CN101516906A

CN101516906A - 提高具有生物学活性之多肽的分泌的方法

Info

Publication number: CN101516906A
Application number: CNA2007800352244A
Authority: CN
Inventors: 桑德拉·梅里诺
Original assignee: Novozymes Biotech Inc
Current assignee: Novozymes Inc
Priority date: 2006-07-21
Filing date: 2007-07-20
Publication date: 2009-08-26
Anticipated expiration: 2027-07-20
Also published as: CA2658610A1; DK2046819T3; WO2008057637A3; US8735549B2; US8546106B2; BRPI0714870A2; US8871486B2; US9006409B2; US20090298126A1; CN101516906B; EP2046819A2; US20140248671A1; ES2538360T3; WO2008057637A2; WO2008057637A9; US20140011256A1; US20150044756A1; EP2046819B1

Abstract

本发明涉及用于产生具有生物学活性的分泌型多肽的方法，该方法包括：(a)用编码融合蛋白的融合蛋白构建体转化真菌宿主细胞，所述融合蛋白构建体包含：(i)编码信号肽的第一多核苷酸；(ii)编码内切葡聚糖酶的至少催化结构域或其部分的第二多核苷酸；和(iii)编码具有生物学活性之多肽的至少催化结构域的第三多核苷酸；其中所述信号肽和所述内切葡聚糖酶的至少催化结构域与不存在所述内切葡聚糖酶的至少催化结构域时相比提高所述具有生物学活性之多肽的分泌；(b)在适于所述融合蛋白生产的条件下培养所述经过转化的真菌宿主细胞；并(c)自所述培养液回收所述具有生物学活性的融合蛋白、其构件、或其组合。

Description

提高具有生物学活性之多肽的分泌的方法

关于在联邦赞助的研究和开发下进行的发明的权利声明

本发明是在政府支持下进行的，即美国能源部授予的基本合同DE-AC36-98GO10337的NREL转包合同号ZCO-30017-02。美国政府具有本发明的某些权利。

发明领域

本发明涉及产生具有生物学活性的分泌型多肽的方法及其融合蛋白和多核苷酸。

发明背景

异源多肽在真菌宿主细胞(特别是丝状真菌细胞，如曲霉属或木霉属或酵母细胞如酵母属)中的重组生产可能提供了用于以商业上合适的数量生产多肽的更理想的媒介。

分泌型异源多肽的重组生产一般通过构建表达盒来实现，在所述表达盒中编码多肽的DNA可操作连接适于宿主细胞的启动子和编码信号肽编码区，所述信号肽编码区所编码的氨基酸序列以符合读码框的方式连接至多肽的氨基末端并指导所编码多肽进入细胞的分泌途径。将表达盒导入宿主细胞，通常通过质粒介导的转化。然后通过在表达盒上所含的启动子正确发挥功能所必需的诱导条件下培养经转化的宿主细胞来实现分泌型异源蛋白的生产。

虽然可改进异源多肽在宿主细胞中的表达，但常常遇到的障碍是多肽进入培养基的分泌很差。改进多肽分泌的一种方法是用外来信号肽编码区替换天然信号肽编码序列以增强多肽的分泌。然而，在有些情况中，这样的替换不能提供足够的改善用于以商业上合适的数量生产多肽。另一种方法是将多肽与另一种由宿主细胞高度分泌的多肽融合。高度分泌的多肽发挥载体的功能将分泌很差或不分泌的多肽作为融合蛋白转运通过细胞的分泌途径。

WO 05/093050披露了由外切纤维二糖水解酶催化结构域和纤维素酶催化结构域构成的融合蛋白，以提高纤维素酶的产量。Gouka等，1997，Appliedand Environmental Microbiology Feb.1997，p.488-497披露了葡糖淀粉酶基因融合物，其减轻了泡盛曲霉(Aspergillus awamori)中对蛋白质产生的限制。Nyyssonen和Keranen，1995，Current Genetics 28：71-79披露了纤维二糖水解酶I在增强里氏木霉(Trichoderma reesei)的融合抗体的产生中的多种作用。

本发明的一个目的是提供用于提高具有生物学活性之多肽的分泌的方法。

发明概述

本发明涉及用于产生具有生物学活性的分泌型多肽的方法，该方法包括：

(a)用编码融合蛋白的融合蛋白构建体转化真菌宿主细胞，其中所述融合蛋白构建体包含：

(i)包含编码信号肽的核苷酸序列的第一多核苷酸；

(ii)包含编码内切葡聚糖酶的至少催化结构域(catalytic domain)或其部分的核苷酸序列的第二多核苷酸；和

(iii)包含编码具有生物学活性之多肽的至少催化结构域或其部分的核苷酸序列的第三多核苷酸；

其中所述信号肽和所述内切葡聚糖酶的至少催化结构域或其部分与不存在所述内切葡聚糖酶的至少催化结构域或其部分时相比提高所述具有生物学活性之多肽或其部分的分泌；

(b)在适于产生所述融合蛋白的条件下培养所述经转化的真菌宿主细胞；和

(c)自所述培养液回收所述融合蛋白、其构件(component thereof)或它们的组合，其中所述融合蛋白或其构件具有生物学活性。

一方面，所述第一多核苷酸的3’端可操作连接所述第二多核苷酸的5’端且所述第二多核苷酸的3’端可操作连接所述第三多核苷酸的5’端，或者所述第一多核苷酸的3’端可操作连接所述第三多核苷酸的5’端且所述第三多核苷酸的3’端可操作连接所述第二多核苷酸的5’端，以编码融合蛋白。

本发明还涉及分离的融合蛋白，该融合蛋白包含：

(a)包含信号肽的第一氨基酸序列；

(b)包含内切葡聚糖酶的至少催化结构域或其部分的第二氨基酸序列；和

(c)包含具有生物学活性之多肽的至少催化结构域或其部分的第三氨基酸序列。

本发明还涉及编码所述融合蛋白的多核苷酸，及包含此类多核苷酸的融合蛋白构建体、表达载体和重组宿主细胞。

另一方面，所述第一氨基酸序列的C端以符合读码框的方式连接所述第二氨基酸序列的N端且所述第二氨基酸序列的C端以符合读码框的方式连接所述第三氨基酸序列的N端，或者所述第一氨基酸序列的C端以符合读码框的方式连接所述第三氨基酸序列的N端且所述第三氨基酸序列的C端以符合读码框的方式连接所述第二氨基酸序列的N端。

本发明还涉及使用所述融合蛋白或其构件的方法。

附图简述

图1显示了pMJ04的限制性图谱。

图2显示了pCaHj527的限制性图谱。

图3显示了pMT2188的限制性图谱。

图4显示了pCaHj568的限制性图谱。

图5显示了pMJ05的限制性图谱。

图6显示了pSMai130的限制性图谱。

图7显示了米曲霉(Aspergillus oryzae)β-葡糖苷酶天然信号序列的DNA序列和氨基酸序列(SEQ ID NO：59和60)。

图8显示了特异腐质霉(Humicola insolens)内切葡聚糖酶V信号序列的DNA序列和氨基酸序列(SEQ ID NO：63和64)。

图9显示了pSMai135的限制性图谱。

图10显示了pSMai140的限制性图谱。

图11显示了pSaMe-F1的限制性图谱。

图12显示了pSaMe-FX的限制性图谱。

图13显示了pAlLo47的限制性图谱。

图14A、14B、14C、和14D显示了米曲霉β-葡糖苷酶变体融合蛋白的DNA序列和推导的氨基酸序列(SEQ ID NO：73和74)。

图15A、15B、15C、和15D显示了米曲霉β-葡糖苷酶融合蛋白的DNA序列和推导的氨基酸序列(SEQ ID NO：75和76)。

定义

内切葡聚糖酶活性：术语“内切葡聚糖酶活性”在本申请中定义为内切-1，4-β-D-葡聚糖4-葡聚糖水解酶(endo-1，4-β-D-glucan 4-glucanohydrolase)(E.C.3.2.1.4)，其催化纤维素、纤维素衍生物(如羧甲基纤维素和羟乙基纤维素)、地衣淀粉(lichenin)中的1，4-β-D-糖苷连接、混合的β-1，3葡聚糖如谷类β-D-葡聚糖或木葡聚糖中的β-1，4键和含有纤维素成分的其它植物材料的内水解(endohydrolysis)。就本发明而言，根据Ghose，1987，Pure and Appl.Chem.59：257-268的方法，使用羧甲基纤维素(CMC)水解来测定内切葡聚糖酶活性。将一单位的内切葡聚糖酶活性定义为：在50℃、pH4.8，每分钟产生1.0微摩尔还原糖。

β-葡糖苷酶活性：术语“β-葡糖苷酶”在本申请中定义为β-D-葡糖苷葡糖水解酶(β-D-glucoside glucohydrolase)(E.C.3.2.1.21)，其催化末端非还原性β-D-葡萄糖残基的水解，同时释放β-D-葡萄糖。就本发明而言，根据Venturi等，2002，J.Basic Microbiol.42：55-66记载的规程来确定β-葡糖苷酶活性，只是如本申请所述采用不同的条件。将一单位的β-葡糖苷酶活性定义为：在50℃、pH5，由100mM柠檬酸钠，0.01％

20中的4mM作为底物的对硝基苯基-β-D-吡喃葡糖苷每分钟产生1.0微摩尔对硝基酚。

全长多肽：术语“全长多肽”在本申请中定义为具有生物学活性之多肽的前体形式，其中所述前体包含信号肽区，或者还包含前肽区，其中一旦从细胞分泌，所述信号肽被切割掉，或者所述前肽也被切割掉，从而产生具有生物学活性之多肽。

信号肽：术语“信号肽”在本申请中定义为以符合读码框的方式连接至多肽的氨基末端且指导所编码多肽进入细胞的分泌途径的肽。

信号肽编码序列：术语“信号肽编码序列”在本申请中定义为如下肽编码区，该肽编码区编码以符合读码框的方式连接至所编码多肽的氨基末端且指导所编码多肽进入细胞的分泌途径的氨基酸序列。

前肽：术语“前肽”在本申请中定义为以符合读码框的方式连接至多肽的氨基末端的肽。所得多肽称为酶原(proenzyme)或多肽原(propolypeptide)(或在一些情况下称为酶原(zymogen))。多肽原一般是没有活性的，而且可以通过前肽的催化或自催化切割从多肽原转变为成熟的活性多肽。当信号肽区和前肽区均存在于多肽的氨基末端时，则前肽区以符合读码框的方式连接至多肽的氨基末端，而信号肽区以符合读码框的方式连接至前肽区的氨基末端。

前肽编码序列：术语“前肽编码序列”在本申请中定义为如下肽编码区，该肽编码区编码以符合读码框的方式连接至多肽的氨基末端从而形成酶原或多肽原(或在一些情况下称为酶原)的氨基酸序列。

成熟多肽：术语“成熟多肽”在本申请中定义为在翻译和任何翻译后修饰(如N端加工、C端截短、糖基化、磷酸化等)后以其最终形式具有生物学活性的多肽。

催化结构域：术语“催化结构域”在本申请中定义为内切葡聚糖酶或具有生物学活性之多肽(例如β-葡糖苷酶活性)的氨基酸序列中拥有内切葡聚糖酶或具有生物学活性之多肽(例如β-葡糖苷酶)的催化活性的结构部分或区。催化结构域在本申请中也称为“核心”(core)区。

融合蛋白：术语“融合蛋白”在本申请中定义为显示生物学活性且包含至少内切葡聚糖酶的催化结构域和具有生物学活性之多肽(例如β-葡糖苷酶)的催化结构域二者的多肽。

β-葡糖苷酶融合蛋白：术语“β-葡糖苷酶融合蛋白”在本申请中定义为显示β-葡糖苷酶活性且包含至少β-葡糖苷酶催化结构域和内切葡聚糖酶的催化结构域二者的多肽。

融合蛋白的构件：术语“融合蛋白的构件”在本申请中定义为融合蛋白的(切割后的)片段个体，其中每个片段具有生物学活性且或是包含内切葡聚糖酶的至少催化结构域和具有生物学活性之多肽的至少催化结构域或是包含具有生物学活性之多肽的至少催化结构域。例如，融合蛋白中内切葡聚糖酶的至少催化结构域和具有生物学活性之多肽的至少催化结构域的构件之间切割位点(例如Kex2位点)的存在可导致具有内切葡聚糖酶活性之多肽和另一种具有生物学活性之多肽的产生。

β-葡糖苷酶融合蛋白的构件：术语“β-葡糖苷酶融合蛋白的构件”在本申请中定义为β-葡糖苷酶融合蛋白的(切割后的)片段个体，其中每个片段具有β-葡糖苷酶活性且或是至少内切葡聚糖酶的催化结构域和至少β-葡糖苷酶催化结构域或是至少β-葡糖苷酶催化结构域。例如，融合蛋白中内切葡聚糖酶和β-葡糖苷酶的构件之间切割位点(例如Kex2位点)的存在可导致具有内切葡聚糖酶活性之多肽和另一种具有β-葡糖苷酶活性之多肽的产生。

碳水化合物结合模块：术语“碳水化合物结合模块(CBM)”在本申请中定义为内切葡聚糖酶(纤维素酶)的氨基酸序列中牵涉内切葡聚糖酶结合纤维素(木质纤维素)的部分。碳水化合物结合模块一般通过使内切葡聚糖酶非共价结合纤维素、纤维素衍生物、或其多糖等同物来发挥功能。CBM通常独立于催化结构域来发挥功能。

融合蛋白构建体：术语“融合蛋白构建体”指由可操作连接的不同基因或其部分构成的核酸构建体。构件自5′端起包括编码至少内切葡聚糖酶的催化结构域的DNA分子和编码具有生物学活性之多肽的至少催化结构域的DNA分子。

β-葡糖苷酶融合物构建体：术语“β-葡糖苷酶融合物构建体”指由可操作连接的不同基因或其部分构成的核酸构建体。构件自5′端起包括编码至少内切葡聚糖酶的催化结构域的DNA分子和编码至少β-葡糖苷酶催化结构域的DNA分子。

分离的多肽：术语“分离的多肽”在用于本申请时指根据SDS-PAGE的测定，至少20％纯、优选至少40％纯、更优选至少60％纯、甚至更优选至少80％纯、最优选至少90％纯、且甚至最优选至少95％纯的多肽。

基本上纯的多肽：术语“基本上纯的多肽”在本申请中指包含至多10％、优选至多8％、更优选至多6％、更优选至多5％、更优选至多4％、更优选至多3％、甚至更优选至多2％、最优选至多1％、且甚至最优选至多0.5％(按重量计)与之天然地或重组地相关的(associated)其它多肽材料的多肽制备物。因此，优选的是，基本上纯的多肽是至少92％纯、优选至少94％纯、更优选至少95％纯、更优选至少96％纯、更优选至少96％纯、更优选至少97％纯、更优选至少98％纯、甚至更优选至少99％、最优选至少99.5％纯、且甚至最优选100％纯的，按制备物中存在的总多肽材料的重量计。本发明的多肽优选是基本上纯的形式，即多肽制备物基本上不含与之天然地或重组地相关的其它多肽材料。这可以如下来实现，例如通过众所周知的重组方法或通过经典的纯化方法来制备多肽。

同一性：参数“同一性”描述两个氨基酸序列之间或两个核苷酸序列之间的相关性。

就本发明而言，两个氨基酸序列之间的同一性程度使用Needleman-Wunsch算法(Needleman和Wunsch，1970，J.Mol.Biol.48：443-453)来确定，正如EMBOSS包(EMBOSS：The European Molecular Biology OpenSoftware Suite，Rice等，2000，Trends in Genetics 16：276-277)(优选3.0.0版或更后的)的Needle程序所执行的。所使用的任选参数是缺口开启罚分(gap openpenalty)为10，缺口延伸罚分(gap extension penalty)为0.5和EBLOSUM62(EMBOSS版的BLOSUM62)替代矩阵。将标记为“最长同一性(longest identity)”(使用-nobrief选项得到的)的Needle输出结果用作百分比同一性，并计算如下：

(相同残基x100)/(比对长度-比对中缺口的总数)

就本发明而言，两个脱氧核糖核苷酸序列之间的同一性程度使用Needleman-Wunsch算法(Needleman和Wunsch，1970，见上文)来确定，正如EMBOSS包(EMBOSS：The European Molecular Biology Open Software Suite，Rice等，2000，见上文)(优选3.0.0版或更后的)的Needle程序所执行的。所使用的任选参数是缺口开启罚分(gap opern penalty)为10，缺口延伸罚分(gapextension penalty)为0.5和EDNAFULL(EMBOSS版的NCBI NUC4.4)替代矩阵。将标记为“最长同一性”(使用-nobrief选项得到的)的Needle输出结果用作百分比同一性，并计算如下：

(相同脱氧核糖核苷酸x100)/(比对长度-比对中缺口的总数)

多肽片段：术语“多肽片段”在本申请中定义为从融合蛋白(例如β-葡糖苷酶融合蛋白)或其构件的氨基和/或羧基末端缺失了一个或几个氨基酸的多肽，其中所述片段具有生物学活性(例如β-葡糖苷酶活性)。

子序列(subsequence)：术语“子序列”在本申请中定义为从多核苷酸的5′和/或3′端缺失了一个或几个核苷酸的核苷酸序列，其中所述子序列编码具有生物学活性(例如β-葡糖苷酶活性或内切葡聚糖酶活性)之多肽片段。

分离的多核苷酸：术语“分离的多核苷酸”在用于本申请时指的根据琼脂糖电泳的测定，至少20％纯、优选至少40％纯、更优选至少60％纯、甚至更优选至少80％纯、最优选至少90％纯、且甚至最优选至少95％纯的多核苷酸。

基本上纯的多核苷酸：术语“基本上纯的多核苷酸”在用于本申请时指不含其它外来的或不需要的核苷酸且处于适用于遗传工程蛋白质生产***的形式的多核苷酸制备物。如此，基本上纯的多核苷酸含有至多10％、优选至多8％、更优选至多6％、更优选至多5％、更优选至多4％、更优选至多3％、甚至更优选至多2％、最优选至多1％、且甚至最优选至多0.5％(按重量计)与之天然地或重组地相关的(associated)其它多核苷酸材料。然而，基本上纯的多核苷酸可以包含天然存在的5’和3’非翻译区，如启动子和终止子。优选的是，基本上纯的多核苷酸是按重量计至少90％纯、优选至少92％纯、更优选至少94％纯、更优选至少95％纯、更优选至少96％纯、更优选至少97％纯、甚至更优选至少98％纯、最优选至少99％、且甚至最优选至少99.5％纯的。多核苷酸优选是基本上纯的形式，即多核苷酸制备物基本上不含与之天然地或重组地相关的其它多核苷酸材料。多核苷酸可以是基因组、cDNA、RNA、半合成、合成起源的，或其任意组合。

cDNA：术语“cDNA”在本申请中定义为可以通过从得自真核细胞的成熟的、已剪接的mRNA分子反转录而制备的DNA分子。cDNA缺少通常存在于相应基因组DNA中的内含子序列。起始的(initial)、初级的RNA转录物是mRNA的前体，其通过一系列的步骤加工然后作为成熟的已剪接的mRNA出现。这些步骤包括通过称为剪接的过程去除内含子序列。因此，衍生自mRNA的cDNA缺少任何内含子序列。

核酸构建体：术语“核酸构建体”在用于本申请时指从天然存在的基因分离的或经修饰而以自然界其它情况中不会存在的方式包含核酸区段的核酸分子，其或是单链的或是双链的。在核酸构建体包含编码序列表达所需要的控制序列时，术语核酸构建体与术语“表达盒”同义。

控制序列：术语“控制序列”在本申请中定义为包括对于编码多肽的多核苷酸表达而言是必需的或有利的所有构件。每种控制序列对于编码多肽的核苷酸序列而言可以是天然的或外来的，或者彼此是天然的或外来的。此类控制序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列、和转录终止子。最低限度，控制序列包括启动子、及转录和翻译终止信号。为了导入特定限制性位点以便于将控制序列与编码多肽核苷酸序列的编码区连接，控制序列可以与接头一起提供。

可操作连接：术语“可操作连接”在本申请中指其中控制序列置于相对于多核苷酸序列的编码序列的适宜位置使得控制序列指导多肽编码序列的表达的构造。另外，术语“可操作连接”还涉及一起作为融合蛋白表达的相连接或融合的两条多核苷酸。

编码序列：在用于本申请时，术语“编码序列”指直接指定其蛋白质产物的氨基酸序列的核苷酸序列。编码序列的边界一般由开读框决定，其通常以ATG起始密码子或可替换的起始密码子如GTG和TTG开始，以终止密码子如TAA、TAG和TGA结束。编码序列可以是DNA、cDNA或重组的核苷酸序列。

表达：术语“表达”包括多肽生产中所牵涉的任何步骤，包括但不限于转录、转录后修饰、翻译、翻译后修饰、和分泌。

表达载体：术语“表达载体”在本申请中定义为线性的或环状的DNA分子，其包含编码本发明多肽的多核苷酸且所述多核苷酸与用于其表达的其它核苷酸可操作连接。

宿主细胞：术语“宿主细胞”在用于本申请时包括易于(susceptible to)用包含多核苷酸的核酸构建体或表达载体转化、转染、转导等的任何细胞类型。

变体：在用于本申请时，术语“变体”指由表达经修饰核苷酸序列(例如SEQ ID NO：25或其同源序列或其成熟编码区)的生物体产生的具有生物学活性之多肽。经修饰核苷酸序列通过人为干预(human intervention)即通过修饰核苷酸序列(例如SEQ ID NO：23或其同源序列或其成熟编码区)来获得。修饰可以是一个或几个氨基酸的取代、缺失、和/或***，以及一个或几个氨基酸侧链的置换。

发明详述

本发明涉及用于产生具有生物学活性的分泌型多肽的方法，该方法包括：(a)用编码融合蛋白的融合蛋白构建体转化真菌宿主细胞，其中所述融合蛋白构建体包含：(i)包含编码信号肽的核苷酸序列的第一多核苷酸；(ii)包含编码内切葡聚糖酶的至少催化结构域或其部分的核苷酸序列的第二多核苷酸；和(iii)包含编码具有生物学活性之多肽的至少催化结构域或其部分的核苷酸序列的第三多核苷酸；其中所述信号肽和所述内切葡聚糖酶的至少催化结构域或其部分与不存在所述内切葡聚糖酶的至少催化结构域或其部分时相比提高所述具有生物学活性之多肽或其部分的分泌；(b)在适于产生所述融合蛋白的条件下培养所述经转化的真菌宿主细胞；和(c)自所述培养液回收所述融合蛋白、其构件或它们的组合，其中所述融合蛋白或其构件具有生物学活性。

在优选的方面，第一多核苷酸的3’端可操作连接第二多核苷酸的5’端且第二多核苷酸的3’端可操作连接第三多核苷酸的5’端。在另一个优选的方面，第一多核苷酸的3’端可操作连接第三多核苷酸的5’端且第三多核苷酸的3’端可操作连接第二多核苷酸的5’端，以编码融合蛋白。

通过将编码具有生物学活性之多肽或其部分的核苷酸序列与编码具有内切葡聚糖酶活性之多肽或其部分的核苷酸序列和编码信号肽的核苷酸序列(其与编码具有内切葡聚糖酶活性之多肽或其部分的核苷酸序列可操作连接)融合来产生融合蛋白。用于产生融合蛋白的技术是本领域已知的，包括例如连接编码多肽的编码序列使得它们符合读码框(in frame)且融合蛋白的表达处在同一启动子和终止子的控制下。也可以使用内含肽(intein)技术来构建融合蛋白，其中在翻译后产生融合物(Cooper等，1993，EMBO J.12：2575-2583；Dawson等，1994，Science 266：776-779)。

包含信号肽、内切葡聚糖酶的至少催化结构域或其部分、和具有生物学活性之多肽的至少催化结构域或其部分，具有生物学活性的融合蛋白与不存在所述内切葡聚糖酶的至少催化结构域或其部分时相比提高了融合蛋白的分泌。具有生物学活性的融合蛋白的分泌与不存在内切葡聚糖酶的至少催化结构域相比的增加是至少5％、优选至少10％、更优选至少25％、甚至更优选至少50％、更优选至少100％、甚至更优选至少150％、甚至更优选至少200％、最优选至少500％、且甚至最优选至少1000％。

在下文每一个优选的方面，融合蛋白构建体(核酸构建体)的构件是自构建体的5’端至3’端可操作连接的。

在优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸；和包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸；和包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸；和包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸；和包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸；和包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸；和包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含的编码内切葡聚糖酶的成熟多肽的核苷酸序列多核苷酸；和包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸；和包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸；和包含编码具有生物学活性之多肽的全长多肽的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含编码具有生物学活性之多肽的全长多肽的核苷酸序列的多核苷酸；和包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸；和包含编码具有生物学活性之多肽的全长多肽的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含编码具有生物学活性之多肽的全长多肽的核苷酸序列的多核苷酸；和包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码内切葡聚糖酶(信号肽和成熟多肽)全长多肽的核苷酸序列的多核苷酸；和包含编码具有生物学活性之多肽的全长多肽的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码具有生物学活性之多肽的全长多肽的核苷酸序列的多核苷酸；和包含编码内切葡聚糖酶(信号肽和成熟多肽)全长多肽的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸，和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸；和包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸，和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸；和包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸，和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸；和包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸，和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸；和包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸，和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸；和包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸，和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸；和包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸，和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸；和包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸，和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸；和包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸，和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸；和包含编码具有生物学活性之多肽的全长多肽的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含编码具有生物学活性之多肽的全长多肽的核苷酸序列的多核苷酸，和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸；和包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸，和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸；和包含编码具有生物学活性之多肽的全长多肽的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含编码具有生物学活性之多肽的全长多肽的核苷酸序列的多核苷酸，和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸；和包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸；包含编码另一信号肽的核苷酸序列的多核苷酸；和包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸；包含编码另一信号肽的核苷酸序列的多核苷酸；和包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸；包含编码另一信号肽的核苷酸序列的多核苷酸；和包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸；包含编码另一信号肽的核苷酸序列的多核苷酸；和包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸；包含编码另一信号肽的核苷酸序列的多核苷酸；和包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸；包含编码另一信号肽的核苷酸序列的多核苷酸；和包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸；包含编码另一信号肽的核苷酸序列的多核苷酸；和包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸；包含编码另一信号肽的核苷酸序列的多核苷酸；和包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸，和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸；包含编码另一信号肽的核苷酸序列的多核苷酸；和包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸，和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸；包含编码另一信号肽的核苷酸序列的多核苷酸；和包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸，和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸；包含编码另一信号肽的核苷酸序列的多核苷酸；和包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸，和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸；包含编码另一信号肽的核苷酸序列的多核苷酸；和包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸，和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸；包含编码另一信号肽的核苷酸序列的多核苷酸；和包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸，和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸；包含编码另一信号肽的核苷酸序列的多核苷酸；和包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸，和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸；包含编码另一信号肽的核苷酸序列的多核苷酸；和包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸。

在另一个优选的方面，融合蛋白构建体包含：包含编码信号肽的核苷酸序列的多核苷酸；和包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸，和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸；包含编码另一信号肽的核苷酸序列的多核苷酸；和包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸。

在另一个优选的方面，对于上文每一个优选的方面，多核苷酸可以编码内切葡聚糖酶或具有生物学活性之多肽的催化结构域的部分、成熟多肽的部分、或全长多肽的部分。所述内切葡聚糖酶的部分可以具有或不具有内切葡聚糖酶活性。在更优选的方面，所述内切葡聚糖酶的部分具有内切葡聚糖酶活性。

在上文每一个优选的方面，融合蛋白构建体的构件进一步包含启动子区和/或终止子区。

内切葡聚糖酶及其多核苷酸

编码内切葡聚糖酶的催化结构域、成熟多肽、或全长多肽，或其部分的多核苷酸可以自任何生物体获得。就本发明而言，术语“多肽”理解为包括全长多肽、成熟多肽、或催化结构域；或其具有活性的部分或片段。术语“自...得到的”或“得自”在本申请中与给定来源一起使用时意味着由核苷酸序列编码的多肽是由所述来源或由其中已经***了来自所述来源的核苷酸序列的菌株产生的。

许多内切葡聚糖酶具有由通过接头肽与碳水化合物结合结构域分隔开的催化结构域组成的多结构域结构(Suurnakki等，2000，Cellulose 7：189-209)。所述催化结构域包含活性位点，而所述CBM通过使酶与其结合而与纤维素相互作用(van Tilbeurgh等，1986，FEBS Letters 204：223-227；Tomme等，1988，European Journal of Biochemistry 170：575-581)。

编码具有内切葡聚糖酶活性之多肽的多核苷酸可以自编码细菌多肽的基因获得。例如，所述多肽可以是***多肽，包括但不限于芽孢杆菌属(Bacillus)、链球菌属(Streptococcus)、链霉菌属(Streptomyces)、葡萄球菌属(Staphylococcus)、肠球菌属(Enterococcus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、梭菌属(Clostridium)、地芽孢杆菌属(Geobacillus)或Oceanobacillus多肽，例如嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、凝结芽孢杆菌(Bacillus coagulans)、灿烂芽孢杆菌(Bacilluslautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacillus licheniformis)、巨大芽孢杆菌(Bacillus megaterium)、嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)、苏云金芽孢杆菌(Bacillusthuringiensis)、似马链球菌(Streptococcus equisimilis)、酿脓链球菌(Streptococcus pyogenes)、***链球菌(Streptococcus uberis)、和马链球菌兽瘟亚种(Streptococcus equi subsp.Zooepidemicus)、和浅青紫链霉菌(Streptomyceslividans)、或鼠灰链霉菌(Streptomyces murinus)多肽；或革兰氏阴性细菌多肽，包括但不限于大肠埃希氏菌或大肠杆菌(E.coli)、假单胞菌属(Pseudomonas)、沙门氏菌属(Salmonella)、弯曲杆菌属(Campylobacter)、螺杆菌属(Helicobacter)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、泥杆菌属(Ilyobacter)、奈瑟氏菌属(Neisseria)、或脲原体属(Ureaplasma)多肽。

可用作本发明方法中多核苷酸来源的细菌内切葡聚糖酶的例子包括但不限于解纤维热酸菌(Acidothermus cellulolyticus)内切葡聚糖酶(WO 91/05039；WO 93/15186；美国专利No.5,275,944；WO 96/02551；美国专利No.5,536,655，WO 00/70031，WO 05/093050)；Thermobifida fusca内切葡聚糖酶III(WO05/093050)；和Thermobifida fusca内切葡聚糖酶V(WO 05/093050)。

编码具有内切葡聚糖酶活性之多肽的多核苷酸可以自编码真菌多肽的基因获得，更优选酵母多肽，如假丝酵母属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、(糖)酵母属(Saccharomyces)、裂殖(糖)酵母属(Schizosaccharomyces)、或耶氏酵母(西洋蓍霉)属(Yarrowia)多肽；或更优选丝状真菌多肽，如枝顶孢霉属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、枝鼻菌属(Cladorrhinum)、隐球菌属(Cryptococcus)、篮状菌属(Filibasidium)、镰孢属(Fusarium)、腐质霉属(Humicola)、梨孢菌属(Magnaporthe)、毛霉属Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、瘤胃壶菌属(Piromyces)、裂褶菌属(Schizophyllum)、踝节菌属(Talaromyces)、热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、或木霉属(Trichoderma)多肽。

在优选的方面，编码具有内切葡聚糖酶活性之多肽的多核苷酸可以自编码如下多肽的基因获得，卡尔酵母(Saccharomyces carlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)、或卵形酵母(Saccharomyces oviformis)多肽。

在另一个优选的方面，编码具有内切葡聚糖酶活性之多肽的多核苷酸可以自编码如下多肽的基因获得，棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillus awamori)、烟曲霉(Aspergillus fumigatus)、臭曲霉(Aspergillusfoetidus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillus oryzae)、Cladorrhinumfoecundissimum、杆孢状镰孢(Fusarium bactridioides)、禾谷镰孢(Fusariumcerealis)、库威镰孢(Fusarium crookwellense)、大刀镰孢(Fusarium culmorum)、禾本科镰孢(Fusarium graminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢(Fusarium negundi)、尖镰孢(Fusariumoxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、圆镰孢(Fusarium torulosum)、拟丝孢镰孢(Fusarium trichothecioides)、镶片镰孢(Fusarium venenatum)、特异腐质霉(Humicola insolens)、疏棉状腐质霉(Humicola lanuginosa)、米赫毛霉(Mucor miehei)、嗜热毁丝霉(Myceliophthorathermophila)、粗糙脉孢菌(Neurospora crassa)、产紫青霉(Penicilliumpurpurogenum)、无色梭孢壳(Thielavia achromatica)、Thielavia albomyces、Thielavia albopilosa、Thielavia australeinsis、Thielavia fimeti、小孢梭孢壳(Thielavia microspora)、卵孢梭孢壳(Thielavia ovispora)、Thielavia peruviana、瘤孢梭孢壳(Thielavia spededonium)、毛梭孢壳(Thielavia setosa)、Thielaviasubthermophila、土生梭孢霉(Thielavia terrestris)、栖土梭孢壳(Thielaviaterricola)、嗜热梭孢壳(Thielavia thermophila)、Thielavia variospora、Thielaviawareingii、哈茨木霉(Trichoderma harzianum)、康宁木霉(Trichodermakoningii)、长枝木霉(Trichoderma longibrachiatum)、里氏木霉(Trichodermareesei)、或绿色木霉(Trichoderma viride)多肽。

可用作本发明方法中多核苷酸来源的真菌内切葡聚糖酶的例子包括但不限于里氏木霉EG1(Penttila等，1986，Gene 45：253-263；GENBANK^TM登录号M15665)；里氏木霉EG2(Saloheimo，等，1988，Gene 63：11-22；GENBANK^TM登录号M19373)；里氏木霉EG3(Okada等，1988，Appl.Environ.Microbiol.64：555-563；GENBANK^TM登录号AB003694)；里氏木霉EG4(Saloheimo等，1997，Eur.J.Biochem.249：584-591；GENBANK^TM登录号Y11113)；和里氏木霉EG5(Saloheimo等，1994，Molecular Microbiology 13：219-228；GENBANK^TM登录号Z33381)；棘孢曲霉内切葡聚糖酶(Ooi等，1990，Nucleic Acidss Research 18：5884)；川地曲霉(Aspergillus kawachii)(Sakamoto等，1995，Current Genetics27：435-439)；胡萝卜软腐欧文氏菌(Erwinia carotovara)内切葡聚糖酶(Saarilahti等，1990，Gene 90：9-14)；尖镰孢(GENBANK^TM登录号L29381)；灰色腐质酶高温变种(Humicola grisea var.thermoidea)(GENBANK^TM登录号AB003107)；Melanocarpus abomyces(GENBANK^TM登录号MAL515703)；和粗糙脉孢菌(GENBANK^TM登录号XM 324477)。

许多糖基水解酶家族中披露了其它内切葡聚糖酶，所述糖基水解酶家族使用根据Henrissat B.，1991，A classification of glycosyl hydrolases based onamino-acid sequence similarities，Biochem.J.280：309-316及Henrissat B.和Bairoch A.，1996，Updating the sequence-based classification of glycosylhydrolases，Biochem.J.316：695-696的分类方法。

用于分离或克隆编码具有内切葡聚糖酶活性之多肽的多核苷酸的技术是本领域已知的，包括自基因组DNA分离、自cDNA制备、或其组合。自此类基因组DNA克隆多核苷酸可以如下来实现，例如通过使用众所周知的聚合酶链式反应(PCR)或抗体筛选表达文库以检测所克隆的具有共同结构特征的DNA片段。参见例如Innis等，1990，PCR：A Guide to Methods and Application，Academic Press，New York。可以使用其它核酸扩增方法，如连接酶链式反应(LCR)、连接活化的转录(LAT)和基于核苷酸序列的扩增(NASBA)。

应当理解，对于上述物种，本发明涵盖完全和不完全两个阶段(perfectand imperfect states)，和其它分类学的等同物(equivalent)，例如无性型(anamorph)，而无论它们已知的种名。本领域技术人员将容易地识别适宜等同物的身份。

公众能够在许多培养物保藏中心容易地取得这些种的菌株，如美国典型培养物保藏中心(American Type Culture Collection)(ATCC)、德意志微生物和细胞培养物保藏中心(Deutsche Sammlung von Mikroorganismen undZellkulturen GmbH)(DSM)、真菌菌种保藏中心(Centraalbureau VoorSchimmelcultures)(CBS)、和农业研究机构专利培养物保藏中心北区研究中心(Agricultural Research Service Patent Culture Collection，Northern RegionalResearch Center)(NRRL)。

在优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自内切葡聚糖酶I基因获得的多核苷酸编码的。

在另一个优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自内切葡聚糖酶II基因获得的多核苷酸编码的。

在另一个优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自内切葡聚糖酶III基因获得的多核苷酸编码的。

在另一个优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自内切葡聚糖酶IV基因获得的多核苷酸编码的。

在另一个优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自内切葡聚糖酶V基因获得的多核苷酸编码的。在更优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自特异腐质霉内切葡聚糖酶V基因获得的多核苷酸编码的。在最优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自特异腐质霉内切葡聚糖酶V基因获得的多核苷酸编码的，所述特异腐质霉内切葡聚糖酶V基因编码SEQ ID NO：2之多肽。在另一个最优选的方面，内切葡聚糖酶的全长多肽，或其部分是由自特异腐质霉内切葡聚糖酶V基因获得的多核苷酸编码的，所述特异腐质霉内切葡聚糖酶V基因编码SEQ ID NO：2之全长多肽。在另一个最优选的方面，内切葡聚糖酶的成熟多肽，或其部分是由自特异腐质霉内切葡聚糖酶V基因获得的多核苷酸编码的，所述特异腐质霉内切葡聚糖酶V基因编码SEQ ID NO：2之成熟多肽。在另一个最优选的方面，内切葡聚糖酶的催化结构域，或其部分是由自特异腐质霉内切葡聚糖酶V基因获得的多核苷酸编码的，所述特异腐质霉内切葡聚糖酶V基因编码SEQ ID NO：2之催化结构域。在另一个最优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自特异腐质霉内切葡聚糖酶V基因获得的多核苷酸编码的，所述特异腐质霉内切葡聚糖酶V基因包含SEQ ID NO：1。在另一个最优选的方面，内切葡聚糖酶的全长多肽，或其部分是由自特异腐质霉内切葡聚糖酶V基因获得的多核苷酸编码的，所述特异腐质霉内切葡聚糖酶V基因包含SEQ ID NO：1。在另一个最优选的方面，内切葡聚糖酶的成熟多肽，或其部分是由自特异腐质霉内切葡聚糖酶V基因获得的多核苷酸编码的，所述特异腐质霉内切葡聚糖酶V基因包含SEQ ID NO：1之成熟多肽编码序列。在另一个最优选的方面，内切葡聚糖酶的催化结构域，或其部分是由自特异腐质霉内切葡聚糖酶V基因获得的多核苷酸编码的，所述特异腐质霉内切葡聚糖酶V基因包含SEQ ID NO：1之催化结构域编码序列。

在另一个优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自内切葡聚糖酶VI基因获得的多核苷酸编码的。

在另一个优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自家族5内切葡聚糖酶基因获得的多核苷酸编码的。在更优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自嗜热毁丝霉CBS 117.65内切葡聚糖酶基因获得的多核苷酸编码的。在最优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自嗜热毁丝霉CBS 117.65内切葡聚糖酶基因获得的多核苷酸编码的，所述嗜热毁丝霉CBS 117.65内切葡聚糖酶基因编码SEQ ID NO：4之多肽。在另一个最优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自嗜热毁丝霉CBS 117.65内切葡聚糖酶基因获得的多核苷酸编码的，所述嗜热毁丝霉CBS 117.65内切葡聚糖酶基因包含SEQ IDNO：3。在另一个更优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自担子菌纲(Basidiomycete)CBS 495.95内切葡聚糖酶基因获得的多核苷酸编码的。在另一个最优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自担子菌纲CBS 495.95内切葡聚糖酶基因获得的多核苷酸编码的，所述担子菌纲CBS 495.95内切葡聚糖酶基因编码SEQ ID NO：6之多肽。在另一个最优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自担子菌纲CBS495.95内切葡聚糖酶基因获得的多核苷酸编码的，所述担子菌纲CBS 495.95内切葡聚糖酶基因包含SEQ ID NO：5。在另一个更优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自担子菌纲CBS494.95内切葡聚糖酶基因获得的多核苷酸编码的。在另一个最优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自担子菌纲CBS 494.95内切葡聚糖酶基因获得的多核苷酸编码的，所述担子菌纲CBS 494.95内切葡聚糖酶基因编码SEQ ID NO：8之多肽。在另一个最优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自担子菌纲CBS 494.95内切葡聚糖酶基因获得的多核苷酸编码的，所述担子菌纲CBS 494.95内切葡聚糖酶基因包含SEQ ID NO：7。

在另一个优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自家族6内切葡聚糖酶基因获得的多核苷酸编码的。在另一个更优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自土生梭孢霉NRRL 8126CEL6B内切葡聚糖酶基因获得的多核苷酸编码的。在另一个最优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自土生梭孢霉NRRL 8126 CEL6B内切葡聚糖酶基因获得的多核苷酸编码的，所述土生梭孢霉NRRL 8126 CEL6B内切葡聚糖酶基因编码SEQ ID NO：10之多肽。在另一个最优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自土生梭孢霉NRRL 8126 CEL6B内切葡聚糖酶基因获得的多核苷酸编码的，所述土生梭孢霉NRRL 8126 CEL6B内切葡聚糖酶基因包含SEQ ID NO：9。在另一个更优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自土生梭孢霉NRRL 8126 CEL6C内切葡聚糖酶基因获得的多核苷酸编码的。在另一个最优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自土生梭孢霉NRRL 8126 CEL6C内切葡聚糖酶基因获得的多核苷酸编码的，所述土生梭孢霉NRRL 8126 CEL6C内切葡聚糖酶基因编码SEQ ID NO：12之多肽。在另一个最优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自土生梭孢霉NRRL 8126CEL6C内切葡聚糖酶基因获得的多核苷酸编码的，所述土生梭孢霉NRRL8126 CEL6C内切葡聚糖酶基因包含SEQ ID NO：11。

在另一个优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自家族7内切葡聚糖酶基因获得的多核苷酸编码的。在另一个更优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶基因获得的多核苷酸编码的。在另一个最优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶基因获得的多核苷酸编码的，所述土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶基因编码SEQ ID NO：14之多肽。在另一个最优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶基因获得的多核苷酸编码的，所述土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶基因包含SEQ ID NO：13。在另一个更优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自土生梭孢霉NRRL 8126 CEL7E内切葡聚糖酶基因获得的多核苷酸编码的。在另一个最优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自土生梭孢霉NRRL 8126 CEL7E获得的多核苷酸编码的，所述土生梭孢霉NRRL 8126 CEL7E内切葡聚糖酶基因编码SEQ ID NO：16之多肽。在另一个最优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自土生梭孢霉NRRL 8126 CEL7E内切葡聚糖酶基因获得的多核苷酸编码的，所述土生梭孢霉NRRL 8126 CEL7E内切葡聚糖酶基因包含SEQ ID NO：15。在另一个更优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自土生梭孢霉NRRL 8126CEL7F内切葡聚糖酶基因获得的多核苷酸编码的。在另一个最优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自土生梭孢霉NRRL 8126 CEL7F内切葡聚糖酶基因获得的多核苷酸编码的，所述土生梭孢霉NRRL 8126 CEL7F内切葡聚糖酶基因编码SEQ ID NO：18之多肽。在另一个最优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自土生梭孢霉NRRL 8126 CEL7F内切葡聚糖酶基因获得的多核苷酸编码的，所述土生梭孢霉NRRL 8126 CEL7F内切葡聚糖酶基因包含SEQ ID NO：17。在另一个更优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自Cladorrhinum foecundissimum ATCC62373 CEL7A内切葡聚糖酶基因获得的多核苷酸编码的。在另一个最优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自Cladorrhinum foecundissimum ATCC 62373 CEL7A内切葡聚糖酶基因获得的多核苷酸编码的，所述Cladorrhinum foecundissimum ATCC 62373 CEL7A内切葡聚糖酶基因编码SEQ ID NO：20之多肽。在另一个最优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自Cladorrhinum foecundissimum ATCC 62373 CEL7A内切葡聚糖酶基因获得的多核苷酸编码的，所述Cladorrhinum foecundissimum ATCC 62373 CEL7A内切葡聚糖酶基因包含SEQ ID NO：19。

在另一个最优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自里氏木霉菌株No.VTT-D-80133内切葡聚糖酶基因获得的多核苷酸编码的，所述里氏木霉菌株No.VTT-D-80133内切葡聚糖酶基因编码SEQ ID NO：22(GENBANK^TM登录号M15665)之多肽。在另一个最优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自里氏木霉菌株No.VTT-D-80133内切葡聚糖酶基因获得的多核苷酸编码的，所述里氏木霉菌株No.VTT-D-80133内切葡聚糖酶基因包含SEQ IDNO：21(GENBANK^TM登录号M15665)。

在另一个优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自家族9内切葡聚糖酶基因获得的多核苷酸编码的。

在另一个优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自家族12内切葡聚糖酶基因获得的多核苷酸编码的。

在另一个优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自家族45内切葡聚糖酶基因获得的多核苷酸编码的。

在另一个优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自家族74内切葡聚糖酶基因获得的多核苷酸编码的。

在另一个优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自编码同源多肽的基因获得的多核苷酸编码的，所述同源多肽包含氨基酸序列，该氨基酸序列与SEQ ID NO：2、SEQ ID NO：4、SEQID NO：6、或SEQ ID NO：8、SEQ ID NO：10、SEQ ID NO：12、SEQ ID NO：14、SEQ ID NO：16、SEQ ID NO：18、SEQ ID NO：20、或SEQ ID NO：22之全长多肽、成熟多肽、或催化结构域的氨基酸序列具有至少60％、优选至少65％、更优选至少70％、更优选至少75％、更优选至少80％、更优选至少85％、甚至更优选至少90％、最优选至少95％、且甚至最优选96％、97％、98％、或99％的同一性程度，其具有内切葡聚糖酶活性。在优选的方面，同源多肽具有与SEQ ID NO：2、SEQ ID NO：4、SEQ ID NO：6、或SEQ ID NO：8、SEQ ID NO：10、SEQ ID NO：12、SEQ ID NO：14、SEQ ID NO：16、SEQ ID NO：18、SEQID NO：20、或SEQ ID NO：22之全长多肽、成熟多肽、或催化结构域差别为10个氨基酸、优选5个氨基酸、更优选4个氨基酸、甚至更优选3个氨基酸、最优选2个氨基酸、且甚至最优选1个氨基酸的氨基酸序列。

在另一个优选的方面，内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域，或其部分是由包含如下核苷酸序列的多核苷酸编码的，所述核苷酸序列在很低的严格条件、优选低的严格条件、更优选中等严格条件、更优选中等-高的严格条件、甚至更优选高的严格条件、和最优选很高的严格条件下与(i)SEQ ID NO：1、SEQ ID NO：3、SEQ ID NO：5、或SEQ ID NO：7、SEQ IDNO：9、SEQ ID NO：11、SEQ ID NO：13、SEQ ID NO：15、SEQ ID NO：17、SEQ ID NO：19、或SEQ ID NO：21，(ii)SEQ ID NO：1、SEQ ID NO：3、SEQID NO：5、或SEQ ID NO：7、SEQ ID NO：9、SEQ ID NO：11、SEQ ID NO：13、SEQ ID NO：15、SEQ ID NO：17、SEQ ID NO：19、或SEQ ID NO：21中所包含的cDNA序列，(iii)(i)或(ii)的子序列，或(iv)(i)、(ii)或(iii)的互补链发生杂交(J.Sambrook，E.F.Fritsch，和T.Maniatis，1989，Molecular Cloning，ALaboratory Manual，第2版，Cold Spring Harbor，New York)。SEQ ID NO：1、SEQ ID NO：3、SEQ ID NO：5、或SEQ ID NO：7、SEQ ID NO：9、SEQ ID NO：11、SEQ ID NO：13、SEQ ID NO：15、SEQ ID NO：17、SEQ ID NO：19、或SEQ ID NO：21的子序列包含至少100个连续的核苷酸或优选至少200个连续的核苷酸。

SEQ ID NO：1、SEQ ID NO：3、SEQ ID NO：5、或SEQ ID NO：7、SEQ IDNO：9、SEQ ID NO：11、SEQ ID NO：13、SEQ ID NO：15、SEQ ID NO：17、SEQ ID NO：19、或SEQ ID NO：21的核苷酸序列或其子序列，以及SEQ ID NO：2、SEQ ID NO：4、SEQ ID NO：6、或SEQ ID NO：8、SEQ ID NO：10、SEQ IDNO：12、SEQ ID NO：14、SEQ ID NO：16、SEQ ID NO：18、SEQ ID NO：20、或SEQ ID NO：22的氨基酸序列或其片段可以用于设计核酸探针，以根据本领域众所周知的方法自不同属或种的菌株鉴定和克隆编码具有内切葡聚糖酶活性之多肽的DNA。具体而言，遵循标准的Southern印迹方法，此类探针可用于与感兴趣的属或种的基因组或cDNA杂交，以鉴定和分离其中相应的基因。此类探针可明显短于完整序列，但长度上应为至少14、优选至少25、更优选至少35、和最优选至少70个核苷酸。然而，优选核酸探针长度上是至少100个核苷酸。例如，核酸探针长度上可以是至少200个核苷酸、优选至少300个核苷酸、更优选至少400个核苷酸、或最优选至少500个核苷酸。可以使用甚至更长的探针，例如长度上是至少600个核苷酸、至少优选至少700个核苷酸、更优选至少800个核苷酸、或最优选至少900个核苷酸的核酸探针。DNA和RNA两种探针都可使用。通常将探针标记用于检测相应的基因(例如用³²P、³H、³⁵S、生物素或抗生物素蛋白(avidin)标记)。此类探针涵盖在本发明中。

因此，可以对自此类其它生物体制备的基因组DNA或cDNA文库筛选与上文所述探针发生杂交且编码具有内切葡聚糖酶活性之多肽的DNA。可以通过琼脂糖或聚丙烯酰胺凝胶电泳或其它分离技术分离来自此类其它生物体的基因组或其它DNA。可以将来自文库的DNA或分离的DNA转移至硝酸纤维素或其它合适的载体材料并固定化于其上。为了鉴定与上文所述序列同源的克隆或DNA，将所述载体材料用在Southern印迹中。

就本发明而言，杂交表示核苷酸序列在很低的至很高的严格条件下与经过标记的核酸探针发生杂交，所述核酸探针对应于上文所述核苷酸序列之一。可使用X射线片来检测在这些条件下核酸探针与之发生杂交的分子。

对于长度为至少100个核苷酸的长探针，很低的至很高的严格条件定义为遵循标准的Southern印迹方法，在42℃，在5X SSPE，0.3％SDS，200μg/ml经剪切和变性的鲑精DNA，和25％甲酰胺(用于很低的和低的严格性)、35％甲酰胺(用于中等和中等-高的严格性)、或50％甲酰胺(用于很高的严格性)中进行预杂交和杂交，最佳的是12-24小时。

对于长度为至少100个核苷酸的长探针，将载体材料最终优选在45℃(很低的严格性)、更优选在50℃(低的严格性)、更优选在55℃(中等严格性)、更优选在60℃(中等-高的严格性)、甚至更优选在65℃(高的严格性)、和最优选在70℃(很高的严格性)使用2X SSC，0.2％SDS清洗三次各15分钟。

对于长度为约15个核苷酸至约70个核苷酸的短探针，严格条件定义为遵循标准的Southern印迹方法在比使用根据Bolton和McCarthy(1962，Proceedings of the National Academy of Sciences USA 48：1390)的算法得出的计算T_m低约5℃到约10℃的温度在0.9M NaCl，0.09M Tris-HCl pH7.6，6mMEDTA，0.5％NP-40，1X Denhardt氏溶液，1mM焦磷酸钠，1mM磷酸二氢钠，0.1mM ATP，和0.2mg/ml酵母RNA中进行预杂交、杂交和杂交后清洗，最佳的是12-24小时。

对于长度为约15个核苷酸至约70个核苷酸的短探针，将载体材料在比计算T_m低5℃到10℃的温度在6X SCC加0.1％SDS中清洗一次15分钟和使用6XSSC清洗两次各15分钟。

具有生物学活性之多肽及其多核苷酸

分泌很差或根本不分泌的任何多肽可用于本发明的方法。所述多肽可以是任何具有感兴趣生物学活性之多肽。所述具有生物学活性之多肽对于感兴趣的真菌宿主细胞而言可以是天然的或异源的(外来的)。术语“异源多肽”在本申请中定义为对于宿主细胞而言不是天然的多肽；或者为了改变天然多肽已经进行了结构修饰的天然多肽。

在优选的方面，多肽是抗体、抗原、抗微生物肽、酶、生长因子、激素、免疫扩张剂(immunodilator)、神经递质、受体、报道蛋白、或结构蛋白。

在另一个优选的方面，多肽是白蛋白、胶原、原弹性蛋白、弹性蛋白、或明胶。

在更优选的方面，多肽是氧化还原酶、转移酶、水解酶、裂合酶、异构酶、或连接酶。

在甚至更优选的方面，多肽是α-淀粉酶、α-1，3-葡聚糖酶、α-半乳糖苷酶、α-葡糖苷酶、α-1，6-甘露糖苷酶、氨肽酶、淀粉酶、***糖酶、β-琼脂(水解)酶β-淀粉酶、β-1，3-葡聚糖酶、β-1，6-葡聚糖酶、β-半乳糖苷酶、β-葡糖苷酶、β-甘露糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、壳聚糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、右旋糖苷酶、内切-1，4-β-半乳聚糖酶、内切-1，6-β-半乳聚糖酶、酯酶、岩藻糖苷酶、葡糖淀粉酶、葡糖脑苷脂酶、透明质酸酶、菊粉酶(inulinase)、转化酶、漆酶、果聚糖酶(levanase)、地衣淀粉酶(licheninase)、脂肪酶、溶菌酶、甘露糖苷酶、变位酶(mutanase)、氧化酶、果胶水解酶、过氧化物酶、磷脂酶、肌醇六磷酸酶、多聚半乳糖醛酸酶、多酚氧化酶、蛋白水解酶、鼠李半乳糖醛酸酶、鼠李糖苷酶、核糖核酸酶、海藻糖酶、转谷氨酰胺酶、糖基转移酶、尿激酶、或木聚糖酶。

在另一个甚至更优选的方面，多肽是纤维素分解酶或纤维素酶。纤维素分解酶的例子包括但不限于内切葡聚糖酶、纤维二糖水解酶、和β-葡糖苷酶。帮助纤维素分解酶作用的其它蛋白质为具有纤维素水解增强活性的多肽(参见例如WO 2005/074647，WO 2005/074656，和美国已公开申请2007/0077630)。

在最优选的方面，多肽是内切葡聚糖酶。在另一个最优选的方面，多肽是纤维二糖水解酶。在另一个最优选的方面，多肽是β-葡糖苷酶。在另一个最优选的方面，多肽是具有纤维素水解增强活性的多肽。

在另一个更优选的方面，多肽是半纤维素酶。半纤维素酶可分成三大类：攻击多糖链内的内部键的内切作用酶，自多糖链的还原端或非还原端渐进作用的外切作用酶，和水解木质素糖苷键的酯酶(如香豆酸酯酶和阿魏酸酯酶)、乙酰酯酶和辅助酶(Wong，K.K.Y.，Tan，L.U.L.，和Saddler，J.N.，1988，Multiplicity of β-1，4-xylanase in microorganisms：Functions and applications，Microbiol.Rev.52：305-317；Tenkanen，M.，和Poutanen，K.，1992，Significanceof esterases in the degradation of xylans，于Xylans and Xylanases，Visser，J.，Beldman，G.，Kuster-van Someren，M.A.，和Voragen，A.G.J.，编，Elsevier，New York，NY，203-212；Coughlan，M.P.，和Hazlewood，G.P.，1993，Hemicellulose and hemicellulases，Portland，London，UK；Brigham，J.S.，Adney，W.S.，和Himmel，M.E.，1996，Hemicellulases：Diversity and applications，于Handbook on Bioethanol：Production and Utilization，Wyman，C.E.，编，Taylor& Francis，Washington，DC，119-141)。

半纤维素酶包括但不限于木聚糖酶、***呋喃糖苷酶、乙酰木聚糖酯酶、葡糖醛酸糖苷酶(glucuronidase)、内切半乳聚糖酶、甘露聚糖酶、内切或外切***糖酶、外切半乳聚糖酶、及其混合物。内切作用的半纤维素酶和辅助酶的例子包括但不限于内切***聚糖酶、内切***半乳聚糖酶、内切葡聚糖酶、内切甘露聚糖酶、内切木聚糖酶、和阿魏酰***木聚糖(feraxan)内切木聚糖酶。外切作用的半纤维素酶和辅助酶的例子包括但不限于α-L-***糖苷酶、β-L-***糖苷酶、α-1，2-L-岩藻糖苷酶、α-D-半乳糖苷酶、β-D-半乳糖苷酶、β-D-葡糖苷酶、β-D-葡糖醛酸糖苷酶、β-D-甘露糖苷酶、β-D-木糖苷酶、外切葡糖苷酶、外切纤维二糖水解酶、外切甘露二糖水解酶、外切甘露聚糖酶、外切木聚糖酶、木聚糖α-葡糖醛酸糖苷酶、和松柏苷β-葡糖苷酶。酯酶的例子包括但不限于乙酰酯酶(乙酰半乳聚糖酯酶、乙酰甘露聚糖酯酶、和乙酰木聚糖酯酶)和芳基酯酶(香豆酸酯酶和阿魏酸酯酶)。

在另一个最优选的方面，多肽是木聚糖酶。在另一个最优选的方面，多肽是木葡聚糖酶。在另一个最优选的方面，多肽是***呋喃糖苷酶。在另一个最优选的方面，多肽是葡糖醛酸糖苷酶，例如α-葡糖醛酸糖苷酶。在另一个最优选的方面，多肽是内切半乳聚糖酶。在另一个最优选的方面，多肽是甘露聚糖酶。在另一个最优选的方面，多肽是内切***糖酶。在另一个最优选的方面，多肽是外切***糖酶。在另一个最优选的方面，多肽是内切***聚糖酶。在另一个最优选的方面，多肽是内切***半乳聚糖酶。在另一个最优选的方面，多肽是内切葡聚糖酶。在另一个最优选的方面，多肽是内切甘露聚糖酶。在另一个最优选的方面，多肽是内切木聚糖酶。在另一个最优选的方面，多肽是阿魏酰***木聚糖内切木聚糖酶。在另一个最优选的方面，多肽是α-L-***糖苷酶。在另一个最优选的方面，多肽是β-L-***糖苷酶。在另一个最优选的方面，多肽是β-葡聚糖酶。在另一个最优选的方面，多肽是α-1，2-L-岩藻糖苷酶。在另一个最优选的方面，多肽是α-D-半乳糖苷酶。在另一个最优选的方面，多肽是β-D-半乳糖苷酶。在另一个最优选的方面，多肽是β-D-葡糖苷酶。在另一个最优选的方面，多肽是β-D-葡糖醛酸糖苷酶。在另一个最优选的方面，多肽是β-D-甘露糖苷酶。在另一个最优选的方面，多肽是β-D-木糖苷酶。在另一个最优选的方面，多肽是外切葡糖苷酶。在另一个最优选的方面，多肽是外切甘露二糖水解酶。在另一个最优选的方面，多肽是外切甘露聚糖酶。在另一个最优选的方面，多肽是外切木聚糖酶。在另一个最优选的方面，多肽是木聚糖α-葡糖醛酸糖苷酶。在另一个最优选的方面，多肽是松柏苷β-葡糖苷酶。

在另一个更优选的方面，多肽是酯酶。在用于本申请时，“酯酶”也称为羧酸酯水解酶，指作用于酯键的酶，包括根据酶命名法(EnzymeNomenclature，1992，Academic Press，San Diego，California，及Supplement(补遗)1(1993)，Supplement 2(1994)，Supplement 3(1995)，Supplement 4(1997)和Supplement 5，分别于Eur.J.Biochem.223：1-5，1994；Eur.J.Biochem.232：1-6，1995；Eur.J.Biochem.237：1-5，1996；Eur.J.Biochem.250：1-6，1997；和Eur.J.Biochem.264：610-650，1999)归入EC 3.1.1羧酸酯水解酶的酶。酯酶的非限制性例子包括芳基酯酶、三酰甘油脂肪酶、乙酰酯酶、乙酰胆碱酯酶、胆碱酯酶、托品酯酶、果胶酯酶、固醇酯酶、叶绿素酶、L-***糖酸内酯酶、葡萄糖酸内酯酶、尿内酯酶、鞣酶、棕榈酸视黄酯酯酶、羟基丁酸二聚体水解酶、酰基甘油脂肪酶、3-氧己二酸根烯醇-内酯酶、1，4-内酯酶、半乳糖脂肪酶、4-吡哆醇内酯酶、酰基肉碱水解酶、氨酰-tRNA水解酶、D-***糖酸内酯酶、6-磷酸葡萄糖酸内酯酶、磷脂酶A1、6-乙酰葡萄糖脱乙酰基酶、脂蛋白脂肪酶、二氢香豆素脂肪酶、柠檬苦素-D-环-内酯酶、类固醇-内酯酶、三乙酸根-内酯酶、放线菌素内酯酶、苔色酸根-缩酚酸水解酶、头孢菌素-C脱乙酰基酶、绿原酸根水解酶、α-氨基酸酯酶、4-甲基草酰乙酸根酯酶、羧基甲烯丁烯羟酸内酯酶(carboxymethylenebutenolidase)、脱氧limonateA-环-内酯酶、2-乙酰基-1-烃基甘油磷酸胆碱酯酶、镰孢氨酸-C鸟氨酸酯酶、芥子碱酯酶、蜡酯水解酶、佛波二酯水解酶、磷脂酰肌醇脱酰基酶、唾液酸根O-乙酰酯酶、乙酰氧基丁炔基并噻吩脱乙酰基酶、乙酰水杨酸根脱乙酰基酶、乙酸甲基伞形基酯脱乙酰基酶、2-吡喃酮-4，6-二羧酸根内酯酶、N-乙酰半乳糖胺聚糖脱乙酰基酶、保幼-激素酯酶、双(2-乙基己基)酞酸根酯酶、蛋白质-谷氨酸根甲基酯酶、11-顺式-棕榈酸视黄酯水解酶、全-反式-棕榈酸视黄酯水解酶、L-鼠李糖-1，4-内酯酶、5-(3，4-双乙酸基丁-1-炔基)-2，2′-并噻吩脱乙酰基酶、脂肪-酰基-乙基-酯合酶、木糖-1，4-内酯酶、N-乙酰葡萄糖胺基磷脂酰肌醇脱乙酰基酶、西曲酸酯苄基酯酶、和乙酰基烃基甘油乙酰水解酶。可用于纤维素生物转化的酯酶包括乙酰酯酶，如乙酰半乳聚糖酯酶、乙酰甘露聚糖酯酶、和乙酰木聚糖酯酶，及水解木质素糖苷键的酯酶，如香豆酸酯酶和阿魏酸酯酶。

在另一个最优选的方面，多肽是乙酰酯酶。在另一个最优选的方面，多肽是乙酰半乳聚糖酯酶。在另一个最优选的方面，多肽是乙酰甘露聚糖酯酶。在另一个最优选的方面，多肽是乙酰木聚糖酯酶。在另一个最优选的方面，多肽是芳基酯酶。在另一个最优选的方面，多肽是香豆酸酯酶。在另一个最优选的方面，多肽是阿魏酸酯酶。

在另一个更优选的方面，多肽是脂肪酶。在另一个更优选的方面，多肽是磷脂酶，例如磷脂酶A1、磷脂酶A2、磷脂酶C、磷脂酶C、或磷脂酶D。

在另一个更优选的方面，多肽是角质酶。

在另一个最优选的方面，多肽是葡萄糖异构酶。在另一个最优选的方面，多肽是木糖异构酶。

在另一个更优选的方面，多肽是蛋白水解酶。蛋白酶是本领域众所周知的，指催化肽键切割的酶。

在另一个最优选的方面，多肽是丝氨酸蛋白酶。在另一个最优选的方面，多肽是金属蛋白酶。在另一个最优选的方面，多肽是硫醇(thiol)蛋白酶。

在另一个更优选的方面，多肽是肽酶。在另一个最优选的方面，多肽是氨肽酶，例如二肽基氨肽酶或三肽基氨肽酶。在另一个最优选的方面，多肽是羧肽酶。

在另一个更优选的方面，多肽是漆酶。

在另一个更优选的方面，多肽是过氧化物酶。

在另一个更优选的方面，多肽是淀粉降解酶。在另一个最优选的方面，多肽是α-淀粉酶。在另一个最优选的方面，多肽是淀粉葡糖苷酶。在另一个最优选的方面，多肽是支链淀粉酶。在另一个最优选的方面，多肽是脱支酶。在另一个最优选的方面，多肽是环糊精糖基转移酶。

编码具有生物学活性之多肽的催化结构域、成熟多肽、或全长多肽，或其部分的多核苷酸可以自任何生物体获得。

编码具有生物学活性之多肽的多核苷酸可以自编码细菌多肽的基因获得。例如，多肽可以是***多肽，包括但不限于芽孢杆菌属、链球菌属、链霉菌属、葡萄球菌属、肠球菌属、乳杆菌属、乳球菌属、梭菌属、地芽孢杆菌属或Oceanobacillus多肽；或者革兰氏阴性细菌多肽，包括但不限于大肠埃希氏菌或大肠杆菌、假单胞菌属、沙门氏菌属、弯曲杆菌属、螺杆菌属、黄杆菌属、梭杆菌属、泥杆菌属、奈瑟氏菌属或脲原体属多肽。

在优选的方面，编码具有生物学活性之多肽的多核苷酸可以自编码如下多肽的基因获得：嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、或苏云金芽孢杆菌多肽。

在另一个优选的方面，编码具有生物学活性之多肽的多核苷酸可以自编码如下多肽的基因获得：似马链球菌、酿脓链球菌、***链球菌、或马链球菌兽瘟亚种多肽。

在另一个优选的方面，编码具有生物学活性之多肽的多核苷酸可以自编码如下多肽的基因获得：不产色链霉菌(Streptomyces achromogenes)、阿维链霉菌(Streptomyces avermitilis)、天蓝链霉菌(Streptomyces coelicolor)、灰色链霉菌(Streptomyces griseus)、或浅青紫链霉菌多肽。

编码具有生物学活性之多肽的多核苷酸也可以自编码真菌多肽基因获得，更优选酵母多肽，如假丝酵母属、克鲁维酵母属、毕赤酵母属、糖酵母属或酵母属、裂殖糖酵母属或裂殖酵母属、或耶氏酵母(西洋蓍霉)属多肽；或更优选丝状真菌多肽，如枝顶孢霉属、蘑菇属(Agaricus)、链格孢属(Alternaria)、曲霉属、短梗霉属、葡萄座腔菌属(Botryospaeria)、拟蜡菌属(Ceriporiopsis)、毛壳霉属(Chaetomidium)、金孢子菌属(Chrysosporium)、麦角菌属(Claviceps)、旋孢霉属(Cochliobolus)、鬼伞属(Coprinopsis)、Coptotermes、棒囊壳属(Corynascus)、隐球丛赤壳属(Cryphonectria)、隐球菌属、色二孢属(Diplodia)、黑耳属(Exidia)、篮状菌属(Filibasidium)、镰孢属、赤霉属(Gibberella)、全鞭毛虫属(Holomastigotoides)、腐质霉属、耙菌属(Irpex)、香菇属(Lentinula)、小球腔菌属(Leptospaeria)、梨孢菌属、Melanocarpus、亚灰树花菌属(Meripilus)、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属(Phanerochaete)、瘤胃壶菌属、Poitrasia、假黑盘菌属(Pseudoplectania)、Pseudotrichonympha、根毛霉属(Rhizomucor)、裂褶菌属、柱霉属(Scytalidium)、踝节菌属、热子囊菌属、梭孢壳属、弯颈霉属、木霉属、长毛盘菌属(Trichophaea)、轮枝孢属(Verticillium)、小包脚菇属(Volvariella)、或炭角菌属(Xylaria)多肽。

在优选的方面，编码具有生物学活性之多肽的多核苷酸可以自编码如下多肽的基因获得：卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母、或卵形酵母多肽。

在另一个优选的方面，编码具有内切葡聚糖酶活性之多肽的多核苷酸可以自编码如下多肽的基因获得：纤维分解枝顶孢霉(Acremoniumcellulolyticus)、棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、嗜角质金孢子菌(Chrysosporium keratinophilum)、Chrysosporium lucknowense、热带金孢子菌(Chrysosporium tropicum)、Chrysosporium merdarium、Chrysosporium inops、毡金孢子菌(Chrysosporiumpannicola)、Chrysosporium queenslandicum、Chrysosporium zonatum、Cladorrhinum foecundissimum、杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、灰色腐质酶(Humicola grisea)、特异腐质霉、疏棉状腐质霉、乳色耙菌(Irpex lacteus)、米赫毛霉、嗜热毁丝霉、粗糙脉孢菌、绳状青霉(Penicillium funiculosum)、产紫青霉、黄孢平革菌(Phanerochaetechrysosporium)、无色梭孢壳、Thielavia albomyces、Thielavia albopilosa、Thielavia australeinsis、Thielavia fimeti、小孢梭孢壳、卵孢梭孢壳、Thielaviaperuviana、瘤孢梭孢壳、毛梭孢壳、Thielavia subthermophila、土生梭孢霉、Thielavia variospora、Thielavia wareingii、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、或绿色木霉多肽。

在一个特别优选的方面，具有生物学活性之多肽是β-葡糖苷酶。可用作本发明方法中的多核苷酸来源的β-葡糖苷酶的例子包括但不限于米曲霉β-葡糖苷酶(WO 02/095014；WO 04/099228)；棘孢曲霉β-葡糖苷酶(Kawaguchi等，1996，Gene 173：287-288)；燕麦曲霉(Aspergillus avenaceus)(GENBANK^TM登录号AY943971)；烟曲霉(GENBANK^TM登录号XM745234)；川地曲霉(GENBANK^TM登录号AB003470)；黑曲霉(GENBANK^TM AJ132386)；灰色梨孢菌(Magnaporthe grisea)(GENBANK^TM登录号AY849670)；黄孢平革菌(GENBANK^TM登录号AB253327)；埃默森篮状菌(Talaromyces emersonii)(GENBANK^TM登录号AY072918)；和里氏木霉(GENBANK^TM登录号U09580，AB003110，AY281374，AY281375，AY281377，AY281378，和AY281379)。β-葡糖苷酶变体也可用作多核苷酸来源，如WO 04/099228中披露的那些。

在优选的方面，β-葡糖苷酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自家族1β-葡糖苷酶基因获得的多核苷酸编码的。

在另一个优选的方面，β-葡糖苷酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自家族3β-葡糖苷酶基因获得的多核苷酸编码的。

在另一个优选的方面，β-葡糖苷酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自米曲霉β-葡糖苷酶基因获得的多核苷酸编码的。在最优选的方面，β-葡糖苷酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自米曲霉β-葡糖苷酶基因或米曲霉β-葡糖苷酶突变体基因获得的多核苷酸编码的，所述米曲霉β-葡糖苷酶基因包含编码SEQ ID NO：24之多肽的SEQID NO：23，所述米曲霉β-葡糖苷酶突变体基因包含编码SEQ ID NO：26之多肽的SEQ ID NO：25。

在另一个优选的方面，β-葡糖苷酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自烟曲霉β-葡糖苷酶基因获得的多核苷酸编码的。在最优选的方面，β-葡糖苷酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自烟曲霉β-葡糖苷酶基因获得的多核苷酸编码的，所述烟曲霉β-葡糖苷酶基因包含编码SEQ ID NO：28之多肽的SEQ ID NO：27。

在另一个优选的方面，β-葡糖苷酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自巴西青霉(Penicillium brasilianum)菌株IBT 20888β-葡糖苷酶基因获得的多核苷酸编码的。在最优选的方面，β-葡糖苷酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自巴西青霉菌株IBT 20888β-葡糖苷酶基因获得的多核苷酸编码的，所述巴西青霉菌株IBT 20888β-葡糖苷酶基因包含编码SEQ ID NO：30之多肽的SEQ ID NO：29。

在另一个优选的方面，β-葡糖苷酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自里氏木霉菌株No.QM9414β-葡糖苷酶基因获得的多核苷酸编码的。在另一个最优选的方面，β-葡糖苷酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自里氏木霉菌株No.QM9414β-葡糖苷酶基因获得的多核苷酸编码的，所述里氏木霉菌株No.QM9414β-葡糖苷酶基因包含编码SEQ ID NO：32之多肽的SEQ ID NO：31(GENBANK^TM登录号U09580)。

在另一个优选的方面，β-葡糖苷酶是天然分泌的。在另一个优选的方面，β-葡糖苷酶不是天然分泌的。

在另一个优选的方面，β-葡糖苷酶的全长多肽、成熟多肽、或催化结构域，或其部分是由自编码同源多肽的基因获得的多核苷酸编码的，所述同源多肽包含氨基酸序列，该氨基酸序列与SEQ ID NO：24、SEQ ID NO：26、SEQID NO：28、SEQ ID NO：30、或SEQ ID NO：32之全长多肽、成熟多肽、或催化结构域的氨基酸序列具有至少60％、优选至少65％、更优选至少70％、更优选至少75％、更优选至少80％、更优选至少85％、甚至更优选至少90％、最优选至少95％、且甚至最优选96％、97％、98％、或99％的同一性程度，其具有内切葡聚糖酶活性。在优选的方面，同源多肽具有与SEQ ID NO：24、SEQ ID NO：26、SEQ ID NO：28、SEQ ID NO：30、或SEQ ID NO：32之全长多肽、成熟多肽、或催化结构域差别为10个氨基酸、优选5个氨基酸、更优选4个氨基酸、甚至更优选3个氨基酸、最优选2个氨基酸、且甚至最优选1个氨基酸的氨基酸序列。

在另一个优选的方面，β-葡糖苷酶的全长多肽、成熟多肽、或催化结构域，或其部分是由如下多核苷酸编码的，所述多核苷酸在很低的严格条件、优选低的严格条件、更优选中等严格条件、更优选中等-高的严格条件、甚至更优选高的严格条件、和最优选很高的严格条件下与(i)SEQ ID NO：23、SEQ ID NO：25、SEQ ID NO：27、SEQ ID NO：29、或SEQ ID NO：31，(ii)SEQID NO：23、SEQ ID NO：25、SEQ ID NO：27、SEQ ID NO：29、或SEQ ID NO：31中所包含的cDNA序列，(iii)(i)或(ii)的子序列，或(iv)(i)、(ii)或(iii)的互补链发生杂交(J.Sambrook，E.F.Fritsch，和T.Maniatis，1989，Molecular Cloning，A Laboratory Manual，第2版，Cold Spring Harbor，New York)。SEQ ID NO：23、SEQ ID NO：25、SEQ ID NO：27、SEQ ID NO：29、或SEQ ID NO：31的子序列包含至少100个连续的核苷酸或优选至少200个连续的核苷酸。

SEQ ID NO：23、SEQ ID NO：25、SEQ ID NO：27、SEQ ID NO：29、或SEQ ID NO：31的核苷酸序列或其子序列，以及SEQ ID NO：24、SEQ ID NO：26、SEQ ID NO：28、SEQ ID NO：30、或SEQ ID NO：32的氨基酸序列或其片段可以用于设计核酸探针，以根据本领域众所周知的方法自不同属或种的菌株鉴定和克隆编码具有β-葡糖苷酶活性之多肽的DNA。具体而言，遵循标准的Southern印迹方法，此类探针可用于与感兴趣的属或种的基因组或cDNA杂交，以鉴定和分离其中相应的基因。此类探针可明显短于完整序列，但长度上应为至少14、优选至少25、更优选至少35、和最优选至少70个核苷酸。然而，优选核酸探针长度上是至少100个核苷酸。例如，核酸探针长度上可以是至少200个核苷酸、优选至少300个核苷酸、更优选至少400个核苷酸、或最优选至少500个核苷酸。可以使用甚至更长的探针，例如长度上是至少600个核苷酸、至少优选至少700个核苷酸、更优选至少800个核苷酸、或最优选至少900个核苷酸的核酸探针。DNA和RNA两种探针都可使用。通常将探针标记以检测相应的基因(例如用³²P、³H、³⁵S、生物素或抗生物素蛋白标记)。此类探针涵盖在本发明中。

信号肽

信号肽可以是由用于本发明融合蛋白胞外分泌的宿主细胞识别的任何适宜信号肽。信号序列优选是与待表达融合蛋白的内切葡聚糖酶构件天然相关的信号序列。

编码多肽的核苷酸序列的编码序列的5’端可以内在地包含与编码分泌型多肽的编码区区段以符合翻译读码框的方式天然相连接的信号肽编码区。或者，编码序列的5’端可以包含对于编码序列而言是外来的信号肽编码区。在编码序列天然不包含信号肽编码区的情况中，可能需要外来信号肽编码区。或者，外来信号肽编码区可以仅仅替换天然信号肽编码区，以增强多肽的分泌。然而，本发明可使用指导所表达融合蛋白进入所选宿主细胞的分泌途径，即分泌入培养基的任何信号肽编码区。

对于丝状真菌宿主细胞有效的信号肽编码序列是自以下酶的基因获得的信号肽编码序列：米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米赫根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、和疏棉状腐质霉脂肪酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、和里氏木霉β-木糖苷酶。

对于酵母宿主细胞有用的信号肽编码序列是自以下酶的基因获得的：酿酒酵母α-因子和酿酒酵母转化酶。其它有用的信号肽编码序列披露于Romanos等，1992，见上文。

在优选的方面，信号肽编码序列得自编码内切葡聚糖酶的基因。在更优选的方面，信号肽编码序列得自编码内切葡聚糖酶V的基因。在甚至更优选的方面，信号肽编码序列得自编码内切葡聚糖酶V的特异腐质霉基因。在最优选的方面，信号肽编码序列编码SEQ ID NO：2的氨基酸1-21。在另一个最优选的方面，信号肽编码序列是SEQ ID NO：1的核苷酸1-63。

融合蛋白可以进一步包含与融合蛋白的β-葡糖苷酶构件相关的第二信号肽。信号肽编码序列可以是与具有生物学活性之多肽的编码序列天然相关的信号肽编码序列，或者可以是不同的信号肽编码序列，如上文所述那些之一。

在优选的方面，信号肽编码序列是与β-葡糖苷酶编码序列天然相关的序列。

接头

如上所述，许多内切葡聚糖酶具有多结构域结构，其由通过接头肽与一个或几个碳水化合物结合模块分隔开的催化结构域组成。在本发明的方法中，融合蛋白构建体可进一步包含接头编码序列，其位于包含内切葡聚糖酶的催化结构域的序列的3′和包含具有生物学活性之多肽的催化结构域的序列的5′。

接头可以自与内切葡聚糖酶的催化结构域相同的基因获得，或者自不同的内切葡聚糖酶基因获得。另一方面，接头可以是合成起源的。

可用于本发明方法的接头的例子包括但不限于自以下酶的基因获得的接头：里氏木霉纤维二糖水解酶I(Srisodsuk等，1993，Journal of BiologicalChemistry 268：20765-20761)；红褐肉座菌(Hypocrea jecorina)(以前的里氏木霉)Cel7A纤维二糖水解酶(Mulakala等，2005，Proteins 60：598-605)；特异腐质霉内切葡聚糖酶V；和土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶。

在优选的方面，接头得自特异腐质霉内切葡聚糖酶基因。在另一个优选的方面，接头得自里氏木霉内切葡聚糖酶基因。在更优选的方面，接头得自特异腐质霉内切葡聚糖酶V(eg5)基因。

在另一个优选的方面，接头得自土生梭孢霉内切葡聚糖酶基因。在另一个更优选的方面，接头得自土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶基因。

在优选的方面，接头是至少5个氨基酸残基。在更优选的方面，接头是至少15个氨基酸残基。在最优选的方面，接头是至少25个氨基酸残基。

在优选的方面，接头为约5个-约60个氨基酸残基。在更优选的方面，接头为约15个-约50个氨基酸残基。在最优选的方面，接头为约25个-约45个氨基酸残基。

碳水化合物结合模块

碳水化合物结合模块(CBM)定义为具有离散折叠结构(discrete fold)(其具有碳水化合物结合活性)且常见于碳水化合物活性酶内的连续氨基酸序列。许多类型的CBM已有记载，其中大多数结合不溶性多糖(参见Boraston等，2004，Biochem J.382：769-781)。

碳水化合物结合模块已经表征为介导与例如结晶纤维素、非结晶纤维素、几丁质、β-1，3-葡聚糖和β-1，3-1，4-混合连接的葡聚糖、木聚糖、甘露聚糖、半乳聚糖和淀粉的相互作用。碳水化合物结合模块频繁出现于多结构域纤维素酶中。虽然有些CBM赋予对碳水化合物结构子集的特异性结合，但是其它CBM在它们与各种多糖结合的能力方面是更普遍性的。赋予对纤维素的结合的CBM有时称为纤维素结合结构域或CBD(Boraston等，2004，Biochem J.382：769-781)。CBM根据氨基酸相似性来分组；当前记载了48个CBM家族。

糖苷水解酶可以包含超过一个催化结构域和一个、两个、三个、或更多个CBM，且任选进一步包含一个或几个将CBM与催化结构域连接的多肽氨基酸序列区，后一种类型的区常常称为“接头”。包含CBM的水解酶的例子有纤维素酶、木聚糖酶、甘露聚糖酶、***呋喃糖苷酶(arabinofuranosidase)、乙酰酯酶和几丁质酶(参见P.Tomme等，Cellulose-Binding Domains-Classification和Properties in Enzymatic Degradation of Insoluble Carbohydrates，John N.Saddler和Michael H.Penner(编)，ACS Symposium Series，No.618，1996)。

CBM可以位于蛋白质或多肽的N或C端或者位于内部位置。多肽或蛋白质中构成CBM的区域通常由超过约30个且不足约250个氨基酸残基组成。例如，家族I中列举和归类的那些CBM由33-37个氨基酸残基组成，家族2a中列举和归类的那些由95-108个氨基酸残基组成，而家族6中列举和归类的那些由85-92个氨基酸残基组成。因而，构成CBM的氨基酸序列的分子量通常在约4kDa至约40kDa的范围内，通常低于(below)约35kDa。

在本发明的方法中，可以使用任何CBM。CBM可以是与内切葡聚糖酶天然相关的，或者对于内切葡聚糖酶而言可以是外来的。

在优选的方面，CBM得自里氏木霉内切葡聚糖酶(EG)基因。在更优选的方面，CBM得自里氏木霉内切葡聚糖酶EGI基因。在另一个更优选的方面，CBM得自里氏木霉内切葡聚糖酶EGII基因。在另一个更优选的方面，CBM得自里氏木霉内切葡聚糖酶EGV基因。

在另一个优选的方面，CBM得自里氏木霉纤维二糖水解酶(CBH)基因。在另一个优选的方面，CBM得自里氏木霉CBHI基因(Terri等，1987，Gene 51：42-52；Linder和Teeri，1996，Biochemistry 93：12251-12255)。在另一个优选的方面，CBM得自里氏木霉CBHII基因。

在另一个优选的方面，CBM得自土生梭孢霉内切葡聚糖酶基因。在另一个更优选的方面，CBM得自土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶基因。

切割位点

在本发明的方法中，融合蛋白构建体可以进一步包含编码切割位点的核苷酸序列。切割位点优选位于包含内切葡聚糖酶的至少催化结构域的序列和包含具有生物学活性之多肽的至少催化结构域的序列之间。在融合蛋白分泌后，所述位点受到切割，自融合蛋白释放具有生物学活性之多肽。

切割位点的例子包括但不限于编码二肽Lys-Arg的Kex2位点(Martin等，2003，J.Ind.Microbiol.Biotechnol.3：568-76；Svetina等，2000，J.Biotechnol.76：245-251；Rasmussen-Wilson等，1997，Appl.Environ.Microbiol.63：3488-3493；Ward等，1995，Biotechnology 13：498-503；和Contreras等，1991，Biotechnology9：378-381)、Ile-(Glu或Asp)-Gly-Arg位点(其在精氨酸残基之后受到因子Xa蛋白酶切割)(Eaton等，1986，Biochem.25：505-512)；Asp-Asp-Asp-Asp-Lys位点(其在赖氨酸之后受到肠激酶的切割)(Collins-Racie等，1995，Biotechnology13：982-987)；His-Tyr-Glu位点或His-Tyr-Asp位点(其受到Genenase I的切割)(Carter等，1989，Proteins：Structure，Function，and Genetics 6：240-248)；Leu-Val-Pro-Arg-Gly-Ser位点(其在Arg之后受到凝血酶的切割)(Stevens，2003，Drug Discovery World 4：35-48)；Glu-Asn-Leu-Tyr-Phe-Gln-Gly位点(其在Gln之后受到TEV蛋白酶的切割)(Stevens，2003，见上文)；和Leu-Glu-Val-Leu-Phe-Gln-Gly-Pro位点(其在Gln之后受到遗传工程形式的人鼻病毒3C蛋白酶的切割)(Stevens，2003，见上文)。

融合蛋白

本发明具有生物学活性的融合蛋白(其包含信号肽、内切葡聚糖酶的至少催化结构域或其部分、和具有生物学活性之多肽的至少催化结构域或其部分)与不存在所述内切葡聚糖酶的至少催化结构域或其部分时相比提高融合蛋白的分泌。在下文每一个优选的方面，融合蛋白的构件自蛋白质的N端至C端以符合读码框的方式相连接。

在优选的方面，融合蛋白包含信号肽；内切葡聚糖酶的催化结构域；和具有生物学活性之多肽的催化结构域。

在另一个优选的方面，融合蛋白包含信号肽；具有生物学活性之多肽的催化结构域；和内切葡聚糖酶的催化结构域。

在另一个优选的方面，融合蛋白包含信号肽；内切葡聚糖酶的成熟多肽；和具有生物学活性之多肽的催化结构域。

在另一个优选的方面，融合蛋白包含信号肽；具有生物学活性之多肽的催化结构域；和内切葡聚糖酶的成熟多肽。

在另一个优选的方面，融合蛋白包含信号肽；内切葡聚糖酶的催化结构域；和具有生物学活性之多肽的成熟多肽。

在另一个优选的方面，融合蛋白包含信号肽；具有生物学活性之多肽的成熟多肽；和内切葡聚糖酶的催化结构域。

在另一个优选的方面，融合蛋白包含信号肽；内切葡聚糖酶的成熟多肽；和具有生物学活性之多肽的成熟多肽。

在另一个优选的方面，融合蛋白包含信号肽；具有生物学活性之多肽的成熟多肽；和内切葡聚糖酶的成熟多肽。

在另一个优选的方面，融合蛋白包含信号肽；内切葡聚糖酶的催化结构域；和具有生物学活性之多肽的全长多肽。

在另一个优选的方面，融合蛋白包含信号肽；具有生物学活性之多肽的全长多肽；和内切葡聚糖酶的催化结构域。

在另一个优选的方面，融合蛋白包含信号肽；内切葡聚糖酶的成熟多肽；和具有生物学活性之多肽的全长多肽。

在另一个优选的方面，融合蛋白包含信号肽；具有生物学活性之多肽的全长多肽；和内切葡聚糖酶的成熟多肽。

在另一个优选的方面，融合蛋白包含内切葡聚糖酶的全长多肽(信号肽和成熟多肽)；和具有生物学活性之多肽的全长多肽。

在另一个优选的方面，融合蛋白包含具有生物学活性之多肽的全长多肽和内切葡聚糖酶的全长多肽(信号肽和成熟多肽)。

在另一个优选的方面，融合蛋白包含信号肽；内切葡聚糖酶的催化结构域、接头和/或碳水化合物结合模块；和具有生物学活性之多肽的催化结构域。

在另一个优选的方面，融合蛋白包含信号肽；具有生物学活性之多肽的催化结构域、接头和/或碳水化合物结合模块；和内切葡聚糖酶的催化结构域。

在另一个优选的方面，融合蛋白包含信号肽；内切葡聚糖酶的成熟多肽、接头和/或碳水化合物结合模块；和具有生物学活性之多肽的催化结构域。

在另一个优选的方面，融合蛋白包含信号肽；具有生物学活性之多肽的催化结构域、接头和/或碳水化合物结合模块；和内切葡聚糖酶的成熟多肽。

在另一个优选的方面，融合蛋白包含信号肽；内切葡聚糖酶的催化结构域、接头和/或碳水化合物结合模块；和具有生物学活性之多肽的成熟多肽。

在另一个优选的方面，融合蛋白包含信号肽；具有生物学活性之多肽的成熟多肽、接头和/或碳水化合物结合模块；和内切葡聚糖酶的催化结构域。

在另一个优选的方面，融合蛋白包含信号肽；内切葡聚糖酶的成熟多肽、接头和/或碳水化合物结合模块；和具有生物学活性之多肽的成熟多肽。

在另一个优选的方面，融合蛋白包含信号肽；具有生物学活性之多肽的成熟多肽、接头和/或碳水化合物结合模块；和内切葡聚糖酶的成熟多肽。

在另一个优选的方面，融合蛋白包含信号肽；内切葡聚糖酶的催化结构域、接头和/或碳水化合物结合模块；和具有生物学活性之多肽的全长多肽。

在另一个优选的方面，融合蛋白包含信号肽；具有生物学活性之多肽的全长多肽、接头和/或碳水化合物结合模块；和内切葡聚糖酶的催化结构域。

在另一个优选的方面，融合蛋白包含信号肽；内切葡聚糖酶的成熟多肽、接头和/或碳水化合物结合模块；和具有生物学活性之多肽的全长多肽。

在另一个优选的方面，融合蛋白包含信号肽；具有生物学活性之多肽的全长多肽、接头和/或碳水化合物结合模块；和内切葡聚糖酶的成熟多肽。

在另一个优选的方面，融合蛋白包含信号肽；内切葡聚糖酶的催化结构域；第二信号肽；和具有生物学活性之多肽的催化结构域。

在另一个优选的方面，融合蛋白包含信号肽；具有生物学活性之多肽的催化结构域；第二信号肽；和内切葡聚糖酶的催化结构域。

在另一个优选的方面，融合蛋白包含信号肽；内切葡聚糖酶的成熟多肽；第二信号肽；和具有生物学活性之多肽的催化结构域。

在另一个优选的方面，融合蛋白包含信号肽；具有生物学活性之多肽的催化结构域；第二信号肽；和内切葡聚糖酶的成熟多肽。

在另一个优选的方面，融合蛋白包含信号肽；内切葡聚糖酶的催化结构域；第二信号肽；和具有生物学活性之多肽的成熟多肽。

在另一个优选的方面，融合蛋白包含信号肽；具有生物学活性之多肽的成熟多肽；第二信号肽；和内切葡聚糖酶的催化结构域。

在另一个优选的方面，融合蛋白包含信号肽；内切葡聚糖酶的成熟多肽；第二信号肽；和具有生物学活性之多肽的成熟多肽。

在另一个优选的方面，融合蛋白包含信号肽；具有生物学活性之多肽的成熟多肽；第二信号肽；和内切葡聚糖酶的成熟多肽。

在另一个优选的方面，融合蛋白包含信号肽；内切葡聚糖酶的催化结构域、接头和/或碳水化合物结合模块；第二信号肽；和具有生物学活性之多肽的催化结构域。

在另一个优选的方面，融合蛋白包含信号肽；具有生物学活性之多肽的催化结构域、接头和/或碳水化合物结合模块；第二信号肽；和内切葡聚糖酶的催化结构域。

在另一个优选的方面，融合蛋白包含信号肽；内切葡聚糖酶的成熟多肽、接头和/或碳水化合物结合模块；第二信号肽；和具有生物学活性之多肽的催化结构域。

在另一个优选的方面，融合蛋白包含信号肽；具有生物学活性之多肽的催化结构域、接头和/或碳水化合物结合模块；第二信号肽；和内切葡聚糖酶的成熟多肽。

在另一个优选的方面，融合蛋白包含信号肽；内切葡聚糖酶的催化结构域、接头和/或碳水化合物结合模块；第二信号肽；和具有生物学活性之多肽的成熟多肽。

在另一个优选的方面，融合蛋白包含信号肽；具有生物学活性之多肽的成熟多肽、接头和/或碳水化合物结合模块；第二信号肽；和内切葡聚糖酶的催化结构域。

在另一个优选的方面，融合蛋白包含信号肽；内切葡聚糖酶的成熟多肽、接头和/或碳水化合物结合模块；第二信号肽；和具有生物学活性之多肽的成熟多肽。

在另一个优选的方面，融合蛋白包含信号肽；和具有生物学活性之多肽的成熟多肽、接头和/或碳水化合物结合模块；第二信号肽；和内切葡聚糖酶的成熟多肽。

或者，在另一个优选的方面，对于上文每一个优选的方面，融合蛋白可以包含内切葡聚糖酶或具有生物学活性之多肽的催化结构域、成熟多肽、或全长多肽的一部分。内切葡聚糖酶的一部分可以具有或不具有内切葡聚糖酶活性。在更优选的方面，内切葡聚糖酶的一部分具有内切葡聚糖酶活性。

启动子

启动子区可以是受到用于融合蛋白表达的宿主细胞识别的任何适宜启动子序列。启动子序列包含介导多肽表达的转录控制序列。启动子可以是在所选择宿主细胞中显示出转录活性的任何核苷酸序列，包括突变的、截短的、串联的、和杂合的启动子，而且可以自编码胞外或胞内多肽的基因获得，所述基因对于宿主细胞而言可以是天然的或外来的(异源的)。启动子的例子包括组成型启动子和诱导型启动子二者。

用于指导本发明的融合蛋白构建体转录，尤其是在细菌宿主细胞中转录的合适启动子的实例是从下述获得的启动子：大肠杆菌lac操纵子、天蓝色链霉菌(Streptomyces coelicolor)琼脂糖酶基因(dagA)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌产麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因、及原核β-内酰胺酶基因(Villa-Kamaroff等，1978，Proceedings of the National Academy of SciencesUSA 75：3727-3731)，以及tac启动子(DeBoer等，1983，Proceedings of theNational Academy of Sciences USA 80：21-25)。另外的启动子记载于″Usefulproteins from recombinant bacteria″于Scientific American，1980，242：74-94；及Sambrook等，1989，见上文。

用于指导本发明的融合蛋白构建体在丝状真菌宿主细胞中转录的合适启动子的实例是从以下酶的基因获得的启动子：米曲霉TAKA淀粉酶、米赫根毛霉天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、构巢曲霉乙酰胺酶、镶片镰孢淀粉葡糖苷酶(WO00/56900)、镶片镰孢Daria(WO 00/56900)、镶片镰孢Quinn(WO 00/56900)、尖镰孢胰蛋白酶样蛋白酶(WO 96/00787)、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶、灰盖鬼伞(Coprinus cinereus)β-微管蛋白、和里氏木霉Swollenin，以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉丙糖磷酸异构酶基因的启动子的杂合体)；和它们的突变的、截短的和杂合的启动子。

在酵母宿主中，有用的启动子从如下酶的基因获得：酿酒酵母烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1，ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)、和酿酒酵母3-磷酸甘油酸激酶。对于酵母宿主细胞其它有用的启动子记载于Romanos等，1992，Yeast 8：423-488。

在优选的方面，启动子是纤维二糖水解酶启动子。在更优选的方面，启动子是纤维二糖水解酶I(cbh1)启动子。在甚至更优选的方面，启动子是里氏木霉纤维二糖水解酶I基因(cbh1)启动子。在最优选的方面，启动子是SEQ IDNO：29(GENBANK^TM登录号D86235)的核苷酸505-1501之里氏木霉cbh1启动子。在另一个更优选的方面，启动子是纤维二糖水解酶II(cbh2)启动子。在另一个甚至更优选的方面，启动子是里氏木霉纤维二糖水解酶II基因(cbh2)启动子。在另一个最优选的方面，启动子是SEQ ID NO：30(GENBANK^TM登录号M55080)的核苷酸1-582之里氏木霉cbh2启动子。

在另一个优选的方面，启动子是NA2-tpi启动子。在另一个优选的方面，启动子是TAKA淀粉酶启动子。在另一个优选的方面，启动子是镶片镰孢淀粉葡糖苷酶启动子。在另一个优选的方面，启动子是尖镰孢胰蛋白酶样蛋白酶启动子。在另一个优选的方面，启动子是黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)启动子。

在优选的方面，启动子区驱动第一、第二、和第三多核苷酸、或者还有第四多核苷酸的表达。

终止子

终止子可以是受到宿主细胞识别以终止转录的任何合适的转录终止子序列。终止子序列可操作连接编码多肽的核苷酸序列的3’端。本发明可以使用在所选择宿主细胞中有功能的任何终止子。

对于丝状真菌宿主细胞优选的终止子从如下酶的基因获得：米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶、和尖镰孢胰蛋白酶样蛋白酶。

对于酵母宿主细胞优选的终止子从如下酶的基因获得：酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)、和酿酒酵母甘油醛-3-磷酸脱氢酶。对于酵母宿主细胞其它有用的终止子记载于Romanos等，1992，见上文。

在优选的方面，终止子是纤维二糖水解酶基因终止子。在更优选的方面，终止子是纤维二糖水解酶I基因(cbh1)终止子。在甚至更优选的方面，终止子是里氏木霉纤维二糖水解酶I基因(cbh1)终止子。在最优选的方面，终止子是SEQ ID NO：31之里氏木霉cbh1终止子。在另一个更优选的方面，终止子是纤维二糖水解酶II基因(cbh2)终止子。在另一个甚至更优选的方面，终止子是里氏木霉纤维二糖水解酶II基因(cbh2)终止子。在另一个最优选的方面，终止子是SEQ ID NO：32之里氏木霉cbh2终止子。

在另一个优选的方面，终止子是TAKA淀粉酶终止子。在另一个优选的方面，启动子是尖镰孢胰蛋白酶样蛋白酶终止子。在另一个优选的方面，启动子是黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)终止子。

其它调节序列

融合蛋白构建体可以进一步包含其它调控元件，如前导序列、多聚腺苷酸化序列、和其它元件。

调节序列还可以是合适的前导序列，其是mRNA中对于宿主细胞进行的翻译而言重要的非翻译区。前导序列可操作地连接于编码融合蛋白的核苷酸序列的5’端。本发明可以使用在所选择宿主细胞中有功能的任何前导序列。

对于丝状真菌宿主细胞优选的前导序列从如下酶的基因获得：米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶。

对于酵母宿主细胞合适的前导序列从如下酶的基因获得：酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子、和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。

调节序列也可以是聚腺苷酸化序列，其是可操作地连接于核苷酸序列的3’端的序列，并且在转录时，宿主细胞将其识别为信号以将聚腺苷残基添加至转录的mRNA。本发明可以使用在所选择宿主细胞中有功能的任何聚腺苷酸化序列。

对于丝状真菌宿主细胞优选的聚腺苷酸化序列从如下酶的基因获得：米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖镰孢胰蛋白酶样蛋白酶、和黑曲霉α-葡糖苷酶。

对于酵母宿主细胞有用的聚腺苷酸化序列记载于Guo和Sherman，1995，Molecular Cellular Biology 15：5983-5990。

可能还期望添加调节序列，其允许相对于宿主细胞的生长来调节多肽的表达。调节***的例子是那些引起基因表达响应化学或物理刺激(包括调节性化合物的存在)而开启或关闭的***。原核***中的调节***包括lac、tac、和trp操纵基因***。在酵母中，可以使用ADH2***或GAL1***。在丝状真菌中，可以使用TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子、和米曲霉葡糖淀粉酶启动子作为调节序列。调节序列的其它实例是那些允许基因扩增的序列。在真核***中，这些序列包括在氨甲蝶呤(methotrexate)存在下扩增的二氢叶酸还原酶基因，和以重金属(with heavy metal)扩增的金属硫蛋白基因。在这些情况中，编码多肽的核苷酸序列将与调节序列可操作相连接。

融合蛋白构建体优选地包含一种或几种选择标记，其允许简单选择经转化、转染、转导等的细胞。选择标记是基因，其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophy to auxotrophs)等。

细菌选择标记的实例是来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因，或赋予抗生素抗性的标记，所述抗生素抗性如氨苄青霉素、卡那霉素、氯霉素、或四环素抗性。对于酵母宿主细胞合适的标记是ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞的选择标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦(phosphinothricin)乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)(nitrate reductase)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)(orotidine-5’-phosphate decarboxylase)、sC(硫酸腺苷酰转移酶)、和trpC(邻氨基苯甲酸合酶(anthranilate synthase))以及它们的等同物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉的amdS和pyrG基因和吸水链霉菌(Streptomyces hygroscopicus)的bar因。

表达载体

本发明还涉及重组表达载体，其包含编码融合蛋白的多核苷酸、启动子、及转录和翻译终止信号。本申请所述各种核酸和控制序列可以结合在一起以产生重组表达载体，其可以包含一个或几个方便的限制性位点以允许在这些位点***或取代编码多肽的核苷酸序列。或者，可以通过在用于表达的适宜载体中***包含所述序列的核苷酸序列或融合蛋白构建体来表达编码融合蛋白的多核苷酸。在创建表达载体时，将编码序列置于载体中，使得编码序列与用于表达的适宜调节序列可操作相连接。

重组表达载体可以是任何载体(例如质粒或病毒)，其能方便地进行重组DNA方法，而且能产生核苷酸序列的表达。载体的选择将通常取决于载体与其中将引入该载体的宿主细胞的相容性。载体可以是线状的或闭合环状的质粒。

载体可以是自主复制载体，即作为染色体外实体(entity)存在的载体，其复制独立于染色体复制，例如质粒、染色体外元件、微型染色体(minichromosome)、或人工染色体。载体可以包含任何用于确保自复制的手段(means)。或者，载体可以是一种当被导入宿主细胞后，整合到基因组中并且与整合了该载体的染色体一起复制的载体。此外，可以使用单一的载体或质粒或者两个或更多个载体或质粒，其一起含有待导入宿主细胞基因组的完整DNA (total DNA)，或者可以使用转座子。

本发明的载体优选包含一个或几个选择标记，其允许简单选择经转化、转染、转导等等的细胞。本申请记载了细菌、酵母、丝状真菌选择标记的例子。

本发明的载体优选包含允许载体整合入宿主细胞基因组或允许载体在细胞中独立于基因组自主复制的元件。

为了整合入宿主细胞基因组，载体可以依赖编码多肽的多核苷酸序列或用于载体通过同源或非同源重组整合入基因组的任何其它载体元件。或者，载体可以包含额外的核苷酸序列，用于指导通过同源重组在染色体中的精确位置整合入宿主细胞基因组中。为了增加在精确位置处整合的可能性，整合元件应优选包含足够数目的核酸，如100-10,000碱基对、优选400-10,000碱基对、和最优选800-10,000碱基对，其与相应的靶序列具有高度同一性以增强同源重组的概率。整合元件可以是与宿主细胞基因组中的靶序列同源的任何序列。此外，整合元件可以是非编码的或编码的核苷酸序列。另一方面，可以将载体通过非同源重组整合到宿主细胞的基因组中。

为了自主复制，载体可以进一步包含复制起点，其使载体能够在所讨论的宿主细胞中自主复制。复制起点可以是在细胞中发挥功能的、介导自主复制的任何质粒复制子(replicator)。术语“复制起点”或“质粒复制子”在本申请定义为使质粒或载体能够在体内复制的核苷酸序列。

细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177、和pACYC184复制起点，及允许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060和pAMβ1复制起点。

用于酵母宿主细胞中的复制起点的实例是2微米复制起点、ARS1、ARS4、ARS1与CEN3的组合、和ARS4与CEN6的组合。

在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems等，1991，Gene 98：61-67；Cullen等，1987，Nucleic Acids Research 15：9163-9175；WO 00/24883)。分离AMA1基因和构建包含该基因的质粒或载体可以根据WO 00/24883中披露的方法来实现。

可以将多于一个拷贝的编码融合蛋白的多核苷酸***宿主细胞以增加基因产物的产生。多核苷酸拷贝数的增加可通过如下方法获得：将至少一个额外拷贝的序列整合入宿主细胞基因组，或将可扩增的选择标记基因包括在多核苷酸内，其中可通过在适宜选择剂(selectable agent)存在下培养细胞来选择含有选择标记基因的扩增拷贝并由此含有多核苷酸的额外拷贝的细胞。

用于连接上文所述元件以构建本发明的重组表达载体的方法是本领域技术人员熟知的(参见例如Sambrook等，1989，见上文)。

宿主细胞

本发明还涉及包含编码本发明融合蛋白的多核苷酸的重组真菌宿主细胞，其有利地用于重组生产所述蛋白质。将包含本发明多核苷酸的载体导入真菌宿主细胞，使得该载体作为染色体成分或作为自复制的染色体外载体得到维持，正如上文所述。术语“宿主细胞”涵盖亲本细胞的任何后代，其由于复制过程中发生的突变而与亲本细胞有所不同。

真菌宿主细胞可以是任何可用于重组生产本发明多肽的真菌细胞。

“真菌”在用于本申请时包括以下门：子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)、和接合菌门(Zygomycota)(如Hawksworth等，于Ainsworth and Bisby’s Dictionary of The Fungi，第8版，1995，CAB International，University Press，Cambridge，UK中所定义的)、以及卵菌门(Oomycota)(如Hawksworth等，1995，见上文，第171页中所引用)、和所有有丝***孢子真菌(mitosporic fungi)(Hawksworth等，1995，见上文)。

在优选的方面，真菌宿主细胞是酵母细胞。“酵母”在用于本申请时包括产子囊酵母(ascosporogenous yeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenous yeast)、和属于半知菌类(Fungi Imperfecti)(芽孢纲(Blastomycetes))的酵母。由于酵母的分类在未来可能改变，就本发明而言，酵母应定义为如Biology and Activities of Yeast(Skinner，F.A.，Passmore，S.M.，和Davenport，R.R.编，Soc.App.Bacteriol.Symposium Series No.9，1980)中所述。

在更优选的方面，酵母宿主细胞是假丝酵母属、汉逊酵母属、克鲁维酵母属、毕赤酵母属、(糖)酵母属、裂殖(糖)酵母属、或耶氏酵母(西洋蓍霉)属细胞。

在最优选的方面，酵母宿主细胞是卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母、或卵形酵母细胞。在另一个最优选的方面，酵母宿主细胞是乳酸克鲁维酵母细胞。在另一个最优选的方面，酵母宿主细胞是解脂耶氏酵母细胞。

在另一个优选的方面，真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门(Oomycota)的亚门(如Hawksworth等，1995，见上文所定义的)的所有丝状形式。丝状真菌的一般特征在于由几丁质或壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚糖和其它复杂多糖构成的菌丝体壁。通过菌丝延伸进行营养性生长，而碳分解代谢是专性需氧的。相反，酵母如酿酒酵母的营养性生长通过单细胞菌体的出芽(budding)进行，而碳分解代谢可以是发酵的。

在更优选的方面，丝状真菌宿主细胞是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟蜡菌属、金孢子菌属、鬼伞属(Coprinus)、革盖菌属、隐球菌属、篮状菌属、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属、或木霉属细胞。

在最优选的方面，丝状真菌宿主细胞是泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、或米曲霉细胞。在另一个最优选的方面，丝状真菌宿主细胞是杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、或镶片镰孢细胞。在另一个最优选的方面，丝状真菌宿主细胞是黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsis aneirina)、干拟蜡菌、Ceriporiopsis caregiea、Ceriporiopsis gilvescens、Ceriporiopsis pannocinta、Ceriporiopsis rivulosa、Ceriporiopsis subrufa、白霉拟蜡菌(Ceriporiopsissubvermispora)、嗜角质金孢子菌、Chrysosporium lucknowense、热带金孢子菌、Chrysosporium merdarium、Chrysosporium inops、毡金孢子菌、Chrysosporium queenslandicum、Chrysosporium zonatum、灰盖鬼伞、毛革盖菌、特异腐质霉、疏棉状腐质霉、米赫毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢平革菌、辐射射脉菌(Phlebia radiata)、杏鲍菇(Pleurotus eryngii)、土生梭孢霉、长绒毛栓菌、变色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、或绿色木霉细胞。

可以通过牵涉原生质体形成、原生质体转化、和细胞壁重建的方法以本身已知的方式来转化真菌细胞。用于转化曲霉属和木霉属宿主细胞的合适方法记载于EP 238023及Yelton等，1984，Proceedings of the National Academy ofSciences USA 81：1470-1474。用于转化镰孢属物种的合适方法记载于Malardier等，1989，Gene 78：147-156及WO 96/00787。可以使用由如下文献记载的方法来转化酵母：Becker和Guarente，于Abelson，J.N.和Simon，M.I.，编，Guide to Yeast Genetics and Molecular Biology，Methods in Enzymology，卷194，pp 182-187，Academic Press，Inc.，New York；Ito等，1983，Journal ofBacteriology 153：163；及Hinnen等，1978，Proceedings of the Nattonal Academyof Sciences USA 75：1920。

产生和回收

在本发明的生产方法中，使用本领域众所周知的方法在适合于生产具有生物学活性之多肽的营养培养基中培养真菌宿主细胞。例如，可以通过在合适培养基中和在允许多肽表达和/或分离的条件下进行的摇瓶培养和实验室或工业发酵罐中的小规模或大规模发酵(包括连续的、分批的、补料分批的或固态的发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养，所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据公开的组成制备(例如，在美国典型培养物保藏中心的目录中)。

在本发明的方法中，具有生物学活性之多肽选自下组：融合蛋白、融合蛋白的构件、和融合蛋白及其构件的组合。

在优选的方面，具有生物学活性之多肽是融合蛋白。

在另一个优选的方面，具有生物学活性之多肽是融合蛋白的一个或几个构件。

在另一个优选的方面，具有生物学活性之多肽是融合蛋白及其构件的组合。

可以使用本领域已知的、对于所述多肽是特异性的方法来检测具有生物学活性之多肽。这些检测方法可以包括特异性抗体的使用、酶产物的形成、或酶底物的消失。例如，可以使用酶测定法(enzyme assay)来测定多肽的活性，如本申请所述，且可以包括内切葡聚糖酶活性和特定(specific)生物学活性二者。

所得具有生物学活性之多肽(例如β-葡糖苷酶融合蛋白或其构件)可以使用本领域已知的方法回收。例如，可以通过常规方法自营养培养基回收多肽，所述常规方法包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。

本发明的多肽可以通过本领域已知的多种方法来纯化，所述规程包括但不限于层析(例如离子交换、亲和、疏水、层析聚焦、和大小排阻)、电泳方法(例如制备型等电聚焦)、差别溶解度(例如硫酸铵沉淀)、SDS-PAGE、或提取(参见例如Protein Purification，J.-C.Janson和Lars Ryden编，VCH Publishers，New York，1989)，以获得基本上纯的多肽。

组合物

本发明还涉及包含本发明的具有生物学活性之多肽的组合物。优选地，所述组合物富含这种多肽。术语“富含”表示所述组合物的生物学活性以例如至少1.1的富集因数(enrichment factor)增加。

组合物可以包含本发明的多肽作为主要酶成分，例如单成分组合物。或者，组合物可以包含多种酶活性，如氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、卤素过氧化物酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果胶分解酶、肽谷氨酰胺酶(peptidoglutaminase)、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。别的酶可以通过例如属于以下属或种的微生物产生：曲霉属，优选棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉；镰孢属，优选杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢或镶片镰孢；腐质霉属，优选特异腐质霉或疏棉状腐质霉；或木霉属，优选哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉。

可以根据本领域已知的方法来制备多肽组合物，而且可以是液体或干组合物的形式。例如，多肽组合物可以是颗粒(granulate)或微粒(microgranulate)的形式。可以根据本领域已知的方法将包括于组合物中的多肽稳定化。

下面给出的是本发明多肽组合物的优选用途的实例。本发明的多肽组合物的剂量和使用该组合物的其它条件可以基于本领域已知的方法来确定。

用途

本发明还涉及使用融合蛋白或其构件，或它们的组合物的方法。

加工含纤维素材料的方法

本发明的方法对于以商业上重要的数量改进具有纤维素分解或半纤维素分解活性之多肽的分泌特别有用，所述多肽可用于降解或转化木质纤维素材料。此类多肽包括但不限于内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、β-木糖苷酶、***呋喃糖苷酶、乙酰木聚糖酯酶和阿魏酸酯酶。因此，本发明还涉及用于降解或转化含纤维素材料的方法，该方法包括：在存在有效量的根据本发明方法得到的具有纤维素分解活性或半纤维素分解活性的融合蛋白或其构件的条件下用有效量的纤维素分解酶组合物处理含纤维素材料。为了说明目的，将根据本发明方法得到的具有β-葡糖苷酶活性之多肽(例如β-葡糖苷酶融合蛋白或其构件)用于说明目的。

纤维素生物质可以包括但不限于木材资源、城市固体废物、废纸、作物和作物残余物(参见，例如Wiselogel等，1995，于Handbook on Bioethanol(编者Charles E.Wyman)，第105-118页，Taylor & Francis，Washington D.C.；Wyman，1994，Bioresource Technology 50：3-16；Lynd，1990，Applied Biochemistry andBiotechnology 24/25：695-719；Mosier等，1999，Recent Progress in Bioconversionof Lignocellulosics，于Advances in Biochemical Engineering/Biotechnology，总编T.Scheper，第65卷，第23-40页，Springer-Verlag，NewYork)。

生物质初生细胞壁(primary cell wall)中的主要多糖是纤维素，其次最丰富的是半纤维素，而第三是果胶。次生细胞壁(secondary cell wall)在细胞停止生长后产生，其同样含有多糖并通过聚合木质素共价交联至半纤维素而加强。纤维素是脱水纤维二糖的均聚物，并且因此是线性β-(1-4)-D-葡聚糖，而半纤维素包括多种化合物，如木聚糖、木葡聚糖(xyloglucan)、***木聚糖和甘露聚糖，具有系列取代基的复杂分支结构。尽管通常是多形的，存在于植物组织中的纤维素主要作为平行葡聚糖链的不溶晶体基质。半纤维素通常与纤维素以及其它半纤维素以氢键相连，其帮助稳定细胞壁基质。在本申请中应理解，术语“含纤维素材料”或“纤维素”还涵盖木质纤维素。

在本发明的方法中，纤维素分解酶组合物可以包含任何牵涉将含纤维素材料加工成葡萄糖，或将半纤维素加工成木糖、甘露糖、半乳糖和***糖、它们的聚合物、或自它们衍生的产物的蛋白质，如下文所述。纤维素分解酶组合物可以是单构件制备物，例如内切葡聚糖酶；多构件制备物，例如内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶；或单构件蛋白质制备物和多构件蛋白质制备物的组合。纤维素水解蛋白质可以具有活性，即在酸性、中性、或碱性pH范围水解纤维素。纤维素分解酶组合物可以进一步包含具有纤维素水解增强活性的多肽，根据WO 2005/074647、WO 2005/074656、及美国已公开的申请2007/0077630。

纤维素水解蛋白质可以是真菌或细菌起源的，其可以自已知能够产生纤维素分解酶的微生物获得或分离和纯化，例如芽孢杆菌属、假单胞菌属、腐质霉属、鬼伞属、梭孢壳属、镰孢属、毁丝霉属、枝顶孢霉属、头孢霉属(Cephalosporium)、柱霉属、青霉属或曲霉属的物种(参见例如EP 458162)，尤其是那些由选自下组的菌株产生的纤维素水解蛋白质：特异腐质霉(重新分类为嗜热柱霉(Scytalidium thermophilum)，参见例如美国专利No.4,435,307)、灰盖鬼伞、尖镰孢、嗜热毁丝霉、大型亚灰树花菌(Meripilusgiganteus)、土生梭孢霉、枝顶孢霉属菌种、桃色枝顶孢霉(Acremoniumpersicinum)、冠枝顶孢霉(Acremonium acremonium)、Acremoniumbrachypenium、Acremonium dichromosporum、Acremonium obclavatum、Acremonium pinkertoniae、Acremonium roseogriseum、Acremoniumincoloratum、和Acremonium furatum；优选选自下组：特异腐质霉DSM 1800、尖镰孢DSM 2672、嗜热毁丝霉CBS 117.65、头孢霉属菌种RYM-202、枝顶孢霉属菌种CBS 478.94、枝顶孢霉属菌种CBS 265.95、桃色枝顶孢霉CBS169.65、冠枝顶孢霉AHU 9519、头孢霉属菌种CBS 535.71、Acremoniumbrachypenium CBS 866.73、Acremonium dichromosporum CBS 683.73、Acremonium obclavatum CBS 311.74、Acremonium pinkertoniae CBS 157.70、Acremonium roseogriseum CBS 134.56、Acremonium incoloratum CBS 146.62、和Acremonium furatum CBS 299.70H。纤维素水解蛋白质也可以自木霉属(特别是绿色木霉、里氏木霉和康宁木霉)、嗜碱性芽孢杆菌属(参见例如美国专利No.3,844,890和EP 458162)、和链霉菌属(参见例如EP 458162)获得。也可以使用纤维素水解蛋白质的化学修饰或蛋白质工程突变体。

尤其合适的纤维素水解蛋白质是记载于以下文献中的纤维素酶：EP495,257，EP 531,372，WO 96/11262，WO 96/29397，WO 98/08940。其它例子有纤维素酶变体，如以下文献中所记载的：WO 94/07998，EP 531,315，美国专利No.4,435,307，美国专利No.5,457,046，美国专利No.5,648,263，美国专利No.5,686,593，美国专利No.5,691,178，美国专利No.5,763,254，美国专利No.5,776,757，WO 89/09259，WO 95/24471，WO 98/12307和PCT/DK98/00299。

如上所述，本发明方法中所使用的纤维素水解蛋白质可以是单构件制备物，即基本上不含其它纤维素水解构件的构件。单构件可以是重组构件，即通过克隆编码单构件的DNA序列，随后用该DNA序列转化细胞，并在宿主中表达来产生的(参见例如WO 91/17243和WO 91/17244)。宿主优选是异源宿主(酶对于宿主而言是外来的)，但是宿主在某些条件下也可以是同源宿主(酶对于宿主而言是天然的)。单构件纤维素水解蛋白质也可以通过自发酵液纯化此类蛋白质来制备。

本发明方法中所使用的纤维素水解蛋白质可以通过使用本领域已知的方法在含有合适碳源和氮源和无机盐的营养培养基上发酵上文所述微生物菌株来产生(参见例如Bennett，J.W.和LaSure，L.(编)，More Gene Manipulationsin Fungi，Academic Press，CA，1991)。合适的培养基能够从商业供应商获得或可以根据公开的组成制备(例如，在美国典型培养物保藏中心的目录中)。适于生长和纤维素水解蛋白质产生的温度范围和其它条件是本领域已知的(参见例如Bailey，J.E.和Ollis，D.F.，Biochemical Engineering Fundamentals，McGraw-Hill Book Company，NY，1986)。

发酵可以是培养细胞，导致纤维素水解蛋白质表达或分离的任何方法。因此，发酵可以理解为包括在合适培养基中和在允许纤维素水解蛋白质表达或分离的条件下进行的摇瓶培养和实验室或工业发酵罐中的小规模或大规模发酵(包括连续的、分批的、补料分批的或固态的发酵)。通过上文所述方法产生的所得纤维素水解蛋白质可以自发酵培养基回收并通过常规方法纯化，如上所述。

适用于本发明的商业上可用的纤维素分解酶制剂的例子包括例如CELLUCLAST^TM(能够从Novozymes A/S获得)和NOVOZYM^TM 188(能够从Novozymes A/S获得)。可以使用的包含纤维素酶的其它商业上可用的制剂包括CELLUZYME^TM、CEREFLO^TM和ULTRAFLO^TM(Novozymes A/S)，LAMINEX^TM和SPEZYME^TM CP(Genencor Int.)，ROHAMENT^TM 7069W(

GmbH)，和

LDI，LBR、或150L(Dyadic International，Inc.，Jupiter，FL，USA)。以约0.001％至5.0％(固体重量)、更优选约0.025％至约4.0％(固体重量)、和最优选约0.005％至约2.0％(固体重量)的有效量添加纤维素酶。

通过上文所述方法得到的所得纤维素水解蛋白质或β-葡糖苷酶蛋白质可以通过常规方法自发酵培养基回收，所述常规方法包括但不限于离心、过滤、喷雾干燥、蒸发或沉淀。所回收的蛋白质然后可以通过多种层析方法进一步纯化，例如离子交换层析、凝胶过滤层析、亲和层析等等。

纤维素水解蛋白质的活性可以使用本领域已知的任何方法来测定。

适用于本发明的纤维素水解制剂的例子包括例如CELLUCLAST^TM(能够从Novozymes A/S获得)和NOVOZYM^TM 188(能够从Novozymes A/S获得)。可以使用的包含纤维素酶的其它商业上可用的制剂包括CELLUZYME^TM、CEREFLO^TM和ULTRAFLO^TM(Novozymes A/S)，LAMINEX^TM和SPEZYME^TMCP(Genencor Int.)、和ROHAMENT^TM 7069W(

GmbH)。以约0.001％至5.0％(固体重量)、更优选约0.025％至约4.0％(固体重量)、和最优选约0.005％至约2.0％(固体重量)的有效量添加纤维素酶。

如上所述，本发明方法中所使用的纤维素水解蛋白质可以是单构件制备物，即基本上不含其它纤维素水解构件的构件。单构件可以是重组构件，即通过克隆编码单构件的DNA序列，随后用该DNA序列转化细胞，并在宿主中表达来产生的(参见例如WO 91/17243和WO 91/17244)。单构件纤维素水解蛋白质的其它例子包括但不限于JP-07203960-A和WO-9206209中披露的那些。宿主优选是异源宿主(酶对于宿主而言是外来的)，但是宿主在某些条件下也可以是同源宿主(酶对于宿主而言是天然的)。单构件纤维素水解蛋白质也可以通过自发酵液纯化此类蛋白质来制备。

可用于实施本发明方法的单构件纤维素水解蛋白质的例子包括但不限于内切葡聚糖酶、纤维二糖水解酶、和其它对于降解纤维素生物质有用的酶。

术语“内切葡聚糖酶”在本申请中已有定义。术语“纤维二糖水解酶”在本申请中定义为1，4-β-D-葡聚糖纤维二糖水解酶(E.C.3.2.1.91)，其催化纤维素、纤维寡糖、或任何含β-1，4-连接葡萄糖的聚合物中1，4-β-D-葡糖苷键的水解，自链的还原端或非还原端释放纤维二糖。就本发明而言，纤维二糖水解酶活性可以根据如下文献中记载的方法来测定：Lever等，1972，Anal.Biochem.47：273-279及van Tilbeurgh等，1982，FEBS Letters 149：152-156；van Tilbeurgh和Claeyssens，1985，FEBS Letters 187：283-288。在本发明中，采用Lever等的方法来评估玉米秸秆(corn stover)中纤维素的水解。

本发明的多肽与纤维素水解蛋白质一同用于降解生物质底物的纤维素成分(参见例如Brigham等，1995，于Handbook on Bioethanol(Charles E.Wyman，编)，pp.119-141，Taylor & Francis，Washington D.C.；Lee，1997，Journal of Biotechnology 56：1-24)。

具有β-葡糖苷酶活性之多肽和纤维素水解蛋白质的最适量取决于几个因素，其包括但不限于组分纤维素水解蛋白质的混合物、含纤维素的底物、含纤维素底物的浓度、含纤维素底物的预处理、温度、时间、pH和包括发酵生物体(例如用于同步糖化和发酵的酵母)。术语“纤维素水解蛋白质”在本申请中定义为显示出能够在所测试的条件下水解或转化或降解纤维素的那些蛋白质或蛋白质混合物。它们的量通常通过常用方法来测量，如BCA(二辛可宁酸，P.K.Smith等，1985，Anal.Biochem.150：76)，而且优选的添加量与所水解的生物质的量成比例。

在优选的方面，每克含纤维素材料的具有β-葡糖苷酶活性之多肽的量是约0.01至约2.0mg、优选约0.025至约1.5mg、更优选约0.05至约1.25mg、更优选约0.075至约1.25mg、更优选约0.1至约1.25mg、甚至更优选约0.15至约1.25mg、和最优选约0.25至约1.0mg每g含纤维素材料。

在另一个优选的方面，每克含纤维素材料的纤维素水解蛋白质的量是约0.5至约50mg、优选约0.5至约40mg、更优选约0.5至约25mg、更优选约0.75至约20mg、更优选约0.75至约15mg、甚至更优选约0.5至约10mg、和最优选约2.5至约10mg每g含纤维素材料。

本发明的方法可用于将含纤维素材料(例如木质纤维素)降解或转化成任何有用的物质(例如化学制品和燃料)。在乙醇以外，可以自纤维素生产的一些日用和专用化学品包括木糖、丙酮、乙酸盐/酯、甘氨酸、赖氨酸、有机酸(例如乳酸)、1，3-丙二醇、丁二醇、甘油、乙二醇、糠醛或糖醛、聚羟基链烷酸酯、和顺式，顺式-粘康酸(Lynd，L.R.，Wyman，C.E.，和Gerngross，T.U.，1999，Biocommodity Engineering，Biotechnol.Prog.，15：777-793；Philippidis，G.P.，1996，Cellulose bioconversion technology，于Handbook on Bioethanol：Production and Utilization，Wyman，C.E.，编，Taylor & Francis，Washington，DC，179-212；及Ryu，D.D.Y.和Mandels，M.，1980，Cellulases：biosynthesis andapplications，Enz.Microb.Technol.，2：91-102)。潜在的合作生产利益延伸超过自可发酵碳水化合物合成多种有机产物。可以将生物学加工后剩余的富含木质素的残余物转化成木质素衍生的化学品，或者用于动力生产。

根据本发明的方法用于处理含纤维素材料的常规方法是本领域技术人员充分理解的。可以使用任何常规生物质处理设备来实施本发明的方法，所述设备设定为根据本发明操作。

这样的设备可以包括补料-分批式搅拌反应器、分批式搅拌反应器、具有超滤的连续流搅拌反应器、连续活塞流柱式反应器(Fernanda de CastilhosCorazza，Flávio Faria de Moraes，Gisella Maria Zanin和Ivo Neitzel，2003，Optimal control in fed-batch reactor for the cellobiose hydrolysis，ActaScientiarum.Technology 25(1)：33-38；Gusakov，A.V.和Sinitsyn，A.P.，1985，Kinetics of the enzymatic hydrolysis of cellulose：1.A mathematical model for abatch reactor process，Enz.Microb.Technol.7：346-352)、碾磨反应器(Ryu，S.K.和Lee，J.M.，1983，Bioconversion of waste cellulose by using an attritionbioreactor，Biotechnol.Bioeng.25：53-65)、或具有由电磁场引起的强烈搅拌的反应器(Gusakov，A.V.,，Sinitsyn，A.P.，Davydkin，I.Y.，Davydkin，V.Y.，Protas，O.V.，1996，Enhancement of enzymatic cellulose hydrolysis using a novel type ofbioreactor with intensive stirring induced by electromagnetic field，Appl.Biochem.Biotechnol.56：141-153)。

常规方法包括但不限于糖化、发酵、分开的水解和发酵(SHF)、同步糖化和发酵(SSF)、同步糖化和共发酵(SSCF)、混合的水解和发酵(HHF)、和直接微生物转化(DMC)。

SHF使用分开的处理步骤，首先将纤维素酶促水解成可发酵的糖，然后在后续步骤中将糖发酵成乙醇。在SSF中，纤维素的酶促水解和可发酵的糖变为乙醇的发酵组合在一个步骤中(Philippidis，G.P.，1996，Cellulosebioconversion technology，于Handbook on Bioethanol：Production andUtilization，Wyman，C.E.编，Taylor & Francis，Washington，DC，179-212)。SSCF包括多种糖的共发酵(Sheehan，J.，和Himmel，M.，1999，Enzymes，energy and theenvironment：A strategic perspective on the U.S.Department of Energy’s researchand development activities for bioethanol，Biotechnol.Prog.15：817-827)。HHF包括在同一个反应器但不同的温度进行的两个分开的步骤，即，高温酶促糖化，继以在发酵菌株能耐受的较低温度进行的SSF。DMC在一个步骤中组合了所有三个过程(纤维素酶产生、纤维素水解和发酵)(Lynd，L.R.，Weimer，P.J.，vanZyl，W.H.，和Pretorius，I.S.，2002，Microbial cellulose utilization：Fundamentalsand biotechnology，Microbiol.Mol.Biol.Reviews 66：506-577)。

“发酵”或“发酵过程”指任何发酵过程或任何包含发酵步骤的过程。发酵过程包括但不限于用于产生发酵产品的发酵过程，所述发酵产品包括醇(例如***醇、丁醇、乙醇、甘油、甲醇、1，3-丙二醇、山梨醇和木糖醇)；有机酸(例如乙酸、丙酮酸、己二酸、抗坏血酸、柠檬酸、2，5-二酮-D-葡萄糖酸、甲酸、富马酸、葡萄糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、衣康酸、乳酸、苹果酸、丙二酸、草酸、丙酸、琥珀酸、和木糖酸或木质酸)；酮(例如丙酮)；氨基酸(例如天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸和苏氨酸)；气体(例如甲烷、氢气(H₂)、二氧化碳(CO₂)和一氧化碳(CO))。发酵过程还包括在消费品酒业(例如啤酒和酒)、乳业(例如发酵乳制品)、皮革业和烟草业中使用的发酵过程。

根据本发明方法获得的具有纤维素分解活性或半纤维素分解活性的融合蛋白或其构件(例如β-葡糖苷酶融合蛋白或其构件)及其宿主细胞可用于自生物质生产单糖、二糖和多糖作为化学品或发酵给料(feedstock)，用于产生乙醇、塑料、其它产品或中间体。具体而言，多肽和宿主细胞可用于通过纤维素或半纤维素的部分或完全溶解来提高加工残余物(干酒糟(dried distillersgrain)、来自酿造的废糟(spent grains from brewing)、甘蔗渣(sugarcane bagasse)等)的价值。在促进用纤维素分解酶制备物将含纤维素材料加工成葡萄糖、木糖、甘露糖、半乳糖和***糖、它们的聚合物或由它们衍生的产物时，如下文所述，多肽可以是含或不含细胞的粗发酵液形式，或者是半纯化或纯化的酶制备物形式。多肽可以是单构件制备物、多构件蛋白质制备物、或多构件蛋白质制备物与单构件蛋白质制备物的组合。或者，可以使用宿主细胞作为生物质发酵过程中此类多肽的来源。宿主细胞还可以包含天然的或异源的基因，其编码纤维素水解蛋白质以及其它在生物质加工中有用的酶。

本发明进一步涉及用于产生有机物质的方法，该方法包括：(a)在存在有效量的根据本发明方法获得的具有纤维素分解活性或半纤维素分解活性的融合蛋白或其构件的条件下用有效量的纤维素分解酶组合物糖化含纤维素材料；(b)用一种或几种(more)的发酵微生物发酵步骤(a)的糖化的含纤维素材料；和(c)自发酵回收有机物质。如先前所述，出于说明目的，将根据本发明方法获得的具有β-葡糖苷酶活性之多肽(例如β-葡糖苷酶融合蛋白或其构件)用于说明目的。具有β-葡糖苷酶活性之多肽可以是含或不含细胞的粗发酵液形式，或者是半纯化或纯化的酶制剂形式。β-葡糖苷酶蛋白质可以是单构件制备物、多构件蛋白质制备物、或多构件蛋白质制备物与单构件蛋白质制备物的组合。

所述物质可以是任何自发酵衍生的物质。在优选的方面，物质是醇。应当理解，术语“醇”涵盖具有一个或几个羟基部分的物质。在更优选的方面，醇是***醇。在另一个更优选的方面，醇是丁醇。在另一个更优选的方面，醇是乙醇。在另一个更优选的方面，醇是甘油。在另一个更优选的方面，醇是甲醇。在另一个更优选的方面，醇是1，3-丙二醇。在另一个更优选的方面，醇是山梨醇。在另一个更优选的方面，醇是木糖醇。参见例如Gong，C.S.，Cao，N.J.，Du，J.和Tsao，G.T.，1999，Ethanol production from renewable resources，于Advances in Biochemical Engineering/Biotechnology，Scheper，T.编，Springer-Verlag Berlin Heidelberg，Germany，65：207-241；Silveira，M.M.和Jonas，R.，2002，The biotechnological production of sorbitol，Appl.Microbiol.Biotechnol.59：400-408；Nigam，P.和Singh，D.，1995，Processes for fermentativeproduction of xylitol-a sugar substitute，Process Biochemistry 30(2)：117-124；Ezeji，T.C.，Qureshi，N.和Blaschek，H.P.，2003，Production of acetone，butanoland ethanol by Clostridium beijerinckii BA101 and in situ recovery by gasstripping，World Journal of Microbiology and Biotechnology 19(6)：595-603。

在另一个优选的方面，所述物质是有机酸。在另一个更优选的方面，有机酸是乙酸。在另一个更优选的方面，有机酸是丙酮酸。在另一个更优选的方面，有机酸是己二酸。在另一个更优选的方面，有机酸是抗坏血酸。在另一个更优选的方面，有机酸是柠檬酸。在另一个更优选的方面，有机酸是2，5-二酮-D-葡糖酸。在另一个更优选的方面，有机酸是甲酸。在另一个更优选的方面，有机酸是富马酸。在另一个更优选的方面，有机酸是葡萄糖二酸。在另一个更优选的方面，有机酸是葡糖酸。在另一个更优选的方面，有机酸是葡糖醛酸。在另一个更优选的方面，有机酸是戊二酸。在另一个优选的方面，有机酸是3-羟基丙酸。在另一个更优选的方面，有机酸是衣康酸。在另一个更优选的方面，有机酸是乳酸。在另一个更优选的方面，有机酸是苹果酸。在另一个更优选的方面，有机酸是丙二酸。在另一个更优选的方面，有机酸是草酸。在另一个更优选的方面，有机酸是丙酸。在另一个更优选的方面，有机酸是琥珀酸。在另一个更优选的方面，有机酸是木糖酸或木质酸。参见例如Chen，R.和Lee，Y.Y.，1997，Membrane-mediated extractive fermentation for lactic acid production fromcellulosic biomass，Appl.Biochem.Biotechnol.63-65：435-448。

在另一个优选的方面，所述物质是酮。应当理解，术语“酮”涵盖具有一个或几个酮基部分的物质。在另一个更优选的方面，酮是丙酮。参见例如Qureshi和Blaschek，2003，见上文。

在另一个优选的方面，所述物质是氨基酸。在另一个更优选的方面，氨基酸是天冬氨酸。在另一个更优选的方面，氨基酸是谷氨酸。在另一个更优选的方面，氨基酸是甘氨酸。在另一个更优选的方面，氨基酸是赖氨酸。在另一个更优选的方面，氨基酸是丝氨酸。在另一个更优选的方面，氨基酸是苏氨酸。参见例如Richard，A.和Margaritis，A.，2004，Empirical modeling ofbatch fermentation kinetics for poly(glutamic acid)production and othermicrobial biopolymers，Biotechnology and Bioengineering 87(4)：501-515。

在另一个优选的方面，所述物质是气体。在另一个更优选的方面，气体是甲烷。在另一个更优选的方面，气体是H₂。在另一个更优选的方面，气体是CO₂。在另一个更优选的方面，气体是CO。参见例如Kataoka，N.，A.Miya，和K.Kiriyama，1997，Studies on hydrogen production by continuous culturesystem of hydrogen-producing anaerobic bacteria，Water Science and Technology36(6-7)：41-47；及Gunaseelan V.N.于Biomass and Bioenergy，Vol.13(1-2)，pp.83-114，1997，Anaerobic digestion ofbiomass for methane production：A review。

自含纤维素材料生产物质通常需要四个主要步骤。这四个步骤是预处理、酶促水解、发酵和回收。下面例示的是用于产生乙醇的方法，但应当理解，可以使用相似的方法来生产其它物质，例如上文所述物质。

预处理。在预处理或预水解步骤中，将含纤维素材料加热以分解木质素和碳水化合物结构，溶解大部分半纤维素，并使纤维素分解酶能够到达纤维素部分。加热或者直接用蒸汽进行，或者在浆料中进行，此处还可将催化剂添加于材料以使反应加速。催化剂包括强的酸(如硫酸和SO₂)或碱(如氢氧化钠)。预处理阶段的目的是促进酶和微生物的渗透(penetration)。含纤维素生物质还可以经过水热蒸汽喷发的预处理(参见美国专利申请号20020164730)。然而，应当理解，在实施本发明的方法时，可以采用热的、化学的、和/或机械的预处理来使用任何预处理。

糖化。在酶促水解步骤中(所述步骤也称作糖化)，将本申请所述酶加入经预处理的材料中，以将纤维素部分转化成葡萄糖和/或其它糖。糖化通常在搅拌釜反应器或发酵罐中，在受控的pH、温度和混合条件下进行。糖化步骤可以持续长达200小时。糖化可以在约30℃至约65℃，特别是约50℃的温度，和在约4-约5，尤其是约pH4.5的pH进行。为了产生能由酵母代谢的葡萄糖，通常在存在β-葡糖苷酶的条件下进行水解。

发酵。在发酵步骤中，作为预处理和酶促水解步骤的结果从含纤维素材料释放的糖，通过发酵生物体(如酵母)发酵成为乙醇。发酵还可以与酶促水解在同一个容器中，同样在受控的pH、温度和混合条件下同时进行。当糖化和发酵在同一个容器中同时进行时，该过程通常称作同步糖化和发酵或SSF。

在实施本发明时在发酵步骤中可以使用任何合适的含纤维素材料或原材料。通常根据期望的发酵产品(即，要从发酵获得的物质)和所采用的方法来选择材料，如本领域中所公知。适用于本发明的方法中的底物的实例包括含纤维素材料，如木材或植物残余物或自能通过发酵微生物代谢的经处理的含纤维素材料获得的低分子糖DP1-3，所述底物可以通过直接向发酵培养基中加入而提供。

术语“发酵培养基”理解为指加入发酵微生物之前的培养基，如由糖化过程产生的培养基，以及同步糖化和发酵过程(SSF)中使用的培养基。

“发酵微生物”指适用于期望的发酵过程中的任何微生物。根据本发明的合适的发酵微生物能够将糖(如葡萄糖、木糖、***糖、甘露糖、半乳糖或寡糖)直接或间接地发酵(即转化)成期望的发酵产品。发酵微生物的实例包括真菌生物体，如酵母。优选的酵母包括(糖)酵母属菌种，且具体为酿酒酵母的菌株。商业上可得到的酵母包括，例如Red

/Lesaffre Ethanol Red(可从Red

/Lesaffre，USA获得)、FALI(可从Fleischmann’s Yeast，BurnsPhilp Food Inc.，USA的一个部门获得)、SUPERSTART(可从Alltech获得)、GERT STRAND(可从Gert Strand AB，Sweden获得)和FERMIOL(可从DSMSpecialties获得)。

在优选的方面，所述酵母是(糖)酵母属菌种。在更优选的方面，所述酵母是酿酒酵母。在另一个更优选的方面，所述酵母是糖化酵母。在另一个更优选的方面，所述酵母是葡萄汁酵母(Saccharomyces uvarum)。在另一个优选的方面，所述酵母是克鲁维酵母属。在另一个更优选的方面，所述酵母是马克斯克鲁维酵母(Kluyveromyces marxianus)。在另一个更优选的方面，所述酵母是脆壁克鲁维酵母(Kluyveromyces fragilis)。在另一个优选的方面，所述酵母是假丝酵母属。在另一个更优选的方面，所述酵母是假热带假丝酵母(Candida pseudotropicalis)。在另一个更优选的方面，所述酵母是芸苔假丝酵母(Candida brassicae)。在另一个优选的方面，所述酵母是棒孢酵母(Clavispora)。在另一个更优选的方面，所述酵母是鲁西坦棒孢酵母(Clavispora lusitaniae)。在另一个更优选的方面，所述酵母是仙人掌棒孢酵母(Clavispora opuntiae)。在另一个优选的方面，所述酵母是管囊酵母属(Pachysolen)。在另一个更优选的方面，所述酵母是管囊酵母(Pachysolentannophilus)。在另一个优选的方面，所述酵母是酒香酵母属(Bretannomyces)。在另一个更优选的方面，所述酵母是克劳森酒香酵母(Bretannomycesclausenii)(Philippidis，G.P.，1996，Cellulose bioconversion technology，于Handbook on Bioethanol：Production and Utilization，Wyman，C.E.，编，Taylor& Francis，Washington，DC，179-212)。

可以有效地将葡萄糖发酵成乙醇的细菌包括，例如，运动发酵单胞菌(Zymomonas mobilis)和热纤维梭菌(Clostridium thermocellum)(Philippidis，1996，见上文)。

在本领域中公知上述生物体还能用于产生其它物质，如本申请所述。

在酿酒酵母(Chen，Z.，Ho，N.W.Y.，1993，Cloning and improving theexpress ion of Pichia stipitis xylose reductase gene in Saccharomyces cerevisiae，Appl.Biochem.Biotechnol.39-40：135-147；Ho，N.W.Y.，Chen，Z，Brainard，A.P.，1998，Genetically engineered Saccharomyces yeast capable of effectivelycofermenting glucose and xylose，Appl.Environ.Microbiol.64：1852-1859)或在细菌中如大肠杆菌(Beall，D.S.，Ohta，K.，Ingram，L.O.，1991，Parametricstudies of ethanol production from xylose and other sugars by recombinantEscherichia coli Biotech.Bioeng.38：296-303)、产酸克雷伯氏菌(Klebsiellaoxytoca)(Ingram，L.O.，Gomes，P.F.，Lai，X.，Moniruzzaman，M.，Wood，B.E.，Yomano，L.P.，York，S.W.，1998，Metabolic engineering of bacteria for ethanolproduction，Biotechnol.Bioeng.58：204-214)和运动发酵单胞菌(Zhang，M.，Eddy，C.，Deanda，K.，Finkelstein，M.和Picataggio，S.，1995，Metabolicengineering of a pentose metabolism pathway in ethanologenic Zymomonasmobilis，Science 267：240-243；Deanda，K.，Zhang，M.，Eddy，C.，和Picataggio，S.，1996，Development of an arabinose-fermenting Zymomonas mobilis train bymetabolic pathway engineering，Appl.Environ.Microbiol.62：4465-4470)中克隆异源基因导致了能够将己糖和戊糖转化成乙醇(共发酵)的生物体的构建。

通常向降解的纤维素或水解产物中加入酵母或另一种微生物，并进行约24至约96小时，如约35至约60小时的发酵。温度通常在约26℃-约40℃，特别是约32℃，且在约pH3至约pH6，特别是约pH4-5进行。

在优选的方面，将酵母或另一种微生物应用于降解的纤维素或水解产物，并进行约24至约96小时，如通常35-60小时的发酵。在优选的方面，温度通常在约26至约40℃，特别是约32℃，而pH通常在约pH3至约pH6，优选约pH4-5。优选以大约10⁵至10¹²，优选大约10⁷至10¹⁰，尤其是大约5×10⁷活细胞计数每ml发酵液的量应用酵母或另一种微生物。在乙醇产生阶段期间，酵母细胞计数应该优选在大约10⁷至10¹⁰，尤其是约2×10⁸。关于使用酵母进行发酵的其它指导可见于例如“The Alcohol Textbook”(编者K.Jacques，T.P.Lyons和D.R.Kelsall，Nottingham University Press，United Kingdom 1999)中，所述文献通过引用并入本申请。

本领域最广泛使用的方法是同步糖化和发酵(SSF)方法，其中没有糖化的保持阶段，意味着酵母和酶一起添加。

对于乙醇产生，在发酵后将醪(mash)蒸馏以提取乙醇。根据本发明的方法获得的乙醇可以用作，例如，燃料乙醇、饮料乙醇(即，中性饮料酒(potableneutral spirits))或工业乙醇。

发酵刺激剂可以与本申请所述的任何酶促过程组合使用，以进一步改进发酵过程，特别是改进发酵微生物的性能，如速率增加和乙醇得率。“发酵刺激剂”指用于发酵微生物(特别是酵母)生长的刺激剂。优选的用于生长的发酵刺激剂包括维生素和矿物质。维生素的实例包括多种维生素、生物素、泛酸盐/酯、烟酸、内消旋肌醇(meso-inositol)、硫胺、维生素B6(pyridoxine)、对氨基苯甲酸、叶酸、核黄素和维生素A、B、C、D和E。参见，例如，Alfenore等，Improving ethanol production and viability of Saccharomyces cerevisiae by avitamin feeding strategy during fed-batch process，Springer-Verlag(2002)，其通过引用并入本申请。矿物质的实例包括能提供营养的矿物质和矿物质盐，所述营养包括P、K、Mg、S、Ca、Fe、Zn、Mn和Cu。

回收。从发酵的含纤维素材料中分离醇，并通过蒸馏的常规方法纯化。能获得纯度高达约96vol.％的乙醇，其可以用作，例如，燃料乙醇、饮料乙醇(即中性饮料酒)或工业乙醇。

对于其它物质，可以使用本领域已知的任何方法，所述方法包括但不限于层析(例如离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如制备型等电聚焦)、差别溶解度(例如，硫酸铵沉淀)、SDS-PAGE、蒸馏或提取。

在本发明的方法中，在β-葡糖苷酶之外，可以向纤维素分解酶制备物和纤维素分解增强多肽补充一种或几种别的酶活性，以改进含纤维素材料的降解。优选的别的酶是半纤维素酶、酯酶(例如脂肪酶、磷脂酶和/或角质酶)、蛋白酶、漆酶、过氧化物酶，或它们的混合物。

在本发明的方法中，可以在发酵前或发酵过程中(包括在发酵微生物繁殖的过程中或之后)加入别的酶。

本申请中提到的酶可以源自或获得自任何合适的来源，包括细菌、真菌、酵母或哺乳动物来源。术语“获得”在本申请中表示酶可以从天然产生所述酶作为天然酶的生物体分离。术语“获得”在本申请中还表示酶可以在宿主生物体中重组产生，其中重组产生的酶对宿主生物体是天然或外来的，或具有经过修饰的氨基酸序列，例如具有缺失的、***的和/或取代的一个或几个氨基酸，即重组产生的酶是天然氨基酸序列的突变体和/或片段或由本领域已知的核酸改组方法产生的酶。天然酶的意义中包含天然变体，而外来酶的意义中包含通过重组获得的变体，如通过定点诱变或改组获得的变体。

还可以将酶纯化。本申请中使用的术语“纯化”包括不含来自其所源自的生物体中其它成分的酶。术语“纯化”还包括不含来自其所获得自的天然生物体的组分的酶。可将酶纯化，仅存在少量的其它蛋白质。表述“其它蛋白质”具体涉及其它酶。本申请使用的术语“纯化”还指去除其它组分，特别是存在于本发明的酶的起源细胞中的其它蛋白质，最特别是其它酶。酶可为“基本上纯的多肽”，即，不含来自产生所述酶的生物体的其它组分，即，例如，用于重组产生酶的宿主生物体。

本发明中所使用的酶可以是适用于本申请所述方法的任何形式，如例如含有或者不含细胞的粗发酵液、干粉或颗粒、无粉尘颗粒、液体、稳定化的液体或受保护的酶。颗粒可以通过，例如美国专利号4,106,991和4,661,452中公开的方法产生，而且可任选地通过本领域已知的方法包覆(coat)。例如，可以根据已确立的方法通过加入稳定剂(如糖、糖醇或另一种多元醇(polyol)，和/或乳酸或另一种有机酸)将液体酶制剂稳定化。受保护的酶可以根据EP238,216中公开的方法制备。

洗涤剂组合物

本发明的方法对于以商业上重要的数量改进多肽的分泌以用于洗涤剂组合物特别有用。此类多肽包括但不限于蛋白酶、纤维素分解酶、淀粉酶、和过氧化物酶，或任何对于洗涤剂工业有用的其它酶或生物学蛋白质。

本发明的洗涤剂组合物可以例如配制成手洗或机洗洗涤剂组合物，包括适于沾污织物预处理的洗涤添加剂组合物和漂洗添加的织物柔顺剂组合物，或者配制成用于一般家居硬表面清洁操作的洗涤剂组合物，或者配制用于碗盘手洗或机洗操作。

在一个具体的方面，本发明提供了包含根据本发明获得的具有生物学活性之多肽(例如融合蛋白、其构件或它们的组合)的洗涤剂添加剂。洗涤剂添加剂以及洗涤剂组合物可以包含一种或几种(多种)其它酶，如蛋白酶、脂肪酶、角质酶、淀粉酶、碳水化合物酶、纤维素酶、果胶酶、甘露聚糖酶、***糖酶、半乳聚糖酶、木聚糖酶、氧化酶例如漆酶、和/或过氧化物酶。

一般而言，酶组分的特性应当与所选择的洗涤剂相容(即最适pH、与其它酶组分和非酶组分的相容性等)，而且酶组分应当以有效量存在。

蛋白酶：合适的蛋白酶包括动物、植物或微生物起源的那些。微生物起源是优选的。包括化学修饰的或蛋白质工程的突变体。蛋白酶可以是丝氨酸蛋白酶或金属蛋白酶，优选碱性微生物蛋白酶或胰蛋白酶样蛋白酶。碱性蛋白酶的例子有枯草杆菌蛋白酶，尤其是自芽孢杆菌属衍生的那些，例如枯草杆菌蛋白酶Novo、枯草杆菌蛋白酶Carlsberg、枯草杆菌蛋白酶309、枯草杆菌蛋白酶147和枯草杆菌蛋白酶168(WO 89/06279)。胰蛋白酶样蛋白酶的例子有胰蛋白酶(例如猪或牛起源的)和公开于WO 89/06270和WO 94/25583中的镰孢属蛋白酶。

有用的蛋白酶的例子有WO 92/19729、WO 98/20115、WO 98/20116和WO 98/34946中记载的变体，尤其是在一个或多个下列位置具有取代的变体：27、36、57、76、87、97、101、104、120、123、167、170、194、206、218、222、224、235和274。

优选的商业上可用的蛋白酶包括ALCALASE^TM、SAVINASE^TM、PRIMASE^TM、DURALASE^TM、ESPERASE^TM和KANNASE^TM(NOVOZYMESA/S)，MAXTASE^TM、MAXACAL^TM、MAXAPEM^TM、PROPERASE^TM、PURAFECT^TM、PURAFECT OXP^TM、FN2^TM和FN3^TM(Genencor InternationalInc.)。

脂肪酶：合适的脂肪酶包括细菌或真菌起源的那些。包括化学修饰的或蛋白质工程的突变体。有用的脂肪酶的例子包括来自腐质霉属(同义词嗜热霉属(Thermomyces))的脂肪酶，例如EP 258068和EP 305216中所描述的疏棉状腐质霉(细毛嗜热霉(T.lanuginosus))或WO 96/13580中所描述的特异腐质霉；假单胞菌属(Pseudomonas)脂肪酶，例如产碱假单胞菌(P.alkaligenes)或类产碱假单胞菌(P.pseudoalcaligenes)(EP 218272)、洋葱假单胞菌(P.cepacia)(EP 331376)、施氏假单胞菌(P.stutzeri)(GB 1,372,034)、荧光假单胞菌(P.fluorescens)、假单胞菌菌种菌株SD 705(WO 95/06720和WO 96/27002)、威斯康星假单胞菌(P.wisconsinensis)(WO 96/12012)；芽孢杆菌属(Bacillus)脂肪酶，例如来自枯草芽孢杆菌(B.subtilis)(Dartois等，1993，Biochemica etBiophysica Acta，1131，253-360)、嗜热脂肪芽孢杆菌(B.stearothermophilus)(JP64/744992)、或短小芽孢杆菌(B.pumilus)(WO 91/16422)。

其它例子有如在WO 92/05249、WO 94/01541、EP 407225、EP 260105、WO 95/35381、WO 96/00292、WO 95/30744、WO 94/25578、WO 95/14783、WO 95/22615、WO 97/04079和WO 97/07202中所描述的脂肪酶变体。

优选的商业上可用的脂肪酶包括LIPOLASE^TM、LIPEX^TM、和LipolaseULTRA^TM(Novozymes A/S)。

淀粉酶：合适的淀粉酶(α和/或β)包括细菌或真菌起源的那些。包括化学修饰的或蛋白质工程的突变体。淀粉酶包括自例如芽孢杆菌属例如地衣芽孢杆菌(B.licheniformis)特定菌株获得的α-淀粉酶，更详细地记载于GB1,296,839。

有用的淀粉酶的例子有在WO 94/02597、WO 94/18314、WO 96/23873、和WO 97/43424中所描述的变体，尤其是在一个或多个下列位置具有取代的变体：15、23、105、106、124、128、133、154、156、181、188、190、197、202、208、209、243、264、304、305、391、408和444。

商业上可用的淀粉酶有DURAMYL^TM、TERMAMYL^TM、FUNGAMYL^TM和BAN^TM(Novozymes A/S)，Rapidase^TM和Purastar^TM(Genencor InternationalInc.)。

纤维素酶：合适的纤维素酶包括细菌或真菌起源的那些。包括化学修饰的或蛋白质工程的突变体。合适的纤维素酶包括来自下列属的纤维素酶：芽孢杆菌属、假单胞菌属、腐质霉属、镰孢属、梭孢壳属、枝顶孢霉属或木霉属，例如在美国专利No.4,435,307、美国专利No.5,648,263、美国专利No.5,691,178、美国专利No.5,776,757和WO 89/09259中公开的由特异腐质霉、嗜热毁丝霉和尖镰孢产生的真菌纤维素酶。

尤其合适的纤维素酶是有益于保护颜色的碱性或中性纤维素酶。此类纤维素酶的例子有EP 0495257、EP 0531372、WO 96/11262、WO 96/29397、WO 98/08940中描述的纤维素酶。其它例子是纤维素酶变体，如在WO94/07998、EP 0531315、美国专利No.5,457,046、美国专利No.5,686,593、美国专利No.5,763,254、WO 95/24471、WO 98/12307和PCT/DK98/00299中描述的那些纤维素酶变体。

商业上可用的纤维素酶包括

CELLUZYME^TM和CAREZYME^TM(Novozymes A/S)，Clazinase^TM和Puradax HA^TM(GenencorInternational Inc.)，及KAC-500(B)^TM(Kao Corporation)。

过氧化物酶/氧化酶：合适的过氧化物酶/氧化酶包括植物、细菌或真菌起源的那些。包括化学修饰的或蛋白质工程的突变体。有用的过氧化物酶的实例包括来自鬼伞属例如灰盖鬼伞(C.cinereus)的过氧化物酶及其变体，如在WO 93/24618、WO 95/10602、和WO 98/15257中所描述的那些。

商业上可用的过氧化物酶包括GUARDZYME^TM(Novozymes A/S)。

可通过添加含一种或多种酶的分开的添加剂或通过添加包含所有这些酶的组合添加剂将酶组分包括在洗涤剂组合物中。本发明的洗涤剂添加剂，即分开的添加剂或组合的添加剂，可配制成例如颗粒、液体、浆料等形式。优选的洗涤剂添加剂配制物为颗粒，特别是无粉尘的颗粒；液体，特别是稳定化的液体；或浆料。

例如可如在美国专利No.4,106,991和4,661,452中所公开的方法制备无粉尘颗粒，并可以任选地通过本领域已知的方法进行包覆。蜡质包覆材料的实例有平均摩尔重量为1000-20000的聚(环氧乙烷)产物(聚乙二醇，PEG)；具有16-50个环氧乙烷单元的乙氧基化的壬基酚；具有15-80个环氧乙烷单元的乙氧基化的脂肪醇，其中醇含有12-20个碳原子；脂肪醇；脂肪酸；及脂肪酸的单-、双-和三甘油酯。GB 1483591中给出了适于通过流化床技术应用的成膜包覆材料的实例。例如，液体酶制备物可根据已建立的方法通过加入多元醇如丙二醇、糖或糖醇、乳酸或硼酸来稳定。受保护的酶可根据EP 238,216中所公开的方法制备。

本发明的洗涤剂组合物可采用任何方便的形式，例如条、片、粉末、颗粒、糊膏(paste)、或液体。液体洗涤剂可以是含水的，一般含高达70％的水和0-30％的有机溶剂，或者是不含水的。

洗涤剂组合物可含有一种或几种表面活性剂，可以是非离子型的，包括半极性和/或阴离子和/或阳离子和/或两性离子的。表面活性剂一般以按重量计0.1％-60％的水平存在。

当洗涤剂包含阴离子表面活性剂时，它通常含有大约1％到大约40％的阴离子表面活性剂，如线状的烃基苯磺酸酯、α-烯烃磺酸酯(α-olefinsulfonate)、烃基硫酸酯(脂肪醇硫酸酯)、醇乙氧基硫酸酯、仲烷基磺酸酯(secondaryalkanesulfonate)、α-磺基脂肪酸甲酯、烷基-或烯基琥珀酸或皂(soap)。

当洗涤剂中包含非离子型表面活性剂时，它通常含有大约0.2％到大约40％的非离子型表面活性剂，如醇乙氧基化物、壬基苯酚乙氧基化物、烃基多苷、烃基二甲基胺氧化物、乙氧基脂肪酸单乙醇酰胺、脂肪酸单乙醇酰胺、多羟基烃基脂肪酸酰胺、或葡糖胺的N-酰基N-烃基衍生物(“葡糖酰胺”)。

洗涤剂可包含0-65％的洗涤剂助洗剂或络合剂，如沸石、二磷酸盐、三磷酸盐、膦酸酯、碳酸盐、柠檬酸盐、氮川三乙酸(nitrilotriacetic acid)、乙二胺四乙酸、二亚乙基三胺五乙酸、烷基-或烯基琥珀酸、可溶性硅酸盐或层状硅酸盐(例如购自Hoechst的SKS-6)。

洗涤剂可包含一种或几种聚合物。实例有羧甲基纤维素、聚(乙烯吡咯烷酮)、聚(乙二醇)、聚(乙烯醇)、聚(乙烯吡啶-N-氧化物)、聚(乙烯咪唑)、聚羧酸酯如聚丙烯酸酯、马来酸/丙烯酸共聚物、和甲基丙烯酸月桂酯/丙烯酸共聚物。

洗涤剂可包含漂白***，该***可含有H₂O₂源如过硼酸盐或过碳酸盐，可将其与形成过酸的漂白活化剂如四乙酰基乙二胺或壬酰氧基苯磺酸酯相组合。或者，漂白***可包含过氧酸，例如酰胺、酰亚胺或砜型的过氧酸。

可使用常规的稳定剂稳定本发明洗涤剂组合物的酶组分，所述常规稳定剂例如多元醇，如丙二醇或丙三醇；糖或糖醇；乳酸；硼酸，或硼酸衍生物，例如芳香族硼酸酯，或苯基硼酸衍生物如4-甲酰苯基硼酸；且所述组合物可如WO 92/19709和WO 92/19708中所描述的方法来配制。

洗涤剂还可包含其它的常规洗涤剂成分，如包括粘土的织物调节剂、泡沫促进剂、抑泡剂、抗蚀剂、污垢悬浮剂、抗污垢再沉积剂、染色剂、杀菌剂、光增白剂、助水溶物(hydrotrope)、晦暗抑制剂、或芳香剂(perfume)。

在洗涤剂组合物中的任何酶组分，特别是本发明具有生物学活性之多肽都可以相应于每升洗涤液0.01-100mg酶蛋白质的量加入，优选每升洗涤液0.05-5mg酶蛋白质，特别是每升洗涤液0.1-1mg酶蛋白质。

还可将本发明具有生物学活性之多肽掺入到WO 97/07202所公开的洗涤剂配制剂中，这里并入所述文献作为参考。

其它用途

根据本发明获得的具有生物学活性之多肽(例如融合蛋白、其构件或其组合)还可以与其它糖水解酶(glycohydrolase)和相关酶(如本申请所述)组合用于处理纺织品(作为生物抛光剂)和用于减少起毛(fuzz)、起球(pilling)、质地改良(texture modification)和砂洗(stonewashing)(N.K.Lange，于P.Suominen，T.Reinikainen(编)，Trichoderma reesei Cellulases and Other Hydrolases，Foundation for Biotechnical and Industrial Fermentation Research，Helsinki，1993，pp.263-272)。另外，所述多肽还可以与其它糖水解酶和相关酶(如本申请所述)组合用于在木材加工中生物纸浆(biopulping)或剥皮(debarking)、在造纸中纤维改良(fiber modification)、漂白(bleaching)和减少精炼能量成本(refining energycosts)、白水处理(whitewater treatment)(其对于废水再生、木质纤维素纤维再生如脱墨(deinking)和二次纤维加工(secondary fiber processing)是重要的)、及木材残余物利用(S.D，Mansfield和A.R.Esteghlalian于S.D，Mansfield和J.N.Saddler(编)，Applications of Enzymes to Lignocellulosics，ACS Symposium Series855，Washington，D.C.，2003，pp.2-29)。

通过以下实施例进一步对本发明进行描述，但不应将其理解为对本发明范围的限制。

实施例

作为缓冲液和底物使用的化学药品是至少试剂等级的商业产品。

DNA测序

DNA测序使用Applied Biosystems 3130X型遗传分析仪(Model 3130XGenetic Analyzer，Applied Biosystems，Foster City，CA，USA)进行，其使用染料终止物化学(Giesecke等，1992，Journal of Virol.Methods 38：47-60)。使用phred/phrap/consed(University of Washington，Seattle，WA，USA)及序列特异性引物装配序列。

菌株

里氏木霉RutC30(ATCC 56765；Montenecourt和Eveleigh，1979，Adv.Chem.Ser.181：289-301)衍生自里氏木霉Qm6A(ATCC 13631；Mandels和Reese，1957，J.Bacteriol.73：269-278)。使用里氏木霉RutC30和米曲霉Jal355菌株(WO 02/062973)来表达β-葡糖苷酶融合蛋白。

培养基和溶液

YP培养基每升由10g酵母提取物和20g田菌用蛋白胨构成。

纤维素酶诱导培养基每升由20g纤维素，10g玉米浆固体，1.45g(NH₄)₂SO₄，2.08g KH₂PO₄，0.28g CaCl₂，0.42g MgSO₄·7H₂O和0.42ml痕量金属溶液构成。

痕量金属溶液每升由216g FeCl₃·6H₂O，58g ZnSO₄·7H₂O，27gMnSO₄·H₂O，10g CuSO₄·5H₂O，2.4g H₃BO₃，和336g柠檬酸构成。

STC由1M山梨醇，10mM CaCl₂，和10mM Tris-HCl，pH7.5构成。

COVE板每升由342g蔗糖，10ml COVE盐溶液，10ml的1M乙酰胺，10ml的1.5M CsCl，和25g Noble琼脂构成。

COVE盐溶液每升由26g KCl，26g MgSO₄，76g KH₂PO₄，和50ml COVE痕量金属溶液构成。

COVE痕量金属溶液每升由0.04g Na₂B₄O₇·10H₂O，0.4g CuSO₄·5H₂O，1.2gFeSO₄·7H₂O，0.7g MnSO₄·H₂O，0.8g Na₂MoO₂·H₂O，和10g ZnSO₄·7H₂O构成。

COVE2板每升由30g蔗糖，20ml COVE盐溶液，25g Noble琼脂，和10ml的1M乙酰胺构成。

PDA板每升由39g马铃薯右旋糖琼脂构成。

LB培养基每升由10g胰蛋白胨，5g酵母提取物，5g氯化钠构成。

2X YT板每升由10g胰蛋白胨，5g酵母提取物，5g氯化钠，和15g Bacto琼脂构成。

MDU2BP培养基每升由45g麦芽糖，1g MgSO₄·7H₂O，1g NaCl，2gK₂HSO₄，12g KH₂PO₄，2g尿素，和500μl AMG痕量金属溶液构成，将pH调节至5.0，然后用0.22μm过滤单元(unit)过滤除菌。

AMG痕量金属溶液每升由14.3g ZnSO₄·7H₂O，2.5g CuSO₄·5H₂O，0.5gNiCl₂·6H₂O，13.8g FeSO₄·7H₂O，8.5g MnSO₄·7H₂O，和3g柠檬酸构成。

极限培养基板每升由6g NaNO₃，0.52g KCl，1.52g KH₂PO₄，1ml COVE痕量金属溶液，20g Noble琼脂，20ml 50％葡萄糖，2.5ml 20％MgSO₄·7H₂O，和20ml生物素储液构成。

生物素储液每升由0.2g生物素构成。

SOC培养基由2％胰蛋白胨，0.5％酵母提取物，10mM NaCl，2.5mM KCl，10mM MgCl₂和10mM MgSO₄构成，高压灭菌后，添加经过滤除菌的葡萄糖至20mM。

实施例1：pMJ04表达载体的构建

通过自里氏木霉RutC30基因组DNA使用下文所示引物993429(反义)和993428(有义)PCR扩增里氏木霉纤维二糖水解酶1基因(cbh1，CEL7A)终止子构建了表达载体pMJ04。反义引物设计成在5’端具有Pac I位点，而有义引物设计成在3’端具有Spe I位点。

引物993429(反义)：

5’-AACGTTAATTAAGGAATCGTTTTGTGTTT-3’(SEQ ID NO：33)

引物993428(有义)：

5’-AGTACTAGTAGCTCCGTGGCGAAAGCCTG-3’(SEQ ID NO：34)

使用

Plant Maxi试剂盒(QIAGEN Inc.，Valencia，CA，USA)分离里氏木霉RutC30基因组DNA。

扩增反应(50μl)由1X ThermoPol反应缓冲液(New England Biolabs，Beverly，MA，USA)，0.3mM dNTP，100ng里氏木霉RutC30基因组DNA，0.3μM引物993429，0.3μM引物993428和2个单位Vent DNA聚合酶(New EnglandBiolabs，Beverly，MA，USA)构成。将反应物在

5333(Eppendorf Scientific，Inc.，Westbury，NY，USA)中温育，编程为5个循环，每个循环为94℃30秒、50℃30秒和72℃60秒，然后是25个循环，每个循环为94℃30秒、65℃30秒和72℃120秒(最终延伸5分钟)。在1.0％琼脂糖凝胶上分离反应产物，使用40mM Tris碱-20mM乙酸钠-1mM EDTA二钠(TAE)缓冲液，其中自凝胶切下229bp产物条带并使用

凝胶提取试剂盒(QIAGEN Inc.，Valencia，CA，USA)根据制造商的说明书纯化。

所得PCR片段用Pac I和Spe I消化并使用快速连接试剂盒(Roche，Indianapolis，IN，USA)连接入经相同限制酶消化的pAlLo1(WO 05/067531)以产生pMJ04(图1)。

实施例2：pCaHj568的构建

质粒pCaHj568自pCaHj170(美国专利No.5,763,254)和pMT2188构建。质粒pCaHj170包含特异腐质霉内切葡聚糖酶V(CEL45A)全长编码区(SEQ IDNO：1，其编码SEQ ID NO：2之氨基酸序列)。pMT2188的构建通过自pCaHj483(WO 98/00529)使用下文所示引物142779和142780PCR扩增pUC19复制起点起始。引物142780将Bbu I位点引入PCR片段。

142779：5’-TTGAATTGAAAATAGATTGATTTAAAACTTC-3’(SEQ ID NO：35)

142780：5’-TTGCATGCGTAATCATGGTCATAGC-3’(SEQ ID NO：36)

遵循制造商的说明书使用

PCR***(Roche MolecularBiochemicals，Basel，Switzerland)来进行此扩增。在琼脂糖凝胶上将PCR产物分离，分离1160bp片段并使用Jetquick凝胶提取旋转试剂盒(Genomed，Wielandstr，Germany)纯化。

使用下文所示引物140288和142778使用

PCR***自通用的酿酒酵母克隆载体pYES2(Invitrogen，Carlsbad，CA，USA)扩增URA3基因。引物140288将Eco RI位点引入PCR片段。

5’-TTGAATTCATGGGTAATAACTGATAT-3’(SEQ ID NO：37)

142778：

5’-AAATCAATCTATTTTCAATTCAATTCATCATT-3’(SEQ ID NO：38)

在琼脂糖凝胶上将PCR产物分离，分离1126bp片段并使用Jetquick凝胶提取旋转试剂盒纯化。

通过混合并使用上文所示引物142780和140288通过交叠剪接法(Horton等，1989，Gene 77：61-68)扩增来融合上述两种PCR片段。在琼脂糖凝胶上将PCR产物分离，分离2263bp片段并使用Jetquick凝胶提取旋转试剂盒纯化。

所得片段用Eco RI和Bbu I消化并使用标准规程连接至pCaHj483经相同限制酶消化产生的最大片段。将连接混合物转化入通过Mandel和Higa，1970，J.Mol.Biol.45：154的方法制成感受态的pyrF-阴性大肠杆菌菌株DB6507(ATCC 35673)。在每升补充有1g酪蛋白氨基酸，500μg硫胺素和10mg卡那霉素的固体M9培养基(Sambrook等，1989，Molecular Cloning，A LaboratoryManual，第2版，Cold Spring Harbor Laboratory Press)上选择转化体。分离来自一株转化体的质粒并命名为pCaHj527(图2)。

使用PCR***根据制造商的说明书通过简单PCR法对pCaHj527上存在的NA2-tpi启动子进行定点诱变。使用下文所示诱变引物141223将核苷酸134-144自GTACTAAAACC(SEQ ID NO：39)转变成CCGTTAAATTT(SEQ ID NO：40)。

引物141223：5’-GGATGCTGTTGACTCCGGAAATTTAACGGTTTGGTCTTGCATCCC-3’(SEQ ID NO：41)

使用下文所示诱变引物141222将核苷酸423-436自ATGCAATTTAAACT(SEQ ID NO：42)转变成CGGCAATTTAACGG(SEQ ID NO：43)。

引物141222：5’-GGTATTGTCCTGCAGACGGCAATTTAACGGCTTCTGCGAATCGC-3’(SEQ ID NO：44)

所得质粒命名为pMT2188(图3)。

将特异腐质霉内切葡聚糖酶V编码区自pCaHj170(作为Bam HI-Sal I片段)转移入用Bam HI和Xho I消化的pMT2188，以产生pCaHj568(图4)。质粒pCaHj568包含突变的NA2-tpi启动子，其可操作连接于特异腐质霉内切葡聚糖酶V全长编码序列。

实施例3：pMJ05的构建

通过自pCaHj568使用下文所示引物HiEGV-F和HiEGV-R PCR扩增915bp特异腐质霉内切葡聚糖酶V全长编码区而构建了质粒pMJ05。

HiEGV-F(有义)：

5’-AAGCTTAAGCATGCGTTCCTCCCCCCTCC-3’(SEQ ID NO：45)

HiEGV-R(反义)：

5’-CTGCAGAATTCTACAGGCACTGATGGTACCAG-3’(SEQ ID NO：46)

扩增反应(50μl)由1X ThermoPol反应缓冲液(New England Biolabs，Beverly，MA，USA)，0.3mM dNTP，10ng/μl pCaHj568，0.3μM HiEGV-F引物，0.3μMHiEGV-R引物和2个单位Vent DNA聚合酶(New England Biolabs，Beverly，MA，USA)构成。将反应在

5333中温育，编程为5个循环，每个循环为94℃30秒、50℃30秒和72℃60秒，接着是25个循环，每个循环为94℃30秒、65℃30秒和72℃120秒(最终延伸5分钟)。在使用TAE缓冲液的1.0％琼脂糖凝胶上分离反应产物，其中自凝胶切下937bp产物条带并使用

凝胶提取试剂盒根据制造商的说明书将其纯化。

将937bp纯化的片段作为模板DNA用于后续使用下列引物的扩增：

HiEGV-R(反义)：

5’-CTGCAGAATTCTACAGGCACTGATGGTACCAG-3’(SEQ ID NO：47)

HiEGV-F-交叠(overlap)(有义)：

5’-ACCGCGGACTGCGCATCATGCGTTCCTCCCCCCTCC-3’(SEQ ID NO：48)

斜体表示的引物序列与17bp的里氏木霉纤维二糖水解酶I基因(cbh1)启动子同源，而加下划线的引物序列与29bp的特异腐质霉内切葡聚糖酶V编码区同源。启动子和编码序列之间的36bp交叠容许包含里氏木霉cbh1启动子的994bp片段与包含特异腐质霉内切葡聚糖酶V编码区的918bp片段的精确融合。

扩增反应(50μl)由1X ThermoPol反应缓冲液，0.3mM dNTP，1μl纯化的937bp PCR片段，0.3μM HiEGV-F-交叠引物，0.3μM HiEGV-R引物，和2个单位VentDNA聚合物构成。将反应在5333中温育，编程为5个循环，每个循环为94℃30秒、50℃30秒和72℃60秒，接着是25个循环，每个循环为94℃30秒、65℃30秒和72℃120秒(最终延伸5分钟)。在使用TAE缓冲液的1.0％琼脂糖凝胶上分离反应产物，其中自凝胶切下945bp产物条带并使用

凝胶提取试剂盒根据制造商的说明书将其纯化。

实施另一PCR以使用下文所示引物(有义引物设计成在5’端具有Sal I限制性位点)自里氏木霉RutC30基因组DNA扩增里氏木霉cbh1启动子序列，自基因ATG起始密码子上游的994bp延伸。使用Plant Maxi试剂盒分离里氏木霉RutC30基因组DNA。

TrCBHIpro-F(有义)：

5’-AAACGTCGACCGAATGTAGGATTGTTATC-3’(SEQ ID NO：49)

TrCBHIpro-R(反义)：

5’-GATGCGCAGTCCGCGGT-3’(SEQ ID NO：50)

扩增反应(50μl)由1X ThermoPol反应缓冲液，0.3mM dNTP，100ng/μl里氏木霉RutC30基因组DNA，0.3μM TrCBHIpro-F引物，0.3μM TrCBHIpro-R引物和2个单位Vent DNA聚合物构成。将反应在

5333中温育，编程为30个循环，每个循环为94℃30秒、55℃30秒和72℃120秒(最终延伸5分钟)。在使用TAE缓冲液的1.0％琼脂糖凝胶上分离反应产物，其中自凝胶切下998bp产物条带并使用

凝胶提取试剂盒根据制造商的说明书将其纯化。

纯化的998bp PCR片段作为模板DNA用于使用下文所示引物的后续扩增。

TrCBHIpro-F：

5’-AAACGTCGACCGAATGTAGGATTGTTATC-3’(SEQ ID NO：51)

TrCBHIpro-R-交叠：

5’-GGAGGGGGGAGGAACGCATGATGCGCA GTCCGCGGT-3’(SEQ ID NO：52)

斜体表示的序列与17bp的里氏木霉cbh1启动子同源，而加下划线的序列与29bp的特异腐质霉内切葡聚糖酶V编码区同源。启动子和编码序列之间的36bp交叠容许包含里氏木霉cbh1启动子的994bp片段与包含特异腐质霉内切葡聚糖酶V全长编码区的918bp片段的精确融合。

扩增反应(50μl)由1X ThermoPol反应缓冲液，0.3mM dNTP，1μl纯化的998bp PCR片段，0.3μM TrCBH1pro-F引物，0.3μM TrCBH1pro-R-交叠引物，和2个单位Vent DNA聚合物构成。将反应在

5333中温育，编程为5个循环，每个循环为94℃30秒、50℃30秒和72℃60秒，接着是25个循环，每个循环为94℃30秒、65℃30秒和72℃120秒(最终延伸5分钟)。在使用TAE缓冲液的1.0％琼脂糖凝胶上分离反应产物，其中自凝胶切下1017bp产物条带并使用

凝胶提取试剂盒根据制造商的说明书将其纯化。

使用1017bp里氏木霉cbh1启动子PCR片段和945bp特异腐质霉内切葡聚糖酶V PCR片段作为模板DNA用于后续使用下列引物的扩增，用于使用交叠PCR将994bp cbh1启动子精确融合至918bp内切葡聚糖酶V全长编码区。

TrCBHIpro-F：

5’-AAACGTCGACCGAATGTAGGATTGTTATC-3’(SEQ ID NO：53)

HiEGV-R：

5’-CTGCAGAATTCTACAGGCACTGATGGTACCAG-3’(SEQ ID NO：54)

扩增反应(50μl)由1X ThermoPol反应缓冲液，0.3mM dNTP，0.3μMTrCBH1pro-F引物，0.3μM HiEGV-R引物和2个单位Vent DNA聚合物构成。将反应在

5333中温育，编程为5个循环，每个循环为94℃30秒、50℃30秒和72℃60秒，接着是25个循环，每个循环为94℃30秒、65℃30秒和72℃120秒(最终延伸5分钟)。在使用TAE缓冲液的1.0％琼脂糖凝胶上分离反应产物，其中自凝胶切下1926bp产物条带并使用

凝胶提取试剂盒根据制造商的说明书将其纯化。

使用

PCR克隆试剂盒(Invitrogen，Carlsbad，CA，USA)遵循制造商的规程将所得1926bp片段克隆入-Blunt-II-载体(Invitrogen，Carlsbad，CA，USA)。用Not I和Sal I消化所得质粒，使用

凝胶提取试剂盒凝胶纯化1926bp片段并使用T4DNA连接酶(Roche，Indianapolis，IN，USA)连接入也用相同的两种限制酶消化的pMJ04，以产生pMJ05(图5)。质粒pMJ05包含里氏木霉纤维二糖水解酶I启动子和终止子，其可操作连接于特异腐质霉内切葡聚糖酶V全长编码序列。

实施例4：pSMai130表达载体的构建

用下文所示引物993467(有义)和993456(反义)通过PCR自作为模板的pJaL660(WO 2002/095014)扩增跨越米曲霉β-葡糖苷酶全长编码序列(SEQID NO：21为cDNA序列和SEQ ID NO：22为推导的氨基酸序列；大肠杆菌DSM 14240)自ATG起始密码子至TAA终止密码子的2586bp DNA片段。在反义引物的5’端设计Spe I位点以便于连接。斜体表示的引物序列与24bp的里氏木霉cbh1启动子同源，而加下划线的序列与22bp的米曲霉β-葡糖苷酶编码区同源。

引物993467：

5’-ATAGTCAACCGCGGACTGCGCATCATGAAGCTTGGTTGGATCGAGG-3’(SEQ ID NO：55)

引物993456：

5’-ACTAGTTTACTGGGCCTTAGGCAGCG-3’(SEQ ID NO：56)

扩增反应(50μl)由Pfx扩增缓冲液(Invitrogen，Carlsbad，CA，USA)，0.25mM dNTP，10ng pJaL660，6.4μM引物993467，3.2μM引物993456，1mMMgCl₂，和2.5个单位Pfx DNA聚合酶(Invitrogen，Carlsbad，CA，USA)构成。将反应在

5333中温育，编程为30个循环，每个循环为94℃1分钟、55℃1分钟和72℃3分钟(最终延伸15分钟)。在使用TAE缓冲液的1.0％琼脂糖凝胶上分离反应产物，其中自凝胶切下2586bp产物条带并使用

凝胶提取试剂盒根据制造商的说明书将其纯化。

实施另一PCR，用以使用下文所示引物993453(有义)和引物993463(反义)扩增里氏木霉cbh1启动子序列，自基因ATG起始密码子上游的1000bp延伸，以产生1000bp PCR片段。

引物993453：

5’-GTCGACTCGAAGCCCGAATGTAGGAT-3’(SEQID NO：57)

引物993463：

5’-CCTCGATCCAACCAAGCTTCATGA TGCGCA GTCCGCGGTTGACTA-3’(SEQ ID NO：58)

斜体表示的引物序列与24bp的里氏木霉cbh1启动子同源，而加下划线的引物序列与22bp的米曲霉β-葡糖苷酶全长编码区同源。启动子和编码序列之间的46bp交叠容许包含里氏木霉cbh1启动子的1000bp片段与包含米曲霉β-葡糖苷酶编码区的2586bp片段的精确融合。

扩增反应(50μl)由Pfx扩增缓冲液，0.25mM dNTP，100ng里氏木霉RutC30基因组DNA，6.4μM引物993453，3.2μM引物993463，1mM MgCl₂和2.5个单位Pfx DNA聚合物构成。将反应在

5333中温育，编程为30个循环，每个循环为94℃1分钟、55℃1分钟和72℃3分钟(最终延伸15分钟)。在使用TAE缓冲液的1.0％琼脂糖凝胶上分离反应产物，其中自凝胶切下1000bp产物条带并使用

凝胶提取试剂盒根据制造商的说明书将其纯化。

将纯化后的片段作为模板DNA用于后续通过使用上文所示引物993453(有义)和引物993456(反义)的交叠PCR进行的扩增，以精确融合包含里氏木霉cbh1启动子的1000bp片段与包含米曲霉β-葡糖苷酶全长编码区的2586bp片段。

扩增反应(50μl)由Pfx扩增缓冲液，0.25mM dNTP，6.4μM引物99353，3.2μM引物993456，1mM MgCl₂和2.5个单位Pfx DNA聚合物构成。将反应在

5333中温育，编程为30个循环，每个循环为94℃1分钟、60℃1分钟和72℃4分钟(最终延伸15分钟)。

用Sal I和Spe I消化所得3586bp片段并连接入用相同的两种限制酶消化的pMJ04，以产生pSMai130(图6)。质粒pSMai130包含里氏木霉纤维二糖水解酶I基因启动子和终止子，其可操作连接于米曲霉天然β-葡糖苷酶信号序列和编码序列(即全长米曲霉β-葡糖苷酶编码序列)。

实施例5：pSMai135的构建

用下文所示引物993728(有义)和引物993727(反义)自作为模板的pJaL660PCR扩增自Lys-20至TAA终止密码子的米曲霉β-葡糖苷酶成熟编码区(缺少天然信号序列，见图7；SEQ ID NO：59和60)。

引物993728：

5’-TGCCGGTGTTGGCCCTTGCCAAGGATGATCTCGCGTACTCCC-3’(SEQID NO：61)

引物993727：

5’-GACTAGTCTTACTGGGCCTTAGGCAGCG-3’(SEQ ID NO：62)

斜体表示的序列与20bp的特异腐质霉内切葡聚糖酶V信号序列同源，而加下划线的序列与22bp的米曲霉β-葡糖苷酶编码区同源。在反义引物的5’端设计Spe I位点。

扩增反应(50μl)由Pfx扩增缓冲液，0.25mM dNTP，10ng/μl pJaL660，6.4μM引物993728，3.2μM引物993727，1mM MgCl₂和2.5个单位Pfx DNA聚合物构成。将反应在

5333中温育，编程为30个循环，每个循环为94℃1分钟、55℃1分钟和72℃3分钟(最终延伸15分钟)。在使用TAE缓冲液的1.0％琼脂糖凝胶上分离反应产物，其中自凝胶切下2523bp产物条带并使用

凝胶提取试剂盒根据制造商的说明书纯化。

使用下文所示引物993724(有义)和引物993729(反义)进行另一PCR扩增，以扩增1000bp里氏木霉cbh1启动子和63bp特异腐质霉内切葡聚糖酶V信号序列(ATG起始密码子至Ala-21，图8，SEQ ID NO：63和64)。

引物993724：

5’-ACGCGTCGACCGAATGTAGGATTGTTATCC-3’(SEQ ID NO：65)

引物993729：

5’-GGGAGTACGCGAGATCATCCTTGGCAAGGGCCAACACCGGCA-3’(SEQ ID NO：66)

斜体表示的引物序列与20bp的特异腐质霉内切葡聚糖酶V信号序列同源，而加下划线的引物序列与22bp的米曲霉β-葡糖苷酶编码区同源。

使用包含在cbh1启动子控制下的特异腐质霉内切葡聚糖酶V编码区的质粒pMJ05作为模板来产生包含里氏木霉cbh1启动子和特异腐质霉内切葡聚糖酶V信号序列片段的1063bp片段。里氏木霉cbh1启动子和特异腐质霉内切葡聚糖酶V信号序列与米曲霉β-葡糖苷酶成熟编码序列之间共享42bp交叠，以提供启动子与2523bp米曲霉β-葡糖苷酶编码区的ATG起始密码子之间的完好连接。

扩增反应(50μl)由Pfx扩增缓冲液，0.25mM dNTP，10ng/μl pMJ05，6.4μM引物993728，3.2μM引物993727，1mM MgCl₂和2.5个单位Pfx DNA聚合物构成。将反应在

5333中温育，编程为30个循环，每个循环为94℃1分钟、60℃1分钟和72℃4分钟(最终延伸15分钟)。在使用TAE缓冲液的1.0％琼脂糖凝胶上分离反应产物，其中自凝胶切下1063bp产物条带并使用凝胶提取试剂盒根据制造商的说明书纯化。

使用纯化的交叠片段作为模板来进行使用上文所述引物993724(有义)和引物993727(反义)的扩增，以通过交叠PCR将包含里氏木霉cbh1启动子和特异腐质霉内切葡聚糖酶V信号序列的1063bp片段精确融合于包含米曲霉β-葡糖苷酶成熟编码区读码框的2523bp片段。

扩增反应(50μl)由Pfx扩增缓冲液，0.25mM dNTP，6.4μM引物993724，3.2μM引物993727，1mM MgCl₂和2.5个单位Pfx DNA聚合物构成。将反应在

5333中温育，编程为30个循环，每个循环为94℃1分钟、60℃1分钟和72℃4分钟(最终延伸15分钟)。在使用TAE缓冲液的1.0％琼脂糖凝胶上分离反应产物，其中自凝胶切下3591bp产物条带并使用

凝胶提取试剂盒根据制造商的说明书纯化。

用Sal I和Spe I消化所得3591bp片段并连接入用相同限制酶消化的pMJ04，以产生pSMai135(图9)。质粒pSMai135包含里氏木霉纤维二糖水解酶I基因启动子和终止子，其可操作连接于特异腐质霉内切葡聚糖酶V信号序列和米曲霉β-葡糖苷酶成熟编码序列。

实施例6：带有特异腐质霉内切葡聚糖酶V分泌信号的米曲霉β-葡糖苷酶的表达

通过PEG介导的转化(Penttila等，1987，Gene 61155-164)将编码连接至特异腐质霉内切葡聚糖酶V分泌信号的成熟米曲霉β-葡糖苷酶的质粒pSMai135(图8)导入里氏木霉RutC30。该质粒包含构巢曲霉amdS基因，以使转化体能够在作为唯一氮源的乙酰胺上生长。

将里氏木霉RutC30在27℃和90rpm在25ml补充有2％(w/v)葡萄糖和10mM尿苷的YP培养基中培养17小时。通过使用真空驱动一次性使用过滤***(Millipore，Bedford，MA，USA)进行的过滤来收集菌丝体，并用去离子水清洗两次，用1.2M山梨醇清洗两次。通过将清洗后的菌丝体悬浮在20ml含15mg/ml

(Novozymes A/S，Bagsvaerd，Denmark)和0.36单位/ml几丁质酶(Sigma Chemical Co.，St.Louis，MO，USA)的1.2M山梨醇中和在34℃以90rpm温和摇动温育15-25分钟，产生原生质体。通过以400xg离心7分钟来收集原生质体，并用冷的1.2M山梨醇清洗两次。使用血细胞计数器对原生质体计数并重悬浮在STC中，终浓度为每毫升1×10⁸个原生质体。将多余的原生质体保存在-80℃的Cryo 1℃冷冻容器(Nalgene，Rochester，NY，USA)中。

大约7μg用Pme I消化的pSMai135添加至100μl原生质体溶液并温和混匀，接着添加260μl PEG缓冲液并混合，在室温温育30分钟。然后添加STC(3ml)并混合，将转化溶液涂布到使用构巢曲霉amdS选择的COVE板上。将板在28℃温育5-7天。将转化体传代培养到COVE2板上并在28℃培养。

将67个用pSMai135获得的、称为SMA135的转化体传代培养到新鲜的含乙酰胺的板上并让其在28℃形成孢子7天。

培养这67个SMA135里氏木霉转化体，即在装有25ml pH6.0的纤维素酶诱导培养基的125ml带挡板的摇瓶中接种转化体的孢子并在28℃和200rpm温育7天。里氏木霉RutC30作为对照。在第7天取出培养液样品。将每份培养液的1ml在微型离心机中以15,700xg离心5分钟并将上清液转移至新的管。将样品保存在4℃直至酶测定法。如下所述对上清液测定β-葡糖苷酶活性，其中使用对硝基苯基-β-D-吡喃葡糖苷作为底物。

使用在50mM琥珀酸盐pH5.0中1∶10稀释的培养物上清液的25μl等分试样在200μl的于50mM琥珀酸盐pH5.0中的0.5mg/ml作为底物的对硝基苯基-β-D-吡喃葡糖苷中在环境温度测定β-葡糖苷酶活性。温育15分钟后，通过添加100μl的1M Tris-HCl pH8.0来停止反应并通过分光光度法读取405nm吸光度。1单位β-葡糖苷酶活性对应于在pH5.0在环境温度每分钟每升产生1μmol对硝基苯基。黑曲霉β-葡糖苷酶(NOVOZYM^TM 188，Novozymes A/S，Bagsvaerd，Denmark)用作酶标准品。

许多SMA135转化体显示的β-葡糖苷酶活性是里氏木霉RutC30所分泌的β-葡糖苷酶活性的几倍高。在所筛选的SMA135转化体中，转化体SMA135-04产生最高的β-葡糖苷酶活性。

使用

Tris-HCl(5％分辨率(resolving))凝胶(Bio-Rad，Hercules，CA，USA)用

***(Bio-Rad，Hercules，CA，USA)实施SDS-PAGE。将5μl第7天的上清液(见上文)悬浮在2X浓度的Laemmli样品缓冲液(Bio-Rad，Hercules，CA，USA)中并在存在5％β-巯基乙醇的条件下煮沸3分钟。将上清液样品加载到聚丙烯酰胺凝胶上并用1X Tris/Glycine/SDS作为运行缓冲液(Bio-Rad，Hercules，CA，USA)进行电泳。将所得凝胶用BIO-

考马斯染料(Bio-Rad，Hercules，CA，USA)染色。

在38个通过SDS-PAGE分析的里氏木霉SMA135转化体中，有26个产生在作为对照的里氏木霉RutC30中没有看到的大约110kDa的蛋白质。根据通过SDS-PAGE所看到的110kDa条带的丰度(abundance)，转化体里氏木霉SMA135-04产生最高水平的β-葡糖苷酶。

实施例7：表达载体pSMai140的构建

通过用Nco I消化携带米曲霉β-葡糖苷酶变体BG41全长编码区(SEQ IDNO：23，其编码SEQ ID NO：24之氨基酸序列)的质粒pSATe111BG41(WO04/099228)来构建表达载体pSMai140。在使用TAE缓冲液的1.0％琼脂糖凝胶上分离所得1243bp片段并使用

凝胶提取试剂盒根据制造商的说明书将其纯化。

用Nco I消化表达载体pSMai135，在使用TAE缓冲液的1.0％琼脂糖凝胶上分离8286bp片段并使用

凝胶提取试剂盒根据制造商的说明书纯化。然后使用T4DNA连接酶(Roche，Indianapolis，IN，USA)根据制造商的规程将1243bp经Nco I消化的米曲霉β-葡糖苷酶变体BG41片段连接至8286bp载体，以产生表达载体pSMai140(图10)。质粒pSMai140包含里氏木霉纤维二糖水解酶I(CEL7A)基因启动子和终止子，其可操作连接于特异腐质霉内切葡聚糖酶V信号序列和米曲霉β-葡糖苷酶变体成熟编码序列。

实施例8：用pSMai140转化里氏木霉RutC30

将质粒pSMai140用Pme I线性化并如实施例6所述转化入里氏木霉RutC30菌株。自四个独立的转化实验得到了总共100个转化体，都在摇瓶中在纤维素酶诱导培养基上培养，并如实施例6所述对转化体的培养液测量β-葡糖苷酶活性。许多里氏木霉SMA140转化体显示的β-葡糖苷酶活性是里氏木霉RutC30的β-葡糖苷酶活性的几倍高。

在分析了酶活性的同样13份培养物上清液中通过如实施例6所述的SDS-聚丙烯酰胺凝胶电泳和考马斯染色来检测培养基中米曲霉β-葡糖苷酶变体BG41蛋白质的存在。所有这13个具有高β-葡糖苷酶活性的转化体也以不同产量表达大约110KDa米曲霉β-葡糖苷酶变体BG41。

如通过β-葡糖苷酶活性测定法和SDS-聚丙烯酰胺凝胶电泳所评估的，将表达最高β-葡糖苷酶变体的转化体命名为里氏木霉SMA140-43。

实施例9：表达载体pSaMe-F1的构建

使用下文所示引物使用作为模板的pMJ05PCR扩增包含209bp里氏木霉纤维二糖水解酶I基因启动子和特异腐质霉内切葡聚糖酶V基因的核心区(SEQ ID NO：1的核苷酸1-702，其编码SEQ ID NO：2的氨基酸1-234；WO91/17243)的DNA片段。

995103：5’-cccaagcttagccaagaaca-3’(SEQ ID NO：67)

995137：5’-gggggaggaacgcatgggatctggacggc-3’(SEQ ID NO：68)

扩增反应(50μl)由1X Pfx扩增缓冲液，10mM dNTP，50mM MgSO₄，10ng/μl pMJ05，50pmol 995103引物，50pmol 995137引物，和2个单位Pfx DNA聚合物构成。将反应在

5333中温育，编程为30个循环，每个循环为94℃30秒、55℃30秒和72℃60秒(最终延伸3分钟)。

在使用TAE缓冲液的1.0％琼脂糖凝胶上分离反应产物，其中自凝胶切下911bp产物条带并使用

凝胶提取试剂盒根据制造商的说明书将其纯化。

使用作为模板的pSMai140和下文所示引物PCR扩增包含806bp米曲霉β-葡糖苷酶变体BG41基因的DNA片段。

995133：5’-gccgtccagatccccatgcgttcctccccc-3’(SEQ ID NO：69)

995111：5’-ccaagcttgttcagagtttc-3’(SEQ ID NO：70)

扩增反应(50μl)由1X Pfx扩增缓冲液，10mM dNTP，50mM MgSO₄，100ngpSMai140，50pmol 995133引物，50pmol 995111引物，和2个单位Pfx DNA聚合物构成。将反应在

5333中温育，编程为30个循环，每个循环为94℃30秒、55℃30秒和72℃120秒(最终延伸3分钟)。

在使用TAE缓冲液的1.0％琼脂糖凝胶上分离反应产物，其中自凝胶切下806bp产物条带并使用

凝胶提取试剂盒根据制造商的说明书将其纯化。

然后将上文两个PCR片段进行交叠PCR。使用纯化的交叠片段作为模板用于使用上文所述引物995103(有义)和引物995111(反义)进行的扩增，以通过交叠PCR将包含209bp里氏木霉纤维二糖水解酶I基因启动子和特异腐质霉内切葡聚糖酶V核心序列的702bp片段精确融合于包含米曲霉β-葡糖苷酶变体BG41编码区的部分的806bp片段。

扩增反应(50μl)由1X Pfx扩增缓冲液，10mM dNTP，50mM MgSO₄，2.5μl每种片段(20ng/μl)，50pmol 995103引物，50pmol 995111引物，和2个单位高保真Pfx DNA聚合物构成。将反应在

5333中温育，编程为初始变性95℃3分钟，然后是30个循环，每个循环为1分钟变性，60℃退火1分钟，和72℃延伸3分钟。

在使用TAE缓冲液的1.0％琼脂糖凝胶上分离反应产物，其中自凝胶切下1.7kb产物条带并使用凝胶提取试剂盒根据制造商的说明书将其纯化。

根据制造商的说明书，将1.7kb片段连接入

4平末端载体(Invitrogen，Carlsbad，CA，USA)。然后根据制造商的快速化学转化方法，将构建体转化入ONE

TOP10化学感受态大肠杆菌细胞(Invitrogen，Carlsbad，CA，USA)。选择菌落并通过质粒分离和用Hind III消化以释放1.7kb交叠PCR片段来进行分析。

质粒pSMai140也用Hind III消化以使质粒线性化。使用快速DNA连接试剂盒遵循制造商的说明书将这两个消化片段在连接反应中组合以产生pSaMe-F1(图11)。

用连接产物转化大肠杆菌XL1-Blue亚克隆级感受态细胞(Stratagene，LaJolla，CA，USA)。通过来自纯化自经转化大肠杆菌的质粒的里氏木霉纤维二糖水解酶I基因启动子、特异腐质霉内切葡聚糖酶V信号序列、特异腐质霉内切葡聚糖酶V核心、特异腐质霉内切葡聚糖酶V信号序列、米曲霉β-葡糖苷酶变体BG41和里氏木霉纤维二糖水解酶I基因终止子序列的DNA测序来验证构建体的身份。将一个包含重组质粒的克隆命名为pSaMe-F1。质粒pSaMe-F1包含里氏木霉纤维二糖水解酶I基因启动子和终止子和特异腐质霉内切葡聚糖酶V信号肽序列，其直接连接于特异腐质霉内切葡聚糖酶V核心多肽，该特异腐质霉内切葡聚糖酶V核心多肽直接融合于特异腐质霉内切葡聚糖酶V信号肽，该特异腐质霉内切葡聚糖酶V信号肽直接连接于米曲霉β-葡糖苷酶变体BG41成熟编码序列。米曲霉β-葡糖苷酶变体BG融合蛋白的DNA序列和推导的氨基酸序列分别显示于SEQ ID NO：73和74(参见图14A，14B，14C和14D)。

实施例10：用pSaMe-F1转化里氏木霉RutC30

用5×10⁷个里氏木霉RutC30孢子接种装有25ml补充有2％葡萄糖和10mM尿苷的YP培养基的摇瓶。在27℃和90rpm温育过夜大约16小时后，使用真空驱动一次性使用过滤***收集菌丝体。将菌丝体用100ml去离子水清洗两次，用1.2M山梨醇清洗两次。如实施例6所述产生原生质体。

将2μg用Pme I线性化的pSaMe-F 1DNA，100μl里氏木霉RutC30原生质体和50％PEG(4000)混合并在室温温育30分钟。然后添加3ml STC并将内容物倾倒在补充有10mM尿苷的COVE板上。然后将板在28℃温育。到第6天转化体开始出现并挑取到COVE2板上在28℃培养6天。回收了22个里氏木霉转化体。

在摇瓶中在纤维素酶诱导培养基上培养转化体并如实施例6所述测量β-葡糖苷酶活性。许多pSaMe-F1转化体产生β-葡糖苷酶活性。一个命名为里氏木霉SaMeF1-9的转化体产生最高量的β-葡糖苷酶，而且具有表达米曲霉β-葡糖苷酶变体的菌株两倍的活性(实施例9)。

根据Beguin，1983，Analytical Biochem.131(2)：333-336使用羧甲基纤维素(CMC)覆盖测定法测定内切葡聚糖酶活性。将来自5份培养液样品(具有最高β-葡糖苷酶活性的样品)的5μg总蛋白质在天然样品缓冲液(Bio-Rad，Hercules，CA，USA)中稀释并使用10X Tris/甘氨酸运行缓冲液(Bio-Rad，Hercules，CA，USA)在

8-16％Tris-HCl凝胶(Bio-Rad，Hercules，CA，USA)上运行，然后将凝胶覆盖在含1％羧甲基纤维素(CMC)的板的顶部。在37℃温育1小时后，将凝胶用0.1％刚果红染色20分钟。然后将板用1M NaCl脱色以鉴定指示内切葡聚糖酶活性的透明(clearing)区。看到两个透明带(zone)，位于上部的带在大约110kDa而位于下部的带在大约25kDa。特异腐质霉内切葡聚糖酶V和米曲霉β-葡糖苷酶变体BG41融合物的预测蛋白质大小是118kDa，如果这两种蛋白质没有受到切割且保持单一多肽形式；各个内切葡聚糖酶V核心结构域的糖基化和β-葡糖苷酶的糖基化导致各个蛋白质比根据一级序列所预测的在更高mw处迁移。如果这两种蛋白质受到了切割，那么特异腐质霉内切葡聚糖酶V核心结构域的预测大小为24kDa而米曲霉β-葡糖苷酶变体BG41为94kDa。由于在大约110kDa处有透明带，这一结果指示最低限度有一群内切葡聚糖酶和β-葡糖苷酶融合蛋白保持完整而作为单一大型蛋白质形式。较低的透明带最有可能代表内源内切葡聚糖酶活性，另外可能源自特异腐质霉内切葡聚糖酶V核心结构域与米曲霉β-葡糖苷酶的部分切割。

上述结果证明了特异腐质霉内切葡聚糖酶V核心是有活性的，即使在与米曲霉β-葡糖苷酶融合时。另外，β-葡糖苷酶活性的增加表现出源自蛋白质分泌相对于非融合β-葡糖苷酶分泌效率的增加。通过将米曲霉β-葡糖苷酶变体BG41序列连接至有效分泌的特异腐质霉内切葡聚糖酶V核心，更多的β-葡糖苷酶得到分泌。

实施例11：pSaMe-FX载体的构建

通过修饰pSaMe-F1来构建质粒pSaMe-FX。将质粒pSaMe-F1用Bst Z17和Eco RI消化以产生包含β-葡糖苷酶变体BG41编码序列的1kb片段和包含质粒剩余部分的9.2kb片段。在使用TAE缓冲液的1.0％琼脂糖凝胶上将片段分开，切下9.2kb片段并使用

凝胶提取试剂盒根据制造商的说明书将其纯化。将质粒pSMai135也用BstZ17和Eco RI消化以产生包含与米曲霉β-葡糖苷酶变体BG41编码序列同源的碱基的1kb片段和包含质粒剩余部分的8.5kb片段。如上所述分离和纯化1kb片段。

使用快速DNA连接试剂盒遵循制造商的说明书在连接反应中将9.2kb和1kb片段组合在一起以产生pSaMe-FX，其与pSaMe-F1相同，只是它包含野生型β-葡糖苷酶成熟编码序列而非变体成熟编码序列。

用连接产物转化大肠杆菌

感受态细胞(Stratagene，La Jolla，CA，USA)。通过来自纯化自经转化大肠杆菌的质粒的里氏木霉纤维二糖水解酶I基因启动子、特异腐质霉内切葡聚糖酶V信号序列、特异腐质霉内切葡聚糖酶V核心序列、特异腐质霉内切葡聚糖酶V信号序列、米曲霉β-葡糖苷酶成熟编码序列和里氏木霉纤维二糖水解酶I基因终止子序列的DNA测序来验证构建体的身份。将一个包含重组质粒的克隆命名为pSaMe-FX(图12)。米曲霉β-葡糖苷酶融合蛋白的DNA序列和推导的氨基酸序列分别显示于SEQ ID NO：75和76(参见图15A，15B，15C和15D)。

实施例12：木霉转化体的转化和表达

将pSaMe-FX构建体用Pme I线性化并如实施例10所述转化入里氏木霉RutC30菌株。自单个转化得到了总共63个转化体。将转化体在摇瓶中在纤维素酶诱导培养基上培养并如实施例6所述测量β-葡糖苷酶活性。许多pSaMe-FX转化体产生β-葡糖苷酶活性。一个命名为SaMe-FX16的转化体与里氏木霉SaMeF1-9(实施例10)相比产生两倍量的β-葡糖苷酶活性。

实施例13：里氏木霉转化体的分析

如实施例9所述通过将特异腐质霉内切葡聚糖酶V核心(含它自己的天然信号序列)与连接有特异腐质霉内切葡聚糖酶V信号序列的米曲霉β-葡糖苷酶变体BG41成熟编码序列融合来构建融合蛋白。此融合构建体导致与连接有特异腐质霉内切葡聚糖酶V信号序列的米曲霉β-葡糖苷酶变体BG41成熟编码序列相比所分泌的β-葡糖苷酶活性的2倍增加(two-fold increase)。如实施例11所述创建第二融合构建体，其由与连接有特异腐质霉内切葡聚糖酶V信号序列的米曲霉野生型β-葡糖苷酶编码序列融合的特异腐质霉内切葡聚糖酶V核心(含它自己的信号序列)组成，而且这导致β-葡糖苷酶活性的甚至进一步提高。用野生型融合物转化的菌株具有相对于用β-葡糖苷酶变体BG41融合物转化的菌株两倍的所分泌β-葡糖苷酶活性。

实施例14：β-葡糖苷酶融合蛋白编码序列克隆入米曲霉表达载体

设计了两条下文所示合成寡核苷酸引物，以自编码β-葡糖苷酶融合蛋白的pSaMeFX PCR扩增全长开读框。

PCR正向引物：5’-GGACTGCGCAGCATGCGTTC-3’(SEQ ID NO：71)

PCR反向引物：5’-AGTTAATTAATTACTGGGCCTTAGGCAGCG-3’(SEQID NO：72)

粗体字母代表编码序列。正向引物中加下划线的“G”代表为了创建Sph I限制性位点而引入的碱基变化。剩余序列与pSaMeFX的***位点相比包含序列同一性。反向引物中加下划线的序列代表为了便于在表达载体pAlLo2(WO 04/099228)中克隆此基因而添加的Pac I限制性位点。

在终体积50μl中含50ng pSaMeFX DNA，1X Pfx扩增缓冲液，6μl 10mMdATP，dTTP，dGTP和dCTP混合物，2.5个单位

Pfx DNA聚合物，和1μl的50mM MgSO₄的PCR反应中使用50pmol每种上文引物。使用

5333来扩增片段，编程为1个循环的98℃2分钟；和35个循环，每个循环为96℃30秒，61℃30秒和68℃3分钟。35个循环后，将反应在68℃温育10分钟，然后在10℃冷却，直至进一步处理。在使用TAE缓冲液和0.1μg/ml溴化乙锭的0.8％GTG-琼脂糖凝胶(CambrexBioproducts One Meadowlands Plaza East Rutherford，NJ，USA)上分离3.3kbPCR反应产物。借助DARK READER^TM(Clare Chemical Research，Dolores，CO，USA)显现DNA以避免UV诱导的突变。用一次性使用的刀片切下3.3kb DNA条带并用

-DA旋转杯(Millipore，Billerica，MA，USA)根据制造商的说明书将其纯化。

将纯化后的3.3kb PCR产物克隆入

4Blunt-

载体(Invitrogen，Carlsbad，CA，USA)。将4μl纯化后的PCR产物与1μl的2M氯化钠溶液和1μl载体混合。将反应在室温温育15分钟，然后根据制造商的说明书使用2μl反应液转化One

TOP10化学感受态大肠杆菌细胞。将转化反应的3份等分试样(每份83μl)涂布在3个150mm补充有100μg/ml氨苄青霉素的2XYT板上并在37℃温育过夜。

使用8个重组菌落接种含3ml补充有100μg/ml氨苄青霉素的LB培养基的液体培养基。使用

9600(QIAGEN Inc.，Valencia，CA，USA)自这些培养物制备质粒DNA。通过Pac I限制酶消化来分析克隆。将来自每个克隆的质粒DNA用Pac I消化并通过使用TAE缓冲液的1.0％琼脂糖凝胶电泳进行分析。所有8个克隆都具有预期的限制性消化样式，而且选择克隆5、6、7和8进行测序以验证所克隆的***物中没有突变。它们5’和3’端的序列分析显示所有4个克隆都具有正确的序列。选择克隆5和7用于进一步测序。对这两个克隆测序至Phred Q值大于40以确保没有PCR诱导的错误。克隆5和7显示出具有预期的序列，而且选择克隆5用于再克隆入pAlLo2。

将来自克隆5的质粒DNA通过用SphI消化来线性化。然后通过添加1.2μl10mM dATP，dTTP，dGTP和dCTP混合物，和6个单位T4DNA聚合酶(NewEngland Bioloabs，Inc.，Ipswich，MA，USA)来将线性化的克隆平端化(blunt-ended)。将混合物在12℃温育20分钟，然后通过添加1μl的0.5M EDTA并在75℃加热20分钟以灭活酶来停止反应。如上所述通过凝胶电泳和超滤来纯化编码β-葡糖苷酶融合蛋白的3.3kb片段。

将载体pAlLo2通过用Nco I消化线性化。然后通过添加0.5μl的10mMdATP，dTTP，dGTP和dCTP混合物，和1个单位DNA聚合酶I来将线性化的载体平端化。将混合物在25℃温育15分钟，然后通过添加1μl的0.5M EDTA并在75℃加热15分钟以灭活酶来停止反应。然后将载体用Pac I消化。如上所述通过凝胶电泳和超滤来纯化平端化的载体。

用快速连接试剂盒来实施将编码β-葡糖苷酶融合蛋白的3.3kb片段克隆入经过线性化和纯化的pAlLo2载体。根据制造商的说明书使用1μl反应样品转化大肠杆菌XL10

金细胞(Stratagene，La Jolla，CA，USA)。回收期后，将来自转化反应的2份100μl等分试样涂布到2个150mm补充有100μg/ml氨苄青霉素的2X YT板上并在37℃温育过夜。自选择板随机选择一组8个假定的重组克隆并使用

9600自每个克隆制备质粒DNA。选择克隆1-4用于使用pAlLo2特异性引物进行的测序以验证载体/***物连接处具有正确序列。克隆3具有正确的载体/***物连接处并命名为pAlLo47(图13)。

为了创建不含标志物的表达株，进行限制性内切核酸酶消化以将赋予对抗生素氨苄青霉素的抗性的blaA基因与表达构建体的剩余部分分开。用Pme I消化30μg pAlLo47。然后如上所述通过琼脂糖凝胶电泳纯化消化后的DNA。用刀片切下包含表达构建体但缺少blaA基因的6.4kb DNA条带并用

凝胶提取试剂盒纯化。

实施例15：β-葡糖苷酶融合蛋白在米曲霉JaL355中的表达

根据Christensen等，1988，Bio/Technology 6：1419-1422的方法制备米曲霉JaL355(WO 00/240694)原生质体。使用10μl纯化的实施例14表达构建体转化米曲霉JaL355原生质体。米曲霉JaL355的转化产生大约90个转化体。将50个转化体分离至各个PDA板并在34℃温育5天。

用3ml 0.01％

80清洗48个汇合孢子板并使用孢子悬浮液接种125ml玻璃摇瓶中的25ml MDU2BP培养基。将转化体培养物在34℃以200rpm恒定摇动温育。5天后，将每份培养物的1ml等分试样以12,000xg离心并收集它们的上清液。将每份上清液的5μl与等体积的2X加样缓冲液(10％β-巯基乙醇)混合并加载到1.5mm 8％-16％Tris-甘氨酸SDS-PAGE凝胶上，用BIO-

考马斯蓝G250蛋白质染料(Bio-Rad，Hercules，CA，USA)染色。培养液的SDS-PAGE序型显示了48个转化体中的33个能够表达一种新的蛋白质，其表观分子量非常接近预期的118kDa。转化体21产生最好的产量(yield)，选择用于进一步研究。

实施例16：米曲霉JaL355转化体21的单孢子分离

将米曲霉JaL355转化体21的孢子涂布在PDA板上并在34℃温育5天。用0.5ml的0.01％80清洗小面积的汇合孢子板以重悬浮孢子。将100μl孢子悬浮液等分试样用0.01％

80稀释至终体积5ml。借助血细胞计数器，确定孢子浓度并稀释至终浓度为每微升0.1个孢子。将200μl孢子稀释液等分试样涂布在150mm极限培养基板上并在34℃温育2-3天。自板上切下出现的菌落并转移至PDA板，在34℃温育3天。然后将孢子涂布在板上并在34℃再温育5天。

用3ml 0.01％

80清洗汇合孢子板并使用孢子悬浮液接种125ml玻璃摇瓶中的25ml MDU2BP培养基。将单孢子培养物在34℃以200rpm恒定摇动温育。5天后，将每份培养物的1ml等分试样以12,000xg离心并收集它们的上清液。将每份上清液的5μl与等体积的2X加样缓冲液(10％β-巯基乙醇)混合并加载到1.5mm 8％-16％Tris-甘氨酸SDS-PAGE凝胶上，用BIO-

考马斯蓝G250蛋白质染料染色。培养液的SDS-PAGE序型显示了所有8个转化体都能够以很高的水平表达β-葡糖苷酶融合蛋白，而且一个命名为米曲霉JaL355AlLo47的培养物产生最好的产量。

本申请描述和要求保护的本发明并不受限于本申请所公开的具体方面的范围，因为这些方面意欲作为本发明几个方面的说明。任何等价的方面意欲在本发明的范围之内。实际上，从前面的说明中，除本申请所显示和描述的之外，本发明的多种修改对于本领域的技术人员来说是显而易见的。这些修改也意欲落入所附的权利要求的范围内。在冲突的情况下，将以包括定义的本公开为准。

本申请引用了多篇参考文献，其公开的内容通过引用以其整体并入。

序列表

<110>诺维信股份有限公司(Novozymes，Inc.)

<120>提高具有生物学活性之多肽的分泌的方法

<130>10916.204-WO

<150>US 60/832,511

<151>2006-07-21

<160>76

<170>PatentIn version 3.4

<210>1

<211>923

<212>DNA

<213>特异腐质霉(Humicola insolens)

<400>1

atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt 60

gccgctgatg gcaggtccac ccgctactgg gactgctgca agccttcgtg cggctgggcc 120

aagaaggctc ccgtgaacca gcctgtcttt tcctgcaacg ccaacttcca gcgtatcacg 180

gacttcgacg ccaagtccgg ctgcgagccg ggcggtgtcg cctactcgtg cgccgaccag 240

accccatggg ctgtgaacga cgacttcgcg ctcggttttg ctgccacctc tattgccggc 300

agcaatgagg cgggctggtg ctgcgcctgc tacgagctca ccttcacatc cggtcctgtt 360

gctggcaaga agatggtcgt ccagtccacc agcactggcg gtgatcttgg cagcaaccac 420

ttcgatctca acatccccgg cggcggcgtc ggcatcttcg acggatgcac tccccagttc 480

ggcggtctgc ccggccagcg ctacggcggc atctcgtccc gcaacgagtg cgatcggttc 540

cccgacgccc tcaagcccgg ctgctactgg cgcttcgact ggttcaagaa cgccgacaat 600

ccgagcttca gcttccgtca ggtccagtgc ccagccgagc tcgtcgctcg caccggatgc 660

cgccgcaacg acgacggcaa cttccctgcc gtccagatcc cctccagcag caccagctct 720

ccggtcaacc agcctaccag caccagcacc acgtccacct ccaccacctc gagcccgcca 780

gtccagccta cgactcccag cggctgcact gctgagaggt gggctcagtg cggcggcaat 840

ggctggagcg gctgcaccac ctgcgtcgct ggcagcactt gcacgaagat taatgactgg 900

taccatcagt gcctgtagaa ttc 923

<210>2

<211>305

<212>PRT

<213>特异腐质霉(Humicola insolens)

<400>2

Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro

1 5 10 15

Val Leu Ala Leu Ala Ala Asp Gly Arg Ser Thr Arg Tyr Trp Asp Cys

20 25 30

Cys Lys Pro Ser Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro

35 40 45

Val Phe Ser Cys Asn Ala Asn Phe Gln Arg Ile Thr Asp Phe Asp Ala

50 55 60

Lys Ser Gly Cys Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln

65 70 75 80

Thr Pro Trp Ala Val Asn Asp Asp Phe Ala Leu Gly Phe Ala Ala Thr

85 90 95

Ser Ile Ala Gly Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Glu

100 105 110

Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln

115 120 125

Ser Thr Ser Thr Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn

130 135 140

Ile Pro Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe

145 150 155 160

Gly Gly Leu Pro Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu

165 170 175

Cys Asp Arg Phe Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe

180 185 190

Asp Trp Phe Lys Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val

195 200 205

Gln Cys Pro Ala Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp

210 215 220

Asp Gly Asn Phe Pro Ala Val Gln Ile Pro Ser Ser Ser Thr Ser Ser

225 230 235 240

Pro Val Asn Gln Pro Thr Ser Thr Ser Thr Thr Ser Thr Ser Thr Thr

245 250 255

Ser Ser Pro Pro Val Gln Pro Thr Thr Pro Ser Gly Cys Thr Ala Glu

260 265 270

Arg Trp Ala Gln Cys Gly Gly Asn Gly Trp Ser Gly Cys Thr Thr Cys

275 280 285

Val Ala Gly Ser Thr Cys Thr Lys Ile Asn Asp Trp Tyr His Gln Cys

290 295 300

Leu

305

<210>3

<211>1188

<212>DNA

<213>嗜热毁丝霉(Myceliophthora thermophila)

<400>3

cgacttgaaa cgccccaaat gaagtcctcc atcctcgcca gcgtcttcgc cacgggcgcc 60

gtggctcaaa gtggtccgtg gcagcaatgt ggtggcatcg gatggcaagg atcgaccgac 120

tgtgtgtcgg gctaccactg cgtctaccag aacgattggt acagccagtg cgtgcctggc 180

gcggcgtcga caacgctgca gacatcgacc acgtccaggc ccaccgccac cagcaccgcc 240

cctccgtcgt ccaccacctc gcctagcaag ggcaagctga agtggctcgg cagcaacgag 300

tcgggcgccg agttcgggga gggcaattac cccggcctct ggggcaagca cttcatcttc 360

ccgtcgactt cggcgattca gacgctcatc aatgatggat acaacatctt ccggatcgac 420

ttctcgatgg agcgtctggt gcccaaccag ttgacgtcgt ccttcgacca gggttacctc 480

cgcaacctga ccgaggtggt caacttcgtg acgaacgcgg gcaagtacgc cgtcctggac 540

ccgcacaact acggccggta ctacggcaac atcatcacgg acacgaacgc gttccggacc 600

ttctggacca acctggccaa gcagttcgcc tccaactcgc tcgtcatctt cgacaccaac 660

aacgagtaca acacgatgga ccagaccctg gtgctcaacc tcaaccaggc cgccatcgac 720

ggcatccggg ccgccggcgc gacctcgcag tacatcttcg tcgagggcaa cgcgtggagc 780

ggggcctgga gctggaacac gaccaacacc aacatggccg ccctgacgga cccgcagaac 840

aagatcgtgt acgagatgca ccagtacctc gactcggaca gctcgggcac ccacgccgag 900

tgcgtcagca gcaccatcgg cgcccagcgc gtcgtcggag ccacccagtg gctccgcgcc 960

aacggcaagc tcggcgtcct cggcgagttc gccggcggcg ccaacgccgt ctgccagcag 1020

gccgtcaccg gcctcctcga ccacctccag gacaacagcg acgtctggct gggtgccctc 1080

tggtgggccg ccggtccctg gtggggcgac tacatgtact cgttcgagcc tccttcgggc 1140

accggctatg tcaactacaa ctcgatcttg aagaagtact tgccgtaa 1188

<210>4

<211>389

<212>PRT

<213>嗜热毁丝霉(Myceliophthora thermophila)

<400>4

Met Lys Ser Ser Ile Leu Ala Ser Val Phe Ala Thr Gly Ala Val Ala

1 5 10 15

Gln Ser Gly Pro Trp Gln Gln Cys Gly Gly Ile Gly Trp Gln Gly Ser

20 25 30

Thr Asp Cys Val Ser Gly Tyr His Cys Val Tyr Gln Asn Asp Trp Tyr

35 40 45

Ser Gln Cys Val Pro Gly Ala Ala Ser Thr Thr Leu Gln Thr Ser Thr

50 55 60

Thr Ser Arg Pro Thr Ala Thr Ser Thr Ala Pro Pro Ser Ser Thr Thr

65 70 75 80

Ser Pro Ser Lys Gly Lys Leu Lys Trp Leu Gly Ser Asn Glu Ser Gly

85 90 95

Ala Glu Phe Gly Glu Gly Asn Tyr Pro Gly Leu Trp Gly Lys His Phe

100 105 110

Ile Phe Pro Ser Thr Ser Ala Ile Gln Thr Leu Ile Asn Asp Gly Tyr

115 120 125

Asn Ile Phe Arg Ile Asp Phe Ser Met Glu Arg Leu Val Pro Asn Gln

130 135 140

Leu Thr Ser Ser Phe Asp Gln Gly Tyr Leu Arg Asn Leu Thr Glu Val

145 150 155 160

Val Asn Phe Val Thr Asn Ala Gly Lys Tyr Ala Val Leu Asp Pro His

165 170 175

Asn Tyr Gly Arg Tyr Tyr Gly Asn Ile Ile Thr Asp Thr Asn Ala Phe

180 185 190

Arg Thr Phe Trp Thr Asn Leu Ala Lys Gln Phe Ala Ser Asn Ser Leu

195 200 205

Val Ile Phe Asp Thr Asn Asn Glu Tyr Asn Thr Met Asp Gln Thr Leu

210 215 220

Val Leu Asn Leu Asn Gln Ala Ala Ile Asp Gly Ile Arg Ala Ala Gly

225 230 235 240

Ala Thr Ser Gln Tyr Ile Phe Val Glu Gly Asn Ala Trp Ser Gly Ala

245 250 255

Trp Ser Trp Asn Thr Thr Asn Thr Asn Met Ala Ala Leu Thr Asp Pro

260 265 270

Gln Asn Lys Ile Val Tyr Glu Met His Gln Tyr Leu Asp Ser Asp Ser

275 280 285

Ser Gly Thr His Ala Glu Cys Val Ser Ser Thr Ile Gly Ala Gln Arg

290 295 300

Val Val Gly Ala Thr Gln Trp Leu Arg Ala Asn Gly Lys Leu Gly Val

305 310 315 320

Leu Gly Glu Phe Ala Gly Gly Ala Asn Ala Val Cys Gln Gln Ala Val

325 330 335

Thr Gly Leu Leu Asp His Leu Gln Asp Asn Ser Asp Val Trp Leu Gly

340 345 350

Ala Leu Trp Trp Ala Ala Gly Pro Trp Trp Gly Asp Tyr Met Tyr Ser

355 360 365

Phe Glu Pro Pro Ser Gly Thr Gly Tyr Val Asn Tyr Asn Ser Ile Leu

370 375 380

Lys Lys Tyr Leu Pro

385

<210>5

<211>1232

<212>DNA

<213>嗜热毁丝霉(Myceliophthora thermophila)

<400>5

ggatccactt agtaacggcc gccagtgtgc tggaaagcat gaagtctctc ttcctgtcac 60

ttgtagcgac cgtcgcgctc agctcgccag tattctctgt cgcagtctgg gggcaatgcg 120

gcggcattgg cttcagcgga agcaccgtct gtgatgcagg cgccggctgt gtgaagctca 180

acgactatta ctctcaatgc caacccggcg ctcccactgc tacatccgcg gcgccaagta 240

gcaacgcacc gtccggcact tcgacggcct cggccccctc ctccagcctt tgctctggca 300

gccgcacgcc gttccagttc ttcggtgtca acgaatccgg cgcggagttc ggcaacctga 360

acatccccgg tgttctgggc accgactaca cctggccgtc gccatccagc attgacttct 420

tcatgggcaa gggaatgaat accttccgta ttccgttcct catggagcgt cttgtccccc 480

ctgccactgg catcacagga cctctcgacc agacgtactt gggcggcctg cagacgattg 540

tcaactacat caccggcaaa ggcggctttg ctctcattga cccgcacaac tttatgatct 600

acaatggcca gacgatctcc agtaccagcg acttccagaa gttctggcag aacctcgcag 660

gagtgtttaa atcgaacagt cacgtcatct tcgatgttat gaacgagcct cacgatattc 720

ccgcccagac cgtgttccaa ctgaaccaag ccgctgtcaa tggcatccgt gcgagcggtg 780

cgacgtcgca gctcattctg gtcgagggca caagctggac tggagcctgg acctggacga 840

cctctggcaa cagcgatgca ttcggtgcca ttaaggatcc caacaacaac gtcgcgatcc 900

agatgcatca gtacctggat agcgatggct ctggcacttc gcagacctgc gtgtctccca 960

ccatcggtgc cgagcggttg caggctgcga ctcaatggtt gaagcagaac aacctcaagg 1020

gcttcctggg cgagatcggc gccggctcta actccgcttg catcagcgct gtgcagggtg 1080

cgttgtgttc gatgcagcaa tctggtgtgt ggctcggcgc tctctggtgg gctgcgggcc 1140

cgtggtgggg cgactactac cagtccatcg agccgccctc tggcccggcg gtgtccgcga 1200

tcctcccgca ggccctgctg ccgttcgcgt aa 1232

<210>6

<211>397

<212>PRT

<213>嗜热毁丝霉(Myceliophthora thermophila)

<400>6

Met Lys Ser Leu Phe Leu Ser Leu Val Ala Thr Val Ala Leu Ser Ser

1 5 10 15

Pro Val Phe Ser Val Ala Val Trp Gly Gln Cys Gly Gly Ile Gly Phe

20 25 30

Ser Gly Ser Thr Val Cys Asp Ala Gly Ala Gly Cys Val Lys Leu Asn

35 40 45

Asp Tyr Tyr Ser Gln Cys Gln Pro Gly Ala Pro Thr Ala Thr Ser Ala

50 55 60

Ala Pro Ser Ser Asn Ala Pro Ser Gly Thr Ser Thr Ala Ser Ala Pro

65 70 75 80

Ser Ser Ser Leu Cys Ser Gly Ser Arg Thr Pro Phe Gln Phe Phe Gly

85 90 95

Val Asn Glu Ser Gly Ala Glu Phe Gly Asn Leu Asn Ile Pro Gly Val

100 105 110

Leu Gly Thr Asp Tyr Thr Trp Pro Ser Pro Ser Ser Ile Asp Phe Phe

115 120 125

Met Gly Lys Gly Met Asn Thr Phe Arg Ile Pro Phe Leu Met Glu Arg

130 135 140

Leu Val Pro Pro Ala Thr Gly Ile Thr Gly Pro Leu Asp Gln Thr Tyr

145 150 155 160

Leu Gly Gly Leu Gln Thr Ile Val Asn Tyr Ile Thr Gly Lys Gly Gly

165 170 175

Phe Ala Leu Ile Asp Pro His Asn Phe Met Ile Tyr Asn Gly Gln Thr

180 185 190

Ile Ser Ser Thr Ser Asp Phe Gln Lys Phe Trp Gln Asn Leu Ala Gly

195 200 205

Val Phe Lys Ser Asn Ser His Val Ile Phe Asp Val Met Asn Glu Pro

210 215 220

His Asp Ile Pro Ala Gln Thr Val Phe Gln Leu Asn Gln Ala Ala Val

225 230 235 240

Asn Gly Ile Arg Ala Ser Gly Ala Thr Ser Gln Leu Ile Leu Val Glu

245 250 255

Gly Thr Ser Trp Thr Gly Ala Trp Thr Trp Thr Thr Ser Gly Asn Ser

260 265 270

Asp Ala Phe Gly Ala Ile Lys Asp Pro Asn Asn Asn Val Ala Ile Gln

275 280 285

Met His Gln Tyr Leu Asp Ser Asp Gly Ser Gly Thr Ser Gln Thr Cys

290 295 300

Val Ser Pro Thr Ile Gly Ala Glu Arg Leu Gln Ala Ala Thr Gln Trp

305 310 315 320

Leu Lys Gln Asn Asn Leu Lys Gly Phe Leu Gly Glu Ile Gly Ala Gly

325 330 335

Ser Asn Ser Ala Cys Ile Ser Ala Val Gln Gly Ala Leu Cys Ser Met

340 345 350

Gln Gln Ser Gly Val Trp Leu Gly Ala Leu Trp Trp Ala Ala Gly Pro

355 360 365

Trp Trp Gly Asp Tyr Tyr Gln Ser Ile Glu Pro Pro Ser Gly Pro Ala

370 375 380

Val Ser Ala Ile Leu Pro Gln Ala Leu Leu Pro Phe Ala

385 390 395

<210>7

<211>1303

<212>DNA

<213>担子菌纲(Basidiomycete)CBS 495.95

<400>7

ggaaagcgtc agtatggtga aatttgcgct tgtggcaact gtcggcgcaa tcttgagcgc 60

ttctgcggcc aatgcggctt ctatctacca gcaatgtgga ggcattggat ggtctgggtc 120

cactgtttgc gacgccggtc tcgcttgcgt tatcctcaat gcgtactact ttcagtgctt 180

gacgcccgcc gcgggccaga caacgacggg ctcgggcgca ccggcgtcaa catcaacctc 240

tcactcaacg gtcactacgg ggagctcaca ctcaacaacc gggacgacgg cgacgaaaac 300

aactaccact ccgtcgacca ccacgaccct acccgccatc tctgtgtctg gtcgcgtctg 360

ctctggctcc aggacgaagt tcaagttctt cggtgtgaat gaaagcggcg ccgaattcgg 420

gaacactgct tggccagggc agctcgggaa agactataca tggccttcgc ctagcagcgt 480

ggactacttc atgggggctg gattcaatac attccgtatc accttcttga tggagcgtat 540

gagccctccg gctaccggac tcactggccc attcaaccag acgtacctgt cgggcctcac 600

caccattgtc gactacatca cgaacaaagg aggatacgct cttattgacc cccacaactt 660

catgcgttac aacaacggca taatcagcag cacatctgac ttcgcgactt ggtggagcaa 720

tttggccact gtattcaaat ccacgaagaa cgccatcttc gacatccaga acgagccgta 780

cggaatcgat gcgcagaccg tatacgaact gaatcaagct gccatcaatt cgatccgcgc 840

cgctggcgct acgtcacagt tgattctggt tgaaggaacg tcatacactg gagcttggac 900

gtgggtctcg tccggaaacg gagctgcttt cgcggccgtt acggatcctt acaacaacac 960

ggcaattgaa atgcaccaat acctcgacag cgacggttct gggacaaacg aagactgtgt 1020

ctcctccacc attgggtcgc aacgtctcca agctgccact gcgtggctgc aacaaacagg 1080

actcaaggga ttcctcggag agacgggtgc tgggtcgaat tcccagtgca tcgacgccgt 1140

gttcgatgaa ctttgctata tgcaacagca aggcggctcc tggatcggtg cactctggtg 1200

ggctgcgggt ccctggtggg gcacgtacat ttactcgatt gaacctccga gcggtgccgc 1260

tatcccagaa gtccttcctc agggtctcgc tccattcctc tag 1303

<210>8

<211>429

<212>PRT

<213>担子菌纲(BASIDIOMYCETE)CBS 495.95

<400>8

Met Val Lys Phe Ala Leu Val Ala Thr Val Gly Ala Ile Leu Ser Ala

1 5 10 15

Ser Ala Ala Asn Ala Ala Ser Ile Tyr Gln Gln Cys Gly Gly Ile Gly

20 25 30

Trp Ser Gly Ser Thr Val Cys Asp Ala Gly Leu Ala Cys Val Ile Leu

35 40 45

Asn Ala Tyr Tyr Phe Gln Cys Leu Thr Pro Ala Ala Gly Gln Thr Thr

50 55 60

Thr Gly Ser Gly Ala Pro Ala Ser Thr Ser Thr Ser His Ser Thr Val

65 70 75 80

Thr Thr Gly Ser Ser His Ser Thr Thr Gly Thr Thr Ala Thr Lys Thr

85 90 95

Thr Thr Thr Pro Ser Thr Thr Thr Thr Leu Pro Ala Ile Ser Val Ser

100 105 110

Gly Arg Val Cys Ser Gly Ser Arg Thr Lys Phe Lys Phe Phe Gly Val

115 120 125

Asn Glu Ser Gly Ala GIu Phe Gly Asn Thr Ala Trp Pro Gly Gln Leu

130 135 140

Gly Lys Asp Tyr Thr Trp Pro Ser Pro Ser Ser Val Asp Tyr Phe Met

145 150 155 160

Gly Ala Gly Phe Asn Thr Phe Arg Ile Thr Phe Leu Met Glu Arg Met

165 170 175

Ser Pro Pro Ala Thr Gly Leu Thr Gly Pro Phe Asn Gln Thr Tyr Leu

180 185 190

Ser Gly Leu Thr Thr Ile Val Asp Tyr Ile Thr Asn Lys Gly Gly Tyr

195 200 205

Ala Leu Ile Asp Pro His Asn Phe Met Arg Tyr Asn Asn Gly Ile Ile

210 215 220

Ser Ser Thr Ser Asp Phe Ala Thr Trp Trp Ser Asn Leu Ala Thr Val

225 230 235 240

Phe Lys Ser Thr Lys Asn Ala Ile Phe Asp Ile Gln Asn Glu Pro Tyr

245 250 255

Gly Ile Asp Ala Gln Thr Val Tyr Glu Leu Asn Gln Ala Ala Ile Asn

260 265 270

Ser Ile Arg Ala Ala Gly Ala Thr Ser Gln Leu Ile Leu Val Glu Gly

275 280 285

Thr Ser Tyr Thr Gly Ala Trp Thr Trp Val Ser Ser Gly Asn Gly Ala

290 295 300

Ala Phe Ala Ala Val Thr Asp Pro Tyr Asn Asn Thr Ala Ile Glu Met

305 310 315 320

His Gln Tyr Leu Asp Ser Asp Gly Ser Gly Thr Asn Glu Asp Cys Val

325 330 335

Ser Ser Thr Ile Gly Ser Gln Arg Leu Gln Ala Ala Thr Ala Trp Leu

340 345 350

Gln Gln Thr Gly Leu Lys Gly Phe Leu Gly Glu Thr Gly Ala Gly Ser

355 360 365

Asn Ser Gln Cys Ile Asp Ala Val Phe Asp Glu Leu Cys Tyr Met Gln

370 375 380

Gln Gln Gly Gly Ser Trp Ile Gly Ala Leu Trp Trp Ala Ala Gly Pro

385 390 395 400

Trp Trp Gly Thr Tyr Ile Tyr Ser Ile Glu Pro Pro Ser Gly Ala Ala

405 410 415

Ile Pro Glu Val Leu Pro Gln Gly Leu Ala Pro Phe Leu

420 425

<210>9

<211>1580

<212>DNA

<213>土生梭孢霉(Thielavia terrestris)

<400>9

agccccccgt tcaggcacac ttggcatcag atcagcttag cagcgcctgc acagcatgaa 60

gctctcgcag tcggccgcgc tggcggcact caccgcgacg gcgctcgccg ccccctcgcc 120

cacgacgccg caggcgccga ggcaggcttc agccggctgc tcgtctgcgg tcacgctcga 180

cgccagcacc aacgtttgga agaagtacac gctgcacccc aacagctact accgcaagga 240

ggttgaggcc gcggtggcgc agatctcgga cccggacctc gccgccaagg ccaagaaggt 300

ggccgacgtc ggcaccttcc tgtggctcga ctcgatcgag aacatcggca agctggagcc 360

ggcgatccag gacgtgccct gcgagaacat cctgggcctg gtcatctacg acctgccggg 420

ccgcgactgc gcggccaagg cgtccaacgg cgagctcaag gtcggcgaga tcgaccgcta 480

caagaccgag tacatcgaca gtgagtgctg ccccccgggt tcgagaagag cgtgggggaa 540

agggaaaggg ttgactgact gacacggcgc actgcagaga tcgtgtcgat cctcaaggca 600

caccccaaca cggcgttcgc gctggtcatc gagccggact cgctgcccaa cctggtgacc 660

aacagcaact tggacacgtg ctcgagcagc gcgtcgggct accgcgaagg cgtggcttac 720

gccctcaaga acctcaacct gcccaacgtg atcatgtacc tcgacgccgg ccacggcggc 780

tggctcggct gggacgccaa cctgcagccc ggcgcgcagg agctagccaa ggcgtacaag 840

aacgccggct cgcccaagca gctccgcggc ttctcgacca acgtggccgg ctggaactcc 900

tggtgagctt ttttccattc catttcttct tcctcttctc tcttcgctcc cactctgcag 960

ccccccctcc cccaagcacc cactggcgtt ccggcttgct gactcggcct ccctttcccc 1020

gggcaccagg gatcaatcgc ccggcgaatt ctcccaggcg tccgacgcca agtacaacaa 1080

gtgccagaac gagaagatct acgtcagcac cttcggctcc gcgctccagt cggccggcat 1140

gcccaaccac gccatcgtcg acacgggccg caacggcgtc accggcctgc gcaaggagtg 1200

gggtgactgg tgcaacgtca acggtgcagg ttcgttgtct tctttttctc ctcttttgtt 1260

tgcacgtcgt ggtccttttc aagcagccgt gtttggttgg gggagatgga ctccggctga 1320

tgttctgctt cctctctagg cttcggcgtg cgcccgacga gcaacacggg cctcgagctg 1380

gccgacgcgt tcgtgtgggt caagcccggc ggcgagtcgg acggcaccag cgacagctcg 1440

tcgccgcgct acgacagctt ctgcggcaag gacgacgcct tcaagccctc gcccgaggcc 1500

ggcacctgga acgaggccta cttcgagatg ctgctcaaga acgccgtgcc gtcgttctaa 1560

gacggtccag catcatccgg 1580

<210>10

<211>396

<212>PRT

<213>土生梭孢霉(Thielavia terrestris)

<400>10

Met Lys Leu Ser Gln Ser Ala Ala Leu Ala Ala Leu Thr Ala Thr Ala

1 5 10 15

Leu Ala Ala Pro Ser Pro Thr Thr Pro Gln Ala Pro Arg Gln Ala Ser

20 25 30

Ala Gly Cys Ser Ser Ala Val Thr Leu Asp Ala Ser Thr Asn Val Trp

35 40 45

Lys Lys Tyr Thr Leu His Pro Asn Ser Tyr Tyr Arg Lys Glu Val Glu

50 55 60

Ala Ala Val Ala Gln Ile Ser Asp Pro Asp Leu Ala Ala Lys Ala Lys

65 70 75 80

Lys Val Ala Asp Val Gly Thr Phe Leu Trp Leu Asp Ser Ile Glu Asn

85 90 95

Ile Gly Lys Leu Glu Pro Ala Ile Gln Asp Val Pro Cys Glu Asn Ile

100 105 110

Leu Gly Leu Val Ile Tyr Asp Leu Pro Gly Arg Asp Cys Ala Ala Lys

115 120 125

Ala Ser Asn Gly Glu Leu Lys Val Gly Glu Ile Asp Arg Tyr Lys Thr

130 135 140

Glu Tyr Ile Asp Lys Ile Val Ser Ile Leu Lys Ala His Pro Asn Thr

145 150 155 160

Ala Phe Ala Leu Val Ile Glu Pro Asp Ser Leu Pro Asn Leu Val Thr

165 170 175

Asn Ser Asn Leu Asp Thr Cys Ser Ser Ser Ala Ser Gly Tyr Arg Glu

180 185 190

Gly Val Ala Tyr Ala Leu Lys Asn Leu Asn Leu Pro Asn Val Ile Met

195 200 205

Tyr Leu Asp Ala Gly His Gly Gly Trp Leu Gly Trp Asp Ala Asn Leu

210 215 220

Gln Pro Gly Ala Gln Glu Leu Ala Lys Ala Tyr Lys Asn Ala Gly Ser

225 230 235 240

Pro Lys Gln Leu Arg Gly Phe Ser Thr Asn Val Ala Gly Trp Asn Ser

245 250 255

Trp Asp Gln Ser Pro Gly Glu Phe Ser Gln Ala Ser Asp Ala Lys Tyr

260 265 270

Asn Lys Cys Gln Asn Glu Lys Ile Tyr Val Ser Thr Phe Gly Ser Ala

275 280 285

Leu Gln Ser Ala Gly Met Pro Asn His Ala Ile Val Asp Thr Gly Arg

290 295 300

Asn Gly Val Thr Gly Leu Arg Lys Glu Trp Gly Asp Trp Cys Asn Val

305 310 315 320

Asn Gly Ala Gly Phe Gly Val Arg Pro Thr Ser Asn Thr Gly Leu Glu

325 330 335

Leu Ala Asp Ala Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly

340 345 350

Thr Ser Asp Ser Ser Ser Pro Arg Tyr Asp Ser Phe Cys Gly Lys Asp

355 360 365

Asp Ala Phe Lys Pro Ser Pro Glu Ala Gly Thr Trp Asn Glu Ala Tyr

370 375 380

Phe Glu Met Leu Leu Lys Asn Ala Val Pro Ser Phe

385 390 395

<210>11

<211>1203

<212>DNA

<213>土生梭孢霉(Thielavia terrestris)

<400>11

atgaagtacc tcaacctcct cgcagctctc ctcgccgtcg ctcctctctc cctcgctgca 60

cccagcatcg aggccagaca gtcgaacgtc aacccataca tcggcaagag cccgctcgtt 120

attaggtcgt acgcccaaaa gcttgaggag accgtcagga ccttccagca acgtggcgac 180

cagctcaacg ctgcgaggac acggacggtg cagaacgttg cgactttcgc ctggatctcg 240

gataccaatg gtattggagc cattcgacct ctcatccaag atgctctcgc ccagcaggct 300

cgcactggac agaaggtcat cgtccaaatc gtcgtctaca acctcccaga tcgcgactgc 360

tctgccaacg cctcgactgg agagttcacc gtaggaaacg acggtctcaa ccgatacaag 420

aactttgtca acaccatcgc ccgcgagctc tcgactgctg acgctgacaa gctccacttt 480

gccctcctcc tcgaacccga cgcacttgcc aacctcgtca ccaacgcgaa tgcccccagg 540

tgccgaatcg ccgctcccgc ttacaaggag ggtatcgcct acaccctcgc caccttgtcc 600

aagcccaacg tcgacgtcta catcgacgcc gccaacggtg gctggctcgg ctggaacgac 660

aacctccgcc ccttcgccga actcttcaag gaagtctacg acctcgcccg ccgcatcaac 720

cccaacgcca aggtccgcgg cgtccccgtc aacgtctcca actacaacca gtaccgcgct 780

gaagtccgcg agcccttcac cgagtggaag gacgcctggg acgagagccg ctacgtcaac 840

gtcctcaccc cgcacctcaa cgccgtcggc ttctccgcgc acttcatcgt tgaccaggga 900

cgcggtggca agggcggtat caggacggag tggggccagt ggtgcaacgt taggaacgct 960

gggttcggta tcaggcctac tgcggatcag ggcgtgctcc agaacccgaa tgtggatgcg 1020

attgtgtggg ttaagccggg tggagagtcg gatggcacga gtgatttgaa ctcgaacagg 1080

tatgatccta cgtgcaggag tccggtggcg catgttcccg ctcctgaggc tggccagtgg 1140

ttcaacgagt atgttgttaa cctcgttttg aacgctaacc cccctcttga gcctacctgg 1200

taa 1203

<210>12

<211>400

<212>PRT

<213>土生梭孢霉(Thielavia terrestris)

<400>12

Met Lys Tyr Leu Asn Leu Leu Ala Ala Leu Leu Ala Val Ala Pro Leu

1 5 10 15

Ser Leu Ala Ala Pro Ser Ile Glu Ala Arg Gln Ser Asn Val Asn Pro

20 25 30

Tyr Ile Gly Lys Ser Pro Leu Val Ile Arg Ser Tyr Ala Gln Lys Leu

35 40 45

Glu Glu Thr Val Arg Thr Phe Gln Gln Arg Gly Asp Gln Leu Asn Ala

50 55 60

Ala Arg Thr Arg Thr Val Gln Asn Val Ala Thr Phe Ala Trp Ile Ser

65 70 75 80

Asp Thr Asn Gly Ile Gly Ala Ile Arg Pro Leu Ile Gln Asp Ala Leu

85 90 95

Ala Gln Gln Ala Arg Thr Gly Gln Lys Val Ile Val Gln Ile Val Val

100 105 110

Tyr Asn Leu Pro Asp Arg Asp Cys Ser Ala Asn Ala Ser Thr Gly Glu

115 120 125

Phe Thr Val Gly Asn Asp Gly Leu Asn Arg Tyr Lys Asn Phe Val Asn

130 135 140

Thr Ile Ala Arg Glu Leu Ser Thr Ala Asp Ala Asp Lys Leu His Phe

145 150 155 160

Ala Leu Leu Leu Glu Pro Asp Ala Leu Ala Asn Leu Val Thr Asn Ala

165 170 175

Asn Ala Pro Arg Cys Arg Ile Ala Ala Pro Ala Tyr Lys Glu Gly Ile

180 185 190

Ala Tyr Thr Leu Ala Thr Leu Ser Lys Pro Asn Val Asp Val Tyr Ile

195 200 205

Asp Ala Ala Asn Gly Gly Trp Leu Gly Trp Asn Asp Asn Leu Arg Pro

210 215 220

Phe Ala Glu Leu Phe Lys Glu Val Tyr Asp Leu Ala Arg Arg Ile Asn

225 230 235 240

Pro Asn Ala Lys Val Arg Gly Val Pro Val Asn Val Ser Asn Tyr Asn

245 250 255

Gln Tyr Arg Ala Glu Val Arg Glu Pro Phe Thr Glu Trp Lys Asp Ala

260 265 270

Trp Asp Glu Ser Arg Tyr Val Asn Val Leu Thr Pro His Leu Asn Ala

275 280 285

Val Gly Phe Ser Ala His Phe Ile Val Asp Gln Gly Arg Gly Gly Lys

290 295 300

Gly Gly Ile Arg Thr Glu Trp Gly Gln Trp Cys Asn Val Arg Asn Ala

305 310 315 320

Gly Phe Gly Ile Arg Pro Thr Ala Asp Gln Gly Val Leu Gln Asn Pro

325 330 335

Asn Val Asp Ala Ile Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly

340 345 350

Thr Ser Asp Leu Asn Ser Asn Arg Tyr Asp Pro Thr Cys Arg Ser Pro

355 360 365

Val Ala His Val Pro Ala Pro Glu Ala Gly Gln Trp Phe Asn Glu Tyr

370 375 380

Val Val Asn Leu Val Leu Asn Ala Asn Pro Pro Leu Glu Pro Thr Trp

385 390 395 400

<210>13

<211>1501

<212>DNA

<213>土生梭孢霉(Thielavia terrestris)

<400>13

gccgttgtca agatgggcca gaagacgctg cacggattcg ccgccacggc tttggccgtt 60

ctcccctttg tgaaggctca gcagcccggc aacttcacgc cggaggtgca cccgcaactg 120

ccaacgtgga agtgcacgac cgccggcggc tgcgttcagc aggacacttc ggtggtgctc 180

gactggaact accgttggat ccacaatgcc gacggcaccg cctcgtgcac gacgtccagc 240

ggggtcgacc acacgctgtg tccagatgag gcgacctgcg cgaagaactg cttcgtggaa 300

ggcgtcaact acacgagcag cggtgtcacc acatccggca gttcgctgac gatgaggcag 360

tatttcaagg ggagcaacgg gcagaccaac agcgtttcgc ctcgtctcta cctgctcggc 420

tcggatggaa actacgtaat gctcaagctg ctcggccagg agctgagctt cgatgtcgat 480

ctctccacgc tcccctgcgg cgagaacggc gcgctgtacc tgtccgagat ggacgcgacc 540

ggtggcagga accagtacaa caccggcggt gccaactacg gctcgggcta ctgtgacgcc 600

cagtgtcccg tgcagacgtg gatgaacggc acgctgaaca ccaacgggca gggctactgc 660

tgcaacgaga tggacatcct cgaggccaac tcccgcgcca acgcgatgac acctcacccc 720

tgcgccaacg gcagctgcga caagagcggg tgcggactca acccctacgc cgagggctac 780

aagagctact acggaccggg cctcacggtt gacacgtcga agcccttcac catcattacc 840

cgcttcatca ccgacgacgg cacgaccagc ggcaccctca accagatcca gcggatctat 900

gtgcagaatg gcaagacggt cgcgtcggct gcgtccggag gcgacatcat cacggcatcc 960

ggctgcacct cggcccaggc gttcggcggg ctggccaaca tgggcgcggc gcttggacgg 1020

ggcatggtgc tgaccttcag catctggaac gacgctgggg gctacatgaa ctggctcgac 1080

agcggcaaca acggcccgtg cagcagcacc gagggcaacc cgtccaacat cctggccaac 1140

tacccggaca cccacgtggt cttctccaac atccgctggg gagacatcgg ctcgacggtc 1200

caggtctcgg gaggcggcaa cggcggctcg accaccacca cgtcgaccac cacgctgagg 1260

acctcgacca cgaccaccac caccgccccg acggccactg ccacgcactg gggacaatgc 1320

ggcggaatcg gggtacgtca accgcctcct gcattctgtt gaggaagtta actaacgtgg 1380

cctacgcagt ggactggacc gaccgtctgc gaatcgccgt acgcatgcaa ggagctgaac 1440

ccctggtact accagtgcct ctaaagtatt gcagtgaagc catactccgt gctcggcatg 1500

g 1501

<210>14

<211>464

<212>PRT

<213>土生梭孢霉(Thielavia terrestris)

<400>14

Met Gly Gln Lys Thr Leu His Gly Phe Ala Ala Thr Ala Leu Ala Val

1 5 10 15

Leu Pro Phe Val Lys Ala Gln Gln Pro Gly Asn Phe Thr Pro Glu Val

20 25 30

His Pro Gln Leu Pro Thr Trp Lys Cys Thr Thr Ala Gly Gly Cys Val

35 40 45

Gln Gln Asp Thr Ser Val Val Leu Asp Trp Asn Tyr Arg Trp Ile His

50 55 60

Asn Ala Asp Gly Thr Ala Ser Cys Thr Thr Ser Ser Gly Val Asp His

65 70 75 80

Thr Leu Cys Pro Asp Glu Ala Thr Cys Ala Lys Asn Cys Phe Val Glu

85 90 95

Gly Val Asn Tyr Thr Ser Ser Gly Val Thr Thr Ser Gly Ser Ser Leu

100 105 110

Thr Met Arg Gln Tyr Phe Lys Gly Ser Asn Gly Gln Thr Asn Ser Val

115 120 125

Ser Pro Arg Leu Tyr Leu Leu Gly Ser Asp Gly Asn Tyr Val Met Leu

130 135 140

Lys Leu Leu Gly Gln Glu Leu Ser Phe Asp Val Asp Leu Ser Thr Leu

145 150 155 160

Pro Cys Gly Glu Asn Gly Ala Leu Tyr Leu Ser Glu Met Asp Ala Thr

165 170 175

Gly Gly Arg Asn Gln Tyr Asn Thr Gly Gly Ala Asn Tyr Gly Ser Gly

180 185 190

Tyr Cys Asp Ala Gln Cys Pro Val Gln Thr Trp Met Asn Gly Thr Leu

195 200 205

Asn Thr Asn Gly Gln Gly Tyr Cys Cys Asn Glu Met Asp Ile Leu Glu

210 215 220

Ala Asn Ser Arg Ala Asn Ala Met Thr Pro His Pro Cys Ala Asn Gly

225 230 235 240

Ser Cys Asp Lys Ser Gly Cys Gly Leu Asn Pro Tyr Ala Glu Gly Tyr

245 250 255

Lys Ser Tyr Tyr Gly Pro Gly Leu Thr Val Asp Thr Ser Lys Pro Phe

260 265 270

Thr Ile Ile Thr Arg Phe Ile Thr Asp Asp Gly Thr Thr Ser Gly Thr

275 280 285

Leu Asn Gln Ile Gln Arg Ile Tyr Val Gln Asn Gly Lys Thr Val Ala

290 295 300

Ser Ala Ala Ser Gly Gly Asp Ile Ile Thr Ala Ser Gly Cys Thr Ser

305 310 315 320

Ala Gln Ala Phe Gly Gly Leu Ala Asn Met Gly Ala Ala Leu Gly Arg

325 330 335

Gly Met Val Leu Thr Phe Ser Ile Trp Asn Asp Ala Gly Gly Tyr Met

340 345 350

Asn Trp Leu Asp Ser Gly Asn Asn Gly Pro Cys Ser Ser Thr Glu Gly

355 360 365

Asn Pro Ser Asn Ile Leu Ala Asn Tyr Pro Asp Thr His Val Val Phe

370 375 380

Ser Asn Ile Arg Trp Gly Asp Ile Gly Ser Thr Val Gln Val Ser Gly

385 390 395 400

Gly Gly Asn Gly Gly Ser Thr Thr Thr Thr Ser Thr Thr Thr Leu Arg

405 410 415

Thr Ser Thr Thr Thr Thr Thr Thr Ala Pro Thr Ala Thr Ala Thr His

420 425 430

Trp Gly Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro Thr Val Cys Glu

435 440 445

Ser Pro Tyr Ala Cys Lys Glu Leu Asn Pro Trp Tyr Tyr Gln Cys Leu

450 455 460

<210>15

<211>1368

<212>DNA

<213>土生梭孢霉(Thielavia terrestris)

<400>15

accgatccgc tcgaagatgg cgcccaagtc tacagttctg gccgcctggc tgctctcctc 60

gctggccgcg gcccagcaga tcggcaaagc cgtgcccgag gtccacccca aactgacaac 120

gcagaagtgc actctccgcg gcgggtgcaa gcctgtccgc acctcggtcg tgctcgactc 180

gtccgcgcgc tcgctgcaca aggtcgggga ccccaacacc agctgcagcg tcggcggcga 240

cctgtgctcg gacgcgaagt cgtgcggcaa gaactgcgcg ctcgagggcg tcgactacgc 300

ggcccacggc gtggcgacca agggcgacgc cctcacgctg caccagtggc tcaagggggc 360

cgacggcacc tacaggaccg tctcgccgcg cgtatacctc ctgggcgagg acgggaagaa 420

ctacgaggac ttcaagctgc tcaacgccga gctcagcttc gacgtcgacg tgtcccagct 480

cgtctgcggc atgaacggcg ccctgtactt ctccgagatg gagatggacg gcggccgcag 540

cccgctgaac ccggcgggcg ccacgtacgg cacgggctac tgcgacgcgc agtgccccaa 600

gttggacttt atcaacggcg aggtatttct tctctcttct gtttttcttt tccatcgctt 660

tttctgaccg gaatccgccc tcttagctca acaccaacca cacgtacggg gcgtgctgca 720

acgagatgga catctgggag gccaacgcgc tggcgcaggc gctcacgccg cacccgtgca 780

acgcgacgcg ggtgtacaag tgcgacacgg cggacgagtg cgggcagccg gtgggcgtgt 840

gcgacgaatg ggggtgctcg tacaacccgt ccaacttcgg ggtcaaggac tactacgggc 900

gcaacctgac ggtggacacg aaccgcaagt tcacggtgac gacgcagttc gtgacgtcca 960

acgggcgggc ggacggcgag ctgaccgaga tccggcggct gtacgtgcag gacggcgtgg 1020

tgatccagaa ccacgcggtc acggcgggcg gggcgacgta cgacagcatc acggacggct 1080

tctgcaacgc gacggccacc tggacgcagc agcggggcgg gctcgcgcgc atgggcgagg 1140

ccatcggccg cggcatggtg ctcatcttca gcctgtgggt tgacaacggc ggcttcatga 1200

actggctcga cagcggcaac gccgggccct gcaacgccac cgagggcgac ccggccctga 1260

tcctgcagca gcacccggac gccagcgtca ccttctccaa catccgatgg ggcgagatcg 1320

gcagcacgta caagagcgag tgcagccact agagtagagc ttgtaatt 1368

<210>16

<211>423

<212>PRT

<213>土生梭孢霉(Thielavia terrestris)

<400>16

Met Ala Pro Lys Ser Thr Val Leu Ala Ala Trp Leu Leu Ser Ser Leu

1 5 10 15

Ala Ala Ala Gln Gln Ile Gly Lys Ala Val Pro Glu Val His Pro Lys

20 25 30

Leu Thr Thr Gln Lys Cys Thr Leu Arg Gly Gly Cys Lys Pro Val Arg

35 40 45

Thr Ser Val Val Leu Asp Ser Ser Ala Arg Ser Leu His Lys Val Gly

50 55 60

Asp Pro Asn Thr Ser Cys Ser Val Gly Gly Asp Leu Cys Ser Asp Ala

65 70 75 80

Lys Ser Cys Gly Lys Asn Cys Ala Leu Glu Gly Val Asp Tyr Ala Ala

85 90 95

His Gly Val Ala Thr Lys Gly Asp Ala Leu Thr Leu His Gln Trp Leu

100 105 110

Lys Gly Ala Asp Gly Thr Tyr Arg Thr Val Ser Pro Arg Val Tyr Leu

115 120 125

Leu Gly Glu Asp Gly Lys Asn Tyr Glu Asp Phe Lys Leu Leu Asn Ala

130 135 140

Glu Leu Ser Phe Asp Val Asp Val Ser Gln Leu Val Cys Gly Met Asn

145 150 155 160

Gly Ala Leu Tyr Phe Ser Glu Met Glu Met Asp Gly Gly Arg Ser Pro

165 170 175

Leu Asn Pro Ala Gly Ala Thr Tyr Gly Thr Gly Tyr Cys Asp Ala Gln

180 185 190

Cys Pro Lys Leu As1 Phe Ile Asn Gly Glu Leu Asn Thr Asn His Thr

195 200 205

Tyr Gly Ala Cys Cys Asn Glu Met Asp Ile Trp Glu Ala Asn Ala Leu

210 215 220

Ala Gln Ala Leu Thr Pro His Pro Cys Asn Ala Thr Arg Val Tyr Lys

225 230 235 240

Cys Asp Thr Ala Asp Glu Cys Gly Gln Pro Val Gly Val Cys Asp Glu

245 250 255

Trp Gly Cys Ser Tyr Asn Pro Ser Asn Phe Gly Val Lys Asp Tyr Tyr

260 265 270

Gly Arg Asn Leu Thr Val Asp Thr Asn Arg Lys Phe Thr Val Thr Thr

275 280 285

Gln Phe Val Thr Ser Asn Gly Arg Ala Asp Gly Glu Leu Thr Glu Ile

290 295 300

Arg Arg Leu Tyr Val Gln Asp Gly Val Val Ile Gln Asn His Ala Val

305 310 315 320

Thr Ala Gly Gly Ala Thr Tyr Asp Ser Ile Thr Asp Gly Phe Cys Asn

325 330 335

Ala Thr Ala Thr Trp Thr Gln Gln Arg Gly Gly Leu Ala Arg Met Gly

340 345 350

Glu Ala Ile Gly Arg Gly Met Val Leu Ile Phe Ser Leu Trp Val Asp

355 360 365

Asn Gly Gly Phe Met Asn Trp Leu Asp Ser Gly Asn Ala Gly Pro Cys

370 375 380

Asn Ala Thr Glu Gly Asp Pro Ala Leu Ile Leu Gln Gln His Pro Asp

385 390 395 400

Ala Ser Val Thr Phe Ser Asn Ile Arg Trp Gly Glu Ile Gly Ser Thr

405 410 415

Tyr Lys Ser Glu Cys Ser His

420

<210>17

<211>1011

<212>DNA

<213>土生梭孢霉(Thielavia terrestris)

<400>17

atgaccctac ggctccctgt catcagcctg ctggcctcgc tggcagcagg cgccgtcgtc 60

gtcccacggg cggagtttca cccccctctc ccgacttgga aatgcacgac ctccgggggc 120

tgcgtgcagc agaacaccag cgtcgtcctg gaccgtgact cgaagtacgc cgcacacagc 180

gccggctcgc ggacggaatc ggattacgcg gcaatgggag tgtccacttc gggcaatgcc 240

gtgacgctgt accactacgt caagaccaac ggcaccctcg tccccgcttc gccgcgcatc 300

tacctcctgg gcgcggacgg caagtacgtg cttatggacc tcctcaacca ggagctgtcg 360

gtggacgtcg acttctcggc gctgccgtgc ggcgagaacg gggccttcta cctgtccgag 420

atggcggcgg acgggcgggg cgacgcgggg gcgggcgacg ggtactgcga cgcgcagtgc 480

cagggctact gctgcaacga gatggacatc ctcgaggcca actcgatggc gacggccatg 540

acgccgcacc cgtgcaaggg caacaactgc gaccgcagcg gctgcggcta caacccgtac 600

gccagcggcc agcgcggctt ctacgggccc ggcaagacgg tcgacacgag caagcccttc 660

accgtcgtca cgcagttcgc cgccagcggc ggcaagctga cccagatcac ccgcaagtac 720

atccagaacg gccgggagat cggcggcggc ggcaccatct ccagctgcgg ctccgagtct 780

tcgacgggcg gcctgaccgg catgggcgag gcgctggggc gcggaatggt gctggccatg 840

agcatctgga acgacgcggc ccaggagatg gcatggctcg atgccggcaa caacggccct 900

tgcgccagtg gccagggcag cccgtccgtc attcagtcgc agcatcccga cacccacgtc 960

gtcttctcca acatcaggtg gggcgacatc gggtctacca cgaagaacta g 1011

<210>18

<211>336

<212>PRT

<213>土生梭孢霉(Thielavia terrestris)

<400>18

Met Thr Leu Arg Leu Pro Val Ile Ser Leu Leu Ala Ser Leu Ala Ala

1 5 10 15

Gly Ala Val Val Val Pro Arg Ala Glu Phe His Pro Pro Leu Pro Thr

20 25 30

Trp Lys Cys Thr Thr Ser Gly Gly Cys Val Gln Gln Asn Thr Ser Val

35 40 45

Val Leu Asp Arg Asp Ser Lys Tyr Ala Ala His Ser Ala Gly Ser Arg

50 55 60

Thr Glu Ser Asp Tyr Ala Ala Met Gly Val Ser Thr Ser Gly Asn Ala

65 70 75 80

Val Thr Leu Tyr His Tyr Val Lys Thr Asn Gly Thr Leu Val Pro Ala

85 90 95

Ser Pro Arg Ile Tyr Leu Leu Gly Ala Asp Gly Lys Tyr Val Leu Met

100 105 110

Asp Leu Leu Asn Gln Glu Leu Ser Val Asp Val Asp Phe Ser Ala Leu

115 120 125

Pro Cys Gly Glu Asn Gly Ala Phe Tyr Leu Ser Glu Met Ala Ala Asp

130 135 140

Gly Arg Gly Asp Ala Gly Ala Gly Asp Gly Tyr Cys Asp Ala Gln Cys

145 150 155 160

Gln Gly Tyr Cys Cys Asn Glu Met Asp Ile Leu Glu Ala Asn Ser Met

165 170 175

Ala Thr Ala Met Thr Pro His Pro Cys Lys Gly Asn Asn Cys Asp Arg

180 185 190

Ser Gly Cys Gly Tyr Asn Pro Tyr Ala Ser Gly Gln Arg Gly Phe Tyr

195 200 205

Gly Pro Gly Lys Thr Val Asp Thr Ser Lys Pro Phe Thr Val Val Thr

210 215 220

Gln Phe Ala Ala Ser Gly Gly Lys Leu Thr Gln Ile Thr Arg Lys Tyr

225 230 235 240

Ile Gln Asn Gly Arg Glu Ile Gly Gly Gly Gly Thr Ile Ser Ser Cys

245 250 255

Gly Ser Glu Ser Ser Thr Gly Gly Leu Thr Gly Met Gly Glu Ala Leu

260 265 270

Gly Arg Gly Met Val Leu Ala Met Ser Ile Trp Asn Asp Ala Ala Gln

275 280 285

Glu Met Ala Trp Leu Asp Ala Gly Asn Asn Gly Pro Cys Ala Ser Gly

290 295 300

Gln Gly Ser Pro Ser Val Ile Gln Ser Gln His Pro Asp Thr His Val

305 310 315 320

Val Phe Ser Asn Ile Arg Trp Gly Asp Ile Gly Ser Thr Thr Lys Asn

325 330 335

<210>19

<211>1480

<212>DNA

<213>Cladorrhinum foecundissimum

<400>19

gatccgaatt cctcctctcg ttctttagtc acagaccaga catctgccca cgatggttca 60

caagttcgcc ctcctcaccg gcctcgccgc ctccctcgca tctgcccagc agatcggcac 120

cgtcgtcccc gagtctcacc ccaagcttcc caccaagcgc tgcactctcg ccggtggctg 180

ccagaccgtc gacacctcca tcgtcatcga cgccttccag cgtcccctcc acaagatcgg 240

cgacccttcc actccttgcg tcgtcggcgg ccctctctgc cccgacgcca agtcctgcgc 300

tgagaactgc gcgctcgagg gtgtcgacta tgcctcctgg ggcatcaaga ccgagggcga 360

cgccctaact ctcaaccagt ggatgcccga cccggcgaac cctggccagt acaagacgac 420

tactccccgt acttaccttg ttgctgagga cggcaagaac tacgaggatg tgaagctcct 480

ggctaaggag atctcgtttg atgccgatgt cagcaacctt ccctgcggca tgaacggtgc 540

tttctacttg tctgagatgt tgatggatgg tggacgtggc gacctcaacc ctgctggtgc 600

cgagtatggt accggttact gtgatgcgca gtgcttcaag ttggatttca tcaacggcga 660

ggccaacatc gaccaaaagc acggcgcctg ctgcaacgaa atggacattt tcgaatccaa 720

ctcgcgcgcc aagaccttcg tcccccaccc ctgcaacatc acgcaggtct acaagtgcga 780

aggcgaagac gagtgcggcc agcccgtcgg cgtgtgcgac aagtgggggt gcggcttcaa 840

cgagtacaaa tggggcgtcg agtccttcta cggccggggc tcgcagttcg ccatcgactc 900

ctccaagaag ttcaccgtca ccacgcagtt cctgaccgac aacggcaagg aggacggcgt 960

cctcgtcgag atccgccgct tgtggcacca ggatggcaag ctgatcaaga acaccgctat 1020

ccaggttgag gagaactaca gcacggactc ggtgagcacc gagttctgcg agaagactgc 1080

ttctttcacc atgcagcgcg gtggtctcaa ggcgatgggc gaggctatcg gtcgtggtat 1140

ggtgctggtt ttcagcatct gggcggatga ttcgggtttt atgaactggt tggatgcgga 1200

gggtaatggc ccttgcagcg cgactgaggg cgatccgaag gagattgtca agaataagcc 1260

ggatgctagg gttacgttct caaacattag gattggtgag gttggtagca cgtatgctcc 1320

gggtgggaag tgcggtgtta agagcagggt tgctaggggg cttactgctt cttaaggggg 1380

gtgtgaagag aggaggaggt gttgttgggg gttggagatg ataattgggc gagatggtgt 1440

agagcgggtt ggttggatat gaatacgttg aattggatgt 1480

<210>20

<211>440

<212>PRT

<213>Cladorrhinum foecundissimum

<400>20

Met Val His Lys Phe Ala Leu Leu Thr Gly Leu Ala Ala Ser Leu Ala

1 5 10 15

Ser Ala Gln Gln Ile Gly Thr Val Val Pro Glu Ser His Pro Lys Leu

20 25 30

Pro Thr Lys Arg Cys Thr Leu Ala Gly Gly Cys Gln Thr Val Asp Thr

35 40 45

Ser Ile Val Ile Asp Ala Phe Gln Arg Pro Leu His Lys Ile Gly Asp

50 55 60

Pro Ser Thr Pro Cys Val Val Gly Gly Pro Leu Cys Pro Asp Ala Lys

65 70 75 80

Ser Cys Ala Glu Asn Cys Ala Leu Glu Gly Val Asp Tyr Ala Ser Trp

85 90 95

Gly Ile Lys Thr Glu Gly Asp Ala Leu Thr Leu Asn Gln Trp Met Pro

100 105 110

Asp Pro Ala Asn Pro Gly Gln Tyr Lys Thr Thr Thr Pro Arg Thr Tyr

115 120 125

Leu Val Ala Glu Asp Gly Lys Asn Tyr Glu Asp Val Lys Leu Leu Ala

130 135 140

Lys Glu Ile Ser Phe Asp Ala Asp Val Ser Asn Leu Pro Cys Gly Met

145 150 155 160

Asn Gly Ala Phe Tyr Leu Ser Glu Met Leu Met Asp Gly Gly Arg Gly

165 170 175

Asp Leu Asn Pro Ala Gly Ala Glu Tyr Gly Thr Gly Tyr Cys Asp Ala

180 185 190

Gln Cys Phe Lys Leu Asp Phe Ile Asn Gly Glu Ala Asn Ile Asp Gln

195 200 205

Lys His Gly Ala Cys Cys Asn Glu Met Asp Ile Phe Glu Ser Asn Ser

210 215 220

Arg Ala Lys Thr Phe Val Pro His Pro Cys Asn Ile Thr Gln Val Tyr

225 230 235 240

Lys Cys Glu Gly Glu Asp Glu Cys Gly Gln Pro Val GLy Val Cys Asp

245 250 255

Lys Trp Gly Cys Gly Phe Asn Glu Tyr Lys Trp Gly Val Glu Ser Phe

260 265 270

Tyr Gly Arg Gly Ser Gln Phe Ala Ile Asp Ser Ser Lys Lys Phe Thr

275 280 285

Val Thr Thr Gln Phe Leu Thr Asp Asn Gly Lys Glu Asp Gly Val Leu

290 295 300

Val Glu Ile Arg Arg Leu Trp His Gln Asp Gly Lys Leu Ile Lys Asn

305 310 315 320

Thr Ala Ile Gln Val Glu Glu Asn Tyr Ser Thr Asp Ser Val Ser Thr

325 330 335

Glu Phe Cys Glu Lys Thr Ala Ser Phe Thr Met Gln Arg Gly Gly Leu

340 345 350

Lys Ala Met Gly Gl u Ala Ile Gly Arg Gly Met ValLeu Val Phe Ser

355 360 365

Ile Trp Ala Asp Asp Ser Gly Phe Met Asn Trp Leu Asp Ala Glu Gly

370 375 380

Asn Gly Pro Cys Ser Ala Thr Glu Gly Asp Pro Lys Glu Ile Val Lys

385 390 395 400

Asn Lys Pro Asp Ala Arg Val Thr Phe Ser Asn Ile Arg Ile Gly Glu

405 410 415

Val Gly Ser Thr Tyr Ala Pro Gly Gly Lys Cys Gly Val Lys Ser Arg

420 425 430

Val Ala Arg Gly Leu Thr Ala Ser

435 440

<210>21

<211>1380

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>21

atggcgccct cagttacact gccgttgacc acggccatcc tggccattgc ccggctcgtc 60

gccgcccagc aaccgggtac cagcaccccc gaggtccatc ccaagttgac aacctacaag 120

tgtacaaagt ccggggggtg cgtggcccag gacacctcgg tggtccttga ctggaactac 180

cgctggatgc acgacgcaaa ctacaactcg tgcaccgtca acggcggcgt caacaccacg 240

ctctgccctg acgaggcgac ctgtggcaag aactgcttca tcgagggcgt cgactacgcc 300

gcctcgggcg tcacgacctc gggcagcagc ctcaccatga accagtacat gcccagcagc 360

tctggcggct acagcagcgt ctctcctcgg ctgtatctcc tggactctga cggtgagtac 420

gtgatgctga agctcaacgg ccaggagctg agcttcgacg tcgacctctc tgctctgccg 480

tgtggagaga acggctcgct ctacctgtct cagatggacg agaacggggg cgccaaccag 540

tataacacgg ccggtgccaa ctacgggagc ggctactgcg atgctcagtg ccccgtccag 600

acatggagga acggcaccct caacactagc caccagggct tctgctgcaa cgagatggat 660

atcctggagg gcaactcgag ggcgaatgcc ttgacccctc actcttgcac ggccacggcc 720

tgcgactctg ccggttgcgg cttcaacccc tatggcagcg gctacaaaag ctactacggc 780

cccggagata ccgttgacac ctccaagacc ttcaccatca tcacccagtt caacacggac 840

aacggctcgc cctcgggcaa ccttgtgagc atcacccgca agtaccagca aaacggcgtc 900

gacatcccca gcgcccagcc cggcggcgac accatctcgt cctgcccgtc cgcctcagcc 960

tacggcggcc tcgccaccat gggcaaggcc ctgagcagcg gcatggtgct cgtgttcagc 1020

atttggaacg acaacagcca gtacatgaac tggctcgaca gcggcaacgc cggcccctgc 1080

agcagcaccg agggcaaccc atccaacatc ctggccaaca accccaacac gcacgtcgtc 1140

ttctccaaca tccgctgggg agacattggg tctactacga actcgactgc gcccccgccc 1200

ccgcctgcgt ccagcacgac gttttcgact acacggagga gctcgacgac ttcgagcagc 1260

ccgagctgca cgcagactca ctgggggcag tgcggtggca ttgggtacag cgggtgcaag 1320

acgtgcacgt cgggcactac gtgccagtat agcaacgact actactcgca atgcctttag 1380

<210>22

<211>459

<212>PRT

<213>里氏木霉(Trichoderma reesei)

<400>22

Met Ala Pro Ser Val Thr Leu Pro Leu Thr Thr Ala Ile Leu Ala Ile

1 5 10 15

Ala Arg Leu Val Ala Ala Gln Gln Pro Gly Thr Ser Thr Pro Glu Val

20 25 30

His Pro Lys Leu Thr Thr Tyr Lys Cys Thr Lys Ser Gly Gly Cys Val

35 40 45

Ala Gln Asp Thr Ser Val Val Leu Asp Trp Asn Tyr Arg Trp Met His

50 55 60

Asp Ala Asn Tyr Asn Ser Cys Thr Val Asn Gly Gly Val Asn Thr Thr

65 70 75 80

Leu Cys Pro Asp Glu Ala Thr Cys Gly Lys Asn Cys Phe Ile Glu Gly

85 90 95

Val Asp Tyr Ala Ala Ser Gly Val Thr Thr Ser Gly Ser Ser Leu Thr

100 105 110

Met Asn Gln Tyr Met Pro Ser Ser Ser Gly Gly Tyr Ser Ser Val Ser

115 120 125

Pro Arg Leu Tyr Leu Leu Asp Ser Asp Gly Glu Tyr Val Met Leu Lys

130 135 140

Leu Asn Gly Gln Glu Leu Ser Phe Asp Val Asp Leu Ser Ala Leu Pro

145 150 155 160

Cys Gly Glu Asn Gly Ser Leu Tyr Leu Ser Gln Met Asp Glu Asn Gly

165 170 175

Gly Ala Asn Gln Tyr Asn Thr Ala Gly Ala Asn Tyr Gly Ser Gly Tyr

180 185 190

Cys Asp Ala Gln Cys Pro Val Gln Thr Trp Arg Asn Gly Thr Leu Asn

195 200 205

Thr Ser His Gln Gly Phe Cys Cys Asn Glu Met Asp Ile Leu Glu Gly

210 215 220

Asn Ser Arg Ala Asn Ala Leu Thr Pro His Ser Cys Thr Ala Thr Ala

225 230 235 240

Cys Asp Ser Ala Gly Cys Gly Phe Asn Pro Tyr Gly Ser Gly Tyr Lys

245 250 255

Ser Tyr Tyr Gly Pro Gly Asp Thr Val Asp Thr Ser Lys Thr Phe Thr

260 265 270

Ile Ile Thr Gln Phe Asn Thr Asp Asn Gly Ser Pro Ser Gly Asn Leu

275 280 285

Val Ser Ile Thr Arg Lys Tyr Gln Gln Asn Gly Val Asp Ile Pro Ser

290 295 300

Ala Gln Pro Gly Gly Asp Thr Ile Ser Ser Cys Pro Ser Ala Ser Ala

305 310 315 320

Tyr Gly Gly Leu Ala Thr Met Gly Lys Ala Leu Ser Ser Gly Met Val

325 330 335

Leu Val Phe Ser Ile Trp Asn Asp Asn Ser Gln Tyr Met Asn Trp Leu

340 345 350

Asp Ser Gly Asn Ala Gly Pro Cys Ser Ser Thr Glu Gly Asn Pro Ser

355 360 365

Asn Ile Leu Ala Asn Asn Pro Asn Thr His Val Val Phe Ser Asn Ile

370 375 380

Arg Trp Gly Asp Ile Gly Ser Thr Thr Asn Ser Thr Ala Pro Pro Pro

385 390 395 400

Pro Pro Ala Ser Ser Thr Thr Phe Ser Thr Thr Arg Arg Ser Ser Thr

405 410 415

Thr Ser Ser Ser Pro Ser Cys Thr Gln Thr His Trp Gly Gln Cys Gly

420 425 430

Gly Ile Gly Tyr Ser Gly Cys Lys Thr Cys Thr Ser Gly Thr Thr Cys

435 440 445

Gln Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu

450 455

<210>23

<211>2586

<212>DNA

<213>米曲霉(Aspergillus oryzae)

<400>23

atgaagcttg gttggatcga ggtggccgca ttggcggctg cctcagtagt cagtgccaag 60

gatgatctcg cgtactcccc tcctttctac ccttccccat gggcagatgg tcagggtgaa 120

tgggcggaag tatacaaacg cgctgtagac atagtttccc agatgacgtt gacagagaaa 180

gtcaacttaa cgactggaac aggatggcaa ctagagaggt gtgttggaca aactggcagt 240

gttcccagac tcaacatccc cagcttgtgt ttgcaggata gtcctcttgg tattcgtttc 300

tcggactaca attcagcttt ccctgcgggt gttaatgtcg ctgccacctg ggacaagacg 360

ctcgcctacc ttcgtggtca ggcaatgggt gaggagttca gtgataaggg tattgacgtt 420

cagctgggtc ctgctgctgg ccctctcggt gctcatccgg atggcggtag aaactgggaa 480

ggtttctcac cagatccagc cctcaccggt gtactttttg cggagacgat taagggtatt 540

caagatgctg gtgtcattgc gacagctaag cattatatca tgaacgaaca agagcatttc 600

cgccaacaac ccgaggctgc gggttacgga ttcaacgtaa gcgacagttt gagttccaac 660

gttgatgaca agactatgca tgaattgtac ctctggccct tcgcggatgc agtacgcgct 720

ggagtcggtg ctgtcatgtg ctcttacaac caaatcaaca acagctacgg ttgcgagaat 780

agcgaaactc tgaacaagct tttgaaggcg gagcttggtt tccaaggctt cgtcatgagt 840

gattggaccg ctcatcacag cggcgtaggc gctgctttag caggtctgga tatgtcgatg 900

cccggtgatg ttaccttcga tagtggtacg tctttctggg gtgcaaactt gacggtcggt 960

gtccttaacg gtacaatccc ccaatggcgt gttgatgaca tggctgtccg tatcatggcc 1020

gcttattaca aggttggccg cgacaccaaa tacacccctc ccaacttcag ctcgtggacc 1080

agggacgaat atggtttcgc gcataaccat gtttcggaag gtgcttacga gagggtcaac 1140

gaattcgtgg acgtgcaacg cgatcatgcc gacctaatcc gtcgcatcgg cgcgcagagc 1200

actgttctgc tgaagaacaa gggtgccttg cccttgagcc gcaaggaaaa gctggtcgcc 1260

cttctgggag aggatgcggg ttccaactcg tggggcgcta acggctgtga tgaccgtggt 1320

tgcgataacg gtacccttgc catggcctgg ggtagcggta ctgcgaattt cccatacctc 1380

gtgacaccag agcaggcgat tcagaacgaa gttcttcagg gccgtggtaa tgtcttcgcc 1440

gtgaccgaca gttgggcgct cgacaagatc gctgcggctg cccgccaggc cagcgtatct 1500

ctcgtgttcg tcaactccga ctcaggagaa ggctatctta gtgtggatgg aaatgagggc 1560

gatcgtaaca acatcactct gtggaagaac ggcgacaatg tggtcaagac cgcagcgaat 1620

aactgtaaca acaccgttgt catcatccac tccgtcggac cagttttgat cgatgaatgg 1680

tatgaccacc ccaatgtcac tggtattctc tgggctggtc tgccaggcca ggagtctggt 1740

aactccattg ccgatgtgct gtacggtcgt gtcaaccctg gcgccaagtc tcctttcact 1800

tggggcaaga cccgggagtc gtatggttct cccttggtca aggatgccaa caatggcaac 1860

ggagcgcccc agtctgattt cacccagggt gttttcatcg attaccgcca tttcgataag 1920

ttcaatgaga cccctatcta cgagtttggc tacggcttga gctacaccac cttcgagctc 1980

tccgacctcc atgttcagcc cctgaacgcg tcccgataca ctcccaccag tggcatgact 2040

gaagctgcaa agaactttgg tgaaattggc gatgcgtcgg agtacgtgta tccggagggg 2100

ctggaaagga tccatgagtt tatctatccc tggatcaact ctaccgacct gaaggcatcg 2160

tctgacgatt ctaactacgg ctgggaagac tccaagtata ttcccgaagg cgccacggat 2220

gggtctgccc agccccgttt gcccgctagt ggtggtgccg gaggaaaccc cggtctgtac 2280

gaggatcttt tccgcgtctc tgtgaaggtc aagaacacgg gcaatgtcgc cggtgatgaa 2340

gttcctcagc tgtacgtttc cctaggcggc ccgaatgagc ccaaggtggt actgcgcaag 2400

tttgagcgta ttcacttggc cccttcgcag gaggccgtgt ggacaacgac ccttacccgt 2460

cgtgaccttg caaactggga cgtttcggct caggactgga ccgtcactcc ttaccccaag 2520

acgatctacg ttggaaactc ctcacggaaa ctgccgctcc aggcctcgct gcctaaggcc 2580

cagtaa 2586

<210>24

<211>861

<212>PRT

<213>米曲霉(Aspergillus oryzae)

<400>24

Met Lys Leu Gly Trp Ile Glu Val Ala Ala Leu Ala Ala Ala Ser Val

1 5 10 15

Val Ser Ala Lys Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser

20 25 30

Pro Trp Ala Asp Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala

35 40 45

Val Asp Ile Val Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr

50 55 60

Thr Gly Thr Gly Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser

65 70 75 80

Val Pro Arg Leu Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu

85 90 95

Gly Ile Arg Phe Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn

100 105 110

Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala

115 120 125

Met Gly Glu Glu Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro

130 135 140

Ala Ala Gly Pro Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu

145 150 155 160

Gly Phe Ser Pro Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr

165 170 175

Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr

180 185 190

Ile Met Asn Glu Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly

195 200 205

Tyr Gly Phe Asn Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys

210 215 220

Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala

225 230 235 240

Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr

245 250 255

Gly Cys Glu Asn Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu

260 265 270

Gly Phe Gln Gly Phe Val Met Ser Asp Trp Thr Ala His His Ser Gly

275 280 285

Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val

290 295 300

Thr Phe Asp Ser Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly

305 310 315 320

Val Leu Asn Gly Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val

325 330 335

Arg Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr

340 345 350

Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His

355 360 365

Asn His Val Ser Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp

370 375 380

Val Gln Arg Asp His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser

385 390 395 400

Thr Val Leu Leu Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu

405 410 415

Lys Leu Val Ala Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly

420 425 430

Ala Asn Gly Cys Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met

435 440 445

Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu

450 455 460

Gln Ala Ile Gln Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala

465 470 475 480

Val Thr Asp Ser Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln

485 490 495

Ala Ser Val Ser Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr

500 505 510

Leu Ser Val Asp Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp

515 520 525

Lys Asn Gly Asp Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn

530 535 540

Thr Val Val Ile Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp

545 550 555 560

Tyr Asp His Pro Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly

565 570 575

Gln Glu Ser Gly Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn

580 585 590

Pro Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr

595 600 605

Gly Ser Pro Leu Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln

610 615 620

Ser Asp Phe Thr Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys

625 630 635 640

Phe Asn Glu Thr Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr

645 650 655

Thr Phe Glu Leu Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg

660 665 670

Tyr Thr Pro Thr Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu

675 680 685

Ile Gly Asp Ala Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile

690 695 700

His Glu Phe Ile Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser

705 710 715 720

Ser Asp Asp Ser Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu

725 730 735

Gly Ala Thr Asp Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly

740 745 750

Ala Gly Gly Asn Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val

755 760 765

Lys Val Lys Asn Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu

770 775 780

Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys

785 790 795 800

Phe Glu Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr

805 810 815

Thr Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp

820 825 830

Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser Ser

835 840 845

Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln

850 855 860

<210>25

<211>2586

<212>DNA

<213>米曲霉(Aspergillus oryzae)

<400>25

atgaagcttg gttggatcga ggtggccgca ttggcggctg cctcagtagt cagtgccaag 60

gatgatctcg cgtactcccc tcctttctac ccttccccat gggcagatgg tcagggtgaa 120

tgggcggaag tatacaaacg cgctgtagac atagtttccc agatgacgtt gacagagaaa 180

gtcaacttaa cgactggaac aggatggcaa ctagagaggt gtgttggaca aactggcagt 240

gttcccagac tcaacatccc cagcttgtgt ttgcaggata gtcctcttgg tattcgtttc 300

tcggactaca attcagcttt ccctgcgggt gttaatgtcg ctgccacctg ggacaagacg 360

ctcgcctacc ttcgtggtca ggcaatgggt gaggagttca gtgataaggg tattgacgtt 420

cagctgggtc ctgctgctgg ccctctcggt gctcatccgg atggcggtag aaactgggaa 480

agtttctcac cagatccagc cctcaccggt gtactttttg cggagacgat taagggtatt 540

caagatgctg gtgtcattgc gacagctaag cattatatca tgaacgaaca agagcatttc 600

cgccaacaac ccgaggctgc gggttacgga ttcaacgtaa gcgacagttt gagttccaac 660

gttgatgaca agactatgca tgaattgtac ctctggccct tcgcggatgc agtacgcgct 720

ggagtcggtg ctgttatgtg ctcttacaac caaatcaaca acagctacgg ttgcgagaat 780

agcgaaactc tgaacaagct tttgaaggcg gagcttggtt tccaaggctt cgtcatgagt 840

gattggaccg ctcaacacag cggcgtaggc gctgctttag caggtctgga tatgtcgatg 900

cccggtgatg ttaccttcga tagtggtacg tctttctggg gtgcaaactt gacggtcggt 960

gtccttaacg gtacaatccc ccaatggcgt gttgatgaca tggctgtccg tatcatggcc 1020

gcttattaca aggttggccg cgacaccaaa tacacccctc ccaacttcag ctcgtggacc 1080

agggacgaat atggtttcgc gcataaccat gtttcggaag gtgcttacga gagggtcaac 1140

gaattcgtgg acgtgcaacg cgatcatgcc gacctaatcc gtcgcatcgg cgcgcagagc 1200

actgttctgc tgaagaacaa gggtgccttg cccttgagcc gcaaggaaaa gctggtcgcc 1260

cttctgggag aggatgcggg ttccaactcg tggggcgcta acggctgtga tgaccgtggt 1320

tgcgataacg gtacccttgc catggcctgg ggtagcggta ctgcgaattt cccatacctc 1380

gtgacaccag agcaggcgat tcagaacgaa gttcttcagg gccgtggtaa tgtcttcgcc 1440

gtgaccgaca gttgggcgct cgacaagatc gctgcggctg cccgccaggc cagcgtatct 1500

ctcgtgttcg tcaactccga ctcaggagaa ggctatctta gtgtggatgg aaatgagggc 1560

gatcgtaaca acatcactct gtggaagaac ggcgacaatg tggtcaagac cgcagcgaat 1620

aactgtaaca acaccgttgt catcatccac tccgtcggac cagttttgat cgatgaatgg 1680

tatgaccacc ccaatgtcac tggtattctc tgggctggtc tgccaggcca ggagtctggt 1740

aactccattg ccgatgtgct gtacggtcgt gtcaaccctg gcgccaagtc tcctttcact 1800

tggggcaaga cccgggagtc gtatggttct cccttggtca aggatgccaa caatggcaac 1860

ggagcgcccc agtctgattt cacccagggt gttttcatcg attaccgcca tttcgataag 1920

ttcaatgaga cccctatcta cgagtttggc tacggcttga gctacaccac cttcgagctc 1980

tccgacctcc atgttcagcc cctgaacgcg tcccgataca ctcccaccag tggcatgact 2040

gaagctgcaa agaactttgg tgaaattggc gatgcgtcgg agtacgtgta tccggagggg 2100

ctggaaagga tccatgagtt tatctatccc tggatcaact ctaccgacct gaaggcatcg 2160

tctgacgatt ctaactacgg ctgggaagac tccaagtata ttcccgaagg cgccacggat 2220

gggtctgccc agccccgttt gcccgctagt ggtggtgccg gaggaaaccc cggtctgtac 2280

gaggatcttt tccgcgtctc tgtgaaggtc aagaacacgg gcaatgtcgc cggtgatgaa 2340

gttcctcagc tgtacgtttc cctaggcggc ccgaatgagc ccaaggtggt actgcgcaag 2400

tttgagcgta ttcacttggc cccttcgcag gaggccgtgt ggacaacgac ccttacccgt 2460

cgtgaccttg caaactggga cgtttcggct caggactgga ccgtcactcc ttaccccaag 2520

acgatctacg ttggaaactc ctcacggaaa ctgccgctcc aggcctcgct gcctaaggcc 2580

cagtaa 2586

<210>26

<211>861

<212>PRT

<213>米曲霉(Aspergillus oryzae)

<400>26

Met Lys Leu Gly Trp Ile Glu Val Ala Ala Leu Ala Ala Ala Ser Val

1 5 10 15

Val Ser Ala Lys Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser

20 25 30

Pro Trp Ala Asp Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala

35 40 45

Val Asp Ile Val Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr

50 55 60

Thr Gly Thr Gly Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser

65 70 75 80

Val Pro Arg Leu Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu

85 90 95

Gly Ile Arg Phe Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn

100 105 110

Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala

115 120 125

Met Gly Glu Glu Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro

130 135 140

Ala Ala Gly Pro Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu

145 150 155 160

Ser Phe Ser Pro Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr

165 170 175

Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr

180 185 190

Ile Met Asn Glu Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly

195 200 205

Tyr Gly Phe Asn Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys

210 215 220

Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala

225 230 235 240

Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr

245 250 255

Gly Cys Glu Asn Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu

260 265 270

Gly Phe Gln Gly Phe Val Met Ser Asp Trp Thr Ala Gln His Ser Gly

275 280 285

Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val

290 295 300

Thr Phe Asp Ser Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly

305 310 315 320

Val Leu Asn Gly Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val

325 330 335

Arg Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr

340 345 350

Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His

355 360 365

Asn His Val Ser Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp

370 375 380

Val Gln Arg Asp His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser

385 390 395 400

Thr Val Leu Leu Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu

405 410 415

Lys Leu Val Ala Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly

420 425 430

Ala Asn Gly Cys Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met

435 440 445

Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu

450 455 460

Gln Ala Ile Gln Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala

465 470 475 480

Val Thr Asp Ser Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln

485 490 495

Ala Ser Val Ser Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr

500 505 510

Leu Ser Val Asp Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp

515 520 525

Lys Asn Gly Asp Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn

530 535 540

Thr Val Val Ile Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp

545 550 555 560

Tyr Asp His Pro Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly

565 570 575

Gln Glu Ser Gly Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn

580 585 590

Pro Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr

595 600 605

Gly Ser Pro Leu Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln

610 615 620

Ser Asp Phe Thr Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys

525 630 635 640

Phe Asn Glu Thr Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr

645 650 655

Thr Phe Glu Leu Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg

660 665 670

Tyr Thr Pro Thr Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu

675 680 685

Ile Gly Asp Ala Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile

690 695 700

His Glu Phe Ile Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser

705 710 715 720

Ser Asp Asp Ser Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu

725 730 735

Gly Ala Thr Asp Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly

740 745 750

Ala Gly Gly Asn Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val

755 760 765

Lys Val Lys Asn Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu

770 775 780

Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys

785 790 795 800

Phe Glu Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr

805 810 815

Thr Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp

820 825 830

Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Set Ser

835 840 845

Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln

850 855 860

<210>27

<211>3060

<212>DNA

<213>烟曲霉(Aspergillus fumigatus)

<400>27

atgagattcg gttggctcga ggtggccgct ctgacggccg cttctgtagc caatgcccag 60

gtttgtgatg ctttcccgtc attgtttcgg atatagttga caatagtcat ggaaataatc 120

aggaattggc tttctctcca ccattctacc cttcgccttg ggctgatggc cagggagagt 180

gggcagatgc ccatcgacgc gccgtcgaga tcgtttctca gatgacactg gcggagaagg 240

ttaaccttac aacgggtact gggtgggttg cgactttttt gttgacagtg agctttcttc 300

actgaccatc tacacagatg ggaaatggac cgatgcgtcg gtcaaaccgg cagcgttccc 360

aggtaagctt gcaattctgc aacaacgtgc aagtgtagtt gctaaaacgc ggtggtgcag 420

acttggtatc aactggggtc tttgtggcca ggattcccct ttgggtatcc gtttctgtga 480

gctatacccg cggagtcttt cagtccttgt attatgtgct gatgattgtc tctgtatagc 540

tgacctcaac tccgccttcc ctgctggtac taatgtcgcc gcgacatggg acaagacact 600

cgcctacctt cgtggcaagg ccatgggtga ggaattcaac gacaagggcg tggacatttt 660

gctggggcct gctgctggtc ctctcggcaa atacccggac ggcggcagaa tctgggaagg 720

cttctctcct gatccggttc tcactggtgt acttttcgcc gaaactatca agggtatcca 780

agacgcgggt gtgattgcta ctgccaagca ttacattctg aatgaacagg agcatttccg 840

acaggttggc gaggcccagg gatatggtta caacatcacg gagacgatca gctccaacgt 900

ggatgacaag accatgcacg agttgtacct ttggtgagta gttgacactg caaatgagga 960

ccttgattga tttgactgac ctggaatgca ggccctttgc agatgctgtg cgcggtaaga 1020

ttttccgtag acttgacctc gcgacgaaga aatcgctgac gaaccatcgt agctggcgtt 1080

ggcgctgtca tgtgttccta caatcaaatc aacaacagct acggttgtca aaacagtcaa 1140

actctcaaca agctcctcaa ggctgagctg ggcttccaag gcttcgtcat gagtgactgg 1200

agcgctcacc acagcggtgt cggcgctgcc ctcgctgggt tggatatgtc gatgcctgga 1260

gacatttcct tcgacgacgg actctccttc tggggcacga acctaactgt cagtgttctt 1320

aacggcaccg ttccagcctg gcgtgtcgat gacatggctg ttcgtatcat gaccgcgtac 1380

tacaaggttg gtcgtgaccg tcttcgtatt ccccctaact tcagctcctg gacccgggat 1440

gagtacggct gggagcattc tgctgtctcc gagggagcct ggaccaaggt gaacgacttc 1500

gtcaatgtgc agcgcagtca ctctcagatc atccgtgaga ttggtgccgc tagtacagtg 1560

ctcttgaaga acacgggtgc tcttcctttg accggcaagg aggttaaagt gggtgttctc 1620

ggtgaagacg ctggttccaa cccgtggggt gctaacggct gccccgaccg cggctgtgat 1680

aacggcactc ttgctatggc ctggggtagt ggtactgcca acttccctta ccttgtcacc 1740

cccgagcagg ctatccagcg agaggtcatc agcaacggcg gcaatgtctt tgctgtgact 1800

gataacgggg ctctcagcca gatggcagat gttgcatctc aatccaggtg agtgcgggct 1860

cttagaaaaa gaacgttctc tgaatgaagt tttttaacca ttgcgaacag cgtgtctttg 1920

gtgtttgtca acgccgactc tggagagggt ttcatcagtg tcgacggcaa cgagggtgac 1980

cgcaaaaatc tcactctgtg gaagaacggc gaggccgtca ttgacactgt tgtcagccac 2040

tgcaacaaca cgattgtggt tattcacagt gttgggcccg tcttgatcga ccggtggtat 2100

gataacccca acgtcactgc catcatctgg gccggcttgc ccggtcagga gagtggcaac 2160

tccctggtcg acgtgctcta tggccgcgtc aaccccagcg ccaagacccc gttcacctgg 2220

ggcaagactc gggagtctta cggggctccc ttgctcaccg agcctaacaa tggcaatggt 2280

gctccccagg atgatttcaa cgagggcgtc ttcattgact accgtcactt tgacaagcgc 2340

aatgagaccc ccatttatga gtttggccat ggcttgagct acaccacctt tggttactct 2400

caccttcggg ttcaggccct caatagttcg agttcggcat atgtcccgac tagcggagag 2460

accaagcctg cgccaaccta tggtgagatc ggtagtgccg ccgactacct gtatcccgag 2520

ggtctcaaaa gaattaccaa gtttatttac ccttggctca actcgaccga cctcgaggat 2580

tcttctgacg acccgaacta cggctgggag gactcggagt acattcccga aggcgctagg 2640

gatgggtctc ctcaacccct cctgaaggct ggcggcgctc ctggtggtaa ccctaccctt 2700

tatcaggatc ttgttagggt gtcggccacc ataaccaaca ctggtaacgt cgccggttat 2760

gaagtccctc aattggtgag tgacccgcat gttccttgcg ttgcaatttg gctaactcgc 2820

ttctagtatg tttcactggg cggaccgaac gagcctcggg tcgttctgcg caagttcgac 2880

cgaatcttcc tggctcctgg ggagcaaaag gtttggacca cgactcttaa ccgtcgtgat 2940

ctcgccaatt gggatgtgga ggctcaggac tgggtcatca caaagtaccc caagaaagtg 3000

cacgtcggca gctcctcgcg taagctgcct ctgagagcgc ctctgccccg tgtctactag 3060

<210>28

<211>863

<212>PRT

<213>烟曲霉(Aspergillus fumigatus)

<400>28

Met Arg Phe Gly Trp Leu Glu Val Ala Ala Leu Thr Ala Ala Ser Val

1 5 10 15

Ala Asn Ala Gln Glu Leu Ala Phe Ser Pro Pro Phe Tyr Pro Ser Pro

20 25 30

Trp Ala Asp Gly Gln Gly Glu Trp Ala Asp Ala His Arg Arg Ala Val

35 40 45

Glu Ile Val Ser Gln Met Thr Leu Ala Glu Lys Val Asn Leu Thr Thr

50 55 60

Gly Thr Gly Trp Glu Met Asp Arg Cys Val Gly Gln Thr Gly Ser Val

65 70 75 80

Pro Arg Leu Gly Ile Asn Trp Gly Leu Cys Gly Gln Asp Ser Pro Leu

85 90 95

Gly Ile Arg Phe Ser Asp Leu Asn Ser Ala Phe Pro Ala Gly Thr Asn

100 105 110

Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Lys Ala

115 120 125

Met Gly Glu Glu Phe Asn Asp Lys Gly Val Asp Ile Leu Leu Gly Pro

130 135 140

Ala Ala Gly Pro Leu Gly Lys Tyr Pro Asp Gly Gly Arg Ile Trp Glu

145 150 155 160

Gly Phe Ser Pro Asp Pro Val Leu Thr Gly Val Leu Phe Ala Glu Thr

165 170 175

Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr

180 185 190

Ile Leu Asn Glu Gln Glu His Phe Arg Gln Val Gly Glu Ala Gln Gly

195 200 205

Tyr Gly Tyr Asn Ile Thr Glu Thr Ile Ser Ser Asn Val Asp Asp Lys

210 215 220

Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala

225 230 235 240

Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr

245 250 255

Gly Cys Gln Asn Ser Gln Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu

260 265 270

Gly Phe Gln Gly Phe Val Met Ser Asp Trp Ser Ala His His Ser Gly

275 280 285

Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Ile

290 295 300

Ser Phe Asp Asp Gly Leu Ser Phe Trp Gly Thr Asn Leu Thr Val Ser

305 310 315 320

Val Leu Asn Gly Thr Val Pro Ala Trp Arg Val Asp Asp Met AIa Val

325 330 335

Arg Ile Met Thr Ala Tyr Tyr Lys Val Gly Arg Asp Arg Leu Arg Ile

340 345 350

Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Trp Glu His

355 360 365

Ser Ala Val Ser Glu Gly Ala Trp Thr Lys Val Asn Asp Phe Val Asn

370 375 380

Val Gln Arg Ser His Ser Gln Ile Ile Arg Glu Ile Gly Ala Ala Ser

385 390 395 400

Thr Val Leu Leu Lys Asn Thr Gly Ala Leu Pro Leu Thr Gly Lys Glu

405 410 415

Val Lys Val Gly Val Leu Gly Glu Asp Ala Gly Ser Asn Pro Trp Gly

420 425 430

Ala Asn Gly Cys Pro Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met

435 440 445

Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu

450 455 460

Gln Ala Ile Gln Arg Glu Val Ile Ser Asn Gly Gly Asn Val Phe Ala

465 470 475 480

Val Thr Asp Asn Gly Ala Leu Ser Gln Met Ala Asp Val Ala Ser Gln

485 490 495

Ser Ser Val Ser Leu Val Phe Val Asn Ala Asp Ser Gly Glu Gly Phe

500 505 510

Ile Ser Val Asp Gly Asn Glu Gly Asp Arg Lys Asn Leu Thr Leu Trp

515 520 525

Lys Asn Gly Glu Ala Val Ile Asp Thr Val Val Ser His Cys Asn Asn

530 535 540

Thr Ile Val Val Ile His Ser Val Gly Pro Val Leu Ile Asp Arg Trp

545 550 555 560

Tyr Asp Asn Pro Asn Val Thr Ala Ile Ile Trp Ala Gly Leu Pro Gly

565 570 575

Gln Glu Ser Gly Asn Ser Leu Val Asp Val Leu Tyr Gly Arg Val Asn

580 585 590

Pro Ser Ala Lys Thr Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr

595 600 605

Gly Ala Pro Leu Leu Thr Glu Pro Asn Asn Gly Asn Gly Ala Pro Gln

610 615 620

Asp Asp Phe Asn Glu Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys

625 630 635 640

Arg Asn Glu Thr Pro Ile Tyr Glu Phe Gly His Gly Leu Ser Tyr Thr

645 650 655

Thr Phe Gly Tyr Ser His Leu Arg Val Gln Ala Leu Asn Ser Ser Ser

660 665 670

Ser Ala Tyr Val Pro Thr Ser Gly Glu Thr Lys Pro Ala Pro Thr Tyr

675 680 685

Gly Glu Ile Gly Ser Ala Ala Asp Tyr Leu Tyr Pro Glu Gly Leu Lys

690 695 700

Arg Ile Thr Lys Phe Ile Tyr Pro Trp Leu Asn Ser Thr Asp Leu Glu

705 710 715 720

Asp Ser Ser Asp Asp Pro Asn Tyr Gly Trp Glu Asp Ser Glu Tyr Ile

725 730 735

Pro Glu Gly Ala Arg Asp Gly Ser Pro Gln Pro Leu Leu Lys Ala Gly

740 745 750

Gly Ala Pro Gly Gly Asn Pro Thr Leu Tyr Gln Asp Leu Val Arg Val

755 760 765

Ser Ala Thr Ile Thr Asn Thr Gly Asn Val Ala Gly Tyr Glu Val Pro

770 775 780

Gln Leu Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Arg Val Val Leu

785 790 795 800

Arg Lys Phe Asp Arg Ile Phe Leu Ala Pro Gly Glu Gln Lys Val Trp

805 810 815

Thr Thr Thr Leu Asn Arg Arg Asp Leu Ala Asn Trp Asp Val Glu Ala

820 825 830

Gln Asp Trp Val Ile Thr Lys Tyr Pro Lys Lys Val His Val Gly Ser

835 840 845

Ser Ser Arg Lys Leu Pro Leu Arg Ala Pro Leu Pro Arg Val Tyr

850 855 860

<210>29

<211>2800

<212>DNA

<213>巴西青霉(Penicillium brasilianum)

<400>29

tgaaaatgca gggttctaca atctttctgg ctttcgcctc atgggcgagc caggttgctg 60

ccattgcgca gcccatacag aagcacgagg tttgttttat cttgctcatg gacgtgcttt 120

gacttgacta attgttttac atacagcccg gatttctgca cgggccccaa gccatagaat 180

cgttctcaga accgttctac ccgtcgccct ggatgaatcc tcacgccgag ggctgggagg 240

ccgcatatca gaaagctcaa gattttgtct cgcaactcac tatcttggag aaaataaatc 300

tgaccaccgg tgttgggtaa gtctctccga ctgcttctgg gtcacggtgc gacgagccac 360

tgactttttg aagctgggaa aatgggccgt gtgtaggaaa cactggatca attcctcgtc 420

tcggattcaa aggattttgt acccaggatt caccacaggg tgttcggttc gcagattatt 480

cctccgcttt cacatctagc caaatggccg ccgcaacatt tgaccgctca attctttatc 540

aacgaggcca agccatggca caggaacaca aggctaaggg tatcacaatt caattgggcc 600

ctgttgccgg ccctctcggt cgcatccccg agggcggccg caactgggaa ggattctccc 660

ctgatcctgt cttgactggt atagccatgg ctgagacaat taagggcatg caggatactg 720

gagtgattgc ttgcgctaaa cattatattg gaaacgagca ggagcacttc cgtcaagtgg 780

gtgaagctgc gggtcacgga tacactattt ccgatactat ttcatctaat attgacgacc 840

gtgctatgca tgagctatac ttgtggccat ttgctgatgc cgttcgcgct ggtgtgggtt 900

ctttcatgtg ctcatactct cagatcaaca actcctacgg atgccaaaac agtcagaccc 960

tcaacaagct cctcaagagc gaattgggct tccaaggctt tgtcatgagc gattggggtg 1020

cccatcactc tggagtgtca tcggcgctag ctggacttga tatgagcatg ccgggtgata 1080

ccgaatttga ttctggcttg agcttctggg gctctaacct caccattgca attctgaacg 1140

gcacggttcc cgaatggcgc ctggatgaca tggcgatgcg aattatggct gcatacttca 1200

aagttggcct tactattgag gatcaaccag atgtcaactt caatgcctgg acccatgaca 1260

cctacggata taaatacgct tatagcaagg aagattacga gcaggtcaac tggcatgtcg 1320

atgttcgcag cgaccacaat aagctcattc gcgagactgc cgcgaagggt acagttctgc 1380

tgaagaacaa ctttcatgct ctccctctga agcagcccag gttcgtggcc gtcgttggtc 1440

aggatgccgg gccaaacccc aagggcccta acggctgcgc agaccgagga tgcgaccaag 1500

gcactctcgc aatgggatgg ggctcagggt ctaccgaatt cccttacctg gtcactcctg 1560

acactgctat tcagtcaaag gtcctcgaat acgggggtcg atacgagagt atttttgata 1620

actatgacga caatgctatc ttgtcgcttg tctcacagcc tgatgcaacc tgtatcgttt 1680

ttgcaaatgc cgattccggt gaaggctaca tcactgtcga caacaactgg ggtgaccgca 1740

acaatctgac cctctggcaa aatgccgatc aagtgattag cactgtcagc tcgcgatgca 1800

acaacacaat cgttgttctc cactctgtcg gaccagtgtt gctaaatggt atatatgagc 1860

acccgaacat cacagctatt gtctgggcag ggatgccagg cgaagaatct ggcaatgctc 1920

tcgtggatat tctttggggc aatgttaacc ctgccggtcg cactccgttc acctgggcca 1980

aaagtcgaga ggactatggc actgatataa tgtacgagcc caacaacggc cagcgtgcgc 2040

ctcagcagga tttcaccgag agcatctacc tcgactaccg ccatttcgac aaagctggta 2100

tcgagccaat ttacgagttt ggattcggcc tctcctatac caccttcgaa tactctgacc 2160

tccgtgttgt gaagaagtat gttcaaccat acagtcccac gaccggcacc ggtgctcaag 2220

caccttccat cggacagcca cctagccaga acctggatac ctacaagttc cctgctacat 2280

acaagtacat caaaaccttc atttatccct acctgaacag cactgtctcc ctccgcgctg 2340

cttccaagga tcccgaatac ggtcgtacag actttatccc accccacgcg cgtgatggct 2400

cccctcaacc tctcaacccc gctggagacc cagtggccag tggtggaaac aacatgctct 2460

acgacgaact ttacgaggtc actgcacaga tcaaaaacac tggcgacgtg gccggcgacg 2520

aagtcgtcca gctttacgta gatctcgggg gtgacaaccc gcctcgtcag ttgagaaact 2580

ttgacaggtt ttatctgctg cccggtcaga gctcaacatt ccgggctaca ttgacgcgcc 2640

gtgatttgag caactgggat attgaggcgc agaactggcg agttacggaa tcgcctaaga 2700

gagtgtatgt tggacggtcg agtcgggatt tgccgctgag ctcacaattg gagtaatgat 2760

catgtctacc aatagatgtt gaatgtctgg tgtggatatt 2800

<210>30

<211>878

<212>PRT

<213>巴西青霉(Penici ll ium brasilianum)

<400>30

Met Gln Gly Ser Thr Ile Phe Leu Ala Phe Ala Ser Trp Ala Ser Gln

1 5 10 15

Val Ala Ala Ile Ala Gln Pro Ile Gln Lys His Glu Pro Gly Phe Leu

20 25 30

His Gly Pro Gln Ala Ile Glu Ser Phe Ser Glu Pro Phe Tyr Pro Ser

35 40 45

Pro Trp Met Asn Pro His Ala Glu Gly Trp Glu Ala Ala Tyr Gln Lys

50 55 60

Ala Gln Asp Phe Val Ser Gln Leu Thr Ile Leu Glu Lys Ile Asn Leu

65 70 75 80

Thr Thr Gly Val Gly Trp Glu Asn Gly Pro Cys Val Gly Asn Thr Gly

85 90 95

Ser Ile Pro Arg Leu Gly Phe Lys Gly Phe Cys Thr Gln Asp Ser Pro

100 105 110

Gln Gly Val Arg Phe Ala Asp Tyr Ser Ser Ala Phe Thr Ser Ser Gln

115 120 125

Met Ala Ala Ala Thr Phe Asp Arg Ser Ile Leu Tyr Gln Arg Gly Gln

130 135 140

Ala Met Ala Gln Glu His Lys Ala Lys Gly Ile Thr Ile Gln Leu Gly

145 150 155 160

Pro Val Ala Gly Pro Leu Gly Arg Ile Pro Glu Gly Gly Arg Asn Trp

165 170 175

Glu Gly Phe Ser Pro Asp Pro Val Leu Thr Gly Ile Ala Met Ala Glu

180 185 190

Thr Ile Lys Gly Met Gln Asp Thr Gly Val Ile Ala Cys Ala Lys His

195 200 205

Tyr Ile Gly Asn Glu Gln Glu His Phe Arg Gln Val Gly Glu Ala Ala

210 215 220

Gly His Gly Tyr Thr Ile Ser Asp Thr Ile Ser Ser Asn Ile Asp Asp

225 230 235 240

Arg Ala Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg

245 250 255

Ala Gly Val Gly Ser Phe Met Cys Ser Tyr Ser Gln Ile Asn Asn Ser

260 265 270

Tyr Gly Cys Gln Asn Ser Gln Thr Leu Asn Lys Leu Leu Lys Ser Glu

275 280 285

Leu Gly Phe Gln Gly Phe Val Met Ser Asp Trp Gly Ala His His Ser

290 295 300

Gly Val Ser Ser Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp

305 310 315 320

7hr Glu Phe Asp Ser Gly Leu Ser Phe Trp Gly Ser Asn Leu Thr Ile

325 330 335

Ala Ile Leu Asn Gly Thr Val Pro Glu Trp Arg Leu Asp Asp Met Ala

340 345 350

Met Arg Ile Met Ala Ala Tyr Phe Lys Val Gly Leu Thr Ile Glu Asp

355 360 365

Gln Pro Asp Val Asn Phe Asn Ala Trp Thr His Asp Thr Tyr Gly Tyr

370 375 380

Lys Tyr Ala Tyr Ser Lys Glu Asp Tyr Glu Gln Val Asn Trp His Val

385 390 395 400

Asp Val Arg Ser Asp His Asn Lys Leu Ile Arg Glu Thr Ala Ala Lys

405 410 415

Gly Thr Val Leu Leu Lys Asn Asn Phe His Ala Leu Pro Leu Lys Gln

420 425 430

Pro Arg Phe Val Ala Val Val Gly Gln Asp Ala Gly Pro Asn Pro Lys

435 440 445

Gly Pro Asn Gly Cys Ala Asp Arg Gly Cys Asp Gln Gly Thr Leu Ala

450 455 460

Met Gly Trp Gly Ser Gly Ser Thr Glu Phe Pro Tyr Leu Val Thr Pro

465 470 475 480

Asp Thr Ala Ile Gln Ser Lys Val Leu Glu Tyr Gly Gly Arg Tyr Glu

485 490 495

Ser Ile Phe Asp Asn Tyr Asp Asp Asn Ala Ile Leu Ser Leu Val Ser

500 505 510

Gln Pro Asp Ala Thr Cys Ile Val Phe Ala Asn Ala Asp Ser Gly Glu

515 520 525

Gly Tyr Ile Thr Val Asp Asn Asn Trp Gly Asp Arg Asn Asn Leu Thr

530 535 540

Leu Trp Gln Asn Ala Asp Gln Val Ile Ser Thr Val Ser Ser Arg Cys

545 550 555 560

Asn Asn Thr Ile Val Val Leu His Ser Val Gly Pro Val Leu Leu Asn

565 570 575

Gly Ile Tyr Glu His Pro Asn Ile Thr Ala Ile Val Trp Ala Gly Met

580 585 590

Pro Gly Glu Glu Ser Gly Asn Ala Leu Val Asp Ile Leu Trp Gly Asn

595 600 605

Val Asn Pro Ala Gly Arg Thr Pro Phe Thr Trp Ala Lys Ser Arg Glu

610 615 620

Asp Tyr Gly Thr Asp Ile Met Tyr Glu Pro Asn Asn Gly Gln Arg Ala

625 630 635 640

Pro Gln Gln Asp Phe Thr Glu Ser Ile Tyr Leu Asp Tyr Arg His Phe

645 650 655

Asp Lys Ala Gly Ile Glu Pro Ile Tyr Glu Phe Gly Phe Gly Leu Ser

660 665 670

Tyr Thr Thr Phe Glu Tyr Ser Asp Leu Arg Val Val Lys Lys Tyr Val

675 680 685

Gln Pro Tyr Ser Pro Thr Thr Gly Thr Gly Ala Gln Ala Pro Ser Ile

690 695 700

Gly Gln Pro Pro Ser Gln Asn Leu Asp Thr Tyr Lys Phe Pro Ala Thr

705 710 715 720

Tyr Lys Tyr Ile Lys Thr Phe Ile Tyr Pro Tyr Leu Asn Ser Thr Val

725 730 735

Ser Leu Arg Ala Ala Ser Lys Asp Pro Glu Tyr Gly Arg Thr Asp Phe

740 745 750

Ile Pro Pro His Ala Arg Asp Gly Ser Pro Gln Pro Leu Asn Pro Ala

755 760 765

Gly Asp Pro Val Ala Ser Gly Gly Asn Asn Met Leu Tyr Asp Glu Leu

770 775 780

Tyr Glu Val Thr Ala Gln Ile Lys Asn Thr Gly Asp Val Ala Gly Asp

785 790 795 800

Glu Val Val Gln Leu Tyr Val Asp Leu Gly Gly Asp Asn Pro Pro Arg

805 810 815

Gln Leu Arg Asn Phe Asp Arg Phe Tyr Leu Leu Pro Gly Gln Ser Ser

820 825 830

Thr Phe Arg Ala Thr Leu Thr Arg Arg Asp Leu Ser Asn Trp Asp Ile

835 840 845

Glu Ala Gln Asn Trp Arg Val Thr Glu Ser Pro Lys Arg Val Tyr Val

850 855 860

Gly Arg Ser Ser Arg Asp Leu Pro Leu Ser Ser Gln Leu Glu

865 870 875

<210>31

<211>2235

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>31

atgcgttacc gaacagcagc tgcgctggca cttgccactg ggccctttgc tagggcagac 60

agtcactcaa catcgggggc ctcggctgag gcagttgtac ctcctgcagg gactccatgg 120

ggaaccgcgt acgacaaggc gaaggccgca ttggcaaagc tcaatctcca agataaggtc 180

ggcatcgtga gcggtgtcgg ctggaacggc ggtccttgcg ttggaaacac atctccggcc 240

tccaagatca gctatccatc gctatgcctt caagacggac ccctcggtgt tcgatactcg 300

acaggcagca cagcctttac gccgggcgtt caagcggcct cgacgtggga tgtcaatttg 360

atccgcgaac gtggacagtt catcggtgag gaggtgaagg cctcggggat tcatgtcata 420

cttggtcctg tggctgggcc gctgggaaag actccgcagg gcggtcgcaa ctgggagggc 480

ttcggtgtcg atccatatct cacgggcatt gccatgggtc aaaccatcaa cggcatccag 540

tcggtaggcg tgcaggcgac agcgaagcac tatatcctca acgagcagga gctcaatcga 600

gaaaccattt cgagcaaccc agatgaccga actctccatg agctgtatac ttggccattt 660

gccgacgcgg ttcaggccaa tgtcgcttct gtcatgtgct cgtacaacaa ggtcaatacc 720

acctgggcct gcgaggatca gtacacgctg cagactgtgc tgaaagacca gctggggttc 780

ccaggctatg tcatgacgga ctggaacgca cagcacacga ctgtccaaag cgcgaattct 840

gggcttgaca tgtcaatgcc tggcacagac ttcaacggta acaatcggct ctggggtcca 900

gctctcacca atgcggtaaa tagcaatcag gtccccacga gcagagtcga cgatatggtg 960

actcgtatcc tcgccgcatg gtacttgaca ggccaggacc aggcaggcta tccgtcgttc 1020

aacatcagca gaaatgttca aggaaaccac aagaccaatg tcagggcaat tgccagggac 1080

ggcatcgttc tgctcaagaa tgacgccaac atcctgccgc tcaagaagcc cgctagcatt 1140

gccgtcgttg gatctgccgc aatcattggt aaccacgcca gaaactcgcc ctcgtgcaac 1200

gacaaaggct gcgacgacgg ggccttgggc atgggttggg gttccggcgc cgtcaactat 1260

ccgtacttcg tcgcgcccta cgatgccatc aataccagag cgtcttcgca gggcacccag 1320

gttaccttga gcaacaccga caacacgtcc tcaggcgcat ctgcagcaag aggaaaggac 1380

gtcgccatcg tcttcatcac cgccgactcg ggtgaaggct acatcaccgt ggagggcaac 1440

gcgggcgatc gcaacaacct ggatccgtgg cacaacggca atgccctggt ccaggcggtg 1500

gccggtgcca acagcaacgt cattgttgtt gtccactccg ttggcgccat cattctggag 1560

cagattcttg ctcttccgca ggtcaaggcc gttgtctggg cgggtcttcc ttctcaggag 1620

agcggcaatg cgctcgtcga cgtgctgtgg ggagatgtca gcccttctgg caagctggtg 1680

tacaccattg cgaagagccc caatgactat aacactcgca tcgtttccgg cggcagtgac 1740

agcttcagcg agggactgtt catcgactat aagcacttcg acgacgccaa tatcacgccg 1800

cggtacgagt tcggctatgg actgtcttac accaagttca actactcacg cctctccgtc 1860

ttgtcgaccg ccaagtctgg tcctgcgact ggggccgttg tgccgggagg cccgagtgat 1920

ctgttccaga atgtcgcgac agtcaccgtt gacatcgcaa actctggcca agtgactggt 1980

gccgaggtag cccagctgta catcacctac ccatcttcag cacccaggac ccctccgaag 2040

cagctgcgag gctttgccaa gctgaacctc acgcctggtc agagcggaac agcaacgttc 2100

aacatccgac gacgagatct cagctactgg gacacggctt cgcagaaatg ggtggtgccg 2160

tcggggtcgt ttggcatcag cgtgggagcg agcagccggg atatcaggct gacgagcact 2220

ctgtcggtag cgtag 2235

<210>32

<211>744

<212>PRT

<213>里氏木霉(Trichoderma reesei)

<400>32

Met Arg Tyr Arg Thr Ala Ala Ala Leu Ala Leu Ala Thr Gly Pro Phe

1 5 10 15

Ala Arg Ala Asp Ser His Ser Thr Ser Gly Ala Ser Ala Glu Ala Val

20 25 30

Val Pro Pro Ala Gly Thr Pro Trp Gly Thr Ala Tyr Asp Lys Ala Lys

35 40 45

Ala Ala Leu Ala Lys Leu Asn Leu Gln Asp Lys Val Gly Ile Val Ser

50 55 60

Gly Val Gly Trp Asn Gly Gly Pro Cys Val Gly Asn Thr Ser Pro Ala

65 70 75 80

Ser Lys Ile Ser Tyr Pro Ser Leu Cys Leu Gln Asp Gly Pro Leu Gly

85 90 95

Val Arg Tyr Ser Thr Gly Ser Thr Ala Phe Thr Pro Gly Val Gln Ala

100 105 110

Ala Ser Thr Trp Asp Val Asn Leu Ile Arg Glu Arg Gly Gln Phe Ile

115 120 125

Gly Glu Glu Val Lys Ala Ser Gly Ile His Val Ile Leu Gly Pro Val

130 135 140

Ala Gly Pro Leu Gly Lys Thr Pro Gln Gly Gly Arg Asn Trp Glu Gly

145 150 155 160

Phe Gly Val Asp Pro Tyr Leu Thr Gly Ile Ala Met Gly Gln Thr Ile

165 170 175

Asn Gly Ile Gln Ser Val Gly Val Gln Ala Thr Ala Lys His Tyr Ile

180 185 190

Leu Asn Glu Gln Glu Leu Asn Arg Glu Thr Ile Ser Ser Asn Pro Asp

195 200 205

Asp Arg Thr Leu His Glu Leu Tyr Thr Trp Pro Phe Ala Asp Ala Val

210 215 220

Gln Ala Asn Val Ala Ser Val Met Cys Ser Tyr Asn Lys Val Asn Thr

225 230 235 240

Thr Trp Ala Cys Glu Asp Gln Tyr Thr Leu Gln Thr Val Leu Lys Asp

245 250 255

Gln Leu Gly Phe Pro Gly Tyr Val Met Thr Asp Trp Asn Ala Gln His

260 265 270

Thr Thr Val Gln Ser Ala Asn Ser Gly Leu Asp Met Ser Met Pro Gly

275 280 285

Thr Asp Phe Asn Gly Asn Asn Arg Leu Trp Gly Pro Ala Leu Thr Asn

290 295 300

Ala Val Asn Ser Asn Gln Val Pro Thr Ser Arg Val Asp Asp Met Val

305 310 315 320

Thr Arg Ile Leu Ala Ala Trp Tyr Leu Thr Gly Gln Asp Gln Ala Gly

325 330 335

Tyr Pro Ser Phe Asn Ile Ser Arg Asn Val Gln Gly Asn His Lys Thr

340 345 350

Asn Val Arg Ala Ile Ala Arg Asp Gly Ile Val Leu Leu Lys Asn Asp

355 360 365

Ala Asn Ile Leu Pro Leu Lys Lys Pro Ala Ser Ile Ala Val Val Gly

370 375 380

Ser Ala Ala Ile Ile Gly Asn His Ala Arg Asn Ser Pro Ser Cys Asn

385 390 395 400

Asp Lys Gly Cys Asp Asp Gly Ala Leu Gly Met Gly Trp Gly Ser Gly

405 410 415

Ala Val Asn Tyr Pro Tyr Phe Val Ala Pro Tyr Asp Ala Ile Asn Thr

420 425 430

Arg Ala Ser Ser Gln Gly Thr Gln Val Thr Leu Ser Asn Thr Asp Asn

435 440 445

Thr Ser Ser Gly Ala Ser Ala Ala Arg Gly Lys Asp Val Ala Ile Val

450 455 460

Phe Ile Thr Ala Asp Ser Gly Glu Gly Tyr Ile Thr Val Glu Gly Asn

465 470 475 480

Ala Gly Asp Arg Asn Asn Leu Asp Pro Trp His Asn Gly Asn Ala Leu

485 490 495

Val Gln Ala Val Ala Gly Ala Asn Ser Asn Val Ile Val Val Val His

500 505 510

Ser Val Gly Ala Ile Ile Leu Glu Gln Ile Leu Ala Leu Pro Gln Val

515 520 525

Lys Ala Val Val Trp Ala Gly Leu Pro Ser Gln Glu Ser Gly Asn Ala

530 535 540

Leu Val Asp Val Leu Trp Gly Asp Val Ser Pro Ser Gly Lys Leu Val

545 550 555 560

Tyr Thr Ile Ala Lys Ser Pro Asn Asp Tyr Asn Thr Arg Ile Val Ser

565 570 575

Gly Gly Ser Asp Ser Phe Ser Glu Gly Leu Phe Ile Asp Tyr Lys His

580 585 590

Phe Asp Asp Ala Asn Ile Thr Pro Arg Tyr Glu Phe Gly Tyr Gly Leu

595 600 605

Ser Tyr Thr Lys Phe Ash Tyr Ser Arg Leu Ser Val Leu Ser Thr Ala

610 615 620

Lys Ser Gly Pro Ala Thr Gly Ala Val Val Pro Gly Gly Pro Ser Asp

625 630 635 640

Leu Phe Gln Asn Val Ala Thr Val Thr Val Asp Ile Ala Asn Ser Gly

645 650 655

Gln Val Thr Gly Ala Glu Val Ala Gln Leu Tyr Ile Thr Tyr Pro Ser

660 665 670

Ser Ala Pro Arg Thr Pro Pro Lys Gln Leu Arg Gly Phe Ala Lys Leu

675 680 685

Asn Leu Thr Pro Gly Gln Ser Gly Thr Ala Thr Phe Asn Ile Arg Arg

690 695 700

Arg Asp Leu Ser Tyr Trp Asp Thr Ala Ser Gln Lys Trp Val Val Pro

705 710 715 720

Ser Gly Ser Phe Gly Ile Ser Val Gly Ala Ser Ser Arg Asp Ile Arg

725 730 735

Leu Thr Ser Thr Leu Ser Val Ala

740

<210>33

<211>29

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>33

aacgttaatt aaggaatcgt tttgtgttt 29

<210>34

<211>29

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>34

agtactagta gctccgtggc gaaagcctg 29

<210>35

<211>31

<212>DNA

<213>酿酒酵母(Saccharomyces cerevisiae)

<400>35

ttgaattgaa aatagattga tttaaaactt c 31

<210>36

<211>25

<212>DNA

<213>酿酒酵母(Saccharomyces cerevisiae)

<400>36

ttgcatgcgt aatcatggtc atagc 25

<210>37

<211>26

<212>DNA

<213>酿酒酵母(Saccharomyces cerevisiae)

<400>37

ttgaattcat gggtaataac tgatat 26

<210>38

<211>32

<212>DNA

<213>酿酒酵母(Saccharomyces cerevisiae)

<400>38

aaatcaatct attttcaatt caattcatca tt 32

<210>39

<211>11

<212>DNA

<213>黑曲霉(Aspergillus niger)

<400>39

gtactaaaac c 11

<210>40

<211>11

<212>DNA

<213>黑曲霉(Aspergillus niger)

<400>40

ccgttaaatt t 11

<210>41

<211>45

<212>DNA

<213>黑曲霉(Aspergillus niger)

<400>41

ggatgctgtt gactccggaa atttaacggt ttggtcttgc atccc 45

<210>42

<211>14

<212>DNA

<213>黑曲霉(Aspergillus niger)

<400>42

atgcaattta aact 14

<210>43

<211>14

<212>DNA

<213>黑曲霉(Aspergillus niger)

<400>43

cggcaattta acgg 14

<210>44

<211>44

<212>DNA

<213>黑曲霉(Aspergillus niger)

<400>44

ggtattgtcc tgcagacggc aatttaacgg cttctgcgaa tcgc 44

<210>45

<211>29

<212>DNA

<213>特异腐质霉(Humicola insolens)

<400>45

aagcttaagc atgcgttcct cccccctcc 29

<210>46

<211>32

<212>DNA

<213>特异腐质霉(Humicola insolens)

<400>46

ctgcagaatt ctacaggcac tgatggtacc ag 32

<210>47

<211>32

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>47

ctgcagaatt ctacaggcac tgatggtacc ag 32

<210>48

<211>36

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>48

accgcggact gcgcatcatg cgttcctccc ccctcc 36

<210>49

<211>29

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>49

aaacgtcgac cgaatgtagg attgttatc 29

<210>50

<211>17

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>50

gatgcgcagt ccgcggt 17

<210>51

<211>29

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>51

aaacgtcgac cgaatgtagg attgttatc 29

<210>52

<211>36

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>52

ggagggggga ggaacgcatg atgcgcagtc cgcggt 36

<210>53

<211>29

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>53

aaacgtcgac cgaatgtagg at tgttatc 29

<210>54

<211>32

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>54

ctgcagaatt ctacaggcac tgatggtacc ag 32

<210>55

<211>46

<212>DNA

<213>米曲霉(Aspergillus oryzae)

<400>55

atagtcaacc gcggactgcg catcatgaag cttggttgga tcgagg 46

<210>56

<211>26

<212>DNA

<213>米曲霉(Aspergillus oryzae)

<400>56

actagtttac tgggccttag gcagcg 26

<210>57

<211>26

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>57

gtcgactcga agcccgaatg taggat 26

<210>58

<211>45

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>58

cctcgatcca accaagcttc atgatgcgca gtccgcggtt gacta 45

<210>59

<211>57

<212>DNA

<213>米曲霉(Aspergillus oryzae)

<400>59

atgaagcttg gttggatcga ggtggccgca ttggcggct g cctcagtagt cagtgcc 57

<210>60

<211>19

<212>PRT

<213>米曲霉(Aspergillus oryzae)

<400>60

Met Lys Leu Gly Trp Ile Glu Val Ala Ala Leu Ala Ala Ala Ser Val

1 5 10 15

Val Ser Ala

<210>61

<211>42

<212>DNA

<213>米曲霉(Aspergillus oryzae)

<400>61

tgccggtgtt ggcccttgcc aaggatgatc tcgcgtactc cc 42

<210>62

<211>28

<212>DNA

<213>米曲霉(Aspergillus oryzae)

<400>62

gactagtctt actgggcctt aggcagcg 28

<210>63

<211>63

<212>DNA

<213>特异腐质霉(Humicola insolens)

<400>63

atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt 60

gcc 63

<210>64

<211>21

<212>PRT

<213>特异腐质霉(Humicola insolens)

<400>64

Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro

1 5 10 15

Val Leu Ala Leu Ala

20

<210>65

<211>30

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>65

acgcgtcgac cgaatgtagg attgttatcc 30

<210>66

<211>42

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>66

gggagtacgc gagatcatcc ttggcaaggg ccaacaccgg ca 42

<210>67

<211>20

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>67

cccaagctta gccaagaaca 20

<210>68

<211>29

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>68

gggggaggaa cgcatgggat ctggacggc 29

<210>69

<211>30

<212>DNA

<213>米曲霉(Aspergillus oryzae)

<400>69

gccgtccaga tccccatgcg ttcctccccc 30

<210>70

<211>20

<212>DNA

<213>米曲霉(Aspergillus oryzae)

<400>70

ccaagcttgt tcagagtttc 20

<210>71

<211>20

<212>DNA

<213>米曲霉(Aspergillus oryzae)

<400>71

ggactgcgca gcatgcgttc 20

<210>72

<211>30

<212>DNA

<213>米曲霉(Aspergillus oryzae)

<400>72

agttaattaa ttactgggcc ttaggcagcg 30

<210>73

<211>3294

<212>DNA

<213>米曲霉(Aspergillus oryzae)

<400>73

atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt 60

gccgctgatg gcaggtccac ccgctactgg gactgctgca agccttcgtg cggctgggcc 120

aagaaggctc ccgtgaacca gcctgtcttt tcctgcaacg ccaacttcca gcgtatcacg 180

gacttcgacg ccaagtccgg ctgcgagccg ggcggtgtcg cctactcgtg cgccgaccag 240

accccatggg ctgtgaacga cgacttcgcg ctcggttttg ctgccacctc tattgccggc 300

agcaatgagg cgggctggtg ctgcgcctgc tacgagctca ccttcacatc cggtcctgtt 360

gctggcaaga agatggtcgt ccagtccacc agcactggcg gtgatcttgg cagcaaccac 420

ttcgatctca acatccccgg cggcggcgtc ggcatcttcg acggatgcac tccccagttc 480

ggtggtctgc ccggccagcg ctacggcggc atctcgtccc gcaacgagtg cgatcggttc 540

cccgacgccc tcaagcccgg ctgctactgg cgcttcgact ggttcaagaa cgccgacaat 600

ccgagcttca gcttccgtca ggtccagtgc ccagccgagc tcgtcgctcg caccggatgc 660

cgccgcaacg acgacggcaa cttccctgcc gtccagatcc ccatgcgttc ctcccccctc 720

ctccgctccg ccgttgtggc cgccctgccg gtgttggccc ttgccaagga tgatctcgcg 780

tactcccctc ctttctaccc ttccccatgg gcagatggtc agggtgaatg ggcggaagta 840

tacaaacgcg ctgtagacat agtttcccag atgacgttga cagagaaagt caacttaacg 900

actggaacag gatggcaact agagaggtgt gttggacaaa ctggcagtgt tcccagactc 960

aacatcccca gcttgtgttt gcaggatagt cctcttggta ttcgtttctc ggactacaat 1020

tcagctttcc ctgcgggtgt taatgtcgct gccacctggg acaagacgct cgcctacctt 1080

cgtggtcagg caatgggtga ggagttcagt gataagggta ttgacgttca gctgggtcct 1140

gctgctggcc ctctcggtgc tcatccggat ggcggtagaa actgggaagg tttctcacca 1200

gatccagccc tcaccggtgt actttttgcg gagacgatta agggtattca agatgctggt 1260

gtcattgcga cagctaagca ttatatcatg aacgaacaag agcatttccg ccaacaaccc 1320

gaggctgcgg gttacggatt caacgtaagc gacagtttga gttccaacgt tgatgacaag 1380

actatgcatg aattgtacct ctggcccttc gcggatgcag tacgcgctgg agtcggtgct 1440

gtcatgtgct cttacaacca aatcaacaac agctacggtt gcgagaatag cgaaactctg 1500

aacaagcttt tgaaggcgga gcttggtttc caaggcttcg tcatgagtga ttggaccgct 1560

catcacagcg gcgtaggcgc tgctttagca ggtctggata tgtcgatgcc cggtgatgtt 1620

accttcgata gtggtacgtc tttctggggt gcaaacttga cggtcggtgt ccttaacggt 1680

acaatccccc aatggcgtgt tgatgacatg gctgtccgta tcatggccgc ttattacaag 1740

gttggccgcg acaccaaata cacccctccc aacttcagct cgtggaccag ggacgaatat 1800

ggtttcgcgc ataaccatgt ttcggaaggt gcttacgaga gggtcaacga attcgtggac 1860

gtgcaacgcg atcatgccga cctaatccgt cgcatcggcg cgcagagcac tgttctgctg 1920

aagaacaagg gtgccttgcc cttgagccgc aaggaaaagc tggtcgccct tctgggagag 1980

gatgcgggtt ccaactcgtg gggcgctaac ggctgtgatg accgtggttg cgataacggt 2040

acccttgcca tggcctgggg tagcggtact gcgaatttcc catacctcgt gacaccagag 2100

caggcgattc agaacgaagt tcttcagggc cgtggtaatg tcttcgccgt gaccgacagt 2160

tgggcgctcg acaagatcgc tgcggctgcc cgccaggcca gcgtatctct cgtgttcgtc 2220

aactccgact caggagaagg ctatcttagt gtggatggaa atgagggcga tcgtaacaac 2280

atcactctgt ggaagaacgg cgacaatgtg gtcaagaccg cagcgaataa ctgtaacaac 2340

accgttgtca tcatccactc cgtcggacca gttttgatcg atgaatggta tgaccacccc 2400

aatgtcactg gtattctctg ggctggtctg ccaggccagg agtctggtaa ctccattgcc 2460

gatgtgctgt acggtcgtgt caaccctggc gccaagtctc ctttcacttg gggcaagacc 2520

cgggagtcgt atggttctcc cttggtcaag gatgccaaca atggcaacgg agcgccccag 2580

tctgatttca cccagggtgt tttcatcgat taccgccatt tcgataagtt caatgagacc 2640

cctatctacg agtttggcta cggcttgagc tacaccacct tcgagctctc cgacctccat 2700

gttcagcccc tgaacgcgtc ccgatacact cccaccagtg gcatgactga agctgcaaag 2760

aactttggtg aaattggcga tgcgtcggag tacgtgtatc cggaggggct ggaaaggatc 2820

catgagttta tctatccctg gatcaactct accgacctga aggcatcgtc tgacgattct 2880

aactacggct gggaagactc caagtatatt cccgaaggcg ccacggatgg gtctgcccag 2940

ccccgtttgc ccgctagtgg tggtgccgga ggaaaccccg gtctgtacga ggatcttttc 3000

cgcgtctctg tgaaggtcaa gaacacgggc aatgtcgccg gtgatgaagt tcctcagctg 3060

tacgtttccc taggcggccc gaatgagccc aaggtggtac tgcgcaagtt tgagcgtatt 3120

cacttggccc cttcgcagga ggccgtgtgg acaacgaccc ttacccgtcg tgaccttgca 3180

aactgggacg tttcggctca ggactggacc gtcactcctt accccaagac gatctacgtt 3240

ggaaactcct cacggaaact gccgctccag gcctcgctgc ctaaggccca gtaa 3294

<210>74

<211>1097

<212>PRT

<213>米曲霉(Aspergillus oryzae)

<400>74

Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro

1 5 10 15

Val Leu Ala Leu Ala Ala Asp Gly Arg Ser Thr Arg Tyr Trp Asp Cys

20 25 30

Cys Lys Pro Ser Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro

35 40 45

Val Phe Ser Cys Asn Ala Asn Phe Gln Arg Ile Thr Asp Phe Asp Ala

50 55 60

Lys Ser Gly Cys Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln

65 70 75 80

Thr Pro Trp Ala Val Asn Asp Asp Phe Ala Leu Gly Phe Ala Ala Thr

85 90 95

Ser Ile Ala Gly Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Glu

100 105 110

Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln

115 120 125

Ser Thr Ser Thr Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn

130 135 140

Ile Pro Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe

145 150 155 160

Gly Gly Leu Pro Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu

165 170 175

Cys Asp Arg Phe Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe

180 185 190

Asp Trp Phe Lys Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val

195 200 205

Gln Cys Pro Ala Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp

210 215 220

Asp Gly Asn Phe Pro Ala Val Gln Ile Pro Met Arg Ser Ser Pro Leu

225 230 235 240

Leu Arg Ser Ala Val Val Ala Ala Leu Pro Val Leu Ala Leu Ala Lys

245 250 255

Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser Pro Trp Ala Asp

260 265 270

Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala Val Asp Ile Val

275 280 285

Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr Thr Gly Thr Gly

290 295 300

Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser Val Pro Arg Leu

305 310 315 320

Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu Gly Ile Arg Phe

325 330 335

Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn Val Ala Ala Thr

340 345 350

Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala Met Gly Glu Glu

355 360 365

Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro Ala Ala Gly Pro

370 375 380

Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu Gly Phe Ser Pro

385 390 395 400

Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr Ile Lys Gly lle

405 410 415

Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr Ile Met Asn Glu

420 425 430

Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly Tyr Gly Phe Asn

435 440 445

Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys Thr Met His Glu

450 455 460

Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala Gly Val Gly Ala

465 470 475 480

Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly Cys Glu Asn

485 490 495

Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu Gly Phe Gln Gly

500 505 510

Phe Val Met Ser Asp Trp Thr Ala His His Ser Gly Val Gly Ala Ala

515 520 525

Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val Thr Phe Asp Ser

530 535 540

Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly Val Leu Asn Gly

545 550 555 560

Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val Arg Ile Met Ala

565 570 575

Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr Pro Pro Asn Phe

580 585 590

Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His Asn His Val Ser

595 600 605

Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp Val Gln Arg Asp

610 615 620

His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser Thr Val Leu Leu

625 630 635 640

Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu Lys Leu Val Ala

645 650 655

Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly Ala Asn Gly Cys

660 665 670

Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Ala Trp Gly Ser

675 680 685

Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu Gln Ala Ile Gln

690 695 700

Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala Val Thr Asp Ser

705 710 715 720

Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln Ala Ser Val Ser

725 730 735

Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr Leu Ser Val Asp

740 745 750

Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp Lys Asn Gly Asp

755 760 765

Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn Thr Val Val Ile

770 775 780

Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp Tyr Asp His Pro

785 790 795 800

Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly Gln Glu Ser Gly

805 810 815

Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn Pro Gly Ala Lys

820 825 830

Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr Gly Ser Pro Leu

835 840 845

Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln Ser Asp Phe Thr

850 855 860

Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys Phe Asn Glu Thr

865 870 875 880

Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr Thr Phe Glu Leu

885 890 895

Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg Tyr Thr Pro Thr

900 905 910

Ser Gly Met Thr Glu Ala Ala Lys Ash Phe Gly Glu Ile Gly Asp Ala

915 920 925

Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile His Glu Phe Ile

930 935 940

Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser Ser Asp Asp Ser

945 950 955 960

Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu Gly Ala Thr Asp

965 970 975

Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly Ala Gly Gly Asn

980 985 990

Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val Lys Val Lys Asn

995 1000 1005

Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu Tyr Val Ser

1010 1015 1020

Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys Phe Glu

1025 1030 1035

Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr Thr

1040 1045 1050

Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp

1055 1060 1065

Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser

1070 1075 1080

Ser Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln

1085 1090 1095

<210>75

<211>3294

<212>DNA

<213>米曲霉(Aspergillus oryzae)

<400>75

atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt 60

gccgctgatg gcaggtccac ccgctactgg gactgctgca agccttcgtg cggctgggcc 120

aagaaggctc ccgtgaacca gcctgtcttt tcctgcaacg ccaacttcca gcgtatcacg 180

gacttcgacg ccaagtccgg ctgcgagccg ggcggtgtcg cctactcgtg cgccgaccag 240

accccatggg ctgtgaacga cgacttcgcg ctcggttttg ctgccacctc tatt gccggc 300

agcaatgagg cgggctggtg ctgcgcctgc tacgagctca ccttcacatc cggtcctgtt 360

gctggcaaga agatggtcgt ccagtccacc agcactggcg gtgatcttgg cagcaaccac 420

ttcgatctca acatccccgg cggcggcgtc ggcatcttcg acggatgcac tccccagttc 480

ggtggtctgc ccggccagcg ctacggcggc atctcgtccc gcaacgagtg cgatcggttc 540

cccgacgccc tcaagcccgg ctgctactgg cgcttcgact ggttcaagaa cgccgacaat 600

ccgagcttca gcttccgtca ggtccagtgc ccagccgagc tcgtcgctcg caccggatgc 660

cgccgcaacg acgacggcaa cttccctgcc gtccagatcc ccatgcgttc ctcccccctc 720

ctccgctccg ccgttgtggc cgccctgccg gtgttggccc ttgccaagga tgatctcgcg 780

tactcccctc ctttctaccc ttccccatgg gcagatggtc agggtgaatg ggcggaagta 840

tacaaacgcg ctgtagacat agtttcccag atgacgttga cagagaaagt caacttaacg 900

actggaacag gatggcaact agagaggtgt gttggacaaa ctggcagtgt tcccagactc 960

aacatcccca gcttgtgttt gcaggatagt cctcttggta ttcgtttctc ggactacaat 1020

tcagctttcc ctgcgggtgt taatgtcgct gccacctggg acaagacgct cgcctacctt 1080

cgtggtcagg caatgggtga ggagttcagt gataagggta ttgacgttca gctgggtcct 1140

gctgctggcc ctctcggtgc tcatccggat ggcggtagaa actgggaaag tttctcacca 1200

gatccagccc tcaccggtgt actttttgcg gagacgatta agggtattca agatgctggt 1260

gtcattgcga cagctaagca ttatatcatg aacgaacaag agcatttccg ccaacaaccc 1320

gaggctgcgg gttacggatt caacgtaagc gacagtttga gttccaacgt tgatgacaag 1380

actatgcatg aattgtacct ctggcccttc gcggatgcag tacgcgctgg agtcggtgct 1440

gttatgtgct cttacaacca aatcaacaac agctacggtt gcgagaatag cgaaactctg 1500

aacaagcttt tgaaggcgga gcttggtttc caaggcttcg tcatgagtga ttggaccgct 1560

caacacagcg gcgtaggcgc tgctttagca ggtctggata tgtcgatgcc cggtgatgtt 1620

accttcgata gtggtacgtc tttctggggt gcaaacttga cggtcggtgt ccttaacggt 1680

acaatccccc aatggcgtgt tgatgacatg gctgtccgta tcatggccgc ttattacaag 1740

gttggccgcg acaccaaata cacccctccc aacttcagct cgtggaccag ggacgaatat 1800

ggtttcgcgc ataaccatgt ttcggaaggt gcttacgaga gggtcaacga attcgtggac 1860

gtgcaacgcg atcatgccga cctaatccgt cgcatcggcg cgcagagcac tgttctgctg 1920

aagaacaagg gtgccttgcc cttgagccgc aaggaaaagc tggtcgccct tctgggagag 1980

gatgcgggtt ccaactcgtg gggcgctaac ggctgtgatg accgtggttg cgataacggt 2040

acccttgcca tggcctgggg tagcggtact gcgaatttcc catacctcgt gacaccagag 2100

caggcgattc agaacgaagt tcttcagggc cgtggtaatg tcttcgccgt gaccgacagt 2160

tgggcgctcg acaagatcgc tgcggctgcc cgccaggcca gcgtatctct cgtgttcgtc 2220

aactccgact caggagaagg ctatcttagt gtggatggaa atgagggcga tcgtaacaac 2280

atcactctgt ggaagaacgg cgacaatgtg gtcaagaccg cagcgaataa ctgtaacaac 2340

accgttgtca tcatccactc cgtcggacca gttttgatcg atgaatggta tgaccacccc 2400

aatgtcactg gtattctctg ggctggtctg ccaggccagg agtctggtaa ctccattgcc 2460

gatgtgctgt acggtcgtgt caaccctggc gccaagtctc ctttcacttg gggcaagacc 2520

cgggagtcgt atggttctcc cttggtcaag gatgccaaca atggcaacgg agcgccccag 2580

tctgatttca cccagggtgt tttcatcgat taccgccatt tcgataagtt caatgagacc 2640

cctatctacg agtttggcta cggcttgagc tacaccacct tcgagctctc cgacctccat 2700

gttcagcccc tgaacgcgtc ccgatacact cccaccagtg gcatgactga agctgcaaag 2760

aactttggtg aaattggcga tgcgtcggag tacgtgtatc cggaggggct ggaaaggatc 2820

catgagttta tctatccctg gatcaactct accgacctga aggcatcgtc tgacgattct 2880

aactacggct gggaagactc caagtatatt cccgaaggcg ccacggatgg gtctgcccag 2940

ccccgtttgc ccgctagtgg tggtgccgga ggaaaccccg gtctgtacga ggatcttttc 3000

cgcgtctctg tgaaggtcaa gaacacgggc aatgtcgccg gtgatgaagt tcctcagctg 3060

tacgtttccc taggcggccc gaatgagccc aaggtggtac tgcgcaagtt tgagcgtatt 3120

cacttggccc cttcgcagga ggccgtgtgg acaacgaccc ttacccgtcg tgaccttgca 3180

aactgggacg tttcggctca ggactggacc gtcactcctt accccaagac gatctacgtt 3240

ggaaactcct cacggaaact gccgctccag gcctcgctgc ctaaggccca gtaa 3294

<210>76

<211>1097

<212>PRT

<213>米曲霉(Aspergillus oryzae)

<400>76

Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro

1 5 10 15

Val Leu Ala Leu Ala Ala Asp Gly Arg Ser Thr Arg Tyr Trp Asp Cys

20 25 30

Cys Lys Pro Ser Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro

35 40 45

Val Phe Ser Cys Asn Ala Asn Phe Gln Arg Ile Thr Asp Phe Asp Ala

50 55 60

Lys Ser Gly Cys Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln

65 70 75 80

Thr Pro Trp Ala Val Asn Asp Asp Phe Ala Leu Gly Phe Ala Ala Thr

85 90 95

Ser Ile Ala Gly Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Glu

100 105 110

Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln

115 120 125

Ser Thr Ser Thr Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn

130 135 140

Ile Pro Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe

145 150 155 160

Gly Gly Leu Pro Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu

165 170 175

Cys Asp Arg Phe Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe

180 185 190

Asp Trp Phe Lys Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val

195 200 205

Gln Cys Pro Ala Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp

210 215 220

Asp Gly Asn Phe Pro Ala Val Gln Ile Pro Met Arg Ser Ser Pro Leu

225 230 235 240

Leu Arg Ser Ala Val Val Ala Ala Leu Pro Val Leu Ala Leu Ala Lys

245 250 255

Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser Pro Trp Ala Asp

260 265 270

Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala Val Asp Ile Val

275 280 285

Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr Thr Gly Thr Gly

290 295 300

Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser Val Pro Arg Leu

305 310 315 320

Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu Gly Ile Arg Phe

325 330 335

Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn Val Ala Ala Thr

340 345 350

Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala Met Gly Glu Glu

355 360 365

Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro Ala Ala Gly Pro

370 375 380

Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu Ser Phe Ser Pro

385 390 395 400

Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr Ile Lys Gly Ile

405 410 415

Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr Ile Met Asn Glu

420 425 430

Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly Tyr Gly Phe Asn

435 440 445

Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys Thr Met His Glu

450 455 460

Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala Gly Val Gly Ala

465 470 475 480

Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly Cys Glu Asn

485 490 495

Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu Gly Phe Gln Gly

500 505 510

Phe Val Met Ser Asp Trp Thr Ala Gln His Ser Gly Val Gly Ala Ala

515 520 525

Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val Thr Phe Asp Ser

530 535 540

Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly Val Leu Asn Gly

545 550 555 560

Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val Arg Ile Met Ala

565 570 575

Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr Pro Pro Asn Phe

580 585 590

Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His Asn His Val Ser

595 600 605

Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp Val Gln Arg Asp

610 615 620

His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser Thr Val Leu Leu

625 630 635 640

Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu Lys Leu Val Ala

645 650 655

Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly Ala Asn Gly Cys

660 665 670

Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Ala Trp Gly Ser

675 680 685

Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu Gln Ala Ile Gln

690 695 700

Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala Val Thr Asp Ser

705 710 715 720

Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln Ala Ser Val Ser

725 730 735

Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr Leu Ser Val Asp

740 745 750

Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp Lys Asn Gly Asp

755 760 765

Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn Thr Val Val Ile

770 775 780

Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp Tyr Asp His Pro

785 790 795 800

Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly Gln Glu Ser Gly

805 810 815

Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn Pro Gly Ala Lys

820 825 830

Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr Gly Ser Pro Leu

835 840 845

Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln Ser Asp Phe Thr

850 855 860

Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys Phe Asn Glu Thr

865 870 875 880

Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr Thr Phe Glu Leu

885 890 895

Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg Tyr Thr Pro Thr

900 905 910

Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu Ile Gly Asp Ala

915 920 925

Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile His Glu Phe Ile

930 935 940

Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser Ser Asp Asp Ser

945 950 955 960

Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu Gly Ala Thr Asp

965 970 975

Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly Ala Gly Gly Asn

980 985 990

Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val Lys Val Lys Asn

995 1000 1005

Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu Tyr Val Ser

1010 1015 1020

Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys Phe Glu

1025 1030 1035

Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr Thr

1040 1045 1050

Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp

1055 1060 1065

Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser

1070 1075 1080

Ser Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln

1085 1090 1095

Claims

1.用于产生具有生物学活性的分泌型多肽的方法，该方法包括：

(i)包含编码信号肽的核苷酸序列的第一多核苷酸；

(ii)包含编码内切葡聚糖酶的至少催化结构域或其部分的核苷酸序列的第二多核苷酸；和

(b)在适于所述融合蛋白产生的条件下培养所述经过转化的真菌宿主细胞；和

(c)自所述培养基回收融合蛋白、其构件、或它们的组合，其中所述融合蛋白或其构件具有生物学活性。

2.权利要求1的方法，其中所述第一多核苷酸的3’端可操作连接于所述第二多核苷酸的5’端且所述第二多核苷酸的3’端可操作连接于所述第三多核苷酸的5’端，或者所述第一多核苷酸的3’端可操作连接于所述第三多核苷酸的5’端且所述第三多核苷酸的3’端可操作连接于所述第二多核苷酸的5’端，以编码融合蛋白。

3.权利要求1或2的方法，其中所述编码信号肽的第一多核苷酸得自特异腐质霉CEL45内切葡聚糖酶基因(cel45)。

4.权利要求1-3任一项的方法，其中所述包含编码内切葡聚糖酶的至少催化结构域或其部分的核苷酸序列的第二多核苷酸得自特异腐质霉CEL45内切葡聚糖酶基因(cel45)。

5.权利要求1-3任一项的方法，其中所述包含编码内切葡聚糖酶的至少催化结构域或其部分的核苷酸序列的第二多核苷酸得自编码包含如下氨基酸序列的内切葡聚糖酶的基因，所述氨基酸序列与SEQ ID NO：2具有至少70％、优选至少75％、更优选至少80％、甚至更优选至少85％、最优选至少90％、且甚至最优选至少95％同一性。

6.权利要求1-5任一项的方法，其中所述融合蛋白构建体进一步包含编码碳水化合物结合模块的多核苷酸。

7.权利要求1-6任一项的方法，其中所述第二多核苷酸编码内切葡聚糖酶的催化结构域或其部分、成熟多肽、或全长多肽。

8.权利要求1-7任一项的方法，其中所述第三多核苷酸编码具有生物学活性之多肽的催化结构域或其部分、成熟多肽、或全长多肽。

9.权利要求1-8任一项的方法，其中所述融合蛋白构建体进一步包含位于所述编码内切葡聚糖酶的至少催化结构域或其部分的核苷酸序列与所述编码具有生物学活性之多肽的至少催化结构域或其部分的核苷酸序列之间的、编码接头的多核苷酸，或者还有位于所述编码内切葡聚糖酶的至少催化结构域或其部分的核苷酸序列与所述编码具有生物学活性之多肽的至少催化结构域或其部分的核苷酸序列之间的、编码切割位点的多核苷酸。

10.权利要求1-9任一项的方法，其中所述融合蛋白构建体进一步包含编码第二信号肽的第四多核苷酸。

11.权利要求10的方法，其中所述第四多核苷酸3’端可操作连接所述第二多核苷酸的5’端或所述第三多核苷酸的5’端。

12.权利要求1-11任一项的方法，其中所述融合蛋白构建体进一步包含启动子和/或终止子。

13.权利要求12的方法，其中所述启动子驱动所述第一、第二、和第三、或者还有第四多核苷酸的表达。

14.权利要求1-13任一项的方法，其中所述具有生物学活性之多肽是抗体、抗原、抗微生物肽、酶、生长因子、激素、免疫扩张剂、神经递质、受体、报道蛋白、或结构蛋白。

15.权利要求1-14任一项的方法，其中所述具有生物学活性之多肽是氧化还原酶、转移酶、水解酶、裂合酶、异构酶、或连接酶。

16.权利要求1-15任一项的方法，其中所述具有生物学活性之多肽是纤维素分解酶或半纤维素分解酶。

17.权利要求16的方法，其中所述纤维素分解酶是β-葡糖苷酶。

18.权利要求17的方法，其中所述β-葡糖苷酶包含如下氨基酸序列，所述氨基酸序列与SEQ ID NO：24具有至少70％、优选至少75％、更优选至少80％、甚至更优选至少85％、最优选至少90％、且甚至最优选至少95％同一性，或者是包含如下氨基酸序列的变体β-葡糖苷酶，所述氨基酸序列与SEQID NO：35具有至少70％、优选至少75％、更优选至少80％、甚至更优选至少85％、最优选至少90％、且甚至最优选至少95％同一性。

19.权利要求1-18任一项的方法，其中所述融合蛋白、其构件或它们的组合具有纤维素水解活性或半纤维素水解活性。

20.一种分离的融合蛋白，该融合蛋白包含：

(a)包含信号肽的第一氨基酸序列；

21.权利要求20的融合蛋白，其中所述第一氨基酸序列的C端以符合读码框的方式连接所述第二氨基酸序列的N端且所述第二氨基酸序列的C端以符合读码框的方式连接所述第三氨基酸序列的N端，或者所述第一氨基酸序列的C端以符合读码框的方式连接所述第三氨基酸序列的N端且所述第三氨基酸序列的C端以符合读码框的方式连接所述第二氨基酸序列的N端。

22.权利要求20或21的融合蛋白，其中所述包含信号肽的第一氨基酸序列得自特异腐质霉CEL45内切葡聚糖酶。

23.权利要求20-22任一项的融合蛋白，其中所述包含内切葡聚糖酶的至少催化结构域的第二氨基酸序列得自特异腐质霉CEL45内切葡聚糖酶。

24.权利要求20-22任一项的融合蛋白，其中所述包含内切葡聚糖酶的至少催化结构域的第二氨基酸序列得自包含如下氨基酸序列的内切葡聚糖酶，所述氨基酸序列与SEQ ID NO：2具有至少70％、优选至少75％、更优选至少80％、甚至更优选至少85％、最优选至少90％、且甚至最优选至少95％同一性。

25.权利要求20-24任一项的融合蛋白，该融合蛋白进一步包含碳水化合物结合模块。

26.权利要求20-25任一项的融合蛋白，其中所述第二氨基酸序列包含内切葡聚糖酶的催化结构域或其部分、成熟多肽、或全长多肽。

27.权利要求20-26任一项的融合蛋白，其中所述第三氨基酸序列包含具有生物学活性之多肽的催化结构域或其部分、成熟多肽、或全长多肽。

28.权利要求20-27任一项的融合蛋白，该融合蛋白进一步包含位于所述内切葡聚糖酶的至少催化结构域或其部分与所述具有生物学活性之多肽的至少催化结构域或其部分之间的接头，或者还有位于所述内切葡聚糖酶的至少催化结构域或其部分与所述具有生物学活性之多肽的至少催化结构域或其部分之间的切割位点。

29.权利要求20-28任一项的融合蛋白，该融合蛋白进一步包含含有第二信号肽的第四氨基酸序列。

30.权利要求20-29任一项的融合蛋白，其中所述第二信号肽以符合读码框的方式连接所述包含具有生物学活性之多肽的至少催化结构域或其部分的氨基酸序列的N端或所述包含内切葡聚糖酶的至少催化结构域或其部分的氨基酸序列的N端。

31.权利要求20-30任一项的融合蛋白，其中所述具有生物学活性之多肽是抗体、抗原、抗微生物肽、酶、生长因子、激素、免疫扩张剂、神经递质、受体、报道蛋白、或结构蛋白。

32.权利要求20-31任一项的融合蛋白，其中所述具有生物学活性之多肽是氧化还原酶、转移酶、水解酶、裂合酶、异构酶、或连接酶。

33.权利要求20-32任一项的融合蛋白，其中所述具有生物学活性之多肽是纤维素分解酶或半纤维素分解酶。

34.权利要求33的融合蛋白，其中所述纤维素分解酶是β-葡糖苷酶。

35.权利要求34的融合蛋白，其中所述β-葡糖苷酶包含如下氨基酸序列，所述氨基酸序列与SEQ ID NO：24具有至少70％、优选至少75％、更优选至少80％、甚至更优选至少85％、最优选至少90％、且甚至最优选至少95％同一性，或者是包含如下氨基酸序列的变体β-葡糖苷酶，所述氨基酸序列与SEQID NO：35具有至少70％、优选至少75％、更优选至少80％、甚至更优选至少85％、最优选至少90％、且甚至最优选至少95％同一性。

36.权利要求34的融合蛋白，其中所述β-葡糖苷酶是SEQ ID NO：24或SEQ ID NO：35。

37.权利要求20-36任一项的融合蛋白，该融合蛋白是β-葡糖苷酶融合蛋白或其构件。

38.权利要求37的融合蛋白，该融合蛋白包含SEQ ID NO：74或SEQ IDMO：76。

39.权利要求38的融合蛋白，其中SEQ ID NO：74由SEQ ID NO：73编码而SEQ ID NO：76由SEQ ID NO：75编码。

40.权利要求20-40任一项的融合蛋白，其中所述融合蛋白、其构件或它们的组合具有纤维素水解活性或半纤维素水解活性。

41.一种分离的多核苷酸，该多核苷酸编码权利要求20-40任一项的融合蛋白。

42.一种融合蛋白构建体，该融合蛋白构建体包含权利要求41的多核苷酸。

43.一种表达载体，该表达载体包含权利要求42的融合蛋白构建体。

44.一种真菌宿主细胞，该真菌宿主细胞经过权利要求43的融合蛋白构建体的转化。

45.一种用于降解或转变含纤维素材料的方法，该方法包括：在存在有效量的权利要求40的融合蛋白或其构件的条件下用有效量的纤维素分解酶组合物处理所述含纤维素材料。

46.权利要求45的方法，其中所述纤维素分解酶组合物包含一种或几种选自下组的纤维素水解蛋白质：纤维素酶、内切葡聚糖酶、纤维二糖水解酶、和具有纤维素水解增强活性的多肽。

47.权利要求45或46的方法，该方法进一步包括用有效量的一种或几种选自下组的酶处理所述含纤维素材料：半纤维素酶、酯酶、蛋白酶、漆酶、过氧化物酶、或其混合物。

48.权利要求45-47任一项的方法，其中所述方法是预处理方法、同步糖化和发酵方法(SSF)中的步骤、分别水解和发酵(SHF)中的步骤、或混合水解和发酵方法(HHF)中的步骤。

49.权利要求45-48任一项的方法，该方法进一步包括回收经过降解的含纤维素材料。

50.权利要求45的方法，其中所述纤维素水解蛋白质和/或融合蛋白或其构件为含有或不含细胞的发酵液的形式。

51.一种用于产生物质的方法，该方法包括：

(a)在存在有效量的权利要求40的融合蛋白或其构件的条件下用有效量的纤维素分解酶组合物糖化含纤维素材料；

(b)用一种或几种发酵微生物将步骤(a)的经糖化的含纤维素材料发酵；和

(c)从所述发酵回收所述有机物质。

52.权利要求51的方法，其中所述纤维素分解酶组合物包含一种或几种选自下组的蛋白质：纤维素酶、内切葡聚糖酶、纤维二糖水解酶、和具有纤维素水解增强活性的多肽。

53.权利要求51或52的方法，该方法进一步包括用有效量的一种或几种选自下组的酶处理所述含纤维素材料：半纤维素酶、酯酶、蛋白酶、漆酶、过氧化物酶、或其混合物。

54.权利要求51-53任一项的方法，其中步骤(a)和(b)是在同步糖化和发酵中同时进行的。

55.权利要求51-53任一项的方法，其中所述物质是醇、有机酸、酮、氨基酸、或气体。

56.权利要求51-55任一项的方法，其中所述纤维素分解酶组合物和/或所述融合蛋白或其构件为含有或不含细胞的发酵液的形式。