CN101516906A - 提高具有生物学活性之多肽的分泌的方法 - Google Patents
提高具有生物学活性之多肽的分泌的方法 Download PDFInfo
- Publication number
- CN101516906A CN101516906A CNA2007800352244A CN200780035224A CN101516906A CN 101516906 A CN101516906 A CN 101516906A CN A2007800352244 A CNA2007800352244 A CN A2007800352244A CN 200780035224 A CN200780035224 A CN 200780035224A CN 101516906 A CN101516906 A CN 101516906A
- Authority
- CN
- China
- Prior art keywords
- polynucleotide
- endoglucanase
- peptide
- polypeptide
- catalyst structure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2405—Glucanases
- C12N9/2434—Glucanases acting on beta-1,4-glucosidic bonds
- C12N9/2437—Cellulases (3.2.1.4; 3.2.1.74; 3.2.1.91; 3.2.1.150)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K1/00—General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2405—Glucanases
- C12N9/2434—Glucanases acting on beta-1,4-glucosidic bonds
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2405—Glucanases
- C12N9/2434—Glucanases acting on beta-1,4-glucosidic bonds
- C12N9/2445—Beta-glucosidase (3.2.1.21)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/02—Monosaccharides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/14—Preparation of compounds containing saccharide radicals produced by the action of a carbohydrase (EC 3.2.x), e.g. by alpha-amylase, e.g. by cellulase, hemicellulase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/01004—Cellulase (3.2.1.4), i.e. endo-1,4-beta-glucanase
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/036—Fusion polypeptide containing a localisation/targetting motif targeting to the medium outside of the cell, e.g. type III secretion
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Medicinal Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Biophysics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Mycology (AREA)
- Analytical Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
Abstract
本发明涉及用于产生具有生物学活性的分泌型多肽的方法,该方法包括:(a)用编码融合蛋白的融合蛋白构建体转化真菌宿主细胞,所述融合蛋白构建体包含:(i)编码信号肽的第一多核苷酸;(ii)编码内切葡聚糖酶的至少催化结构域或其部分的第二多核苷酸;和(iii)编码具有生物学活性之多肽的至少催化结构域的第三多核苷酸;其中所述信号肽和所述内切葡聚糖酶的至少催化结构域与不存在所述内切葡聚糖酶的至少催化结构域时相比提高所述具有生物学活性之多肽的分泌;(b)在适于所述融合蛋白生产的条件下培养所述经过转化的真菌宿主细胞;并(c)自所述培养液回收所述具有生物学活性的融合蛋白、其构件、或其组合。
Description
关于在联邦赞助的研究和开发下进行的发明的权利声明
本发明是在政府支持下进行的,即美国能源部授予的基本合同DE-AC36-98GO10337的NREL转包合同号ZCO-30017-02。美国政府具有本发明的某些权利。
发明领域
本发明涉及产生具有生物学活性的分泌型多肽的方法及其融合蛋白和多核苷酸。
发明背景
异源多肽在真菌宿主细胞(特别是丝状真菌细胞,如曲霉属或木霉属或酵母细胞如酵母属)中的重组生产可能提供了用于以商业上合适的数量生产多肽的更理想的媒介。
分泌型异源多肽的重组生产一般通过构建表达盒来实现,在所述表达盒中编码多肽的DNA可操作连接适于宿主细胞的启动子和编码信号肽编码区,所述信号肽编码区所编码的氨基酸序列以符合读码框的方式连接至多肽的氨基末端并指导所编码多肽进入细胞的分泌途径。将表达盒导入宿主细胞,通常通过质粒介导的转化。然后通过在表达盒上所含的启动子正确发挥功能所必需的诱导条件下培养经转化的宿主细胞来实现分泌型异源蛋白的生产。
虽然可改进异源多肽在宿主细胞中的表达,但常常遇到的障碍是多肽进入培养基的分泌很差。改进多肽分泌的一种方法是用外来信号肽编码区替换天然信号肽编码序列以增强多肽的分泌。然而,在有些情况中,这样的替换不能提供足够的改善用于以商业上合适的数量生产多肽。另一种方法是将多肽与另一种由宿主细胞高度分泌的多肽融合。高度分泌的多肽发挥载体的功能将分泌很差或不分泌的多肽作为融合蛋白转运通过细胞的分泌途径。
WO 05/093050披露了由外切纤维二糖水解酶催化结构域和纤维素酶催化结构域构成的融合蛋白,以提高纤维素酶的产量。Gouka等,1997,Appliedand Environmental Microbiology Feb.1997,p.488-497披露了葡糖淀粉酶基因融合物,其减轻了泡盛曲霉(Aspergillus awamori)中对蛋白质产生的限制。Nyyssonen和Keranen,1995,Current Genetics 28:71-79披露了纤维二糖水解酶I在增强里氏木霉(Trichoderma reesei)的融合抗体的产生中的多种作用。
本发明的一个目的是提供用于提高具有生物学活性之多肽的分泌的方法。
发明概述
本发明涉及用于产生具有生物学活性的分泌型多肽的方法,该方法包括:
(a)用编码融合蛋白的融合蛋白构建体转化真菌宿主细胞,其中所述融合蛋白构建体包含:
(i)包含编码信号肽的核苷酸序列的第一多核苷酸;
(ii)包含编码内切葡聚糖酶的至少催化结构域(catalytic domain)或其部分的核苷酸序列的第二多核苷酸;和
(iii)包含编码具有生物学活性之多肽的至少催化结构域或其部分的核苷酸序列的第三多核苷酸;
其中所述信号肽和所述内切葡聚糖酶的至少催化结构域或其部分与不存在所述内切葡聚糖酶的至少催化结构域或其部分时相比提高所述具有生物学活性之多肽或其部分的分泌;
(b)在适于产生所述融合蛋白的条件下培养所述经转化的真菌宿主细胞;和
(c)自所述培养液回收所述融合蛋白、其构件(component thereof)或它们的组合,其中所述融合蛋白或其构件具有生物学活性。
一方面,所述第一多核苷酸的3’端可操作连接所述第二多核苷酸的5’端且所述第二多核苷酸的3’端可操作连接所述第三多核苷酸的5’端,或者所述第一多核苷酸的3’端可操作连接所述第三多核苷酸的5’端且所述第三多核苷酸的3’端可操作连接所述第二多核苷酸的5’端,以编码融合蛋白。
本发明还涉及分离的融合蛋白,该融合蛋白包含:
(a)包含信号肽的第一氨基酸序列;
(b)包含内切葡聚糖酶的至少催化结构域或其部分的第二氨基酸序列;和
(c)包含具有生物学活性之多肽的至少催化结构域或其部分的第三氨基酸序列。
本发明还涉及编码所述融合蛋白的多核苷酸,及包含此类多核苷酸的融合蛋白构建体、表达载体和重组宿主细胞。
另一方面,所述第一氨基酸序列的C端以符合读码框的方式连接所述第二氨基酸序列的N端且所述第二氨基酸序列的C端以符合读码框的方式连接所述第三氨基酸序列的N端,或者所述第一氨基酸序列的C端以符合读码框的方式连接所述第三氨基酸序列的N端且所述第三氨基酸序列的C端以符合读码框的方式连接所述第二氨基酸序列的N端。
本发明还涉及使用所述融合蛋白或其构件的方法。
附图简述
图1显示了pMJ04的限制性图谱。
图2显示了pCaHj527的限制性图谱。
图3显示了pMT2188的限制性图谱。
图4显示了pCaHj568的限制性图谱。
图5显示了pMJ05的限制性图谱。
图6显示了pSMai130的限制性图谱。
图7显示了米曲霉(Aspergillus oryzae)β-葡糖苷酶天然信号序列的DNA序列和氨基酸序列(SEQ ID NO:59和60)。
图8显示了特异腐质霉(Humicola insolens)内切葡聚糖酶V信号序列的DNA序列和氨基酸序列(SEQ ID NO:63和64)。
图9显示了pSMai135的限制性图谱。
图10显示了pSMai140的限制性图谱。
图11显示了pSaMe-F1的限制性图谱。
图12显示了pSaMe-FX的限制性图谱。
图13显示了pAlLo47的限制性图谱。
图14A、14B、14C、和14D显示了米曲霉β-葡糖苷酶变体融合蛋白的DNA序列和推导的氨基酸序列(SEQ ID NO:73和74)。
图15A、15B、15C、和15D显示了米曲霉β-葡糖苷酶融合蛋白的DNA序列和推导的氨基酸序列(SEQ ID NO:75和76)。
定义
内切葡聚糖酶活性:术语“内切葡聚糖酶活性”在本申请中定义为内切-1,4-β-D-葡聚糖4-葡聚糖水解酶(endo-1,4-β-D-glucan 4-glucanohydrolase)(E.C.3.2.1.4),其催化纤维素、纤维素衍生物(如羧甲基纤维素和羟乙基纤维素)、地衣淀粉(lichenin)中的1,4-β-D-糖苷连接、混合的β-1,3葡聚糖如谷类β-D-葡聚糖或木葡聚糖中的β-1,4键和含有纤维素成分的其它植物材料的内水解(endohydrolysis)。就本发明而言,根据Ghose,1987,Pure and Appl.Chem.59:257-268的方法,使用羧甲基纤维素(CMC)水解来测定内切葡聚糖酶活性。将一单位的内切葡聚糖酶活性定义为:在50℃、pH4.8,每分钟产生1.0微摩尔还原糖。
β-葡糖苷酶活性:术语“β-葡糖苷酶”在本申请中定义为β-D-葡糖苷葡糖水解酶(β-D-glucoside glucohydrolase)(E.C.3.2.1.21),其催化末端非还原性β-D-葡萄糖残基的水解,同时释放β-D-葡萄糖。就本发明而言,根据Venturi等,2002,J.Basic Microbiol.42:55-66记载的规程来确定β-葡糖苷酶活性,只是如本申请所述采用不同的条件。将一单位的β-葡糖苷酶活性定义为:在50℃、pH5,由100mM柠檬酸钠,0.01%20中的4mM作为底物的对硝基苯基-β-D-吡喃葡糖苷每分钟产生1.0微摩尔对硝基酚。
全长多肽:术语“全长多肽”在本申请中定义为具有生物学活性之多肽的前体形式,其中所述前体包含信号肽区,或者还包含前肽区,其中一旦从细胞分泌,所述信号肽被切割掉,或者所述前肽也被切割掉,从而产生具有生物学活性之多肽。
信号肽:术语“信号肽”在本申请中定义为以符合读码框的方式连接至多肽的氨基末端且指导所编码多肽进入细胞的分泌途径的肽。
信号肽编码序列:术语“信号肽编码序列”在本申请中定义为如下肽编码区,该肽编码区编码以符合读码框的方式连接至所编码多肽的氨基末端且指导所编码多肽进入细胞的分泌途径的氨基酸序列。
前肽:术语“前肽”在本申请中定义为以符合读码框的方式连接至多肽的氨基末端的肽。所得多肽称为酶原(proenzyme)或多肽原(propolypeptide)(或在一些情况下称为酶原(zymogen))。多肽原一般是没有活性的,而且可以通过前肽的催化或自催化切割从多肽原转变为成熟的活性多肽。当信号肽区和前肽区均存在于多肽的氨基末端时,则前肽区以符合读码框的方式连接至多肽的氨基末端,而信号肽区以符合读码框的方式连接至前肽区的氨基末端。
前肽编码序列:术语“前肽编码序列”在本申请中定义为如下肽编码区,该肽编码区编码以符合读码框的方式连接至多肽的氨基末端从而形成酶原或多肽原(或在一些情况下称为酶原)的氨基酸序列。
成熟多肽:术语“成熟多肽”在本申请中定义为在翻译和任何翻译后修饰(如N端加工、C端截短、糖基化、磷酸化等)后以其最终形式具有生物学活性的多肽。
催化结构域:术语“催化结构域”在本申请中定义为内切葡聚糖酶或具有生物学活性之多肽(例如β-葡糖苷酶活性)的氨基酸序列中拥有内切葡聚糖酶或具有生物学活性之多肽(例如β-葡糖苷酶)的催化活性的结构部分或区。催化结构域在本申请中也称为“核心”(core)区。
融合蛋白:术语“融合蛋白”在本申请中定义为显示生物学活性且包含至少内切葡聚糖酶的催化结构域和具有生物学活性之多肽(例如β-葡糖苷酶)的催化结构域二者的多肽。
β-葡糖苷酶融合蛋白:术语“β-葡糖苷酶融合蛋白”在本申请中定义为显示β-葡糖苷酶活性且包含至少β-葡糖苷酶催化结构域和内切葡聚糖酶的催化结构域二者的多肽。
融合蛋白的构件:术语“融合蛋白的构件”在本申请中定义为融合蛋白的(切割后的)片段个体,其中每个片段具有生物学活性且或是包含内切葡聚糖酶的至少催化结构域和具有生物学活性之多肽的至少催化结构域或是包含具有生物学活性之多肽的至少催化结构域。例如,融合蛋白中内切葡聚糖酶的至少催化结构域和具有生物学活性之多肽的至少催化结构域的构件之间切割位点(例如Kex2位点)的存在可导致具有内切葡聚糖酶活性之多肽和另一种具有生物学活性之多肽的产生。
β-葡糖苷酶融合蛋白的构件:术语“β-葡糖苷酶融合蛋白的构件”在本申请中定义为β-葡糖苷酶融合蛋白的(切割后的)片段个体,其中每个片段具有β-葡糖苷酶活性且或是至少内切葡聚糖酶的催化结构域和至少β-葡糖苷酶催化结构域或是至少β-葡糖苷酶催化结构域。例如,融合蛋白中内切葡聚糖酶和β-葡糖苷酶的构件之间切割位点(例如Kex2位点)的存在可导致具有内切葡聚糖酶活性之多肽和另一种具有β-葡糖苷酶活性之多肽的产生。
碳水化合物结合模块:术语“碳水化合物结合模块(CBM)”在本申请中定义为内切葡聚糖酶(纤维素酶)的氨基酸序列中牵涉内切葡聚糖酶结合纤维素(木质纤维素)的部分。碳水化合物结合模块一般通过使内切葡聚糖酶非共价结合纤维素、纤维素衍生物、或其多糖等同物来发挥功能。CBM通常独立于催化结构域来发挥功能。
融合蛋白构建体:术语“融合蛋白构建体”指由可操作连接的不同基因或其部分构成的核酸构建体。构件自5′端起包括编码至少内切葡聚糖酶的催化结构域的DNA分子和编码具有生物学活性之多肽的至少催化结构域的DNA分子。
β-葡糖苷酶融合物构建体:术语“β-葡糖苷酶融合物构建体”指由可操作连接的不同基因或其部分构成的核酸构建体。构件自5′端起包括编码至少内切葡聚糖酶的催化结构域的DNA分子和编码至少β-葡糖苷酶催化结构域的DNA分子。
分离的多肽:术语“分离的多肽”在用于本申请时指根据SDS-PAGE的测定,至少20%纯、优选至少40%纯、更优选至少60%纯、甚至更优选至少80%纯、最优选至少90%纯、且甚至最优选至少95%纯的多肽。
基本上纯的多肽:术语“基本上纯的多肽”在本申请中指包含至多10%、优选至多8%、更优选至多6%、更优选至多5%、更优选至多4%、更优选至多3%、甚至更优选至多2%、最优选至多1%、且甚至最优选至多0.5%(按重量计)与之天然地或重组地相关的(associated)其它多肽材料的多肽制备物。因此,优选的是,基本上纯的多肽是至少92%纯、优选至少94%纯、更优选至少95%纯、更优选至少96%纯、更优选至少96%纯、更优选至少97%纯、更优选至少98%纯、甚至更优选至少99%、最优选至少99.5%纯、且甚至最优选100%纯的,按制备物中存在的总多肽材料的重量计。本发明的多肽优选是基本上纯的形式,即多肽制备物基本上不含与之天然地或重组地相关的其它多肽材料。这可以如下来实现,例如通过众所周知的重组方法或通过经典的纯化方法来制备多肽。
同一性:参数“同一性”描述两个氨基酸序列之间或两个核苷酸序列之间的相关性。
就本发明而言,两个氨基酸序列之间的同一性程度使用Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)来确定,正如EMBOSS包(EMBOSS:The European Molecular Biology OpenSoftware Suite,Rice等,2000,Trends in Genetics 16:276-277)(优选3.0.0版或更后的)的Needle程序所执行的。所使用的任选参数是缺口开启罚分(gap openpenalty)为10,缺口延伸罚分(gap extension penalty)为0.5和EBLOSUM62(EMBOSS版的BLOSUM62)替代矩阵。将标记为“最长同一性(longest identity)”(使用-nobrief选项得到的)的Needle输出结果用作百分比同一性,并计算如下:
(相同残基x100)/(比对长度-比对中缺口的总数)
就本发明而言,两个脱氧核糖核苷酸序列之间的同一性程度使用Needleman-Wunsch算法(Needleman和Wunsch,1970,见上文)来确定,正如EMBOSS包(EMBOSS:The European Molecular Biology Open Software Suite,Rice等,2000,见上文)(优选3.0.0版或更后的)的Needle程序所执行的。所使用的任选参数是缺口开启罚分(gap opern penalty)为10,缺口延伸罚分(gapextension penalty)为0.5和EDNAFULL(EMBOSS版的NCBI NUC4.4)替代矩阵。将标记为“最长同一性”(使用-nobrief选项得到的)的Needle输出结果用作百分比同一性,并计算如下:
(相同脱氧核糖核苷酸x100)/(比对长度-比对中缺口的总数)
多肽片段:术语“多肽片段”在本申请中定义为从融合蛋白(例如β-葡糖苷酶融合蛋白)或其构件的氨基和/或羧基末端缺失了一个或几个氨基酸的多肽,其中所述片段具有生物学活性(例如β-葡糖苷酶活性)。
子序列(subsequence):术语“子序列”在本申请中定义为从多核苷酸的5′和/或3′端缺失了一个或几个核苷酸的核苷酸序列,其中所述子序列编码具有生物学活性(例如β-葡糖苷酶活性或内切葡聚糖酶活性)之多肽片段。
分离的多核苷酸:术语“分离的多核苷酸”在用于本申请时指的根据琼脂糖电泳的测定,至少20%纯、优选至少40%纯、更优选至少60%纯、甚至更优选至少80%纯、最优选至少90%纯、且甚至最优选至少95%纯的多核苷酸。
基本上纯的多核苷酸:术语“基本上纯的多核苷酸”在用于本申请时指不含其它外来的或不需要的核苷酸且处于适用于遗传工程蛋白质生产***的形式的多核苷酸制备物。如此,基本上纯的多核苷酸含有至多10%、优选至多8%、更优选至多6%、更优选至多5%、更优选至多4%、更优选至多3%、甚至更优选至多2%、最优选至多1%、且甚至最优选至多0.5%(按重量计)与之天然地或重组地相关的(associated)其它多核苷酸材料。然而,基本上纯的多核苷酸可以包含天然存在的5’和3’非翻译区,如启动子和终止子。优选的是,基本上纯的多核苷酸是按重量计至少90%纯、优选至少92%纯、更优选至少94%纯、更优选至少95%纯、更优选至少96%纯、更优选至少97%纯、甚至更优选至少98%纯、最优选至少99%、且甚至最优选至少99.5%纯的。多核苷酸优选是基本上纯的形式,即多核苷酸制备物基本上不含与之天然地或重组地相关的其它多核苷酸材料。多核苷酸可以是基因组、cDNA、RNA、半合成、合成起源的,或其任意组合。
cDNA:术语“cDNA”在本申请中定义为可以通过从得自真核细胞的成熟的、已剪接的mRNA分子反转录而制备的DNA分子。cDNA缺少通常存在于相应基因组DNA中的内含子序列。起始的(initial)、初级的RNA转录物是mRNA的前体,其通过一系列的步骤加工然后作为成熟的已剪接的mRNA出现。这些步骤包括通过称为剪接的过程去除内含子序列。因此,衍生自mRNA的cDNA缺少任何内含子序列。
核酸构建体:术语“核酸构建体”在用于本申请时指从天然存在的基因分离的或经修饰而以自然界其它情况中不会存在的方式包含核酸区段的核酸分子,其或是单链的或是双链的。在核酸构建体包含编码序列表达所需要的控制序列时,术语核酸构建体与术语“表达盒”同义。
控制序列:术语“控制序列”在本申请中定义为包括对于编码多肽的多核苷酸表达而言是必需的或有利的所有构件。每种控制序列对于编码多肽的核苷酸序列而言可以是天然的或外来的,或者彼此是天然的或外来的。此类控制序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列、和转录终止子。最低限度,控制序列包括启动子、及转录和翻译终止信号。为了导入特定限制性位点以便于将控制序列与编码多肽核苷酸序列的编码区连接,控制序列可以与接头一起提供。
可操作连接:术语“可操作连接”在本申请中指其中控制序列置于相对于多核苷酸序列的编码序列的适宜位置使得控制序列指导多肽编码序列的表达的构造。另外,术语“可操作连接”还涉及一起作为融合蛋白表达的相连接或融合的两条多核苷酸。
编码序列:在用于本申请时,术语“编码序列”指直接指定其蛋白质产物的氨基酸序列的核苷酸序列。编码序列的边界一般由开读框决定,其通常以ATG起始密码子或可替换的起始密码子如GTG和TTG开始,以终止密码子如TAA、TAG和TGA结束。编码序列可以是DNA、cDNA或重组的核苷酸序列。
表达:术语“表达”包括多肽生产中所牵涉的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰、和分泌。
表达载体:术语“表达载体”在本申请中定义为线性的或环状的DNA分子,其包含编码本发明多肽的多核苷酸且所述多核苷酸与用于其表达的其它核苷酸可操作连接。
宿主细胞:术语“宿主细胞”在用于本申请时包括易于(susceptible to)用包含多核苷酸的核酸构建体或表达载体转化、转染、转导等的任何细胞类型。
变体:在用于本申请时,术语“变体”指由表达经修饰核苷酸序列(例如SEQ ID NO:25或其同源序列或其成熟编码区)的生物体产生的具有生物学活性之多肽。经修饰核苷酸序列通过人为干预(human intervention)即通过修饰核苷酸序列(例如SEQ ID NO:23或其同源序列或其成熟编码区)来获得。修饰可以是一个或几个氨基酸的取代、缺失、和/或***,以及一个或几个氨基酸侧链的置换。
发明详述
本发明涉及用于产生具有生物学活性的分泌型多肽的方法,该方法包括:(a)用编码融合蛋白的融合蛋白构建体转化真菌宿主细胞,其中所述融合蛋白构建体包含:(i)包含编码信号肽的核苷酸序列的第一多核苷酸;(ii)包含编码内切葡聚糖酶的至少催化结构域或其部分的核苷酸序列的第二多核苷酸;和(iii)包含编码具有生物学活性之多肽的至少催化结构域或其部分的核苷酸序列的第三多核苷酸;其中所述信号肽和所述内切葡聚糖酶的至少催化结构域或其部分与不存在所述内切葡聚糖酶的至少催化结构域或其部分时相比提高所述具有生物学活性之多肽或其部分的分泌;(b)在适于产生所述融合蛋白的条件下培养所述经转化的真菌宿主细胞;和(c)自所述培养液回收所述融合蛋白、其构件或它们的组合,其中所述融合蛋白或其构件具有生物学活性。
在优选的方面,第一多核苷酸的3’端可操作连接第二多核苷酸的5’端且第二多核苷酸的3’端可操作连接第三多核苷酸的5’端。在另一个优选的方面,第一多核苷酸的3’端可操作连接第三多核苷酸的5’端且第三多核苷酸的3’端可操作连接第二多核苷酸的5’端,以编码融合蛋白。
通过将编码具有生物学活性之多肽或其部分的核苷酸序列与编码具有内切葡聚糖酶活性之多肽或其部分的核苷酸序列和编码信号肽的核苷酸序列(其与编码具有内切葡聚糖酶活性之多肽或其部分的核苷酸序列可操作连接)融合来产生融合蛋白。用于产生融合蛋白的技术是本领域已知的,包括例如连接编码多肽的编码序列使得它们符合读码框(in frame)且融合蛋白的表达处在同一启动子和终止子的控制下。也可以使用内含肽(intein)技术来构建融合蛋白,其中在翻译后产生融合物(Cooper等,1993,EMBO J.12:2575-2583;Dawson等,1994,Science 266:776-779)。
包含信号肽、内切葡聚糖酶的至少催化结构域或其部分、和具有生物学活性之多肽的至少催化结构域或其部分,具有生物学活性的融合蛋白与不存在所述内切葡聚糖酶的至少催化结构域或其部分时相比提高了融合蛋白的分泌。具有生物学活性的融合蛋白的分泌与不存在内切葡聚糖酶的至少催化结构域相比的增加是至少5%、优选至少10%、更优选至少25%、甚至更优选至少50%、更优选至少100%、甚至更优选至少150%、甚至更优选至少200%、最优选至少500%、且甚至最优选至少1000%。
在下文每一个优选的方面,融合蛋白构建体(核酸构建体)的构件是自构建体的5’端至3’端可操作连接的。
在优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸;和包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸;和包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸;和包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸;和包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸;和包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸;和包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含的编码内切葡聚糖酶的成熟多肽的核苷酸序列多核苷酸;和包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸;和包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸;和包含编码具有生物学活性之多肽的全长多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码具有生物学活性之多肽的全长多肽的核苷酸序列的多核苷酸;和包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸;和包含编码具有生物学活性之多肽的全长多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码具有生物学活性之多肽的全长多肽的核苷酸序列的多核苷酸;和包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码内切葡聚糖酶(信号肽和成熟多肽)全长多肽的核苷酸序列的多核苷酸;和包含编码具有生物学活性之多肽的全长多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码具有生物学活性之多肽的全长多肽的核苷酸序列的多核苷酸;和包含编码内切葡聚糖酶(信号肽和成熟多肽)全长多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;和包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;和包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;和包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;和包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;和包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;和包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;和包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;和包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;和包含编码具有生物学活性之多肽的全长多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码具有生物学活性之多肽的全长多肽的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;和包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;和包含编码具有生物学活性之多肽的全长多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码具有生物学活性之多肽的全长多肽的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;和包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸;包含编码另一信号肽的核苷酸序列的多核苷酸;和包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸;包含编码另一信号肽的核苷酸序列的多核苷酸;和包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸;包含编码另一信号肽的核苷酸序列的多核苷酸;和包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸;包含编码另一信号肽的核苷酸序列的多核苷酸;和包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸;包含编码另一信号肽的核苷酸序列的多核苷酸;和包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸;包含编码另一信号肽的核苷酸序列的多核苷酸;和包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸;包含编码另一信号肽的核苷酸序列的多核苷酸;和包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸;包含编码另一信号肽的核苷酸序列的多核苷酸;和包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;包含编码另一信号肽的核苷酸序列的多核苷酸;和包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;包含编码另一信号肽的核苷酸序列的多核苷酸;和包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;包含编码另一信号肽的核苷酸序列的多核苷酸;和包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;包含编码另一信号肽的核苷酸序列的多核苷酸;和包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;包含编码另一信号肽的核苷酸序列的多核苷酸;和包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;包含编码另一信号肽的核苷酸序列的多核苷酸;和包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;包含编码另一信号肽的核苷酸序列的多核苷酸;和包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;和包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;包含编码另一信号肽的核苷酸序列的多核苷酸;和包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,对于上文每一个优选的方面,多核苷酸可以编码内切葡聚糖酶或具有生物学活性之多肽的催化结构域的部分、成熟多肽的部分、或全长多肽的部分。所述内切葡聚糖酶的部分可以具有或不具有内切葡聚糖酶活性。在更优选的方面,所述内切葡聚糖酶的部分具有内切葡聚糖酶活性。
在上文每一个优选的方面,融合蛋白构建体的构件进一步包含启动子区和/或终止子区。
内切葡聚糖酶及其多核苷酸
编码内切葡聚糖酶的催化结构域、成熟多肽、或全长多肽,或其部分的多核苷酸可以自任何生物体获得。就本发明而言,术语“多肽”理解为包括全长多肽、成熟多肽、或催化结构域;或其具有活性的部分或片段。术语“自...得到的”或“得自”在本申请中与给定来源一起使用时意味着由核苷酸序列编码的多肽是由所述来源或由其中已经***了来自所述来源的核苷酸序列的菌株产生的。
许多内切葡聚糖酶具有由通过接头肽与碳水化合物结合结构域分隔开的催化结构域组成的多结构域结构(Suurnakki等,2000,Cellulose 7:189-209)。所述催化结构域包含活性位点,而所述CBM通过使酶与其结合而与纤维素相互作用(van Tilbeurgh等,1986,FEBS Letters 204:223-227;Tomme等,1988,European Journal of Biochemistry 170:575-581)。
编码具有内切葡聚糖酶活性之多肽的多核苷酸可以自编码细菌多肽的基因获得。例如,所述多肽可以是***多肽,包括但不限于芽孢杆菌属(Bacillus)、链球菌属(Streptococcus)、链霉菌属(Streptomyces)、葡萄球菌属(Staphylococcus)、肠球菌属(Enterococcus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、梭菌属(Clostridium)、地芽孢杆菌属(Geobacillus)或Oceanobacillus多肽,例如嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、凝结芽孢杆菌(Bacillus coagulans)、灿烂芽孢杆菌(Bacilluslautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacillus licheniformis)、巨大芽孢杆菌(Bacillus megaterium)、嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)、苏云金芽孢杆菌(Bacillusthuringiensis)、似马链球菌(Streptococcus equisimilis)、酿脓链球菌(Streptococcus pyogenes)、***链球菌(Streptococcus uberis)、和马链球菌兽瘟亚种(Streptococcus equi subsp.Zooepidemicus)、和浅青紫链霉菌(Streptomyceslividans)、或鼠灰链霉菌(Streptomyces murinus)多肽;或革兰氏阴性细菌多肽,包括但不限于大肠埃希氏菌或大肠杆菌(E.coli)、假单胞菌属(Pseudomonas)、沙门氏菌属(Salmonella)、弯曲杆菌属(Campylobacter)、螺杆菌属(Helicobacter)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、泥杆菌属(Ilyobacter)、奈瑟氏菌属(Neisseria)、或脲原体属(Ureaplasma)多肽。
可用作本发明方法中多核苷酸来源的细菌内切葡聚糖酶的例子包括但不限于解纤维热酸菌(Acidothermus cellulolyticus)内切葡聚糖酶(WO 91/05039;WO 93/15186;美国专利No.5,275,944;WO 96/02551;美国专利No.5,536,655,WO 00/70031,WO 05/093050);Thermobifida fusca内切葡聚糖酶III(WO05/093050);和Thermobifida fusca内切葡聚糖酶V(WO 05/093050)。
编码具有内切葡聚糖酶活性之多肽的多核苷酸可以自编码真菌多肽的基因获得,更优选酵母多肽,如假丝酵母属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、(糖)酵母属(Saccharomyces)、裂殖(糖)酵母属(Schizosaccharomyces)、或耶氏酵母(西洋蓍霉)属(Yarrowia)多肽;或更优选丝状真菌多肽,如枝顶孢霉属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、枝鼻菌属(Cladorrhinum)、隐球菌属(Cryptococcus)、篮状菌属(Filibasidium)、镰孢属(Fusarium)、腐质霉属(Humicola)、梨孢菌属(Magnaporthe)、毛霉属Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、瘤胃壶菌属(Piromyces)、裂褶菌属(Schizophyllum)、踝节菌属(Talaromyces)、热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、或木霉属(Trichoderma)多肽。
在优选的方面,编码具有内切葡聚糖酶活性之多肽的多核苷酸可以自编码如下多肽的基因获得,卡尔酵母(Saccharomyces carlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)、或卵形酵母(Saccharomyces oviformis)多肽。
在另一个优选的方面,编码具有内切葡聚糖酶活性之多肽的多核苷酸可以自编码如下多肽的基因获得,棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillus awamori)、烟曲霉(Aspergillus fumigatus)、臭曲霉(Aspergillusfoetidus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillus oryzae)、Cladorrhinumfoecundissimum、杆孢状镰孢(Fusarium bactridioides)、禾谷镰孢(Fusariumcerealis)、库威镰孢(Fusarium crookwellense)、大刀镰孢(Fusarium culmorum)、禾本科镰孢(Fusarium graminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢(Fusarium negundi)、尖镰孢(Fusariumoxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、圆镰孢(Fusarium torulosum)、拟丝孢镰孢(Fusarium trichothecioides)、镶片镰孢(Fusarium venenatum)、特异腐质霉(Humicola insolens)、疏棉状腐质霉(Humicola lanuginosa)、米赫毛霉(Mucor miehei)、嗜热毁丝霉(Myceliophthorathermophila)、粗糙脉孢菌(Neurospora crassa)、产紫青霉(Penicilliumpurpurogenum)、无色梭孢壳(Thielavia achromatica)、Thielavia albomyces、Thielavia albopilosa、Thielavia australeinsis、Thielavia fimeti、小孢梭孢壳(Thielavia microspora)、卵孢梭孢壳(Thielavia ovispora)、Thielavia peruviana、瘤孢梭孢壳(Thielavia spededonium)、毛梭孢壳(Thielavia setosa)、Thielaviasubthermophila、土生梭孢霉(Thielavia terrestris)、栖土梭孢壳(Thielaviaterricola)、嗜热梭孢壳(Thielavia thermophila)、Thielavia variospora、Thielaviawareingii、哈茨木霉(Trichoderma harzianum)、康宁木霉(Trichodermakoningii)、长枝木霉(Trichoderma longibrachiatum)、里氏木霉(Trichodermareesei)、或绿色木霉(Trichoderma viride)多肽。
可用作本发明方法中多核苷酸来源的真菌内切葡聚糖酶的例子包括但不限于里氏木霉EG1(Penttila等,1986,Gene 45:253-263;GENBANKTM登录号M15665);里氏木霉EG2(Saloheimo,等,1988,Gene 63:11-22;GENBANKTM登录号M19373);里氏木霉EG3(Okada等,1988,Appl.Environ.Microbiol.64:555-563;GENBANKTM登录号AB003694);里氏木霉EG4(Saloheimo等,1997,Eur.J.Biochem.249:584-591;GENBANKTM登录号Y11113);和里氏木霉EG5(Saloheimo等,1994,Molecular Microbiology 13:219-228;GENBANKTM登录号Z33381);棘孢曲霉内切葡聚糖酶(Ooi等,1990,Nucleic Acidss Research 18:5884);川地曲霉(Aspergillus kawachii)(Sakamoto等,1995,Current Genetics27:435-439);胡萝卜软腐欧文氏菌(Erwinia carotovara)内切葡聚糖酶(Saarilahti等,1990,Gene 90:9-14);尖镰孢(GENBANKTM登录号L29381);灰色腐质酶高温变种(Humicola grisea var.thermoidea)(GENBANKTM登录号AB003107);Melanocarpus abomyces(GENBANKTM登录号MAL515703);和粗糙脉孢菌(GENBANKTM登录号XM 324477)。
许多糖基水解酶家族中披露了其它内切葡聚糖酶,所述糖基水解酶家族使用根据Henrissat B.,1991,A classification of glycosyl hydrolases based onamino-acid sequence similarities,Biochem.J.280:309-316及Henrissat B.和Bairoch A.,1996,Updating the sequence-based classification of glycosylhydrolases,Biochem.J.316:695-696的分类方法。
用于分离或克隆编码具有内切葡聚糖酶活性之多肽的多核苷酸的技术是本领域已知的,包括自基因组DNA分离、自cDNA制备、或其组合。自此类基因组DNA克隆多核苷酸可以如下来实现,例如通过使用众所周知的聚合酶链式反应(PCR)或抗体筛选表达文库以检测所克隆的具有共同结构特征的DNA片段。参见例如Innis等,1990,PCR:A Guide to Methods and Application,Academic Press,New York。可以使用其它核酸扩增方法,如连接酶链式反应(LCR)、连接活化的转录(LAT)和基于核苷酸序列的扩增(NASBA)。
应当理解,对于上述物种,本发明涵盖完全和不完全两个阶段(perfectand imperfect states),和其它分类学的等同物(equivalent),例如无性型(anamorph),而无论它们已知的种名。本领域技术人员将容易地识别适宜等同物的身份。
公众能够在许多培养物保藏中心容易地取得这些种的菌株,如美国典型培养物保藏中心(American Type Culture Collection)(ATCC)、德意志微生物和细胞培养物保藏中心(Deutsche Sammlung von Mikroorganismen undZellkulturen GmbH)(DSM)、真菌菌种保藏中心(Centraalbureau VoorSchimmelcultures)(CBS)、和农业研究机构专利培养物保藏中心北区研究中心(Agricultural Research Service Patent Culture Collection,Northern RegionalResearch Center)(NRRL)。
在优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自内切葡聚糖酶I基因获得的多核苷酸编码的。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自内切葡聚糖酶II基因获得的多核苷酸编码的。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自内切葡聚糖酶III基因获得的多核苷酸编码的。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自内切葡聚糖酶IV基因获得的多核苷酸编码的。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自内切葡聚糖酶V基因获得的多核苷酸编码的。在更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自特异腐质霉内切葡聚糖酶V基因获得的多核苷酸编码的。在最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自特异腐质霉内切葡聚糖酶V基因获得的多核苷酸编码的,所述特异腐质霉内切葡聚糖酶V基因编码SEQ ID NO:2之多肽。在另一个最优选的方面,内切葡聚糖酶的全长多肽,或其部分是由自特异腐质霉内切葡聚糖酶V基因获得的多核苷酸编码的,所述特异腐质霉内切葡聚糖酶V基因编码SEQ ID NO:2之全长多肽。在另一个最优选的方面,内切葡聚糖酶的成熟多肽,或其部分是由自特异腐质霉内切葡聚糖酶V基因获得的多核苷酸编码的,所述特异腐质霉内切葡聚糖酶V基因编码SEQ ID NO:2之成熟多肽。在另一个最优选的方面,内切葡聚糖酶的催化结构域,或其部分是由自特异腐质霉内切葡聚糖酶V基因获得的多核苷酸编码的,所述特异腐质霉内切葡聚糖酶V基因编码SEQ ID NO:2之催化结构域。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自特异腐质霉内切葡聚糖酶V基因获得的多核苷酸编码的,所述特异腐质霉内切葡聚糖酶V基因包含SEQ ID NO:1。在另一个最优选的方面,内切葡聚糖酶的全长多肽,或其部分是由自特异腐质霉内切葡聚糖酶V基因获得的多核苷酸编码的,所述特异腐质霉内切葡聚糖酶V基因包含SEQ ID NO:1。在另一个最优选的方面,内切葡聚糖酶的成熟多肽,或其部分是由自特异腐质霉内切葡聚糖酶V基因获得的多核苷酸编码的,所述特异腐质霉内切葡聚糖酶V基因包含SEQ ID NO:1之成熟多肽编码序列。在另一个最优选的方面,内切葡聚糖酶的催化结构域,或其部分是由自特异腐质霉内切葡聚糖酶V基因获得的多核苷酸编码的,所述特异腐质霉内切葡聚糖酶V基因包含SEQ ID NO:1之催化结构域编码序列。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自内切葡聚糖酶VI基因获得的多核苷酸编码的。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自家族5内切葡聚糖酶基因获得的多核苷酸编码的。在更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自嗜热毁丝霉CBS 117.65内切葡聚糖酶基因获得的多核苷酸编码的。在最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自嗜热毁丝霉CBS 117.65内切葡聚糖酶基因获得的多核苷酸编码的,所述嗜热毁丝霉CBS 117.65内切葡聚糖酶基因编码SEQ ID NO:4之多肽。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自嗜热毁丝霉CBS 117.65内切葡聚糖酶基因获得的多核苷酸编码的,所述嗜热毁丝霉CBS 117.65内切葡聚糖酶基因包含SEQ IDNO:3。在另一个更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自担子菌纲(Basidiomycete)CBS 495.95内切葡聚糖酶基因获得的多核苷酸编码的。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自担子菌纲CBS 495.95内切葡聚糖酶基因获得的多核苷酸编码的,所述担子菌纲CBS 495.95内切葡聚糖酶基因编码SEQ ID NO:6之多肽。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自担子菌纲CBS495.95内切葡聚糖酶基因获得的多核苷酸编码的,所述担子菌纲CBS 495.95内切葡聚糖酶基因包含SEQ ID NO:5。在另一个更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自担子菌纲CBS494.95内切葡聚糖酶基因获得的多核苷酸编码的。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自担子菌纲CBS 494.95内切葡聚糖酶基因获得的多核苷酸编码的,所述担子菌纲CBS 494.95内切葡聚糖酶基因编码SEQ ID NO:8之多肽。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自担子菌纲CBS 494.95内切葡聚糖酶基因获得的多核苷酸编码的,所述担子菌纲CBS 494.95内切葡聚糖酶基因包含SEQ ID NO:7。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自家族6内切葡聚糖酶基因获得的多核苷酸编码的。在另一个更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自土生梭孢霉NRRL 8126CEL6B内切葡聚糖酶基因获得的多核苷酸编码的。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自土生梭孢霉NRRL 8126 CEL6B内切葡聚糖酶基因获得的多核苷酸编码的,所述土生梭孢霉NRRL 8126 CEL6B内切葡聚糖酶基因编码SEQ ID NO:10之多肽。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自土生梭孢霉NRRL 8126 CEL6B内切葡聚糖酶基因获得的多核苷酸编码的,所述土生梭孢霉NRRL 8126 CEL6B内切葡聚糖酶基因包含SEQ ID NO:9。在另一个更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自土生梭孢霉NRRL 8126 CEL6C内切葡聚糖酶基因获得的多核苷酸编码的。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自土生梭孢霉NRRL 8126 CEL6C内切葡聚糖酶基因获得的多核苷酸编码的,所述土生梭孢霉NRRL 8126 CEL6C内切葡聚糖酶基因编码SEQ ID NO:12之多肽。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自土生梭孢霉NRRL 8126CEL6C内切葡聚糖酶基因获得的多核苷酸编码的,所述土生梭孢霉NRRL8126 CEL6C内切葡聚糖酶基因包含SEQ ID NO:11。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自家族7内切葡聚糖酶基因获得的多核苷酸编码的。在另一个更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶基因获得的多核苷酸编码的。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶基因获得的多核苷酸编码的,所述土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶基因编码SEQ ID NO:14之多肽。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶基因获得的多核苷酸编码的,所述土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶基因包含SEQ ID NO:13。在另一个更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自土生梭孢霉NRRL 8126 CEL7E内切葡聚糖酶基因获得的多核苷酸编码的。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自土生梭孢霉NRRL 8126 CEL7E获得的多核苷酸编码的,所述土生梭孢霉NRRL 8126 CEL7E内切葡聚糖酶基因编码SEQ ID NO:16之多肽。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自土生梭孢霉NRRL 8126 CEL7E内切葡聚糖酶基因获得的多核苷酸编码的,所述土生梭孢霉NRRL 8126 CEL7E内切葡聚糖酶基因包含SEQ ID NO:15。在另一个更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自土生梭孢霉NRRL 8126CEL7F内切葡聚糖酶基因获得的多核苷酸编码的。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自土生梭孢霉NRRL 8126 CEL7F内切葡聚糖酶基因获得的多核苷酸编码的,所述土生梭孢霉NRRL 8126 CEL7F内切葡聚糖酶基因编码SEQ ID NO:18之多肽。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自土生梭孢霉NRRL 8126 CEL7F内切葡聚糖酶基因获得的多核苷酸编码的,所述土生梭孢霉NRRL 8126 CEL7F内切葡聚糖酶基因包含SEQ ID NO:17。在另一个更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自Cladorrhinum foecundissimum ATCC62373 CEL7A内切葡聚糖酶基因获得的多核苷酸编码的。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自Cladorrhinum foecundissimum ATCC 62373 CEL7A内切葡聚糖酶基因获得的多核苷酸编码的,所述Cladorrhinum foecundissimum ATCC 62373 CEL7A内切葡聚糖酶基因编码SEQ ID NO:20之多肽。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自Cladorrhinum foecundissimum ATCC 62373 CEL7A内切葡聚糖酶基因获得的多核苷酸编码的,所述Cladorrhinum foecundissimum ATCC 62373 CEL7A内切葡聚糖酶基因包含SEQ ID NO:19。
在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自里氏木霉菌株No.VTT-D-80133内切葡聚糖酶基因获得的多核苷酸编码的,所述里氏木霉菌株No.VTT-D-80133内切葡聚糖酶基因编码SEQ ID NO:22(GENBANKTM登录号M15665)之多肽。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自里氏木霉菌株No.VTT-D-80133内切葡聚糖酶基因获得的多核苷酸编码的,所述里氏木霉菌株No.VTT-D-80133内切葡聚糖酶基因包含SEQ IDNO:21(GENBANKTM登录号M15665)。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自家族9内切葡聚糖酶基因获得的多核苷酸编码的。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自家族12内切葡聚糖酶基因获得的多核苷酸编码的。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自家族45内切葡聚糖酶基因获得的多核苷酸编码的。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自家族74内切葡聚糖酶基因获得的多核苷酸编码的。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自编码同源多肽的基因获得的多核苷酸编码的,所述同源多肽包含氨基酸序列,该氨基酸序列与SEQ ID NO:2、SEQ ID NO:4、SEQID NO:6、或SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、或SEQ ID NO:22之全长多肽、成熟多肽、或催化结构域的氨基酸序列具有至少60%、优选至少65%、更优选至少70%、更优选至少75%、更优选至少80%、更优选至少85%、甚至更优选至少90%、最优选至少95%、且甚至最优选96%、97%、98%、或99%的同一性程度,其具有内切葡聚糖酶活性。在优选的方面,同源多肽具有与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、或SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQID NO:20、或SEQ ID NO:22之全长多肽、成熟多肽、或催化结构域差别为10个氨基酸、优选5个氨基酸、更优选4个氨基酸、甚至更优选3个氨基酸、最优选2个氨基酸、且甚至最优选1个氨基酸的氨基酸序列。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由包含如下核苷酸序列的多核苷酸编码的,所述核苷酸序列在很低的严格条件、优选低的严格条件、更优选中等严格条件、更优选中等-高的严格条件、甚至更优选高的严格条件、和最优选很高的严格条件下与(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、或SEQ ID NO:7、SEQ IDNO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、或SEQ ID NO:21,(ii)SEQ ID NO:1、SEQ ID NO:3、SEQID NO:5、或SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、或SEQ ID NO:21中所包含的cDNA序列,(iii)(i)或(ii)的子序列,或(iv)(i)、(ii)或(iii)的互补链发生杂交(J.Sambrook,E.F.Fritsch,和T.Maniatis,1989,Molecular Cloning,ALaboratory Manual,第2版,Cold Spring Harbor,New York)。SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、或SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、或SEQ ID NO:21的子序列包含至少100个连续的核苷酸或优选至少200个连续的核苷酸。
SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、或SEQ ID NO:7、SEQ IDNO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、或SEQ ID NO:21的核苷酸序列或其子序列,以及SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、或SEQ ID NO:8、SEQ ID NO:10、SEQ IDNO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、或SEQ ID NO:22的氨基酸序列或其片段可以用于设计核酸探针,以根据本领域众所周知的方法自不同属或种的菌株鉴定和克隆编码具有内切葡聚糖酶活性之多肽的DNA。具体而言,遵循标准的Southern印迹方法,此类探针可用于与感兴趣的属或种的基因组或cDNA杂交,以鉴定和分离其中相应的基因。此类探针可明显短于完整序列,但长度上应为至少14、优选至少25、更优选至少35、和最优选至少70个核苷酸。然而,优选核酸探针长度上是至少100个核苷酸。例如,核酸探针长度上可以是至少200个核苷酸、优选至少300个核苷酸、更优选至少400个核苷酸、或最优选至少500个核苷酸。可以使用甚至更长的探针,例如长度上是至少600个核苷酸、至少优选至少700个核苷酸、更优选至少800个核苷酸、或最优选至少900个核苷酸的核酸探针。DNA和RNA两种探针都可使用。通常将探针标记用于检测相应的基因(例如用32P、3H、35S、生物素或抗生物素蛋白(avidin)标记)。此类探针涵盖在本发明中。
因此,可以对自此类其它生物体制备的基因组DNA或cDNA文库筛选与上文所述探针发生杂交且编码具有内切葡聚糖酶活性之多肽的DNA。可以通过琼脂糖或聚丙烯酰胺凝胶电泳或其它分离技术分离来自此类其它生物体的基因组或其它DNA。可以将来自文库的DNA或分离的DNA转移至硝酸纤维素或其它合适的载体材料并固定化于其上。为了鉴定与上文所述序列同源的克隆或DNA,将所述载体材料用在Southern印迹中。
就本发明而言,杂交表示核苷酸序列在很低的至很高的严格条件下与经过标记的核酸探针发生杂交,所述核酸探针对应于上文所述核苷酸序列之一。可使用X射线片来检测在这些条件下核酸探针与之发生杂交的分子。
对于长度为至少100个核苷酸的长探针,很低的至很高的严格条件定义为遵循标准的Southern印迹方法,在42℃,在5X SSPE,0.3%SDS,200μg/ml经剪切和变性的鲑精DNA,和25%甲酰胺(用于很低的和低的严格性)、35%甲酰胺(用于中等和中等-高的严格性)、或50%甲酰胺(用于很高的严格性)中进行预杂交和杂交,最佳的是12-24小时。
对于长度为至少100个核苷酸的长探针,将载体材料最终优选在45℃(很低的严格性)、更优选在50℃(低的严格性)、更优选在55℃(中等严格性)、更优选在60℃(中等-高的严格性)、甚至更优选在65℃(高的严格性)、和最优选在70℃(很高的严格性)使用2X SSC,0.2%SDS清洗三次各15分钟。
对于长度为约15个核苷酸至约70个核苷酸的短探针,严格条件定义为遵循标准的Southern印迹方法在比使用根据Bolton和McCarthy(1962,Proceedings of the National Academy of Sciences USA 48:1390)的算法得出的计算Tm低约5℃到约10℃的温度在0.9M NaCl,0.09M Tris-HCl pH7.6,6mMEDTA,0.5%NP-40,1X Denhardt氏溶液,1mM焦磷酸钠,1mM磷酸二氢钠,0.1mM ATP,和0.2mg/ml酵母RNA中进行预杂交、杂交和杂交后清洗,最佳的是12-24小时。
对于长度为约15个核苷酸至约70个核苷酸的短探针,将载体材料在比计算Tm低5℃到10℃的温度在6X SCC加0.1%SDS中清洗一次15分钟和使用6XSSC清洗两次各15分钟。
具有生物学活性之多肽及其多核苷酸
分泌很差或根本不分泌的任何多肽可用于本发明的方法。所述多肽可以是任何具有感兴趣生物学活性之多肽。所述具有生物学活性之多肽对于感兴趣的真菌宿主细胞而言可以是天然的或异源的(外来的)。术语“异源多肽”在本申请中定义为对于宿主细胞而言不是天然的多肽;或者为了改变天然多肽已经进行了结构修饰的天然多肽。
在优选的方面,多肽是抗体、抗原、抗微生物肽、酶、生长因子、激素、免疫扩张剂(immunodilator)、神经递质、受体、报道蛋白、或结构蛋白。
在另一个优选的方面,多肽是白蛋白、胶原、原弹性蛋白、弹性蛋白、或明胶。
在更优选的方面,多肽是氧化还原酶、转移酶、水解酶、裂合酶、异构酶、或连接酶。
在甚至更优选的方面,多肽是α-淀粉酶、α-1,3-葡聚糖酶、α-半乳糖苷酶、α-葡糖苷酶、α-1,6-甘露糖苷酶、氨肽酶、淀粉酶、***糖酶、β-琼脂(水解)酶β-淀粉酶、β-1,3-葡聚糖酶、β-1,6-葡聚糖酶、β-半乳糖苷酶、β-葡糖苷酶、β-甘露糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、壳聚糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、右旋糖苷酶、内切-1,4-β-半乳聚糖酶、内切-1,6-β-半乳聚糖酶、酯酶、岩藻糖苷酶、葡糖淀粉酶、葡糖脑苷脂酶、透明质酸酶、菊粉酶(inulinase)、转化酶、漆酶、果聚糖酶(levanase)、地衣淀粉酶(licheninase)、脂肪酶、溶菌酶、甘露糖苷酶、变位酶(mutanase)、氧化酶、果胶水解酶、过氧化物酶、磷脂酶、肌醇六磷酸酶、多聚半乳糖醛酸酶、多酚氧化酶、蛋白水解酶、鼠李半乳糖醛酸酶、鼠李糖苷酶、核糖核酸酶、海藻糖酶、转谷氨酰胺酶、糖基转移酶、尿激酶、或木聚糖酶。
在另一个甚至更优选的方面,多肽是纤维素分解酶或纤维素酶。纤维素分解酶的例子包括但不限于内切葡聚糖酶、纤维二糖水解酶、和β-葡糖苷酶。帮助纤维素分解酶作用的其它蛋白质为具有纤维素水解增强活性的多肽(参见例如WO 2005/074647,WO 2005/074656,和美国已公开申请2007/0077630)。
在最优选的方面,多肽是内切葡聚糖酶。在另一个最优选的方面,多肽是纤维二糖水解酶。在另一个最优选的方面,多肽是β-葡糖苷酶。在另一个最优选的方面,多肽是具有纤维素水解增强活性的多肽。
在另一个更优选的方面,多肽是半纤维素酶。半纤维素酶可分成三大类:攻击多糖链内的内部键的内切作用酶,自多糖链的还原端或非还原端渐进作用的外切作用酶,和水解木质素糖苷键的酯酶(如香豆酸酯酶和阿魏酸酯酶)、乙酰酯酶和辅助酶(Wong,K.K.Y.,Tan,L.U.L.,和Saddler,J.N.,1988,Multiplicity of β-1,4-xylanase in microorganisms:Functions and applications,Microbiol.Rev.52:305-317;Tenkanen,M.,和Poutanen,K.,1992,Significanceof esterases in the degradation of xylans,于Xylans and Xylanases,Visser,J.,Beldman,G.,Kuster-van Someren,M.A.,和Voragen,A.G.J.,编,Elsevier,New York,NY,203-212;Coughlan,M.P.,和Hazlewood,G.P.,1993,Hemicellulose and hemicellulases,Portland,London,UK;Brigham,J.S.,Adney,W.S.,和Himmel,M.E.,1996,Hemicellulases:Diversity and applications,于Handbook on Bioethanol:Production and Utilization,Wyman,C.E.,编,Taylor& Francis,Washington,DC,119-141)。
半纤维素酶包括但不限于木聚糖酶、***呋喃糖苷酶、乙酰木聚糖酯酶、葡糖醛酸糖苷酶(glucuronidase)、内切半乳聚糖酶、甘露聚糖酶、内切或外切***糖酶、外切半乳聚糖酶、及其混合物。内切作用的半纤维素酶和辅助酶的例子包括但不限于内切***聚糖酶、内切***半乳聚糖酶、内切葡聚糖酶、内切甘露聚糖酶、内切木聚糖酶、和阿魏酰***木聚糖(feraxan)内切木聚糖酶。外切作用的半纤维素酶和辅助酶的例子包括但不限于α-L-***糖苷酶、β-L-***糖苷酶、α-1,2-L-岩藻糖苷酶、α-D-半乳糖苷酶、β-D-半乳糖苷酶、β-D-葡糖苷酶、β-D-葡糖醛酸糖苷酶、β-D-甘露糖苷酶、β-D-木糖苷酶、外切葡糖苷酶、外切纤维二糖水解酶、外切甘露二糖水解酶、外切甘露聚糖酶、外切木聚糖酶、木聚糖α-葡糖醛酸糖苷酶、和松柏苷β-葡糖苷酶。酯酶的例子包括但不限于乙酰酯酶(乙酰半乳聚糖酯酶、乙酰甘露聚糖酯酶、和乙酰木聚糖酯酶)和芳基酯酶(香豆酸酯酶和阿魏酸酯酶)。
在另一个最优选的方面,多肽是木聚糖酶。在另一个最优选的方面,多肽是木葡聚糖酶。在另一个最优选的方面,多肽是***呋喃糖苷酶。在另一个最优选的方面,多肽是葡糖醛酸糖苷酶,例如α-葡糖醛酸糖苷酶。在另一个最优选的方面,多肽是内切半乳聚糖酶。在另一个最优选的方面,多肽是甘露聚糖酶。在另一个最优选的方面,多肽是内切***糖酶。在另一个最优选的方面,多肽是外切***糖酶。在另一个最优选的方面,多肽是内切***聚糖酶。在另一个最优选的方面,多肽是内切***半乳聚糖酶。在另一个最优选的方面,多肽是内切葡聚糖酶。在另一个最优选的方面,多肽是内切甘露聚糖酶。在另一个最优选的方面,多肽是内切木聚糖酶。在另一个最优选的方面,多肽是阿魏酰***木聚糖内切木聚糖酶。在另一个最优选的方面,多肽是α-L-***糖苷酶。在另一个最优选的方面,多肽是β-L-***糖苷酶。在另一个最优选的方面,多肽是β-葡聚糖酶。在另一个最优选的方面,多肽是α-1,2-L-岩藻糖苷酶。在另一个最优选的方面,多肽是α-D-半乳糖苷酶。在另一个最优选的方面,多肽是β-D-半乳糖苷酶。在另一个最优选的方面,多肽是β-D-葡糖苷酶。在另一个最优选的方面,多肽是β-D-葡糖醛酸糖苷酶。在另一个最优选的方面,多肽是β-D-甘露糖苷酶。在另一个最优选的方面,多肽是β-D-木糖苷酶。在另一个最优选的方面,多肽是外切葡糖苷酶。在另一个最优选的方面,多肽是外切甘露二糖水解酶。在另一个最优选的方面,多肽是外切甘露聚糖酶。在另一个最优选的方面,多肽是外切木聚糖酶。在另一个最优选的方面,多肽是木聚糖α-葡糖醛酸糖苷酶。在另一个最优选的方面,多肽是松柏苷β-葡糖苷酶。
在另一个更优选的方面,多肽是酯酶。在用于本申请时,“酯酶”也称为羧酸酯水解酶,指作用于酯键的酶,包括根据酶命名法(EnzymeNomenclature,1992,Academic Press,San Diego,California,及Supplement(补遗)1(1993),Supplement 2(1994),Supplement 3(1995),Supplement 4(1997)和Supplement 5,分别于Eur.J.Biochem.223:1-5,1994;Eur.J.Biochem.232:1-6,1995;Eur.J.Biochem.237:1-5,1996;Eur.J.Biochem.250:1-6,1997;和Eur.J.Biochem.264:610-650,1999)归入EC 3.1.1羧酸酯水解酶的酶。酯酶的非限制性例子包括芳基酯酶、三酰甘油脂肪酶、乙酰酯酶、乙酰胆碱酯酶、胆碱酯酶、托品酯酶、果胶酯酶、固醇酯酶、叶绿素酶、L-***糖酸内酯酶、葡萄糖酸内酯酶、尿内酯酶、鞣酶、棕榈酸视黄酯酯酶、羟基丁酸二聚体水解酶、酰基甘油脂肪酶、3-氧己二酸根烯醇-内酯酶、1,4-内酯酶、半乳糖脂肪酶、4-吡哆醇内酯酶、酰基肉碱水解酶、氨酰-tRNA水解酶、D-***糖酸内酯酶、6-磷酸葡萄糖酸内酯酶、磷脂酶A1、6-乙酰葡萄糖脱乙酰基酶、脂蛋白脂肪酶、二氢香豆素脂肪酶、柠檬苦素-D-环-内酯酶、类固醇-内酯酶、三乙酸根-内酯酶、放线菌素内酯酶、苔色酸根-缩酚酸水解酶、头孢菌素-C脱乙酰基酶、绿原酸根水解酶、α-氨基酸酯酶、4-甲基草酰乙酸根酯酶、羧基甲烯丁烯羟酸内酯酶(carboxymethylenebutenolidase)、脱氧limonateA-环-内酯酶、2-乙酰基-1-烃基甘油磷酸胆碱酯酶、镰孢氨酸-C鸟氨酸酯酶、芥子碱酯酶、蜡酯水解酶、佛波二酯水解酶、磷脂酰肌醇脱酰基酶、唾液酸根O-乙酰酯酶、乙酰氧基丁炔基并噻吩脱乙酰基酶、乙酰水杨酸根脱乙酰基酶、乙酸甲基伞形基酯脱乙酰基酶、2-吡喃酮-4,6-二羧酸根内酯酶、N-乙酰半乳糖胺聚糖脱乙酰基酶、保幼-激素酯酶、双(2-乙基己基)酞酸根酯酶、蛋白质-谷氨酸根甲基酯酶、11-顺式-棕榈酸视黄酯水解酶、全-反式-棕榈酸视黄酯水解酶、L-鼠李糖-1,4-内酯酶、5-(3,4-双乙酸基丁-1-炔基)-2,2′-并噻吩脱乙酰基酶、脂肪-酰基-乙基-酯合酶、木糖-1,4-内酯酶、N-乙酰葡萄糖胺基磷脂酰肌醇脱乙酰基酶、西曲酸酯苄基酯酶、和乙酰基烃基甘油乙酰水解酶。可用于纤维素生物转化的酯酶包括乙酰酯酶,如乙酰半乳聚糖酯酶、乙酰甘露聚糖酯酶、和乙酰木聚糖酯酶,及水解木质素糖苷键的酯酶,如香豆酸酯酶和阿魏酸酯酶。
在另一个最优选的方面,多肽是乙酰酯酶。在另一个最优选的方面,多肽是乙酰半乳聚糖酯酶。在另一个最优选的方面,多肽是乙酰甘露聚糖酯酶。在另一个最优选的方面,多肽是乙酰木聚糖酯酶。在另一个最优选的方面,多肽是芳基酯酶。在另一个最优选的方面,多肽是香豆酸酯酶。在另一个最优选的方面,多肽是阿魏酸酯酶。
在另一个更优选的方面,多肽是脂肪酶。在另一个更优选的方面,多肽是磷脂酶,例如磷脂酶A1、磷脂酶A2、磷脂酶C、磷脂酶C、或磷脂酶D。
在另一个更优选的方面,多肽是角质酶。
在另一个最优选的方面,多肽是葡萄糖异构酶。在另一个最优选的方面,多肽是木糖异构酶。
在另一个更优选的方面,多肽是蛋白水解酶。蛋白酶是本领域众所周知的,指催化肽键切割的酶。
在另一个最优选的方面,多肽是丝氨酸蛋白酶。在另一个最优选的方面,多肽是金属蛋白酶。在另一个最优选的方面,多肽是硫醇(thiol)蛋白酶。
在另一个更优选的方面,多肽是肽酶。在另一个最优选的方面,多肽是氨肽酶,例如二肽基氨肽酶或三肽基氨肽酶。在另一个最优选的方面,多肽是羧肽酶。
在另一个更优选的方面,多肽是漆酶。
在另一个更优选的方面,多肽是过氧化物酶。
在另一个更优选的方面,多肽是淀粉降解酶。在另一个最优选的方面,多肽是α-淀粉酶。在另一个最优选的方面,多肽是淀粉葡糖苷酶。在另一个最优选的方面,多肽是支链淀粉酶。在另一个最优选的方面,多肽是脱支酶。在另一个最优选的方面,多肽是环糊精糖基转移酶。
编码具有生物学活性之多肽的催化结构域、成熟多肽、或全长多肽,或其部分的多核苷酸可以自任何生物体获得。
编码具有生物学活性之多肽的多核苷酸可以自编码细菌多肽的基因获得。例如,多肽可以是***多肽,包括但不限于芽孢杆菌属、链球菌属、链霉菌属、葡萄球菌属、肠球菌属、乳杆菌属、乳球菌属、梭菌属、地芽孢杆菌属或Oceanobacillus多肽;或者革兰氏阴性细菌多肽,包括但不限于大肠埃希氏菌或大肠杆菌、假单胞菌属、沙门氏菌属、弯曲杆菌属、螺杆菌属、黄杆菌属、梭杆菌属、泥杆菌属、奈瑟氏菌属或脲原体属多肽。
在优选的方面,编码具有生物学活性之多肽的多核苷酸可以自编码如下多肽的基因获得:嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、或苏云金芽孢杆菌多肽。
在另一个优选的方面,编码具有生物学活性之多肽的多核苷酸可以自编码如下多肽的基因获得:似马链球菌、酿脓链球菌、***链球菌、或马链球菌兽瘟亚种多肽。
在另一个优选的方面,编码具有生物学活性之多肽的多核苷酸可以自编码如下多肽的基因获得:不产色链霉菌(Streptomyces achromogenes)、阿维链霉菌(Streptomyces avermitilis)、天蓝链霉菌(Streptomyces coelicolor)、灰色链霉菌(Streptomyces griseus)、或浅青紫链霉菌多肽。
编码具有生物学活性之多肽的多核苷酸也可以自编码真菌多肽基因获得,更优选酵母多肽,如假丝酵母属、克鲁维酵母属、毕赤酵母属、糖酵母属或酵母属、裂殖糖酵母属或裂殖酵母属、或耶氏酵母(西洋蓍霉)属多肽;或更优选丝状真菌多肽,如枝顶孢霉属、蘑菇属(Agaricus)、链格孢属(Alternaria)、曲霉属、短梗霉属、葡萄座腔菌属(Botryospaeria)、拟蜡菌属(Ceriporiopsis)、毛壳霉属(Chaetomidium)、金孢子菌属(Chrysosporium)、麦角菌属(Claviceps)、旋孢霉属(Cochliobolus)、鬼伞属(Coprinopsis)、Coptotermes、棒囊壳属(Corynascus)、隐球丛赤壳属(Cryphonectria)、隐球菌属、色二孢属(Diplodia)、黑耳属(Exidia)、篮状菌属(Filibasidium)、镰孢属、赤霉属(Gibberella)、全鞭毛虫属(Holomastigotoides)、腐质霉属、耙菌属(Irpex)、香菇属(Lentinula)、小球腔菌属(Leptospaeria)、梨孢菌属、Melanocarpus、亚灰树花菌属(Meripilus)、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属(Phanerochaete)、瘤胃壶菌属、Poitrasia、假黑盘菌属(Pseudoplectania)、Pseudotrichonympha、根毛霉属(Rhizomucor)、裂褶菌属、柱霉属(Scytalidium)、踝节菌属、热子囊菌属、梭孢壳属、弯颈霉属、木霉属、长毛盘菌属(Trichophaea)、轮枝孢属(Verticillium)、小包脚菇属(Volvariella)、或炭角菌属(Xylaria)多肽。
在优选的方面,编码具有生物学活性之多肽的多核苷酸可以自编码如下多肽的基因获得:卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母、或卵形酵母多肽。
在另一个优选的方面,编码具有内切葡聚糖酶活性之多肽的多核苷酸可以自编码如下多肽的基因获得:纤维分解枝顶孢霉(Acremoniumcellulolyticus)、棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、嗜角质金孢子菌(Chrysosporium keratinophilum)、Chrysosporium lucknowense、热带金孢子菌(Chrysosporium tropicum)、Chrysosporium merdarium、Chrysosporium inops、毡金孢子菌(Chrysosporiumpannicola)、Chrysosporium queenslandicum、Chrysosporium zonatum、Cladorrhinum foecundissimum、杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、灰色腐质酶(Humicola grisea)、特异腐质霉、疏棉状腐质霉、乳色耙菌(Irpex lacteus)、米赫毛霉、嗜热毁丝霉、粗糙脉孢菌、绳状青霉(Penicillium funiculosum)、产紫青霉、黄孢平革菌(Phanerochaetechrysosporium)、无色梭孢壳、Thielavia albomyces、Thielavia albopilosa、Thielavia australeinsis、Thielavia fimeti、小孢梭孢壳、卵孢梭孢壳、Thielaviaperuviana、瘤孢梭孢壳、毛梭孢壳、Thielavia subthermophila、土生梭孢霉、Thielavia variospora、Thielavia wareingii、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、或绿色木霉多肽。
在一个特别优选的方面,具有生物学活性之多肽是β-葡糖苷酶。可用作本发明方法中的多核苷酸来源的β-葡糖苷酶的例子包括但不限于米曲霉β-葡糖苷酶(WO 02/095014;WO 04/099228);棘孢曲霉β-葡糖苷酶(Kawaguchi等,1996,Gene 173:287-288);燕麦曲霉(Aspergillus avenaceus)(GENBANKTM登录号AY943971);烟曲霉(GENBANKTM登录号XM745234);川地曲霉(GENBANKTM登录号AB003470);黑曲霉(GENBANKTM AJ132386);灰色梨孢菌(Magnaporthe grisea)(GENBANKTM登录号AY849670);黄孢平革菌(GENBANKTM登录号AB253327);埃默森篮状菌(Talaromyces emersonii)(GENBANKTM登录号AY072918);和里氏木霉(GENBANKTM登录号U09580,AB003110,AY281374,AY281375,AY281377,AY281378,和AY281379)。β-葡糖苷酶变体也可用作多核苷酸来源,如WO 04/099228中披露的那些。
在优选的方面,β-葡糖苷酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自家族1β-葡糖苷酶基因获得的多核苷酸编码的。
在另一个优选的方面,β-葡糖苷酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自家族3β-葡糖苷酶基因获得的多核苷酸编码的。
在另一个优选的方面,β-葡糖苷酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自米曲霉β-葡糖苷酶基因获得的多核苷酸编码的。在最优选的方面,β-葡糖苷酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自米曲霉β-葡糖苷酶基因或米曲霉β-葡糖苷酶突变体基因获得的多核苷酸编码的,所述米曲霉β-葡糖苷酶基因包含编码SEQ ID NO:24之多肽的SEQID NO:23,所述米曲霉β-葡糖苷酶突变体基因包含编码SEQ ID NO:26之多肽的SEQ ID NO:25。
在另一个优选的方面,β-葡糖苷酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自烟曲霉β-葡糖苷酶基因获得的多核苷酸编码的。在最优选的方面,β-葡糖苷酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自烟曲霉β-葡糖苷酶基因获得的多核苷酸编码的,所述烟曲霉β-葡糖苷酶基因包含编码SEQ ID NO:28之多肽的SEQ ID NO:27。
在另一个优选的方面,β-葡糖苷酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自巴西青霉(Penicillium brasilianum)菌株IBT 20888β-葡糖苷酶基因获得的多核苷酸编码的。在最优选的方面,β-葡糖苷酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自巴西青霉菌株IBT 20888β-葡糖苷酶基因获得的多核苷酸编码的,所述巴西青霉菌株IBT 20888β-葡糖苷酶基因包含编码SEQ ID NO:30之多肽的SEQ ID NO:29。
在另一个优选的方面,β-葡糖苷酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自里氏木霉菌株No.QM9414β-葡糖苷酶基因获得的多核苷酸编码的。在另一个最优选的方面,β-葡糖苷酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自里氏木霉菌株No.QM9414β-葡糖苷酶基因获得的多核苷酸编码的,所述里氏木霉菌株No.QM9414β-葡糖苷酶基因包含编码SEQ ID NO:32之多肽的SEQ ID NO:31(GENBANKTM登录号U09580)。
在另一个优选的方面,β-葡糖苷酶是天然分泌的。在另一个优选的方面,β-葡糖苷酶不是天然分泌的。
在另一个优选的方面,β-葡糖苷酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自编码同源多肽的基因获得的多核苷酸编码的,所述同源多肽包含氨基酸序列,该氨基酸序列与SEQ ID NO:24、SEQ ID NO:26、SEQID NO:28、SEQ ID NO:30、或SEQ ID NO:32之全长多肽、成熟多肽、或催化结构域的氨基酸序列具有至少60%、优选至少65%、更优选至少70%、更优选至少75%、更优选至少80%、更优选至少85%、甚至更优选至少90%、最优选至少95%、且甚至最优选96%、97%、98%、或99%的同一性程度,其具有内切葡聚糖酶活性。在优选的方面,同源多肽具有与SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、或SEQ ID NO:32之全长多肽、成熟多肽、或催化结构域差别为10个氨基酸、优选5个氨基酸、更优选4个氨基酸、甚至更优选3个氨基酸、最优选2个氨基酸、且甚至最优选1个氨基酸的氨基酸序列。
在另一个优选的方面,β-葡糖苷酶的全长多肽、成熟多肽、或催化结构域,或其部分是由如下多核苷酸编码的,所述多核苷酸在很低的严格条件、优选低的严格条件、更优选中等严格条件、更优选中等-高的严格条件、甚至更优选高的严格条件、和最优选很高的严格条件下与(i)SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、或SEQ ID NO:31,(ii)SEQID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、或SEQ ID NO:31中所包含的cDNA序列,(iii)(i)或(ii)的子序列,或(iv)(i)、(ii)或(iii)的互补链发生杂交(J.Sambrook,E.F.Fritsch,和T.Maniatis,1989,Molecular Cloning,A Laboratory Manual,第2版,Cold Spring Harbor,New York)。SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、或SEQ ID NO:31的子序列包含至少100个连续的核苷酸或优选至少200个连续的核苷酸。
SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、或SEQ ID NO:31的核苷酸序列或其子序列,以及SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、或SEQ ID NO:32的氨基酸序列或其片段可以用于设计核酸探针,以根据本领域众所周知的方法自不同属或种的菌株鉴定和克隆编码具有β-葡糖苷酶活性之多肽的DNA。具体而言,遵循标准的Southern印迹方法,此类探针可用于与感兴趣的属或种的基因组或cDNA杂交,以鉴定和分离其中相应的基因。此类探针可明显短于完整序列,但长度上应为至少14、优选至少25、更优选至少35、和最优选至少70个核苷酸。然而,优选核酸探针长度上是至少100个核苷酸。例如,核酸探针长度上可以是至少200个核苷酸、优选至少300个核苷酸、更优选至少400个核苷酸、或最优选至少500个核苷酸。可以使用甚至更长的探针,例如长度上是至少600个核苷酸、至少优选至少700个核苷酸、更优选至少800个核苷酸、或最优选至少900个核苷酸的核酸探针。DNA和RNA两种探针都可使用。通常将探针标记以检测相应的基因(例如用32P、3H、35S、生物素或抗生物素蛋白标记)。此类探针涵盖在本发明中。
信号肽
信号肽可以是由用于本发明融合蛋白胞外分泌的宿主细胞识别的任何适宜信号肽。信号序列优选是与待表达融合蛋白的内切葡聚糖酶构件天然相关的信号序列。
编码多肽的核苷酸序列的编码序列的5’端可以内在地包含与编码分泌型多肽的编码区区段以符合翻译读码框的方式天然相连接的信号肽编码区。或者,编码序列的5’端可以包含对于编码序列而言是外来的信号肽编码区。在编码序列天然不包含信号肽编码区的情况中,可能需要外来信号肽编码区。或者,外来信号肽编码区可以仅仅替换天然信号肽编码区,以增强多肽的分泌。然而,本发明可使用指导所表达融合蛋白进入所选宿主细胞的分泌途径,即分泌入培养基的任何信号肽编码区。
对于丝状真菌宿主细胞有效的信号肽编码序列是自以下酶的基因获得的信号肽编码序列:米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米赫根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、和疏棉状腐质霉脂肪酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、和里氏木霉β-木糖苷酶。
对于酵母宿主细胞有用的信号肽编码序列是自以下酶的基因获得的:酿酒酵母α-因子和酿酒酵母转化酶。其它有用的信号肽编码序列披露于Romanos等,1992,见上文。
在优选的方面,信号肽编码序列得自编码内切葡聚糖酶的基因。在更优选的方面,信号肽编码序列得自编码内切葡聚糖酶V的基因。在甚至更优选的方面,信号肽编码序列得自编码内切葡聚糖酶V的特异腐质霉基因。在最优选的方面,信号肽编码序列编码SEQ ID NO:2的氨基酸1-21。在另一个最优选的方面,信号肽编码序列是SEQ ID NO:1的核苷酸1-63。
融合蛋白可以进一步包含与融合蛋白的β-葡糖苷酶构件相关的第二信号肽。信号肽编码序列可以是与具有生物学活性之多肽的编码序列天然相关的信号肽编码序列,或者可以是不同的信号肽编码序列,如上文所述那些之一。
在优选的方面,信号肽编码序列是与β-葡糖苷酶编码序列天然相关的序列。
接头
如上所述,许多内切葡聚糖酶具有多结构域结构,其由通过接头肽与一个或几个碳水化合物结合模块分隔开的催化结构域组成。在本发明的方法中,融合蛋白构建体可进一步包含接头编码序列,其位于包含内切葡聚糖酶的催化结构域的序列的3′和包含具有生物学活性之多肽的催化结构域的序列的5′。
接头可以自与内切葡聚糖酶的催化结构域相同的基因获得,或者自不同的内切葡聚糖酶基因获得。另一方面,接头可以是合成起源的。
可用于本发明方法的接头的例子包括但不限于自以下酶的基因获得的接头:里氏木霉纤维二糖水解酶I(Srisodsuk等,1993,Journal of BiologicalChemistry 268:20765-20761);红褐肉座菌(Hypocrea jecorina)(以前的里氏木霉)Cel7A纤维二糖水解酶(Mulakala等,2005,Proteins 60:598-605);特异腐质霉内切葡聚糖酶V;和土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶。
在优选的方面,接头得自特异腐质霉内切葡聚糖酶基因。在另一个优选的方面,接头得自里氏木霉内切葡聚糖酶基因。在更优选的方面,接头得自特异腐质霉内切葡聚糖酶V(eg5)基因。
在另一个优选的方面,接头得自土生梭孢霉内切葡聚糖酶基因。在另一个更优选的方面,接头得自土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶基因。
在优选的方面,接头是至少5个氨基酸残基。在更优选的方面,接头是至少15个氨基酸残基。在最优选的方面,接头是至少25个氨基酸残基。
在优选的方面,接头为约5个-约60个氨基酸残基。在更优选的方面,接头为约15个-约50个氨基酸残基。在最优选的方面,接头为约25个-约45个氨基酸残基。
碳水化合物结合模块
碳水化合物结合模块(CBM)定义为具有离散折叠结构(discrete fold)(其具有碳水化合物结合活性)且常见于碳水化合物活性酶内的连续氨基酸序列。许多类型的CBM已有记载,其中大多数结合不溶性多糖(参见Boraston等,2004,Biochem J.382:769-781)。
碳水化合物结合模块已经表征为介导与例如结晶纤维素、非结晶纤维素、几丁质、β-1,3-葡聚糖和β-1,3-1,4-混合连接的葡聚糖、木聚糖、甘露聚糖、半乳聚糖和淀粉的相互作用。碳水化合物结合模块频繁出现于多结构域纤维素酶中。虽然有些CBM赋予对碳水化合物结构子集的特异性结合,但是其它CBM在它们与各种多糖结合的能力方面是更普遍性的。赋予对纤维素的结合的CBM有时称为纤维素结合结构域或CBD(Boraston等,2004,Biochem J.382:769-781)。CBM根据氨基酸相似性来分组;当前记载了48个CBM家族。
糖苷水解酶可以包含超过一个催化结构域和一个、两个、三个、或更多个CBM,且任选进一步包含一个或几个将CBM与催化结构域连接的多肽氨基酸序列区,后一种类型的区常常称为“接头”。包含CBM的水解酶的例子有纤维素酶、木聚糖酶、甘露聚糖酶、***呋喃糖苷酶(arabinofuranosidase)、乙酰酯酶和几丁质酶(参见P.Tomme等,Cellulose-Binding Domains-Classification和Properties in Enzymatic Degradation of Insoluble Carbohydrates,John N.Saddler和Michael H.Penner(编),ACS Symposium Series,No.618,1996)。
CBM可以位于蛋白质或多肽的N或C端或者位于内部位置。多肽或蛋白质中构成CBM的区域通常由超过约30个且不足约250个氨基酸残基组成。例如,家族I中列举和归类的那些CBM由33-37个氨基酸残基组成,家族2a中列举和归类的那些由95-108个氨基酸残基组成,而家族6中列举和归类的那些由85-92个氨基酸残基组成。因而,构成CBM的氨基酸序列的分子量通常在约4kDa至约40kDa的范围内,通常低于(below)约35kDa。
在本发明的方法中,可以使用任何CBM。CBM可以是与内切葡聚糖酶天然相关的,或者对于内切葡聚糖酶而言可以是外来的。
在优选的方面,CBM得自里氏木霉内切葡聚糖酶(EG)基因。在更优选的方面,CBM得自里氏木霉内切葡聚糖酶EGI基因。在另一个更优选的方面,CBM得自里氏木霉内切葡聚糖酶EGII基因。在另一个更优选的方面,CBM得自里氏木霉内切葡聚糖酶EGV基因。
在另一个优选的方面,CBM得自里氏木霉纤维二糖水解酶(CBH)基因。在另一个优选的方面,CBM得自里氏木霉CBHI基因(Terri等,1987,Gene 51:42-52;Linder和Teeri,1996,Biochemistry 93:12251-12255)。在另一个优选的方面,CBM得自里氏木霉CBHII基因。
在另一个优选的方面,CBM得自土生梭孢霉内切葡聚糖酶基因。在另一个更优选的方面,CBM得自土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶基因。
切割位点
在本发明的方法中,融合蛋白构建体可以进一步包含编码切割位点的核苷酸序列。切割位点优选位于包含内切葡聚糖酶的至少催化结构域的序列和包含具有生物学活性之多肽的至少催化结构域的序列之间。在融合蛋白分泌后,所述位点受到切割,自融合蛋白释放具有生物学活性之多肽。
切割位点的例子包括但不限于编码二肽Lys-Arg的Kex2位点(Martin等,2003,J.Ind.Microbiol.Biotechnol.3:568-76;Svetina等,2000,J.Biotechnol.76:245-251;Rasmussen-Wilson等,1997,Appl.Environ.Microbiol.63:3488-3493;Ward等,1995,Biotechnology 13:498-503;和Contreras等,1991,Biotechnology9:378-381)、Ile-(Glu或Asp)-Gly-Arg位点(其在精氨酸残基之后受到因子Xa蛋白酶切割)(Eaton等,1986,Biochem.25:505-512);Asp-Asp-Asp-Asp-Lys位点(其在赖氨酸之后受到肠激酶的切割)(Collins-Racie等,1995,Biotechnology13:982-987);His-Tyr-Glu位点或His-Tyr-Asp位点(其受到Genenase I的切割)(Carter等,1989,Proteins:Structure,Function,and Genetics 6:240-248);Leu-Val-Pro-Arg-Gly-Ser位点(其在Arg之后受到凝血酶的切割)(Stevens,2003,Drug Discovery World 4:35-48);Glu-Asn-Leu-Tyr-Phe-Gln-Gly位点(其在Gln之后受到TEV蛋白酶的切割)(Stevens,2003,见上文);和Leu-Glu-Val-Leu-Phe-Gln-Gly-Pro位点(其在Gln之后受到遗传工程形式的人鼻病毒3C蛋白酶的切割)(Stevens,2003,见上文)。
融合蛋白
本发明具有生物学活性的融合蛋白(其包含信号肽、内切葡聚糖酶的至少催化结构域或其部分、和具有生物学活性之多肽的至少催化结构域或其部分)与不存在所述内切葡聚糖酶的至少催化结构域或其部分时相比提高融合蛋白的分泌。在下文每一个优选的方面,融合蛋白的构件自蛋白质的N端至C端以符合读码框的方式相连接。
在优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的催化结构域;和具有生物学活性之多肽的催化结构域。
在另一个优选的方面,融合蛋白包含信号肽;具有生物学活性之多肽的催化结构域;和内切葡聚糖酶的催化结构域。
在另一个优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的成熟多肽;和具有生物学活性之多肽的催化结构域。
在另一个优选的方面,融合蛋白包含信号肽;具有生物学活性之多肽的催化结构域;和内切葡聚糖酶的成熟多肽。
在另一个优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的催化结构域;和具有生物学活性之多肽的成熟多肽。
在另一个优选的方面,融合蛋白包含信号肽;具有生物学活性之多肽的成熟多肽;和内切葡聚糖酶的催化结构域。
在另一个优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的成熟多肽;和具有生物学活性之多肽的成熟多肽。
在另一个优选的方面,融合蛋白包含信号肽;具有生物学活性之多肽的成熟多肽;和内切葡聚糖酶的成熟多肽。
在另一个优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的催化结构域;和具有生物学活性之多肽的全长多肽。
在另一个优选的方面,融合蛋白包含信号肽;具有生物学活性之多肽的全长多肽;和内切葡聚糖酶的催化结构域。
在另一个优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的成熟多肽;和具有生物学活性之多肽的全长多肽。
在另一个优选的方面,融合蛋白包含信号肽;具有生物学活性之多肽的全长多肽;和内切葡聚糖酶的成熟多肽。
在另一个优选的方面,融合蛋白包含内切葡聚糖酶的全长多肽(信号肽和成熟多肽);和具有生物学活性之多肽的全长多肽。
在另一个优选的方面,融合蛋白包含具有生物学活性之多肽的全长多肽和内切葡聚糖酶的全长多肽(信号肽和成熟多肽)。
在另一个优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的催化结构域、接头和/或碳水化合物结合模块;和具有生物学活性之多肽的催化结构域。
在另一个优选的方面,融合蛋白包含信号肽;具有生物学活性之多肽的催化结构域、接头和/或碳水化合物结合模块;和内切葡聚糖酶的催化结构域。
在另一个优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的成熟多肽、接头和/或碳水化合物结合模块;和具有生物学活性之多肽的催化结构域。
在另一个优选的方面,融合蛋白包含信号肽;具有生物学活性之多肽的催化结构域、接头和/或碳水化合物结合模块;和内切葡聚糖酶的成熟多肽。
在另一个优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的催化结构域、接头和/或碳水化合物结合模块;和具有生物学活性之多肽的成熟多肽。
在另一个优选的方面,融合蛋白包含信号肽;具有生物学活性之多肽的成熟多肽、接头和/或碳水化合物结合模块;和内切葡聚糖酶的催化结构域。
在另一个优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的成熟多肽、接头和/或碳水化合物结合模块;和具有生物学活性之多肽的成熟多肽。
在另一个优选的方面,融合蛋白包含信号肽;具有生物学活性之多肽的成熟多肽、接头和/或碳水化合物结合模块;和内切葡聚糖酶的成熟多肽。
在另一个优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的催化结构域、接头和/或碳水化合物结合模块;和具有生物学活性之多肽的全长多肽。
在另一个优选的方面,融合蛋白包含信号肽;具有生物学活性之多肽的全长多肽、接头和/或碳水化合物结合模块;和内切葡聚糖酶的催化结构域。
在另一个优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的成熟多肽、接头和/或碳水化合物结合模块;和具有生物学活性之多肽的全长多肽。
在另一个优选的方面,融合蛋白包含信号肽;具有生物学活性之多肽的全长多肽、接头和/或碳水化合物结合模块;和内切葡聚糖酶的成熟多肽。
在另一个优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的催化结构域;第二信号肽;和具有生物学活性之多肽的催化结构域。
在另一个优选的方面,融合蛋白包含信号肽;具有生物学活性之多肽的催化结构域;第二信号肽;和内切葡聚糖酶的催化结构域。
在另一个优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的成熟多肽;第二信号肽;和具有生物学活性之多肽的催化结构域。
在另一个优选的方面,融合蛋白包含信号肽;具有生物学活性之多肽的催化结构域;第二信号肽;和内切葡聚糖酶的成熟多肽。
在另一个优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的催化结构域;第二信号肽;和具有生物学活性之多肽的成熟多肽。
在另一个优选的方面,融合蛋白包含信号肽;具有生物学活性之多肽的成熟多肽;第二信号肽;和内切葡聚糖酶的催化结构域。
在另一个优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的成熟多肽;第二信号肽;和具有生物学活性之多肽的成熟多肽。
在另一个优选的方面,融合蛋白包含信号肽;具有生物学活性之多肽的成熟多肽;第二信号肽;和内切葡聚糖酶的成熟多肽。
在另一个优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的催化结构域、接头和/或碳水化合物结合模块;第二信号肽;和具有生物学活性之多肽的催化结构域。
在另一个优选的方面,融合蛋白包含信号肽;具有生物学活性之多肽的催化结构域、接头和/或碳水化合物结合模块;第二信号肽;和内切葡聚糖酶的催化结构域。
在另一个优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的成熟多肽、接头和/或碳水化合物结合模块;第二信号肽;和具有生物学活性之多肽的催化结构域。
在另一个优选的方面,融合蛋白包含信号肽;具有生物学活性之多肽的催化结构域、接头和/或碳水化合物结合模块;第二信号肽;和内切葡聚糖酶的成熟多肽。
在另一个优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的催化结构域、接头和/或碳水化合物结合模块;第二信号肽;和具有生物学活性之多肽的成熟多肽。
在另一个优选的方面,融合蛋白包含信号肽;具有生物学活性之多肽的成熟多肽、接头和/或碳水化合物结合模块;第二信号肽;和内切葡聚糖酶的催化结构域。
在另一个优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的成熟多肽、接头和/或碳水化合物结合模块;第二信号肽;和具有生物学活性之多肽的成熟多肽。
在另一个优选的方面,融合蛋白包含信号肽;和具有生物学活性之多肽的成熟多肽、接头和/或碳水化合物结合模块;第二信号肽;和内切葡聚糖酶的成熟多肽。
或者,在另一个优选的方面,对于上文每一个优选的方面,融合蛋白可以包含内切葡聚糖酶或具有生物学活性之多肽的催化结构域、成熟多肽、或全长多肽的一部分。内切葡聚糖酶的一部分可以具有或不具有内切葡聚糖酶活性。在更优选的方面,内切葡聚糖酶的一部分具有内切葡聚糖酶活性。
启动子
启动子区可以是受到用于融合蛋白表达的宿主细胞识别的任何适宜启动子序列。启动子序列包含介导多肽表达的转录控制序列。启动子可以是在所选择宿主细胞中显示出转录活性的任何核苷酸序列,包括突变的、截短的、串联的、和杂合的启动子,而且可以自编码胞外或胞内多肽的基因获得,所述基因对于宿主细胞而言可以是天然的或外来的(异源的)。启动子的例子包括组成型启动子和诱导型启动子二者。
用于指导本发明的融合蛋白构建体转录,尤其是在细菌宿主细胞中转录的合适启动子的实例是从下述获得的启动子:大肠杆菌lac操纵子、天蓝色链霉菌(Streptomyces coelicolor)琼脂糖酶基因(dagA)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌产麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因、及原核β-内酰胺酶基因(Villa-Kamaroff等,1978,Proceedings of the National Academy of SciencesUSA 75:3727-3731),以及tac启动子(DeBoer等,1983,Proceedings of theNational Academy of Sciences USA 80:21-25)。另外的启动子记载于″Usefulproteins from recombinant bacteria″于Scientific American,1980,242:74-94;及Sambrook等,1989,见上文。
用于指导本发明的融合蛋白构建体在丝状真菌宿主细胞中转录的合适启动子的实例是从以下酶的基因获得的启动子:米曲霉TAKA淀粉酶、米赫根毛霉天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、构巢曲霉乙酰胺酶、镶片镰孢淀粉葡糖苷酶(WO00/56900)、镶片镰孢Daria(WO 00/56900)、镶片镰孢Quinn(WO 00/56900)、尖镰孢胰蛋白酶样蛋白酶(WO 96/00787)、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶、灰盖鬼伞(Coprinus cinereus)β-微管蛋白、和里氏木霉Swollenin,以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉丙糖磷酸异构酶基因的启动子的杂合体);和它们的突变的、截短的和杂合的启动子。
在酵母宿主中,有用的启动子从如下酶的基因获得:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1,ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)、和酿酒酵母3-磷酸甘油酸激酶。对于酵母宿主细胞其它有用的启动子记载于Romanos等,1992,Yeast 8:423-488。
在优选的方面,启动子是纤维二糖水解酶启动子。在更优选的方面,启动子是纤维二糖水解酶I(cbh1)启动子。在甚至更优选的方面,启动子是里氏木霉纤维二糖水解酶I基因(cbh1)启动子。在最优选的方面,启动子是SEQ IDNO:29(GENBANKTM登录号D86235)的核苷酸505-1501之里氏木霉cbh1启动子。在另一个更优选的方面,启动子是纤维二糖水解酶II(cbh2)启动子。在另一个甚至更优选的方面,启动子是里氏木霉纤维二糖水解酶II基因(cbh2)启动子。在另一个最优选的方面,启动子是SEQ ID NO:30(GENBANKTM登录号M55080)的核苷酸1-582之里氏木霉cbh2启动子。
在另一个优选的方面,启动子是NA2-tpi启动子。在另一个优选的方面,启动子是TAKA淀粉酶启动子。在另一个优选的方面,启动子是镶片镰孢淀粉葡糖苷酶启动子。在另一个优选的方面,启动子是尖镰孢胰蛋白酶样蛋白酶启动子。在另一个优选的方面,启动子是黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)启动子。
在优选的方面,启动子区驱动第一、第二、和第三多核苷酸、或者还有第四多核苷酸的表达。
终止子
终止子可以是受到宿主细胞识别以终止转录的任何合适的转录终止子序列。终止子序列可操作连接编码多肽的核苷酸序列的3’端。本发明可以使用在所选择宿主细胞中有功能的任何终止子。
对于丝状真菌宿主细胞优选的终止子从如下酶的基因获得:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶、和尖镰孢胰蛋白酶样蛋白酶。
对于酵母宿主细胞优选的终止子从如下酶的基因获得:酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)、和酿酒酵母甘油醛-3-磷酸脱氢酶。对于酵母宿主细胞其它有用的终止子记载于Romanos等,1992,见上文。
在优选的方面,终止子是纤维二糖水解酶基因终止子。在更优选的方面,终止子是纤维二糖水解酶I基因(cbh1)终止子。在甚至更优选的方面,终止子是里氏木霉纤维二糖水解酶I基因(cbh1)终止子。在最优选的方面,终止子是SEQ ID NO:31之里氏木霉cbh1终止子。在另一个更优选的方面,终止子是纤维二糖水解酶II基因(cbh2)终止子。在另一个甚至更优选的方面,终止子是里氏木霉纤维二糖水解酶II基因(cbh2)终止子。在另一个最优选的方面,终止子是SEQ ID NO:32之里氏木霉cbh2终止子。
在另一个优选的方面,终止子是TAKA淀粉酶终止子。在另一个优选的方面,启动子是尖镰孢胰蛋白酶样蛋白酶终止子。在另一个优选的方面,启动子是黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)终止子。
其它调节序列
融合蛋白构建体可以进一步包含其它调控元件,如前导序列、多聚腺苷酸化序列、和其它元件。
调节序列还可以是合适的前导序列,其是mRNA中对于宿主细胞进行的翻译而言重要的非翻译区。前导序列可操作地连接于编码融合蛋白的核苷酸序列的5’端。本发明可以使用在所选择宿主细胞中有功能的任何前导序列。
对于丝状真菌宿主细胞优选的前导序列从如下酶的基因获得:米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶。
对于酵母宿主细胞合适的前导序列从如下酶的基因获得:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子、和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。
调节序列也可以是聚腺苷酸化序列,其是可操作地连接于核苷酸序列的3’端的序列,并且在转录时,宿主细胞将其识别为信号以将聚腺苷残基添加至转录的mRNA。本发明可以使用在所选择宿主细胞中有功能的任何聚腺苷酸化序列。
对于丝状真菌宿主细胞优选的聚腺苷酸化序列从如下酶的基因获得:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖镰孢胰蛋白酶样蛋白酶、和黑曲霉α-葡糖苷酶。
对于酵母宿主细胞有用的聚腺苷酸化序列记载于Guo和Sherman,1995,Molecular Cellular Biology 15:5983-5990。
可能还期望添加调节序列,其允许相对于宿主细胞的生长来调节多肽的表达。调节***的例子是那些引起基因表达响应化学或物理刺激(包括调节性化合物的存在)而开启或关闭的***。原核***中的调节***包括lac、tac、和trp操纵基因***。在酵母中,可以使用ADH2***或GAL1***。在丝状真菌中,可以使用TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子、和米曲霉葡糖淀粉酶启动子作为调节序列。调节序列的其它实例是那些允许基因扩增的序列。在真核***中,这些序列包括在氨甲蝶呤(methotrexate)存在下扩增的二氢叶酸还原酶基因,和以重金属(with heavy metal)扩增的金属硫蛋白基因。在这些情况中,编码多肽的核苷酸序列将与调节序列可操作相连接。
融合蛋白构建体优选地包含一种或几种选择标记,其允许简单选择经转化、转染、转导等的细胞。选择标记是基因,其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophy to auxotrophs)等。
细菌选择标记的实例是来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或赋予抗生素抗性的标记,所述抗生素抗性如氨苄青霉素、卡那霉素、氯霉素、或四环素抗性。对于酵母宿主细胞合适的标记是ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞的选择标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦(phosphinothricin)乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)(nitrate reductase)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)(orotidine-5’-phosphate decarboxylase)、sC(硫酸腺苷酰转移酶)、和trpC(邻氨基苯甲酸合酶(anthranilate synthase))以及它们的等同物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉的amdS和pyrG基因和吸水链霉菌(Streptomyces hygroscopicus)的bar因。
表达载体
本发明还涉及重组表达载体,其包含编码融合蛋白的多核苷酸、启动子、及转录和翻译终止信号。本申请所述各种核酸和控制序列可以结合在一起以产生重组表达载体,其可以包含一个或几个方便的限制性位点以允许在这些位点***或取代编码多肽的核苷酸序列。或者,可以通过在用于表达的适宜载体中***包含所述序列的核苷酸序列或融合蛋白构建体来表达编码融合蛋白的多核苷酸。在创建表达载体时,将编码序列置于载体中,使得编码序列与用于表达的适宜调节序列可操作相连接。
重组表达载体可以是任何载体(例如质粒或病毒),其能方便地进行重组DNA方法,而且能产生核苷酸序列的表达。载体的选择将通常取决于载体与其中将引入该载体的宿主细胞的相容性。载体可以是线状的或闭合环状的质粒。
载体可以是自主复制载体,即作为染色体外实体(entity)存在的载体,其复制独立于染色体复制,例如质粒、染色体外元件、微型染色体(minichromosome)、或人工染色体。载体可以包含任何用于确保自复制的手段(means)。或者,载体可以是一种当被导入宿主细胞后,整合到基因组中并且与整合了该载体的染色体一起复制的载体。此外,可以使用单一的载体或质粒或者两个或更多个载体或质粒,其一起含有待导入宿主细胞基因组的完整DNA (total DNA),或者可以使用转座子。
本发明的载体优选包含一个或几个选择标记,其允许简单选择经转化、转染、转导等等的细胞。本申请记载了细菌、酵母、丝状真菌选择标记的例子。
本发明的载体优选包含允许载体整合入宿主细胞基因组或允许载体在细胞中独立于基因组自主复制的元件。
为了整合入宿主细胞基因组,载体可以依赖编码多肽的多核苷酸序列或用于载体通过同源或非同源重组整合入基因组的任何其它载体元件。或者,载体可以包含额外的核苷酸序列,用于指导通过同源重组在染色体中的精确位置整合入宿主细胞基因组中。为了增加在精确位置处整合的可能性,整合元件应优选包含足够数目的核酸,如100-10,000碱基对、优选400-10,000碱基对、和最优选800-10,000碱基对,其与相应的靶序列具有高度同一性以增强同源重组的概率。整合元件可以是与宿主细胞基因组中的靶序列同源的任何序列。此外,整合元件可以是非编码的或编码的核苷酸序列。另一方面,可以将载体通过非同源重组整合到宿主细胞的基因组中。
为了自主复制,载体可以进一步包含复制起点,其使载体能够在所讨论的宿主细胞中自主复制。复制起点可以是在细胞中发挥功能的、介导自主复制的任何质粒复制子(replicator)。术语“复制起点”或“质粒复制子”在本申请定义为使质粒或载体能够在体内复制的核苷酸序列。
细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177、和pACYC184复制起点,及允许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060和pAMβ1复制起点。
用于酵母宿主细胞中的复制起点的实例是2微米复制起点、ARS1、ARS4、ARS1与CEN3的组合、和ARS4与CEN6的组合。
在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems等,1991,Gene 98:61-67;Cullen等,1987,Nucleic Acids Research 15:9163-9175;WO 00/24883)。分离AMA1基因和构建包含该基因的质粒或载体可以根据WO 00/24883中披露的方法来实现。
可以将多于一个拷贝的编码融合蛋白的多核苷酸***宿主细胞以增加基因产物的产生。多核苷酸拷贝数的增加可通过如下方法获得:将至少一个额外拷贝的序列整合入宿主细胞基因组,或将可扩增的选择标记基因包括在多核苷酸内,其中可通过在适宜选择剂(selectable agent)存在下培养细胞来选择含有选择标记基因的扩增拷贝并由此含有多核苷酸的额外拷贝的细胞。
用于连接上文所述元件以构建本发明的重组表达载体的方法是本领域技术人员熟知的(参见例如Sambrook等,1989,见上文)。
宿主细胞
本发明还涉及包含编码本发明融合蛋白的多核苷酸的重组真菌宿主细胞,其有利地用于重组生产所述蛋白质。将包含本发明多核苷酸的载体导入真菌宿主细胞,使得该载体作为染色体成分或作为自复制的染色体外载体得到维持,正如上文所述。术语“宿主细胞”涵盖亲本细胞的任何后代,其由于复制过程中发生的突变而与亲本细胞有所不同。
真菌宿主细胞可以是任何可用于重组生产本发明多肽的真菌细胞。
“真菌”在用于本申请时包括以下门:子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)、和接合菌门(Zygomycota)(如Hawksworth等,于Ainsworth and Bisby’s Dictionary of The Fungi,第8版,1995,CAB International,University Press,Cambridge,UK中所定义的)、以及卵菌门(Oomycota)(如Hawksworth等,1995,见上文,第171页中所引用)、和所有有丝***孢子真菌(mitosporic fungi)(Hawksworth等,1995,见上文)。
在优选的方面,真菌宿主细胞是酵母细胞。“酵母”在用于本申请时包括产子囊酵母(ascosporogenous yeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenous yeast)、和属于半知菌类(Fungi Imperfecti)(芽孢纲(Blastomycetes))的酵母。由于酵母的分类在未来可能改变,就本发明而言,酵母应定义为如Biology and Activities of Yeast(Skinner,F.A.,Passmore,S.M.,和Davenport,R.R.编,Soc.App.Bacteriol.Symposium Series No.9,1980)中所述。
在更优选的方面,酵母宿主细胞是假丝酵母属、汉逊酵母属、克鲁维酵母属、毕赤酵母属、(糖)酵母属、裂殖(糖)酵母属、或耶氏酵母(西洋蓍霉)属细胞。
在最优选的方面,酵母宿主细胞是卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母、或卵形酵母细胞。在另一个最优选的方面,酵母宿主细胞是乳酸克鲁维酵母细胞。在另一个最优选的方面,酵母宿主细胞是解脂耶氏酵母细胞。
在另一个优选的方面,真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门(Oomycota)的亚门(如Hawksworth等,1995,见上文所定义的)的所有丝状形式。丝状真菌的一般特征在于由几丁质或壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚糖和其它复杂多糖构成的菌丝体壁。通过菌丝延伸进行营养性生长,而碳分解代谢是专性需氧的。相反,酵母如酿酒酵母的营养性生长通过单细胞菌体的出芽(budding)进行,而碳分解代谢可以是发酵的。
在更优选的方面,丝状真菌宿主细胞是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟蜡菌属、金孢子菌属、鬼伞属(Coprinus)、革盖菌属、隐球菌属、篮状菌属、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属、或木霉属细胞。
在最优选的方面,丝状真菌宿主细胞是泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、或米曲霉细胞。在另一个最优选的方面,丝状真菌宿主细胞是杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、或镶片镰孢细胞。在另一个最优选的方面,丝状真菌宿主细胞是黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsis aneirina)、干拟蜡菌、Ceriporiopsis caregiea、Ceriporiopsis gilvescens、Ceriporiopsis pannocinta、Ceriporiopsis rivulosa、Ceriporiopsis subrufa、白霉拟蜡菌(Ceriporiopsissubvermispora)、嗜角质金孢子菌、Chrysosporium lucknowense、热带金孢子菌、Chrysosporium merdarium、Chrysosporium inops、毡金孢子菌、Chrysosporium queenslandicum、Chrysosporium zonatum、灰盖鬼伞、毛革盖菌、特异腐质霉、疏棉状腐质霉、米赫毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢平革菌、辐射射脉菌(Phlebia radiata)、杏鲍菇(Pleurotus eryngii)、土生梭孢霉、长绒毛栓菌、变色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、或绿色木霉细胞。
可以通过牵涉原生质体形成、原生质体转化、和细胞壁重建的方法以本身已知的方式来转化真菌细胞。用于转化曲霉属和木霉属宿主细胞的合适方法记载于EP 238023及Yelton等,1984,Proceedings of the National Academy ofSciences USA 81:1470-1474。用于转化镰孢属物种的合适方法记载于Malardier等,1989,Gene 78:147-156及WO 96/00787。可以使用由如下文献记载的方法来转化酵母:Becker和Guarente,于Abelson,J.N.和Simon,M.I.,编,Guide to Yeast Genetics and Molecular Biology,Methods in Enzymology,卷194,pp 182-187,Academic Press,Inc.,New York;Ito等,1983,Journal ofBacteriology 153:163;及Hinnen等,1978,Proceedings of the Nattonal Academyof Sciences USA 75:1920。
产生和回收
在本发明的生产方法中,使用本领域众所周知的方法在适合于生产具有生物学活性之多肽的营养培养基中培养真菌宿主细胞。例如,可以通过在合适培养基中和在允许多肽表达和/或分离的条件下进行的摇瓶培养和实验室或工业发酵罐中的小规模或大规模发酵(包括连续的、分批的、补料分批的或固态的发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养,所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据公开的组成制备(例如,在美国典型培养物保藏中心的目录中)。
在本发明的方法中,具有生物学活性之多肽选自下组:融合蛋白、融合蛋白的构件、和融合蛋白及其构件的组合。
在优选的方面,具有生物学活性之多肽是融合蛋白。
在另一个优选的方面,具有生物学活性之多肽是融合蛋白的一个或几个构件。
在另一个优选的方面,具有生物学活性之多肽是融合蛋白及其构件的组合。
可以使用本领域已知的、对于所述多肽是特异性的方法来检测具有生物学活性之多肽。这些检测方法可以包括特异性抗体的使用、酶产物的形成、或酶底物的消失。例如,可以使用酶测定法(enzyme assay)来测定多肽的活性,如本申请所述,且可以包括内切葡聚糖酶活性和特定(specific)生物学活性二者。
所得具有生物学活性之多肽(例如β-葡糖苷酶融合蛋白或其构件)可以使用本领域已知的方法回收。例如,可以通过常规方法自营养培养基回收多肽,所述常规方法包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。
本发明的多肽可以通过本领域已知的多种方法来纯化,所述规程包括但不限于层析(例如离子交换、亲和、疏水、层析聚焦、和大小排阻)、电泳方法(例如制备型等电聚焦)、差别溶解度(例如硫酸铵沉淀)、SDS-PAGE、或提取(参见例如Protein Purification,J.-C.Janson和Lars Ryden编,VCH Publishers,New York,1989),以获得基本上纯的多肽。
组合物
本发明还涉及包含本发明的具有生物学活性之多肽的组合物。优选地,所述组合物富含这种多肽。术语“富含”表示所述组合物的生物学活性以例如至少1.1的富集因数(enrichment factor)增加。
组合物可以包含本发明的多肽作为主要酶成分,例如单成分组合物。或者,组合物可以包含多种酶活性,如氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、卤素过氧化物酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果胶分解酶、肽谷氨酰胺酶(peptidoglutaminase)、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。别的酶可以通过例如属于以下属或种的微生物产生:曲霉属,优选棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉;镰孢属,优选杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢或镶片镰孢;腐质霉属,优选特异腐质霉或疏棉状腐质霉;或木霉属,优选哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉。
可以根据本领域已知的方法来制备多肽组合物,而且可以是液体或干组合物的形式。例如,多肽组合物可以是颗粒(granulate)或微粒(microgranulate)的形式。可以根据本领域已知的方法将包括于组合物中的多肽稳定化。
下面给出的是本发明多肽组合物的优选用途的实例。本发明的多肽组合物的剂量和使用该组合物的其它条件可以基于本领域已知的方法来确定。
用途
本发明还涉及使用融合蛋白或其构件,或它们的组合物的方法。
加工含纤维素材料的方法
本发明的方法对于以商业上重要的数量改进具有纤维素分解或半纤维素分解活性之多肽的分泌特别有用,所述多肽可用于降解或转化木质纤维素材料。此类多肽包括但不限于内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、β-木糖苷酶、***呋喃糖苷酶、乙酰木聚糖酯酶和阿魏酸酯酶。因此,本发明还涉及用于降解或转化含纤维素材料的方法,该方法包括:在存在有效量的根据本发明方法得到的具有纤维素分解活性或半纤维素分解活性的融合蛋白或其构件的条件下用有效量的纤维素分解酶组合物处理含纤维素材料。为了说明目的,将根据本发明方法得到的具有β-葡糖苷酶活性之多肽(例如β-葡糖苷酶融合蛋白或其构件)用于说明目的。
纤维素生物质可以包括但不限于木材资源、城市固体废物、废纸、作物和作物残余物(参见,例如Wiselogel等,1995,于Handbook on Bioethanol(编者Charles E.Wyman),第105-118页,Taylor & Francis,Washington D.C.;Wyman,1994,Bioresource Technology 50:3-16;Lynd,1990,Applied Biochemistry andBiotechnology 24/25:695-719;Mosier等,1999,Recent Progress in Bioconversionof Lignocellulosics,于Advances in Biochemical Engineering/Biotechnology,总编T.Scheper,第65卷,第23-40页,Springer-Verlag,NewYork)。
生物质初生细胞壁(primary cell wall)中的主要多糖是纤维素,其次最丰富的是半纤维素,而第三是果胶。次生细胞壁(secondary cell wall)在细胞停止生长后产生,其同样含有多糖并通过聚合木质素共价交联至半纤维素而加强。纤维素是脱水纤维二糖的均聚物,并且因此是线性β-(1-4)-D-葡聚糖,而半纤维素包括多种化合物,如木聚糖、木葡聚糖(xyloglucan)、***木聚糖和甘露聚糖,具有系列取代基的复杂分支结构。尽管通常是多形的,存在于植物组织中的纤维素主要作为平行葡聚糖链的不溶晶体基质。半纤维素通常与纤维素以及其它半纤维素以氢键相连,其帮助稳定细胞壁基质。在本申请中应理解,术语“含纤维素材料”或“纤维素”还涵盖木质纤维素。
在本发明的方法中,纤维素分解酶组合物可以包含任何牵涉将含纤维素材料加工成葡萄糖,或将半纤维素加工成木糖、甘露糖、半乳糖和***糖、它们的聚合物、或自它们衍生的产物的蛋白质,如下文所述。纤维素分解酶组合物可以是单构件制备物,例如内切葡聚糖酶;多构件制备物,例如内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶;或单构件蛋白质制备物和多构件蛋白质制备物的组合。纤维素水解蛋白质可以具有活性,即在酸性、中性、或碱性pH范围水解纤维素。纤维素分解酶组合物可以进一步包含具有纤维素水解增强活性的多肽,根据WO 2005/074647、WO 2005/074656、及美国已公开的申请2007/0077630。
纤维素水解蛋白质可以是真菌或细菌起源的,其可以自已知能够产生纤维素分解酶的微生物获得或分离和纯化,例如芽孢杆菌属、假单胞菌属、腐质霉属、鬼伞属、梭孢壳属、镰孢属、毁丝霉属、枝顶孢霉属、头孢霉属(Cephalosporium)、柱霉属、青霉属或曲霉属的物种(参见例如EP 458162),尤其是那些由选自下组的菌株产生的纤维素水解蛋白质:特异腐质霉(重新分类为嗜热柱霉(Scytalidium thermophilum),参见例如美国专利No.4,435,307)、灰盖鬼伞、尖镰孢、嗜热毁丝霉、大型亚灰树花菌(Meripilusgiganteus)、土生梭孢霉、枝顶孢霉属菌种、桃色枝顶孢霉(Acremoniumpersicinum)、冠枝顶孢霉(Acremonium acremonium)、Acremoniumbrachypenium、Acremonium dichromosporum、Acremonium obclavatum、Acremonium pinkertoniae、Acremonium roseogriseum、Acremoniumincoloratum、和Acremonium furatum;优选选自下组:特异腐质霉DSM 1800、尖镰孢DSM 2672、嗜热毁丝霉CBS 117.65、头孢霉属菌种RYM-202、枝顶孢霉属菌种CBS 478.94、枝顶孢霉属菌种CBS 265.95、桃色枝顶孢霉CBS169.65、冠枝顶孢霉AHU 9519、头孢霉属菌种CBS 535.71、Acremoniumbrachypenium CBS 866.73、Acremonium dichromosporum CBS 683.73、Acremonium obclavatum CBS 311.74、Acremonium pinkertoniae CBS 157.70、Acremonium roseogriseum CBS 134.56、Acremonium incoloratum CBS 146.62、和Acremonium furatum CBS 299.70H。纤维素水解蛋白质也可以自木霉属(特别是绿色木霉、里氏木霉和康宁木霉)、嗜碱性芽孢杆菌属(参见例如美国专利No.3,844,890和EP 458162)、和链霉菌属(参见例如EP 458162)获得。也可以使用纤维素水解蛋白质的化学修饰或蛋白质工程突变体。
尤其合适的纤维素水解蛋白质是记载于以下文献中的纤维素酶:EP495,257,EP 531,372,WO 96/11262,WO 96/29397,WO 98/08940。其它例子有纤维素酶变体,如以下文献中所记载的:WO 94/07998,EP 531,315,美国专利No.4,435,307,美国专利No.5,457,046,美国专利No.5,648,263,美国专利No.5,686,593,美国专利No.5,691,178,美国专利No.5,763,254,美国专利No.5,776,757,WO 89/09259,WO 95/24471,WO 98/12307和PCT/DK98/00299。
如上所述,本发明方法中所使用的纤维素水解蛋白质可以是单构件制备物,即基本上不含其它纤维素水解构件的构件。单构件可以是重组构件,即通过克隆编码单构件的DNA序列,随后用该DNA序列转化细胞,并在宿主中表达来产生的(参见例如WO 91/17243和WO 91/17244)。宿主优选是异源宿主(酶对于宿主而言是外来的),但是宿主在某些条件下也可以是同源宿主(酶对于宿主而言是天然的)。单构件纤维素水解蛋白质也可以通过自发酵液纯化此类蛋白质来制备。
本发明方法中所使用的纤维素水解蛋白质可以通过使用本领域已知的方法在含有合适碳源和氮源和无机盐的营养培养基上发酵上文所述微生物菌株来产生(参见例如Bennett,J.W.和LaSure,L.(编),More Gene Manipulationsin Fungi,Academic Press,CA,1991)。合适的培养基能够从商业供应商获得或可以根据公开的组成制备(例如,在美国典型培养物保藏中心的目录中)。适于生长和纤维素水解蛋白质产生的温度范围和其它条件是本领域已知的(参见例如Bailey,J.E.和Ollis,D.F.,Biochemical Engineering Fundamentals,McGraw-Hill Book Company,NY,1986)。
发酵可以是培养细胞,导致纤维素水解蛋白质表达或分离的任何方法。因此,发酵可以理解为包括在合适培养基中和在允许纤维素水解蛋白质表达或分离的条件下进行的摇瓶培养和实验室或工业发酵罐中的小规模或大规模发酵(包括连续的、分批的、补料分批的或固态的发酵)。通过上文所述方法产生的所得纤维素水解蛋白质可以自发酵培养基回收并通过常规方法纯化,如上所述。
适用于本发明的商业上可用的纤维素分解酶制剂的例子包括例如CELLUCLASTTM(能够从Novozymes A/S获得)和NOVOZYMTM 188(能够从Novozymes A/S获得)。可以使用的包含纤维素酶的其它商业上可用的制剂包括CELLUZYMETM、CEREFLOTM和ULTRAFLOTM(Novozymes A/S),LAMINEXTM和SPEZYMETM CP(Genencor Int.),ROHAMENTTM 7069W(GmbH),和LDI,LBR、或150L(Dyadic International,Inc.,Jupiter,FL,USA)。以约0.001%至5.0%(固体重量)、更优选约0.025%至约4.0%(固体重量)、和最优选约0.005%至约2.0%(固体重量)的有效量添加纤维素酶。
通过上文所述方法得到的所得纤维素水解蛋白质或β-葡糖苷酶蛋白质可以通过常规方法自发酵培养基回收,所述常规方法包括但不限于离心、过滤、喷雾干燥、蒸发或沉淀。所回收的蛋白质然后可以通过多种层析方法进一步纯化,例如离子交换层析、凝胶过滤层析、亲和层析等等。
纤维素水解蛋白质的活性可以使用本领域已知的任何方法来测定。
适用于本发明的纤维素水解制剂的例子包括例如CELLUCLASTTM(能够从Novozymes A/S获得)和NOVOZYMTM 188(能够从Novozymes A/S获得)。可以使用的包含纤维素酶的其它商业上可用的制剂包括CELLUZYMETM、CEREFLOTM和ULTRAFLOTM(Novozymes A/S),LAMINEXTM和SPEZYMETMCP(Genencor Int.)、和ROHAMENTTM 7069W(GmbH)。以约0.001%至5.0%(固体重量)、更优选约0.025%至约4.0%(固体重量)、和最优选约0.005%至约2.0%(固体重量)的有效量添加纤维素酶。
如上所述,本发明方法中所使用的纤维素水解蛋白质可以是单构件制备物,即基本上不含其它纤维素水解构件的构件。单构件可以是重组构件,即通过克隆编码单构件的DNA序列,随后用该DNA序列转化细胞,并在宿主中表达来产生的(参见例如WO 91/17243和WO 91/17244)。单构件纤维素水解蛋白质的其它例子包括但不限于JP-07203960-A和WO-9206209中披露的那些。宿主优选是异源宿主(酶对于宿主而言是外来的),但是宿主在某些条件下也可以是同源宿主(酶对于宿主而言是天然的)。单构件纤维素水解蛋白质也可以通过自发酵液纯化此类蛋白质来制备。
可用于实施本发明方法的单构件纤维素水解蛋白质的例子包括但不限于内切葡聚糖酶、纤维二糖水解酶、和其它对于降解纤维素生物质有用的酶。
术语“内切葡聚糖酶”在本申请中已有定义。术语“纤维二糖水解酶”在本申请中定义为1,4-β-D-葡聚糖纤维二糖水解酶(E.C.3.2.1.91),其催化纤维素、纤维寡糖、或任何含β-1,4-连接葡萄糖的聚合物中1,4-β-D-葡糖苷键的水解,自链的还原端或非还原端释放纤维二糖。就本发明而言,纤维二糖水解酶活性可以根据如下文献中记载的方法来测定:Lever等,1972,Anal.Biochem.47:273-279及van Tilbeurgh等,1982,FEBS Letters 149:152-156;van Tilbeurgh和Claeyssens,1985,FEBS Letters 187:283-288。在本发明中,采用Lever等的方法来评估玉米秸秆(corn stover)中纤维素的水解。
本发明的多肽与纤维素水解蛋白质一同用于降解生物质底物的纤维素成分(参见例如Brigham等,1995,于Handbook on Bioethanol(Charles E.Wyman,编),pp.119-141,Taylor & Francis,Washington D.C.;Lee,1997,Journal of Biotechnology 56:1-24)。
具有β-葡糖苷酶活性之多肽和纤维素水解蛋白质的最适量取决于几个因素,其包括但不限于组分纤维素水解蛋白质的混合物、含纤维素的底物、含纤维素底物的浓度、含纤维素底物的预处理、温度、时间、pH和包括发酵生物体(例如用于同步糖化和发酵的酵母)。术语“纤维素水解蛋白质”在本申请中定义为显示出能够在所测试的条件下水解或转化或降解纤维素的那些蛋白质或蛋白质混合物。它们的量通常通过常用方法来测量,如BCA(二辛可宁酸,P.K.Smith等,1985,Anal.Biochem.150:76),而且优选的添加量与所水解的生物质的量成比例。
在优选的方面,每克含纤维素材料的具有β-葡糖苷酶活性之多肽的量是约0.01至约2.0mg、优选约0.025至约1.5mg、更优选约0.05至约1.25mg、更优选约0.075至约1.25mg、更优选约0.1至约1.25mg、甚至更优选约0.15至约1.25mg、和最优选约0.25至约1.0mg每g含纤维素材料。
在另一个优选的方面,每克含纤维素材料的纤维素水解蛋白质的量是约0.5至约50mg、优选约0.5至约40mg、更优选约0.5至约25mg、更优选约0.75至约20mg、更优选约0.75至约15mg、甚至更优选约0.5至约10mg、和最优选约2.5至约10mg每g含纤维素材料。
本发明的方法可用于将含纤维素材料(例如木质纤维素)降解或转化成任何有用的物质(例如化学制品和燃料)。在乙醇以外,可以自纤维素生产的一些日用和专用化学品包括木糖、丙酮、乙酸盐/酯、甘氨酸、赖氨酸、有机酸(例如乳酸)、1,3-丙二醇、丁二醇、甘油、乙二醇、糠醛或糖醛、聚羟基链烷酸酯、和顺式,顺式-粘康酸(Lynd,L.R.,Wyman,C.E.,和Gerngross,T.U.,1999,Biocommodity Engineering,Biotechnol.Prog.,15:777-793;Philippidis,G.P.,1996,Cellulose bioconversion technology,于Handbook on Bioethanol:Production and Utilization,Wyman,C.E.,编,Taylor & Francis,Washington,DC,179-212;及Ryu,D.D.Y.和Mandels,M.,1980,Cellulases:biosynthesis andapplications,Enz.Microb.Technol.,2:91-102)。潜在的合作生产利益延伸超过自可发酵碳水化合物合成多种有机产物。可以将生物学加工后剩余的富含木质素的残余物转化成木质素衍生的化学品,或者用于动力生产。
根据本发明的方法用于处理含纤维素材料的常规方法是本领域技术人员充分理解的。可以使用任何常规生物质处理设备来实施本发明的方法,所述设备设定为根据本发明操作。
这样的设备可以包括补料-分批式搅拌反应器、分批式搅拌反应器、具有超滤的连续流搅拌反应器、连续活塞流柱式反应器(Fernanda de CastilhosCorazza,Flávio Faria de Moraes,Gisella Maria Zanin和Ivo Neitzel,2003,Optimal control in fed-batch reactor for the cellobiose hydrolysis,ActaScientiarum.Technology 25(1):33-38;Gusakov,A.V.和Sinitsyn,A.P.,1985,Kinetics of the enzymatic hydrolysis of cellulose:1.A mathematical model for abatch reactor process,Enz.Microb.Technol.7:346-352)、碾磨反应器(Ryu,S.K.和Lee,J.M.,1983,Bioconversion of waste cellulose by using an attritionbioreactor,Biotechnol.Bioeng.25:53-65)、或具有由电磁场引起的强烈搅拌的反应器(Gusakov,A.V.,,Sinitsyn,A.P.,Davydkin,I.Y.,Davydkin,V.Y.,Protas,O.V.,1996,Enhancement of enzymatic cellulose hydrolysis using a novel type ofbioreactor with intensive stirring induced by electromagnetic field,Appl.Biochem.Biotechnol.56:141-153)。
常规方法包括但不限于糖化、发酵、分开的水解和发酵(SHF)、同步糖化和发酵(SSF)、同步糖化和共发酵(SSCF)、混合的水解和发酵(HHF)、和直接微生物转化(DMC)。
SHF使用分开的处理步骤,首先将纤维素酶促水解成可发酵的糖,然后在后续步骤中将糖发酵成乙醇。在SSF中,纤维素的酶促水解和可发酵的糖变为乙醇的发酵组合在一个步骤中(Philippidis,G.P.,1996,Cellulosebioconversion technology,于Handbook on Bioethanol:Production andUtilization,Wyman,C.E.编,Taylor & Francis,Washington,DC,179-212)。SSCF包括多种糖的共发酵(Sheehan,J.,和Himmel,M.,1999,Enzymes,energy and theenvironment:A strategic perspective on the U.S.Department of Energy’s researchand development activities for bioethanol,Biotechnol.Prog.15:817-827)。HHF包括在同一个反应器但不同的温度进行的两个分开的步骤,即,高温酶促糖化,继以在发酵菌株能耐受的较低温度进行的SSF。DMC在一个步骤中组合了所有三个过程(纤维素酶产生、纤维素水解和发酵)(Lynd,L.R.,Weimer,P.J.,vanZyl,W.H.,和Pretorius,I.S.,2002,Microbial cellulose utilization:Fundamentalsand biotechnology,Microbiol.Mol.Biol.Reviews 66:506-577)。
“发酵”或“发酵过程”指任何发酵过程或任何包含发酵步骤的过程。发酵过程包括但不限于用于产生发酵产品的发酵过程,所述发酵产品包括醇(例如***醇、丁醇、乙醇、甘油、甲醇、1,3-丙二醇、山梨醇和木糖醇);有机酸(例如乙酸、丙酮酸、己二酸、抗坏血酸、柠檬酸、2,5-二酮-D-葡萄糖酸、甲酸、富马酸、葡萄糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、衣康酸、乳酸、苹果酸、丙二酸、草酸、丙酸、琥珀酸、和木糖酸或木质酸);酮(例如丙酮);氨基酸(例如天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸和苏氨酸);气体(例如甲烷、氢气(H2)、二氧化碳(CO2)和一氧化碳(CO))。发酵过程还包括在消费品酒业(例如啤酒和酒)、乳业(例如发酵乳制品)、皮革业和烟草业中使用的发酵过程。
根据本发明方法获得的具有纤维素分解活性或半纤维素分解活性的融合蛋白或其构件(例如β-葡糖苷酶融合蛋白或其构件)及其宿主细胞可用于自生物质生产单糖、二糖和多糖作为化学品或发酵给料(feedstock),用于产生乙醇、塑料、其它产品或中间体。具体而言,多肽和宿主细胞可用于通过纤维素或半纤维素的部分或完全溶解来提高加工残余物(干酒糟(dried distillersgrain)、来自酿造的废糟(spent grains from brewing)、甘蔗渣(sugarcane bagasse)等)的价值。在促进用纤维素分解酶制备物将含纤维素材料加工成葡萄糖、木糖、甘露糖、半乳糖和***糖、它们的聚合物或由它们衍生的产物时,如下文所述,多肽可以是含或不含细胞的粗发酵液形式,或者是半纯化或纯化的酶制备物形式。多肽可以是单构件制备物、多构件蛋白质制备物、或多构件蛋白质制备物与单构件蛋白质制备物的组合。或者,可以使用宿主细胞作为生物质发酵过程中此类多肽的来源。宿主细胞还可以包含天然的或异源的基因,其编码纤维素水解蛋白质以及其它在生物质加工中有用的酶。
本发明进一步涉及用于产生有机物质的方法,该方法包括:(a)在存在有效量的根据本发明方法获得的具有纤维素分解活性或半纤维素分解活性的融合蛋白或其构件的条件下用有效量的纤维素分解酶组合物糖化含纤维素材料;(b)用一种或几种(more)的发酵微生物发酵步骤(a)的糖化的含纤维素材料;和(c)自发酵回收有机物质。如先前所述,出于说明目的,将根据本发明方法获得的具有β-葡糖苷酶活性之多肽(例如β-葡糖苷酶融合蛋白或其构件)用于说明目的。具有β-葡糖苷酶活性之多肽可以是含或不含细胞的粗发酵液形式,或者是半纯化或纯化的酶制剂形式。β-葡糖苷酶蛋白质可以是单构件制备物、多构件蛋白质制备物、或多构件蛋白质制备物与单构件蛋白质制备物的组合。
所述物质可以是任何自发酵衍生的物质。在优选的方面,物质是醇。应当理解,术语“醇”涵盖具有一个或几个羟基部分的物质。在更优选的方面,醇是***醇。在另一个更优选的方面,醇是丁醇。在另一个更优选的方面,醇是乙醇。在另一个更优选的方面,醇是甘油。在另一个更优选的方面,醇是甲醇。在另一个更优选的方面,醇是1,3-丙二醇。在另一个更优选的方面,醇是山梨醇。在另一个更优选的方面,醇是木糖醇。参见例如Gong,C.S.,Cao,N.J.,Du,J.和Tsao,G.T.,1999,Ethanol production from renewable resources,于Advances in Biochemical Engineering/Biotechnology,Scheper,T.编,Springer-Verlag Berlin Heidelberg,Germany,65:207-241;Silveira,M.M.和Jonas,R.,2002,The biotechnological production of sorbitol,Appl.Microbiol.Biotechnol.59:400-408;Nigam,P.和Singh,D.,1995,Processes for fermentativeproduction of xylitol-a sugar substitute,Process Biochemistry 30(2):117-124;Ezeji,T.C.,Qureshi,N.和Blaschek,H.P.,2003,Production of acetone,butanoland ethanol by Clostridium beijerinckii BA101 and in situ recovery by gasstripping,World Journal of Microbiology and Biotechnology 19(6):595-603。
在另一个优选的方面,所述物质是有机酸。在另一个更优选的方面,有机酸是乙酸。在另一个更优选的方面,有机酸是丙酮酸。在另一个更优选的方面,有机酸是己二酸。在另一个更优选的方面,有机酸是抗坏血酸。在另一个更优选的方面,有机酸是柠檬酸。在另一个更优选的方面,有机酸是2,5-二酮-D-葡糖酸。在另一个更优选的方面,有机酸是甲酸。在另一个更优选的方面,有机酸是富马酸。在另一个更优选的方面,有机酸是葡萄糖二酸。在另一个更优选的方面,有机酸是葡糖酸。在另一个更优选的方面,有机酸是葡糖醛酸。在另一个更优选的方面,有机酸是戊二酸。在另一个优选的方面,有机酸是3-羟基丙酸。在另一个更优选的方面,有机酸是衣康酸。在另一个更优选的方面,有机酸是乳酸。在另一个更优选的方面,有机酸是苹果酸。在另一个更优选的方面,有机酸是丙二酸。在另一个更优选的方面,有机酸是草酸。在另一个更优选的方面,有机酸是丙酸。在另一个更优选的方面,有机酸是琥珀酸。在另一个更优选的方面,有机酸是木糖酸或木质酸。参见例如Chen,R.和Lee,Y.Y.,1997,Membrane-mediated extractive fermentation for lactic acid production fromcellulosic biomass,Appl.Biochem.Biotechnol.63-65:435-448。
在另一个优选的方面,所述物质是酮。应当理解,术语“酮”涵盖具有一个或几个酮基部分的物质。在另一个更优选的方面,酮是丙酮。参见例如Qureshi和Blaschek,2003,见上文。
在另一个优选的方面,所述物质是氨基酸。在另一个更优选的方面,氨基酸是天冬氨酸。在另一个更优选的方面,氨基酸是谷氨酸。在另一个更优选的方面,氨基酸是甘氨酸。在另一个更优选的方面,氨基酸是赖氨酸。在另一个更优选的方面,氨基酸是丝氨酸。在另一个更优选的方面,氨基酸是苏氨酸。参见例如Richard,A.和Margaritis,A.,2004,Empirical modeling ofbatch fermentation kinetics for poly(glutamic acid)production and othermicrobial biopolymers,Biotechnology and Bioengineering 87(4):501-515。
在另一个优选的方面,所述物质是气体。在另一个更优选的方面,气体是甲烷。在另一个更优选的方面,气体是H2。在另一个更优选的方面,气体是CO2。在另一个更优选的方面,气体是CO。参见例如Kataoka,N.,A.Miya,和K.Kiriyama,1997,Studies on hydrogen production by continuous culturesystem of hydrogen-producing anaerobic bacteria,Water Science and Technology36(6-7):41-47;及Gunaseelan V.N.于Biomass and Bioenergy,Vol.13(1-2),pp.83-114,1997,Anaerobic digestion ofbiomass for methane production:A review。
自含纤维素材料生产物质通常需要四个主要步骤。这四个步骤是预处理、酶促水解、发酵和回收。下面例示的是用于产生乙醇的方法,但应当理解,可以使用相似的方法来生产其它物质,例如上文所述物质。
预处理。在预处理或预水解步骤中,将含纤维素材料加热以分解木质素和碳水化合物结构,溶解大部分半纤维素,并使纤维素分解酶能够到达纤维素部分。加热或者直接用蒸汽进行,或者在浆料中进行,此处还可将催化剂添加于材料以使反应加速。催化剂包括强的酸(如硫酸和SO2)或碱(如氢氧化钠)。预处理阶段的目的是促进酶和微生物的渗透(penetration)。含纤维素生物质还可以经过水热蒸汽喷发的预处理(参见美国专利申请号20020164730)。然而,应当理解,在实施本发明的方法时,可以采用热的、化学的、和/或机械的预处理来使用任何预处理。
糖化。在酶促水解步骤中(所述步骤也称作糖化),将本申请所述酶加入经预处理的材料中,以将纤维素部分转化成葡萄糖和/或其它糖。糖化通常在搅拌釜反应器或发酵罐中,在受控的pH、温度和混合条件下进行。糖化步骤可以持续长达200小时。糖化可以在约30℃至约65℃,特别是约50℃的温度,和在约4-约5,尤其是约pH4.5的pH进行。为了产生能由酵母代谢的葡萄糖,通常在存在β-葡糖苷酶的条件下进行水解。
发酵。在发酵步骤中,作为预处理和酶促水解步骤的结果从含纤维素材料释放的糖,通过发酵生物体(如酵母)发酵成为乙醇。发酵还可以与酶促水解在同一个容器中,同样在受控的pH、温度和混合条件下同时进行。当糖化和发酵在同一个容器中同时进行时,该过程通常称作同步糖化和发酵或SSF。
在实施本发明时在发酵步骤中可以使用任何合适的含纤维素材料或原材料。通常根据期望的发酵产品(即,要从发酵获得的物质)和所采用的方法来选择材料,如本领域中所公知。适用于本发明的方法中的底物的实例包括含纤维素材料,如木材或植物残余物或自能通过发酵微生物代谢的经处理的含纤维素材料获得的低分子糖DP1-3,所述底物可以通过直接向发酵培养基中加入而提供。
术语“发酵培养基”理解为指加入发酵微生物之前的培养基,如由糖化过程产生的培养基,以及同步糖化和发酵过程(SSF)中使用的培养基。
“发酵微生物”指适用于期望的发酵过程中的任何微生物。根据本发明的合适的发酵微生物能够将糖(如葡萄糖、木糖、***糖、甘露糖、半乳糖或寡糖)直接或间接地发酵(即转化)成期望的发酵产品。发酵微生物的实例包括真菌生物体,如酵母。优选的酵母包括(糖)酵母属菌种,且具体为酿酒酵母的菌株。商业上可得到的酵母包括,例如Red/Lesaffre Ethanol Red(可从Red/Lesaffre,USA获得)、FALI(可从Fleischmann’s Yeast,BurnsPhilp Food Inc.,USA的一个部门获得)、SUPERSTART(可从Alltech获得)、GERT STRAND(可从Gert Strand AB,Sweden获得)和FERMIOL(可从DSMSpecialties获得)。
在优选的方面,所述酵母是(糖)酵母属菌种。在更优选的方面,所述酵母是酿酒酵母。在另一个更优选的方面,所述酵母是糖化酵母。在另一个更优选的方面,所述酵母是葡萄汁酵母(Saccharomyces uvarum)。在另一个优选的方面,所述酵母是克鲁维酵母属。在另一个更优选的方面,所述酵母是马克斯克鲁维酵母(Kluyveromyces marxianus)。在另一个更优选的方面,所述酵母是脆壁克鲁维酵母(Kluyveromyces fragilis)。在另一个优选的方面,所述酵母是假丝酵母属。在另一个更优选的方面,所述酵母是假热带假丝酵母(Candida pseudotropicalis)。在另一个更优选的方面,所述酵母是芸苔假丝酵母(Candida brassicae)。在另一个优选的方面,所述酵母是棒孢酵母(Clavispora)。在另一个更优选的方面,所述酵母是鲁西坦棒孢酵母(Clavispora lusitaniae)。在另一个更优选的方面,所述酵母是仙人掌棒孢酵母(Clavispora opuntiae)。在另一个优选的方面,所述酵母是管囊酵母属(Pachysolen)。在另一个更优选的方面,所述酵母是管囊酵母(Pachysolentannophilus)。在另一个优选的方面,所述酵母是酒香酵母属(Bretannomyces)。在另一个更优选的方面,所述酵母是克劳森酒香酵母(Bretannomycesclausenii)(Philippidis,G.P.,1996,Cellulose bioconversion technology,于Handbook on Bioethanol:Production and Utilization,Wyman,C.E.,编,Taylor& Francis,Washington,DC,179-212)。
可以有效地将葡萄糖发酵成乙醇的细菌包括,例如,运动发酵单胞菌(Zymomonas mobilis)和热纤维梭菌(Clostridium thermocellum)(Philippidis,1996,见上文)。
在本领域中公知上述生物体还能用于产生其它物质,如本申请所述。
在酿酒酵母(Chen,Z.,Ho,N.W.Y.,1993,Cloning and improving theexpress ion of Pichia stipitis xylose reductase gene in Saccharomyces cerevisiae,Appl.Biochem.Biotechnol.39-40:135-147;Ho,N.W.Y.,Chen,Z,Brainard,A.P.,1998,Genetically engineered Saccharomyces yeast capable of effectivelycofermenting glucose and xylose,Appl.Environ.Microbiol.64:1852-1859)或在细菌中如大肠杆菌(Beall,D.S.,Ohta,K.,Ingram,L.O.,1991,Parametricstudies of ethanol production from xylose and other sugars by recombinantEscherichia coli Biotech.Bioeng.38:296-303)、产酸克雷伯氏菌(Klebsiellaoxytoca)(Ingram,L.O.,Gomes,P.F.,Lai,X.,Moniruzzaman,M.,Wood,B.E.,Yomano,L.P.,York,S.W.,1998,Metabolic engineering of bacteria for ethanolproduction,Biotechnol.Bioeng.58:204-214)和运动发酵单胞菌(Zhang,M.,Eddy,C.,Deanda,K.,Finkelstein,M.和Picataggio,S.,1995,Metabolicengineering of a pentose metabolism pathway in ethanologenic Zymomonasmobilis,Science 267:240-243;Deanda,K.,Zhang,M.,Eddy,C.,和Picataggio,S.,1996,Development of an arabinose-fermenting Zymomonas mobilis train bymetabolic pathway engineering,Appl.Environ.Microbiol.62:4465-4470)中克隆异源基因导致了能够将己糖和戊糖转化成乙醇(共发酵)的生物体的构建。
通常向降解的纤维素或水解产物中加入酵母或另一种微生物,并进行约24至约96小时,如约35至约60小时的发酵。温度通常在约26℃-约40℃,特别是约32℃,且在约pH3至约pH6,特别是约pH4-5进行。
在优选的方面,将酵母或另一种微生物应用于降解的纤维素或水解产物,并进行约24至约96小时,如通常35-60小时的发酵。在优选的方面,温度通常在约26至约40℃,特别是约32℃,而pH通常在约pH3至约pH6,优选约pH4-5。优选以大约105至1012,优选大约107至1010,尤其是大约5×107活细胞计数每ml发酵液的量应用酵母或另一种微生物。在乙醇产生阶段期间,酵母细胞计数应该优选在大约107至1010,尤其是约2×108。关于使用酵母进行发酵的其它指导可见于例如“The Alcohol Textbook”(编者K.Jacques,T.P.Lyons和D.R.Kelsall,Nottingham University Press,United Kingdom 1999)中,所述文献通过引用并入本申请。
本领域最广泛使用的方法是同步糖化和发酵(SSF)方法,其中没有糖化的保持阶段,意味着酵母和酶一起添加。
对于乙醇产生,在发酵后将醪(mash)蒸馏以提取乙醇。根据本发明的方法获得的乙醇可以用作,例如,燃料乙醇、饮料乙醇(即,中性饮料酒(potableneutral spirits))或工业乙醇。
发酵刺激剂可以与本申请所述的任何酶促过程组合使用,以进一步改进发酵过程,特别是改进发酵微生物的性能,如速率增加和乙醇得率。“发酵刺激剂”指用于发酵微生物(特别是酵母)生长的刺激剂。优选的用于生长的发酵刺激剂包括维生素和矿物质。维生素的实例包括多种维生素、生物素、泛酸盐/酯、烟酸、内消旋肌醇(meso-inositol)、硫胺、维生素B6(pyridoxine)、对氨基苯甲酸、叶酸、核黄素和维生素A、B、C、D和E。参见,例如,Alfenore等,Improving ethanol production and viability of Saccharomyces cerevisiae by avitamin feeding strategy during fed-batch process,Springer-Verlag(2002),其通过引用并入本申请。矿物质的实例包括能提供营养的矿物质和矿物质盐,所述营养包括P、K、Mg、S、Ca、Fe、Zn、Mn和Cu。
回收。从发酵的含纤维素材料中分离醇,并通过蒸馏的常规方法纯化。能获得纯度高达约96vol.%的乙醇,其可以用作,例如,燃料乙醇、饮料乙醇(即中性饮料酒)或工业乙醇。
对于其它物质,可以使用本领域已知的任何方法,所述方法包括但不限于层析(例如离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如制备型等电聚焦)、差别溶解度(例如,硫酸铵沉淀)、SDS-PAGE、蒸馏或提取。
在本发明的方法中,在β-葡糖苷酶之外,可以向纤维素分解酶制备物和纤维素分解增强多肽补充一种或几种别的酶活性,以改进含纤维素材料的降解。优选的别的酶是半纤维素酶、酯酶(例如脂肪酶、磷脂酶和/或角质酶)、蛋白酶、漆酶、过氧化物酶,或它们的混合物。
在本发明的方法中,可以在发酵前或发酵过程中(包括在发酵微生物繁殖的过程中或之后)加入别的酶。
本申请中提到的酶可以源自或获得自任何合适的来源,包括细菌、真菌、酵母或哺乳动物来源。术语“获得”在本申请中表示酶可以从天然产生所述酶作为天然酶的生物体分离。术语“获得”在本申请中还表示酶可以在宿主生物体中重组产生,其中重组产生的酶对宿主生物体是天然或外来的,或具有经过修饰的氨基酸序列,例如具有缺失的、***的和/或取代的一个或几个氨基酸,即重组产生的酶是天然氨基酸序列的突变体和/或片段或由本领域已知的核酸改组方法产生的酶。天然酶的意义中包含天然变体,而外来酶的意义中包含通过重组获得的变体,如通过定点诱变或改组获得的变体。
还可以将酶纯化。本申请中使用的术语“纯化”包括不含来自其所源自的生物体中其它成分的酶。术语“纯化”还包括不含来自其所获得自的天然生物体的组分的酶。可将酶纯化,仅存在少量的其它蛋白质。表述“其它蛋白质”具体涉及其它酶。本申请使用的术语“纯化”还指去除其它组分,特别是存在于本发明的酶的起源细胞中的其它蛋白质,最特别是其它酶。酶可为“基本上纯的多肽”,即,不含来自产生所述酶的生物体的其它组分,即,例如,用于重组产生酶的宿主生物体。
本发明中所使用的酶可以是适用于本申请所述方法的任何形式,如例如含有或者不含细胞的粗发酵液、干粉或颗粒、无粉尘颗粒、液体、稳定化的液体或受保护的酶。颗粒可以通过,例如美国专利号4,106,991和4,661,452中公开的方法产生,而且可任选地通过本领域已知的方法包覆(coat)。例如,可以根据已确立的方法通过加入稳定剂(如糖、糖醇或另一种多元醇(polyol),和/或乳酸或另一种有机酸)将液体酶制剂稳定化。受保护的酶可以根据EP238,216中公开的方法制备。
洗涤剂组合物
本发明的方法对于以商业上重要的数量改进多肽的分泌以用于洗涤剂组合物特别有用。此类多肽包括但不限于蛋白酶、纤维素分解酶、淀粉酶、和过氧化物酶,或任何对于洗涤剂工业有用的其它酶或生物学蛋白质。
本发明的洗涤剂组合物可以例如配制成手洗或机洗洗涤剂组合物,包括适于沾污织物预处理的洗涤添加剂组合物和漂洗添加的织物柔顺剂组合物,或者配制成用于一般家居硬表面清洁操作的洗涤剂组合物,或者配制用于碗盘手洗或机洗操作。
在一个具体的方面,本发明提供了包含根据本发明获得的具有生物学活性之多肽(例如融合蛋白、其构件或它们的组合)的洗涤剂添加剂。洗涤剂添加剂以及洗涤剂组合物可以包含一种或几种(多种)其它酶,如蛋白酶、脂肪酶、角质酶、淀粉酶、碳水化合物酶、纤维素酶、果胶酶、甘露聚糖酶、***糖酶、半乳聚糖酶、木聚糖酶、氧化酶例如漆酶、和/或过氧化物酶。
一般而言,酶组分的特性应当与所选择的洗涤剂相容(即最适pH、与其它酶组分和非酶组分的相容性等),而且酶组分应当以有效量存在。
蛋白酶:合适的蛋白酶包括动物、植物或微生物起源的那些。微生物起源是优选的。包括化学修饰的或蛋白质工程的突变体。蛋白酶可以是丝氨酸蛋白酶或金属蛋白酶,优选碱性微生物蛋白酶或胰蛋白酶样蛋白酶。碱性蛋白酶的例子有枯草杆菌蛋白酶,尤其是自芽孢杆菌属衍生的那些,例如枯草杆菌蛋白酶Novo、枯草杆菌蛋白酶Carlsberg、枯草杆菌蛋白酶309、枯草杆菌蛋白酶147和枯草杆菌蛋白酶168(WO 89/06279)。胰蛋白酶样蛋白酶的例子有胰蛋白酶(例如猪或牛起源的)和公开于WO 89/06270和WO 94/25583中的镰孢属蛋白酶。
有用的蛋白酶的例子有WO 92/19729、WO 98/20115、WO 98/20116和WO 98/34946中记载的变体,尤其是在一个或多个下列位置具有取代的变体:27、36、57、76、87、97、101、104、120、123、167、170、194、206、218、222、224、235和274。
优选的商业上可用的蛋白酶包括ALCALASETM、SAVINASETM、PRIMASETM、DURALASETM、ESPERASETM和KANNASETM(NOVOZYMESA/S),MAXTASETM、MAXACALTM、MAXAPEMTM、PROPERASETM、PURAFECTTM、PURAFECT OXPTM、FN2TM和FN3TM(Genencor InternationalInc.)。
脂肪酶:合适的脂肪酶包括细菌或真菌起源的那些。包括化学修饰的或蛋白质工程的突变体。有用的脂肪酶的例子包括来自腐质霉属(同义词嗜热霉属(Thermomyces))的脂肪酶,例如EP 258068和EP 305216中所描述的疏棉状腐质霉(细毛嗜热霉(T.lanuginosus))或WO 96/13580中所描述的特异腐质霉;假单胞菌属(Pseudomonas)脂肪酶,例如产碱假单胞菌(P.alkaligenes)或类产碱假单胞菌(P.pseudoalcaligenes)(EP 218272)、洋葱假单胞菌(P.cepacia)(EP 331376)、施氏假单胞菌(P.stutzeri)(GB 1,372,034)、荧光假单胞菌(P.fluorescens)、假单胞菌菌种菌株SD 705(WO 95/06720和WO 96/27002)、威斯康星假单胞菌(P.wisconsinensis)(WO 96/12012);芽孢杆菌属(Bacillus)脂肪酶,例如来自枯草芽孢杆菌(B.subtilis)(Dartois等,1993,Biochemica etBiophysica Acta,1131,253-360)、嗜热脂肪芽孢杆菌(B.stearothermophilus)(JP64/744992)、或短小芽孢杆菌(B.pumilus)(WO 91/16422)。
其它例子有如在WO 92/05249、WO 94/01541、EP 407225、EP 260105、WO 95/35381、WO 96/00292、WO 95/30744、WO 94/25578、WO 95/14783、WO 95/22615、WO 97/04079和WO 97/07202中所描述的脂肪酶变体。
优选的商业上可用的脂肪酶包括LIPOLASETM、LIPEXTM、和LipolaseULTRATM(Novozymes A/S)。
淀粉酶:合适的淀粉酶(α和/或β)包括细菌或真菌起源的那些。包括化学修饰的或蛋白质工程的突变体。淀粉酶包括自例如芽孢杆菌属例如地衣芽孢杆菌(B.licheniformis)特定菌株获得的α-淀粉酶,更详细地记载于GB1,296,839。
有用的淀粉酶的例子有在WO 94/02597、WO 94/18314、WO 96/23873、和WO 97/43424中所描述的变体,尤其是在一个或多个下列位置具有取代的变体:15、23、105、106、124、128、133、154、156、181、188、190、197、202、208、209、243、264、304、305、391、408和444。
商业上可用的淀粉酶有DURAMYLTM、TERMAMYLTM、FUNGAMYLTM和BANTM(Novozymes A/S),RapidaseTM和PurastarTM(Genencor InternationalInc.)。
纤维素酶:合适的纤维素酶包括细菌或真菌起源的那些。包括化学修饰的或蛋白质工程的突变体。合适的纤维素酶包括来自下列属的纤维素酶:芽孢杆菌属、假单胞菌属、腐质霉属、镰孢属、梭孢壳属、枝顶孢霉属或木霉属,例如在美国专利No.4,435,307、美国专利No.5,648,263、美国专利No.5,691,178、美国专利No.5,776,757和WO 89/09259中公开的由特异腐质霉、嗜热毁丝霉和尖镰孢产生的真菌纤维素酶。
尤其合适的纤维素酶是有益于保护颜色的碱性或中性纤维素酶。此类纤维素酶的例子有EP 0495257、EP 0531372、WO 96/11262、WO 96/29397、WO 98/08940中描述的纤维素酶。其它例子是纤维素酶变体,如在WO94/07998、EP 0531315、美国专利No.5,457,046、美国专利No.5,686,593、美国专利No.5,763,254、WO 95/24471、WO 98/12307和PCT/DK98/00299中描述的那些纤维素酶变体。
商业上可用的纤维素酶包括CELLUZYMETM和CAREZYMETM(Novozymes A/S),ClazinaseTM和Puradax HATM(GenencorInternational Inc.),及KAC-500(B)TM(Kao Corporation)。
过氧化物酶/氧化酶:合适的过氧化物酶/氧化酶包括植物、细菌或真菌起源的那些。包括化学修饰的或蛋白质工程的突变体。有用的过氧化物酶的实例包括来自鬼伞属例如灰盖鬼伞(C.cinereus)的过氧化物酶及其变体,如在WO 93/24618、WO 95/10602、和WO 98/15257中所描述的那些。
商业上可用的过氧化物酶包括GUARDZYMETM(Novozymes A/S)。
可通过添加含一种或多种酶的分开的添加剂或通过添加包含所有这些酶的组合添加剂将酶组分包括在洗涤剂组合物中。本发明的洗涤剂添加剂,即分开的添加剂或组合的添加剂,可配制成例如颗粒、液体、浆料等形式。优选的洗涤剂添加剂配制物为颗粒,特别是无粉尘的颗粒;液体,特别是稳定化的液体;或浆料。
例如可如在美国专利No.4,106,991和4,661,452中所公开的方法制备无粉尘颗粒,并可以任选地通过本领域已知的方法进行包覆。蜡质包覆材料的实例有平均摩尔重量为1000-20000的聚(环氧乙烷)产物(聚乙二醇,PEG);具有16-50个环氧乙烷单元的乙氧基化的壬基酚;具有15-80个环氧乙烷单元的乙氧基化的脂肪醇,其中醇含有12-20个碳原子;脂肪醇;脂肪酸;及脂肪酸的单-、双-和三甘油酯。GB 1483591中给出了适于通过流化床技术应用的成膜包覆材料的实例。例如,液体酶制备物可根据已建立的方法通过加入多元醇如丙二醇、糖或糖醇、乳酸或硼酸来稳定。受保护的酶可根据EP 238,216中所公开的方法制备。
本发明的洗涤剂组合物可采用任何方便的形式,例如条、片、粉末、颗粒、糊膏(paste)、或液体。液体洗涤剂可以是含水的,一般含高达70%的水和0-30%的有机溶剂,或者是不含水的。
洗涤剂组合物可含有一种或几种表面活性剂,可以是非离子型的,包括半极性和/或阴离子和/或阳离子和/或两性离子的。表面活性剂一般以按重量计0.1%-60%的水平存在。
当洗涤剂包含阴离子表面活性剂时,它通常含有大约1%到大约40%的阴离子表面活性剂,如线状的烃基苯磺酸酯、α-烯烃磺酸酯(α-olefinsulfonate)、烃基硫酸酯(脂肪醇硫酸酯)、醇乙氧基硫酸酯、仲烷基磺酸酯(secondaryalkanesulfonate)、α-磺基脂肪酸甲酯、烷基-或烯基琥珀酸或皂(soap)。
当洗涤剂中包含非离子型表面活性剂时,它通常含有大约0.2%到大约40%的非离子型表面活性剂,如醇乙氧基化物、壬基苯酚乙氧基化物、烃基多苷、烃基二甲基胺氧化物、乙氧基脂肪酸单乙醇酰胺、脂肪酸单乙醇酰胺、多羟基烃基脂肪酸酰胺、或葡糖胺的N-酰基N-烃基衍生物(“葡糖酰胺”)。
洗涤剂可包含0-65%的洗涤剂助洗剂或络合剂,如沸石、二磷酸盐、三磷酸盐、膦酸酯、碳酸盐、柠檬酸盐、氮川三乙酸(nitrilotriacetic acid)、乙二胺四乙酸、二亚乙基三胺五乙酸、烷基-或烯基琥珀酸、可溶性硅酸盐或层状硅酸盐(例如购自Hoechst的SKS-6)。
洗涤剂可包含一种或几种聚合物。实例有羧甲基纤维素、聚(乙烯吡咯烷酮)、聚(乙二醇)、聚(乙烯醇)、聚(乙烯吡啶-N-氧化物)、聚(乙烯咪唑)、聚羧酸酯如聚丙烯酸酯、马来酸/丙烯酸共聚物、和甲基丙烯酸月桂酯/丙烯酸共聚物。
洗涤剂可包含漂白***,该***可含有H2O2源如过硼酸盐或过碳酸盐,可将其与形成过酸的漂白活化剂如四乙酰基乙二胺或壬酰氧基苯磺酸酯相组合。或者,漂白***可包含过氧酸,例如酰胺、酰亚胺或砜型的过氧酸。
可使用常规的稳定剂稳定本发明洗涤剂组合物的酶组分,所述常规稳定剂例如多元醇,如丙二醇或丙三醇;糖或糖醇;乳酸;硼酸,或硼酸衍生物,例如芳香族硼酸酯,或苯基硼酸衍生物如4-甲酰苯基硼酸;且所述组合物可如WO 92/19709和WO 92/19708中所描述的方法来配制。
洗涤剂还可包含其它的常规洗涤剂成分,如包括粘土的织物调节剂、泡沫促进剂、抑泡剂、抗蚀剂、污垢悬浮剂、抗污垢再沉积剂、染色剂、杀菌剂、光增白剂、助水溶物(hydrotrope)、晦暗抑制剂、或芳香剂(perfume)。
在洗涤剂组合物中的任何酶组分,特别是本发明具有生物学活性之多肽都可以相应于每升洗涤液0.01-100mg酶蛋白质的量加入,优选每升洗涤液0.05-5mg酶蛋白质,特别是每升洗涤液0.1-1mg酶蛋白质。
还可将本发明具有生物学活性之多肽掺入到WO 97/07202所公开的洗涤剂配制剂中,这里并入所述文献作为参考。
其它用途
根据本发明获得的具有生物学活性之多肽(例如融合蛋白、其构件或其组合)还可以与其它糖水解酶(glycohydrolase)和相关酶(如本申请所述)组合用于处理纺织品(作为生物抛光剂)和用于减少起毛(fuzz)、起球(pilling)、质地改良(texture modification)和砂洗(stonewashing)(N.K.Lange,于P.Suominen,T.Reinikainen(编),Trichoderma reesei Cellulases and Other Hydrolases,Foundation for Biotechnical and Industrial Fermentation Research,Helsinki,1993,pp.263-272)。另外,所述多肽还可以与其它糖水解酶和相关酶(如本申请所述)组合用于在木材加工中生物纸浆(biopulping)或剥皮(debarking)、在造纸中纤维改良(fiber modification)、漂白(bleaching)和减少精炼能量成本(refining energycosts)、白水处理(whitewater treatment)(其对于废水再生、木质纤维素纤维再生如脱墨(deinking)和二次纤维加工(secondary fiber processing)是重要的)、及木材残余物利用(S.D,Mansfield和A.R.Esteghlalian于S.D,Mansfield和J.N.Saddler(编),Applications of Enzymes to Lignocellulosics,ACS Symposium Series855,Washington,D.C.,2003,pp.2-29)。
通过以下实施例进一步对本发明进行描述,但不应将其理解为对本发明范围的限制。
实施例
作为缓冲液和底物使用的化学药品是至少试剂等级的商业产品。
DNA测序
DNA测序使用Applied Biosystems 3130X型遗传分析仪(Model 3130XGenetic Analyzer,Applied Biosystems,Foster City,CA,USA)进行,其使用染料终止物化学(Giesecke等,1992,Journal of Virol.Methods 38:47-60)。使用phred/phrap/consed(University of Washington,Seattle,WA,USA)及序列特异性引物装配序列。
菌株
里氏木霉RutC30(ATCC 56765;Montenecourt和Eveleigh,1979,Adv.Chem.Ser.181:289-301)衍生自里氏木霉Qm6A(ATCC 13631;Mandels和Reese,1957,J.Bacteriol.73:269-278)。使用里氏木霉RutC30和米曲霉Jal355菌株(WO 02/062973)来表达β-葡糖苷酶融合蛋白。
培养基和溶液
YP培养基每升由10g酵母提取物和20g田菌用蛋白胨构成。
纤维素酶诱导培养基每升由20g纤维素,10g玉米浆固体,1.45g(NH4)2SO4,2.08g KH2PO4,0.28g CaCl2,0.42g MgSO4·7H2O和0.42ml痕量金属溶液构成。
痕量金属溶液每升由216g FeCl3·6H2O,58g ZnSO4·7H2O,27gMnSO4·H2O,10g CuSO4·5H2O,2.4g H3BO3,和336g柠檬酸构成。
STC由1M山梨醇,10mM CaCl2,和10mM Tris-HCl,pH7.5构成。
COVE板每升由342g蔗糖,10ml COVE盐溶液,10ml的1M乙酰胺,10ml的1.5M CsCl,和25g Noble琼脂构成。
COVE盐溶液每升由26g KCl,26g MgSO4,76g KH2PO4,和50ml COVE痕量金属溶液构成。
COVE痕量金属溶液每升由0.04g Na2B4O7·10H2O,0.4g CuSO4·5H2O,1.2gFeSO4·7H2O,0.7g MnSO4·H2O,0.8g Na2MoO2·H2O,和10g ZnSO4·7H2O构成。
COVE2板每升由30g蔗糖,20ml COVE盐溶液,25g Noble琼脂,和10ml的1M乙酰胺构成。
PDA板每升由39g马铃薯右旋糖琼脂构成。
LB培养基每升由10g胰蛋白胨,5g酵母提取物,5g氯化钠构成。
2X YT板每升由10g胰蛋白胨,5g酵母提取物,5g氯化钠,和15g Bacto琼脂构成。
MDU2BP培养基每升由45g麦芽糖,1g MgSO4·7H2O,1g NaCl,2gK2HSO4,12g KH2PO4,2g尿素,和500μl AMG痕量金属溶液构成,将pH调节至5.0,然后用0.22μm过滤单元(unit)过滤除菌。
AMG痕量金属溶液每升由14.3g ZnSO4·7H2O,2.5g CuSO4·5H2O,0.5gNiCl2·6H2O,13.8g FeSO4·7H2O,8.5g MnSO4·7H2O,和3g柠檬酸构成。
极限培养基板每升由6g NaNO3,0.52g KCl,1.52g KH2PO4,1ml COVE痕量金属溶液,20g Noble琼脂,20ml 50%葡萄糖,2.5ml 20%MgSO4·7H2O,和20ml生物素储液构成。
生物素储液每升由0.2g生物素构成。
SOC培养基由2%胰蛋白胨,0.5%酵母提取物,10mM NaCl,2.5mM KCl,10mM MgCl2和10mM MgSO4构成,高压灭菌后,添加经过滤除菌的葡萄糖至20mM。
实施例1:pMJ04表达载体的构建
通过自里氏木霉RutC30基因组DNA使用下文所示引物993429(反义)和993428(有义)PCR扩增里氏木霉纤维二糖水解酶1基因(cbh1,CEL7A)终止子构建了表达载体pMJ04。反义引物设计成在5’端具有Pac I位点,而有义引物设计成在3’端具有Spe I位点。
引物993429(反义):
5’-AACGTTAATTAAGGAATCGTTTTGTGTTT-3’(SEQ ID NO:33)
引物993428(有义):
5’-AGTACTAGTAGCTCCGTGGCGAAAGCCTG-3’(SEQ ID NO:34)
扩增反应(50μl)由1X ThermoPol反应缓冲液(New England Biolabs,Beverly,MA,USA),0.3mM dNTP,100ng里氏木霉RutC30基因组DNA,0.3μM引物993429,0.3μM引物993428和2个单位Vent DNA聚合酶(New EnglandBiolabs,Beverly,MA,USA)构成。将反应物在 5333(Eppendorf Scientific,Inc.,Westbury,NY,USA)中温育,编程为5个循环,每个循环为94℃30秒、50℃30秒和72℃60秒,然后是25个循环,每个循环为94℃30秒、65℃30秒和72℃120秒(最终延伸5分钟)。在1.0%琼脂糖凝胶上分离反应产物,使用40mM Tris碱-20mM乙酸钠-1mM EDTA二钠(TAE)缓冲液,其中自凝胶切下229bp产物条带并使用凝胶提取试剂盒(QIAGEN Inc.,Valencia,CA,USA)根据制造商的说明书纯化。
所得PCR片段用Pac I和Spe I消化并使用快速连接试剂盒(Roche,Indianapolis,IN,USA)连接入经相同限制酶消化的pAlLo1(WO 05/067531)以产生pMJ04(图1)。
实施例2:pCaHj568的构建
质粒pCaHj568自pCaHj170(美国专利No.5,763,254)和pMT2188构建。质粒pCaHj170包含特异腐质霉内切葡聚糖酶V(CEL45A)全长编码区(SEQ IDNO:1,其编码SEQ ID NO:2之氨基酸序列)。pMT2188的构建通过自pCaHj483(WO 98/00529)使用下文所示引物142779和142780PCR扩增pUC19复制起点起始。引物142780将Bbu I位点引入PCR片段。
142779:5’-TTGAATTGAAAATAGATTGATTTAAAACTTC-3’(SEQ ID NO:35)
142780:5’-TTGCATGCGTAATCATGGTCATAGC-3’(SEQ ID NO:36)
遵循制造商的说明书使用PCR***(Roche MolecularBiochemicals,Basel,Switzerland)来进行此扩增。在琼脂糖凝胶上将PCR产物分离,分离1160bp片段并使用Jetquick凝胶提取旋转试剂盒(Genomed,Wielandstr,Germany)纯化。
使用下文所示引物140288和142778使用PCR***自通用的酿酒酵母克隆载体pYES2(Invitrogen,Carlsbad,CA,USA)扩增URA3基因。引物140288将Eco RI位点引入PCR片段。
5’-TTGAATTCATGGGTAATAACTGATAT-3’(SEQ ID NO:37)
142778:
5’-AAATCAATCTATTTTCAATTCAATTCATCATT-3’(SEQ ID NO:38)
在琼脂糖凝胶上将PCR产物分离,分离1126bp片段并使用Jetquick凝胶提取旋转试剂盒纯化。
通过混合并使用上文所示引物142780和140288通过交叠剪接法(Horton等,1989,Gene 77:61-68)扩增来融合上述两种PCR片段。在琼脂糖凝胶上将PCR产物分离,分离2263bp片段并使用Jetquick凝胶提取旋转试剂盒纯化。
所得片段用Eco RI和Bbu I消化并使用标准规程连接至pCaHj483经相同限制酶消化产生的最大片段。将连接混合物转化入通过Mandel和Higa,1970,J.Mol.Biol.45:154的方法制成感受态的pyrF-阴性大肠杆菌菌株DB6507(ATCC 35673)。在每升补充有1g酪蛋白氨基酸,500μg硫胺素和10mg卡那霉素的固体M9培养基(Sambrook等,1989,Molecular Cloning,A LaboratoryManual,第2版,Cold Spring Harbor Laboratory Press)上选择转化体。分离来自一株转化体的质粒并命名为pCaHj527(图2)。
使用PCR***根据制造商的说明书通过简单PCR法对pCaHj527上存在的NA2-tpi启动子进行定点诱变。使用下文所示诱变引物141223将核苷酸134-144自GTACTAAAACC(SEQ ID NO:39)转变成CCGTTAAATTT(SEQ ID NO:40)。
引物141223:5’-GGATGCTGTTGACTCCGGAAATTTAACGGTTTGGTCTTGCATCCC-3’(SEQ ID NO:41)
使用下文所示诱变引物141222将核苷酸423-436自ATGCAATTTAAACT(SEQ ID NO:42)转变成CGGCAATTTAACGG(SEQ ID NO:43)。
引物141222:5’-GGTATTGTCCTGCAGACGGCAATTTAACGGCTTCTGCGAATCGC-3’(SEQ ID NO:44)
所得质粒命名为pMT2188(图3)。
将特异腐质霉内切葡聚糖酶V编码区自pCaHj170(作为Bam HI-Sal I片段)转移入用Bam HI和Xho I消化的pMT2188,以产生pCaHj568(图4)。质粒pCaHj568包含突变的NA2-tpi启动子,其可操作连接于特异腐质霉内切葡聚糖酶V全长编码序列。
实施例3:pMJ05的构建
通过自pCaHj568使用下文所示引物HiEGV-F和HiEGV-R PCR扩增915bp特异腐质霉内切葡聚糖酶V全长编码区而构建了质粒pMJ05。
HiEGV-F(有义):
5’-AAGCTTAAGCATGCGTTCCTCCCCCCTCC-3’(SEQ ID NO:45)
HiEGV-R(反义):
5’-CTGCAGAATTCTACAGGCACTGATGGTACCAG-3’(SEQ ID NO:46)
扩增反应(50μl)由1X ThermoPol反应缓冲液(New England Biolabs,Beverly,MA,USA),0.3mM dNTP,10ng/μl pCaHj568,0.3μM HiEGV-F引物,0.3μMHiEGV-R引物和2个单位Vent DNA聚合酶(New England Biolabs,Beverly,MA,USA)构成。将反应在 5333中温育,编程为5个循环,每个循环为94℃30秒、50℃30秒和72℃60秒,接着是25个循环,每个循环为94℃30秒、65℃30秒和72℃120秒(最终延伸5分钟)。在使用TAE缓冲液的1.0%琼脂糖凝胶上分离反应产物,其中自凝胶切下937bp产物条带并使用凝胶提取试剂盒根据制造商的说明书将其纯化。
将937bp纯化的片段作为模板DNA用于后续使用下列引物的扩增:
HiEGV-R(反义):
5’-CTGCAGAATTCTACAGGCACTGATGGTACCAG-3’(SEQ ID NO:47)
HiEGV-F-交叠(overlap)(有义):
5’-ACCGCGGACTGCGCATCATGCGTTCCTCCCCCCTCC-3’(SEQ ID NO:48)
斜体表示的引物序列与17bp的里氏木霉纤维二糖水解酶I基因(cbh1)启动子同源,而加下划线的引物序列与29bp的特异腐质霉内切葡聚糖酶V编码区同源。启动子和编码序列之间的36bp交叠容许包含里氏木霉cbh1启动子的994bp片段与包含特异腐质霉内切葡聚糖酶V编码区的918bp片段的精确融合。
扩增反应(50μl)由1X ThermoPol反应缓冲液,0.3mM dNTP,1μl纯化的937bp PCR片段,0.3μM HiEGV-F-交叠引物,0.3μM HiEGV-R引物,和2个单位VentDNA聚合物构成。将反应在5333中温育,编程为5个循环,每个循环为94℃30秒、50℃30秒和72℃60秒,接着是25个循环,每个循环为94℃30秒、65℃30秒和72℃120秒(最终延伸5分钟)。在使用TAE缓冲液的1.0%琼脂糖凝胶上分离反应产物,其中自凝胶切下945bp产物条带并使用凝胶提取试剂盒根据制造商的说明书将其纯化。
实施另一PCR以使用下文所示引物(有义引物设计成在5’端具有Sal I限制性位点)自里氏木霉RutC30基因组DNA扩增里氏木霉cbh1启动子序列,自基因ATG起始密码子上游的994bp延伸。使用Plant Maxi试剂盒分离里氏木霉RutC30基因组DNA。
TrCBHIpro-F(有义):
5’-AAACGTCGACCGAATGTAGGATTGTTATC-3’(SEQ ID NO:49)
TrCBHIpro-R(反义):
5’-GATGCGCAGTCCGCGGT-3’(SEQ ID NO:50)
扩增反应(50μl)由1X ThermoPol反应缓冲液,0.3mM dNTP,100ng/μl里氏木霉RutC30基因组DNA,0.3μM TrCBHIpro-F引物,0.3μM TrCBHIpro-R引物和2个单位Vent DNA聚合物构成。将反应在 5333中温育,编程为30个循环,每个循环为94℃30秒、55℃30秒和72℃120秒(最终延伸5分钟)。在使用TAE缓冲液的1.0%琼脂糖凝胶上分离反应产物,其中自凝胶切下998bp产物条带并使用凝胶提取试剂盒根据制造商的说明书将其纯化。
纯化的998bp PCR片段作为模板DNA用于使用下文所示引物的后续扩增。
TrCBHIpro-F:
5’-AAACGTCGACCGAATGTAGGATTGTTATC-3’(SEQ ID NO:51)
TrCBHIpro-R-交叠:
5’-GGAGGGGGGAGGAACGCATGATGCGCA GTCCGCGGT-3’(SEQ ID NO:52)
斜体表示的序列与17bp的里氏木霉cbh1启动子同源,而加下划线的序列与29bp的特异腐质霉内切葡聚糖酶V编码区同源。启动子和编码序列之间的36bp交叠容许包含里氏木霉cbh1启动子的994bp片段与包含特异腐质霉内切葡聚糖酶V全长编码区的918bp片段的精确融合。
扩增反应(50μl)由1X ThermoPol反应缓冲液,0.3mM dNTP,1μl纯化的998bp PCR片段,0.3μM TrCBH1pro-F引物,0.3μM TrCBH1pro-R-交叠引物,和2个单位Vent DNA聚合物构成。将反应在 5333中温育,编程为5个循环,每个循环为94℃30秒、50℃30秒和72℃60秒,接着是25个循环,每个循环为94℃30秒、65℃30秒和72℃120秒(最终延伸5分钟)。在使用TAE缓冲液的1.0%琼脂糖凝胶上分离反应产物,其中自凝胶切下1017bp产物条带并使用凝胶提取试剂盒根据制造商的说明书将其纯化。
使用1017bp里氏木霉cbh1启动子PCR片段和945bp特异腐质霉内切葡聚糖酶V PCR片段作为模板DNA用于后续使用下列引物的扩增,用于使用交叠PCR将994bp cbh1启动子精确融合至918bp内切葡聚糖酶V全长编码区。
TrCBHIpro-F:
5’-AAACGTCGACCGAATGTAGGATTGTTATC-3’(SEQ ID NO:53)
HiEGV-R:
5’-CTGCAGAATTCTACAGGCACTGATGGTACCAG-3’(SEQ ID NO:54)
扩增反应(50μl)由1X ThermoPol反应缓冲液,0.3mM dNTP,0.3μMTrCBH1pro-F引物,0.3μM HiEGV-R引物和2个单位Vent DNA聚合物构成。将反应在 5333中温育,编程为5个循环,每个循环为94℃30秒、50℃30秒和72℃60秒,接着是25个循环,每个循环为94℃30秒、65℃30秒和72℃120秒(最终延伸5分钟)。在使用TAE缓冲液的1.0%琼脂糖凝胶上分离反应产物,其中自凝胶切下1926bp产物条带并使用凝胶提取试剂盒根据制造商的说明书将其纯化。
使用PCR克隆试剂盒(Invitrogen,Carlsbad,CA,USA)遵循制造商的规程将所得1926bp片段克隆入-Blunt-II-载体(Invitrogen,Carlsbad,CA,USA)。用Not I和Sal I消化所得质粒,使用凝胶提取试剂盒凝胶纯化1926bp片段并使用T4DNA连接酶(Roche,Indianapolis,IN,USA)连接入也用相同的两种限制酶消化的pMJ04,以产生pMJ05(图5)。质粒pMJ05包含里氏木霉纤维二糖水解酶I启动子和终止子,其可操作连接于特异腐质霉内切葡聚糖酶V全长编码序列。
实施例4:pSMai130表达载体的构建
用下文所示引物993467(有义)和993456(反义)通过PCR自作为模板的pJaL660(WO 2002/095014)扩增跨越米曲霉β-葡糖苷酶全长编码序列(SEQID NO:21为cDNA序列和SEQ ID NO:22为推导的氨基酸序列;大肠杆菌DSM 14240)自ATG起始密码子至TAA终止密码子的2586bp DNA片段。在反义引物的5’端设计Spe I位点以便于连接。斜体表示的引物序列与24bp的里氏木霉cbh1启动子同源,而加下划线的序列与22bp的米曲霉β-葡糖苷酶编码区同源。
引物993467:
5’-ATAGTCAACCGCGGACTGCGCATCATGAAGCTTGGTTGGATCGAGG-3’(SEQ ID NO:55)
引物993456:
5’-ACTAGTTTACTGGGCCTTAGGCAGCG-3’(SEQ ID NO:56)
扩增反应(50μl)由Pfx扩增缓冲液(Invitrogen,Carlsbad,CA,USA),0.25mM dNTP,10ng pJaL660,6.4μM引物993467,3.2μM引物993456,1mMMgCl2,和2.5个单位Pfx DNA聚合酶(Invitrogen,Carlsbad,CA,USA)构成。将反应在 5333中温育,编程为30个循环,每个循环为94℃1分钟、55℃1分钟和72℃3分钟(最终延伸15分钟)。在使用TAE缓冲液的1.0%琼脂糖凝胶上分离反应产物,其中自凝胶切下2586bp产物条带并使用凝胶提取试剂盒根据制造商的说明书将其纯化。
实施另一PCR,用以使用下文所示引物993453(有义)和引物993463(反义)扩增里氏木霉cbh1启动子序列,自基因ATG起始密码子上游的1000bp延伸,以产生1000bp PCR片段。
引物993453:
5’-GTCGACTCGAAGCCCGAATGTAGGAT-3’(SEQID NO:57)
引物993463:
5’-CCTCGATCCAACCAAGCTTCATGA TGCGCA GTCCGCGGTTGACTA-3’(SEQ ID NO:58)
斜体表示的引物序列与24bp的里氏木霉cbh1启动子同源,而加下划线的引物序列与22bp的米曲霉β-葡糖苷酶全长编码区同源。启动子和编码序列之间的46bp交叠容许包含里氏木霉cbh1启动子的1000bp片段与包含米曲霉β-葡糖苷酶编码区的2586bp片段的精确融合。
扩增反应(50μl)由Pfx扩增缓冲液,0.25mM dNTP,100ng里氏木霉RutC30基因组DNA,6.4μM引物993453,3.2μM引物993463,1mM MgCl2和2.5个单位Pfx DNA聚合物构成。将反应在 5333中温育,编程为30个循环,每个循环为94℃1分钟、55℃1分钟和72℃3分钟(最终延伸15分钟)。在使用TAE缓冲液的1.0%琼脂糖凝胶上分离反应产物,其中自凝胶切下1000bp产物条带并使用凝胶提取试剂盒根据制造商的说明书将其纯化。
将纯化后的片段作为模板DNA用于后续通过使用上文所示引物993453(有义)和引物993456(反义)的交叠PCR进行的扩增,以精确融合包含里氏木霉cbh1启动子的1000bp片段与包含米曲霉β-葡糖苷酶全长编码区的2586bp片段。
扩增反应(50μl)由Pfx扩增缓冲液,0.25mM dNTP,6.4μM引物99353,3.2μM引物993456,1mM MgCl2和2.5个单位Pfx DNA聚合物构成。将反应在5333中温育,编程为30个循环,每个循环为94℃1分钟、60℃1分钟和72℃4分钟(最终延伸15分钟)。
用Sal I和Spe I消化所得3586bp片段并连接入用相同的两种限制酶消化的pMJ04,以产生pSMai130(图6)。质粒pSMai130包含里氏木霉纤维二糖水解酶I基因启动子和终止子,其可操作连接于米曲霉天然β-葡糖苷酶信号序列和编码序列(即全长米曲霉β-葡糖苷酶编码序列)。
实施例5:pSMai135的构建
用下文所示引物993728(有义)和引物993727(反义)自作为模板的pJaL660PCR扩增自Lys-20至TAA终止密码子的米曲霉β-葡糖苷酶成熟编码区(缺少天然信号序列,见图7;SEQ ID NO:59和60)。
引物993728:
5’-TGCCGGTGTTGGCCCTTGCCAAGGATGATCTCGCGTACTCCC-3’(SEQID NO:61)
引物993727:
5’-GACTAGTCTTACTGGGCCTTAGGCAGCG-3’(SEQ ID NO:62)
斜体表示的序列与20bp的特异腐质霉内切葡聚糖酶V信号序列同源,而加下划线的序列与22bp的米曲霉β-葡糖苷酶编码区同源。在反义引物的5’端设计Spe I位点。
扩增反应(50μl)由Pfx扩增缓冲液,0.25mM dNTP,10ng/μl pJaL660,6.4μM引物993728,3.2μM引物993727,1mM MgCl2和2.5个单位Pfx DNA聚合物构成。将反应在5333中温育,编程为30个循环,每个循环为94℃1分钟、55℃1分钟和72℃3分钟(最终延伸15分钟)。在使用TAE缓冲液的1.0%琼脂糖凝胶上分离反应产物,其中自凝胶切下2523bp产物条带并使用凝胶提取试剂盒根据制造商的说明书纯化。
使用下文所示引物993724(有义)和引物993729(反义)进行另一PCR扩增,以扩增1000bp里氏木霉cbh1启动子和63bp特异腐质霉内切葡聚糖酶V信号序列(ATG起始密码子至Ala-21,图8,SEQ ID NO:63和64)。
引物993724:
5’-ACGCGTCGACCGAATGTAGGATTGTTATCC-3’(SEQ ID NO:65)
引物993729:
5’-GGGAGTACGCGAGATCATCCTTGGCAAGGGCCAACACCGGCA-3’(SEQ ID NO:66)
斜体表示的引物序列与20bp的特异腐质霉内切葡聚糖酶V信号序列同源,而加下划线的引物序列与22bp的米曲霉β-葡糖苷酶编码区同源。
使用包含在cbh1启动子控制下的特异腐质霉内切葡聚糖酶V编码区的质粒pMJ05作为模板来产生包含里氏木霉cbh1启动子和特异腐质霉内切葡聚糖酶V信号序列片段的1063bp片段。里氏木霉cbh1启动子和特异腐质霉内切葡聚糖酶V信号序列与米曲霉β-葡糖苷酶成熟编码序列之间共享42bp交叠,以提供启动子与2523bp米曲霉β-葡糖苷酶编码区的ATG起始密码子之间的完好连接。
扩增反应(50μl)由Pfx扩增缓冲液,0.25mM dNTP,10ng/μl pMJ05,6.4μM引物993728,3.2μM引物993727,1mM MgCl2和2.5个单位Pfx DNA聚合物构成。将反应在5333中温育,编程为30个循环,每个循环为94℃1分钟、60℃1分钟和72℃4分钟(最终延伸15分钟)。在使用TAE缓冲液的1.0%琼脂糖凝胶上分离反应产物,其中自凝胶切下1063bp产物条带并使用凝胶提取试剂盒根据制造商的说明书纯化。
使用纯化的交叠片段作为模板来进行使用上文所述引物993724(有义)和引物993727(反义)的扩增,以通过交叠PCR将包含里氏木霉cbh1启动子和特异腐质霉内切葡聚糖酶V信号序列的1063bp片段精确融合于包含米曲霉β-葡糖苷酶成熟编码区读码框的2523bp片段。
扩增反应(50μl)由Pfx扩增缓冲液,0.25mM dNTP,6.4μM引物993724,3.2μM引物993727,1mM MgCl2和2.5个单位Pfx DNA聚合物构成。将反应在5333中温育,编程为30个循环,每个循环为94℃1分钟、60℃1分钟和72℃4分钟(最终延伸15分钟)。在使用TAE缓冲液的1.0%琼脂糖凝胶上分离反应产物,其中自凝胶切下3591bp产物条带并使用凝胶提取试剂盒根据制造商的说明书纯化。
用Sal I和Spe I消化所得3591bp片段并连接入用相同限制酶消化的pMJ04,以产生pSMai135(图9)。质粒pSMai135包含里氏木霉纤维二糖水解酶I基因启动子和终止子,其可操作连接于特异腐质霉内切葡聚糖酶V信号序列和米曲霉β-葡糖苷酶成熟编码序列。
实施例6:带有特异腐质霉内切葡聚糖酶V分泌信号的米曲霉β-葡糖苷酶的表达
通过PEG介导的转化(Penttila等,1987,Gene 61155-164)将编码连接至特异腐质霉内切葡聚糖酶V分泌信号的成熟米曲霉β-葡糖苷酶的质粒pSMai135(图8)导入里氏木霉RutC30。该质粒包含构巢曲霉amdS基因,以使转化体能够在作为唯一氮源的乙酰胺上生长。
将里氏木霉RutC30在27℃和90rpm在25ml补充有2%(w/v)葡萄糖和10mM尿苷的YP培养基中培养17小时。通过使用真空驱动一次性使用过滤***(Millipore,Bedford,MA,USA)进行的过滤来收集菌丝体,并用去离子水清洗两次,用1.2M山梨醇清洗两次。通过将清洗后的菌丝体悬浮在20ml含15mg/ml(Novozymes A/S,Bagsvaerd,Denmark)和0.36单位/ml几丁质酶(Sigma Chemical Co.,St.Louis,MO,USA)的1.2M山梨醇中和在34℃以90rpm温和摇动温育15-25分钟,产生原生质体。通过以400xg离心7分钟来收集原生质体,并用冷的1.2M山梨醇清洗两次。使用血细胞计数器对原生质体计数并重悬浮在STC中,终浓度为每毫升1×108个原生质体。将多余的原生质体保存在-80℃的Cryo 1℃冷冻容器(Nalgene,Rochester,NY,USA)中。
大约7μg用Pme I消化的pSMai135添加至100μl原生质体溶液并温和混匀,接着添加260μl PEG缓冲液并混合,在室温温育30分钟。然后添加STC(3ml)并混合,将转化溶液涂布到使用构巢曲霉amdS选择的COVE板上。将板在28℃温育5-7天。将转化体传代培养到COVE2板上并在28℃培养。
将67个用pSMai135获得的、称为SMA135的转化体传代培养到新鲜的含乙酰胺的板上并让其在28℃形成孢子7天。
培养这67个SMA135里氏木霉转化体,即在装有25ml pH6.0的纤维素酶诱导培养基的125ml带挡板的摇瓶中接种转化体的孢子并在28℃和200rpm温育7天。里氏木霉RutC30作为对照。在第7天取出培养液样品。将每份培养液的1ml在微型离心机中以15,700xg离心5分钟并将上清液转移至新的管。将样品保存在4℃直至酶测定法。如下所述对上清液测定β-葡糖苷酶活性,其中使用对硝基苯基-β-D-吡喃葡糖苷作为底物。
使用在50mM琥珀酸盐pH5.0中1∶10稀释的培养物上清液的25μl等分试样在200μl的于50mM琥珀酸盐pH5.0中的0.5mg/ml作为底物的对硝基苯基-β-D-吡喃葡糖苷中在环境温度测定β-葡糖苷酶活性。温育15分钟后,通过添加100μl的1M Tris-HCl pH8.0来停止反应并通过分光光度法读取405nm吸光度。1单位β-葡糖苷酶活性对应于在pH5.0在环境温度每分钟每升产生1μmol对硝基苯基。黑曲霉β-葡糖苷酶(NOVOZYMTM 188,Novozymes A/S,Bagsvaerd,Denmark)用作酶标准品。
许多SMA135转化体显示的β-葡糖苷酶活性是里氏木霉RutC30所分泌的β-葡糖苷酶活性的几倍高。在所筛选的SMA135转化体中,转化体SMA135-04产生最高的β-葡糖苷酶活性。
使用Tris-HCl(5%分辨率(resolving))凝胶(Bio-Rad,Hercules,CA,USA)用***(Bio-Rad,Hercules,CA,USA)实施SDS-PAGE。将5μl第7天的上清液(见上文)悬浮在2X浓度的Laemmli样品缓冲液(Bio-Rad,Hercules,CA,USA)中并在存在5%β-巯基乙醇的条件下煮沸3分钟。将上清液样品加载到聚丙烯酰胺凝胶上并用1X Tris/Glycine/SDS作为运行缓冲液(Bio-Rad,Hercules,CA,USA)进行电泳。将所得凝胶用BIO-考马斯染料(Bio-Rad,Hercules,CA,USA)染色。
在38个通过SDS-PAGE分析的里氏木霉SMA135转化体中,有26个产生在作为对照的里氏木霉RutC30中没有看到的大约110kDa的蛋白质。根据通过SDS-PAGE所看到的110kDa条带的丰度(abundance),转化体里氏木霉SMA135-04产生最高水平的β-葡糖苷酶。
实施例7:表达载体pSMai140的构建
通过用Nco I消化携带米曲霉β-葡糖苷酶变体BG41全长编码区(SEQ IDNO:23,其编码SEQ ID NO:24之氨基酸序列)的质粒pSATe111BG41(WO04/099228)来构建表达载体pSMai140。在使用TAE缓冲液的1.0%琼脂糖凝胶上分离所得1243bp片段并使用凝胶提取试剂盒根据制造商的说明书将其纯化。
用Nco I消化表达载体pSMai135,在使用TAE缓冲液的1.0%琼脂糖凝胶上分离8286bp片段并使用凝胶提取试剂盒根据制造商的说明书纯化。然后使用T4DNA连接酶(Roche,Indianapolis,IN,USA)根据制造商的规程将1243bp经Nco I消化的米曲霉β-葡糖苷酶变体BG41片段连接至8286bp载体,以产生表达载体pSMai140(图10)。质粒pSMai140包含里氏木霉纤维二糖水解酶I(CEL7A)基因启动子和终止子,其可操作连接于特异腐质霉内切葡聚糖酶V信号序列和米曲霉β-葡糖苷酶变体成熟编码序列。
实施例8:用pSMai140转化里氏木霉RutC30
将质粒pSMai140用Pme I线性化并如实施例6所述转化入里氏木霉RutC30菌株。自四个独立的转化实验得到了总共100个转化体,都在摇瓶中在纤维素酶诱导培养基上培养,并如实施例6所述对转化体的培养液测量β-葡糖苷酶活性。许多里氏木霉SMA140转化体显示的β-葡糖苷酶活性是里氏木霉RutC30的β-葡糖苷酶活性的几倍高。
在分析了酶活性的同样13份培养物上清液中通过如实施例6所述的SDS-聚丙烯酰胺凝胶电泳和考马斯染色来检测培养基中米曲霉β-葡糖苷酶变体BG41蛋白质的存在。所有这13个具有高β-葡糖苷酶活性的转化体也以不同产量表达大约110KDa米曲霉β-葡糖苷酶变体BG41。
如通过β-葡糖苷酶活性测定法和SDS-聚丙烯酰胺凝胶电泳所评估的,将表达最高β-葡糖苷酶变体的转化体命名为里氏木霉SMA140-43。
实施例9:表达载体pSaMe-F1的构建
使用下文所示引物使用作为模板的pMJ05PCR扩增包含209bp里氏木霉纤维二糖水解酶I基因启动子和特异腐质霉内切葡聚糖酶V基因的核心区(SEQ ID NO:1的核苷酸1-702,其编码SEQ ID NO:2的氨基酸1-234;WO91/17243)的DNA片段。
995103:5’-cccaagcttagccaagaaca-3’(SEQ ID NO:67)
995137:5’-gggggaggaacgcatgggatctggacggc-3’(SEQ ID NO:68)
扩增反应(50μl)由1X Pfx扩增缓冲液,10mM dNTP,50mM MgSO4,10ng/μl pMJ05,50pmol 995103引物,50pmol 995137引物,和2个单位Pfx DNA聚合物构成。将反应在 5333中温育,编程为30个循环,每个循环为94℃30秒、55℃30秒和72℃60秒(最终延伸3分钟)。
使用作为模板的pSMai140和下文所示引物PCR扩增包含806bp米曲霉β-葡糖苷酶变体BG41基因的DNA片段。
995133:5’-gccgtccagatccccatgcgttcctccccc-3’(SEQ ID NO:69)
995111:5’-ccaagcttgttcagagtttc-3’(SEQ ID NO:70)
扩增反应(50μl)由1X Pfx扩增缓冲液,10mM dNTP,50mM MgSO4,100ngpSMai140,50pmol 995133引物,50pmol 995111引物,和2个单位Pfx DNA聚合物构成。将反应在5333中温育,编程为30个循环,每个循环为94℃30秒、55℃30秒和72℃120秒(最终延伸3分钟)。
然后将上文两个PCR片段进行交叠PCR。使用纯化的交叠片段作为模板用于使用上文所述引物995103(有义)和引物995111(反义)进行的扩增,以通过交叠PCR将包含209bp里氏木霉纤维二糖水解酶I基因启动子和特异腐质霉内切葡聚糖酶V核心序列的702bp片段精确融合于包含米曲霉β-葡糖苷酶变体BG41编码区的部分的806bp片段。
扩增反应(50μl)由1X Pfx扩增缓冲液,10mM dNTP,50mM MgSO4,2.5μl每种片段(20ng/μl),50pmol 995103引物,50pmol 995111引物,和2个单位高保真Pfx DNA聚合物构成。将反应在5333中温育,编程为初始变性95℃3分钟,然后是30个循环,每个循环为1分钟变性,60℃退火1分钟,和72℃延伸3分钟。
在使用TAE缓冲液的1.0%琼脂糖凝胶上分离反应产物,其中自凝胶切下1.7kb产物条带并使用凝胶提取试剂盒根据制造商的说明书将其纯化。
根据制造商的说明书,将1.7kb片段连接入4平末端载体(Invitrogen,Carlsbad,CA,USA)。然后根据制造商的快速化学转化方法,将构建体转化入ONETOP10化学感受态大肠杆菌细胞(Invitrogen,Carlsbad,CA,USA)。选择菌落并通过质粒分离和用Hind III消化以释放1.7kb交叠PCR片段来进行分析。
质粒pSMai140也用Hind III消化以使质粒线性化。使用快速DNA连接试剂盒遵循制造商的说明书将这两个消化片段在连接反应中组合以产生pSaMe-F1(图11)。
用连接产物转化大肠杆菌XL1-Blue亚克隆级感受态细胞(Stratagene,LaJolla,CA,USA)。通过来自纯化自经转化大肠杆菌的质粒的里氏木霉纤维二糖水解酶I基因启动子、特异腐质霉内切葡聚糖酶V信号序列、特异腐质霉内切葡聚糖酶V核心、特异腐质霉内切葡聚糖酶V信号序列、米曲霉β-葡糖苷酶变体BG41和里氏木霉纤维二糖水解酶I基因终止子序列的DNA测序来验证构建体的身份。将一个包含重组质粒的克隆命名为pSaMe-F1。质粒pSaMe-F1包含里氏木霉纤维二糖水解酶I基因启动子和终止子和特异腐质霉内切葡聚糖酶V信号肽序列,其直接连接于特异腐质霉内切葡聚糖酶V核心多肽,该特异腐质霉内切葡聚糖酶V核心多肽直接融合于特异腐质霉内切葡聚糖酶V信号肽,该特异腐质霉内切葡聚糖酶V信号肽直接连接于米曲霉β-葡糖苷酶变体BG41成熟编码序列。米曲霉β-葡糖苷酶变体BG融合蛋白的DNA序列和推导的氨基酸序列分别显示于SEQ ID NO:73和74(参见图14A,14B,14C和14D)。
实施例10:用pSaMe-F1转化里氏木霉RutC30
用5×107个里氏木霉RutC30孢子接种装有25ml补充有2%葡萄糖和10mM尿苷的YP培养基的摇瓶。在27℃和90rpm温育过夜大约16小时后,使用真空驱动一次性使用过滤***收集菌丝体。将菌丝体用100ml去离子水清洗两次,用1.2M山梨醇清洗两次。如实施例6所述产生原生质体。
将2μg用Pme I线性化的pSaMe-F 1DNA,100μl里氏木霉RutC30原生质体和50%PEG(4000)混合并在室温温育30分钟。然后添加3ml STC并将内容物倾倒在补充有10mM尿苷的COVE板上。然后将板在28℃温育。到第6天转化体开始出现并挑取到COVE2板上在28℃培养6天。回收了22个里氏木霉转化体。
在摇瓶中在纤维素酶诱导培养基上培养转化体并如实施例6所述测量β-葡糖苷酶活性。许多pSaMe-F1转化体产生β-葡糖苷酶活性。一个命名为里氏木霉SaMeF1-9的转化体产生最高量的β-葡糖苷酶,而且具有表达米曲霉β-葡糖苷酶变体的菌株两倍的活性(实施例9)。
根据Beguin,1983,Analytical Biochem.131(2):333-336使用羧甲基纤维素(CMC)覆盖测定法测定内切葡聚糖酶活性。将来自5份培养液样品(具有最高β-葡糖苷酶活性的样品)的5μg总蛋白质在天然样品缓冲液(Bio-Rad,Hercules,CA,USA)中稀释并使用10X Tris/甘氨酸运行缓冲液(Bio-Rad,Hercules,CA,USA)在8-16%Tris-HCl凝胶(Bio-Rad,Hercules,CA,USA)上运行,然后将凝胶覆盖在含1%羧甲基纤维素(CMC)的板的顶部。在37℃温育1小时后,将凝胶用0.1%刚果红染色20分钟。然后将板用1M NaCl脱色以鉴定指示内切葡聚糖酶活性的透明(clearing)区。看到两个透明带(zone),位于上部的带在大约110kDa而位于下部的带在大约25kDa。特异腐质霉内切葡聚糖酶V和米曲霉β-葡糖苷酶变体BG41融合物的预测蛋白质大小是118kDa,如果这两种蛋白质没有受到切割且保持单一多肽形式;各个内切葡聚糖酶V核心结构域的糖基化和β-葡糖苷酶的糖基化导致各个蛋白质比根据一级序列所预测的在更高mw处迁移。如果这两种蛋白质受到了切割,那么特异腐质霉内切葡聚糖酶V核心结构域的预测大小为24kDa而米曲霉β-葡糖苷酶变体BG41为94kDa。由于在大约110kDa处有透明带,这一结果指示最低限度有一群内切葡聚糖酶和β-葡糖苷酶融合蛋白保持完整而作为单一大型蛋白质形式。较低的透明带最有可能代表内源内切葡聚糖酶活性,另外可能源自特异腐质霉内切葡聚糖酶V核心结构域与米曲霉β-葡糖苷酶的部分切割。
上述结果证明了特异腐质霉内切葡聚糖酶V核心是有活性的,即使在与米曲霉β-葡糖苷酶融合时。另外,β-葡糖苷酶活性的增加表现出源自蛋白质分泌相对于非融合β-葡糖苷酶分泌效率的增加。通过将米曲霉β-葡糖苷酶变体BG41序列连接至有效分泌的特异腐质霉内切葡聚糖酶V核心,更多的β-葡糖苷酶得到分泌。
实施例11:pSaMe-FX载体的构建
通过修饰pSaMe-F1来构建质粒pSaMe-FX。将质粒pSaMe-F1用Bst Z17和Eco RI消化以产生包含β-葡糖苷酶变体BG41编码序列的1kb片段和包含质粒剩余部分的9.2kb片段。在使用TAE缓冲液的1.0%琼脂糖凝胶上将片段分开,切下9.2kb片段并使用凝胶提取试剂盒根据制造商的说明书将其纯化。将质粒pSMai135也用BstZ17和Eco RI消化以产生包含与米曲霉β-葡糖苷酶变体BG41编码序列同源的碱基的1kb片段和包含质粒剩余部分的8.5kb片段。如上所述分离和纯化1kb片段。
使用快速DNA连接试剂盒遵循制造商的说明书在连接反应中将9.2kb和1kb片段组合在一起以产生pSaMe-FX,其与pSaMe-F1相同,只是它包含野生型β-葡糖苷酶成熟编码序列而非变体成熟编码序列。
用连接产物转化大肠杆菌感受态细胞(Stratagene,La Jolla,CA,USA)。通过来自纯化自经转化大肠杆菌的质粒的里氏木霉纤维二糖水解酶I基因启动子、特异腐质霉内切葡聚糖酶V信号序列、特异腐质霉内切葡聚糖酶V核心序列、特异腐质霉内切葡聚糖酶V信号序列、米曲霉β-葡糖苷酶成熟编码序列和里氏木霉纤维二糖水解酶I基因终止子序列的DNA测序来验证构建体的身份。将一个包含重组质粒的克隆命名为pSaMe-FX(图12)。米曲霉β-葡糖苷酶融合蛋白的DNA序列和推导的氨基酸序列分别显示于SEQ ID NO:75和76(参见图15A,15B,15C和15D)。
实施例12:木霉转化体的转化和表达
将pSaMe-FX构建体用Pme I线性化并如实施例10所述转化入里氏木霉RutC30菌株。自单个转化得到了总共63个转化体。将转化体在摇瓶中在纤维素酶诱导培养基上培养并如实施例6所述测量β-葡糖苷酶活性。许多pSaMe-FX转化体产生β-葡糖苷酶活性。一个命名为SaMe-FX16的转化体与里氏木霉SaMeF1-9(实施例10)相比产生两倍量的β-葡糖苷酶活性。
实施例13:里氏木霉转化体的分析
如实施例9所述通过将特异腐质霉内切葡聚糖酶V核心(含它自己的天然信号序列)与连接有特异腐质霉内切葡聚糖酶V信号序列的米曲霉β-葡糖苷酶变体BG41成熟编码序列融合来构建融合蛋白。此融合构建体导致与连接有特异腐质霉内切葡聚糖酶V信号序列的米曲霉β-葡糖苷酶变体BG41成熟编码序列相比所分泌的β-葡糖苷酶活性的2倍增加(two-fold increase)。如实施例11所述创建第二融合构建体,其由与连接有特异腐质霉内切葡聚糖酶V信号序列的米曲霉野生型β-葡糖苷酶编码序列融合的特异腐质霉内切葡聚糖酶V核心(含它自己的信号序列)组成,而且这导致β-葡糖苷酶活性的甚至进一步提高。用野生型融合物转化的菌株具有相对于用β-葡糖苷酶变体BG41融合物转化的菌株两倍的所分泌β-葡糖苷酶活性。
实施例14:β-葡糖苷酶融合蛋白编码序列克隆入米曲霉表达载体
设计了两条下文所示合成寡核苷酸引物,以自编码β-葡糖苷酶融合蛋白的pSaMeFX PCR扩增全长开读框。
PCR正向引物:5’-GGACTGCGCAGCATGCGTTC-3’(SEQ ID NO:71)
PCR反向引物:5’-AGTTAATTAATTACTGGGCCTTAGGCAGCG-3’(SEQID NO:72)
粗体字母代表编码序列。正向引物中加下划线的“G”代表为了创建Sph I限制性位点而引入的碱基变化。剩余序列与pSaMeFX的***位点相比包含序列同一性。反向引物中加下划线的序列代表为了便于在表达载体pAlLo2(WO 04/099228)中克隆此基因而添加的Pac I限制性位点。
在终体积50μl中含50ng pSaMeFX DNA,1X Pfx扩增缓冲液,6μl 10mMdATP,dTTP,dGTP和dCTP混合物,2.5个单位Pfx DNA聚合物,和1μl的50mM MgSO4的PCR反应中使用50pmol每种上文引物。使用 5333来扩增片段,编程为1个循环的98℃2分钟;和35个循环,每个循环为96℃30秒,61℃30秒和68℃3分钟。35个循环后,将反应在68℃温育10分钟,然后在10℃冷却,直至进一步处理。在使用TAE缓冲液和0.1μg/ml溴化乙锭的0.8%GTG-琼脂糖凝胶(CambrexBioproducts One Meadowlands Plaza East Rutherford,NJ,USA)上分离3.3kbPCR反应产物。借助DARK READERTM(Clare Chemical Research,Dolores,CO,USA)显现DNA以避免UV诱导的突变。用一次性使用的刀片切下3.3kb DNA条带并用-DA旋转杯(Millipore,Billerica,MA,USA)根据制造商的说明书将其纯化。
将纯化后的3.3kb PCR产物克隆入4Blunt-载体(Invitrogen,Carlsbad,CA,USA)。将4μl纯化后的PCR产物与1μl的2M氯化钠溶液和1μl载体混合。将反应在室温温育15分钟,然后根据制造商的说明书使用2μl反应液转化OneTOP10化学感受态大肠杆菌细胞。将转化反应的3份等分试样(每份83μl)涂布在3个150mm补充有100μg/ml氨苄青霉素的2XYT板上并在37℃温育过夜。
使用8个重组菌落接种含3ml补充有100μg/ml氨苄青霉素的LB培养基的液体培养基。使用9600(QIAGEN Inc.,Valencia,CA,USA)自这些培养物制备质粒DNA。通过Pac I限制酶消化来分析克隆。将来自每个克隆的质粒DNA用Pac I消化并通过使用TAE缓冲液的1.0%琼脂糖凝胶电泳进行分析。所有8个克隆都具有预期的限制性消化样式,而且选择克隆5、6、7和8进行测序以验证所克隆的***物中没有突变。它们5’和3’端的序列分析显示所有4个克隆都具有正确的序列。选择克隆5和7用于进一步测序。对这两个克隆测序至Phred Q值大于40以确保没有PCR诱导的错误。克隆5和7显示出具有预期的序列,而且选择克隆5用于再克隆入pAlLo2。
将来自克隆5的质粒DNA通过用SphI消化来线性化。然后通过添加1.2μl10mM dATP,dTTP,dGTP和dCTP混合物,和6个单位T4DNA聚合酶(NewEngland Bioloabs,Inc.,Ipswich,MA,USA)来将线性化的克隆平端化(blunt-ended)。将混合物在12℃温育20分钟,然后通过添加1μl的0.5M EDTA并在75℃加热20分钟以灭活酶来停止反应。如上所述通过凝胶电泳和超滤来纯化编码β-葡糖苷酶融合蛋白的3.3kb片段。
将载体pAlLo2通过用Nco I消化线性化。然后通过添加0.5μl的10mMdATP,dTTP,dGTP和dCTP混合物,和1个单位DNA聚合酶I来将线性化的载体平端化。将混合物在25℃温育15分钟,然后通过添加1μl的0.5M EDTA并在75℃加热15分钟以灭活酶来停止反应。然后将载体用Pac I消化。如上所述通过凝胶电泳和超滤来纯化平端化的载体。
用快速连接试剂盒来实施将编码β-葡糖苷酶融合蛋白的3.3kb片段克隆入经过线性化和纯化的pAlLo2载体。根据制造商的说明书使用1μl反应样品转化大肠杆菌XL10金细胞(Stratagene,La Jolla,CA,USA)。回收期后,将来自转化反应的2份100μl等分试样涂布到2个150mm补充有100μg/ml氨苄青霉素的2X YT板上并在37℃温育过夜。自选择板随机选择一组8个假定的重组克隆并使用9600自每个克隆制备质粒DNA。选择克隆1-4用于使用pAlLo2特异性引物进行的测序以验证载体/***物连接处具有正确序列。克隆3具有正确的载体/***物连接处并命名为pAlLo47(图13)。
为了创建不含标志物的表达株,进行限制性内切核酸酶消化以将赋予对抗生素氨苄青霉素的抗性的blaA基因与表达构建体的剩余部分分开。用Pme I消化30μg pAlLo47。然后如上所述通过琼脂糖凝胶电泳纯化消化后的DNA。用刀片切下包含表达构建体但缺少blaA基因的6.4kb DNA条带并用凝胶提取试剂盒纯化。
实施例15:β-葡糖苷酶融合蛋白在米曲霉JaL355中的表达
根据Christensen等,1988,Bio/Technology 6:1419-1422的方法制备米曲霉JaL355(WO 00/240694)原生质体。使用10μl纯化的实施例14表达构建体转化米曲霉JaL355原生质体。米曲霉JaL355的转化产生大约90个转化体。将50个转化体分离至各个PDA板并在34℃温育5天。
用3ml 0.01%80清洗48个汇合孢子板并使用孢子悬浮液接种125ml玻璃摇瓶中的25ml MDU2BP培养基。将转化体培养物在34℃以200rpm恒定摇动温育。5天后,将每份培养物的1ml等分试样以12,000xg离心并收集它们的上清液。将每份上清液的5μl与等体积的2X加样缓冲液(10%β-巯基乙醇)混合并加载到1.5mm 8%-16%Tris-甘氨酸SDS-PAGE凝胶上,用BIO-考马斯蓝G250蛋白质染料(Bio-Rad,Hercules,CA,USA)染色。培养液的SDS-PAGE序型显示了48个转化体中的33个能够表达一种新的蛋白质,其表观分子量非常接近预期的118kDa。转化体21产生最好的产量(yield),选择用于进一步研究。
实施例16:米曲霉JaL355转化体21的单孢子分离
将米曲霉JaL355转化体21的孢子涂布在PDA板上并在34℃温育5天。用0.5ml的0.01%80清洗小面积的汇合孢子板以重悬浮孢子。将100μl孢子悬浮液等分试样用0.01%80稀释至终体积5ml。借助血细胞计数器,确定孢子浓度并稀释至终浓度为每微升0.1个孢子。将200μl孢子稀释液等分试样涂布在150mm极限培养基板上并在34℃温育2-3天。自板上切下出现的菌落并转移至PDA板,在34℃温育3天。然后将孢子涂布在板上并在34℃再温育5天。
用3ml 0.01%80清洗汇合孢子板并使用孢子悬浮液接种125ml玻璃摇瓶中的25ml MDU2BP培养基。将单孢子培养物在34℃以200rpm恒定摇动温育。5天后,将每份培养物的1ml等分试样以12,000xg离心并收集它们的上清液。将每份上清液的5μl与等体积的2X加样缓冲液(10%β-巯基乙醇)混合并加载到1.5mm 8%-16%Tris-甘氨酸SDS-PAGE凝胶上,用BIO-考马斯蓝G250蛋白质染料染色。培养液的SDS-PAGE序型显示了所有8个转化体都能够以很高的水平表达β-葡糖苷酶融合蛋白,而且一个命名为米曲霉JaL355AlLo47的培养物产生最好的产量。
本申请描述和要求保护的本发明并不受限于本申请所公开的具体方面的范围,因为这些方面意欲作为本发明几个方面的说明。任何等价的方面意欲在本发明的范围之内。实际上,从前面的说明中,除本申请所显示和描述的之外,本发明的多种修改对于本领域的技术人员来说是显而易见的。这些修改也意欲落入所附的权利要求的范围内。在冲突的情况下,将以包括定义的本公开为准。
本申请引用了多篇参考文献,其公开的内容通过引用以其整体并入。
序列表
<110>诺维信股份有限公司(Novozymes,Inc.)
<120>提高具有生物学活性之多肽的分泌的方法
<130>10916.204-WO
<150>US 60/832,511
<151>2006-07-21
<160>76
<170>PatentIn version 3.4
<210>1
<211>923
<212>DNA
<213>特异腐质霉(Humicola insolens)
<400>1
atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt 60
gccgctgatg gcaggtccac ccgctactgg gactgctgca agccttcgtg cggctgggcc 120
aagaaggctc ccgtgaacca gcctgtcttt tcctgcaacg ccaacttcca gcgtatcacg 180
gacttcgacg ccaagtccgg ctgcgagccg ggcggtgtcg cctactcgtg cgccgaccag 240
accccatggg ctgtgaacga cgacttcgcg ctcggttttg ctgccacctc tattgccggc 300
agcaatgagg cgggctggtg ctgcgcctgc tacgagctca ccttcacatc cggtcctgtt 360
gctggcaaga agatggtcgt ccagtccacc agcactggcg gtgatcttgg cagcaaccac 420
ttcgatctca acatccccgg cggcggcgtc ggcatcttcg acggatgcac tccccagttc 480
ggcggtctgc ccggccagcg ctacggcggc atctcgtccc gcaacgagtg cgatcggttc 540
cccgacgccc tcaagcccgg ctgctactgg cgcttcgact ggttcaagaa cgccgacaat 600
ccgagcttca gcttccgtca ggtccagtgc ccagccgagc tcgtcgctcg caccggatgc 660
cgccgcaacg acgacggcaa cttccctgcc gtccagatcc cctccagcag caccagctct 720
ccggtcaacc agcctaccag caccagcacc acgtccacct ccaccacctc gagcccgcca 780
gtccagccta cgactcccag cggctgcact gctgagaggt gggctcagtg cggcggcaat 840
ggctggagcg gctgcaccac ctgcgtcgct ggcagcactt gcacgaagat taatgactgg 900
taccatcagt gcctgtagaa ttc 923
<210>2
<211>305
<212>PRT
<213>特异腐质霉(Humicola insolens)
<400>2
Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro
1 5 10 15
Val Leu Ala Leu Ala Ala Asp Gly Arg Ser Thr Arg Tyr Trp Asp Cys
20 25 30
Cys Lys Pro Ser Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro
35 40 45
Val Phe Ser Cys Asn Ala Asn Phe Gln Arg Ile Thr Asp Phe Asp Ala
50 55 60
Lys Ser Gly Cys Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln
65 70 75 80
Thr Pro Trp Ala Val Asn Asp Asp Phe Ala Leu Gly Phe Ala Ala Thr
85 90 95
Ser Ile Ala Gly Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Glu
100 105 110
Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln
115 120 125
Ser Thr Ser Thr Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn
130 135 140
Ile Pro Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe
145 150 155 160
Gly Gly Leu Pro Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu
165 170 175
Cys Asp Arg Phe Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe
180 185 190
Asp Trp Phe Lys Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val
195 200 205
Gln Cys Pro Ala Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp
210 215 220
Asp Gly Asn Phe Pro Ala Val Gln Ile Pro Ser Ser Ser Thr Ser Ser
225 230 235 240
Pro Val Asn Gln Pro Thr Ser Thr Ser Thr Thr Ser Thr Ser Thr Thr
245 250 255
Ser Ser Pro Pro Val Gln Pro Thr Thr Pro Ser Gly Cys Thr Ala Glu
260 265 270
Arg Trp Ala Gln Cys Gly Gly Asn Gly Trp Ser Gly Cys Thr Thr Cys
275 280 285
Val Ala Gly Ser Thr Cys Thr Lys Ile Asn Asp Trp Tyr His Gln Cys
290 295 300
Leu
305
<210>3
<211>1188
<212>DNA
<213>嗜热毁丝霉(Myceliophthora thermophila)
<400>3
cgacttgaaa cgccccaaat gaagtcctcc atcctcgcca gcgtcttcgc cacgggcgcc 60
gtggctcaaa gtggtccgtg gcagcaatgt ggtggcatcg gatggcaagg atcgaccgac 120
tgtgtgtcgg gctaccactg cgtctaccag aacgattggt acagccagtg cgtgcctggc 180
gcggcgtcga caacgctgca gacatcgacc acgtccaggc ccaccgccac cagcaccgcc 240
cctccgtcgt ccaccacctc gcctagcaag ggcaagctga agtggctcgg cagcaacgag 300
tcgggcgccg agttcgggga gggcaattac cccggcctct ggggcaagca cttcatcttc 360
ccgtcgactt cggcgattca gacgctcatc aatgatggat acaacatctt ccggatcgac 420
ttctcgatgg agcgtctggt gcccaaccag ttgacgtcgt ccttcgacca gggttacctc 480
cgcaacctga ccgaggtggt caacttcgtg acgaacgcgg gcaagtacgc cgtcctggac 540
ccgcacaact acggccggta ctacggcaac atcatcacgg acacgaacgc gttccggacc 600
ttctggacca acctggccaa gcagttcgcc tccaactcgc tcgtcatctt cgacaccaac 660
aacgagtaca acacgatgga ccagaccctg gtgctcaacc tcaaccaggc cgccatcgac 720
ggcatccggg ccgccggcgc gacctcgcag tacatcttcg tcgagggcaa cgcgtggagc 780
ggggcctgga gctggaacac gaccaacacc aacatggccg ccctgacgga cccgcagaac 840
aagatcgtgt acgagatgca ccagtacctc gactcggaca gctcgggcac ccacgccgag 900
tgcgtcagca gcaccatcgg cgcccagcgc gtcgtcggag ccacccagtg gctccgcgcc 960
aacggcaagc tcggcgtcct cggcgagttc gccggcggcg ccaacgccgt ctgccagcag 1020
gccgtcaccg gcctcctcga ccacctccag gacaacagcg acgtctggct gggtgccctc 1080
tggtgggccg ccggtccctg gtggggcgac tacatgtact cgttcgagcc tccttcgggc 1140
accggctatg tcaactacaa ctcgatcttg aagaagtact tgccgtaa 1188
<210>4
<211>389
<212>PRT
<213>嗜热毁丝霉(Myceliophthora thermophila)
<400>4
Met Lys Ser Ser Ile Leu Ala Ser Val Phe Ala Thr Gly Ala Val Ala
1 5 10 15
Gln Ser Gly Pro Trp Gln Gln Cys Gly Gly Ile Gly Trp Gln Gly Ser
20 25 30
Thr Asp Cys Val Ser Gly Tyr His Cys Val Tyr Gln Asn Asp Trp Tyr
35 40 45
Ser Gln Cys Val Pro Gly Ala Ala Ser Thr Thr Leu Gln Thr Ser Thr
50 55 60
Thr Ser Arg Pro Thr Ala Thr Ser Thr Ala Pro Pro Ser Ser Thr Thr
65 70 75 80
Ser Pro Ser Lys Gly Lys Leu Lys Trp Leu Gly Ser Asn Glu Ser Gly
85 90 95
Ala Glu Phe Gly Glu Gly Asn Tyr Pro Gly Leu Trp Gly Lys His Phe
100 105 110
Ile Phe Pro Ser Thr Ser Ala Ile Gln Thr Leu Ile Asn Asp Gly Tyr
115 120 125
Asn Ile Phe Arg Ile Asp Phe Ser Met Glu Arg Leu Val Pro Asn Gln
130 135 140
Leu Thr Ser Ser Phe Asp Gln Gly Tyr Leu Arg Asn Leu Thr Glu Val
145 150 155 160
Val Asn Phe Val Thr Asn Ala Gly Lys Tyr Ala Val Leu Asp Pro His
165 170 175
Asn Tyr Gly Arg Tyr Tyr Gly Asn Ile Ile Thr Asp Thr Asn Ala Phe
180 185 190
Arg Thr Phe Trp Thr Asn Leu Ala Lys Gln Phe Ala Ser Asn Ser Leu
195 200 205
Val Ile Phe Asp Thr Asn Asn Glu Tyr Asn Thr Met Asp Gln Thr Leu
210 215 220
Val Leu Asn Leu Asn Gln Ala Ala Ile Asp Gly Ile Arg Ala Ala Gly
225 230 235 240
Ala Thr Ser Gln Tyr Ile Phe Val Glu Gly Asn Ala Trp Ser Gly Ala
245 250 255
Trp Ser Trp Asn Thr Thr Asn Thr Asn Met Ala Ala Leu Thr Asp Pro
260 265 270
Gln Asn Lys Ile Val Tyr Glu Met His Gln Tyr Leu Asp Ser Asp Ser
275 280 285
Ser Gly Thr His Ala Glu Cys Val Ser Ser Thr Ile Gly Ala Gln Arg
290 295 300
Val Val Gly Ala Thr Gln Trp Leu Arg Ala Asn Gly Lys Leu Gly Val
305 310 315 320
Leu Gly Glu Phe Ala Gly Gly Ala Asn Ala Val Cys Gln Gln Ala Val
325 330 335
Thr Gly Leu Leu Asp His Leu Gln Asp Asn Ser Asp Val Trp Leu Gly
340 345 350
Ala Leu Trp Trp Ala Ala Gly Pro Trp Trp Gly Asp Tyr Met Tyr Ser
355 360 365
Phe Glu Pro Pro Ser Gly Thr Gly Tyr Val Asn Tyr Asn Ser Ile Leu
370 375 380
Lys Lys Tyr Leu Pro
385
<210>5
<211>1232
<212>DNA
<213>嗜热毁丝霉(Myceliophthora thermophila)
<400>5
ggatccactt agtaacggcc gccagtgtgc tggaaagcat gaagtctctc ttcctgtcac 60
ttgtagcgac cgtcgcgctc agctcgccag tattctctgt cgcagtctgg gggcaatgcg 120
gcggcattgg cttcagcgga agcaccgtct gtgatgcagg cgccggctgt gtgaagctca 180
acgactatta ctctcaatgc caacccggcg ctcccactgc tacatccgcg gcgccaagta 240
gcaacgcacc gtccggcact tcgacggcct cggccccctc ctccagcctt tgctctggca 300
gccgcacgcc gttccagttc ttcggtgtca acgaatccgg cgcggagttc ggcaacctga 360
acatccccgg tgttctgggc accgactaca cctggccgtc gccatccagc attgacttct 420
tcatgggcaa gggaatgaat accttccgta ttccgttcct catggagcgt cttgtccccc 480
ctgccactgg catcacagga cctctcgacc agacgtactt gggcggcctg cagacgattg 540
tcaactacat caccggcaaa ggcggctttg ctctcattga cccgcacaac tttatgatct 600
acaatggcca gacgatctcc agtaccagcg acttccagaa gttctggcag aacctcgcag 660
gagtgtttaa atcgaacagt cacgtcatct tcgatgttat gaacgagcct cacgatattc 720
ccgcccagac cgtgttccaa ctgaaccaag ccgctgtcaa tggcatccgt gcgagcggtg 780
cgacgtcgca gctcattctg gtcgagggca caagctggac tggagcctgg acctggacga 840
cctctggcaa cagcgatgca ttcggtgcca ttaaggatcc caacaacaac gtcgcgatcc 900
agatgcatca gtacctggat agcgatggct ctggcacttc gcagacctgc gtgtctccca 960
ccatcggtgc cgagcggttg caggctgcga ctcaatggtt gaagcagaac aacctcaagg 1020
gcttcctggg cgagatcggc gccggctcta actccgcttg catcagcgct gtgcagggtg 1080
cgttgtgttc gatgcagcaa tctggtgtgt ggctcggcgc tctctggtgg gctgcgggcc 1140
cgtggtgggg cgactactac cagtccatcg agccgccctc tggcccggcg gtgtccgcga 1200
tcctcccgca ggccctgctg ccgttcgcgt aa 1232
<210>6
<211>397
<212>PRT
<213>嗜热毁丝霉(Myceliophthora thermophila)
<400>6
Met Lys Ser Leu Phe Leu Ser Leu Val Ala Thr Val Ala Leu Ser Ser
1 5 10 15
Pro Val Phe Ser Val Ala Val Trp Gly Gln Cys Gly Gly Ile Gly Phe
20 25 30
Ser Gly Ser Thr Val Cys Asp Ala Gly Ala Gly Cys Val Lys Leu Asn
35 40 45
Asp Tyr Tyr Ser Gln Cys Gln Pro Gly Ala Pro Thr Ala Thr Ser Ala
50 55 60
Ala Pro Ser Ser Asn Ala Pro Ser Gly Thr Ser Thr Ala Ser Ala Pro
65 70 75 80
Ser Ser Ser Leu Cys Ser Gly Ser Arg Thr Pro Phe Gln Phe Phe Gly
85 90 95
Val Asn Glu Ser Gly Ala Glu Phe Gly Asn Leu Asn Ile Pro Gly Val
100 105 110
Leu Gly Thr Asp Tyr Thr Trp Pro Ser Pro Ser Ser Ile Asp Phe Phe
115 120 125
Met Gly Lys Gly Met Asn Thr Phe Arg Ile Pro Phe Leu Met Glu Arg
130 135 140
Leu Val Pro Pro Ala Thr Gly Ile Thr Gly Pro Leu Asp Gln Thr Tyr
145 150 155 160
Leu Gly Gly Leu Gln Thr Ile Val Asn Tyr Ile Thr Gly Lys Gly Gly
165 170 175
Phe Ala Leu Ile Asp Pro His Asn Phe Met Ile Tyr Asn Gly Gln Thr
180 185 190
Ile Ser Ser Thr Ser Asp Phe Gln Lys Phe Trp Gln Asn Leu Ala Gly
195 200 205
Val Phe Lys Ser Asn Ser His Val Ile Phe Asp Val Met Asn Glu Pro
210 215 220
His Asp Ile Pro Ala Gln Thr Val Phe Gln Leu Asn Gln Ala Ala Val
225 230 235 240
Asn Gly Ile Arg Ala Ser Gly Ala Thr Ser Gln Leu Ile Leu Val Glu
245 250 255
Gly Thr Ser Trp Thr Gly Ala Trp Thr Trp Thr Thr Ser Gly Asn Ser
260 265 270
Asp Ala Phe Gly Ala Ile Lys Asp Pro Asn Asn Asn Val Ala Ile Gln
275 280 285
Met His Gln Tyr Leu Asp Ser Asp Gly Ser Gly Thr Ser Gln Thr Cys
290 295 300
Val Ser Pro Thr Ile Gly Ala Glu Arg Leu Gln Ala Ala Thr Gln Trp
305 310 315 320
Leu Lys Gln Asn Asn Leu Lys Gly Phe Leu Gly Glu Ile Gly Ala Gly
325 330 335
Ser Asn Ser Ala Cys Ile Ser Ala Val Gln Gly Ala Leu Cys Ser Met
340 345 350
Gln Gln Ser Gly Val Trp Leu Gly Ala Leu Trp Trp Ala Ala Gly Pro
355 360 365
Trp Trp Gly Asp Tyr Tyr Gln Ser Ile Glu Pro Pro Ser Gly Pro Ala
370 375 380
Val Ser Ala Ile Leu Pro Gln Ala Leu Leu Pro Phe Ala
385 390 395
<210>7
<211>1303
<212>DNA
<213>担子菌纲(Basidiomycete)CBS 495.95
<400>7
ggaaagcgtc agtatggtga aatttgcgct tgtggcaact gtcggcgcaa tcttgagcgc 60
ttctgcggcc aatgcggctt ctatctacca gcaatgtgga ggcattggat ggtctgggtc 120
cactgtttgc gacgccggtc tcgcttgcgt tatcctcaat gcgtactact ttcagtgctt 180
gacgcccgcc gcgggccaga caacgacggg ctcgggcgca ccggcgtcaa catcaacctc 240
tcactcaacg gtcactacgg ggagctcaca ctcaacaacc gggacgacgg cgacgaaaac 300
aactaccact ccgtcgacca ccacgaccct acccgccatc tctgtgtctg gtcgcgtctg 360
ctctggctcc aggacgaagt tcaagttctt cggtgtgaat gaaagcggcg ccgaattcgg 420
gaacactgct tggccagggc agctcgggaa agactataca tggccttcgc ctagcagcgt 480
ggactacttc atgggggctg gattcaatac attccgtatc accttcttga tggagcgtat 540
gagccctccg gctaccggac tcactggccc attcaaccag acgtacctgt cgggcctcac 600
caccattgtc gactacatca cgaacaaagg aggatacgct cttattgacc cccacaactt 660
catgcgttac aacaacggca taatcagcag cacatctgac ttcgcgactt ggtggagcaa 720
tttggccact gtattcaaat ccacgaagaa cgccatcttc gacatccaga acgagccgta 780
cggaatcgat gcgcagaccg tatacgaact gaatcaagct gccatcaatt cgatccgcgc 840
cgctggcgct acgtcacagt tgattctggt tgaaggaacg tcatacactg gagcttggac 900
gtgggtctcg tccggaaacg gagctgcttt cgcggccgtt acggatcctt acaacaacac 960
ggcaattgaa atgcaccaat acctcgacag cgacggttct gggacaaacg aagactgtgt 1020
ctcctccacc attgggtcgc aacgtctcca agctgccact gcgtggctgc aacaaacagg 1080
actcaaggga ttcctcggag agacgggtgc tgggtcgaat tcccagtgca tcgacgccgt 1140
gttcgatgaa ctttgctata tgcaacagca aggcggctcc tggatcggtg cactctggtg 1200
ggctgcgggt ccctggtggg gcacgtacat ttactcgatt gaacctccga gcggtgccgc 1260
tatcccagaa gtccttcctc agggtctcgc tccattcctc tag 1303
<210>8
<211>429
<212>PRT
<213>担子菌纲(BASIDIOMYCETE)CBS 495.95
<400>8
Met Val Lys Phe Ala Leu Val Ala Thr Val Gly Ala Ile Leu Ser Ala
1 5 10 15
Ser Ala Ala Asn Ala Ala Ser Ile Tyr Gln Gln Cys Gly Gly Ile Gly
20 25 30
Trp Ser Gly Ser Thr Val Cys Asp Ala Gly Leu Ala Cys Val Ile Leu
35 40 45
Asn Ala Tyr Tyr Phe Gln Cys Leu Thr Pro Ala Ala Gly Gln Thr Thr
50 55 60
Thr Gly Ser Gly Ala Pro Ala Ser Thr Ser Thr Ser His Ser Thr Val
65 70 75 80
Thr Thr Gly Ser Ser His Ser Thr Thr Gly Thr Thr Ala Thr Lys Thr
85 90 95
Thr Thr Thr Pro Ser Thr Thr Thr Thr Leu Pro Ala Ile Ser Val Ser
100 105 110
Gly Arg Val Cys Ser Gly Ser Arg Thr Lys Phe Lys Phe Phe Gly Val
115 120 125
Asn Glu Ser Gly Ala GIu Phe Gly Asn Thr Ala Trp Pro Gly Gln Leu
130 135 140
Gly Lys Asp Tyr Thr Trp Pro Ser Pro Ser Ser Val Asp Tyr Phe Met
145 150 155 160
Gly Ala Gly Phe Asn Thr Phe Arg Ile Thr Phe Leu Met Glu Arg Met
165 170 175
Ser Pro Pro Ala Thr Gly Leu Thr Gly Pro Phe Asn Gln Thr Tyr Leu
180 185 190
Ser Gly Leu Thr Thr Ile Val Asp Tyr Ile Thr Asn Lys Gly Gly Tyr
195 200 205
Ala Leu Ile Asp Pro His Asn Phe Met Arg Tyr Asn Asn Gly Ile Ile
210 215 220
Ser Ser Thr Ser Asp Phe Ala Thr Trp Trp Ser Asn Leu Ala Thr Val
225 230 235 240
Phe Lys Ser Thr Lys Asn Ala Ile Phe Asp Ile Gln Asn Glu Pro Tyr
245 250 255
Gly Ile Asp Ala Gln Thr Val Tyr Glu Leu Asn Gln Ala Ala Ile Asn
260 265 270
Ser Ile Arg Ala Ala Gly Ala Thr Ser Gln Leu Ile Leu Val Glu Gly
275 280 285
Thr Ser Tyr Thr Gly Ala Trp Thr Trp Val Ser Ser Gly Asn Gly Ala
290 295 300
Ala Phe Ala Ala Val Thr Asp Pro Tyr Asn Asn Thr Ala Ile Glu Met
305 310 315 320
His Gln Tyr Leu Asp Ser Asp Gly Ser Gly Thr Asn Glu Asp Cys Val
325 330 335
Ser Ser Thr Ile Gly Ser Gln Arg Leu Gln Ala Ala Thr Ala Trp Leu
340 345 350
Gln Gln Thr Gly Leu Lys Gly Phe Leu Gly Glu Thr Gly Ala Gly Ser
355 360 365
Asn Ser Gln Cys Ile Asp Ala Val Phe Asp Glu Leu Cys Tyr Met Gln
370 375 380
Gln Gln Gly Gly Ser Trp Ile Gly Ala Leu Trp Trp Ala Ala Gly Pro
385 390 395 400
Trp Trp Gly Thr Tyr Ile Tyr Ser Ile Glu Pro Pro Ser Gly Ala Ala
405 410 415
Ile Pro Glu Val Leu Pro Gln Gly Leu Ala Pro Phe Leu
420 425
<210>9
<211>1580
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>9
agccccccgt tcaggcacac ttggcatcag atcagcttag cagcgcctgc acagcatgaa 60
gctctcgcag tcggccgcgc tggcggcact caccgcgacg gcgctcgccg ccccctcgcc 120
cacgacgccg caggcgccga ggcaggcttc agccggctgc tcgtctgcgg tcacgctcga 180
cgccagcacc aacgtttgga agaagtacac gctgcacccc aacagctact accgcaagga 240
ggttgaggcc gcggtggcgc agatctcgga cccggacctc gccgccaagg ccaagaaggt 300
ggccgacgtc ggcaccttcc tgtggctcga ctcgatcgag aacatcggca agctggagcc 360
ggcgatccag gacgtgccct gcgagaacat cctgggcctg gtcatctacg acctgccggg 420
ccgcgactgc gcggccaagg cgtccaacgg cgagctcaag gtcggcgaga tcgaccgcta 480
caagaccgag tacatcgaca gtgagtgctg ccccccgggt tcgagaagag cgtgggggaa 540
agggaaaggg ttgactgact gacacggcgc actgcagaga tcgtgtcgat cctcaaggca 600
caccccaaca cggcgttcgc gctggtcatc gagccggact cgctgcccaa cctggtgacc 660
aacagcaact tggacacgtg ctcgagcagc gcgtcgggct accgcgaagg cgtggcttac 720
gccctcaaga acctcaacct gcccaacgtg atcatgtacc tcgacgccgg ccacggcggc 780
tggctcggct gggacgccaa cctgcagccc ggcgcgcagg agctagccaa ggcgtacaag 840
aacgccggct cgcccaagca gctccgcggc ttctcgacca acgtggccgg ctggaactcc 900
tggtgagctt ttttccattc catttcttct tcctcttctc tcttcgctcc cactctgcag 960
ccccccctcc cccaagcacc cactggcgtt ccggcttgct gactcggcct ccctttcccc 1020
gggcaccagg gatcaatcgc ccggcgaatt ctcccaggcg tccgacgcca agtacaacaa 1080
gtgccagaac gagaagatct acgtcagcac cttcggctcc gcgctccagt cggccggcat 1140
gcccaaccac gccatcgtcg acacgggccg caacggcgtc accggcctgc gcaaggagtg 1200
gggtgactgg tgcaacgtca acggtgcagg ttcgttgtct tctttttctc ctcttttgtt 1260
tgcacgtcgt ggtccttttc aagcagccgt gtttggttgg gggagatgga ctccggctga 1320
tgttctgctt cctctctagg cttcggcgtg cgcccgacga gcaacacggg cctcgagctg 1380
gccgacgcgt tcgtgtgggt caagcccggc ggcgagtcgg acggcaccag cgacagctcg 1440
tcgccgcgct acgacagctt ctgcggcaag gacgacgcct tcaagccctc gcccgaggcc 1500
ggcacctgga acgaggccta cttcgagatg ctgctcaaga acgccgtgcc gtcgttctaa 1560
gacggtccag catcatccgg 1580
<210>10
<211>396
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>10
Met Lys Leu Ser Gln Ser Ala Ala Leu Ala Ala Leu Thr Ala Thr Ala
1 5 10 15
Leu Ala Ala Pro Ser Pro Thr Thr Pro Gln Ala Pro Arg Gln Ala Ser
20 25 30
Ala Gly Cys Ser Ser Ala Val Thr Leu Asp Ala Ser Thr Asn Val Trp
35 40 45
Lys Lys Tyr Thr Leu His Pro Asn Ser Tyr Tyr Arg Lys Glu Val Glu
50 55 60
Ala Ala Val Ala Gln Ile Ser Asp Pro Asp Leu Ala Ala Lys Ala Lys
65 70 75 80
Lys Val Ala Asp Val Gly Thr Phe Leu Trp Leu Asp Ser Ile Glu Asn
85 90 95
Ile Gly Lys Leu Glu Pro Ala Ile Gln Asp Val Pro Cys Glu Asn Ile
100 105 110
Leu Gly Leu Val Ile Tyr Asp Leu Pro Gly Arg Asp Cys Ala Ala Lys
115 120 125
Ala Ser Asn Gly Glu Leu Lys Val Gly Glu Ile Asp Arg Tyr Lys Thr
130 135 140
Glu Tyr Ile Asp Lys Ile Val Ser Ile Leu Lys Ala His Pro Asn Thr
145 150 155 160
Ala Phe Ala Leu Val Ile Glu Pro Asp Ser Leu Pro Asn Leu Val Thr
165 170 175
Asn Ser Asn Leu Asp Thr Cys Ser Ser Ser Ala Ser Gly Tyr Arg Glu
180 185 190
Gly Val Ala Tyr Ala Leu Lys Asn Leu Asn Leu Pro Asn Val Ile Met
195 200 205
Tyr Leu Asp Ala Gly His Gly Gly Trp Leu Gly Trp Asp Ala Asn Leu
210 215 220
Gln Pro Gly Ala Gln Glu Leu Ala Lys Ala Tyr Lys Asn Ala Gly Ser
225 230 235 240
Pro Lys Gln Leu Arg Gly Phe Ser Thr Asn Val Ala Gly Trp Asn Ser
245 250 255
Trp Asp Gln Ser Pro Gly Glu Phe Ser Gln Ala Ser Asp Ala Lys Tyr
260 265 270
Asn Lys Cys Gln Asn Glu Lys Ile Tyr Val Ser Thr Phe Gly Ser Ala
275 280 285
Leu Gln Ser Ala Gly Met Pro Asn His Ala Ile Val Asp Thr Gly Arg
290 295 300
Asn Gly Val Thr Gly Leu Arg Lys Glu Trp Gly Asp Trp Cys Asn Val
305 310 315 320
Asn Gly Ala Gly Phe Gly Val Arg Pro Thr Ser Asn Thr Gly Leu Glu
325 330 335
Leu Ala Asp Ala Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly
340 345 350
Thr Ser Asp Ser Ser Ser Pro Arg Tyr Asp Ser Phe Cys Gly Lys Asp
355 360 365
Asp Ala Phe Lys Pro Ser Pro Glu Ala Gly Thr Trp Asn Glu Ala Tyr
370 375 380
Phe Glu Met Leu Leu Lys Asn Ala Val Pro Ser Phe
385 390 395
<210>11
<211>1203
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>11
atgaagtacc tcaacctcct cgcagctctc ctcgccgtcg ctcctctctc cctcgctgca 60
cccagcatcg aggccagaca gtcgaacgtc aacccataca tcggcaagag cccgctcgtt 120
attaggtcgt acgcccaaaa gcttgaggag accgtcagga ccttccagca acgtggcgac 180
cagctcaacg ctgcgaggac acggacggtg cagaacgttg cgactttcgc ctggatctcg 240
gataccaatg gtattggagc cattcgacct ctcatccaag atgctctcgc ccagcaggct 300
cgcactggac agaaggtcat cgtccaaatc gtcgtctaca acctcccaga tcgcgactgc 360
tctgccaacg cctcgactgg agagttcacc gtaggaaacg acggtctcaa ccgatacaag 420
aactttgtca acaccatcgc ccgcgagctc tcgactgctg acgctgacaa gctccacttt 480
gccctcctcc tcgaacccga cgcacttgcc aacctcgtca ccaacgcgaa tgcccccagg 540
tgccgaatcg ccgctcccgc ttacaaggag ggtatcgcct acaccctcgc caccttgtcc 600
aagcccaacg tcgacgtcta catcgacgcc gccaacggtg gctggctcgg ctggaacgac 660
aacctccgcc ccttcgccga actcttcaag gaagtctacg acctcgcccg ccgcatcaac 720
cccaacgcca aggtccgcgg cgtccccgtc aacgtctcca actacaacca gtaccgcgct 780
gaagtccgcg agcccttcac cgagtggaag gacgcctggg acgagagccg ctacgtcaac 840
gtcctcaccc cgcacctcaa cgccgtcggc ttctccgcgc acttcatcgt tgaccaggga 900
cgcggtggca agggcggtat caggacggag tggggccagt ggtgcaacgt taggaacgct 960
gggttcggta tcaggcctac tgcggatcag ggcgtgctcc agaacccgaa tgtggatgcg 1020
attgtgtggg ttaagccggg tggagagtcg gatggcacga gtgatttgaa ctcgaacagg 1080
tatgatccta cgtgcaggag tccggtggcg catgttcccg ctcctgaggc tggccagtgg 1140
ttcaacgagt atgttgttaa cctcgttttg aacgctaacc cccctcttga gcctacctgg 1200
taa 1203
<210>12
<211>400
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>12
Met Lys Tyr Leu Asn Leu Leu Ala Ala Leu Leu Ala Val Ala Pro Leu
1 5 10 15
Ser Leu Ala Ala Pro Ser Ile Glu Ala Arg Gln Ser Asn Val Asn Pro
20 25 30
Tyr Ile Gly Lys Ser Pro Leu Val Ile Arg Ser Tyr Ala Gln Lys Leu
35 40 45
Glu Glu Thr Val Arg Thr Phe Gln Gln Arg Gly Asp Gln Leu Asn Ala
50 55 60
Ala Arg Thr Arg Thr Val Gln Asn Val Ala Thr Phe Ala Trp Ile Ser
65 70 75 80
Asp Thr Asn Gly Ile Gly Ala Ile Arg Pro Leu Ile Gln Asp Ala Leu
85 90 95
Ala Gln Gln Ala Arg Thr Gly Gln Lys Val Ile Val Gln Ile Val Val
100 105 110
Tyr Asn Leu Pro Asp Arg Asp Cys Ser Ala Asn Ala Ser Thr Gly Glu
115 120 125
Phe Thr Val Gly Asn Asp Gly Leu Asn Arg Tyr Lys Asn Phe Val Asn
130 135 140
Thr Ile Ala Arg Glu Leu Ser Thr Ala Asp Ala Asp Lys Leu His Phe
145 150 155 160
Ala Leu Leu Leu Glu Pro Asp Ala Leu Ala Asn Leu Val Thr Asn Ala
165 170 175
Asn Ala Pro Arg Cys Arg Ile Ala Ala Pro Ala Tyr Lys Glu Gly Ile
180 185 190
Ala Tyr Thr Leu Ala Thr Leu Ser Lys Pro Asn Val Asp Val Tyr Ile
195 200 205
Asp Ala Ala Asn Gly Gly Trp Leu Gly Trp Asn Asp Asn Leu Arg Pro
210 215 220
Phe Ala Glu Leu Phe Lys Glu Val Tyr Asp Leu Ala Arg Arg Ile Asn
225 230 235 240
Pro Asn Ala Lys Val Arg Gly Val Pro Val Asn Val Ser Asn Tyr Asn
245 250 255
Gln Tyr Arg Ala Glu Val Arg Glu Pro Phe Thr Glu Trp Lys Asp Ala
260 265 270
Trp Asp Glu Ser Arg Tyr Val Asn Val Leu Thr Pro His Leu Asn Ala
275 280 285
Val Gly Phe Ser Ala His Phe Ile Val Asp Gln Gly Arg Gly Gly Lys
290 295 300
Gly Gly Ile Arg Thr Glu Trp Gly Gln Trp Cys Asn Val Arg Asn Ala
305 310 315 320
Gly Phe Gly Ile Arg Pro Thr Ala Asp Gln Gly Val Leu Gln Asn Pro
325 330 335
Asn Val Asp Ala Ile Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly
340 345 350
Thr Ser Asp Leu Asn Ser Asn Arg Tyr Asp Pro Thr Cys Arg Ser Pro
355 360 365
Val Ala His Val Pro Ala Pro Glu Ala Gly Gln Trp Phe Asn Glu Tyr
370 375 380
Val Val Asn Leu Val Leu Asn Ala Asn Pro Pro Leu Glu Pro Thr Trp
385 390 395 400
<210>13
<211>1501
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>13
gccgttgtca agatgggcca gaagacgctg cacggattcg ccgccacggc tttggccgtt 60
ctcccctttg tgaaggctca gcagcccggc aacttcacgc cggaggtgca cccgcaactg 120
ccaacgtgga agtgcacgac cgccggcggc tgcgttcagc aggacacttc ggtggtgctc 180
gactggaact accgttggat ccacaatgcc gacggcaccg cctcgtgcac gacgtccagc 240
ggggtcgacc acacgctgtg tccagatgag gcgacctgcg cgaagaactg cttcgtggaa 300
ggcgtcaact acacgagcag cggtgtcacc acatccggca gttcgctgac gatgaggcag 360
tatttcaagg ggagcaacgg gcagaccaac agcgtttcgc ctcgtctcta cctgctcggc 420
tcggatggaa actacgtaat gctcaagctg ctcggccagg agctgagctt cgatgtcgat 480
ctctccacgc tcccctgcgg cgagaacggc gcgctgtacc tgtccgagat ggacgcgacc 540
ggtggcagga accagtacaa caccggcggt gccaactacg gctcgggcta ctgtgacgcc 600
cagtgtcccg tgcagacgtg gatgaacggc acgctgaaca ccaacgggca gggctactgc 660
tgcaacgaga tggacatcct cgaggccaac tcccgcgcca acgcgatgac acctcacccc 720
tgcgccaacg gcagctgcga caagagcggg tgcggactca acccctacgc cgagggctac 780
aagagctact acggaccggg cctcacggtt gacacgtcga agcccttcac catcattacc 840
cgcttcatca ccgacgacgg cacgaccagc ggcaccctca accagatcca gcggatctat 900
gtgcagaatg gcaagacggt cgcgtcggct gcgtccggag gcgacatcat cacggcatcc 960
ggctgcacct cggcccaggc gttcggcggg ctggccaaca tgggcgcggc gcttggacgg 1020
ggcatggtgc tgaccttcag catctggaac gacgctgggg gctacatgaa ctggctcgac 1080
agcggcaaca acggcccgtg cagcagcacc gagggcaacc cgtccaacat cctggccaac 1140
tacccggaca cccacgtggt cttctccaac atccgctggg gagacatcgg ctcgacggtc 1200
caggtctcgg gaggcggcaa cggcggctcg accaccacca cgtcgaccac cacgctgagg 1260
acctcgacca cgaccaccac caccgccccg acggccactg ccacgcactg gggacaatgc 1320
ggcggaatcg gggtacgtca accgcctcct gcattctgtt gaggaagtta actaacgtgg 1380
cctacgcagt ggactggacc gaccgtctgc gaatcgccgt acgcatgcaa ggagctgaac 1440
ccctggtact accagtgcct ctaaagtatt gcagtgaagc catactccgt gctcggcatg 1500
g 1501
<210>14
<211>464
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>14
Met Gly Gln Lys Thr Leu His Gly Phe Ala Ala Thr Ala Leu Ala Val
1 5 10 15
Leu Pro Phe Val Lys Ala Gln Gln Pro Gly Asn Phe Thr Pro Glu Val
20 25 30
His Pro Gln Leu Pro Thr Trp Lys Cys Thr Thr Ala Gly Gly Cys Val
35 40 45
Gln Gln Asp Thr Ser Val Val Leu Asp Trp Asn Tyr Arg Trp Ile His
50 55 60
Asn Ala Asp Gly Thr Ala Ser Cys Thr Thr Ser Ser Gly Val Asp His
65 70 75 80
Thr Leu Cys Pro Asp Glu Ala Thr Cys Ala Lys Asn Cys Phe Val Glu
85 90 95
Gly Val Asn Tyr Thr Ser Ser Gly Val Thr Thr Ser Gly Ser Ser Leu
100 105 110
Thr Met Arg Gln Tyr Phe Lys Gly Ser Asn Gly Gln Thr Asn Ser Val
115 120 125
Ser Pro Arg Leu Tyr Leu Leu Gly Ser Asp Gly Asn Tyr Val Met Leu
130 135 140
Lys Leu Leu Gly Gln Glu Leu Ser Phe Asp Val Asp Leu Ser Thr Leu
145 150 155 160
Pro Cys Gly Glu Asn Gly Ala Leu Tyr Leu Ser Glu Met Asp Ala Thr
165 170 175
Gly Gly Arg Asn Gln Tyr Asn Thr Gly Gly Ala Asn Tyr Gly Ser Gly
180 185 190
Tyr Cys Asp Ala Gln Cys Pro Val Gln Thr Trp Met Asn Gly Thr Leu
195 200 205
Asn Thr Asn Gly Gln Gly Tyr Cys Cys Asn Glu Met Asp Ile Leu Glu
210 215 220
Ala Asn Ser Arg Ala Asn Ala Met Thr Pro His Pro Cys Ala Asn Gly
225 230 235 240
Ser Cys Asp Lys Ser Gly Cys Gly Leu Asn Pro Tyr Ala Glu Gly Tyr
245 250 255
Lys Ser Tyr Tyr Gly Pro Gly Leu Thr Val Asp Thr Ser Lys Pro Phe
260 265 270
Thr Ile Ile Thr Arg Phe Ile Thr Asp Asp Gly Thr Thr Ser Gly Thr
275 280 285
Leu Asn Gln Ile Gln Arg Ile Tyr Val Gln Asn Gly Lys Thr Val Ala
290 295 300
Ser Ala Ala Ser Gly Gly Asp Ile Ile Thr Ala Ser Gly Cys Thr Ser
305 310 315 320
Ala Gln Ala Phe Gly Gly Leu Ala Asn Met Gly Ala Ala Leu Gly Arg
325 330 335
Gly Met Val Leu Thr Phe Ser Ile Trp Asn Asp Ala Gly Gly Tyr Met
340 345 350
Asn Trp Leu Asp Ser Gly Asn Asn Gly Pro Cys Ser Ser Thr Glu Gly
355 360 365
Asn Pro Ser Asn Ile Leu Ala Asn Tyr Pro Asp Thr His Val Val Phe
370 375 380
Ser Asn Ile Arg Trp Gly Asp Ile Gly Ser Thr Val Gln Val Ser Gly
385 390 395 400
Gly Gly Asn Gly Gly Ser Thr Thr Thr Thr Ser Thr Thr Thr Leu Arg
405 410 415
Thr Ser Thr Thr Thr Thr Thr Thr Ala Pro Thr Ala Thr Ala Thr His
420 425 430
Trp Gly Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro Thr Val Cys Glu
435 440 445
Ser Pro Tyr Ala Cys Lys Glu Leu Asn Pro Trp Tyr Tyr Gln Cys Leu
450 455 460
<210>15
<211>1368
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>15
accgatccgc tcgaagatgg cgcccaagtc tacagttctg gccgcctggc tgctctcctc 60
gctggccgcg gcccagcaga tcggcaaagc cgtgcccgag gtccacccca aactgacaac 120
gcagaagtgc actctccgcg gcgggtgcaa gcctgtccgc acctcggtcg tgctcgactc 180
gtccgcgcgc tcgctgcaca aggtcgggga ccccaacacc agctgcagcg tcggcggcga 240
cctgtgctcg gacgcgaagt cgtgcggcaa gaactgcgcg ctcgagggcg tcgactacgc 300
ggcccacggc gtggcgacca agggcgacgc cctcacgctg caccagtggc tcaagggggc 360
cgacggcacc tacaggaccg tctcgccgcg cgtatacctc ctgggcgagg acgggaagaa 420
ctacgaggac ttcaagctgc tcaacgccga gctcagcttc gacgtcgacg tgtcccagct 480
cgtctgcggc atgaacggcg ccctgtactt ctccgagatg gagatggacg gcggccgcag 540
cccgctgaac ccggcgggcg ccacgtacgg cacgggctac tgcgacgcgc agtgccccaa 600
gttggacttt atcaacggcg aggtatttct tctctcttct gtttttcttt tccatcgctt 660
tttctgaccg gaatccgccc tcttagctca acaccaacca cacgtacggg gcgtgctgca 720
acgagatgga catctgggag gccaacgcgc tggcgcaggc gctcacgccg cacccgtgca 780
acgcgacgcg ggtgtacaag tgcgacacgg cggacgagtg cgggcagccg gtgggcgtgt 840
gcgacgaatg ggggtgctcg tacaacccgt ccaacttcgg ggtcaaggac tactacgggc 900
gcaacctgac ggtggacacg aaccgcaagt tcacggtgac gacgcagttc gtgacgtcca 960
acgggcgggc ggacggcgag ctgaccgaga tccggcggct gtacgtgcag gacggcgtgg 1020
tgatccagaa ccacgcggtc acggcgggcg gggcgacgta cgacagcatc acggacggct 1080
tctgcaacgc gacggccacc tggacgcagc agcggggcgg gctcgcgcgc atgggcgagg 1140
ccatcggccg cggcatggtg ctcatcttca gcctgtgggt tgacaacggc ggcttcatga 1200
actggctcga cagcggcaac gccgggccct gcaacgccac cgagggcgac ccggccctga 1260
tcctgcagca gcacccggac gccagcgtca ccttctccaa catccgatgg ggcgagatcg 1320
gcagcacgta caagagcgag tgcagccact agagtagagc ttgtaatt 1368
<210>16
<211>423
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>16
Met Ala Pro Lys Ser Thr Val Leu Ala Ala Trp Leu Leu Ser Ser Leu
1 5 10 15
Ala Ala Ala Gln Gln Ile Gly Lys Ala Val Pro Glu Val His Pro Lys
20 25 30
Leu Thr Thr Gln Lys Cys Thr Leu Arg Gly Gly Cys Lys Pro Val Arg
35 40 45
Thr Ser Val Val Leu Asp Ser Ser Ala Arg Ser Leu His Lys Val Gly
50 55 60
Asp Pro Asn Thr Ser Cys Ser Val Gly Gly Asp Leu Cys Ser Asp Ala
65 70 75 80
Lys Ser Cys Gly Lys Asn Cys Ala Leu Glu Gly Val Asp Tyr Ala Ala
85 90 95
His Gly Val Ala Thr Lys Gly Asp Ala Leu Thr Leu His Gln Trp Leu
100 105 110
Lys Gly Ala Asp Gly Thr Tyr Arg Thr Val Ser Pro Arg Val Tyr Leu
115 120 125
Leu Gly Glu Asp Gly Lys Asn Tyr Glu Asp Phe Lys Leu Leu Asn Ala
130 135 140
Glu Leu Ser Phe Asp Val Asp Val Ser Gln Leu Val Cys Gly Met Asn
145 150 155 160
Gly Ala Leu Tyr Phe Ser Glu Met Glu Met Asp Gly Gly Arg Ser Pro
165 170 175
Leu Asn Pro Ala Gly Ala Thr Tyr Gly Thr Gly Tyr Cys Asp Ala Gln
180 185 190
Cys Pro Lys Leu As1 Phe Ile Asn Gly Glu Leu Asn Thr Asn His Thr
195 200 205
Tyr Gly Ala Cys Cys Asn Glu Met Asp Ile Trp Glu Ala Asn Ala Leu
210 215 220
Ala Gln Ala Leu Thr Pro His Pro Cys Asn Ala Thr Arg Val Tyr Lys
225 230 235 240
Cys Asp Thr Ala Asp Glu Cys Gly Gln Pro Val Gly Val Cys Asp Glu
245 250 255
Trp Gly Cys Ser Tyr Asn Pro Ser Asn Phe Gly Val Lys Asp Tyr Tyr
260 265 270
Gly Arg Asn Leu Thr Val Asp Thr Asn Arg Lys Phe Thr Val Thr Thr
275 280 285
Gln Phe Val Thr Ser Asn Gly Arg Ala Asp Gly Glu Leu Thr Glu Ile
290 295 300
Arg Arg Leu Tyr Val Gln Asp Gly Val Val Ile Gln Asn His Ala Val
305 310 315 320
Thr Ala Gly Gly Ala Thr Tyr Asp Ser Ile Thr Asp Gly Phe Cys Asn
325 330 335
Ala Thr Ala Thr Trp Thr Gln Gln Arg Gly Gly Leu Ala Arg Met Gly
340 345 350
Glu Ala Ile Gly Arg Gly Met Val Leu Ile Phe Ser Leu Trp Val Asp
355 360 365
Asn Gly Gly Phe Met Asn Trp Leu Asp Ser Gly Asn Ala Gly Pro Cys
370 375 380
Asn Ala Thr Glu Gly Asp Pro Ala Leu Ile Leu Gln Gln His Pro Asp
385 390 395 400
Ala Ser Val Thr Phe Ser Asn Ile Arg Trp Gly Glu Ile Gly Ser Thr
405 410 415
Tyr Lys Ser Glu Cys Ser His
420
<210>17
<211>1011
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>17
atgaccctac ggctccctgt catcagcctg ctggcctcgc tggcagcagg cgccgtcgtc 60
gtcccacggg cggagtttca cccccctctc ccgacttgga aatgcacgac ctccgggggc 120
tgcgtgcagc agaacaccag cgtcgtcctg gaccgtgact cgaagtacgc cgcacacagc 180
gccggctcgc ggacggaatc ggattacgcg gcaatgggag tgtccacttc gggcaatgcc 240
gtgacgctgt accactacgt caagaccaac ggcaccctcg tccccgcttc gccgcgcatc 300
tacctcctgg gcgcggacgg caagtacgtg cttatggacc tcctcaacca ggagctgtcg 360
gtggacgtcg acttctcggc gctgccgtgc ggcgagaacg gggccttcta cctgtccgag 420
atggcggcgg acgggcgggg cgacgcgggg gcgggcgacg ggtactgcga cgcgcagtgc 480
cagggctact gctgcaacga gatggacatc ctcgaggcca actcgatggc gacggccatg 540
acgccgcacc cgtgcaaggg caacaactgc gaccgcagcg gctgcggcta caacccgtac 600
gccagcggcc agcgcggctt ctacgggccc ggcaagacgg tcgacacgag caagcccttc 660
accgtcgtca cgcagttcgc cgccagcggc ggcaagctga cccagatcac ccgcaagtac 720
atccagaacg gccgggagat cggcggcggc ggcaccatct ccagctgcgg ctccgagtct 780
tcgacgggcg gcctgaccgg catgggcgag gcgctggggc gcggaatggt gctggccatg 840
agcatctgga acgacgcggc ccaggagatg gcatggctcg atgccggcaa caacggccct 900
tgcgccagtg gccagggcag cccgtccgtc attcagtcgc agcatcccga cacccacgtc 960
gtcttctcca acatcaggtg gggcgacatc gggtctacca cgaagaacta g 1011
<210>18
<211>336
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>18
Met Thr Leu Arg Leu Pro Val Ile Ser Leu Leu Ala Ser Leu Ala Ala
1 5 10 15
Gly Ala Val Val Val Pro Arg Ala Glu Phe His Pro Pro Leu Pro Thr
20 25 30
Trp Lys Cys Thr Thr Ser Gly Gly Cys Val Gln Gln Asn Thr Ser Val
35 40 45
Val Leu Asp Arg Asp Ser Lys Tyr Ala Ala His Ser Ala Gly Ser Arg
50 55 60
Thr Glu Ser Asp Tyr Ala Ala Met Gly Val Ser Thr Ser Gly Asn Ala
65 70 75 80
Val Thr Leu Tyr His Tyr Val Lys Thr Asn Gly Thr Leu Val Pro Ala
85 90 95
Ser Pro Arg Ile Tyr Leu Leu Gly Ala Asp Gly Lys Tyr Val Leu Met
100 105 110
Asp Leu Leu Asn Gln Glu Leu Ser Val Asp Val Asp Phe Ser Ala Leu
115 120 125
Pro Cys Gly Glu Asn Gly Ala Phe Tyr Leu Ser Glu Met Ala Ala Asp
130 135 140
Gly Arg Gly Asp Ala Gly Ala Gly Asp Gly Tyr Cys Asp Ala Gln Cys
145 150 155 160
Gln Gly Tyr Cys Cys Asn Glu Met Asp Ile Leu Glu Ala Asn Ser Met
165 170 175
Ala Thr Ala Met Thr Pro His Pro Cys Lys Gly Asn Asn Cys Asp Arg
180 185 190
Ser Gly Cys Gly Tyr Asn Pro Tyr Ala Ser Gly Gln Arg Gly Phe Tyr
195 200 205
Gly Pro Gly Lys Thr Val Asp Thr Ser Lys Pro Phe Thr Val Val Thr
210 215 220
Gln Phe Ala Ala Ser Gly Gly Lys Leu Thr Gln Ile Thr Arg Lys Tyr
225 230 235 240
Ile Gln Asn Gly Arg Glu Ile Gly Gly Gly Gly Thr Ile Ser Ser Cys
245 250 255
Gly Ser Glu Ser Ser Thr Gly Gly Leu Thr Gly Met Gly Glu Ala Leu
260 265 270
Gly Arg Gly Met Val Leu Ala Met Ser Ile Trp Asn Asp Ala Ala Gln
275 280 285
Glu Met Ala Trp Leu Asp Ala Gly Asn Asn Gly Pro Cys Ala Ser Gly
290 295 300
Gln Gly Ser Pro Ser Val Ile Gln Ser Gln His Pro Asp Thr His Val
305 310 315 320
Val Phe Ser Asn Ile Arg Trp Gly Asp Ile Gly Ser Thr Thr Lys Asn
325 330 335
<210>19
<211>1480
<212>DNA
<213>Cladorrhinum foecundissimum
<400>19
gatccgaatt cctcctctcg ttctttagtc acagaccaga catctgccca cgatggttca 60
caagttcgcc ctcctcaccg gcctcgccgc ctccctcgca tctgcccagc agatcggcac 120
cgtcgtcccc gagtctcacc ccaagcttcc caccaagcgc tgcactctcg ccggtggctg 180
ccagaccgtc gacacctcca tcgtcatcga cgccttccag cgtcccctcc acaagatcgg 240
cgacccttcc actccttgcg tcgtcggcgg ccctctctgc cccgacgcca agtcctgcgc 300
tgagaactgc gcgctcgagg gtgtcgacta tgcctcctgg ggcatcaaga ccgagggcga 360
cgccctaact ctcaaccagt ggatgcccga cccggcgaac cctggccagt acaagacgac 420
tactccccgt acttaccttg ttgctgagga cggcaagaac tacgaggatg tgaagctcct 480
ggctaaggag atctcgtttg atgccgatgt cagcaacctt ccctgcggca tgaacggtgc 540
tttctacttg tctgagatgt tgatggatgg tggacgtggc gacctcaacc ctgctggtgc 600
cgagtatggt accggttact gtgatgcgca gtgcttcaag ttggatttca tcaacggcga 660
ggccaacatc gaccaaaagc acggcgcctg ctgcaacgaa atggacattt tcgaatccaa 720
ctcgcgcgcc aagaccttcg tcccccaccc ctgcaacatc acgcaggtct acaagtgcga 780
aggcgaagac gagtgcggcc agcccgtcgg cgtgtgcgac aagtgggggt gcggcttcaa 840
cgagtacaaa tggggcgtcg agtccttcta cggccggggc tcgcagttcg ccatcgactc 900
ctccaagaag ttcaccgtca ccacgcagtt cctgaccgac aacggcaagg aggacggcgt 960
cctcgtcgag atccgccgct tgtggcacca ggatggcaag ctgatcaaga acaccgctat 1020
ccaggttgag gagaactaca gcacggactc ggtgagcacc gagttctgcg agaagactgc 1080
ttctttcacc atgcagcgcg gtggtctcaa ggcgatgggc gaggctatcg gtcgtggtat 1140
ggtgctggtt ttcagcatct gggcggatga ttcgggtttt atgaactggt tggatgcgga 1200
gggtaatggc ccttgcagcg cgactgaggg cgatccgaag gagattgtca agaataagcc 1260
ggatgctagg gttacgttct caaacattag gattggtgag gttggtagca cgtatgctcc 1320
gggtgggaag tgcggtgtta agagcagggt tgctaggggg cttactgctt cttaaggggg 1380
gtgtgaagag aggaggaggt gttgttgggg gttggagatg ataattgggc gagatggtgt 1440
agagcgggtt ggttggatat gaatacgttg aattggatgt 1480
<210>20
<211>440
<212>PRT
<213>Cladorrhinum foecundissimum
<400>20
Met Val His Lys Phe Ala Leu Leu Thr Gly Leu Ala Ala Ser Leu Ala
1 5 10 15
Ser Ala Gln Gln Ile Gly Thr Val Val Pro Glu Ser His Pro Lys Leu
20 25 30
Pro Thr Lys Arg Cys Thr Leu Ala Gly Gly Cys Gln Thr Val Asp Thr
35 40 45
Ser Ile Val Ile Asp Ala Phe Gln Arg Pro Leu His Lys Ile Gly Asp
50 55 60
Pro Ser Thr Pro Cys Val Val Gly Gly Pro Leu Cys Pro Asp Ala Lys
65 70 75 80
Ser Cys Ala Glu Asn Cys Ala Leu Glu Gly Val Asp Tyr Ala Ser Trp
85 90 95
Gly Ile Lys Thr Glu Gly Asp Ala Leu Thr Leu Asn Gln Trp Met Pro
100 105 110
Asp Pro Ala Asn Pro Gly Gln Tyr Lys Thr Thr Thr Pro Arg Thr Tyr
115 120 125
Leu Val Ala Glu Asp Gly Lys Asn Tyr Glu Asp Val Lys Leu Leu Ala
130 135 140
Lys Glu Ile Ser Phe Asp Ala Asp Val Ser Asn Leu Pro Cys Gly Met
145 150 155 160
Asn Gly Ala Phe Tyr Leu Ser Glu Met Leu Met Asp Gly Gly Arg Gly
165 170 175
Asp Leu Asn Pro Ala Gly Ala Glu Tyr Gly Thr Gly Tyr Cys Asp Ala
180 185 190
Gln Cys Phe Lys Leu Asp Phe Ile Asn Gly Glu Ala Asn Ile Asp Gln
195 200 205
Lys His Gly Ala Cys Cys Asn Glu Met Asp Ile Phe Glu Ser Asn Ser
210 215 220
Arg Ala Lys Thr Phe Val Pro His Pro Cys Asn Ile Thr Gln Val Tyr
225 230 235 240
Lys Cys Glu Gly Glu Asp Glu Cys Gly Gln Pro Val GLy Val Cys Asp
245 250 255
Lys Trp Gly Cys Gly Phe Asn Glu Tyr Lys Trp Gly Val Glu Ser Phe
260 265 270
Tyr Gly Arg Gly Ser Gln Phe Ala Ile Asp Ser Ser Lys Lys Phe Thr
275 280 285
Val Thr Thr Gln Phe Leu Thr Asp Asn Gly Lys Glu Asp Gly Val Leu
290 295 300
Val Glu Ile Arg Arg Leu Trp His Gln Asp Gly Lys Leu Ile Lys Asn
305 310 315 320
Thr Ala Ile Gln Val Glu Glu Asn Tyr Ser Thr Asp Ser Val Ser Thr
325 330 335
Glu Phe Cys Glu Lys Thr Ala Ser Phe Thr Met Gln Arg Gly Gly Leu
340 345 350
Lys Ala Met Gly Gl u Ala Ile Gly Arg Gly Met ValLeu Val Phe Ser
355 360 365
Ile Trp Ala Asp Asp Ser Gly Phe Met Asn Trp Leu Asp Ala Glu Gly
370 375 380
Asn Gly Pro Cys Ser Ala Thr Glu Gly Asp Pro Lys Glu Ile Val Lys
385 390 395 400
Asn Lys Pro Asp Ala Arg Val Thr Phe Ser Asn Ile Arg Ile Gly Glu
405 410 415
Val Gly Ser Thr Tyr Ala Pro Gly Gly Lys Cys Gly Val Lys Ser Arg
420 425 430
Val Ala Arg Gly Leu Thr Ala Ser
435 440
<210>21
<211>1380
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>21
atggcgccct cagttacact gccgttgacc acggccatcc tggccattgc ccggctcgtc 60
gccgcccagc aaccgggtac cagcaccccc gaggtccatc ccaagttgac aacctacaag 120
tgtacaaagt ccggggggtg cgtggcccag gacacctcgg tggtccttga ctggaactac 180
cgctggatgc acgacgcaaa ctacaactcg tgcaccgtca acggcggcgt caacaccacg 240
ctctgccctg acgaggcgac ctgtggcaag aactgcttca tcgagggcgt cgactacgcc 300
gcctcgggcg tcacgacctc gggcagcagc ctcaccatga accagtacat gcccagcagc 360
tctggcggct acagcagcgt ctctcctcgg ctgtatctcc tggactctga cggtgagtac 420
gtgatgctga agctcaacgg ccaggagctg agcttcgacg tcgacctctc tgctctgccg 480
tgtggagaga acggctcgct ctacctgtct cagatggacg agaacggggg cgccaaccag 540
tataacacgg ccggtgccaa ctacgggagc ggctactgcg atgctcagtg ccccgtccag 600
acatggagga acggcaccct caacactagc caccagggct tctgctgcaa cgagatggat 660
atcctggagg gcaactcgag ggcgaatgcc ttgacccctc actcttgcac ggccacggcc 720
tgcgactctg ccggttgcgg cttcaacccc tatggcagcg gctacaaaag ctactacggc 780
cccggagata ccgttgacac ctccaagacc ttcaccatca tcacccagtt caacacggac 840
aacggctcgc cctcgggcaa ccttgtgagc atcacccgca agtaccagca aaacggcgtc 900
gacatcccca gcgcccagcc cggcggcgac accatctcgt cctgcccgtc cgcctcagcc 960
tacggcggcc tcgccaccat gggcaaggcc ctgagcagcg gcatggtgct cgtgttcagc 1020
atttggaacg acaacagcca gtacatgaac tggctcgaca gcggcaacgc cggcccctgc 1080
agcagcaccg agggcaaccc atccaacatc ctggccaaca accccaacac gcacgtcgtc 1140
ttctccaaca tccgctgggg agacattggg tctactacga actcgactgc gcccccgccc 1200
ccgcctgcgt ccagcacgac gttttcgact acacggagga gctcgacgac ttcgagcagc 1260
ccgagctgca cgcagactca ctgggggcag tgcggtggca ttgggtacag cgggtgcaag 1320
acgtgcacgt cgggcactac gtgccagtat agcaacgact actactcgca atgcctttag 1380
<210>22
<211>459
<212>PRT
<213>里氏木霉(Trichoderma reesei)
<400>22
Met Ala Pro Ser Val Thr Leu Pro Leu Thr Thr Ala Ile Leu Ala Ile
1 5 10 15
Ala Arg Leu Val Ala Ala Gln Gln Pro Gly Thr Ser Thr Pro Glu Val
20 25 30
His Pro Lys Leu Thr Thr Tyr Lys Cys Thr Lys Ser Gly Gly Cys Val
35 40 45
Ala Gln Asp Thr Ser Val Val Leu Asp Trp Asn Tyr Arg Trp Met His
50 55 60
Asp Ala Asn Tyr Asn Ser Cys Thr Val Asn Gly Gly Val Asn Thr Thr
65 70 75 80
Leu Cys Pro Asp Glu Ala Thr Cys Gly Lys Asn Cys Phe Ile Glu Gly
85 90 95
Val Asp Tyr Ala Ala Ser Gly Val Thr Thr Ser Gly Ser Ser Leu Thr
100 105 110
Met Asn Gln Tyr Met Pro Ser Ser Ser Gly Gly Tyr Ser Ser Val Ser
115 120 125
Pro Arg Leu Tyr Leu Leu Asp Ser Asp Gly Glu Tyr Val Met Leu Lys
130 135 140
Leu Asn Gly Gln Glu Leu Ser Phe Asp Val Asp Leu Ser Ala Leu Pro
145 150 155 160
Cys Gly Glu Asn Gly Ser Leu Tyr Leu Ser Gln Met Asp Glu Asn Gly
165 170 175
Gly Ala Asn Gln Tyr Asn Thr Ala Gly Ala Asn Tyr Gly Ser Gly Tyr
180 185 190
Cys Asp Ala Gln Cys Pro Val Gln Thr Trp Arg Asn Gly Thr Leu Asn
195 200 205
Thr Ser His Gln Gly Phe Cys Cys Asn Glu Met Asp Ile Leu Glu Gly
210 215 220
Asn Ser Arg Ala Asn Ala Leu Thr Pro His Ser Cys Thr Ala Thr Ala
225 230 235 240
Cys Asp Ser Ala Gly Cys Gly Phe Asn Pro Tyr Gly Ser Gly Tyr Lys
245 250 255
Ser Tyr Tyr Gly Pro Gly Asp Thr Val Asp Thr Ser Lys Thr Phe Thr
260 265 270
Ile Ile Thr Gln Phe Asn Thr Asp Asn Gly Ser Pro Ser Gly Asn Leu
275 280 285
Val Ser Ile Thr Arg Lys Tyr Gln Gln Asn Gly Val Asp Ile Pro Ser
290 295 300
Ala Gln Pro Gly Gly Asp Thr Ile Ser Ser Cys Pro Ser Ala Ser Ala
305 310 315 320
Tyr Gly Gly Leu Ala Thr Met Gly Lys Ala Leu Ser Ser Gly Met Val
325 330 335
Leu Val Phe Ser Ile Trp Asn Asp Asn Ser Gln Tyr Met Asn Trp Leu
340 345 350
Asp Ser Gly Asn Ala Gly Pro Cys Ser Ser Thr Glu Gly Asn Pro Ser
355 360 365
Asn Ile Leu Ala Asn Asn Pro Asn Thr His Val Val Phe Ser Asn Ile
370 375 380
Arg Trp Gly Asp Ile Gly Ser Thr Thr Asn Ser Thr Ala Pro Pro Pro
385 390 395 400
Pro Pro Ala Ser Ser Thr Thr Phe Ser Thr Thr Arg Arg Ser Ser Thr
405 410 415
Thr Ser Ser Ser Pro Ser Cys Thr Gln Thr His Trp Gly Gln Cys Gly
420 425 430
Gly Ile Gly Tyr Ser Gly Cys Lys Thr Cys Thr Ser Gly Thr Thr Cys
435 440 445
Gln Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu
450 455
<210>23
<211>2586
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>23
atgaagcttg gttggatcga ggtggccgca ttggcggctg cctcagtagt cagtgccaag 60
gatgatctcg cgtactcccc tcctttctac ccttccccat gggcagatgg tcagggtgaa 120
tgggcggaag tatacaaacg cgctgtagac atagtttccc agatgacgtt gacagagaaa 180
gtcaacttaa cgactggaac aggatggcaa ctagagaggt gtgttggaca aactggcagt 240
gttcccagac tcaacatccc cagcttgtgt ttgcaggata gtcctcttgg tattcgtttc 300
tcggactaca attcagcttt ccctgcgggt gttaatgtcg ctgccacctg ggacaagacg 360
ctcgcctacc ttcgtggtca ggcaatgggt gaggagttca gtgataaggg tattgacgtt 420
cagctgggtc ctgctgctgg ccctctcggt gctcatccgg atggcggtag aaactgggaa 480
ggtttctcac cagatccagc cctcaccggt gtactttttg cggagacgat taagggtatt 540
caagatgctg gtgtcattgc gacagctaag cattatatca tgaacgaaca agagcatttc 600
cgccaacaac ccgaggctgc gggttacgga ttcaacgtaa gcgacagttt gagttccaac 660
gttgatgaca agactatgca tgaattgtac ctctggccct tcgcggatgc agtacgcgct 720
ggagtcggtg ctgtcatgtg ctcttacaac caaatcaaca acagctacgg ttgcgagaat 780
agcgaaactc tgaacaagct tttgaaggcg gagcttggtt tccaaggctt cgtcatgagt 840
gattggaccg ctcatcacag cggcgtaggc gctgctttag caggtctgga tatgtcgatg 900
cccggtgatg ttaccttcga tagtggtacg tctttctggg gtgcaaactt gacggtcggt 960
gtccttaacg gtacaatccc ccaatggcgt gttgatgaca tggctgtccg tatcatggcc 1020
gcttattaca aggttggccg cgacaccaaa tacacccctc ccaacttcag ctcgtggacc 1080
agggacgaat atggtttcgc gcataaccat gtttcggaag gtgcttacga gagggtcaac 1140
gaattcgtgg acgtgcaacg cgatcatgcc gacctaatcc gtcgcatcgg cgcgcagagc 1200
actgttctgc tgaagaacaa gggtgccttg cccttgagcc gcaaggaaaa gctggtcgcc 1260
cttctgggag aggatgcggg ttccaactcg tggggcgcta acggctgtga tgaccgtggt 1320
tgcgataacg gtacccttgc catggcctgg ggtagcggta ctgcgaattt cccatacctc 1380
gtgacaccag agcaggcgat tcagaacgaa gttcttcagg gccgtggtaa tgtcttcgcc 1440
gtgaccgaca gttgggcgct cgacaagatc gctgcggctg cccgccaggc cagcgtatct 1500
ctcgtgttcg tcaactccga ctcaggagaa ggctatctta gtgtggatgg aaatgagggc 1560
gatcgtaaca acatcactct gtggaagaac ggcgacaatg tggtcaagac cgcagcgaat 1620
aactgtaaca acaccgttgt catcatccac tccgtcggac cagttttgat cgatgaatgg 1680
tatgaccacc ccaatgtcac tggtattctc tgggctggtc tgccaggcca ggagtctggt 1740
aactccattg ccgatgtgct gtacggtcgt gtcaaccctg gcgccaagtc tcctttcact 1800
tggggcaaga cccgggagtc gtatggttct cccttggtca aggatgccaa caatggcaac 1860
ggagcgcccc agtctgattt cacccagggt gttttcatcg attaccgcca tttcgataag 1920
ttcaatgaga cccctatcta cgagtttggc tacggcttga gctacaccac cttcgagctc 1980
tccgacctcc atgttcagcc cctgaacgcg tcccgataca ctcccaccag tggcatgact 2040
gaagctgcaa agaactttgg tgaaattggc gatgcgtcgg agtacgtgta tccggagggg 2100
ctggaaagga tccatgagtt tatctatccc tggatcaact ctaccgacct gaaggcatcg 2160
tctgacgatt ctaactacgg ctgggaagac tccaagtata ttcccgaagg cgccacggat 2220
gggtctgccc agccccgttt gcccgctagt ggtggtgccg gaggaaaccc cggtctgtac 2280
gaggatcttt tccgcgtctc tgtgaaggtc aagaacacgg gcaatgtcgc cggtgatgaa 2340
gttcctcagc tgtacgtttc cctaggcggc ccgaatgagc ccaaggtggt actgcgcaag 2400
tttgagcgta ttcacttggc cccttcgcag gaggccgtgt ggacaacgac ccttacccgt 2460
cgtgaccttg caaactggga cgtttcggct caggactgga ccgtcactcc ttaccccaag 2520
acgatctacg ttggaaactc ctcacggaaa ctgccgctcc aggcctcgct gcctaaggcc 2580
cagtaa 2586
<210>24
<211>861
<212>PRT
<213>米曲霉(Aspergillus oryzae)
<400>24
Met Lys Leu Gly Trp Ile Glu Val Ala Ala Leu Ala Ala Ala Ser Val
1 5 10 15
Val Ser Ala Lys Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser
20 25 30
Pro Trp Ala Asp Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala
35 40 45
Val Asp Ile Val Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr
50 55 60
Thr Gly Thr Gly Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser
65 70 75 80
Val Pro Arg Leu Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu
85 90 95
Gly Ile Arg Phe Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn
100 105 110
Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala
115 120 125
Met Gly Glu Glu Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro
130 135 140
Ala Ala Gly Pro Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu
145 150 155 160
Gly Phe Ser Pro Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr
165 170 175
Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr
180 185 190
Ile Met Asn Glu Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly
195 200 205
Tyr Gly Phe Asn Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys
210 215 220
Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala
225 230 235 240
Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr
245 250 255
Gly Cys Glu Asn Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu
260 265 270
Gly Phe Gln Gly Phe Val Met Ser Asp Trp Thr Ala His His Ser Gly
275 280 285
Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val
290 295 300
Thr Phe Asp Ser Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly
305 310 315 320
Val Leu Asn Gly Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val
325 330 335
Arg Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr
340 345 350
Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His
355 360 365
Asn His Val Ser Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp
370 375 380
Val Gln Arg Asp His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser
385 390 395 400
Thr Val Leu Leu Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu
405 410 415
Lys Leu Val Ala Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly
420 425 430
Ala Asn Gly Cys Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met
435 440 445
Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu
450 455 460
Gln Ala Ile Gln Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala
465 470 475 480
Val Thr Asp Ser Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln
485 490 495
Ala Ser Val Ser Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr
500 505 510
Leu Ser Val Asp Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp
515 520 525
Lys Asn Gly Asp Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn
530 535 540
Thr Val Val Ile Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp
545 550 555 560
Tyr Asp His Pro Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly
565 570 575
Gln Glu Ser Gly Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn
580 585 590
Pro Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr
595 600 605
Gly Ser Pro Leu Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln
610 615 620
Ser Asp Phe Thr Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys
625 630 635 640
Phe Asn Glu Thr Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr
645 650 655
Thr Phe Glu Leu Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg
660 665 670
Tyr Thr Pro Thr Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu
675 680 685
Ile Gly Asp Ala Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile
690 695 700
His Glu Phe Ile Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser
705 710 715 720
Ser Asp Asp Ser Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu
725 730 735
Gly Ala Thr Asp Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly
740 745 750
Ala Gly Gly Asn Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val
755 760 765
Lys Val Lys Asn Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu
770 775 780
Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys
785 790 795 800
Phe Glu Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr
805 810 815
Thr Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp
820 825 830
Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser Ser
835 840 845
Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln
850 855 860
<210>25
<211>2586
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>25
atgaagcttg gttggatcga ggtggccgca ttggcggctg cctcagtagt cagtgccaag 60
gatgatctcg cgtactcccc tcctttctac ccttccccat gggcagatgg tcagggtgaa 120
tgggcggaag tatacaaacg cgctgtagac atagtttccc agatgacgtt gacagagaaa 180
gtcaacttaa cgactggaac aggatggcaa ctagagaggt gtgttggaca aactggcagt 240
gttcccagac tcaacatccc cagcttgtgt ttgcaggata gtcctcttgg tattcgtttc 300
tcggactaca attcagcttt ccctgcgggt gttaatgtcg ctgccacctg ggacaagacg 360
ctcgcctacc ttcgtggtca ggcaatgggt gaggagttca gtgataaggg tattgacgtt 420
cagctgggtc ctgctgctgg ccctctcggt gctcatccgg atggcggtag aaactgggaa 480
agtttctcac cagatccagc cctcaccggt gtactttttg cggagacgat taagggtatt 540
caagatgctg gtgtcattgc gacagctaag cattatatca tgaacgaaca agagcatttc 600
cgccaacaac ccgaggctgc gggttacgga ttcaacgtaa gcgacagttt gagttccaac 660
gttgatgaca agactatgca tgaattgtac ctctggccct tcgcggatgc agtacgcgct 720
ggagtcggtg ctgttatgtg ctcttacaac caaatcaaca acagctacgg ttgcgagaat 780
agcgaaactc tgaacaagct tttgaaggcg gagcttggtt tccaaggctt cgtcatgagt 840
gattggaccg ctcaacacag cggcgtaggc gctgctttag caggtctgga tatgtcgatg 900
cccggtgatg ttaccttcga tagtggtacg tctttctggg gtgcaaactt gacggtcggt 960
gtccttaacg gtacaatccc ccaatggcgt gttgatgaca tggctgtccg tatcatggcc 1020
gcttattaca aggttggccg cgacaccaaa tacacccctc ccaacttcag ctcgtggacc 1080
agggacgaat atggtttcgc gcataaccat gtttcggaag gtgcttacga gagggtcaac 1140
gaattcgtgg acgtgcaacg cgatcatgcc gacctaatcc gtcgcatcgg cgcgcagagc 1200
actgttctgc tgaagaacaa gggtgccttg cccttgagcc gcaaggaaaa gctggtcgcc 1260
cttctgggag aggatgcggg ttccaactcg tggggcgcta acggctgtga tgaccgtggt 1320
tgcgataacg gtacccttgc catggcctgg ggtagcggta ctgcgaattt cccatacctc 1380
gtgacaccag agcaggcgat tcagaacgaa gttcttcagg gccgtggtaa tgtcttcgcc 1440
gtgaccgaca gttgggcgct cgacaagatc gctgcggctg cccgccaggc cagcgtatct 1500
ctcgtgttcg tcaactccga ctcaggagaa ggctatctta gtgtggatgg aaatgagggc 1560
gatcgtaaca acatcactct gtggaagaac ggcgacaatg tggtcaagac cgcagcgaat 1620
aactgtaaca acaccgttgt catcatccac tccgtcggac cagttttgat cgatgaatgg 1680
tatgaccacc ccaatgtcac tggtattctc tgggctggtc tgccaggcca ggagtctggt 1740
aactccattg ccgatgtgct gtacggtcgt gtcaaccctg gcgccaagtc tcctttcact 1800
tggggcaaga cccgggagtc gtatggttct cccttggtca aggatgccaa caatggcaac 1860
ggagcgcccc agtctgattt cacccagggt gttttcatcg attaccgcca tttcgataag 1920
ttcaatgaga cccctatcta cgagtttggc tacggcttga gctacaccac cttcgagctc 1980
tccgacctcc atgttcagcc cctgaacgcg tcccgataca ctcccaccag tggcatgact 2040
gaagctgcaa agaactttgg tgaaattggc gatgcgtcgg agtacgtgta tccggagggg 2100
ctggaaagga tccatgagtt tatctatccc tggatcaact ctaccgacct gaaggcatcg 2160
tctgacgatt ctaactacgg ctgggaagac tccaagtata ttcccgaagg cgccacggat 2220
gggtctgccc agccccgttt gcccgctagt ggtggtgccg gaggaaaccc cggtctgtac 2280
gaggatcttt tccgcgtctc tgtgaaggtc aagaacacgg gcaatgtcgc cggtgatgaa 2340
gttcctcagc tgtacgtttc cctaggcggc ccgaatgagc ccaaggtggt actgcgcaag 2400
tttgagcgta ttcacttggc cccttcgcag gaggccgtgt ggacaacgac ccttacccgt 2460
cgtgaccttg caaactggga cgtttcggct caggactgga ccgtcactcc ttaccccaag 2520
acgatctacg ttggaaactc ctcacggaaa ctgccgctcc aggcctcgct gcctaaggcc 2580
cagtaa 2586
<210>26
<211>861
<212>PRT
<213>米曲霉(Aspergillus oryzae)
<400>26
Met Lys Leu Gly Trp Ile Glu Val Ala Ala Leu Ala Ala Ala Ser Val
1 5 10 15
Val Ser Ala Lys Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser
20 25 30
Pro Trp Ala Asp Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala
35 40 45
Val Asp Ile Val Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr
50 55 60
Thr Gly Thr Gly Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser
65 70 75 80
Val Pro Arg Leu Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu
85 90 95
Gly Ile Arg Phe Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn
100 105 110
Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala
115 120 125
Met Gly Glu Glu Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro
130 135 140
Ala Ala Gly Pro Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu
145 150 155 160
Ser Phe Ser Pro Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr
165 170 175
Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr
180 185 190
Ile Met Asn Glu Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly
195 200 205
Tyr Gly Phe Asn Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys
210 215 220
Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala
225 230 235 240
Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr
245 250 255
Gly Cys Glu Asn Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu
260 265 270
Gly Phe Gln Gly Phe Val Met Ser Asp Trp Thr Ala Gln His Ser Gly
275 280 285
Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val
290 295 300
Thr Phe Asp Ser Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly
305 310 315 320
Val Leu Asn Gly Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val
325 330 335
Arg Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr
340 345 350
Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His
355 360 365
Asn His Val Ser Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp
370 375 380
Val Gln Arg Asp His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser
385 390 395 400
Thr Val Leu Leu Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu
405 410 415
Lys Leu Val Ala Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly
420 425 430
Ala Asn Gly Cys Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met
435 440 445
Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu
450 455 460
Gln Ala Ile Gln Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala
465 470 475 480
Val Thr Asp Ser Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln
485 490 495
Ala Ser Val Ser Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr
500 505 510
Leu Ser Val Asp Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp
515 520 525
Lys Asn Gly Asp Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn
530 535 540
Thr Val Val Ile Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp
545 550 555 560
Tyr Asp His Pro Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly
565 570 575
Gln Glu Ser Gly Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn
580 585 590
Pro Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr
595 600 605
Gly Ser Pro Leu Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln
610 615 620
Ser Asp Phe Thr Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys
525 630 635 640
Phe Asn Glu Thr Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr
645 650 655
Thr Phe Glu Leu Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg
660 665 670
Tyr Thr Pro Thr Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu
675 680 685
Ile Gly Asp Ala Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile
690 695 700
His Glu Phe Ile Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser
705 710 715 720
Ser Asp Asp Ser Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu
725 730 735
Gly Ala Thr Asp Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly
740 745 750
Ala Gly Gly Asn Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val
755 760 765
Lys Val Lys Asn Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu
770 775 780
Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys
785 790 795 800
Phe Glu Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr
805 810 815
Thr Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp
820 825 830
Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Set Ser
835 840 845
Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln
850 855 860
<210>27
<211>3060
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
<400>27
atgagattcg gttggctcga ggtggccgct ctgacggccg cttctgtagc caatgcccag 60
gtttgtgatg ctttcccgtc attgtttcgg atatagttga caatagtcat ggaaataatc 120
aggaattggc tttctctcca ccattctacc cttcgccttg ggctgatggc cagggagagt 180
gggcagatgc ccatcgacgc gccgtcgaga tcgtttctca gatgacactg gcggagaagg 240
ttaaccttac aacgggtact gggtgggttg cgactttttt gttgacagtg agctttcttc 300
actgaccatc tacacagatg ggaaatggac cgatgcgtcg gtcaaaccgg cagcgttccc 360
aggtaagctt gcaattctgc aacaacgtgc aagtgtagtt gctaaaacgc ggtggtgcag 420
acttggtatc aactggggtc tttgtggcca ggattcccct ttgggtatcc gtttctgtga 480
gctatacccg cggagtcttt cagtccttgt attatgtgct gatgattgtc tctgtatagc 540
tgacctcaac tccgccttcc ctgctggtac taatgtcgcc gcgacatggg acaagacact 600
cgcctacctt cgtggcaagg ccatgggtga ggaattcaac gacaagggcg tggacatttt 660
gctggggcct gctgctggtc ctctcggcaa atacccggac ggcggcagaa tctgggaagg 720
cttctctcct gatccggttc tcactggtgt acttttcgcc gaaactatca agggtatcca 780
agacgcgggt gtgattgcta ctgccaagca ttacattctg aatgaacagg agcatttccg 840
acaggttggc gaggcccagg gatatggtta caacatcacg gagacgatca gctccaacgt 900
ggatgacaag accatgcacg agttgtacct ttggtgagta gttgacactg caaatgagga 960
ccttgattga tttgactgac ctggaatgca ggccctttgc agatgctgtg cgcggtaaga 1020
ttttccgtag acttgacctc gcgacgaaga aatcgctgac gaaccatcgt agctggcgtt 1080
ggcgctgtca tgtgttccta caatcaaatc aacaacagct acggttgtca aaacagtcaa 1140
actctcaaca agctcctcaa ggctgagctg ggcttccaag gcttcgtcat gagtgactgg 1200
agcgctcacc acagcggtgt cggcgctgcc ctcgctgggt tggatatgtc gatgcctgga 1260
gacatttcct tcgacgacgg actctccttc tggggcacga acctaactgt cagtgttctt 1320
aacggcaccg ttccagcctg gcgtgtcgat gacatggctg ttcgtatcat gaccgcgtac 1380
tacaaggttg gtcgtgaccg tcttcgtatt ccccctaact tcagctcctg gacccgggat 1440
gagtacggct gggagcattc tgctgtctcc gagggagcct ggaccaaggt gaacgacttc 1500
gtcaatgtgc agcgcagtca ctctcagatc atccgtgaga ttggtgccgc tagtacagtg 1560
ctcttgaaga acacgggtgc tcttcctttg accggcaagg aggttaaagt gggtgttctc 1620
ggtgaagacg ctggttccaa cccgtggggt gctaacggct gccccgaccg cggctgtgat 1680
aacggcactc ttgctatggc ctggggtagt ggtactgcca acttccctta ccttgtcacc 1740
cccgagcagg ctatccagcg agaggtcatc agcaacggcg gcaatgtctt tgctgtgact 1800
gataacgggg ctctcagcca gatggcagat gttgcatctc aatccaggtg agtgcgggct 1860
cttagaaaaa gaacgttctc tgaatgaagt tttttaacca ttgcgaacag cgtgtctttg 1920
gtgtttgtca acgccgactc tggagagggt ttcatcagtg tcgacggcaa cgagggtgac 1980
cgcaaaaatc tcactctgtg gaagaacggc gaggccgtca ttgacactgt tgtcagccac 2040
tgcaacaaca cgattgtggt tattcacagt gttgggcccg tcttgatcga ccggtggtat 2100
gataacccca acgtcactgc catcatctgg gccggcttgc ccggtcagga gagtggcaac 2160
tccctggtcg acgtgctcta tggccgcgtc aaccccagcg ccaagacccc gttcacctgg 2220
ggcaagactc gggagtctta cggggctccc ttgctcaccg agcctaacaa tggcaatggt 2280
gctccccagg atgatttcaa cgagggcgtc ttcattgact accgtcactt tgacaagcgc 2340
aatgagaccc ccatttatga gtttggccat ggcttgagct acaccacctt tggttactct 2400
caccttcggg ttcaggccct caatagttcg agttcggcat atgtcccgac tagcggagag 2460
accaagcctg cgccaaccta tggtgagatc ggtagtgccg ccgactacct gtatcccgag 2520
ggtctcaaaa gaattaccaa gtttatttac ccttggctca actcgaccga cctcgaggat 2580
tcttctgacg acccgaacta cggctgggag gactcggagt acattcccga aggcgctagg 2640
gatgggtctc ctcaacccct cctgaaggct ggcggcgctc ctggtggtaa ccctaccctt 2700
tatcaggatc ttgttagggt gtcggccacc ataaccaaca ctggtaacgt cgccggttat 2760
gaagtccctc aattggtgag tgacccgcat gttccttgcg ttgcaatttg gctaactcgc 2820
ttctagtatg tttcactggg cggaccgaac gagcctcggg tcgttctgcg caagttcgac 2880
cgaatcttcc tggctcctgg ggagcaaaag gtttggacca cgactcttaa ccgtcgtgat 2940
ctcgccaatt gggatgtgga ggctcaggac tgggtcatca caaagtaccc caagaaagtg 3000
cacgtcggca gctcctcgcg taagctgcct ctgagagcgc ctctgccccg tgtctactag 3060
<210>28
<211>863
<212>PRT
<213>烟曲霉(Aspergillus fumigatus)
<400>28
Met Arg Phe Gly Trp Leu Glu Val Ala Ala Leu Thr Ala Ala Ser Val
1 5 10 15
Ala Asn Ala Gln Glu Leu Ala Phe Ser Pro Pro Phe Tyr Pro Ser Pro
20 25 30
Trp Ala Asp Gly Gln Gly Glu Trp Ala Asp Ala His Arg Arg Ala Val
35 40 45
Glu Ile Val Ser Gln Met Thr Leu Ala Glu Lys Val Asn Leu Thr Thr
50 55 60
Gly Thr Gly Trp Glu Met Asp Arg Cys Val Gly Gln Thr Gly Ser Val
65 70 75 80
Pro Arg Leu Gly Ile Asn Trp Gly Leu Cys Gly Gln Asp Ser Pro Leu
85 90 95
Gly Ile Arg Phe Ser Asp Leu Asn Ser Ala Phe Pro Ala Gly Thr Asn
100 105 110
Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Lys Ala
115 120 125
Met Gly Glu Glu Phe Asn Asp Lys Gly Val Asp Ile Leu Leu Gly Pro
130 135 140
Ala Ala Gly Pro Leu Gly Lys Tyr Pro Asp Gly Gly Arg Ile Trp Glu
145 150 155 160
Gly Phe Ser Pro Asp Pro Val Leu Thr Gly Val Leu Phe Ala Glu Thr
165 170 175
Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr
180 185 190
Ile Leu Asn Glu Gln Glu His Phe Arg Gln Val Gly Glu Ala Gln Gly
195 200 205
Tyr Gly Tyr Asn Ile Thr Glu Thr Ile Ser Ser Asn Val Asp Asp Lys
210 215 220
Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala
225 230 235 240
Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr
245 250 255
Gly Cys Gln Asn Ser Gln Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu
260 265 270
Gly Phe Gln Gly Phe Val Met Ser Asp Trp Ser Ala His His Ser Gly
275 280 285
Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Ile
290 295 300
Ser Phe Asp Asp Gly Leu Ser Phe Trp Gly Thr Asn Leu Thr Val Ser
305 310 315 320
Val Leu Asn Gly Thr Val Pro Ala Trp Arg Val Asp Asp Met AIa Val
325 330 335
Arg Ile Met Thr Ala Tyr Tyr Lys Val Gly Arg Asp Arg Leu Arg Ile
340 345 350
Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Trp Glu His
355 360 365
Ser Ala Val Ser Glu Gly Ala Trp Thr Lys Val Asn Asp Phe Val Asn
370 375 380
Val Gln Arg Ser His Ser Gln Ile Ile Arg Glu Ile Gly Ala Ala Ser
385 390 395 400
Thr Val Leu Leu Lys Asn Thr Gly Ala Leu Pro Leu Thr Gly Lys Glu
405 410 415
Val Lys Val Gly Val Leu Gly Glu Asp Ala Gly Ser Asn Pro Trp Gly
420 425 430
Ala Asn Gly Cys Pro Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met
435 440 445
Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu
450 455 460
Gln Ala Ile Gln Arg Glu Val Ile Ser Asn Gly Gly Asn Val Phe Ala
465 470 475 480
Val Thr Asp Asn Gly Ala Leu Ser Gln Met Ala Asp Val Ala Ser Gln
485 490 495
Ser Ser Val Ser Leu Val Phe Val Asn Ala Asp Ser Gly Glu Gly Phe
500 505 510
Ile Ser Val Asp Gly Asn Glu Gly Asp Arg Lys Asn Leu Thr Leu Trp
515 520 525
Lys Asn Gly Glu Ala Val Ile Asp Thr Val Val Ser His Cys Asn Asn
530 535 540
Thr Ile Val Val Ile His Ser Val Gly Pro Val Leu Ile Asp Arg Trp
545 550 555 560
Tyr Asp Asn Pro Asn Val Thr Ala Ile Ile Trp Ala Gly Leu Pro Gly
565 570 575
Gln Glu Ser Gly Asn Ser Leu Val Asp Val Leu Tyr Gly Arg Val Asn
580 585 590
Pro Ser Ala Lys Thr Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr
595 600 605
Gly Ala Pro Leu Leu Thr Glu Pro Asn Asn Gly Asn Gly Ala Pro Gln
610 615 620
Asp Asp Phe Asn Glu Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys
625 630 635 640
Arg Asn Glu Thr Pro Ile Tyr Glu Phe Gly His Gly Leu Ser Tyr Thr
645 650 655
Thr Phe Gly Tyr Ser His Leu Arg Val Gln Ala Leu Asn Ser Ser Ser
660 665 670
Ser Ala Tyr Val Pro Thr Ser Gly Glu Thr Lys Pro Ala Pro Thr Tyr
675 680 685
Gly Glu Ile Gly Ser Ala Ala Asp Tyr Leu Tyr Pro Glu Gly Leu Lys
690 695 700
Arg Ile Thr Lys Phe Ile Tyr Pro Trp Leu Asn Ser Thr Asp Leu Glu
705 710 715 720
Asp Ser Ser Asp Asp Pro Asn Tyr Gly Trp Glu Asp Ser Glu Tyr Ile
725 730 735
Pro Glu Gly Ala Arg Asp Gly Ser Pro Gln Pro Leu Leu Lys Ala Gly
740 745 750
Gly Ala Pro Gly Gly Asn Pro Thr Leu Tyr Gln Asp Leu Val Arg Val
755 760 765
Ser Ala Thr Ile Thr Asn Thr Gly Asn Val Ala Gly Tyr Glu Val Pro
770 775 780
Gln Leu Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Arg Val Val Leu
785 790 795 800
Arg Lys Phe Asp Arg Ile Phe Leu Ala Pro Gly Glu Gln Lys Val Trp
805 810 815
Thr Thr Thr Leu Asn Arg Arg Asp Leu Ala Asn Trp Asp Val Glu Ala
820 825 830
Gln Asp Trp Val Ile Thr Lys Tyr Pro Lys Lys Val His Val Gly Ser
835 840 845
Ser Ser Arg Lys Leu Pro Leu Arg Ala Pro Leu Pro Arg Val Tyr
850 855 860
<210>29
<211>2800
<212>DNA
<213>巴西青霉(Penicillium brasilianum)
<400>29
tgaaaatgca gggttctaca atctttctgg ctttcgcctc atgggcgagc caggttgctg 60
ccattgcgca gcccatacag aagcacgagg tttgttttat cttgctcatg gacgtgcttt 120
gacttgacta attgttttac atacagcccg gatttctgca cgggccccaa gccatagaat 180
cgttctcaga accgttctac ccgtcgccct ggatgaatcc tcacgccgag ggctgggagg 240
ccgcatatca gaaagctcaa gattttgtct cgcaactcac tatcttggag aaaataaatc 300
tgaccaccgg tgttgggtaa gtctctccga ctgcttctgg gtcacggtgc gacgagccac 360
tgactttttg aagctgggaa aatgggccgt gtgtaggaaa cactggatca attcctcgtc 420
tcggattcaa aggattttgt acccaggatt caccacaggg tgttcggttc gcagattatt 480
cctccgcttt cacatctagc caaatggccg ccgcaacatt tgaccgctca attctttatc 540
aacgaggcca agccatggca caggaacaca aggctaaggg tatcacaatt caattgggcc 600
ctgttgccgg ccctctcggt cgcatccccg agggcggccg caactgggaa ggattctccc 660
ctgatcctgt cttgactggt atagccatgg ctgagacaat taagggcatg caggatactg 720
gagtgattgc ttgcgctaaa cattatattg gaaacgagca ggagcacttc cgtcaagtgg 780
gtgaagctgc gggtcacgga tacactattt ccgatactat ttcatctaat attgacgacc 840
gtgctatgca tgagctatac ttgtggccat ttgctgatgc cgttcgcgct ggtgtgggtt 900
ctttcatgtg ctcatactct cagatcaaca actcctacgg atgccaaaac agtcagaccc 960
tcaacaagct cctcaagagc gaattgggct tccaaggctt tgtcatgagc gattggggtg 1020
cccatcactc tggagtgtca tcggcgctag ctggacttga tatgagcatg ccgggtgata 1080
ccgaatttga ttctggcttg agcttctggg gctctaacct caccattgca attctgaacg 1140
gcacggttcc cgaatggcgc ctggatgaca tggcgatgcg aattatggct gcatacttca 1200
aagttggcct tactattgag gatcaaccag atgtcaactt caatgcctgg acccatgaca 1260
cctacggata taaatacgct tatagcaagg aagattacga gcaggtcaac tggcatgtcg 1320
atgttcgcag cgaccacaat aagctcattc gcgagactgc cgcgaagggt acagttctgc 1380
tgaagaacaa ctttcatgct ctccctctga agcagcccag gttcgtggcc gtcgttggtc 1440
aggatgccgg gccaaacccc aagggcccta acggctgcgc agaccgagga tgcgaccaag 1500
gcactctcgc aatgggatgg ggctcagggt ctaccgaatt cccttacctg gtcactcctg 1560
acactgctat tcagtcaaag gtcctcgaat acgggggtcg atacgagagt atttttgata 1620
actatgacga caatgctatc ttgtcgcttg tctcacagcc tgatgcaacc tgtatcgttt 1680
ttgcaaatgc cgattccggt gaaggctaca tcactgtcga caacaactgg ggtgaccgca 1740
acaatctgac cctctggcaa aatgccgatc aagtgattag cactgtcagc tcgcgatgca 1800
acaacacaat cgttgttctc cactctgtcg gaccagtgtt gctaaatggt atatatgagc 1860
acccgaacat cacagctatt gtctgggcag ggatgccagg cgaagaatct ggcaatgctc 1920
tcgtggatat tctttggggc aatgttaacc ctgccggtcg cactccgttc acctgggcca 1980
aaagtcgaga ggactatggc actgatataa tgtacgagcc caacaacggc cagcgtgcgc 2040
ctcagcagga tttcaccgag agcatctacc tcgactaccg ccatttcgac aaagctggta 2100
tcgagccaat ttacgagttt ggattcggcc tctcctatac caccttcgaa tactctgacc 2160
tccgtgttgt gaagaagtat gttcaaccat acagtcccac gaccggcacc ggtgctcaag 2220
caccttccat cggacagcca cctagccaga acctggatac ctacaagttc cctgctacat 2280
acaagtacat caaaaccttc atttatccct acctgaacag cactgtctcc ctccgcgctg 2340
cttccaagga tcccgaatac ggtcgtacag actttatccc accccacgcg cgtgatggct 2400
cccctcaacc tctcaacccc gctggagacc cagtggccag tggtggaaac aacatgctct 2460
acgacgaact ttacgaggtc actgcacaga tcaaaaacac tggcgacgtg gccggcgacg 2520
aagtcgtcca gctttacgta gatctcgggg gtgacaaccc gcctcgtcag ttgagaaact 2580
ttgacaggtt ttatctgctg cccggtcaga gctcaacatt ccgggctaca ttgacgcgcc 2640
gtgatttgag caactgggat attgaggcgc agaactggcg agttacggaa tcgcctaaga 2700
gagtgtatgt tggacggtcg agtcgggatt tgccgctgag ctcacaattg gagtaatgat 2760
catgtctacc aatagatgtt gaatgtctgg tgtggatatt 2800
<210>30
<211>878
<212>PRT
<213>巴西青霉(Penici ll ium brasilianum)
<400>30
Met Gln Gly Ser Thr Ile Phe Leu Ala Phe Ala Ser Trp Ala Ser Gln
1 5 10 15
Val Ala Ala Ile Ala Gln Pro Ile Gln Lys His Glu Pro Gly Phe Leu
20 25 30
His Gly Pro Gln Ala Ile Glu Ser Phe Ser Glu Pro Phe Tyr Pro Ser
35 40 45
Pro Trp Met Asn Pro His Ala Glu Gly Trp Glu Ala Ala Tyr Gln Lys
50 55 60
Ala Gln Asp Phe Val Ser Gln Leu Thr Ile Leu Glu Lys Ile Asn Leu
65 70 75 80
Thr Thr Gly Val Gly Trp Glu Asn Gly Pro Cys Val Gly Asn Thr Gly
85 90 95
Ser Ile Pro Arg Leu Gly Phe Lys Gly Phe Cys Thr Gln Asp Ser Pro
100 105 110
Gln Gly Val Arg Phe Ala Asp Tyr Ser Ser Ala Phe Thr Ser Ser Gln
115 120 125
Met Ala Ala Ala Thr Phe Asp Arg Ser Ile Leu Tyr Gln Arg Gly Gln
130 135 140
Ala Met Ala Gln Glu His Lys Ala Lys Gly Ile Thr Ile Gln Leu Gly
145 150 155 160
Pro Val Ala Gly Pro Leu Gly Arg Ile Pro Glu Gly Gly Arg Asn Trp
165 170 175
Glu Gly Phe Ser Pro Asp Pro Val Leu Thr Gly Ile Ala Met Ala Glu
180 185 190
Thr Ile Lys Gly Met Gln Asp Thr Gly Val Ile Ala Cys Ala Lys His
195 200 205
Tyr Ile Gly Asn Glu Gln Glu His Phe Arg Gln Val Gly Glu Ala Ala
210 215 220
Gly His Gly Tyr Thr Ile Ser Asp Thr Ile Ser Ser Asn Ile Asp Asp
225 230 235 240
Arg Ala Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg
245 250 255
Ala Gly Val Gly Ser Phe Met Cys Ser Tyr Ser Gln Ile Asn Asn Ser
260 265 270
Tyr Gly Cys Gln Asn Ser Gln Thr Leu Asn Lys Leu Leu Lys Ser Glu
275 280 285
Leu Gly Phe Gln Gly Phe Val Met Ser Asp Trp Gly Ala His His Ser
290 295 300
Gly Val Ser Ser Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp
305 310 315 320
7hr Glu Phe Asp Ser Gly Leu Ser Phe Trp Gly Ser Asn Leu Thr Ile
325 330 335
Ala Ile Leu Asn Gly Thr Val Pro Glu Trp Arg Leu Asp Asp Met Ala
340 345 350
Met Arg Ile Met Ala Ala Tyr Phe Lys Val Gly Leu Thr Ile Glu Asp
355 360 365
Gln Pro Asp Val Asn Phe Asn Ala Trp Thr His Asp Thr Tyr Gly Tyr
370 375 380
Lys Tyr Ala Tyr Ser Lys Glu Asp Tyr Glu Gln Val Asn Trp His Val
385 390 395 400
Asp Val Arg Ser Asp His Asn Lys Leu Ile Arg Glu Thr Ala Ala Lys
405 410 415
Gly Thr Val Leu Leu Lys Asn Asn Phe His Ala Leu Pro Leu Lys Gln
420 425 430
Pro Arg Phe Val Ala Val Val Gly Gln Asp Ala Gly Pro Asn Pro Lys
435 440 445
Gly Pro Asn Gly Cys Ala Asp Arg Gly Cys Asp Gln Gly Thr Leu Ala
450 455 460
Met Gly Trp Gly Ser Gly Ser Thr Glu Phe Pro Tyr Leu Val Thr Pro
465 470 475 480
Asp Thr Ala Ile Gln Ser Lys Val Leu Glu Tyr Gly Gly Arg Tyr Glu
485 490 495
Ser Ile Phe Asp Asn Tyr Asp Asp Asn Ala Ile Leu Ser Leu Val Ser
500 505 510
Gln Pro Asp Ala Thr Cys Ile Val Phe Ala Asn Ala Asp Ser Gly Glu
515 520 525
Gly Tyr Ile Thr Val Asp Asn Asn Trp Gly Asp Arg Asn Asn Leu Thr
530 535 540
Leu Trp Gln Asn Ala Asp Gln Val Ile Ser Thr Val Ser Ser Arg Cys
545 550 555 560
Asn Asn Thr Ile Val Val Leu His Ser Val Gly Pro Val Leu Leu Asn
565 570 575
Gly Ile Tyr Glu His Pro Asn Ile Thr Ala Ile Val Trp Ala Gly Met
580 585 590
Pro Gly Glu Glu Ser Gly Asn Ala Leu Val Asp Ile Leu Trp Gly Asn
595 600 605
Val Asn Pro Ala Gly Arg Thr Pro Phe Thr Trp Ala Lys Ser Arg Glu
610 615 620
Asp Tyr Gly Thr Asp Ile Met Tyr Glu Pro Asn Asn Gly Gln Arg Ala
625 630 635 640
Pro Gln Gln Asp Phe Thr Glu Ser Ile Tyr Leu Asp Tyr Arg His Phe
645 650 655
Asp Lys Ala Gly Ile Glu Pro Ile Tyr Glu Phe Gly Phe Gly Leu Ser
660 665 670
Tyr Thr Thr Phe Glu Tyr Ser Asp Leu Arg Val Val Lys Lys Tyr Val
675 680 685
Gln Pro Tyr Ser Pro Thr Thr Gly Thr Gly Ala Gln Ala Pro Ser Ile
690 695 700
Gly Gln Pro Pro Ser Gln Asn Leu Asp Thr Tyr Lys Phe Pro Ala Thr
705 710 715 720
Tyr Lys Tyr Ile Lys Thr Phe Ile Tyr Pro Tyr Leu Asn Ser Thr Val
725 730 735
Ser Leu Arg Ala Ala Ser Lys Asp Pro Glu Tyr Gly Arg Thr Asp Phe
740 745 750
Ile Pro Pro His Ala Arg Asp Gly Ser Pro Gln Pro Leu Asn Pro Ala
755 760 765
Gly Asp Pro Val Ala Ser Gly Gly Asn Asn Met Leu Tyr Asp Glu Leu
770 775 780
Tyr Glu Val Thr Ala Gln Ile Lys Asn Thr Gly Asp Val Ala Gly Asp
785 790 795 800
Glu Val Val Gln Leu Tyr Val Asp Leu Gly Gly Asp Asn Pro Pro Arg
805 810 815
Gln Leu Arg Asn Phe Asp Arg Phe Tyr Leu Leu Pro Gly Gln Ser Ser
820 825 830
Thr Phe Arg Ala Thr Leu Thr Arg Arg Asp Leu Ser Asn Trp Asp Ile
835 840 845
Glu Ala Gln Asn Trp Arg Val Thr Glu Ser Pro Lys Arg Val Tyr Val
850 855 860
Gly Arg Ser Ser Arg Asp Leu Pro Leu Ser Ser Gln Leu Glu
865 870 875
<210>31
<211>2235
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>31
atgcgttacc gaacagcagc tgcgctggca cttgccactg ggccctttgc tagggcagac 60
agtcactcaa catcgggggc ctcggctgag gcagttgtac ctcctgcagg gactccatgg 120
ggaaccgcgt acgacaaggc gaaggccgca ttggcaaagc tcaatctcca agataaggtc 180
ggcatcgtga gcggtgtcgg ctggaacggc ggtccttgcg ttggaaacac atctccggcc 240
tccaagatca gctatccatc gctatgcctt caagacggac ccctcggtgt tcgatactcg 300
acaggcagca cagcctttac gccgggcgtt caagcggcct cgacgtggga tgtcaatttg 360
atccgcgaac gtggacagtt catcggtgag gaggtgaagg cctcggggat tcatgtcata 420
cttggtcctg tggctgggcc gctgggaaag actccgcagg gcggtcgcaa ctgggagggc 480
ttcggtgtcg atccatatct cacgggcatt gccatgggtc aaaccatcaa cggcatccag 540
tcggtaggcg tgcaggcgac agcgaagcac tatatcctca acgagcagga gctcaatcga 600
gaaaccattt cgagcaaccc agatgaccga actctccatg agctgtatac ttggccattt 660
gccgacgcgg ttcaggccaa tgtcgcttct gtcatgtgct cgtacaacaa ggtcaatacc 720
acctgggcct gcgaggatca gtacacgctg cagactgtgc tgaaagacca gctggggttc 780
ccaggctatg tcatgacgga ctggaacgca cagcacacga ctgtccaaag cgcgaattct 840
gggcttgaca tgtcaatgcc tggcacagac ttcaacggta acaatcggct ctggggtcca 900
gctctcacca atgcggtaaa tagcaatcag gtccccacga gcagagtcga cgatatggtg 960
actcgtatcc tcgccgcatg gtacttgaca ggccaggacc aggcaggcta tccgtcgttc 1020
aacatcagca gaaatgttca aggaaaccac aagaccaatg tcagggcaat tgccagggac 1080
ggcatcgttc tgctcaagaa tgacgccaac atcctgccgc tcaagaagcc cgctagcatt 1140
gccgtcgttg gatctgccgc aatcattggt aaccacgcca gaaactcgcc ctcgtgcaac 1200
gacaaaggct gcgacgacgg ggccttgggc atgggttggg gttccggcgc cgtcaactat 1260
ccgtacttcg tcgcgcccta cgatgccatc aataccagag cgtcttcgca gggcacccag 1320
gttaccttga gcaacaccga caacacgtcc tcaggcgcat ctgcagcaag aggaaaggac 1380
gtcgccatcg tcttcatcac cgccgactcg ggtgaaggct acatcaccgt ggagggcaac 1440
gcgggcgatc gcaacaacct ggatccgtgg cacaacggca atgccctggt ccaggcggtg 1500
gccggtgcca acagcaacgt cattgttgtt gtccactccg ttggcgccat cattctggag 1560
cagattcttg ctcttccgca ggtcaaggcc gttgtctggg cgggtcttcc ttctcaggag 1620
agcggcaatg cgctcgtcga cgtgctgtgg ggagatgtca gcccttctgg caagctggtg 1680
tacaccattg cgaagagccc caatgactat aacactcgca tcgtttccgg cggcagtgac 1740
agcttcagcg agggactgtt catcgactat aagcacttcg acgacgccaa tatcacgccg 1800
cggtacgagt tcggctatgg actgtcttac accaagttca actactcacg cctctccgtc 1860
ttgtcgaccg ccaagtctgg tcctgcgact ggggccgttg tgccgggagg cccgagtgat 1920
ctgttccaga atgtcgcgac agtcaccgtt gacatcgcaa actctggcca agtgactggt 1980
gccgaggtag cccagctgta catcacctac ccatcttcag cacccaggac ccctccgaag 2040
cagctgcgag gctttgccaa gctgaacctc acgcctggtc agagcggaac agcaacgttc 2100
aacatccgac gacgagatct cagctactgg gacacggctt cgcagaaatg ggtggtgccg 2160
tcggggtcgt ttggcatcag cgtgggagcg agcagccggg atatcaggct gacgagcact 2220
ctgtcggtag cgtag 2235
<210>32
<211>744
<212>PRT
<213>里氏木霉(Trichoderma reesei)
<400>32
Met Arg Tyr Arg Thr Ala Ala Ala Leu Ala Leu Ala Thr Gly Pro Phe
1 5 10 15
Ala Arg Ala Asp Ser His Ser Thr Ser Gly Ala Ser Ala Glu Ala Val
20 25 30
Val Pro Pro Ala Gly Thr Pro Trp Gly Thr Ala Tyr Asp Lys Ala Lys
35 40 45
Ala Ala Leu Ala Lys Leu Asn Leu Gln Asp Lys Val Gly Ile Val Ser
50 55 60
Gly Val Gly Trp Asn Gly Gly Pro Cys Val Gly Asn Thr Ser Pro Ala
65 70 75 80
Ser Lys Ile Ser Tyr Pro Ser Leu Cys Leu Gln Asp Gly Pro Leu Gly
85 90 95
Val Arg Tyr Ser Thr Gly Ser Thr Ala Phe Thr Pro Gly Val Gln Ala
100 105 110
Ala Ser Thr Trp Asp Val Asn Leu Ile Arg Glu Arg Gly Gln Phe Ile
115 120 125
Gly Glu Glu Val Lys Ala Ser Gly Ile His Val Ile Leu Gly Pro Val
130 135 140
Ala Gly Pro Leu Gly Lys Thr Pro Gln Gly Gly Arg Asn Trp Glu Gly
145 150 155 160
Phe Gly Val Asp Pro Tyr Leu Thr Gly Ile Ala Met Gly Gln Thr Ile
165 170 175
Asn Gly Ile Gln Ser Val Gly Val Gln Ala Thr Ala Lys His Tyr Ile
180 185 190
Leu Asn Glu Gln Glu Leu Asn Arg Glu Thr Ile Ser Ser Asn Pro Asp
195 200 205
Asp Arg Thr Leu His Glu Leu Tyr Thr Trp Pro Phe Ala Asp Ala Val
210 215 220
Gln Ala Asn Val Ala Ser Val Met Cys Ser Tyr Asn Lys Val Asn Thr
225 230 235 240
Thr Trp Ala Cys Glu Asp Gln Tyr Thr Leu Gln Thr Val Leu Lys Asp
245 250 255
Gln Leu Gly Phe Pro Gly Tyr Val Met Thr Asp Trp Asn Ala Gln His
260 265 270
Thr Thr Val Gln Ser Ala Asn Ser Gly Leu Asp Met Ser Met Pro Gly
275 280 285
Thr Asp Phe Asn Gly Asn Asn Arg Leu Trp Gly Pro Ala Leu Thr Asn
290 295 300
Ala Val Asn Ser Asn Gln Val Pro Thr Ser Arg Val Asp Asp Met Val
305 310 315 320
Thr Arg Ile Leu Ala Ala Trp Tyr Leu Thr Gly Gln Asp Gln Ala Gly
325 330 335
Tyr Pro Ser Phe Asn Ile Ser Arg Asn Val Gln Gly Asn His Lys Thr
340 345 350
Asn Val Arg Ala Ile Ala Arg Asp Gly Ile Val Leu Leu Lys Asn Asp
355 360 365
Ala Asn Ile Leu Pro Leu Lys Lys Pro Ala Ser Ile Ala Val Val Gly
370 375 380
Ser Ala Ala Ile Ile Gly Asn His Ala Arg Asn Ser Pro Ser Cys Asn
385 390 395 400
Asp Lys Gly Cys Asp Asp Gly Ala Leu Gly Met Gly Trp Gly Ser Gly
405 410 415
Ala Val Asn Tyr Pro Tyr Phe Val Ala Pro Tyr Asp Ala Ile Asn Thr
420 425 430
Arg Ala Ser Ser Gln Gly Thr Gln Val Thr Leu Ser Asn Thr Asp Asn
435 440 445
Thr Ser Ser Gly Ala Ser Ala Ala Arg Gly Lys Asp Val Ala Ile Val
450 455 460
Phe Ile Thr Ala Asp Ser Gly Glu Gly Tyr Ile Thr Val Glu Gly Asn
465 470 475 480
Ala Gly Asp Arg Asn Asn Leu Asp Pro Trp His Asn Gly Asn Ala Leu
485 490 495
Val Gln Ala Val Ala Gly Ala Asn Ser Asn Val Ile Val Val Val His
500 505 510
Ser Val Gly Ala Ile Ile Leu Glu Gln Ile Leu Ala Leu Pro Gln Val
515 520 525
Lys Ala Val Val Trp Ala Gly Leu Pro Ser Gln Glu Ser Gly Asn Ala
530 535 540
Leu Val Asp Val Leu Trp Gly Asp Val Ser Pro Ser Gly Lys Leu Val
545 550 555 560
Tyr Thr Ile Ala Lys Ser Pro Asn Asp Tyr Asn Thr Arg Ile Val Ser
565 570 575
Gly Gly Ser Asp Ser Phe Ser Glu Gly Leu Phe Ile Asp Tyr Lys His
580 585 590
Phe Asp Asp Ala Asn Ile Thr Pro Arg Tyr Glu Phe Gly Tyr Gly Leu
595 600 605
Ser Tyr Thr Lys Phe Ash Tyr Ser Arg Leu Ser Val Leu Ser Thr Ala
610 615 620
Lys Ser Gly Pro Ala Thr Gly Ala Val Val Pro Gly Gly Pro Ser Asp
625 630 635 640
Leu Phe Gln Asn Val Ala Thr Val Thr Val Asp Ile Ala Asn Ser Gly
645 650 655
Gln Val Thr Gly Ala Glu Val Ala Gln Leu Tyr Ile Thr Tyr Pro Ser
660 665 670
Ser Ala Pro Arg Thr Pro Pro Lys Gln Leu Arg Gly Phe Ala Lys Leu
675 680 685
Asn Leu Thr Pro Gly Gln Ser Gly Thr Ala Thr Phe Asn Ile Arg Arg
690 695 700
Arg Asp Leu Ser Tyr Trp Asp Thr Ala Ser Gln Lys Trp Val Val Pro
705 710 715 720
Ser Gly Ser Phe Gly Ile Ser Val Gly Ala Ser Ser Arg Asp Ile Arg
725 730 735
Leu Thr Ser Thr Leu Ser Val Ala
740
<210>33
<211>29
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>33
aacgttaatt aaggaatcgt tttgtgttt 29
<210>34
<211>29
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>34
agtactagta gctccgtggc gaaagcctg 29
<210>35
<211>31
<212>DNA
<213>酿酒酵母(Saccharomyces cerevisiae)
<400>35
ttgaattgaa aatagattga tttaaaactt c 31
<210>36
<211>25
<212>DNA
<213>酿酒酵母(Saccharomyces cerevisiae)
<400>36
ttgcatgcgt aatcatggtc atagc 25
<210>37
<211>26
<212>DNA
<213>酿酒酵母(Saccharomyces cerevisiae)
<400>37
ttgaattcat gggtaataac tgatat 26
<210>38
<211>32
<212>DNA
<213>酿酒酵母(Saccharomyces cerevisiae)
<400>38
aaatcaatct attttcaatt caattcatca tt 32
<210>39
<211>11
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>39
gtactaaaac c 11
<210>40
<211>11
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>40
ccgttaaatt t 11
<210>41
<211>45
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>41
ggatgctgtt gactccggaa atttaacggt ttggtcttgc atccc 45
<210>42
<211>14
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>42
atgcaattta aact 14
<210>43
<211>14
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>43
cggcaattta acgg 14
<210>44
<211>44
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>44
ggtattgtcc tgcagacggc aatttaacgg cttctgcgaa tcgc 44
<210>45
<211>29
<212>DNA
<213>特异腐质霉(Humicola insolens)
<400>45
aagcttaagc atgcgttcct cccccctcc 29
<210>46
<211>32
<212>DNA
<213>特异腐质霉(Humicola insolens)
<400>46
ctgcagaatt ctacaggcac tgatggtacc ag 32
<210>47
<211>32
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>47
ctgcagaatt ctacaggcac tgatggtacc ag 32
<210>48
<211>36
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>48
accgcggact gcgcatcatg cgttcctccc ccctcc 36
<210>49
<211>29
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>49
aaacgtcgac cgaatgtagg attgttatc 29
<210>50
<211>17
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>50
gatgcgcagt ccgcggt 17
<210>51
<211>29
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>51
aaacgtcgac cgaatgtagg attgttatc 29
<210>52
<211>36
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>52
ggagggggga ggaacgcatg atgcgcagtc cgcggt 36
<210>53
<211>29
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>53
aaacgtcgac cgaatgtagg at tgttatc 29
<210>54
<211>32
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>54
ctgcagaatt ctacaggcac tgatggtacc ag 32
<210>55
<211>46
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>55
atagtcaacc gcggactgcg catcatgaag cttggttgga tcgagg 46
<210>56
<211>26
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>56
actagtttac tgggccttag gcagcg 26
<210>57
<211>26
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>57
gtcgactcga agcccgaatg taggat 26
<210>58
<211>45
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>58
cctcgatcca accaagcttc atgatgcgca gtccgcggtt gacta 45
<210>59
<211>57
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>59
atgaagcttg gttggatcga ggtggccgca ttggcggct g cctcagtagt cagtgcc 57
<210>60
<211>19
<212>PRT
<213>米曲霉(Aspergillus oryzae)
<400>60
Met Lys Leu Gly Trp Ile Glu Val Ala Ala Leu Ala Ala Ala Ser Val
1 5 10 15
Val Ser Ala
<210>61
<211>42
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>61
tgccggtgtt ggcccttgcc aaggatgatc tcgcgtactc cc 42
<210>62
<211>28
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>62
gactagtctt actgggcctt aggcagcg 28
<210>63
<211>63
<212>DNA
<213>特异腐质霉(Humicola insolens)
<400>63
atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt 60
gcc 63
<210>64
<211>21
<212>PRT
<213>特异腐质霉(Humicola insolens)
<400>64
Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro
1 5 10 15
Val Leu Ala Leu Ala
20
<210>65
<211>30
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>65
acgcgtcgac cgaatgtagg attgttatcc 30
<210>66
<211>42
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>66
gggagtacgc gagatcatcc ttggcaaggg ccaacaccgg ca 42
<210>67
<211>20
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>67
cccaagctta gccaagaaca 20
<210>68
<211>29
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>68
gggggaggaa cgcatgggat ctggacggc 29
<210>69
<211>30
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>69
gccgtccaga tccccatgcg ttcctccccc 30
<210>70
<211>20
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>70
ccaagcttgt tcagagtttc 20
<210>71
<211>20
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>71
ggactgcgca gcatgcgttc 20
<210>72
<211>30
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>72
agttaattaa ttactgggcc ttaggcagcg 30
<210>73
<211>3294
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>73
atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt 60
gccgctgatg gcaggtccac ccgctactgg gactgctgca agccttcgtg cggctgggcc 120
aagaaggctc ccgtgaacca gcctgtcttt tcctgcaacg ccaacttcca gcgtatcacg 180
gacttcgacg ccaagtccgg ctgcgagccg ggcggtgtcg cctactcgtg cgccgaccag 240
accccatggg ctgtgaacga cgacttcgcg ctcggttttg ctgccacctc tattgccggc 300
agcaatgagg cgggctggtg ctgcgcctgc tacgagctca ccttcacatc cggtcctgtt 360
gctggcaaga agatggtcgt ccagtccacc agcactggcg gtgatcttgg cagcaaccac 420
ttcgatctca acatccccgg cggcggcgtc ggcatcttcg acggatgcac tccccagttc 480
ggtggtctgc ccggccagcg ctacggcggc atctcgtccc gcaacgagtg cgatcggttc 540
cccgacgccc tcaagcccgg ctgctactgg cgcttcgact ggttcaagaa cgccgacaat 600
ccgagcttca gcttccgtca ggtccagtgc ccagccgagc tcgtcgctcg caccggatgc 660
cgccgcaacg acgacggcaa cttccctgcc gtccagatcc ccatgcgttc ctcccccctc 720
ctccgctccg ccgttgtggc cgccctgccg gtgttggccc ttgccaagga tgatctcgcg 780
tactcccctc ctttctaccc ttccccatgg gcagatggtc agggtgaatg ggcggaagta 840
tacaaacgcg ctgtagacat agtttcccag atgacgttga cagagaaagt caacttaacg 900
actggaacag gatggcaact agagaggtgt gttggacaaa ctggcagtgt tcccagactc 960
aacatcccca gcttgtgttt gcaggatagt cctcttggta ttcgtttctc ggactacaat 1020
tcagctttcc ctgcgggtgt taatgtcgct gccacctggg acaagacgct cgcctacctt 1080
cgtggtcagg caatgggtga ggagttcagt gataagggta ttgacgttca gctgggtcct 1140
gctgctggcc ctctcggtgc tcatccggat ggcggtagaa actgggaagg tttctcacca 1200
gatccagccc tcaccggtgt actttttgcg gagacgatta agggtattca agatgctggt 1260
gtcattgcga cagctaagca ttatatcatg aacgaacaag agcatttccg ccaacaaccc 1320
gaggctgcgg gttacggatt caacgtaagc gacagtttga gttccaacgt tgatgacaag 1380
actatgcatg aattgtacct ctggcccttc gcggatgcag tacgcgctgg agtcggtgct 1440
gtcatgtgct cttacaacca aatcaacaac agctacggtt gcgagaatag cgaaactctg 1500
aacaagcttt tgaaggcgga gcttggtttc caaggcttcg tcatgagtga ttggaccgct 1560
catcacagcg gcgtaggcgc tgctttagca ggtctggata tgtcgatgcc cggtgatgtt 1620
accttcgata gtggtacgtc tttctggggt gcaaacttga cggtcggtgt ccttaacggt 1680
acaatccccc aatggcgtgt tgatgacatg gctgtccgta tcatggccgc ttattacaag 1740
gttggccgcg acaccaaata cacccctccc aacttcagct cgtggaccag ggacgaatat 1800
ggtttcgcgc ataaccatgt ttcggaaggt gcttacgaga gggtcaacga attcgtggac 1860
gtgcaacgcg atcatgccga cctaatccgt cgcatcggcg cgcagagcac tgttctgctg 1920
aagaacaagg gtgccttgcc cttgagccgc aaggaaaagc tggtcgccct tctgggagag 1980
gatgcgggtt ccaactcgtg gggcgctaac ggctgtgatg accgtggttg cgataacggt 2040
acccttgcca tggcctgggg tagcggtact gcgaatttcc catacctcgt gacaccagag 2100
caggcgattc agaacgaagt tcttcagggc cgtggtaatg tcttcgccgt gaccgacagt 2160
tgggcgctcg acaagatcgc tgcggctgcc cgccaggcca gcgtatctct cgtgttcgtc 2220
aactccgact caggagaagg ctatcttagt gtggatggaa atgagggcga tcgtaacaac 2280
atcactctgt ggaagaacgg cgacaatgtg gtcaagaccg cagcgaataa ctgtaacaac 2340
accgttgtca tcatccactc cgtcggacca gttttgatcg atgaatggta tgaccacccc 2400
aatgtcactg gtattctctg ggctggtctg ccaggccagg agtctggtaa ctccattgcc 2460
gatgtgctgt acggtcgtgt caaccctggc gccaagtctc ctttcacttg gggcaagacc 2520
cgggagtcgt atggttctcc cttggtcaag gatgccaaca atggcaacgg agcgccccag 2580
tctgatttca cccagggtgt tttcatcgat taccgccatt tcgataagtt caatgagacc 2640
cctatctacg agtttggcta cggcttgagc tacaccacct tcgagctctc cgacctccat 2700
gttcagcccc tgaacgcgtc ccgatacact cccaccagtg gcatgactga agctgcaaag 2760
aactttggtg aaattggcga tgcgtcggag tacgtgtatc cggaggggct ggaaaggatc 2820
catgagttta tctatccctg gatcaactct accgacctga aggcatcgtc tgacgattct 2880
aactacggct gggaagactc caagtatatt cccgaaggcg ccacggatgg gtctgcccag 2940
ccccgtttgc ccgctagtgg tggtgccgga ggaaaccccg gtctgtacga ggatcttttc 3000
cgcgtctctg tgaaggtcaa gaacacgggc aatgtcgccg gtgatgaagt tcctcagctg 3060
tacgtttccc taggcggccc gaatgagccc aaggtggtac tgcgcaagtt tgagcgtatt 3120
cacttggccc cttcgcagga ggccgtgtgg acaacgaccc ttacccgtcg tgaccttgca 3180
aactgggacg tttcggctca ggactggacc gtcactcctt accccaagac gatctacgtt 3240
ggaaactcct cacggaaact gccgctccag gcctcgctgc ctaaggccca gtaa 3294
<210>74
<211>1097
<212>PRT
<213>米曲霉(Aspergillus oryzae)
<400>74
Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro
1 5 10 15
Val Leu Ala Leu Ala Ala Asp Gly Arg Ser Thr Arg Tyr Trp Asp Cys
20 25 30
Cys Lys Pro Ser Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro
35 40 45
Val Phe Ser Cys Asn Ala Asn Phe Gln Arg Ile Thr Asp Phe Asp Ala
50 55 60
Lys Ser Gly Cys Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln
65 70 75 80
Thr Pro Trp Ala Val Asn Asp Asp Phe Ala Leu Gly Phe Ala Ala Thr
85 90 95
Ser Ile Ala Gly Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Glu
100 105 110
Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln
115 120 125
Ser Thr Ser Thr Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn
130 135 140
Ile Pro Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe
145 150 155 160
Gly Gly Leu Pro Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu
165 170 175
Cys Asp Arg Phe Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe
180 185 190
Asp Trp Phe Lys Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val
195 200 205
Gln Cys Pro Ala Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp
210 215 220
Asp Gly Asn Phe Pro Ala Val Gln Ile Pro Met Arg Ser Ser Pro Leu
225 230 235 240
Leu Arg Ser Ala Val Val Ala Ala Leu Pro Val Leu Ala Leu Ala Lys
245 250 255
Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser Pro Trp Ala Asp
260 265 270
Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala Val Asp Ile Val
275 280 285
Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr Thr Gly Thr Gly
290 295 300
Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser Val Pro Arg Leu
305 310 315 320
Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu Gly Ile Arg Phe
325 330 335
Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn Val Ala Ala Thr
340 345 350
Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala Met Gly Glu Glu
355 360 365
Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro Ala Ala Gly Pro
370 375 380
Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu Gly Phe Ser Pro
385 390 395 400
Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr Ile Lys Gly lle
405 410 415
Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr Ile Met Asn Glu
420 425 430
Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly Tyr Gly Phe Asn
435 440 445
Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys Thr Met His Glu
450 455 460
Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala Gly Val Gly Ala
465 470 475 480
Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly Cys Glu Asn
485 490 495
Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu Gly Phe Gln Gly
500 505 510
Phe Val Met Ser Asp Trp Thr Ala His His Ser Gly Val Gly Ala Ala
515 520 525
Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val Thr Phe Asp Ser
530 535 540
Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly Val Leu Asn Gly
545 550 555 560
Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val Arg Ile Met Ala
565 570 575
Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr Pro Pro Asn Phe
580 585 590
Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His Asn His Val Ser
595 600 605
Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp Val Gln Arg Asp
610 615 620
His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser Thr Val Leu Leu
625 630 635 640
Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu Lys Leu Val Ala
645 650 655
Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly Ala Asn Gly Cys
660 665 670
Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Ala Trp Gly Ser
675 680 685
Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu Gln Ala Ile Gln
690 695 700
Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala Val Thr Asp Ser
705 710 715 720
Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln Ala Ser Val Ser
725 730 735
Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr Leu Ser Val Asp
740 745 750
Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp Lys Asn Gly Asp
755 760 765
Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn Thr Val Val Ile
770 775 780
Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp Tyr Asp His Pro
785 790 795 800
Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly Gln Glu Ser Gly
805 810 815
Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn Pro Gly Ala Lys
820 825 830
Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr Gly Ser Pro Leu
835 840 845
Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln Ser Asp Phe Thr
850 855 860
Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys Phe Asn Glu Thr
865 870 875 880
Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr Thr Phe Glu Leu
885 890 895
Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg Tyr Thr Pro Thr
900 905 910
Ser Gly Met Thr Glu Ala Ala Lys Ash Phe Gly Glu Ile Gly Asp Ala
915 920 925
Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile His Glu Phe Ile
930 935 940
Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser Ser Asp Asp Ser
945 950 955 960
Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu Gly Ala Thr Asp
965 970 975
Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly Ala Gly Gly Asn
980 985 990
Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val Lys Val Lys Asn
995 1000 1005
Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu Tyr Val Ser
1010 1015 1020
Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys Phe Glu
1025 1030 1035
Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr Thr
1040 1045 1050
Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp
1055 1060 1065
Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser
1070 1075 1080
Ser Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln
1085 1090 1095
<210>75
<211>3294
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>75
atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt 60
gccgctgatg gcaggtccac ccgctactgg gactgctgca agccttcgtg cggctgggcc 120
aagaaggctc ccgtgaacca gcctgtcttt tcctgcaacg ccaacttcca gcgtatcacg 180
gacttcgacg ccaagtccgg ctgcgagccg ggcggtgtcg cctactcgtg cgccgaccag 240
accccatggg ctgtgaacga cgacttcgcg ctcggttttg ctgccacctc tatt gccggc 300
agcaatgagg cgggctggtg ctgcgcctgc tacgagctca ccttcacatc cggtcctgtt 360
gctggcaaga agatggtcgt ccagtccacc agcactggcg gtgatcttgg cagcaaccac 420
ttcgatctca acatccccgg cggcggcgtc ggcatcttcg acggatgcac tccccagttc 480
ggtggtctgc ccggccagcg ctacggcggc atctcgtccc gcaacgagtg cgatcggttc 540
cccgacgccc tcaagcccgg ctgctactgg cgcttcgact ggttcaagaa cgccgacaat 600
ccgagcttca gcttccgtca ggtccagtgc ccagccgagc tcgtcgctcg caccggatgc 660
cgccgcaacg acgacggcaa cttccctgcc gtccagatcc ccatgcgttc ctcccccctc 720
ctccgctccg ccgttgtggc cgccctgccg gtgttggccc ttgccaagga tgatctcgcg 780
tactcccctc ctttctaccc ttccccatgg gcagatggtc agggtgaatg ggcggaagta 840
tacaaacgcg ctgtagacat agtttcccag atgacgttga cagagaaagt caacttaacg 900
actggaacag gatggcaact agagaggtgt gttggacaaa ctggcagtgt tcccagactc 960
aacatcccca gcttgtgttt gcaggatagt cctcttggta ttcgtttctc ggactacaat 1020
tcagctttcc ctgcgggtgt taatgtcgct gccacctggg acaagacgct cgcctacctt 1080
cgtggtcagg caatgggtga ggagttcagt gataagggta ttgacgttca gctgggtcct 1140
gctgctggcc ctctcggtgc tcatccggat ggcggtagaa actgggaaag tttctcacca 1200
gatccagccc tcaccggtgt actttttgcg gagacgatta agggtattca agatgctggt 1260
gtcattgcga cagctaagca ttatatcatg aacgaacaag agcatttccg ccaacaaccc 1320
gaggctgcgg gttacggatt caacgtaagc gacagtttga gttccaacgt tgatgacaag 1380
actatgcatg aattgtacct ctggcccttc gcggatgcag tacgcgctgg agtcggtgct 1440
gttatgtgct cttacaacca aatcaacaac agctacggtt gcgagaatag cgaaactctg 1500
aacaagcttt tgaaggcgga gcttggtttc caaggcttcg tcatgagtga ttggaccgct 1560
caacacagcg gcgtaggcgc tgctttagca ggtctggata tgtcgatgcc cggtgatgtt 1620
accttcgata gtggtacgtc tttctggggt gcaaacttga cggtcggtgt ccttaacggt 1680
acaatccccc aatggcgtgt tgatgacatg gctgtccgta tcatggccgc ttattacaag 1740
gttggccgcg acaccaaata cacccctccc aacttcagct cgtggaccag ggacgaatat 1800
ggtttcgcgc ataaccatgt ttcggaaggt gcttacgaga gggtcaacga attcgtggac 1860
gtgcaacgcg atcatgccga cctaatccgt cgcatcggcg cgcagagcac tgttctgctg 1920
aagaacaagg gtgccttgcc cttgagccgc aaggaaaagc tggtcgccct tctgggagag 1980
gatgcgggtt ccaactcgtg gggcgctaac ggctgtgatg accgtggttg cgataacggt 2040
acccttgcca tggcctgggg tagcggtact gcgaatttcc catacctcgt gacaccagag 2100
caggcgattc agaacgaagt tcttcagggc cgtggtaatg tcttcgccgt gaccgacagt 2160
tgggcgctcg acaagatcgc tgcggctgcc cgccaggcca gcgtatctct cgtgttcgtc 2220
aactccgact caggagaagg ctatcttagt gtggatggaa atgagggcga tcgtaacaac 2280
atcactctgt ggaagaacgg cgacaatgtg gtcaagaccg cagcgaataa ctgtaacaac 2340
accgttgtca tcatccactc cgtcggacca gttttgatcg atgaatggta tgaccacccc 2400
aatgtcactg gtattctctg ggctggtctg ccaggccagg agtctggtaa ctccattgcc 2460
gatgtgctgt acggtcgtgt caaccctggc gccaagtctc ctttcacttg gggcaagacc 2520
cgggagtcgt atggttctcc cttggtcaag gatgccaaca atggcaacgg agcgccccag 2580
tctgatttca cccagggtgt tttcatcgat taccgccatt tcgataagtt caatgagacc 2640
cctatctacg agtttggcta cggcttgagc tacaccacct tcgagctctc cgacctccat 2700
gttcagcccc tgaacgcgtc ccgatacact cccaccagtg gcatgactga agctgcaaag 2760
aactttggtg aaattggcga tgcgtcggag tacgtgtatc cggaggggct ggaaaggatc 2820
catgagttta tctatccctg gatcaactct accgacctga aggcatcgtc tgacgattct 2880
aactacggct gggaagactc caagtatatt cccgaaggcg ccacggatgg gtctgcccag 2940
ccccgtttgc ccgctagtgg tggtgccgga ggaaaccccg gtctgtacga ggatcttttc 3000
cgcgtctctg tgaaggtcaa gaacacgggc aatgtcgccg gtgatgaagt tcctcagctg 3060
tacgtttccc taggcggccc gaatgagccc aaggtggtac tgcgcaagtt tgagcgtatt 3120
cacttggccc cttcgcagga ggccgtgtgg acaacgaccc ttacccgtcg tgaccttgca 3180
aactgggacg tttcggctca ggactggacc gtcactcctt accccaagac gatctacgtt 3240
ggaaactcct cacggaaact gccgctccag gcctcgctgc ctaaggccca gtaa 3294
<210>76
<211>1097
<212>PRT
<213>米曲霉(Aspergillus oryzae)
<400>76
Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro
1 5 10 15
Val Leu Ala Leu Ala Ala Asp Gly Arg Ser Thr Arg Tyr Trp Asp Cys
20 25 30
Cys Lys Pro Ser Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro
35 40 45
Val Phe Ser Cys Asn Ala Asn Phe Gln Arg Ile Thr Asp Phe Asp Ala
50 55 60
Lys Ser Gly Cys Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln
65 70 75 80
Thr Pro Trp Ala Val Asn Asp Asp Phe Ala Leu Gly Phe Ala Ala Thr
85 90 95
Ser Ile Ala Gly Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Glu
100 105 110
Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln
115 120 125
Ser Thr Ser Thr Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn
130 135 140
Ile Pro Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe
145 150 155 160
Gly Gly Leu Pro Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu
165 170 175
Cys Asp Arg Phe Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe
180 185 190
Asp Trp Phe Lys Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val
195 200 205
Gln Cys Pro Ala Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp
210 215 220
Asp Gly Asn Phe Pro Ala Val Gln Ile Pro Met Arg Ser Ser Pro Leu
225 230 235 240
Leu Arg Ser Ala Val Val Ala Ala Leu Pro Val Leu Ala Leu Ala Lys
245 250 255
Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser Pro Trp Ala Asp
260 265 270
Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala Val Asp Ile Val
275 280 285
Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr Thr Gly Thr Gly
290 295 300
Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser Val Pro Arg Leu
305 310 315 320
Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu Gly Ile Arg Phe
325 330 335
Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn Val Ala Ala Thr
340 345 350
Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala Met Gly Glu Glu
355 360 365
Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro Ala Ala Gly Pro
370 375 380
Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu Ser Phe Ser Pro
385 390 395 400
Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr Ile Lys Gly Ile
405 410 415
Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr Ile Met Asn Glu
420 425 430
Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly Tyr Gly Phe Asn
435 440 445
Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys Thr Met His Glu
450 455 460
Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala Gly Val Gly Ala
465 470 475 480
Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly Cys Glu Asn
485 490 495
Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu Gly Phe Gln Gly
500 505 510
Phe Val Met Ser Asp Trp Thr Ala Gln His Ser Gly Val Gly Ala Ala
515 520 525
Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val Thr Phe Asp Ser
530 535 540
Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly Val Leu Asn Gly
545 550 555 560
Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val Arg Ile Met Ala
565 570 575
Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr Pro Pro Asn Phe
580 585 590
Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His Asn His Val Ser
595 600 605
Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp Val Gln Arg Asp
610 615 620
His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser Thr Val Leu Leu
625 630 635 640
Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu Lys Leu Val Ala
645 650 655
Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly Ala Asn Gly Cys
660 665 670
Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Ala Trp Gly Ser
675 680 685
Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu Gln Ala Ile Gln
690 695 700
Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala Val Thr Asp Ser
705 710 715 720
Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln Ala Ser Val Ser
725 730 735
Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr Leu Ser Val Asp
740 745 750
Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp Lys Asn Gly Asp
755 760 765
Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn Thr Val Val Ile
770 775 780
Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp Tyr Asp His Pro
785 790 795 800
Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly Gln Glu Ser Gly
805 810 815
Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn Pro Gly Ala Lys
820 825 830
Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr Gly Ser Pro Leu
835 840 845
Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln Ser Asp Phe Thr
850 855 860
Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys Phe Asn Glu Thr
865 870 875 880
Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr Thr Phe Glu Leu
885 890 895
Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg Tyr Thr Pro Thr
900 905 910
Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu Ile Gly Asp Ala
915 920 925
Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile His Glu Phe Ile
930 935 940
Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser Ser Asp Asp Ser
945 950 955 960
Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu Gly Ala Thr Asp
965 970 975
Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly Ala Gly Gly Asn
980 985 990
Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val Lys Val Lys Asn
995 1000 1005
Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu Tyr Val Ser
1010 1015 1020
Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys Phe Glu
1025 1030 1035
Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr Thr
1040 1045 1050
Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp
1055 1060 1065
Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser
1070 1075 1080
Ser Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln
1085 1090 1095
Claims (56)
1.用于产生具有生物学活性的分泌型多肽的方法,该方法包括:
(a)用编码融合蛋白的融合蛋白构建体转化真菌宿主细胞,其中所述融合蛋白构建体包含:
(i)包含编码信号肽的核苷酸序列的第一多核苷酸;
(ii)包含编码内切葡聚糖酶的至少催化结构域或其部分的核苷酸序列的第二多核苷酸;和
(iii)包含编码具有生物学活性之多肽的至少催化结构域或其部分的核苷酸序列的第三多核苷酸;
其中所述信号肽和所述内切葡聚糖酶的至少催化结构域或其部分与不存在所述内切葡聚糖酶的至少催化结构域或其部分时相比提高所述具有生物学活性之多肽或其部分的分泌;
(b)在适于所述融合蛋白产生的条件下培养所述经过转化的真菌宿主细胞;和
(c)自所述培养基回收融合蛋白、其构件、或它们的组合,其中所述融合蛋白或其构件具有生物学活性。
2.权利要求1的方法,其中所述第一多核苷酸的3’端可操作连接于所述第二多核苷酸的5’端且所述第二多核苷酸的3’端可操作连接于所述第三多核苷酸的5’端,或者所述第一多核苷酸的3’端可操作连接于所述第三多核苷酸的5’端且所述第三多核苷酸的3’端可操作连接于所述第二多核苷酸的5’端,以编码融合蛋白。
3.权利要求1或2的方法,其中所述编码信号肽的第一多核苷酸得自特异腐质霉CEL45内切葡聚糖酶基因(cel45)。
4.权利要求1-3任一项的方法,其中所述包含编码内切葡聚糖酶的至少催化结构域或其部分的核苷酸序列的第二多核苷酸得自特异腐质霉CEL45内切葡聚糖酶基因(cel45)。
5.权利要求1-3任一项的方法,其中所述包含编码内切葡聚糖酶的至少催化结构域或其部分的核苷酸序列的第二多核苷酸得自编码包含如下氨基酸序列的内切葡聚糖酶的基因,所述氨基酸序列与SEQ ID NO:2具有至少70%、优选至少75%、更优选至少80%、甚至更优选至少85%、最优选至少90%、且甚至最优选至少95%同一性。
6.权利要求1-5任一项的方法,其中所述融合蛋白构建体进一步包含编码碳水化合物结合模块的多核苷酸。
7.权利要求1-6任一项的方法,其中所述第二多核苷酸编码内切葡聚糖酶的催化结构域或其部分、成熟多肽、或全长多肽。
8.权利要求1-7任一项的方法,其中所述第三多核苷酸编码具有生物学活性之多肽的催化结构域或其部分、成熟多肽、或全长多肽。
9.权利要求1-8任一项的方法,其中所述融合蛋白构建体进一步包含位于所述编码内切葡聚糖酶的至少催化结构域或其部分的核苷酸序列与所述编码具有生物学活性之多肽的至少催化结构域或其部分的核苷酸序列之间的、编码接头的多核苷酸,或者还有位于所述编码内切葡聚糖酶的至少催化结构域或其部分的核苷酸序列与所述编码具有生物学活性之多肽的至少催化结构域或其部分的核苷酸序列之间的、编码切割位点的多核苷酸。
10.权利要求1-9任一项的方法,其中所述融合蛋白构建体进一步包含编码第二信号肽的第四多核苷酸。
11.权利要求10的方法,其中所述第四多核苷酸3’端可操作连接所述第二多核苷酸的5’端或所述第三多核苷酸的5’端。
12.权利要求1-11任一项的方法,其中所述融合蛋白构建体进一步包含启动子和/或终止子。
13.权利要求12的方法,其中所述启动子驱动所述第一、第二、和第三、或者还有第四多核苷酸的表达。
14.权利要求1-13任一项的方法,其中所述具有生物学活性之多肽是抗体、抗原、抗微生物肽、酶、生长因子、激素、免疫扩张剂、神经递质、受体、报道蛋白、或结构蛋白。
15.权利要求1-14任一项的方法,其中所述具有生物学活性之多肽是氧化还原酶、转移酶、水解酶、裂合酶、异构酶、或连接酶。
16.权利要求1-15任一项的方法,其中所述具有生物学活性之多肽是纤维素分解酶或半纤维素分解酶。
17.权利要求16的方法,其中所述纤维素分解酶是β-葡糖苷酶。
18.权利要求17的方法,其中所述β-葡糖苷酶包含如下氨基酸序列,所述氨基酸序列与SEQ ID NO:24具有至少70%、优选至少75%、更优选至少80%、甚至更优选至少85%、最优选至少90%、且甚至最优选至少95%同一性,或者是包含如下氨基酸序列的变体β-葡糖苷酶,所述氨基酸序列与SEQID NO:35具有至少70%、优选至少75%、更优选至少80%、甚至更优选至少85%、最优选至少90%、且甚至最优选至少95%同一性。
19.权利要求1-18任一项的方法,其中所述融合蛋白、其构件或它们的组合具有纤维素水解活性或半纤维素水解活性。
20.一种分离的融合蛋白,该融合蛋白包含:
(a)包含信号肽的第一氨基酸序列;
(b)包含内切葡聚糖酶的至少催化结构域或其部分的第二氨基酸序列;和
(c)包含具有生物学活性之多肽的至少催化结构域或其部分的第三氨基酸序列。
21.权利要求20的融合蛋白,其中所述第一氨基酸序列的C端以符合读码框的方式连接所述第二氨基酸序列的N端且所述第二氨基酸序列的C端以符合读码框的方式连接所述第三氨基酸序列的N端,或者所述第一氨基酸序列的C端以符合读码框的方式连接所述第三氨基酸序列的N端且所述第三氨基酸序列的C端以符合读码框的方式连接所述第二氨基酸序列的N端。
22.权利要求20或21的融合蛋白,其中所述包含信号肽的第一氨基酸序列得自特异腐质霉CEL45内切葡聚糖酶。
23.权利要求20-22任一项的融合蛋白,其中所述包含内切葡聚糖酶的至少催化结构域的第二氨基酸序列得自特异腐质霉CEL45内切葡聚糖酶。
24.权利要求20-22任一项的融合蛋白,其中所述包含内切葡聚糖酶的至少催化结构域的第二氨基酸序列得自包含如下氨基酸序列的内切葡聚糖酶,所述氨基酸序列与SEQ ID NO:2具有至少70%、优选至少75%、更优选至少80%、甚至更优选至少85%、最优选至少90%、且甚至最优选至少95%同一性。
25.权利要求20-24任一项的融合蛋白,该融合蛋白进一步包含碳水化合物结合模块。
26.权利要求20-25任一项的融合蛋白,其中所述第二氨基酸序列包含内切葡聚糖酶的催化结构域或其部分、成熟多肽、或全长多肽。
27.权利要求20-26任一项的融合蛋白,其中所述第三氨基酸序列包含具有生物学活性之多肽的催化结构域或其部分、成熟多肽、或全长多肽。
28.权利要求20-27任一项的融合蛋白,该融合蛋白进一步包含位于所述内切葡聚糖酶的至少催化结构域或其部分与所述具有生物学活性之多肽的至少催化结构域或其部分之间的接头,或者还有位于所述内切葡聚糖酶的至少催化结构域或其部分与所述具有生物学活性之多肽的至少催化结构域或其部分之间的切割位点。
29.权利要求20-28任一项的融合蛋白,该融合蛋白进一步包含含有第二信号肽的第四氨基酸序列。
30.权利要求20-29任一项的融合蛋白,其中所述第二信号肽以符合读码框的方式连接所述包含具有生物学活性之多肽的至少催化结构域或其部分的氨基酸序列的N端或所述包含内切葡聚糖酶的至少催化结构域或其部分的氨基酸序列的N端。
31.权利要求20-30任一项的融合蛋白,其中所述具有生物学活性之多肽是抗体、抗原、抗微生物肽、酶、生长因子、激素、免疫扩张剂、神经递质、受体、报道蛋白、或结构蛋白。
32.权利要求20-31任一项的融合蛋白,其中所述具有生物学活性之多肽是氧化还原酶、转移酶、水解酶、裂合酶、异构酶、或连接酶。
33.权利要求20-32任一项的融合蛋白,其中所述具有生物学活性之多肽是纤维素分解酶或半纤维素分解酶。
34.权利要求33的融合蛋白,其中所述纤维素分解酶是β-葡糖苷酶。
35.权利要求34的融合蛋白,其中所述β-葡糖苷酶包含如下氨基酸序列,所述氨基酸序列与SEQ ID NO:24具有至少70%、优选至少75%、更优选至少80%、甚至更优选至少85%、最优选至少90%、且甚至最优选至少95%同一性,或者是包含如下氨基酸序列的变体β-葡糖苷酶,所述氨基酸序列与SEQID NO:35具有至少70%、优选至少75%、更优选至少80%、甚至更优选至少85%、最优选至少90%、且甚至最优选至少95%同一性。
36.权利要求34的融合蛋白,其中所述β-葡糖苷酶是SEQ ID NO:24或SEQ ID NO:35。
37.权利要求20-36任一项的融合蛋白,该融合蛋白是β-葡糖苷酶融合蛋白或其构件。
38.权利要求37的融合蛋白,该融合蛋白包含SEQ ID NO:74或SEQ IDMO:76。
39.权利要求38的融合蛋白,其中SEQ ID NO:74由SEQ ID NO:73编码而SEQ ID NO:76由SEQ ID NO:75编码。
40.权利要求20-40任一项的融合蛋白,其中所述融合蛋白、其构件或它们的组合具有纤维素水解活性或半纤维素水解活性。
41.一种分离的多核苷酸,该多核苷酸编码权利要求20-40任一项的融合蛋白。
42.一种融合蛋白构建体,该融合蛋白构建体包含权利要求41的多核苷酸。
43.一种表达载体,该表达载体包含权利要求42的融合蛋白构建体。
44.一种真菌宿主细胞,该真菌宿主细胞经过权利要求43的融合蛋白构建体的转化。
45.一种用于降解或转变含纤维素材料的方法,该方法包括:在存在有效量的权利要求40的融合蛋白或其构件的条件下用有效量的纤维素分解酶组合物处理所述含纤维素材料。
46.权利要求45的方法,其中所述纤维素分解酶组合物包含一种或几种选自下组的纤维素水解蛋白质:纤维素酶、内切葡聚糖酶、纤维二糖水解酶、和具有纤维素水解增强活性的多肽。
47.权利要求45或46的方法,该方法进一步包括用有效量的一种或几种选自下组的酶处理所述含纤维素材料:半纤维素酶、酯酶、蛋白酶、漆酶、过氧化物酶、或其混合物。
48.权利要求45-47任一项的方法,其中所述方法是预处理方法、同步糖化和发酵方法(SSF)中的步骤、分别水解和发酵(SHF)中的步骤、或混合水解和发酵方法(HHF)中的步骤。
49.权利要求45-48任一项的方法,该方法进一步包括回收经过降解的含纤维素材料。
50.权利要求45的方法,其中所述纤维素水解蛋白质和/或融合蛋白或其构件为含有或不含细胞的发酵液的形式。
51.一种用于产生物质的方法,该方法包括:
(a)在存在有效量的权利要求40的融合蛋白或其构件的条件下用有效量的纤维素分解酶组合物糖化含纤维素材料;
(b)用一种或几种发酵微生物将步骤(a)的经糖化的含纤维素材料发酵;和
(c)从所述发酵回收所述有机物质。
52.权利要求51的方法,其中所述纤维素分解酶组合物包含一种或几种选自下组的蛋白质:纤维素酶、内切葡聚糖酶、纤维二糖水解酶、和具有纤维素水解增强活性的多肽。
53.权利要求51或52的方法,该方法进一步包括用有效量的一种或几种选自下组的酶处理所述含纤维素材料:半纤维素酶、酯酶、蛋白酶、漆酶、过氧化物酶、或其混合物。
54.权利要求51-53任一项的方法,其中步骤(a)和(b)是在同步糖化和发酵中同时进行的。
55.权利要求51-53任一项的方法,其中所述物质是醇、有机酸、酮、氨基酸、或气体。
56.权利要求51-55任一项的方法,其中所述纤维素分解酶组合物和/或所述融合蛋白或其构件为含有或不含细胞的发酵液的形式。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US83251106P | 2006-07-21 | 2006-07-21 | |
US60/832,511 | 2006-07-21 | ||
PCT/US2007/074038 WO2008057637A2 (en) | 2006-07-21 | 2007-07-20 | Methods of increasing secretion of polypeptides having biological activity |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101516906A true CN101516906A (zh) | 2009-08-26 |
CN101516906B CN101516906B (zh) | 2013-11-06 |
Family
ID=39365161
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2007800352244A Expired - Fee Related CN101516906B (zh) | 2006-07-21 | 2007-07-20 | 提高具有生物学活性之多肽的分泌的方法 |
Country Status (8)
Country | Link |
---|---|
US (4) | US8546106B2 (zh) |
EP (1) | EP2046819B1 (zh) |
CN (1) | CN101516906B (zh) |
BR (1) | BRPI0714870A2 (zh) |
CA (1) | CA2658610A1 (zh) |
DK (1) | DK2046819T3 (zh) |
ES (1) | ES2538360T3 (zh) |
WO (1) | WO2008057637A2 (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102695720A (zh) * | 2009-09-30 | 2012-09-26 | 诺维信股份有限公司 | 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸 |
WO2016082305A1 (en) | 2014-11-27 | 2016-06-02 | Wilmar (Shanghai) Biotechnology Research & Development Center Co., Ltd | Methods for recombinant expression of beta-glucosidase gene |
CN107287250A (zh) * | 2009-12-23 | 2017-10-24 | 丹尼斯科美国公司 | 提高同步糖化发酵反应效率的方法 |
CN111500599A (zh) * | 2014-05-16 | 2020-08-07 | 中央研究院 | 用以制备虾红素的重组多核苷酸序列及其应用 |
CN113166746A (zh) * | 2018-11-13 | 2021-07-23 | 生化酶股份有限公司 | 融合蛋白 |
CN113215135A (zh) * | 2021-06-17 | 2021-08-06 | 福建中烟工业有限责任公司 | 一种内切葡聚糖酶在卷烟原料改良中的应用 |
CN114317304A (zh) * | 2021-12-21 | 2022-04-12 | 浙江工业大学 | 酿酒酵母产绿原酸工程菌株的构建方法及其应用 |
CN114606143A (zh) * | 2020-12-08 | 2022-06-10 | 青岛蔚蓝康成生物科技有限公司 | 一种高产鼠李糖苷酶的里氏木霉突变菌株及其应用 |
Families Citing this family (173)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2012205191B2 (en) * | 2007-05-31 | 2013-03-21 | Novozymes, Inc. | Compositions for degrading cellulosic material |
CA2709490A1 (en) | 2007-12-19 | 2009-07-09 | Novozymes A/S | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
CN101981200A (zh) | 2008-03-27 | 2011-02-23 | 诺维信公司 | 从含木素纤维素材料产生发酵产物 |
US20110165617A1 (en) | 2008-09-30 | 2011-07-07 | Novozymes North America, Inc. | Enzymatic Hydrolysis Of Pretreated Lignocellulose-Containing Material With Distillers Dried Grains |
EP2356136A1 (en) | 2008-11-10 | 2011-08-17 | Novozymes Inc. | Polypeptides having feruloyl esterase activity and polynucleotides encoding same |
CA2745760A1 (en) | 2008-12-04 | 2010-06-10 | Novozymes A/S | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
WO2010078391A2 (en) | 2008-12-30 | 2010-07-08 | Novozymes North America, Inc. | Improvement of enzymatic hydrolysis of pretreated lignocellulose-containing material with dissolved air flotation sludge |
WO2010078392A2 (en) | 2008-12-31 | 2010-07-08 | Novozymes North America, Inc. | Processes of producing fermentation products |
WO2010088463A2 (en) * | 2009-01-30 | 2010-08-05 | Novozymes, Inc. | Polypeptides having expansin activity and polynucleotides encoding same |
BRPI1013483B1 (pt) | 2009-03-24 | 2019-04-24 | Novozymes A/S | Construção de ácido nucleico, vetor de expressão recombinante, célula hospedeira microbiana transgênica, métodos para produzir o polipeptídeo, para degradar um xilano acetilado e para produzir um produto de fermentação, e, composição |
WO2010129287A2 (en) | 2009-04-27 | 2010-11-11 | The Board Of Trustees Of The University Of Illinois | Hemicellulose-degrading enzymes |
US8278507B2 (en) | 2009-06-02 | 2012-10-02 | Novozymes, Inc. | Polypeptides having cellobiohydrolase activity and polynucleotides encoding same |
CN102471759A (zh) | 2009-06-30 | 2012-05-23 | 诺维信公司 | 生物质水解方法 |
EP2451957B1 (en) | 2009-07-07 | 2017-11-15 | Novozymes Inc. | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
DK2478096T3 (en) | 2009-09-17 | 2017-08-28 | Novozymes Inc | POLYPEPTIDES WITH CELLULOLYTIC IMPROVING ACTIVITY AND POLYNUCLEOTIDES CODING THEM |
EP2478095A1 (en) | 2009-09-18 | 2012-07-25 | Novozymes Inc. | Polypeptides having beta-glucosidase activity and polynucleotides encoding same |
BR112012006982B1 (pt) | 2009-09-29 | 2021-12-21 | Novozymes, Inc. | Célula hospedeira microbiana transgênica, métodos para produzir um polipeptídeo, para produzir um mutante de uma célula precursora, para inibir a expressão de um polipeptídeo, para produzir uma proteína, para degradar ou converter um material celulósico, para produzir um produto de fermentação, para fermentar um material celulósico, construções de ácido nucleico, vetor de expressão, polipeptídeo isolado tendo atividade intensificadora celulolítica, polinucleotídeo isolado que codifica o mesmo, e, composição detergente |
WO2011041405A1 (en) | 2009-09-29 | 2011-04-07 | Novozymes, Inc. | Polypeptides having xylanase activity and polynucleotides encoding same |
WO2011039319A1 (en) | 2009-09-30 | 2011-04-07 | Novozymes A/S | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
WO2011057086A1 (en) | 2009-11-06 | 2011-05-12 | Novozymes, Inc. | Polypeptides having cellobiohydrolase activity and polynucleotides encoding same |
EP2496692B1 (en) | 2009-11-06 | 2016-03-16 | Novozymes, Inc. | Polypeptides having xylanase activity and polynucleotides encoding same |
US20130040354A1 (en) | 2010-01-29 | 2013-02-14 | Novozymes A/S | Biogas Production Process With Enzymatic Pre-Treatment |
ES2636216T3 (es) | 2010-03-30 | 2017-10-05 | Novozymes North America, Inc. | Procesos de producción de un producto de fermentación |
BR112012020503A2 (pt) | 2010-03-31 | 2015-09-15 | Novozymes Inc | variante isolado de celobioidrolase precursor, polipeptídeo isolado, construção de ácido nucleico, vetor de expressão, célula hospedeira, método de produzir um variante de celobioidrolas precursor, métodos para obter o variante, para degradar variante de celobioidrolase precursor, métodos para obter o variante, para degradar ou converter um material celulósico, poara produzir um produto de fermentação e de fermentar um material celulósico, e, composição de enzima. |
DK2588604T3 (en) | 2010-06-30 | 2016-09-26 | Novozymes Inc | Polypeptides having beta-glucosidase activity and polynucleotides encoding them |
DK2591119T4 (da) | 2010-07-07 | 2022-12-12 | Novozymes North America Inc | Fermenteringsproces |
WO2012012590A2 (en) | 2010-07-23 | 2012-01-26 | Novozymes A/S | Processes for producing fermentation products |
EP2611901B1 (en) | 2010-08-30 | 2016-05-11 | Novozymes A/S | Polypeptides having beta-glucosidase activity, beta-xylosidase activity, or beta-glucosidase and beta-xylosidase activity and polynucleotides encoding same |
US8624082B2 (en) | 2010-08-30 | 2014-01-07 | Novozymes A/S | Polypeptides having xylanase activity and polynucleotides encoding same |
US20130212746A1 (en) | 2010-08-30 | 2013-08-15 | Novoyzmes A/S | Polypeptides Having Hemicellulolytic Activity And Polynucleotides Encoding Same |
WO2012030844A1 (en) | 2010-08-30 | 2012-03-08 | Novozymes A/S | Polypeptides having endoglucanase activity and polynucleotides encoding same |
WO2012030811A1 (en) | 2010-08-30 | 2012-03-08 | Novozymes A/S | Polypeptides having cellobiohydrolase activity and polynucleotides encoding same |
EP3470514A1 (en) | 2010-08-30 | 2019-04-17 | Novozymes A/S | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
US20130260423A1 (en) | 2010-10-26 | 2013-10-03 | Novozymes North America, Inc. | Methods of Saccharifying Sugar Cane Trash |
US9212354B2 (en) | 2010-11-04 | 2015-12-15 | Novozymes Inc. | Polypeptides having cellobiohydrolase activitiy and polynucleotides encoding same |
DK2638153T3 (en) | 2010-11-12 | 2017-10-16 | Novozymes Inc | POLYPEPTIDES WITH ENDOGLUCANASE ACTIVITY AND POLYNUCLEOTIDES CODING THEM |
US8927235B2 (en) | 2010-12-06 | 2015-01-06 | Novozymes A/S | Methods of hydrolyzing oligomers in hemicellulosic liquor |
CN103261420B (zh) * | 2010-12-16 | 2016-01-20 | 诺维信股份有限公司 | 用于在真菌细胞中表达基因的启动子 |
EP2661499A1 (en) | 2011-01-04 | 2013-11-13 | Novozymes A/S | Process for producing biogas from pectin and lignocellulose containing material |
WO2012103350A1 (en) | 2011-01-26 | 2012-08-02 | Novozymes A/S | Polypeptides having cellobiohydrolase activity and polynucleotides encoding same |
WO2012103288A1 (en) | 2011-01-26 | 2012-08-02 | Novozymes A/S | Polypeptides having cellobiohydrolase activity and polynucleotides encoding same |
CN103517985B (zh) | 2011-01-26 | 2016-12-07 | 诺维信公司 | 具有纤维二糖水解酶活性的多肽及编码该多肽的多核苷酸 |
EP2668268B1 (en) | 2011-01-26 | 2017-05-31 | Novozymes A/S | Polypeptides having cellobiohydrolase activity and polynucleotides encoding same |
WO2012103322A1 (en) | 2011-01-26 | 2012-08-02 | Novozymes A/S | Polypeptides having endoglucanase activity and polynucleotides encoding same |
CN103459605B (zh) | 2011-01-31 | 2016-08-24 | 诺维信北美公司 | 用于酶法精制经预处理的纤维素材料以供糖化的工艺 |
CN103384678B (zh) | 2011-02-23 | 2017-01-18 | 诺维信股份有限公司 | 具有纤维素水解增强活性的多肽及其编码多核苷酸 |
EP3339442B1 (en) | 2011-03-09 | 2022-05-11 | Novozymes A/S | Methods of increasing the cellulolytic enhancing activity of a polypeptide |
US9409958B2 (en) | 2011-03-10 | 2016-08-09 | Novozymes, Inc. | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
DK2689011T3 (en) | 2011-03-25 | 2018-01-22 | Novozymes As | PROCEDURE FOR DEGRADATION OR CONVERSION OF CELLULOSE-SUBSTANCING MATERIAL |
US9410136B2 (en) | 2011-03-31 | 2016-08-09 | Novozymes, Inc. | Methods for enhancing the degradation or conversion of cellulosic material |
US20140080182A1 (en) | 2011-03-31 | 2014-03-20 | Novozymes, Inc. | Cellulose Binding Domain Variants and Polynucleotides Encoding Same |
US9926547B2 (en) | 2011-04-28 | 2018-03-27 | Novozymes, Inc. | Polypeptides having endoglucanase activity and polynucleotides encoding same |
US9624518B2 (en) | 2011-04-29 | 2017-04-18 | Novozymes, Inc. | Methods for enhancing the degradation or conversion of cellulosic material |
WO2012159009A1 (en) | 2011-05-19 | 2012-11-22 | Novozymes, Inc. | Methods for enhancing the degradation of cellulosic material with chitin binding proteins |
EP2710132A1 (en) | 2011-05-19 | 2014-03-26 | Novozymes, Inc. | Methods for enhancing the degradation of cellulosic material with chitin binding proteins |
US20140106427A1 (en) | 2011-06-28 | 2014-04-17 | Novozymes A/S | Biogas From Enzyme-Treated Bagasse |
DK2734633T3 (da) | 2011-07-22 | 2019-06-11 | Novozymes North America Inc | Fremgangsmåder til forbehandling af celluloseholdigt materiale og forbedring af hydrolyse deraf |
DK2739728T3 (en) | 2011-08-04 | 2017-10-16 | Novozymes As | Polypeptides with endoglucanase activity and polynucleotides encoding them |
CN108823184B (zh) | 2011-08-04 | 2022-04-05 | 诺维信公司 | 具有木聚糖酶活性的多肽及其编码多核苷酸 |
BR112014004188A2 (pt) | 2011-08-24 | 2017-03-21 | Novozymes Inc | método para obter transformantes positivos de uma célula hospedeira fúngica filamentosa, célula hospedeira fúngica filamentosa, método para produzir múltiplos polipeptídeos recombinantes, e, construto em tandem |
BR112014004190A2 (pt) | 2011-08-24 | 2017-03-01 | Novozymes Inc | método para construir uma cepa fúngida filamentosa, cepa fúngida filamentosa, método para produzir múltiplos polipeptídeos recombinantes, e, construto em tandem |
WO2013039776A1 (en) | 2011-09-13 | 2013-03-21 | Novozymes North America, Inc. | Methods of hydrolyzing and fermenting cellulosic material |
WO2013043910A1 (en) | 2011-09-20 | 2013-03-28 | Novozymes A/S | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
DK2748313T3 (en) | 2011-09-23 | 2016-07-25 | Novozymes As | Methods for hydrolysis of acetylated cellulosic material |
CN103930438A (zh) | 2011-09-30 | 2014-07-16 | 诺维信股份有限公司 | 具有β-葡糖苷酶活性的嵌合多肽和对其进行编码的多核苷酸 |
US10308921B2 (en) | 2011-10-31 | 2019-06-04 | Novozymes, Inc. | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
US9708591B2 (en) | 2011-11-18 | 2017-07-18 | Novozymes Inc. | Polypeptides having endoglucanase activity and polynucleotides encoding same |
EP2780449B1 (en) | 2011-11-18 | 2018-04-11 | Novozymes, Inc. | Polypeptides having beta-glucosidase activity, beta-xylosidase activity, or beta-glucosidase and beta-xylosidase activity and polynucleotides encoding same |
BR112014012165A2 (pt) | 2011-11-21 | 2020-06-23 | Novozymes, Inc. | Variante de um polipeptídeo gh61, polinucleotídeo isolado, célula hospedeira recombinante, método para produção de uma variante de um polipeptídeo gh61, processos para degradação ou conversão de um material celulósico, para produção de um produto de fermentação, e para fermentação de um material celulósico, composição enzimática, formulação de caldo completo, ou composição de cultura celular, composição detergente, e método de limpeza ou lavagem de uma superfície dura ou roupa. |
DK2782998T3 (en) | 2011-11-22 | 2018-04-16 | Novozymes Inc | POLYPEPTIDES WITH BETA-XYLOSIDASE ACTIVITY AND POLYNUCLEOTIDES CODING THEM |
DK2785732T3 (en) | 2011-12-01 | 2017-06-19 | Novozymes Inc | POLYPEPTIDES WITH BETA-XYLOSIDASE ACTIVITY AND POLYNUCLEOTIDES CODING THEM |
WO2013083801A2 (en) | 2011-12-09 | 2013-06-13 | Novozymes A/S | Biogas from substrates comprising animal manure and enzymes |
EP2791330B1 (en) | 2011-12-16 | 2017-07-26 | Novozymes, Inc. | Polypeptides having laccase activity and polynucleotides encoding same |
BR112014014697A2 (pt) | 2011-12-19 | 2020-10-27 | Novozymes, Inc. | polipeptídeo isolado, composição, polinucleotídeo isolado, construto de ácido nucleico ou vetor de expressão, célula hospedeira recombinante, métodos para produzir um polipeptídeo e uma proteína, para gerar oxigênio molecular, e para remover peróxido de hidrogênio do tecido, processos para degradar ou converter um material celulósico, e para produzir um produto de fermentação, e, formulação de caldo integral ou composição de cultura de células |
CN104768391A (zh) | 2011-12-19 | 2015-07-08 | 诺维信公司 | 用于增加纤维素材料的消化率的方法和组合物 |
CA2878019A1 (en) | 2011-12-20 | 2013-06-27 | Novozymes, Inc. | Cellobiohydrolase variants and polynucleotides encoding same |
WO2013096652A1 (en) | 2011-12-21 | 2013-06-27 | Novozymes, Inc. | Methods for determining the degradation of a biomass material |
CA2862703A1 (en) | 2012-03-26 | 2013-10-03 | Novozymes North America, Inc. | Methods of preconditioning cellulosic material |
EP2859110B1 (en) | 2012-03-30 | 2022-10-26 | Novozymes North America, Inc. | Processes of producing fermentation products |
ES2935920T3 (es) | 2012-03-30 | 2023-03-13 | Novozymes North America Inc | Procesos de elaboración de productos de fermentación |
CN104245929A (zh) | 2012-04-23 | 2014-12-24 | 诺维信公司 | 具有α-葡糖醛酸糖苷酶活性的多肽以及编码其的多核苷酸 |
DK2841570T3 (en) | 2012-04-23 | 2018-03-12 | Novozymes As | POLYPEPTIDES WITH GLUCURONYL STERASE ACTIVITY AND POLYNUCLEOTIDES CODING THEM |
WO2013163590A2 (en) | 2012-04-27 | 2013-10-31 | Novozymes, Inc. | Gh61 polypeptide variants and polynucleotides encoding same |
CN104427869A (zh) | 2012-07-06 | 2015-03-18 | 诺维信公司 | 用于酶回收的液体酶组合物及方法 |
EP2898068A2 (en) | 2012-09-19 | 2015-07-29 | Novozymes, Inc. | Methods for enhancing the degradation or conversion of cellulosic material |
DK2903412T3 (da) | 2012-10-08 | 2019-12-16 | Novozymes As | Polypeptider med cellulolyseforbedrende aktivitet og polynukleotider, som koder for dem |
US20150275194A1 (en) | 2012-10-24 | 2015-10-01 | Novozymes A/S | Polypeptides Having Cellulolytic Enhancing Activity And Polynucleotides Encoding Same |
JP2015533292A (ja) * | 2012-10-31 | 2015-11-24 | ダニスコ・ユーエス・インク | マグナポルテ・グリセア(Magnaporthegrisea)由来のβ−グルコシダーゼ |
CA2892031A1 (en) | 2012-11-27 | 2014-06-05 | Novozymes A/S | Milling process |
DK2925790T3 (da) | 2012-11-27 | 2021-10-11 | Novozymes As | Formalingsproces |
US9765373B2 (en) | 2012-12-14 | 2017-09-19 | Novozymes A/S | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
WO2014099798A1 (en) | 2012-12-19 | 2014-06-26 | Novozymes A/S | Polypeptides having cellulolytic enhancinc activity and polynucleotides encoding same |
CN105074001A (zh) | 2013-02-21 | 2015-11-18 | 诺维信公司 | 糖化和发酵纤维素材料的方法 |
EP2964760B1 (en) | 2013-03-08 | 2021-05-12 | Novozymes A/S | Cellobiohydrolase variants and polynucleotides encoding same |
EP3063282B1 (en) | 2013-09-11 | 2020-03-25 | Novozymes A/S | Processes for producing fermentation products |
US9938552B2 (en) | 2013-11-01 | 2018-04-10 | Novozymes A/S | Methods of saccharifying and fermenting a cellulosic material |
US10647947B2 (en) | 2014-06-04 | 2020-05-12 | Novozymes A/S | Detergent composition |
EP3177719A4 (en) | 2014-08-08 | 2018-04-04 | Xyleco, Inc. | Aglycosylated enzyme and uses thereof |
EP3191597A1 (en) | 2014-08-21 | 2017-07-19 | Novozymes A/S | Process for saccharifying cellulosic material under oxygen addition |
DK3183352T3 (da) | 2014-08-22 | 2021-06-14 | Cysbio Aps | Fremgangsmåde til fremstilling af et fermenteringsprodukt ud fra et lignocelluloseholdigt materiale |
BR112017004251A2 (pt) | 2014-09-05 | 2017-12-12 | Novozymes As | variantes de módulos de ligação a carboidrato e polinucleotídeos que os codificam |
CN107109346B (zh) | 2014-09-23 | 2021-07-20 | 诺维信公司 | 用于生产乙醇的方法和发酵生物 |
CU20170036A7 (es) * | 2014-09-26 | 2017-09-06 | Xyleco Inc | Mezclas que comprenden una pluralidad de polipéptidos con actividad degradante de biomasa y métodos para producir las mismas |
WO2016120298A1 (en) | 2015-01-28 | 2016-08-04 | Dsm Ip Assets B.V. | Process for enzymatic hydrolysis of lignocellulosic material and fermentation of sugars |
CA2973302C (en) | 2015-01-28 | 2022-10-25 | Dsm Ip Assets B.V. | Process for enzymatic hydrolysis of lignocellulosic material and fermentation of sugars |
DK3640336T3 (da) | 2015-01-28 | 2022-06-27 | Dsm Ip Assets Bv | Fremgangsmåde til enzymatisk hydrolyse af lignocellulosemateriale og fermentering af sukre |
WO2016138167A2 (en) | 2015-02-24 | 2016-09-01 | Novozymes A/S | Cellobiohydrolase variants and polynucleotides encoding same |
US10308963B2 (en) | 2015-02-27 | 2019-06-04 | Novozymes A/S | Processes of producing ethanol using a fermenting organism |
DK3268482T3 (da) | 2015-03-09 | 2020-03-09 | Novozymes As | Fremgangsmåder til indføring af en flerhed af ekspressionskonstruktioner i en eukaryot celle |
TN2017000318A1 (en) | 2015-03-12 | 2019-01-16 | Beta Renewable Spa | Multi-stage enzymatic hydrolysis of lignocellulosic biomass |
EP3067428A1 (en) | 2015-03-12 | 2016-09-14 | BETA RENEWABLES S.p.A. | A process for producing a hydrolyzed mixture from a pre-treated ligno-cellulosic slurry comprising a slurry liquid and slurry solids |
BR112017019331A2 (pt) | 2015-03-12 | 2018-06-05 | Beta Renewables Spa | processos para sacarificação de múltiplos estágios de um material lignocelulósico e para melhorar um rendimento de glicose ou xilose de sacarificação de um material lignocelulósico em um reator de tanque continuamente agitado |
BR112017018461A2 (pt) | 2015-03-12 | 2018-04-17 | Novozymes As | processos para hidrólise multiestágio, para produção de um produto de fermentação, e, para aumento de rendimento de açúcar de hidrólise. |
WO2016169892A1 (en) | 2015-04-20 | 2016-10-27 | Dsm Ip Assets B.V. | Process for enzymatic hydrolysis of lignocellulosic material and fermentation of sugars |
WO2016169893A1 (en) | 2015-04-20 | 2016-10-27 | Dsm Ip Assets B.V. | Whole fermentation broth |
WO2016205127A1 (en) | 2015-06-18 | 2016-12-22 | Novozymes A/S | Polypeptides having trehalase activity and the use thereof in process of producing fermentation products |
WO2016207144A1 (en) | 2015-06-22 | 2016-12-29 | Dsm Ip Assets B.V. | Process for enzymatic hydrolysis of lignocellulosic material and fermentation of sugars |
CN108350044B (zh) | 2015-09-22 | 2022-05-24 | 诺维信公司 | 具有纤维二糖水解酶活性的多肽以及对其进行编码的多核苷酸 |
EP3394275A1 (en) | 2015-12-22 | 2018-10-31 | Novozymes A/S | Process of extracting oil from thin stillage |
CN114368888A (zh) | 2015-12-23 | 2022-04-19 | 诺维信公司 | 用于用酶处理增强污泥的脱水性能的方法 |
EP3469090A1 (en) | 2016-06-09 | 2019-04-17 | DSM IP Assets B.V. | Seed train for large scale enzyme production |
WO2018019948A1 (en) | 2016-07-29 | 2018-02-01 | Dsm Ip Assets B.V. | Polypeptides having cellulolytic enhancing activity and uses thereof |
WO2018098381A1 (en) | 2016-11-23 | 2018-05-31 | Novozymes A/S | Improved yeast for ethanol production |
BR112019010355B1 (pt) | 2016-11-24 | 2024-03-05 | Dsm Ip Assets B.V. | Composição de enzimas |
CA3043435A1 (en) | 2016-11-24 | 2018-05-31 | Dsm Ip Assets B.V. | Enzyme compositions with improved hydrolysis performance |
EP3551759A1 (en) | 2016-12-06 | 2019-10-16 | Novozymes A/S | Improved processes for production of ethanol from xylose-containing cellulosic substrates using engineered yeast strains |
WO2018185071A1 (en) | 2017-04-03 | 2018-10-11 | Dsm Ip Assets B.V. | Process for enzymatic hydrolysis of lignocellulosic material and fermentation of sugars |
US11091753B2 (en) | 2017-05-31 | 2021-08-17 | Novozymes A/S | Xylose fermenting yeast strains and processes thereof for ethanol production |
AU2018275794A1 (en) | 2017-06-02 | 2019-12-05 | Novozymes A/S | Improved yeast for ethanol production |
EP4015524A1 (en) | 2017-06-28 | 2022-06-22 | Novozymes A/S | Polypeptides having trehalase activity and polynucleotides encoding same |
CN111094562A (zh) | 2017-08-08 | 2020-05-01 | 诺维信公司 | 具有海藻糖酶活性的多肽及其在产生发酵产物的方法中的用途 |
EP3682014A1 (en) | 2017-09-15 | 2020-07-22 | Novozymes A/S | Enzyme blends and processes for improving the nutritional quality of animal feed |
CN107513549A (zh) * | 2017-09-29 | 2017-12-26 | 天津大学 | 一种复合霉菌降解玉米秸秆的方法 |
BR112020005439A2 (pt) | 2017-10-09 | 2020-09-24 | Dsm Ip Assets B.V. | processo para hidrólise enzimática de material lignocelulósico e fermentação de açúcares |
EP3701037A1 (en) | 2017-10-23 | 2020-09-02 | Novozymes A/S | Processes for reducing lactic acid in a biofuel fermentation system |
WO2019086370A1 (en) | 2017-10-30 | 2019-05-09 | Dsm Ip Assets B.V. | Process for enzymatic hydrolysis of lignocellulosic material and fermentation of sugars |
EP3704259A1 (en) | 2017-10-30 | 2020-09-09 | DSM IP Assets B.V. | Process for enzymatic hydrolysis of lignocellulosic material and fermentation of sugars |
CA3083854A1 (en) | 2017-12-22 | 2019-06-27 | Novozymes A/S | Wheat milling process and gh8 xylanases |
CN113286871A (zh) | 2018-01-29 | 2021-08-20 | 诺维信公司 | 用于乙醇生产的氮利用提高的微生物 |
CA3107124A1 (en) | 2018-02-15 | 2019-08-22 | Novozymes A/S | Improved yeast for ethanol production |
WO2019185681A1 (en) | 2018-03-28 | 2019-10-03 | Dsm Ip Assets B.V. | Enzyme composition |
EP3775189A1 (en) | 2018-03-28 | 2021-02-17 | DSM IP Assets B.V. | Enzyme composition |
WO2019219804A1 (en) | 2018-05-17 | 2019-11-21 | Dsm Ip Assets B.V. | Process for producing a polypeptide |
LT3802843T (lt) | 2018-05-30 | 2023-04-25 | Versalis S.P.A. | Cukrų gamybos iš angliavandenių medžiagos būdas |
BR112020024347A2 (pt) | 2018-05-31 | 2021-02-23 | Novozymes A/S | processos para aumentar o crescimento e a produtividade de levedura |
CN112601818A (zh) | 2018-07-25 | 2021-04-02 | 诺维信公司 | 用于生产乙醇的表达酶的酵母 |
WO2020058253A1 (en) | 2018-09-18 | 2020-03-26 | Dsm Ip Assets B.V. | Process for enzymatic hydrolysis of carbohydrate material and fermentation of sugars |
WO2020058249A1 (en) | 2018-09-18 | 2020-03-26 | Dsm Ip Assets B.V. | Process for enzymatic hydrolysis of carbohydrate material and fermentation of sugars |
WO2020058248A1 (en) | 2018-09-18 | 2020-03-26 | Dsm Ip Assets B.V. | Process for enzymatic hydrolysis of carbohydrate material and fermentation of sugars |
US11807889B2 (en) | 2018-10-08 | 2023-11-07 | Novozymes A/S | Yeast expressing a heterologous phospholipase for ethanol production |
CN112912511A (zh) | 2018-10-24 | 2021-06-04 | 帝斯曼知识产权资产管理有限公司 | 用于碳水化合物材料酶促水解和糖发酵的方法 |
BR112021014873A2 (pt) | 2019-01-31 | 2021-10-05 | Novozymes A/S | Polipeptídeo, combinação de enzimas, polinucleotídeo, construto de ácido nucleico ou vetor de expressão recombinante, célula hospedeira recombinante, método de produção de um polipeptídeo, e, processo de produção de um produto de fermentação |
EP3938525A1 (en) | 2019-03-12 | 2022-01-19 | DSM IP Assets B.V. | Process for producing a fermentation broth |
WO2021021458A1 (en) | 2019-07-26 | 2021-02-04 | Novozymes A/S | Microorganisms with improved nitrogen transport for ethanol production |
CA3144423A1 (en) | 2019-08-05 | 2021-02-11 | Kurt Creamer | Enzyme blends and processes for producing a high protein feed ingredient from a whole stillage byproduct |
BR112021026477A2 (pt) | 2019-08-06 | 2022-02-08 | Novozymes As | Célula hospedeira recombinante, métodos de produção de um produto de fermentação a partir de um material contendo amido ou contendo celulose, de produção do polipeptídeo maduro, de produção de um derivado de uma célula hospedeira recombinante e de produção de etanol, construto de ácido nucleico ou vetor de expressão, composição, e, uso de uma célula hospedeira recombinante |
US20220340943A1 (en) | 2019-09-10 | 2022-10-27 | Dsm Ip Assets B.V. | Enzyme composition |
EP4031661A1 (en) | 2019-09-16 | 2022-07-27 | Novozymes A/S | Polypeptides having beta-glucanase activity and polynucleotides encoding same |
AU2020402990A1 (en) | 2019-12-10 | 2022-06-09 | Novozymes A/S | Microorganism for improved pentose fermentation |
WO2021126966A1 (en) | 2019-12-16 | 2021-06-24 | Novozymes A/S | Processes for producing fermentation products |
EP4103709A2 (en) | 2020-02-10 | 2022-12-21 | Novozymes A/S | Polypeptides having alpha-amylase activity and polynucleotides encoding same |
WO2022013148A1 (en) | 2020-07-13 | 2022-01-20 | Dsm Ip Assets B.V. | Process for the production of biogas |
MX2023002490A (es) | 2020-09-04 | 2023-03-09 | Novozymes As | Organismo fermentador mejorado para la produccion de etanol. |
US20230399632A1 (en) | 2020-11-02 | 2023-12-14 | Novozymes A/S | Glucoamylase Variants and Polynucleotides Encoding Same |
CN112592849A (zh) * | 2020-12-14 | 2021-04-02 | 宁夏泰胜生物科技有限公司 | 利用兽疫链霉菌发酵生产高分子量透明质酸的培养基和培养方法 |
CN113201464B (zh) * | 2020-12-30 | 2023-01-20 | 广东省科学院生物工程研究所 | 一株产α-葡聚糖酶的毕赤酵母工程菌及其构建方法、培养方法与应用 |
BR112023020357A2 (pt) | 2021-04-06 | 2023-11-21 | Dsm Ip Assets Bv | Composição de enzima |
CA3213845A1 (en) | 2021-04-06 | 2022-10-13 | Dsm Ip Assets B.V. | Enzyme composition |
US20240182936A1 (en) | 2021-04-06 | 2024-06-06 | Dsm Ip Assets B.V. | Enzyme composition |
WO2022214460A1 (en) | 2021-04-08 | 2022-10-13 | Dsm Ip Assets B.V. | Process for the preparation of a sugar product and a fermentation product |
WO2022261003A1 (en) | 2021-06-07 | 2022-12-15 | Novozymes A/S | Engineered microorganism for improved ethanol fermentation |
WO2023225459A2 (en) | 2022-05-14 | 2023-11-23 | Novozymes A/S | Compositions and methods for preventing, treating, supressing and/or eliminating phytopathogenic infestations and infections |
WO2024064901A2 (en) | 2022-09-23 | 2024-03-28 | Novozymes A/S | Improved fermenting organism for ethanol production |
Family Cites Families (90)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB1296839A (zh) | 1969-05-29 | 1972-11-22 | ||
GB1372034A (en) | 1970-12-31 | 1974-10-30 | Unilever Ltd | Detergent compositions |
JPS5028515B2 (zh) | 1971-09-30 | 1975-09-16 | ||
GB1483591A (en) | 1973-07-23 | 1977-08-24 | Novo Industri As | Process for coating water soluble or water dispersible particles by means of the fluid bed technique |
GB1590432A (en) | 1976-07-07 | 1981-06-03 | Novo Industri As | Process for the production of an enzyme granulate and the enzyme granuate thus produced |
DK187280A (da) | 1980-04-30 | 1981-10-31 | Novo Industri As | Ruhedsreducerende middel til et fuldvaskemiddel fuldvaskemiddel og fuldvaskemetode |
DK263584D0 (da) | 1984-05-29 | 1984-05-29 | Novo Industri As | Enzymholdige granulater anvendt som detergentadditiver |
EP0218272B1 (en) | 1985-08-09 | 1992-03-18 | Gist-Brocades N.V. | Novel lipolytic enzymes and their use in detergent compositions |
EG18543A (en) | 1986-02-20 | 1993-07-30 | Albright & Wilson | Protected enzyme systems |
DK122686D0 (da) | 1986-03-17 | 1986-03-17 | Novo Industri As | Fremstilling af proteiner |
DE3750450T2 (de) | 1986-08-29 | 1995-01-05 | Novo Industri As | Enzymhaltiger Reinigungsmittelzusatz. |
NZ221627A (en) | 1986-09-09 | 1993-04-28 | Genencor Inc | Preparation of enzymes, modifications, catalytic triads to alter ratios or transesterification/hydrolysis ratios |
ATE125865T1 (de) | 1987-08-28 | 1995-08-15 | Novo Nordisk As | Rekombinante humicola-lipase und verfahren zur herstellung von rekombinanten humicola-lipasen. |
JPS6474992A (en) | 1987-09-16 | 1989-03-20 | Fuji Oil Co Ltd | Dna sequence, plasmid and production of lipase |
DE68924654T2 (de) | 1988-01-07 | 1996-04-04 | Novonordisk As | Spezifische Protease. |
DK6488D0 (da) | 1988-01-07 | 1988-01-07 | Novo Industri As | Enzymer |
JP3079276B2 (ja) | 1988-02-28 | 2000-08-21 | 天野製薬株式会社 | 組換え体dna、それを含むシュードモナス属菌及びそれを用いたリパーゼの製造法 |
DE68911131T2 (de) | 1988-03-24 | 1994-03-31 | Novonordisk As | Cellulosezubereitung. |
US5648263A (en) | 1988-03-24 | 1997-07-15 | Novo Nordisk A/S | Methods for reducing the harshness of a cotton-containing fabric |
GB8915658D0 (en) | 1989-07-07 | 1989-08-23 | Unilever Plc | Enzymes,their production and use |
US5110735A (en) | 1989-09-26 | 1992-05-05 | Midwest Research Institute | Thermostable purified endoglucanase from thermophilic bacterium acidothermus cellulolyticus |
US5536655A (en) | 1989-09-26 | 1996-07-16 | Midwest Research Institute | Gene coding for the E1 endoglucanase |
US5275944A (en) | 1989-09-26 | 1994-01-04 | Midwest Research Institute | Thermostable purified endoglucanas from acidothermus cellulolyticus ATCC 43068 |
JP3112937B2 (ja) | 1990-04-14 | 2000-11-27 | カリ―ヒエミー アクチエンゲゼルシヤフト | アルカリ性バチルスーリパーゼ、これをコード化するdna配列およびこのリパーゼを生産するバチルス |
WO1991017243A1 (en) | 1990-05-09 | 1991-11-14 | Novo Nordisk A/S | A cellulase preparation comprising an endoglucanase enzyme |
DK115890D0 (da) | 1990-05-09 | 1990-05-09 | Novo Nordisk As | Enzym |
JPH0427386A (ja) | 1990-05-24 | 1992-01-30 | Kao Corp | プロテアーゼ耐性セルラーゼ、これを産生する微生物及び該セルラーゼの製造法 |
DE69129988T2 (de) | 1990-09-13 | 1999-03-18 | Novo Nordisk As | Lipase-varianten |
DE69133352T2 (de) | 1990-10-05 | 2004-11-04 | Genencor International, Inc., Palo Alto | Methoden zur behandlung baumwolle-enthaltender fasern mit zellulase |
ES2174820T3 (es) | 1991-01-16 | 2002-11-16 | Procter & Gamble | Composiciones detergentes compactas con celulasa de alta actividad. |
DE69209500T2 (de) | 1991-04-30 | 1996-10-31 | Procter & Gamble | Gerüstsubstanzhaltige flüssigwaschmittel mit borsäure-polyolkomplex zur ptoteolytischen enzyminhibierung |
EP0511456A1 (en) | 1991-04-30 | 1992-11-04 | The Procter & Gamble Company | Liquid detergents with aromatic borate ester to inhibit proteolytic enzyme |
DE69226182T2 (de) | 1991-05-01 | 1999-01-21 | Novo Nordisk As | Stabilisierte enzyme und waschmittelzusammensetzungen |
DK72992D0 (da) | 1992-06-01 | 1992-06-01 | Novo Nordisk As | Enzym |
DK88892D0 (da) | 1992-07-06 | 1992-07-06 | Novo Nordisk As | Forbindelse |
DE69334295D1 (de) | 1992-07-23 | 2009-11-12 | Novo Nordisk As | MUTIERTE -g(a)-AMYLASE, WASCHMITTEL UND GESCHIRRSPÜLMITTEL |
WO1994007998A1 (en) | 1992-10-06 | 1994-04-14 | Novo Nordisk A/S | Cellulase variants |
EP0867504B2 (en) | 1993-02-11 | 2011-05-18 | Genencor International, Inc. | Oxidation-stable alpha-amylase |
KR950702240A (ko) | 1993-04-27 | 1995-06-19 | 한스 발터 라벤 | 세제로의 이용을 위한 새로운 리파제 변형체 |
DK52393D0 (zh) | 1993-05-05 | 1993-05-05 | Novo Nordisk As | |
WO1995002675A1 (en) * | 1993-07-12 | 1995-01-26 | Novo Nordisk A/S | A detergent composition comprising two cellulase components |
JP2859520B2 (ja) | 1993-08-30 | 1999-02-17 | ノボ ノルディスク アクティーゼルスカブ | リパーゼ及びそれを生産する微生物及びリパーゼ製造方法及びリパーゼ含有洗剤組成物 |
AU7853194A (en) | 1993-10-13 | 1995-05-04 | Novo Nordisk A/S | H2o2-stable peroxidase variants |
JPH07143883A (ja) | 1993-11-24 | 1995-06-06 | Showa Denko Kk | リパーゼ遺伝子及び変異体リパーゼ |
JP3081434B2 (ja) | 1994-01-24 | 2000-08-28 | 花王株式会社 | アルカリセルラーゼ |
AU1806795A (en) | 1994-02-22 | 1995-09-04 | Novo Nordisk A/S | A method of preparing a variant of a lipolytic enzyme |
ES2251717T3 (es) | 1994-03-08 | 2006-05-01 | Novozymes A/S | Nuevas celulasas alcalinas. |
CA2189441C (en) | 1994-05-04 | 2009-06-30 | Wolfgang Aehle | Lipases with improved surfactant resistance |
WO1995035381A1 (en) | 1994-06-20 | 1995-12-28 | Unilever N.V. | Modified pseudomonas lipases and their use |
WO1996000292A1 (en) | 1994-06-23 | 1996-01-04 | Unilever N.V. | Modified pseudomonas lipases and their use |
WO1996000787A1 (en) | 1994-06-30 | 1996-01-11 | Novo Nordisk Biotech, Inc. | Non-toxic, non-toxigenic, non-pathogenic fusarium expression system and promoters and terminators for use therein |
AU3604595A (en) | 1994-10-06 | 1996-05-02 | Novo Nordisk A/S | An enzyme and enzyme preparation with endoglucanase activity |
BE1008998A3 (fr) | 1994-10-14 | 1996-10-01 | Solvay | Lipase, microorganisme la produisant, procede de preparation de cette lipase et utilisations de celle-ci. |
CN1167503A (zh) | 1994-10-26 | 1997-12-10 | 诺沃挪第克公司 | 一种具有脂解活性的酶 |
AR000862A1 (es) | 1995-02-03 | 1997-08-06 | Novozymes As | Variantes de una ó-amilasa madre, un metodo para producir la misma, una estructura de adn y un vector de expresion, una celula transformada por dichaestructura de adn y vector, un aditivo para detergente, composicion detergente, una composicion para lavado de ropa y una composicion para la eliminacion del |
JPH08228778A (ja) | 1995-02-27 | 1996-09-10 | Showa Denko Kk | 新規なリパーゼ遺伝子及びそれを用いたリパーゼの製造方法 |
CN1182451A (zh) | 1995-03-17 | 1998-05-20 | 诺沃挪第克公司 | 新的内切葡聚糖酶 |
JP4307549B2 (ja) | 1995-07-14 | 2009-08-05 | ノボザイムス アクティーゼルスカブ | 脂肪分解活性を有する修飾された酵素 |
ES2221934T3 (es) | 1995-08-11 | 2005-01-16 | Novozymes A/S | Nuevas enzimas lipoliticas. |
US5763385A (en) | 1996-05-14 | 1998-06-09 | Genencor International, Inc. | Modified α-amylases having altered calcium binding properties |
EP0910627A1 (en) | 1996-06-28 | 1999-04-28 | Novo Nordisk A/S | A recombinant enzyme with dextranase activitiy |
US6403362B1 (en) * | 1996-07-24 | 2002-06-11 | Meiji Seika Kaisha, Ltd. | Systems for the mass production of proteins or peptides by microorganisms of the genus humicola |
WO1998008940A1 (en) | 1996-08-26 | 1998-03-05 | Novo Nordisk A/S | A novel endoglucanase |
CN100362100C (zh) | 1996-09-17 | 2008-01-16 | 诺沃奇梅兹有限公司 | 纤维素酶变体 |
AU730286B2 (en) | 1996-10-08 | 2001-03-01 | Novo Nordisk A/S | Diaminobenzoic acid derivatives as dye precursors |
AU4551097A (en) | 1996-10-11 | 1998-05-11 | Novo Nordisk A/S | Alpha-amylase fused to cellulose binding domain, for starch degradation |
EP0948610B1 (en) | 1996-11-04 | 2011-05-25 | Novozymes A/S | Subtilase variants and compositions |
US6300116B1 (en) | 1996-11-04 | 2001-10-09 | Novozymes A/S | Modified protease having improved autoproteolytic stability |
US6159731A (en) | 1997-02-12 | 2000-12-12 | Massachusetts Institute Of Technology | Daxx, a Fas-binding protein that activates JNK and apoptosis |
AU7564198A (en) | 1998-05-01 | 1999-11-23 | Procter & Gamble Company, The | Laundry detergent and/or fabric care compositions comprising a modified cellulase |
DE69932345T2 (de) | 1998-10-26 | 2007-07-19 | Novozymes A/S | Erstellung und durchmusterung von interessierenden dna-banken in zellen von filamentösen pilzen |
WO2000056900A2 (en) | 1999-03-22 | 2000-09-28 | Novo Nordisk Biotech, Inc. | Promoter sequences derived from fusarium venenatum and uses thereof |
CA2372594A1 (en) | 1999-05-19 | 2000-11-23 | Midwest Research Institute | E1 endoglucanase variants y245g, y82r and w42r |
ES2166316B1 (es) | 2000-02-24 | 2003-02-16 | Ct Investig Energeticas Ciemat | Procedimiento de produccion de etanol a partir de biomasa lignocelulosica utilizando una nueva levadura termotolerante. |
KR20020026456A (ko) * | 2000-04-13 | 2002-04-10 | 에말파브 마크 아론 | 사상균에서 발현된 dna 라이브러리의 고산출량 스크리닝 |
AU2002223504A1 (en) | 2000-11-17 | 2002-05-27 | Novozymes A/S | Heterologous expression of taxanes |
JP4287149B2 (ja) | 2001-02-07 | 2009-07-01 | ノボザイムス アクティーゼルスカブ | リパーゼ変異体 |
AU2002316785A1 (en) | 2001-05-18 | 2002-12-03 | Novozymes A/S | Polypeptides having cellobiase activity and polynucleotides encoding same |
JP2006512891A (ja) * | 2002-04-18 | 2006-04-20 | ジェネンコー・インターナショナル・インク | 糸状菌における機能性抗体の生産 |
CN1836038B (zh) * | 2003-05-02 | 2011-04-06 | 诺维信股份有限公司 | 制备分泌型多肽的方法 |
ATE471370T1 (de) | 2003-05-02 | 2010-07-15 | Novozymes Inc | Varianten von beta-glukosidasen |
DK1702981T3 (da) * | 2003-12-08 | 2011-10-17 | Meiji Seika Pharma Co Ltd | Tensid-tollerant cellulase og fremgangsmåde til omdannelse deraf |
EP1709163B1 (en) | 2004-01-16 | 2010-11-24 | Novozymes, Inc. | Methods for degrading lignocellulosic materials |
ES2391826T3 (es) | 2004-01-30 | 2012-11-30 | Novozymes, Inc. | Polipéptidos con actividad de mejora celulolítica y polinucleótidos que los codifican |
EP1733033B1 (en) | 2004-02-06 | 2012-06-20 | Novozymes Inc. | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
WO2005093050A2 (en) | 2004-03-25 | 2005-10-06 | Genencor International, Inc. | Cellulase fusion protein and heterologous cellulase fusion construct encoding the same |
EP1781785B1 (en) | 2004-07-20 | 2010-11-10 | Novozymes, Inc. | Methods of producing mutant polynucleotides |
AU2006337184B2 (en) | 2005-09-30 | 2012-08-16 | Novozymes, Inc. | Methods for enhancing the degradation or conversion of cellulosic material |
US7361487B2 (en) | 2006-04-13 | 2008-04-22 | Ab Enzymes Oy | Enzyme fusion proteins and their use |
CA2689910A1 (en) * | 2007-05-31 | 2008-12-11 | Novozymes, Inc. | Compositions for degrading cellulosic material |
-
2007
- 2007-07-20 BR BRPI0714870-4A patent/BRPI0714870A2/pt not_active IP Right Cessation
- 2007-07-20 DK DK07868319.0T patent/DK2046819T3/da active
- 2007-07-20 CN CN2007800352244A patent/CN101516906B/zh not_active Expired - Fee Related
- 2007-07-20 WO PCT/US2007/074038 patent/WO2008057637A2/en active Application Filing
- 2007-07-20 US US11/781,151 patent/US8546106B2/en not_active Expired - Fee Related
- 2007-07-20 CA CA002658610A patent/CA2658610A1/en not_active Abandoned
- 2007-07-20 ES ES07868319.0T patent/ES2538360T3/es active Active
- 2007-07-20 EP EP07868319.0A patent/EP2046819B1/en not_active Not-in-force
-
2013
- 2013-09-11 US US14/024,292 patent/US8735549B2/en not_active Expired - Fee Related
-
2014
- 2014-05-16 US US14/279,624 patent/US8871486B2/en not_active Expired - Fee Related
- 2014-10-27 US US14/524,793 patent/US9006409B2/en not_active Expired - Fee Related
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102695720A (zh) * | 2009-09-30 | 2012-09-26 | 诺维信股份有限公司 | 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸 |
CN102695720B (zh) * | 2009-09-30 | 2018-02-16 | 诺维信股份有限公司 | 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸 |
CN107287250A (zh) * | 2009-12-23 | 2017-10-24 | 丹尼斯科美国公司 | 提高同步糖化发酵反应效率的方法 |
CN111500599A (zh) * | 2014-05-16 | 2020-08-07 | 中央研究院 | 用以制备虾红素的重组多核苷酸序列及其应用 |
WO2016082305A1 (en) | 2014-11-27 | 2016-06-02 | Wilmar (Shanghai) Biotechnology Research & Development Center Co., Ltd | Methods for recombinant expression of beta-glucosidase gene |
US9969995B2 (en) | 2014-11-27 | 2018-05-15 | Wilmar (Shanghai) Biotechnology Research & Development Center Co., Ltd. | Methods for recombinant expression of beta-glucosidase gene |
CN113166746A (zh) * | 2018-11-13 | 2021-07-23 | 生化酶股份有限公司 | 融合蛋白 |
CN114606143A (zh) * | 2020-12-08 | 2022-06-10 | 青岛蔚蓝康成生物科技有限公司 | 一种高产鼠李糖苷酶的里氏木霉突变菌株及其应用 |
CN113215135A (zh) * | 2021-06-17 | 2021-08-06 | 福建中烟工业有限责任公司 | 一种内切葡聚糖酶在卷烟原料改良中的应用 |
CN114317304A (zh) * | 2021-12-21 | 2022-04-12 | 浙江工业大学 | 酿酒酵母产绿原酸工程菌株的构建方法及其应用 |
CN114317304B (zh) * | 2021-12-21 | 2024-03-15 | 浙江工业大学 | 酿酒酵母产绿原酸工程菌株的构建方法及其应用 |
Also Published As
Publication number | Publication date |
---|---|
CA2658610A1 (en) | 2008-05-15 |
DK2046819T3 (da) | 2015-06-22 |
WO2008057637A3 (en) | 2008-10-09 |
US8735549B2 (en) | 2014-05-27 |
US8546106B2 (en) | 2013-10-01 |
BRPI0714870A2 (pt) | 2013-05-28 |
US8871486B2 (en) | 2014-10-28 |
US9006409B2 (en) | 2015-04-14 |
US20090298126A1 (en) | 2009-12-03 |
CN101516906B (zh) | 2013-11-06 |
EP2046819A2 (en) | 2009-04-15 |
US20140248671A1 (en) | 2014-09-04 |
ES2538360T3 (es) | 2015-06-19 |
WO2008057637A2 (en) | 2008-05-15 |
WO2008057637A9 (en) | 2008-07-17 |
US20140011256A1 (en) | 2014-01-09 |
US20150044756A1 (en) | 2015-02-12 |
EP2046819B1 (en) | 2015-03-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101516906B (zh) | 提高具有生物学活性之多肽的分泌的方法 | |
CN101970651B (zh) | 用于降解纤维素材料的组合物 | |
CN102770534B (zh) | 具有纤维素分解增强活性的多肽及编码其的多核苷酸 | |
US8629326B2 (en) | Polypeptides having beta-glucosidase activity and polynucleotides encoding same | |
CN101874109B (zh) | 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸 | |
CN103282489B (zh) | 具有纤维素分解增强活性的多肽变体及其编码多核苷酸 | |
CN103237891B (zh) | 具有纤维素分解增强活性的多肽变体及其编码多核苷酸 | |
CN101784659A (zh) | 具有纤维素分解增强活性的多肽和编码它的多核苷酸 | |
CN103797126A (zh) | 用于增强纤维素材料的降解或转化的方法 | |
CA2689910A1 (en) | Compositions for degrading cellulosic material | |
CN108165542A (zh) | 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸 | |
CN101910405A (zh) | 降低鞣质对酶促水解纤维素材料的抑制作用的方法 | |
CN103958672A (zh) | Gh61多肽变体以及编码所述变体的多核苷酸 | |
CN101910406A (zh) | 减少氧化还原活性金属离子对纤维素材料酶水解抑制作用的方法 | |
CN104245926A (zh) | Gh61多肽变体以及编码其的多核苷酸 | |
US8586828B2 (en) | Polypeptides having beta-glucosidase activity and polynucleotides encoding same |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20131106 Termination date: 20170720 |
|
CF01 | Termination of patent right due to non-payment of annual fee |