CN101516906A - 提高具有生物学活性之多肽的分泌的方法 - Google Patents

提高具有生物学活性之多肽的分泌的方法 Download PDF

Info

Publication number
CN101516906A
CN101516906A CNA2007800352244A CN200780035224A CN101516906A CN 101516906 A CN101516906 A CN 101516906A CN A2007800352244 A CNA2007800352244 A CN A2007800352244A CN 200780035224 A CN200780035224 A CN 200780035224A CN 101516906 A CN101516906 A CN 101516906A
Authority
CN
China
Prior art keywords
polynucleotide
endoglucanase
peptide
polypeptide
catalyst structure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007800352244A
Other languages
English (en)
Other versions
CN101516906B (zh
Inventor
桑德拉·梅里诺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novozymes Inc
Original Assignee
Novozymes Biotech Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novozymes Biotech Inc filed Critical Novozymes Biotech Inc
Publication of CN101516906A publication Critical patent/CN101516906A/zh
Application granted granted Critical
Publication of CN101516906B publication Critical patent/CN101516906B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • C12N9/2437Cellulases (3.2.1.4; 3.2.1.74; 3.2.1.91; 3.2.1.150)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • C12N9/2445Beta-glucosidase (3.2.1.21)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/02Monosaccharides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/14Preparation of compounds containing saccharide radicals produced by the action of a carbohydrase (EC 3.2.x), e.g. by alpha-amylase, e.g. by cellulase, hemicellulase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01004Cellulase (3.2.1.4), i.e. endo-1,4-beta-glucanase
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/036Fusion polypeptide containing a localisation/targetting motif targeting to the medium outside of the cell, e.g. type III secretion

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Mycology (AREA)
  • Analytical Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明涉及用于产生具有生物学活性的分泌型多肽的方法,该方法包括:(a)用编码融合蛋白的融合蛋白构建体转化真菌宿主细胞,所述融合蛋白构建体包含:(i)编码信号肽的第一多核苷酸;(ii)编码内切葡聚糖酶的至少催化结构域或其部分的第二多核苷酸;和(iii)编码具有生物学活性之多肽的至少催化结构域的第三多核苷酸;其中所述信号肽和所述内切葡聚糖酶的至少催化结构域与不存在所述内切葡聚糖酶的至少催化结构域时相比提高所述具有生物学活性之多肽的分泌;(b)在适于所述融合蛋白生产的条件下培养所述经过转化的真菌宿主细胞;并(c)自所述培养液回收所述具有生物学活性的融合蛋白、其构件、或其组合。

Description

提高具有生物学活性之多肽的分泌的方法
关于在联邦赞助的研究和开发下进行的发明的权利声明
本发明是在政府支持下进行的,即美国能源部授予的基本合同DE-AC36-98GO10337的NREL转包合同号ZCO-30017-02。美国政府具有本发明的某些权利。
发明领域
本发明涉及产生具有生物学活性的分泌型多肽的方法及其融合蛋白和多核苷酸。
发明背景
异源多肽在真菌宿主细胞(特别是丝状真菌细胞,如曲霉属或木霉属或酵母细胞如酵母属)中的重组生产可能提供了用于以商业上合适的数量生产多肽的更理想的媒介。
分泌型异源多肽的重组生产一般通过构建表达盒来实现,在所述表达盒中编码多肽的DNA可操作连接适于宿主细胞的启动子和编码信号肽编码区,所述信号肽编码区所编码的氨基酸序列以符合读码框的方式连接至多肽的氨基末端并指导所编码多肽进入细胞的分泌途径。将表达盒导入宿主细胞,通常通过质粒介导的转化。然后通过在表达盒上所含的启动子正确发挥功能所必需的诱导条件下培养经转化的宿主细胞来实现分泌型异源蛋白的生产。
虽然可改进异源多肽在宿主细胞中的表达,但常常遇到的障碍是多肽进入培养基的分泌很差。改进多肽分泌的一种方法是用外来信号肽编码区替换天然信号肽编码序列以增强多肽的分泌。然而,在有些情况中,这样的替换不能提供足够的改善用于以商业上合适的数量生产多肽。另一种方法是将多肽与另一种由宿主细胞高度分泌的多肽融合。高度分泌的多肽发挥载体的功能将分泌很差或不分泌的多肽作为融合蛋白转运通过细胞的分泌途径。
WO 05/093050披露了由外切纤维二糖水解酶催化结构域和纤维素酶催化结构域构成的融合蛋白,以提高纤维素酶的产量。Gouka等,1997,Appliedand Environmental Microbiology Feb.1997,p.488-497披露了葡糖淀粉酶基因融合物,其减轻了泡盛曲霉(Aspergillus awamori)中对蛋白质产生的限制。Nyyssonen和Keranen,1995,Current Genetics 28:71-79披露了纤维二糖水解酶I在增强里氏木霉(Trichoderma reesei)的融合抗体的产生中的多种作用。
本发明的一个目的是提供用于提高具有生物学活性之多肽的分泌的方法。
发明概述
本发明涉及用于产生具有生物学活性的分泌型多肽的方法,该方法包括:
(a)用编码融合蛋白的融合蛋白构建体转化真菌宿主细胞,其中所述融合蛋白构建体包含:
(i)包含编码信号肽的核苷酸序列的第一多核苷酸;
(ii)包含编码内切葡聚糖酶的至少催化结构域(catalytic domain)或其部分的核苷酸序列的第二多核苷酸;和
(iii)包含编码具有生物学活性之多肽的至少催化结构域或其部分的核苷酸序列的第三多核苷酸;
其中所述信号肽和所述内切葡聚糖酶的至少催化结构域或其部分与不存在所述内切葡聚糖酶的至少催化结构域或其部分时相比提高所述具有生物学活性之多肽或其部分的分泌;
(b)在适于产生所述融合蛋白的条件下培养所述经转化的真菌宿主细胞;和
(c)自所述培养液回收所述融合蛋白、其构件(component thereof)或它们的组合,其中所述融合蛋白或其构件具有生物学活性。
一方面,所述第一多核苷酸的3’端可操作连接所述第二多核苷酸的5’端且所述第二多核苷酸的3’端可操作连接所述第三多核苷酸的5’端,或者所述第一多核苷酸的3’端可操作连接所述第三多核苷酸的5’端且所述第三多核苷酸的3’端可操作连接所述第二多核苷酸的5’端,以编码融合蛋白。
本发明还涉及分离的融合蛋白,该融合蛋白包含:
(a)包含信号肽的第一氨基酸序列;
(b)包含内切葡聚糖酶的至少催化结构域或其部分的第二氨基酸序列;和
(c)包含具有生物学活性之多肽的至少催化结构域或其部分的第三氨基酸序列。
本发明还涉及编码所述融合蛋白的多核苷酸,及包含此类多核苷酸的融合蛋白构建体、表达载体和重组宿主细胞。
另一方面,所述第一氨基酸序列的C端以符合读码框的方式连接所述第二氨基酸序列的N端且所述第二氨基酸序列的C端以符合读码框的方式连接所述第三氨基酸序列的N端,或者所述第一氨基酸序列的C端以符合读码框的方式连接所述第三氨基酸序列的N端且所述第三氨基酸序列的C端以符合读码框的方式连接所述第二氨基酸序列的N端。
本发明还涉及使用所述融合蛋白或其构件的方法。
附图简述
图1显示了pMJ04的限制性图谱。
图2显示了pCaHj527的限制性图谱。
图3显示了pMT2188的限制性图谱。
图4显示了pCaHj568的限制性图谱。
图5显示了pMJ05的限制性图谱。
图6显示了pSMai130的限制性图谱。
图7显示了米曲霉(Aspergillus oryzae)β-葡糖苷酶天然信号序列的DNA序列和氨基酸序列(SEQ ID NO:59和60)。
图8显示了特异腐质霉(Humicola insolens)内切葡聚糖酶V信号序列的DNA序列和氨基酸序列(SEQ ID NO:63和64)。
图9显示了pSMai135的限制性图谱。
图10显示了pSMai140的限制性图谱。
图11显示了pSaMe-F1的限制性图谱。
图12显示了pSaMe-FX的限制性图谱。
图13显示了pAlLo47的限制性图谱。
图14A、14B、14C、和14D显示了米曲霉β-葡糖苷酶变体融合蛋白的DNA序列和推导的氨基酸序列(SEQ ID NO:73和74)。
图15A、15B、15C、和15D显示了米曲霉β-葡糖苷酶融合蛋白的DNA序列和推导的氨基酸序列(SEQ ID NO:75和76)。
定义
内切葡聚糖酶活性:术语“内切葡聚糖酶活性”在本申请中定义为内切-1,4-β-D-葡聚糖4-葡聚糖水解酶(endo-1,4-β-D-glucan 4-glucanohydrolase)(E.C.3.2.1.4),其催化纤维素、纤维素衍生物(如羧甲基纤维素和羟乙基纤维素)、地衣淀粉(lichenin)中的1,4-β-D-糖苷连接、混合的β-1,3葡聚糖如谷类β-D-葡聚糖或木葡聚糖中的β-1,4键和含有纤维素成分的其它植物材料的内水解(endohydrolysis)。就本发明而言,根据Ghose,1987,Pure and Appl.Chem.59:257-268的方法,使用羧甲基纤维素(CMC)水解来测定内切葡聚糖酶活性。将一单位的内切葡聚糖酶活性定义为:在50℃、pH4.8,每分钟产生1.0微摩尔还原糖。
β-葡糖苷酶活性:术语“β-葡糖苷酶”在本申请中定义为β-D-葡糖苷葡糖水解酶(β-D-glucoside glucohydrolase)(E.C.3.2.1.21),其催化末端非还原性β-D-葡萄糖残基的水解,同时释放β-D-葡萄糖。就本发明而言,根据Venturi等,2002,J.Basic Microbiol.42:55-66记载的规程来确定β-葡糖苷酶活性,只是如本申请所述采用不同的条件。将一单位的β-葡糖苷酶活性定义为:在50℃、pH5,由100mM柠檬酸钠,0.01%
Figure A20078003522400111
20中的4mM作为底物的对硝基苯基-β-D-吡喃葡糖苷每分钟产生1.0微摩尔对硝基酚。
全长多肽:术语“全长多肽”在本申请中定义为具有生物学活性之多肽的前体形式,其中所述前体包含信号肽区,或者还包含前肽区,其中一旦从细胞分泌,所述信号肽被切割掉,或者所述前肽也被切割掉,从而产生具有生物学活性之多肽。
信号肽:术语“信号肽”在本申请中定义为以符合读码框的方式连接至多肽的氨基末端且指导所编码多肽进入细胞的分泌途径的肽。
信号肽编码序列:术语“信号肽编码序列”在本申请中定义为如下肽编码区,该肽编码区编码以符合读码框的方式连接至所编码多肽的氨基末端且指导所编码多肽进入细胞的分泌途径的氨基酸序列。
前肽:术语“前肽”在本申请中定义为以符合读码框的方式连接至多肽的氨基末端的肽。所得多肽称为酶原(proenzyme)或多肽原(propolypeptide)(或在一些情况下称为酶原(zymogen))。多肽原一般是没有活性的,而且可以通过前肽的催化或自催化切割从多肽原转变为成熟的活性多肽。当信号肽区和前肽区均存在于多肽的氨基末端时,则前肽区以符合读码框的方式连接至多肽的氨基末端,而信号肽区以符合读码框的方式连接至前肽区的氨基末端。
前肽编码序列:术语“前肽编码序列”在本申请中定义为如下肽编码区,该肽编码区编码以符合读码框的方式连接至多肽的氨基末端从而形成酶原或多肽原(或在一些情况下称为酶原)的氨基酸序列。
成熟多肽:术语“成熟多肽”在本申请中定义为在翻译和任何翻译后修饰(如N端加工、C端截短、糖基化、磷酸化等)后以其最终形式具有生物学活性的多肽。
催化结构域:术语“催化结构域”在本申请中定义为内切葡聚糖酶或具有生物学活性之多肽(例如β-葡糖苷酶活性)的氨基酸序列中拥有内切葡聚糖酶或具有生物学活性之多肽(例如β-葡糖苷酶)的催化活性的结构部分或区。催化结构域在本申请中也称为“核心”(core)区。
融合蛋白:术语“融合蛋白”在本申请中定义为显示生物学活性且包含至少内切葡聚糖酶的催化结构域和具有生物学活性之多肽(例如β-葡糖苷酶)的催化结构域二者的多肽。
β-葡糖苷酶融合蛋白:术语“β-葡糖苷酶融合蛋白”在本申请中定义为显示β-葡糖苷酶活性且包含至少β-葡糖苷酶催化结构域和内切葡聚糖酶的催化结构域二者的多肽。
融合蛋白的构件:术语“融合蛋白的构件”在本申请中定义为融合蛋白的(切割后的)片段个体,其中每个片段具有生物学活性且或是包含内切葡聚糖酶的至少催化结构域和具有生物学活性之多肽的至少催化结构域或是包含具有生物学活性之多肽的至少催化结构域。例如,融合蛋白中内切葡聚糖酶的至少催化结构域和具有生物学活性之多肽的至少催化结构域的构件之间切割位点(例如Kex2位点)的存在可导致具有内切葡聚糖酶活性之多肽和另一种具有生物学活性之多肽的产生。
β-葡糖苷酶融合蛋白的构件:术语“β-葡糖苷酶融合蛋白的构件”在本申请中定义为β-葡糖苷酶融合蛋白的(切割后的)片段个体,其中每个片段具有β-葡糖苷酶活性且或是至少内切葡聚糖酶的催化结构域和至少β-葡糖苷酶催化结构域或是至少β-葡糖苷酶催化结构域。例如,融合蛋白中内切葡聚糖酶和β-葡糖苷酶的构件之间切割位点(例如Kex2位点)的存在可导致具有内切葡聚糖酶活性之多肽和另一种具有β-葡糖苷酶活性之多肽的产生。
碳水化合物结合模块:术语“碳水化合物结合模块(CBM)”在本申请中定义为内切葡聚糖酶(纤维素酶)的氨基酸序列中牵涉内切葡聚糖酶结合纤维素(木质纤维素)的部分。碳水化合物结合模块一般通过使内切葡聚糖酶非共价结合纤维素、纤维素衍生物、或其多糖等同物来发挥功能。CBM通常独立于催化结构域来发挥功能。
融合蛋白构建体:术语“融合蛋白构建体”指由可操作连接的不同基因或其部分构成的核酸构建体。构件自5′端起包括编码至少内切葡聚糖酶的催化结构域的DNA分子和编码具有生物学活性之多肽的至少催化结构域的DNA分子。
β-葡糖苷酶融合物构建体:术语“β-葡糖苷酶融合物构建体”指由可操作连接的不同基因或其部分构成的核酸构建体。构件自5′端起包括编码至少内切葡聚糖酶的催化结构域的DNA分子和编码至少β-葡糖苷酶催化结构域的DNA分子。
分离的多肽:术语“分离的多肽”在用于本申请时指根据SDS-PAGE的测定,至少20%纯、优选至少40%纯、更优选至少60%纯、甚至更优选至少80%纯、最优选至少90%纯、且甚至最优选至少95%纯的多肽。
基本上纯的多肽:术语“基本上纯的多肽”在本申请中指包含至多10%、优选至多8%、更优选至多6%、更优选至多5%、更优选至多4%、更优选至多3%、甚至更优选至多2%、最优选至多1%、且甚至最优选至多0.5%(按重量计)与之天然地或重组地相关的(associated)其它多肽材料的多肽制备物。因此,优选的是,基本上纯的多肽是至少92%纯、优选至少94%纯、更优选至少95%纯、更优选至少96%纯、更优选至少96%纯、更优选至少97%纯、更优选至少98%纯、甚至更优选至少99%、最优选至少99.5%纯、且甚至最优选100%纯的,按制备物中存在的总多肽材料的重量计。本发明的多肽优选是基本上纯的形式,即多肽制备物基本上不含与之天然地或重组地相关的其它多肽材料。这可以如下来实现,例如通过众所周知的重组方法或通过经典的纯化方法来制备多肽。
同一性:参数“同一性”描述两个氨基酸序列之间或两个核苷酸序列之间的相关性。
就本发明而言,两个氨基酸序列之间的同一性程度使用Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)来确定,正如EMBOSS包(EMBOSS:The European Molecular Biology OpenSoftware Suite,Rice等,2000,Trends in Genetics 16:276-277)(优选3.0.0版或更后的)的Needle程序所执行的。所使用的任选参数是缺口开启罚分(gap openpenalty)为10,缺口延伸罚分(gap extension penalty)为0.5和EBLOSUM62(EMBOSS版的BLOSUM62)替代矩阵。将标记为“最长同一性(longest identity)”(使用-nobrief选项得到的)的Needle输出结果用作百分比同一性,并计算如下:
(相同残基x100)/(比对长度-比对中缺口的总数)
就本发明而言,两个脱氧核糖核苷酸序列之间的同一性程度使用Needleman-Wunsch算法(Needleman和Wunsch,1970,见上文)来确定,正如EMBOSS包(EMBOSS:The European Molecular Biology Open Software Suite,Rice等,2000,见上文)(优选3.0.0版或更后的)的Needle程序所执行的。所使用的任选参数是缺口开启罚分(gap opern penalty)为10,缺口延伸罚分(gapextension penalty)为0.5和EDNAFULL(EMBOSS版的NCBI NUC4.4)替代矩阵。将标记为“最长同一性”(使用-nobrief选项得到的)的Needle输出结果用作百分比同一性,并计算如下:
(相同脱氧核糖核苷酸x100)/(比对长度-比对中缺口的总数)
多肽片段:术语“多肽片段”在本申请中定义为从融合蛋白(例如β-葡糖苷酶融合蛋白)或其构件的氨基和/或羧基末端缺失了一个或几个氨基酸的多肽,其中所述片段具有生物学活性(例如β-葡糖苷酶活性)。
子序列(subsequence):术语“子序列”在本申请中定义为从多核苷酸的5′和/或3′端缺失了一个或几个核苷酸的核苷酸序列,其中所述子序列编码具有生物学活性(例如β-葡糖苷酶活性或内切葡聚糖酶活性)之多肽片段。
分离的多核苷酸:术语“分离的多核苷酸”在用于本申请时指的根据琼脂糖电泳的测定,至少20%纯、优选至少40%纯、更优选至少60%纯、甚至更优选至少80%纯、最优选至少90%纯、且甚至最优选至少95%纯的多核苷酸。
基本上纯的多核苷酸:术语“基本上纯的多核苷酸”在用于本申请时指不含其它外来的或不需要的核苷酸且处于适用于遗传工程蛋白质生产***的形式的多核苷酸制备物。如此,基本上纯的多核苷酸含有至多10%、优选至多8%、更优选至多6%、更优选至多5%、更优选至多4%、更优选至多3%、甚至更优选至多2%、最优选至多1%、且甚至最优选至多0.5%(按重量计)与之天然地或重组地相关的(associated)其它多核苷酸材料。然而,基本上纯的多核苷酸可以包含天然存在的5’和3’非翻译区,如启动子和终止子。优选的是,基本上纯的多核苷酸是按重量计至少90%纯、优选至少92%纯、更优选至少94%纯、更优选至少95%纯、更优选至少96%纯、更优选至少97%纯、甚至更优选至少98%纯、最优选至少99%、且甚至最优选至少99.5%纯的。多核苷酸优选是基本上纯的形式,即多核苷酸制备物基本上不含与之天然地或重组地相关的其它多核苷酸材料。多核苷酸可以是基因组、cDNA、RNA、半合成、合成起源的,或其任意组合。
cDNA:术语“cDNA”在本申请中定义为可以通过从得自真核细胞的成熟的、已剪接的mRNA分子反转录而制备的DNA分子。cDNA缺少通常存在于相应基因组DNA中的内含子序列。起始的(initial)、初级的RNA转录物是mRNA的前体,其通过一系列的步骤加工然后作为成熟的已剪接的mRNA出现。这些步骤包括通过称为剪接的过程去除内含子序列。因此,衍生自mRNA的cDNA缺少任何内含子序列。
核酸构建体:术语“核酸构建体”在用于本申请时指从天然存在的基因分离的或经修饰而以自然界其它情况中不会存在的方式包含核酸区段的核酸分子,其或是单链的或是双链的。在核酸构建体包含编码序列表达所需要的控制序列时,术语核酸构建体与术语“表达盒”同义。
控制序列:术语“控制序列”在本申请中定义为包括对于编码多肽的多核苷酸表达而言是必需的或有利的所有构件。每种控制序列对于编码多肽的核苷酸序列而言可以是天然的或外来的,或者彼此是天然的或外来的。此类控制序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列、和转录终止子。最低限度,控制序列包括启动子、及转录和翻译终止信号。为了导入特定限制性位点以便于将控制序列与编码多肽核苷酸序列的编码区连接,控制序列可以与接头一起提供。
可操作连接:术语“可操作连接”在本申请中指其中控制序列置于相对于多核苷酸序列的编码序列的适宜位置使得控制序列指导多肽编码序列的表达的构造。另外,术语“可操作连接”还涉及一起作为融合蛋白表达的相连接或融合的两条多核苷酸。
编码序列:在用于本申请时,术语“编码序列”指直接指定其蛋白质产物的氨基酸序列的核苷酸序列。编码序列的边界一般由开读框决定,其通常以ATG起始密码子或可替换的起始密码子如GTG和TTG开始,以终止密码子如TAA、TAG和TGA结束。编码序列可以是DNA、cDNA或重组的核苷酸序列。
表达:术语“表达”包括多肽生产中所牵涉的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰、和分泌。
表达载体:术语“表达载体”在本申请中定义为线性的或环状的DNA分子,其包含编码本发明多肽的多核苷酸且所述多核苷酸与用于其表达的其它核苷酸可操作连接。
宿主细胞:术语“宿主细胞”在用于本申请时包括易于(susceptible to)用包含多核苷酸的核酸构建体或表达载体转化、转染、转导等的任何细胞类型。
变体:在用于本申请时,术语“变体”指由表达经修饰核苷酸序列(例如SEQ ID NO:25或其同源序列或其成熟编码区)的生物体产生的具有生物学活性之多肽。经修饰核苷酸序列通过人为干预(human intervention)即通过修饰核苷酸序列(例如SEQ ID NO:23或其同源序列或其成熟编码区)来获得。修饰可以是一个或几个氨基酸的取代、缺失、和/或***,以及一个或几个氨基酸侧链的置换。
发明详述
本发明涉及用于产生具有生物学活性的分泌型多肽的方法,该方法包括:(a)用编码融合蛋白的融合蛋白构建体转化真菌宿主细胞,其中所述融合蛋白构建体包含:(i)包含编码信号肽的核苷酸序列的第一多核苷酸;(ii)包含编码内切葡聚糖酶的至少催化结构域或其部分的核苷酸序列的第二多核苷酸;和(iii)包含编码具有生物学活性之多肽的至少催化结构域或其部分的核苷酸序列的第三多核苷酸;其中所述信号肽和所述内切葡聚糖酶的至少催化结构域或其部分与不存在所述内切葡聚糖酶的至少催化结构域或其部分时相比提高所述具有生物学活性之多肽或其部分的分泌;(b)在适于产生所述融合蛋白的条件下培养所述经转化的真菌宿主细胞;和(c)自所述培养液回收所述融合蛋白、其构件或它们的组合,其中所述融合蛋白或其构件具有生物学活性。
在优选的方面,第一多核苷酸的3’端可操作连接第二多核苷酸的5’端且第二多核苷酸的3’端可操作连接第三多核苷酸的5’端。在另一个优选的方面,第一多核苷酸的3’端可操作连接第三多核苷酸的5’端且第三多核苷酸的3’端可操作连接第二多核苷酸的5’端,以编码融合蛋白。
通过将编码具有生物学活性之多肽或其部分的核苷酸序列与编码具有内切葡聚糖酶活性之多肽或其部分的核苷酸序列和编码信号肽的核苷酸序列(其与编码具有内切葡聚糖酶活性之多肽或其部分的核苷酸序列可操作连接)融合来产生融合蛋白。用于产生融合蛋白的技术是本领域已知的,包括例如连接编码多肽的编码序列使得它们符合读码框(in frame)且融合蛋白的表达处在同一启动子和终止子的控制下。也可以使用内含肽(intein)技术来构建融合蛋白,其中在翻译后产生融合物(Cooper等,1993,EMBO J.12:2575-2583;Dawson等,1994,Science 266:776-779)。
包含信号肽、内切葡聚糖酶的至少催化结构域或其部分、和具有生物学活性之多肽的至少催化结构域或其部分,具有生物学活性的融合蛋白与不存在所述内切葡聚糖酶的至少催化结构域或其部分时相比提高了融合蛋白的分泌。具有生物学活性的融合蛋白的分泌与不存在内切葡聚糖酶的至少催化结构域相比的增加是至少5%、优选至少10%、更优选至少25%、甚至更优选至少50%、更优选至少100%、甚至更优选至少150%、甚至更优选至少200%、最优选至少500%、且甚至最优选至少1000%。
在下文每一个优选的方面,融合蛋白构建体(核酸构建体)的构件是自构建体的5’端至3’端可操作连接的。
在优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸;和包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸;和包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸;和包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸;和包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸;和包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸;和包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含的编码内切葡聚糖酶的成熟多肽的核苷酸序列多核苷酸;和包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸;和包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸;和包含编码具有生物学活性之多肽的全长多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码具有生物学活性之多肽的全长多肽的核苷酸序列的多核苷酸;和包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸;和包含编码具有生物学活性之多肽的全长多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码具有生物学活性之多肽的全长多肽的核苷酸序列的多核苷酸;和包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码内切葡聚糖酶(信号肽和成熟多肽)全长多肽的核苷酸序列的多核苷酸;和包含编码具有生物学活性之多肽的全长多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码具有生物学活性之多肽的全长多肽的核苷酸序列的多核苷酸;和包含编码内切葡聚糖酶(信号肽和成熟多肽)全长多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;和包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;和包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;和包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;和包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;和包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;和包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;和包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;和包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;和包含编码具有生物学活性之多肽的全长多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码具有生物学活性之多肽的全长多肽的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;和包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;和包含编码具有生物学活性之多肽的全长多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码具有生物学活性之多肽的全长多肽的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;和包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸;包含编码另一信号肽的核苷酸序列的多核苷酸;和包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸;包含编码另一信号肽的核苷酸序列的多核苷酸;和包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸;包含编码另一信号肽的核苷酸序列的多核苷酸;和包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸;包含编码另一信号肽的核苷酸序列的多核苷酸;和包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸;包含编码另一信号肽的核苷酸序列的多核苷酸;和包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸;包含编码另一信号肽的核苷酸序列的多核苷酸;和包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸;包含编码另一信号肽的核苷酸序列的多核苷酸;和包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸;包含编码另一信号肽的核苷酸序列的多核苷酸;和包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;包含编码另一信号肽的核苷酸序列的多核苷酸;和包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;包含编码另一信号肽的核苷酸序列的多核苷酸;和包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;包含编码另一信号肽的核苷酸序列的多核苷酸;和包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码具有生物学活性之多肽的催化结构域的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;包含编码另一信号肽的核苷酸序列的多核苷酸;和包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;包含编码另一信号肽的核苷酸序列的多核苷酸;和包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;包含编码另一信号肽的核苷酸序列的多核苷酸;和包含编码内切葡聚糖酶的催化结构域的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;包含编码另一信号肽的核苷酸序列的多核苷酸;和包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,融合蛋白构建体包含:包含编码信号肽的核苷酸序列的多核苷酸;和包含编码具有生物学活性之多肽的成熟多肽的核苷酸序列的多核苷酸,和编码接头的多核苷酸和/或编码碳水化合物结合模块的多核苷酸;包含编码另一信号肽的核苷酸序列的多核苷酸;和包含编码内切葡聚糖酶的成熟多肽的核苷酸序列的多核苷酸。
在另一个优选的方面,对于上文每一个优选的方面,多核苷酸可以编码内切葡聚糖酶或具有生物学活性之多肽的催化结构域的部分、成熟多肽的部分、或全长多肽的部分。所述内切葡聚糖酶的部分可以具有或不具有内切葡聚糖酶活性。在更优选的方面,所述内切葡聚糖酶的部分具有内切葡聚糖酶活性。
在上文每一个优选的方面,融合蛋白构建体的构件进一步包含启动子区和/或终止子区。
内切葡聚糖酶及其多核苷酸
编码内切葡聚糖酶的催化结构域、成熟多肽、或全长多肽,或其部分的多核苷酸可以自任何生物体获得。就本发明而言,术语“多肽”理解为包括全长多肽、成熟多肽、或催化结构域;或其具有活性的部分或片段。术语“自...得到的”或“得自”在本申请中与给定来源一起使用时意味着由核苷酸序列编码的多肽是由所述来源或由其中已经***了来自所述来源的核苷酸序列的菌株产生的。
许多内切葡聚糖酶具有由通过接头肽与碳水化合物结合结构域分隔开的催化结构域组成的多结构域结构(Suurnakki等,2000,Cellulose 7:189-209)。所述催化结构域包含活性位点,而所述CBM通过使酶与其结合而与纤维素相互作用(van Tilbeurgh等,1986,FEBS Letters 204:223-227;Tomme等,1988,European Journal of Biochemistry 170:575-581)。
编码具有内切葡聚糖酶活性之多肽的多核苷酸可以自编码细菌多肽的基因获得。例如,所述多肽可以是***多肽,包括但不限于芽孢杆菌属(Bacillus)、链球菌属(Streptococcus)、链霉菌属(Streptomyces)、葡萄球菌属(Staphylococcus)、肠球菌属(Enterococcus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、梭菌属(Clostridium)、地芽孢杆菌属(Geobacillus)或Oceanobacillus多肽,例如嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、凝结芽孢杆菌(Bacillus coagulans)、灿烂芽孢杆菌(Bacilluslautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacillus licheniformis)、巨大芽孢杆菌(Bacillus megaterium)、嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)、苏云金芽孢杆菌(Bacillusthuringiensis)、似马链球菌(Streptococcus equisimilis)、酿脓链球菌(Streptococcus pyogenes)、***链球菌(Streptococcus uberis)、和马链球菌兽瘟亚种(Streptococcus equi subsp.Zooepidemicus)、和浅青紫链霉菌(Streptomyceslividans)、或鼠灰链霉菌(Streptomyces murinus)多肽;或革兰氏阴性细菌多肽,包括但不限于大肠埃希氏菌或大肠杆菌(E.coli)、假单胞菌属(Pseudomonas)、沙门氏菌属(Salmonella)、弯曲杆菌属(Campylobacter)、螺杆菌属(Helicobacter)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、泥杆菌属(Ilyobacter)、奈瑟氏菌属(Neisseria)、或脲原体属(Ureaplasma)多肽。
可用作本发明方法中多核苷酸来源的细菌内切葡聚糖酶的例子包括但不限于解纤维热酸菌(Acidothermus cellulolyticus)内切葡聚糖酶(WO 91/05039;WO 93/15186;美国专利No.5,275,944;WO 96/02551;美国专利No.5,536,655,WO 00/70031,WO 05/093050);Thermobifida fusca内切葡聚糖酶III(WO05/093050);和Thermobifida fusca内切葡聚糖酶V(WO 05/093050)。
编码具有内切葡聚糖酶活性之多肽的多核苷酸可以自编码真菌多肽的基因获得,更优选酵母多肽,如假丝酵母属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、(糖)酵母属(Saccharomyces)、裂殖(糖)酵母属(Schizosaccharomyces)、或耶氏酵母(西洋蓍霉)属(Yarrowia)多肽;或更优选丝状真菌多肽,如枝顶孢霉属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、枝鼻菌属(Cladorrhinum)、隐球菌属(Cryptococcus)、篮状菌属(Filibasidium)、镰孢属(Fusarium)、腐质霉属(Humicola)、梨孢菌属(Magnaporthe)、毛霉属Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、瘤胃壶菌属(Piromyces)、裂褶菌属(Schizophyllum)、踝节菌属(Talaromyces)、热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、或木霉属(Trichoderma)多肽。
在优选的方面,编码具有内切葡聚糖酶活性之多肽的多核苷酸可以自编码如下多肽的基因获得,卡尔酵母(Saccharomyces carlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)、或卵形酵母(Saccharomyces oviformis)多肽。
在另一个优选的方面,编码具有内切葡聚糖酶活性之多肽的多核苷酸可以自编码如下多肽的基因获得,棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillus awamori)、烟曲霉(Aspergillus fumigatus)、臭曲霉(Aspergillusfoetidus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillus oryzae)、Cladorrhinumfoecundissimum、杆孢状镰孢(Fusarium bactridioides)、禾谷镰孢(Fusariumcerealis)、库威镰孢(Fusarium crookwellense)、大刀镰孢(Fusarium culmorum)、禾本科镰孢(Fusarium graminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢(Fusarium negundi)、尖镰孢(Fusariumoxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、圆镰孢(Fusarium torulosum)、拟丝孢镰孢(Fusarium trichothecioides)、镶片镰孢(Fusarium venenatum)、特异腐质霉(Humicola insolens)、疏棉状腐质霉(Humicola lanuginosa)、米赫毛霉(Mucor miehei)、嗜热毁丝霉(Myceliophthorathermophila)、粗糙脉孢菌(Neurospora crassa)、产紫青霉(Penicilliumpurpurogenum)、无色梭孢壳(Thielavia achromatica)、Thielavia albomyces、Thielavia albopilosa、Thielavia australeinsis、Thielavia fimeti、小孢梭孢壳(Thielavia microspora)、卵孢梭孢壳(Thielavia ovispora)、Thielavia peruviana、瘤孢梭孢壳(Thielavia spededonium)、毛梭孢壳(Thielavia setosa)、Thielaviasubthermophila、土生梭孢霉(Thielavia terrestris)、栖土梭孢壳(Thielaviaterricola)、嗜热梭孢壳(Thielavia thermophila)、Thielavia variospora、Thielaviawareingii、哈茨木霉(Trichoderma harzianum)、康宁木霉(Trichodermakoningii)、长枝木霉(Trichoderma longibrachiatum)、里氏木霉(Trichodermareesei)、或绿色木霉(Trichoderma viride)多肽。
可用作本发明方法中多核苷酸来源的真菌内切葡聚糖酶的例子包括但不限于里氏木霉EG1(Penttila等,1986,Gene 45:253-263;GENBANKTM登录号M15665);里氏木霉EG2(Saloheimo,等,1988,Gene 63:11-22;GENBANKTM登录号M19373);里氏木霉EG3(Okada等,1988,Appl.Environ.Microbiol.64:555-563;GENBANKTM登录号AB003694);里氏木霉EG4(Saloheimo等,1997,Eur.J.Biochem.249:584-591;GENBANKTM登录号Y11113);和里氏木霉EG5(Saloheimo等,1994,Molecular Microbiology 13:219-228;GENBANKTM登录号Z33381);棘孢曲霉内切葡聚糖酶(Ooi等,1990,Nucleic Acidss Research 18:5884);川地曲霉(Aspergillus kawachii)(Sakamoto等,1995,Current Genetics27:435-439);胡萝卜软腐欧文氏菌(Erwinia carotovara)内切葡聚糖酶(Saarilahti等,1990,Gene 90:9-14);尖镰孢(GENBANKTM登录号L29381);灰色腐质酶高温变种(Humicola grisea var.thermoidea)(GENBANKTM登录号AB003107);Melanocarpus abomyces(GENBANKTM登录号MAL515703);和粗糙脉孢菌(GENBANKTM登录号XM 324477)。
许多糖基水解酶家族中披露了其它内切葡聚糖酶,所述糖基水解酶家族使用根据Henrissat B.,1991,A classification of glycosyl hydrolases based onamino-acid sequence similarities,Biochem.J.280:309-316及Henrissat B.和Bairoch A.,1996,Updating the sequence-based classification of glycosylhydrolases,Biochem.J.316:695-696的分类方法。
用于分离或克隆编码具有内切葡聚糖酶活性之多肽的多核苷酸的技术是本领域已知的,包括自基因组DNA分离、自cDNA制备、或其组合。自此类基因组DNA克隆多核苷酸可以如下来实现,例如通过使用众所周知的聚合酶链式反应(PCR)或抗体筛选表达文库以检测所克隆的具有共同结构特征的DNA片段。参见例如Innis等,1990,PCR:A Guide to Methods and Application,Academic Press,New York。可以使用其它核酸扩增方法,如连接酶链式反应(LCR)、连接活化的转录(LAT)和基于核苷酸序列的扩增(NASBA)。
应当理解,对于上述物种,本发明涵盖完全和不完全两个阶段(perfectand imperfect states),和其它分类学的等同物(equivalent),例如无性型(anamorph),而无论它们已知的种名。本领域技术人员将容易地识别适宜等同物的身份。
公众能够在许多培养物保藏中心容易地取得这些种的菌株,如美国典型培养物保藏中心(American Type Culture Collection)(ATCC)、德意志微生物和细胞培养物保藏中心(Deutsche Sammlung von Mikroorganismen undZellkulturen GmbH)(DSM)、真菌菌种保藏中心(Centraalbureau VoorSchimmelcultures)(CBS)、和农业研究机构专利培养物保藏中心北区研究中心(Agricultural Research Service Patent Culture Collection,Northern RegionalResearch Center)(NRRL)。
在优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自内切葡聚糖酶I基因获得的多核苷酸编码的。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自内切葡聚糖酶II基因获得的多核苷酸编码的。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自内切葡聚糖酶III基因获得的多核苷酸编码的。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自内切葡聚糖酶IV基因获得的多核苷酸编码的。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自内切葡聚糖酶V基因获得的多核苷酸编码的。在更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自特异腐质霉内切葡聚糖酶V基因获得的多核苷酸编码的。在最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自特异腐质霉内切葡聚糖酶V基因获得的多核苷酸编码的,所述特异腐质霉内切葡聚糖酶V基因编码SEQ ID NO:2之多肽。在另一个最优选的方面,内切葡聚糖酶的全长多肽,或其部分是由自特异腐质霉内切葡聚糖酶V基因获得的多核苷酸编码的,所述特异腐质霉内切葡聚糖酶V基因编码SEQ ID NO:2之全长多肽。在另一个最优选的方面,内切葡聚糖酶的成熟多肽,或其部分是由自特异腐质霉内切葡聚糖酶V基因获得的多核苷酸编码的,所述特异腐质霉内切葡聚糖酶V基因编码SEQ ID NO:2之成熟多肽。在另一个最优选的方面,内切葡聚糖酶的催化结构域,或其部分是由自特异腐质霉内切葡聚糖酶V基因获得的多核苷酸编码的,所述特异腐质霉内切葡聚糖酶V基因编码SEQ ID NO:2之催化结构域。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自特异腐质霉内切葡聚糖酶V基因获得的多核苷酸编码的,所述特异腐质霉内切葡聚糖酶V基因包含SEQ ID NO:1。在另一个最优选的方面,内切葡聚糖酶的全长多肽,或其部分是由自特异腐质霉内切葡聚糖酶V基因获得的多核苷酸编码的,所述特异腐质霉内切葡聚糖酶V基因包含SEQ ID NO:1。在另一个最优选的方面,内切葡聚糖酶的成熟多肽,或其部分是由自特异腐质霉内切葡聚糖酶V基因获得的多核苷酸编码的,所述特异腐质霉内切葡聚糖酶V基因包含SEQ ID NO:1之成熟多肽编码序列。在另一个最优选的方面,内切葡聚糖酶的催化结构域,或其部分是由自特异腐质霉内切葡聚糖酶V基因获得的多核苷酸编码的,所述特异腐质霉内切葡聚糖酶V基因包含SEQ ID NO:1之催化结构域编码序列。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自内切葡聚糖酶VI基因获得的多核苷酸编码的。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自家族5内切葡聚糖酶基因获得的多核苷酸编码的。在更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自嗜热毁丝霉CBS 117.65内切葡聚糖酶基因获得的多核苷酸编码的。在最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自嗜热毁丝霉CBS 117.65内切葡聚糖酶基因获得的多核苷酸编码的,所述嗜热毁丝霉CBS 117.65内切葡聚糖酶基因编码SEQ ID NO:4之多肽。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自嗜热毁丝霉CBS 117.65内切葡聚糖酶基因获得的多核苷酸编码的,所述嗜热毁丝霉CBS 117.65内切葡聚糖酶基因包含SEQ IDNO:3。在另一个更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自担子菌纲(Basidiomycete)CBS 495.95内切葡聚糖酶基因获得的多核苷酸编码的。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自担子菌纲CBS 495.95内切葡聚糖酶基因获得的多核苷酸编码的,所述担子菌纲CBS 495.95内切葡聚糖酶基因编码SEQ ID NO:6之多肽。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自担子菌纲CBS495.95内切葡聚糖酶基因获得的多核苷酸编码的,所述担子菌纲CBS 495.95内切葡聚糖酶基因包含SEQ ID NO:5。在另一个更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自担子菌纲CBS494.95内切葡聚糖酶基因获得的多核苷酸编码的。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自担子菌纲CBS 494.95内切葡聚糖酶基因获得的多核苷酸编码的,所述担子菌纲CBS 494.95内切葡聚糖酶基因编码SEQ ID NO:8之多肽。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自担子菌纲CBS 494.95内切葡聚糖酶基因获得的多核苷酸编码的,所述担子菌纲CBS 494.95内切葡聚糖酶基因包含SEQ ID NO:7。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自家族6内切葡聚糖酶基因获得的多核苷酸编码的。在另一个更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自土生梭孢霉NRRL 8126CEL6B内切葡聚糖酶基因获得的多核苷酸编码的。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自土生梭孢霉NRRL 8126 CEL6B内切葡聚糖酶基因获得的多核苷酸编码的,所述土生梭孢霉NRRL 8126 CEL6B内切葡聚糖酶基因编码SEQ ID NO:10之多肽。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自土生梭孢霉NRRL 8126 CEL6B内切葡聚糖酶基因获得的多核苷酸编码的,所述土生梭孢霉NRRL 8126 CEL6B内切葡聚糖酶基因包含SEQ ID NO:9。在另一个更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自土生梭孢霉NRRL 8126 CEL6C内切葡聚糖酶基因获得的多核苷酸编码的。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自土生梭孢霉NRRL 8126 CEL6C内切葡聚糖酶基因获得的多核苷酸编码的,所述土生梭孢霉NRRL 8126 CEL6C内切葡聚糖酶基因编码SEQ ID NO:12之多肽。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自土生梭孢霉NRRL 8126CEL6C内切葡聚糖酶基因获得的多核苷酸编码的,所述土生梭孢霉NRRL8126 CEL6C内切葡聚糖酶基因包含SEQ ID NO:11。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自家族7内切葡聚糖酶基因获得的多核苷酸编码的。在另一个更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶基因获得的多核苷酸编码的。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶基因获得的多核苷酸编码的,所述土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶基因编码SEQ ID NO:14之多肽。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶基因获得的多核苷酸编码的,所述土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶基因包含SEQ ID NO:13。在另一个更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自土生梭孢霉NRRL 8126 CEL7E内切葡聚糖酶基因获得的多核苷酸编码的。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自土生梭孢霉NRRL 8126 CEL7E获得的多核苷酸编码的,所述土生梭孢霉NRRL 8126 CEL7E内切葡聚糖酶基因编码SEQ ID NO:16之多肽。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自土生梭孢霉NRRL 8126 CEL7E内切葡聚糖酶基因获得的多核苷酸编码的,所述土生梭孢霉NRRL 8126 CEL7E内切葡聚糖酶基因包含SEQ ID NO:15。在另一个更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自土生梭孢霉NRRL 8126CEL7F内切葡聚糖酶基因获得的多核苷酸编码的。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自土生梭孢霉NRRL 8126 CEL7F内切葡聚糖酶基因获得的多核苷酸编码的,所述土生梭孢霉NRRL 8126 CEL7F内切葡聚糖酶基因编码SEQ ID NO:18之多肽。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自土生梭孢霉NRRL 8126 CEL7F内切葡聚糖酶基因获得的多核苷酸编码的,所述土生梭孢霉NRRL 8126 CEL7F内切葡聚糖酶基因包含SEQ ID NO:17。在另一个更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自Cladorrhinum foecundissimum ATCC62373 CEL7A内切葡聚糖酶基因获得的多核苷酸编码的。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自Cladorrhinum foecundissimum ATCC 62373 CEL7A内切葡聚糖酶基因获得的多核苷酸编码的,所述Cladorrhinum foecundissimum ATCC 62373 CEL7A内切葡聚糖酶基因编码SEQ ID NO:20之多肽。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自Cladorrhinum foecundissimum ATCC 62373 CEL7A内切葡聚糖酶基因获得的多核苷酸编码的,所述Cladorrhinum foecundissimum ATCC 62373 CEL7A内切葡聚糖酶基因包含SEQ ID NO:19。
在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自里氏木霉菌株No.VTT-D-80133内切葡聚糖酶基因获得的多核苷酸编码的,所述里氏木霉菌株No.VTT-D-80133内切葡聚糖酶基因编码SEQ ID NO:22(GENBANKTM登录号M15665)之多肽。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自里氏木霉菌株No.VTT-D-80133内切葡聚糖酶基因获得的多核苷酸编码的,所述里氏木霉菌株No.VTT-D-80133内切葡聚糖酶基因包含SEQ IDNO:21(GENBANKTM登录号M15665)。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自家族9内切葡聚糖酶基因获得的多核苷酸编码的。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自家族12内切葡聚糖酶基因获得的多核苷酸编码的。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自家族45内切葡聚糖酶基因获得的多核苷酸编码的。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自家族74内切葡聚糖酶基因获得的多核苷酸编码的。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自编码同源多肽的基因获得的多核苷酸编码的,所述同源多肽包含氨基酸序列,该氨基酸序列与SEQ ID NO:2、SEQ ID NO:4、SEQID NO:6、或SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、或SEQ ID NO:22之全长多肽、成熟多肽、或催化结构域的氨基酸序列具有至少60%、优选至少65%、更优选至少70%、更优选至少75%、更优选至少80%、更优选至少85%、甚至更优选至少90%、最优选至少95%、且甚至最优选96%、97%、98%、或99%的同一性程度,其具有内切葡聚糖酶活性。在优选的方面,同源多肽具有与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、或SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQID NO:20、或SEQ ID NO:22之全长多肽、成熟多肽、或催化结构域差别为10个氨基酸、优选5个氨基酸、更优选4个氨基酸、甚至更优选3个氨基酸、最优选2个氨基酸、且甚至最优选1个氨基酸的氨基酸序列。
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽、或催化结构域,或其部分是由包含如下核苷酸序列的多核苷酸编码的,所述核苷酸序列在很低的严格条件、优选低的严格条件、更优选中等严格条件、更优选中等-高的严格条件、甚至更优选高的严格条件、和最优选很高的严格条件下与(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、或SEQ ID NO:7、SEQ IDNO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、或SEQ ID NO:21,(ii)SEQ ID NO:1、SEQ ID NO:3、SEQID NO:5、或SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、或SEQ ID NO:21中所包含的cDNA序列,(iii)(i)或(ii)的子序列,或(iv)(i)、(ii)或(iii)的互补链发生杂交(J.Sambrook,E.F.Fritsch,和T.Maniatis,1989,Molecular Cloning,ALaboratory Manual,第2版,Cold Spring Harbor,New York)。SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、或SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、或SEQ ID NO:21的子序列包含至少100个连续的核苷酸或优选至少200个连续的核苷酸。
SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、或SEQ ID NO:7、SEQ IDNO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、或SEQ ID NO:21的核苷酸序列或其子序列,以及SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、或SEQ ID NO:8、SEQ ID NO:10、SEQ IDNO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、或SEQ ID NO:22的氨基酸序列或其片段可以用于设计核酸探针,以根据本领域众所周知的方法自不同属或种的菌株鉴定和克隆编码具有内切葡聚糖酶活性之多肽的DNA。具体而言,遵循标准的Southern印迹方法,此类探针可用于与感兴趣的属或种的基因组或cDNA杂交,以鉴定和分离其中相应的基因。此类探针可明显短于完整序列,但长度上应为至少14、优选至少25、更优选至少35、和最优选至少70个核苷酸。然而,优选核酸探针长度上是至少100个核苷酸。例如,核酸探针长度上可以是至少200个核苷酸、优选至少300个核苷酸、更优选至少400个核苷酸、或最优选至少500个核苷酸。可以使用甚至更长的探针,例如长度上是至少600个核苷酸、至少优选至少700个核苷酸、更优选至少800个核苷酸、或最优选至少900个核苷酸的核酸探针。DNA和RNA两种探针都可使用。通常将探针标记用于检测相应的基因(例如用32P、3H、35S、生物素或抗生物素蛋白(avidin)标记)。此类探针涵盖在本发明中。
因此,可以对自此类其它生物体制备的基因组DNA或cDNA文库筛选与上文所述探针发生杂交且编码具有内切葡聚糖酶活性之多肽的DNA。可以通过琼脂糖或聚丙烯酰胺凝胶电泳或其它分离技术分离来自此类其它生物体的基因组或其它DNA。可以将来自文库的DNA或分离的DNA转移至硝酸纤维素或其它合适的载体材料并固定化于其上。为了鉴定与上文所述序列同源的克隆或DNA,将所述载体材料用在Southern印迹中。
就本发明而言,杂交表示核苷酸序列在很低的至很高的严格条件下与经过标记的核酸探针发生杂交,所述核酸探针对应于上文所述核苷酸序列之一。可使用X射线片来检测在这些条件下核酸探针与之发生杂交的分子。
对于长度为至少100个核苷酸的长探针,很低的至很高的严格条件定义为遵循标准的Southern印迹方法,在42℃,在5X SSPE,0.3%SDS,200μg/ml经剪切和变性的鲑精DNA,和25%甲酰胺(用于很低的和低的严格性)、35%甲酰胺(用于中等和中等-高的严格性)、或50%甲酰胺(用于很高的严格性)中进行预杂交和杂交,最佳的是12-24小时。
对于长度为至少100个核苷酸的长探针,将载体材料最终优选在45℃(很低的严格性)、更优选在50℃(低的严格性)、更优选在55℃(中等严格性)、更优选在60℃(中等-高的严格性)、甚至更优选在65℃(高的严格性)、和最优选在70℃(很高的严格性)使用2X SSC,0.2%SDS清洗三次各15分钟。
对于长度为约15个核苷酸至约70个核苷酸的短探针,严格条件定义为遵循标准的Southern印迹方法在比使用根据Bolton和McCarthy(1962,Proceedings of the National Academy of Sciences USA 48:1390)的算法得出的计算Tm低约5℃到约10℃的温度在0.9M NaCl,0.09M Tris-HCl pH7.6,6mMEDTA,0.5%NP-40,1X Denhardt氏溶液,1mM焦磷酸钠,1mM磷酸二氢钠,0.1mM ATP,和0.2mg/ml酵母RNA中进行预杂交、杂交和杂交后清洗,最佳的是12-24小时。
对于长度为约15个核苷酸至约70个核苷酸的短探针,将载体材料在比计算Tm低5℃到10℃的温度在6X SCC加0.1%SDS中清洗一次15分钟和使用6XSSC清洗两次各15分钟。
具有生物学活性之多肽及其多核苷酸
分泌很差或根本不分泌的任何多肽可用于本发明的方法。所述多肽可以是任何具有感兴趣生物学活性之多肽。所述具有生物学活性之多肽对于感兴趣的真菌宿主细胞而言可以是天然的或异源的(外来的)。术语“异源多肽”在本申请中定义为对于宿主细胞而言不是天然的多肽;或者为了改变天然多肽已经进行了结构修饰的天然多肽。
在优选的方面,多肽是抗体、抗原、抗微生物肽、酶、生长因子、激素、免疫扩张剂(immunodilator)、神经递质、受体、报道蛋白、或结构蛋白。
在另一个优选的方面,多肽是白蛋白、胶原、原弹性蛋白、弹性蛋白、或明胶。
在更优选的方面,多肽是氧化还原酶、转移酶、水解酶、裂合酶、异构酶、或连接酶。
在甚至更优选的方面,多肽是α-淀粉酶、α-1,3-葡聚糖酶、α-半乳糖苷酶、α-葡糖苷酶、α-1,6-甘露糖苷酶、氨肽酶、淀粉酶、***糖酶、β-琼脂(水解)酶β-淀粉酶、β-1,3-葡聚糖酶、β-1,6-葡聚糖酶、β-半乳糖苷酶、β-葡糖苷酶、β-甘露糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、壳聚糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、右旋糖苷酶、内切-1,4-β-半乳聚糖酶、内切-1,6-β-半乳聚糖酶、酯酶、岩藻糖苷酶、葡糖淀粉酶、葡糖脑苷脂酶、透明质酸酶、菊粉酶(inulinase)、转化酶、漆酶、果聚糖酶(levanase)、地衣淀粉酶(licheninase)、脂肪酶、溶菌酶、甘露糖苷酶、变位酶(mutanase)、氧化酶、果胶水解酶、过氧化物酶、磷脂酶、肌醇六磷酸酶、多聚半乳糖醛酸酶、多酚氧化酶、蛋白水解酶、鼠李半乳糖醛酸酶、鼠李糖苷酶、核糖核酸酶、海藻糖酶、转谷氨酰胺酶、糖基转移酶、尿激酶、或木聚糖酶。
在另一个甚至更优选的方面,多肽是纤维素分解酶或纤维素酶。纤维素分解酶的例子包括但不限于内切葡聚糖酶、纤维二糖水解酶、和β-葡糖苷酶。帮助纤维素分解酶作用的其它蛋白质为具有纤维素水解增强活性的多肽(参见例如WO 2005/074647,WO 2005/074656,和美国已公开申请2007/0077630)。
在最优选的方面,多肽是内切葡聚糖酶。在另一个最优选的方面,多肽是纤维二糖水解酶。在另一个最优选的方面,多肽是β-葡糖苷酶。在另一个最优选的方面,多肽是具有纤维素水解增强活性的多肽。
在另一个更优选的方面,多肽是半纤维素酶。半纤维素酶可分成三大类:攻击多糖链内的内部键的内切作用酶,自多糖链的还原端或非还原端渐进作用的外切作用酶,和水解木质素糖苷键的酯酶(如香豆酸酯酶和阿魏酸酯酶)、乙酰酯酶和辅助酶(Wong,K.K.Y.,Tan,L.U.L.,和Saddler,J.N.,1988,Multiplicity of β-1,4-xylanase in microorganisms:Functions and applications,Microbiol.Rev.52:305-317;Tenkanen,M.,和Poutanen,K.,1992,Significanceof esterases in the degradation of xylans,于Xylans and Xylanases,Visser,J.,Beldman,G.,Kuster-van Someren,M.A.,和Voragen,A.G.J.,编,Elsevier,New York,NY,203-212;Coughlan,M.P.,和Hazlewood,G.P.,1993,Hemicellulose and hemicellulases,Portland,London,UK;Brigham,J.S.,Adney,W.S.,和Himmel,M.E.,1996,Hemicellulases:Diversity and applications,于Handbook on Bioethanol:Production and Utilization,Wyman,C.E.,编,Taylor& Francis,Washington,DC,119-141)。
半纤维素酶包括但不限于木聚糖酶、***呋喃糖苷酶、乙酰木聚糖酯酶、葡糖醛酸糖苷酶(glucuronidase)、内切半乳聚糖酶、甘露聚糖酶、内切或外切***糖酶、外切半乳聚糖酶、及其混合物。内切作用的半纤维素酶和辅助酶的例子包括但不限于内切***聚糖酶、内切***半乳聚糖酶、内切葡聚糖酶、内切甘露聚糖酶、内切木聚糖酶、和阿魏酰***木聚糖(feraxan)内切木聚糖酶。外切作用的半纤维素酶和辅助酶的例子包括但不限于α-L-***糖苷酶、β-L-***糖苷酶、α-1,2-L-岩藻糖苷酶、α-D-半乳糖苷酶、β-D-半乳糖苷酶、β-D-葡糖苷酶、β-D-葡糖醛酸糖苷酶、β-D-甘露糖苷酶、β-D-木糖苷酶、外切葡糖苷酶、外切纤维二糖水解酶、外切甘露二糖水解酶、外切甘露聚糖酶、外切木聚糖酶、木聚糖α-葡糖醛酸糖苷酶、和松柏苷β-葡糖苷酶。酯酶的例子包括但不限于乙酰酯酶(乙酰半乳聚糖酯酶、乙酰甘露聚糖酯酶、和乙酰木聚糖酯酶)和芳基酯酶(香豆酸酯酶和阿魏酸酯酶)。
在另一个最优选的方面,多肽是木聚糖酶。在另一个最优选的方面,多肽是木葡聚糖酶。在另一个最优选的方面,多肽是***呋喃糖苷酶。在另一个最优选的方面,多肽是葡糖醛酸糖苷酶,例如α-葡糖醛酸糖苷酶。在另一个最优选的方面,多肽是内切半乳聚糖酶。在另一个最优选的方面,多肽是甘露聚糖酶。在另一个最优选的方面,多肽是内切***糖酶。在另一个最优选的方面,多肽是外切***糖酶。在另一个最优选的方面,多肽是内切***聚糖酶。在另一个最优选的方面,多肽是内切***半乳聚糖酶。在另一个最优选的方面,多肽是内切葡聚糖酶。在另一个最优选的方面,多肽是内切甘露聚糖酶。在另一个最优选的方面,多肽是内切木聚糖酶。在另一个最优选的方面,多肽是阿魏酰***木聚糖内切木聚糖酶。在另一个最优选的方面,多肽是α-L-***糖苷酶。在另一个最优选的方面,多肽是β-L-***糖苷酶。在另一个最优选的方面,多肽是β-葡聚糖酶。在另一个最优选的方面,多肽是α-1,2-L-岩藻糖苷酶。在另一个最优选的方面,多肽是α-D-半乳糖苷酶。在另一个最优选的方面,多肽是β-D-半乳糖苷酶。在另一个最优选的方面,多肽是β-D-葡糖苷酶。在另一个最优选的方面,多肽是β-D-葡糖醛酸糖苷酶。在另一个最优选的方面,多肽是β-D-甘露糖苷酶。在另一个最优选的方面,多肽是β-D-木糖苷酶。在另一个最优选的方面,多肽是外切葡糖苷酶。在另一个最优选的方面,多肽是外切甘露二糖水解酶。在另一个最优选的方面,多肽是外切甘露聚糖酶。在另一个最优选的方面,多肽是外切木聚糖酶。在另一个最优选的方面,多肽是木聚糖α-葡糖醛酸糖苷酶。在另一个最优选的方面,多肽是松柏苷β-葡糖苷酶。
在另一个更优选的方面,多肽是酯酶。在用于本申请时,“酯酶”也称为羧酸酯水解酶,指作用于酯键的酶,包括根据酶命名法(EnzymeNomenclature,1992,Academic Press,San Diego,California,及Supplement(补遗)1(1993),Supplement 2(1994),Supplement 3(1995),Supplement 4(1997)和Supplement 5,分别于Eur.J.Biochem.223:1-5,1994;Eur.J.Biochem.232:1-6,1995;Eur.J.Biochem.237:1-5,1996;Eur.J.Biochem.250:1-6,1997;和Eur.J.Biochem.264:610-650,1999)归入EC 3.1.1羧酸酯水解酶的酶。酯酶的非限制性例子包括芳基酯酶、三酰甘油脂肪酶、乙酰酯酶、乙酰胆碱酯酶、胆碱酯酶、托品酯酶、果胶酯酶、固醇酯酶、叶绿素酶、L-***糖酸内酯酶、葡萄糖酸内酯酶、尿内酯酶、鞣酶、棕榈酸视黄酯酯酶、羟基丁酸二聚体水解酶、酰基甘油脂肪酶、3-氧己二酸根烯醇-内酯酶、1,4-内酯酶、半乳糖脂肪酶、4-吡哆醇内酯酶、酰基肉碱水解酶、氨酰-tRNA水解酶、D-***糖酸内酯酶、6-磷酸葡萄糖酸内酯酶、磷脂酶A1、6-乙酰葡萄糖脱乙酰基酶、脂蛋白脂肪酶、二氢香豆素脂肪酶、柠檬苦素-D-环-内酯酶、类固醇-内酯酶、三乙酸根-内酯酶、放线菌素内酯酶、苔色酸根-缩酚酸水解酶、头孢菌素-C脱乙酰基酶、绿原酸根水解酶、α-氨基酸酯酶、4-甲基草酰乙酸根酯酶、羧基甲烯丁烯羟酸内酯酶(carboxymethylenebutenolidase)、脱氧limonateA-环-内酯酶、2-乙酰基-1-烃基甘油磷酸胆碱酯酶、镰孢氨酸-C鸟氨酸酯酶、芥子碱酯酶、蜡酯水解酶、佛波二酯水解酶、磷脂酰肌醇脱酰基酶、唾液酸根O-乙酰酯酶、乙酰氧基丁炔基并噻吩脱乙酰基酶、乙酰水杨酸根脱乙酰基酶、乙酸甲基伞形基酯脱乙酰基酶、2-吡喃酮-4,6-二羧酸根内酯酶、N-乙酰半乳糖胺聚糖脱乙酰基酶、保幼-激素酯酶、双(2-乙基己基)酞酸根酯酶、蛋白质-谷氨酸根甲基酯酶、11-顺式-棕榈酸视黄酯水解酶、全-反式-棕榈酸视黄酯水解酶、L-鼠李糖-1,4-内酯酶、5-(3,4-双乙酸基丁-1-炔基)-2,2′-并噻吩脱乙酰基酶、脂肪-酰基-乙基-酯合酶、木糖-1,4-内酯酶、N-乙酰葡萄糖胺基磷脂酰肌醇脱乙酰基酶、西曲酸酯苄基酯酶、和乙酰基烃基甘油乙酰水解酶。可用于纤维素生物转化的酯酶包括乙酰酯酶,如乙酰半乳聚糖酯酶、乙酰甘露聚糖酯酶、和乙酰木聚糖酯酶,及水解木质素糖苷键的酯酶,如香豆酸酯酶和阿魏酸酯酶。
在另一个最优选的方面,多肽是乙酰酯酶。在另一个最优选的方面,多肽是乙酰半乳聚糖酯酶。在另一个最优选的方面,多肽是乙酰甘露聚糖酯酶。在另一个最优选的方面,多肽是乙酰木聚糖酯酶。在另一个最优选的方面,多肽是芳基酯酶。在另一个最优选的方面,多肽是香豆酸酯酶。在另一个最优选的方面,多肽是阿魏酸酯酶。
在另一个更优选的方面,多肽是脂肪酶。在另一个更优选的方面,多肽是磷脂酶,例如磷脂酶A1、磷脂酶A2、磷脂酶C、磷脂酶C、或磷脂酶D。
在另一个更优选的方面,多肽是角质酶。
在另一个最优选的方面,多肽是葡萄糖异构酶。在另一个最优选的方面,多肽是木糖异构酶。
在另一个更优选的方面,多肽是蛋白水解酶。蛋白酶是本领域众所周知的,指催化肽键切割的酶。
在另一个最优选的方面,多肽是丝氨酸蛋白酶。在另一个最优选的方面,多肽是金属蛋白酶。在另一个最优选的方面,多肽是硫醇(thiol)蛋白酶。
在另一个更优选的方面,多肽是肽酶。在另一个最优选的方面,多肽是氨肽酶,例如二肽基氨肽酶或三肽基氨肽酶。在另一个最优选的方面,多肽是羧肽酶。
在另一个更优选的方面,多肽是漆酶。
在另一个更优选的方面,多肽是过氧化物酶。
在另一个更优选的方面,多肽是淀粉降解酶。在另一个最优选的方面,多肽是α-淀粉酶。在另一个最优选的方面,多肽是淀粉葡糖苷酶。在另一个最优选的方面,多肽是支链淀粉酶。在另一个最优选的方面,多肽是脱支酶。在另一个最优选的方面,多肽是环糊精糖基转移酶。
编码具有生物学活性之多肽的催化结构域、成熟多肽、或全长多肽,或其部分的多核苷酸可以自任何生物体获得。
编码具有生物学活性之多肽的多核苷酸可以自编码细菌多肽的基因获得。例如,多肽可以是***多肽,包括但不限于芽孢杆菌属、链球菌属、链霉菌属、葡萄球菌属、肠球菌属、乳杆菌属、乳球菌属、梭菌属、地芽孢杆菌属或Oceanobacillus多肽;或者革兰氏阴性细菌多肽,包括但不限于大肠埃希氏菌或大肠杆菌、假单胞菌属、沙门氏菌属、弯曲杆菌属、螺杆菌属、黄杆菌属、梭杆菌属、泥杆菌属、奈瑟氏菌属或脲原体属多肽。
在优选的方面,编码具有生物学活性之多肽的多核苷酸可以自编码如下多肽的基因获得:嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、或苏云金芽孢杆菌多肽。
在另一个优选的方面,编码具有生物学活性之多肽的多核苷酸可以自编码如下多肽的基因获得:似马链球菌、酿脓链球菌、***链球菌、或马链球菌兽瘟亚种多肽。
在另一个优选的方面,编码具有生物学活性之多肽的多核苷酸可以自编码如下多肽的基因获得:不产色链霉菌(Streptomyces achromogenes)、阿维链霉菌(Streptomyces avermitilis)、天蓝链霉菌(Streptomyces coelicolor)、灰色链霉菌(Streptomyces griseus)、或浅青紫链霉菌多肽。
编码具有生物学活性之多肽的多核苷酸也可以自编码真菌多肽基因获得,更优选酵母多肽,如假丝酵母属、克鲁维酵母属、毕赤酵母属、糖酵母属或酵母属、裂殖糖酵母属或裂殖酵母属、或耶氏酵母(西洋蓍霉)属多肽;或更优选丝状真菌多肽,如枝顶孢霉属、蘑菇属(Agaricus)、链格孢属(Alternaria)、曲霉属、短梗霉属、葡萄座腔菌属(Botryospaeria)、拟蜡菌属(Ceriporiopsis)、毛壳霉属(Chaetomidium)、金孢子菌属(Chrysosporium)、麦角菌属(Claviceps)、旋孢霉属(Cochliobolus)、鬼伞属(Coprinopsis)、Coptotermes、棒囊壳属(Corynascus)、隐球丛赤壳属(Cryphonectria)、隐球菌属、色二孢属(Diplodia)、黑耳属(Exidia)、篮状菌属(Filibasidium)、镰孢属、赤霉属(Gibberella)、全鞭毛虫属(Holomastigotoides)、腐质霉属、耙菌属(Irpex)、香菇属(Lentinula)、小球腔菌属(Leptospaeria)、梨孢菌属、Melanocarpus、亚灰树花菌属(Meripilus)、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属(Phanerochaete)、瘤胃壶菌属、Poitrasia、假黑盘菌属(Pseudoplectania)、Pseudotrichonympha、根毛霉属(Rhizomucor)、裂褶菌属、柱霉属(Scytalidium)、踝节菌属、热子囊菌属、梭孢壳属、弯颈霉属、木霉属、长毛盘菌属(Trichophaea)、轮枝孢属(Verticillium)、小包脚菇属(Volvariella)、或炭角菌属(Xylaria)多肽。
在优选的方面,编码具有生物学活性之多肽的多核苷酸可以自编码如下多肽的基因获得:卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母、或卵形酵母多肽。
在另一个优选的方面,编码具有内切葡聚糖酶活性之多肽的多核苷酸可以自编码如下多肽的基因获得:纤维分解枝顶孢霉(Acremoniumcellulolyticus)、棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、嗜角质金孢子菌(Chrysosporium keratinophilum)、Chrysosporium lucknowense、热带金孢子菌(Chrysosporium tropicum)、Chrysosporium merdarium、Chrysosporium inops、毡金孢子菌(Chrysosporiumpannicola)、Chrysosporium queenslandicum、Chrysosporium zonatum、Cladorrhinum foecundissimum、杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、灰色腐质酶(Humicola grisea)、特异腐质霉、疏棉状腐质霉、乳色耙菌(Irpex lacteus)、米赫毛霉、嗜热毁丝霉、粗糙脉孢菌、绳状青霉(Penicillium funiculosum)、产紫青霉、黄孢平革菌(Phanerochaetechrysosporium)、无色梭孢壳、Thielavia albomyces、Thielavia albopilosa、Thielavia australeinsis、Thielavia fimeti、小孢梭孢壳、卵孢梭孢壳、Thielaviaperuviana、瘤孢梭孢壳、毛梭孢壳、Thielavia subthermophila、土生梭孢霉、Thielavia variospora、Thielavia wareingii、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、或绿色木霉多肽。
在一个特别优选的方面,具有生物学活性之多肽是β-葡糖苷酶。可用作本发明方法中的多核苷酸来源的β-葡糖苷酶的例子包括但不限于米曲霉β-葡糖苷酶(WO 02/095014;WO 04/099228);棘孢曲霉β-葡糖苷酶(Kawaguchi等,1996,Gene 173:287-288);燕麦曲霉(Aspergillus avenaceus)(GENBANKTM登录号AY943971);烟曲霉(GENBANKTM登录号XM745234);川地曲霉(GENBANKTM登录号AB003470);黑曲霉(GENBANKTM AJ132386);灰色梨孢菌(Magnaporthe grisea)(GENBANKTM登录号AY849670);黄孢平革菌(GENBANKTM登录号AB253327);埃默森篮状菌(Talaromyces emersonii)(GENBANKTM登录号AY072918);和里氏木霉(GENBANKTM登录号U09580,AB003110,AY281374,AY281375,AY281377,AY281378,和AY281379)。β-葡糖苷酶变体也可用作多核苷酸来源,如WO 04/099228中披露的那些。
在优选的方面,β-葡糖苷酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自家族1β-葡糖苷酶基因获得的多核苷酸编码的。
在另一个优选的方面,β-葡糖苷酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自家族3β-葡糖苷酶基因获得的多核苷酸编码的。
在另一个优选的方面,β-葡糖苷酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自米曲霉β-葡糖苷酶基因获得的多核苷酸编码的。在最优选的方面,β-葡糖苷酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自米曲霉β-葡糖苷酶基因或米曲霉β-葡糖苷酶突变体基因获得的多核苷酸编码的,所述米曲霉β-葡糖苷酶基因包含编码SEQ ID NO:24之多肽的SEQID NO:23,所述米曲霉β-葡糖苷酶突变体基因包含编码SEQ ID NO:26之多肽的SEQ ID NO:25。
在另一个优选的方面,β-葡糖苷酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自烟曲霉β-葡糖苷酶基因获得的多核苷酸编码的。在最优选的方面,β-葡糖苷酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自烟曲霉β-葡糖苷酶基因获得的多核苷酸编码的,所述烟曲霉β-葡糖苷酶基因包含编码SEQ ID NO:28之多肽的SEQ ID NO:27。
在另一个优选的方面,β-葡糖苷酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自巴西青霉(Penicillium brasilianum)菌株IBT 20888β-葡糖苷酶基因获得的多核苷酸编码的。在最优选的方面,β-葡糖苷酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自巴西青霉菌株IBT 20888β-葡糖苷酶基因获得的多核苷酸编码的,所述巴西青霉菌株IBT 20888β-葡糖苷酶基因包含编码SEQ ID NO:30之多肽的SEQ ID NO:29。
在另一个优选的方面,β-葡糖苷酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自里氏木霉菌株No.QM9414β-葡糖苷酶基因获得的多核苷酸编码的。在另一个最优选的方面,β-葡糖苷酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自里氏木霉菌株No.QM9414β-葡糖苷酶基因获得的多核苷酸编码的,所述里氏木霉菌株No.QM9414β-葡糖苷酶基因包含编码SEQ ID NO:32之多肽的SEQ ID NO:31(GENBANKTM登录号U09580)。
在另一个优选的方面,β-葡糖苷酶是天然分泌的。在另一个优选的方面,β-葡糖苷酶不是天然分泌的。
在另一个优选的方面,β-葡糖苷酶的全长多肽、成熟多肽、或催化结构域,或其部分是由自编码同源多肽的基因获得的多核苷酸编码的,所述同源多肽包含氨基酸序列,该氨基酸序列与SEQ ID NO:24、SEQ ID NO:26、SEQID NO:28、SEQ ID NO:30、或SEQ ID NO:32之全长多肽、成熟多肽、或催化结构域的氨基酸序列具有至少60%、优选至少65%、更优选至少70%、更优选至少75%、更优选至少80%、更优选至少85%、甚至更优选至少90%、最优选至少95%、且甚至最优选96%、97%、98%、或99%的同一性程度,其具有内切葡聚糖酶活性。在优选的方面,同源多肽具有与SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、或SEQ ID NO:32之全长多肽、成熟多肽、或催化结构域差别为10个氨基酸、优选5个氨基酸、更优选4个氨基酸、甚至更优选3个氨基酸、最优选2个氨基酸、且甚至最优选1个氨基酸的氨基酸序列。
在另一个优选的方面,β-葡糖苷酶的全长多肽、成熟多肽、或催化结构域,或其部分是由如下多核苷酸编码的,所述多核苷酸在很低的严格条件、优选低的严格条件、更优选中等严格条件、更优选中等-高的严格条件、甚至更优选高的严格条件、和最优选很高的严格条件下与(i)SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、或SEQ ID NO:31,(ii)SEQID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、或SEQ ID NO:31中所包含的cDNA序列,(iii)(i)或(ii)的子序列,或(iv)(i)、(ii)或(iii)的互补链发生杂交(J.Sambrook,E.F.Fritsch,和T.Maniatis,1989,Molecular Cloning,A Laboratory Manual,第2版,Cold Spring Harbor,New York)。SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、或SEQ ID NO:31的子序列包含至少100个连续的核苷酸或优选至少200个连续的核苷酸。
SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、或SEQ ID NO:31的核苷酸序列或其子序列,以及SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、或SEQ ID NO:32的氨基酸序列或其片段可以用于设计核酸探针,以根据本领域众所周知的方法自不同属或种的菌株鉴定和克隆编码具有β-葡糖苷酶活性之多肽的DNA。具体而言,遵循标准的Southern印迹方法,此类探针可用于与感兴趣的属或种的基因组或cDNA杂交,以鉴定和分离其中相应的基因。此类探针可明显短于完整序列,但长度上应为至少14、优选至少25、更优选至少35、和最优选至少70个核苷酸。然而,优选核酸探针长度上是至少100个核苷酸。例如,核酸探针长度上可以是至少200个核苷酸、优选至少300个核苷酸、更优选至少400个核苷酸、或最优选至少500个核苷酸。可以使用甚至更长的探针,例如长度上是至少600个核苷酸、至少优选至少700个核苷酸、更优选至少800个核苷酸、或最优选至少900个核苷酸的核酸探针。DNA和RNA两种探针都可使用。通常将探针标记以检测相应的基因(例如用32P、3H、35S、生物素或抗生物素蛋白标记)。此类探针涵盖在本发明中。
信号肽
信号肽可以是由用于本发明融合蛋白胞外分泌的宿主细胞识别的任何适宜信号肽。信号序列优选是与待表达融合蛋白的内切葡聚糖酶构件天然相关的信号序列。
编码多肽的核苷酸序列的编码序列的5’端可以内在地包含与编码分泌型多肽的编码区区段以符合翻译读码框的方式天然相连接的信号肽编码区。或者,编码序列的5’端可以包含对于编码序列而言是外来的信号肽编码区。在编码序列天然不包含信号肽编码区的情况中,可能需要外来信号肽编码区。或者,外来信号肽编码区可以仅仅替换天然信号肽编码区,以增强多肽的分泌。然而,本发明可使用指导所表达融合蛋白进入所选宿主细胞的分泌途径,即分泌入培养基的任何信号肽编码区。
对于丝状真菌宿主细胞有效的信号肽编码序列是自以下酶的基因获得的信号肽编码序列:米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米赫根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、和疏棉状腐质霉脂肪酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、和里氏木霉β-木糖苷酶。
对于酵母宿主细胞有用的信号肽编码序列是自以下酶的基因获得的:酿酒酵母α-因子和酿酒酵母转化酶。其它有用的信号肽编码序列披露于Romanos等,1992,见上文。
在优选的方面,信号肽编码序列得自编码内切葡聚糖酶的基因。在更优选的方面,信号肽编码序列得自编码内切葡聚糖酶V的基因。在甚至更优选的方面,信号肽编码序列得自编码内切葡聚糖酶V的特异腐质霉基因。在最优选的方面,信号肽编码序列编码SEQ ID NO:2的氨基酸1-21。在另一个最优选的方面,信号肽编码序列是SEQ ID NO:1的核苷酸1-63。
融合蛋白可以进一步包含与融合蛋白的β-葡糖苷酶构件相关的第二信号肽。信号肽编码序列可以是与具有生物学活性之多肽的编码序列天然相关的信号肽编码序列,或者可以是不同的信号肽编码序列,如上文所述那些之一。
在优选的方面,信号肽编码序列是与β-葡糖苷酶编码序列天然相关的序列。
接头
如上所述,许多内切葡聚糖酶具有多结构域结构,其由通过接头肽与一个或几个碳水化合物结合模块分隔开的催化结构域组成。在本发明的方法中,融合蛋白构建体可进一步包含接头编码序列,其位于包含内切葡聚糖酶的催化结构域的序列的3′和包含具有生物学活性之多肽的催化结构域的序列的5′。
接头可以自与内切葡聚糖酶的催化结构域相同的基因获得,或者自不同的内切葡聚糖酶基因获得。另一方面,接头可以是合成起源的。
可用于本发明方法的接头的例子包括但不限于自以下酶的基因获得的接头:里氏木霉纤维二糖水解酶I(Srisodsuk等,1993,Journal of BiologicalChemistry 268:20765-20761);红褐肉座菌(Hypocrea jecorina)(以前的里氏木霉)Cel7A纤维二糖水解酶(Mulakala等,2005,Proteins 60:598-605);特异腐质霉内切葡聚糖酶V;和土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶。
在优选的方面,接头得自特异腐质霉内切葡聚糖酶基因。在另一个优选的方面,接头得自里氏木霉内切葡聚糖酶基因。在更优选的方面,接头得自特异腐质霉内切葡聚糖酶V(eg5)基因。
在另一个优选的方面,接头得自土生梭孢霉内切葡聚糖酶基因。在另一个更优选的方面,接头得自土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶基因。
在优选的方面,接头是至少5个氨基酸残基。在更优选的方面,接头是至少15个氨基酸残基。在最优选的方面,接头是至少25个氨基酸残基。
在优选的方面,接头为约5个-约60个氨基酸残基。在更优选的方面,接头为约15个-约50个氨基酸残基。在最优选的方面,接头为约25个-约45个氨基酸残基。
碳水化合物结合模块
碳水化合物结合模块(CBM)定义为具有离散折叠结构(discrete fold)(其具有碳水化合物结合活性)且常见于碳水化合物活性酶内的连续氨基酸序列。许多类型的CBM已有记载,其中大多数结合不溶性多糖(参见Boraston等,2004,Biochem J.382:769-781)。
碳水化合物结合模块已经表征为介导与例如结晶纤维素、非结晶纤维素、几丁质、β-1,3-葡聚糖和β-1,3-1,4-混合连接的葡聚糖、木聚糖、甘露聚糖、半乳聚糖和淀粉的相互作用。碳水化合物结合模块频繁出现于多结构域纤维素酶中。虽然有些CBM赋予对碳水化合物结构子集的特异性结合,但是其它CBM在它们与各种多糖结合的能力方面是更普遍性的。赋予对纤维素的结合的CBM有时称为纤维素结合结构域或CBD(Boraston等,2004,Biochem J.382:769-781)。CBM根据氨基酸相似性来分组;当前记载了48个CBM家族。
糖苷水解酶可以包含超过一个催化结构域和一个、两个、三个、或更多个CBM,且任选进一步包含一个或几个将CBM与催化结构域连接的多肽氨基酸序列区,后一种类型的区常常称为“接头”。包含CBM的水解酶的例子有纤维素酶、木聚糖酶、甘露聚糖酶、***呋喃糖苷酶(arabinofuranosidase)、乙酰酯酶和几丁质酶(参见P.Tomme等,Cellulose-Binding Domains-Classification和Properties in Enzymatic Degradation of Insoluble Carbohydrates,John N.Saddler和Michael H.Penner(编),ACS Symposium Series,No.618,1996)。
CBM可以位于蛋白质或多肽的N或C端或者位于内部位置。多肽或蛋白质中构成CBM的区域通常由超过约30个且不足约250个氨基酸残基组成。例如,家族I中列举和归类的那些CBM由33-37个氨基酸残基组成,家族2a中列举和归类的那些由95-108个氨基酸残基组成,而家族6中列举和归类的那些由85-92个氨基酸残基组成。因而,构成CBM的氨基酸序列的分子量通常在约4kDa至约40kDa的范围内,通常低于(below)约35kDa。
在本发明的方法中,可以使用任何CBM。CBM可以是与内切葡聚糖酶天然相关的,或者对于内切葡聚糖酶而言可以是外来的。
在优选的方面,CBM得自里氏木霉内切葡聚糖酶(EG)基因。在更优选的方面,CBM得自里氏木霉内切葡聚糖酶EGI基因。在另一个更优选的方面,CBM得自里氏木霉内切葡聚糖酶EGII基因。在另一个更优选的方面,CBM得自里氏木霉内切葡聚糖酶EGV基因。
在另一个优选的方面,CBM得自里氏木霉纤维二糖水解酶(CBH)基因。在另一个优选的方面,CBM得自里氏木霉CBHI基因(Terri等,1987,Gene 51:42-52;Linder和Teeri,1996,Biochemistry 93:12251-12255)。在另一个优选的方面,CBM得自里氏木霉CBHII基因。
在另一个优选的方面,CBM得自土生梭孢霉内切葡聚糖酶基因。在另一个更优选的方面,CBM得自土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶基因。
切割位点
在本发明的方法中,融合蛋白构建体可以进一步包含编码切割位点的核苷酸序列。切割位点优选位于包含内切葡聚糖酶的至少催化结构域的序列和包含具有生物学活性之多肽的至少催化结构域的序列之间。在融合蛋白分泌后,所述位点受到切割,自融合蛋白释放具有生物学活性之多肽。
切割位点的例子包括但不限于编码二肽Lys-Arg的Kex2位点(Martin等,2003,J.Ind.Microbiol.Biotechnol.3:568-76;Svetina等,2000,J.Biotechnol.76:245-251;Rasmussen-Wilson等,1997,Appl.Environ.Microbiol.63:3488-3493;Ward等,1995,Biotechnology 13:498-503;和Contreras等,1991,Biotechnology9:378-381)、Ile-(Glu或Asp)-Gly-Arg位点(其在精氨酸残基之后受到因子Xa蛋白酶切割)(Eaton等,1986,Biochem.25:505-512);Asp-Asp-Asp-Asp-Lys位点(其在赖氨酸之后受到肠激酶的切割)(Collins-Racie等,1995,Biotechnology13:982-987);His-Tyr-Glu位点或His-Tyr-Asp位点(其受到Genenase I的切割)(Carter等,1989,Proteins:Structure,Function,and Genetics 6:240-248);Leu-Val-Pro-Arg-Gly-Ser位点(其在Arg之后受到凝血酶的切割)(Stevens,2003,Drug Discovery World 4:35-48);Glu-Asn-Leu-Tyr-Phe-Gln-Gly位点(其在Gln之后受到TEV蛋白酶的切割)(Stevens,2003,见上文);和Leu-Glu-Val-Leu-Phe-Gln-Gly-Pro位点(其在Gln之后受到遗传工程形式的人鼻病毒3C蛋白酶的切割)(Stevens,2003,见上文)。
融合蛋白
本发明具有生物学活性的融合蛋白(其包含信号肽、内切葡聚糖酶的至少催化结构域或其部分、和具有生物学活性之多肽的至少催化结构域或其部分)与不存在所述内切葡聚糖酶的至少催化结构域或其部分时相比提高融合蛋白的分泌。在下文每一个优选的方面,融合蛋白的构件自蛋白质的N端至C端以符合读码框的方式相连接。
在优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的催化结构域;和具有生物学活性之多肽的催化结构域。
在另一个优选的方面,融合蛋白包含信号肽;具有生物学活性之多肽的催化结构域;和内切葡聚糖酶的催化结构域。
在另一个优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的成熟多肽;和具有生物学活性之多肽的催化结构域。
在另一个优选的方面,融合蛋白包含信号肽;具有生物学活性之多肽的催化结构域;和内切葡聚糖酶的成熟多肽。
在另一个优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的催化结构域;和具有生物学活性之多肽的成熟多肽。
在另一个优选的方面,融合蛋白包含信号肽;具有生物学活性之多肽的成熟多肽;和内切葡聚糖酶的催化结构域。
在另一个优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的成熟多肽;和具有生物学活性之多肽的成熟多肽。
在另一个优选的方面,融合蛋白包含信号肽;具有生物学活性之多肽的成熟多肽;和内切葡聚糖酶的成熟多肽。
在另一个优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的催化结构域;和具有生物学活性之多肽的全长多肽。
在另一个优选的方面,融合蛋白包含信号肽;具有生物学活性之多肽的全长多肽;和内切葡聚糖酶的催化结构域。
在另一个优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的成熟多肽;和具有生物学活性之多肽的全长多肽。
在另一个优选的方面,融合蛋白包含信号肽;具有生物学活性之多肽的全长多肽;和内切葡聚糖酶的成熟多肽。
在另一个优选的方面,融合蛋白包含内切葡聚糖酶的全长多肽(信号肽和成熟多肽);和具有生物学活性之多肽的全长多肽。
在另一个优选的方面,融合蛋白包含具有生物学活性之多肽的全长多肽和内切葡聚糖酶的全长多肽(信号肽和成熟多肽)。
在另一个优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的催化结构域、接头和/或碳水化合物结合模块;和具有生物学活性之多肽的催化结构域。
在另一个优选的方面,融合蛋白包含信号肽;具有生物学活性之多肽的催化结构域、接头和/或碳水化合物结合模块;和内切葡聚糖酶的催化结构域。
在另一个优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的成熟多肽、接头和/或碳水化合物结合模块;和具有生物学活性之多肽的催化结构域。
在另一个优选的方面,融合蛋白包含信号肽;具有生物学活性之多肽的催化结构域、接头和/或碳水化合物结合模块;和内切葡聚糖酶的成熟多肽。
在另一个优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的催化结构域、接头和/或碳水化合物结合模块;和具有生物学活性之多肽的成熟多肽。
在另一个优选的方面,融合蛋白包含信号肽;具有生物学活性之多肽的成熟多肽、接头和/或碳水化合物结合模块;和内切葡聚糖酶的催化结构域。
在另一个优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的成熟多肽、接头和/或碳水化合物结合模块;和具有生物学活性之多肽的成熟多肽。
在另一个优选的方面,融合蛋白包含信号肽;具有生物学活性之多肽的成熟多肽、接头和/或碳水化合物结合模块;和内切葡聚糖酶的成熟多肽。
在另一个优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的催化结构域、接头和/或碳水化合物结合模块;和具有生物学活性之多肽的全长多肽。
在另一个优选的方面,融合蛋白包含信号肽;具有生物学活性之多肽的全长多肽、接头和/或碳水化合物结合模块;和内切葡聚糖酶的催化结构域。
在另一个优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的成熟多肽、接头和/或碳水化合物结合模块;和具有生物学活性之多肽的全长多肽。
在另一个优选的方面,融合蛋白包含信号肽;具有生物学活性之多肽的全长多肽、接头和/或碳水化合物结合模块;和内切葡聚糖酶的成熟多肽。
在另一个优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的催化结构域;第二信号肽;和具有生物学活性之多肽的催化结构域。
在另一个优选的方面,融合蛋白包含信号肽;具有生物学活性之多肽的催化结构域;第二信号肽;和内切葡聚糖酶的催化结构域。
在另一个优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的成熟多肽;第二信号肽;和具有生物学活性之多肽的催化结构域。
在另一个优选的方面,融合蛋白包含信号肽;具有生物学活性之多肽的催化结构域;第二信号肽;和内切葡聚糖酶的成熟多肽。
在另一个优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的催化结构域;第二信号肽;和具有生物学活性之多肽的成熟多肽。
在另一个优选的方面,融合蛋白包含信号肽;具有生物学活性之多肽的成熟多肽;第二信号肽;和内切葡聚糖酶的催化结构域。
在另一个优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的成熟多肽;第二信号肽;和具有生物学活性之多肽的成熟多肽。
在另一个优选的方面,融合蛋白包含信号肽;具有生物学活性之多肽的成熟多肽;第二信号肽;和内切葡聚糖酶的成熟多肽。
在另一个优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的催化结构域、接头和/或碳水化合物结合模块;第二信号肽;和具有生物学活性之多肽的催化结构域。
在另一个优选的方面,融合蛋白包含信号肽;具有生物学活性之多肽的催化结构域、接头和/或碳水化合物结合模块;第二信号肽;和内切葡聚糖酶的催化结构域。
在另一个优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的成熟多肽、接头和/或碳水化合物结合模块;第二信号肽;和具有生物学活性之多肽的催化结构域。
在另一个优选的方面,融合蛋白包含信号肽;具有生物学活性之多肽的催化结构域、接头和/或碳水化合物结合模块;第二信号肽;和内切葡聚糖酶的成熟多肽。
在另一个优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的催化结构域、接头和/或碳水化合物结合模块;第二信号肽;和具有生物学活性之多肽的成熟多肽。
在另一个优选的方面,融合蛋白包含信号肽;具有生物学活性之多肽的成熟多肽、接头和/或碳水化合物结合模块;第二信号肽;和内切葡聚糖酶的催化结构域。
在另一个优选的方面,融合蛋白包含信号肽;内切葡聚糖酶的成熟多肽、接头和/或碳水化合物结合模块;第二信号肽;和具有生物学活性之多肽的成熟多肽。
在另一个优选的方面,融合蛋白包含信号肽;和具有生物学活性之多肽的成熟多肽、接头和/或碳水化合物结合模块;第二信号肽;和内切葡聚糖酶的成熟多肽。
或者,在另一个优选的方面,对于上文每一个优选的方面,融合蛋白可以包含内切葡聚糖酶或具有生物学活性之多肽的催化结构域、成熟多肽、或全长多肽的一部分。内切葡聚糖酶的一部分可以具有或不具有内切葡聚糖酶活性。在更优选的方面,内切葡聚糖酶的一部分具有内切葡聚糖酶活性。
启动子
启动子区可以是受到用于融合蛋白表达的宿主细胞识别的任何适宜启动子序列。启动子序列包含介导多肽表达的转录控制序列。启动子可以是在所选择宿主细胞中显示出转录活性的任何核苷酸序列,包括突变的、截短的、串联的、和杂合的启动子,而且可以自编码胞外或胞内多肽的基因获得,所述基因对于宿主细胞而言可以是天然的或外来的(异源的)。启动子的例子包括组成型启动子和诱导型启动子二者。
用于指导本发明的融合蛋白构建体转录,尤其是在细菌宿主细胞中转录的合适启动子的实例是从下述获得的启动子:大肠杆菌lac操纵子、天蓝色链霉菌(Streptomyces coelicolor)琼脂糖酶基因(dagA)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌产麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因、及原核β-内酰胺酶基因(Villa-Kamaroff等,1978,Proceedings of the National Academy of SciencesUSA 75:3727-3731),以及tac启动子(DeBoer等,1983,Proceedings of theNational Academy of Sciences USA 80:21-25)。另外的启动子记载于″Usefulproteins from recombinant bacteria″于Scientific American,1980,242:74-94;及Sambrook等,1989,见上文。
用于指导本发明的融合蛋白构建体在丝状真菌宿主细胞中转录的合适启动子的实例是从以下酶的基因获得的启动子:米曲霉TAKA淀粉酶、米赫根毛霉天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、构巢曲霉乙酰胺酶、镶片镰孢淀粉葡糖苷酶(WO00/56900)、镶片镰孢Daria(WO 00/56900)、镶片镰孢Quinn(WO 00/56900)、尖镰孢胰蛋白酶样蛋白酶(WO 96/00787)、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶、灰盖鬼伞(Coprinus cinereus)β-微管蛋白、和里氏木霉Swollenin,以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉丙糖磷酸异构酶基因的启动子的杂合体);和它们的突变的、截短的和杂合的启动子。
在酵母宿主中,有用的启动子从如下酶的基因获得:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1,ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)、和酿酒酵母3-磷酸甘油酸激酶。对于酵母宿主细胞其它有用的启动子记载于Romanos等,1992,Yeast 8:423-488。
在优选的方面,启动子是纤维二糖水解酶启动子。在更优选的方面,启动子是纤维二糖水解酶I(cbh1)启动子。在甚至更优选的方面,启动子是里氏木霉纤维二糖水解酶I基因(cbh1)启动子。在最优选的方面,启动子是SEQ IDNO:29(GENBANKTM登录号D86235)的核苷酸505-1501之里氏木霉cbh1启动子。在另一个更优选的方面,启动子是纤维二糖水解酶II(cbh2)启动子。在另一个甚至更优选的方面,启动子是里氏木霉纤维二糖水解酶II基因(cbh2)启动子。在另一个最优选的方面,启动子是SEQ ID NO:30(GENBANKTM登录号M55080)的核苷酸1-582之里氏木霉cbh2启动子。
在另一个优选的方面,启动子是NA2-tpi启动子。在另一个优选的方面,启动子是TAKA淀粉酶启动子。在另一个优选的方面,启动子是镶片镰孢淀粉葡糖苷酶启动子。在另一个优选的方面,启动子是尖镰孢胰蛋白酶样蛋白酶启动子。在另一个优选的方面,启动子是黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)启动子。
在优选的方面,启动子区驱动第一、第二、和第三多核苷酸、或者还有第四多核苷酸的表达。
终止子
终止子可以是受到宿主细胞识别以终止转录的任何合适的转录终止子序列。终止子序列可操作连接编码多肽的核苷酸序列的3’端。本发明可以使用在所选择宿主细胞中有功能的任何终止子。
对于丝状真菌宿主细胞优选的终止子从如下酶的基因获得:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶、和尖镰孢胰蛋白酶样蛋白酶。
对于酵母宿主细胞优选的终止子从如下酶的基因获得:酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)、和酿酒酵母甘油醛-3-磷酸脱氢酶。对于酵母宿主细胞其它有用的终止子记载于Romanos等,1992,见上文。
在优选的方面,终止子是纤维二糖水解酶基因终止子。在更优选的方面,终止子是纤维二糖水解酶I基因(cbh1)终止子。在甚至更优选的方面,终止子是里氏木霉纤维二糖水解酶I基因(cbh1)终止子。在最优选的方面,终止子是SEQ ID NO:31之里氏木霉cbh1终止子。在另一个更优选的方面,终止子是纤维二糖水解酶II基因(cbh2)终止子。在另一个甚至更优选的方面,终止子是里氏木霉纤维二糖水解酶II基因(cbh2)终止子。在另一个最优选的方面,终止子是SEQ ID NO:32之里氏木霉cbh2终止子。
在另一个优选的方面,终止子是TAKA淀粉酶终止子。在另一个优选的方面,启动子是尖镰孢胰蛋白酶样蛋白酶终止子。在另一个优选的方面,启动子是黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)终止子。
其它调节序列
融合蛋白构建体可以进一步包含其它调控元件,如前导序列、多聚腺苷酸化序列、和其它元件。
调节序列还可以是合适的前导序列,其是mRNA中对于宿主细胞进行的翻译而言重要的非翻译区。前导序列可操作地连接于编码融合蛋白的核苷酸序列的5’端。本发明可以使用在所选择宿主细胞中有功能的任何前导序列。
对于丝状真菌宿主细胞优选的前导序列从如下酶的基因获得:米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶。
对于酵母宿主细胞合适的前导序列从如下酶的基因获得:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子、和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。
调节序列也可以是聚腺苷酸化序列,其是可操作地连接于核苷酸序列的3’端的序列,并且在转录时,宿主细胞将其识别为信号以将聚腺苷残基添加至转录的mRNA。本发明可以使用在所选择宿主细胞中有功能的任何聚腺苷酸化序列。
对于丝状真菌宿主细胞优选的聚腺苷酸化序列从如下酶的基因获得:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖镰孢胰蛋白酶样蛋白酶、和黑曲霉α-葡糖苷酶。
对于酵母宿主细胞有用的聚腺苷酸化序列记载于Guo和Sherman,1995,Molecular Cellular Biology 15:5983-5990。
可能还期望添加调节序列,其允许相对于宿主细胞的生长来调节多肽的表达。调节***的例子是那些引起基因表达响应化学或物理刺激(包括调节性化合物的存在)而开启或关闭的***。原核***中的调节***包括lac、tac、和trp操纵基因***。在酵母中,可以使用ADH2***或GAL1***。在丝状真菌中,可以使用TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子、和米曲霉葡糖淀粉酶启动子作为调节序列。调节序列的其它实例是那些允许基因扩增的序列。在真核***中,这些序列包括在氨甲蝶呤(methotrexate)存在下扩增的二氢叶酸还原酶基因,和以重金属(with heavy metal)扩增的金属硫蛋白基因。在这些情况中,编码多肽的核苷酸序列将与调节序列可操作相连接。
融合蛋白构建体优选地包含一种或几种选择标记,其允许简单选择经转化、转染、转导等的细胞。选择标记是基因,其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophy to auxotrophs)等。
细菌选择标记的实例是来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或赋予抗生素抗性的标记,所述抗生素抗性如氨苄青霉素、卡那霉素、氯霉素、或四环素抗性。对于酵母宿主细胞合适的标记是ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞的选择标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦(phosphinothricin)乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)(nitrate reductase)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)(orotidine-5’-phosphate decarboxylase)、sC(硫酸腺苷酰转移酶)、和trpC(邻氨基苯甲酸合酶(anthranilate synthase))以及它们的等同物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉的amdS和pyrG基因和吸水链霉菌(Streptomyces hygroscopicus)的bar因。
表达载体
本发明还涉及重组表达载体,其包含编码融合蛋白的多核苷酸、启动子、及转录和翻译终止信号。本申请所述各种核酸和控制序列可以结合在一起以产生重组表达载体,其可以包含一个或几个方便的限制性位点以允许在这些位点***或取代编码多肽的核苷酸序列。或者,可以通过在用于表达的适宜载体中***包含所述序列的核苷酸序列或融合蛋白构建体来表达编码融合蛋白的多核苷酸。在创建表达载体时,将编码序列置于载体中,使得编码序列与用于表达的适宜调节序列可操作相连接。
重组表达载体可以是任何载体(例如质粒或病毒),其能方便地进行重组DNA方法,而且能产生核苷酸序列的表达。载体的选择将通常取决于载体与其中将引入该载体的宿主细胞的相容性。载体可以是线状的或闭合环状的质粒。
载体可以是自主复制载体,即作为染色体外实体(entity)存在的载体,其复制独立于染色体复制,例如质粒、染色体外元件、微型染色体(minichromosome)、或人工染色体。载体可以包含任何用于确保自复制的手段(means)。或者,载体可以是一种当被导入宿主细胞后,整合到基因组中并且与整合了该载体的染色体一起复制的载体。此外,可以使用单一的载体或质粒或者两个或更多个载体或质粒,其一起含有待导入宿主细胞基因组的完整DNA (total DNA),或者可以使用转座子。
本发明的载体优选包含一个或几个选择标记,其允许简单选择经转化、转染、转导等等的细胞。本申请记载了细菌、酵母、丝状真菌选择标记的例子。
本发明的载体优选包含允许载体整合入宿主细胞基因组或允许载体在细胞中独立于基因组自主复制的元件。
为了整合入宿主细胞基因组,载体可以依赖编码多肽的多核苷酸序列或用于载体通过同源或非同源重组整合入基因组的任何其它载体元件。或者,载体可以包含额外的核苷酸序列,用于指导通过同源重组在染色体中的精确位置整合入宿主细胞基因组中。为了增加在精确位置处整合的可能性,整合元件应优选包含足够数目的核酸,如100-10,000碱基对、优选400-10,000碱基对、和最优选800-10,000碱基对,其与相应的靶序列具有高度同一性以增强同源重组的概率。整合元件可以是与宿主细胞基因组中的靶序列同源的任何序列。此外,整合元件可以是非编码的或编码的核苷酸序列。另一方面,可以将载体通过非同源重组整合到宿主细胞的基因组中。
为了自主复制,载体可以进一步包含复制起点,其使载体能够在所讨论的宿主细胞中自主复制。复制起点可以是在细胞中发挥功能的、介导自主复制的任何质粒复制子(replicator)。术语“复制起点”或“质粒复制子”在本申请定义为使质粒或载体能够在体内复制的核苷酸序列。
细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177、和pACYC184复制起点,及允许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060和pAMβ1复制起点。
用于酵母宿主细胞中的复制起点的实例是2微米复制起点、ARS1、ARS4、ARS1与CEN3的组合、和ARS4与CEN6的组合。
在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems等,1991,Gene 98:61-67;Cullen等,1987,Nucleic Acids Research 15:9163-9175;WO 00/24883)。分离AMA1基因和构建包含该基因的质粒或载体可以根据WO 00/24883中披露的方法来实现。
可以将多于一个拷贝的编码融合蛋白的多核苷酸***宿主细胞以增加基因产物的产生。多核苷酸拷贝数的增加可通过如下方法获得:将至少一个额外拷贝的序列整合入宿主细胞基因组,或将可扩增的选择标记基因包括在多核苷酸内,其中可通过在适宜选择剂(selectable agent)存在下培养细胞来选择含有选择标记基因的扩增拷贝并由此含有多核苷酸的额外拷贝的细胞。
用于连接上文所述元件以构建本发明的重组表达载体的方法是本领域技术人员熟知的(参见例如Sambrook等,1989,见上文)。
宿主细胞
本发明还涉及包含编码本发明融合蛋白的多核苷酸的重组真菌宿主细胞,其有利地用于重组生产所述蛋白质。将包含本发明多核苷酸的载体导入真菌宿主细胞,使得该载体作为染色体成分或作为自复制的染色体外载体得到维持,正如上文所述。术语“宿主细胞”涵盖亲本细胞的任何后代,其由于复制过程中发生的突变而与亲本细胞有所不同。
真菌宿主细胞可以是任何可用于重组生产本发明多肽的真菌细胞。
“真菌”在用于本申请时包括以下门:子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)、和接合菌门(Zygomycota)(如Hawksworth等,于Ainsworth and Bisby’s Dictionary of The Fungi,第8版,1995,CAB International,University Press,Cambridge,UK中所定义的)、以及卵菌门(Oomycota)(如Hawksworth等,1995,见上文,第171页中所引用)、和所有有丝***孢子真菌(mitosporic fungi)(Hawksworth等,1995,见上文)。
在优选的方面,真菌宿主细胞是酵母细胞。“酵母”在用于本申请时包括产子囊酵母(ascosporogenous yeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenous yeast)、和属于半知菌类(Fungi Imperfecti)(芽孢纲(Blastomycetes))的酵母。由于酵母的分类在未来可能改变,就本发明而言,酵母应定义为如Biology and Activities of Yeast(Skinner,F.A.,Passmore,S.M.,和Davenport,R.R.编,Soc.App.Bacteriol.Symposium Series No.9,1980)中所述。
在更优选的方面,酵母宿主细胞是假丝酵母属、汉逊酵母属、克鲁维酵母属、毕赤酵母属、(糖)酵母属、裂殖(糖)酵母属、或耶氏酵母(西洋蓍霉)属细胞。
在最优选的方面,酵母宿主细胞是卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母、或卵形酵母细胞。在另一个最优选的方面,酵母宿主细胞是乳酸克鲁维酵母细胞。在另一个最优选的方面,酵母宿主细胞是解脂耶氏酵母细胞。
在另一个优选的方面,真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门(Oomycota)的亚门(如Hawksworth等,1995,见上文所定义的)的所有丝状形式。丝状真菌的一般特征在于由几丁质或壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚糖和其它复杂多糖构成的菌丝体壁。通过菌丝延伸进行营养性生长,而碳分解代谢是专性需氧的。相反,酵母如酿酒酵母的营养性生长通过单细胞菌体的出芽(budding)进行,而碳分解代谢可以是发酵的。
在更优选的方面,丝状真菌宿主细胞是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟蜡菌属、金孢子菌属、鬼伞属(Coprinus)、革盖菌属、隐球菌属、篮状菌属、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属、或木霉属细胞。
在最优选的方面,丝状真菌宿主细胞是泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、或米曲霉细胞。在另一个最优选的方面,丝状真菌宿主细胞是杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、或镶片镰孢细胞。在另一个最优选的方面,丝状真菌宿主细胞是黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsis aneirina)、干拟蜡菌、Ceriporiopsis caregiea、Ceriporiopsis gilvescens、Ceriporiopsis pannocinta、Ceriporiopsis rivulosa、Ceriporiopsis subrufa、白霉拟蜡菌(Ceriporiopsissubvermispora)、嗜角质金孢子菌、Chrysosporium lucknowense、热带金孢子菌、Chrysosporium merdarium、Chrysosporium inops、毡金孢子菌、Chrysosporium queenslandicum、Chrysosporium zonatum、灰盖鬼伞、毛革盖菌、特异腐质霉、疏棉状腐质霉、米赫毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢平革菌、辐射射脉菌(Phlebia radiata)、杏鲍菇(Pleurotus eryngii)、土生梭孢霉、长绒毛栓菌、变色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、或绿色木霉细胞。
可以通过牵涉原生质体形成、原生质体转化、和细胞壁重建的方法以本身已知的方式来转化真菌细胞。用于转化曲霉属和木霉属宿主细胞的合适方法记载于EP 238023及Yelton等,1984,Proceedings of the National Academy ofSciences USA 81:1470-1474。用于转化镰孢属物种的合适方法记载于Malardier等,1989,Gene 78:147-156及WO 96/00787。可以使用由如下文献记载的方法来转化酵母:Becker和Guarente,于Abelson,J.N.和Simon,M.I.,编,Guide to Yeast Genetics and Molecular Biology,Methods in Enzymology,卷194,pp 182-187,Academic Press,Inc.,New York;Ito等,1983,Journal ofBacteriology 153:163;及Hinnen等,1978,Proceedings of the Nattonal Academyof Sciences USA 75:1920。
产生和回收
在本发明的生产方法中,使用本领域众所周知的方法在适合于生产具有生物学活性之多肽的营养培养基中培养真菌宿主细胞。例如,可以通过在合适培养基中和在允许多肽表达和/或分离的条件下进行的摇瓶培养和实验室或工业发酵罐中的小规模或大规模发酵(包括连续的、分批的、补料分批的或固态的发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养,所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据公开的组成制备(例如,在美国典型培养物保藏中心的目录中)。
在本发明的方法中,具有生物学活性之多肽选自下组:融合蛋白、融合蛋白的构件、和融合蛋白及其构件的组合。
在优选的方面,具有生物学活性之多肽是融合蛋白。
在另一个优选的方面,具有生物学活性之多肽是融合蛋白的一个或几个构件。
在另一个优选的方面,具有生物学活性之多肽是融合蛋白及其构件的组合。
可以使用本领域已知的、对于所述多肽是特异性的方法来检测具有生物学活性之多肽。这些检测方法可以包括特异性抗体的使用、酶产物的形成、或酶底物的消失。例如,可以使用酶测定法(enzyme assay)来测定多肽的活性,如本申请所述,且可以包括内切葡聚糖酶活性和特定(specific)生物学活性二者。
所得具有生物学活性之多肽(例如β-葡糖苷酶融合蛋白或其构件)可以使用本领域已知的方法回收。例如,可以通过常规方法自营养培养基回收多肽,所述常规方法包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。
本发明的多肽可以通过本领域已知的多种方法来纯化,所述规程包括但不限于层析(例如离子交换、亲和、疏水、层析聚焦、和大小排阻)、电泳方法(例如制备型等电聚焦)、差别溶解度(例如硫酸铵沉淀)、SDS-PAGE、或提取(参见例如Protein Purification,J.-C.Janson和Lars Ryden编,VCH Publishers,New York,1989),以获得基本上纯的多肽。
组合物
本发明还涉及包含本发明的具有生物学活性之多肽的组合物。优选地,所述组合物富含这种多肽。术语“富含”表示所述组合物的生物学活性以例如至少1.1的富集因数(enrichment factor)增加。
组合物可以包含本发明的多肽作为主要酶成分,例如单成分组合物。或者,组合物可以包含多种酶活性,如氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、卤素过氧化物酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果胶分解酶、肽谷氨酰胺酶(peptidoglutaminase)、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。别的酶可以通过例如属于以下属或种的微生物产生:曲霉属,优选棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉;镰孢属,优选杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢或镶片镰孢;腐质霉属,优选特异腐质霉或疏棉状腐质霉;或木霉属,优选哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉。
可以根据本领域已知的方法来制备多肽组合物,而且可以是液体或干组合物的形式。例如,多肽组合物可以是颗粒(granulate)或微粒(microgranulate)的形式。可以根据本领域已知的方法将包括于组合物中的多肽稳定化。
下面给出的是本发明多肽组合物的优选用途的实例。本发明的多肽组合物的剂量和使用该组合物的其它条件可以基于本领域已知的方法来确定。
用途
本发明还涉及使用融合蛋白或其构件,或它们的组合物的方法。
加工含纤维素材料的方法
本发明的方法对于以商业上重要的数量改进具有纤维素分解或半纤维素分解活性之多肽的分泌特别有用,所述多肽可用于降解或转化木质纤维素材料。此类多肽包括但不限于内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、木聚糖酶、β-木糖苷酶、***呋喃糖苷酶、乙酰木聚糖酯酶和阿魏酸酯酶。因此,本发明还涉及用于降解或转化含纤维素材料的方法,该方法包括:在存在有效量的根据本发明方法得到的具有纤维素分解活性或半纤维素分解活性的融合蛋白或其构件的条件下用有效量的纤维素分解酶组合物处理含纤维素材料。为了说明目的,将根据本发明方法得到的具有β-葡糖苷酶活性之多肽(例如β-葡糖苷酶融合蛋白或其构件)用于说明目的。
纤维素生物质可以包括但不限于木材资源、城市固体废物、废纸、作物和作物残余物(参见,例如Wiselogel等,1995,于Handbook on Bioethanol(编者Charles E.Wyman),第105-118页,Taylor & Francis,Washington D.C.;Wyman,1994,Bioresource Technology 50:3-16;Lynd,1990,Applied Biochemistry andBiotechnology 24/25:695-719;Mosier等,1999,Recent Progress in Bioconversionof Lignocellulosics,于Advances in Biochemical Engineering/Biotechnology,总编T.Scheper,第65卷,第23-40页,Springer-Verlag,NewYork)。
生物质初生细胞壁(primary cell wall)中的主要多糖是纤维素,其次最丰富的是半纤维素,而第三是果胶。次生细胞壁(secondary cell wall)在细胞停止生长后产生,其同样含有多糖并通过聚合木质素共价交联至半纤维素而加强。纤维素是脱水纤维二糖的均聚物,并且因此是线性β-(1-4)-D-葡聚糖,而半纤维素包括多种化合物,如木聚糖、木葡聚糖(xyloglucan)、***木聚糖和甘露聚糖,具有系列取代基的复杂分支结构。尽管通常是多形的,存在于植物组织中的纤维素主要作为平行葡聚糖链的不溶晶体基质。半纤维素通常与纤维素以及其它半纤维素以氢键相连,其帮助稳定细胞壁基质。在本申请中应理解,术语“含纤维素材料”或“纤维素”还涵盖木质纤维素。
在本发明的方法中,纤维素分解酶组合物可以包含任何牵涉将含纤维素材料加工成葡萄糖,或将半纤维素加工成木糖、甘露糖、半乳糖和***糖、它们的聚合物、或自它们衍生的产物的蛋白质,如下文所述。纤维素分解酶组合物可以是单构件制备物,例如内切葡聚糖酶;多构件制备物,例如内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶;或单构件蛋白质制备物和多构件蛋白质制备物的组合。纤维素水解蛋白质可以具有活性,即在酸性、中性、或碱性pH范围水解纤维素。纤维素分解酶组合物可以进一步包含具有纤维素水解增强活性的多肽,根据WO 2005/074647、WO 2005/074656、及美国已公开的申请2007/0077630。
纤维素水解蛋白质可以是真菌或细菌起源的,其可以自已知能够产生纤维素分解酶的微生物获得或分离和纯化,例如芽孢杆菌属、假单胞菌属、腐质霉属、鬼伞属、梭孢壳属、镰孢属、毁丝霉属、枝顶孢霉属、头孢霉属(Cephalosporium)、柱霉属、青霉属或曲霉属的物种(参见例如EP 458162),尤其是那些由选自下组的菌株产生的纤维素水解蛋白质:特异腐质霉(重新分类为嗜热柱霉(Scytalidium thermophilum),参见例如美国专利No.4,435,307)、灰盖鬼伞、尖镰孢、嗜热毁丝霉、大型亚灰树花菌(Meripilusgiganteus)、土生梭孢霉、枝顶孢霉属菌种、桃色枝顶孢霉(Acremoniumpersicinum)、冠枝顶孢霉(Acremonium acremonium)、Acremoniumbrachypenium、Acremonium dichromosporum、Acremonium obclavatum、Acremonium pinkertoniae、Acremonium roseogriseum、Acremoniumincoloratum、和Acremonium furatum;优选选自下组:特异腐质霉DSM 1800、尖镰孢DSM 2672、嗜热毁丝霉CBS 117.65、头孢霉属菌种RYM-202、枝顶孢霉属菌种CBS 478.94、枝顶孢霉属菌种CBS 265.95、桃色枝顶孢霉CBS169.65、冠枝顶孢霉AHU 9519、头孢霉属菌种CBS 535.71、Acremoniumbrachypenium CBS 866.73、Acremonium dichromosporum CBS 683.73、Acremonium obclavatum CBS 311.74、Acremonium pinkertoniae CBS 157.70、Acremonium roseogriseum CBS 134.56、Acremonium incoloratum CBS 146.62、和Acremonium furatum CBS 299.70H。纤维素水解蛋白质也可以自木霉属(特别是绿色木霉、里氏木霉和康宁木霉)、嗜碱性芽孢杆菌属(参见例如美国专利No.3,844,890和EP 458162)、和链霉菌属(参见例如EP 458162)获得。也可以使用纤维素水解蛋白质的化学修饰或蛋白质工程突变体。
尤其合适的纤维素水解蛋白质是记载于以下文献中的纤维素酶:EP495,257,EP 531,372,WO 96/11262,WO 96/29397,WO 98/08940。其它例子有纤维素酶变体,如以下文献中所记载的:WO 94/07998,EP 531,315,美国专利No.4,435,307,美国专利No.5,457,046,美国专利No.5,648,263,美国专利No.5,686,593,美国专利No.5,691,178,美国专利No.5,763,254,美国专利No.5,776,757,WO 89/09259,WO 95/24471,WO 98/12307和PCT/DK98/00299。
如上所述,本发明方法中所使用的纤维素水解蛋白质可以是单构件制备物,即基本上不含其它纤维素水解构件的构件。单构件可以是重组构件,即通过克隆编码单构件的DNA序列,随后用该DNA序列转化细胞,并在宿主中表达来产生的(参见例如WO 91/17243和WO 91/17244)。宿主优选是异源宿主(酶对于宿主而言是外来的),但是宿主在某些条件下也可以是同源宿主(酶对于宿主而言是天然的)。单构件纤维素水解蛋白质也可以通过自发酵液纯化此类蛋白质来制备。
本发明方法中所使用的纤维素水解蛋白质可以通过使用本领域已知的方法在含有合适碳源和氮源和无机盐的营养培养基上发酵上文所述微生物菌株来产生(参见例如Bennett,J.W.和LaSure,L.(编),More Gene Manipulationsin Fungi,Academic Press,CA,1991)。合适的培养基能够从商业供应商获得或可以根据公开的组成制备(例如,在美国典型培养物保藏中心的目录中)。适于生长和纤维素水解蛋白质产生的温度范围和其它条件是本领域已知的(参见例如Bailey,J.E.和Ollis,D.F.,Biochemical Engineering Fundamentals,McGraw-Hill Book Company,NY,1986)。
发酵可以是培养细胞,导致纤维素水解蛋白质表达或分离的任何方法。因此,发酵可以理解为包括在合适培养基中和在允许纤维素水解蛋白质表达或分离的条件下进行的摇瓶培养和实验室或工业发酵罐中的小规模或大规模发酵(包括连续的、分批的、补料分批的或固态的发酵)。通过上文所述方法产生的所得纤维素水解蛋白质可以自发酵培养基回收并通过常规方法纯化,如上所述。
适用于本发明的商业上可用的纤维素分解酶制剂的例子包括例如CELLUCLASTTM(能够从Novozymes A/S获得)和NOVOZYMTM 188(能够从Novozymes A/S获得)。可以使用的包含纤维素酶的其它商业上可用的制剂包括CELLUZYMETM、CEREFLOTM和ULTRAFLOTM(Novozymes A/S),LAMINEXTM和SPEZYMETM CP(Genencor Int.),ROHAMENTTM 7069W(
Figure A20078003522400611
GmbH),和
Figure A20078003522400612
LDI,LBR、或150L(Dyadic International,Inc.,Jupiter,FL,USA)。以约0.001%至5.0%(固体重量)、更优选约0.025%至约4.0%(固体重量)、和最优选约0.005%至约2.0%(固体重量)的有效量添加纤维素酶。
通过上文所述方法得到的所得纤维素水解蛋白质或β-葡糖苷酶蛋白质可以通过常规方法自发酵培养基回收,所述常规方法包括但不限于离心、过滤、喷雾干燥、蒸发或沉淀。所回收的蛋白质然后可以通过多种层析方法进一步纯化,例如离子交换层析、凝胶过滤层析、亲和层析等等。
纤维素水解蛋白质的活性可以使用本领域已知的任何方法来测定。
适用于本发明的纤维素水解制剂的例子包括例如CELLUCLASTTM(能够从Novozymes A/S获得)和NOVOZYMTM 188(能够从Novozymes A/S获得)。可以使用的包含纤维素酶的其它商业上可用的制剂包括CELLUZYMETM、CEREFLOTM和ULTRAFLOTM(Novozymes A/S),LAMINEXTM和SPEZYMETMCP(Genencor Int.)、和ROHAMENTTM 7069W(
Figure A20078003522400615
GmbH)。以约0.001%至5.0%(固体重量)、更优选约0.025%至约4.0%(固体重量)、和最优选约0.005%至约2.0%(固体重量)的有效量添加纤维素酶。
如上所述,本发明方法中所使用的纤维素水解蛋白质可以是单构件制备物,即基本上不含其它纤维素水解构件的构件。单构件可以是重组构件,即通过克隆编码单构件的DNA序列,随后用该DNA序列转化细胞,并在宿主中表达来产生的(参见例如WO 91/17243和WO 91/17244)。单构件纤维素水解蛋白质的其它例子包括但不限于JP-07203960-A和WO-9206209中披露的那些。宿主优选是异源宿主(酶对于宿主而言是外来的),但是宿主在某些条件下也可以是同源宿主(酶对于宿主而言是天然的)。单构件纤维素水解蛋白质也可以通过自发酵液纯化此类蛋白质来制备。
可用于实施本发明方法的单构件纤维素水解蛋白质的例子包括但不限于内切葡聚糖酶、纤维二糖水解酶、和其它对于降解纤维素生物质有用的酶。
术语“内切葡聚糖酶”在本申请中已有定义。术语“纤维二糖水解酶”在本申请中定义为1,4-β-D-葡聚糖纤维二糖水解酶(E.C.3.2.1.91),其催化纤维素、纤维寡糖、或任何含β-1,4-连接葡萄糖的聚合物中1,4-β-D-葡糖苷键的水解,自链的还原端或非还原端释放纤维二糖。就本发明而言,纤维二糖水解酶活性可以根据如下文献中记载的方法来测定:Lever等,1972,Anal.Biochem.47:273-279及van Tilbeurgh等,1982,FEBS Letters 149:152-156;van Tilbeurgh和Claeyssens,1985,FEBS Letters 187:283-288。在本发明中,采用Lever等的方法来评估玉米秸秆(corn stover)中纤维素的水解。
本发明的多肽与纤维素水解蛋白质一同用于降解生物质底物的纤维素成分(参见例如Brigham等,1995,于Handbook on Bioethanol(Charles E.Wyman,编),pp.119-141,Taylor & Francis,Washington D.C.;Lee,1997,Journal of Biotechnology 56:1-24)。
具有β-葡糖苷酶活性之多肽和纤维素水解蛋白质的最适量取决于几个因素,其包括但不限于组分纤维素水解蛋白质的混合物、含纤维素的底物、含纤维素底物的浓度、含纤维素底物的预处理、温度、时间、pH和包括发酵生物体(例如用于同步糖化和发酵的酵母)。术语“纤维素水解蛋白质”在本申请中定义为显示出能够在所测试的条件下水解或转化或降解纤维素的那些蛋白质或蛋白质混合物。它们的量通常通过常用方法来测量,如BCA(二辛可宁酸,P.K.Smith等,1985,Anal.Biochem.150:76),而且优选的添加量与所水解的生物质的量成比例。
在优选的方面,每克含纤维素材料的具有β-葡糖苷酶活性之多肽的量是约0.01至约2.0mg、优选约0.025至约1.5mg、更优选约0.05至约1.25mg、更优选约0.075至约1.25mg、更优选约0.1至约1.25mg、甚至更优选约0.15至约1.25mg、和最优选约0.25至约1.0mg每g含纤维素材料。
在另一个优选的方面,每克含纤维素材料的纤维素水解蛋白质的量是约0.5至约50mg、优选约0.5至约40mg、更优选约0.5至约25mg、更优选约0.75至约20mg、更优选约0.75至约15mg、甚至更优选约0.5至约10mg、和最优选约2.5至约10mg每g含纤维素材料。
本发明的方法可用于将含纤维素材料(例如木质纤维素)降解或转化成任何有用的物质(例如化学制品和燃料)。在乙醇以外,可以自纤维素生产的一些日用和专用化学品包括木糖、丙酮、乙酸盐/酯、甘氨酸、赖氨酸、有机酸(例如乳酸)、1,3-丙二醇、丁二醇、甘油、乙二醇、糠醛或糖醛、聚羟基链烷酸酯、和顺式,顺式-粘康酸(Lynd,L.R.,Wyman,C.E.,和Gerngross,T.U.,1999,Biocommodity Engineering,Biotechnol.Prog.,15:777-793;Philippidis,G.P.,1996,Cellulose bioconversion technology,于Handbook on Bioethanol:Production and Utilization,Wyman,C.E.,编,Taylor & Francis,Washington,DC,179-212;及Ryu,D.D.Y.和Mandels,M.,1980,Cellulases:biosynthesis andapplications,Enz.Microb.Technol.,2:91-102)。潜在的合作生产利益延伸超过自可发酵碳水化合物合成多种有机产物。可以将生物学加工后剩余的富含木质素的残余物转化成木质素衍生的化学品,或者用于动力生产。
根据本发明的方法用于处理含纤维素材料的常规方法是本领域技术人员充分理解的。可以使用任何常规生物质处理设备来实施本发明的方法,所述设备设定为根据本发明操作。
这样的设备可以包括补料-分批式搅拌反应器、分批式搅拌反应器、具有超滤的连续流搅拌反应器、连续活塞流柱式反应器(Fernanda de CastilhosCorazza,Flávio Faria de Moraes,Gisella Maria Zanin和Ivo Neitzel,2003,Optimal control in fed-batch reactor for the cellobiose hydrolysis,ActaScientiarum.Technology 25(1):33-38;Gusakov,A.V.和Sinitsyn,A.P.,1985,Kinetics of the enzymatic hydrolysis of cellulose:1.A mathematical model for abatch reactor process,Enz.Microb.Technol.7:346-352)、碾磨反应器(Ryu,S.K.和Lee,J.M.,1983,Bioconversion of waste cellulose by using an attritionbioreactor,Biotechnol.Bioeng.25:53-65)、或具有由电磁场引起的强烈搅拌的反应器(Gusakov,A.V.,,Sinitsyn,A.P.,Davydkin,I.Y.,Davydkin,V.Y.,Protas,O.V.,1996,Enhancement of enzymatic cellulose hydrolysis using a novel type ofbioreactor with intensive stirring induced by electromagnetic field,Appl.Biochem.Biotechnol.56:141-153)。
常规方法包括但不限于糖化、发酵、分开的水解和发酵(SHF)、同步糖化和发酵(SSF)、同步糖化和共发酵(SSCF)、混合的水解和发酵(HHF)、和直接微生物转化(DMC)。
SHF使用分开的处理步骤,首先将纤维素酶促水解成可发酵的糖,然后在后续步骤中将糖发酵成乙醇。在SSF中,纤维素的酶促水解和可发酵的糖变为乙醇的发酵组合在一个步骤中(Philippidis,G.P.,1996,Cellulosebioconversion technology,于Handbook on Bioethanol:Production andUtilization,Wyman,C.E.编,Taylor & Francis,Washington,DC,179-212)。SSCF包括多种糖的共发酵(Sheehan,J.,和Himmel,M.,1999,Enzymes,energy and theenvironment:A strategic perspective on the U.S.Department of Energy’s researchand development activities for bioethanol,Biotechnol.Prog.15:817-827)。HHF包括在同一个反应器但不同的温度进行的两个分开的步骤,即,高温酶促糖化,继以在发酵菌株能耐受的较低温度进行的SSF。DMC在一个步骤中组合了所有三个过程(纤维素酶产生、纤维素水解和发酵)(Lynd,L.R.,Weimer,P.J.,vanZyl,W.H.,和Pretorius,I.S.,2002,Microbial cellulose utilization:Fundamentalsand biotechnology,Microbiol.Mol.Biol.Reviews 66:506-577)。
“发酵”或“发酵过程”指任何发酵过程或任何包含发酵步骤的过程。发酵过程包括但不限于用于产生发酵产品的发酵过程,所述发酵产品包括醇(例如***醇、丁醇、乙醇、甘油、甲醇、1,3-丙二醇、山梨醇和木糖醇);有机酸(例如乙酸、丙酮酸、己二酸、抗坏血酸、柠檬酸、2,5-二酮-D-葡萄糖酸、甲酸、富马酸、葡萄糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、衣康酸、乳酸、苹果酸、丙二酸、草酸、丙酸、琥珀酸、和木糖酸或木质酸);酮(例如丙酮);氨基酸(例如天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸和苏氨酸);气体(例如甲烷、氢气(H2)、二氧化碳(CO2)和一氧化碳(CO))。发酵过程还包括在消费品酒业(例如啤酒和酒)、乳业(例如发酵乳制品)、皮革业和烟草业中使用的发酵过程。
根据本发明方法获得的具有纤维素分解活性或半纤维素分解活性的融合蛋白或其构件(例如β-葡糖苷酶融合蛋白或其构件)及其宿主细胞可用于自生物质生产单糖、二糖和多糖作为化学品或发酵给料(feedstock),用于产生乙醇、塑料、其它产品或中间体。具体而言,多肽和宿主细胞可用于通过纤维素或半纤维素的部分或完全溶解来提高加工残余物(干酒糟(dried distillersgrain)、来自酿造的废糟(spent grains from brewing)、甘蔗渣(sugarcane bagasse)等)的价值。在促进用纤维素分解酶制备物将含纤维素材料加工成葡萄糖、木糖、甘露糖、半乳糖和***糖、它们的聚合物或由它们衍生的产物时,如下文所述,多肽可以是含或不含细胞的粗发酵液形式,或者是半纯化或纯化的酶制备物形式。多肽可以是单构件制备物、多构件蛋白质制备物、或多构件蛋白质制备物与单构件蛋白质制备物的组合。或者,可以使用宿主细胞作为生物质发酵过程中此类多肽的来源。宿主细胞还可以包含天然的或异源的基因,其编码纤维素水解蛋白质以及其它在生物质加工中有用的酶。
本发明进一步涉及用于产生有机物质的方法,该方法包括:(a)在存在有效量的根据本发明方法获得的具有纤维素分解活性或半纤维素分解活性的融合蛋白或其构件的条件下用有效量的纤维素分解酶组合物糖化含纤维素材料;(b)用一种或几种(more)的发酵微生物发酵步骤(a)的糖化的含纤维素材料;和(c)自发酵回收有机物质。如先前所述,出于说明目的,将根据本发明方法获得的具有β-葡糖苷酶活性之多肽(例如β-葡糖苷酶融合蛋白或其构件)用于说明目的。具有β-葡糖苷酶活性之多肽可以是含或不含细胞的粗发酵液形式,或者是半纯化或纯化的酶制剂形式。β-葡糖苷酶蛋白质可以是单构件制备物、多构件蛋白质制备物、或多构件蛋白质制备物与单构件蛋白质制备物的组合。
所述物质可以是任何自发酵衍生的物质。在优选的方面,物质是醇。应当理解,术语“醇”涵盖具有一个或几个羟基部分的物质。在更优选的方面,醇是***醇。在另一个更优选的方面,醇是丁醇。在另一个更优选的方面,醇是乙醇。在另一个更优选的方面,醇是甘油。在另一个更优选的方面,醇是甲醇。在另一个更优选的方面,醇是1,3-丙二醇。在另一个更优选的方面,醇是山梨醇。在另一个更优选的方面,醇是木糖醇。参见例如Gong,C.S.,Cao,N.J.,Du,J.和Tsao,G.T.,1999,Ethanol production from renewable resources,于Advances in Biochemical Engineering/Biotechnology,Scheper,T.编,Springer-Verlag Berlin Heidelberg,Germany,65:207-241;Silveira,M.M.和Jonas,R.,2002,The biotechnological production of sorbitol,Appl.Microbiol.Biotechnol.59:400-408;Nigam,P.和Singh,D.,1995,Processes for fermentativeproduction of xylitol-a sugar substitute,Process Biochemistry 30(2):117-124;Ezeji,T.C.,Qureshi,N.和Blaschek,H.P.,2003,Production of acetone,butanoland ethanol by Clostridium beijerinckii BA101 and in situ recovery by gasstripping,World Journal of Microbiology and Biotechnology 19(6):595-603。
在另一个优选的方面,所述物质是有机酸。在另一个更优选的方面,有机酸是乙酸。在另一个更优选的方面,有机酸是丙酮酸。在另一个更优选的方面,有机酸是己二酸。在另一个更优选的方面,有机酸是抗坏血酸。在另一个更优选的方面,有机酸是柠檬酸。在另一个更优选的方面,有机酸是2,5-二酮-D-葡糖酸。在另一个更优选的方面,有机酸是甲酸。在另一个更优选的方面,有机酸是富马酸。在另一个更优选的方面,有机酸是葡萄糖二酸。在另一个更优选的方面,有机酸是葡糖酸。在另一个更优选的方面,有机酸是葡糖醛酸。在另一个更优选的方面,有机酸是戊二酸。在另一个优选的方面,有机酸是3-羟基丙酸。在另一个更优选的方面,有机酸是衣康酸。在另一个更优选的方面,有机酸是乳酸。在另一个更优选的方面,有机酸是苹果酸。在另一个更优选的方面,有机酸是丙二酸。在另一个更优选的方面,有机酸是草酸。在另一个更优选的方面,有机酸是丙酸。在另一个更优选的方面,有机酸是琥珀酸。在另一个更优选的方面,有机酸是木糖酸或木质酸。参见例如Chen,R.和Lee,Y.Y.,1997,Membrane-mediated extractive fermentation for lactic acid production fromcellulosic biomass,Appl.Biochem.Biotechnol.63-65:435-448。
在另一个优选的方面,所述物质是酮。应当理解,术语“酮”涵盖具有一个或几个酮基部分的物质。在另一个更优选的方面,酮是丙酮。参见例如Qureshi和Blaschek,2003,见上文。
在另一个优选的方面,所述物质是氨基酸。在另一个更优选的方面,氨基酸是天冬氨酸。在另一个更优选的方面,氨基酸是谷氨酸。在另一个更优选的方面,氨基酸是甘氨酸。在另一个更优选的方面,氨基酸是赖氨酸。在另一个更优选的方面,氨基酸是丝氨酸。在另一个更优选的方面,氨基酸是苏氨酸。参见例如Richard,A.和Margaritis,A.,2004,Empirical modeling ofbatch fermentation kinetics for poly(glutamic acid)production and othermicrobial biopolymers,Biotechnology and Bioengineering 87(4):501-515。
在另一个优选的方面,所述物质是气体。在另一个更优选的方面,气体是甲烷。在另一个更优选的方面,气体是H2。在另一个更优选的方面,气体是CO2。在另一个更优选的方面,气体是CO。参见例如Kataoka,N.,A.Miya,和K.Kiriyama,1997,Studies on hydrogen production by continuous culturesystem of hydrogen-producing anaerobic bacteria,Water Science and Technology36(6-7):41-47;及Gunaseelan V.N.于Biomass and Bioenergy,Vol.13(1-2),pp.83-114,1997,Anaerobic digestion ofbiomass for methane production:A review。
自含纤维素材料生产物质通常需要四个主要步骤。这四个步骤是预处理、酶促水解、发酵和回收。下面例示的是用于产生乙醇的方法,但应当理解,可以使用相似的方法来生产其它物质,例如上文所述物质。
预处理。在预处理或预水解步骤中,将含纤维素材料加热以分解木质素和碳水化合物结构,溶解大部分半纤维素,并使纤维素分解酶能够到达纤维素部分。加热或者直接用蒸汽进行,或者在浆料中进行,此处还可将催化剂添加于材料以使反应加速。催化剂包括强的酸(如硫酸和SO2)或碱(如氢氧化钠)。预处理阶段的目的是促进酶和微生物的渗透(penetration)。含纤维素生物质还可以经过水热蒸汽喷发的预处理(参见美国专利申请号20020164730)。然而,应当理解,在实施本发明的方法时,可以采用热的、化学的、和/或机械的预处理来使用任何预处理。
糖化。在酶促水解步骤中(所述步骤也称作糖化),将本申请所述酶加入经预处理的材料中,以将纤维素部分转化成葡萄糖和/或其它糖。糖化通常在搅拌釜反应器或发酵罐中,在受控的pH、温度和混合条件下进行。糖化步骤可以持续长达200小时。糖化可以在约30℃至约65℃,特别是约50℃的温度,和在约4-约5,尤其是约pH4.5的pH进行。为了产生能由酵母代谢的葡萄糖,通常在存在β-葡糖苷酶的条件下进行水解。
发酵。在发酵步骤中,作为预处理和酶促水解步骤的结果从含纤维素材料释放的糖,通过发酵生物体(如酵母)发酵成为乙醇。发酵还可以与酶促水解在同一个容器中,同样在受控的pH、温度和混合条件下同时进行。当糖化和发酵在同一个容器中同时进行时,该过程通常称作同步糖化和发酵或SSF。
在实施本发明时在发酵步骤中可以使用任何合适的含纤维素材料或原材料。通常根据期望的发酵产品(即,要从发酵获得的物质)和所采用的方法来选择材料,如本领域中所公知。适用于本发明的方法中的底物的实例包括含纤维素材料,如木材或植物残余物或自能通过发酵微生物代谢的经处理的含纤维素材料获得的低分子糖DP1-3,所述底物可以通过直接向发酵培养基中加入而提供。
术语“发酵培养基”理解为指加入发酵微生物之前的培养基,如由糖化过程产生的培养基,以及同步糖化和发酵过程(SSF)中使用的培养基。
“发酵微生物”指适用于期望的发酵过程中的任何微生物。根据本发明的合适的发酵微生物能够将糖(如葡萄糖、木糖、***糖、甘露糖、半乳糖或寡糖)直接或间接地发酵(即转化)成期望的发酵产品。发酵微生物的实例包括真菌生物体,如酵母。优选的酵母包括(糖)酵母属菌种,且具体为酿酒酵母的菌株。商业上可得到的酵母包括,例如Red
Figure A20078003522400681
/Lesaffre Ethanol Red(可从Red
Figure A20078003522400682
/Lesaffre,USA获得)、FALI(可从Fleischmann’s Yeast,BurnsPhilp Food Inc.,USA的一个部门获得)、SUPERSTART(可从Alltech获得)、GERT STRAND(可从Gert Strand AB,Sweden获得)和FERMIOL(可从DSMSpecialties获得)。
在优选的方面,所述酵母是(糖)酵母属菌种。在更优选的方面,所述酵母是酿酒酵母。在另一个更优选的方面,所述酵母是糖化酵母。在另一个更优选的方面,所述酵母是葡萄汁酵母(Saccharomyces uvarum)。在另一个优选的方面,所述酵母是克鲁维酵母属。在另一个更优选的方面,所述酵母是马克斯克鲁维酵母(Kluyveromyces marxianus)。在另一个更优选的方面,所述酵母是脆壁克鲁维酵母(Kluyveromyces fragilis)。在另一个优选的方面,所述酵母是假丝酵母属。在另一个更优选的方面,所述酵母是假热带假丝酵母(Candida pseudotropicalis)。在另一个更优选的方面,所述酵母是芸苔假丝酵母(Candida brassicae)。在另一个优选的方面,所述酵母是棒孢酵母(Clavispora)。在另一个更优选的方面,所述酵母是鲁西坦棒孢酵母(Clavispora lusitaniae)。在另一个更优选的方面,所述酵母是仙人掌棒孢酵母(Clavispora opuntiae)。在另一个优选的方面,所述酵母是管囊酵母属(Pachysolen)。在另一个更优选的方面,所述酵母是管囊酵母(Pachysolentannophilus)。在另一个优选的方面,所述酵母是酒香酵母属(Bretannomyces)。在另一个更优选的方面,所述酵母是克劳森酒香酵母(Bretannomycesclausenii)(Philippidis,G.P.,1996,Cellulose bioconversion technology,于Handbook on Bioethanol:Production and Utilization,Wyman,C.E.,编,Taylor& Francis,Washington,DC,179-212)。
可以有效地将葡萄糖发酵成乙醇的细菌包括,例如,运动发酵单胞菌(Zymomonas mobilis)和热纤维梭菌(Clostridium thermocellum)(Philippidis,1996,见上文)。
在本领域中公知上述生物体还能用于产生其它物质,如本申请所述。
在酿酒酵母(Chen,Z.,Ho,N.W.Y.,1993,Cloning and improving theexpress ion of Pichia stipitis xylose reductase gene in Saccharomyces cerevisiae,Appl.Biochem.Biotechnol.39-40:135-147;Ho,N.W.Y.,Chen,Z,Brainard,A.P.,1998,Genetically engineered Saccharomyces yeast capable of effectivelycofermenting glucose and xylose,Appl.Environ.Microbiol.64:1852-1859)或在细菌中如大肠杆菌(Beall,D.S.,Ohta,K.,Ingram,L.O.,1991,Parametricstudies of ethanol production from xylose and other sugars by recombinantEscherichia coli Biotech.Bioeng.38:296-303)、产酸克雷伯氏菌(Klebsiellaoxytoca)(Ingram,L.O.,Gomes,P.F.,Lai,X.,Moniruzzaman,M.,Wood,B.E.,Yomano,L.P.,York,S.W.,1998,Metabolic engineering of bacteria for ethanolproduction,Biotechnol.Bioeng.58:204-214)和运动发酵单胞菌(Zhang,M.,Eddy,C.,Deanda,K.,Finkelstein,M.和Picataggio,S.,1995,Metabolicengineering of a pentose metabolism pathway in ethanologenic Zymomonasmobilis,Science 267:240-243;Deanda,K.,Zhang,M.,Eddy,C.,和Picataggio,S.,1996,Development of an arabinose-fermenting Zymomonas mobilis train bymetabolic pathway engineering,Appl.Environ.Microbiol.62:4465-4470)中克隆异源基因导致了能够将己糖和戊糖转化成乙醇(共发酵)的生物体的构建。
通常向降解的纤维素或水解产物中加入酵母或另一种微生物,并进行约24至约96小时,如约35至约60小时的发酵。温度通常在约26℃-约40℃,特别是约32℃,且在约pH3至约pH6,特别是约pH4-5进行。
在优选的方面,将酵母或另一种微生物应用于降解的纤维素或水解产物,并进行约24至约96小时,如通常35-60小时的发酵。在优选的方面,温度通常在约26至约40℃,特别是约32℃,而pH通常在约pH3至约pH6,优选约pH4-5。优选以大约105至1012,优选大约107至1010,尤其是大约5×107活细胞计数每ml发酵液的量应用酵母或另一种微生物。在乙醇产生阶段期间,酵母细胞计数应该优选在大约107至1010,尤其是约2×108。关于使用酵母进行发酵的其它指导可见于例如“The Alcohol Textbook”(编者K.Jacques,T.P.Lyons和D.R.Kelsall,Nottingham University Press,United Kingdom 1999)中,所述文献通过引用并入本申请。
本领域最广泛使用的方法是同步糖化和发酵(SSF)方法,其中没有糖化的保持阶段,意味着酵母和酶一起添加。
对于乙醇产生,在发酵后将醪(mash)蒸馏以提取乙醇。根据本发明的方法获得的乙醇可以用作,例如,燃料乙醇、饮料乙醇(即,中性饮料酒(potableneutral spirits))或工业乙醇。
发酵刺激剂可以与本申请所述的任何酶促过程组合使用,以进一步改进发酵过程,特别是改进发酵微生物的性能,如速率增加和乙醇得率。“发酵刺激剂”指用于发酵微生物(特别是酵母)生长的刺激剂。优选的用于生长的发酵刺激剂包括维生素和矿物质。维生素的实例包括多种维生素、生物素、泛酸盐/酯、烟酸、内消旋肌醇(meso-inositol)、硫胺、维生素B6(pyridoxine)、对氨基苯甲酸、叶酸、核黄素和维生素A、B、C、D和E。参见,例如,Alfenore等,Improving ethanol production and viability of Saccharomyces cerevisiae by avitamin feeding strategy during fed-batch process,Springer-Verlag(2002),其通过引用并入本申请。矿物质的实例包括能提供营养的矿物质和矿物质盐,所述营养包括P、K、Mg、S、Ca、Fe、Zn、Mn和Cu。
回收。从发酵的含纤维素材料中分离醇,并通过蒸馏的常规方法纯化。能获得纯度高达约96vol.%的乙醇,其可以用作,例如,燃料乙醇、饮料乙醇(即中性饮料酒)或工业乙醇。
对于其它物质,可以使用本领域已知的任何方法,所述方法包括但不限于层析(例如离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如制备型等电聚焦)、差别溶解度(例如,硫酸铵沉淀)、SDS-PAGE、蒸馏或提取。
在本发明的方法中,在β-葡糖苷酶之外,可以向纤维素分解酶制备物和纤维素分解增强多肽补充一种或几种别的酶活性,以改进含纤维素材料的降解。优选的别的酶是半纤维素酶、酯酶(例如脂肪酶、磷脂酶和/或角质酶)、蛋白酶、漆酶、过氧化物酶,或它们的混合物。
在本发明的方法中,可以在发酵前或发酵过程中(包括在发酵微生物繁殖的过程中或之后)加入别的酶。
本申请中提到的酶可以源自或获得自任何合适的来源,包括细菌、真菌、酵母或哺乳动物来源。术语“获得”在本申请中表示酶可以从天然产生所述酶作为天然酶的生物体分离。术语“获得”在本申请中还表示酶可以在宿主生物体中重组产生,其中重组产生的酶对宿主生物体是天然或外来的,或具有经过修饰的氨基酸序列,例如具有缺失的、***的和/或取代的一个或几个氨基酸,即重组产生的酶是天然氨基酸序列的突变体和/或片段或由本领域已知的核酸改组方法产生的酶。天然酶的意义中包含天然变体,而外来酶的意义中包含通过重组获得的变体,如通过定点诱变或改组获得的变体。
还可以将酶纯化。本申请中使用的术语“纯化”包括不含来自其所源自的生物体中其它成分的酶。术语“纯化”还包括不含来自其所获得自的天然生物体的组分的酶。可将酶纯化,仅存在少量的其它蛋白质。表述“其它蛋白质”具体涉及其它酶。本申请使用的术语“纯化”还指去除其它组分,特别是存在于本发明的酶的起源细胞中的其它蛋白质,最特别是其它酶。酶可为“基本上纯的多肽”,即,不含来自产生所述酶的生物体的其它组分,即,例如,用于重组产生酶的宿主生物体。
本发明中所使用的酶可以是适用于本申请所述方法的任何形式,如例如含有或者不含细胞的粗发酵液、干粉或颗粒、无粉尘颗粒、液体、稳定化的液体或受保护的酶。颗粒可以通过,例如美国专利号4,106,991和4,661,452中公开的方法产生,而且可任选地通过本领域已知的方法包覆(coat)。例如,可以根据已确立的方法通过加入稳定剂(如糖、糖醇或另一种多元醇(polyol),和/或乳酸或另一种有机酸)将液体酶制剂稳定化。受保护的酶可以根据EP238,216中公开的方法制备。
洗涤剂组合物
本发明的方法对于以商业上重要的数量改进多肽的分泌以用于洗涤剂组合物特别有用。此类多肽包括但不限于蛋白酶、纤维素分解酶、淀粉酶、和过氧化物酶,或任何对于洗涤剂工业有用的其它酶或生物学蛋白质。
本发明的洗涤剂组合物可以例如配制成手洗或机洗洗涤剂组合物,包括适于沾污织物预处理的洗涤添加剂组合物和漂洗添加的织物柔顺剂组合物,或者配制成用于一般家居硬表面清洁操作的洗涤剂组合物,或者配制用于碗盘手洗或机洗操作。
在一个具体的方面,本发明提供了包含根据本发明获得的具有生物学活性之多肽(例如融合蛋白、其构件或它们的组合)的洗涤剂添加剂。洗涤剂添加剂以及洗涤剂组合物可以包含一种或几种(多种)其它酶,如蛋白酶、脂肪酶、角质酶、淀粉酶、碳水化合物酶、纤维素酶、果胶酶、甘露聚糖酶、***糖酶、半乳聚糖酶、木聚糖酶、氧化酶例如漆酶、和/或过氧化物酶。
一般而言,酶组分的特性应当与所选择的洗涤剂相容(即最适pH、与其它酶组分和非酶组分的相容性等),而且酶组分应当以有效量存在。
蛋白酶:合适的蛋白酶包括动物、植物或微生物起源的那些。微生物起源是优选的。包括化学修饰的或蛋白质工程的突变体。蛋白酶可以是丝氨酸蛋白酶或金属蛋白酶,优选碱性微生物蛋白酶或胰蛋白酶样蛋白酶。碱性蛋白酶的例子有枯草杆菌蛋白酶,尤其是自芽孢杆菌属衍生的那些,例如枯草杆菌蛋白酶Novo、枯草杆菌蛋白酶Carlsberg、枯草杆菌蛋白酶309、枯草杆菌蛋白酶147和枯草杆菌蛋白酶168(WO 89/06279)。胰蛋白酶样蛋白酶的例子有胰蛋白酶(例如猪或牛起源的)和公开于WO 89/06270和WO 94/25583中的镰孢属蛋白酶。
有用的蛋白酶的例子有WO 92/19729、WO 98/20115、WO 98/20116和WO 98/34946中记载的变体,尤其是在一个或多个下列位置具有取代的变体:27、36、57、76、87、97、101、104、120、123、167、170、194、206、218、222、224、235和274。
优选的商业上可用的蛋白酶包括ALCALASETM、SAVINASETM、PRIMASETM、DURALASETM、ESPERASETM和KANNASETM(NOVOZYMESA/S),MAXTASETM、MAXACALTM、MAXAPEMTM、PROPERASETM、PURAFECTTM、PURAFECT OXPTM、FN2TM和FN3TM(Genencor InternationalInc.)。
脂肪酶:合适的脂肪酶包括细菌或真菌起源的那些。包括化学修饰的或蛋白质工程的突变体。有用的脂肪酶的例子包括来自腐质霉属(同义词嗜热霉属(Thermomyces))的脂肪酶,例如EP 258068和EP 305216中所描述的疏棉状腐质霉(细毛嗜热霉(T.lanuginosus))或WO 96/13580中所描述的特异腐质霉;假单胞菌属(Pseudomonas)脂肪酶,例如产碱假单胞菌(P.alkaligenes)或类产碱假单胞菌(P.pseudoalcaligenes)(EP 218272)、洋葱假单胞菌(P.cepacia)(EP 331376)、施氏假单胞菌(P.stutzeri)(GB 1,372,034)、荧光假单胞菌(P.fluorescens)、假单胞菌菌种菌株SD 705(WO 95/06720和WO 96/27002)、威斯康星假单胞菌(P.wisconsinensis)(WO 96/12012);芽孢杆菌属(Bacillus)脂肪酶,例如来自枯草芽孢杆菌(B.subtilis)(Dartois等,1993,Biochemica etBiophysica Acta,1131,253-360)、嗜热脂肪芽孢杆菌(B.stearothermophilus)(JP64/744992)、或短小芽孢杆菌(B.pumilus)(WO 91/16422)。
其它例子有如在WO 92/05249、WO 94/01541、EP 407225、EP 260105、WO 95/35381、WO 96/00292、WO 95/30744、WO 94/25578、WO 95/14783、WO 95/22615、WO 97/04079和WO 97/07202中所描述的脂肪酶变体。
优选的商业上可用的脂肪酶包括LIPOLASETM、LIPEXTM、和LipolaseULTRATM(Novozymes A/S)。
淀粉酶:合适的淀粉酶(α和/或β)包括细菌或真菌起源的那些。包括化学修饰的或蛋白质工程的突变体。淀粉酶包括自例如芽孢杆菌属例如地衣芽孢杆菌(B.licheniformis)特定菌株获得的α-淀粉酶,更详细地记载于GB1,296,839。
有用的淀粉酶的例子有在WO 94/02597、WO 94/18314、WO 96/23873、和WO 97/43424中所描述的变体,尤其是在一个或多个下列位置具有取代的变体:15、23、105、106、124、128、133、154、156、181、188、190、197、202、208、209、243、264、304、305、391、408和444。
商业上可用的淀粉酶有DURAMYLTM、TERMAMYLTM、FUNGAMYLTM和BANTM(Novozymes A/S),RapidaseTM和PurastarTM(Genencor InternationalInc.)。
纤维素酶:合适的纤维素酶包括细菌或真菌起源的那些。包括化学修饰的或蛋白质工程的突变体。合适的纤维素酶包括来自下列属的纤维素酶:芽孢杆菌属、假单胞菌属、腐质霉属、镰孢属、梭孢壳属、枝顶孢霉属或木霉属,例如在美国专利No.4,435,307、美国专利No.5,648,263、美国专利No.5,691,178、美国专利No.5,776,757和WO 89/09259中公开的由特异腐质霉、嗜热毁丝霉和尖镰孢产生的真菌纤维素酶。
尤其合适的纤维素酶是有益于保护颜色的碱性或中性纤维素酶。此类纤维素酶的例子有EP 0495257、EP 0531372、WO 96/11262、WO 96/29397、WO 98/08940中描述的纤维素酶。其它例子是纤维素酶变体,如在WO94/07998、EP 0531315、美国专利No.5,457,046、美国专利No.5,686,593、美国专利No.5,763,254、WO 95/24471、WO 98/12307和PCT/DK98/00299中描述的那些纤维素酶变体。
商业上可用的纤维素酶包括
Figure A20078003522400731
CELLUZYMETM和CAREZYMETM(Novozymes A/S),ClazinaseTM和Puradax HATM(GenencorInternational Inc.),及KAC-500(B)TM(Kao Corporation)。
过氧化物酶/氧化酶:合适的过氧化物酶/氧化酶包括植物、细菌或真菌起源的那些。包括化学修饰的或蛋白质工程的突变体。有用的过氧化物酶的实例包括来自鬼伞属例如灰盖鬼伞(C.cinereus)的过氧化物酶及其变体,如在WO 93/24618、WO 95/10602、和WO 98/15257中所描述的那些。
商业上可用的过氧化物酶包括GUARDZYMETM(Novozymes A/S)。
可通过添加含一种或多种酶的分开的添加剂或通过添加包含所有这些酶的组合添加剂将酶组分包括在洗涤剂组合物中。本发明的洗涤剂添加剂,即分开的添加剂或组合的添加剂,可配制成例如颗粒、液体、浆料等形式。优选的洗涤剂添加剂配制物为颗粒,特别是无粉尘的颗粒;液体,特别是稳定化的液体;或浆料。
例如可如在美国专利No.4,106,991和4,661,452中所公开的方法制备无粉尘颗粒,并可以任选地通过本领域已知的方法进行包覆。蜡质包覆材料的实例有平均摩尔重量为1000-20000的聚(环氧乙烷)产物(聚乙二醇,PEG);具有16-50个环氧乙烷单元的乙氧基化的壬基酚;具有15-80个环氧乙烷单元的乙氧基化的脂肪醇,其中醇含有12-20个碳原子;脂肪醇;脂肪酸;及脂肪酸的单-、双-和三甘油酯。GB 1483591中给出了适于通过流化床技术应用的成膜包覆材料的实例。例如,液体酶制备物可根据已建立的方法通过加入多元醇如丙二醇、糖或糖醇、乳酸或硼酸来稳定。受保护的酶可根据EP 238,216中所公开的方法制备。
本发明的洗涤剂组合物可采用任何方便的形式,例如条、片、粉末、颗粒、糊膏(paste)、或液体。液体洗涤剂可以是含水的,一般含高达70%的水和0-30%的有机溶剂,或者是不含水的。
洗涤剂组合物可含有一种或几种表面活性剂,可以是非离子型的,包括半极性和/或阴离子和/或阳离子和/或两性离子的。表面活性剂一般以按重量计0.1%-60%的水平存在。
当洗涤剂包含阴离子表面活性剂时,它通常含有大约1%到大约40%的阴离子表面活性剂,如线状的烃基苯磺酸酯、α-烯烃磺酸酯(α-olefinsulfonate)、烃基硫酸酯(脂肪醇硫酸酯)、醇乙氧基硫酸酯、仲烷基磺酸酯(secondaryalkanesulfonate)、α-磺基脂肪酸甲酯、烷基-或烯基琥珀酸或皂(soap)。
当洗涤剂中包含非离子型表面活性剂时,它通常含有大约0.2%到大约40%的非离子型表面活性剂,如醇乙氧基化物、壬基苯酚乙氧基化物、烃基多苷、烃基二甲基胺氧化物、乙氧基脂肪酸单乙醇酰胺、脂肪酸单乙醇酰胺、多羟基烃基脂肪酸酰胺、或葡糖胺的N-酰基N-烃基衍生物(“葡糖酰胺”)。
洗涤剂可包含0-65%的洗涤剂助洗剂或络合剂,如沸石、二磷酸盐、三磷酸盐、膦酸酯、碳酸盐、柠檬酸盐、氮川三乙酸(nitrilotriacetic acid)、乙二胺四乙酸、二亚乙基三胺五乙酸、烷基-或烯基琥珀酸、可溶性硅酸盐或层状硅酸盐(例如购自Hoechst的SKS-6)。
洗涤剂可包含一种或几种聚合物。实例有羧甲基纤维素、聚(乙烯吡咯烷酮)、聚(乙二醇)、聚(乙烯醇)、聚(乙烯吡啶-N-氧化物)、聚(乙烯咪唑)、聚羧酸酯如聚丙烯酸酯、马来酸/丙烯酸共聚物、和甲基丙烯酸月桂酯/丙烯酸共聚物。
洗涤剂可包含漂白***,该***可含有H2O2源如过硼酸盐或过碳酸盐,可将其与形成过酸的漂白活化剂如四乙酰基乙二胺或壬酰氧基苯磺酸酯相组合。或者,漂白***可包含过氧酸,例如酰胺、酰亚胺或砜型的过氧酸。
可使用常规的稳定剂稳定本发明洗涤剂组合物的酶组分,所述常规稳定剂例如多元醇,如丙二醇或丙三醇;糖或糖醇;乳酸;硼酸,或硼酸衍生物,例如芳香族硼酸酯,或苯基硼酸衍生物如4-甲酰苯基硼酸;且所述组合物可如WO 92/19709和WO 92/19708中所描述的方法来配制。
洗涤剂还可包含其它的常规洗涤剂成分,如包括粘土的织物调节剂、泡沫促进剂、抑泡剂、抗蚀剂、污垢悬浮剂、抗污垢再沉积剂、染色剂、杀菌剂、光增白剂、助水溶物(hydrotrope)、晦暗抑制剂、或芳香剂(perfume)。
在洗涤剂组合物中的任何酶组分,特别是本发明具有生物学活性之多肽都可以相应于每升洗涤液0.01-100mg酶蛋白质的量加入,优选每升洗涤液0.05-5mg酶蛋白质,特别是每升洗涤液0.1-1mg酶蛋白质。
还可将本发明具有生物学活性之多肽掺入到WO 97/07202所公开的洗涤剂配制剂中,这里并入所述文献作为参考。
其它用途
根据本发明获得的具有生物学活性之多肽(例如融合蛋白、其构件或其组合)还可以与其它糖水解酶(glycohydrolase)和相关酶(如本申请所述)组合用于处理纺织品(作为生物抛光剂)和用于减少起毛(fuzz)、起球(pilling)、质地改良(texture modification)和砂洗(stonewashing)(N.K.Lange,于P.Suominen,T.Reinikainen(编),Trichoderma reesei Cellulases and Other Hydrolases,Foundation for Biotechnical and Industrial Fermentation Research,Helsinki,1993,pp.263-272)。另外,所述多肽还可以与其它糖水解酶和相关酶(如本申请所述)组合用于在木材加工中生物纸浆(biopulping)或剥皮(debarking)、在造纸中纤维改良(fiber modification)、漂白(bleaching)和减少精炼能量成本(refining energycosts)、白水处理(whitewater treatment)(其对于废水再生、木质纤维素纤维再生如脱墨(deinking)和二次纤维加工(secondary fiber processing)是重要的)、及木材残余物利用(S.D,Mansfield和A.R.Esteghlalian于S.D,Mansfield和J.N.Saddler(编),Applications of Enzymes to Lignocellulosics,ACS Symposium Series855,Washington,D.C.,2003,pp.2-29)。
通过以下实施例进一步对本发明进行描述,但不应将其理解为对本发明范围的限制。
实施例
作为缓冲液和底物使用的化学药品是至少试剂等级的商业产品。
DNA测序
DNA测序使用Applied Biosystems 3130X型遗传分析仪(Model 3130XGenetic Analyzer,Applied Biosystems,Foster City,CA,USA)进行,其使用染料终止物化学(Giesecke等,1992,Journal of Virol.Methods 38:47-60)。使用phred/phrap/consed(University of Washington,Seattle,WA,USA)及序列特异性引物装配序列。
菌株
里氏木霉RutC30(ATCC 56765;Montenecourt和Eveleigh,1979,Adv.Chem.Ser.181:289-301)衍生自里氏木霉Qm6A(ATCC 13631;Mandels和Reese,1957,J.Bacteriol.73:269-278)。使用里氏木霉RutC30和米曲霉Jal355菌株(WO 02/062973)来表达β-葡糖苷酶融合蛋白。
培养基和溶液
YP培养基每升由10g酵母提取物和20g田菌用蛋白胨构成。
纤维素酶诱导培养基每升由20g纤维素,10g玉米浆固体,1.45g(NH4)2SO4,2.08g KH2PO4,0.28g CaCl2,0.42g MgSO4·7H2O和0.42ml痕量金属溶液构成。
痕量金属溶液每升由216g FeCl3·6H2O,58g ZnSO4·7H2O,27gMnSO4·H2O,10g CuSO4·5H2O,2.4g H3BO3,和336g柠檬酸构成。
STC由1M山梨醇,10mM CaCl2,和10mM Tris-HCl,pH7.5构成。
COVE板每升由342g蔗糖,10ml COVE盐溶液,10ml的1M乙酰胺,10ml的1.5M CsCl,和25g Noble琼脂构成。
COVE盐溶液每升由26g KCl,26g MgSO4,76g KH2PO4,和50ml COVE痕量金属溶液构成。
COVE痕量金属溶液每升由0.04g Na2B4O7·10H2O,0.4g CuSO4·5H2O,1.2gFeSO4·7H2O,0.7g MnSO4·H2O,0.8g Na2MoO2·H2O,和10g ZnSO4·7H2O构成。
COVE2板每升由30g蔗糖,20ml COVE盐溶液,25g Noble琼脂,和10ml的1M乙酰胺构成。
PDA板每升由39g马铃薯右旋糖琼脂构成。
LB培养基每升由10g胰蛋白胨,5g酵母提取物,5g氯化钠构成。
2X YT板每升由10g胰蛋白胨,5g酵母提取物,5g氯化钠,和15g Bacto琼脂构成。
MDU2BP培养基每升由45g麦芽糖,1g MgSO4·7H2O,1g NaCl,2gK2HSO4,12g KH2PO4,2g尿素,和500μl AMG痕量金属溶液构成,将pH调节至5.0,然后用0.22μm过滤单元(unit)过滤除菌。
AMG痕量金属溶液每升由14.3g ZnSO4·7H2O,2.5g CuSO4·5H2O,0.5gNiCl2·6H2O,13.8g FeSO4·7H2O,8.5g MnSO4·7H2O,和3g柠檬酸构成。
极限培养基板每升由6g NaNO3,0.52g KCl,1.52g KH2PO4,1ml COVE痕量金属溶液,20g Noble琼脂,20ml 50%葡萄糖,2.5ml 20%MgSO4·7H2O,和20ml生物素储液构成。
生物素储液每升由0.2g生物素构成。
SOC培养基由2%胰蛋白胨,0.5%酵母提取物,10mM NaCl,2.5mM KCl,10mM MgCl2和10mM MgSO4构成,高压灭菌后,添加经过滤除菌的葡萄糖至20mM。
实施例1:pMJ04表达载体的构建
通过自里氏木霉RutC30基因组DNA使用下文所示引物993429(反义)和993428(有义)PCR扩增里氏木霉纤维二糖水解酶1基因(cbh1,CEL7A)终止子构建了表达载体pMJ04。反义引物设计成在5’端具有Pac I位点,而有义引物设计成在3’端具有Spe I位点。
引物993429(反义):
5’-AACGTTAATTAAGGAATCGTTTTGTGTTT-3’(SEQ ID NO:33)
引物993428(有义):
5’-AGTACTAGTAGCTCCGTGGCGAAAGCCTG-3’(SEQ ID NO:34)
使用
Figure A20078003522400781
Plant Maxi试剂盒(QIAGEN Inc.,Valencia,CA,USA)分离里氏木霉RutC30基因组DNA。
扩增反应(50μl)由1X ThermoPol反应缓冲液(New England Biolabs,Beverly,MA,USA),0.3mM dNTP,100ng里氏木霉RutC30基因组DNA,0.3μM引物993429,0.3μM引物993428和2个单位Vent DNA聚合酶(New EnglandBiolabs,Beverly,MA,USA)构成。将反应物在
Figure A20078003522400782
Figure A20078003522400783
5333(Eppendorf Scientific,Inc.,Westbury,NY,USA)中温育,编程为5个循环,每个循环为94℃30秒、50℃30秒和72℃60秒,然后是25个循环,每个循环为94℃30秒、65℃30秒和72℃120秒(最终延伸5分钟)。在1.0%琼脂糖凝胶上分离反应产物,使用40mM Tris碱-20mM乙酸钠-1mM EDTA二钠(TAE)缓冲液,其中自凝胶切下229bp产物条带并使用
Figure A20078003522400784
凝胶提取试剂盒(QIAGEN Inc.,Valencia,CA,USA)根据制造商的说明书纯化。
所得PCR片段用Pac I和Spe I消化并使用快速连接试剂盒(Roche,Indianapolis,IN,USA)连接入经相同限制酶消化的pAlLo1(WO 05/067531)以产生pMJ04(图1)。
实施例2:pCaHj568的构建
质粒pCaHj568自pCaHj170(美国专利No.5,763,254)和pMT2188构建。质粒pCaHj170包含特异腐质霉内切葡聚糖酶V(CEL45A)全长编码区(SEQ IDNO:1,其编码SEQ ID NO:2之氨基酸序列)。pMT2188的构建通过自pCaHj483(WO 98/00529)使用下文所示引物142779和142780PCR扩增pUC19复制起点起始。引物142780将Bbu I位点引入PCR片段。
142779:5’-TTGAATTGAAAATAGATTGATTTAAAACTTC-3’(SEQ ID NO:35)
142780:5’-TTGCATGCGTAATCATGGTCATAGC-3’(SEQ ID NO:36)
遵循制造商的说明书使用
Figure A20078003522400791
PCR***(Roche MolecularBiochemicals,Basel,Switzerland)来进行此扩增。在琼脂糖凝胶上将PCR产物分离,分离1160bp片段并使用Jetquick凝胶提取旋转试剂盒(Genomed,Wielandstr,Germany)纯化。
使用下文所示引物140288和142778使用
Figure A20078003522400792
PCR***自通用的酿酒酵母克隆载体pYES2(Invitrogen,Carlsbad,CA,USA)扩增URA3基因。引物140288将Eco RI位点引入PCR片段。
5’-TTGAATTCATGGGTAATAACTGATAT-3’(SEQ ID NO:37)
142778:
5’-AAATCAATCTATTTTCAATTCAATTCATCATT-3’(SEQ ID NO:38)
在琼脂糖凝胶上将PCR产物分离,分离1126bp片段并使用Jetquick凝胶提取旋转试剂盒纯化。
通过混合并使用上文所示引物142780和140288通过交叠剪接法(Horton等,1989,Gene 77:61-68)扩增来融合上述两种PCR片段。在琼脂糖凝胶上将PCR产物分离,分离2263bp片段并使用Jetquick凝胶提取旋转试剂盒纯化。
所得片段用Eco RI和Bbu I消化并使用标准规程连接至pCaHj483经相同限制酶消化产生的最大片段。将连接混合物转化入通过Mandel和Higa,1970,J.Mol.Biol.45:154的方法制成感受态的pyrF-阴性大肠杆菌菌株DB6507(ATCC 35673)。在每升补充有1g酪蛋白氨基酸,500μg硫胺素和10mg卡那霉素的固体M9培养基(Sambrook等,1989,Molecular Cloning,A LaboratoryManual,第2版,Cold Spring Harbor Laboratory Press)上选择转化体。分离来自一株转化体的质粒并命名为pCaHj527(图2)。
使用PCR***根据制造商的说明书通过简单PCR法对pCaHj527上存在的NA2-tpi启动子进行定点诱变。使用下文所示诱变引物141223将核苷酸134-144自GTACTAAAACC(SEQ ID NO:39)转变成CCGTTAAATTT(SEQ ID NO:40)。
引物141223:5’-GGATGCTGTTGACTCCGGAAATTTAACGGTTTGGTCTTGCATCCC-3’(SEQ ID NO:41)
使用下文所示诱变引物141222将核苷酸423-436自ATGCAATTTAAACT(SEQ ID NO:42)转变成CGGCAATTTAACGG(SEQ ID NO:43)。
引物141222:5’-GGTATTGTCCTGCAGACGGCAATTTAACGGCTTCTGCGAATCGC-3’(SEQ ID NO:44)
所得质粒命名为pMT2188(图3)。
将特异腐质霉内切葡聚糖酶V编码区自pCaHj170(作为Bam HI-Sal I片段)转移入用Bam HI和Xho I消化的pMT2188,以产生pCaHj568(图4)。质粒pCaHj568包含突变的NA2-tpi启动子,其可操作连接于特异腐质霉内切葡聚糖酶V全长编码序列。
实施例3:pMJ05的构建
通过自pCaHj568使用下文所示引物HiEGV-F和HiEGV-R PCR扩增915bp特异腐质霉内切葡聚糖酶V全长编码区而构建了质粒pMJ05。
HiEGV-F(有义):
5’-AAGCTTAAGCATGCGTTCCTCCCCCCTCC-3’(SEQ ID NO:45)
HiEGV-R(反义):
5’-CTGCAGAATTCTACAGGCACTGATGGTACCAG-3’(SEQ ID NO:46)
扩增反应(50μl)由1X ThermoPol反应缓冲液(New England Biolabs,Beverly,MA,USA),0.3mM dNTP,10ng/μl pCaHj568,0.3μM HiEGV-F引物,0.3μMHiEGV-R引物和2个单位Vent DNA聚合酶(New England Biolabs,Beverly,MA,USA)构成。将反应在
Figure A20078003522400801
Figure A20078003522400802
5333中温育,编程为5个循环,每个循环为94℃30秒、50℃30秒和72℃60秒,接着是25个循环,每个循环为94℃30秒、65℃30秒和72℃120秒(最终延伸5分钟)。在使用TAE缓冲液的1.0%琼脂糖凝胶上分离反应产物,其中自凝胶切下937bp产物条带并使用
Figure A20078003522400803
凝胶提取试剂盒根据制造商的说明书将其纯化。
将937bp纯化的片段作为模板DNA用于后续使用下列引物的扩增:
HiEGV-R(反义):
5’-CTGCAGAATTCTACAGGCACTGATGGTACCAG-3’(SEQ ID NO:47)
HiEGV-F-交叠(overlap)(有义):
5’-ACCGCGGACTGCGCATCATGCGTTCCTCCCCCCTCC-3’(SEQ ID NO:48)
斜体表示的引物序列与17bp的里氏木霉纤维二糖水解酶I基因(cbh1)启动子同源,而加下划线的引物序列与29bp的特异腐质霉内切葡聚糖酶V编码区同源。启动子和编码序列之间的36bp交叠容许包含里氏木霉cbh1启动子的994bp片段与包含特异腐质霉内切葡聚糖酶V编码区的918bp片段的精确融合。
扩增反应(50μl)由1X ThermoPol反应缓冲液,0.3mM dNTP,1μl纯化的937bp PCR片段,0.3μM HiEGV-F-交叠引物,0.3μM HiEGV-R引物,和2个单位VentDNA聚合物构成。将反应在5333中温育,编程为5个循环,每个循环为94℃30秒、50℃30秒和72℃60秒,接着是25个循环,每个循环为94℃30秒、65℃30秒和72℃120秒(最终延伸5分钟)。在使用TAE缓冲液的1.0%琼脂糖凝胶上分离反应产物,其中自凝胶切下945bp产物条带并使用
Figure A20078003522400812
凝胶提取试剂盒根据制造商的说明书将其纯化。
实施另一PCR以使用下文所示引物(有义引物设计成在5’端具有Sal I限制性位点)自里氏木霉RutC30基因组DNA扩增里氏木霉cbh1启动子序列,自基因ATG起始密码子上游的994bp延伸。使用Plant Maxi试剂盒分离里氏木霉RutC30基因组DNA。
TrCBHIpro-F(有义):
5’-AAACGTCGACCGAATGTAGGATTGTTATC-3’(SEQ ID NO:49)
TrCBHIpro-R(反义):
5’-GATGCGCAGTCCGCGGT-3’(SEQ ID NO:50)
扩增反应(50μl)由1X ThermoPol反应缓冲液,0.3mM dNTP,100ng/μl里氏木霉RutC30基因组DNA,0.3μM TrCBHIpro-F引物,0.3μM TrCBHIpro-R引物和2个单位Vent DNA聚合物构成。将反应在
Figure A20078003522400815
5333中温育,编程为30个循环,每个循环为94℃30秒、55℃30秒和72℃120秒(最终延伸5分钟)。在使用TAE缓冲液的1.0%琼脂糖凝胶上分离反应产物,其中自凝胶切下998bp产物条带并使用
Figure A20078003522400816
凝胶提取试剂盒根据制造商的说明书将其纯化。
纯化的998bp PCR片段作为模板DNA用于使用下文所示引物的后续扩增。
TrCBHIpro-F:
5’-AAACGTCGACCGAATGTAGGATTGTTATC-3’(SEQ ID NO:51)
TrCBHIpro-R-交叠:
5’-GGAGGGGGGAGGAACGCATGATGCGCA GTCCGCGGT-3’(SEQ ID NO:52)
斜体表示的序列与17bp的里氏木霉cbh1启动子同源,而加下划线的序列与29bp的特异腐质霉内切葡聚糖酶V编码区同源。启动子和编码序列之间的36bp交叠容许包含里氏木霉cbh1启动子的994bp片段与包含特异腐质霉内切葡聚糖酶V全长编码区的918bp片段的精确融合。
扩增反应(50μl)由1X ThermoPol反应缓冲液,0.3mM dNTP,1μl纯化的998bp PCR片段,0.3μM TrCBH1pro-F引物,0.3μM TrCBH1pro-R-交叠引物,和2个单位Vent DNA聚合物构成。将反应在
Figure A20078003522400821
Figure A20078003522400822
5333中温育,编程为5个循环,每个循环为94℃30秒、50℃30秒和72℃60秒,接着是25个循环,每个循环为94℃30秒、65℃30秒和72℃120秒(最终延伸5分钟)。在使用TAE缓冲液的1.0%琼脂糖凝胶上分离反应产物,其中自凝胶切下1017bp产物条带并使用
Figure A20078003522400823
凝胶提取试剂盒根据制造商的说明书将其纯化。
使用1017bp里氏木霉cbh1启动子PCR片段和945bp特异腐质霉内切葡聚糖酶V PCR片段作为模板DNA用于后续使用下列引物的扩增,用于使用交叠PCR将994bp cbh1启动子精确融合至918bp内切葡聚糖酶V全长编码区。
TrCBHIpro-F:
5’-AAACGTCGACCGAATGTAGGATTGTTATC-3’(SEQ ID NO:53)
HiEGV-R:
5’-CTGCAGAATTCTACAGGCACTGATGGTACCAG-3’(SEQ ID NO:54)
扩增反应(50μl)由1X ThermoPol反应缓冲液,0.3mM dNTP,0.3μMTrCBH1pro-F引物,0.3μM HiEGV-R引物和2个单位Vent DNA聚合物构成。将反应在
Figure A20078003522400824
Figure A20078003522400825
5333中温育,编程为5个循环,每个循环为94℃30秒、50℃30秒和72℃60秒,接着是25个循环,每个循环为94℃30秒、65℃30秒和72℃120秒(最终延伸5分钟)。在使用TAE缓冲液的1.0%琼脂糖凝胶上分离反应产物,其中自凝胶切下1926bp产物条带并使用
Figure A20078003522400826
凝胶提取试剂盒根据制造商的说明书将其纯化。
使用
Figure A20078003522400827
PCR克隆试剂盒(Invitrogen,Carlsbad,CA,USA)遵循制造商的规程将所得1926bp片段克隆入-Blunt-II-载体(Invitrogen,Carlsbad,CA,USA)。用Not I和Sal I消化所得质粒,使用
Figure A20078003522400833
凝胶提取试剂盒凝胶纯化1926bp片段并使用T4DNA连接酶(Roche,Indianapolis,IN,USA)连接入也用相同的两种限制酶消化的pMJ04,以产生pMJ05(图5)。质粒pMJ05包含里氏木霉纤维二糖水解酶I启动子和终止子,其可操作连接于特异腐质霉内切葡聚糖酶V全长编码序列。
实施例4:pSMai130表达载体的构建
用下文所示引物993467(有义)和993456(反义)通过PCR自作为模板的pJaL660(WO 2002/095014)扩增跨越米曲霉β-葡糖苷酶全长编码序列(SEQID NO:21为cDNA序列和SEQ ID NO:22为推导的氨基酸序列;大肠杆菌DSM 14240)自ATG起始密码子至TAA终止密码子的2586bp DNA片段。在反义引物的5’端设计Spe I位点以便于连接。斜体表示的引物序列与24bp的里氏木霉cbh1启动子同源,而加下划线的序列与22bp的米曲霉β-葡糖苷酶编码区同源。
引物993467:
5’-ATAGTCAACCGCGGACTGCGCATCATGAAGCTTGGTTGGATCGAGG-3’(SEQ ID NO:55)
引物993456:
5’-ACTAGTTTACTGGGCCTTAGGCAGCG-3’(SEQ ID NO:56)
扩增反应(50μl)由Pfx扩增缓冲液(Invitrogen,Carlsbad,CA,USA),0.25mM dNTP,10ng pJaL660,6.4μM引物993467,3.2μM引物993456,1mMMgCl2,和2.5个单位Pfx DNA聚合酶(Invitrogen,Carlsbad,CA,USA)构成。将反应在
Figure A20078003522400834
Figure A20078003522400835
5333中温育,编程为30个循环,每个循环为94℃1分钟、55℃1分钟和72℃3分钟(最终延伸15分钟)。在使用TAE缓冲液的1.0%琼脂糖凝胶上分离反应产物,其中自凝胶切下2586bp产物条带并使用
Figure A20078003522400836
凝胶提取试剂盒根据制造商的说明书将其纯化。
实施另一PCR,用以使用下文所示引物993453(有义)和引物993463(反义)扩增里氏木霉cbh1启动子序列,自基因ATG起始密码子上游的1000bp延伸,以产生1000bp PCR片段。
引物993453:
5’-GTCGACTCGAAGCCCGAATGTAGGAT-3’(SEQID NO:57)
引物993463:
5’-CCTCGATCCAACCAAGCTTCATGA TGCGCA GTCCGCGGTTGACTA-3’(SEQ ID NO:58)
斜体表示的引物序列与24bp的里氏木霉cbh1启动子同源,而加下划线的引物序列与22bp的米曲霉β-葡糖苷酶全长编码区同源。启动子和编码序列之间的46bp交叠容许包含里氏木霉cbh1启动子的1000bp片段与包含米曲霉β-葡糖苷酶编码区的2586bp片段的精确融合。
扩增反应(50μl)由Pfx扩增缓冲液,0.25mM dNTP,100ng里氏木霉RutC30基因组DNA,6.4μM引物993453,3.2μM引物993463,1mM MgCl2和2.5个单位Pfx DNA聚合物构成。将反应在
Figure A20078003522400841
Figure A20078003522400842
5333中温育,编程为30个循环,每个循环为94℃1分钟、55℃1分钟和72℃3分钟(最终延伸15分钟)。在使用TAE缓冲液的1.0%琼脂糖凝胶上分离反应产物,其中自凝胶切下1000bp产物条带并使用
Figure A20078003522400843
凝胶提取试剂盒根据制造商的说明书将其纯化。
将纯化后的片段作为模板DNA用于后续通过使用上文所示引物993453(有义)和引物993456(反义)的交叠PCR进行的扩增,以精确融合包含里氏木霉cbh1启动子的1000bp片段与包含米曲霉β-葡糖苷酶全长编码区的2586bp片段。
扩增反应(50μl)由Pfx扩增缓冲液,0.25mM dNTP,6.4μM引物99353,3.2μM引物993456,1mM MgCl2和2.5个单位Pfx DNA聚合物构成。将反应在
Figure A20078003522400844
5333中温育,编程为30个循环,每个循环为94℃1分钟、60℃1分钟和72℃4分钟(最终延伸15分钟)。
用Sal I和Spe I消化所得3586bp片段并连接入用相同的两种限制酶消化的pMJ04,以产生pSMai130(图6)。质粒pSMai130包含里氏木霉纤维二糖水解酶I基因启动子和终止子,其可操作连接于米曲霉天然β-葡糖苷酶信号序列和编码序列(即全长米曲霉β-葡糖苷酶编码序列)。
实施例5:pSMai135的构建
用下文所示引物993728(有义)和引物993727(反义)自作为模板的pJaL660PCR扩增自Lys-20至TAA终止密码子的米曲霉β-葡糖苷酶成熟编码区(缺少天然信号序列,见图7;SEQ ID NO:59和60)。
引物993728:
5’-TGCCGGTGTTGGCCCTTGCCAAGGATGATCTCGCGTACTCCC-3’(SEQID NO:61)
引物993727:
5’-GACTAGTCTTACTGGGCCTTAGGCAGCG-3’(SEQ ID NO:62)
斜体表示的序列与20bp的特异腐质霉内切葡聚糖酶V信号序列同源,而加下划线的序列与22bp的米曲霉β-葡糖苷酶编码区同源。在反义引物的5’端设计Spe I位点。
扩增反应(50μl)由Pfx扩增缓冲液,0.25mM dNTP,10ng/μl pJaL660,6.4μM引物993728,3.2μM引物993727,1mM MgCl2和2.5个单位Pfx DNA聚合物构成。将反应在
Figure A20078003522400851
5333中温育,编程为30个循环,每个循环为94℃1分钟、55℃1分钟和72℃3分钟(最终延伸15分钟)。在使用TAE缓冲液的1.0%琼脂糖凝胶上分离反应产物,其中自凝胶切下2523bp产物条带并使用
Figure A20078003522400852
凝胶提取试剂盒根据制造商的说明书纯化。
使用下文所示引物993724(有义)和引物993729(反义)进行另一PCR扩增,以扩增1000bp里氏木霉cbh1启动子和63bp特异腐质霉内切葡聚糖酶V信号序列(ATG起始密码子至Ala-21,图8,SEQ ID NO:63和64)。
引物993724:
5’-ACGCGTCGACCGAATGTAGGATTGTTATCC-3’(SEQ ID NO:65)
引物993729:
5’-GGGAGTACGCGAGATCATCCTTGGCAAGGGCCAACACCGGCA-3’(SEQ ID NO:66)
斜体表示的引物序列与20bp的特异腐质霉内切葡聚糖酶V信号序列同源,而加下划线的引物序列与22bp的米曲霉β-葡糖苷酶编码区同源。
使用包含在cbh1启动子控制下的特异腐质霉内切葡聚糖酶V编码区的质粒pMJ05作为模板来产生包含里氏木霉cbh1启动子和特异腐质霉内切葡聚糖酶V信号序列片段的1063bp片段。里氏木霉cbh1启动子和特异腐质霉内切葡聚糖酶V信号序列与米曲霉β-葡糖苷酶成熟编码序列之间共享42bp交叠,以提供启动子与2523bp米曲霉β-葡糖苷酶编码区的ATG起始密码子之间的完好连接。
扩增反应(50μl)由Pfx扩增缓冲液,0.25mM dNTP,10ng/μl pMJ05,6.4μM引物993728,3.2μM引物993727,1mM MgCl2和2.5个单位Pfx DNA聚合物构成。将反应在
Figure A20078003522400861
5333中温育,编程为30个循环,每个循环为94℃1分钟、60℃1分钟和72℃4分钟(最终延伸15分钟)。在使用TAE缓冲液的1.0%琼脂糖凝胶上分离反应产物,其中自凝胶切下1063bp产物条带并使用凝胶提取试剂盒根据制造商的说明书纯化。
使用纯化的交叠片段作为模板来进行使用上文所述引物993724(有义)和引物993727(反义)的扩增,以通过交叠PCR将包含里氏木霉cbh1启动子和特异腐质霉内切葡聚糖酶V信号序列的1063bp片段精确融合于包含米曲霉β-葡糖苷酶成熟编码区读码框的2523bp片段。
扩增反应(50μl)由Pfx扩增缓冲液,0.25mM dNTP,6.4μM引物993724,3.2μM引物993727,1mM MgCl2和2.5个单位Pfx DNA聚合物构成。将反应在
Figure A20078003522400863
5333中温育,编程为30个循环,每个循环为94℃1分钟、60℃1分钟和72℃4分钟(最终延伸15分钟)。在使用TAE缓冲液的1.0%琼脂糖凝胶上分离反应产物,其中自凝胶切下3591bp产物条带并使用
Figure A20078003522400864
凝胶提取试剂盒根据制造商的说明书纯化。
用Sal I和Spe I消化所得3591bp片段并连接入用相同限制酶消化的pMJ04,以产生pSMai135(图9)。质粒pSMai135包含里氏木霉纤维二糖水解酶I基因启动子和终止子,其可操作连接于特异腐质霉内切葡聚糖酶V信号序列和米曲霉β-葡糖苷酶成熟编码序列。
实施例6:带有特异腐质霉内切葡聚糖酶V分泌信号的米曲霉β-葡糖苷酶的表达
通过PEG介导的转化(Penttila等,1987,Gene 61155-164)将编码连接至特异腐质霉内切葡聚糖酶V分泌信号的成熟米曲霉β-葡糖苷酶的质粒pSMai135(图8)导入里氏木霉RutC30。该质粒包含构巢曲霉amdS基因,以使转化体能够在作为唯一氮源的乙酰胺上生长。
将里氏木霉RutC30在27℃和90rpm在25ml补充有2%(w/v)葡萄糖和10mM尿苷的YP培养基中培养17小时。通过使用真空驱动一次性使用过滤***(Millipore,Bedford,MA,USA)进行的过滤来收集菌丝体,并用去离子水清洗两次,用1.2M山梨醇清洗两次。通过将清洗后的菌丝体悬浮在20ml含15mg/ml
Figure A20078003522400871
(Novozymes A/S,Bagsvaerd,Denmark)和0.36单位/ml几丁质酶(Sigma Chemical Co.,St.Louis,MO,USA)的1.2M山梨醇中和在34℃以90rpm温和摇动温育15-25分钟,产生原生质体。通过以400xg离心7分钟来收集原生质体,并用冷的1.2M山梨醇清洗两次。使用血细胞计数器对原生质体计数并重悬浮在STC中,终浓度为每毫升1×108个原生质体。将多余的原生质体保存在-80℃的Cryo 1℃冷冻容器(Nalgene,Rochester,NY,USA)中。
大约7μg用Pme I消化的pSMai135添加至100μl原生质体溶液并温和混匀,接着添加260μl PEG缓冲液并混合,在室温温育30分钟。然后添加STC(3ml)并混合,将转化溶液涂布到使用构巢曲霉amdS选择的COVE板上。将板在28℃温育5-7天。将转化体传代培养到COVE2板上并在28℃培养。
将67个用pSMai135获得的、称为SMA135的转化体传代培养到新鲜的含乙酰胺的板上并让其在28℃形成孢子7天。
培养这67个SMA135里氏木霉转化体,即在装有25ml pH6.0的纤维素酶诱导培养基的125ml带挡板的摇瓶中接种转化体的孢子并在28℃和200rpm温育7天。里氏木霉RutC30作为对照。在第7天取出培养液样品。将每份培养液的1ml在微型离心机中以15,700xg离心5分钟并将上清液转移至新的管。将样品保存在4℃直至酶测定法。如下所述对上清液测定β-葡糖苷酶活性,其中使用对硝基苯基-β-D-吡喃葡糖苷作为底物。
使用在50mM琥珀酸盐pH5.0中1∶10稀释的培养物上清液的25μl等分试样在200μl的于50mM琥珀酸盐pH5.0中的0.5mg/ml作为底物的对硝基苯基-β-D-吡喃葡糖苷中在环境温度测定β-葡糖苷酶活性。温育15分钟后,通过添加100μl的1M Tris-HCl pH8.0来停止反应并通过分光光度法读取405nm吸光度。1单位β-葡糖苷酶活性对应于在pH5.0在环境温度每分钟每升产生1μmol对硝基苯基。黑曲霉β-葡糖苷酶(NOVOZYMTM 188,Novozymes A/S,Bagsvaerd,Denmark)用作酶标准品。
许多SMA135转化体显示的β-葡糖苷酶活性是里氏木霉RutC30所分泌的β-葡糖苷酶活性的几倍高。在所筛选的SMA135转化体中,转化体SMA135-04产生最高的β-葡糖苷酶活性。
使用
Figure A20078003522400872
Tris-HCl(5%分辨率(resolving))凝胶(Bio-Rad,Hercules,CA,USA)用
Figure A20078003522400873
***(Bio-Rad,Hercules,CA,USA)实施SDS-PAGE。将5μl第7天的上清液(见上文)悬浮在2X浓度的Laemmli样品缓冲液(Bio-Rad,Hercules,CA,USA)中并在存在5%β-巯基乙醇的条件下煮沸3分钟。将上清液样品加载到聚丙烯酰胺凝胶上并用1X Tris/Glycine/SDS作为运行缓冲液(Bio-Rad,Hercules,CA,USA)进行电泳。将所得凝胶用BIO-
Figure A20078003522400881
考马斯染料(Bio-Rad,Hercules,CA,USA)染色。
在38个通过SDS-PAGE分析的里氏木霉SMA135转化体中,有26个产生在作为对照的里氏木霉RutC30中没有看到的大约110kDa的蛋白质。根据通过SDS-PAGE所看到的110kDa条带的丰度(abundance),转化体里氏木霉SMA135-04产生最高水平的β-葡糖苷酶。
实施例7:表达载体pSMai140的构建
通过用Nco I消化携带米曲霉β-葡糖苷酶变体BG41全长编码区(SEQ IDNO:23,其编码SEQ ID NO:24之氨基酸序列)的质粒pSATe111BG41(WO04/099228)来构建表达载体pSMai140。在使用TAE缓冲液的1.0%琼脂糖凝胶上分离所得1243bp片段并使用
Figure A20078003522400882
凝胶提取试剂盒根据制造商的说明书将其纯化。
用Nco I消化表达载体pSMai135,在使用TAE缓冲液的1.0%琼脂糖凝胶上分离8286bp片段并使用
Figure A20078003522400883
凝胶提取试剂盒根据制造商的说明书纯化。然后使用T4DNA连接酶(Roche,Indianapolis,IN,USA)根据制造商的规程将1243bp经Nco I消化的米曲霉β-葡糖苷酶变体BG41片段连接至8286bp载体,以产生表达载体pSMai140(图10)。质粒pSMai140包含里氏木霉纤维二糖水解酶I(CEL7A)基因启动子和终止子,其可操作连接于特异腐质霉内切葡聚糖酶V信号序列和米曲霉β-葡糖苷酶变体成熟编码序列。
实施例8:用pSMai140转化里氏木霉RutC30
将质粒pSMai140用Pme I线性化并如实施例6所述转化入里氏木霉RutC30菌株。自四个独立的转化实验得到了总共100个转化体,都在摇瓶中在纤维素酶诱导培养基上培养,并如实施例6所述对转化体的培养液测量β-葡糖苷酶活性。许多里氏木霉SMA140转化体显示的β-葡糖苷酶活性是里氏木霉RutC30的β-葡糖苷酶活性的几倍高。
在分析了酶活性的同样13份培养物上清液中通过如实施例6所述的SDS-聚丙烯酰胺凝胶电泳和考马斯染色来检测培养基中米曲霉β-葡糖苷酶变体BG41蛋白质的存在。所有这13个具有高β-葡糖苷酶活性的转化体也以不同产量表达大约110KDa米曲霉β-葡糖苷酶变体BG41。
如通过β-葡糖苷酶活性测定法和SDS-聚丙烯酰胺凝胶电泳所评估的,将表达最高β-葡糖苷酶变体的转化体命名为里氏木霉SMA140-43。
实施例9:表达载体pSaMe-F1的构建
使用下文所示引物使用作为模板的pMJ05PCR扩增包含209bp里氏木霉纤维二糖水解酶I基因启动子和特异腐质霉内切葡聚糖酶V基因的核心区(SEQ ID NO:1的核苷酸1-702,其编码SEQ ID NO:2的氨基酸1-234;WO91/17243)的DNA片段。
995103:5’-cccaagcttagccaagaaca-3’(SEQ ID NO:67)
995137:5’-gggggaggaacgcatgggatctggacggc-3’(SEQ ID NO:68)
扩增反应(50μl)由1X Pfx扩增缓冲液,10mM dNTP,50mM MgSO4,10ng/μl pMJ05,50pmol 995103引物,50pmol 995137引物,和2个单位Pfx DNA聚合物构成。将反应在
Figure A20078003522400891
Figure A20078003522400892
5333中温育,编程为30个循环,每个循环为94℃30秒、55℃30秒和72℃60秒(最终延伸3分钟)。
在使用TAE缓冲液的1.0%琼脂糖凝胶上分离反应产物,其中自凝胶切下911bp产物条带并使用
Figure A20078003522400893
凝胶提取试剂盒根据制造商的说明书将其纯化。
使用作为模板的pSMai140和下文所示引物PCR扩增包含806bp米曲霉β-葡糖苷酶变体BG41基因的DNA片段。
995133:5’-gccgtccagatccccatgcgttcctccccc-3’(SEQ ID NO:69)
995111:5’-ccaagcttgttcagagtttc-3’(SEQ ID NO:70)
扩增反应(50μl)由1X Pfx扩增缓冲液,10mM dNTP,50mM MgSO4,100ngpSMai140,50pmol 995133引物,50pmol 995111引物,和2个单位Pfx DNA聚合物构成。将反应在
Figure A20078003522400894
5333中温育,编程为30个循环,每个循环为94℃30秒、55℃30秒和72℃120秒(最终延伸3分钟)。
在使用TAE缓冲液的1.0%琼脂糖凝胶上分离反应产物,其中自凝胶切下806bp产物条带并使用
Figure A20078003522400895
凝胶提取试剂盒根据制造商的说明书将其纯化。
然后将上文两个PCR片段进行交叠PCR。使用纯化的交叠片段作为模板用于使用上文所述引物995103(有义)和引物995111(反义)进行的扩增,以通过交叠PCR将包含209bp里氏木霉纤维二糖水解酶I基因启动子和特异腐质霉内切葡聚糖酶V核心序列的702bp片段精确融合于包含米曲霉β-葡糖苷酶变体BG41编码区的部分的806bp片段。
扩增反应(50μl)由1X Pfx扩增缓冲液,10mM dNTP,50mM MgSO4,2.5μl每种片段(20ng/μl),50pmol 995103引物,50pmol 995111引物,和2个单位高保真Pfx DNA聚合物构成。将反应在
Figure A20078003522400901
5333中温育,编程为初始变性95℃3分钟,然后是30个循环,每个循环为1分钟变性,60℃退火1分钟,和72℃延伸3分钟。
在使用TAE缓冲液的1.0%琼脂糖凝胶上分离反应产物,其中自凝胶切下1.7kb产物条带并使用凝胶提取试剂盒根据制造商的说明书将其纯化。
根据制造商的说明书,将1.7kb片段连接入
Figure A20078003522400903
4平末端载体(Invitrogen,Carlsbad,CA,USA)。然后根据制造商的快速化学转化方法,将构建体转化入ONE
Figure A20078003522400904
TOP10化学感受态大肠杆菌细胞(Invitrogen,Carlsbad,CA,USA)。选择菌落并通过质粒分离和用Hind III消化以释放1.7kb交叠PCR片段来进行分析。
质粒pSMai140也用Hind III消化以使质粒线性化。使用快速DNA连接试剂盒遵循制造商的说明书将这两个消化片段在连接反应中组合以产生pSaMe-F1(图11)。
用连接产物转化大肠杆菌XL1-Blue亚克隆级感受态细胞(Stratagene,LaJolla,CA,USA)。通过来自纯化自经转化大肠杆菌的质粒的里氏木霉纤维二糖水解酶I基因启动子、特异腐质霉内切葡聚糖酶V信号序列、特异腐质霉内切葡聚糖酶V核心、特异腐质霉内切葡聚糖酶V信号序列、米曲霉β-葡糖苷酶变体BG41和里氏木霉纤维二糖水解酶I基因终止子序列的DNA测序来验证构建体的身份。将一个包含重组质粒的克隆命名为pSaMe-F1。质粒pSaMe-F1包含里氏木霉纤维二糖水解酶I基因启动子和终止子和特异腐质霉内切葡聚糖酶V信号肽序列,其直接连接于特异腐质霉内切葡聚糖酶V核心多肽,该特异腐质霉内切葡聚糖酶V核心多肽直接融合于特异腐质霉内切葡聚糖酶V信号肽,该特异腐质霉内切葡聚糖酶V信号肽直接连接于米曲霉β-葡糖苷酶变体BG41成熟编码序列。米曲霉β-葡糖苷酶变体BG融合蛋白的DNA序列和推导的氨基酸序列分别显示于SEQ ID NO:73和74(参见图14A,14B,14C和14D)。
实施例10:用pSaMe-F1转化里氏木霉RutC30
用5×107个里氏木霉RutC30孢子接种装有25ml补充有2%葡萄糖和10mM尿苷的YP培养基的摇瓶。在27℃和90rpm温育过夜大约16小时后,使用真空驱动一次性使用过滤***收集菌丝体。将菌丝体用100ml去离子水清洗两次,用1.2M山梨醇清洗两次。如实施例6所述产生原生质体。
将2μg用Pme I线性化的pSaMe-F 1DNA,100μl里氏木霉RutC30原生质体和50%PEG(4000)混合并在室温温育30分钟。然后添加3ml STC并将内容物倾倒在补充有10mM尿苷的COVE板上。然后将板在28℃温育。到第6天转化体开始出现并挑取到COVE2板上在28℃培养6天。回收了22个里氏木霉转化体。
在摇瓶中在纤维素酶诱导培养基上培养转化体并如实施例6所述测量β-葡糖苷酶活性。许多pSaMe-F1转化体产生β-葡糖苷酶活性。一个命名为里氏木霉SaMeF1-9的转化体产生最高量的β-葡糖苷酶,而且具有表达米曲霉β-葡糖苷酶变体的菌株两倍的活性(实施例9)。
根据Beguin,1983,Analytical Biochem.131(2):333-336使用羧甲基纤维素(CMC)覆盖测定法测定内切葡聚糖酶活性。将来自5份培养液样品(具有最高β-葡糖苷酶活性的样品)的5μg总蛋白质在天然样品缓冲液(Bio-Rad,Hercules,CA,USA)中稀释并使用10X Tris/甘氨酸运行缓冲液(Bio-Rad,Hercules,CA,USA)在
Figure A20078003522400911
8-16%Tris-HCl凝胶(Bio-Rad,Hercules,CA,USA)上运行,然后将凝胶覆盖在含1%羧甲基纤维素(CMC)的板的顶部。在37℃温育1小时后,将凝胶用0.1%刚果红染色20分钟。然后将板用1M NaCl脱色以鉴定指示内切葡聚糖酶活性的透明(clearing)区。看到两个透明带(zone),位于上部的带在大约110kDa而位于下部的带在大约25kDa。特异腐质霉内切葡聚糖酶V和米曲霉β-葡糖苷酶变体BG41融合物的预测蛋白质大小是118kDa,如果这两种蛋白质没有受到切割且保持单一多肽形式;各个内切葡聚糖酶V核心结构域的糖基化和β-葡糖苷酶的糖基化导致各个蛋白质比根据一级序列所预测的在更高mw处迁移。如果这两种蛋白质受到了切割,那么特异腐质霉内切葡聚糖酶V核心结构域的预测大小为24kDa而米曲霉β-葡糖苷酶变体BG41为94kDa。由于在大约110kDa处有透明带,这一结果指示最低限度有一群内切葡聚糖酶和β-葡糖苷酶融合蛋白保持完整而作为单一大型蛋白质形式。较低的透明带最有可能代表内源内切葡聚糖酶活性,另外可能源自特异腐质霉内切葡聚糖酶V核心结构域与米曲霉β-葡糖苷酶的部分切割。
上述结果证明了特异腐质霉内切葡聚糖酶V核心是有活性的,即使在与米曲霉β-葡糖苷酶融合时。另外,β-葡糖苷酶活性的增加表现出源自蛋白质分泌相对于非融合β-葡糖苷酶分泌效率的增加。通过将米曲霉β-葡糖苷酶变体BG41序列连接至有效分泌的特异腐质霉内切葡聚糖酶V核心,更多的β-葡糖苷酶得到分泌。
实施例11:pSaMe-FX载体的构建
通过修饰pSaMe-F1来构建质粒pSaMe-FX。将质粒pSaMe-F1用Bst Z17和Eco RI消化以产生包含β-葡糖苷酶变体BG41编码序列的1kb片段和包含质粒剩余部分的9.2kb片段。在使用TAE缓冲液的1.0%琼脂糖凝胶上将片段分开,切下9.2kb片段并使用
Figure A20078003522400921
凝胶提取试剂盒根据制造商的说明书将其纯化。将质粒pSMai135也用BstZ17和Eco RI消化以产生包含与米曲霉β-葡糖苷酶变体BG41编码序列同源的碱基的1kb片段和包含质粒剩余部分的8.5kb片段。如上所述分离和纯化1kb片段。
使用快速DNA连接试剂盒遵循制造商的说明书在连接反应中将9.2kb和1kb片段组合在一起以产生pSaMe-FX,其与pSaMe-F1相同,只是它包含野生型β-葡糖苷酶成熟编码序列而非变体成熟编码序列。
用连接产物转化大肠杆菌
Figure A20078003522400922
感受态细胞(Stratagene,La Jolla,CA,USA)。通过来自纯化自经转化大肠杆菌的质粒的里氏木霉纤维二糖水解酶I基因启动子、特异腐质霉内切葡聚糖酶V信号序列、特异腐质霉内切葡聚糖酶V核心序列、特异腐质霉内切葡聚糖酶V信号序列、米曲霉β-葡糖苷酶成熟编码序列和里氏木霉纤维二糖水解酶I基因终止子序列的DNA测序来验证构建体的身份。将一个包含重组质粒的克隆命名为pSaMe-FX(图12)。米曲霉β-葡糖苷酶融合蛋白的DNA序列和推导的氨基酸序列分别显示于SEQ ID NO:75和76(参见图15A,15B,15C和15D)。
实施例12:木霉转化体的转化和表达
将pSaMe-FX构建体用Pme I线性化并如实施例10所述转化入里氏木霉RutC30菌株。自单个转化得到了总共63个转化体。将转化体在摇瓶中在纤维素酶诱导培养基上培养并如实施例6所述测量β-葡糖苷酶活性。许多pSaMe-FX转化体产生β-葡糖苷酶活性。一个命名为SaMe-FX16的转化体与里氏木霉SaMeF1-9(实施例10)相比产生两倍量的β-葡糖苷酶活性。
实施例13:里氏木霉转化体的分析
如实施例9所述通过将特异腐质霉内切葡聚糖酶V核心(含它自己的天然信号序列)与连接有特异腐质霉内切葡聚糖酶V信号序列的米曲霉β-葡糖苷酶变体BG41成熟编码序列融合来构建融合蛋白。此融合构建体导致与连接有特异腐质霉内切葡聚糖酶V信号序列的米曲霉β-葡糖苷酶变体BG41成熟编码序列相比所分泌的β-葡糖苷酶活性的2倍增加(two-fold increase)。如实施例11所述创建第二融合构建体,其由与连接有特异腐质霉内切葡聚糖酶V信号序列的米曲霉野生型β-葡糖苷酶编码序列融合的特异腐质霉内切葡聚糖酶V核心(含它自己的信号序列)组成,而且这导致β-葡糖苷酶活性的甚至进一步提高。用野生型融合物转化的菌株具有相对于用β-葡糖苷酶变体BG41融合物转化的菌株两倍的所分泌β-葡糖苷酶活性。
实施例14:β-葡糖苷酶融合蛋白编码序列克隆入米曲霉表达载体
设计了两条下文所示合成寡核苷酸引物,以自编码β-葡糖苷酶融合蛋白的pSaMeFX PCR扩增全长开读框。
PCR正向引物:5’-GGACTGCGCAGCATGCGTTC-3’(SEQ ID NO:71)
PCR反向引物:5’-AGTTAATTAATTACTGGGCCTTAGGCAGCG-3’(SEQID NO:72)
粗体字母代表编码序列。正向引物中加下划线的“G”代表为了创建Sph I限制性位点而引入的碱基变化。剩余序列与pSaMeFX的***位点相比包含序列同一性。反向引物中加下划线的序列代表为了便于在表达载体pAlLo2(WO 04/099228)中克隆此基因而添加的Pac I限制性位点。
在终体积50μl中含50ng pSaMeFX DNA,1X Pfx扩增缓冲液,6μl 10mMdATP,dTTP,dGTP和dCTP混合物,2.5个单位
Figure A20078003522400931
Pfx DNA聚合物,和1μl的50mM MgSO4的PCR反应中使用50pmol每种上文引物。使用
Figure A20078003522400932
Figure A20078003522400933
5333来扩增片段,编程为1个循环的98℃2分钟;和35个循环,每个循环为96℃30秒,61℃30秒和68℃3分钟。35个循环后,将反应在68℃温育10分钟,然后在10℃冷却,直至进一步处理。在使用TAE缓冲液和0.1μg/ml溴化乙锭的0.8%GTG-琼脂糖凝胶(CambrexBioproducts One Meadowlands Plaza East Rutherford,NJ,USA)上分离3.3kbPCR反应产物。借助DARK READERTM(Clare Chemical Research,Dolores,CO,USA)显现DNA以避免UV诱导的突变。用一次性使用的刀片切下3.3kb DNA条带并用
Figure A20078003522400941
-DA旋转杯(Millipore,Billerica,MA,USA)根据制造商的说明书将其纯化。
将纯化后的3.3kb PCR产物克隆入
Figure A20078003522400942
4Blunt-
Figure A20078003522400943
载体(Invitrogen,Carlsbad,CA,USA)。将4μl纯化后的PCR产物与1μl的2M氯化钠溶液和1μl载体混合。将反应在室温温育15分钟,然后根据制造商的说明书使用2μl反应液转化One
Figure A20078003522400945
TOP10化学感受态大肠杆菌细胞。将转化反应的3份等分试样(每份83μl)涂布在3个150mm补充有100μg/ml氨苄青霉素的2XYT板上并在37℃温育过夜。
使用8个重组菌落接种含3ml补充有100μg/ml氨苄青霉素的LB培养基的液体培养基。使用
Figure A20078003522400946
9600(QIAGEN Inc.,Valencia,CA,USA)自这些培养物制备质粒DNA。通过Pac I限制酶消化来分析克隆。将来自每个克隆的质粒DNA用Pac I消化并通过使用TAE缓冲液的1.0%琼脂糖凝胶电泳进行分析。所有8个克隆都具有预期的限制性消化样式,而且选择克隆5、6、7和8进行测序以验证所克隆的***物中没有突变。它们5’和3’端的序列分析显示所有4个克隆都具有正确的序列。选择克隆5和7用于进一步测序。对这两个克隆测序至Phred Q值大于40以确保没有PCR诱导的错误。克隆5和7显示出具有预期的序列,而且选择克隆5用于再克隆入pAlLo2。
将来自克隆5的质粒DNA通过用SphI消化来线性化。然后通过添加1.2μl10mM dATP,dTTP,dGTP和dCTP混合物,和6个单位T4DNA聚合酶(NewEngland Bioloabs,Inc.,Ipswich,MA,USA)来将线性化的克隆平端化(blunt-ended)。将混合物在12℃温育20分钟,然后通过添加1μl的0.5M EDTA并在75℃加热20分钟以灭活酶来停止反应。如上所述通过凝胶电泳和超滤来纯化编码β-葡糖苷酶融合蛋白的3.3kb片段。
将载体pAlLo2通过用Nco I消化线性化。然后通过添加0.5μl的10mMdATP,dTTP,dGTP和dCTP混合物,和1个单位DNA聚合酶I来将线性化的载体平端化。将混合物在25℃温育15分钟,然后通过添加1μl的0.5M EDTA并在75℃加热15分钟以灭活酶来停止反应。然后将载体用Pac I消化。如上所述通过凝胶电泳和超滤来纯化平端化的载体。
用快速连接试剂盒来实施将编码β-葡糖苷酶融合蛋白的3.3kb片段克隆入经过线性化和纯化的pAlLo2载体。根据制造商的说明书使用1μl反应样品转化大肠杆菌XL10
Figure A20078003522400951
金细胞(Stratagene,La Jolla,CA,USA)。回收期后,将来自转化反应的2份100μl等分试样涂布到2个150mm补充有100μg/ml氨苄青霉素的2X YT板上并在37℃温育过夜。自选择板随机选择一组8个假定的重组克隆并使用
Figure A20078003522400952
9600自每个克隆制备质粒DNA。选择克隆1-4用于使用pAlLo2特异性引物进行的测序以验证载体/***物连接处具有正确序列。克隆3具有正确的载体/***物连接处并命名为pAlLo47(图13)。
为了创建不含标志物的表达株,进行限制性内切核酸酶消化以将赋予对抗生素氨苄青霉素的抗性的blaA基因与表达构建体的剩余部分分开。用Pme I消化30μg pAlLo47。然后如上所述通过琼脂糖凝胶电泳纯化消化后的DNA。用刀片切下包含表达构建体但缺少blaA基因的6.4kb DNA条带并用
Figure A20078003522400953
凝胶提取试剂盒纯化。
实施例15:β-葡糖苷酶融合蛋白在米曲霉JaL355中的表达
根据Christensen等,1988,Bio/Technology 6:1419-1422的方法制备米曲霉JaL355(WO 00/240694)原生质体。使用10μl纯化的实施例14表达构建体转化米曲霉JaL355原生质体。米曲霉JaL355的转化产生大约90个转化体。将50个转化体分离至各个PDA板并在34℃温育5天。
用3ml 0.01%
Figure A20078003522400954
80清洗48个汇合孢子板并使用孢子悬浮液接种125ml玻璃摇瓶中的25ml MDU2BP培养基。将转化体培养物在34℃以200rpm恒定摇动温育。5天后,将每份培养物的1ml等分试样以12,000xg离心并收集它们的上清液。将每份上清液的5μl与等体积的2X加样缓冲液(10%β-巯基乙醇)混合并加载到1.5mm 8%-16%Tris-甘氨酸SDS-PAGE凝胶上,用BIO-
Figure A20078003522400955
考马斯蓝G250蛋白质染料(Bio-Rad,Hercules,CA,USA)染色。培养液的SDS-PAGE序型显示了48个转化体中的33个能够表达一种新的蛋白质,其表观分子量非常接近预期的118kDa。转化体21产生最好的产量(yield),选择用于进一步研究。
实施例16:米曲霉JaL355转化体21的单孢子分离
将米曲霉JaL355转化体21的孢子涂布在PDA板上并在34℃温育5天。用0.5ml的0.01%80清洗小面积的汇合孢子板以重悬浮孢子。将100μl孢子悬浮液等分试样用0.01%
Figure A20078003522400962
80稀释至终体积5ml。借助血细胞计数器,确定孢子浓度并稀释至终浓度为每微升0.1个孢子。将200μl孢子稀释液等分试样涂布在150mm极限培养基板上并在34℃温育2-3天。自板上切下出现的菌落并转移至PDA板,在34℃温育3天。然后将孢子涂布在板上并在34℃再温育5天。
用3ml 0.01%
Figure A20078003522400963
80清洗汇合孢子板并使用孢子悬浮液接种125ml玻璃摇瓶中的25ml MDU2BP培养基。将单孢子培养物在34℃以200rpm恒定摇动温育。5天后,将每份培养物的1ml等分试样以12,000xg离心并收集它们的上清液。将每份上清液的5μl与等体积的2X加样缓冲液(10%β-巯基乙醇)混合并加载到1.5mm 8%-16%Tris-甘氨酸SDS-PAGE凝胶上,用BIO-
Figure A20078003522400964
考马斯蓝G250蛋白质染料染色。培养液的SDS-PAGE序型显示了所有8个转化体都能够以很高的水平表达β-葡糖苷酶融合蛋白,而且一个命名为米曲霉JaL355AlLo47的培养物产生最好的产量。
本申请描述和要求保护的本发明并不受限于本申请所公开的具体方面的范围,因为这些方面意欲作为本发明几个方面的说明。任何等价的方面意欲在本发明的范围之内。实际上,从前面的说明中,除本申请所显示和描述的之外,本发明的多种修改对于本领域的技术人员来说是显而易见的。这些修改也意欲落入所附的权利要求的范围内。在冲突的情况下,将以包括定义的本公开为准。
本申请引用了多篇参考文献,其公开的内容通过引用以其整体并入。
序列表
<110>诺维信股份有限公司(Novozymes,Inc.)
<120>提高具有生物学活性之多肽的分泌的方法
<130>10916.204-WO
<150>US 60/832,511
<151>2006-07-21
<160>76
<170>PatentIn version 3.4
<210>1
<211>923
<212>DNA
<213>特异腐质霉(Humicola insolens)
<400>1
atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt     60
gccgctgatg gcaggtccac ccgctactgg gactgctgca agccttcgtg cggctgggcc    120
aagaaggctc ccgtgaacca gcctgtcttt tcctgcaacg ccaacttcca gcgtatcacg    180
gacttcgacg ccaagtccgg ctgcgagccg ggcggtgtcg cctactcgtg cgccgaccag    240
accccatggg ctgtgaacga cgacttcgcg ctcggttttg ctgccacctc tattgccggc    300
agcaatgagg cgggctggtg ctgcgcctgc tacgagctca ccttcacatc cggtcctgtt    360
gctggcaaga agatggtcgt ccagtccacc agcactggcg gtgatcttgg cagcaaccac    420
ttcgatctca acatccccgg cggcggcgtc ggcatcttcg acggatgcac tccccagttc    480
ggcggtctgc ccggccagcg ctacggcggc atctcgtccc gcaacgagtg cgatcggttc    540
cccgacgccc tcaagcccgg ctgctactgg cgcttcgact ggttcaagaa cgccgacaat    600
ccgagcttca gcttccgtca ggtccagtgc ccagccgagc tcgtcgctcg caccggatgc    660
cgccgcaacg acgacggcaa cttccctgcc gtccagatcc cctccagcag caccagctct    720
ccggtcaacc agcctaccag caccagcacc acgtccacct ccaccacctc gagcccgcca    780
gtccagccta cgactcccag cggctgcact gctgagaggt gggctcagtg cggcggcaat    840
ggctggagcg gctgcaccac ctgcgtcgct ggcagcactt gcacgaagat taatgactgg    900
taccatcagt gcctgtagaa ttc                                            923
<210>2
<211>305
<212>PRT
<213>特异腐质霉(Humicola insolens)
<400>2
Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro
1               5                   10                  15
Val Leu Ala Leu Ala Ala Asp Gly Arg Ser Thr Arg Tyr Trp Asp Cys
            20                  25                  30
Cys Lys Pro Ser Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro
        35                  40                  45
Val Phe Ser Cys Asn Ala Asn Phe Gln Arg Ile Thr Asp Phe Asp Ala
    50                  55                  60
Lys Ser Gly Cys Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln
65                  70                  75                  80
Thr Pro Trp Ala Val Asn Asp Asp Phe Ala Leu Gly Phe Ala Ala Thr
                85                  90                  95
Ser Ile Ala Gly Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Glu
            100                 105                 110
Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln
        115                 120                 125
Ser Thr Ser Thr Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn
    130                 135                 140
Ile Pro Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe
145                 150                 155                 160
Gly Gly Leu Pro Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu
                165                 170                 175
Cys Asp Arg Phe Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe
            180                 185                 190
Asp Trp Phe Lys Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val
        195                 200                 205
Gln Cys Pro Ala Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp
    210                 215                 220
Asp Gly Asn Phe Pro Ala Val Gln Ile Pro Ser Ser Ser Thr Ser Ser
225                 230                 235                 240
Pro Val Asn Gln Pro Thr Ser Thr Ser Thr Thr Ser Thr Ser Thr Thr
                245                 250                 255
Ser Ser Pro Pro Val Gln Pro Thr Thr Pro Ser Gly Cys Thr Ala Glu
            260                 265                 270
Arg Trp Ala Gln Cys Gly Gly Asn Gly Trp Ser Gly Cys Thr Thr Cys
        275                 280                 285
Val Ala Gly Ser Thr Cys Thr Lys Ile Asn Asp Trp Tyr His Gln Cys
    290                 295                 300
Leu
305
<210>3
<211>1188
<212>DNA
<213>嗜热毁丝霉(Myceliophthora thermophila)
<400>3
cgacttgaaa cgccccaaat gaagtcctcc atcctcgcca gcgtcttcgc cacgggcgcc   60
gtggctcaaa gtggtccgtg gcagcaatgt ggtggcatcg gatggcaagg atcgaccgac  120
tgtgtgtcgg gctaccactg cgtctaccag aacgattggt acagccagtg cgtgcctggc  180
gcggcgtcga caacgctgca gacatcgacc acgtccaggc ccaccgccac cagcaccgcc  240
cctccgtcgt ccaccacctc gcctagcaag ggcaagctga agtggctcgg cagcaacgag  300
tcgggcgccg agttcgggga gggcaattac cccggcctct ggggcaagca cttcatcttc  360
ccgtcgactt cggcgattca gacgctcatc aatgatggat acaacatctt ccggatcgac  420
ttctcgatgg agcgtctggt gcccaaccag ttgacgtcgt ccttcgacca gggttacctc  480
cgcaacctga ccgaggtggt caacttcgtg acgaacgcgg gcaagtacgc cgtcctggac  540
ccgcacaact acggccggta ctacggcaac atcatcacgg acacgaacgc gttccggacc  600
ttctggacca acctggccaa gcagttcgcc tccaactcgc tcgtcatctt cgacaccaac  660
aacgagtaca acacgatgga ccagaccctg gtgctcaacc tcaaccaggc cgccatcgac  720
ggcatccggg ccgccggcgc gacctcgcag tacatcttcg tcgagggcaa cgcgtggagc  780
ggggcctgga gctggaacac gaccaacacc aacatggccg ccctgacgga cccgcagaac  840
aagatcgtgt acgagatgca ccagtacctc gactcggaca gctcgggcac ccacgccgag  900
tgcgtcagca gcaccatcgg cgcccagcgc gtcgtcggag ccacccagtg gctccgcgcc   960
aacggcaagc tcggcgtcct cggcgagttc gccggcggcg ccaacgccgt ctgccagcag  1020
gccgtcaccg gcctcctcga ccacctccag gacaacagcg acgtctggct gggtgccctc  1080
tggtgggccg ccggtccctg gtggggcgac tacatgtact cgttcgagcc tccttcgggc  1140
accggctatg tcaactacaa ctcgatcttg aagaagtact tgccgtaa               1188
<210>4
<211>389
<212>PRT
<213>嗜热毁丝霉(Myceliophthora thermophila)
<400>4
Met Lys Ser Ser Ile Leu Ala Ser Val Phe Ala Thr Gly Ala Val Ala
1               5                   10                  15
Gln Ser Gly Pro Trp Gln Gln Cys Gly Gly Ile Gly Trp Gln Gly Ser
            20                  25                  30
Thr Asp Cys Val Ser Gly Tyr His Cys Val Tyr Gln Asn Asp Trp Tyr
        35                  40                  45
Ser Gln Cys Val Pro Gly Ala Ala Ser Thr Thr Leu Gln Thr Ser Thr
    50                  55                  60
Thr Ser Arg Pro Thr Ala Thr Ser Thr Ala Pro Pro Ser Ser Thr Thr
65                  70                  75                  80
Ser Pro Ser Lys Gly Lys Leu Lys Trp Leu Gly Ser Asn Glu Ser Gly
                85                  90                  95
Ala Glu Phe Gly Glu Gly Asn Tyr Pro Gly Leu Trp Gly Lys His Phe
            100                 105                 110
Ile Phe Pro Ser Thr Ser Ala Ile Gln Thr Leu Ile Asn Asp Gly Tyr
        115                 120                 125
Asn Ile Phe Arg Ile Asp Phe Ser Met Glu Arg Leu Val Pro Asn Gln
    130                 135                 140
Leu Thr Ser Ser Phe Asp Gln Gly Tyr Leu Arg Asn Leu Thr Glu Val
145                 150                 155                 160
Val Asn Phe Val Thr Asn Ala Gly Lys Tyr Ala Val Leu Asp Pro His
                165                 170                 175
Asn Tyr Gly Arg Tyr Tyr Gly Asn Ile Ile Thr Asp Thr Asn Ala Phe
            180                 185                 190
Arg Thr Phe Trp Thr Asn Leu Ala Lys Gln Phe Ala Ser Asn Ser Leu
        195                 200                 205
Val Ile Phe Asp Thr Asn Asn Glu Tyr Asn Thr Met Asp Gln Thr Leu
    210                 215                 220
Val Leu Asn Leu Asn Gln Ala Ala Ile Asp Gly Ile Arg Ala Ala Gly
225                 230                 235                 240
Ala Thr Ser Gln Tyr Ile Phe Val Glu Gly Asn Ala Trp Ser Gly Ala
                245                 250                 255
Trp Ser Trp Asn Thr Thr Asn Thr Asn Met Ala Ala Leu Thr Asp Pro
            260                 265                 270
Gln Asn Lys Ile Val Tyr Glu Met His Gln Tyr Leu Asp Ser Asp Ser
        275                 280                 285
Ser Gly Thr His Ala Glu Cys Val Ser Ser Thr Ile Gly Ala Gln Arg
    290                 295                 300
Val Val Gly Ala Thr Gln Trp Leu Arg Ala Asn Gly Lys Leu Gly Val
305                 310                 315                 320
Leu Gly Glu Phe Ala Gly Gly Ala Asn Ala Val Cys Gln Gln Ala Val
                325                 330                 335
Thr Gly Leu Leu Asp His Leu Gln Asp Asn Ser Asp Val Trp Leu Gly
            340                 345                 350
Ala Leu Trp Trp Ala Ala Gly Pro Trp Trp Gly Asp Tyr Met Tyr Ser
        355                 360                 365
Phe Glu Pro Pro Ser Gly Thr Gly Tyr Val Asn Tyr Asn Ser Ile Leu
    370                 375                 380
Lys Lys Tyr Leu Pro
385
<210>5
<211>1232
<212>DNA
<213>嗜热毁丝霉(Myceliophthora thermophila)
<400>5
ggatccactt agtaacggcc gccagtgtgc tggaaagcat gaagtctctc ttcctgtcac    60
ttgtagcgac cgtcgcgctc agctcgccag tattctctgt cgcagtctgg gggcaatgcg   120
gcggcattgg cttcagcgga agcaccgtct gtgatgcagg cgccggctgt gtgaagctca   180
acgactatta ctctcaatgc caacccggcg ctcccactgc tacatccgcg gcgccaagta   240
gcaacgcacc gtccggcact tcgacggcct cggccccctc ctccagcctt tgctctggca   300
gccgcacgcc gttccagttc ttcggtgtca acgaatccgg cgcggagttc ggcaacctga   360
acatccccgg tgttctgggc accgactaca cctggccgtc gccatccagc attgacttct   420
tcatgggcaa gggaatgaat accttccgta ttccgttcct catggagcgt cttgtccccc   480
ctgccactgg catcacagga cctctcgacc agacgtactt gggcggcctg cagacgattg   540
tcaactacat caccggcaaa ggcggctttg ctctcattga cccgcacaac tttatgatct   600
acaatggcca gacgatctcc agtaccagcg acttccagaa gttctggcag aacctcgcag   660
gagtgtttaa atcgaacagt cacgtcatct tcgatgttat gaacgagcct cacgatattc   720
ccgcccagac cgtgttccaa ctgaaccaag ccgctgtcaa tggcatccgt gcgagcggtg   780
cgacgtcgca gctcattctg gtcgagggca caagctggac tggagcctgg acctggacga   840
cctctggcaa cagcgatgca ttcggtgcca ttaaggatcc caacaacaac gtcgcgatcc   900
agatgcatca gtacctggat agcgatggct ctggcacttc gcagacctgc gtgtctccca   960
ccatcggtgc cgagcggttg caggctgcga ctcaatggtt gaagcagaac aacctcaagg  1020
gcttcctggg cgagatcggc gccggctcta actccgcttg catcagcgct gtgcagggtg  1080
cgttgtgttc gatgcagcaa tctggtgtgt ggctcggcgc tctctggtgg gctgcgggcc  1140
cgtggtgggg cgactactac cagtccatcg agccgccctc tggcccggcg gtgtccgcga  1200
tcctcccgca ggccctgctg ccgttcgcgt aa                                1232
<210>6
<211>397
<212>PRT
<213>嗜热毁丝霉(Myceliophthora thermophila)
<400>6
Met Lys Ser Leu Phe Leu Ser Leu Val Ala Thr Val Ala Leu Ser Ser
1               5                   10                  15
Pro Val Phe Ser Val Ala Val Trp Gly Gln Cys Gly Gly Ile Gly Phe
            20                  25                  30
Ser Gly Ser Thr Val Cys Asp Ala Gly Ala Gly Cys Val Lys Leu Asn
        35                  40                  45
Asp Tyr Tyr Ser Gln Cys Gln Pro Gly Ala Pro Thr Ala Thr Ser Ala
    50                 55                 60
Ala Pro Ser Ser Asn Ala Pro Ser Gly Thr Ser Thr Ala Ser Ala Pro
65                  70                  75                  80
Ser Ser Ser Leu Cys Ser Gly Ser Arg Thr Pro Phe Gln Phe Phe Gly
                85                  90                  95
Val Asn Glu Ser Gly Ala Glu Phe Gly Asn Leu Asn Ile Pro Gly Val
            100                 105                 110
Leu Gly Thr Asp Tyr Thr Trp Pro Ser Pro Ser Ser Ile Asp Phe Phe
        115                 120                 125
Met Gly Lys Gly Met Asn Thr Phe Arg Ile Pro Phe Leu Met Glu Arg
    130                 135                 140
Leu Val Pro Pro Ala Thr Gly Ile Thr Gly Pro Leu Asp Gln Thr Tyr
145                 150                 155                 160
Leu Gly Gly Leu Gln Thr Ile Val Asn Tyr Ile Thr Gly Lys Gly Gly
                165                 170                 175
Phe Ala Leu Ile Asp Pro His Asn Phe Met Ile Tyr Asn Gly Gln Thr
            180                 185                 190
Ile Ser Ser Thr Ser Asp Phe Gln Lys Phe Trp Gln Asn Leu Ala Gly
        195                 200                 205
Val Phe Lys Ser Asn Ser His Val Ile Phe Asp Val Met Asn Glu Pro
    210                 215                 220
His Asp Ile Pro Ala Gln Thr Val Phe Gln Leu Asn Gln Ala Ala Val
225                 230                 235                 240
Asn Gly Ile Arg Ala Ser Gly Ala Thr Ser Gln Leu Ile Leu Val Glu
                245                 250                 255
Gly Thr Ser Trp Thr Gly Ala Trp Thr Trp Thr Thr Ser Gly Asn Ser
            260                 265                 270
Asp Ala Phe Gly Ala Ile Lys Asp Pro Asn Asn Asn Val Ala Ile Gln
        275                 280                 285
Met His Gln Tyr Leu Asp Ser Asp Gly Ser Gly Thr Ser Gln Thr Cys
    290                 295                 300
Val Ser Pro Thr Ile Gly Ala Glu Arg Leu Gln Ala Ala Thr Gln Trp
305                 310                 315                 320
Leu Lys Gln Asn Asn Leu Lys Gly Phe Leu Gly Glu Ile Gly Ala Gly
                325                 330                 335
Ser Asn Ser Ala Cys Ile Ser Ala Val Gln Gly Ala Leu Cys Ser Met
            340                 345                 350
Gln Gln Ser Gly Val Trp Leu Gly Ala Leu Trp Trp Ala Ala Gly Pro
        355                 360                 365
Trp Trp Gly Asp Tyr Tyr Gln Ser Ile Glu Pro Pro Ser Gly Pro Ala
    370                 375                 380
Val Ser Ala Ile Leu Pro Gln Ala Leu Leu Pro Phe Ala
385                 390                 395
<210>7
<211>1303
<212>DNA
<213>担子菌纲(Basidiomycete)CBS 495.95
<400>7
ggaaagcgtc agtatggtga aatttgcgct tgtggcaact gtcggcgcaa tcttgagcgc     60
ttctgcggcc aatgcggctt ctatctacca gcaatgtgga ggcattggat ggtctgggtc    120
cactgtttgc gacgccggtc tcgcttgcgt tatcctcaat gcgtactact ttcagtgctt    180
gacgcccgcc gcgggccaga caacgacggg ctcgggcgca ccggcgtcaa catcaacctc   240
tcactcaacg gtcactacgg ggagctcaca ctcaacaacc gggacgacgg cgacgaaaac   300
aactaccact ccgtcgacca ccacgaccct acccgccatc tctgtgtctg gtcgcgtctg   360
ctctggctcc aggacgaagt tcaagttctt cggtgtgaat gaaagcggcg ccgaattcgg   420
gaacactgct tggccagggc agctcgggaa agactataca tggccttcgc ctagcagcgt   480
ggactacttc atgggggctg gattcaatac attccgtatc accttcttga tggagcgtat   540
gagccctccg gctaccggac tcactggccc attcaaccag acgtacctgt cgggcctcac   600
caccattgtc gactacatca cgaacaaagg aggatacgct cttattgacc cccacaactt   660
catgcgttac aacaacggca taatcagcag cacatctgac ttcgcgactt ggtggagcaa   720
tttggccact gtattcaaat ccacgaagaa cgccatcttc gacatccaga acgagccgta   780
cggaatcgat gcgcagaccg tatacgaact gaatcaagct gccatcaatt cgatccgcgc   840
cgctggcgct acgtcacagt tgattctggt tgaaggaacg tcatacactg gagcttggac   900
gtgggtctcg tccggaaacg gagctgcttt cgcggccgtt acggatcctt acaacaacac   960
ggcaattgaa atgcaccaat acctcgacag cgacggttct gggacaaacg aagactgtgt  1020
ctcctccacc attgggtcgc aacgtctcca agctgccact gcgtggctgc aacaaacagg  1080
actcaaggga ttcctcggag agacgggtgc tgggtcgaat tcccagtgca tcgacgccgt  1140
gttcgatgaa ctttgctata tgcaacagca aggcggctcc tggatcggtg cactctggtg  1200
ggctgcgggt ccctggtggg gcacgtacat ttactcgatt gaacctccga gcggtgccgc  1260
tatcccagaa gtccttcctc agggtctcgc tccattcctc tag                    1303
<210>8
<211>429
<212>PRT
<213>担子菌纲(BASIDIOMYCETE)CBS 495.95
<400>8
Met Val Lys Phe Ala Leu Val Ala Thr Val Gly Ala Ile Leu Ser Ala
1               5                   10                  15
Ser Ala Ala Asn Ala Ala Ser Ile Tyr Gln Gln Cys Gly Gly Ile Gly
            20                  25                  30
Trp Ser Gly Ser Thr Val Cys Asp Ala Gly Leu Ala Cys Val Ile Leu
        35                  40                  45
Asn Ala Tyr Tyr Phe Gln Cys Leu Thr Pro Ala Ala Gly Gln Thr Thr
    50                  55                  60
Thr Gly Ser Gly Ala Pro Ala Ser Thr Ser Thr Ser His Ser Thr Val
65                  70                  75                  80
Thr Thr Gly Ser Ser His Ser Thr Thr Gly Thr Thr Ala Thr Lys Thr
                85                  90                  95
Thr Thr Thr Pro Ser Thr Thr Thr Thr Leu Pro Ala Ile Ser Val Ser
            100                 105                 110
Gly Arg Val Cys Ser Gly Ser Arg Thr Lys Phe Lys Phe Phe Gly Val
        115                 120                 125
Asn Glu Ser Gly Ala GIu Phe Gly Asn Thr Ala Trp Pro Gly Gln Leu
    130                 135                 140
Gly Lys Asp Tyr Thr Trp Pro Ser Pro Ser Ser Val Asp Tyr Phe Met
145                 150                 155                 160
Gly Ala Gly Phe Asn Thr Phe Arg Ile Thr Phe Leu Met Glu Arg Met
                165                 170                 175
Ser Pro Pro Ala Thr Gly Leu Thr Gly Pro Phe Asn Gln Thr Tyr Leu
            180                 185                 190
Ser Gly Leu Thr Thr Ile Val Asp Tyr Ile Thr Asn Lys Gly Gly Tyr
        195                 200                 205
Ala Leu Ile Asp Pro His Asn Phe Met Arg Tyr Asn Asn Gly Ile Ile
    210                 215                 220
Ser Ser Thr Ser Asp Phe Ala Thr Trp Trp Ser Asn Leu Ala Thr Val
225                 230                 235                 240
Phe Lys Ser Thr Lys Asn Ala Ile Phe Asp Ile Gln Asn Glu Pro Tyr
                245                 250                 255
Gly Ile Asp Ala Gln Thr Val Tyr Glu Leu Asn Gln Ala Ala Ile Asn
            260                 265                 270
Ser Ile Arg Ala Ala Gly Ala Thr Ser Gln Leu Ile Leu Val Glu Gly
        275                 280                 285
Thr Ser Tyr Thr Gly Ala Trp Thr Trp Val Ser Ser Gly Asn Gly Ala
    290                 295                 300
Ala Phe Ala Ala Val Thr Asp Pro Tyr Asn Asn Thr Ala Ile Glu Met
305                 310                 315                 320
His Gln Tyr Leu Asp Ser Asp Gly Ser Gly Thr Asn Glu Asp Cys Val
                325                 330                 335
Ser Ser Thr Ile Gly Ser Gln Arg Leu Gln Ala Ala Thr Ala Trp Leu
            340                 345                 350
Gln Gln Thr Gly Leu Lys Gly Phe Leu Gly Glu Thr Gly Ala Gly Ser
        355                 360                 365
Asn Ser Gln Cys Ile Asp Ala Val Phe Asp Glu Leu Cys Tyr Met Gln
    370                 375                 380
Gln Gln Gly Gly Ser Trp Ile Gly Ala Leu Trp Trp Ala Ala Gly Pro
385                 390                 395                 400
Trp Trp Gly Thr Tyr Ile Tyr Ser Ile Glu Pro Pro Ser Gly Ala Ala
                405                 410                 415
Ile Pro Glu Val Leu Pro Gln Gly Leu Ala Pro Phe Leu
            420                 425
<210>9
<211>1580
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>9
agccccccgt tcaggcacac ttggcatcag atcagcttag cagcgcctgc acagcatgaa     60
gctctcgcag tcggccgcgc tggcggcact caccgcgacg gcgctcgccg ccccctcgcc    120
cacgacgccg caggcgccga ggcaggcttc agccggctgc tcgtctgcgg tcacgctcga    180
cgccagcacc aacgtttgga agaagtacac gctgcacccc aacagctact accgcaagga    240
ggttgaggcc gcggtggcgc agatctcgga cccggacctc gccgccaagg ccaagaaggt    300
ggccgacgtc ggcaccttcc tgtggctcga ctcgatcgag aacatcggca agctggagcc    360
ggcgatccag gacgtgccct gcgagaacat cctgggcctg gtcatctacg acctgccggg    420
ccgcgactgc gcggccaagg cgtccaacgg cgagctcaag gtcggcgaga tcgaccgcta    480
caagaccgag tacatcgaca gtgagtgctg ccccccgggt tcgagaagag cgtgggggaa    540
agggaaaggg ttgactgact gacacggcgc actgcagaga tcgtgtcgat cctcaaggca    600
caccccaaca cggcgttcgc gctggtcatc gagccggact cgctgcccaa cctggtgacc    660
aacagcaact tggacacgtg ctcgagcagc gcgtcgggct accgcgaagg cgtggcttac    720
gccctcaaga acctcaacct gcccaacgtg atcatgtacc tcgacgccgg ccacggcggc   780
tggctcggct gggacgccaa cctgcagccc ggcgcgcagg agctagccaa ggcgtacaag   840
aacgccggct cgcccaagca gctccgcggc ttctcgacca acgtggccgg ctggaactcc   900
tggtgagctt ttttccattc catttcttct tcctcttctc tcttcgctcc cactctgcag   960
ccccccctcc cccaagcacc cactggcgtt ccggcttgct gactcggcct ccctttcccc  1020
gggcaccagg gatcaatcgc ccggcgaatt ctcccaggcg tccgacgcca agtacaacaa  1080
gtgccagaac gagaagatct acgtcagcac cttcggctcc gcgctccagt cggccggcat  1140
gcccaaccac gccatcgtcg acacgggccg caacggcgtc accggcctgc gcaaggagtg  1200
gggtgactgg tgcaacgtca acggtgcagg ttcgttgtct tctttttctc ctcttttgtt  1260
tgcacgtcgt ggtccttttc aagcagccgt gtttggttgg gggagatgga ctccggctga  1320
tgttctgctt cctctctagg cttcggcgtg cgcccgacga gcaacacggg cctcgagctg  1380
gccgacgcgt tcgtgtgggt caagcccggc ggcgagtcgg acggcaccag cgacagctcg  1440
tcgccgcgct acgacagctt ctgcggcaag gacgacgcct tcaagccctc gcccgaggcc  1500
ggcacctgga acgaggccta cttcgagatg ctgctcaaga acgccgtgcc gtcgttctaa  1560
gacggtccag catcatccgg                                              1580
<210>10
<211>396
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>10
Met Lys Leu Ser Gln Ser Ala Ala Leu Ala Ala Leu Thr Ala Thr Ala
1               5                   10                  15
Leu Ala Ala Pro Ser Pro Thr Thr Pro Gln Ala Pro Arg Gln Ala Ser
            20                  25                  30
Ala Gly Cys Ser Ser Ala Val Thr Leu Asp Ala Ser Thr Asn Val Trp
        35                  40                  45
Lys Lys Tyr Thr Leu His Pro Asn Ser Tyr Tyr Arg Lys Glu Val Glu
    50                  55                  60
Ala Ala Val Ala Gln Ile Ser Asp Pro Asp Leu Ala Ala Lys Ala Lys
65                  70                  75                  80
Lys Val Ala Asp Val Gly Thr Phe Leu Trp Leu Asp Ser Ile Glu Asn
                85                  90                  95
Ile Gly Lys Leu Glu Pro Ala Ile Gln Asp Val Pro Cys Glu Asn Ile
            100                 105                 110
Leu Gly Leu Val Ile Tyr Asp Leu Pro Gly Arg Asp Cys Ala Ala Lys
        115                 120                 125
Ala Ser Asn Gly Glu Leu Lys Val Gly Glu Ile Asp Arg Tyr Lys Thr
    130                 135                 140
Glu Tyr Ile Asp Lys Ile Val Ser Ile Leu Lys Ala His Pro Asn Thr
145                 150                 155                 160
Ala Phe Ala Leu Val Ile Glu Pro Asp Ser Leu Pro Asn Leu Val Thr
                165                 170                 175
Asn Ser Asn Leu Asp Thr Cys Ser Ser Ser Ala Ser Gly Tyr Arg Glu
            180                 185                 190
Gly Val Ala Tyr Ala Leu Lys Asn Leu Asn Leu Pro Asn Val Ile Met
        195                 200                 205
Tyr Leu Asp Ala Gly His Gly Gly Trp Leu Gly Trp Asp Ala Asn Leu
    210                 215                 220
Gln Pro Gly Ala Gln Glu Leu Ala Lys Ala Tyr Lys Asn Ala Gly Ser
225                 230                 235                 240
Pro Lys Gln Leu Arg Gly Phe Ser Thr Asn Val Ala Gly Trp Asn Ser
                245                 250                 255
Trp Asp Gln Ser Pro Gly Glu Phe Ser Gln Ala Ser Asp Ala Lys Tyr
            260                 265                 270
Asn Lys Cys Gln Asn Glu Lys Ile Tyr Val Ser Thr Phe Gly Ser Ala
        275                 280                 285
Leu Gln Ser Ala Gly Met Pro Asn His Ala Ile Val Asp Thr Gly Arg
    290                 295                 300
Asn Gly Val Thr Gly Leu Arg Lys Glu Trp Gly Asp Trp Cys Asn Val
305                 310                 315                 320
Asn Gly Ala Gly Phe Gly Val Arg Pro Thr Ser Asn Thr Gly Leu Glu
                325                 330                 335
Leu Ala Asp Ala Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly
            340                 345                 350
Thr Ser Asp Ser Ser Ser Pro Arg Tyr Asp Ser Phe Cys Gly Lys Asp
        355                 360                 365
Asp Ala Phe Lys Pro Ser Pro Glu Ala Gly Thr Trp Asn Glu Ala Tyr
    370                 375                 380
Phe Glu Met Leu Leu Lys Asn Ala Val Pro Ser Phe
385                 390                 395
<210>11
<211>1203
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>11
atgaagtacc tcaacctcct cgcagctctc ctcgccgtcg ctcctctctc cctcgctgca    60
cccagcatcg aggccagaca gtcgaacgtc aacccataca tcggcaagag cccgctcgtt   120
attaggtcgt acgcccaaaa gcttgaggag accgtcagga ccttccagca acgtggcgac   180
cagctcaacg ctgcgaggac acggacggtg cagaacgttg cgactttcgc ctggatctcg   240
gataccaatg gtattggagc cattcgacct ctcatccaag atgctctcgc ccagcaggct   300
cgcactggac agaaggtcat cgtccaaatc gtcgtctaca acctcccaga tcgcgactgc   360
tctgccaacg cctcgactgg agagttcacc gtaggaaacg acggtctcaa ccgatacaag   420
aactttgtca acaccatcgc ccgcgagctc tcgactgctg acgctgacaa gctccacttt   480
gccctcctcc tcgaacccga cgcacttgcc aacctcgtca ccaacgcgaa tgcccccagg   540
tgccgaatcg ccgctcccgc ttacaaggag ggtatcgcct acaccctcgc caccttgtcc   600
aagcccaacg tcgacgtcta catcgacgcc gccaacggtg gctggctcgg ctggaacgac   660
aacctccgcc ccttcgccga actcttcaag gaagtctacg acctcgcccg ccgcatcaac   720
cccaacgcca aggtccgcgg cgtccccgtc aacgtctcca actacaacca gtaccgcgct   780
gaagtccgcg agcccttcac cgagtggaag gacgcctggg acgagagccg ctacgtcaac   840
gtcctcaccc cgcacctcaa cgccgtcggc ttctccgcgc acttcatcgt tgaccaggga   900
cgcggtggca agggcggtat caggacggag tggggccagt ggtgcaacgt taggaacgct   960
gggttcggta tcaggcctac tgcggatcag ggcgtgctcc agaacccgaa tgtggatgcg  1020
attgtgtggg ttaagccggg tggagagtcg gatggcacga gtgatttgaa ctcgaacagg  1080
tatgatccta cgtgcaggag tccggtggcg catgttcccg ctcctgaggc tggccagtgg  1140
ttcaacgagt atgttgttaa cctcgttttg aacgctaacc cccctcttga gcctacctgg  1200
taa                                                                1203
<210>12
<211>400
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>12
Met Lys Tyr Leu Asn Leu Leu Ala Ala Leu Leu Ala Val Ala Pro Leu
1               5                   10                  15
Ser Leu Ala Ala Pro Ser Ile Glu Ala Arg Gln Ser Asn Val Asn Pro
            20                  25                  30
Tyr Ile Gly Lys Ser Pro Leu Val Ile Arg Ser Tyr Ala Gln Lys Leu
        35                  40                  45
Glu Glu Thr Val Arg Thr Phe Gln Gln Arg Gly Asp Gln Leu Asn Ala
    50                  55                  60
Ala Arg Thr Arg Thr Val Gln Asn Val Ala Thr Phe Ala Trp Ile Ser
65                  70                  75                  80
Asp Thr Asn Gly Ile Gly Ala Ile Arg Pro Leu Ile Gln Asp Ala Leu
                85                  90                  95
Ala Gln Gln Ala Arg Thr Gly Gln Lys Val Ile Val Gln Ile Val Val
            100                 105                 110
Tyr Asn Leu Pro Asp Arg Asp Cys Ser Ala Asn Ala Ser Thr Gly Glu
        115                 120                 125
Phe Thr Val Gly Asn Asp Gly Leu Asn Arg Tyr Lys Asn Phe Val Asn
    130                 135                 140
Thr Ile Ala Arg Glu Leu Ser Thr Ala Asp Ala Asp Lys Leu His Phe
145                 150                 155                 160
Ala Leu Leu Leu Glu Pro Asp Ala Leu Ala Asn Leu Val Thr Asn Ala
                165                 170                 175
Asn Ala Pro Arg Cys Arg Ile Ala Ala Pro Ala Tyr Lys Glu Gly Ile
            180                 185                 190
Ala Tyr Thr Leu Ala Thr Leu Ser Lys Pro Asn Val Asp Val Tyr Ile
        195                 200                 205
Asp Ala Ala Asn Gly Gly Trp Leu Gly Trp Asn Asp Asn Leu Arg Pro
    210                 215                 220
Phe Ala Glu Leu Phe Lys Glu Val Tyr Asp Leu Ala Arg Arg Ile Asn
225                 230                 235                 240
Pro Asn Ala Lys Val Arg Gly Val Pro Val Asn Val Ser Asn Tyr Asn
                245                 250                 255
Gln Tyr Arg Ala Glu Val Arg Glu Pro Phe Thr Glu Trp Lys Asp Ala
            260                 265                 270
Trp Asp Glu Ser Arg Tyr Val Asn Val Leu Thr Pro His Leu Asn Ala
        275                 280                 285
Val Gly Phe Ser Ala His Phe Ile Val Asp Gln Gly Arg Gly Gly Lys
    290                 295                 300
Gly Gly Ile Arg Thr Glu Trp Gly Gln Trp Cys Asn Val Arg Asn Ala
305                 310                 315                 320
Gly Phe Gly Ile Arg Pro Thr Ala Asp Gln Gly Val Leu Gln Asn Pro
                325                 330                 335
Asn Val Asp Ala Ile Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly
            340                 345                 350
Thr Ser Asp Leu Asn Ser Asn Arg Tyr Asp Pro Thr Cys Arg Ser Pro
        355                 360                 365
Val Ala His Val Pro Ala Pro Glu Ala Gly Gln Trp Phe Asn Glu Tyr
    370                 375                 380
Val Val Asn Leu Val Leu Asn Ala Asn Pro Pro Leu Glu Pro Thr Trp
385                 390                 395                 400
<210>13
<211>1501
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>13
gccgttgtca agatgggcca gaagacgctg cacggattcg ccgccacggc tttggccgtt    60
ctcccctttg tgaaggctca gcagcccggc aacttcacgc cggaggtgca cccgcaactg   120
ccaacgtgga agtgcacgac cgccggcggc tgcgttcagc aggacacttc ggtggtgctc   180
gactggaact accgttggat ccacaatgcc gacggcaccg cctcgtgcac gacgtccagc   240
ggggtcgacc acacgctgtg tccagatgag gcgacctgcg cgaagaactg cttcgtggaa   300
ggcgtcaact acacgagcag cggtgtcacc acatccggca gttcgctgac gatgaggcag   360
tatttcaagg ggagcaacgg gcagaccaac agcgtttcgc ctcgtctcta cctgctcggc   420
tcggatggaa actacgtaat gctcaagctg ctcggccagg agctgagctt cgatgtcgat   480
ctctccacgc tcccctgcgg cgagaacggc gcgctgtacc tgtccgagat ggacgcgacc   540
ggtggcagga accagtacaa caccggcggt gccaactacg gctcgggcta ctgtgacgcc   600
cagtgtcccg tgcagacgtg gatgaacggc acgctgaaca ccaacgggca gggctactgc   660
tgcaacgaga tggacatcct cgaggccaac tcccgcgcca acgcgatgac acctcacccc   720
tgcgccaacg gcagctgcga caagagcggg tgcggactca acccctacgc cgagggctac   780
aagagctact acggaccggg cctcacggtt gacacgtcga agcccttcac catcattacc   840
cgcttcatca ccgacgacgg cacgaccagc ggcaccctca accagatcca gcggatctat   900
gtgcagaatg gcaagacggt cgcgtcggct gcgtccggag gcgacatcat cacggcatcc   960
ggctgcacct cggcccaggc gttcggcggg ctggccaaca tgggcgcggc gcttggacgg  1020
ggcatggtgc tgaccttcag catctggaac gacgctgggg gctacatgaa ctggctcgac  1080
agcggcaaca acggcccgtg cagcagcacc gagggcaacc cgtccaacat cctggccaac  1140
tacccggaca cccacgtggt cttctccaac atccgctggg gagacatcgg ctcgacggtc  1200
caggtctcgg gaggcggcaa cggcggctcg accaccacca cgtcgaccac cacgctgagg  1260
acctcgacca cgaccaccac caccgccccg acggccactg ccacgcactg gggacaatgc  1320
ggcggaatcg gggtacgtca accgcctcct gcattctgtt gaggaagtta actaacgtgg  1380
cctacgcagt ggactggacc gaccgtctgc gaatcgccgt acgcatgcaa ggagctgaac  1440
ccctggtact accagtgcct ctaaagtatt gcagtgaagc catactccgt gctcggcatg  1500
g                                                                  1501
<210>14
<211>464
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>14
Met Gly Gln Lys Thr Leu His Gly Phe Ala Ala Thr Ala Leu Ala Val
1               5                   10                  15
Leu Pro Phe Val Lys Ala Gln Gln Pro Gly Asn Phe Thr Pro Glu Val
            20                  25                  30
His Pro Gln Leu Pro Thr Trp Lys Cys Thr Thr Ala Gly Gly Cys Val
        35                  40                  45
Gln Gln Asp Thr Ser Val Val Leu Asp Trp Asn Tyr Arg Trp Ile His
    50                  55                  60
Asn Ala Asp Gly Thr Ala Ser Cys Thr Thr Ser Ser Gly Val Asp His
65                  70                  75                  80
Thr Leu Cys Pro Asp Glu Ala Thr Cys Ala Lys Asn Cys Phe Val Glu
                85                  90                  95
Gly Val Asn Tyr Thr Ser Ser Gly Val Thr Thr Ser Gly Ser Ser Leu
            100                 105                 110
Thr Met Arg Gln Tyr Phe Lys Gly Ser Asn Gly Gln Thr Asn Ser Val
        115                 120                 125
Ser Pro Arg Leu Tyr Leu Leu Gly Ser Asp Gly Asn Tyr Val Met Leu
    130                 135                 140
Lys Leu Leu Gly Gln Glu Leu Ser Phe Asp Val Asp Leu Ser Thr Leu
145                 150                 155                 160
Pro Cys Gly Glu Asn Gly Ala Leu Tyr Leu Ser Glu Met Asp Ala Thr
                165                 170                 175
Gly Gly Arg Asn Gln Tyr Asn Thr Gly Gly Ala Asn Tyr Gly Ser Gly
            180                 185                 190
Tyr Cys Asp Ala Gln Cys Pro Val Gln Thr Trp Met Asn Gly Thr Leu
        195                 200                 205
Asn Thr Asn Gly Gln Gly Tyr Cys Cys Asn Glu Met Asp Ile Leu Glu
    210                 215                 220
Ala Asn Ser Arg Ala Asn Ala Met Thr Pro His Pro Cys Ala Asn Gly
225                 230                 235                 240
Ser Cys Asp Lys Ser Gly Cys Gly Leu Asn Pro Tyr Ala Glu Gly Tyr
                245                 250                 255
Lys Ser Tyr Tyr Gly Pro Gly Leu Thr Val Asp Thr Ser Lys Pro Phe
            260                 265                 270
Thr Ile Ile Thr Arg Phe Ile Thr Asp Asp Gly Thr Thr Ser Gly Thr
        275                 280                 285
Leu Asn Gln Ile Gln Arg Ile Tyr Val Gln Asn Gly Lys Thr Val Ala
    290                 295                 300
Ser Ala Ala Ser Gly Gly Asp Ile Ile Thr Ala Ser Gly Cys Thr Ser
305                 310                 315                 320
Ala Gln Ala Phe Gly Gly Leu Ala Asn Met Gly Ala Ala Leu Gly Arg
                325                 330                 335
Gly Met Val Leu Thr Phe Ser Ile Trp Asn Asp Ala Gly Gly Tyr Met
            340                 345                 350
Asn Trp Leu Asp Ser Gly Asn Asn Gly Pro Cys Ser Ser Thr Glu Gly
        355                 360                 365
Asn Pro Ser Asn Ile Leu Ala Asn Tyr Pro Asp Thr His Val Val Phe
    370                 375                 380
Ser Asn Ile Arg Trp Gly Asp Ile Gly Ser Thr Val Gln Val Ser Gly
385                 390                 395                 400
Gly Gly Asn Gly Gly Ser Thr Thr Thr Thr Ser Thr Thr Thr Leu Arg
                405                 410                 415
Thr Ser Thr Thr Thr Thr Thr Thr Ala Pro Thr Ala Thr Ala Thr His
            420                 425                 430
Trp Gly Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro Thr Val Cys Glu
        435                 440                 445
Ser Pro Tyr Ala Cys Lys Glu Leu Asn Pro Trp Tyr Tyr Gln Cys Leu
    450                 455                 460
<210>15
<211>1368
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>15
accgatccgc tcgaagatgg cgcccaagtc tacagttctg gccgcctggc tgctctcctc    60
gctggccgcg gcccagcaga tcggcaaagc cgtgcccgag gtccacccca aactgacaac   120
gcagaagtgc actctccgcg gcgggtgcaa gcctgtccgc acctcggtcg tgctcgactc   180
gtccgcgcgc tcgctgcaca aggtcgggga ccccaacacc agctgcagcg tcggcggcga   240
cctgtgctcg gacgcgaagt cgtgcggcaa gaactgcgcg ctcgagggcg tcgactacgc   300
ggcccacggc gtggcgacca agggcgacgc cctcacgctg caccagtggc tcaagggggc   360
cgacggcacc tacaggaccg tctcgccgcg cgtatacctc ctgggcgagg acgggaagaa   420
ctacgaggac ttcaagctgc tcaacgccga gctcagcttc gacgtcgacg tgtcccagct   480
cgtctgcggc atgaacggcg ccctgtactt ctccgagatg gagatggacg gcggccgcag   540
cccgctgaac ccggcgggcg ccacgtacgg cacgggctac tgcgacgcgc agtgccccaa   600
gttggacttt atcaacggcg aggtatttct tctctcttct gtttttcttt tccatcgctt   660
tttctgaccg gaatccgccc tcttagctca acaccaacca cacgtacggg gcgtgctgca   720
acgagatgga catctgggag gccaacgcgc tggcgcaggc gctcacgccg cacccgtgca   780
acgcgacgcg ggtgtacaag tgcgacacgg cggacgagtg cgggcagccg gtgggcgtgt   840
gcgacgaatg ggggtgctcg tacaacccgt ccaacttcgg ggtcaaggac tactacgggc   900
gcaacctgac ggtggacacg aaccgcaagt tcacggtgac gacgcagttc gtgacgtcca   960
acgggcgggc ggacggcgag ctgaccgaga tccggcggct gtacgtgcag gacggcgtgg  1020
tgatccagaa ccacgcggtc acggcgggcg gggcgacgta cgacagcatc acggacggct  1080
tctgcaacgc gacggccacc tggacgcagc agcggggcgg gctcgcgcgc atgggcgagg  1140
ccatcggccg cggcatggtg ctcatcttca gcctgtgggt tgacaacggc ggcttcatga  1200
actggctcga cagcggcaac gccgggccct gcaacgccac cgagggcgac ccggccctga  1260
tcctgcagca gcacccggac gccagcgtca ccttctccaa catccgatgg ggcgagatcg  1320
gcagcacgta caagagcgag tgcagccact agagtagagc ttgtaatt               1368
<210>16
<211>423
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>16
Met Ala Pro Lys Ser Thr Val Leu Ala Ala Trp Leu Leu Ser Ser Leu
1               5                   10                  15
Ala Ala Ala Gln Gln Ile Gly Lys Ala Val Pro Glu Val His Pro Lys
            20                  25                  30
Leu Thr Thr Gln Lys Cys Thr Leu Arg Gly Gly Cys Lys Pro Val Arg
        35                  40                  45
Thr Ser Val Val Leu Asp Ser Ser Ala Arg Ser Leu His Lys Val Gly
    50                  55                  60
Asp Pro Asn Thr Ser Cys Ser Val Gly Gly Asp Leu Cys Ser Asp Ala
65                  70                  75                  80
Lys Ser Cys Gly Lys Asn Cys Ala Leu Glu Gly Val Asp Tyr Ala Ala
                85                  90                  95
His Gly Val Ala Thr Lys Gly Asp Ala Leu Thr Leu His Gln Trp Leu
            100                 105                 110
Lys Gly Ala Asp Gly Thr Tyr Arg Thr Val Ser Pro Arg Val Tyr Leu
        115                 120                 125
Leu Gly Glu Asp Gly Lys Asn Tyr Glu Asp Phe Lys Leu Leu Asn Ala
    130                 135                 140
Glu Leu Ser Phe Asp Val Asp Val Ser Gln Leu Val Cys Gly Met Asn
145                 150                 155                 160
Gly Ala Leu Tyr Phe Ser Glu Met Glu Met Asp Gly Gly Arg Ser Pro
                165                 170                 175
Leu Asn Pro Ala Gly Ala Thr Tyr Gly Thr Gly Tyr Cys Asp Ala Gln
            180                 185                 190
Cys Pro Lys Leu As1 Phe Ile Asn Gly Glu Leu Asn Thr Asn His Thr
        195                 200                 205
Tyr Gly Ala Cys Cys Asn Glu Met Asp Ile Trp Glu Ala Asn Ala Leu
    210                 215                 220
Ala Gln Ala Leu Thr Pro His Pro Cys Asn Ala Thr Arg Val Tyr Lys
225                 230                 235                 240
Cys Asp Thr Ala Asp Glu Cys Gly Gln Pro Val Gly Val Cys Asp Glu
                245                 250                 255
Trp Gly Cys Ser Tyr Asn Pro Ser Asn Phe Gly Val Lys Asp Tyr Tyr
            260                 265                 270
Gly Arg Asn Leu Thr Val Asp Thr Asn Arg Lys Phe Thr Val Thr Thr
        275                 280                 285
Gln Phe Val Thr Ser Asn Gly Arg Ala Asp Gly Glu Leu Thr Glu Ile
    290                 295                 300
Arg Arg Leu Tyr Val Gln Asp Gly Val Val Ile Gln Asn His Ala Val
305                 310                 315                 320
Thr Ala Gly Gly Ala Thr Tyr Asp Ser Ile Thr Asp Gly Phe Cys Asn
                325                 330                 335
Ala Thr Ala Thr Trp Thr Gln Gln Arg Gly Gly Leu Ala Arg Met Gly
            340                 345                 350
Glu Ala Ile Gly Arg Gly Met Val Leu Ile Phe Ser Leu Trp Val Asp
        355                 360                 365
Asn Gly Gly Phe Met Asn Trp Leu Asp Ser Gly Asn Ala Gly Pro Cys
    370                 375                 380
Asn Ala Thr Glu Gly Asp Pro Ala Leu Ile Leu Gln Gln His Pro Asp
385                 390                 395                 400
Ala Ser Val Thr Phe Ser Asn Ile Arg Trp Gly Glu Ile Gly Ser Thr
                405                 410                 415
Tyr Lys Ser Glu Cys Ser His
            420
<210>17
<211>1011
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>17
atgaccctac ggctccctgt catcagcctg ctggcctcgc tggcagcagg cgccgtcgtc     60
gtcccacggg cggagtttca cccccctctc ccgacttgga aatgcacgac ctccgggggc    120
tgcgtgcagc agaacaccag cgtcgtcctg gaccgtgact cgaagtacgc cgcacacagc    180
gccggctcgc ggacggaatc ggattacgcg gcaatgggag tgtccacttc gggcaatgcc    240
gtgacgctgt accactacgt caagaccaac ggcaccctcg tccccgcttc gccgcgcatc    300
tacctcctgg gcgcggacgg caagtacgtg cttatggacc tcctcaacca ggagctgtcg    360
gtggacgtcg acttctcggc gctgccgtgc ggcgagaacg gggccttcta cctgtccgag    420
atggcggcgg acgggcgggg cgacgcgggg gcgggcgacg ggtactgcga cgcgcagtgc    480
cagggctact gctgcaacga gatggacatc ctcgaggcca actcgatggc gacggccatg    540
acgccgcacc cgtgcaaggg caacaactgc gaccgcagcg gctgcggcta caacccgtac    600
gccagcggcc agcgcggctt ctacgggccc ggcaagacgg tcgacacgag caagcccttc    660
accgtcgtca cgcagttcgc cgccagcggc ggcaagctga cccagatcac ccgcaagtac    720
atccagaacg gccgggagat cggcggcggc ggcaccatct ccagctgcgg ctccgagtct    780
tcgacgggcg gcctgaccgg catgggcgag gcgctggggc gcggaatggt gctggccatg    840
agcatctgga acgacgcggc ccaggagatg gcatggctcg atgccggcaa caacggccct    900
tgcgccagtg gccagggcag cccgtccgtc attcagtcgc agcatcccga cacccacgtc    960
gtcttctcca acatcaggtg gggcgacatc gggtctacca cgaagaacta g            1011
<210>18
<211>336
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>18
Met Thr Leu Arg Leu Pro Val Ile Ser Leu Leu Ala Ser Leu Ala Ala
1               5                   10                  15
Gly Ala Val Val Val Pro Arg Ala Glu Phe His Pro Pro Leu Pro Thr
            20                  25                  30
Trp Lys Cys Thr Thr Ser Gly Gly Cys Val Gln Gln Asn Thr Ser Val
        35                  40                  45
Val Leu Asp Arg Asp Ser Lys Tyr Ala Ala His Ser Ala Gly Ser Arg
    50                  55                  60
Thr Glu Ser Asp Tyr Ala Ala Met Gly Val Ser Thr Ser Gly Asn Ala
65                  70                  75                  80
Val Thr Leu Tyr His Tyr Val Lys Thr Asn Gly Thr Leu Val Pro Ala
                85                  90                  95
Ser Pro Arg Ile Tyr Leu Leu Gly Ala Asp Gly Lys Tyr Val Leu Met
            100                 105                 110
Asp Leu Leu Asn Gln Glu Leu Ser Val Asp Val Asp Phe Ser Ala Leu
        115                 120                 125
Pro Cys Gly Glu Asn Gly Ala Phe Tyr Leu Ser Glu Met Ala Ala Asp
    130                 135                 140
Gly Arg Gly Asp Ala Gly Ala Gly Asp Gly Tyr Cys Asp Ala Gln Cys
145                 150                 155                 160
Gln Gly Tyr Cys Cys Asn Glu Met Asp Ile Leu Glu Ala Asn Ser Met
                165                 170                 175
Ala Thr Ala Met Thr Pro His Pro Cys Lys Gly Asn Asn Cys Asp Arg
            180                 185                 190
Ser Gly Cys Gly Tyr Asn Pro Tyr Ala Ser Gly Gln Arg Gly Phe Tyr
        195                 200                 205
Gly Pro Gly Lys Thr Val Asp Thr Ser Lys Pro Phe Thr Val Val Thr
    210                 215                 220
Gln Phe Ala Ala Ser Gly Gly Lys Leu Thr Gln Ile Thr Arg Lys Tyr
225                 230                 235                 240
Ile Gln Asn Gly Arg Glu Ile Gly Gly Gly Gly Thr Ile Ser Ser Cys
                245                 250                 255
Gly Ser Glu Ser Ser Thr Gly Gly Leu Thr Gly Met Gly Glu Ala Leu
            260                 265                 270
Gly Arg Gly Met Val Leu Ala Met Ser Ile Trp Asn Asp Ala Ala Gln
        275                 280                 285
Glu Met Ala Trp Leu Asp Ala Gly Asn Asn Gly Pro Cys Ala Ser Gly
    290                 295                 300
Gln Gly Ser Pro Ser Val Ile Gln Ser Gln His Pro Asp Thr His Val
305                 310                 315                 320
Val Phe Ser Asn Ile Arg Trp Gly Asp Ile Gly Ser Thr Thr Lys Asn
                325                 330                 335
<210>19
<211>1480
<212>DNA
<213>Cladorrhinum foecundissimum
<400>19
gatccgaatt cctcctctcg ttctttagtc acagaccaga catctgccca cgatggttca     60
caagttcgcc ctcctcaccg gcctcgccgc ctccctcgca tctgcccagc agatcggcac    120
cgtcgtcccc gagtctcacc ccaagcttcc caccaagcgc tgcactctcg ccggtggctg    180
ccagaccgtc gacacctcca tcgtcatcga cgccttccag cgtcccctcc acaagatcgg    240
cgacccttcc actccttgcg tcgtcggcgg ccctctctgc cccgacgcca agtcctgcgc    300
tgagaactgc gcgctcgagg gtgtcgacta tgcctcctgg ggcatcaaga ccgagggcga    360
cgccctaact ctcaaccagt ggatgcccga cccggcgaac cctggccagt acaagacgac    420
tactccccgt acttaccttg ttgctgagga cggcaagaac tacgaggatg tgaagctcct    480
ggctaaggag atctcgtttg atgccgatgt cagcaacctt ccctgcggca tgaacggtgc    540
tttctacttg tctgagatgt tgatggatgg tggacgtggc gacctcaacc ctgctggtgc    600
cgagtatggt accggttact gtgatgcgca gtgcttcaag ttggatttca tcaacggcga    660
ggccaacatc gaccaaaagc acggcgcctg ctgcaacgaa atggacattt tcgaatccaa    720
ctcgcgcgcc aagaccttcg tcccccaccc ctgcaacatc acgcaggtct acaagtgcga    780
aggcgaagac gagtgcggcc agcccgtcgg cgtgtgcgac aagtgggggt gcggcttcaa    840
cgagtacaaa tggggcgtcg agtccttcta cggccggggc tcgcagttcg ccatcgactc    900
ctccaagaag ttcaccgtca ccacgcagtt cctgaccgac aacggcaagg aggacggcgt    960
cctcgtcgag atccgccgct tgtggcacca ggatggcaag ctgatcaaga acaccgctat   1020
ccaggttgag gagaactaca gcacggactc ggtgagcacc gagttctgcg agaagactgc   1080
ttctttcacc atgcagcgcg gtggtctcaa ggcgatgggc gaggctatcg gtcgtggtat   1140
ggtgctggtt ttcagcatct gggcggatga ttcgggtttt atgaactggt tggatgcgga   1200
gggtaatggc ccttgcagcg cgactgaggg cgatccgaag gagattgtca agaataagcc   1260
ggatgctagg gttacgttct caaacattag gattggtgag gttggtagca cgtatgctcc   1320
gggtgggaag tgcggtgtta agagcagggt tgctaggggg cttactgctt cttaaggggg   1380
gtgtgaagag aggaggaggt gttgttgggg gttggagatg ataattgggc gagatggtgt   1440
agagcgggtt ggttggatat gaatacgttg aattggatgt                         1480
<210>20
<211>440
<212>PRT
<213>Cladorrhinum foecundissimum
<400>20
Met Val His Lys Phe Ala Leu Leu Thr Gly Leu Ala Ala Ser Leu Ala
1               5                   10                  15
Ser Ala Gln Gln Ile Gly Thr Val Val Pro Glu Ser His Pro Lys Leu
            20                  25                  30
Pro Thr Lys Arg Cys Thr Leu Ala Gly Gly Cys Gln Thr Val Asp Thr
        35                  40                  45
Ser Ile Val Ile Asp Ala Phe Gln Arg Pro Leu His Lys Ile Gly Asp
    50                  55                  60
Pro Ser Thr Pro Cys Val Val Gly Gly Pro Leu Cys Pro Asp Ala Lys
65                  70                  75                  80
Ser Cys Ala Glu Asn Cys Ala Leu Glu Gly Val Asp Tyr Ala Ser Trp
                85                  90                  95
Gly Ile Lys Thr Glu Gly Asp Ala Leu Thr Leu Asn Gln Trp Met Pro
            100                 105                 110
Asp Pro Ala Asn Pro Gly Gln Tyr Lys Thr Thr Thr Pro Arg Thr Tyr
        115                 120                 125
Leu Val Ala Glu Asp Gly Lys Asn Tyr Glu Asp Val Lys Leu Leu Ala
    130                 135                 140
Lys Glu Ile Ser Phe Asp Ala Asp Val Ser Asn Leu Pro Cys Gly Met
145                 150                 155                 160
Asn Gly Ala Phe Tyr Leu Ser Glu Met Leu Met Asp Gly Gly Arg Gly
                165                 170                 175
Asp Leu Asn Pro Ala Gly Ala Glu Tyr Gly Thr Gly Tyr Cys Asp Ala
            180                 185                 190
Gln Cys Phe Lys Leu Asp Phe Ile Asn Gly Glu Ala Asn Ile Asp Gln
        195                 200                 205
Lys His Gly Ala Cys Cys Asn Glu Met Asp Ile Phe Glu Ser Asn Ser
    210                 215                 220
Arg Ala Lys Thr Phe Val Pro His Pro Cys Asn Ile Thr Gln Val Tyr
225                 230                 235                 240
Lys Cys Glu Gly Glu Asp Glu Cys Gly Gln Pro Val GLy Val Cys Asp
                245                 250                 255
Lys Trp Gly Cys Gly Phe Asn Glu Tyr Lys Trp Gly Val Glu Ser Phe
            260                 265                 270
Tyr Gly Arg Gly Ser Gln Phe Ala Ile Asp Ser Ser Lys Lys Phe Thr
        275                 280                 285
Val Thr Thr Gln Phe Leu Thr Asp Asn Gly Lys Glu Asp Gly Val Leu
    290                 295                 300
Val Glu Ile Arg Arg Leu Trp His Gln Asp Gly Lys Leu Ile Lys Asn
305                 310                 315                 320
Thr Ala Ile Gln Val Glu Glu Asn Tyr Ser Thr Asp Ser Val Ser Thr
                325                 330                 335
Glu Phe Cys Glu Lys Thr Ala Ser Phe Thr Met Gln Arg Gly Gly Leu
            340                 345                 350
Lys Ala Met Gly Gl u Ala Ile Gly Arg Gly Met ValLeu Val Phe Ser
        355                 360                 365
Ile Trp Ala Asp Asp Ser Gly Phe Met Asn Trp Leu Asp Ala Glu Gly
    370                 375                 380
Asn Gly Pro Cys Ser Ala Thr Glu Gly Asp Pro Lys Glu Ile Val Lys
385                 390                 395                 400
Asn Lys Pro Asp Ala Arg Val Thr Phe Ser Asn Ile Arg Ile Gly Glu
                405                 410                 415
Val Gly Ser Thr Tyr Ala Pro Gly Gly Lys Cys Gly Val Lys Ser Arg
            420                 425                 430
Val Ala Arg Gly Leu Thr Ala Ser
        435                 440
<210>21
<211>1380
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>21
atggcgccct cagttacact gccgttgacc acggccatcc tggccattgc ccggctcgtc    60
gccgcccagc aaccgggtac cagcaccccc gaggtccatc ccaagttgac aacctacaag   120
tgtacaaagt ccggggggtg cgtggcccag gacacctcgg tggtccttga ctggaactac   180
cgctggatgc acgacgcaaa ctacaactcg tgcaccgtca acggcggcgt caacaccacg   240
ctctgccctg acgaggcgac ctgtggcaag aactgcttca tcgagggcgt cgactacgcc   300
gcctcgggcg tcacgacctc gggcagcagc ctcaccatga accagtacat gcccagcagc   360
tctggcggct acagcagcgt ctctcctcgg ctgtatctcc tggactctga cggtgagtac   420
gtgatgctga agctcaacgg ccaggagctg agcttcgacg tcgacctctc tgctctgccg   480
tgtggagaga acggctcgct ctacctgtct cagatggacg agaacggggg cgccaaccag   540
tataacacgg ccggtgccaa ctacgggagc ggctactgcg atgctcagtg ccccgtccag   600
acatggagga acggcaccct caacactagc caccagggct tctgctgcaa cgagatggat   660
atcctggagg gcaactcgag ggcgaatgcc ttgacccctc actcttgcac ggccacggcc   720
tgcgactctg ccggttgcgg cttcaacccc tatggcagcg gctacaaaag ctactacggc   780
cccggagata ccgttgacac ctccaagacc ttcaccatca tcacccagtt caacacggac   840
aacggctcgc cctcgggcaa ccttgtgagc atcacccgca agtaccagca aaacggcgtc   900
gacatcccca gcgcccagcc cggcggcgac accatctcgt cctgcccgtc cgcctcagcc   960
tacggcggcc tcgccaccat gggcaaggcc ctgagcagcg gcatggtgct cgtgttcagc  1020
atttggaacg acaacagcca gtacatgaac tggctcgaca gcggcaacgc cggcccctgc  1080
agcagcaccg agggcaaccc atccaacatc ctggccaaca accccaacac gcacgtcgtc  1140
ttctccaaca tccgctgggg agacattggg tctactacga actcgactgc gcccccgccc  1200
ccgcctgcgt ccagcacgac gttttcgact acacggagga gctcgacgac ttcgagcagc  1260
ccgagctgca cgcagactca ctgggggcag tgcggtggca ttgggtacag cgggtgcaag  1320
acgtgcacgt cgggcactac gtgccagtat agcaacgact actactcgca atgcctttag  1380
<210>22
<211>459
<212>PRT
<213>里氏木霉(Trichoderma reesei)
<400>22
Met Ala Pro Ser Val Thr Leu Pro Leu Thr Thr Ala Ile Leu Ala Ile
1               5                   10                  15
Ala Arg Leu Val Ala Ala Gln Gln Pro Gly Thr Ser Thr Pro Glu Val
            20                  25                  30
His Pro Lys Leu Thr Thr Tyr Lys Cys Thr Lys Ser Gly Gly Cys Val
        35                  40                  45
Ala Gln Asp Thr Ser Val Val Leu Asp Trp Asn Tyr Arg Trp Met His
    50                  55                  60
Asp Ala Asn Tyr Asn Ser Cys Thr Val Asn Gly Gly Val Asn Thr Thr
65                  70                  75                  80
Leu Cys Pro Asp Glu Ala Thr Cys Gly Lys Asn Cys Phe Ile Glu Gly
                85                  90                  95
Val Asp Tyr Ala Ala Ser Gly Val Thr Thr Ser Gly Ser Ser Leu Thr
            100                 105                 110
Met Asn Gln Tyr Met Pro Ser Ser Ser Gly Gly Tyr Ser Ser Val Ser
        115                 120                 125
Pro Arg Leu Tyr Leu Leu Asp Ser Asp Gly Glu Tyr Val Met Leu Lys
    130                 135                 140
Leu Asn Gly Gln Glu Leu Ser Phe Asp Val Asp Leu Ser Ala Leu Pro
145                 150                 155                 160
Cys Gly Glu Asn Gly Ser Leu Tyr Leu Ser Gln Met Asp Glu Asn Gly
                165                 170                 175
Gly Ala Asn Gln Tyr Asn Thr Ala Gly Ala Asn Tyr Gly Ser Gly Tyr
            180                 185                 190
Cys Asp Ala Gln Cys Pro Val Gln Thr Trp Arg Asn Gly Thr Leu Asn
        195                 200                 205
Thr Ser His Gln Gly Phe Cys Cys Asn Glu Met Asp Ile Leu Glu Gly
    210                 215                 220
Asn Ser Arg Ala Asn Ala Leu Thr Pro His Ser Cys Thr Ala Thr Ala
225                 230                 235                 240
Cys Asp Ser Ala Gly Cys Gly Phe Asn Pro Tyr Gly Ser Gly Tyr Lys
                245                 250                 255
Ser Tyr Tyr Gly Pro Gly Asp Thr Val Asp Thr Ser Lys Thr Phe Thr
            260                 265                 270
Ile Ile Thr Gln Phe Asn Thr Asp Asn Gly Ser Pro Ser Gly Asn Leu
        275                 280                 285
Val Ser Ile Thr Arg Lys Tyr Gln Gln Asn Gly Val Asp Ile Pro Ser
    290                 295                 300
Ala Gln Pro Gly Gly Asp Thr Ile Ser Ser Cys Pro Ser Ala Ser Ala
305                 310                 315                 320
Tyr Gly Gly Leu Ala Thr Met Gly Lys Ala Leu Ser Ser Gly Met Val
                325                 330                 335
Leu Val Phe Ser Ile Trp Asn Asp Asn Ser Gln Tyr Met Asn Trp Leu
            340                 345                 350
Asp Ser Gly Asn Ala Gly Pro Cys Ser Ser Thr Glu Gly Asn Pro Ser
        355                 360                 365
Asn Ile Leu Ala Asn Asn Pro Asn Thr His Val Val Phe Ser Asn Ile
    370                 375                 380
Arg Trp Gly Asp Ile Gly Ser Thr Thr Asn Ser Thr Ala Pro Pro Pro
385                 390                 395                 400
Pro Pro Ala Ser Ser Thr Thr Phe Ser Thr Thr Arg Arg Ser Ser Thr
                405                 410                 415
Thr Ser Ser Ser Pro Ser Cys Thr Gln Thr His Trp Gly Gln Cys Gly
            420                 425                 430
Gly Ile Gly Tyr Ser Gly Cys Lys Thr Cys Thr Ser Gly Thr Thr Cys
        435                 440                 445
Gln Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu
    450                 455
<210>23
<211>2586
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>23
atgaagcttg gttggatcga ggtggccgca ttggcggctg cctcagtagt cagtgccaag    60
gatgatctcg cgtactcccc tcctttctac ccttccccat gggcagatgg tcagggtgaa   120
tgggcggaag tatacaaacg cgctgtagac atagtttccc agatgacgtt gacagagaaa   180
gtcaacttaa cgactggaac aggatggcaa ctagagaggt gtgttggaca aactggcagt   240
gttcccagac tcaacatccc cagcttgtgt ttgcaggata gtcctcttgg tattcgtttc   300
tcggactaca attcagcttt ccctgcgggt gttaatgtcg ctgccacctg ggacaagacg   360
ctcgcctacc ttcgtggtca ggcaatgggt gaggagttca gtgataaggg tattgacgtt   420
cagctgggtc ctgctgctgg ccctctcggt gctcatccgg atggcggtag aaactgggaa   480
ggtttctcac cagatccagc cctcaccggt gtactttttg cggagacgat taagggtatt   540
caagatgctg gtgtcattgc gacagctaag cattatatca tgaacgaaca agagcatttc   600
cgccaacaac ccgaggctgc gggttacgga ttcaacgtaa gcgacagttt gagttccaac   660
gttgatgaca agactatgca tgaattgtac ctctggccct tcgcggatgc agtacgcgct   720
ggagtcggtg ctgtcatgtg ctcttacaac caaatcaaca acagctacgg ttgcgagaat   780
agcgaaactc tgaacaagct tttgaaggcg gagcttggtt tccaaggctt cgtcatgagt   840
gattggaccg ctcatcacag cggcgtaggc gctgctttag caggtctgga tatgtcgatg   900
cccggtgatg ttaccttcga tagtggtacg tctttctggg gtgcaaactt gacggtcggt   960
gtccttaacg gtacaatccc ccaatggcgt gttgatgaca tggctgtccg tatcatggcc  1020
gcttattaca aggttggccg cgacaccaaa tacacccctc ccaacttcag ctcgtggacc  1080
agggacgaat atggtttcgc gcataaccat gtttcggaag gtgcttacga gagggtcaac  1140
gaattcgtgg acgtgcaacg cgatcatgcc gacctaatcc gtcgcatcgg cgcgcagagc  1200
actgttctgc tgaagaacaa gggtgccttg cccttgagcc gcaaggaaaa gctggtcgcc  1260
cttctgggag aggatgcggg ttccaactcg tggggcgcta acggctgtga tgaccgtggt  1320
tgcgataacg gtacccttgc catggcctgg ggtagcggta ctgcgaattt cccatacctc  1380
gtgacaccag agcaggcgat tcagaacgaa gttcttcagg gccgtggtaa tgtcttcgcc  1440
gtgaccgaca gttgggcgct cgacaagatc gctgcggctg cccgccaggc cagcgtatct  1500
ctcgtgttcg tcaactccga ctcaggagaa ggctatctta gtgtggatgg aaatgagggc  1560
gatcgtaaca acatcactct gtggaagaac ggcgacaatg tggtcaagac cgcagcgaat  1620
aactgtaaca acaccgttgt catcatccac tccgtcggac cagttttgat cgatgaatgg  1680
tatgaccacc ccaatgtcac tggtattctc tgggctggtc tgccaggcca ggagtctggt  1740
aactccattg ccgatgtgct gtacggtcgt gtcaaccctg gcgccaagtc tcctttcact  1800
tggggcaaga cccgggagtc gtatggttct cccttggtca aggatgccaa caatggcaac  1860
ggagcgcccc agtctgattt cacccagggt gttttcatcg attaccgcca tttcgataag  1920
ttcaatgaga cccctatcta cgagtttggc tacggcttga gctacaccac cttcgagctc  1980
tccgacctcc atgttcagcc cctgaacgcg tcccgataca ctcccaccag tggcatgact  2040
gaagctgcaa agaactttgg tgaaattggc gatgcgtcgg agtacgtgta tccggagggg  2100
ctggaaagga tccatgagtt tatctatccc tggatcaact ctaccgacct gaaggcatcg  2160
tctgacgatt ctaactacgg ctgggaagac tccaagtata ttcccgaagg cgccacggat  2220
gggtctgccc agccccgttt gcccgctagt ggtggtgccg gaggaaaccc cggtctgtac  2280
gaggatcttt tccgcgtctc tgtgaaggtc aagaacacgg gcaatgtcgc cggtgatgaa  2340
gttcctcagc tgtacgtttc cctaggcggc ccgaatgagc ccaaggtggt actgcgcaag  2400
tttgagcgta ttcacttggc cccttcgcag gaggccgtgt ggacaacgac ccttacccgt  2460
cgtgaccttg caaactggga cgtttcggct caggactgga ccgtcactcc ttaccccaag  2520
acgatctacg ttggaaactc ctcacggaaa ctgccgctcc aggcctcgct gcctaaggcc  2580
cagtaa                                                             2586
<210>24
<211>861
<212>PRT
<213>米曲霉(Aspergillus oryzae)
<400>24
Met Lys Leu Gly Trp Ile Glu Val Ala Ala Leu Ala Ala Ala Ser Val
1               5                   10                  15
Val Ser Ala Lys Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser
            20                  25                  30
Pro Trp Ala Asp Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala
        35                  40                  45
Val Asp Ile Val Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr
    50                  55                  60
Thr Gly Thr Gly Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser
65                  70                  75                  80
Val Pro Arg Leu Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu
                85                  90                  95
Gly Ile Arg Phe Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn
            100                 105                 110
Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala
        115                 120                 125
Met Gly Glu Glu Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro
    130                 135                 140
Ala Ala Gly Pro Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu
145                 150                 155                 160
Gly Phe Ser Pro Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr
                165                 170                 175
Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr
            180                 185                 190
Ile Met Asn Glu Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly
        195                 200                 205
Tyr Gly Phe Asn Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys
    210                 215                 220
Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala
225                 230                 235                 240
Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr
                245                 250                 255
Gly Cys Glu Asn Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu
            260                 265                 270
Gly Phe Gln Gly Phe Val Met Ser Asp Trp Thr Ala His His Ser Gly
        275                 280                 285
Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val
    290                 295                 300
Thr Phe Asp Ser Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly
305                 310                 315                 320
Val Leu Asn Gly Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val
                325                 330                 335
Arg Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr
            340                 345                 350
Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His
        355                 360                 365
Asn His Val Ser Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp
    370                 375                 380
Val Gln Arg Asp His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser
385                 390                 395                 400
Thr Val Leu Leu Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu
                405                 410                 415
Lys Leu Val Ala Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly
            420                 425                 430
Ala Asn Gly Cys Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met
        435                 440                 445
Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu
    450                 455                 460
Gln Ala Ile Gln Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala
465                 470                 475                 480
Val Thr Asp Ser Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln
                485                 490                 495
Ala Ser Val Ser Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr
            500                 505                 510
Leu Ser Val Asp Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp
        515                 520                 525
Lys Asn Gly Asp Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn
    530                 535                 540
Thr Val Val Ile Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp
545                 550                 555                 560
Tyr Asp His Pro Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly
                565                 570                 575
Gln Glu Ser Gly Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn
            580                 585                 590
Pro Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr
        595                 600                 605
Gly Ser Pro Leu Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln
    610                 615                 620
Ser Asp Phe Thr Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys
625                 630                 635                 640
Phe Asn Glu Thr Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr
                645                 650                 655
Thr Phe Glu Leu Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg
            660                 665                 670
Tyr Thr Pro Thr Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu
        675                 680                 685
Ile Gly Asp Ala Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile
    690                 695                 700
His Glu Phe Ile Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser
705                 710                 715                 720
Ser Asp Asp Ser Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu
                725                 730                 735
Gly Ala Thr Asp Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly
            740                 745                 750
Ala Gly Gly Asn Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val
        755                 760                 765
Lys Val Lys Asn Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu
    770                 775                 780
Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys
785                 790                 795                 800
Phe Glu Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr
                805                 810                 815
Thr Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp
            820                 825                 830
Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser Ser
        835                 840                 845
Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln
    850                 855                 860
<210>25
<211>2586
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>25
atgaagcttg gttggatcga ggtggccgca ttggcggctg cctcagtagt cagtgccaag     60
gatgatctcg cgtactcccc tcctttctac ccttccccat gggcagatgg tcagggtgaa    120
tgggcggaag tatacaaacg cgctgtagac atagtttccc agatgacgtt gacagagaaa    180
gtcaacttaa cgactggaac aggatggcaa ctagagaggt gtgttggaca aactggcagt    240
gttcccagac tcaacatccc cagcttgtgt ttgcaggata gtcctcttgg tattcgtttc    300
tcggactaca attcagcttt ccctgcgggt gttaatgtcg ctgccacctg ggacaagacg    360
ctcgcctacc ttcgtggtca ggcaatgggt gaggagttca gtgataaggg tattgacgtt    420
cagctgggtc ctgctgctgg ccctctcggt gctcatccgg atggcggtag aaactgggaa    480
agtttctcac cagatccagc cctcaccggt gtactttttg cggagacgat taagggtatt    540
caagatgctg gtgtcattgc gacagctaag cattatatca tgaacgaaca agagcatttc    600
cgccaacaac ccgaggctgc gggttacgga ttcaacgtaa gcgacagttt gagttccaac    660
gttgatgaca agactatgca tgaattgtac ctctggccct tcgcggatgc agtacgcgct    720
ggagtcggtg ctgttatgtg ctcttacaac caaatcaaca acagctacgg ttgcgagaat    780
agcgaaactc tgaacaagct tttgaaggcg gagcttggtt tccaaggctt cgtcatgagt    840
gattggaccg ctcaacacag cggcgtaggc gctgctttag caggtctgga tatgtcgatg    900
cccggtgatg ttaccttcga tagtggtacg tctttctggg gtgcaaactt gacggtcggt    960
gtccttaacg gtacaatccc ccaatggcgt gttgatgaca tggctgtccg tatcatggcc   1020
gcttattaca aggttggccg cgacaccaaa tacacccctc ccaacttcag ctcgtggacc   1080
agggacgaat atggtttcgc gcataaccat gtttcggaag gtgcttacga gagggtcaac   1140
gaattcgtgg acgtgcaacg cgatcatgcc gacctaatcc gtcgcatcgg cgcgcagagc   1200
actgttctgc tgaagaacaa gggtgccttg cccttgagcc gcaaggaaaa gctggtcgcc   1260
cttctgggag aggatgcggg ttccaactcg tggggcgcta acggctgtga tgaccgtggt  1320
tgcgataacg gtacccttgc catggcctgg ggtagcggta ctgcgaattt cccatacctc  1380
gtgacaccag agcaggcgat tcagaacgaa gttcttcagg gccgtggtaa tgtcttcgcc  1440
gtgaccgaca gttgggcgct cgacaagatc gctgcggctg cccgccaggc cagcgtatct  1500
ctcgtgttcg tcaactccga ctcaggagaa ggctatctta gtgtggatgg aaatgagggc  1560
gatcgtaaca acatcactct gtggaagaac ggcgacaatg tggtcaagac cgcagcgaat  1620
aactgtaaca acaccgttgt catcatccac tccgtcggac cagttttgat cgatgaatgg  1680
tatgaccacc ccaatgtcac tggtattctc tgggctggtc tgccaggcca ggagtctggt  1740
aactccattg ccgatgtgct gtacggtcgt gtcaaccctg gcgccaagtc tcctttcact  1800
tggggcaaga cccgggagtc gtatggttct cccttggtca aggatgccaa caatggcaac  1860
ggagcgcccc agtctgattt cacccagggt gttttcatcg attaccgcca tttcgataag  1920
ttcaatgaga cccctatcta cgagtttggc tacggcttga gctacaccac cttcgagctc  1980
tccgacctcc atgttcagcc cctgaacgcg tcccgataca ctcccaccag tggcatgact  2040
gaagctgcaa agaactttgg tgaaattggc gatgcgtcgg agtacgtgta tccggagggg  2100
ctggaaagga tccatgagtt tatctatccc tggatcaact ctaccgacct gaaggcatcg  2160
tctgacgatt ctaactacgg ctgggaagac tccaagtata ttcccgaagg cgccacggat  2220
gggtctgccc agccccgttt gcccgctagt ggtggtgccg gaggaaaccc cggtctgtac  2280
gaggatcttt tccgcgtctc tgtgaaggtc aagaacacgg gcaatgtcgc cggtgatgaa  2340
gttcctcagc tgtacgtttc cctaggcggc ccgaatgagc ccaaggtggt actgcgcaag  2400
tttgagcgta ttcacttggc cccttcgcag gaggccgtgt ggacaacgac ccttacccgt  2460
cgtgaccttg caaactggga cgtttcggct caggactgga ccgtcactcc ttaccccaag  2520
acgatctacg ttggaaactc ctcacggaaa ctgccgctcc aggcctcgct gcctaaggcc  2580
cagtaa                                                             2586
<210>26
<211>861
<212>PRT
<213>米曲霉(Aspergillus oryzae)
<400>26
Met Lys Leu Gly Trp Ile Glu Val Ala Ala Leu Ala Ala Ala Ser Val
1               5                   10                  15
Val Ser Ala Lys Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser
            20                  25                  30
Pro Trp Ala Asp Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala
        35                  40                  45
Val Asp Ile Val Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr
    50                  55                  60
Thr Gly Thr Gly Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser
65                  70                  75                  80
Val Pro Arg Leu Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu
                85                  90                  95
Gly Ile Arg Phe Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn
            100                 105                 110
Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala
        115                 120                 125
Met Gly Glu Glu Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro
    130                 135                 140
Ala Ala Gly Pro Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu
145                 150                 155                 160
Ser Phe Ser Pro Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr
                165                 170                 175
Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr
            180                 185                 190
Ile Met Asn Glu Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly
        195                 200                 205
Tyr Gly Phe Asn Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys
    210                 215                 220
Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala
225                 230                 235                 240
Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr
                245                 250                 255
Gly Cys Glu Asn Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu
            260                 265                 270
Gly Phe Gln Gly Phe Val Met Ser Asp Trp Thr Ala Gln His Ser Gly
        275                 280                 285
Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val
    290                 295                 300
Thr Phe Asp Ser Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly
305                 310                 315                 320
Val Leu Asn Gly Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val
                325                 330                 335
Arg Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr
            340                 345                 350
Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His
        355                 360                 365
Asn His Val Ser Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp
    370                 375                 380
Val Gln Arg Asp His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser
385                 390                 395                 400
Thr Val Leu Leu Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu
                405                 410                 415
Lys Leu Val Ala Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly
            420                 425                 430
Ala Asn Gly Cys Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met
        435                 440                 445
Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu
    450                 455                 460
Gln Ala Ile Gln Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala
465                 470                 475                 480
Val Thr Asp Ser Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln
                485                 490                 495
Ala Ser Val Ser Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr
            500                 505                 510
Leu Ser Val Asp Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp
        515                 520                 525
Lys Asn Gly Asp Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn
    530                 535                 540
Thr Val Val Ile Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp
545                 550                 555                 560
Tyr Asp His Pro Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly
                565                 570                 575
Gln Glu Ser Gly Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn
            580                 585                 590
Pro Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr
        595                 600                 605
Gly Ser Pro Leu Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln
    610                 615                 620
Ser Asp Phe Thr Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys
525                 630                 635                 640
Phe Asn Glu Thr Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr
                645                 650                 655
Thr Phe Glu Leu Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg
            660                 665                 670
Tyr Thr Pro Thr Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu
        675                 680                 685
Ile Gly Asp Ala Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile
    690                 695                 700
His Glu Phe Ile Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser
705                 710                 715                 720
Ser Asp Asp Ser Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu
                725                 730                 735
Gly Ala Thr Asp Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly
            740                 745                 750
Ala Gly Gly Asn Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val
        755                 760                 765
Lys Val Lys Asn Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu
    770                 775                 780
Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys
785                 790                 795                 800
Phe Glu Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr
                805                 810                 815
Thr Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp
            820                 825                 830
Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Set Ser
        835                 840                 845
Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln
    850                 855                 860
<210>27
<211>3060
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
<400>27
atgagattcg gttggctcga ggtggccgct ctgacggccg cttctgtagc caatgcccag     60
gtttgtgatg ctttcccgtc attgtttcgg atatagttga caatagtcat ggaaataatc    120
aggaattggc tttctctcca ccattctacc cttcgccttg ggctgatggc cagggagagt    180
gggcagatgc ccatcgacgc gccgtcgaga tcgtttctca gatgacactg gcggagaagg    240
ttaaccttac aacgggtact gggtgggttg cgactttttt gttgacagtg agctttcttc    300
actgaccatc tacacagatg ggaaatggac cgatgcgtcg gtcaaaccgg cagcgttccc    360
aggtaagctt gcaattctgc aacaacgtgc aagtgtagtt gctaaaacgc ggtggtgcag    420
acttggtatc aactggggtc tttgtggcca ggattcccct ttgggtatcc gtttctgtga    480
gctatacccg cggagtcttt cagtccttgt attatgtgct gatgattgtc tctgtatagc    540
tgacctcaac tccgccttcc ctgctggtac taatgtcgcc gcgacatggg acaagacact    600
cgcctacctt cgtggcaagg ccatgggtga ggaattcaac gacaagggcg tggacatttt    660
gctggggcct gctgctggtc ctctcggcaa atacccggac ggcggcagaa tctgggaagg    720
cttctctcct gatccggttc tcactggtgt acttttcgcc gaaactatca agggtatcca    780
agacgcgggt gtgattgcta ctgccaagca ttacattctg aatgaacagg agcatttccg    840
acaggttggc gaggcccagg gatatggtta caacatcacg gagacgatca gctccaacgt    900
ggatgacaag accatgcacg agttgtacct ttggtgagta gttgacactg caaatgagga    960
ccttgattga tttgactgac ctggaatgca ggccctttgc agatgctgtg cgcggtaaga   1020
ttttccgtag acttgacctc gcgacgaaga aatcgctgac gaaccatcgt agctggcgtt   1080
ggcgctgtca tgtgttccta caatcaaatc aacaacagct acggttgtca aaacagtcaa   1140
actctcaaca agctcctcaa ggctgagctg ggcttccaag gcttcgtcat gagtgactgg   1200
agcgctcacc acagcggtgt cggcgctgcc ctcgctgggt tggatatgtc gatgcctgga   1260
gacatttcct tcgacgacgg actctccttc tggggcacga acctaactgt cagtgttctt   1320
aacggcaccg ttccagcctg gcgtgtcgat gacatggctg ttcgtatcat gaccgcgtac   1380
tacaaggttg gtcgtgaccg tcttcgtatt ccccctaact tcagctcctg gacccgggat   1440
gagtacggct gggagcattc tgctgtctcc gagggagcct ggaccaaggt gaacgacttc   1500
gtcaatgtgc agcgcagtca ctctcagatc atccgtgaga ttggtgccgc tagtacagtg   1560
ctcttgaaga acacgggtgc tcttcctttg accggcaagg aggttaaagt gggtgttctc   1620
ggtgaagacg ctggttccaa cccgtggggt gctaacggct gccccgaccg cggctgtgat   1680
aacggcactc ttgctatggc ctggggtagt ggtactgcca acttccctta ccttgtcacc   1740
cccgagcagg ctatccagcg agaggtcatc agcaacggcg gcaatgtctt tgctgtgact   1800
gataacgggg ctctcagcca gatggcagat gttgcatctc aatccaggtg agtgcgggct   1860
cttagaaaaa gaacgttctc tgaatgaagt tttttaacca ttgcgaacag cgtgtctttg   1920
gtgtttgtca acgccgactc tggagagggt ttcatcagtg tcgacggcaa cgagggtgac   1980
cgcaaaaatc tcactctgtg gaagaacggc gaggccgtca ttgacactgt tgtcagccac   2040
tgcaacaaca cgattgtggt tattcacagt gttgggcccg tcttgatcga ccggtggtat   2100
gataacccca acgtcactgc catcatctgg gccggcttgc ccggtcagga gagtggcaac   2160
tccctggtcg acgtgctcta tggccgcgtc aaccccagcg ccaagacccc gttcacctgg   2220
ggcaagactc gggagtctta cggggctccc ttgctcaccg agcctaacaa tggcaatggt   2280
gctccccagg atgatttcaa cgagggcgtc ttcattgact accgtcactt tgacaagcgc   2340
aatgagaccc ccatttatga gtttggccat ggcttgagct acaccacctt tggttactct   2400
caccttcggg ttcaggccct caatagttcg agttcggcat atgtcccgac tagcggagag   2460
accaagcctg cgccaaccta tggtgagatc ggtagtgccg ccgactacct gtatcccgag   2520
ggtctcaaaa gaattaccaa gtttatttac ccttggctca actcgaccga cctcgaggat   2580
tcttctgacg acccgaacta cggctgggag gactcggagt acattcccga aggcgctagg   2640
gatgggtctc ctcaacccct cctgaaggct ggcggcgctc ctggtggtaa ccctaccctt   2700
tatcaggatc ttgttagggt gtcggccacc ataaccaaca ctggtaacgt cgccggttat   2760
gaagtccctc aattggtgag tgacccgcat gttccttgcg ttgcaatttg gctaactcgc  2820
ttctagtatg tttcactggg cggaccgaac gagcctcggg tcgttctgcg caagttcgac  2880
cgaatcttcc tggctcctgg ggagcaaaag gtttggacca cgactcttaa ccgtcgtgat  2940
ctcgccaatt gggatgtgga ggctcaggac tgggtcatca caaagtaccc caagaaagtg  3000
cacgtcggca gctcctcgcg taagctgcct ctgagagcgc ctctgccccg tgtctactag  3060
<210>28
<211>863
<212>PRT
<213>烟曲霉(Aspergillus fumigatus)
<400>28
Met Arg Phe Gly Trp Leu Glu Val Ala Ala Leu Thr Ala Ala Ser Val
1               5                   10                  15
Ala Asn Ala Gln Glu Leu Ala Phe Ser Pro Pro Phe Tyr Pro Ser Pro
            20                  25                  30
Trp Ala Asp Gly Gln Gly Glu Trp Ala Asp Ala His Arg Arg Ala Val
        35                  40                  45
Glu Ile Val Ser Gln Met Thr Leu Ala Glu Lys Val Asn Leu Thr Thr
    50                  55                  60
Gly Thr Gly Trp Glu Met Asp Arg Cys Val Gly Gln Thr Gly Ser Val
65                  70                  75                  80
Pro Arg Leu Gly Ile Asn Trp Gly Leu Cys Gly Gln Asp Ser Pro Leu
                85                  90                  95
Gly Ile Arg Phe Ser Asp Leu Asn Ser Ala Phe Pro Ala Gly Thr Asn
            100                 105                 110
Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Lys Ala
        115                 120                 125
Met Gly Glu Glu Phe Asn Asp Lys Gly Val Asp Ile Leu Leu Gly Pro
    130                 135                 140
Ala Ala Gly Pro Leu Gly Lys Tyr Pro Asp Gly Gly Arg Ile Trp Glu
145                 150                 155                 160
Gly Phe Ser Pro Asp Pro Val Leu Thr Gly Val Leu Phe Ala Glu Thr
                165                 170                 175
Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr
            180                 185                 190
Ile Leu Asn Glu Gln Glu His Phe Arg Gln Val Gly Glu Ala Gln Gly
        195                 200                 205
Tyr Gly Tyr Asn Ile Thr Glu Thr Ile Ser Ser Asn Val Asp Asp Lys
    210                 215                 220
Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala
225                 230                 235                 240
Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr
                245                 250                 255
Gly Cys Gln Asn Ser Gln Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu
            260                 265                 270
Gly Phe Gln Gly Phe Val Met Ser Asp Trp Ser Ala His His Ser Gly
        275                 280                 285
Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Ile
    290                 295                 300
Ser Phe Asp Asp Gly Leu Ser Phe Trp Gly Thr Asn Leu Thr Val Ser
305                 310                 315                 320
Val Leu Asn Gly Thr Val Pro Ala Trp Arg Val Asp Asp Met AIa Val
                325                 330                 335
Arg Ile Met Thr Ala Tyr Tyr Lys Val Gly Arg Asp Arg Leu Arg Ile
            340                 345                 350
Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Trp Glu His
        355                 360                 365
Ser Ala Val Ser Glu Gly Ala Trp Thr Lys Val Asn Asp Phe Val Asn
    370                 375                 380
Val Gln Arg Ser His Ser Gln Ile Ile Arg Glu Ile Gly Ala Ala Ser
385                 390                 395                 400
Thr Val Leu Leu Lys Asn Thr Gly Ala Leu Pro Leu Thr Gly Lys Glu
                405                 410                 415
Val Lys Val Gly Val Leu Gly Glu Asp Ala Gly Ser Asn Pro Trp Gly
            420                 425                 430
Ala Asn Gly Cys Pro Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met
        435                 440                 445
Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu
    450                 455                 460
Gln Ala Ile Gln Arg Glu Val Ile Ser Asn Gly Gly Asn Val Phe Ala
465                 470                 475                 480
Val Thr Asp Asn Gly Ala Leu Ser Gln Met Ala Asp Val Ala Ser Gln
                485                 490                 495
Ser Ser Val Ser Leu Val Phe Val Asn Ala Asp Ser Gly Glu Gly Phe
            500                 505                 510
Ile Ser Val Asp Gly Asn Glu Gly Asp Arg Lys Asn Leu Thr Leu Trp
        515                 520                 525
Lys Asn Gly Glu Ala Val Ile Asp Thr Val Val Ser His Cys Asn Asn
    530                 535                 540
Thr Ile Val Val Ile His Ser Val Gly Pro Val Leu Ile Asp Arg Trp
545                 550                 555                 560
Tyr Asp Asn Pro Asn Val Thr Ala Ile Ile Trp Ala Gly Leu Pro Gly
                565                 570                 575
Gln Glu Ser Gly Asn Ser Leu Val Asp Val Leu Tyr Gly Arg Val Asn
            580                 585                 590
Pro Ser Ala Lys Thr Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr
        595                 600                 605
Gly Ala Pro Leu Leu Thr Glu Pro Asn Asn Gly Asn Gly Ala Pro Gln
    610                 615                 620
Asp Asp Phe Asn Glu Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys
625                 630                 635                 640
Arg Asn Glu Thr Pro Ile Tyr Glu Phe Gly His Gly Leu Ser Tyr Thr
                645                 650                 655
Thr Phe Gly Tyr Ser His Leu Arg Val Gln Ala Leu Asn Ser Ser Ser
            660                 665                 670
Ser Ala Tyr Val Pro Thr Ser Gly Glu Thr Lys Pro Ala Pro Thr Tyr
        675                 680                 685
Gly Glu Ile Gly Ser Ala Ala Asp Tyr Leu Tyr Pro Glu Gly Leu Lys
    690                 695                 700
Arg Ile Thr Lys Phe Ile Tyr Pro Trp Leu Asn Ser Thr Asp Leu Glu
705                 710                 715                 720
Asp Ser Ser Asp Asp Pro Asn Tyr Gly Trp Glu Asp Ser Glu Tyr Ile
                725                 730                 735
Pro Glu Gly Ala Arg Asp Gly Ser Pro Gln Pro Leu Leu Lys Ala Gly
            740                 745                 750
Gly Ala Pro Gly Gly Asn Pro Thr Leu Tyr Gln Asp Leu Val Arg Val
        755                 760                 765
Ser Ala Thr Ile Thr Asn Thr Gly Asn Val Ala Gly Tyr Glu Val Pro
    770                 775                 780
Gln Leu Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Arg Val Val Leu
785                 790                 795                 800
Arg Lys Phe Asp Arg Ile Phe Leu Ala Pro Gly Glu Gln Lys Val Trp
                805                 810                 815
Thr Thr Thr Leu Asn Arg Arg Asp Leu Ala Asn Trp Asp Val Glu Ala
            820                 825                 830
Gln Asp Trp Val Ile Thr Lys Tyr Pro Lys Lys Val His Val Gly Ser
        835                 840                 845
Ser Ser Arg Lys Leu Pro Leu Arg Ala Pro Leu Pro Arg Val Tyr
    850                 855                 860
<210>29
<211>2800
<212>DNA
<213>巴西青霉(Penicillium brasilianum)
<400>29
tgaaaatgca gggttctaca atctttctgg ctttcgcctc atgggcgagc caggttgctg    60
ccattgcgca gcccatacag aagcacgagg tttgttttat cttgctcatg gacgtgcttt   120
gacttgacta attgttttac atacagcccg gatttctgca cgggccccaa gccatagaat   180
cgttctcaga accgttctac ccgtcgccct ggatgaatcc tcacgccgag ggctgggagg   240
ccgcatatca gaaagctcaa gattttgtct cgcaactcac tatcttggag aaaataaatc   300
tgaccaccgg tgttgggtaa gtctctccga ctgcttctgg gtcacggtgc gacgagccac   360
tgactttttg aagctgggaa aatgggccgt gtgtaggaaa cactggatca attcctcgtc   420
tcggattcaa aggattttgt acccaggatt caccacaggg tgttcggttc gcagattatt   480
cctccgcttt cacatctagc caaatggccg ccgcaacatt tgaccgctca attctttatc   540
aacgaggcca agccatggca caggaacaca aggctaaggg tatcacaatt caattgggcc   600
ctgttgccgg ccctctcggt cgcatccccg agggcggccg caactgggaa ggattctccc   660
ctgatcctgt cttgactggt atagccatgg ctgagacaat taagggcatg caggatactg   720
gagtgattgc ttgcgctaaa cattatattg gaaacgagca ggagcacttc cgtcaagtgg   780
gtgaagctgc gggtcacgga tacactattt ccgatactat ttcatctaat attgacgacc   840
gtgctatgca tgagctatac ttgtggccat ttgctgatgc cgttcgcgct ggtgtgggtt   900
ctttcatgtg ctcatactct cagatcaaca actcctacgg atgccaaaac agtcagaccc   960
tcaacaagct cctcaagagc gaattgggct tccaaggctt tgtcatgagc gattggggtg  1020
cccatcactc tggagtgtca tcggcgctag ctggacttga tatgagcatg ccgggtgata  1080
ccgaatttga ttctggcttg agcttctggg gctctaacct caccattgca attctgaacg  1140
gcacggttcc cgaatggcgc ctggatgaca tggcgatgcg aattatggct gcatacttca  1200
aagttggcct tactattgag gatcaaccag atgtcaactt caatgcctgg acccatgaca  1260
cctacggata taaatacgct tatagcaagg aagattacga gcaggtcaac tggcatgtcg  1320
atgttcgcag cgaccacaat aagctcattc gcgagactgc cgcgaagggt acagttctgc  1380
tgaagaacaa ctttcatgct ctccctctga agcagcccag gttcgtggcc gtcgttggtc  1440
aggatgccgg gccaaacccc aagggcccta acggctgcgc agaccgagga tgcgaccaag  1500
gcactctcgc aatgggatgg ggctcagggt ctaccgaatt cccttacctg gtcactcctg  1560
acactgctat tcagtcaaag gtcctcgaat acgggggtcg atacgagagt atttttgata  1620
actatgacga caatgctatc ttgtcgcttg tctcacagcc tgatgcaacc tgtatcgttt  1680
ttgcaaatgc cgattccggt gaaggctaca tcactgtcga caacaactgg ggtgaccgca  1740
acaatctgac cctctggcaa aatgccgatc aagtgattag cactgtcagc tcgcgatgca  1800
acaacacaat cgttgttctc cactctgtcg gaccagtgtt gctaaatggt atatatgagc  1860
acccgaacat cacagctatt gtctgggcag ggatgccagg cgaagaatct ggcaatgctc  1920
tcgtggatat tctttggggc aatgttaacc ctgccggtcg cactccgttc acctgggcca  1980
aaagtcgaga ggactatggc actgatataa tgtacgagcc caacaacggc cagcgtgcgc  2040
ctcagcagga tttcaccgag agcatctacc tcgactaccg ccatttcgac aaagctggta  2100
tcgagccaat ttacgagttt ggattcggcc tctcctatac caccttcgaa tactctgacc  2160
tccgtgttgt gaagaagtat gttcaaccat acagtcccac gaccggcacc ggtgctcaag  2220
caccttccat cggacagcca cctagccaga acctggatac ctacaagttc cctgctacat  2280
acaagtacat caaaaccttc atttatccct acctgaacag cactgtctcc ctccgcgctg  2340
cttccaagga tcccgaatac ggtcgtacag actttatccc accccacgcg cgtgatggct  2400
cccctcaacc tctcaacccc gctggagacc cagtggccag tggtggaaac aacatgctct  2460
acgacgaact ttacgaggtc actgcacaga tcaaaaacac tggcgacgtg gccggcgacg  2520
aagtcgtcca gctttacgta gatctcgggg gtgacaaccc gcctcgtcag ttgagaaact  2580
ttgacaggtt ttatctgctg cccggtcaga gctcaacatt ccgggctaca ttgacgcgcc  2640
gtgatttgag caactgggat attgaggcgc agaactggcg agttacggaa tcgcctaaga  2700
gagtgtatgt tggacggtcg agtcgggatt tgccgctgag ctcacaattg gagtaatgat  2760
catgtctacc aatagatgtt gaatgtctgg tgtggatatt                        2800
<210>30
<211>878
<212>PRT
<213>巴西青霉(Penici ll ium brasilianum)
<400>30
Met Gln Gly Ser Thr Ile Phe Leu Ala Phe Ala Ser Trp Ala Ser Gln
1               5                   10                  15
Val Ala Ala Ile Ala Gln Pro Ile Gln Lys His Glu Pro Gly Phe Leu
            20                  25                  30
His Gly Pro Gln Ala Ile Glu Ser Phe Ser Glu Pro Phe Tyr Pro Ser
        35                  40                  45
Pro Trp Met Asn Pro His Ala Glu Gly Trp Glu Ala Ala Tyr Gln Lys
    50                  55                  60
Ala Gln Asp Phe Val Ser Gln Leu Thr Ile Leu Glu Lys Ile Asn Leu
65                  70                  75                  80
Thr Thr Gly Val Gly Trp Glu Asn Gly Pro Cys Val Gly Asn Thr Gly
                85                  90                  95
Ser Ile Pro Arg Leu Gly Phe Lys Gly Phe Cys Thr Gln Asp Ser Pro
            100                 105                 110
Gln Gly Val Arg Phe Ala Asp Tyr Ser Ser Ala Phe Thr Ser Ser Gln
        115                 120                 125
Met Ala Ala Ala Thr Phe Asp Arg Ser Ile Leu Tyr Gln Arg Gly Gln
    130                 135                 140
Ala Met Ala Gln Glu His Lys Ala Lys Gly Ile Thr Ile Gln Leu Gly
145                 150                 155                 160
Pro Val Ala Gly Pro Leu Gly Arg Ile Pro Glu Gly Gly Arg Asn Trp
                165                 170                 175
Glu Gly Phe Ser Pro Asp Pro Val Leu Thr Gly Ile Ala Met Ala Glu
            180                 185                 190
Thr Ile Lys Gly Met Gln Asp Thr Gly Val Ile Ala Cys Ala Lys His
        195                 200                 205
Tyr Ile Gly Asn Glu Gln Glu His Phe Arg Gln Val Gly Glu Ala Ala
    210                 215                 220
Gly His Gly Tyr Thr Ile Ser Asp Thr Ile Ser Ser Asn Ile Asp Asp
225                 230                 235                 240
Arg Ala Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg
                245                 250                 255
Ala Gly Val Gly Ser Phe Met Cys Ser Tyr Ser Gln Ile Asn Asn Ser
            260                 265                 270
Tyr Gly Cys Gln Asn Ser Gln Thr Leu Asn Lys Leu Leu Lys Ser Glu
        275                 280                 285
Leu Gly Phe Gln Gly Phe Val Met Ser Asp Trp Gly Ala His His Ser
    290                 295                 300
Gly Val Ser Ser Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp
305                 310                 315                 320
7hr Glu Phe Asp Ser Gly Leu Ser Phe Trp Gly Ser Asn Leu Thr Ile
                325                 330                 335
Ala Ile Leu Asn Gly Thr Val Pro Glu Trp Arg Leu Asp Asp Met Ala
            340                 345                 350
Met Arg Ile Met Ala Ala Tyr Phe Lys Val Gly Leu Thr Ile Glu Asp
        355                 360                 365
Gln Pro Asp Val Asn Phe Asn Ala Trp Thr His Asp Thr Tyr Gly Tyr
    370                 375                 380
Lys Tyr Ala Tyr Ser Lys Glu Asp Tyr Glu Gln Val Asn Trp His Val
385                 390                 395                 400
Asp Val Arg Ser Asp His Asn Lys Leu Ile Arg Glu Thr Ala Ala Lys
                405                 410                 415
Gly Thr Val Leu Leu Lys Asn Asn Phe His Ala Leu Pro Leu Lys Gln
            420                 425                 430
Pro Arg Phe Val Ala Val Val Gly Gln Asp Ala Gly Pro Asn Pro Lys
        435                 440                 445
Gly Pro Asn Gly Cys Ala Asp Arg Gly Cys Asp Gln Gly Thr Leu Ala
    450                 455                 460
Met Gly Trp Gly Ser Gly Ser Thr Glu Phe Pro Tyr Leu Val Thr Pro
465                 470                 475                 480
Asp Thr Ala Ile Gln Ser Lys Val Leu Glu Tyr Gly Gly Arg Tyr Glu
                485                 490                 495
Ser Ile Phe Asp Asn Tyr Asp Asp Asn Ala Ile Leu Ser Leu Val Ser
            500                 505                 510
Gln Pro Asp Ala Thr Cys Ile Val Phe Ala Asn Ala Asp Ser Gly Glu
        515                 520                 525
Gly Tyr Ile Thr Val Asp Asn Asn Trp Gly Asp Arg Asn Asn Leu Thr
    530                 535                 540
Leu Trp Gln Asn Ala Asp Gln Val Ile Ser Thr Val Ser Ser Arg Cys
545                 550                 555                 560
Asn Asn Thr Ile Val Val Leu His Ser Val Gly Pro Val Leu Leu Asn
                565                 570                 575
Gly Ile Tyr Glu His Pro Asn Ile Thr Ala Ile Val Trp Ala Gly Met
            580                 585                 590
Pro Gly Glu Glu Ser Gly Asn Ala Leu Val Asp Ile Leu Trp Gly Asn
        595                 600                 605
Val Asn Pro Ala Gly Arg Thr Pro Phe Thr Trp Ala Lys Ser Arg Glu
    610                 615                 620
Asp Tyr Gly Thr Asp Ile Met Tyr Glu Pro Asn Asn Gly Gln Arg Ala
625                 630                 635                 640
Pro Gln Gln Asp Phe Thr Glu Ser Ile Tyr Leu Asp Tyr Arg His Phe
                645                 650                 655
Asp Lys Ala Gly Ile Glu Pro Ile Tyr Glu Phe Gly Phe Gly Leu Ser
            660                 665                 670
Tyr Thr Thr Phe Glu Tyr Ser Asp Leu Arg Val Val Lys Lys Tyr Val
        675                 680                 685
Gln Pro Tyr Ser Pro Thr Thr Gly Thr Gly Ala Gln Ala Pro Ser Ile
    690                 695                 700
Gly Gln Pro Pro Ser Gln Asn Leu Asp Thr Tyr Lys Phe Pro Ala Thr
705                 710                 715                 720
Tyr Lys Tyr Ile Lys Thr Phe Ile Tyr Pro Tyr Leu Asn Ser Thr Val
                725                 730                 735
Ser Leu Arg Ala Ala Ser Lys Asp Pro Glu Tyr Gly Arg Thr Asp Phe
            740                 745                 750
Ile Pro Pro His Ala Arg Asp Gly Ser Pro Gln Pro Leu Asn Pro Ala
        755                 760                 765
Gly Asp Pro Val Ala Ser Gly Gly Asn Asn Met Leu Tyr Asp Glu Leu
    770                 775                 780
Tyr Glu Val Thr Ala Gln Ile Lys Asn Thr Gly Asp Val Ala Gly Asp
785                 790                 795                 800
Glu Val Val Gln Leu Tyr Val Asp Leu Gly Gly Asp Asn Pro Pro Arg
                805                 810                 815
Gln Leu Arg Asn Phe Asp Arg Phe Tyr Leu Leu Pro Gly Gln Ser Ser
            820                 825                 830
Thr Phe Arg Ala Thr Leu Thr Arg Arg Asp Leu Ser Asn Trp Asp Ile
        835                 840                 845
Glu Ala Gln Asn Trp Arg Val Thr Glu Ser Pro Lys Arg Val Tyr Val
    850                 855                 860
Gly Arg Ser Ser Arg Asp Leu Pro Leu Ser Ser Gln Leu Glu
865                 870                 875
<210>31
<211>2235
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>31
atgcgttacc gaacagcagc tgcgctggca cttgccactg ggccctttgc tagggcagac     60
agtcactcaa catcgggggc ctcggctgag gcagttgtac ctcctgcagg gactccatgg    120
ggaaccgcgt acgacaaggc gaaggccgca ttggcaaagc tcaatctcca agataaggtc    180
ggcatcgtga gcggtgtcgg ctggaacggc ggtccttgcg ttggaaacac atctccggcc    240
tccaagatca gctatccatc gctatgcctt caagacggac ccctcggtgt tcgatactcg    300
acaggcagca cagcctttac gccgggcgtt caagcggcct cgacgtggga tgtcaatttg    360
atccgcgaac gtggacagtt catcggtgag gaggtgaagg cctcggggat tcatgtcata    420
cttggtcctg tggctgggcc gctgggaaag actccgcagg gcggtcgcaa ctgggagggc   480
ttcggtgtcg atccatatct cacgggcatt gccatgggtc aaaccatcaa cggcatccag   540
tcggtaggcg tgcaggcgac agcgaagcac tatatcctca acgagcagga gctcaatcga   600
gaaaccattt cgagcaaccc agatgaccga actctccatg agctgtatac ttggccattt   660
gccgacgcgg ttcaggccaa tgtcgcttct gtcatgtgct cgtacaacaa ggtcaatacc   720
acctgggcct gcgaggatca gtacacgctg cagactgtgc tgaaagacca gctggggttc   780
ccaggctatg tcatgacgga ctggaacgca cagcacacga ctgtccaaag cgcgaattct   840
gggcttgaca tgtcaatgcc tggcacagac ttcaacggta acaatcggct ctggggtcca   900
gctctcacca atgcggtaaa tagcaatcag gtccccacga gcagagtcga cgatatggtg   960
actcgtatcc tcgccgcatg gtacttgaca ggccaggacc aggcaggcta tccgtcgttc  1020
aacatcagca gaaatgttca aggaaaccac aagaccaatg tcagggcaat tgccagggac  1080
ggcatcgttc tgctcaagaa tgacgccaac atcctgccgc tcaagaagcc cgctagcatt  1140
gccgtcgttg gatctgccgc aatcattggt aaccacgcca gaaactcgcc ctcgtgcaac  1200
gacaaaggct gcgacgacgg ggccttgggc atgggttggg gttccggcgc cgtcaactat  1260
ccgtacttcg tcgcgcccta cgatgccatc aataccagag cgtcttcgca gggcacccag  1320
gttaccttga gcaacaccga caacacgtcc tcaggcgcat ctgcagcaag aggaaaggac  1380
gtcgccatcg tcttcatcac cgccgactcg ggtgaaggct acatcaccgt ggagggcaac  1440
gcgggcgatc gcaacaacct ggatccgtgg cacaacggca atgccctggt ccaggcggtg  1500
gccggtgcca acagcaacgt cattgttgtt gtccactccg ttggcgccat cattctggag  1560
cagattcttg ctcttccgca ggtcaaggcc gttgtctggg cgggtcttcc ttctcaggag  1620
agcggcaatg cgctcgtcga cgtgctgtgg ggagatgtca gcccttctgg caagctggtg  1680
tacaccattg cgaagagccc caatgactat aacactcgca tcgtttccgg cggcagtgac  1740
agcttcagcg agggactgtt catcgactat aagcacttcg acgacgccaa tatcacgccg  1800
cggtacgagt tcggctatgg actgtcttac accaagttca actactcacg cctctccgtc  1860
ttgtcgaccg ccaagtctgg tcctgcgact ggggccgttg tgccgggagg cccgagtgat  1920
ctgttccaga atgtcgcgac agtcaccgtt gacatcgcaa actctggcca agtgactggt  1980
gccgaggtag cccagctgta catcacctac ccatcttcag cacccaggac ccctccgaag  2040
cagctgcgag gctttgccaa gctgaacctc acgcctggtc agagcggaac agcaacgttc  2100
aacatccgac gacgagatct cagctactgg gacacggctt cgcagaaatg ggtggtgccg  2160
tcggggtcgt ttggcatcag cgtgggagcg agcagccggg atatcaggct gacgagcact  2220
ctgtcggtag cgtag                                                   2235
<210>32
<211>744
<212>PRT
<213>里氏木霉(Trichoderma reesei)
<400>32
Met Arg Tyr Arg Thr Ala Ala Ala Leu Ala Leu Ala Thr Gly Pro Phe
1               5                   10                  15
Ala Arg Ala Asp Ser His Ser Thr Ser Gly Ala Ser Ala Glu Ala Val
            20                  25                  30
Val Pro Pro Ala Gly Thr Pro Trp Gly Thr Ala Tyr Asp Lys Ala Lys
        35                  40                  45
Ala Ala Leu Ala Lys Leu Asn Leu Gln Asp Lys Val Gly Ile Val Ser
    50                  55                  60
Gly Val Gly Trp Asn Gly Gly Pro Cys Val Gly Asn Thr Ser Pro Ala
65                  70                  75                  80
Ser Lys Ile Ser Tyr Pro Ser Leu Cys Leu Gln Asp Gly Pro Leu Gly
                85                  90                  95
Val Arg Tyr Ser Thr Gly Ser Thr Ala Phe Thr Pro Gly Val Gln Ala
            100                 105                 110
Ala Ser Thr Trp Asp Val Asn Leu Ile Arg Glu Arg Gly Gln Phe Ile
        115                 120                 125
Gly Glu Glu Val Lys Ala Ser Gly Ile His Val Ile Leu Gly Pro Val
    130                 135                 140
Ala Gly Pro Leu Gly Lys Thr Pro Gln Gly Gly Arg Asn Trp Glu Gly
145                 150                 155                 160
Phe Gly Val Asp Pro Tyr Leu Thr Gly Ile Ala Met Gly Gln Thr Ile
                165                 170                 175
Asn Gly Ile Gln Ser Val Gly Val Gln Ala Thr Ala Lys His Tyr Ile
            180                 185                 190
Leu Asn Glu Gln Glu Leu Asn Arg Glu Thr Ile Ser Ser Asn Pro Asp
        195                 200                 205
Asp Arg Thr Leu His Glu Leu Tyr Thr Trp Pro Phe Ala Asp Ala Val
    210                 215                 220
Gln Ala Asn Val Ala Ser Val Met Cys Ser Tyr Asn Lys Val Asn Thr
225                 230                 235                 240
Thr Trp Ala Cys Glu Asp Gln Tyr Thr Leu Gln Thr Val Leu Lys Asp
                245                 250                 255
Gln Leu Gly Phe Pro Gly Tyr Val Met Thr Asp Trp Asn Ala Gln His
            260                 265                 270
Thr Thr Val Gln Ser Ala Asn Ser Gly Leu Asp Met Ser Met Pro Gly
        275                 280                 285
Thr Asp Phe Asn Gly Asn Asn Arg Leu Trp Gly Pro Ala Leu Thr Asn
    290                 295                 300
Ala Val Asn Ser Asn Gln Val Pro Thr Ser Arg Val Asp Asp Met Val
305                 310                 315                 320
Thr Arg Ile Leu Ala Ala Trp Tyr Leu Thr Gly Gln Asp Gln Ala Gly
                325                 330                 335
Tyr Pro Ser Phe Asn Ile Ser Arg Asn Val Gln Gly Asn His Lys Thr
            340                 345                 350
Asn Val Arg Ala Ile Ala Arg Asp Gly Ile Val Leu Leu Lys Asn Asp
        355                 360                 365
Ala Asn Ile Leu Pro Leu Lys Lys Pro Ala Ser Ile Ala Val Val Gly
    370                 375                 380
Ser Ala Ala Ile Ile Gly Asn His Ala Arg Asn Ser Pro Ser Cys Asn
385                 390                 395                 400
Asp Lys Gly Cys Asp Asp Gly Ala Leu Gly Met Gly Trp Gly Ser Gly
                405                 410                 415
Ala Val Asn Tyr Pro Tyr Phe Val Ala Pro Tyr Asp Ala Ile Asn Thr
            420                 425                 430
Arg Ala Ser Ser Gln Gly Thr Gln Val Thr Leu Ser Asn Thr Asp Asn
        435                 440                 445
Thr Ser Ser Gly Ala Ser Ala Ala Arg Gly Lys Asp Val Ala Ile Val
    450                 455                 460
Phe Ile Thr Ala Asp Ser Gly Glu Gly Tyr Ile Thr Val Glu Gly Asn
465                 470                 475                 480
Ala Gly Asp Arg Asn Asn Leu Asp Pro Trp His Asn Gly Asn Ala Leu
                485                 490                 495
Val Gln Ala Val Ala Gly Ala Asn Ser Asn Val Ile Val Val Val His
            500                 505                 510
Ser Val Gly Ala Ile Ile Leu Glu Gln Ile Leu Ala Leu Pro Gln Val
        515                 520                 525
Lys Ala Val Val Trp Ala Gly Leu Pro Ser Gln Glu Ser Gly Asn Ala
    530                 535                 540
Leu Val Asp Val Leu Trp Gly Asp Val Ser Pro Ser Gly Lys Leu Val
545                 550                 555                 560
Tyr Thr Ile Ala Lys Ser Pro Asn Asp Tyr Asn Thr Arg Ile Val Ser
                565                 570                 575
Gly Gly Ser Asp Ser Phe Ser Glu Gly Leu Phe Ile Asp Tyr Lys His
            580                 585                 590
Phe Asp Asp Ala Asn Ile Thr Pro Arg Tyr Glu Phe Gly Tyr Gly Leu
        595                 600                 605
Ser Tyr Thr Lys Phe Ash Tyr Ser Arg Leu Ser Val Leu Ser Thr Ala
    610                 615                 620
Lys Ser Gly Pro Ala Thr Gly Ala Val Val Pro Gly Gly Pro Ser Asp
625                 630                 635                 640
Leu Phe Gln Asn Val Ala Thr Val Thr Val Asp Ile Ala Asn Ser Gly
                645                 650                 655
Gln Val Thr Gly Ala Glu Val Ala Gln Leu Tyr Ile Thr Tyr Pro Ser
            660                 665                 670
Ser Ala Pro Arg Thr Pro Pro Lys Gln Leu Arg Gly Phe Ala Lys Leu
        675                 680                 685
Asn Leu Thr Pro Gly Gln Ser Gly Thr Ala Thr Phe Asn Ile Arg Arg
    690                 695                 700
Arg Asp Leu Ser Tyr Trp Asp Thr Ala Ser Gln Lys Trp Val Val Pro
705                 710                 715                 720
Ser Gly Ser Phe Gly Ile Ser Val Gly Ala Ser Ser Arg Asp Ile Arg
                725                 730                 735
Leu Thr Ser Thr Leu Ser Val Ala
            740
<210>33
<211>29
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>33
aacgttaatt aaggaatcgt tttgtgttt    29
<210>34
<211>29
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>34
agtactagta gctccgtggc gaaagcctg    29
<210>35
<211>31
<212>DNA
<213>酿酒酵母(Saccharomyces cerevisiae)
<400>35
ttgaattgaa aatagattga tttaaaactt c                   31
<210>36
<211>25
<212>DNA
<213>酿酒酵母(Saccharomyces cerevisiae)
<400>36
ttgcatgcgt aatcatggtc atagc                          25
<210>37
<211>26
<212>DNA
<213>酿酒酵母(Saccharomyces cerevisiae)
<400>37
ttgaattcat gggtaataac tgatat                         26
<210>38
<211>32
<212>DNA
<213>酿酒酵母(Saccharomyces cerevisiae)
<400>38
aaatcaatct attttcaatt caattcatca tt                  32
<210>39
<211>11
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>39
gtactaaaac c                                         11
<210>40
<211>11
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>40
ccgttaaatt t                                         11
<210>41
<211>45
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>41
ggatgctgtt gactccggaa atttaacggt ttggtcttgc atccc    45
<210>42
<211>14
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>42
atgcaattta aact                                      14
<210>43
<211>14
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>43
cggcaattta acgg                                      14
<210>44
<211>44
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>44
ggtattgtcc tgcagacggc aatttaacgg cttctgcgaa tcgc    44
<210>45
<211>29
<212>DNA
<213>特异腐质霉(Humicola insolens)
<400>45
aagcttaagc atgcgttcct cccccctcc                     29
<210>46
<211>32
<212>DNA
<213>特异腐质霉(Humicola insolens)
<400>46
ctgcagaatt ctacaggcac tgatggtacc ag                 32
<210>47
<211>32
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>47
ctgcagaatt ctacaggcac tgatggtacc ag                 32
<210>48
<211>36
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>48
accgcggact gcgcatcatg cgttcctccc ccctcc             36
<210>49
<211>29
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>49
aaacgtcgac cgaatgtagg attgttatc                     29
<210>50
<211>17
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>50
gatgcgcagt ccgcggt                                  17
<210>51
<211>29
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>51
aaacgtcgac cgaatgtagg attgttatc                     29
<210>52
<211>36
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>52
ggagggggga ggaacgcatg atgcgcagtc cgcggt             36
<210>53
<211>29
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>53
aaacgtcgac cgaatgtagg at tgttatc                                   29
<210>54
<211>32
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>54
ctgcagaatt ctacaggcac tgatggtacc ag                                32
<210>55
<211>46
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>55
atagtcaacc gcggactgcg catcatgaag cttggttgga tcgagg                 46
<210>56
<211>26
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>56
actagtttac tgggccttag gcagcg                                       26
<210>57
<211>26
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>57
gtcgactcga agcccgaatg taggat                                       26
<210>58
<211>45
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>58
cctcgatcca accaagcttc atgatgcgca gtccgcggtt gacta                  45
<210>59
<211>57
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>59
atgaagcttg gttggatcga ggtggccgca ttggcggct g cctcagtagt cagtgcc    57
<210>60
<211>19
<212>PRT
<213>米曲霉(Aspergillus oryzae)
<400>60
Met Lys Leu Gly Trp Ile Glu Val Ala Ala Leu Ala Ala Ala Ser Val
1               5                   10                  15
Val Ser Ala
<210>61
<211>42
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>61
tgccggtgtt ggcccttgcc aaggatgatc tcgcgtactc cc                       42
<210>62
<211>28
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>62
gactagtctt actgggcctt aggcagcg                                       28
<210>63
<211>63
<212>DNA
<213>特异腐质霉(Humicola insolens)
<400>63
atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt    60
gcc                                                                  63
<210>64
<211>21
<212>PRT
<213>特异腐质霉(Humicola insolens)
<400>64
Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro
1               5                   10                  15
Val Leu Ala Leu Ala
            20
<210>65
<211>30
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>65
acgcgtcgac cgaatgtagg attgttatcc                                     30
<210>66
<211>42
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>66
gggagtacgc gagatcatcc ttggcaaggg ccaacaccgg ca                       42
<210>67
<211>20
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>67
cccaagctta gccaagaaca                                                20
<210>68
<211>29
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>68
gggggaggaa cgcatgggat ctggacggc                                      29
<210>69
<211>30
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>69
gccgtccaga tccccatgcg ttcctccccc                                     30
<210>70
<211>20
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>70
ccaagcttgt tcagagtttc                                                20
<210>71
<211>20
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>71
ggactgcgca gcatgcgttc                                                20
<210>72
<211>30
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>72
agttaattaa ttactgggcc ttaggcagcg                                     30
<210>73
<211>3294
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>73
atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt    60
gccgctgatg gcaggtccac ccgctactgg gactgctgca agccttcgtg cggctgggcc   120
aagaaggctc ccgtgaacca gcctgtcttt tcctgcaacg ccaacttcca gcgtatcacg   180
gacttcgacg ccaagtccgg ctgcgagccg ggcggtgtcg cctactcgtg cgccgaccag   240
accccatggg ctgtgaacga cgacttcgcg ctcggttttg ctgccacctc tattgccggc   300
agcaatgagg cgggctggtg ctgcgcctgc tacgagctca ccttcacatc cggtcctgtt   360
gctggcaaga agatggtcgt ccagtccacc agcactggcg gtgatcttgg cagcaaccac   420
ttcgatctca acatccccgg cggcggcgtc ggcatcttcg acggatgcac tccccagttc   480
ggtggtctgc ccggccagcg ctacggcggc atctcgtccc gcaacgagtg cgatcggttc   540
cccgacgccc tcaagcccgg ctgctactgg cgcttcgact ggttcaagaa cgccgacaat   600
ccgagcttca gcttccgtca ggtccagtgc ccagccgagc tcgtcgctcg caccggatgc   660
cgccgcaacg acgacggcaa cttccctgcc gtccagatcc ccatgcgttc ctcccccctc   720
ctccgctccg ccgttgtggc cgccctgccg gtgttggccc ttgccaagga tgatctcgcg   780
tactcccctc ctttctaccc ttccccatgg gcagatggtc agggtgaatg ggcggaagta   840
tacaaacgcg ctgtagacat agtttcccag atgacgttga cagagaaagt caacttaacg   900
actggaacag gatggcaact agagaggtgt gttggacaaa ctggcagtgt tcccagactc   960
aacatcccca gcttgtgttt gcaggatagt cctcttggta ttcgtttctc ggactacaat  1020
tcagctttcc ctgcgggtgt taatgtcgct gccacctggg acaagacgct cgcctacctt  1080
cgtggtcagg caatgggtga ggagttcagt gataagggta ttgacgttca gctgggtcct  1140
gctgctggcc ctctcggtgc tcatccggat ggcggtagaa actgggaagg tttctcacca  1200
gatccagccc tcaccggtgt actttttgcg gagacgatta agggtattca agatgctggt  1260
gtcattgcga cagctaagca ttatatcatg aacgaacaag agcatttccg ccaacaaccc  1320
gaggctgcgg gttacggatt caacgtaagc gacagtttga gttccaacgt tgatgacaag  1380
actatgcatg aattgtacct ctggcccttc gcggatgcag tacgcgctgg agtcggtgct  1440
gtcatgtgct cttacaacca aatcaacaac agctacggtt gcgagaatag cgaaactctg  1500
aacaagcttt tgaaggcgga gcttggtttc caaggcttcg tcatgagtga ttggaccgct  1560
catcacagcg gcgtaggcgc tgctttagca ggtctggata tgtcgatgcc cggtgatgtt  1620
accttcgata gtggtacgtc tttctggggt gcaaacttga cggtcggtgt ccttaacggt  1680
acaatccccc aatggcgtgt tgatgacatg gctgtccgta tcatggccgc ttattacaag  1740
gttggccgcg acaccaaata cacccctccc aacttcagct cgtggaccag ggacgaatat  1800
ggtttcgcgc ataaccatgt ttcggaaggt gcttacgaga gggtcaacga attcgtggac  1860
gtgcaacgcg atcatgccga cctaatccgt cgcatcggcg cgcagagcac tgttctgctg  1920
aagaacaagg gtgccttgcc cttgagccgc aaggaaaagc tggtcgccct tctgggagag  1980
gatgcgggtt ccaactcgtg gggcgctaac ggctgtgatg accgtggttg cgataacggt  2040
acccttgcca tggcctgggg tagcggtact gcgaatttcc catacctcgt gacaccagag  2100
caggcgattc agaacgaagt tcttcagggc cgtggtaatg tcttcgccgt gaccgacagt  2160
tgggcgctcg acaagatcgc tgcggctgcc cgccaggcca gcgtatctct cgtgttcgtc  2220
aactccgact caggagaagg ctatcttagt gtggatggaa atgagggcga tcgtaacaac  2280
atcactctgt ggaagaacgg cgacaatgtg gtcaagaccg cagcgaataa ctgtaacaac  2340
accgttgtca tcatccactc cgtcggacca gttttgatcg atgaatggta tgaccacccc  2400
aatgtcactg gtattctctg ggctggtctg ccaggccagg agtctggtaa ctccattgcc  2460
gatgtgctgt acggtcgtgt caaccctggc gccaagtctc ctttcacttg gggcaagacc  2520
cgggagtcgt atggttctcc cttggtcaag gatgccaaca atggcaacgg agcgccccag  2580
tctgatttca cccagggtgt tttcatcgat taccgccatt tcgataagtt caatgagacc  2640
cctatctacg agtttggcta cggcttgagc tacaccacct tcgagctctc cgacctccat  2700
gttcagcccc tgaacgcgtc ccgatacact cccaccagtg gcatgactga agctgcaaag  2760
aactttggtg aaattggcga tgcgtcggag tacgtgtatc cggaggggct ggaaaggatc  2820
catgagttta tctatccctg gatcaactct accgacctga aggcatcgtc tgacgattct  2880
aactacggct gggaagactc caagtatatt cccgaaggcg ccacggatgg gtctgcccag  2940
ccccgtttgc ccgctagtgg tggtgccgga ggaaaccccg gtctgtacga ggatcttttc  3000
cgcgtctctg tgaaggtcaa gaacacgggc aatgtcgccg gtgatgaagt tcctcagctg  3060
tacgtttccc taggcggccc gaatgagccc aaggtggtac tgcgcaagtt tgagcgtatt  3120
cacttggccc cttcgcagga ggccgtgtgg acaacgaccc ttacccgtcg tgaccttgca  3180
aactgggacg tttcggctca ggactggacc gtcactcctt accccaagac gatctacgtt  3240
ggaaactcct cacggaaact gccgctccag gcctcgctgc ctaaggccca gtaa        3294
<210>74
<211>1097
<212>PRT
<213>米曲霉(Aspergillus oryzae)
<400>74
Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro
1               5                   10                  15
Val Leu Ala Leu Ala Ala Asp Gly Arg Ser Thr Arg Tyr Trp Asp Cys
            20                  25                  30
Cys Lys Pro Ser Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro
        35                  40                  45
Val Phe Ser Cys Asn Ala Asn Phe Gln Arg Ile Thr Asp Phe Asp Ala
    50                  55                  60
Lys Ser Gly Cys Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln
65                  70                  75                  80
Thr Pro Trp Ala Val Asn Asp Asp Phe Ala Leu Gly Phe Ala Ala Thr
                85                  90                  95
Ser Ile Ala Gly Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Glu
            100                 105                 110
Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln
        115                 120                 125
Ser Thr Ser Thr Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn
    130                 135                 140
Ile Pro Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe
145                 150                 155                 160
Gly Gly Leu Pro Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu
                165                 170                 175
Cys Asp Arg Phe Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe
            180                 185                 190
Asp Trp Phe Lys Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val
        195                 200                 205
Gln Cys Pro Ala Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp
    210                 215                 220
Asp Gly Asn Phe Pro Ala Val Gln Ile Pro Met Arg Ser Ser Pro Leu
225                 230                 235                 240
Leu Arg Ser Ala Val Val Ala Ala Leu Pro Val Leu Ala Leu Ala Lys
                245                 250                 255
Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser Pro Trp Ala Asp
            260                 265                 270
Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala Val Asp Ile Val
        275                 280                 285
Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr Thr Gly Thr Gly
    290                 295                 300
Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser Val Pro Arg Leu
305                 310                 315                 320
Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu Gly Ile Arg Phe
                325                 330                 335
Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn Val Ala Ala Thr
            340                 345                 350
Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala Met Gly Glu Glu
        355                 360                 365
Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro Ala Ala Gly Pro
    370                 375                 380
Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu Gly Phe Ser Pro
385                 390                 395                 400
Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr Ile Lys Gly lle
                405                 410                 415
Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr Ile Met Asn Glu
            420                 425                 430
Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly Tyr Gly Phe Asn
        435                 440                 445
Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys Thr Met His Glu
    450                 455                 460
Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala Gly Val Gly Ala
465                 470                 475                 480
Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly Cys Glu Asn
                485                 490                 495
Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu Gly Phe Gln Gly
            500                 505                 510
Phe Val Met Ser Asp Trp Thr Ala His His Ser Gly Val Gly Ala Ala
        515                 520                 525
Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val Thr Phe Asp Ser
    530                 535                 540
Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly Val Leu Asn Gly
545                 550                 555                 560
Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val Arg Ile Met Ala
                565                 570                 575
Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr Pro Pro Asn Phe
            580                 585                 590
Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His Asn His Val Ser
        595                 600                 605
Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp Val Gln Arg Asp
    610                 615                 620
His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser Thr Val Leu Leu
625                 630                 635                 640
Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu Lys Leu Val Ala
                645                 650                 655
Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly Ala Asn Gly Cys
            660                 665                 670
Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Ala Trp Gly Ser
        675                 680                 685
Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu Gln Ala Ile Gln
    690                 695                 700
Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala Val Thr Asp Ser
705                 710                 715                 720
Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln Ala Ser Val Ser
                725                 730                 735
Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr Leu Ser Val Asp
            740                 745                 750
Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp Lys Asn Gly Asp
        755                 760                 765
Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn Thr Val Val Ile
    770                 775                 780
Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp Tyr Asp His Pro
785                 790                 795                 800
Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly Gln Glu Ser Gly
                805                 810                 815
Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn Pro Gly Ala Lys
            820                 825                 830
Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr Gly Ser Pro Leu
        835                 840                 845
Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln Ser Asp Phe Thr
    850                 855                 860
Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys Phe Asn Glu Thr
865                 870                 875                 880
Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr Thr Phe Glu Leu
                885                 890                 895
Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg Tyr Thr Pro Thr
            900                 905                 910
Ser Gly Met Thr Glu Ala Ala Lys Ash Phe Gly Glu Ile Gly Asp Ala
        915                 920                 925
Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile His Glu Phe Ile
    930                 935                 940
Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser Ser Asp Asp Ser
945                 950                 955                 960
Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu Gly Ala Thr Asp
                965                 970                 975
Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly Ala Gly Gly Asn
            980                 985                 990
Pro Gly Leu Tyr Glu Asp Leu Phe  Arg Val Ser Val Lys  Val Lys Asn
        995                 1000                 1005
Thr Gly  Asn Val Ala Gly Asp  Glu Val Pro Gln Leu  Tyr Val Ser
    1010                 1015                 1020
Leu Gly  Gly Pro Asn Glu Pro  Lys Val Val Leu Arg  Lys Phe Glu
    1025                 1030                 1035
Arg Ile  His Leu Ala Pro Ser  Gln Glu Ala Val Trp  Thr Thr Thr
    1040                 1045                 1050
Leu Thr  Arg Arg Asp Leu Ala  Asn Trp Asp Val Ser  Ala Gln Asp
    1055                 1060                 1065
Trp Thr  Val Thr Pro Tyr Pro  Lys Thr Ile Tyr Val  Gly Asn Ser
    1070                 1075                 1080
Ser Arg  Lys Leu Pro Leu Gln  Ala Ser Leu Pro Lys  Ala Gln
    1085                 1090                 1095
<210>75
<211>3294
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>75
atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt     60
gccgctgatg gcaggtccac ccgctactgg gactgctgca agccttcgtg cggctgggcc    120
aagaaggctc ccgtgaacca gcctgtcttt tcctgcaacg ccaacttcca gcgtatcacg    180
gacttcgacg ccaagtccgg ctgcgagccg ggcggtgtcg cctactcgtg cgccgaccag    240
accccatggg ctgtgaacga cgacttcgcg ctcggttttg ctgccacctc tatt gccggc   300
agcaatgagg cgggctggtg ctgcgcctgc tacgagctca ccttcacatc cggtcctgtt    360
gctggcaaga agatggtcgt ccagtccacc agcactggcg gtgatcttgg cagcaaccac    420
ttcgatctca acatccccgg cggcggcgtc ggcatcttcg acggatgcac tccccagttc    480
ggtggtctgc ccggccagcg ctacggcggc atctcgtccc gcaacgagtg cgatcggttc    540
cccgacgccc tcaagcccgg ctgctactgg cgcttcgact ggttcaagaa cgccgacaat    600
ccgagcttca gcttccgtca ggtccagtgc ccagccgagc tcgtcgctcg caccggatgc    660
cgccgcaacg acgacggcaa cttccctgcc gtccagatcc ccatgcgttc ctcccccctc    720
ctccgctccg ccgttgtggc cgccctgccg gtgttggccc ttgccaagga tgatctcgcg    780
tactcccctc ctttctaccc ttccccatgg gcagatggtc agggtgaatg ggcggaagta    840
tacaaacgcg ctgtagacat agtttcccag atgacgttga cagagaaagt caacttaacg    900
actggaacag gatggcaact agagaggtgt gttggacaaa ctggcagtgt tcccagactc    960
aacatcccca gcttgtgttt gcaggatagt cctcttggta ttcgtttctc ggactacaat   1020
tcagctttcc ctgcgggtgt taatgtcgct gccacctggg acaagacgct cgcctacctt   1080
cgtggtcagg caatgggtga ggagttcagt gataagggta ttgacgttca gctgggtcct   1140
gctgctggcc ctctcggtgc tcatccggat ggcggtagaa actgggaaag tttctcacca   1200
gatccagccc tcaccggtgt actttttgcg gagacgatta agggtattca agatgctggt   1260
gtcattgcga cagctaagca ttatatcatg aacgaacaag agcatttccg ccaacaaccc   1320
gaggctgcgg gttacggatt caacgtaagc gacagtttga gttccaacgt tgatgacaag   1380
actatgcatg aattgtacct ctggcccttc gcggatgcag tacgcgctgg agtcggtgct   1440
gttatgtgct cttacaacca aatcaacaac agctacggtt gcgagaatag cgaaactctg   1500
aacaagcttt tgaaggcgga gcttggtttc caaggcttcg tcatgagtga ttggaccgct   1560
caacacagcg gcgtaggcgc tgctttagca ggtctggata tgtcgatgcc cggtgatgtt   1620
accttcgata gtggtacgtc tttctggggt gcaaacttga cggtcggtgt ccttaacggt   1680
acaatccccc aatggcgtgt tgatgacatg gctgtccgta tcatggccgc ttattacaag   1740
gttggccgcg acaccaaata cacccctccc aacttcagct cgtggaccag ggacgaatat   1800
ggtttcgcgc ataaccatgt ttcggaaggt gcttacgaga gggtcaacga attcgtggac   1860
gtgcaacgcg atcatgccga cctaatccgt cgcatcggcg cgcagagcac tgttctgctg   1920
aagaacaagg gtgccttgcc cttgagccgc aaggaaaagc tggtcgccct tctgggagag   1980
gatgcgggtt ccaactcgtg gggcgctaac ggctgtgatg accgtggttg cgataacggt   2040
acccttgcca tggcctgggg tagcggtact gcgaatttcc catacctcgt gacaccagag   2100
caggcgattc agaacgaagt tcttcagggc cgtggtaatg tcttcgccgt gaccgacagt   2160
tgggcgctcg acaagatcgc tgcggctgcc cgccaggcca gcgtatctct cgtgttcgtc   2220
aactccgact caggagaagg ctatcttagt gtggatggaa atgagggcga tcgtaacaac   2280
atcactctgt ggaagaacgg cgacaatgtg gtcaagaccg cagcgaataa ctgtaacaac   2340
accgttgtca tcatccactc cgtcggacca gttttgatcg atgaatggta tgaccacccc   2400
aatgtcactg gtattctctg ggctggtctg ccaggccagg agtctggtaa ctccattgcc   2460
gatgtgctgt acggtcgtgt caaccctggc gccaagtctc ctttcacttg gggcaagacc   2520
cgggagtcgt atggttctcc cttggtcaag gatgccaaca atggcaacgg agcgccccag   2580
tctgatttca cccagggtgt tttcatcgat taccgccatt tcgataagtt caatgagacc   2640
cctatctacg agtttggcta cggcttgagc tacaccacct tcgagctctc cgacctccat   2700
gttcagcccc tgaacgcgtc ccgatacact cccaccagtg gcatgactga agctgcaaag   2760
aactttggtg aaattggcga tgcgtcggag tacgtgtatc cggaggggct ggaaaggatc   2820
catgagttta tctatccctg gatcaactct accgacctga aggcatcgtc tgacgattct   2880
aactacggct gggaagactc caagtatatt cccgaaggcg ccacggatgg gtctgcccag   2940
ccccgtttgc ccgctagtgg tggtgccgga ggaaaccccg gtctgtacga ggatcttttc   3000
cgcgtctctg tgaaggtcaa gaacacgggc aatgtcgccg gtgatgaagt tcctcagctg   3060
tacgtttccc taggcggccc gaatgagccc aaggtggtac tgcgcaagtt tgagcgtatt   3120
cacttggccc cttcgcagga ggccgtgtgg acaacgaccc ttacccgtcg tgaccttgca  3180
aactgggacg tttcggctca ggactggacc gtcactcctt accccaagac gatctacgtt  3240
ggaaactcct cacggaaact gccgctccag gcctcgctgc ctaaggccca gtaa        3294
<210>76
<211>1097
<212>PRT
<213>米曲霉(Aspergillus oryzae)
<400>76
Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro
1               5                   10                  15
Val Leu Ala Leu Ala Ala Asp Gly Arg Ser Thr Arg Tyr Trp Asp Cys
            20                  25                  30
Cys Lys Pro Ser Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro
        35                  40                  45
Val Phe Ser Cys Asn Ala Asn Phe Gln Arg Ile Thr Asp Phe Asp Ala
    50                  55                  60
Lys Ser Gly Cys Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln
65                  70                  75                  80
Thr Pro Trp Ala Val Asn Asp Asp Phe Ala Leu Gly Phe Ala Ala Thr
                85                  90                  95
Ser Ile Ala Gly Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Glu
            100                 105                 110
Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln
        115                 120                 125
Ser Thr Ser Thr Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn
    130                 135                 140
Ile Pro Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe
145                 150                 155                 160
Gly Gly Leu Pro Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu
                165                 170                 175
Cys Asp Arg Phe Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe
            180                 185                 190
Asp Trp Phe Lys Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val
        195                 200                 205
Gln Cys Pro Ala Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp
    210                 215                 220
Asp Gly Asn Phe Pro Ala Val Gln Ile Pro Met Arg Ser Ser Pro Leu
225                 230                 235                 240
Leu Arg Ser Ala Val Val Ala Ala Leu Pro Val Leu Ala Leu Ala Lys
                245                 250                 255
Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser Pro Trp Ala Asp
            260                 265                 270
Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala Val Asp Ile Val
        275                 280                 285
Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr Thr Gly Thr Gly
    290                 295                 300
Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser Val Pro Arg Leu
305                 310                 315                 320
Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu Gly Ile Arg Phe
                325                 330                 335
Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn Val Ala Ala Thr
            340                 345                 350
Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala Met Gly Glu Glu
        355                 360                 365
Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro Ala Ala Gly Pro
    370                 375                 380
Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu Ser Phe Ser Pro
385                 390                 395                 400
Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr Ile Lys Gly Ile
                405                 410                 415
Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr Ile Met Asn Glu
            420                 425                 430
Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly Tyr Gly Phe Asn
        435                 440                 445
Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys Thr Met His Glu
    450                 455                 460
Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala Gly Val Gly Ala
465                 470                 475                 480
Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly Cys Glu Asn
                485                 490                 495
Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu Gly Phe Gln Gly
            500                 505                 510
Phe Val Met Ser Asp Trp Thr Ala Gln His Ser Gly Val Gly Ala Ala
        515                 520                 525
Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val Thr Phe Asp Ser
    530                 535                 540
Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly Val Leu Asn Gly
545                 550                 555                 560
Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val Arg Ile Met Ala
                565                 570                 575
Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr Pro Pro Asn Phe
            580                 585                 590
Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His Asn His Val Ser
        595                 600                 605
Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp Val Gln Arg Asp
    610                 615                 620
His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser Thr Val Leu Leu
625                 630                 635                 640
Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu Lys Leu Val Ala
                645                 650                 655
Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly Ala Asn Gly Cys
            660                 665                 670
Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Ala Trp Gly Ser
        675                 680                 685
Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu Gln Ala Ile Gln
    690                 695                 700
Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala Val Thr Asp Ser
705                 710                 715                 720
Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln Ala Ser Val Ser
                725                 730                 735
Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr Leu Ser Val Asp
            740                 745                 750
Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp Lys Asn Gly Asp
        755                 760                 765
Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn Thr Val Val Ile
    770                 775                     780
Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp Tyr Asp His Pro
785                 790                 795                 800
Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly Gln Glu Ser Gly
                805                 810                 815
Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn Pro Gly Ala Lys
            820                 825                 830
Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr Gly Ser Pro Leu
        835                 840                 845
Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln Ser Asp Phe Thr
    850                 855                 860
Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys Phe Asn Glu Thr
865                 870                 875                 880
Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr Thr Phe Glu Leu
                885                 890                 895
Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg Tyr Thr Pro Thr
            900                 905                 910
Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu Ile Gly Asp Ala
        915                 920                 925
Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile His Glu Phe Ile
    930                 935                 940
Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser Ser Asp Asp Ser
945                 950                 955                 960
Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu Gly Ala Thr Asp
                965                 970                 975
Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly Ala Gly Gly Asn
            980                 985                 990
Pro Gly Leu Tyr Glu Asp Leu Phe  Arg Val Ser Val Lys  Val Lys Asn
        995                 1000                 1005
Thr Gly  Asn Val Ala Gly Asp  Glu Val Pro Gln Leu  Tyr Val Ser
    1010                 1015                 1020
Leu Gly  Gly Pro Asn Glu Pro  Lys Val Val Leu Arg  Lys Phe Glu
    1025                 1030                 1035
Arg Ile  His Leu Ala Pro Ser  Gln Glu Ala Val Trp  Thr Thr Thr
    1040                 1045                 1050
Leu Thr  Arg Arg Asp Leu Ala  Asn Trp Asp Val Ser  Ala Gln Asp
    1055                 1060                 1065
Trp Thr  Val Thr Pro Tyr Pro  Lys Thr Ile Tyr Val  Gly Asn Ser
    1070                 1075                 1080
Ser Arg  Lys Leu Pro Leu Gln  Ala Ser Leu Pro Lys  Ala Gln
    1085                 1090                 1095

Claims (56)

1.用于产生具有生物学活性的分泌型多肽的方法,该方法包括:
(a)用编码融合蛋白的融合蛋白构建体转化真菌宿主细胞,其中所述融合蛋白构建体包含:
(i)包含编码信号肽的核苷酸序列的第一多核苷酸;
(ii)包含编码内切葡聚糖酶的至少催化结构域或其部分的核苷酸序列的第二多核苷酸;和
(iii)包含编码具有生物学活性之多肽的至少催化结构域或其部分的核苷酸序列的第三多核苷酸;
其中所述信号肽和所述内切葡聚糖酶的至少催化结构域或其部分与不存在所述内切葡聚糖酶的至少催化结构域或其部分时相比提高所述具有生物学活性之多肽或其部分的分泌;
(b)在适于所述融合蛋白产生的条件下培养所述经过转化的真菌宿主细胞;和
(c)自所述培养基回收融合蛋白、其构件、或它们的组合,其中所述融合蛋白或其构件具有生物学活性。
2.权利要求1的方法,其中所述第一多核苷酸的3’端可操作连接于所述第二多核苷酸的5’端且所述第二多核苷酸的3’端可操作连接于所述第三多核苷酸的5’端,或者所述第一多核苷酸的3’端可操作连接于所述第三多核苷酸的5’端且所述第三多核苷酸的3’端可操作连接于所述第二多核苷酸的5’端,以编码融合蛋白。
3.权利要求1或2的方法,其中所述编码信号肽的第一多核苷酸得自特异腐质霉CEL45内切葡聚糖酶基因(cel45)。
4.权利要求1-3任一项的方法,其中所述包含编码内切葡聚糖酶的至少催化结构域或其部分的核苷酸序列的第二多核苷酸得自特异腐质霉CEL45内切葡聚糖酶基因(cel45)。
5.权利要求1-3任一项的方法,其中所述包含编码内切葡聚糖酶的至少催化结构域或其部分的核苷酸序列的第二多核苷酸得自编码包含如下氨基酸序列的内切葡聚糖酶的基因,所述氨基酸序列与SEQ ID NO:2具有至少70%、优选至少75%、更优选至少80%、甚至更优选至少85%、最优选至少90%、且甚至最优选至少95%同一性。
6.权利要求1-5任一项的方法,其中所述融合蛋白构建体进一步包含编码碳水化合物结合模块的多核苷酸。
7.权利要求1-6任一项的方法,其中所述第二多核苷酸编码内切葡聚糖酶的催化结构域或其部分、成熟多肽、或全长多肽。
8.权利要求1-7任一项的方法,其中所述第三多核苷酸编码具有生物学活性之多肽的催化结构域或其部分、成熟多肽、或全长多肽。
9.权利要求1-8任一项的方法,其中所述融合蛋白构建体进一步包含位于所述编码内切葡聚糖酶的至少催化结构域或其部分的核苷酸序列与所述编码具有生物学活性之多肽的至少催化结构域或其部分的核苷酸序列之间的、编码接头的多核苷酸,或者还有位于所述编码内切葡聚糖酶的至少催化结构域或其部分的核苷酸序列与所述编码具有生物学活性之多肽的至少催化结构域或其部分的核苷酸序列之间的、编码切割位点的多核苷酸。
10.权利要求1-9任一项的方法,其中所述融合蛋白构建体进一步包含编码第二信号肽的第四多核苷酸。
11.权利要求10的方法,其中所述第四多核苷酸3’端可操作连接所述第二多核苷酸的5’端或所述第三多核苷酸的5’端。
12.权利要求1-11任一项的方法,其中所述融合蛋白构建体进一步包含启动子和/或终止子。
13.权利要求12的方法,其中所述启动子驱动所述第一、第二、和第三、或者还有第四多核苷酸的表达。
14.权利要求1-13任一项的方法,其中所述具有生物学活性之多肽是抗体、抗原、抗微生物肽、酶、生长因子、激素、免疫扩张剂、神经递质、受体、报道蛋白、或结构蛋白。
15.权利要求1-14任一项的方法,其中所述具有生物学活性之多肽是氧化还原酶、转移酶、水解酶、裂合酶、异构酶、或连接酶。
16.权利要求1-15任一项的方法,其中所述具有生物学活性之多肽是纤维素分解酶或半纤维素分解酶。
17.权利要求16的方法,其中所述纤维素分解酶是β-葡糖苷酶。
18.权利要求17的方法,其中所述β-葡糖苷酶包含如下氨基酸序列,所述氨基酸序列与SEQ ID NO:24具有至少70%、优选至少75%、更优选至少80%、甚至更优选至少85%、最优选至少90%、且甚至最优选至少95%同一性,或者是包含如下氨基酸序列的变体β-葡糖苷酶,所述氨基酸序列与SEQID NO:35具有至少70%、优选至少75%、更优选至少80%、甚至更优选至少85%、最优选至少90%、且甚至最优选至少95%同一性。
19.权利要求1-18任一项的方法,其中所述融合蛋白、其构件或它们的组合具有纤维素水解活性或半纤维素水解活性。
20.一种分离的融合蛋白,该融合蛋白包含:
(a)包含信号肽的第一氨基酸序列;
(b)包含内切葡聚糖酶的至少催化结构域或其部分的第二氨基酸序列;和
(c)包含具有生物学活性之多肽的至少催化结构域或其部分的第三氨基酸序列。
21.权利要求20的融合蛋白,其中所述第一氨基酸序列的C端以符合读码框的方式连接所述第二氨基酸序列的N端且所述第二氨基酸序列的C端以符合读码框的方式连接所述第三氨基酸序列的N端,或者所述第一氨基酸序列的C端以符合读码框的方式连接所述第三氨基酸序列的N端且所述第三氨基酸序列的C端以符合读码框的方式连接所述第二氨基酸序列的N端。
22.权利要求20或21的融合蛋白,其中所述包含信号肽的第一氨基酸序列得自特异腐质霉CEL45内切葡聚糖酶。
23.权利要求20-22任一项的融合蛋白,其中所述包含内切葡聚糖酶的至少催化结构域的第二氨基酸序列得自特异腐质霉CEL45内切葡聚糖酶。
24.权利要求20-22任一项的融合蛋白,其中所述包含内切葡聚糖酶的至少催化结构域的第二氨基酸序列得自包含如下氨基酸序列的内切葡聚糖酶,所述氨基酸序列与SEQ ID NO:2具有至少70%、优选至少75%、更优选至少80%、甚至更优选至少85%、最优选至少90%、且甚至最优选至少95%同一性。
25.权利要求20-24任一项的融合蛋白,该融合蛋白进一步包含碳水化合物结合模块。
26.权利要求20-25任一项的融合蛋白,其中所述第二氨基酸序列包含内切葡聚糖酶的催化结构域或其部分、成熟多肽、或全长多肽。
27.权利要求20-26任一项的融合蛋白,其中所述第三氨基酸序列包含具有生物学活性之多肽的催化结构域或其部分、成熟多肽、或全长多肽。
28.权利要求20-27任一项的融合蛋白,该融合蛋白进一步包含位于所述内切葡聚糖酶的至少催化结构域或其部分与所述具有生物学活性之多肽的至少催化结构域或其部分之间的接头,或者还有位于所述内切葡聚糖酶的至少催化结构域或其部分与所述具有生物学活性之多肽的至少催化结构域或其部分之间的切割位点。
29.权利要求20-28任一项的融合蛋白,该融合蛋白进一步包含含有第二信号肽的第四氨基酸序列。
30.权利要求20-29任一项的融合蛋白,其中所述第二信号肽以符合读码框的方式连接所述包含具有生物学活性之多肽的至少催化结构域或其部分的氨基酸序列的N端或所述包含内切葡聚糖酶的至少催化结构域或其部分的氨基酸序列的N端。
31.权利要求20-30任一项的融合蛋白,其中所述具有生物学活性之多肽是抗体、抗原、抗微生物肽、酶、生长因子、激素、免疫扩张剂、神经递质、受体、报道蛋白、或结构蛋白。
32.权利要求20-31任一项的融合蛋白,其中所述具有生物学活性之多肽是氧化还原酶、转移酶、水解酶、裂合酶、异构酶、或连接酶。
33.权利要求20-32任一项的融合蛋白,其中所述具有生物学活性之多肽是纤维素分解酶或半纤维素分解酶。
34.权利要求33的融合蛋白,其中所述纤维素分解酶是β-葡糖苷酶。
35.权利要求34的融合蛋白,其中所述β-葡糖苷酶包含如下氨基酸序列,所述氨基酸序列与SEQ ID NO:24具有至少70%、优选至少75%、更优选至少80%、甚至更优选至少85%、最优选至少90%、且甚至最优选至少95%同一性,或者是包含如下氨基酸序列的变体β-葡糖苷酶,所述氨基酸序列与SEQID NO:35具有至少70%、优选至少75%、更优选至少80%、甚至更优选至少85%、最优选至少90%、且甚至最优选至少95%同一性。
36.权利要求34的融合蛋白,其中所述β-葡糖苷酶是SEQ ID NO:24或SEQ ID NO:35。
37.权利要求20-36任一项的融合蛋白,该融合蛋白是β-葡糖苷酶融合蛋白或其构件。
38.权利要求37的融合蛋白,该融合蛋白包含SEQ ID NO:74或SEQ IDMO:76。
39.权利要求38的融合蛋白,其中SEQ ID NO:74由SEQ ID NO:73编码而SEQ ID NO:76由SEQ ID NO:75编码。
40.权利要求20-40任一项的融合蛋白,其中所述融合蛋白、其构件或它们的组合具有纤维素水解活性或半纤维素水解活性。
41.一种分离的多核苷酸,该多核苷酸编码权利要求20-40任一项的融合蛋白。
42.一种融合蛋白构建体,该融合蛋白构建体包含权利要求41的多核苷酸。
43.一种表达载体,该表达载体包含权利要求42的融合蛋白构建体。
44.一种真菌宿主细胞,该真菌宿主细胞经过权利要求43的融合蛋白构建体的转化。
45.一种用于降解或转变含纤维素材料的方法,该方法包括:在存在有效量的权利要求40的融合蛋白或其构件的条件下用有效量的纤维素分解酶组合物处理所述含纤维素材料。
46.权利要求45的方法,其中所述纤维素分解酶组合物包含一种或几种选自下组的纤维素水解蛋白质:纤维素酶、内切葡聚糖酶、纤维二糖水解酶、和具有纤维素水解增强活性的多肽。
47.权利要求45或46的方法,该方法进一步包括用有效量的一种或几种选自下组的酶处理所述含纤维素材料:半纤维素酶、酯酶、蛋白酶、漆酶、过氧化物酶、或其混合物。
48.权利要求45-47任一项的方法,其中所述方法是预处理方法、同步糖化和发酵方法(SSF)中的步骤、分别水解和发酵(SHF)中的步骤、或混合水解和发酵方法(HHF)中的步骤。
49.权利要求45-48任一项的方法,该方法进一步包括回收经过降解的含纤维素材料。
50.权利要求45的方法,其中所述纤维素水解蛋白质和/或融合蛋白或其构件为含有或不含细胞的发酵液的形式。
51.一种用于产生物质的方法,该方法包括:
(a)在存在有效量的权利要求40的融合蛋白或其构件的条件下用有效量的纤维素分解酶组合物糖化含纤维素材料;
(b)用一种或几种发酵微生物将步骤(a)的经糖化的含纤维素材料发酵;和
(c)从所述发酵回收所述有机物质。
52.权利要求51的方法,其中所述纤维素分解酶组合物包含一种或几种选自下组的蛋白质:纤维素酶、内切葡聚糖酶、纤维二糖水解酶、和具有纤维素水解增强活性的多肽。
53.权利要求51或52的方法,该方法进一步包括用有效量的一种或几种选自下组的酶处理所述含纤维素材料:半纤维素酶、酯酶、蛋白酶、漆酶、过氧化物酶、或其混合物。
54.权利要求51-53任一项的方法,其中步骤(a)和(b)是在同步糖化和发酵中同时进行的。
55.权利要求51-53任一项的方法,其中所述物质是醇、有机酸、酮、氨基酸、或气体。
56.权利要求51-55任一项的方法,其中所述纤维素分解酶组合物和/或所述融合蛋白或其构件为含有或不含细胞的发酵液的形式。
CN2007800352244A 2006-07-21 2007-07-20 提高具有生物学活性之多肽的分泌的方法 Expired - Fee Related CN101516906B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US83251106P 2006-07-21 2006-07-21
US60/832,511 2006-07-21
PCT/US2007/074038 WO2008057637A2 (en) 2006-07-21 2007-07-20 Methods of increasing secretion of polypeptides having biological activity

Publications (2)

Publication Number Publication Date
CN101516906A true CN101516906A (zh) 2009-08-26
CN101516906B CN101516906B (zh) 2013-11-06

Family

ID=39365161

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007800352244A Expired - Fee Related CN101516906B (zh) 2006-07-21 2007-07-20 提高具有生物学活性之多肽的分泌的方法

Country Status (8)

Country Link
US (4) US8546106B2 (zh)
EP (1) EP2046819B1 (zh)
CN (1) CN101516906B (zh)
BR (1) BRPI0714870A2 (zh)
CA (1) CA2658610A1 (zh)
DK (1) DK2046819T3 (zh)
ES (1) ES2538360T3 (zh)
WO (1) WO2008057637A2 (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102695720A (zh) * 2009-09-30 2012-09-26 诺维信股份有限公司 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸
WO2016082305A1 (en) 2014-11-27 2016-06-02 Wilmar (Shanghai) Biotechnology Research & Development Center Co., Ltd Methods for recombinant expression of beta-glucosidase gene
CN107287250A (zh) * 2009-12-23 2017-10-24 丹尼斯科美国公司 提高同步糖化发酵反应效率的方法
CN111500599A (zh) * 2014-05-16 2020-08-07 中央研究院 用以制备虾红素的重组多核苷酸序列及其应用
CN113166746A (zh) * 2018-11-13 2021-07-23 生化酶股份有限公司 融合蛋白
CN113215135A (zh) * 2021-06-17 2021-08-06 福建中烟工业有限责任公司 一种内切葡聚糖酶在卷烟原料改良中的应用
CN114317304A (zh) * 2021-12-21 2022-04-12 浙江工业大学 酿酒酵母产绿原酸工程菌株的构建方法及其应用
CN114606143A (zh) * 2020-12-08 2022-06-10 青岛蔚蓝康成生物科技有限公司 一种高产鼠李糖苷酶的里氏木霉突变菌株及其应用

Families Citing this family (173)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2012205191B2 (en) * 2007-05-31 2013-03-21 Novozymes, Inc. Compositions for degrading cellulosic material
CA2709490A1 (en) 2007-12-19 2009-07-09 Novozymes A/S Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
CN101981200A (zh) 2008-03-27 2011-02-23 诺维信公司 从含木素纤维素材料产生发酵产物
US20110165617A1 (en) 2008-09-30 2011-07-07 Novozymes North America, Inc. Enzymatic Hydrolysis Of Pretreated Lignocellulose-Containing Material With Distillers Dried Grains
EP2356136A1 (en) 2008-11-10 2011-08-17 Novozymes Inc. Polypeptides having feruloyl esterase activity and polynucleotides encoding same
CA2745760A1 (en) 2008-12-04 2010-06-10 Novozymes A/S Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
WO2010078391A2 (en) 2008-12-30 2010-07-08 Novozymes North America, Inc. Improvement of enzymatic hydrolysis of pretreated lignocellulose-containing material with dissolved air flotation sludge
WO2010078392A2 (en) 2008-12-31 2010-07-08 Novozymes North America, Inc. Processes of producing fermentation products
WO2010088463A2 (en) * 2009-01-30 2010-08-05 Novozymes, Inc. Polypeptides having expansin activity and polynucleotides encoding same
BRPI1013483B1 (pt) 2009-03-24 2019-04-24 Novozymes A/S Construção de ácido nucleico, vetor de expressão recombinante, célula hospedeira microbiana transgênica, métodos para produzir o polipeptídeo, para degradar um xilano acetilado e para produzir um produto de fermentação, e, composição
WO2010129287A2 (en) 2009-04-27 2010-11-11 The Board Of Trustees Of The University Of Illinois Hemicellulose-degrading enzymes
US8278507B2 (en) 2009-06-02 2012-10-02 Novozymes, Inc. Polypeptides having cellobiohydrolase activity and polynucleotides encoding same
CN102471759A (zh) 2009-06-30 2012-05-23 诺维信公司 生物质水解方法
EP2451957B1 (en) 2009-07-07 2017-11-15 Novozymes Inc. Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
DK2478096T3 (en) 2009-09-17 2017-08-28 Novozymes Inc POLYPEPTIDES WITH CELLULOLYTIC IMPROVING ACTIVITY AND POLYNUCLEOTIDES CODING THEM
EP2478095A1 (en) 2009-09-18 2012-07-25 Novozymes Inc. Polypeptides having beta-glucosidase activity and polynucleotides encoding same
BR112012006982B1 (pt) 2009-09-29 2021-12-21 Novozymes, Inc. Célula hospedeira microbiana transgênica, métodos para produzir um polipeptídeo, para produzir um mutante de uma célula precursora, para inibir a expressão de um polipeptídeo, para produzir uma proteína, para degradar ou converter um material celulósico, para produzir um produto de fermentação, para fermentar um material celulósico, construções de ácido nucleico, vetor de expressão, polipeptídeo isolado tendo atividade intensificadora celulolítica, polinucleotídeo isolado que codifica o mesmo, e, composição detergente
WO2011041405A1 (en) 2009-09-29 2011-04-07 Novozymes, Inc. Polypeptides having xylanase activity and polynucleotides encoding same
WO2011039319A1 (en) 2009-09-30 2011-04-07 Novozymes A/S Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
WO2011057086A1 (en) 2009-11-06 2011-05-12 Novozymes, Inc. Polypeptides having cellobiohydrolase activity and polynucleotides encoding same
EP2496692B1 (en) 2009-11-06 2016-03-16 Novozymes, Inc. Polypeptides having xylanase activity and polynucleotides encoding same
US20130040354A1 (en) 2010-01-29 2013-02-14 Novozymes A/S Biogas Production Process With Enzymatic Pre-Treatment
ES2636216T3 (es) 2010-03-30 2017-10-05 Novozymes North America, Inc. Procesos de producción de un producto de fermentación
BR112012020503A2 (pt) 2010-03-31 2015-09-15 Novozymes Inc variante isolado de celobioidrolase precursor, polipeptídeo isolado, construção de ácido nucleico, vetor de expressão, célula hospedeira, método de produzir um variante de celobioidrolas precursor, métodos para obter o variante, para degradar variante de celobioidrolase precursor, métodos para obter o variante, para degradar ou converter um material celulósico, poara produzir um produto de fermentação e de fermentar um material celulósico, e, composição de enzima.
DK2588604T3 (en) 2010-06-30 2016-09-26 Novozymes Inc Polypeptides having beta-glucosidase activity and polynucleotides encoding them
DK2591119T4 (da) 2010-07-07 2022-12-12 Novozymes North America Inc Fermenteringsproces
WO2012012590A2 (en) 2010-07-23 2012-01-26 Novozymes A/S Processes for producing fermentation products
EP2611901B1 (en) 2010-08-30 2016-05-11 Novozymes A/S Polypeptides having beta-glucosidase activity, beta-xylosidase activity, or beta-glucosidase and beta-xylosidase activity and polynucleotides encoding same
US8624082B2 (en) 2010-08-30 2014-01-07 Novozymes A/S Polypeptides having xylanase activity and polynucleotides encoding same
US20130212746A1 (en) 2010-08-30 2013-08-15 Novoyzmes A/S Polypeptides Having Hemicellulolytic Activity And Polynucleotides Encoding Same
WO2012030844A1 (en) 2010-08-30 2012-03-08 Novozymes A/S Polypeptides having endoglucanase activity and polynucleotides encoding same
WO2012030811A1 (en) 2010-08-30 2012-03-08 Novozymes A/S Polypeptides having cellobiohydrolase activity and polynucleotides encoding same
EP3470514A1 (en) 2010-08-30 2019-04-17 Novozymes A/S Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
US20130260423A1 (en) 2010-10-26 2013-10-03 Novozymes North America, Inc. Methods of Saccharifying Sugar Cane Trash
US9212354B2 (en) 2010-11-04 2015-12-15 Novozymes Inc. Polypeptides having cellobiohydrolase activitiy and polynucleotides encoding same
DK2638153T3 (en) 2010-11-12 2017-10-16 Novozymes Inc POLYPEPTIDES WITH ENDOGLUCANASE ACTIVITY AND POLYNUCLEOTIDES CODING THEM
US8927235B2 (en) 2010-12-06 2015-01-06 Novozymes A/S Methods of hydrolyzing oligomers in hemicellulosic liquor
CN103261420B (zh) * 2010-12-16 2016-01-20 诺维信股份有限公司 用于在真菌细胞中表达基因的启动子
EP2661499A1 (en) 2011-01-04 2013-11-13 Novozymes A/S Process for producing biogas from pectin and lignocellulose containing material
WO2012103350A1 (en) 2011-01-26 2012-08-02 Novozymes A/S Polypeptides having cellobiohydrolase activity and polynucleotides encoding same
WO2012103288A1 (en) 2011-01-26 2012-08-02 Novozymes A/S Polypeptides having cellobiohydrolase activity and polynucleotides encoding same
CN103517985B (zh) 2011-01-26 2016-12-07 诺维信公司 具有纤维二糖水解酶活性的多肽及编码该多肽的多核苷酸
EP2668268B1 (en) 2011-01-26 2017-05-31 Novozymes A/S Polypeptides having cellobiohydrolase activity and polynucleotides encoding same
WO2012103322A1 (en) 2011-01-26 2012-08-02 Novozymes A/S Polypeptides having endoglucanase activity and polynucleotides encoding same
CN103459605B (zh) 2011-01-31 2016-08-24 诺维信北美公司 用于酶法精制经预处理的纤维素材料以供糖化的工艺
CN103384678B (zh) 2011-02-23 2017-01-18 诺维信股份有限公司 具有纤维素水解增强活性的多肽及其编码多核苷酸
EP3339442B1 (en) 2011-03-09 2022-05-11 Novozymes A/S Methods of increasing the cellulolytic enhancing activity of a polypeptide
US9409958B2 (en) 2011-03-10 2016-08-09 Novozymes, Inc. Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
DK2689011T3 (en) 2011-03-25 2018-01-22 Novozymes As PROCEDURE FOR DEGRADATION OR CONVERSION OF CELLULOSE-SUBSTANCING MATERIAL
US9410136B2 (en) 2011-03-31 2016-08-09 Novozymes, Inc. Methods for enhancing the degradation or conversion of cellulosic material
US20140080182A1 (en) 2011-03-31 2014-03-20 Novozymes, Inc. Cellulose Binding Domain Variants and Polynucleotides Encoding Same
US9926547B2 (en) 2011-04-28 2018-03-27 Novozymes, Inc. Polypeptides having endoglucanase activity and polynucleotides encoding same
US9624518B2 (en) 2011-04-29 2017-04-18 Novozymes, Inc. Methods for enhancing the degradation or conversion of cellulosic material
WO2012159009A1 (en) 2011-05-19 2012-11-22 Novozymes, Inc. Methods for enhancing the degradation of cellulosic material with chitin binding proteins
EP2710132A1 (en) 2011-05-19 2014-03-26 Novozymes, Inc. Methods for enhancing the degradation of cellulosic material with chitin binding proteins
US20140106427A1 (en) 2011-06-28 2014-04-17 Novozymes A/S Biogas From Enzyme-Treated Bagasse
DK2734633T3 (da) 2011-07-22 2019-06-11 Novozymes North America Inc Fremgangsmåder til forbehandling af celluloseholdigt materiale og forbedring af hydrolyse deraf
DK2739728T3 (en) 2011-08-04 2017-10-16 Novozymes As Polypeptides with endoglucanase activity and polynucleotides encoding them
CN108823184B (zh) 2011-08-04 2022-04-05 诺维信公司 具有木聚糖酶活性的多肽及其编码多核苷酸
BR112014004188A2 (pt) 2011-08-24 2017-03-21 Novozymes Inc método para obter transformantes positivos de uma célula hospedeira fúngica filamentosa, célula hospedeira fúngica filamentosa, método para produzir múltiplos polipeptídeos recombinantes, e, construto em tandem
BR112014004190A2 (pt) 2011-08-24 2017-03-01 Novozymes Inc método para construir uma cepa fúngida filamentosa, cepa fúngida filamentosa, método para produzir múltiplos polipeptídeos recombinantes, e, construto em tandem
WO2013039776A1 (en) 2011-09-13 2013-03-21 Novozymes North America, Inc. Methods of hydrolyzing and fermenting cellulosic material
WO2013043910A1 (en) 2011-09-20 2013-03-28 Novozymes A/S Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
DK2748313T3 (en) 2011-09-23 2016-07-25 Novozymes As Methods for hydrolysis of acetylated cellulosic material
CN103930438A (zh) 2011-09-30 2014-07-16 诺维信股份有限公司 具有β-葡糖苷酶活性的嵌合多肽和对其进行编码的多核苷酸
US10308921B2 (en) 2011-10-31 2019-06-04 Novozymes, Inc. Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
US9708591B2 (en) 2011-11-18 2017-07-18 Novozymes Inc. Polypeptides having endoglucanase activity and polynucleotides encoding same
EP2780449B1 (en) 2011-11-18 2018-04-11 Novozymes, Inc. Polypeptides having beta-glucosidase activity, beta-xylosidase activity, or beta-glucosidase and beta-xylosidase activity and polynucleotides encoding same
BR112014012165A2 (pt) 2011-11-21 2020-06-23 Novozymes, Inc. Variante de um polipeptídeo gh61, polinucleotídeo isolado, célula hospedeira recombinante, método para produção de uma variante de um polipeptídeo gh61, processos para degradação ou conversão de um material celulósico, para produção de um produto de fermentação, e para fermentação de um material celulósico, composição enzimática, formulação de caldo completo, ou composição de cultura celular, composição detergente, e método de limpeza ou lavagem de uma superfície dura ou roupa.
DK2782998T3 (en) 2011-11-22 2018-04-16 Novozymes Inc POLYPEPTIDES WITH BETA-XYLOSIDASE ACTIVITY AND POLYNUCLEOTIDES CODING THEM
DK2785732T3 (en) 2011-12-01 2017-06-19 Novozymes Inc POLYPEPTIDES WITH BETA-XYLOSIDASE ACTIVITY AND POLYNUCLEOTIDES CODING THEM
WO2013083801A2 (en) 2011-12-09 2013-06-13 Novozymes A/S Biogas from substrates comprising animal manure and enzymes
EP2791330B1 (en) 2011-12-16 2017-07-26 Novozymes, Inc. Polypeptides having laccase activity and polynucleotides encoding same
BR112014014697A2 (pt) 2011-12-19 2020-10-27 Novozymes, Inc. polipeptídeo isolado, composição, polinucleotídeo isolado, construto de ácido nucleico ou vetor de expressão, célula hospedeira recombinante, métodos para produzir um polipeptídeo e uma proteína, para gerar oxigênio molecular, e para remover peróxido de hidrogênio do tecido, processos para degradar ou converter um material celulósico, e para produzir um produto de fermentação, e, formulação de caldo integral ou composição de cultura de células
CN104768391A (zh) 2011-12-19 2015-07-08 诺维信公司 用于增加纤维素材料的消化率的方法和组合物
CA2878019A1 (en) 2011-12-20 2013-06-27 Novozymes, Inc. Cellobiohydrolase variants and polynucleotides encoding same
WO2013096652A1 (en) 2011-12-21 2013-06-27 Novozymes, Inc. Methods for determining the degradation of a biomass material
CA2862703A1 (en) 2012-03-26 2013-10-03 Novozymes North America, Inc. Methods of preconditioning cellulosic material
EP2859110B1 (en) 2012-03-30 2022-10-26 Novozymes North America, Inc. Processes of producing fermentation products
ES2935920T3 (es) 2012-03-30 2023-03-13 Novozymes North America Inc Procesos de elaboración de productos de fermentación
CN104245929A (zh) 2012-04-23 2014-12-24 诺维信公司 具有α-葡糖醛酸糖苷酶活性的多肽以及编码其的多核苷酸
DK2841570T3 (en) 2012-04-23 2018-03-12 Novozymes As POLYPEPTIDES WITH GLUCURONYL STERASE ACTIVITY AND POLYNUCLEOTIDES CODING THEM
WO2013163590A2 (en) 2012-04-27 2013-10-31 Novozymes, Inc. Gh61 polypeptide variants and polynucleotides encoding same
CN104427869A (zh) 2012-07-06 2015-03-18 诺维信公司 用于酶回收的液体酶组合物及方法
EP2898068A2 (en) 2012-09-19 2015-07-29 Novozymes, Inc. Methods for enhancing the degradation or conversion of cellulosic material
DK2903412T3 (da) 2012-10-08 2019-12-16 Novozymes As Polypeptider med cellulolyseforbedrende aktivitet og polynukleotider, som koder for dem
US20150275194A1 (en) 2012-10-24 2015-10-01 Novozymes A/S Polypeptides Having Cellulolytic Enhancing Activity And Polynucleotides Encoding Same
JP2015533292A (ja) * 2012-10-31 2015-11-24 ダニスコ・ユーエス・インク マグナポルテ・グリセア(Magnaporthegrisea)由来のβ−グルコシダーゼ
CA2892031A1 (en) 2012-11-27 2014-06-05 Novozymes A/S Milling process
DK2925790T3 (da) 2012-11-27 2021-10-11 Novozymes As Formalingsproces
US9765373B2 (en) 2012-12-14 2017-09-19 Novozymes A/S Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
WO2014099798A1 (en) 2012-12-19 2014-06-26 Novozymes A/S Polypeptides having cellulolytic enhancinc activity and polynucleotides encoding same
CN105074001A (zh) 2013-02-21 2015-11-18 诺维信公司 糖化和发酵纤维素材料的方法
EP2964760B1 (en) 2013-03-08 2021-05-12 Novozymes A/S Cellobiohydrolase variants and polynucleotides encoding same
EP3063282B1 (en) 2013-09-11 2020-03-25 Novozymes A/S Processes for producing fermentation products
US9938552B2 (en) 2013-11-01 2018-04-10 Novozymes A/S Methods of saccharifying and fermenting a cellulosic material
US10647947B2 (en) 2014-06-04 2020-05-12 Novozymes A/S Detergent composition
EP3177719A4 (en) 2014-08-08 2018-04-04 Xyleco, Inc. Aglycosylated enzyme and uses thereof
EP3191597A1 (en) 2014-08-21 2017-07-19 Novozymes A/S Process for saccharifying cellulosic material under oxygen addition
DK3183352T3 (da) 2014-08-22 2021-06-14 Cysbio Aps Fremgangsmåde til fremstilling af et fermenteringsprodukt ud fra et lignocelluloseholdigt materiale
BR112017004251A2 (pt) 2014-09-05 2017-12-12 Novozymes As variantes de módulos de ligação a carboidrato e polinucleotídeos que os codificam
CN107109346B (zh) 2014-09-23 2021-07-20 诺维信公司 用于生产乙醇的方法和发酵生物
CU20170036A7 (es) * 2014-09-26 2017-09-06 Xyleco Inc Mezclas que comprenden una pluralidad de polipéptidos con actividad degradante de biomasa y métodos para producir las mismas
WO2016120298A1 (en) 2015-01-28 2016-08-04 Dsm Ip Assets B.V. Process for enzymatic hydrolysis of lignocellulosic material and fermentation of sugars
CA2973302C (en) 2015-01-28 2022-10-25 Dsm Ip Assets B.V. Process for enzymatic hydrolysis of lignocellulosic material and fermentation of sugars
DK3640336T3 (da) 2015-01-28 2022-06-27 Dsm Ip Assets Bv Fremgangsmåde til enzymatisk hydrolyse af lignocellulosemateriale og fermentering af sukre
WO2016138167A2 (en) 2015-02-24 2016-09-01 Novozymes A/S Cellobiohydrolase variants and polynucleotides encoding same
US10308963B2 (en) 2015-02-27 2019-06-04 Novozymes A/S Processes of producing ethanol using a fermenting organism
DK3268482T3 (da) 2015-03-09 2020-03-09 Novozymes As Fremgangsmåder til indføring af en flerhed af ekspressionskonstruktioner i en eukaryot celle
TN2017000318A1 (en) 2015-03-12 2019-01-16 Beta Renewable Spa Multi-stage enzymatic hydrolysis of lignocellulosic biomass
EP3067428A1 (en) 2015-03-12 2016-09-14 BETA RENEWABLES S.p.A. A process for producing a hydrolyzed mixture from a pre-treated ligno-cellulosic slurry comprising a slurry liquid and slurry solids
BR112017019331A2 (pt) 2015-03-12 2018-06-05 Beta Renewables Spa processos para sacarificação de múltiplos estágios de um material lignocelulósico e para melhorar um rendimento de glicose ou xilose de sacarificação de um material lignocelulósico em um reator de tanque continuamente agitado
BR112017018461A2 (pt) 2015-03-12 2018-04-17 Novozymes As processos para hidrólise multiestágio, para produção de um produto de fermentação, e, para aumento de rendimento de açúcar de hidrólise.
WO2016169892A1 (en) 2015-04-20 2016-10-27 Dsm Ip Assets B.V. Process for enzymatic hydrolysis of lignocellulosic material and fermentation of sugars
WO2016169893A1 (en) 2015-04-20 2016-10-27 Dsm Ip Assets B.V. Whole fermentation broth
WO2016205127A1 (en) 2015-06-18 2016-12-22 Novozymes A/S Polypeptides having trehalase activity and the use thereof in process of producing fermentation products
WO2016207144A1 (en) 2015-06-22 2016-12-29 Dsm Ip Assets B.V. Process for enzymatic hydrolysis of lignocellulosic material and fermentation of sugars
CN108350044B (zh) 2015-09-22 2022-05-24 诺维信公司 具有纤维二糖水解酶活性的多肽以及对其进行编码的多核苷酸
EP3394275A1 (en) 2015-12-22 2018-10-31 Novozymes A/S Process of extracting oil from thin stillage
CN114368888A (zh) 2015-12-23 2022-04-19 诺维信公司 用于用酶处理增强污泥的脱水性能的方法
EP3469090A1 (en) 2016-06-09 2019-04-17 DSM IP Assets B.V. Seed train for large scale enzyme production
WO2018019948A1 (en) 2016-07-29 2018-02-01 Dsm Ip Assets B.V. Polypeptides having cellulolytic enhancing activity and uses thereof
WO2018098381A1 (en) 2016-11-23 2018-05-31 Novozymes A/S Improved yeast for ethanol production
BR112019010355B1 (pt) 2016-11-24 2024-03-05 Dsm Ip Assets B.V. Composição de enzimas
CA3043435A1 (en) 2016-11-24 2018-05-31 Dsm Ip Assets B.V. Enzyme compositions with improved hydrolysis performance
EP3551759A1 (en) 2016-12-06 2019-10-16 Novozymes A/S Improved processes for production of ethanol from xylose-containing cellulosic substrates using engineered yeast strains
WO2018185071A1 (en) 2017-04-03 2018-10-11 Dsm Ip Assets B.V. Process for enzymatic hydrolysis of lignocellulosic material and fermentation of sugars
US11091753B2 (en) 2017-05-31 2021-08-17 Novozymes A/S Xylose fermenting yeast strains and processes thereof for ethanol production
AU2018275794A1 (en) 2017-06-02 2019-12-05 Novozymes A/S Improved yeast for ethanol production
EP4015524A1 (en) 2017-06-28 2022-06-22 Novozymes A/S Polypeptides having trehalase activity and polynucleotides encoding same
CN111094562A (zh) 2017-08-08 2020-05-01 诺维信公司 具有海藻糖酶活性的多肽及其在产生发酵产物的方法中的用途
EP3682014A1 (en) 2017-09-15 2020-07-22 Novozymes A/S Enzyme blends and processes for improving the nutritional quality of animal feed
CN107513549A (zh) * 2017-09-29 2017-12-26 天津大学 一种复合霉菌降解玉米秸秆的方法
BR112020005439A2 (pt) 2017-10-09 2020-09-24 Dsm Ip Assets B.V. processo para hidrólise enzimática de material lignocelulósico e fermentação de açúcares
EP3701037A1 (en) 2017-10-23 2020-09-02 Novozymes A/S Processes for reducing lactic acid in a biofuel fermentation system
WO2019086370A1 (en) 2017-10-30 2019-05-09 Dsm Ip Assets B.V. Process for enzymatic hydrolysis of lignocellulosic material and fermentation of sugars
EP3704259A1 (en) 2017-10-30 2020-09-09 DSM IP Assets B.V. Process for enzymatic hydrolysis of lignocellulosic material and fermentation of sugars
CA3083854A1 (en) 2017-12-22 2019-06-27 Novozymes A/S Wheat milling process and gh8 xylanases
CN113286871A (zh) 2018-01-29 2021-08-20 诺维信公司 用于乙醇生产的氮利用提高的微生物
CA3107124A1 (en) 2018-02-15 2019-08-22 Novozymes A/S Improved yeast for ethanol production
WO2019185681A1 (en) 2018-03-28 2019-10-03 Dsm Ip Assets B.V. Enzyme composition
EP3775189A1 (en) 2018-03-28 2021-02-17 DSM IP Assets B.V. Enzyme composition
WO2019219804A1 (en) 2018-05-17 2019-11-21 Dsm Ip Assets B.V. Process for producing a polypeptide
LT3802843T (lt) 2018-05-30 2023-04-25 Versalis S.P.A. Cukrų gamybos iš angliavandenių medžiagos būdas
BR112020024347A2 (pt) 2018-05-31 2021-02-23 Novozymes A/S processos para aumentar o crescimento e a produtividade de levedura
CN112601818A (zh) 2018-07-25 2021-04-02 诺维信公司 用于生产乙醇的表达酶的酵母
WO2020058253A1 (en) 2018-09-18 2020-03-26 Dsm Ip Assets B.V. Process for enzymatic hydrolysis of carbohydrate material and fermentation of sugars
WO2020058249A1 (en) 2018-09-18 2020-03-26 Dsm Ip Assets B.V. Process for enzymatic hydrolysis of carbohydrate material and fermentation of sugars
WO2020058248A1 (en) 2018-09-18 2020-03-26 Dsm Ip Assets B.V. Process for enzymatic hydrolysis of carbohydrate material and fermentation of sugars
US11807889B2 (en) 2018-10-08 2023-11-07 Novozymes A/S Yeast expressing a heterologous phospholipase for ethanol production
CN112912511A (zh) 2018-10-24 2021-06-04 帝斯曼知识产权资产管理有限公司 用于碳水化合物材料酶促水解和糖发酵的方法
BR112021014873A2 (pt) 2019-01-31 2021-10-05 Novozymes A/S Polipeptídeo, combinação de enzimas, polinucleotídeo, construto de ácido nucleico ou vetor de expressão recombinante, célula hospedeira recombinante, método de produção de um polipeptídeo, e, processo de produção de um produto de fermentação
EP3938525A1 (en) 2019-03-12 2022-01-19 DSM IP Assets B.V. Process for producing a fermentation broth
WO2021021458A1 (en) 2019-07-26 2021-02-04 Novozymes A/S Microorganisms with improved nitrogen transport for ethanol production
CA3144423A1 (en) 2019-08-05 2021-02-11 Kurt Creamer Enzyme blends and processes for producing a high protein feed ingredient from a whole stillage byproduct
BR112021026477A2 (pt) 2019-08-06 2022-02-08 Novozymes As Célula hospedeira recombinante, métodos de produção de um produto de fermentação a partir de um material contendo amido ou contendo celulose, de produção do polipeptídeo maduro, de produção de um derivado de uma célula hospedeira recombinante e de produção de etanol, construto de ácido nucleico ou vetor de expressão, composição, e, uso de uma célula hospedeira recombinante
US20220340943A1 (en) 2019-09-10 2022-10-27 Dsm Ip Assets B.V. Enzyme composition
EP4031661A1 (en) 2019-09-16 2022-07-27 Novozymes A/S Polypeptides having beta-glucanase activity and polynucleotides encoding same
AU2020402990A1 (en) 2019-12-10 2022-06-09 Novozymes A/S Microorganism for improved pentose fermentation
WO2021126966A1 (en) 2019-12-16 2021-06-24 Novozymes A/S Processes for producing fermentation products
EP4103709A2 (en) 2020-02-10 2022-12-21 Novozymes A/S Polypeptides having alpha-amylase activity and polynucleotides encoding same
WO2022013148A1 (en) 2020-07-13 2022-01-20 Dsm Ip Assets B.V. Process for the production of biogas
MX2023002490A (es) 2020-09-04 2023-03-09 Novozymes As Organismo fermentador mejorado para la produccion de etanol.
US20230399632A1 (en) 2020-11-02 2023-12-14 Novozymes A/S Glucoamylase Variants and Polynucleotides Encoding Same
CN112592849A (zh) * 2020-12-14 2021-04-02 宁夏泰胜生物科技有限公司 利用兽疫链霉菌发酵生产高分子量透明质酸的培养基和培养方法
CN113201464B (zh) * 2020-12-30 2023-01-20 广东省科学院生物工程研究所 一株产α-葡聚糖酶的毕赤酵母工程菌及其构建方法、培养方法与应用
BR112023020357A2 (pt) 2021-04-06 2023-11-21 Dsm Ip Assets Bv Composição de enzima
CA3213845A1 (en) 2021-04-06 2022-10-13 Dsm Ip Assets B.V. Enzyme composition
US20240182936A1 (en) 2021-04-06 2024-06-06 Dsm Ip Assets B.V. Enzyme composition
WO2022214460A1 (en) 2021-04-08 2022-10-13 Dsm Ip Assets B.V. Process for the preparation of a sugar product and a fermentation product
WO2022261003A1 (en) 2021-06-07 2022-12-15 Novozymes A/S Engineered microorganism for improved ethanol fermentation
WO2023225459A2 (en) 2022-05-14 2023-11-23 Novozymes A/S Compositions and methods for preventing, treating, supressing and/or eliminating phytopathogenic infestations and infections
WO2024064901A2 (en) 2022-09-23 2024-03-28 Novozymes A/S Improved fermenting organism for ethanol production

Family Cites Families (90)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1296839A (zh) 1969-05-29 1972-11-22
GB1372034A (en) 1970-12-31 1974-10-30 Unilever Ltd Detergent compositions
JPS5028515B2 (zh) 1971-09-30 1975-09-16
GB1483591A (en) 1973-07-23 1977-08-24 Novo Industri As Process for coating water soluble or water dispersible particles by means of the fluid bed technique
GB1590432A (en) 1976-07-07 1981-06-03 Novo Industri As Process for the production of an enzyme granulate and the enzyme granuate thus produced
DK187280A (da) 1980-04-30 1981-10-31 Novo Industri As Ruhedsreducerende middel til et fuldvaskemiddel fuldvaskemiddel og fuldvaskemetode
DK263584D0 (da) 1984-05-29 1984-05-29 Novo Industri As Enzymholdige granulater anvendt som detergentadditiver
EP0218272B1 (en) 1985-08-09 1992-03-18 Gist-Brocades N.V. Novel lipolytic enzymes and their use in detergent compositions
EG18543A (en) 1986-02-20 1993-07-30 Albright & Wilson Protected enzyme systems
DK122686D0 (da) 1986-03-17 1986-03-17 Novo Industri As Fremstilling af proteiner
DE3750450T2 (de) 1986-08-29 1995-01-05 Novo Industri As Enzymhaltiger Reinigungsmittelzusatz.
NZ221627A (en) 1986-09-09 1993-04-28 Genencor Inc Preparation of enzymes, modifications, catalytic triads to alter ratios or transesterification/hydrolysis ratios
ATE125865T1 (de) 1987-08-28 1995-08-15 Novo Nordisk As Rekombinante humicola-lipase und verfahren zur herstellung von rekombinanten humicola-lipasen.
JPS6474992A (en) 1987-09-16 1989-03-20 Fuji Oil Co Ltd Dna sequence, plasmid and production of lipase
DE68924654T2 (de) 1988-01-07 1996-04-04 Novonordisk As Spezifische Protease.
DK6488D0 (da) 1988-01-07 1988-01-07 Novo Industri As Enzymer
JP3079276B2 (ja) 1988-02-28 2000-08-21 天野製薬株式会社 組換え体dna、それを含むシュードモナス属菌及びそれを用いたリパーゼの製造法
DE68911131T2 (de) 1988-03-24 1994-03-31 Novonordisk As Cellulosezubereitung.
US5648263A (en) 1988-03-24 1997-07-15 Novo Nordisk A/S Methods for reducing the harshness of a cotton-containing fabric
GB8915658D0 (en) 1989-07-07 1989-08-23 Unilever Plc Enzymes,their production and use
US5110735A (en) 1989-09-26 1992-05-05 Midwest Research Institute Thermostable purified endoglucanase from thermophilic bacterium acidothermus cellulolyticus
US5536655A (en) 1989-09-26 1996-07-16 Midwest Research Institute Gene coding for the E1 endoglucanase
US5275944A (en) 1989-09-26 1994-01-04 Midwest Research Institute Thermostable purified endoglucanas from acidothermus cellulolyticus ATCC 43068
JP3112937B2 (ja) 1990-04-14 2000-11-27 カリ―ヒエミー アクチエンゲゼルシヤフト アルカリ性バチルスーリパーゼ、これをコード化するdna配列およびこのリパーゼを生産するバチルス
WO1991017243A1 (en) 1990-05-09 1991-11-14 Novo Nordisk A/S A cellulase preparation comprising an endoglucanase enzyme
DK115890D0 (da) 1990-05-09 1990-05-09 Novo Nordisk As Enzym
JPH0427386A (ja) 1990-05-24 1992-01-30 Kao Corp プロテアーゼ耐性セルラーゼ、これを産生する微生物及び該セルラーゼの製造法
DE69129988T2 (de) 1990-09-13 1999-03-18 Novo Nordisk As Lipase-varianten
DE69133352T2 (de) 1990-10-05 2004-11-04 Genencor International, Inc., Palo Alto Methoden zur behandlung baumwolle-enthaltender fasern mit zellulase
ES2174820T3 (es) 1991-01-16 2002-11-16 Procter & Gamble Composiciones detergentes compactas con celulasa de alta actividad.
DE69209500T2 (de) 1991-04-30 1996-10-31 Procter & Gamble Gerüstsubstanzhaltige flüssigwaschmittel mit borsäure-polyolkomplex zur ptoteolytischen enzyminhibierung
EP0511456A1 (en) 1991-04-30 1992-11-04 The Procter & Gamble Company Liquid detergents with aromatic borate ester to inhibit proteolytic enzyme
DE69226182T2 (de) 1991-05-01 1999-01-21 Novo Nordisk As Stabilisierte enzyme und waschmittelzusammensetzungen
DK72992D0 (da) 1992-06-01 1992-06-01 Novo Nordisk As Enzym
DK88892D0 (da) 1992-07-06 1992-07-06 Novo Nordisk As Forbindelse
DE69334295D1 (de) 1992-07-23 2009-11-12 Novo Nordisk As MUTIERTE -g(a)-AMYLASE, WASCHMITTEL UND GESCHIRRSPÜLMITTEL
WO1994007998A1 (en) 1992-10-06 1994-04-14 Novo Nordisk A/S Cellulase variants
EP0867504B2 (en) 1993-02-11 2011-05-18 Genencor International, Inc. Oxidation-stable alpha-amylase
KR950702240A (ko) 1993-04-27 1995-06-19 한스 발터 라벤 세제로의 이용을 위한 새로운 리파제 변형체
DK52393D0 (zh) 1993-05-05 1993-05-05 Novo Nordisk As
WO1995002675A1 (en) * 1993-07-12 1995-01-26 Novo Nordisk A/S A detergent composition comprising two cellulase components
JP2859520B2 (ja) 1993-08-30 1999-02-17 ノボ ノルディスク アクティーゼルスカブ リパーゼ及びそれを生産する微生物及びリパーゼ製造方法及びリパーゼ含有洗剤組成物
AU7853194A (en) 1993-10-13 1995-05-04 Novo Nordisk A/S H2o2-stable peroxidase variants
JPH07143883A (ja) 1993-11-24 1995-06-06 Showa Denko Kk リパーゼ遺伝子及び変異体リパーゼ
JP3081434B2 (ja) 1994-01-24 2000-08-28 花王株式会社 アルカリセルラーゼ
AU1806795A (en) 1994-02-22 1995-09-04 Novo Nordisk A/S A method of preparing a variant of a lipolytic enzyme
ES2251717T3 (es) 1994-03-08 2006-05-01 Novozymes A/S Nuevas celulasas alcalinas.
CA2189441C (en) 1994-05-04 2009-06-30 Wolfgang Aehle Lipases with improved surfactant resistance
WO1995035381A1 (en) 1994-06-20 1995-12-28 Unilever N.V. Modified pseudomonas lipases and their use
WO1996000292A1 (en) 1994-06-23 1996-01-04 Unilever N.V. Modified pseudomonas lipases and their use
WO1996000787A1 (en) 1994-06-30 1996-01-11 Novo Nordisk Biotech, Inc. Non-toxic, non-toxigenic, non-pathogenic fusarium expression system and promoters and terminators for use therein
AU3604595A (en) 1994-10-06 1996-05-02 Novo Nordisk A/S An enzyme and enzyme preparation with endoglucanase activity
BE1008998A3 (fr) 1994-10-14 1996-10-01 Solvay Lipase, microorganisme la produisant, procede de preparation de cette lipase et utilisations de celle-ci.
CN1167503A (zh) 1994-10-26 1997-12-10 诺沃挪第克公司 一种具有脂解活性的酶
AR000862A1 (es) 1995-02-03 1997-08-06 Novozymes As Variantes de una ó-amilasa madre, un metodo para producir la misma, una estructura de adn y un vector de expresion, una celula transformada por dichaestructura de adn y vector, un aditivo para detergente, composicion detergente, una composicion para lavado de ropa y una composicion para la eliminacion del
JPH08228778A (ja) 1995-02-27 1996-09-10 Showa Denko Kk 新規なリパーゼ遺伝子及びそれを用いたリパーゼの製造方法
CN1182451A (zh) 1995-03-17 1998-05-20 诺沃挪第克公司 新的内切葡聚糖酶
JP4307549B2 (ja) 1995-07-14 2009-08-05 ノボザイムス アクティーゼルスカブ 脂肪分解活性を有する修飾された酵素
ES2221934T3 (es) 1995-08-11 2005-01-16 Novozymes A/S Nuevas enzimas lipoliticas.
US5763385A (en) 1996-05-14 1998-06-09 Genencor International, Inc. Modified α-amylases having altered calcium binding properties
EP0910627A1 (en) 1996-06-28 1999-04-28 Novo Nordisk A/S A recombinant enzyme with dextranase activitiy
US6403362B1 (en) * 1996-07-24 2002-06-11 Meiji Seika Kaisha, Ltd. Systems for the mass production of proteins or peptides by microorganisms of the genus humicola
WO1998008940A1 (en) 1996-08-26 1998-03-05 Novo Nordisk A/S A novel endoglucanase
CN100362100C (zh) 1996-09-17 2008-01-16 诺沃奇梅兹有限公司 纤维素酶变体
AU730286B2 (en) 1996-10-08 2001-03-01 Novo Nordisk A/S Diaminobenzoic acid derivatives as dye precursors
AU4551097A (en) 1996-10-11 1998-05-11 Novo Nordisk A/S Alpha-amylase fused to cellulose binding domain, for starch degradation
EP0948610B1 (en) 1996-11-04 2011-05-25 Novozymes A/S Subtilase variants and compositions
US6300116B1 (en) 1996-11-04 2001-10-09 Novozymes A/S Modified protease having improved autoproteolytic stability
US6159731A (en) 1997-02-12 2000-12-12 Massachusetts Institute Of Technology Daxx, a Fas-binding protein that activates JNK and apoptosis
AU7564198A (en) 1998-05-01 1999-11-23 Procter & Gamble Company, The Laundry detergent and/or fabric care compositions comprising a modified cellulase
DE69932345T2 (de) 1998-10-26 2007-07-19 Novozymes A/S Erstellung und durchmusterung von interessierenden dna-banken in zellen von filamentösen pilzen
WO2000056900A2 (en) 1999-03-22 2000-09-28 Novo Nordisk Biotech, Inc. Promoter sequences derived from fusarium venenatum and uses thereof
CA2372594A1 (en) 1999-05-19 2000-11-23 Midwest Research Institute E1 endoglucanase variants y245g, y82r and w42r
ES2166316B1 (es) 2000-02-24 2003-02-16 Ct Investig Energeticas Ciemat Procedimiento de produccion de etanol a partir de biomasa lignocelulosica utilizando una nueva levadura termotolerante.
KR20020026456A (ko) * 2000-04-13 2002-04-10 에말파브 마크 아론 사상균에서 발현된 dna 라이브러리의 고산출량 스크리닝
AU2002223504A1 (en) 2000-11-17 2002-05-27 Novozymes A/S Heterologous expression of taxanes
JP4287149B2 (ja) 2001-02-07 2009-07-01 ノボザイムス アクティーゼルスカブ リパーゼ変異体
AU2002316785A1 (en) 2001-05-18 2002-12-03 Novozymes A/S Polypeptides having cellobiase activity and polynucleotides encoding same
JP2006512891A (ja) * 2002-04-18 2006-04-20 ジェネンコー・インターナショナル・インク 糸状菌における機能性抗体の生産
CN1836038B (zh) * 2003-05-02 2011-04-06 诺维信股份有限公司 制备分泌型多肽的方法
ATE471370T1 (de) 2003-05-02 2010-07-15 Novozymes Inc Varianten von beta-glukosidasen
DK1702981T3 (da) * 2003-12-08 2011-10-17 Meiji Seika Pharma Co Ltd Tensid-tollerant cellulase og fremgangsmåde til omdannelse deraf
EP1709163B1 (en) 2004-01-16 2010-11-24 Novozymes, Inc. Methods for degrading lignocellulosic materials
ES2391826T3 (es) 2004-01-30 2012-11-30 Novozymes, Inc. Polipéptidos con actividad de mejora celulolítica y polinucleótidos que los codifican
EP1733033B1 (en) 2004-02-06 2012-06-20 Novozymes Inc. Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
WO2005093050A2 (en) 2004-03-25 2005-10-06 Genencor International, Inc. Cellulase fusion protein and heterologous cellulase fusion construct encoding the same
EP1781785B1 (en) 2004-07-20 2010-11-10 Novozymes, Inc. Methods of producing mutant polynucleotides
AU2006337184B2 (en) 2005-09-30 2012-08-16 Novozymes, Inc. Methods for enhancing the degradation or conversion of cellulosic material
US7361487B2 (en) 2006-04-13 2008-04-22 Ab Enzymes Oy Enzyme fusion proteins and their use
CA2689910A1 (en) * 2007-05-31 2008-12-11 Novozymes, Inc. Compositions for degrading cellulosic material

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102695720A (zh) * 2009-09-30 2012-09-26 诺维信股份有限公司 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸
CN102695720B (zh) * 2009-09-30 2018-02-16 诺维信股份有限公司 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸
CN107287250A (zh) * 2009-12-23 2017-10-24 丹尼斯科美国公司 提高同步糖化发酵反应效率的方法
CN111500599A (zh) * 2014-05-16 2020-08-07 中央研究院 用以制备虾红素的重组多核苷酸序列及其应用
WO2016082305A1 (en) 2014-11-27 2016-06-02 Wilmar (Shanghai) Biotechnology Research & Development Center Co., Ltd Methods for recombinant expression of beta-glucosidase gene
US9969995B2 (en) 2014-11-27 2018-05-15 Wilmar (Shanghai) Biotechnology Research & Development Center Co., Ltd. Methods for recombinant expression of beta-glucosidase gene
CN113166746A (zh) * 2018-11-13 2021-07-23 生化酶股份有限公司 融合蛋白
CN114606143A (zh) * 2020-12-08 2022-06-10 青岛蔚蓝康成生物科技有限公司 一种高产鼠李糖苷酶的里氏木霉突变菌株及其应用
CN113215135A (zh) * 2021-06-17 2021-08-06 福建中烟工业有限责任公司 一种内切葡聚糖酶在卷烟原料改良中的应用
CN114317304A (zh) * 2021-12-21 2022-04-12 浙江工业大学 酿酒酵母产绿原酸工程菌株的构建方法及其应用
CN114317304B (zh) * 2021-12-21 2024-03-15 浙江工业大学 酿酒酵母产绿原酸工程菌株的构建方法及其应用

Also Published As

Publication number Publication date
CA2658610A1 (en) 2008-05-15
DK2046819T3 (da) 2015-06-22
WO2008057637A3 (en) 2008-10-09
US8735549B2 (en) 2014-05-27
US8546106B2 (en) 2013-10-01
BRPI0714870A2 (pt) 2013-05-28
US8871486B2 (en) 2014-10-28
US9006409B2 (en) 2015-04-14
US20090298126A1 (en) 2009-12-03
CN101516906B (zh) 2013-11-06
EP2046819A2 (en) 2009-04-15
US20140248671A1 (en) 2014-09-04
ES2538360T3 (es) 2015-06-19
WO2008057637A2 (en) 2008-05-15
WO2008057637A9 (en) 2008-07-17
US20140011256A1 (en) 2014-01-09
US20150044756A1 (en) 2015-02-12
EP2046819B1 (en) 2015-03-18

Similar Documents

Publication Publication Date Title
CN101516906B (zh) 提高具有生物学活性之多肽的分泌的方法
CN101970651B (zh) 用于降解纤维素材料的组合物
CN102770534B (zh) 具有纤维素分解增强活性的多肽及编码其的多核苷酸
US8629326B2 (en) Polypeptides having beta-glucosidase activity and polynucleotides encoding same
CN101874109B (zh) 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸
CN103282489B (zh) 具有纤维素分解增强活性的多肽变体及其编码多核苷酸
CN103237891B (zh) 具有纤维素分解增强活性的多肽变体及其编码多核苷酸
CN101784659A (zh) 具有纤维素分解增强活性的多肽和编码它的多核苷酸
CN103797126A (zh) 用于增强纤维素材料的降解或转化的方法
CA2689910A1 (en) Compositions for degrading cellulosic material
CN108165542A (zh) 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸
CN101910405A (zh) 降低鞣质对酶促水解纤维素材料的抑制作用的方法
CN103958672A (zh) Gh61多肽变体以及编码所述变体的多核苷酸
CN101910406A (zh) 减少氧化还原活性金属离子对纤维素材料酶水解抑制作用的方法
CN104245926A (zh) Gh61多肽变体以及编码其的多核苷酸
US8586828B2 (en) Polypeptides having beta-glucosidase activity and polynucleotides encoding same

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20131106

Termination date: 20170720

CF01 Termination of patent right due to non-payment of annual fee