CN109136114A - 在丝状真菌宿主细胞中产生多种重组多肽的方法 - Google Patents

在丝状真菌宿主细胞中产生多种重组多肽的方法 Download PDF

Info

Publication number
CN109136114A
CN109136114A CN201810953356.5A CN201810953356A CN109136114A CN 109136114 A CN109136114 A CN 109136114A CN 201810953356 A CN201810953356 A CN 201810953356A CN 109136114 A CN109136114 A CN 109136114A
Authority
CN
China
Prior art keywords
cellobiohydrolase
homologous
seq
sequence
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810953356.5A
Other languages
English (en)
Inventor
D·亚韦
金绮明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novozymes Inc
Original Assignee
Novozymes Biotech Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novozymes Biotech Inc filed Critical Novozymes Biotech Inc
Publication of CN109136114A publication Critical patent/CN109136114A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • C12N9/2437Cellulases (3.2.1.4; 3.2.1.74; 3.2.1.91; 3.2.1.150)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01091Cellulose 1,4-beta-cellobiosidase (3.2.1.91)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/0115Oligoxyloglucan reducing-end-specific cellobiohydrolase (3.2.1.150)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Mycology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明涉及构建用于产生具有生物活性的多种重组多肽的丝状真菌菌株的方法。本发明还涉及在丝状真菌菌株中产生具有生物活性的多种重组多肽的方法。本发明还涉及表达具有生物活性的多种重组多肽的丝状真菌菌株。

Description

在丝状真菌宿主细胞中产生多种重组多肽的方法
本申请是2014年4月24日提交到中华人民共和国国家知识产权局的发明名称为“在丝状真菌宿主细胞中产生多种重组多肽的方法”、申请号为“201280052277.8”的发明专利申请的分案申请。
序列表的引用
本申请含有计算机可读形式的序列表,其通过引用的方式合并入本文。
发明领域
本发明涉及在丝状真菌宿主细胞中产生多种重组多肽的方法。
背景技术
在丝状真菌宿主细胞中重组产生多肽可以为生产商业相关量的多肽提供更为合意的载体。多肽的重组产生通常通过构建表达盒来实现,其中在表达盒中,将编码多肽的DNA置于来自调控基因的启动子的表达控制下。通常通过质粒介导的转化将表达盒导入到宿主细胞中。然后通过在表达盒中含有的启动子适当发挥作用所必需的诱导性条件下培养所转化的宿主细胞来实现多肽的生产。
可以通过涉及原生质体形成、原生质体的转化和细胞壁的再生的方法以本身已知的方式用载体转化丝状真菌细胞。用两种或更多种载体单独或一起(共转化)转化丝状真菌宿主细胞的效率是非常低的,并受到可用的可选择性标记物的可得性的限制。
本领域需要一些方法,通过将串联表达构建体定向至一个或多个 (例如几个)特定基因组基因座来构建能够表达多种重组多肽的丝状真菌菌株,从而实现所需表达量的所有目标多肽。
本发明提供在丝状真菌宿主细胞中产生多种重组多肽的改进方法。
发明内容
本发明涉及构建用于产生具有生物活性的多种重组多肽的丝状真菌菌株的方法,包括:
(a)通过向丝状真菌菌株中导入第一串联构建体,通过靶向整合 (targetedintegration)来取代内源性第一基因,该第一串联构建体包含: (i)第一基因的同源5’区、其同源侧翼区或其组合;(ii)一个或多个 (例如,几个)第一可选择性标记物;(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸;(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸;和(v)第一基因的同源3’区、其同源侧翼区或其组合;
(b)通过向丝状真菌菌株中导入第二串联构建体,通过靶向整合来取代内源性第二基因,该第二串联构建体包含:(i)第二基因的同源 5’区、其同源侧翼区或其组合;(ii)一个或多个(例如,几个)第二可选择性标记物;(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸;(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸;和(v)第二基因的同源3’区、其同源侧翼区或其组合;或
(c)(a)和(b)的组合。
本发明还涉及丝状真菌菌株,其包含:
(a)通过向丝状真菌菌株中导入第一串联构建体经靶向整合被取代的内源性第一基因,该第一串联构建体包含:(i)第一基因的同源5’区、其同源侧翼区或其组合;(ii)一个或多个(例如,几个)第一可选择性标记物;(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸;(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸;和 (v)第一基因的同源3’区、其同源侧翼区或其组合;
(b)通过向丝状真菌菌株中导入第二串联构建体经靶向整合被取代的内源性第二基因,该第二串联构建体包含:(i)第二基因的同源5’区、其同源侧翼区或其组合;(ii)一个或多个(例如,几个)第二可选择性标记物;(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸;(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸;和 (v)第二基因的同源3’区、其同源侧翼区或其组合;或
(c)(a)和(b)的组合。
本发明还涉及在丝状真菌菌株中产生具有生物活性的多种重组多肽的方法,其包括:
(A)在有益于产生多肽的条件下培养丝状真菌宿主细胞,其中该丝状真菌宿主细胞包含:(a)通过靶向整合用第一串联构建体取代的内源性第一基因,该第一串联构建体包含(i)第一基因的同源5’区、其同源侧翼区或其组合,(ii)一个或多个(例如,几个)第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v) 第一基因的同源3’区、其同源侧翼区或其组合;(b)通过靶向整合用第二串联构建体取代的内源性第二基因,该第二串联构建体包含(i) 第二基因的同源5’区、其同源侧翼区或其组合,(ii)一个或多个(例如,几个)第二可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v)第二基因的同源3’区、其同源侧翼区或其组合;或(c)(a)和(b)的组合;以及任选地
(B)回收多种重组多肽。
本发明还涉及串联构建体,其包含:(i)基因的同源5’区、其同源侧翼区或其组合;(ii)一个或多个(例如,几个)可选择性标记物;(iii) 与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸;(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸;和(v)基因的同源3’区、其同源侧翼区或其组合。
本发明还涉及构建用于产生具有生物活性的多种重组多肽的丝状真菌菌株的方法,其包括:
(a)通过靶向整合向内源性第一基因座中***第一串联构建体,该第一串联构建体包含:(i)第一基因座的同源5’区、其同源侧翼区或其组合;(ii)一个或多个第一可选择性标记物;(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸;(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸;和(v)第一基因座的同源3’区、其同源侧翼区或其组合;
(b)通过靶向整合向内源性第二基因座中***第二串联构建体,该第二串联构建体包含:(i)第二基因座的同源5’区、其同源侧翼区或其组合;(ii)一个或多个第二可选择性标记物;(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸;(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸;和(v)第二基因座的同源3’区、其同源侧翼区或其组合;或
(c)(a)和(b)的组合。
本发明还涉及丝状真菌菌株,其包含:(a)通过靶向整合经***第一串联构建体而修饰的内源性第一基因座,该第一串联构建体包含 (i)第一基因座的同源5’区、其同源侧翼区或其组合,(ii)一个或多个第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v)第一基因座的同源3’区、其同源侧翼区或其组合;(b) 通过靶向整合经***第二串联构建体而修饰的内源性第二基因座,该第二串联构建体包含(i)第二基因座的同源5’区、其同源侧翼区或其组合;(ii)一个或多个第二可选择性标记物;(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v)第二基因座的同源3’区、其同源侧翼区或其组合;或(c)(a)和(b)的组合。
本发明还涉及在丝状真菌菌株中产生具有生物活性的多种重组多肽的方法,其包括:
(A)在有益于产生多肽的条件下培养丝状真菌宿主细胞,其中该丝状真菌宿主细胞包含:(a)通过靶向整合经***第一串联构建体而修饰的内源性第一基因座,该第一串联构建体包含(i)第一基因座的同源5’区、其同源侧翼区或其组合,(ii)一个或多个第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v)第一基因座的同源3’区、其同源侧翼区或其组合;(b)通过靶向整合经***第二串联构建体而修饰的内源性第二基因座,该第二串联构建体包含(i)第二基因座的同源5’区、其同源侧翼区或其组合,(ii)一个或多个第二可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v)第二基因座的同源3’区、其同源侧翼区或其组合;或 (c)(a)和(b)的组合;以及
(B)回收多种重组多肽。
本发明还涉及串联构建体,其包含:(i)基因座的同源5’区、其同源侧翼区或其组合;(ii)一个或多个可选择性标记物;(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸;(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸;和(v)基因座的同源3’区、其同源侧翼区或其组合。
附图说明
图1示出质粒pAG43的限制性酶切图谱。
图2示出质粒pSMai214的限制性酶切图谱。
图3示出质粒pDM287的限制性酶切图谱。
图4示出阳性转化体对于β-葡糖苷酶活性的比较:pDM287的45 个转化子与pEJG107+pSMai214的45个转化子之间。
图5示出质粒pDM286的限制性酶切图谱。
图6示出质粒pDM290的限制性酶切图谱。
图7示出质粒pJfyS142的限制性酶切图谱。
图8示出质粒pJfyS144的限制性酶切图谱。
图9示出质粒pJfyS139的限制性酶切图谱。
图10示出质粒pQM18的限制性酶切图谱。
图11示出质粒pQM21的限制性酶切图谱。
图12示出质粒pAG121的限制性酶切图谱。
图13示出质粒pRRAB01的限制性酶切图谱。
图14示出质粒pDFng113-3的限制性酶切图谱。
图15示出质粒pAmFs074的限制性酶切图谱。
图16示出质粒pQM22的限制性酶切图谱。
具体实施方式
定义
乙酰木聚糖酯酶:术语“乙酰木聚糖酯酶”是指催化乙酰基从聚合木聚糖、乙酰化木糖、乙酰化葡萄糖、乙酸α-萘酯和乙酸对硝基苯酯水解的羧酸酯酶(E.C.3.1.1.72)。出于本发明的目的,乙酰木聚糖酯酶的活性是使用在含0.01%TWEENTM 20(聚氧乙烯失水山梨醇单月桂酸酯)的50mM乙酸钠pH 5.0中的0.5mM乙酸对硝基苯酯作为底物而确定的。一个单位的乙酰木聚糖酯酶被定义为能够在pH 5、25℃下每分钟释放1微摩尔(μmole)对硝基苯酚阴离子的酶量。
等位变体(allelic variant):术语“等位变体”是指占据同一染色体基因座的基因的两种或更多种(例如,几种)可选形式中的任意种。等位变化通过突变而自然发生,并可能引起种群内的多态性。基因突变可以是沉默的(在所编码的多肽中没有变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体所编码的多肽。
α-L-***呋喃糖苷酶:术语“α-L-***呋喃糖苷酶”是指催化α-L-***糖苷中末端非还原性α-L-***呋喃糖苷残基的水解的α-L-***呋喃糖苷***呋喃水解酶(alpha-L-arabinofuranoside arabinofuranohydrolase)(E.C.3.2.1.55)。该酶作用于α-L-***呋喃糖苷、含有(1,3)-和/或(1,5)-键的α-L-***聚糖、***木聚糖、和***半乳聚糖。α-L-***呋喃糖苷酶也称为***糖苷酶、α-***糖苷酶、α-L-***糖苷酶、α-***呋喃糖苷酶、多糖α-L-***呋喃糖苷酶、α-L-***呋喃糖苷水解酶、L-***糖苷酶、或α-L-***聚糖酶。出于本发明的目的,α-L-***呋喃糖苷酶的活性是使用总体积200μl的100mM乙酸钠pH 5中的每ml 5mg中等粘度小麦***木聚糖(Megazyme International Ireland,Ltd.,Bray,Co.Wicklow,爱尔兰)在40℃下30分钟,随后通过HPX-87H柱层析 (Bio-Rad Laboratories,Inc.,Hercules,CA,美国)的***糖分析而确定的。
α-葡糖醛酸糖苷酶:术语“α-葡糖醛酸糖苷酶”是指催化α-D-葡糖苷酸水解为D-葡糖醛酸和醇的α-D-葡糖苷酸葡糖醛酸水解酶 (alpha-D-glucosiduronateglucuronohydrolase)(E.C.3.2.1.139)。出于本发明的目的,α-葡糖醛酸糖苷酶活性是根据de Vries,1998,J. Bacteriol.180:243-249而确定的。一个单位的α-葡糖醛酸糖苷酶等于能够在pH 5、40℃下每分钟释放1微摩尔的葡糖醛酸或4-O-甲基葡糖醛酸的酶量。
天冬氨酸蛋白酶:术语“天冬氨酸蛋白酶”是指使用天冬氨酸残基来催化肽和蛋白中肽键的水解的蛋白酶。天冬氨酸蛋白酶是使用天冬氨酸残基来催化它们的肽底物的水解的蛋白酶家族。一般情况下,它们在活性位点中具有两个高度保守的天冬氨酸盐(酯),且在酸性pH 下活性最佳(Szecsi,1992,Scand.J.Clin.Lab.In vest.Suppl.210:5–22)。出于本发明的目的,天冬氨酸蛋白酶活性根据Aikawa等人、2001,J. Biochem.129:791-794描述的过程来确定。
β-葡糖苷酶:术语“β-葡糖苷酶”是指催化末端非还原性β-D-葡萄糖残基的水解并释放β-D-葡萄糖的β-D-葡糖苷葡糖水解酶 (beta-D-glucoside glucohydrolase)(E.C.3.2.1.21)。出于本发明的目的,β-葡糖苷酶活性是根据Venturi等人,2002,Extracellular beta-D-glucosidase from Chaetomium thermophilumvar.coprophilum: production,purification and some biochemical properties,J.Basic Microbiol.42:55-66的过程使用对硝基苯基-β-D-吡喃葡糖苷作为底物而确定的。一个单位的β-葡糖苷酶被定义为在25℃、pH 4.8下在含 0.01%20的50mM柠檬酸钠中从作为底物的1mM对硝基苯基-β-D-吡喃葡糖苷中每分钟生产1.0微摩尔对硝基苯酚阴离子。
β-木糖苷酶:术语“β-木糖苷酶”是指催化短β-(4)-低聚木糖的外水解以从非还原性末端去除连续的D-木糖残基的β-D-木糖苷木糖水解酶(EC 3.2.1.37)。出于本发明的目的,一个单位的β-木糖苷酶被定义为在40℃、pH 5下在含0.01%20的100mM柠檬酸钠中从作为底物的1mM对硝基苯基-β-D-木糖苷中每分钟生产1.0微摩尔对硝基苯酚阴离子。
cDNA:术语“cDNA”是指可以通过反转录从成熟的、剪接的从真核或原核细胞获得的mRNA分子制备而来的DNA分子。cDNA缺少可以存在于对应基因组DNA中的内含子序列。最初的初级RNA转录体是在呈现为成熟剪接的mRNA前的经由一系列步骤包括剪接而加工的mRNA的前体。
纤维二糖水解酶:术语“纤维二糖水解酶”是指催化纤维素、纤维寡糖、或任何含有β-1,4-连接的葡萄糖的聚合物中1,4-β-D-糖苷键的水解以从链的还原末端或非还原末端释放纤维二糖的1,4-β-D-葡聚糖纤维二糖水解酶(E.C.3.2.1.91和E.C.3.2.1.176)(Teeri,1997,Crystalline cellulose degradation:New insight into the functionof cellobiohydrolases, Trends in Biotechnology 15:160-167;Teeri等人,1998,Trichoderma reesei cellobiohydrolases:why so efficient on crystallinecellulose? Biochem.Soc.Trans.26:173-178)。纤维二糖水解酶活性根据Lever等人,1972,Anal.Biochem.47:273-279;van Tilbeurgh等人,1982,FEBS Letters, 149:152-156;van Tilbeurgh and Claeyssens,1985,FEBS Letters,187: 283-288;以及Tomme等人,1988,Eur.J.Biochem.170:575-581描述的过程来确定。在本发明中,Tomme等人的方法可被用于确定纤维二糖水解酶的活性。
纤维分解酶或纤维素酶:术语“纤维分解酶”或“纤维素酶”是指一种或多种(例如,几种)水解纤维素材料的酶。这样的酶包括内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶或其组合。测量纤维分解活性的两种基本方法包括:(1)测量总纤维分解活性,和(2)测量单独的纤维分解活性(内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶),如 Zhang等人,Outlookfor cellulase improvement:Screening and selection strategies,2006,Biotechnology Advances 24:452-481所综述的。总纤维分解活性通常是使用不溶性底物来测量的,该底物包括Whatman№1 滤纸、微晶纤维素、细菌纤维素、藻类纤维素、棉花、经预处理的木质纤维素等。最常见的总纤维分解活性检定是使用Whatman№1滤纸作为底物的滤纸检定。该检定是由国际纯粹与应用化学联合会 (International Union of Pure andApplied Chemistry,IUPAC)确立的 (Ghose,1987,Measurement of cellulaseactivities,Pure Appl.Chem.59: 257-68)。
出于本发明的目的,纤维分解酶活性通过测量在下述条件下由纤维素分解酶进行的纤维素材料的水解的增加而加以确定:l~50mg纤维分解酶蛋白/g PCS中纤维素(或其他经预处理的纤维素材料),在合适的温度例如50℃、55℃或60℃下3~7天,与未添加纤维分解酶蛋白的对照水解相比较。通常条件为:1ml反应物,经洗涤或未洗涤的PCS, 5%不溶性固体,50mM乙酸钠pH 5,1mM MnSO4,50℃、55℃或 60℃,72小时,通过HPX-87H柱(Bio-Rad Laboratories,Inc., Hercules,CA,美国)进行糖分析。
纤维素材料:术语“纤维素材料”是指包含纤维素的任何材料。在生物质的初生细胞壁中的主要多糖是纤维素,其次丰富的是半纤维素,而第三是果胶。在细胞停止生长后产生的次生细胞壁也含有多糖,且次生细胞壁通过与半纤维素共价交联的聚合木质素而进行加强。纤维素是脱水纤维二糖的均聚物,并且因此是直链β-(l-4)-D-葡聚糖;而半纤维素包括多种化合物,例如木聚糖、木葡聚糖(xyloglucan)、***木聚糖和甘露聚糖,处于具有系列取代基的复杂分支结构。尽管通常是多晶形的,存在于植物组织中的纤维素主要是平行葡聚糖链的不溶晶体基质。半纤维素通常与纤维素以及其他半纤维素以氢键相连,这帮助稳定细胞壁基质。
纤维素通常见于例如植物的茎、叶、壳、皮和穗轴,或树的叶、枝和木材。纤维素材料可以是,但不限于,农业残余物、草本材料(包括能量作物)、城市固体废物、纸浆与造纸厂残余物、废纸和木材(包括林业残余物)(参见,例如,Wiselogel等,1995,于Handbook onBioethanol(Charles E.Wyman编辑),pp.105-118,Taylor&Francis, Washington D.C.;Wyman,1994,Bioresource Technology 50:3-16;Lynd, 1990,Applied Biochemistry andBiotechnology 24/25:695-719;Mosier等人,1999,Recent Progress in Bioconversionof Lignocellulosics,于 Advances in Biochemical Engineering/Biotechnology,T.Scheper主编, Volume 65,pp.23-40,Springer-Verlag,New York)。在本文中应理解的是,纤维素可以是木质纤维素的形式,即在混合基质中包含木质素、纤维素和半纤维素的植物细胞壁材料。在优选的方面,纤维素材料是任何生物质材料。在另一个优选的方面,纤维素材料是木质纤维素,其包含纤维素、半纤维素和木质素。
在一个方面,纤维素材料是农业残余物。在另一个方面,纤维素材料是草本材料(包括能量作物)。在另一个方面,纤维素材料是城市固体废物。在另一个方面,纤维素材料是纸浆和造纸厂残余物。在另一个方面,纤维素材料是废纸。在另一个方面,纤维素材料是木材(包括林业残余物)。
在另一个方面,纤维素材料是芦竹。在另一个方面,纤维素材料是甘蔗渣。在另一个方面,纤维素材料是竹。在另一个方面,纤维素材料是玉米穗轴。在另一个方面,纤维素材料是玉米纤维。在另一个方面,纤维素材料是玉米秸秆。在另一个方面,纤维素材料是芒草。在另一个方面,纤维素材料是橘皮。在另一个方面,纤维素材料是稻杆。在另一个方面,纤维素材料是柳枝稷。在另一个方面,纤维素材料是麦杆。
在另一个方面,纤维素材料是山杨。在另一个方面,纤维素材料是桉树。在另一个方面,纤维素材料是冷杉。在另一个方面,纤维素材料是松树。在另一个方面,纤维素材料是白杨。在另一个方面,纤维素材料是云杉。在另一个方面,纤维素材料是柳树。
在另一个方面,纤维素材料是藻类纤维素。在另一个方面,纤维素材料是细菌纤维素。在另一个方面,纤维素材料是棉绒。在另一个方面,纤维素材料是滤纸。在另一个方面,纤维素材料是微晶纤维素。在另一个方面,纤维素材料是磷酸处理的纤维素。
在另一个方面,纤维素材料是水生生物质。如本文所使用的,术语“水生生物质”是指在水生环境中由光合作用过程产生的生物质。水生生物质可以为藻类、挺水植物、浮叶植物或沉水植物。
如本文所述,纤维素材料可以使用本领域已知的常规方法按原样使用或进行预处理。在优选的方面,纤维素材料被预处理。
编码序列:术语“编码序列”是指直接指定多肽的氨基酸序列的多核苷酸。编码序列的边界一般由开放阅读框确定,开放阅读框以起始密码子如ATG、GTG或TTG开始并以终止密码子如TAA、TAG或 TGA结束。编码序列可以是基因组DNA、cDNA、合成DNA或其组合。
控制序列:术语“控制序列”是指编码多肽的多核苷酸在表达时所必需的核酸序列。各个控制序列对于编码多肽的多核苷酸可以是内生的(即,来自相同基因)或外来的(即,来自不同基因)或彼此为内生或外来的。这些控制序列包括但不限于前导序列、多腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。在最低限度,控制序列包括启动子、以及转录和翻译终止信号。控制序列可以设有接头,以用于导入特定的促进控制序列与编码多肽的多核苷酸编码区进行连接的限制性酶切位点。
异位整合:术语“异位整合”是指向微生物的基因组在非靶位点或除其通常的染色体基因座以外的位点***核酸,即,随机整合。
内切葡聚糖酶:术语“内切葡聚糖酶”是指催化纤维素、纤维素衍生物(例如羧甲基纤维素和羟乙基纤维素)、地衣多糖中的1,4-β-D- 糖苷键的内水解(endohydrolysis),催化混合的β-1,3-葡聚糖例如谷类β-D-葡聚糖或木葡聚糖以及含有纤维素组分的其他植物材料中的β-1,4 键的内水解的内切-1,4-(1,3;1,4)-β-D-葡聚糖4-葡聚糖水解酶 (endo-1,4-(1,3;1,4)-beta-D-glucan 4-glucanohydrolase)(E.C.3.2.1.4)。内切葡聚糖酶的活性可以通过测量底物粘度的减少或由还原糖检定 (Zhang等人,2006,BiotechnologyAdvances 24:452-481)确定的还原端的增加来确定。出于本发明的目的,内切葡聚糖酶的活性根据Ghose, 1987,Pure and Appl.Chem.59:257-268的方法,在pH 5、40℃下使用羧甲基纤维素(CMC)作为底物而确定。
表达:术语“表达”包括在多肽生产中涉及的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。
表达载体:术语“表达载体”是指包含编码多肽的多核苷酸并与提供用于其表达的控制序列可操作地连接的线性或环状DNA分子。
糖苷水解酶61家族:术语“糖苷水解酶61家族”或“GH61家族”或“GH61”是指根据Henrissat B.,1991,A classification of glycosyl hydrolases based on amino-acidsequence similarities,Biochem.J.280: 309-316及Henrissat B.和Bairoch A.,1996,Updating the sequence-based classification of glycosyl hydrolases,Biochem.J.316:695-696而落入糖苷水解酶61家族的多肽。原先,该家族中的酶基于一个家族成员中测量的非常弱的内切-1,4-β-D-葡聚糖酶活性而归类为糖苷水解酶家族。这些酶的结构和作用模式是非公认的,且它们无法被视为真正的糖苷酶。然而,基于它们在与纤维素酶或纤维素酶的混合物一同使用时增强木质纤维素分解的能力,它们被保留在CAZy分类中。
阿魏酸酯酶:术语“阿魏酸酯酶”是指催化4-羟基-3-甲氧基肉桂酰(阿魏酰)基团从酯化的糖(在天然生物质底物中通常为***糖) 中水解以产生阿魏酸酯(盐)(4-羟基-3-甲氧基肉桂酸酯(盐))的4- 羟基-3-甲氧基肉桂酰-糖水解酶(EC 3.1.1.73)。阿魏酸酯酶也被称为阿魏酸酯酶、羟基肉桂酰基酯酶、FAE-III、肉桂酸酯水解酶、FAEA、 cinnAE、FAE-I或FAE-II。出于本发明的目的,阿魏酸酯酶的活性是使用50mM乙酸钠pH 5.0中的0.5mM阿魏酸对硝基苯酯作为底物而确定的。一个单位的阿魏酸酯酶等于能够在pH 5、25℃下每分钟释放1 微摩尔对硝基苯酚阴离子的酶量。
侧翼:术语“侧翼”是指在特定DNA序列、基因座或基因的任一侧延伸的DNA序列。侧翼DNA紧邻将要整合到丝状真菌细胞的基因组中的另一DNA序列、基因座或基因。
片段:术语“片段”是指在成熟多肽域的氨基端和/或羧基端缺少一个或多个(如,几个)氨基酸的多肽;其中该片段具有酶活性。在一方面,片段含有酶的成熟多肽的至少85%,例如至少90%或至少95%的氨基酸残基。
半纤维素分解酶或半纤维素酶:术语“半纤维素分解酶”或“半纤维素酶”是指一种或多种(例如,几种)水解半纤维素材料的酶。参见,例如Shallom,D.和Shoham,Y.Microbialhemicellulases.Current Opinion In Microbiology,2003,6(3):219-228)。半纤维素酶是植物生物质降解中的关键组分。半纤维素酶的实例包括,但不限于,乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、***聚糖酶、***呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖苷酸酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶和木糖苷酶。这些酶的底物,半纤维素,是支链和直链多糖的混杂群,它们通过氢键键合于植物细胞壁中的纤维素微纤维,将其交联为稳定网路。半纤维素亦共价地附于木质素,与纤维素一同形成高度复杂的结构。半纤维素的可变结构和组织需要许多酶的协同作用来使其完全降解。半纤维素酶的催化单元为水解糖苷键的糖苷水解酶(GH),或水解乙酸酯或阿魏酸侧基的酯键的糖酯酶(CE)。这些催化单元,基于其一级序列的同源性,可分类到GH和CE家族。具有总体上类似的折叠的一些家族还可以归类为宗族,按字母顺序标记(例如,GH-A)。这些和其他糖类活性酶的最具信息性和最新的分类可以在糖类活性酶(CAZy)数据库中获得。半纤维素分解酶活性可以根据Ghose和Bisaria,1987,Pure&Appl.Chem. 59:1739-1752在合适的温度例如50℃、55℃或60℃以及pH例如5.0 或5.5下进行测量。
高等严格条件:术语“高等严格条件”是指至少100个核苷酸长度的探针于42℃在5×SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼***DNA和50%甲酰胺中预杂交和杂交,遵循标准DNA印迹程序进行12至24小时。载体材料最后使用2×SSC、0.2%SDS在65℃洗涤三次,每次15分钟。
同源3’或5’区:术语“同源3’区”是指以下DNA片段,其与基因组中区域的序列相同或者序列同一性为至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%,并且当与同源5’区结合时可以通过同源重组将一条DNA靶向整合至基因组中的特定位点。术语“同源5’区”是指以下DNA片段,其与基因组中区域的序列相同,并且当与同源3’区结合时可以通过同源重组将一条DNA靶向整合至基因组中的特定位点。同源5’和3’区必须连接在基因组中,这意味着它们处于同一染色体中,彼此在至少200kb内。
同源侧翼区:术语“同源侧翼区”是指以下DNA片段,其与基因组中区域的序列相同或者序列同一性为至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%,并且紧邻基因组中的细胞外DNA靶向整合入的特定位点的上游或下游。
同源重复:术语“同源重复”是指在导入宿主细胞的重组DNA中重复至少两次且可以通过同源重组而促进DNA(即,插在两个同源重复之间的可选择性标记物)的丢失的DNA片段。
宿主细胞:术语“宿主细胞”是指对具有含编码多肽的多核苷酸的核酸构建体或表达载体的转化、转染、转导等敏感的任何细胞类型。术语“宿主细胞”包括由于复制过程中发生的突变而不与亲本细胞相同的任何亲本细胞后代。
分离的:术语“分离的”是指,处于非天然发生的形式或环境中的物质。分离的物质的非限制性实例包括(1)任何非天然发生的物质; (2)包括但不限于任何酶、变体、核酸、蛋白、肽或辅助因子的任何物质,其至少部分地从与其天然相关联的一种或多种或所有天然发生成分中移出;(3)相对于天然发现的物质,经人工修饰的任何物质;或者(4)通过增加物质相对于与其天然相关的其他组分的含量而修饰的任意物质(例如,宿主细胞中的重组生产;多个拷贝的物质编码基因;相比于与编码物质的基因天然相关的启动子,使用更强的启动子)。
低等严格条件:术语“低等严格条件”是指,长度为至少100个核苷酸的探针,在42℃下,在5×SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼***DNA和25%甲酰胺中预杂交并杂交,遵循标准DNA 印迹过程进行12~24个小时。载体材料最终使用2×SSC、0.2%SDS在50℃下洗涤三次,每次15分钟。
成熟多肽:术语“成熟多肽”是指翻译和任何翻译后修饰例如N- 端加工、C-端截短、糖基化、磷酸化等之后的最终形式的多肽。在一方面,基于预测SEQ ID NO:2的氨基酸1~17是信号肽的SignalP程序 (Nielsen等人,1997,Protein Engineering 10:1-6),里氏木霉(T.Reesei) 纤维二糖水解酶I的成熟多肽是SEQ ID NO:2的氨基酸18~514。另一方面,基于预测SEQ ID NO:4的氨基酸1~18是信号肽的SignalP程序,里氏木霉纤维二糖水解酶II的成熟多肽是SEQ ID NO:4的氨基酸 19~471。另一方面,基于预测SEQ ID NO:6的氨基酸1~22是信号肽的SignalP程序,里氏木霉内切葡聚糖酶I的成熟多肽是SEQ ID NO:6的氨基酸23~459。另一方面,基于预测SEQ ID NO:8的氨基酸1~21 是信号肽的SignalP程序,里氏木霉内切葡聚糖酶II的成熟多肽是SEQ ID NO:8的氨基酸22~418。另一方面,基于预测SEQ ID NO:10的氨基酸1~19是信号肽的SignalP程序,里氏木霉β-葡糖苷酶的成熟多肽是SEQ ID NO:10的氨基酸20~744。另一方面,基于预测SEQ ID NO: 12的氨基酸1~19是信号肽的SignalP程序,里氏木霉木聚糖酶I的成熟多肽是SEQ ID NO:12的氨基酸20~229。另一方面,基于预测SEQ ID NO:14的氨基酸1~19是信号肽的SignalP程序,里氏木霉木聚糖酶II 的成熟多肽是SEQ ID NO:14的氨基酸20~223。另一方面,基于预测 SEQ ID NO:16的氨基酸1~16是信号肽的SignalP程序,里氏木霉木聚糖酶III的成熟多肽是SEQ ID NO:16的氨基酸17~347。另一方面,基于预测SEQ ID NO:18的氨基酸1~20是信号肽的SignalP程序,里氏木霉β-木糖苷酶的成熟多肽是SEQ ID NO:18的氨基酸21~797。另一方面,基于预测SEQ ID NO:20的氨基酸1~18是信号肽的SignalP程序,里氏木霉膨胀因子的成熟多肽是SEQ ID NO:20的氨基酸19~493。另一方面,基于预测SEQ ID NO:22的氨基酸1~19是信号肽的SignalP 程序,里氏木霉的枯草杆菌蛋白酶样丝氨酸蛋白酶的成熟多肽是SEQ IDNO:22的氨基酸20~882。另一方面,基于预测SEQ ID NO:24的氨基酸1~20是信号肽的SignalP程序,里氏木霉天冬氨酸蛋白酶的成熟多肽是SEQ ID NO:24的氨基酸21~407。另一方面,基于预测SEQ ID NO:26的氨基酸1~19是信号肽的SignalP程序,里氏木霉胰蛋白酶样丝氨酸蛋白酶的成熟多肽是SEQ ID NO:26的氨基酸20~259。另一方面,基于预测SEQID NO:28的氨基酸1~15是信号肽的SignalP程序,另一种里氏木霉枯草杆菌蛋白酶样丝氨酸蛋白酶的成熟多肽是SEQ ID NO:28的氨基酸16~540。另一方面,基于预测SEQ ID NO:30的氨基酸1~17是信号肽的SignalP程序,另一种里氏木霉天冬氨酸蛋白酶的成熟多肽是SEQ ID NO:30的氨基酸18~395。在本领域已知宿主细胞可以产生由同一多核苷酸表达的两种或更多种不同成熟多肽(例如,具有不同的C-端和/或N-端氨基酸)的混合物。
成熟多肽编码序列:术语“成熟多肽编码序列”是指编码具有酶活性的成熟多肽的多核苷酸。在一方面,基于预测SEQ ID NO:1的核苷酸1~51编码信号肽的SignalP程序,里氏木霉纤维二糖水解酶I的成熟多肽编码序列是SEQ ID NO:1的核苷酸52~1545或其cDNA序列。另一方面,基于预测SEQ ID NO:3的核苷酸1~54编码信号肽的SignalP 程序,里氏木霉纤维二糖水解酶II的成熟多肽编码序列是SEQ ID NO: 3的核苷酸55~1608或其cDNA序列。另一方面,基于预测SEQ ID NO: 5的核苷酸1~66编码信号肽的SignalP程序,里氏木霉内切葡聚糖酶I 的成熟多肽编码序列是SEQ ID NO:5的核苷酸67~1374或其cDNA序列。另一方面,基于预测SEQ ID NO:7的核苷酸1~63编码信号肽的 SignalP程序,里氏木霉内切葡聚糖酶II的成熟多肽编码序列是SEQ ID NO:7的核苷酸64~1254或其cDNA序列。另一方面,基于预测SEQ ID NO:9的核苷酸1~57编码信号肽的SignalP程序,里氏木霉β-葡糖苷酶的成熟多肽编码序列是SEQ ID NO:9的核苷酸58~2612或其cDNA 序列。另一方面,基于预测SEQ ID NO:11的核苷酸1~57编码信号肽的SignalP程序,里氏木霉木聚糖酶I的成熟多肽编码序列是SEQ ID NO:11的核苷酸58~749或其cDNA序列。另一方面,基于预测SEQ IDNO:13的核苷酸1~57编码信号肽的SignalP程序,里氏木霉木聚糖酶 II的成熟多肽编码序列是SEQ ID NO:13的核苷酸58~778或其cDNA 序列。另一方面,基于预测SEQ ID NO:15的核苷酸1~48编码信号肽的SignalP程序,里氏木霉木聚糖酶III的成熟多肽编码序列是SEQID NO:15的核苷酸49~1349或其cDNA序列。另一方面,基于预测SEQ ID NO:17的核苷酸1~60编码信号肽的SignalP程序,里氏木霉β-木糖苷酶的成熟多肽编码序列是SEQ ID NO:17的核苷酸61~2391或其 cDNA序列。另一方面,基于预测SEQ ID NO:19的核苷酸1~54编码信号肽的SignalP程序,里氏木霉膨胀因子的成熟多肽编码序列是SEQ ID NO:19的核苷酸55~2776或其cDNA序列。另一方面,基于预测 SEQ ID NO:21的核苷酸1~57编码信号肽的SignalP程序,里氏木霉枯草杆菌蛋白酶样丝氨酸蛋白酶的成熟多肽编码序列是SEQ IDNO:21 的核苷酸58~2774。另一方面,基于预测SEQ ID NO:23的核苷酸1~60 编码信号肽的SignalP程序,里氏木霉天冬氨酸蛋白酶的成熟多肽编码序列是SEQ ID NO:23的核苷酸61~1299。另一方面,基于预测SEQ ID NO:25的核苷酸1~57编码信号肽的SignalP程序,里氏木霉胰蛋白酶样蛋白酶的成熟多肽编码序列是SEQ ID NO:25的核苷酸58~930。另一方面,基于预测SEQ ID NO:27的核苷酸1~45编码信号肽的SignalP 程序,另一种里氏木霉枯草杆菌蛋白酶样丝氨酸蛋白酶的成熟多肽编码序列是SEQ ID NO:27的核苷酸46~1681。另一方面,基于预测SEQ ID NO:29的核苷酸1~51编码信号肽的SignalP程序,另一种里氏木霉天冬氨酸蛋白酶的成熟多肽编码序列是SEQ ID NO:29的核苷酸 52~1339。
中等严格条件:术语“中等严格条件”是指,长度为至少100个核苷酸的探针,在42℃下,在5×SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼***DNA和35%甲酰胺中预杂交并杂交,按照标准DNA 印迹过程进行12~24个小时。载体材料最终使用2×SSC、0.2%SDS在55℃下洗涤三次,每次15分钟。
中到高等严格条件:术语“中到高等严格条件”是指,长度为至少100个核苷酸的探针,在42℃下,在5×SSPE、0.3%SDS、200微克 /ml剪切并变性的鲑鱼***DNA和35%甲酰胺中预杂交并杂交,按照标准DNA印迹过程进行12~24个小时。载体材料最终使用2×SSC、0.2%SDS在60℃下洗涤三次,每次15分钟。
核酸构建体:术语“核酸构建体”是指单链或双链的核酸分子,其从天然存在的基因中分离出或以自然中不会出现或是合成的方式修饰成包含核酸片段,其包含一个或多个(例如,几个)控制序列。
可操作地连接:术语“可操作地连接”是指一种构造,其中控制序列位于相对于多核苷酸的编码序列为合适的位置,从而使控制序列引导编码序列的表达。
具有纤维素分解增强活性的多肽:术语“具有纤维素分解增强活性的多肽”是指通过具有纤维素分解活性的酶来催化纤维素材料水解的增强的GH61多肽。出于本发明的目的,通过测量由纤维素分解酶在下述条件下水解纤维素材料而来的还原糖的增加或纤维二糖与葡萄糖总量的增加来确定纤维素分解增强活性:PCS中的l~50mg总蛋白/g 纤维素,其中总蛋白包含50~99.5%w/w的纤维素分解酶蛋白和 0.5~50%w/w的具有纤维素分解增强活性的GH61多肽的蛋白,在合适的温度例如50℃、55℃或60℃以及pH例如5.0或5.5下1~7天,与用等量的无纤维素分解增强活性的总蛋白加载量(PCS中的l~50mg纤维素分解蛋白/g纤维素)所进行的对照水解相比。在优选的方面,在 2~3%总蛋白质重量的米曲霉(Aspergillus oryzae)β-葡糖苷酶(根据 WO 02/095014在米曲霉中重组产生)或2~3%总蛋白质重量的烟曲霉 (Aspergillus fumigatus)β-葡糖苷酶(根据WO 2002/095014在米曲霉中重组产生)的纤维素酶蛋白质加载量的存在下将 1.5L(NovozymesA/S,Denmark)的混合物用作纤维素分解活性的来源。
具有纤维素分解增强活性的GH61多肽通过降低达到相同水解程度所需的纤维素分解酶的量来增强由具有纤维素分解活性的酶催化的纤维素材料的水解,优选降低至少1.01倍,例如至少1.05倍、至少1.10 倍、至少1.25倍、至少1.5倍、至少2倍、至少3倍、至少4倍、至少5倍、至少10倍或至少20倍。
经预处理的玉米秸秆:术语“PCS”或“经预处理的玉米秸秆”是指通过用热和稀硫酸处理、碱预处理或中性预处理而得自玉米秸秆的纤维素材料。
序列同一性:两个氨基酸序列之间或两个核苷酸序列之间的关联性通过参数“序列同一性”来描述。
出于本发明的目的,使用在EMBOSS软件包(EMBOSS:The European MolecularBiology Open Software Suite(欧洲分子生物学开放软件包),Rice等人,2000,TrendsGenet.16:276-277)(优选5.0.0或更新版本)的Needle程序中执行的Needleman-Wunsch算法(Needleman and Wunsch,1970,J.Mol.Biol.48:443-453),来确定两个氨基酸序列之间的序列同一性。所使用的参数是,空位开放罚分为10,空位扩展罚分为0.5,以及EBLOSUM62(BLOSUM62的EMBOSS版本)替换矩阵。Needle标记的“最长同一性”的输出(使用-nobrief选项得到的) 被用作百分比同一性并计算如下:
(相同残基×100)/(比对长度-比对中的空位总数)。
出于本发明的目的,使用在EMBOSS软件包(EMBOSS:The European MolecularBiology Open Software Suite(欧洲分子生物学开放软件包),Rice等人,2000,同上)(优选5.0.0或更新版本)的Needle 程序中执行的Needleman-Wunsch算法(Needleman andWunsch,1970,同上),来确定两个脱氧核糖核苷酸序列之间的序列同一性。所使用的参数是,空位开放罚分为10,空位扩展罚分为0.5,以及EDNAFULL (NCBI NUC4.4的EMBOSS版本)替换矩阵。Needle标记的“最长同一性”的输出(使用-nobrief选项得到的)被用作百分比同一性并计算如下:
(相同的脱氧核糖核苷酸×100)/(比对长度-比对中的空位总数)。
子序列:术语“子序列”是指从成熟多肽编码序列的5'和/或3'端缺失一个或多个(例如,几个)核苷酸的多核苷酸;其中子序列编码具有酶活性的片段。在一个方面,子序列含有酶的成熟多肽编码序列的至少85%,例如,至少90%或至少95%的核苷酸。
枯草杆菌蛋白酶样丝氨酸蛋白酶:术语“枯草杆菌蛋白酶样丝氨酸蛋白酶”是指底物特异性类似于枯草杆菌蛋白酶的蛋白酶,枯草杆菌蛋白酶使用丝氨酸残基来催化肽和蛋白中肽键的水解。枯草杆菌蛋白酶样蛋白酶(枯草杆菌酶)为丝氨酸蛋白酶,其特征在于三个氨基酸天冬氨酸、组氨酸和丝氨酸的催化三联体(catalytic triad)。这些催化残基的排布为来自地衣芽孢杆菌(Bacillus licheniformis)的原型枯草杆菌蛋白酶所共有(Siezen和Leunissen,1997,Protein Science 6:501-523)。枯草杆菌蛋白酶样丝氨酸蛋白酶的活性可以使用合成的底物N-琥珀酰-L-Ala-L-Ala-L-Pro-L-Phe-对硝基酰苯胺(AAPF)(Bachem AG,Bubendorf,瑞士)于100mM NaCl-100mM MOPS pH 7.0中在50℃下3小时并接着测量在405nm处吸光度而确定。
靶向整合:术语“靶向整合”是指细胞外DNA在指定的基因组基因座处的稳定整合。
转化体:术语“转化体”是指已接纳胞外DNA(外来的、人工的或修饰的)并表达包含其中的基因的细胞。
转化:术语“转化”是指将胞外DNA导入细胞,即,由从其周围直接摄入、整合并表达外来遗传物质(外来DNA)以及经细胞膜接收而引起的细胞的遗传改变。
转化效率:术语“转化效率”是指细胞能够摄入胞外DNA并表达其中所含的基因的效率,转化效率通过将表达基因的阳性转化体的数目除以转化过程中使用的DNA量来计算。
胰蛋白酶样丝氨酸蛋白酶:术语“胰蛋白酶样丝氨酸蛋白酶”是指底物特异性类似于胰蛋白酶的蛋白酶,胰蛋白酶使用丝氨酸残基来催化肽和蛋白中肽键的水解。出于本发明的目的,胰蛋白酶样丝氨酸蛋白酶的活性是根据Dienes等人,2007,Enzyme andMicrobial Technology 40:1087-1094所述的方法而确定的。
变体:术语“变体”是指,在一个或多个(例如,几个)位置上包含改变(即替换、***和/或缺失)的具有酶活性的多肽。替换是指用不同的氨基酸取代占据位置的氨基酸;缺失是指去除占据位置的氨基酸;而***是指将氨基酸添加至紧邻占据位置的氨基酸。
极高等严格条件:术语“极高等严格条件”是指,长度为至少100 个核苷酸的探针,在42℃下,在5×SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼***DNA和50%甲酰胺中预杂交并杂交,按照标准 DNA印迹过程进行12至24个小时。载体材料最终使用2×SSC、 0.2%SDS在70℃下洗涤三次,每次15分钟。
极低等严格条件:术语“极低等严格条件”是指,长度为至少100 个核苷酸的探针,在42℃下,在5×SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼***DNA和25%甲酰胺中预杂交并杂交,按照标准 DNA印迹过程进行12至24个小时。载体材料最终使用2×SSC、 0.2%SDS在45℃下洗涤三次,每次15分钟。
含木聚糖的材料:术语“含木聚糖的材料”是指任何包含植物细胞壁多糖的材料,植物细胞壁多糖含有β-(1-4)-连接的木糖残基的骨架。陆生植物的木聚糖是具有β-(1-4)-D-吡喃木糖骨架的杂聚物,其由短的糖链分支。它们包含D-葡糖醛酸或其4-O-甲基醚、L-***糖和/或多种由D-木糖、L-***糖、D-或L-半乳糖和D-葡萄糖构成的寡糖。木聚糖类的多糖可以分为均木聚糖(homoxylan)和杂木聚糖 (heteroxylan),包括葡糖醛酸木聚糖、(***)葡糖醛酸木聚糖、(葡糖醛酸)***木聚糖、***木聚糖和复合杂木聚糖。参见,例如 Ebringerova等人,2005,Adv.Polym.Sci.186:1-67。
在本发明的方法中,可以使用任何含有木聚糖的材料。在优选的方面,含木聚糖的材料为木质纤维素。
木聚糖降解活性或木聚糖分解活性:术语“木聚糖降解活性”或“木聚糖分解活性”是指水解含木聚糖的材料的生物学活性。两种基础的测量木聚糖分解活性的方法包括:(1)测量总木聚糖分解活性,和(2)测量单个的木聚糖分解活性(例如,内切木聚糖酶、β-木糖苷酶、***呋喃糖苷酶、α-葡糖醛酸酶、乙酰木聚糖酯酶、阿魏酸酯酶和α-葡糖醛酸酯酶(alpha-glucuronyl esterase))。木聚糖分解酶检定的最新进展被总结于几个公开文献中,包括Biely and Puchard,Recent progress in the assays of xylanolyticenzymes,2006,Journal of the Science of Food and Agriculture 86(11):1636-1647;Spanikova and Biely,2006, Glucuronoyl esterase-Novel carbohydrate esteraseproduced by Schizophyllum commune,FEBS Letters 580(19):4597-4601;Herrmann,Vrsanska,Jurickova,Hirsch,Biely and Kubicek,1997,The beta-D-xylosidase ofTrichoderma reesei is a multifunctional beta-D-xylan xylohydrolase,Biochemical Journal 321:375-381。
总木聚糖降解活性可以通过确定由多种类型的木聚糖形成的还原糖来测量,木聚糖包括,例如,燕麦(oat spelt)、山毛榉材和落叶松材木聚糖,或可以通过光度法确定从多种共价染色的木聚糖中释放出的染色木聚糖片段而测量。最常见的总木聚糖分解活性检定基于由多聚 4-O-甲基葡糖醛酸木聚糖生产还原糖,如Bailey,Biely,Poutanen,1992,Interlaboratory testing of methods for assay of xylanase activity、Journal ofBiotechnology 23(3):257-270中所述。木聚糖酶活性亦可以用0.2% AZCL-***木聚糖作为底物在37℃下于0.01%X-100 (4-(1,1,3,3-四甲基丁基)苯基-聚乙二醇)和200mM磷酸钠缓冲液pH 6 中加以确定。一个单位的木聚糖酶活性定义为在37℃、pH 6下在200 mM磷酸钠pH 6缓冲液中从作为底物的0.2%AZCL-***木聚糖中每分钟产生1.0微摩尔可可碱醋酸钠(azurine)。
出于本发明的目的,木聚糖降解活性是通过在以下通常条件下测量由木聚糖降解酶引起的白桦木聚糖(Sigma Chemical Co.,Inc.,St. Louis,MO,美国)水解的增加而确定的:1ml反应,5mg/ml底物(总固体),5mg木聚糖分解蛋白/g底物,50mM乙酸钠pH 5,50℃,24小时,如Lever,1972,A new reaction for colorimetric determination ofcarbohydrates,Anal.Biochem 47:273-279所述的使用对羟基苯甲酸酰肼 (PHBAH)检定的糖分析。
木聚糖酶:术语“木聚糖酶”是指催化木聚糖中1,4-β-D-木糖苷键的内水解的1,4-β-D-木聚糖-木糖水解酶 (1,4-beta-D-xylan-xylohydrolase)(E.C.3.2.1.8)。出于本发明的目的,木聚糖酶活性是用0.2%AZCL-***木聚糖作为底物在37℃下于 0.01%X-100和200mM磷酸钠缓冲液pH 6中加以确定的。一个单位的木聚糖酶活性定义为在37℃、pH 6下于200mM磷酸钠pH 6缓冲液中从作为底物的0.2%AZCL-***木聚糖中每分钟产生1.0 微摩尔可可碱醋酸钠。
发明详述
本发明涉及构建用于产生具有生物活性的多种重组多肽的丝状真菌菌株的方法,包括:(a)通过向丝状真菌菌株中导入第一串联构建体,通过靶向整合取代内源性第一基因,该第一串联构建体包含(i) 第一基因的同源5’区、其同源侧翼区或其组合,(ii)一个或多个(例如,几个)第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v)第一基因的同源3’区、其同源侧翼区或其组合;(b)通过向丝状真菌菌株中导入第二串联构建体,通过靶向整合取代内源性第二基因,该第二串联构建体包含(i)第二基因的同源5’区、其同源侧翼区或其组合,(ii)一个或多个(例如,几个)第二可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和 (v)第二基因的同源3’区、其同源侧翼区或其组合;或(c)(a)和 (b)的组合。
本发明还涉及串联构建体,其包含:(i)基因的同源5’区、其同源侧翼区或其组合;(ii)一个或多个(例如,几个)可选择性标记物; (iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸;(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸;和(v)基因的同源 3’区、其同源侧翼区或其组合。
本发明还涉及构建用于产生具有生物活性的多种重组多肽的丝状真菌菌株的方法,其包括:(a)通过向丝状真菌菌株中导入第一串联构建体,通过靶向整合***到内源性第一基因座中,该第一串联构建体包含(i)第一基因座的同源5’区、其同源侧翼区或其组合,(ii) 一个或多个第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v)第一基因座的同源3’区、其同源侧翼区或其组合;(b)通过向丝状真菌菌株中导入第二串联构建体,通过靶向整合***到内源性第二基因座中,该第二串联构建体包含(i)第二基因座的同源5’区、其同源侧翼区或其组合,(ii)一个或多个第二可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v) 第二基因座的同源3’区、其同源侧翼区或其组合;或(c)(a)和(b) 的组合。
本发明还涉及串联构建体,其包含:(i)基因座的同源5’区、其同源侧翼区或其组合;(ii)一个或多个第一可选择性标记物;(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸;(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸;和(v)基因座的同源3’区、其同源侧翼区或其组合。
在本发明的方法中,各个串联构建体均通过双同源重组整合至丝状真菌菌株染色体中的目标位点。在一方面,第一基因或第一基因座的同源5’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。另一方面,第一基因或第一基因座的同源3’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。另一方面,第二基因或第二基因座的同源5’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少 800bp、至少1000bp、至少1500bp或至少2000bp。另一方面,第二基因或第二基因座的同源3’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000 bp、至少1500bp或至少2000bp。
本发明的方法还可以包括将一个或多个(例如,几个)其他内源性基因各自通过靶向整合用针对各个基因的对应串联构建体取代,串联构建体包含:(i)基因的同源5’区、其同源侧翼区或其组合;(ii) 一个或多个(例如,几个)可选择性标记物;(iii)与启动子可操作连接的编码具有生物活性的多肽的多核苷酸;(iv)与另一启动子可操作连接的编码具有生物活性的另一多肽的另一多核苷酸;和(v)基因的同源3’区、其同源侧翼区或其组合。
本发明的方法还可以包括向一个或多个(例如,几个)其他内源性基因座中各自通过靶向整合***针对各个基因座的对应串联构建体,该串联构建体包含:(i)基因座的同源5’区、其同源侧翼区或其组合;(ii)一个或多个(例如,几个)可选择性标记物;(iii)与启动子和终止子可操作连接的编码具有生物活性的多肽的多核苷酸;(iv) 与另一启动子和另一终止子可操作连接的编码具有生物活性的另一多肽的另一多核苷酸;和(v)基因座的同源3’区、其同源侧翼区或其组合。
在本发明的方法中,丝状真菌宿主细胞还可以用串联构建体进行转化,该串联构建体包含:(i)一个或多个(例如,几个)可选择性标记物;(ii)与第五启动子和第五终止子可操作连接的编码具有生物活性的第五多肽的第五多核苷酸;和(iii)与第六启动子和第六终止子可操作连接的编码具有生物活性的第六多肽的第六多核苷酸,其中串联构建体通过异位整合来整合。
本发明提供几项优势,包括在丝状真菌宿主中产生多种重组多肽的改良方法;使得一个或多个导入到丝状真菌菌株中的重组多肽可以简单地得以取代和/或缺失的方法(如果一个或多个重组多肽在单个基因座处导入,该一个或多个重组多肽可以在单一步骤中被取代和/或缺失,而不是在多个步骤中);以及使得丝状真菌宿主中存在的一个或多个重组多肽可以简单地得以修饰(如果一个或多个重组多肽在单个基因座处导入,一个或多个这些重组多肽的变体/突变体可以很容易地在单一步骤中加以修饰,而不是在多个步骤中)。本发明构建的丝状真菌菌株的其他优势是可以诱变菌株并选择收率提高的突变体。然后可以将这些突变体的串联构建体用表达新的多种重组多肽的新的串联构建体取代,从而利用作为宿主细胞的突变体的提高的收率生产率。
内源性基因
在本发明的方法中,任何对于丝状真菌菌株来说为内源性的的基因可以被取代,或者可以是基因座。基因对于丝状真菌菌株来说可以是内生的或外来的。术语“内源性基因”或其变型,例如,“内源性第一基因”或“内源性第二基因”将理解成包括一个或多个(例如,几个)基因。当多于一个基因被取代时,基因优选是邻接的。这样的多个基因可以是,例如,代谢通路或其一部分。
内源性基因可以编码选自抗体、抗原、抗微生物肽、酶、生长因子、激素、免疫增强剂(immunodilator)、神经递质、受体、报告蛋白质、结构蛋白或转录因子的多肽。
在一方面,酶选自氧化还原酶、转移酶、水解酶、裂解酶、异构酶和连接酶。另一方面,酶选自乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、氨基肽酶、α-淀粉酶、α-半乳糖苷酶、α-葡糖苷酶、α-1,6-葡糖苷转移酶、***聚糖酶、***呋喃糖苷酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、几丁质酶、香豆酸酯酶、环糊精糖基转移酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、阿魏酸酯酶、具有纤维素分解促进活性的GH61多肽、葡糖脑苷脂酶、葡萄糖氧化酶、葡糖醛酸酶、葡糖醛酸酯酶、卤过氧化物酶(haloperoxidase)、半纤维素酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、甘露聚糖酶、甘露糖苷酶、变聚糖酶(mutanase)、氧化酶、果胶酶、过氧化物酶、磷脂酶、植酸酶、酚氧化酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、尿激酶和木聚糖酶。
另一方面,一个或多个(例如,几个)内源性蛋白酶基因是失活的。另一方面,一个或多个(例如,几个)内源性蛋白酶基因是枯草杆菌蛋白酶样丝氨酸蛋白酶、天冬氨酸蛋白酶和胰蛋白酶样丝氨酸蛋白酶基因,如WO 2011/075677中所述,其通过引用的方式全部并入本文。
另一方面,酶是枯草杆菌蛋白酶样丝氨酸蛋白酶。另一方面,酶是天冬氨酸蛋白酶。另一方面,酶是胰蛋白酶样丝氨酸蛋白酶。
另一方面,酶是内切葡聚糖酶。另一方面,酶是纤维二糖水解酶。另一方面,酶是β-葡糖苷酶。另一方面,酶是具有纤维素分解增强活性的GH61多肽。另一方面,酶是木聚糖酶。另一方面,酶是β-木糖苷酶。另一方面,酶是膨胀因子。另一方面,酶是乙酰木聚糖酯酶。另一方面,酶是阿魏酸酯酶。另一方面,酶是***呋喃糖苷酶。另一方面,酶是葡糖醛酸酶。另一方面,酶是乙酰甘露聚糖酯酶。另一方面,酶是***聚糖酶。另一方面,酶是香豆酸酯酶。另一方面,酶是半乳糖苷酶。另一方面,酶是葡糖醛酸酯酶。另一方面,酶是甘露聚糖酶。另一方面,酶是甘露糖苷酶。
另一方面,内源性基因可以是纤维二糖水解酶I基因。另一方面,纤维二糖水解酶I基因编码选自以下的纤维二糖水解酶I:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶I;(ii)包含与SEQ ID NO:2 的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶I;(iii)由包含与SEQ ID NO:1 的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少 87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少 93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I;和(iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO: 1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I。
另一方面,内源性基因可以是纤维二糖水解酶II基因。另一方面,纤维二糖水解酶II基因编码选自以下的纤维二糖水解酶II:(i)包含 SEQ ID NO:4的成熟多肽的纤维二糖水解酶II;(ii)包含与SEQ ID NO: 4的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II;(iii)由包含与SEQID NO:3的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II;和(iv)由在至少高等严格条件,例如非常高等严格条件下与 SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
另一方面,内源性基因可以是内切葡聚糖酶I基因。另一方面,内切葡聚糖酶I基因编码选自以下的内切葡聚糖酶I:(i)包含SEQ ID NO: 6的成熟多肽的内切葡聚糖酶I;(ii)包含与SEQ ID NO:6的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的内切葡聚糖酶I;(iii)由包含与SEQ ID NO:5的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少 82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少 88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少 94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的内切葡聚糖酶I;和(iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO:5的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的内切葡聚糖酶 I。
另一方面,内源性基因可以是内切葡聚糖酶II基因。另一方面,内切葡聚糖酶II基因编码选自以下的内切葡聚糖酶II:(i)包含SEQ ID NO:8的成熟多肽的内切葡聚糖酶II;(ii)包含与SEQ ID NO:8的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的内切葡聚糖酶II;(iii)由包含与SEQ ID NO:7的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的内切葡聚糖酶II;和(iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO:7的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的内切葡聚糖酶II。
另一方面,内源性基因可以是β-葡糖苷酶基因。另一方面,β-葡糖苷酶基因编码选自以下的β-葡糖苷酶:(i)包含SEQ ID NO:10的成熟多肽的β-葡糖苷酶;(ii)包含与SEQ IDNO:10的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的β-葡糖苷酶;(iii)由包含与SEQ ID NO:9的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的β-葡糖苷酶;和(iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ IDNO:9的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的β-葡糖苷酶。
另一方面,内源性基因可以是木聚糖酶I基因。另一方面,木聚糖酶I基因编码选自以下的木聚糖酶I:(i)包含SEQ ID NO:12的成熟多肽的木聚糖酶I;(ii)包含与SEQ ID NO:12的成熟多肽具有至少 70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的木聚糖酶I;(iii)由包含与SEQ ID NO:11的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的木聚糖酶I;和(iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ IDNO:11的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的木聚糖酶I。
另一方面,内源性基因可以是木聚糖酶II基因。另一方面,木聚糖酶II基因编码选自以下的木聚糖酶II:(i)包含SEQ ID NO:14的成熟多肽的木聚糖酶II;(ii)包含与SEQ IDNO:14的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的木聚糖酶II;(iii)由包含与SEQ ID NO:13的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少 83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少 89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少 95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的木聚糖酶II;和(iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO:13的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的木聚糖酶II。
另一方面,内源性基因可以是木聚糖酶III基因。另一方面,木聚糖酶III基因编码选自以下的木聚糖酶III:(i)包含SEQ ID NO:16的成熟多肽的木聚糖酶III;(ii)包含与SEQ ID NO:16的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的木聚糖酶III;(iii)由包含与SEQ ID NO:15的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少 83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少 89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少 95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的木聚糖酶III;和(iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO:15的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的木聚糖酶III。
另一方面,内源性基因可以是β-木糖苷酶基因。另一方面,β-木糖苷酶基因编码选自以下的β-木糖苷酶:(i)包含SEQ ID NO:18的成熟多肽的β-木糖苷酶;(ii)包含与SEQ IDNO:18的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的β-木糖苷酶;(iii)由包含与SEQ ID NO:17的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少 89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少 95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的β-木糖苷酶;和(iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO:17的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的β-木糖苷酶。
另一方面,内源性基因可以是膨胀因子基因。另一方面,膨胀因子基因编码选自以下的膨胀因子:(i)包含SEQ ID NO:20的成熟多肽的膨胀因子;(ii)包含与SEQ ID NO:20的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的膨胀因子; (iii)由包含与SEQ ID NO:19的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的膨胀因子;和(iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO:19的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的膨胀因子。
另一方面,内源性基因可以是枯草杆菌蛋白酶样丝氨酸蛋白酶基因。另一方面,枯草杆菌蛋白酶样丝氨酸蛋白酶基因编码选自以下的枯草杆菌蛋白酶样丝氨酸蛋白酶:(i)包含SEQ ID NO:22的成熟多肽的枯草杆菌蛋白酶样丝氨酸蛋白酶;(ii)包含与SEQ ID NO:22的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的枯草杆菌蛋白酶样丝氨酸蛋白酶;(iii)由包含与SEQ ID NO:21的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的枯草杆菌蛋白酶样丝氨酸蛋白酶;和(iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO:21的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的枯草杆菌蛋白酶样丝氨酸蛋白酶。
另一方面,内源性基因可以是天冬氨酸蛋白酶基因。另一方面,天冬氨酸蛋白酶基因编码选自以下的天冬氨酸蛋白酶:(i)包含SEQ ID NO:24的成熟多肽的天冬氨酸蛋白酶;(ii)包含与SEQ ID NO:24的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少 82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少 88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少 94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的天冬氨酸蛋白酶;(iii)由包含与SEQ ID NO:23 的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少 87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少 93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的天冬氨酸蛋白酶;和 (iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO: 23的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的天冬氨酸蛋白酶。
另一方面,内源性基因可以是胰蛋白酶样丝氨酸蛋白酶基因。另一方面,胰蛋白酶样丝氨酸蛋白酶基因编码选自以下的胰蛋白酶样丝氨酸蛋白酶:(i)包含SEQ ID NO:26的成熟多肽的胰蛋白酶样丝氨酸蛋白酶;(ii)包含与SEQ ID NO:26的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的胰蛋白酶样丝氨酸蛋白酶;(iii)由包含与SEQ ID NO:25的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的胰蛋白酶样丝氨酸蛋白酶;和(iv)由在至少高等严格条件,例如非常高等严格条件下与SEQID NO:25的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的胰蛋白酶样丝氨酸蛋白酶。
另一方面,内源性基因可以是枯草杆菌蛋白酶样丝氨酸蛋白酶基因。另一方面,枯草杆菌蛋白酶样丝氨酸蛋白酶基因编码选自以下的枯草杆菌蛋白酶样丝氨酸蛋白酶:(i)包含SEQ ID NO:28的成熟多肽的枯草杆菌蛋白酶样丝氨酸蛋白酶;(ii)包含与SEQ ID NO:28的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的枯草杆菌蛋白酶样丝氨酸蛋白酶;(iii)由包含与SEQ ID NO:27的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的枯草杆菌蛋白酶样丝氨酸蛋白酶;和(iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO:27的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的枯草杆菌蛋白酶样丝氨酸蛋白酶。
另一方面,内源性基因可以是天冬氨酸蛋白酶基因。另一方面,天冬氨酸蛋白酶基因编码选自以下的天冬氨酸蛋白酶:(i)包含SEQ ID NO:30的成熟多肽的天冬氨酸蛋白酶;(ii)包含与SEQ ID NO:30的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少 82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少 94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的天冬氨酸蛋白酶;(iii)由包含与SEQ ID NO:29 的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少 81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少 87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少 93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的天冬氨酸蛋白酶;和 (iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO: 29的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的天冬氨酸蛋白酶。
串联构建体
本发明还涉及串联构建体,其包含:(i)基因的同源5’区、其同源侧翼区或其组合;(ii)一个或多个(例如,几个)可选择性标记物; (iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸;(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸;和(v)基因的同源 3’区、其同源侧翼区或其组合。
本发明还涉及串联构建体,其包含:(i)基因座的同源5’区、其同源侧翼区或其组合;(ii)一个或多个第一可选择性标记物;(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸;(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸;和(v)基因座的同源3’区、其同源侧翼区或其组合。
串联构建体可以通过使一个或多个(例如,几个)控制基因与构建体的各个多核苷酸可操作连接而构建,从而在与控制序列相容的条件下引导编码序列在丝状真菌宿主细胞中的表达。取决于表达载体,在***到载体之前对各个多核苷酸进行操纵可能是合意的或必需的。使用重组DNA方法修饰多核苷酸的技术是本领域公知的。
控制序列可以是启动子,即被宿主细胞识别用于编码多肽的多核苷酸的表达的多核苷酸。启动子含有介导多肽表达的转录控制序列。启动子可以是任何在宿主细胞中表现出转录活性的多核苷酸,包括突变的、截短的和杂合的启动子,并且可以得自与宿主细胞同源或异源的编码胞外或胞内多肽的基因。
一方面,启动子是不同的启动子。另一方面,两个或更多个(例如,几个)启动子是相同的启动子。
用于在丝状真菌宿主细胞中引导构建体的转录的适当启动子的实例是从构巢曲霉(Aspergillus nidulans)乙酰胺酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉 (Aspergillus awamori)葡糖淀粉酶(glaA)、米曲霉(Aspergillus oryzae) TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、尖孢镰孢(Fusarium oxysporum)胰蛋白酶样蛋白酶(WO 96/00787)、镶片镰孢(Fusariumvenenatum)淀粉葡糖苷酶(WO 00/56900)、镶片镰孢 (Fusarium venenatum)Daria(WO 00/56900)、镶片镰孢Quinn(WO 00/56900)、米黑根毛霉(Rhizomucor miehei)脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶、和里氏木霉翻译延伸因子的基因中获得的启动子,以及NA2-tpi启动子(得自曲霉中性α-淀粉酶基因的修饰启动子,其中非翻译前导已被曲霉磷酸丙糖异构酶基因的非翻译前导替换;非限制性实例包括黑曲霉中性α-淀粉酶基因的修饰启动子,其中非翻译前导已被构巢曲霉或米曲霉磷酸丙糖异构酶基因的非翻译前导替换);以及其突变的、截短的和杂合的启动子。其他启动子在美国专利第 6,011,147中描述,其整体并入本文。
控制序列也可以是转录终止子,其由宿主细胞识别来终止转录。终止子与编码多肽的多核苷酸的3’端可操作地连接。可以在宿主细胞中起作用的任何终止子可以用在本发明中。
在一个方面,终止子是不同的终止子。在另一个方面,两个或更多个(例如,几个)终止子是相同的终止子。
用于丝状真菌宿主细胞的优选终止子得自构巢曲霉邻氨基苯甲酸合酶、构巢曲霉乙酰胺酶(amdS)、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖孢镰孢胰蛋白酶样蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶、和里氏木霉翻译延伸因子的基因。
控制序列还可以是前导序列,即,对由宿主细胞的翻译较为重要的mRNA非翻译区。前导序列可操作地连接到编码多肽的多核苷酸的 5’端。任何在宿主细胞中起作用的前导序列均可以使用。
用于丝状真菌宿主细胞的优选前导序列得自米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶的基因。
控制序列也可以是多腺苷酸化序列,即可操作地连接至多核苷酸的3’端的序列,在转录时被宿主细胞识别为向所转录的mRNA添加多腺苷残基的信号。在宿主细胞中起作用的任何多腺苷酸化序列均可以使用。
用于丝状真菌宿主细胞的优选多腺苷酸化序列得自构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA 淀粉酶、尖孢镰孢胰蛋白酶样蛋白酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、和里氏木霉内切葡聚糖酶V的基因。
控制序列也可以是编码与多肽N端连接的信号肽并引导多肽进入细胞分泌通路的信号肽编码区。多核苷酸的编码序列的5’端可以固有地包含在翻译阅读框中与编码多肽的编码序列片段自然连接的信号肽编码序列。或者,编码序列的5’端可以包含对于编码序列为外来的信号肽编码序列。在编码序列不天然包含信号肽编码序列时,外来信号肽编码序列可能是需要的。或者,为增强多肽的分泌,外来信号肽编码序列可以简单地取代天然信号肽编码序列。然而,任何引导所表达的多肽进入宿主细胞的分泌通路的信号肽编码序列均可以使用。
用于丝状真菌宿主细胞的有效信号肽编码序列是得自黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉 (Humicola insolens)纤维素酶、特异腐质霉内切葡聚糖酶V、柔毛腐质霉(Humicola lanuginosa)脂肪酶、米黑根毛霉(Rhizomucormiehei) 天冬氨酸蛋白酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、和里氏木霉切葡聚糖酶V的基因的信号肽编码序列。
控制序列也可以是编码位于多肽N端的前肽的前肽编码序列。得到的多肽称为酶原或前多肽(或在一些情况下为酵素原)。前多肽一般是失活的且可以通过从前多肽到前肽的催化或自催化切割而转化为活性多肽。前肽编码序列可以得自嗜热毁丝菌(Myceliophthora thermophila)漆酶(WO 95/33836)和米黑根毛霉天冬氨酸蛋白酶的基因。
在信号肽和前肽序列均存在时,前肽序列紧邻多肽的N端且信号肽序列紧邻前肽序列的N端。
也可能需要添加调控多肽相对于宿主细胞生长的表达的调控序列。调控序列的实例是响应于化学或物理刺激(包括调控化合物的存在)引起基因表达的开启和关闭的那些。丝状真菌中的调控序列包括黑曲霉葡糖淀粉酶启动子、米曲霉TAKA α-淀粉酶启动子、米曲霉葡糖淀粉酶启动子、里氏木霉纤维二糖水解酶I启动子和里氏木霉纤维二糖水解酶II启动子。调控序列的其他实例是使得基因扩增的那些。在这些情况下,编码多肽的多核苷酸将与调控序列可操作地连接。
本发明的串联构建体优选包含一个或多个(例如,几个)允许方便地选择所转化细胞的可选择性标记物。可选择性标记物是基因,其产物提供对生物灭杀剂的抗性或病毒抗性、重金属抗性、相对于营养缺陷型的原养型等。用于丝状真菌宿主细胞的可选择性标记物的实例包括,但不限于,adeA(磷酸核糖基氨基咪唑-琥珀羧胺合酶(phosphoribosylaminoimidazole-succinocarboxamide synthase))、adeB (磷酸核糖基氨基咪唑合酶(phosphoribosylaminoimidazole synthase))、 amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(膦丝菌素乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5'-磷酸脱羧酶)、sC(硫酸腺苷酰转移酶)、和trpC(邻氨基苯甲酸合成酶)、以及其等价物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉amdS和pyrG基因以及吸水链霉菌(Streptomyces hygroscopicus)bar基因。优选用在木霉属细胞中的是adeA、adeB、amdS、 hph和pyrG基因。细菌可选择性标记物的实例是赋予抗生素抗性的标记物,例如氨苄青霉素、氯霉素、卡那霉素、新霉素、壮观霉素、或四环素抗性。
一个或多个(例如,几个)可选择性标记物可以是如WO 2010/039889 A2(通过引用的方式全部合并入本文)中所述的双选择标记物体系。在一个方面,一个或多个可选择性标记物是hph-tk双选择标记物体系。
在本发明的各串联构建体中,一个或多个(例如,几个)可选择性标记物是不同的标记物,除非如本文所述重复使用可选择性标记物。
一个或多个(例如,几个)可选择性标记物可以再用于将针对各个基因或基因座的对应串联构建体各自通过靶向整合来取代一个或多个(例如,几个)其他内源性基因或***到一个或多个其他内源性基因座中。一个或多个串联构建体还可以包含一个或多个可选择性标记物的5’侧翼的第一同源重复以及一个或多个可选择性标记物的3’侧翼的第二同源重复,其中,第一同源重复和第二同源重复进行同源重组以切除一个或多个可选择性标记物。在切除一个或多个可选择性标记物时,一个或多个可选择性标记物可以再用于将针对各个基因或基因座的对应串联构建体各自通过靶向整合来取代一个或多个其他内源性基因或***到一个或多个其他内源性基因座中。
在一个方面,第一和第二同源重复是相同的。在另一个方面,第一和第二同源重复彼此具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%的序列同一性。在另一个方面,第一和第二同源重复各自为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800 bp、至少1000bp、至少1500bp、或至少2000bp。包含一个重复的片段可以比含有另一重复的片段长。
本发明的串联构建体还可以包含一个或多个(例如,几个)编码其他具有生物活性的多肽的其他多核苷酸。例如,串联构建体可以含有一个其他多核苷酸、两个其他多核苷酸、三个其他多核苷酸等。
具有生物活性的多肽
多肽可以是具有目标生物活性的任何多肽。在本文中,术语“多肽”不是指特定长度的所编码产物,因此涵盖肽、寡肽和蛋白。术语“多肽”还涵盖组合形成所编码产物的两个或更多个(例如,几个) 多肽。多肽也包括融合多肽,其包含得自至少两个不同多肽的部分或完整多肽序列的组合,其中一个或多个(例如,几个)多肽可以对丝状真菌宿主细胞为异源。多肽还可以包括下述多肽的天然存在的等位变化和遗传工程变化以及杂合多肽。
在一个方面,多肽选自抗体、抗原、抗微生物肽、酶、生长因子、激素、免疫增强剂、神经递质、受体、报告蛋白、结构蛋白、或转录因子。
另一方面,酶选自氧化还原酶、转移酶、水解酶、裂解酶、异构酶和连接酶。在另一个方面,酶选自乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、氨基肽酶、α-淀粉酶、α-半乳糖苷酶、α-葡糖苷酶、α-1,6-葡糖苷转移酶、***聚糖酶、***呋喃糖苷酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、几丁质酶、香豆酸酯酶、环糊精糖基转移酶、角质酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、阿魏酸酯酶、具有纤维素分解增强活性的GH61多肽、葡糖脑苷脂酶、葡糖氧化酶、葡糖醛酸酶、葡糖醛酸酯酶、卤过氧化物酶、半纤维素酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、甘露聚糖酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、磷脂酶、植酸酶、酚氧化酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、尿激酶和木聚糖酶
另一方面,多肽选自白蛋白、胶原蛋白、弹性蛋白原、弹性蛋白、和明胶。
另一方面,具有生物活性的多肽可以是不同的多肽。另一方面,具有生物活性的两个或更多个(例如,几个)多肽是相同的多肽。
另一方面,多肽包含选自纤维素酶、cip 1蛋白、具有纤维素分解增强活性的GH61、半纤维素酶、酯酶、膨胀素、漆酶、木质素降解酶、果胶酶、过氧化物酶、蛋白酶、和膨胀因子的一种或多种酶。在另一方面,纤维素酶是选自内切葡聚糖酶、纤维二糖水解酶、和β-葡糖苷酶的一种或多种酶。在另一方面,半纤维素酶是选自木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、***呋喃糖苷酶、木糖苷酶和葡糖醛酸酶的一种或多种酶。
在另一方面,多肽之一是纤维素酶。在另一方面,多肽之一是内切葡聚糖酶。在另一方面,多肽之一是纤维二糖水解酶。在另一方面,多肽之一是β-葡糖苷酶。在另一方面,多肽之一是具有纤维素分解增强活性的GH61多肽。在另一方面,多肽之一是膨胀因子蛋白。在另一方面,多肽之一是cip 1蛋白。在另一方面,多肽之一是酯酶。在另一方面,多肽之一是膨胀素。在另一方面,多肽之一是漆酶。在另一方面,多肽之一是木质素降解酶。在另一方面,多肽之一是果胶酶。在另一方面,多肽之一是过氧化物酶。在另一方面,多肽之一是蛋白酶。在另一方面,多肽之一是膨胀因子。
在另一方面,多肽之一是半纤维素酶。在另一方面,多肽之一是木聚糖酶。在另一方面,多肽之一是β-木糖苷酶。在另一方面,多肽之一是乙酰木聚糖酯酶。在另一方面,多肽之一是阿魏酸酯酶。在另一方面,多肽之一是***呋喃糖苷酶。在另一方面,多肽之一是葡糖醛酸酶。在另一方面,多肽之一是乙酰甘露聚糖酯酶。在另一方面,多肽之一是***聚糖酶。在另一方面,多肽之一是香豆酸酯酶。在另一方面,多肽之一是半乳糖苷酶。在另一方面,多肽之一是葡糖醛酸酯酶。在另一方面,多肽之一是甘露聚糖酶。在另一方面,多肽之一是甘露糖苷酶。
作为具有生物活性的多肽的内切葡聚糖酶的实例包括,但不限于,里氏木霉内切葡聚糖酶I(Penttila等人,1986,Gene 45:253-263)、里氏木霉Cel7B内切葡聚糖酶I(GENBANKTM登录号M15665)、里氏木霉内切葡聚糖酶II(Saloheimo等人,1988,Gene 63:11-22)、里氏木霉Cel5A 内切葡聚糖酶II(GENBANKTM登录号M19373)、里氏木霉内切葡聚糖酶III(Okada等人,1988,Appl.Environ.Microbiol.64:555-563; GENBANKTM登录号AB003694)、里氏木霉内切葡聚糖酶V(Saloheimo 等人,1994,Molecular Microbiology13:219-228,GENBANKTM登录号 Z33381)、棘孢曲霉(Aspergillus aculeatus)内切葡聚糖酶(Ooi等人,1990,Nucleic Acids Research 18:5884)、白曲霉(Aspergillus kawachii) 内切葡聚糖酶(Sakamoto等人,1995,Current Genetics 27:435-439)、软腐欧氏杆菌(Erwinia carotovara)内切葡聚糖酶(Saarilahti等人, 1990,Gene 90:9-14)、尖孢镰孢内切葡聚糖酶(GENBANKTM登录号 L29381)、灰腐质霉高温变种(Humicola griseavar.thermoidea)内切葡聚糖酶(GENBANKTM登录号AB003107)、热白丝菌(Melanocarpusalbomyces)内切葡聚糖酶(GENBANKTM登录号MAL515703)、粗糙脉孢菌(Neurospora crassa)内切葡聚糖酶(GENBANKTM登录号 XM_324477)、特异腐质霉内切葡聚糖酶V、嗜热毁丝菌CBS117.65 内切葡聚糖酶、担子菌(basidiomycete)CBS 495.95内切葡聚糖酶、担子菌CBS494.95内切葡聚糖酶、太瑞斯梭孢壳(Thielavia terrestris) NRRL 8126CEL6B内切葡聚糖酶、太瑞斯梭孢壳NRRL 8126CEL6C 内切葡聚糖酶、太瑞斯梭孢壳NRRL 8126CEL7C内切葡聚糖酶、太瑞斯梭孢壳NRRL 8126CEL7E内切葡聚糖酶、太瑞斯梭孢壳NRRL 8126 CEL7F内切葡聚糖酶、多生枝鼻菌(Cladorrhinum foecundissimum) ATCC 62373CEL7A内切葡聚糖酶、和里氏木霉菌株No.VTT-D-80133 内切葡聚糖酶(GENBANKTM登录号M15665)。
作为具有生物活性的多肽的纤维二糖水解酶的实例包括,但不限于,棘孢曲霉纤维二糖水解酶II(WO 2011/059740)、嗜热毛壳菌 (Chaetomium thermophilum)纤维二糖水解酶I、嗜热毛壳菌纤维二糖水解酶II、特异腐质霉纤维二糖水解酶I、嗜热毁丝菌纤维二糖水解酶 II(WO 2009/042871)、Thielavia hyrcanie纤维二糖水解酶II(WO 2010/141325)、太瑞斯梭孢壳纤维二糖水解酶II(CEL6A,WO 2006/074435)、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶 II和囊状长毛盘菌(Trichophaea saccata)纤维二糖水解酶II(WO2010/057086)。
作为具有生物活性的多肽的β-葡糖苷酶的实例包括,但不限于,来自棘孢曲霉(Kawaguchi等人,1996,Gene 173:287-288)、烟曲霉(WO 2005/047499)、黑曲霉(Dan等人,2000,J.Biol.Chem.275:4973-4980)、米曲霉(WO 2002/095014)、巴西青霉(Penicilliumbrasilianum)IBT 20888(WO 2007/019442和WO 2010/088387)、太瑞斯梭孢壳(WO 2011/035029)和囊状长毛盘菌(WO 2007/019442)的β-葡糖苷酶。
β-葡糖苷酶还可以是融合蛋白。在一个方面,β-葡糖苷酶是米曲霉β-葡糖苷酶变体BG融合蛋白(WO 2008/057637)或米曲霉β-葡糖苷酶融合蛋白(WO 2008/057637)。
使用根据Henrissat B.,1991,A classification of glycosyl hydrolasesbased on amino-acid sequence similarities,Biochem.J.280:309-316、及 HenrissatB.and Bairoch A.,1996,Updating the sequence-based classification of glycosylhydrolases,Biochem.J.316:695-696所述的分类,其他内切葡聚糖酶、纤维二糖水解酶、和β-葡糖苷酶的实例在众多的糖基水解酶家族中公开。
可以用于本发明的其他纤维素分解酶在WO 98/13465、WO 98/015619、WO 98/015633、WO 99/06574、WO 99/10481、WO 99/025847、WO 99/031255、WO 2002/101078、WO2003/027306、WO 2003/052054、WO 2003/052055、WO 2003/052056、WO 2003/052057、 WO2003/052118、WO 2004/016760、WO 2004/043980、WO 2004/048592、WO 2005/001065、WO2005/028636、WO 2005/093050、 WO 2005/093073、WO 2006/074005、WO 2006/117432、WO2007/071818、WO 2007/071820、WO 2008/008070、WO 2008/008793、美国专利第5,457,046号、美国专利第5,648,263号和美国专利第 5,686,593号中有过记载。
作为具有生物活性的多肽的具有纤维素分解增强活性的GH61多肽的实例包括,但不限于,来自太瑞斯梭孢壳(WO 2005/074647、WO 2008/148131、和WO 2011/035027)、嗜热子囊菌(Thermoascus aurantiacus)(WO 2005/074656和WO 2010/065830)、里氏木霉(WO2007/089290)、嗜热毁丝菌(WO 2009/085935、WO 2009/085859、WO 2009/085864、WO 2009/085868)、烟曲霉(WO 2010/138754)的GH61 多肽,来自嗜松青霉(Penicilliumpinopuilum)(WO 2011/005867)、嗜热子囊菌(WO 2011/039319)、青霉(WO 2011/041397)、和甲壳嗜热子囊菌(Thermoascus crustaceous)(WO 2011/041504)的GH61多肽。
作为具有生物活性的多肽的木聚糖酶的实例包括,但不限于,来自棘孢曲霉(GeneSeqP:AAR63790;WO 94/21785)、烟曲霉(WO 2006/078256)、嗜松青霉(WO 2011/041405)、青霉(WO 2010/126772)、太瑞斯梭孢壳NRRL 8126(WO 2009/079210)、以及囊状长毛盘菌GH10 (WO 2011/057083)的木聚糖酶。
作为具有生物活性的多肽的β-木糖苷酶的实例包括,但不限于,来自粗糙脉孢菌(SwissProt登录号Q7SOW4)、里氏木霉 (UniProtKB/TrEMBL登录号Q92458)、和埃默森篮状菌(Talaromyces emersonii)(SwissProt登录号Q8X212)的β-木糖苷酶。
作为具有生物活性的多肽的乙酰木聚糖酯酶的实例包括,但不限于,来自棘孢曲霉(WO 2010/108918)、球毛壳菌(Chaetomium globosum)(UniProt登录号Q2GWX4)、细丽毛壳菌(Chaetomium gracile)(GeneSeqP登录号AAB82124)、特异腐质霉DSM 1800(WO 2009/073709)、红褐肉座菌(Hypocrea jecorina)(WO 2005/001036)、嗜热毁丝菌(WO 2010/014880)、粗糙脉孢菌(UniProt登录号q7s259)、颖枯壳针孢(Phaeosphaeria nodorum)(UniProt登录号Q0UHJ1)、和太瑞斯梭孢壳NRRL 8126(WO 2009/042846)的乙酰木聚糖酯酶。
作为具有生物活性的多肽的阿魏酸酯酶的实例包括,但不限于,来自特异腐质霉DSM 1800(WO 2009/076122)、费希新萨托菌 (Neosartorya fischeri)(UniProt登录号A1D9T4)、粗糙脉孢菌(UniProt 登录号Q9HGR3)、橘灰青霉(Penicilliumaurantiogriseum)(WO 2009/127729)、和太瑞斯梭孢壳(WO 2010/053838和WO 2010/065448) 的阿魏酸酯酶。
作为具有生物活性的多肽的***呋喃糖苷酶的实例包括,但不限于,来自黑曲霉(GeneSeqP登录号AAR94170)、特异腐质霉DSM 1800(WO 2006/114094和WO 2009/073383)、和大型亚灰树花菌(M. giganteus)(WO 2006/114094)的***呋喃糖苷酶。
作为具有生物活性的多肽的α-葡糖醛酸酶的实例包括,但不限于,来自棒曲霉(Aspergillus clavatus)(UniProt登录号alcc12)、烟曲霉 (SwissProt登录号Q4WW45)、黑曲霉(UniProt登录号Q96WX9)、土曲霉(Aspergillus terreus)(SwissProt登录号Q0CJP9)、特异腐质霉 (WO 2010/014706)、橘灰青霉(WO 2009/068565)、埃默森篮状菌 (UniProt登录号Q8X211)、和里氏木霉(UniProt登录号Q99024)的α-葡糖醛酸酶。
登录号通过引用的方式整体并入本文。
表达载体
本发明还涉及包含本发明的串联构建体的表达载体。串联构建体可以***到载体中或者串联构建体的多个组分可以结合在一起以产生重组表达载体。载体可以包含一个或多个(例如,几个)方便的限制性酶切位点以使得在这些位点***多核苷酸。在表达载体的创建中,将编码序列置于载体中,从而将编码序列与适当的用于表达的控制序列可操作地连接。
重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA步骤,并且能够产生多核苷酸的表达。载体的选择将通常依赖于载体与将导入载体的宿主细胞的相容性。载体可以是线状或闭合环状质粒。
载体优选地含有一个或多个(例如,几个)可选择性标记物,其使得可以方便选择所转化的细胞。用于丝状真菌宿主细胞的可选择性标记物的实例包括,但不限于,adeA(磷酸核糖基氨基咪唑-琥珀羧胺合酶)、adeB(磷酸核糖基氨基咪唑合酶)、amdS(乙酰胺酶)、argB (鸟氨酸氨甲酰基转移酶)、bar(膦丝菌素乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5'-磷酸脱羧酶)、sC(硫酸腺苷酰转移酶)、和trpC(邻氨基苯甲酸合成酶)、以及其等价物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉amdS和pyrG 基因以及吸水链霉菌bar基因。优选用在木霉属细胞中的是adeA、 adeB、amdS、hph和pyrG基因。细菌可选择性标记物的实例是赋予抗生素抗性的标记物,例如氨苄青霉素、氯霉素、卡那霉素、新霉素、壮观霉素、或四环素抗性。
用于连接上述元件以构建重组表达载体的方法为本领域技术人员公知(参见,例如,Sambrook等人,1989,同上)。
丝状真菌宿主细胞
本发明还涉及丝状真菌菌株,其包含:(a)通过靶向整合用第一串联构建体取代的内源性第一基因,该第一串联构建体包含(i)第一基因的同源5’区、其同源侧翼区或其组合,(ii)一个或多个(例如,几个)第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v)第一基因的同源3’区、其同源侧翼区或其组合; (b)通过靶向整合用第二串联构建体取代的内源性第二基因,该第二串联构建体包含(i)第二基因的同源5’区、其同源侧翼区或其组合, (ii)一个或多个(例如,几个)第二可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v)第二基因的同源3’区、其同源侧翼区或其组合;或(c)(a)和(b)的组合。
本发明还涉及丝状真菌菌株,其包含:(a)通过靶向整合经***第一串联构建体而修饰的内源性第一基因座,该第一串联构建体包含 (i)第一基因座的同源5’区、其同源侧翼区或其组合,(ii)一个或多个第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v)第一基因座的同源3’区、其同源侧翼区或其组合; (b)通过靶向整合通过经***第二串联构建体而修饰的内源性第二基因座,该第二串联构建体包含(i)第二基因座的同源5’区、其同源侧翼区或其组合,(ii)一个或多个第二可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v)第二基因座的同源3’区、其同源侧翼区或其组合;或(c)(a)和(b)的组合。
术语“宿主细胞”包括由于在复制过程中发生突变而与亲本细胞不同的亲本细胞的任何子代。宿主细胞的选择将在很大程度上取决于编码多肽的基因及其来源。
宿主细胞可以是在多肽的重组生产中有用的任何丝状真菌细胞。“丝状真菌”包括真菌门和卵菌门的的亚门(如由Hawksworth等人, 1995,同上,所定义)的所有丝状形式。丝状真菌通常的特征在于由壳质、纤维素、葡聚糖、壳聚糖、甘露聚糖和其他复合多糖组成的菌丝体壁。营养生长是通过菌丝伸长,碳分解代谢必须是需氧的。相反,酵母例如酿酒酵母(Saccharomyces cerevisiae)的营养生长是通过单细胞菌体的出芽,且碳分解可以是发酵性的。
丝状真菌宿主细胞可以是枝顶孢属(Acremonium)、曲霉属 (Aspergillus)、短梗霉属(Aureobasidium)、黑管菌属(Bjerkandera)、拟蜡霉属(Ceriporiopsis)、金孢属(Chrysosporium)、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属(Cryptococcus)、线黑粉酵母属 (Filibasidium)、镰孢菌属(Fusarium)、腐质霉属(Humicola)、巨座壳属(Magnaporthe)、毛霉属(Mucor)、毁丝菌属(Myceliophthora)、新美鞭菌属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属 (Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、白腐菌属(Phlebia)、梨囊鞭菌属(Piromyces)、侧耳属(Pleurotus)、裂褶菌属(Schizophyllum)、篮状菌属(Talaromyces)、嗜热子囊菌属 (Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、栓菌属(Trametes)或木霉属(Trichoderma)细胞。
例如,丝状真菌宿主细胞可以是泡盛曲霉(Aspergillus awamori)、臭曲霉(Aspergillus foetidus)、烟曲霉、日本曲霉(Aspergillus japonicus)、构巢曲霉、黑曲霉、米曲霉、烟管菌(Bjerkandera adusta)、干拟蜡菌 (Ceriporiopsis aneirina)、Ceriporiopsis caregiea、浅黄拟蜡菌 (Ceriporiopsis gilvescens)、Ceriporiopsispannocinta、Ceriporiopsis rivulosa、Ceriporiopsis subrufa、虫拟蜡菌(Ceriporiopsis subvermispora)、 Chrysosporium inops、嗜毛金色孢(Chrysosporiumkeratinophilum)、 Chrysosporium lucknowense、粪状金孢(Chrysosporium merdarium)、Chrysosporium pannicola、Chrysosporium queenslandicum、热带金孢菌(Chrysosporium tropicum)、Chrysosporium zonatum、灰盖鬼伞 (Coprinus cinereus)、粗毛云芝(Coriolus hirsutus)、杆孢状镰孢 (Fusarium bactridioides)、谷类镰孢(Fusarium cerealis)、克鲁克威尔镰孢菌(Fusarium crookwellense)、黄色镰孢菌(Fusarium culmorum)、禾谷镰孢菌(Fusarium graminearum)、禾赤镰孢(Fusariumgraminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢(Fusarium negundi)、尖孢镰孢、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟枝孢镰孢菌(Fusariumsporotrichioides)、硫色镰孢 (Fusarium sulphureum)、圆镰孢(Fusarium torulosum)、拟丝孢镰孢 (Fusarium trichothecioides)、镶片镰孢、特异腐质霉、柔毛腐质霉(Humicola lanuginosa)、米赫毛霉(Mucor miehei)、嗜热毁丝霉、粗糙脉胞菌、产紫青霉(Penicillium purpurogenum)、黄孢原毛平革菌 (Phanerochaete chrysosporium)、脉射菌(Phlebia radiata)、刺芹侧耳 (Pleurotus eryngii)、太瑞斯梭孢壳、长绒毛栓菌(Trametes villosa)、变色栓菌(Trametes versicolor)、哈茨木霉(Trichodermaharzianum)、康氏木霉(Trichoderma koningii)、长梗木霉(Trichodermalongibrachiatum)、里氏木霉或绿色木霉(Trichoderma viride)细胞。
在一个方面,丝状真菌宿主细胞是米曲霉。在另一方面,丝状真菌宿主细胞是黑曲霉。在另一方面,丝状真菌宿主细胞是镶片镰孢。在另一方面,丝状真菌宿主细胞是里氏木霉。在另一方面,丝状真菌宿主细胞是长梗木霉。
在另一方面,丝状真菌宿主细胞是里氏木霉RutC30。在另一方面,丝状真菌宿主细胞是里氏木霉TV10。在另一方面,丝状真菌宿主细胞是里氏木霉RutC30的突变体。在另一方面,丝状真菌宿主细胞是里氏木霉TV10的突变体。在另一方面,丝状真菌宿主细胞是里氏木霉的形态突变体。参见,例如,WO 97/26330,其通过引用的方式整体并入本文。
在另一方面,丝状真菌宿主细胞是包含一个或多个(例如,几个) 选自第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因、第一天冬氨酸蛋白酶基因、胰蛋白酶样丝氨酸蛋白酶基因、第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因、和第二天冬氨酸蛋白酶基因的基因的木霉属菌株,其中一个或多个(例如,几个)基因修饰成使突变体菌株当在相同条件下培养时,相对于亲本木霉属菌株,分别在一种或多种(例如,几种) 选自第一枯草杆菌蛋白酶样丝氨酸蛋白酶、第一天冬氨酸蛋白酶、胰蛋白酶样丝氨酸蛋白酶、第二枯草杆菌蛋白酶样丝氨酸蛋白酶、和第二天冬氨酸蛋白酶的酶的产生方面有缺陷,如WO 2011/075677中所述,其通过引用的方式整体并入本文。
可以将丝状真菌细胞通过涉及原生质体形成、原生质体转化、和细胞壁再生的方法以本身已知的方式进行转化。用于转化曲霉属和木霉属宿主细胞的适当方法在EP238023、Yelton等人,1984,Proc.Natl. Acad.Sci.USA 81:1470-1474以及Christensen等人,1988,Bio/Technology 6:1419-1422中有过记载。用于转化镰孢属的种的适当方法由Malardier 等人,1989,Gene 78:147-156和WO 1996/00787记载。
产生的方法
本发明还涉及在丝状真菌菌株中产生具有生物活性的多种重组多肽的方法,其包括:
(A)在有益于产生多肽的条件下培养丝状真菌宿主细胞,其中该丝状真菌宿主细胞包含:(a)通过靶向整合用第一串联构建体取代的内源性第一基因,该第一串联构建体包含(i)第一基因的同源5’区、其同源侧翼区或其组合,(ii)一个或多个(例如,几个)第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v) 第一基因的同源3’区、其同源侧翼区或其组合;(b)通过靶向整合用第二串联构建体取代的内源性第二基因,该第二串联构建体包含(i) 第二基因的同源5’区、其同源侧翼区或其组合,(ii)一个或多个(例如,几个)第二可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v)第二基因的同源3’区、其同源侧翼区或其组合;或(c)(a)和(b)的组合;以及任选地
(B)回收多种重组多肽。
本发明还涉及在丝状真菌菌株中产生具有生物活性的多种重组多肽的方法,其包括:
(A)在有益于产生多肽的条件下培养丝状真菌宿主细胞,其中该丝状真菌宿主细胞包含:(a)通过靶向整合经***第一串联构建体而修饰的内源性第一基因座,该第一串联构建体包含(i)第一基因座的同源5’区、其同源侧翼区或其组合,(ii)一个或多个第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v)第一基因座的同源3’区、其同源侧翼区或其组合;(b)通过靶向整合经***第二串联构建体而修饰的内源性第二基因座,该第二串联构建体包含(i)第二基因座的同源5’区、其同源侧翼区或其组合,(ii)一个或多个第二可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v)第二基因座的同源3’区、其同源侧翼区或其组合;或 (c)(a)和(b)的组合;以及任选地
(B)回收多种重组多肽。
使用本领域已知的方法,在适于产生多肽的营养介质中培养丝状真菌宿主细胞。例如,细胞可以通过在合适的介质中并在使得多肽进行表达和/或分离的条件下进行摇瓶培养或在实验室或工业发酵罐中进行小规模或大规模发酵(包括连续发酵、分批发酵、分批补料发酵或固态发酵)来培养。使用本领域已知的步骤,培养在包含碳源和氮源以及无机盐的合适营养介质中进行。合适的介质可以从商业供应商获得或可以根据公开的组成(例如,在美国典型培养物保藏中心的目录中)来制备。如果多肽被分泌到营养介质中,则可以直接从介质中回收多肽。如果多肽未被分泌,则可以从细胞裂解物中回收。
多肽可以使用领域内已知的特定用于多肽的方法来检测。这些检测方法包括但不限于特异性抗体的使用、酶产物的形成、或酶底物的消失。例如,酶检定可以用来判定多肽的活性。
多肽可以使用本领域已知的方法来回收。例如,多肽可以通过常规步骤从营养介质中回收,这些常规步骤包括但不限于收集、离心、过滤、萃取、喷雾干燥、蒸发或沉淀。在一个方面,回收整个发酵液。
多肽可以通过本领域已知的多种方法进行纯化,以获得基本纯的多肽,方法包括但不限于层析法(例如,离子交换层析、亲和层析、疏水性层析、聚焦层析、和尺寸排阻层析)、电泳法(例如,制备式等电聚焦)、差别溶解度(例如,硫酸铵沉淀)、SDS-PAGE、或萃取(参见例如,Protein Purification,Janson和Ryden编,VCH Publishers,New York,1989)。
本发明通过以下实施例进一步加以说明,这些实施例不应理解成对本发明的范围加以限定。
实施例
菌株
里氏木霉菌株981-O-8(D4)是里氏木霉RutC30(ATCC 56765;Montenecourt andEveleigh,1979,Adv.Chem.Ser.181:289-301)的诱变菌株。
里氏木霉菌株AgJg115-104-7B1(PCT/US2010/061105、WO 2011/075677)是里氏木霉菌株981-O-8(D4)的ku70-衍生体。
培养基和缓冲溶液
LB平板由10g胰蛋白胨、5g酵母提取物、5g NaCl、15g Bacto 琼脂和加至1升的去离子水组成。
2XYT+氨苄青霉素平板由16g胰蛋白胨、10g酵母提取物、5g 氯化钠、15g Bacto琼脂和加至1升去离子水组成。在高压灭菌的培养基冷却至55℃之后,加入1ml 100mg/ml的氨苄青霉素溶液。
SOC培养基由20g Bacto-胰蛋白胨、5g Bacto酵母提取物、0.5g NaCl、2.5ml 1MKCl和加至1升的去离子水组成。在高压灭菌之前,用10N NaOH将pH调节至7.0。然后在临用前加入20ml的无菌1M 葡萄糖。
COVE盐溶液由26g KCl、26g MgSO4·7H2O、76g KH2PO4、50ml COVE痕量金属溶液和加至1升的去离子水组成。
COVE痕量金属溶液由0.04g NaB4O7·10H2O、0.4g CuSO4·5H2O、 1.2g FeSO4·7H2O、0.7g MnSO4·H2O、0.8g Na2MoO2·2H2O、10g ZnSO4·7H2O和加至1升的去离子水组成。
COVE平板由342.3g蔗糖、20ml COVE盐溶液、10ml 1M乙酰胺、10ml 1.5M CsCl、25gNoble琼脂(Difco)和加至1升的去离子水组成。
COVE2平板由30g蔗糖、20ml COVE盐溶液、10ml 1M乙酰胺、25g Noble琼脂(Difco)和加至1升的去离子水组成。
木霉属痕量金属溶液由216g FeCl3·6H2O、58g ZnSO4·7H2O、27g MnSO4·H2O、10gCuSO4·5H2O、2.4g H3BO3、336g柠檬酸和加至1 升的去离子水组成。
CIM培养基由20g纤维素、10g玉米浆冻干粉、1.45g(NH4)2SO4、 2.08g KH2PO4、0.28gCaCl2、0.42g MgSO4·7H2O、0.42ml木霉属痕量金属溶液、1~2滴消泡剂和加至1升的去离子水组成;pH调节至 6.0。
YP培养基由10g酵母提取物、20g Bacto蛋白胨和加至1升的去离子水组成。
YPG培养基由4g酵母提取物、1g K2HPO4、0.5g MgSO4、15.0g 葡萄糖和加至1升的去离子水组成(pH 6.0)。
PEG缓冲液由500g聚乙二醇4000(PEG 4000)、10mM CaCl2、 10mM Tris-HCl pH7.5和加至1升的去离子水组成;过滤除菌。
PDA平板由39g土豆右旋糖琼脂(Difco)和加至1升的去离子水组成。
PDA覆层培养基由39g土豆右旋糖琼脂(Difco)、2.44g尿苷和加至1升的去离子水组成。使用之前,将高压灭菌的培养基在微波中融化,然后冷却至55℃。
STC由1M山梨糖醇、10mM mM CaCl2和10mM Tris-HCl,pH 7.5 组成;过滤除菌。
TE缓冲液由1M Tris pH 8.0和0.5M EDTApH 8.0组成。
变性溶液由0.5M NaOH和1.5M NaCl组成。
中和溶液由1M Tris pH 8.0和1.5M NaCl组成。
20X SSC由175.3g NaCl、88.2g柠檬酸钠和加至1升的去离子水组成。
TrMM-G培养基由20ml COVE盐溶液、6g(NH4)2SO4、0.6g CaCl2、25g Nobel琼脂(Difco)、20g葡萄糖和加至1升的去离子水组成。
NZY+培养基由5g NaCl、3g MgSO4·7H2O、5g酵母提取物、10g NZ胺、1.2g MgCl2、4g葡萄糖和加至1升的去离子水组成。
实施例1:烟曲霉GH61B多肽基因的克隆
烟曲霉部分基因组序列(The Institute for Genomic Research, Rockville,MD,USA)的tblastn搜索(Altschul等人,1997,Nucleic Acids Res.25:3389-3402)使用几种已知的GH61多肽(包括嗜热子囊菌 GH61A多肽(GeneSeqP登录号AEC05922))作为查询序列来进行。基于在氨基酸水平上与查询序列的高度类似性,数个基因被识别为推定的家族GH61同源物。选择一个约850bp的与嗜热子囊菌GH61A多肽序列在氨基酸水平具有高于70%序列同一性的基因组区域进行进一步研究。
烟曲霉NN051616如美国专利第7,244,605号中所述生长并收获。将冷冻的菌丝体用研钵和研杵研磨成细粉末,并使用植物大量提取试剂盒(Plant Maxi Kit)(QIAGEN Inc.,Valencia, CA,USA)根据生产商的说明来分离基因组DNA。
设计以下示出的两个合成的寡核苷酸引物,以从基因组DNA中 PCR扩增出烟曲霉GH61B多肽编码序列。使用克隆试剂盒(Clontech Laboratories,Inc.,Mountain View,CA,USA)将片段直接克隆入表达载体pAlLo2(WO 2004/099228),而无需进行限制性酶切消化和连接。
正向引物:
5'-ACTGGATTTACCATGACTTTGTCCAAGATCACTTCCA-3' (SEQ ID NO:31)
反向引物:
5'-TCACCTCTAGTTAATTAAGCGTTGAACAGTGCAGGACCA G-3'(SEQ ID NO:32)
粗体字母代表编码序列。剩余序列与pAlLo2的***位点同源。
将五十皮摩尔的各个上述引物用于PCR反应中,反应由204ng的烟曲霉基因组DNA,1×Pfx扩增缓冲液(Invitrogen,Carlsbad,CA, USA),1.5μl的dATP、dTTP、dGTP和dCTP的10mM混合物,2.5 个单位的Pfx DNA聚合酶(Invitrogen Corp.,Carlsbad,CA, USA),和1μl的50mM MgSO4构成,终体积为50μl。扩增使用5333epgradient S(Eppendorf Scientific,Inc.,Westbury,NY,USA)进行,程序为:94℃3分钟,1个循环;和每循环94℃30秒、56℃30秒、和72℃1分钟,30个循环。然后将加热块维持在72℃15分钟,接着进行4℃浸泡循环。反应产物通过使用40mM Tris碱、20mM乙酸钠、1mM EDTA二钠盐(TAE) 缓冲液的1.0%琼脂糖凝胶电泳进行分离,其中将约850bp的产物条带从凝胶中切出,并使用凝胶提取试剂盒(QIAGEN Inc., Valencia,CA,USA)根据生产商的说明进行纯化。
然后使用克隆试剂盒将850bp片段克隆入pAlLo2。将质粒pAlLo2用Nco I和Pac I消化。将质粒片段通过如上的凝胶电泳和凝胶纯化试剂盒(QIAGEN Inc.,Valencia,CA,USA) 进行纯化。将基因片段和消化的载体在后述的反应中合并在一起,得到表达质粒pAG43(图1),其中烟曲霉GH61B多肽编码序列的转录处于NA2-tpi启动子的调控之下。NA2-tpi启动子是来自黑曲霉中性α- 淀粉酶基因的修饰启动子,其中非翻译的前导序列被来自构巢曲霉磷酸丙糖异构酶基因的非翻译前导序列替代。重组反应(20μl)由 1×反应缓冲液(Clontech Laboratories,Inc.,MountainView, CA,USA)、1×BSA(Clontech Laboratories,Inc.,Mountain View,CA, USA)、1μl的酶(稀释1:10)(Clontech Laboratories,Inc., Mountain View,CA,USA)、166ng的用Nco I和Pac I消化的pAlLo2、和110ng的烟曲霉GH61B多肽的纯化PCR产物构成。将反应在37℃下孵育15分钟,接着在50℃孵育15分钟。将反应物用40μl的10mM Tris-0.1MEDTA缓冲液稀释,并根据生产商的说明将2.5μl的稀释反应物用来转化大肠杆菌(E.coli)XL10Gold感受态细胞(Stratagene,La Jolla,CA,USA)。含有pAG43(GH61B多肽编码序列)的大肠杆菌转化体通过限制性酶切消化进行鉴定,并使用9600(QIAGEN Inc.,Valencia,CA,USA)制备质粒DNA。
862bp PCR片段的DNA测序用Applied Biosystems Model 377XL 自动DNA测序仪(Applied Biosystems,Carlsbad,CA,USA)使用染料- 终止子化学法(Giesecke等人,1992,Journal of Virology Methods 38:47-60)和引物步移策略进行。使用下述的载体特异性引物进行测序:
pAllo2 5Seq:
5'-TGTCCCTTGTCGATGCG 3'(SEQ ID NO:33)
pAllo23Seq:
5'-CACATGACTTGGCTTCC 3'(SEQ ID NO:34)
仔细检查核苷酸序列数据的质量,并将所有序列经 PHRED/PHRAP软件(University of Washington,Seattle,WA,USA)的协助而进行彼此比较。
基于所编码的蛋白与嗜热子囊菌GH61A蛋白(GeneSeqP登录号 AEC05922)的相似性来构建用于烟曲霉序列的基因模型。烟曲霉 GH61B多肽编码序列的核苷酸序列和推导的氨基酸序列分别示于SEQ ID NO:35和SEQ ID NO:36。基因组片段编码250个氨基酸的多肽,被2个53和56bp的内含子打断。编码序列和成熟编码序列的G+C含量百分比分别为53.9%和57%。使用SignalP软件程序(Nielsen等人, 1997,Protein Engineering 10:1-6),预测21个残基的信号肽。预测的成熟蛋白含有221个氨基酸,其具有23.39kDa的预测分子量。
实施例2:用于表达烟曲霉GH61B多肽的pSMai214的构建
使用如下所示的基因特异性的正向和反向引物从质粒pAG43(实施例1)中扩增烟曲霉GH61B多肽编码序列。斜体的区域表示与反应的***位点的载体同源性。
正向引物:
5'-GGACTGCGCACCATGACTTTGTCCAAGATCACTTCCA-3' (SEQ ID NO:37)
反向引物:
5'-GCCACGGAGCTTAATTAATTAAGCGTTGAACAGTGCAG-3' (SEQ ID NO:38)
将五十皮摩尔的各上述引物用于PCR反应中,该反应由10ng的 pAG43DNA,1×Pfx扩增缓冲液,1.5μl的dATP、dTTP、dGTP和dCTP 的10mM混合物,2.5个单位的Pfx DNA聚合酶,和1μl 的50mM MgSO4构成,最终体积为50μl。扩增使用 5333epgradient S进行,其程序为:98℃3分钟,1 个循环;和每循环98℃30秒、56℃30秒、和72℃1分钟,30个循环。然后将加热块维持在72℃15分钟。PCR产物通过使用TAE缓冲液的1%琼脂糖凝胶电泳进行分离,其中将约0.9kb的片段从凝胶切出,并使用凝胶提取试剂盒根据生产商的操作指南进行提取。
将质粒pMJ09(WO 2005/047499)用Nco I和Pac I消化,通过在 1mM EDTA二钠盐-50mM Tris碱-50mM硼酸(TBE)缓冲液中的1.0%琼脂糖凝胶电泳来分离,从凝胶中切出,并根据生产商的说明使用凝胶提取试剂盒(QIAGEN Inc.,Valencia,CA,USA)提取。
根据生产商的操作指南,使用PCR克隆试剂盒将0.9 kb的PCR产物***到凝胶纯化的经Nco I/Pac I消化的pMJ09中。反应由1X反应缓冲液、100ng的凝胶纯化的经Nco I/Pac I消化的pMJ09、37ng的0.9kb PCR产物、2μl的500 μg/ml BSA、和1μl的酶构成,反应体积为20μl。将反应在37℃孵育15分钟并在50℃孵育15分钟。在孵育期后,将30μl 的TE缓冲液加入反应中。根据制造商的操作指南,将2.5μl等份用于转化Gold超级感受态细胞(Agilent Technologies,Inc., Cedar Creek,TX,USA)。通过测序来筛选转化体,鉴定出含有无PCR 错误的***的一个克隆并将其定名为pSMai214(图2)。可以用Pme I 消化质粒pSMai214,以产生用于里氏木霉转化的约5.4kb的片段。该 5.4kb的片段包含由里氏木霉Cel7A纤维二糖水解酶I基因启动子、烟曲霉GH61B多肽编码序列、里氏木霉Cel7A纤维二糖水解酶I基因终止子、和构巢曲霉乙酰胺酶(amdS)基因组成的表达盒。
实施例3:用于表达烟曲霉CEL3Aβ-葡糖苷酶和烟曲霉GH61B多肽两者的串联构建 体pDM287的构建
使用如下所示的基因特异性的正向和反向引物从质粒pSMai214 中扩增烟曲霉GH61B多肽表达盒。斜体的区域表示与反应的***位点的载体同源性。
正向引物:
5'-CGCGGTAGTGGCGCGGTCGACCGAATGTAGGATTGTT-3' (SEQ ID NO:39)
反向引物:
5'-TTACCAATTGGCGCGCCACTACCGCGTTCGAGAAGA-3'(SEQ ID NO:40)
将五十皮摩尔的各上述引物用于PCR反应中,该反应由25ng的 pSMai214DNA,1XPHUSIONTM高保真热启动DNA聚合酶缓冲液 (Finnzymes Oy,Espoo,Finland),1μl的dATP、dTTP、dGTP和dCTP 的10mM混合物,以及1个单位的PHUSIONTM高保真热启动DNA聚合酶(Finnzymes Oy,Espoo,Finland)构成,最终体积为50μl。扩增使用5333epgradient S进行,其程序为:98℃30秒,1个循环;每循环98℃10秒、60℃30秒、和72℃1 分30秒,35个循环;和72℃10分钟,1个循环。PCR产物通过使用 TAE缓冲液的0.8%琼脂糖凝胶电泳进行分离,其中将约2.3kb的片段从凝胶中切出,并使用提取II试剂盒(Macherey-Nagel, Inc.,Bethlehem,PA,USA)根据生产商的操作指南进行提取。
将约2.3kb的PCR产物使用Advantage PCR克隆试剂盒(ClontechLaboratories,Inc.,Mountain View,CA,USA)根据生产商的操作指南而***至经Asc I消化的pEJG107(WO 2005/047499)。质粒pEJG107包含烟曲霉CEL3Aβ-葡糖苷酶编码序列(SEQID NO: 53[DNA序列]和SEQ ID NO:54[推导的氨基酸序列])。该 反应由1X反应缓冲液、125ng的经Asc I消化的 pEJG107、90ng的2.33kb的PCR产物、和1μl酶组成,反应体积为10μl。将反应在37℃孵育15分钟,接着在50℃孵育15 分钟。在孵育期后,将40μl的TE加入反应中。根据制造商的操作指南,将2μl等份用于转化ONETOP10感受态细胞(Invitrogen, Carlsbad,CA,USA)。将大肠杆菌转化反应物铺在2XYT+氨苄青霉素平板上。通过测序来筛选转化体,鉴定出含有无PCR错误的***的一个克隆并将其命名为pDM287(图3)。可以用Pme I消化质粒pDM287,产生用于里氏木霉转化的约9.9kb的片段。该9.9kb的片段包含由(1) 里氏木霉Cel7A纤维二糖水解酶I基因启动子、烟曲霉CEL3A β-葡糖苷酶编码序列、和里氏木霉Cel7A纤维二糖水解酶I基因终止子;以及(2)里氏木霉Cel7A纤维二糖水解酶I基因启动子、烟曲霉GH61B 多肽编码序列、和里氏木霉Cel7A纤维二糖水解酶I基因终止子组成的两个表达盒。该9.9kb的片段也包含构巢曲霉乙酰胺酶(amdS)基因。
实施例4:里氏木霉原生质体的产生和转化
原生质体的制备和转化使用Penttila等人,1987,Gene 61:155-164 的修改操作指南来进行。简要地,在27℃下于25ml的补充有2%(w/v) 葡萄糖和10mM尿苷的YP培养基中在90rpm的轻柔振荡下培养里氏木霉菌株981-O-8(D4)17小时。菌丝体使用真空驱动的一次性过滤***(Millipore,Bedford,MA,USA)通过过滤来收集,并用去离子水洗涤两次和用1.2M山梨糖醇洗涤两次。通过在34℃下于20ml的1.2 M山梨糖醇中以90rpm的轻柔振荡来悬浮所洗涤的菌丝体15~25分钟,从而产生原生质体,该20ml的1.2M山梨糖醇含有每ml 15mg的200G(Novozymes A/S,Bagsvaerd,Denmark)和每 ml 0.36个单位的几丁质酶(Sigma Chemical Co.,St.Louis,MO,USA)。原生质体通过在400×g下离心7分钟而收集,用冷的1.2M山梨糖醇洗涤两次。将原生质体用血球计数器来计数,并在STC中再悬浮至 1×108原生质体/ml的最终浓度。将过量的原生质体储存在-80℃的Cryo 1℃冷冻容器(Nalgene,Rochester,NY,USA)中。
用Pme I消化约100μg的转化质粒(pSMai214、pDM287或 pEJG107)。消化反应物通过使用TAE缓冲液的0.8%琼脂糖凝胶电泳进行纯化。将含有pSMai214、pDM287或pEJG107的表达盒以及构巢曲霉乙酰胺酶(amdS)基因的DNA条带从凝胶中切出,并根据制造商建议的操作指南使用提取II试剂盒进行提取。
将所得的纯化的DNA[1μg的9.9kb的经Pme I消化的pDM287 (串联转化)或1μg的7.6kb的经Pme I消化的pEJG107加1μg的 5.4kb的经Pme I消化的pSMai214(共转化)]加至100μl的原生质体溶液中并轻柔地混合。加入PEG缓冲液(250μl),将反应物混合并在 34℃下孵育30分钟。然后加入STC(3ml),并将反应物混合,然后涂布在用于amdS选择的COVE平板上。将平板在28℃下孵育6~11天。
实施例5:对表达烟曲霉CEL3Aβ-葡糖苷酶和烟曲霉GH61B多肽的里氏木霉转化体 的评价
使用接种环将里氏木霉转化体(实施例4)从COVE转化平板转移至补充了10mM尿苷的COVE2平板,并在28℃下孵育5~7天。用接种环收集孢子,并将其转移至125ml塑料摇瓶中的25ml CIM培养基中。将摇瓶培养物在28℃、200rpm下孵育5天。将各个培养物的1 ml等份在微量离心机中以13,400×g离心,并回收培养物上清液。根据制造商的说明通过使用8~16%Tris-HCl凝胶(Bio-Rad Laboratories,Hercules,CA,USA)的SDS-PAGE对5μl的各个培养物上清液进行分析。将所得凝胶用BIO-SAFETM考马斯(Bio-RadLaboratories, Hercules,CA,USA)染色。45个pDM287转化体(串联构建体)和45 个pEJG107+pSMai214转化体(共转化)的SDS-PAGE图谱示出,转化体产生对应于烟曲霉CEL3Aβ-葡糖苷酶的约130kDa以及对应于烟曲霉GH61B多肽的约24kDa的主要蛋白条带。由未转化的里氏木霉菌株981-O-8(D4)培养物上清液构成的阴性对照样本,未示出约130 kDa和约24kDa的显著条带。
以下所示的结果表明,串联构建体pDM287的转化比pEJG107和 pSMai214的共转化得到更多的生产烟曲霉β-葡糖苷酶和烟曲霉 GH61B多肽的阳性转化体。
实施例6:表达烟曲霉CEL3Aβ-葡糖苷酶和烟曲霉GH61B多肽的里氏木霉转化体的 β-葡糖苷酶检定
使用3000、NX、和机械臂 (Beckman Coulter,Inc,Fullerton,CA,USA)对实施例5的培养物上清液检定β-葡糖苷酶活性。培养物上清液在0.1M琥珀酸盐、0.01%X-100(4-(1,1,3,3-四甲基丁基)苯基-聚乙二醇)缓冲液pH 5.0 (样本缓冲液)中适当稀释,接着进行稀释样本的0倍到1/3倍再到 1/9倍的一系列稀释。将共20μl的各个稀释液转移至96孔平底板。将两百微升的对硝基苯基-β-D-吡喃葡糖苷底物溶液(每ml的0.1M琥珀酸盐pH 5.0中,1mg的对硝基苯基-β-D-吡喃葡糖苷)加至各个孔中,然后在环境温度下孵育45分钟。孵育期结束后,将50μl的淬灭缓冲液(1M Tris缓冲液pH 9)加至各个孔中。在405nm的光密度测量96 孔板的端点。
在图4中示出的结果证实了实施例5的SDS-PAGE结果,即用串联构建体pDM287转化比用pEJG107和pSMai214共转化得到更多的生产烟曲霉β-葡糖苷酶和烟曲霉GH61B多肽的阳性转化体。
实施例7:构建表达青霉GH61A多肽的pDM286
使用以下所示的基因特异性正向和反向引物由质粒pGH61D23Y4 (WO 2011/041397)扩增青霉(Penicillium emersonii)GH61A多肽编码序列(SEQ ID NO:43[DNA序列]和SEQ ID NO:44[推导的氨基酸序列])。斜体区表示与反应的***位点的载体同源性。
正向引物:
5’-CGGACTGCGCACCATGCTGTCTTCGACGACTCGCAC-3' (SEQ ID NO:45)
反向引物:
5’-TCGCCACGGAGCTTATCGACTTCTTCTAGAACGTC-3'(SEQ ID NO:46)
扩增反应物由30ng pGH61D23Y4DNA,50皮摩尔的各上述引物, 1μl的dATP、dTTP、dGTP和dCTP的10mM混合物,1X PHUSIONTM高保真热启动DNA聚合酶缓冲液和1个单位的PHUSIONTM高保真热启动DNA聚合酶组成,最终体积为50μl。在 5333epgradient S中孵育扩增反应物,程序为: 98℃30秒,1个循环;每循环98℃10秒、60℃30秒和72℃30秒,35 个循环;以及72℃10分钟,1个循环。通过使用TAE缓冲液的1%琼脂糖凝胶电泳分离PCR产物,其中将约0.9kb片段从凝胶中切出,并使用凝胶提取试剂盒根据制造商的操作指南提取。
将质粒pMJ09(WO 2005/047499)用Nco I和Pac I消化,使用 TBE缓冲液通过1.0%琼脂糖凝胶电泳分离,从凝胶中切出,并使用凝胶提取试剂盒根据制造商的说明进行提取。
使用Advantage PCR克隆试剂盒根据制造商的操作指南将0.9kbPCR产物***到凝胶纯化的Nco I/Pac I消化的pMJ09中。 IN-FUSIONTM反应由1X IN-FUSIONTM反应缓冲液、180ng凝胶纯化的 Nco I/Pac I消化的pMJ09、108ng 0.9kb PCR产物和1μl IN-FUSIONTM酶组成,反应体积为10μl。将反应物在37℃下孵育15分钟,然后在 50℃下孵育15分钟。孵育期之后,将40μl TE加入到反应中。根据制造商的操作指南使用2μl等份来转化ONETOP10感受态细胞。将大肠杆菌转化反应物铺在2XYT+氨苄青霉素平板上。通过测序来筛选转化体,识别出含有没有PCR错误的***的一个克隆,并命名为pDM286(图5)。质粒pDM286可以用Pme I消化,产生约5.4kb 片段以用于里氏木霉转化。5.4kb片段含有由里氏木霉Cel7A纤维二糖水解酶I基因启动子、P.emersonii GH61A多肽编码序列和里氏木霉 Cel7A纤维二糖水解酶I基因终止子组成的表达盒。5.4kb片段还含有构巢曲霉乙酰胺酶(amdS)基因。
实施例8:用于表达Penicillium emersonii GH61A多肽和烟曲霉CEL3Aβ-葡糖苷 酶两者的串联构建体pDM290的构建
使用以下示出的基因特异性正向和反向引物从质粒pEJG107扩增烟曲霉CEL3A β-葡糖苷酶表达盒。斜体区表示与反应的***位点的载体同源性。
正向引物:
5'-CGCGGTAGTGGCGCGGTCGACCGAATGTAGGATTGTT-3' (SEQ ID NO:47)
反向引物:
5'-TTACCAATTGGCGCGCCACTACCGCGTTCGAGAAGA-3'(SEQ ID NO:48)
在最终体积50μl的PCR反应中使用50皮摩尔的以上各引物,该 PCR反应由25ngpEJG107DNA,1X PHUSIONTM高保真热启动DNA 聚合酶缓冲液,1μl的dATP、dTTP、dGTP和dCTP的10mM混合物和1个单位的PHUSIONTM高保真热启动DNA聚合酶组成。在5333epgradient S中进行扩增,程序设定如下:98℃30秒,1个循环;每循环98℃10秒、60℃30秒和 72℃2分钟30秒,35个循环;以及72℃10分钟,1个循环。
使用TAE缓冲液通过0.8%琼脂糖凝胶电泳来分离PCR产物,其中将约4.5kb片段从凝胶中切出,并使用Extract II试剂盒根据制造商的操作指南进行提取。
使用IN-FUSIONTMAdvantage PCR克隆试剂盒根据制造商的操作指南将4.5kb PCR产物***到Asc I消化的pDM286中。IN-FUSIONTM反应由1X IN-FUSIONTM反应缓冲液、125ngAsc I消化的pDM286、100 ng 4.5kb PCR产物和1μl的IN-FUSIONTM酶组成,反应体积为10μl。将反应物在37℃下孵育15分钟,然后在50℃下孵育15分钟。孵育期之后,将40μl TE加入到反应中。使用2μl等份根据制造商的操作指南转化ONETOP10感受态细胞。将大肠杆菌转化反应物铺在 2XYT+氨苄青霉素平板上。通过测序来筛选转化体,识别出包含没有PCR错误的***的一个克隆,并命名为pDM290(图6)。质粒pDM290 可以用Pme I消化,产生约9.9kb片段,以用于里氏木霉转化。9.9kb 片段包含两种表达盒:(1)里氏木霉Cel7A纤维二糖水解酶I基因启动子、P.emersonii GH61A多肽编码序列和里氏木霉Cel7A纤维二糖水解酶I基因终止子;和(2)里氏木霉Cel7A纤维二糖水解酶I基因启动子、烟曲霉CEL3Aβ-葡糖苷酶编码序列和里氏木霉Cel7A纤维二糖水解酶I基因终止子。9.9kb片段还含有构巢曲霉乙酰胺酶(amdS) 基因。
实施例9:空的里氏木霉cbhII取代构建体pJfyS142的构建
为产生构建体,以将里氏木霉cbhII基因(SEQ ID NO:3[DNA序列]和SEQ ID NO:4[推导的氨基酸序列])用烟曲霉cbhII编码序列 (SEQ ID NO:49[DNA序列]和SEQ ID NO:50[推导的氨基酸序列]) 取代,首先使用以下示出的基因特异性正向和反向引物从里氏木霉RutC30基因组DNA扩增出里氏木霉cbhII启动子。斜体区表示与反应的***位点的载体同源性。
正向引物:
5’-acgaattgtttaaacgtcgacCCAAGTATCCAGAGGTGTATGGAAATA TCAGAT-3’(SEQ IDNO:51)
反向引物:
5’-cgcgtagatctgcggccatGGTGCAATACACAGAGGGTGATCTT-3’ (SEQ ID NO:52)
将里氏木霉RutC30在28℃下在250ml带挡板的摇瓶中在200rpm 振荡下在50ml补充有2%葡萄糖(w/v)的YP培养基中生长2天。使用(Calbiochem,LaJolla,CA,USA)通过过滤收获菌丝体,并将其用去离子水洗涤两次,并在液氮下冷冻。通过研钵及研杵将冷冻的菌丝体研磨成细粉,并使用Plant Maxi试剂盒分离基因组DNA,其中裂解孵育延长至2小时。
扩增反应由20ng里氏木霉RutC30基因组DNA、200μM dNTP、 0.4μM引物、1X反应缓冲液(Stratagene,La Jolla,CA, USA)和1.875个单位的热启动高保真DNA聚合酶 (Stratagene,La Jolla,CA,USA)组成,最终体积为50μl。在5333epgradient S中孵育扩增反应物,程序设定为:95℃2分钟,1个循环;每循环95℃30秒、55℃30 秒和72℃1分30秒,25个循环;以及72℃7分钟,1个循环。使用TAE 缓冲液通过1%琼脂糖凝胶电泳来分离PCR产物,其中将1.6kb片段从凝胶中切出,并使用凝胶提取试剂盒进行提取。
使用Advantage PCR克隆试剂盒根据制造商的操作指南将1.6kbPCR产物***到Nco I/Sal I消化的pSMai155(WO 05/074647)中。反应物由1X反应缓冲液、 125ng Nco I/Sal I消化的pSMai155、100ng 1.6kb PCR产物和1μl 酶组成,反应体积为10μl。将反应物在37℃下孵育15 分钟,然后在50℃下孵育15分钟。孵育期之后,将40μl TE加入到反应中。根据制造商的操作指南,使用2μl等份来转化ONE TOP10感受态细胞。将大肠杆菌转化反应物铺在2XYT+氨苄青霉素平板上。通过使用Pci I的限制性酶切分析来筛选所得的转化体,对阳性克隆进行测序,以确保不存在PCR错误。识别出包含没有PCR错误的***的一个克隆,并命名为pJfyS142-A。质粒pJfyS142-A用于里氏木霉cbhII终止子的***。
使用以下示出的基因特异性正向和反向引物从里氏木霉RutC30基因组DNA扩增cbhII终止子。斜体区表示与反应的***位点的载体同源性。
正向引物:
5’-atctacgcgtactagttaattaaGGCTTTCGTGACCGGGCTTCAAACA- 3’(SEQ ID NO:53)
反向引物:
5’-gcggccgttactagtggatccACTCGGAGTTGTTATACGCTACTCG-3’ (SEQ ID NO:54)
扩增反应由150ng里氏木霉RutC30基因组DNA、200μM dNTP、 0.4μM引物、1X反应缓冲液和1.875个单位的热启动高保真DNA聚合酶组成,最终体积为50μl。在5333epgradient S中孵育扩增反应物,程序设定为:95℃2分钟,1个循环;每循环95℃30秒、54℃30 秒和72℃50秒,25个循环;以及72℃7分钟,1个循环。使用TAE 缓冲液通过1%琼脂糖凝胶电泳来分离PCR产物,其中将0.3kb片段从凝胶中切出,并使用凝胶提取试剂盒进行提取。
使用Advantage PCR克隆试剂盒根据制造商的操作指南将0.3kbPCR产物***到Pac I/Bam HI消化的pJfyS142-A中。反应由1X反应缓冲液、150ng PacI/Bam HI 消化的pJfyS142-A、50ng 0.3kb PCR产物和1μl 酶组成,反应体积为10μl。将反应物在37℃下孵育15分钟,然后在50℃下孵育15分钟。孵育期之后,将40μl TE加入到反应中。根据制造商的操作指南,使用2μl等份来转化ONE TOP10感受态细胞。将细胞在42℃下热击30秒,加入250μl SOC培养基。将试管在37℃、200 rpm下孵育1小时,并将250μl铺在直径150mm的2XYT+氨苄青霉素平板上,在37℃下孵育过夜。通过序列分析来筛选转化体,以识别阳性克隆,并确保不存在PCR错误。识别出包含没有PCR错误的***的一个克隆,并命名为pJfyS142-B。质粒pJfyS142-B用于单纯疱疹 (Herpes simplex)tk基因的***。
通过将质粒用Bgl II和Bam HI消化,将单纯疱疹tk基因从 pJfyS1579-8-6(WO2010/039840)中释放。使用TAE缓冲液对消化物进行1%琼脂糖凝胶电泳,其中将2.3kb条带从凝胶中切出,并使用凝胶提取试剂盒进行提取。使用QUICK LIGATIONTM试剂盒根据制造商的操作指南将tk盒***到Bam HI消化的牛小肠磷酸酶 -去磷酸化的pJfyS142-B中。连接反应物由50ng Bam HI消化的牛小肠磷酸酶-去磷酸化的pJfyS142-B、50ng 2.3kb tk基因***物、1X QUICK LIGATIONTM缓冲液和5个单位的QUICK LIGASETM组成,连接体积为 20μl。将反应物在室温下孵育5分钟,并根据制造商的操作指南使用2 μl反应物来转化ONE TOP10感受态细胞。将细胞在42℃下热击30秒,加入250μl SOC培养基。将试管在37℃、200rpm下孵育1 小时,并将250μl铺在直径150mm的2XYT+氨苄青霉素平板上,在 37℃下孵育过夜。通过使用Xma I和Bam HI的限制性酶切分析来筛选筛选所得的转化体,以确定***物的存在和方向,并识别出含有该***物的克隆,将其命名为pJfyS142-C。质粒pJfyS142-C用于里氏木霉 3’cbhII基因侧翼序列的***。
使用以下示出的正向和反向引物从里氏木霉RutC30基因组DNA 扩增3’cbhII基因侧翼序列。斜体区表示与反应的***位点的载体同源性。
正向引物:
5’-atccatcacactggcggccgcGCTTCAAACAATGATGTGCGATGGT-3’ (SEQ ID NO:55)
反向引物:
5’-gatgcatgctcgagcggccgcCTACCTTGGCAGCCCTACGAGAGAG- 3’(SEQ ID NO:56)
扩增反应由150ng里氏木霉RutC30基因组DNA、200μM dNTP、 0.4μM引物、1X反应缓冲液和1.875个单位的热启动高保真DNA聚合酶组成,最终体积为50μl。在5333epgradient S中孵育扩增反应物,程序设定为:95℃2分钟,1个循环;每循环95℃30秒、56℃30 秒和72℃下1分50秒,30个循环;以及72℃7分钟,1个循环。使用 TAE缓冲液,PCR反应物进行1%琼脂糖凝胶电泳,其中将1.5kb条带从凝胶中切出,并使用凝胶提取试剂盒进行提取。使用Advantage PCR克隆试剂盒根据制造商的操作指南将3’ cbhII基因侧翼序列***到Not I线性化的pJfyS142-C中。反应由1X反应缓冲液、150ng Not I线性化的 pJfyS142-C、80ng 1.5kb PCR产物和1μl IN-FUSIONTM酶组成,反应体积为10μl。将反应物在37℃下孵育15分钟,然后在50℃下孵育15 分钟。孵育期之后,将40μl TE加入到反应中。根据制造商的操作指南,使用2μl等份来转化ONE TOP10感受态细胞。将细胞在 42℃下热击30秒,并加入250μl SOC培养基。将试管在37℃、200rpm 下孵育1小时,并将250μl铺在直径150mm的2XYT+氨苄青霉素平板上,在37℃下孵育过夜。通过使用Bgl II的限制性酶切分析来筛选所得的转化体,并对阳性克隆进行测序,以确保不存在PCR错误。识别出包含没有PCR错误的***的一个克隆,并命名为pJfyS142(图7)。质粒pJfyS142用于烟曲霉cbhII编码序列的***。
实施例10:里氏木霉cbhII-烟曲霉cbhII取代构建体pJfyS144的构建
使用以下示出的正向和反向引物从pAlLo33(WO 2011/057140) 扩增烟曲霉cbhII编码序列。斜体区表示与反应的***位点的载体同源性。
正向引物:
5’-ctctgtgtattgcaccATGAAGCACCTTGCATCTTCCATCG-3’(SEQ ID NO:57)
反向引物:
5’-ccggtcacgaaagccTTAATTAAAAGGACGGGTTAGCGTT-3’(SEQ ID NO:58)
扩增反应由20ng pAlLo33、200μm dNTP、0.4μM引物、1mM 反应缓冲液和1.875个单位的热启动高保真DNA聚合酶组成,最终体积为50μl。在 5333epgradient S中孵育扩增反应物,程序设定为:95℃2分钟,1个循环;每循环95℃30秒、55℃30秒和72℃2分钟,30个循环;以及72℃7分钟,1个循环。
使用TAE缓冲液,PCR反应物进行1%琼脂糖凝胶电泳,其中将 1.7kb条带从凝胶中切出,并使用凝胶提取试剂盒提取。使用Advantage PCR克隆试剂盒根据制造商的操作指南将1.7kb PCR产物***到Nco I/Pac I消化的pJfyS142(实施例9)中。反应由1X 反应缓冲液、120ng Nco I/Pac I 消化的pJfyS142、70ng 1.7kb PCR产物和1μl 酶组成,反应体积为10μl。将反应物在37℃下孵育15分钟,然后在50℃下孵育15分钟。孵育期之后,将40μl TE加入到反应中。根据制造商的操作指南,使用2μl等份来转化ONE TOP10感受态细胞。将细胞在42℃下热击30秒,并加入250μl SOC培养基。将试管在37℃、 200rpm下孵育1小时,并将250μl铺在直径150mm的2XYT+氨苄青霉素平板上,在37℃下孵育过夜。将所得的转化体进行测序,以确保不存在PCR错误,并确定***物的存在。识别出序列没有错误的一个克隆,并命名为pJfyS144(图8)。
实施例11:里氏木霉cbhI-烟曲霉cbhI取代构建体pJfyS139的构建
使用以下的基因特异性正向和反向引物从pEJG93(WO 2011/057140)扩增烟曲霉纤维二糖水解酶I(cbhI)编码序列(SEQ ID NO:59[DNA序列]和SEQ ID NO:60[推导的氨基酸序列])。斜体区表示与反应的***位点的载体同源性,划线部分是导入的 Pac I位点。
正向引物:
5’-cgcggactgcgcaccATGCTGGCCTCCACCTTCTCCTACC-3’(SEQ ID NO:61)
反向引物:
5’-ctttcgccacggagcttaattaaCTACAGGCACTGAGAGTAATAATCA-3’ (SEQ ID NO:62)
扩增反应由20ng pEJG93、200μM dNTP、0.4μM引物、1X 反应缓冲液和1.875个单位的热启动高保真DNA聚合酶组成,最终体积为50μl。在 5333epgradient S中孵育扩增反应物,程序设定为:95℃2分钟,1个循环;每循环95℃30秒、55℃30秒和72℃1分钟,30个循环;以及72℃7分钟,1个循环。使用TAE缓冲液通过1%琼脂糖凝胶电泳来分离PCR产物,其中将1.6kb片段从凝胶中切出,并使用凝胶提取试剂盒根据制造商的操作指南进行提取。
使用Advantage PCR克隆试剂盒根据制造商的操作指南将1.6kbPCR产物***到Nco I/Pac I消化的pSMai155(WO 05/074647)中。反应由1X反应缓冲液、125 ng Nco I/Pac I消化的pSMai155、100ng 1.6kb PCR产物和1μl IN-FUSIONTM酶组成,反应体积为10μl。将反应物在37℃下孵育15 分钟,然后在50℃下孵育15分钟。孵育期之后,将40μl TE缓冲液加入到反应中。根据制造商的操作指南使用2μl等份来转化ONE TOP10感受态细胞。将大肠杆菌转化反应物铺在2XYT+氨苄青霉素平板上。通过测序筛选所得的转化体,并识别出包含没有PCR错误的***的一个克隆,将其命名为pJfyS139-A。质粒pJfyS139-A用于单纯疱疹病毒胸苷激酶(tk)基因的***。
通过将质粒用Bgl II和Bam HI消化,将单纯疱疹病毒tk编码序列 (SEQ ID NO:63[DNA序列]和SEQ ID NO:64[推导的氨基酸序列]) 从pJfyS1579-8-6(WO 2010/039840)中释放。使用TAE缓冲液,消化物进行1%琼脂糖凝胶电泳,其中将2.3kb条带从凝胶中切出,并使用凝胶提取试剂盒进行提取。使用QUICK LIGATIONTM试剂盒根据制造商的操作指南将tk基因盒***到Bam HI消化的牛小肠磷酸酶处理的pJfyS139-A中。连接反应物由50ng Bam HI消化的牛小肠磷酸酶处理的pJfyS139-A、50ng 2.3kb tk基因***物、1XQUICK LIGATIONTM缓冲液和5个单位的QUICK LIGASETM组成,最终体积为 20μl。将反应物在室温下孵育5分钟,并根据制造商的操作指南使用2 μl反应物来转化ONE TOP10感受态细胞。将细胞在42℃下热击30秒,加入250μl的SOC培养基。将试管在37℃、200rpm下孵育1小时,并将250μl铺在直径150mm的2XYT+氨苄青霉素平板上,在37℃下孵育过夜。通过使用Xma I的限制性酶切分析来筛选所得的转化体,以确定***物的存在和方向,并识别出含有***物的克隆,将其命名为pJfyS139-B。质粒pJfyS139-B用于里氏木霉3’cbhI基因侧翼序列的***。
使用以下示出的正向和反向引物从里氏木霉RutC30基因组DNA (实施例9)扩增3’cbhI基因侧翼序列。划线部分表示引入的用于克隆的Not I位点。
正向引物:
5’-ttagactgcggccgcGTGGCGAAAGCCTGACGCACCGGTAGAT-3’ (SEQ ID NO:65)
反向引物:
5’-agtagttagcggccgcACGGCACGGTTAAGCAGGGTCTTGC-3’ (SEQ ID NO:66)
扩增反应由150ng里氏木霉RutC30基因组DNA、200μM dNTP、 0.4μM引物、1X反应缓冲液和1.875个单位的热启动高保真DNA聚合酶组成,最终体积为50μl。在5333epgradient S中孵育扩增反应物,程序设定为:95℃2分钟,1个循环;每循环95℃30秒、60℃30 秒和72℃下1分30秒,30个循环;以及72℃7分钟,1个循环。
根据制造商的操作指南,对PCR反应物使用核苷酸去除试剂盒(QIAGEN Inc.,Valencia,CA,USA)。将所得的PCR混合物用Not I消化,使用TAE缓冲液通过1%琼脂糖凝胶电泳分离消化的PCR 产物。将含有3’cbhI基因侧翼序列的1.3kb片段从凝胶中切出,并使用凝胶提取试剂盒进行提取。使用QUICK LIGATIONTM试剂盒将1.3kb片段***到Not I线性化的牛小肠磷酸酶处理过的 pJfyS139-B中。QUICK LIGATIONTM反应由100ng Not I线性化的牛小肠磷酸酶处理过的pJfyS139-B、20ng 1.3kb片段、1XQUICK LIGATIONTM缓冲液和5个单位的QUICK LIGASETM组成,最终体积为 20μl。将反应物在室温下孵育5分钟,并根据制造商的操作指南使用2 μl反应物来转化ONE TOP10感受态细胞。将细胞在42℃下热击30秒,加入250μl SOC培养基。将试管在37℃、200rpm下孵育1 小时,并将250μl铺在直径150mm的2XYT+氨苄青霉素平板上,在 37℃下孵育过夜。通过使用Xma I的限制性酶切分析来筛选所得的转化体,以确定***物的存在和方向,并对阳性克隆进行测序。包含没有PCR错误的3’cbhI基因侧翼序列的克隆被命名为pJfyS139(图9)。
实施例12:用于取代里氏木霉cbhI基因的烟曲霉cbhI-烟曲霉cbhII串联表达载体 的构建
构建串联取代载体pQM21,用表达两种重组蛋白的串联表达盒来取代里氏木霉中的内生里氏木霉cbhI基因。质粒pQM21含有里氏木霉cbhI 5’侧翼序列、里氏木霉Cel7A纤维二糖水解酶I基因启动子、烟曲霉Cel7A纤维二糖水解酶I编码序列、里氏木霉Cel7A纤维二糖水解酶I基因终止子、里氏木霉Cel6A纤维二糖水解酶II基因启动子、烟曲霉Cel6A纤维二糖水解酶II编码序列、里氏木霉Cel6A纤维二糖水解酶II基因终止子、里氏木霉Cel7A纤维二糖水解酶I基因终止子重复序列、单纯疱疹病毒胸苷激酶(tk)基因、大肠杆菌潮霉素磷酸转移酶(hpt/hygR)选择性标记物、里氏木霉cbhI 3’侧翼序列和氨苄青霉素抗性标记物基因。
使用以下示出的基因特异性正向和反向引物从pJfyS144(实施例 10)扩增烟曲霉纤维二糖水解酶II表达盒。斜体区表示与反应的***位点的序列同源性,划线部分分别是是引入的Bam HI位点和Nhe I位点。
正向引物:
5’-tcaagcttggtaccgagctcggatCCAAGTATCCAGAGGTGTATGGAAA T-3’(SEQ ID NO:67)
反向引物:
5’-ctggcggccgttactagtgctagcACTCGGAGTTGTTATACGCTAC-3’ (SEQ ID NO:68)
扩增反应由164ng pJfyS144、1μM引物、1X ACCUPRIMETMPfx 反应缓冲液(Invitrogen,Carlsbad,CA,USA)和2.5个单位的 ACCUPRIMETMPfx DNA聚合酶(Invitrogen,Carlsbad,CA,USA)组成,最终体积为50μl。在5333 epgradient S中孵育扩增反应物,程序设定为:95℃2分钟,1个循环;每循环95℃15秒、58℃30秒和68℃5分钟,35个循环。使用TAE缓冲液,通过1%琼脂糖凝胶电泳来分离PCR产物,其中将约3.5kb的片段从凝胶中切出,并使用凝胶提取试剂盒根据制造商的操作指南进行提取。
使用IN-FUSIONTMAdvantage PCR克隆试剂盒根据制造商建议的操作指南将3.5kbPCR产物***到Bam HI消化的pJfyS139(实施例 11)中。IN-FUSIONTM反应由1X IN-FUSIONTM反应缓冲液、103ng Bam HI消化的pJfyS139、62ng 3.5kb PCR产物和1μl IN-FUSIONTM酶组成,反应体积为10μl。将反应物在37℃下孵育15分钟,然后在50℃下孵育15分钟。孵育期之后,向反应中加入15μl TE。根据制造商的操作指南,使用2μl等份来转化Gold超级感受态细胞。将大肠杆菌转化反应物铺在2XYT+氨苄青霉素平板上。通过测序来筛选转化体,并识别出包含没有PCR错误的***的一个克隆,将其命名为 pQM18(图10)。质粒pQM18用于在串联表达盒后***来自里氏木霉 3’cbhI基因侧翼区的同源重复片段,并修饰里氏木霉3’cbhII基因侧翼区。
使用以下的正向和反向引物从pJfyS139扩增来自里氏木霉3’cbhI 基因侧翼区的同源重复片段。斜体区表示与反应的***位点的序列同源性,划线部分是引入的用于克隆的Nhe I位点和Xba I 位点。
正向引物:
5’-gagtagcgtataacaactccgagtgctagcTTTAAGATAACGGAATAGAA GAA AG-3’(SEQID NO:69)
反向引物:
5’-ctggcggccgttactagtctagaCGCGCCACTACCGCGTTCG-3’(SEQ ID NO:70)
使用以下的正向和反向引物从pJfyS139扩增里氏木霉3’cbhI基因侧翼序列。斜体区表示与反应的***位点的载体同源性,划线部分是引入的用于克隆的Not I位点。
正向引物:
5’-tctgcagatatccatcacactggcggccgcTTTAAGATAACGGAATAGAAG AAAG-3’(SEQ IDNO:71)
反向引物:
5’-aaactctaggatgcatgctcgagcggccgcACGGCACGGTTAAGCAGGGT -3’(SEQ ID NO:72)
扩增反应由350ng pJfyS139、1μM引物、1X ACCUPRIMETMPfx 反应缓冲液和2.5个单位的ACCUPRIMETMPfx DNA聚合酶组成,最终体积为50μl。在5333epgradient S中孵育扩增反应物,程序设定为:95℃2分钟,1个循环;以及每循环95℃15秒、58℃30秒和68℃5分钟,35个循环。使用TAE缓冲液通过1%琼脂糖凝胶电泳纯化PCR产物,其中将约1.1kb的片段和约260bp的片段从凝胶中切出,并使用凝胶提取试剂盒根据制造商的操作指南进行提取。
通过将质粒用Nhe I和Not I消化,将含有tk基因和hpt(潮霉素磷酸转移酶)选择性标记物的DNA片段从pQM18中释放。使用TAE 缓冲液通过1%琼脂糖凝胶电泳对消化物进行分析,其中将约4.4kb的条带从凝胶中切出,并使用凝胶提取试剂盒根据制造商的操作指南进行提取。
使用TAE缓冲液通过1%琼脂糖凝胶电泳来分离来自Nhe I和Not I 消化的pQM18中的约9kb DNA片段。将9kb片段从凝胶中切出,并使用凝胶提取试剂盒根据制造商的操作指南进行提取。
IN-FUSIONTM反应由1X IN-FUSIONTM反应缓冲液、158ng的9kb Nhe I和Not I消化的pQM18、13ng的260bp来自里氏木霉cbhI 3’侧翼区的同源重复片段、39ng的1.1kb 3’cbhI侧翼、56ng的4.4kb tk-hpt 片段和1μl IN-FUSIONTM酶组成,反应体积为10μl。将反应物在37℃下孵育15分钟,并在50℃下孵育15分钟。孵育期之后,向反应中加入40μl TE。根据制造商的操作指南,使用2.5μl等份来转化Gold超级感受态细胞。将大肠杆菌转化反应物铺在 2XYT+氨苄青霉素平板上,并在37℃下孵育过夜。通过测序来筛选转化体,并识别出包含没有PCR错误的***的一个克隆,将其命名为 pQM21(图11)。质粒pQM21用作取代cbhI基因的载体。
实施例13:用烟曲霉纤维二糖水解酶I和烟曲霉纤维二糖水解酶II串联表达盒取 代内生里氏木霉cbhI基因
如实施例4所述,进行里氏木霉菌株AgJg115-104-7B1的原生质体制备和转化。
为将内生cbhI基因用烟曲霉cbhI-cbhII串联表达盒取代,将约137 μg的pQM21(实施例12)用Pme I消化。使用TAE缓冲液通过1%琼脂糖凝胶电泳来纯化消化反应物,其中从凝胶中切出含有用于靶向里氏木霉cbhI基因座的烟曲霉CBHI-CBHII串联表达盒的约12kbDNA 条带,并使用Extract II纯化试剂盒进行提取。将约1~3 μg的纯化的所得12kb DNA加入到100μl里氏木霉ku70-菌株 AgJg115-104-7B1原生质体溶液中,并轻柔混合。加入PEG缓冲液(250 μl),混合,并在34℃下孵育30分钟。然后加入STC(3ml),混合,并铺在各个补充有1M蔗糖的PDA平板上。在28℃下孵育16小时后,向各个板中加入20ml补充有35μg潮霉素B/ml的覆层PDA培养基。将平板在28℃下孵育4~7天。
得到7个转化体,挑出每一个,并转移至PDA平板,在28℃下孵育7天。采用使用下述操作指南的真菌孢子PCR法来筛选携带取代物的转化体,使用以下所示的对整合的cbhI 5’侧翼区的上游区进行退火的正向引物以及以下所示的对tk区中的区域进行退火的反向引物。
正向引物:
5’-CAAGCAAAGCGTTCCGTCGCAGTAGCAGGC-3’(SEQ ID NO: 73)
反向引物:
5’-CAGTGGCGCTTATTACTCAG-3’(SEQ ID NO:74)
只有当在cbhII基因座处发生精确的基因取代时,才会产生约7kb 的PCR产物。如果盒已经整合在基因组中的别处,则不会得到扩增物。
将来自各转化体的少量孢子悬浮在25μl的TE缓冲液中,并在微波炉中高温加热1分钟。使用各个微波过的孢子悬浮液作为PCR反应中的模板。反应由2μl微波过的孢子悬浮液、200μM dNTP、1μM引物、1X Taq反应缓冲液(New England Biolabs,Inc,Ipswich, MA,USA)和2个单位的Taq DNA聚合酶(New England Biolabs,Inc,Ipswich,MA,USA)组成,最终体积为20μl。在5333epgradient S中孵育反应物,程序设定为:95℃4分钟,1个循环;每循环95℃15秒、50℃30秒和 68℃7分钟,35个循环;以及68℃15分钟,1个循环。使用TAE缓冲液通过1%琼脂糖凝胶电泳对PCR反应物进行分析。孢子PCR表明,7 个转化体中的5个在cbhI基因座处含有取代盒。
根据实施例9中所述的过程,从4个阳性转化体中分离出基因组 DNA,并对其进行DNA印迹分析,以确认取代盒是单个拷贝。
对于DNA印迹分析,将2μg基因组DNA在20μl反应体积中用10个单位的Bam HI消化,并使用TAE缓冲液对其进行0.7%琼脂糖电泳。将凝胶中的DNA在0.25N HCl中脱嘌呤15分钟,在变性溶液中变性两次,每次15分钟,在中和溶液中中和10~30分钟,并使用TURBOBLOTTERTM***(Whatman,Inc.,Florham Park,NJ,USA)根据制造商的操作指南转移至Supercharge膜(Whatman,Inc., Florham Park,NJ,USA)。使用STRATALINKERTMUV交联剂 (Stratagene,La Jolla,CA,USA)将DNA经UV交联在膜上,并在20ml DIG Easy Hyb(Roche Diagnostics Corporation,Indianapolis,IN,USA) 中在42℃下预杂交1小时。
使用PCR Dig探针合成试剂盒(Roche Diagnostics Corporation,Indianapolis,IN,USA)根据制造商说明书,用如下所示的正向和反向引物生成与cbhI基因的3’侧翼区杂交的探针。PCR反应由具有MgCl2的1X 高保真PCR缓冲液(RocheDiagnostics Corporation, Indianapolis,IN,USA)、1X PCR DIG探针合成混合物(RocheDiagnostics Corporation,Indianapolis,IN,USA)、1μM各引物、100pg的1.1kb 3’ cbhI侧翼区和2.625个单位的高保真酶混合物(Roche Diagnostics Corporation,Indianapolis,IN,USA)组成。在 5333epgradientS中进行PCR,程序设定为:95℃ 2分钟,1个循环;每循环95℃30秒、60℃30秒和72℃40秒,10个循环;每个循环为95℃30秒、60℃30秒和72℃40秒且对于各个连续循环额外有20秒,20个循环;以及72℃7分钟,1个循环。
正向引物:
5’-GAGAACACAGTGAGACCATAGC-3’(SEQ ID NO:75)
反向引物:
5’-TCTCAACCCAATCAGCAACATG-3’(SEQ ID NO:76)
使用TAE缓冲液通过1%琼脂糖凝胶电泳来纯化探针,其中将与探针对应的720bp条带从凝胶中切出,并使用Extract II纯化试剂盒进行提取。将探针煮沸5分钟,在冰上冷却2分钟,然后加入到10ml DIG Easy Hyb中,产生杂交溶液。杂交在42℃下进行 15~17小时。然后在室温下将膜在低等严格条件下在2X SSC+0.1% SDS中洗涤5分钟,然后,在65℃下在0.5X SSC+0.1%SDS中进行两次高等严格洗涤,每次15分钟。使用化学发光检定(Roche Diagnostics, Indianapolis,IN,USA)根据制造商说明书来检测探针-靶标杂交。DNA 印迹分析表明,命名为里氏木霉QMJi029-A5的一个转化体在cbhI基因座处含有取代盒,并选择其用于消除tk和hpt标记物。
使用无菌涂布器,在5ml 0.01%20中收集在28℃下生长的七日龄PDA平板上的里氏木霉QMJi029-A5的孢子。使用血球计数器确定孢子的浓度,将104和/或105孢子铺在150mm平板上,该平板含有补充有1μM 5-氟-2'-脱氧尿苷(FdU)的TrMM-G培养基。
挑选10个FdU抗性的孢子分离株,如上所述从3个孢子分离株中提取基因组DNA。如上所述对分离株进行DNA印迹分析,结果表明所有的孢子分离株已经切除在取代盒的同源重复序列之间的hpt/tk区。选择命名为里氏木霉QMJi030-A5.6的一个菌株用于取代cbhII基因。
用10μl接种环,收集在28℃下生长的七日龄PDA平板上的里氏木霉QMJi029-A5和里氏木霉QMJi030-A5.6的孢子,并将其转移至125 ml塑料摇瓶中的25ml CIM培养基中。将摇瓶培养物在28℃、200rpm 下孵育5天。将各培养物的1ml等份在微型离心机中于13,400xg离心,回收培养上清液。使用8~16%Tris-HCl凝胶根据制造商说明书经由SDS-PAGE对5μl的各培养上清液进行分析。将所得的凝胶用BIO-SAFETMCoomassie(考马斯)染色。培养物的SDS-PAGE 图谱表明,转化体产生50与70kDa之间的两个主要蛋白条带,其分别与烟曲霉纤维二糖水解酶I和烟曲霉纤维二糖水解酶II对应。烟曲霉纤维二糖水解酶I和烟曲霉纤维二糖水解酶II的表达通过质谱分析加以确认(实施例14)。
实施例14:用于肽测序的多肽的凝胶内消化
使用II液体处理机械臂(PerkinElmer Life and AnalyticalSciences,Boston,MA,USA)进行凝胶内消化。将实施例13 中所述的SDS-PAGE凝胶的一部分切出,其在50和70kDa MW标记物之间含有目标蛋白。将凝胶片在100mM碳酸氢铵pH 8.0中用50μl 10mM二硫苏糖醇(DTT)还原30分钟。还原之后,将凝胶片在100mM 碳酸氢铵pH 8.0中用50μl 55mM碘乙酰胺烷基化20分钟。使干燥的凝胶条在室温下在含有6ng测序级胰蛋白酶(Promega,Madison,WI, USA)/μl 50mM碳酸氢铵pH 8的25μl胰蛋白酶消化液中膨胀30分钟,然后在40℃下消化8小时。上述各个反应步骤之后为,均遵照制造商的标准操作指南用适当的溶液进行多次洗涤和预洗涤。在反应之间使用50μl乙腈来使凝胶片脱水,并在步骤之间将凝胶片空气干燥。将肽用HPLC级水中的1%甲酸/2%乙腈提取30分钟,进行两次。将肽提取液转移至已经冷却至10~15℃的96孔有边缘PCR型板(ABGene, Rochester,NY,USA),并用96孔板盖(PerkinElmer Life and Analytical Sciences,Boston,MA,USA)盖上,以防止蒸发。将板在4℃下进一步储存,直至可以进行质谱分析。
蛋白鉴定.对于通过串联质谱法进行肽的从头测序,使用混合正交四极杆飞行时间质谱仪SYNAPTTMMS(Waters Corp.,Milford,MA, USA)进行LC/MS/MS分析。SYNAPTTMMS完全是微处理器控制的,其使用软件4.1版(Waters Corp.,Milford,MA,USA)。 SYNAPTTMMS装有用于使样本浓缩并脱盐的NANOACQUITY (Waters Corp,Milford,MA,USA)。将样本装载在上样环中安装的捕获柱(180μm ID X 20mm,5μmC18)(Waters Corp,Milford,MA,USA)上,并使用二元溶剂控制泵以15μl/分钟用水中的0.1%甲酸洗涤1分钟。在100μm ID x 100mm,C18,1.7μm, BEH130TMC18纳流融合毛细管柱(Waters Corp,Milford,MA,USA) 上以400nl/分钟的流量分离肽。在30分钟时间间隔中,施用0.1%甲酸中1%~85%乙腈的阶梯洗脱梯度。柱洗提液在214nm下监测,并通过装有纳米喷雾接口的电喷雾离子源引入到SYNAPTTMMS。
以全元素扫描模式从m/z 250~1900的质量范围获取数据,使用 MS到MS/MS的切换标准,以包括大于10.0计数/秒的离子强度和+2、 +3和+4的电荷状态。可以获得扫描时间为2.0秒的6个共洗脱种的分析谱图。通常使用45伏的锥孔电压,并将碰撞能量设定为根据洗脱的肽的质量和电荷状态而变化,且在10~60伏的范围内。将得到的谱图以自动的方式合并、平滑化并集中,生成峰列表。使用PROTEINLYNX GLOBAL 2.4软件(WatersCorp,Milford,MA,USA)和v.2.2(Matrix Sciences Ltd.,London,UK),针对选择的数据库对峰列表进行搜索。对PROTEINLYNX GLOBAL 搜索的结果进行评价,肽的鉴定基于与所预期蛋白序列的肽质量指纹图谱匹配。
肽质量指纹图谱证实,里氏木霉QMJi029-A5和里氏木霉 QMJI030A5.6的SDS-PAGE样本含有烟曲霉Cel7A纤维二糖水解酶I、烟曲霉Cel6A纤维二糖水解酶II、里氏木霉纤维二糖水解酶II和其他少量里氏木霉宿主背景蛋白。
实施例15:编码Penicillium emersonii GH61A多肽和烟曲霉Cel3Aβ-葡糖苷酶的 串联基因表达质粒pRRAB01的生成
使用以下所示的基因特异性正向和反向引物从质粒pAG121(图 12;SEQ ID NO:77;来自核苷酸6位至核苷酸620位,参见pAG121 的限制性酶切图谱和序列)扩增里氏木霉纤维二糖水解酶II(cbhII) 基因启动子。正向引物中的斜体区表示与pDM286载体骨架的序列同源性,反向引物中的斜体区表示与用于反应的下一个***物即烟曲霉β-葡糖苷酶编码序列的序列同源性。
正向引物:
5’-cgaacgcggtagtggGAATTCTAGGCTAGGTATGC-3’(SEQ ID NO: 78)
反向引物:
5’-ccaaccgaatctcatGGTGCAATACACAGAGGGTG-3’(SEQ ID NO: 79)
扩增反应由1ng的pAG121DNA、100皮摩尔的各上述引物、1μl 的dATP、dTTP、dGTP和dCTP的10mM混合物、1X PHUSIONTM高保真热启动DNA聚合酶缓冲液和1个单位的PHUSIONTM高保真热启动DNA聚合酶组成,最终体积为50μl。在 5333epgradient S中孵育扩增反应物,程序设定为:98℃下30秒,1个循环;每循环98℃10秒和72℃20秒,35个循环;以及72℃10分钟,1个循环。使用TAE缓冲液通过1%琼脂糖凝胶电泳分离PCR产物,其中将约640bp片段从凝胶中切出,并使用凝胶提取试剂盒根据制造商的操作指南进行提取。
使用以下所示的基因特异性正向和反向引物从质粒pDM290扩增烟曲霉β-葡糖苷酶编码序列。正向引物中的斜体区表示与之前***物即里氏木霉纤维二糖水解酶II编码基因的序列同源性,反向引物中的斜体区表示与反应的下一个***物即里氏木霉纤维二糖水解酶II基因终止子的序列同源性。
正向引物:
5’-tctgtgtattgcaccATGAGATTCGGTTGGCTCGA-3’(SEQ ID NO: 80)
反向引物:
5’-ccggtcacgaaagccCTAGTAGACACGGGGCAGAG-3’(SEQ ID NO:81)
扩增反应由1ng的pDM290DNA、100皮摩尔的各上述引物、1μl 的dATP、dTTP、dGTP和dCTP的10mM混合物、1X PHUSIONTM高保真热启动DNA聚合酶缓冲液和1个单位的PHUSIONTM高保真热启动DNA聚合酶组成,最终体积为50μl。在 5333epgradient S中孵育扩增反应物,程序设定为:98℃30秒,1个循环;每循环98℃10秒、65℃30秒和72℃1:35 秒,35个循环;以及72℃10分钟,1个循环。使用TAE缓冲液通过 1%琼脂糖凝胶电泳分离PCR产物,其中将约3.1kb片段从凝胶中切出,并使用凝胶提取试剂盒根据制造商的操作指南进行提取。
使用以下所示的基因特异性正向和反向引物从质粒pJfyS144扩增里氏木霉纤维二糖水解酶II基因终止子。正向引物中的斜体区表示与烟曲霉β-葡糖苷酶编码序列的序列同源性,反向引物中的斜体区表示与用于反应的pDM286骨架的序列同源性。
正向引物:
5’-ccccgtgtctactagGGCTTTCGTGACCGGGCTTC-3’(SEQ ID NO: 82)
反向引物:
5’-gtcattaccaattggACTCGGAGTTGTTATACGCT-3’(SEQ ID NO: 83)
扩增反应由1ng的pJfyS144DNA,100皮摩尔的各上述引物,1μl 的dATP、dTTP、dGTP和dCTP的10mM混合物,1X PHUSIONTM高保真热启动DNA聚合酶缓冲液和1个单位PHUSIONTM高保真热启动 DNA聚合酶组成,最终体积为50μl。在 5333epgradient S中孵育扩增反应物,程序设定为:98℃30秒,1个循环;每循环98℃10秒和72℃10秒,35个循环;以及72℃10分钟,1个循环。使用TAE缓冲液通过1%琼脂糖凝胶电泳分离PCR产物,其中将330bp片段从凝胶中切出,并使用凝胶提取试剂盒根据制造商的操作指南进行提取。
使用以下所示的基因特异性正向和反向引物,将里氏木霉纤维二糖水解酶II基因启动子、烟曲霉β-葡糖苷酶编码序列和里氏木霉纤维二糖水解酶II基因终止子在重叠延伸(SOE)PCR反应中结合。斜体区表示与用于反应的pDM286中的***位点的序列同源性。
正向引物:
5’-cgaacgcggtagtggGAATTCTAGGCTAGGTATGC-3’(SEQ ID NO: 84)
反向引物:
5’-gtcattaccaattggACTCGGAGTTGTTATACGCT-3’(SEQ ID NO: 85)
SOE PCR反应由48ng扩增自pAG121的640bp里氏木霉cbhII启动子,228ng扩增自pDM290的3.1kb烟曲霉β-葡糖苷酶基因片段, 24ng扩增自pJfyS144的330bp里氏木霉cbhII终止子,100皮摩尔的各上述引物,1μl的dATP、dTTP、dGTP和dCTP的10mM混合物, 1XPHUSIONTM高保真热启动DNA聚合酶缓冲液和1个单位的 PHUSIONTM高保真热启动DNA聚合酶组成,最终体积为50μl。在5333epgradient S中孵育扩增反应物,程序设定为:98℃30秒,1个循环;每循环98℃10秒和72℃2分5 秒,35个循环;和72℃10分钟,1个循环。使用TAE缓冲液通过1%琼脂糖凝胶电泳分离PCR产物,其中将约4.1kb片段从凝胶中切出,并使用凝胶提取试剂盒根据制造商的操作指南进行提取。
将质粒pDM286用Asc I消化,并使用TAE缓冲液通过1%琼脂糖凝胶电泳分离经AscI消化的pDM286,其中将约8kb的片段从凝胶中切出,并使用凝胶提取试剂盒根据制造商的操作指南进行提取。
使用IN-FUSIONTMAdvantage PCR克隆试剂盒根据制造商的操作指南将4.1kb的PCR产物***到Asc I消化的pDM286中。IN-FUSIONTM反应由1X IN-FUSIONTM反应缓冲液、200ng约8kb凝胶纯化的Asc I 消化的pDM286、203.1ng的4.1kb PCR产物和1μl IN-FUSIONTM酶组成,反应体积为10μl。将反应物在37℃下孵育15分钟,并在50℃下孵育15分钟。孵育期之后,向反应物中加入40μl TE。根据制造商的操作指南,使用2μl等份来转化ONE TOP10感受态细胞。将大肠杆菌转化反应物铺在2XYT+氨苄青霉素平板上。通过测序来筛选转化体,并识别出包含没有PCR错误的***的一个克隆,将其命名为 pRRAB01(图13)。
实施例16:编码烟曲霉β-葡糖苷酶(Cel3A)突变基因的里氏木霉表达载体的生成
使用多点定点诱变试剂盒(Stratagene,La Jolla, CA,USA)通过在pEJG97(WO 2005/074647)上进行定点诱变,构建含有替换G142S、Q183R、H266Q和D703G的烟曲霉家族3A β-葡糖苷酶的变体。用于定点诱变的寡核苷酸的概要示于表1中。
使用9600准备所得的变异质粒pDFng128-6。使用 AppliedBiosystems 3130xl基因分析仪(Applied Biosystems,Foster City, CA,USA)对变异质粒构建体进行测序,以确认变化。
表1
设计以下所示的两种合成寡核苷酸引物,从质粒pDFng128-6中 PCR扩增烟曲霉β-葡糖苷酶变体编码序列。使用IN-FUSIONTM克隆试剂盒将片段直接克隆到表达载体pMJ09中。粗体字母表示编码序列。其余序列与pMJ09的***位点同源。
正向引物:
5’-CGGACTGCGCACCATGAGATTCGGTTGGCTCGA-3’(SEQ ID NO:90)
反向引物:
5’-TCGCCACGGAGCTTACTAGTAGACACGGGGCAGAG-3’ (SEQ ID NO:91)
将50皮摩尔的各上述引物用于PCR反应中,该PCR反应由50ng 的pDFng128-6,具有MgCl2的1X 高保真PCR缓冲液,各 0.25mM的dATP、dTTP、dGTP和dCTP,和2.6个单位的高保真酶混合物组成,最终体积为50μl。在 5333epgradient S中进行扩增,程序设定为:94℃ 2分钟,1个循环;每循环94℃15秒、65℃30秒和68℃1分钟,30个循环;以及68℃下最终延长7分钟。然后将加热块转至4℃浸泡循环。使用TBE缓冲液通过0.7%琼脂糖凝胶电泳分离反应产物,其中将约 3.1kb的产物条带从凝胶中切出,并使用凝胶提取试剂盒根据制造商说明书进行提取。
将质粒pMJ09用Nco I和Pac I消化,使用TBE缓冲液通过1.0%琼脂糖凝胶电泳分离,从凝胶中切出,并使用凝胶提取试剂盒根据制造商说明书进行提取。
将3.1kb的基因片段和消化的载体使用IN-FUSIONTM克隆试剂盒连接在一起,得到pDFng113-3(图14),其中β-葡糖苷酶变体编码序列的转录处于来自里氏木霉cbhI基因的启动子的控制下。连接反应(20 μl)由1X IN-FUSIONTM反应缓冲液、1X BSA、1μl IN-FUSIONTM酶 (1:10稀释)、200ng凝胶纯化的Nco I/Pac I消化的pMJ09以及172.2 ng纯化的3.1kbPCR产物组成。将反应物在37℃下孵育15分钟,然后在50℃下孵育15分钟。使用2μl反应物来转化大肠杆菌XL10 Gold超级感受态细胞。将大肠杆菌转化反应物铺在2XYT+氨苄青霉素平板上。使用9600来准备含有 pDFng133-3的大肠杆菌转化体。通过DNA测序来确认pDFng133-3中的烟曲霉β-葡糖苷酶变体***物。
实施例17:编码Penicillium emersonii GH61A多肽和烟曲霉Cel3A β-葡糖苷酶 变体的串联表达载体pAmFs074的构建
通过将来自pRRAB01和pDFNG133-3的限制性酶切片段组合来生成串联表达载体pAmFs074,以产生用于表达Penicillium emersonii GH61A多肽和烟曲霉Cel3A β-葡糖苷酶变体的单一载体。
将1微克经质粒中量试剂盒(QIAGEN Inc.,Valencia,CA,USA) 纯化的质粒pRRAB01(实施例15)与最终体积20μl中的20个单位 Xho I(New England Biolabs Inc,Ipswich,MA,USA)、1X NEB缓冲液4 (New England Biolabs Inc,Ipswich,MA,USA)和1XBSA混合。反应物在37℃下孵育3小时,并然后与4μl的5X DNA上样染料(QIAGEN Inc.,Valencia,CA,USA)结合。使用TBE缓冲液通过1%琼脂糖凝胶电泳分离限制性酶切消化反应产物,其中将约9.4kb的片段从凝胶中切出,并使用Extract II试剂盒根据制造商的操作指南进行提取。9.4kb的片段含有里氏木霉Cel7A纤维二糖水解酶I基因启动子、P.emersonii GH61A多肽编码序列、里氏木霉Cel7A纤维二糖水解酶I基因终止子、里氏木霉Cel6A纤维二糖水解酶II基因启动子、烟曲霉β-葡糖苷酶Cel3A β-葡糖苷酶编码序列的3’端487bp部分和5’端 16bp部分、里氏木霉Cel6A纤维二糖水解酶II基因终止子、构巢曲霉乙酰胺酶(amdS)基因和氨苄青霉素抗性标记物基因。
将1微克经质粒中量试剂盒纯化的质粒pDFNG133-3(实施例16) 与最终体积20μl中的20个单位限制性内切酶Xho I、1X NEB缓冲液 4和1X BSA混合。将反应物在37℃下孵育3小时,然后与4μl 5X DNA 上样染料混结合。使用TBE缓冲液通过1%琼脂糖凝胶电泳分离限制性酶切消化反应产物,其中将约2.6kb的片段从凝胶中切出,并使用Extract II试剂盒根据制造商的操作指南进行提取。2.6 kb的片段含有烟曲霉β-葡糖苷酶Cel3A β-葡糖苷酶突变基因的1940bp 部分。
将纯化的9.4kb pRRAB01Xho I限制性酶切片段和纯化的2.6kb pDFNG133-3Xho I限制性酶切片段使用QUICK LIGATIONTM试剂盒根据制造商的操作指南连接在一起。将50ng等份的9.4kb pRRAB01片段和50ng等份的2.6kb pDFNG133-3片段混合,用无菌水将体积调节至10μl。然后加入10μl 2X QUICK LIGATIONTM缓冲液和1μl QUICK LIGASETM,并彻底混合。将反应在25℃下进行5分钟,然后置于冰上。根据制造商的操作指南,使用2μl等份的连接反应物来转化ONE TOP10感受态细胞。将大肠杆菌转化反应物铺在2XYT+氨苄青霉素平板上。通过限制性酶切图谱和测序来筛选转化体。识别出包含没有序列错误并方向正确的***的一个克隆,将其命名为pAmFs074(图 15)。
质粒pAmFs074可以用Pme I消化,以产生用于里氏木霉转化的约 9.35kb片段。9.35kb的片段含有由以下组成的表达盒:(1)里氏木霉 Cel7A纤维二糖水解酶I基因启动子、P.emersonii GH61A多肽编码序列和里氏木霉Cel7A纤维二糖水解酶I基因终止子,和(2)里氏木霉 Cel6A纤维二糖水解酶II基因启动子、烟曲霉β-葡糖苷酶Cel3A β-葡糖苷酶突变体编码序列和里氏木霉Cel6A纤维二糖水解酶II基因终止子。9.35kb的片段还含有构巢曲霉乙酰胺酶(amdS)基因。
实施例18:用于取代里氏木霉cbhII的Penicillium emersonii GH61A多肽和烟曲 霉Cel3A变异β-葡糖苷酶串联表达载体的产生
构建串联取代载体pQM22,用于将里氏木霉中的里氏木霉cbhII 基因用串联表达盒取代,以表达除真菌选择性标记物之外的两种重组蛋白。载体pQM22含有里氏木霉cbhII5’侧翼区、里氏木霉Cel7A纤维二糖水解酶I基因启动子、P.emersonii GH61A多肽编码序列、里氏木霉Cel7A纤维二糖水解酶I基因终止子、里氏木霉Cel6A纤维二糖水解酶II基因启动子、烟曲霉β-葡糖苷酶Cel3A β-葡糖苷酶突变体编码序列、里氏木霉Cel6A纤维二糖水解酶II基因终止子、单纯疱疹病毒胸苷激酶(tk)基因、大肠杆菌潮霉素磷酸转移酶(hpt/hygR)选择性标记物、里氏木霉cbhII 3’侧翼区和氨苄青霉素抗性标记物基因。
通过将释放自pAmFs074的约6.4kb串联表达盒和扩增自里氏木霉菌株AgJg115-104-7B1基因组DNA(根据实施例9分离)的约1.5kb 里氏木霉cbhII 5’侧翼区***到经SapI和Pac I消化的pJfyS142(实施例9)的约8.7kb载体片段中,制得载体pQM22。
通过将质粒用Pme I和Eco RV消化,从pAmFs074中释放用于P. emersonii GH61A多肽和烟曲霉β-葡糖苷酶变体的6.4kb串联表达盒。对消化物进行使用TAE缓冲液的1%琼脂糖凝胶电泳,其中将约6.4kb 条带从凝胶中切出,并使用Extract II纯化试剂盒根据制造商的操作指南进行提取。
使用以下的正向和反向引物,从里氏木霉菌株QMJi030-A5.6基因组DNA扩增5’里氏木霉cbhII侧翼序列。斜体区表示与用于反应的***位点的序列同源性,划线部分表示引入的用于克隆的Pac I和Psi I位点。
正向引物:
5’-gcgagtcagtgagcgaggaagcggaagagcttaattaaTCTTGAGTGGATGTC TGATCTAG-3’(SEQ ID NO:92)
反向引物:
5’-gttcggataacaatcctacattcggtcgacttataaGGATGTATCAATGGGTTAT ACG-3’(SEQID NO:93)
扩增反应由约150ng的里氏木霉QMJi030-A5.6(实施例13)基因组DNA、1μM引物、200μM dNTP(Appiled Biosystems, Foster City,USA)、1X PHUSIONTM高保真热启动DNA聚合酶缓冲液和 1个单位的PHUSIONTM高保真热启动DNA聚合酶组成,最终体积为50μl。在5333epgradient S中孵育扩增反应物,程序设定为:98℃2分钟,1个循环;每循环98℃15秒、 60℃30秒和72℃1分钟,35个循环;和在72℃10分钟,1个循环。使用TAE缓冲液通过1%琼脂糖凝胶电泳分离PCR产物,其中将约1.5kb 条带从凝胶中切出,并使用Extract II纯化试剂盒根据制造商的操作指南进行提取。
将约36μg的pJfyS142用Sap I和Pac I消化。使用TAE缓冲液通过1%琼脂糖凝胶电泳分离消化反应物,其中将约8.7kb的条带从凝胶中切出,并使用Extract II纯化试剂盒根据制造商的操作指南进行提取。
IN-FUSIONTM反应由1X IN-FUSIONTM反应缓冲液、138ng用Sap I 和Pac I消化的8.7kb pJfyS142片段、205ng来自pAmFs074的6.4kb 片段、49ng里氏木霉cbhII 5’侧翼区的1.5kb片段和1μl IN-FUSIONTM酶组成,反应体积为10μl。将反应物在37℃下孵育15分钟,在50℃下孵育15分钟。孵育期之后,向反应中加入40μl TE。根据制造商的操作指南,使用2.5μl等份来转化ONE TOP10感受态细胞。将大肠杆菌转化反应物铺在2XYT+氨苄青霉素平板上。通过测序来筛选转化体,并识别出包含没有PCR错误的***的一个克隆,将其命名为 pQM22(图16)。质粒pQM22用作取代里氏木霉cbhII基因的载体。
实施例19:用Penicillium emersonii GH61A多肽和烟曲霉β-葡糖苷酶突变串联 表达盒取代内生里氏木霉cbhII基因
为将内生里氏木霉cbhII基因用P.emersonii GH61多肽-烟曲霉β- 葡糖苷酶突变串联表达盒取代,将里氏木霉QMJi030-A5.6(实施例13) 用6.3μg Pme I线性化的pQM22(实施例18)转化。得到31个转化体,挑取每一个并转移至PDA平板,在28℃下孵育7天。使用实施例13 中所述的真菌孢子PCR法用以下所示的引物组A筛选出含有完整cbhII 基因基因座的转化体之后,根据实施例9的过程从8个转化体中分离出基因组DNA,并使用以下所示的引物组B、与整合的cbhII 5’侧翼区的上游区进行退火的正向引物、烟曲霉β-葡糖苷酶突变区之后的tk区中的反向引物-1和里氏木霉cbhII 3’侧翼区下游的另一反向引物-2经 PCR加以分析。
引物组A正向引物:
5’-TCAACCAGCTTCTTTATTGG-3’(SEQ ID NO:94)
引物组A反向引物:
5’-GATCGCCATAGGCTCATGCTCCGCA-3’(SEQ ID NO:95)
引物组B正向引物:
5’-GCGGCATCAAACACGAACCTG-3’(SEQ ID NO:96)
引物组B反向-1引物:
5’-CAGTGGCGCTTATTACTCAG-3’(SEQ ID NO:97)
引物组B反向-2引物:
5’-GATCGCCATAGGCTCATGCTCCGCA-3’(SEQ ID NO:98)
反应由2μl孢子悬浮液、200μM dNTP、1μM引物、1X Taq反应缓冲液和2个单位的Taq DNA聚合酶组成,最终体积为20μl。在 5333epgradient S中孵育反应物,程序设定为:95℃4分钟,1个循环;每循环95℃15秒、55℃30秒、68℃11分钟,35个循环;以及68℃15分钟,1个循环。使用TAE缓冲液通过1%琼脂糖凝胶电泳对PCR反应物进行分析。PCR结果表明,一个转化体在靶向的cbhII基因座处含有取代盒。如下文所述进行DNA印迹分析,以确认取代盒是P. emersonii GH61A多肽序列和烟曲霉β-葡糖苷酶突变编码序列的单一拷贝。
根据实施例9中所述的过程从转化体中分离出基因组DNA,并对各转化体进行DNA印迹分析。对于DNA印迹分析,在70μl反应体积中用10个单位的Cla I和/或含有5个单位StuI和5个单位Sex AI 的限制性内切酶混合物消化6μg基因组DNA。将消化的DNA反应物与14μl的5X DNA上样染料混合,并使用TAE缓冲液使25μl的各混合物进行1%琼脂糖电泳。将凝胶中的DNA在0.25N HCl中脱嘌呤15 分钟,在变性溶液中变性两次,每次15分钟,在中和溶液中中和10~30 分钟,并转移至Supercharge膜。使用STRATALINKERTM UV交联剂将DNA UV交联到膜上,并在20ml DIG Easy Hyb中在42℃下预杂交1小时。
将约1μg的pQM22用Stu I和Xba I消化。使用TAE缓冲液通过 1%琼脂糖凝胶电泳分离消化反应物,其中将来自P.emersonii GH61A 多肽编码序列的约800bp条带从凝胶中切出,并使用凝胶提取试剂盒根据制造商的操作指南进行提取。
将约1μg的pQM22用Xho I和Nru I消化。使用TAE缓冲液通过 1%琼脂糖凝胶电泳分离消化反应物,其中将来自烟曲霉Cel3A β-葡糖苷酶突变体编码序列的约1kb条带从凝胶中切出,并使用凝胶提取试剂盒根据制造商的操作指南进行提取。
将约1μg的pQM22用Not I和Pvu I消化。使用TAE缓冲液通过 1%琼脂糖凝胶电泳分离消化反应物,其中将来自hpt基因的约1.1kb 条带从凝胶中切出,并使用凝胶提取试剂盒根据制造商的操作指南进行提取。
将266ng的800bp片段、168ng的1kb片段和240ng的1.1kb 片段量各自混合在16μl的最终体积中,以使用DIG-High Prime DNA 标记试剂盒(Roche DiagnosticsCorporation,Indianapolis,IN,USA)根据制造商说明书生成探针。将DNA混合物煮沸10分钟,然后迅速在冰上冷却,之后加入4μl的DIG-High引物混合物(Roche DiagnosticsCorporation,Indianapolis,IN,USA)。将反应物在37℃下孵育约20小时,之后加入2μl的0.2M EDTA,然后在65℃下加热10分钟,以使反应停止。
使用凝胶提取试剂盒根据制造商的操作指南纯化探针。将探针煮沸5分钟,在冰上冷却2分钟,然后加入到10ml的 DIG Easy Hyb中,产生杂交溶液。杂交在42℃下进行约17小时。然后在室温下将膜在低等严格条件下在2X SSC+0.1%SDS中洗涤5分钟,然后在65℃下在0.5X SSC+0.1%SDS中进行两次高等严格洗涤,每次15分钟。探针-靶标杂交物通过化学发光检定(Roche Diagnostics, Indianapolis,IN,USA)根据制造商说明书进行检测。DNA印迹分析表明,转化体在靶向的cbhII基因座处含有P.emersonii GH61A多肽编码序列和烟曲霉β-葡糖苷酶(Cel3A)突变体编码序列的单一拷贝。该转化体命名为里氏木霉QMJi033。
实施例20:里氏木霉原生质体的生成和转化
原生质体的制备和转化使用Penttila等人,1987,Gene 61:155-164 的改良操作指南进行。简言之,将里氏木霉菌株AgJg115-104-7B1 (PCT/US2010/061105;WO 2011/075677)在25ml补充有2%(w/v) 葡萄糖和10mM尿苷的YP培养基中在27℃下在90rpm轻缓震荡下培养17小时。使用真空驱动的一次性过滤***通过过滤来收集菌丝体,并用去离子水洗涤两次,再用1.2M山梨糖醇洗涤两次。通过将洗涤的菌丝体在含有15mg200G/ml和0.36个单位的几丁质酶/ml的20ml 1.2M山梨糖醇中,在34℃下在90rpm轻缓震荡下悬浮15~25分钟,生成原生质体。通过在400x g下离心7分钟收集原生质体,并将其用冷的1.2M山梨糖醇洗涤两次。将原生质体用血球计数器计数,并在STC中再悬浮至1x108原生质体/ml的最终浓度。将多余的原生质体在-80℃下储存在Cryo 1℃冷冻容器中。
将约100μg在以下实施例中描述的转化质粒用Pme I消化。使用 TAE缓冲液通过1%琼脂糖凝胶电泳纯化消化反应物。将DNA条带从凝胶中切出,并使用凝胶提取试剂盒进行提取。将所得的纯化DNA加入到100μl原生质体溶液中,并轻缓混合。加入PEG 缓冲液(250μl),混合,并在34℃下孵育30分钟。然后加入STC(3 ml),混合,并铺在补充有1M蔗糖的PDA平板上。在28℃下孵育16 小时之后,向各个板加入20ml补充有35μg潮霉素B/ml的覆层PDA 培养基。将平板在28℃下孵育4~7天。
实施例21:用烟曲霉cbhI基因取代内生里氏木霉cbhI基因
为将里氏木霉内生cbhI基因(SEQ ID NO:1[DNA序列]和SEQ ID NO:2[推导的氨基酸序列])用烟曲霉cbhI编码序列(SEQ ID NO:57 [DNA序列]和SEQ ID NO:58[推导的氨基酸序列])取代,根据实施例 20中所述的过程将里氏木霉ku70-菌株AgJg115-104-7B1(PCT/US2010/061105;WO 2011/075677)用4x 2μg Pme I线性化的 pJfyS139(实施例11)转化。得到7个转化体,挑取每一种并转移至 PDA平板,在28℃下孵育7天。根据实施例9中所述的过程,从转化体中分离基因组DNA,并使各转化体进行DNA印迹分析。
对于DNA印迹分析,将2μg基因组DNA在50μl反应体积中用 33个单位的Bgl II消化,并使用TAE缓冲液进行1%琼脂糖电泳。将凝胶中的DNA在0.25N HCl中经一次10分钟洗涤而脱嘌呤,在0.5N NaOH-1.5M NaCl中经两次15分钟洗涤而变性,在1M Tris pH 8-1.5MNaCl经一次30分钟洗涤而中和,并在20X SSC中孵育5分钟。使用 TURBOBLOTTERTM***根据制造商的操作指南将DNA转移至Supercharge膜。使用STRATALINKERTMUV交联剂将DNA UV交联到膜上,并在20ml DIG Easy Hyb中在42℃下预杂交1小时。
使用PCR Dig探针合成试剂盒根据制造商说明书用以下所示的正向和反向引物生成与3’cbhI基因侧翼序列杂交的探针。PCR反应由1X 反应缓冲液、400nM各引物、200μM DIG标记的含有 dUTP的dNTP、20ng pJfyS139和1.5个单位的热启动高保真DNA聚合酶组成。在5333 epgradient S中孵育扩增反应物,程序设定为:95℃2分钟,1个循环;每循环95℃30秒、55℃30秒和72℃40秒,25个循环;以及在72℃7分钟,1个循环。
正向引物:
5’-AAAAAACAAACATCCCGTTCATAAC-3’(SEQ ID NO:99)
反向引物:
5’-AACAAGGTTTACCGGTTTCGAAAAG-3’(SEQ ID NO:100)
使用TAE缓冲液通过1%琼脂糖凝胶电泳纯化探针,其中将与探针对应的0.5kb条带从凝胶中切出,并使用凝胶提取试剂盒进行提取。将探针煮沸5分钟,在冰上冷却2分钟,然后加入到 10ml DIG Easy Hyb中,产生杂交溶液。杂交在42℃下进行15~17小时。然后在室温下将膜在低等严格条件下在2X SSC+0.1%SDS中洗涤5分钟,然后在65℃下在0.5X SSC+0.1%SDS中进行两次高等严格洗涤,每次15分钟。探针-靶标杂交物通过化学发光检定(Roche Diagnostics,Indianapolis,IN,USA)根据制造商说明书进行检测。DNA 印迹分析表明,7个转化体中的3个在cbhI基因座处含有取代盒,选择一个转化体里氏木霉JfyS139-8用于消除hpt和tk标记物。
通过将在28℃下生长的七日龄PDA平板的孢子转移至PDA平板,并在28℃下孵育7天,生成新鲜的孢子平板。使用无菌涂布器将孢子收集在10ml 0.01%20中。使用血球计数器测定孢子浓度,将105孢子铺在含有补充有1μM 5-氟-2'-脱氧尿苷(FdU)的TrMM-G 培养基的150mm板上。
得到300个FDU抗性的孢子分离株,如上所述从2个孢子分离株中提取DNA。如上所述将分离株进行DNA印迹分析,结果表明两个孢子分离株均已切除在取代盒的同源重复序列之间的hpt/tk区。选择命名为里氏木霉JfyS139-8A的一个菌株用于取代cbhII基因。
实施例22:用烟曲霉cbhII基因取代内生里氏木霉cbhII基因
为将里氏木霉天然cbhII基因用烟曲霉cbhII编码序列取代,根据实施例20中所述的过程将里氏木霉JfyS139-8A(实施例21)用2μg Pme I线性化并经凝胶纯化的pJfyS144(实施例10)转化。得到7个转化体,挑取每一个并转移至PDA平板,在28℃下孵育7天。使用下文所述的真菌孢子PCR法来筛选携带基因取代的转化体,使用以下所示的与整合区外的5’cbhII基因侧翼序列的上游区进行退火的正向引物,以及以下所示的用于烟曲霉cbhII编码序列的反向引物。
正向引物:
5’-AGCCACATGCCGCATATTGACAAAG-3’(SEQ ID NO:101)
反向引物:
5’-AGGGATTCAGTGTGCTACAGGCTGC-3’(SEQ ID NO:102)
只有当在cbhII基因座处发生精确基因取代时,才会产生大约1.8 kb的PCR产物。如果盒已经整合在基因组中的别处,则不会发生扩增。
将来自各转化体的少量孢子悬浮在25μl TE缓冲液中,并在微波炉中高温加热1分钟。使用各个微波过的孢子悬浮液作为PCR反应中的模板。反应由1μl微波过的孢子悬浮液、1μl的10mM dNTP、12.5 μl的2X GC-Melt LA悬浮液(Clontech,MountainView, CA,USA)、25pmol正向引物、25pmol反向引物、1.25个单位的GCGenomic LA聚合酶混合物(Clontech,Mountain View,CA,USA)和9.25μl水组成。在 5333epgradient S中孵育反应物,程序设定为:95℃10分钟,1个循环;每循环95℃30秒、56℃30秒和72℃1分40 秒,35个循环;以及72℃7分钟,1个循环;以及保持在4℃。使用 TAE缓冲液使PCR反应物进行1%琼脂糖凝胶电泳。孢子PCR表明, 7个转化体中的4个在靶向的基因座处含有取代盒,对其中的3个进行 DNA印迹分析,以确认取代盒是单个拷贝。
根据实施例9中所述的过程,从3个转化体中分离基因组DNA,并对各个转化体进行DNA印迹分析。对于DNA印迹分析,将2μg基因组DNA在50μl反应体积中用50个单位的Dra I消化,并使用TAE 缓冲液使其进行1%琼脂糖电泳。将凝胶中的DNA在0.25N HCl中以一次10分钟洗涤进行脱嘌呤,在0.5N NaOH-1.5M NaCl中以两次15 分钟洗涤进行变性,在1M TrispH 8-1.5M NaCl中以1次30分钟洗涤进行中和,并在20X SSC中孵育5分钟。将DNA转移至 Supercharge膜。使用STRATALINKERTMUV交联剂将DNA UV交联到膜上,并在20ml DIG Easy Hyb中在42℃下预杂交1小时。
使用PCR Dig探针合成试剂盒根据制造商说明书,用以下示出的正向和反向引物生成与3’cbhII基因侧翼序列杂交的探针。PCR反应由 1X 反应缓冲液、400nM各引物、200μM DIG标记的含有dUTP的dNTP、150ng里氏木霉RutC30基因组DNA和1.5个单位的热启动高保真DNA聚合酶组成。在 5333epgradient S中孵育反应物,程序设定为: 95℃2分钟,1个循环;每循环95℃30秒、51℃30秒和72℃40秒,30 个循环;以及72℃7分钟,1个循环。
正向引物:
5’-AAAAAACAAACATCCCGTTCATAAC-3’(SEQ ID NO:103)
反向引物:
5’-AACAAGGTTTACCGGTTTCGAAAAG-3’(SEQ ID NO:104)
使用TAE缓冲液通过1%琼脂糖凝胶电泳纯化探针,其中将与探针对应的0.5kb条带从凝胶中切出,并使用凝胶提取试剂盒进行提取。将探针煮沸5分钟,在冰上冷却2分钟,并加入到10ml DIG Easy Hyb中,产生杂交溶液。杂交在42℃下进行约17小时。然后在室温下将膜在低等严格条件下在2X SSC+0.1%SDS中洗涤5分钟,然后在65℃下在0.5X SSC+0.1%SDS中进行两次高等严格洗涤,每次15分钟。探针-靶标杂交物通过化学发光检定(Roche Diagnostics, Indianapolis,IN,USA)根据制造商说明书进行检测。DNA印迹分析表明,3个转化体在cbhII基因座处含有取代盒,选择所有三个(命名为 JfyS139/144-5、-6和-10)用于消除hpt和tk标记物。
通过将在28℃下在PDA平板上生长的七日龄培养物的塞子转移至新的PDA平板,并在28℃下孵育7天,生成新鲜的孢子平板。使用无菌涂布器将孢子收集在10ml 0.01%20中。使用血球计数器测定孢子浓度,将105和104孢子铺在含有补充有1μM FdU的 TrMM-G培养基的150mm平板上。
从含有105孢子的平板中得到各个转化体的约500个FdU抗性的孢子分离株,从含有104孢子的平板中针对各转化体分离约100个FdU 抗性的孢子分离株。对于菌株JfyS139/144-5和-6,挑取8个孢子分离株,对于菌株JfyS139/144-10,挑取4个。将来自初级转化体5的各分离株1~8命名为JfyS139/144-5A至-5H。将来自初级转化体6的分离株 1~8命名为JfyS139/144-6A至-6H。将来自初级转化体10的分离株1~4 命名为JfyS139/144-10A至-10D。使用以下所示的正向和反向引物如上所述进行孢子PCR,以确认hpt和tk标记物已经被正确切除。
正向引物:
5’-GTTAAGCATACAATTGAACGAGAATGG-3’(SEQ ID NO: 105)
反向引物:
5’-GATGATATAATGGAGCAAATAAGGG-3’(SEQ ID NO:106)
如上所述用以下循环参数进行PCR反应:95℃2分钟,1个循环;每个循环为95℃30秒、55℃30秒和72℃6分钟,30个循环;以及72℃ 7分钟,1个循环。
引物与用于cbhII基因取代的5’(正向)和3’(反向)侧翼序列进行退火。已经将hpt/tk盒正确切除的菌株将会显示3.5kb片段,而标记物完整的那些则显示8kb片段。PCR筛选表明,所有的孢子分离株均已正确切除hpt/tk盒。
从各初级转化体的A和B孢子分离株提取DNA,并如上所述对其进行DNA印迹分析。DNA印迹分析证实,各个孢子分离株均已正确切除了hpt/tk盒。选择孢子分离株里氏木霉JfyS139/144-10B来代表含有里氏木霉cbhI和cbhII基因二者均分别被烟曲霉同源物取代的菌株。
实施例23:里氏木霉ku70基因修复质粒pTH239的生成
使用Advantage PCR克隆试剂盒将4个DNA片段结合,以生成用内生里氏木霉ku70编码序列(SEQ ID NO:107[DNA序列]和SEQ ID NO:108[推导的氨基酸序列])取代被破坏的里氏木霉 ku70编码序列的构建体。使用以下所示的序列特异性正向和反向引物 (SEQ ID NO:109和110)从pJfyS139-B(实施例11)扩增包含原核复制原点的氨苄青霉素抗性标记物区。使用以下所示的序列特异性正向和反向引物(SEQ ID NO:111和112)从里氏木霉981-O-8基因组 DNA扩增里氏木霉ku70基因上游序列(由来自ku70编码序列上游的 989bp和ku70编码序列的前1010bp组成)。使用以下所示的序列特异性正向和反向引物(SEQ ID NO:113和114)从里氏木霉981-O-8基因组DNA扩增里氏木霉ku70基因下游序列(由从在上游PCR产物中扩增的ku70编码序列的1010 bp片段3’端重复出的500 bp片段、含有ku70 编码序列其余部分的1067 bp片段和来自ku70编码序列下游的461 bp 组成)。根据实施例9中所述的过程来制备里氏木霉981-O-8基因组 DNA。
正向引物:
5’-GTGTGCGGCCGCTCGAGCATGCATGTTTAAACAGCTTGGC ACTGGCCGTCGTTTT-3’(SEQ IDNO:109)
反向引物:
5’-ATCAGCCCCGAGACGGCGCCGCGTTTAAACAATTCGTAAT CATGGTCATAGCTGT-3’(SEQ IDNO:110)
正向引物:
5’-CATGATTACGAATTGTTTAAACGCGGCGCCGTCTCGGGGC TGATCTTGTCGAGGA-3’(SEQ IDNO:111)
反向引物:
5’-GGCGGCCGTTACTAGTGGATCCAGCCCTTGACAGTGATCT TGAGTCCAGGTGCAA-3’(SEQ IDNO:112)
正向引物:
5’-TGCAGATATCCATCACACTGGCGGCCGCAGTTTCCATGTCC AACGTGTTGTTTTGCGC-3’(SEQID NO:113)
反向引物:
5’-GCCAGTGCCAAGCTGTTTAAACATGCATGCTCGAGCGGCC GCACACGCCCTCTCCTCG-3’(SEQID NO:114)
对于氨苄青霉素抗性标记物和原核复制原点区的扩增,反应由100 ng里氏木霉981-O-8基因组DNA、200μM dNTP、1μM各引物(SEQ ID NO:109和110)、1X 高保真热启动DNA聚合酶缓冲液和1.0个单位的高保真热启动DNA聚合酶组成,最终体积为50μl。在5333 epgradient S中孵育扩增反应物,程序设定为:98℃30秒,1个循环;每循环98℃10 秒,55℃30秒和72℃1分30秒,30个循环;以及72℃7分钟,1个循环。使用TAE缓冲液通过1%琼脂糖凝胶电泳分离PCR产物,其中将 2.692 kb片段从凝胶中切出,并使用凝胶提取试剂盒进行提取。
对于ku70基因上游序列和下游序列的扩增,反应由100ng pJfyS139-B、200μMdNTP、1μM各引物(SEQ ID NO:111和112或者113和114)、1X 高保真热启动DNA聚合酶缓冲液和1.0 个单位的高保真热启动DNA聚合酶组成,最终体积为50μl。在5333epgradient S中孵育扩增反应物,程序设定为:98℃30秒,1个循环;每循环98℃10秒,55℃ 30秒和72℃1分30秒,30个循环;以及72℃7分钟,1个循环。使用 TAE缓冲液通过1%琼脂糖凝胶电泳分离PCR产物,其中分别将1.999 kb和2.028kb的片段从凝胶中切出,并使用凝胶提取试剂盒进行提取。
从使用Not I和Bam HI的pJfyS139-B的限制性内切酶消化中产生第4个DNA片段。反应由5μg pJfyS139-B、10个单位的Not I、20个单位的Bam HI和20μl限制性内切酶缓冲液2(New England Biolabs, Inc.,Ipswich,MA,USA)组成,总体积为50μl。将反应物在37℃下孵育1小时,然后使用TAE缓冲液通过1%琼脂糖凝胶电泳分离,其中将4.400kb片段从凝胶中切出,并使用凝胶提取试剂盒进行提取。
使用Advantage PCR克隆试剂盒根据制造商的操作指南将2,028bp、1,999bp和2,692bp的三种PCR产物***到Not I和 Bam HI消化的pJfyS139-B中。反应由1X 反应缓冲液、50ng Not I/Bam HI消化的pJfyS139-B、50ng 1.999kb ku70 基因上游PCR产物、50ng 2.028kb ku70基因下游PCR产物、50ng 2.692 kb氨苄青霉素抗性标记物和原核复制原点PCR产物和1μl 酶组成,反应体积为10μl。反应物在37℃下孵育15分钟,然后在50℃下孵育15分钟。孵育期之后,向反应物中加入40μl TE。使用3μl等份根据制造商的操作指南来转化大肠杆菌XL10感受态细胞(Stratagene,La Jolla,CA,USA)。将细胞在42℃下热击30秒,然后加入500μl预热至42℃的NZY+培养基。将管在37℃下以200rpm 震摇孵育40分钟,然后铺在直径150mm的2XYT+氨苄青霉素平板上,在37℃下孵育过夜。通过用Hind III和Xba I进行限制性酶切消化分析,筛选所得的转化体,并对阳性克隆进行测序,以确保不存在PCR错误。识别出包含没有PCR错误的***的一个克隆,并将其命名为pTH239。
实施例24:烟曲霉cbh1和cbh2取代菌株JfyS139/144-10B中ku70基因的修复
在菌株里氏木霉JfyS139/144-10B(实施例22)中对内生里氏木霉 ku70基因进行修复,以促进需要ku70基因在非同源性末端结合中的功能的菌株操纵步骤。根据实施例4中所述的过程,将里氏木霉 JfyS129/144-10B用23x 2μg Pme I线性化的pTH239(实施例23)进行转化。得到19个转化体,将各个分别转移至PDA平板,并在28℃下孵育7天。
通过PCR来筛选所有19个转化体,以确认pTH239Pme I片段在破坏的ku70基因基因座处的同源整合。对于各个转化体,使用无菌接种环从7日龄PDA平板中收集孢子。将孢子转移至含有25μl 1mM EDTA-10mM Tris缓冲液的试管,并用高功率微波处理1分钟。将1μl 等份的微波处理过的孢子混合物直接加入到PCR反应中作为模板 DNA。设计以下所示的一组PCR引物,以跨越ku70编码序列的破坏区进行扩增,从而区分具有ku70编码序列中的破坏的宿主基因组(848 bp)与pTH239靶向目标菌株(606bp)。PCR反应由1X Genomic LA聚合酶反应缓冲液(Clontech,Mountain View,CA,USA)、 400nM各引物、200μMdNTP、1μl微波处理过的TE-孢子混合物(如上所述)和1.0个单位的Genomic LA聚合酶(Clontech, Mountain View,CA,USA)组成。在 5333epgradient S中孵育扩增反应物,程序设定为:95℃10分钟,1个循环;每循环95℃30秒,55℃30秒和72℃60秒,30个循环;以及72℃ 7分钟,1个循环。
正向引物:
5’-CAATGACGATCCGCACGCGT-3’(SEQ ID NO:115)
反向引物:
5’-CAATGACGATCCGCACGCGT-3’(SEQ ID NO:116)
仅19个转化体中的1个(#19)对于606bp PCR产物为阳性且对 848bp PCR产物为阴性,表明为包含同源整合在ku70基因座处的pTH239PmeI片段的菌株。
使用无菌涂布器,将来自转化体#19的七日龄PDA平板的孢子收集在10ml 0.01%20中。使用血球计数器确定孢子浓度,将 106孢子铺在含有补充有1μM 5-氟-2'-脱氧尿苷(FdU)的TrMM-G培养基的150mm平板上,并在28℃下培养5天。得到22个FdU抗性的孢子分离株,将其转化至PDA平板,并在28℃下培养5天。
针对存在于修复盒内的在ku70编码序列的同源重复之间的hpt/tk 标记物区的切除,通过PCR筛选所有22个孢子分离株(#19A-V)。对于各个孢子分离株,使用无菌接种环从7日龄PDA平板中收集孢子。将孢子转移至含有25μl 1mM EDTA-10mM Tris缓冲液的试管,并用高功率微波处理1分钟。将1μl等份的孢子混合物直接加入到PCR反应中作为模板基因组DNA。设计以下所示的一组PCR引物,以跨越 hpt/tk区进行扩增,以区分hpt/tk区的存在(6kb)或不存在(1.1kb)。 PCR反应由1X Genomic LA聚合酶反应缓冲液、400 nM各引物(以下所示)、200μM dNTP、1μl微波处理过的TE-孢子混合物(如上所述)和1.0个单位的Genomic LA聚合酶组成。在5333epgradient S中孵育扩增反应物,程序设定为:95℃10分钟,1个循环;每循环95℃30秒, 50℃30秒和72℃6分钟,30个循环;以及72℃7分钟,1个循环。
正向引物:
5’-GACACTCTTTTCTCCCATCT-3’(SEQ ID NO:117)
反向引物:
5’-GAGGAGCAGAAGAAGCTCCG-3’(SEQ ID NO:118)
所有22个孢子分离株对于与hpt/tk标记物区对应的6kb PCR产物均为阴性。
使用无菌涂布器,将来自分离株#19A和#19L的七日龄PDA平板的孢子收集在10ml0.01%20中。使用血球计数器确定孢子浓度,将103、102和101孢子铺在含有1M蔗糖的150mm PDA平板上,在28℃下培养3天。从菌株#19A和#19L的PDA平板选择10个孢子分离株,并转移至新鲜PDA平板,置于28℃下。
根据实施例9中所述的过程从#19L和#19A的6个孢子分离株中提取基因组DNA,并对其进行DNA印迹分析。
对于DNA印迹分析,将2μg基因组DNA在50μl反应体积中用 (1)分别5个单位和10个单位的Asc I和Xho I或(2)分别5个单位和25个单位的Asc I和Apa I消化,并使用TAE缓冲液进行1%琼脂糖电泳。将凝胶中的DNA在0.25N HCl以一次10分钟洗涤进行脱嘌呤,在0.5NNaOH-1.5M NaCl中以两次15分钟洗涤进行变性,在1M Tris pH 8-1.5M NaCl中以一次30分钟洗涤进行中和,并在20X SSC中孵育5分钟。使用TURBOBLOTTERTM***根据制造商的操作指南将 DNA转移至Supercharge膜。使用STRATALINKERTMUV 交联剂将DNA经UV交联到膜上,并在20ml DIG Easy Hyb中在42℃下预杂交1小时。
使用PCR Dig探针合成试剂盒根据制造商说明书用以下所示的正向和反向引物生成与ku70编码序列的3’端杂交的探针。为生成纯的用于探针PCR反应的模板,从里氏木霉981-O-8基因组DNA扩增ku70 编码序列的3’端。PCR反应由1X 高保真热启动DNA聚合酶缓冲液、1μM各引物、200μM dNTP、165ng里氏木霉981-O-8基因组DNA和1.0个单位的高保真热启动DNA聚合酶组成。在5333epgradient S中孵育扩增反应物,程序设定为:98℃30秒,1个循环;每循环98℃10秒、60℃30 秒和72℃15秒,35个循环;以及72℃10分钟,1个循环。
正向引物:
5’-gcatatataacccactcaagta-3’(SEQ ID NO:119)
反向引物:
5’-attatcttggaccggccgcagg-3’(SEQ ID NO:120)
使用TAE缓冲液通过1%琼脂糖凝胶电泳纯化0.5kb探针模板,并将其从凝胶中切出,使用凝胶提取试剂盒进行提取。使用上述的引物和扩增条件,如制造商说明书所述,使用纯化的PCR 产物生成DIG标记的探针。使用TAE缓冲液通过1%琼脂糖凝胶电泳纯化0.5kb DIG标记的探针,并将其从凝胶中切出,使用凝胶提取试剂盒进行提取。将探针煮沸5分钟,在冰上冷却2分钟,并加入到10ml DIG Easy Hyb中,产生杂交溶液。杂交在42℃下进行15~17小时。然后在室温下将膜在低等严格条件下在2X SSC+0.1% SDS中洗涤5分钟,然后在65℃下在0.5X SSC+0.1%SDS中进行两次高等严格洗涤,每次15分钟。探针-靶标杂交物通过化学发光检定 (Roche Diagnostics,Indianapolis,IN,USA)根据制造商说明书进行检测。DNA印迹分析表明,所有孢子分离株均在ku70基因座处含有修复 /取代盒,并消除了hpt和tk标记物。选择命名为里氏木霉 981-O-8.5#10B+Ku70#19L3的一个菌株,用于进一步的转化。
实施例25:里氏木霉981-O-8.5#10B+Ku70#19L3原生质体的生成和转化
原生质体的制备和转化使用Penttila等人,1987,Gene 61:155-164 的改良方案进行。简言之,将里氏木霉菌株981-O-8.5#10B+Ku70#19L3 在25ml补充有2%(w/v)葡萄糖和10mM尿苷的YP培养基中在27℃下在90rpm轻缓震荡下培养17小时。使用真空驱动的一次性过滤***通过过滤收集菌丝体,并用去离子水洗涤两次,用1.2M山梨糖醇洗涤两次。通过将洗涤过的菌丝体在含有15mg 200G/ml 和0.36个单位的几丁质酶/ml的20ml 1.2M山梨糖醇中在34℃下随90 rpm轻缓震荡悬浮15~25分钟。通过在400x g离心7分钟收集原生质体,并将其用冷的1.2M山梨糖醇洗涤两次。将原生质体用血球计数器计数,并再悬浮在STC中至最终浓度为1x108原生质体/ml。将过量的原生质体在-80℃下储存在Cryo1℃冷冻容器中。
将约100μg质粒pAmFs074用Pme I消化。使用TAE缓冲液通过 0.8%琼脂糖凝胶电泳纯化消化反应物。将含有表达盒的约9.4kb DNA 条带从凝胶中切出,上述表达盒包含Penicillium emersonii GH61A多肽编码序列、烟曲霉β-葡糖苷酶突变体编码序列和amdS标记物,并使用凝胶提取试剂盒根据制造商建议的操作指南进行提取。
将所得的9.4kb片段(5x 2μg或2x 3.5μg的9.4kb Pme I消化的 pAmFs074)加入到100μl原生质体溶液中,并轻缓混合。加入PEG 缓冲液(250μl),将反应物混合,并在34℃下孵育30分钟。然后加入 STC(3ml),将反应物混合,然后铺在用于amdS选择的COVE平板上。将平板在28℃下孵育6~11天。
实施例26:对摇瓶中里氏木霉转化体进行Penicillium emersonii GH61A多肽和 烟曲霉β-葡糖苷酶变体的表达的评价
使用接种环将112个里氏木霉981-O-8.5#10B+Ku70#19L3转化体从COVE转化平板转移至补充有10mM尿苷的COVE2平板,并在28℃下孵育5~7天。用接种环收集孢子,并将其转移至125ml塑料摇瓶中的25ml CIM培养基中。将摇瓶培养物在28℃、200rpm下孵育5天。将约14~15ml的各培养物倒入15ml试管中。将试管在863x g下离心 20分钟。将上清液倾倒到新的试管中。使用3000、 NX和机械臂(BeckmanCoulter,Inc,Fullerton,CA,USA)对上清液进行β-葡糖苷酶活性的检定。将上清液适当稀释于0.1M琥珀酸盐、0.01%X-100(4-(1,1,3,3-四甲基丁基)苯基-聚乙二醇)缓冲液pH 5.0(样本缓冲液)中,然后将稀释的样本连续稀释0倍至 1/3倍至1/9倍。将共20μl的各稀释液共计转移至96孔平底板。向各孔中加入200微升于0.1M琥珀酸盐pH 5.0缓冲液中的1mg/ml对硝基苯基-β-D-吡喃葡糖苷底物,然后在环境温度下孵育45分钟。孵育期一结束,向各孔中加入50μl的淬灭缓冲液(1M Tris pH 9)。对于96 孔板,在405nm的光密度处测量终点。通过SDS-PAGE对33个示出大于16,000μM/min/ml的活性的样本进行分析,以确定GH61多肽的表达。
使用8~16%Tris-HCl凝胶根据制造商说明书经 SDS-PAGE对10μl的各培养上清液进行分析。将所得的凝胶用 BIO-SAFETM考马斯染色。培养物的SDS-PAGE图谱示出,转化体产生与烟曲霉β-葡糖苷酶变体对应的约130kDa、以及与Penicilliumemersonii GH61A GH61A多肽对应的约27kDa的主要蛋白条带。基于 SDS-PAGE图谱上GH61A多肽的表达,选择21个转化体,用于进一步的孢子纯化和分析。
孢子纯化的进行是通过用1μl接种环接触孢子平板,之后将环浸在1ml 0.01%20中,然后进行涡旋。将1微升和10微升的该孢子混合物与100μl 0.01%20混合,并铺在大的COVE 平板上。将平板在28℃下孵育,直至在板上出现单个的孢子分离株。
将所有21个候选物的单个孢子分离株均转移至COVE2+10mM 尿苷平板,并在28℃下孵育约1周,之后接种至含有25ml CIM培养基的125ml塑料摇瓶。如上所述通过SDS-PAGE对所得的摇瓶培养物进行分析,并与初级转化体的摇瓶培养物进行比较。选择6个孢子纯化的转化体,即597A、676D、679C、680A、683A和686C,用于2 升发酵,以测定收率。
实施例27:发酵
将前6个孢子纯化的里氏木霉981-O-8.5#10B+Ku70#19L3转化体 (597A、676D、679C、680A、683A和686C)和里氏木霉QMJi033 在28℃下在PDA平板上培养约1周。
摇瓶培养基由20g右旋糖、10g玉米浆冻干粉、1.45g(NH4)2SO4、 2.08g KH2PO4、0.36g CaCl2、0.42g MgSO4·7H2O和0.42ml痕量金属溶液组成。痕量金属溶液由216gFeCl3·6H2O、58g ZnSO4·7H2O、27g MnSO4·H2O、10g CuSO4·5H2O、2.4g H3BO3、336g柠檬酸和加至1 升的去离子水组成。
将100ml摇瓶培养基加入到500ml摇瓶中。用两个塞子从固体平板培养物接种摇瓶,并在28℃下在定轨摇床上在200rpm下孵育48小时。使用50ml摇瓶肉汤来接种2升的发酵容器。
分批发酵培养基每升由30g纤维素、4g右旋糖、10g玉米浆冻干粉、3.8g(NH4)2SO4、2.8g KH2PO4、2.64g CaCl2、1.63g MgSO4.7H2O、 1.8ml消泡剂和0.66ml痕量金属溶液组成。痕量金属溶液每升由216g FeCl3·6H2O、58g ZnSO4·7H2O、27g MnSO4·H2O、10g CuSO4·5H2O、 2.4g H3BO3和336g柠檬酸组成。发酵进料培养基由右旋糖组成。
将共1.8升的分批发酵培养基加入到3升玻璃夹套发酵罐(Applikon Biotechnology Inc.,Foster City CA USA)中。将发酵进料培养基以0~4g/l/hr的速率给予185小时的时间段。将发酵容器保持在28℃温度下,使用1030控制***(Applikon Biotechnology Inc.,Foster City CA USA)将pH控制在4.5+/-0.1的设定点。以1vvm的速率将空气加入至容器中,通过以1100~1300rpm转动的Rushton桨搅动肉汤。发酵结束时,从容器中收获全部肉汤,并在 3000x g下离心,以除去生物质。将上清液无菌过滤,并在5~10℃下储存。
实施例28:对2升发酵肉汤中的里氏木霉转化体进行Penicillium emersonii GH61A多肽和烟曲霉β-葡糖苷酶变体在2升发酵肉汤中表达的评价
通过SDS-PAGE对前6个孢子纯化的里氏木霉 981-O-8.5#10B+Ku70#19L3转化体(597A、676D、679C、680A、683A 和686C)和里氏木霉QMJi033的发酵肉汤进行分析,以评价Penicillium emersonii GH61A多肽和烟曲霉β-葡糖苷酶变体的表达水平。将0.5μl 体积的各菌株的发酵肉汤上清液与25μl去离子水以及25μl含有5%2- 巯基乙醇的Laemmli染料(Bio-Rad Laboratories,Hercules,CA,USA) 混合。将混合物在95℃加热5分钟,将10μl(相当于0.1μl发酵肉汤) 根据制造商说明书装载在不含染料的8~16%Tris-HCl凝胶(Bio-Rad Laboratories,Hercules,CA,USA)上。将凝胶在200伏特下跑大约55分钟,然后通过Gel DocTMEZ成像器(Bio-Rad Laboratories, Hercules,CA,USA)分析。发酵肉汤上清液的SDS-PAGE图谱示出,里氏木霉QMJi033中Penicillium emersonii GH61A多肽和烟曲霉β-葡糖苷酶变体的表达与前6个里氏木霉981-O-8.5#10B+Ku70#19L3转化体(597A、676D、679C、680A、683A和686C)是相当的。
通过以下编号的段落对本发明进行进一步的说明:
[1]一种构建用于产生具有生物活性的多种重组多肽的丝状真菌菌株的方法,其包括:(a)通过向丝状真菌菌株中导入第一串联构建体,通过靶向整合取代内源性第一基因,该第一串联构建体包含(i) 第一基因的同源5’区、其同源侧翼区或其组合,(ii)一个或多个第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v)第一基因的同源3’区、其同源侧翼区或其组合;(b)通过向丝状真菌菌株中导入第二串联构建体,通过靶向整合取代内源性第二基因,该第二串联构建体包含(i)第二基因的同源5’区、其同源侧翼区或其组合,(ii)一个或多个第二可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v)第二基因的同源3’区、其同源侧翼区或其组合;或(c)(a)和(b)的组合。
[2]段落1的方法,其中第一基因是纤维二糖水解酶I基因。
[3]段落2的方法,其中纤维二糖水解酶I基因编码选自以下的纤维二糖水解酶I:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶 I;(ii)包含与SEQ ID NO:2的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶I; (iii)由包含与SEQ ID NO:1的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I;和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ IDNO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I。
[4]段落1的方法,其中第二基因是纤维二糖水解酶II基因。
[5]段落4的方法,其中纤维二糖水解酶II基因编码选自以下的纤维二糖水解酶II:(i)包含SEQ ID NO:4的成熟多肽的纤维二糖水解酶II;(ii)包含与SEQ ID NO:4的成熟多肽具有至少70%,例如至少 75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少 85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少 91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少 97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II;(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II;和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
[6]段落1~5中任一段的方法,其中各个串联构建体通过同源重组整合到丝状真菌菌株的染色体中。
[7]段落1~6中任一段的方法,其中第一基因的同源5’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[8]段落1~7中任一段的方法,其中第一基因的同源3’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[9]段落1~8中任一段的方法,其中第二基因的同源5’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[10]段落1~9中任一段的方法,其中第二基因的同源3’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[11]段落1~10中任一段的方法,其还包括通过向丝状真菌菌株中导入针对各个基因的对应串联构建体各自经靶向整合取代一个或多个其他内源性基因,该串联构建体包含:(i)基因的同源5’区、其同源侧翼区或其组合;(ii)一个或多个可选择性标记物;(iii)与启动子和终止子可操作连接的编码具有生物活性的多肽的多核苷酸;(iv)与另一启动子和另一终止子可操作连接的编码具有生物活性的另一多肽的另一多核苷酸;和(v)基因的同源3’区、其同源侧翼区或其组合。
[12]段落1~11中任一段的方法,其中一个或多个串联构建体还包含一个或多个可选择性标记物的5’侧翼的第一同源重复和一个或多个可选择性标记物的3’侧翼的第二同源重复,其中第一同源重复和第二同源重复进行同源重组,以切除一个或多个可选择性标记物。
[13]段落12的方法,其中第一和第二同源重复是相同的,或者彼此具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的的序列同一性。
[14]段落12或13的方法,其中第一和第二同源重复各自为至少 50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[15]段落12~14中任一段的方法,其中在切除一个或多个可选择性标记物时,一个或多个可选择性标记物可以再用于将针对各个基因的对应串联构建体各自通过靶向整合来取代一个或多个其他内源性基因。
[16]段落1~15中任一段的方法,其还包括将丝状真菌宿主细胞用串联构建体转化,该串联构建体包含:(i)一个或多个可选择性标记物; (ii)与第五启动子和第五终止子可操作连接的编码具有生物活性的第五多肽的第五多核苷酸;和(iii)与第六启动子和第六终止子可操作连接的编码具有生物活性的第六多肽的第六多核苷酸,其中该串联构建体通过异位整合而整合。
[17]段落1~16中任一段的方法,其中具有生物活性的多肽是不同的多肽。
[18]段落1~16中任一段的方法,其中两个或更多个具有生物活性的多肽是相同的多肽。
[19]段落1~18中任一段的方法,其中启动子是不同的启动子。
[20]段落1~18中任一段的方法,其中两个或更多个启动子是相同的启动子。
[21]段落1~20中任一段的方法,其中终止子是不同的终止子。
[22]段落1~20中任一段的方法,其中两个或更多个终止子是相同的终止子。
[23]段落1~22中任一段的方法,其中一个或多个串联构建体包含在表达载体中。
[24]段落1~23中任一段的方法,其中丝状真菌菌株是枝顶孢属、曲霉属、短梗霉属、黑管菌属、拟蜡霉属、金孢属、鬼伞属、革盖菌属、隐球菌属、线黑粉酵母属、镰孢菌属、腐质霉属、巨座壳属、毛霉属、毁丝菌属、新美鞭菌属、脉孢菌属、拟青霉属、青霉属、平革菌属、白腐菌属、梨囊鞭菌属、侧耳属、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属或木霉属菌株。
[25]段落24的方法,其中木霉属菌株选自哈茨木霉、康氏木霉、长梗木霉、里氏木霉或绿色木霉。
[26]段落24的方法,其中木霉属菌株是里氏木霉。
[27]一种丝状真菌菌株,根据段落1~26中任一段的方法得到。
[28]一种丝状真菌菌株,其包含:(a)通过靶向整合用第一串联构建体取代的内源性第一基因,该第一串联构建体包含(i)第一基因的同源5’区、其同源侧翼区或其组合,(ii)一个或多个可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v)第一基因的同源3’区、其同源侧翼区或其组合;(b)通过靶向整合用第二串联构建体取代的内源性第二基因,该第二串联构建体包含(i)第二基因的同源5’区、其同源侧翼区或其组合,(ii)一个或多个可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v)第二基因的同源3’区、其同源侧翼区或其组合;或(c)(a)和(b)的组合。
[29]段落28的丝状真菌菌株,其中第一基因是纤维二糖水解酶I 基因。
[30]段落29的丝状真菌菌株,其中纤维二糖水解酶I基因编码选自以下的纤维二糖水解酶I:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶I;(ii)包含与SEQ ID NO:2的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶I;(iii)由包含与SEQ ID NO:1的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I;和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I。
[31]段落28的丝状真菌菌株,其中第二基因是纤维二糖水解酶II 基因。
[32]段落31的丝状真菌菌株,其中纤维二糖水解酶II基因编码选自以下的纤维二糖水解酶II:(i)包含SEQ ID NO:4的成熟多肽的纤维二糖水解酶II;(ii)包含与SEQ IDNO:4的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II;(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少 70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II;和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
[33]段落28~32中任一段的丝状真菌菌株,其中各个串联构建体通过同源重组整合到丝状真菌菌株的染色体中。
[34]段落28~33中任一段的丝状真菌菌株,其中第一串联构建体的第一基因的同源5’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[35]段落28~34中任一段的丝状真菌菌株,其中第一串联构建体的第一基因的同源3’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[36]段落28~35中任一段的丝状真菌菌株,其中第二串联构建体的第二基因的同源5’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[37]段落28~36中任一段的丝状真菌菌株,其中第二串联构建体的第二基因的同源3’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[38]段落28~37中任一段的丝状真菌菌株,其还包含一个或多个各自通过靶向整合用针对各基因的对应串联构建体取代的其他内源性基因,该串联构建体包含:(i)基因的同源5’区、其同源侧翼区或其组合;(ii)一个或多个可选择性标记物;(iii)与启动子和终止子可操作连接的编码具有生物活性的多肽的多核苷酸;(iv)与另一启动子和另一终止子可操作连接的编码具有生物活性的另一多肽的另一多核苷酸;和(v)基因的同源3’区、其同源侧翼区或其组合。
[39]段落28~38中任一段的丝状真菌菌株,其中一个或多个串联构建体还包含一个或多个可选择性标记物的5’侧翼的第一同源重复和一个或多个可选择性标记物的3’侧翼的第二同源重复,其中第一同源重复和第二同源重复进行同源重组,以切除一个或多个可选择性标记物。
[40]段落39的丝状真菌菌株,其中第一和第二同源重复是相同的,或者彼此具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的的序列同一性。
[41]段落39或40的丝状真菌菌株,其中第一和第二同源重复各自为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少 800bp、至少1000bp、至少1500bp或至少2000bp。
[42]段落39~41中任一段的丝状真菌菌株,其中在切除一个或多个可选择性标记物时,一个或多个可选择性标记物可以再用于将针对各个基因的对应串联构建体各自通过靶向整合来取代一个或多个其他内源性基因。
[43]段落28~42中任一段的丝状真菌菌株,其还包含串联构建体,该串联构建体包含:(i)一个或多个可选择性标记物;(ii)与第五启动子和第五终止子可操作连接的编码具有生物活性的第五多肽的第五多核苷酸;和(iii)与第六启动子和第六终止子可操作连接的编码具有生物活性的第六多肽的第六多核苷酸,其中该串联构建体通过异位整合而整合。
[44]段落28~43中任一段的丝状真菌菌株,其中具有生物活性的多肽是不同的多肽。
[45]段落28~43中任一段的丝状真菌菌株,其中两个或更多个具有生物活性的多肽是相同的多肽。
[46]段落28~45中任一段的丝状真菌菌株,其中启动子是不同的启动子。
[47]段落28~45中任一段的丝状真菌菌株,其中两个或更多个启动子是相同的启动子。
[48]段落28~47中任一段的丝状真菌菌株,其中终止子是不同的终止子。
[49]段落28~47中任一段的丝状真菌菌株,其中两个或更多个终止子是相同的终止子。
[50]段落28~49中任一段的丝状真菌菌株,其中一个或多个串联构建体包含在表达载体中。
[51]段落28~50中任一段的丝状真菌菌株,其中丝状真菌菌株是枝顶孢属、曲霉属、短梗霉属、黑管菌属、拟蜡霉属、金孢属、鬼伞属、革盖菌属、隐球菌属、线黑粉酵母属、镰孢菌属、腐质霉属、巨座壳属、毛霉属、毁丝菌属、新美鞭菌属、脉孢菌属、拟青霉属、青霉属、平革菌属、白腐菌属、梨囊鞭菌属、侧耳属、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属或木霉属菌株。
[52]段落51的丝状真菌菌株,其中木霉属菌株选自哈茨木霉、康氏木霉、长梗木霉、里氏木霉或绿色木霉。
[53]段落51的丝状真菌菌株,其中木霉属菌株是里氏木霉。
[54]一种在丝状真菌菌株中产生具有生物活性的多种重组多肽的方法,其包括在有益于产生多肽的条件下培养丝状真菌宿主细胞,其中丝状真菌宿主细胞包含:(a)通过靶向整合用第一串联构建体取代的内源性第一基因,该第一串联构建体包含(i)第一基因的同源5’区、其同源侧翼区或其组合,(ii)一个或多个可选择性标记物,(iii) 与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v)第一基因的同源 3’区、其同源侧翼区或其组合;(b)通过靶向整合用第二串联构建体取代的内源性第二基因,该第二串联构建体包含(i)第二基因的同源 5’区、其同源侧翼区或其组合,(ii)一个或多个可选择性标记物,(iii) 与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v)第二基因的同源 3’区、其同源侧翼区或其组合;或(c)(a)和(b)的组合。
[55]权利要求54的方法,其还包括回收多种重组多肽。
[56]段落54或55的方法,其中第一基因是纤维二糖水解酶I基因。
[57]段落56的方法,其中纤维二糖水解酶I基因编码选自以下的纤维二糖水解酶I:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶I;(ii)包含与SEQ ID NO:2的成熟多肽具有至少70%,例如至少 75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少 85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少 91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少 97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶I;(iii)由包含与SEQ ID NO:1的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I;和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I。
[58]段落54或55的方法,其中第二基因是纤维二糖水解酶II基因。
[59]段落58的方法,其中纤维二糖水解酶II基因编码选自以下的纤维二糖水解酶II:(i)包含SEQ ID NO:4的成熟多肽的纤维二糖水解酶II;(ii)包含与SEQ ID NO:4的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II;(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II;和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
[60]段落54~59中任一段的方法,其中第一串联构建体的第一基因的同源5’区、其同源侧翼区或其组合为至少50bp,例如,至少100 bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500 bp或至少2000bp。
[61]段落54~60中任一段的方法,其中第一串联构建体的第一基因的同源3’区、其同源侧翼区或其组合为至少50bp,例如,至少100 bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500 bp或至少2000bp。
[62]段落54~61中任一段的方法,其中第二串联构建体的第二基因的同源5’区、其同源侧翼区或其组合为至少50bp,例如,至少100 bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500 bp或至少2000bp。
[63]段落54~62中任一段的方法,其中第二串联构建体的第二基因的同源3’区、其同源侧翼区或其组合为至少50bp,例如,至少100 bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500 bp或至少2000bp。
[64]段落54~63中任一段的方法,其中丝状真菌宿主细胞还包含一个或多个各自通过靶向整合用针对各个基因的对应串联构建体取代的其他内源性基因,该串联构建体包含:(i)基因的同源5’区、其同源侧翼区或其组合;(ii)一个或多个可选择性标记物;(iii)与启动子和终止子可操作连接的编码具有生物活性的多肽的多核苷酸;(iv)与另一启动子和另一终止子可操作连接的编码具有生物活性的另一多肽的另一多核苷酸;和(v)基因的同源3’区、其同源侧翼区或其组合。
[65]段落54~64中任一段的方法,其中一个或多个串联构建体还包含一个或多个可选择性标记物的5’侧翼的第一同源重复和一个或多个可选择性标记物的3’侧翼的第二同源重复,其中第一同源重复和第二同源重复进行同源重组,以切除一个或多个可选择性标记物。
[66]段落65的方法,其中第一和第二同源重复是相同的,或者彼此具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的的序列同一性。
[67]段落65或66的方法,其中第一和第二同源重复各自为至少 50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[68]段落65~67中任一段的方法,其中在切除一个或多个可选择性标记物时,一个或多个可选择性标记物可以再用于将针对各个基因的对应串联构建体各自通过靶向整合来取代一个或多个其他内源性基因。
[69]段落54~68中任一段的方法,其中丝状真菌宿主细胞还包含串联构建体,该串联构建体包含:(i)一个或多个可选择性标记物;(ii) 与第五启动子和第五终止子可操作连接的编码具有生物活性的第五多肽的第五多核苷酸;和(iii)与第六启动子和第六终止子可操作连接的编码具有生物活性的第六多肽的第六多核苷酸,其中该串联构建体通过异位整合而整合。
[70]段落54~69中任一段的方法,其中具有生物活性的多肽是不同的多肽。
[71]段落54~69中任一段的方法,其中两个或更多个具有生物活性的多肽是相同的多肽。
[72]段落54~71中任一段的方法,其中启动子是不同的启动子。
[73]段落54~71中任一段的方法,其中两个或更多个启动子是相同的启动子。
[74]段落54~73中任一段的方法,其中终止子是不同的终止子。
[75]段落54~73中任一段的方法,其中两个或更多个终止子是相同的终止子。
[76]段落54~75中任一段的方法,其中一个或多个串联构建体包含在表达载体中。
[77]段落54~76中任一段的方法,其中丝状真菌菌株是枝顶孢属、曲霉属、短梗霉属、黑管菌属、拟蜡霉属、金孢属、鬼伞属、革盖菌属、隐球菌属、线黑粉酵母属、镰孢菌属、腐质霉属、巨座壳属、毛霉属、毁丝菌属、新美鞭菌属、脉孢菌属、拟青霉属、青霉属、平革菌属、白腐菌属、梨囊鞭菌属、侧耳属、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属或木霉属菌株。
[78]段落77的方法,其中木霉属菌株选自哈茨木霉、康氏木霉、长梗木霉、里氏木霉和绿色木霉。
[79]段落77的方法,其中木霉属菌株是里氏木霉。
[80]一种串联构建体,其包含:(i)基因的同源5’区、其同源侧翼区或其组合;(ii)一个或多个第一可选择性标记物;(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸;(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸;和(v)基因的同源3’区、其同源侧翼区或其组合。
[81]段落80的串联构建体,其中基因是纤维二糖水解酶I基因。
[82]段落81的串联构建体,其中纤维二糖水解酶I基因编码选自以下的纤维二糖水解酶I:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶I;(ii)包含与SEQ ID NO:2的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶I;(iii)由包含与SEQ ID NO:1的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I;和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I。
[83]段落80的串联构建体,其中基因是纤维二糖水解酶II基因。
[84]段落83的串联构建体,其中纤维二糖水解酶II基因编码选自以下的纤维二糖水解酶II:(i)包含SEQ ID NO:4的成熟多肽的纤维二糖水解酶II;(ii)包含与SEQ ID NO:4的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II;(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II;和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
[85]段落80~84中任一段的串联构建体,其中基因的同源5’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[86]段落80~85中任一段的串联构建体,其中基因的同源3’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[87]段落80~86中任一段的串联构建体,其中具有生物活性的多肽是不同的多肽。
[88]段落80~86中任一段的串联构建体,其中两个或更多个具有生物活性的多肽是相同的多肽。
[89]段落80~88中任一段的串联构建体,其中启动子是不同的启动子。
[90]段落80~88中任一段的串联构建体,其中两个或更多个启动子是相同的启动子。
[91]段落80~90中任一段的串联构建体,其中终止子是不同的终止子。
[92]段落80~90中任一段的串联构建体,其中两个或更多个终止子是相同的终止子。
[93]一种表达载体,其包含段落80~92中任一段的串联构建体。
[94]一种构建用于产生具有生物活性的多种重组多肽的丝状真菌菌株的方法,其包括:(a)通过靶向整合向内源性第一基因座中***第一串联构建体,该第一串联构建体包含(i)第一基因座的同源5’区、其同源侧翼区或其组合,(ii)一个或多个第一可选择性标记物,(iii) 与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v)第一基因座的同源3’区、其同源侧翼区或其组合;(b)通过靶向整合向内源性第二基因座中***第二串联构建体,该第二串联构建体包含(i)第二基因座的同源5’区、其同源侧翼区或其组合,(ii)一个或多个第二可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v)第二基因座的同源3’区、其同源侧翼区或其组合;或(c)(a)和(b) 的组合。
[95]段落94的方法,其中第一基因座是纤维二糖水解酶I基因。
[96]段落95的方法,其中纤维二糖水解酶I基因编码选自以下的纤维二糖水解酶I:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶I;(ii)包含与SEQ ID NO:2的成熟多肽具有至少70%,例如至少 75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少 85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少 91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少 97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶I;(iii)由包含与SEQ ID NO:1的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I;和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I。
[97]段落94的方法,其中第二基因座是纤维二糖水解酶II基因。
[98]段落97的方法,其中纤维二糖水解酶II基因编码选自以下的纤维二糖水解酶II:(i)包含SEQ ID NO:4的成熟多肽的纤维二糖水解酶II;(ii)包含与SEQ ID NO:4的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II;(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II;和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
[99]段落94~98中任一段的方法,其中各个串联构建体通过同源重组整合到丝状真菌菌株的染色体中。
[100]段落94~99中任一段的方法,其中第一基因座的同源5’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[101]段落94~100中任一段的方法,其中第一基因座的同源3’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200 bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000 bp。
[102]段落94~101中任一段的方法,其中第二基因座的同源5’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200 bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000 bp。
[103]段落94~102中任一段的方法,其中第二基因座的同源3’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200 bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000 bp。
[104]段落94~103中任一段的方法,其还包括各自通过靶向整合向一个或多个其他内源性基因座中***针对各个基因座的对应串联构建体,该串联构建体包含:(i)基因座的同源5’区、其同源侧翼区或其组合;(ii)一个或多个可选择性标记物;(iii)与启动子和终止子可操作连接的编码具有生物活性的多肽的多核苷酸;(iv)与另一启动子和另一终止子可操作连接的编码具有生物活性的另一多肽的另一多核苷酸;和(v)基因座的同源3’区、其同源侧翼区或其组合。
[105]段落94~104中任一段的方法,其中一个或多个串联构建体还包含一个或多个可选择性标记物的5’侧翼的第一同源重复和一个或多个可选择性标记物的3’侧翼的第二同源重复,其中第一同源重复和第二同源重复进行同源重组,以切除一个或多个可选择性标记物。
[106]段落105的方法,其中第一和第二同源重复是相同的,或者彼此具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的的序列同一性。
[107]段落105或106的方法,其中第一和第二同源重复各自为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[108]段落105~107中任一段的方法,其中在切除一个或多个可选择性标记物时,一个或多个可选择性标记物可以再用于将针对各个基因的对应串联构建体各自通过靶向整合经***来修饰一个或多个其他内源性基因座。
[109]段落94~108中任一段的方法,其还包括用串联构建体转化丝状真菌宿主细胞,该串联构建体包含:(i)一个或多个可选择性标记物;(ii)与第五启动子和第五终止子可操作连接的编码具有生物活性的第五多肽的第五多核苷酸;和(iii)与第六启动子和第六终止子可操作连接的编码具有生物活性的第六多肽的第六多核苷酸,其中该串联构建体通过异位整合而整合。
[110]段落94~109中任一段的方法,其中具有生物活性的多肽是不同的多肽。
[111]段落94~109中任一段的方法,其中两个或更多个具有生物活性的多肽是相同的多肽。
[112]段落94~111中任一段的方法,其中启动子是不同的启动子。
[113]段落94~111中任一段的方法,其中两个或更多个启动子是相同的启动子。
[114]段落94~113中任一段的方法,其中终止子是不同的终止子。
[115]段落94~113中任一段的方法,其中两个或更多个终止子是相同的终止子。
[116]段落94~115中任一段的方法,其中一个或多个串联构建体包含在表达载体中。
[117]段落94~116中任一段的方法,其中丝状真菌菌株是枝顶孢属、曲霉属、短梗霉属、黑管菌属、拟蜡霉属、金孢属、鬼伞属、革盖菌属、隐球菌属、线黑粉酵母属、镰孢菌属、腐质霉属、巨座壳属、毛霉属、毁丝菌属、新美鞭菌属、脉孢菌属、拟青霉属、青霉属、平革菌属、白腐菌属、梨囊鞭菌属、侧耳属、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属或木霉属菌株。
[118]段落117的方法,其中木霉属菌株选自哈茨木霉、康氏木霉、长梗木霉、里氏木霉和绿色木霉。
[119]段落117的方法,其中木霉属菌株是里氏木霉。
[120]一种丝状真菌菌株,由段落94~119中任一段的方法得到。
[121]一种丝状真菌菌株,其包含:(a)通过靶向整合经***第一串联构建体而修饰的内源性第一基因座,该第一串联构建体包含(i) 第一基因座的同源5’区、其同源侧翼区或其组合,(ii)一个或多个第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v)第一基因座的同源3’区、其同源侧翼区或其组合;(b) 通过靶向整合经***第二串联构建体而修饰的内源性第二基因座,该第二串联构建体包含(i)第二基因座的同源5’区、其同源侧翼区或其组合,(ii)一个或多个可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸, (iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v)第二基因座的同源3’区、其同源侧翼区或其组合;或(c)(a)和(b)的组合。
[122]段落121的丝状真菌菌株,其中第一基因座是纤维二糖水解酶I基因。
[123]段落122的丝状真菌菌株,其中纤维二糖水解酶I基因编码选自以下的纤维二糖水解酶I:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶I;(ii)包含与SEQ IDNO:2的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶I;(iii)由包含与SEQ ID NO:1的成熟多肽编码序列具有至少 70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I;和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I。
[124]段落121的丝状真菌菌株,其中第二基因座是纤维二糖水解酶II基因。
[125]段落124的丝状真菌菌株,其中纤维二糖水解酶II基因编码选自以下的纤维二糖水解酶II:(i)包含SEQ ID NO:4的成熟多肽的纤维二糖水解酶II;(ii)包含与SEQ IDNO:4的成熟多肽具有至少 70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II;(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II;和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
[126]段落121~125中任一段的丝状真菌菌株,其中各个串联构建体通过同源重组整合到丝状真菌菌株的染色体中。
[127]段落121~126中任一段的丝状真菌菌株,其中第一串联构建体的第一基因座的同源5’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000 bp、至少1500bp或至少2000bp。
[128]段落121~127中任一段的丝状真菌菌株,其中第一串联构建体的第一基因座的同源3’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000 bp、至少1500bp或至少2000bp。
[129]段落121~128中任一段的丝状真菌菌株,其中第二串联构建体的第二基因座的同源5’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000 bp、至少1500bp或至少2000bp。
[130]段落121~129中任一段的丝状真菌菌株,其中第二串联构建体的第二基因座的同源3’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000 bp、至少1500bp或至少2000bp。
[131]段落121~130中任一段的丝状真菌菌株,其还包含一个或多个各自通过靶向整合用针对各个基因座的对应串联构建体经***而修饰的其他内源基因座,该串联构建体包含:(i)基因座的同源5’区、其同源侧翼区或其组合;(ii)一个或多个可选择性标记物;(iii)与启动子和终止子可操作连接的编码具有生物活性的多肽的多核苷酸;(iv) 与另一启动子和另一终止子可操作连接的编码具有生物活性的另一多肽的另一多核苷酸;和(v)基因座的同源3’区、其同源侧翼区或其组合。
[132]段落121~131中任一段的丝状真菌菌株,其中一个或多个串联构建体还包含一个或多个可选择性标记物的5’侧翼的第一同源重复和一个或多个可选择性标记物的3’侧翼的第二同源重复,其中第一同源重复和第二同源重复进行同源重组,以切除一个或多个可选择性标记物。
[133]段落132的丝状真菌菌株,其中第一和第二同源重复是相同的,或者彼此具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的的序列同一性。
[134]段落132或133的丝状真菌菌株,其中第一和第二同源重复各自为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[135]段落132~134中任一段的丝状真菌菌株,其中在切除一个或多个可选择性标记物时,一个或多个可选择性标记物可以再用于各自通过靶向整合向一个或多个其他内源性基因座***针对各个基因座的对应串联构建体。
[136]段落121~135中任一段的丝状真菌菌株,其还包含串联构建体,该串联构建体包含:(i)一个或多个可选择性标记物;(ii)与第五启动子和第五终止子可操作连接的编码具有生物活性的第五多肽的第五多核苷酸;和(iii)与第六启动子和第六终止子可操作连接的编码具有生物活性的第六多肽的第六多核苷酸,其中该串联构建体通过异位整合而整合。
[137]段落121~136中任一段的丝状真菌菌株,其中具有生物活性的多肽是不同的多肽。
[138]段落121~136中任一段的丝状真菌菌株,其中两个或更多个具有生物活性的多肽是相同的多肽。
[139]段落121~138中任一段的丝状真菌菌株,其中启动子是不同的启动子。
[140]段落121~138中任一段的丝状真菌菌株,其中两个或更多个启动子是相同的启动子。
[141]段落121~140中任一段的丝状真菌菌株,其中终止子是不同的终止子。
[142]段落121~140中任一段的丝状真菌菌株,其中两个或更多个终止子是相同的终止子。
[143]段落121~142中任一段的丝状真菌菌株,其中一个或多个串联构建体包含在表达载体中。
[144]段落121~143中任一段的丝状真菌菌株,其中丝状真菌菌株是枝顶孢属、曲霉属、短梗霉属、黑管菌属、拟蜡霉属、金孢属、鬼伞属、革盖菌属、隐球菌属、线黑粉酵母属、镰孢菌属、腐质霉属、巨座壳属、毛霉属、毁丝菌属、新美鞭菌属、脉孢菌属、拟青霉属、青霉属、平革菌属、白腐菌属、梨囊鞭菌属、侧耳属、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属或木霉属菌株。
[145]段落144的丝状真菌菌株,其中木霉属菌株选自哈茨木霉、康氏木霉、长梗木霉、里氏木霉和绿色木霉。
[146]段落144的丝状真菌菌株,其中木霉属菌株是里氏木霉。
[147]一种在丝状真菌菌株中产生具有生物活性的多种重组多肽的方法,其包括:在有益于产生多肽的条件下培养丝状真菌宿主细胞,其中丝状真菌宿主细胞包含:(a)通过靶向整合经***第一串联构建体而修饰的内源性第一基因座,该第一串联构建体包含(i)第一基因座的同源5’区、其同源侧翼区或其组合,(ii)一个或多个第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v) 第一基因座的同源3’区、其同源侧翼区或其组合;(b)通过靶向整合经***第二串联构建体而修饰的内源性第二基因座,该第二串联构建体包含(i)第二基因座的同源5’区、其同源侧翼区或其组合,(ii) 一个或多个可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v)第二基因座的同源3’区、其同源侧翼区或其组合;或(c)(a)和(b)的组合。
[148]段落147的方法,其还包括回收多种重组多肽。
[149]段落147或148的方法,其中第一基因座是纤维二糖水解酶 I基因。
[150]段落149的方法,其中纤维二糖水解酶I基因编码选自以下的纤维二糖水解酶I:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶I;(ii)包含与SEQ ID NO:2的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶I;(iii)由包含与SEQ ID NO:1的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I;和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I。
[151]段落147或148的方法,其中第二基因座是纤维二糖水解酶 II基因。
[152]段落151的方法,其中纤维二糖水解酶II基因编码选自以下的纤维二糖水解酶II:(i)包含SEQ ID NO:4的成熟多肽的纤维二糖水解酶II;(ii)包含与SEQ ID NO:4的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II;(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II;和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
[153]段落147~152中任一段的方法,其中第一串联构建体的第一基因座的同源5’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[154]段落147~153中任一段的方法,其中第一串联构建体的第一基因座的同源3’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[155]段落147~154中任一段的方法,其中第二串联构建体的第二基因座的同源5’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[156]段落147~155中任一段的方法,其中第二串联构建体的第二基因座的同源3’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[157]段落147~156中任一段的方法,其中丝状真菌宿主细胞还包含一个或多个各自通过靶向整合用针对各个基因座的对应串联构建体经***而修饰的其他内源性基因座,该串联构建体包含:(i)基因座的同源5’区、其同源侧翼区或其组合;(ii)一个或多个可选择性标记物; (iii)与启动子和终止子可操作连接的编码具有生物活性的多肽的多核苷酸;(iv)与另一启动子和另一终止子可操作连接的编码具有生物活性的另一多肽的另一多核苷酸;和(v)基因座的同源3’区、其同源侧翼区或其组合。
[158]段落147~157中任一段的方法,其中一个或多个串联构建体还包含一个或多个可选择性标记物的5’侧翼的第一同源重复和一个或多个可选择性标记物的3’侧翼的第二同源重复,其中第一同源重复和第二同源重复进行同源重组,以切除一个或多个可选择性标记物。
[159]段落158的方法,其中第一和第二同源重复是相同的,或者彼此具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的的序列同一性。
[160]段落158或159的方法,其中第一和第二同源重复各自为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[161]段落158~160中任一段的方法,其中在切除一个或多个可选择性标记物时,一个或多个可选择性标记物可以再用于将针对各个基因的对应串联构建体各自通过靶向整合经***来修饰一个或多个其他内源性基因座。
[162]段落147~161中任一段的方法,其中丝状真菌宿主细胞还包含串联构建体,该串联构建体包含:(i)一个或多个可选择性标记物; (ii)与第五启动子和第五终止子可操作连接的编码具有生物活性的第五多肽的第五多核苷酸;和(iii)与第六启动子和第六终止子可操作连接的编码具有生物活性的第六多肽的第六多核苷酸,其中该串联构建体通过异位整合而整合。
[163]段落147~162中任一段的方法,其中具有生物活性的多肽是不同的多肽。
[164]段落147~162中任一段的方法,其中两个或更多个具有生物活性的多肽是相同的多肽。
[165]段落147~164中任一段的方法,其中启动子是不同的启动子。
[166]段落147~164中任一段的方法,其中两个或更多个启动子是相同的启动子。
[167]段落147~166中任一段的方法,其中终止子是不同的终止子。
[168]段落147~166中任一段的方法,其中两个或更多个终止子是相同的终止子。
[169]段落147~168中任一段的方法,其中一个或多个串联构建体包含在表达载体中。
[170]段落147~169中任一段的方法,其中丝状真菌菌株是枝顶孢属、曲霉属、短梗霉属、黑管菌属、拟蜡霉属、金孢属、鬼伞属、革盖菌属、隐球菌属、线黑粉酵母属、镰孢菌属、腐质霉属、巨座壳属、毛霉属、毁丝菌属、新美鞭菌属、脉孢菌属、拟青霉属、青霉属、平革菌属、白腐菌属、梨囊鞭菌属、侧耳属、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属或木霉属菌株。
[171]段落170的方法,其中木霉属菌株选自哈茨木霉、康氏木霉、长梗木霉、里氏木霉和绿色木霉。
[172]段落170的方法,其中木霉属菌株是里氏木霉。
[173]一种串联构建体,其包含:(i)基因座的同源5’区、其同源侧翼区或其组合;(ii)一个或多个第一可选择性标记物;(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸;(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸;和(v)基因座的同源3’区、其同源侧翼区或其组合。
[174]段落173的串联构建体,其中基因座是纤维二糖水解酶I基因。
[175]段落174的串联构建体,其中纤维二糖水解酶I基因编码选自以下的纤维二糖水解酶I:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶I;(ii)包含与SEQ ID NO:2的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶I;(iii)由包含与SEQ ID NO:1的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I;和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I。
[176]段落173的串联构建体,其中基因座是纤维二糖水解酶II 基因。
[177]段落176的串联构建体,其中纤维二糖水解酶II基因编码选自以下的纤维二糖水解酶II:(i)包含SEQ ID NO:4的成熟多肽的纤维二糖水解酶II;(ii)包含与SEQ IDNO:4的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II;(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少 70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II;和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
[178]段落173~177中任一段的串联构建体,其中基因座的同源 5’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[179]段落173~178中任一段的串联构建体,其中基因座的同源 3’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[180]段落173~179中任一段的串联构建体,其中具有生物活性的多肽是不同的多肽。
[181]段落173~179中任一段的串联构建体,其中两个或更多个具有生物活性的多肽是相同的多肽。
[182]段落173~181中任一段的串联构建体,其中启动子是不同的启动子。
[183]段落173~181中任一段的串联构建体,其中两个或更多个启动子是相同的启动子。
[184]段落173~183中任一段的串联构建体,其中终止子是不同的终止子。
[185]段落173~183中任一段的串联构建体,其中两个或更多个终止子是相同的终止子。
[186]一种表达载体,其包含段落173~185中任一段的串联构建体。
本文所说明并要求保护的发明在范围上并不受本文所述的具体方面的限定,因为这些方面意在作为本发明多个方面的示例。任何等同方面均意在包含于本发明的范围内。确实,除本文示出并说明的那些以外,基于以上的描述,本发明的多种修改对本领域技术人员来说将会是显而易见的。这些修改也意在落入所附权利要求的范围之内。在冲突的情况下,包括定义在内的当前公开内容将做出控制。
序列表
<110> 诺维信股份有限公司.
D·亚韦
金绮明
<120> 在丝状真菌宿主细胞中产生多种重组多肽的方法
<130> 12280-WO-PCT
<150> US 61/526,809
<151> 2011-08-24
<160> 120
<170> PatentIn版本3.5
<210> 1
<211> 1545
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 1
atgtatcgga agttggccgt catctcggcc ttcttggcca cagctcgtgc tcagtcggcc 60
tgcactctcc aatcggagac tcacccgcct ctgacatggc agaaatgctc gtctggtggc 120
acgtgcactc aacagacagg ctccgtggtc atcgacgcca actggcgctg gactcacgct 180
acgaacagca gcacgaactg ctacgatggc aacacttgga gctcgaccct atgtcctgac 240
aacgagacct gcgcgaagaa ctgctgtctg gacggtgccg cctacgcgtc cacgtacgga 300
gttaccacga gcggtaacag cctctccatt ggctttgtca cccagtctgc gcagaagaac 360
gttggcgctc gcctttacct tatggcgagc gacacgacct accaggaatt caccctgctt 420
ggcaacgagt tctctttcga tgttgatgtt tcgcagctgc cgtgcggctt gaacggagct 480
ctctacttcg tgtccatgga cgcggatggt ggcgtgagca agtatcccac caacaccgct 540
ggcgccaagt acggcacggg gtactgtgac agccagtgtc cccgcgatct gaagttcatc 600
aatggccagg ccaacgttga gggctgggag ccgtcatcca acaacgcgaa cacgggcatt 660
ggaggacacg gaagctgctg ctctgagatg gatatctggg aggccaactc catctccgag 720
gctcttaccc cccacccttg cacgactgtc ggccaggaga tctgcgaggg tgatgggtgc 780
ggcggaactt actccgataa cagatatggc ggcacttgcg atcccgatgg ctgcgactgg 840
aacccatacc gcctgggcaa caccagcttc tacggccctg gctcaagctt taccctcgat 900
accaccaaga aattgaccgt tgtcacccag ttcgagacgt cgggtgccat caaccgatac 960
tatgtccaga atggcgtcac tttccagcag cccaacgccg agcttggtag ttactctggc 1020
aacgagctca acgatgatta ctgcacagct gaggaggcag aattcggcgg atcctctttc 1080
tcagacaagg gcggcctgac tcagttcaag aaggctacct ctggcggcat ggttctggtc 1140
atgagtctgt gggatgatta ctacgccaac atgctgtggc tggactccac ctacccgaca 1200
aacgagacct cctccacacc cggtgccgtg cgcggaagct gctccaccag ctccggtgtc 1260
cctgctcagg tcgaatctca gtctcccaac gccaaggtca ccttctccaa catcaagttc 1320
ggacccattg gcagcaccgg caaccctagc ggcggcaacc ctcccggcgg aaacccgcct 1380
ggcaccacca ccacccgccg cccagccact accactggaa gctctcccgg acctacccag 1440
tctcactacg gccagtgcgg cggtattggc tacagcggcc ccacggtctg cgccagcggc 1500
acaacttgcc aggtcctgaa cccttactac tctcagtgcc tgtaa 1545
<210> 2
<211> 514
<212> PRT
<213> 里氏木霉
<400> 2
Met Tyr Arg Lys Leu Ala Val Ile Ser Ala Phe Leu Ala Thr Ala Arg
1 5 10 15
Ala Gln Ser Ala Cys Thr Leu Gln Ser Glu Thr His Pro Pro Leu Thr
20 25 30
Trp Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser
35 40 45
Val Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser
50 55 60
Thr Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp
65 70 75 80
Asn Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala
85 90 95
Ser Thr Tyr Gly Val Thr Thr Ser Gly Asn Ser Leu Ser Ile Gly Phe
100 105 110
Val Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met
115 120 125
Ala Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe
130 135 140
Ser Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala
145 150 155 160
Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro
165 170 175
Thr Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln
180 185 190
Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly
195 200 205
Trp Glu Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Gly His Gly
210 215 220
Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu
225 230 235 240
Ala Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu Ile Cys Glu
245 250 255
Gly Asp Gly Cys Gly Gly Thr Tyr Ser Asp Asn Arg Tyr Gly Gly Thr
260 265 270
Cys Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr
275 280 285
Ser Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys
290 295 300
Leu Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr
305 310 315 320
Tyr Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala Glu Leu Gly
325 330 335
Ser Tyr Ser Gly Asn Glu Leu Asn Asp Asp Tyr Cys Thr Ala Glu Glu
340 345 350
Ala Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln
355 360 365
Phe Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp
370 375 380
Asp Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr
385 390 395 400
Asn Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr
405 410 415
Ser Ser Gly Val Pro Ala Gln Val Glu Ser Gln Ser Pro Asn Ala Lys
420 425 430
Val Thr Phe Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn
435 440 445
Pro Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro Gly Thr Thr Thr
450 455 460
Thr Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr Gln
465 470 475 480
Ser His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val
485 490 495
Cys Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln
500 505 510
Cys Leu
<210> 3
<211> 1611
<212> DNA
<213> 里氏木霉
<400> 3
atgattgtcg gcattctcac cacgctggct acgctggcca cactcgcagc tagtgtgcct 60
ctagaggagc ggcaagcttg ctcaagcgtc tggtaattat gtgaaccctc tcaagagacc 120
caaatactga gatatgtcaa ggggccaatg tggtggccag aattggtcgg gtccgacttg 180
ctgtgcttcc ggaagcacat gcgtctactc caacgactat tactcccagt gtcttcccgg 240
cgctgcaagc tcaagctcgt ccacgcgcgc cgcgtcgacg acttctcgag tatcccccac 300
aacatcccgg tcgagctccg cgacgcctcc acctggttct actactacca gagtacctcc 360
agtcggatcg ggaaccgcta cgtattcagg caaccctttt gttggggtca ctccttgggc 420
caatgcatat tacgcctctg aagttagcag cctcgctatt cctagcttga ctggagccat 480
ggccactgct gcagcagctg tcgcaaaggt tccctctttt atgtggctgt aggtcctccc 540
ggaaccaagg caatctgtta ctgaaggctc atcattcact gcagagatac tcttgacaag 600
acccctctca tggagcaaac cttggccgac atccgcaccg ccaacaagaa tggcggtaac 660
tatgccggac agtttgtggt gtatgacttg ccggatcgcg attgcgctgc ccttgcctcg 720
aatggcgaat actctattgc cgatggtggc gtcgccaaat ataagaacta tatcgacacc 780
attcgtcaaa ttgtcgtgga atattccgat atccggaccc tcctggttat tggtatgagt 840
ttaaacacct gcctcccccc ccccttccct tcctttcccg ccggcatctt gtcgttgtgc 900
taactattgt tccctcttcc agagcctgac tctcttgcca acctggtgac caacctcggt 960
actccaaagt gtgccaatgc tcagtcagcc taccttgagt gcatcaacta cgccgtcaca 1020
cagctgaacc ttccaaatgt tgcgatgtat ttggacgctg gccatgcagg atggcttggc 1080
tggccggcaa accaagaccc ggccgctcag ctatttgcaa atgtttacaa gaatgcatcg 1140
tctccgagag ctcttcgcgg attggcaacc aatgtcgcca actacaacgg gtggaacatt 1200
accagccccc catcgtacac gcaaggcaac gctgtctaca acgagaagct gtacatccac 1260
gctattggac gtcttcttgc caatcacggc tggtccaacg ccttcttcat cactgatcaa 1320
ggtcgatcgg gaaagcagcc taccggacag caacagtggg gagactggtg caatgtgatc 1380
ggcaccggat ttggtattcg cccatccgca aacactgggg actcgttgct ggattcgttt 1440
gtctgggtca agccaggcgg cgagtgtgac ggcaccagcg acagcagtgc gccacgattt 1500
gactcccact gtgcgctccc agatgccttg caaccggcgc ctcaagctgg tgcttggttc 1560
caagcctact ttgtgcagct tctcacaaac gcaaacccat cgttcctgta a 1611
<210> 4
<211> 471
<212> PRT
<213> 里氏木霉
<400> 4
Met Ile Val Gly Ile Leu Thr Thr Leu Ala Thr Leu Ala Thr Leu Ala
1 5 10 15
Ala Ser Val Pro Leu Glu Glu Arg Gln Ala Cys Ser Ser Val Trp Gly
20 25 30
Gln Cys Gly Gly Gln Asn Trp Ser Gly Pro Thr Cys Cys Ala Ser Gly
35 40 45
Ser Thr Cys Val Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu Pro Gly
50 55 60
Ala Ala Ser Ser Ser Ser Ser Thr Arg Ala Ala Ser Thr Thr Ser Arg
65 70 75 80
Val Ser Pro Thr Thr Ser Arg Ser Ser Ser Ala Thr Pro Pro Pro Gly
85 90 95
Ser Thr Thr Thr Arg Val Pro Pro Val Gly Ser Gly Thr Ala Thr Tyr
100 105 110
Ser Gly Asn Pro Phe Val Gly Val Thr Pro Trp Ala Asn Ala Tyr Tyr
115 120 125
Ala Ser Glu Val Ser Ser Leu Ala Ile Pro Ser Leu Thr Gly Ala Met
130 135 140
Ala Thr Ala Ala Ala Ala Val Ala Lys Val Pro Ser Phe Met Trp Leu
145 150 155 160
Asp Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile
165 170 175
Arg Thr Ala Asn Lys Asn Gly Gly Asn Tyr Ala Gly Gln Phe Val Val
180 185 190
Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly Glu
195 200 205
Tyr Ser Ile Ala Asp Gly Gly Val Ala Lys Tyr Lys Asn Tyr Ile Asp
210 215 220
Thr Ile Arg Gln Ile Val Val Glu Tyr Ser Asp Ile Arg Thr Leu Leu
225 230 235 240
Val Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr Asn Leu Gly Thr
245 250 255
Pro Lys Cys Ala Asn Ala Gln Ser Ala Tyr Leu Glu Cys Ile Asn Tyr
260 265 270
Ala Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala
275 280 285
Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp Pro Ala Ala
290 295 300
Gln Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro Arg Ala Leu
305 310 315 320
Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Gly Trp Asn Ile Thr
325 330 335
Ser Pro Pro Ser Tyr Thr Gln Gly Asn Ala Val Tyr Asn Glu Lys Leu
340 345 350
Tyr Ile His Ala Ile Gly Arg Leu Leu Ala Asn His Gly Trp Ser Asn
355 360 365
Ala Phe Phe Ile Thr Asp Gln Gly Arg Ser Gly Lys Gln Pro Thr Gly
370 375 380
Gln Gln Gln Trp Gly Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly
385 390 395 400
Ile Arg Pro Ser Ala Asn Thr Gly Asp Ser Leu Leu Asp Ser Phe Val
405 410 415
Trp Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Ser Ser Ala
420 425 430
Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro Ala
435 440 445
Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu Thr
450 455 460
Asn Ala Asn Pro Ser Phe Leu
465 470
<210> 5
<211> 1377
<212> DNA
<213> 里氏木霉
<400> 5
atggcgccct cagttacact gccgttgacc acggccatcc tggccattgc ccggctcgtc 60
gccgcccagc aaccgggtac cagcaccccc gaggtccatc ccaagttgac aacctacaag 120
tgtacaaagt ccggggggtg cgtggcccag gacacctcgg tggtccttga ctggaactac 180
cgctggatgc acgacgcaaa ctacaactcg tgcaccgtca acggcggcgt caacaccacg 240
ctctgccctg acgaggcgac ctgtggcaag aactgcttca tcgagggcgt cgactacgcc 300
gcctcgggcg tcacgacctc gggcagcagc ctcaccatga accagtacat gcccagcagc 360
tctggcggct acagcagcgt ctctcctcgg ctgtatctcc tggactctga cggtgagtac 420
gtgatgctga agctcaacgg ccaggagctg agcttcgacg tcgacctctc tgctctgccg 480
tgtggagaga acggctcgct ctacctgtct cagatggacg agaacggggg cgccaaccag 540
tataacacgg ccggtgccaa ctacgggagc ggctactgcg atgctcagtg ccccgtccag 600
acatggagga acggcaccct caacactagc caccagggct tctgctgcaa cgagatggat 660
atcctggagg gcaactcgag ggcgaatgcc ttgacccctc actcttgcac ggccacggcc 720
tgcgactctg ccggttgcgg cttcaacccc tatggcagcg gctacaaaag ctactacggc 780
cccggagata ccgttgacac ctccaagacc ttcaccatca tcacccagtt caacacggac 840
aacggctcgc cctcgggcaa ccttgtgagc atcacccgca agtaccagca aaacggcgtc 900
gacatcccca gcgcccagcc cggcggcgac accatctcgt cctgcccgtc cgcctcagcc 960
tacggcggcc tcgccaccat gggcaaggcc ctgagcagcg gcatggtgct cgtgttcagc 1020
atttggaacg acaacagcca gtacatgaac tggctcgaca gcggcaacgc cggcccctgc 1080
agcagcaccg agggcaaccc atccaacatc ctggccaaca accccaacac gcacgtcgtc 1140
ttctccaaca tccgctgggg agacattggg tctactacga actcgactgc gcccccgccc 1200
ccgcctgcgt ccagcacgac gttttcgact acacggagga gctcgacgac ttcgagcagc 1260
ccgagctgca cgcagactca ctgggggcag tgcggtggca ttgggtacag cgggtgcaag 1320
acgtgcacgt cgggcactac gtgccagtat agcaacgact actactcgca atgcctt 1377
<210> 6
<211> 459
<212> PRT
<213> 里氏木霉
<400> 6
Met Ala Pro Ser Val Thr Leu Pro Leu Thr Thr Ala Ile Leu Ala Ile
1 5 10 15
Ala Arg Leu Val Ala Ala Gln Gln Pro Gly Thr Ser Thr Pro Glu Val
20 25 30
His Pro Lys Leu Thr Thr Tyr Lys Cys Thr Lys Ser Gly Gly Cys Val
35 40 45
Ala Gln Asp Thr Ser Val Val Leu Asp Trp Asn Tyr Arg Trp Met His
50 55 60
Asp Ala Asn Tyr Asn Ser Cys Thr Val Asn Gly Gly Val Asn Thr Thr
65 70 75 80
Leu Cys Pro Asp Glu Ala Thr Cys Gly Lys Asn Cys Phe Ile Glu Gly
85 90 95
Val Asp Tyr Ala Ala Ser Gly Val Thr Thr Ser Gly Ser Ser Leu Thr
100 105 110
Met Asn Gln Tyr Met Pro Ser Ser Ser Gly Gly Tyr Ser Ser Val Ser
115 120 125
Pro Arg Leu Tyr Leu Leu Asp Ser Asp Gly Glu Tyr Val Met Leu Lys
130 135 140
Leu Asn Gly Gln Glu Leu Ser Phe Asp Val Asp Leu Ser Ala Leu Pro
145 150 155 160
Cys Gly Glu Asn Gly Ser Leu Tyr Leu Ser Gln Met Asp Glu Asn Gly
165 170 175
Gly Ala Asn Gln Tyr Asn Thr Ala Gly Ala Asn Tyr Gly Ser Gly Tyr
180 185 190
Cys Asp Ala Gln Cys Pro Val Gln Thr Trp Arg Asn Gly Thr Leu Asn
195 200 205
Thr Ser His Gln Gly Phe Cys Cys Asn Glu Met Asp Ile Leu Glu Gly
210 215 220
Asn Ser Arg Ala Asn Ala Leu Thr Pro His Ser Cys Thr Ala Thr Ala
225 230 235 240
Cys Asp Ser Ala Gly Cys Gly Phe Asn Pro Tyr Gly Ser Gly Tyr Lys
245 250 255
Ser Tyr Tyr Gly Pro Gly Asp Thr Val Asp Thr Ser Lys Thr Phe Thr
260 265 270
Ile Ile Thr Gln Phe Asn Thr Asp Asn Gly Ser Pro Ser Gly Asn Leu
275 280 285
Val Ser Ile Thr Arg Lys Tyr Gln Gln Asn Gly Val Asp Ile Pro Ser
290 295 300
Ala Gln Pro Gly Gly Asp Thr Ile Ser Ser Cys Pro Ser Ala Ser Ala
305 310 315 320
Tyr Gly Gly Leu Ala Thr Met Gly Lys Ala Leu Ser Ser Gly Met Val
325 330 335
Leu Val Phe Ser Ile Trp Asn Asp Asn Ser Gln Tyr Met Asn Trp Leu
340 345 350
Asp Ser Gly Asn Ala Gly Pro Cys Ser Ser Thr Glu Gly Asn Pro Ser
355 360 365
Asn Ile Leu Ala Asn Asn Pro Asn Thr His Val Val Phe Ser Asn Ile
370 375 380
Arg Trp Gly Asp Ile Gly Ser Thr Thr Asn Ser Thr Ala Pro Pro Pro
385 390 395 400
Pro Pro Ala Ser Ser Thr Thr Phe Ser Thr Thr Arg Arg Ser Ser Thr
405 410 415
Thr Ser Ser Ser Pro Ser Cys Thr Gln Thr His Trp Gly Gln Cys Gly
420 425 430
Gly Ile Gly Tyr Ser Gly Cys Lys Thr Cys Thr Ser Gly Thr Thr Cys
435 440 445
Gln Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu
450 455
<210> 7
<211> 1254
<212> DNA
<213> 里氏木霉
<400> 7
atgaacaagt ccgtggctcc attgctgctt gcagcgtcca tactatatgg cggcgccgtc 60
gcacagcaga ctgtctgggg ccagtgtgga ggtattggtt ggagcggacc tacgaattgt 120
gctcctggct cagcttgttc gaccctcaat ccttattatg cgcaatgtat tccgggagcc 180
actactatca ccacttcgac ccggccacca tccggtccaa ccaccaccac cagggctacc 240
tcaacaagct catcaactcc acccacgagc tctggggtcc gatttgccgg cgttaacatc 300
gcgggttttg actttggctg taccacagat ggcacttgcg ttacctcgaa ggtttatcct 360
ccgttgaaga acttcaccgg ctcaaacaac taccccgatg gcatcggcca gatgcagcac 420
ttcgtcaacg aggacgggat gactattttc cgcttacctg tcggatggca gtacctcgtc 480
aacaacaatt tgggcggcaa tcttgattcc acgagcattt ccaagtatga tcagcttgtt 540
caggggtgcc tgtctctggg cgcatactgc atcgtcgaca tccacaatta tgctcgatgg 600
aacggtggga tcattggtca gggcggccct actaatgctc aattcacgag cctttggtcg 660
cagttggcat caaagtacgc atctcagtcg agggtgtggt tcggcatcat gaatgagccc 720
cacgacgtga acatcaacac ctgggctgcc acggtccaag aggttgtaac cgcaatccgc 780
aacgctggtg ctacgtcgca attcatctct ttgcctggaa atgattggca atctgctggg 840
gctttcatat ccgatggcag tgcagccgcc ctgtctcaag tcacgaaccc ggatgggtca 900
acaacgaatc tgatttttga cgtgcacaaa tacttggact cagacaactc cggtactcac 960
gccgaatgta ctacaaataa cattgacggc gccttttctc cgcttgccac ttggctccga 1020
cagaacaatc gccaggctat cctgacagaa accggtggtg gcaacgttca gtcctgcata 1080
caagacatgt gccagcaaat ccaatatctc aaccagaact cagatgtcta tcttggctat 1140
gttggttggg gtgccggatc atttgatagc acgtatgtcc tgacggaaac accgactagc 1200
agtggtaact catggacgga cacatccttg gtcagctcgt gtctcgcaag aaag 1254
<210> 8
<211> 418
<212> PRT
<213> 里氏木霉
<400> 8
Met Asn Lys Ser Val Ala Pro Leu Leu Leu Ala Ala Ser Ile Leu Tyr
1 5 10 15
Gly Gly Ala Val Ala Gln Gln Thr Val Trp Gly Gln Cys Gly Gly Ile
20 25 30
Gly Trp Ser Gly Pro Thr Asn Cys Ala Pro Gly Ser Ala Cys Ser Thr
35 40 45
Leu Asn Pro Tyr Tyr Ala Gln Cys Ile Pro Gly Ala Thr Thr Ile Thr
50 55 60
Thr Ser Thr Arg Pro Pro Ser Gly Pro Thr Thr Thr Thr Arg Ala Thr
65 70 75 80
Ser Thr Ser Ser Ser Thr Pro Pro Thr Ser Ser Gly Val Arg Phe Ala
85 90 95
Gly Val Asn Ile Ala Gly Phe Asp Phe Gly Cys Thr Thr Asp Gly Thr
100 105 110
Cys Val Thr Ser Lys Val Tyr Pro Pro Leu Lys Asn Phe Thr Gly Ser
115 120 125
Asn Asn Tyr Pro Asp Gly Ile Gly Gln Met Gln His Phe Val Asn Glu
130 135 140
Asp Gly Met Thr Ile Phe Arg Leu Pro Val Gly Trp Gln Tyr Leu Val
145 150 155 160
Asn Asn Asn Leu Gly Gly Asn Leu Asp Ser Thr Ser Ile Ser Lys Tyr
165 170 175
Asp Gln Leu Val Gln Gly Cys Leu Ser Leu Gly Ala Tyr Cys Ile Val
180 185 190
Asp Ile His Asn Tyr Ala Arg Trp Asn Gly Gly Ile Ile Gly Gln Gly
195 200 205
Gly Pro Thr Asn Ala Gln Phe Thr Ser Leu Trp Ser Gln Leu Ala Ser
210 215 220
Lys Tyr Ala Ser Gln Ser Arg Val Trp Phe Gly Ile Met Asn Glu Pro
225 230 235 240
His Asp Val Asn Ile Asn Thr Trp Ala Ala Thr Val Gln Glu Val Val
245 250 255
Thr Ala Ile Arg Asn Ala Gly Ala Thr Ser Gln Phe Ile Ser Leu Pro
260 265 270
Gly Asn Asp Trp Gln Ser Ala Gly Ala Phe Ile Ser Asp Gly Ser Ala
275 280 285
Ala Ala Leu Ser Gln Val Thr Asn Pro Asp Gly Ser Thr Thr Asn Leu
290 295 300
Ile Phe Asp Val His Lys Tyr Leu Asp Ser Asp Asn Ser Gly Thr His
305 310 315 320
Ala Glu Cys Thr Thr Asn Asn Ile Asp Gly Ala Phe Ser Pro Leu Ala
325 330 335
Thr Trp Leu Arg Gln Asn Asn Arg Gln Ala Ile Leu Thr Glu Thr Gly
340 345 350
Gly Gly Asn Val Gln Ser Cys Ile Gln Asp Met Cys Gln Gln Ile Gln
355 360 365
Tyr Leu Asn Gln Asn Ser Asp Val Tyr Leu Gly Tyr Val Gly Trp Gly
370 375 380
Ala Gly Ser Phe Asp Ser Thr Tyr Val Leu Thr Glu Thr Pro Thr Ser
385 390 395 400
Ser Gly Asn Ser Trp Thr Asp Thr Ser Leu Val Ser Ser Cys Leu Ala
405 410 415
Arg Lys
<210> 9
<211> 2615
<212> DNA
<213> 里氏木霉
<400> 9
atgggatttg gccgcaatgc tgccgagccc gagtgtttct gcaacgttat ccaggagatt 60
tgcgcttgcc caagagggag ttgacgggga gagtcccaac tggttccttc agtaacgcca 120
ccctggcaga ctatataact tgtggacaag actctgcttt gttgagttct tcctaccagt 180
cttgaccaag accattctgt tgagcccaat cagaaatgcg ttaccgaaca gcagctgcgc 240
tggcacttgc cactgggccc tttgctaggg cagacagtca gtatagctgg tccatactgg 300
gatgtatatg tatcctggag acaccatgct gactcttgaa tcaaggtagc tcaacatcgg 360
gggcctcggc tgaggcagtt gtacctcctg cagggactcc atggggaacc gcgtacgaca 420
aggcgaaggc cgcattggca aagctcaatc tccaagataa ggtcggcatc gtgagcggtg 480
tcggctggaa cggcggtcct tgcgttggaa acacatctcc ggcctccaag atcagctatc 540
catcgctatg ccttcaagac ggacccctcg gtgttcgata ctcgacaggc agcacagcct 600
ttacgccggg cgttcaagcg gcctcgacgt gggatgtcaa tttgatccgc gaacgtggac 660
agttcatcgg tgaggaggtg aaggcctcgg ggattcatgt catacttggt cctgtggctg 720
ggccgctggg aaagactccg cagggcggtc gcaactggga gggcttcggt gtcgatccat 780
atctcacggg cattgccatg ggtcaaacca tcaacggcat ccagtcggta ggcgtgcagg 840
cgacagcgaa gcactatatc ctcaacgagc aggagctcaa tcgagaaacc atttcgagca 900
acccagatga ccgaactctc catgagctgt atacttggcc atttgccgac gcggttcagg 960
ccaatgtcgc ttctgtcatg tgctcgtaca acaaggtcaa taccacctgg gcctgcgagg 1020
atcagtacac gctgcagact gtgctgaaag accagctggg gttcccaggc tatgtcatga 1080
cggactggaa cgcacagcac acgactgtcc aaagcgcgaa ttctgggctt gacatgtcaa 1140
tgcctggcac agacttcaac ggtaacaatc ggctctgggg tccagctctc accaatgcgg 1200
taaatagcaa tcaggtcccc acgagcagag tcgacgatat ggtgactcgt atcctcgccg 1260
catggtactt gacaggccag gaccaggcag gctatccgtc gttcaacatc agcagaaatg 1320
ttcaaggaaa ccacaagacc aatgtcaggg caattgccag ggacggcatc gttctgctca 1380
agaatgacgc caacatcctg ccgctcaaga agcccgctag cattgccgtc gttggatctg 1440
ccgcaatcat tggtaaccac gccagaaact cgccctcgtg caacgacaaa ggctgcgacg 1500
acggggcctt gggcatgggt tggggttccg gcgccgtcaa ctatccgtac ttcgtcgcgc 1560
cctacgatgc catcaatacc agagcgtctt cgcagggcac ccaggttacc ttgagcaaca 1620
ccgacaacac gtcctcaggc gcatctgcag caagaggaaa ggacgtcgcc atcgtcttca 1680
tcaccgccga ctcgggtgaa ggctacatca ccgtggaggg caacgcgggc gatcgcaaca 1740
acctggatcc gtggcacaac ggcaatgccc tggtccaggc ggtggccggt gccaacagca 1800
acgtcattgt tgttgtccac tccgttggcg ccatcattct ggagcagatt cttgctcttc 1860
cgcaggtcaa ggccgttgtc tgggcgggtc ttccttctca ggagagcggc aatgcgctcg 1920
tcgacgtgct gtggggagat gtcagccctt ctggcaagct ggtgtacacc attgcgaaga 1980
gccccaatga ctataacact cgcatcgttt ccggcggcag tgacagcttc agcgagggac 2040
tgttcatcga ctataagcac ttcgacgacg ccaatatcac gccgcggtac gagttcggct 2100
atggactgtg taagtttgct aacctgaaca atctattaga caggttgact gacggatgac 2160
tgtggaatga tagcttacac caagttcaac tactcacgcc tctccgtctt gtcgaccgcc 2220
aagtctggtc ctgcgactgg ggccgttgtg ccgggaggcc cgagtgatct gttccagaat 2280
gtcgcgacag tcaccgttga catcgcaaac tctggccaag tgactggtgc cgaggtagcc 2340
cagctgtaca tcacctaccc atcttcagca cccaggaccc ctccgaagca gctgcgaggc 2400
tttgccaagc tgaacctcac gcctggtcag agcggaacag caacgttcaa catccgacga 2460
cgagatctca gctactggga cacggcttcg cagaaatggg tggtgccgtc ggggtcgttt 2520
ggcatcagcg tgggagcgag cagccgggat atcaggctga cgagcactct gtcggtagcg 2580
tagcgcgagg agggtgaagg cggttgacct gtgac 2615
<210> 10
<211> 744
<212> PRT
<213> 里氏木霉
<400> 10
Met Arg Tyr Arg Thr Ala Ala Ala Leu Ala Leu Ala Thr Gly Pro Phe
1 5 10 15
Ala Arg Ala Asp Ser His Ser Thr Ser Gly Ala Ser Ala Glu Ala Val
20 25 30
Val Pro Pro Ala Gly Thr Pro Trp Gly Thr Ala Tyr Asp Lys Ala Lys
35 40 45
Ala Ala Leu Ala Lys Leu Asn Leu Gln Asp Lys Val Gly Ile Val Ser
50 55 60
Gly Val Gly Trp Asn Gly Gly Pro Cys Val Gly Asn Thr Ser Pro Ala
65 70 75 80
Ser Lys Ile Ser Tyr Pro Ser Leu Cys Leu Gln Asp Gly Pro Leu Gly
85 90 95
Val Arg Tyr Ser Thr Gly Ser Thr Ala Phe Thr Pro Gly Val Gln Ala
100 105 110
Ala Ser Thr Trp Asp Val Asn Leu Ile Arg Glu Arg Gly Gln Phe Ile
115 120 125
Gly Glu Glu Val Lys Ala Ser Gly Ile His Val Ile Leu Gly Pro Val
130 135 140
Ala Gly Pro Leu Gly Lys Thr Pro Gln Gly Gly Arg Asn Trp Glu Gly
145 150 155 160
Phe Gly Val Asp Pro Tyr Leu Thr Gly Ile Ala Met Gly Gln Thr Ile
165 170 175
Asn Gly Ile Gln Ser Val Gly Val Gln Ala Thr Ala Lys His Tyr Ile
180 185 190
Leu Asn Glu Gln Glu Leu Asn Arg Glu Thr Ile Ser Ser Asn Pro Asp
195 200 205
Asp Arg Thr Leu His Glu Leu Tyr Thr Trp Pro Phe Ala Asp Ala Val
210 215 220
Gln Ala Asn Val Ala Ser Val Met Cys Ser Tyr Asn Lys Val Asn Thr
225 230 235 240
Thr Trp Ala Cys Glu Asp Gln Tyr Thr Leu Gln Thr Val Leu Lys Asp
245 250 255
Gln Leu Gly Phe Pro Gly Tyr Val Met Thr Asp Trp Asn Ala Gln His
260 265 270
Thr Thr Val Gln Ser Ala Asn Ser Gly Leu Asp Met Ser Met Pro Gly
275 280 285
Thr Asp Phe Asn Gly Asn Asn Arg Leu Trp Gly Pro Ala Leu Thr Asn
290 295 300
Ala Val Asn Ser Asn Gln Val Pro Thr Ser Arg Val Asp Asp Met Val
305 310 315 320
Thr Arg Ile Leu Ala Ala Trp Tyr Leu Thr Gly Gln Asp Gln Ala Gly
325 330 335
Tyr Pro Ser Phe Asn Ile Ser Arg Asn Val Gln Gly Asn His Lys Thr
340 345 350
Asn Val Arg Ala Ile Ala Arg Asp Gly Ile Val Leu Leu Lys Asn Asp
355 360 365
Ala Asn Ile Leu Pro Leu Lys Lys Pro Ala Ser Ile Ala Val Val Gly
370 375 380
Ser Ala Ala Ile Ile Gly Asn His Ala Arg Asn Ser Pro Ser Cys Asn
385 390 395 400
Asp Lys Gly Cys Asp Asp Gly Ala Leu Gly Met Gly Trp Gly Ser Gly
405 410 415
Ala Val Asn Tyr Pro Tyr Phe Val Ala Pro Tyr Asp Ala Ile Asn Thr
420 425 430
Arg Ala Ser Ser Gln Gly Thr Gln Val Thr Leu Ser Asn Thr Asp Asn
435 440 445
Thr Ser Ser Gly Ala Ser Ala Ala Arg Gly Lys Asp Val Ala Ile Val
450 455 460
Phe Ile Thr Ala Asp Ser Gly Glu Gly Tyr Ile Thr Val Glu Gly Asn
465 470 475 480
Ala Gly Asp Arg Asn Asn Leu Asp Pro Trp His Asn Gly Asn Ala Leu
485 490 495
Val Gln Ala Val Ala Gly Ala Asn Ser Asn Val Ile Val Val Val His
500 505 510
Ser Val Gly Ala Ile Ile Leu Glu Gln Ile Leu Ala Leu Pro Gln Val
515 520 525
Lys Ala Val Val Trp Ala Gly Leu Pro Ser Gln Glu Ser Gly Asn Ala
530 535 540
Leu Val Asp Val Leu Trp Gly Asp Val Ser Pro Ser Gly Lys Leu Val
545 550 555 560
Tyr Thr Ile Ala Lys Ser Pro Asn Asp Tyr Asn Thr Arg Ile Val Ser
565 570 575
Gly Gly Ser Asp Ser Phe Ser Glu Gly Leu Phe Ile Asp Tyr Lys His
580 585 590
Phe Asp Asp Ala Asn Ile Thr Pro Arg Tyr Glu Phe Gly Tyr Gly Leu
595 600 605
Ser Tyr Thr Lys Phe Asn Tyr Ser Arg Leu Ser Val Leu Ser Thr Ala
610 615 620
Lys Ser Gly Pro Ala Thr Gly Ala Val Val Pro Gly Gly Pro Ser Asp
625 630 635 640
Leu Phe Gln Asn Val Ala Thr Val Thr Val Asp Ile Ala Asn Ser Gly
645 650 655
Gln Val Thr Gly Ala Glu Val Ala Gln Leu Tyr Ile Thr Tyr Pro Ser
660 665 670
Ser Ala Pro Arg Thr Pro Pro Lys Gln Leu Arg Gly Phe Ala Lys Leu
675 680 685
Asn Leu Thr Pro Gly Gln Ser Gly Thr Ala Thr Phe Asn Ile Arg Arg
690 695 700
Arg Asp Leu Ser Tyr Trp Asp Thr Ala Ser Gln Lys Trp Val Val Pro
705 710 715 720
Ser Gly Ser Phe Gly Ile Ser Val Gly Ala Ser Ser Arg Asp Ile Arg
725 730 735
Leu Thr Ser Thr Leu Ser Val Ala
740
<210> 11
<211> 752
<212> DNA
<213> 里氏木霉
<400> 11
atggttgcct tttccagcct catctgcgct ctcaccagca tcgccagtac tctggcgatg 60
cccacaggcc tcgagcctga gagcagtgtc aacgtcacag agcgtggcat gtacgacttt 120
gttcttggag ctcacaatga tcatcgccgt cgtgctagca tcaactacga ccaaaactac 180
caaactggcg gacaagtcag ctattcgcct tccaacactg gcttctcagt gaactggaac 240
actcaagatg actttgttgt gggcgttggt tggacgactg gatcttctgc gtaggaggac 300
tcctcatcat tctgcacttt gaaagcatct tctgaccaaa agcttctctt agtcccatca 360
actttggcgg ctcttttagt gtcaacagcg gaactggcct gctttccgtc tatggctgga 420
gcaccaaccc actggttgag tactacatca tggaggacaa ccacaactac ccagcacagg 480
gtaccgtcaa gggaaccgtc accagcgacg gagccactta caccatctgg gagaataccc 540
gtgtcaacga gccttccatc cagggcacag cgaccttcaa ccagtacatt tccgtgcgga 600
actcgcccag gaccagcgga actgttactg tgcagaacca cttcaatgct tgggcctcgc 660
ttggcctgca ccttgggcag atgaactacc aggttgtcgc tgtcgaaggc tggggtggta 720
gtggttctgc ctcacagagt gtcagcaact ag 752
<210> 12
<211> 229
<212> PRT
<213> 里氏木霉
<400> 12
Met Val Ala Phe Ser Ser Leu Ile Cys Ala Leu Thr Ser Ile Ala Ser
1 5 10 15
Thr Leu Ala Met Pro Thr Gly Leu Glu Pro Glu Ser Ser Val Asn Val
20 25 30
Thr Glu Arg Gly Met Tyr Asp Phe Val Leu Gly Ala His Asn Asp His
35 40 45
Arg Arg Arg Ala Ser Ile Asn Tyr Asp Gln Asn Tyr Gln Thr Gly Gly
50 55 60
Gln Val Ser Tyr Ser Pro Ser Asn Thr Gly Phe Ser Val Asn Trp Asn
65 70 75 80
Thr Gln Asp Asp Phe Val Val Gly Val Gly Trp Thr Thr Gly Ser Ser
85 90 95
Ala Pro Ile Asn Phe Gly Gly Ser Phe Ser Val Asn Ser Gly Thr Gly
100 105 110
Leu Leu Ser Val Tyr Gly Trp Ser Thr Asn Pro Leu Val Glu Tyr Tyr
115 120 125
Ile Met Glu Asp Asn His Asn Tyr Pro Ala Gln Gly Thr Val Lys Gly
130 135 140
Thr Val Thr Ser Asp Gly Ala Thr Tyr Thr Ile Trp Glu Asn Thr Arg
145 150 155 160
Val Asn Glu Pro Ser Ile Gln Gly Thr Ala Thr Phe Asn Gln Tyr Ile
165 170 175
Ser Val Arg Asn Ser Pro Arg Thr Ser Gly Thr Val Thr Val Gln Asn
180 185 190
His Phe Asn Ala Trp Ala Ser Leu Gly Leu His Leu Gly Gln Met Asn
195 200 205
Tyr Gln Val Val Ala Val Glu Gly Trp Gly Gly Ser Gly Ser Ala Ser
210 215 220
Gln Ser Val Ser Asn
225
<210> 13
<211> 796
<212> DNA
<213> 里氏木霉
<400> 13
caagaagaca tcaacatggt ctccttcacc tccctcctcg ccggcgtcgc cgccatctcg 60
ggcgtcttgg ccgctcccgc cgccgaggtc gaatccgtgg ctgtggagaa gcgccagacg 120
attcagcccg gcacgggcta caacaacggc tacttctact cgtactggaa cgatggccac 180
ggcggcgtga cgtacaccaa tggtcccggc gggcagttct ccgtcaactg gtccaactcg 240
ggcaactttg tcggcggcaa gggatggcag cccggcacca agaacaagta agactaccta 300
ctcttacccc ctttgaccaa cacagcacaa cacaatacaa cacatgtgac taccaatcat 360
ggaatcggat ctaacagctg tgttttcaaa aaaaagggtc atcaacttct cgggcagcta 420
caaccccaac ggcaacagct acctctccgt gtacggctgg tcccgcaacc ccctgatcga 480
gtactacatc gtcgagaact ttggcaccta caacccgtcc acgggcgcca ccaagctggg 540
cgaggtcacc tccgacggca gcgtctacga catttaccgc acgcagcgcg tcaaccagcc 600
gtccatcatc ggcaccgcca ccttttacca gtactggtcc gtccgccgca accaccgctc 660
gagcggctcc gtcaacacgg cgaaccactt caacgcgtgg gctcagcaag gcctgacgct 720
cgggacgatg gattaccaga ttgttgccgt ggagggttac tttagctctg gctctgcttc 780
catcaccgtc agctaa 796
<210> 14
<211> 223
<212> PRT
<213> 里氏木霉
<400> 14
Met Val Ser Phe Thr Ser Leu Leu Ala Gly Val Ala Ala Ile Ser Gly
1 5 10 15
Val Leu Ala Ala Pro Ala Ala Glu Val Glu Ser Val Ala Val Glu Lys
20 25 30
Arg Gln Thr Ile Gln Pro Gly Thr Gly Tyr Asn Asn Gly Tyr Phe Tyr
35 40 45
Ser Tyr Trp Asn Asp Gly His Gly Gly Val Thr Tyr Thr Asn Gly Pro
50 55 60
Gly Gly Gln Phe Ser Val Asn Trp Ser Asn Ser Gly Asn Phe Val Gly
65 70 75 80
Gly Lys Gly Trp Gln Pro Gly Thr Lys Asn Lys Val Ile Asn Phe Ser
85 90 95
Gly Ser Tyr Asn Pro Asn Gly Asn Ser Tyr Leu Ser Val Tyr Gly Trp
100 105 110
Ser Arg Asn Pro Leu Ile Glu Tyr Tyr Ile Val Glu Asn Phe Gly Thr
115 120 125
Tyr Asn Pro Ser Thr Gly Ala Thr Lys Leu Gly Glu Val Thr Ser Asp
130 135 140
Gly Ser Val Tyr Asp Ile Tyr Arg Thr Gln Arg Val Asn Gln Pro Ser
145 150 155 160
Ile Ile Gly Thr Ala Thr Phe Tyr Gln Tyr Trp Ser Val Arg Arg Asn
165 170 175
His Arg Ser Ser Gly Ser Val Asn Thr Ala Asn His Phe Asn Ala Trp
180 185 190
Ala Gln Gln Gly Leu Thr Leu Gly Thr Met Asp Tyr Gln Ile Val Ala
195 200 205
Val Glu Gly Tyr Phe Ser Ser Gly Ser Ala Ser Ile Thr Val Ser
210 215 220
<210> 15
<211> 1352
<212> DNA
<213> 里氏木霉
<400> 15
atgaaagcaa acgtcatctt gtgcctcctg gcccccctgg tcgccgctct ccccaccgaa 60
accatccacc tcgaccccga gctcgccgct ctccgcgcca acctcaccga gcgaacagcc 120
gacctctggg accgccaagc ctctcaaagc atcgaccagc tcatcaagag aaaaggcaag 180
ctctactttg gcaccgccac cgaccgcggc ctcctccaac gggaaaagaa cgcggccatc 240
atccaggcag acctcggcca ggtgacgccg gagaacagca tgaagtggca gtcgctcgag 300
aacaaccaag gccagctgaa ctggggagac gccgactatc tcgtcaactt tgcccagcaa 360
aacggcaagt cgatacgcgg ccacactctg atctggcact cgcagctgcc tgcgtgggtg 420
aacaatatca acaacgcgga tactctgcgg caagtcatcc gcacccatgt ctctactgtg 480
gttgggcggt acaagggcaa gattcgtgct tgggtgagtt ttgaacacca catgcccctt 540
ttcttagtcc gctcctcctc ctcttggaac ttctcacagt tatagccgta tacaacattc 600
gacaggaaat ttaggatgac aactactgac tgacttgtgt gtgtgatggc gataggacgt 660
ggtcaatgaa atcttcaacg aggatggaac gctgcgctct tcagtctttt ccaggctcct 720
cggcgaggag tttgtctcga ttgcctttcg tgctgctcga gatgctgacc cttctgcccg 780
tctttacatc aacgactaca atctcgaccg cgccaactat ggcaaggtca acgggttgaa 840
gacttacgtc tccaagtgga tctctcaagg agttcccatt gacggtattg gtgagccacg 900
acccctaaat gtcccccatt agagtctctt tctagagcca aggcttgaag ccattcaggg 960
actgacacga gagccttctc tacaggaagc cagtcccatc tcagcggcgg cggaggctct 1020
ggtacgctgg gtgcgctcca gcagctggca acggtacccg tcaccgagct ggccattacc 1080
gagctggaca ttcagggggc accgacgacg gattacaccc aagttgttca agcatgcctg 1140
agcgtctcca agtgcgtcgg catcaccgtg tggggcatca gtgacaaggt aagttgcttc 1200
ccctgtctgt gcttatcaac tgtaagcagc aacaactgat gctgtctgtc tttacctagg 1260
actcgtggcg tgccagcacc aaccctcttc tgtttgacgc aaacttcaac cccaagccgg 1320
catataacag cattgttggc atcttacaat ag 1352
<210> 16
<211> 347
<212> PRT
<213> 里氏木霉
<400> 16
Met Lys Ala Asn Val Ile Leu Cys Leu Leu Ala Pro Leu Val Ala Ala
1 5 10 15
Leu Pro Thr Glu Thr Ile His Leu Asp Pro Glu Leu Ala Ala Leu Arg
20 25 30
Ala Asn Leu Thr Glu Arg Thr Ala Asp Leu Trp Asp Arg Gln Ala Ser
35 40 45
Gln Ser Ile Asp Gln Leu Ile Lys Arg Lys Gly Lys Leu Tyr Phe Gly
50 55 60
Thr Ala Thr Asp Arg Gly Leu Leu Gln Arg Glu Lys Asn Ala Ala Ile
65 70 75 80
Ile Gln Ala Asp Leu Gly Gln Val Thr Pro Glu Asn Ser Met Lys Trp
85 90 95
Gln Ser Leu Glu Asn Asn Gln Gly Gln Leu Asn Trp Gly Asp Ala Asp
100 105 110
Tyr Leu Val Asn Phe Ala Gln Gln Asn Gly Lys Ser Ile Arg Gly His
115 120 125
Thr Leu Ile Trp His Ser Gln Leu Pro Ala Trp Val Asn Asn Ile Asn
130 135 140
Asn Ala Asp Thr Leu Arg Gln Val Ile Arg Thr His Val Ser Thr Val
145 150 155 160
Val Gly Arg Tyr Lys Gly Lys Ile Arg Ala Trp Asp Val Val Asn Glu
165 170 175
Ile Phe Asn Glu Asp Gly Thr Leu Arg Ser Ser Val Phe Ser Arg Leu
180 185 190
Leu Gly Glu Glu Phe Val Ser Ile Ala Phe Arg Ala Ala Arg Asp Ala
195 200 205
Asp Pro Ser Ala Arg Leu Tyr Ile Asn Asp Tyr Asn Leu Asp Arg Ala
210 215 220
Asn Tyr Gly Lys Val Asn Gly Leu Lys Thr Tyr Val Ser Lys Trp Ile
225 230 235 240
Ser Gln Gly Val Pro Ile Asp Gly Ile Gly Ser Gln Ser His Leu Ser
245 250 255
Gly Gly Gly Gly Ser Gly Thr Leu Gly Ala Leu Gln Gln Leu Ala Thr
260 265 270
Val Pro Val Thr Glu Leu Ala Ile Thr Glu Leu Asp Ile Gln Gly Ala
275 280 285
Pro Thr Thr Asp Tyr Thr Gln Val Val Gln Ala Cys Leu Ser Val Ser
290 295 300
Lys Cys Val Gly Ile Thr Val Trp Gly Ile Ser Asp Lys Asp Ser Trp
305 310 315 320
Arg Ala Ser Thr Asn Pro Leu Leu Phe Asp Ala Asn Phe Asn Pro Lys
325 330 335
Pro Ala Tyr Asn Ser Ile Val Gly Ile Leu Gln
340 345
<210> 17
<211> 2564
<212> DNA
<213> 里氏木霉
<400> 17
ggacagccgg acgcaatggt gaataacgca gctcttctcg ccgccctgtc ggctctcctg 60
cccacggccc tggcgcagaa caatcaaaca tacgccaact actctgctca gggccagcct 120
gatctctacc ccgagacact tgccacgctc acactctcgt tccccgactg cgaacatggc 180
cccctcaaga acaatctcgt ctgtgactca tcggccggct atgtagagcg agcccaggcc 240
ctcatctcgc tcttcaccct cgaggagctc attctcaaca cgcaaaactc gggccccggc 300
gtgcctcgcc tgggtcttcc gaactaccaa gtctggaatg aggctctgca cggcttggac 360
cgcgccaact tcgccaccaa gggcggccag ttcgaatggg cgacctcgtt ccccatgccc 420
atcctcacta cggcggccct caaccgcaca ttgatccacc agattgccga catcatctcg 480
acccaagctc gagcattcag caacagcggc cgttacggtc tcgacgtcta tgcgccaaac 540
gtcaatggct tccgaagccc cctctggggc cgtggccagg agacgcccgg cgaagacgcc 600
tttttcctca gctccgccta tacttacgag tacatcacgg gcatccaggg tggcgtcgac 660
cctgagcacc tcaaggttgc cgccacggtg aagcactttg ccggatacga cctcgagaac 720
tggaacaacc agtcccgtct cggtttcgac gccatcataa ctcagcagga cctctccgaa 780
tactacactc cccagttcct cgctgcggcc cgttatgcaa agtcacgcag cttgatgtgc 840
gcatacaact ccgtcaacgg cgtgcccagc tgtgccaaca gcttcttcct gcagacgctt 900
ttgcgcgaga gctggggctt ccccgaatgg ggatacgtct cgtccgattg cgatgccgtc 960
tacaacgttt tcaaccctca tgactacgcc agcaaccagt cgtcagccgc cgccagctca 1020
ctgcgagccg gcaccgatat cgactgcggt cagacttacc cgtggcacct caacgagtcc 1080
tttgtggccg gcgaagtctc ccgcggcgag atcgagcggt ccgtcacccg tctgtacgcc 1140
aacctcgtcc gtctcggata cttcgacaag aagaaccagt accgctcgct cggttggaag 1200
gatgtcgtca agactgatgc ctggaacatc tcgtacgagg ctgctgttga gggcatcgtc 1260
ctgctcaaga acgatggcac tctccctctg tccaagaagg tgcgcagcat tgctctgatc 1320
ggaccatggg ccaatgccac aacccaaatg caaggcaact actatggccc tgccccatac 1380
ctcatcagcc ctctggaagc tgctaagaag gccggctatc acgtcaactt tgaactcggc 1440
acagagatcg ccggcaacag caccactggc tttgccaagg ccattgctgc cgccaagaag 1500
tcggatgcca tcatctacct cggtggaatt gacaacacca ttgaacagga gggcgctgac 1560
cgcacggaca ttgcttggcc cggtaatcag ctggatctca tcaagcagct cagcgaggtc 1620
ggcaaacccc ttgtcgtcct gcaaatgggc ggtggtcagg tagactcatc ctcgctcaag 1680
agcaacaaga aggtcaactc cctcgtctgg ggcggatatc ccggccagtc gggaggcgtt 1740
gccctcttcg acattctctc tggcaagcgt gctcctgccg gccgactggt caccactcag 1800
tacccggctg agtatgttca ccaattcccc cagaatgaca tgaacctccg acccgatgga 1860
aagtcaaacc ctggacagac ttacatctgg tacaccggca aacccgtcta cgagtttggc 1920
agtggtctct tctacaccac cttcaaggag actctcgcca gccaccccaa gagcctcaag 1980
ttcaacacct catcgatcct ctctgctcct caccccggat acacttacag cgagcagatt 2040
cccgtcttca ccttcgaggc caacatcaag aactcgggca agacggagtc cccatatacg 2100
gccatgctgt ttgttcgcac aagcaacgct ggcccagccc cgtacccgaa caagtggctc 2160
gtcggattcg accgacttgc cgacatcaag cctggtcact cttccaagct cagcatcccc 2220
atccctgtca gtgctctcgc ccgtgttgat tctcacggaa accggattgt ataccccggc 2280
aagtatgagc tagccttgaa caccgacgag tctgtgaagc ttgagtttga gttggtggga 2340
gaagaggtaa cgattgagaa ctggccgttg gaggagcaac agatcaagga tgctacacct 2400
gacgcataag ggttttaatg atgttgttat gacaaacggg tagagtagtt aatgatggaa 2460
taggaagagg ccatagtttt ctgtttgcaa accatttttg ccattgcgaa aaaaaaaaaa 2520
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaa 2564
<210> 18
<211> 780
<212> PRT
<213> 里氏木霉
<400> 18
Met Val Asn Asn Ala Ala Leu Leu Ala Ala Leu Ser Ala Leu Leu Pro
1 5 10 15
Thr Ala Leu Ala Gln Asn Asn Gln Thr Tyr Ala Asn Tyr Ser Ala Gln
20 25 30
Gly Gln Pro Asp Leu Tyr Pro Glu Thr Leu Ala Thr Leu Thr Leu Ser
35 40 45
Phe Pro Asp Cys Glu His Gly Pro Leu Lys Asn Asn Leu Val Cys Asp
50 55 60
Ser Ser Ala Gly Tyr Val Glu Arg Ala Gln Ala Leu Ile Ser Leu Phe
65 70 75 80
Thr Leu Glu Glu Leu Ile Leu Asn Thr Gln Asn Ser Gly Pro Gly Val
85 90 95
Pro Arg Leu Gly Leu Pro Asn Tyr Gln Val Trp Asn Glu Ala Leu His
100 105 110
Gly Leu Asp Arg Ala Asn Phe Ala Thr Lys Gly Gly Gln Phe Glu Trp
115 120 125
Ala Thr Ser Phe Pro Met Pro Ile Leu Thr Thr Ala Ala Leu Asn Arg
130 135 140
Thr Leu Ile His Gln Ile Ala Asp Ile Ile Ser Thr Gln Ala Arg Ala
145 150 155 160
Phe Ser Asn Ser Gly Arg Tyr Gly Leu Asp Val Tyr Ala Pro Asn Val
165 170 175
Asn Gly Phe Arg Ser Pro Leu Trp Gly Arg Gly Gln Glu Thr Pro Gly
180 185 190
Glu Asp Ala Phe Phe Leu Ser Ser Ala Tyr Thr Tyr Glu Tyr Ile Thr
195 200 205
Gly Ile Gln Gly Gly Val Asp Pro Glu His Leu Lys Val Ala Ala Thr
210 215 220
Val Lys His Phe Ala Gly Tyr Asp Leu Glu Asn Trp Asn Asn Gln Ser
225 230 235 240
Arg Leu Gly Phe Asp Ala Ile Ile Thr Gln Gln Asp Leu Ser Glu Tyr
245 250 255
Tyr Thr Pro Gln Phe Leu Ala Ala Ala Arg Tyr Ala Lys Ser Arg Ser
260 265 270
Leu Met Cys Ala Tyr Asn Ser Val Asn Gly Val Pro Ser Cys Ala Asn
275 280 285
Ser Phe Phe Leu Gln Thr Leu Leu Arg Glu Ser Trp Gly Phe Pro Glu
290 295 300
Trp Gly Tyr Val Ser Ser Asp Cys Asp Ala Val Tyr Asn Val Phe Asn
305 310 315 320
Pro His Asp Tyr Ala Ser Asn Gln Ser Ser Ala Ala Ala Ser Ser Leu
325 330 335
Arg Ala Gly Thr Asp Ile Asp Cys Gly Gln Thr Tyr Pro Trp His Leu
340 345 350
Asn Glu Ser Phe Val Ala Gly Glu Val Ser Arg Gly Glu Ile Glu Arg
355 360 365
Ser Val Thr Arg Leu Tyr Ala Asn Leu Val Arg Leu Gly Tyr Phe Asp
370 375 380
Lys Lys Asn Gln Tyr Arg Ser Leu Gly Trp Lys Asp Val Val Lys Thr
385 390 395 400
Asp Ala Trp Asn Ile Ser Tyr Glu Ala Ala Val Glu Gly Ile Val Leu
405 410 415
Leu Lys Asn Asp Gly Thr Leu Pro Leu Ser Lys Lys Val Arg Ser Ile
420 425 430
Ala Leu Ile Gly Pro Trp Ala Asn Ala Thr Thr Gln Met Gln Gly Asn
435 440 445
Tyr Tyr Gly Pro Ala Pro Tyr Leu Ile Ser Pro Leu Glu Ala Ala Lys
450 455 460
Lys Ala Gly Tyr His Val Asn Phe Glu Leu Gly Thr Glu Ile Ala Gly
465 470 475 480
Asn Ser Thr Thr Gly Phe Ala Lys Ala Ile Ala Ala Ala Lys Lys Ser
485 490 495
Asp Ala Ile Ile Tyr Leu Gly Gly Ile Asp Asn Thr Ile Glu Gln Glu
500 505 510
Gly Ala Asp Arg Thr Asp Ile Ala Trp Pro Gly Asn Gln Leu Asp Leu
515 520 525
Ile Lys Gln Leu Ser Glu Val Gly Lys Pro Leu Val Val Leu Gln Met
530 535 540
Gly Gly Gly Gln Val Asp Ser Ser Ser Leu Lys Ser Asn Lys Lys Val
545 550 555 560
Asn Ser Leu Val Trp Gly Gly Tyr Pro Gly Gln Ser Gly Gly Val Ala
565 570 575
Leu Phe Asp Ile Leu Ser Gly Lys Arg Ala Pro Ala Gly Arg Leu Val
580 585 590
Thr Thr Gln Tyr Pro Ala Glu Tyr Val His Gln Phe Pro Gln Asn Asp
595 600 605
Met Asn Leu Arg Pro Asp Gly Lys Ser Asn Pro Gly Gln Thr Tyr Ile
610 615 620
Trp Tyr Thr Gly Lys Pro Val Tyr Glu Phe Gly Ser Gly Leu Phe Tyr
625 630 635 640
Thr Thr Phe Lys Glu Thr Leu Ala Ser His Pro Lys Ser Leu Lys Phe
645 650 655
Asn Thr Ser Ser Ile Leu Ser Ala Pro His Pro Gly Tyr Thr Tyr Ser
660 665 670
Glu Gln Ile Pro Val Phe Thr Phe Glu Ala Asn Ile Lys Asn Ser Gly
675 680 685
Lys Thr Glu Ser Pro Tyr Thr Ala Met Leu Phe Val Arg Thr Ser Asn
690 695 700
Ala Gly Pro Ala Pro Tyr Pro Asn Lys Trp Leu Val Gly Phe Asp Arg
705 710 715 720
Leu Ala Asp Ile Lys Pro Gly His Ser Ser Lys Leu Ser Ile Pro Ile
725 730 735
Pro Val Ser Ala Leu Ala Arg Val Asp Ser His Gly Asn Arg Ile Val
740 745 750
Tyr Pro Gly Lys Tyr Glu Leu Ala Leu Asn Thr Asp Glu Ser Val Lys
755 760 765
Leu Glu Phe Glu Leu Val Gly Glu Glu Val Thr Ile
770 775 780
<210> 19
<211> 2779
<212> DNA
<213> 里氏木霉
<400> 19
atgtccgcgt ctagtgattt atatgtagaa tgatcacaat tcatgtaact gcgttttcgc 60
acatgcaaaa agccctaacg tgagactgag ccacttccta gttttcgtat catgtcagtt 120
gcaaggttac accacaatgc agctcaacga gacaacgctg ccagcccata ataatggata 180
gctggttgta gagagattaa gaagagaatg ctgtttcaga aggaagacta tatcatagca 240
gctgctacat ttccctcttt ccctctttcc atcccttaat agatacgtac ccttgcaatt 300
ggccgtttcg gaagagcttt tctgcttatc ctaaccacct acgccagaat accggtggaa 360
taatcagtgc tcaataggga aacccccaac tgcagcatat aagcctatta acaagacgtc 420
ccaacatgca ttttccttca gtccgcagca ggctatagag agtaggcaat ttacacacca 480
cttttagcct ctgcacatat ctcaccacat ttgcattacg gcatccacta ttacaaccac 540
ttggcacctg atggctttgc tctacccata tcggttttta cgttccgctg tgttcagtcg 600
ttaaatccgt ggtggagcag aacgaccagc ttctcgtatc gggaactccg cttatccgat 660
accctcagtc gaacccttcg tgatactcag cctaaataac atcgcatcgt agcagacaac 720
ttcagtaatt tttgtggggt aatggtcaga tcgctcctct tatatataaa gcagaggtta 780
gtgggctaag gaaattcgtg gttcgcttat agtagagctg tcagttgccc ttcccgaact 840
gttagacggg atggctggta agcttatcct cgtggctcta gcaagccttg tatcactctc 900
tattcagcag aattgcgcag cattattgta agagtgttga gcgtgttgag taccatctgt 960
atcgttgcta acgtaggctt ttagtggcca atgtggaggc atagggtggt ccggcaccac 1020
atgttgcgtt gctggcgccc agtgcagttt tgtcaatgac tggtactccc agtgccttgc 1080
gtcaaccgta tgagctccga tccgggccgt caatatcttc taactccaga ctgtacaggg 1140
cggaaacccc ccaaacggaa caacttcctc tagcttggtt tcacggacgt cgtcagcatc 1200
ctcatccgtc ggctcgtctt cacccggcgg caactcacca actggcagtg cttccaccta 1260
cacaaccaca gatacagcta ccgtggctcc tcattcgcag tctccttacc ccagcattgc 1320
cgcatccagt tgcggatcgt ggaccctcgt ggataatgtt tgctgcccat catattgtgc 1380
taatgatgac acatccgagt catgctcagg ctgcggtacc tgcactacgc cgccctcggc 1440
ggactgcaaa tccggaacca tgtatccaga ggtccatcac gtatccagca acgagagctg 1500
gcactacagt gtaagatgac caacgctggg gtatctaatc ctttgtcttc ctcggcgtgc 1560
tgaccttgga gcatttagag atcaacccac tttggcctaa cgagcggcgg ggcctgtggc 1620
tttggcctgt acggtctctg cacaaagggc agtgttacag ccagctggac ggatcccatg 1680
cttggcgcga cgtgtgacgc tttttgtaca gcgtatcccc tgctttgcaa agaccctacc 1740
ggcactaccc ttcgtggcaa cttcgcagct ccaaacggcg attactacac ccaagttggg 1800
gaccccgaga ggcaatcatt ttctggtgta gtattcactg acagtgcgat agttctggtc 1860
ctcgttgcca ggagccctcg ataactacct gtcctgcggc gagtgcattg agctgataca 1920
aacaaagccc gatgggaccg attatgctgt cggagaagcc ggctacacgg atccaattac 1980
tctcgagatt gtggacagct gcccgtgcag cgcgaactcc aagtggtgct gtcagagagc 2040
cccgtccatc ccgtccattg tactacatgc gccaaccgaa tggccctggc taacatctcg 2100
caggtggtcc gggcgccgat cattgcggag agatcgactt caaatacggc tgtcctcttc 2160
ctgctgacag cattcatctc gacctgtcag acattgccat gggccgtttg cagggcaatg 2220
gatcactaac caatggcgtc atcccgactc gatatagaag agtccaatgc cccaaagttg 2280
ggaacgccta catttggctt cgaaatggcg gagggcctta ctattttgct ctcacggcag 2340
tcaacaccaa cggaccgggc tcagtcacca aaatcgagat caagggcgca gacaccgaca 2400
actgggttgc cttggtccat gacccaaact atacgagtag ccgcccacaa gaacgctatg 2460
gcagttgggt aatcccacag ggatcagggc cctttaactt gcctgttgga attcgtctga 2520
ctagcccaac gggggaacag attgtgaatg aacaggccat caagacattc actcctccgg 2580
ccacaggtga ccccaatttt tactacattg acattggtgt gcagtttagc cagaattgat 2640
ggcaagcatt gggcaatggg cttcttgctg tgggacaatg atgtaggcta gattctcaat 2700
gcttcaagta tgtggtgtac gtcttcgtgt gtatagatag gtatgctgtt cacttaaata 2760
cacatccttt ggtacgttg 2779
<210> 20
<211> 493
<212> PRT
<213> 里氏木霉
<400> 20
Met Ala Gly Lys Leu Ile Leu Val Ala Leu Ala Ser Leu Val Ser Leu
1 5 10 15
Ser Ile Gln Gln Asn Cys Ala Ala Leu Phe Gly Gln Cys Gly Gly Ile
20 25 30
Gly Trp Ser Gly Thr Thr Cys Cys Val Ala Gly Ala Gln Cys Ser Phe
35 40 45
Val Asn Asp Trp Tyr Ser Gln Cys Leu Ala Ser Thr Gly Gly Asn Pro
50 55 60
Pro Asn Gly Thr Thr Ser Ser Ser Leu Val Ser Arg Thr Ser Ser Ala
65 70 75 80
Ser Ser Ser Val Gly Ser Ser Ser Pro Gly Gly Asn Ser Pro Thr Gly
85 90 95
Ser Ala Ser Thr Tyr Thr Thr Thr Asp Thr Ala Thr Val Ala Pro His
100 105 110
Ser Gln Ser Pro Tyr Pro Ser Ile Ala Ala Ser Ser Cys Gly Ser Trp
115 120 125
Thr Leu Val Asp Asn Val Cys Cys Pro Ser Tyr Cys Ala Asn Asp Asp
130 135 140
Thr Ser Glu Ser Cys Ser Gly Cys Gly Thr Cys Thr Thr Pro Pro Ser
145 150 155 160
Ala Asp Cys Lys Ser Gly Thr Met Tyr Pro Glu Val His His Val Ser
165 170 175
Ser Asn Glu Ser Trp His Tyr Ser Arg Ser Thr His Phe Gly Leu Thr
180 185 190
Ser Gly Gly Ala Cys Gly Phe Gly Leu Tyr Gly Leu Cys Thr Lys Gly
195 200 205
Ser Val Thr Ala Ser Trp Thr Asp Pro Met Leu Gly Ala Thr Cys Asp
210 215 220
Ala Phe Cys Thr Ala Tyr Pro Leu Leu Cys Lys Asp Pro Thr Gly Thr
225 230 235 240
Thr Leu Arg Gly Asn Phe Ala Ala Pro Asn Gly Asp Tyr Tyr Thr Gln
245 250 255
Phe Trp Ser Ser Leu Pro Gly Ala Leu Asp Asn Tyr Leu Ser Cys Gly
260 265 270
Glu Cys Ile Glu Leu Ile Gln Thr Lys Pro Asp Gly Thr Asp Tyr Ala
275 280 285
Val Gly Glu Ala Gly Tyr Thr Asp Pro Ile Thr Leu Glu Ile Val Asp
290 295 300
Ser Cys Pro Cys Ser Ala Asn Ser Lys Trp Cys Cys Gly Pro Gly Ala
305 310 315 320
Asp His Cys Gly Glu Ile Asp Phe Lys Tyr Gly Cys Pro Leu Pro Ala
325 330 335
Asp Ser Ile His Leu Asp Leu Ser Asp Ile Ala Met Gly Arg Leu Gln
340 345 350
Gly Asn Gly Ser Leu Thr Asn Gly Val Ile Pro Thr Arg Tyr Arg Arg
355 360 365
Val Gln Cys Pro Lys Val Gly Asn Ala Tyr Ile Trp Leu Arg Asn Gly
370 375 380
Gly Gly Pro Tyr Tyr Phe Ala Leu Thr Ala Val Asn Thr Asn Gly Pro
385 390 395 400
Gly Ser Val Thr Lys Ile Glu Ile Lys Gly Ala Asp Thr Asp Asn Trp
405 410 415
Val Ala Leu Val His Asp Pro Asn Tyr Thr Ser Ser Arg Pro Gln Glu
420 425 430
Arg Tyr Gly Ser Trp Val Ile Pro Gln Gly Ser Gly Pro Phe Asn Leu
435 440 445
Pro Val Gly Ile Arg Leu Thr Ser Pro Thr Gly Glu Gln Ile Val Asn
450 455 460
Glu Gln Ala Ile Lys Thr Phe Thr Pro Pro Ala Thr Gly Asp Pro Asn
465 470 475 480
Phe Tyr Tyr Ile Asp Ile Gly Val Gln Phe Ser Gln Asn
485 490
<210> 21
<211> 2777
<212> DNA
<213> 里氏木霉
<400> 21
atggtgcgct ccgccctatt cgtgtcgctg ctcgcgacct tctccggagt cattgcccgt 60
gtctccgggc atgggtcaaa gatcgttccc ggcgcgtaca tcttcgaatt cgaggattca 120
caggtgagtc tcgctcggcc gttggcaccg gatgacatgc ctccagctgt ggcaatgctg 180
acgggactcc atccaggaca cggccgattt ctacaagaag ctcaacggcg agggctcaac 240
gcgcctgaag ttcgactaca agctgttcaa gggcgtctcc gtccagctca aggacctaga 300
caaccatgag gcaaaggccc agcagatggc ccagctgcct gctgtcaaga acgtgtggcc 360
cgtcaccctc atcgacgccc ccaaccccaa ggtcgagtgg gttgccggca gcacggcgcc 420
tactctggag agcagggcga tcaagaagcc accgatcccg aacgactcga gcgacttccc 480
cacgcaccag atgacccaaa tcgacaagct gcgagccaag ggctacacgg gcaagggcgt 540
cagggttgcc gtcattgata caggcgtgag tacaagccca ctgtcccaag caagtcgtgt 600
agacgctcac atacggccag attgactaca cccaccctgc tctcggcggc tgctttggta 660
ggggctgtct ggtctccttt ggcaccgatt tggtcggtga cgactacacc ggctttaaca 720
cgcctgtccc cgatgatgac cccgtcgact gcgccggcca cggttctcac gttgctggta 780
tcattgctgc gcaggagaat ccgtacggct tcactggcgg cgctcccgat gtcaccctcg 840
gcgcttatcg agtctttggc tgcgacggcc aggccggtaa cgatgtcctg atttccgctt 900
acaaccaggc ctttgaggac ggtgcccaga tcatcactgc ctccattggc ggtccctctg 960
gctgggctga ggagccgtgg gccgttgccg tcacccgcat cgttgaggca ggtgttccct 1020
gcacggtctc tgccggcaac gagggcgact ctggtctctt ctttgccagc acggcagcca 1080
atggcaagaa agtcattgct gtcgcctccg tcgacaacga gaacatccct tcagtgctgt 1140
ccgtggcctc ttacaaaatt gacagcggcg ctgcccagga ctttggctac gtctcctcct 1200
ccaaggcgtg ggacggcgtg agcaagcccc tgtatgctgt gtcgttcgac actactattc 1260
ccgacgatgg ctgctcgcct ctccctgaca gcactcccga cctctctgac tacattgtcc 1320
ttgtccgccg tggcacctgc acctttgtcc agaaagccca aaatgtcgct gcaaagggcg 1380
ccaagtacct gctctattat aacaacattc ccggtgcgct ggccgtcgat gtcagcgccg 1440
tccccgagat tgaggctgtc ggcatggtcg atgacaagac gggtgctacc tggattgccg 1500
ccctcaagga tggaaagacc gtcaccctga cactgactga cccgatcgag agcgagaagc 1560
aaattcagtt cagcgacaac ccgacaactg gcggtgctct gagcggctac acaacctggg 1620
gccctacctg ggagctggac gtcaagcctc agatcagctc tcccggcggc aacattctct 1680
ccacgtaccc cgtggctctc ggaggatatg ccaccctgtc cggtacctcc atggcctgcc 1740
ccctgacggc ggctgctgtt gctctgattg gacaagctcg tggcaccttt gaccctgcct 1800
tgatcgacaa cttgttggca acgactgcga acccccagct gttcaacgac ggcgagaagt 1860
tctacgactt cctcgccccc gttccccaac agggcggtgg cctcatccag gcctacgatg 1920
ccgcctttgc gaccactctc ctgtcaccgt ccagcctgtc gttcaacgac actgaccact 1980
tcatcaagaa gaagcagatc accctcaaga acaccagcaa gcagagggtc acctacaagc 2040
tcaaccacgt ccccaccaac accttttaca ctctggcacc cggtaacggc tatccagctc 2100
cctttcctaa cgacgccgtt gccgctcacg ccaatctcaa gtttaatctg cagcaagtga 2160
ccctgcccgc cggcaggtcc atcactgtcg acgtcttccc tactcccccc agggacgtcg 2220
acgccaagcg cctggcgctt tggtcgggct acatcacggt caacggcacg gatggcacca 2280
gtctgtctgt cccgtaccag ggcctcaccg gctccctgca caagcagaag gtgctctatc 2340
cggaggactc ctggatcgcc gattccaccg atgaaagcct ggcccctgtt gagaacggca 2400
ccgtcttcac cattcccgcg ccgggcaacg ctggccccga tgacaagctc ccatcgctcg 2460
tcgtcagccc tgcccttggc tctcgttatg tccgcgttga tctcgtcctc ctgtccgcgc 2520
ctcctcatgg caccaagctc aagacggtca agttcctcga caccacctcc atcggccagc 2580
ctgccggatc accgctcctc tggatcagcc gtggcgccaa ccctattgct tggaccggcg 2640
agctgtctga caacaagttt gctccccctg gaacgtacaa ggccgtgttc catgctctgc 2700
gtattttcgg caacgagaag aagaaggagg actgggatgt gagcgaatct cctgccttca 2760
ccatcaagta tgcgtag 2777
<210> 22
<211> 882
<212> PRT
<213> 里氏木霉
<400> 22
Met Val Arg Ser Ala Leu Phe Val Ser Leu Leu Ala Thr Phe Ser Gly
1 5 10 15
Val Ile Ala Arg Val Ser Gly His Gly Ser Lys Ile Val Pro Gly Ala
20 25 30
Tyr Ile Phe Glu Phe Glu Asp Ser Gln Asp Thr Ala Asp Phe Tyr Lys
35 40 45
Lys Leu Asn Gly Glu Gly Ser Thr Arg Leu Lys Phe Asp Tyr Lys Leu
50 55 60
Phe Lys Gly Val Ser Val Gln Leu Lys Asp Leu Asp Asn His Glu Ala
65 70 75 80
Lys Ala Gln Gln Met Ala Gln Leu Pro Ala Val Lys Asn Val Trp Pro
85 90 95
Val Thr Leu Ile Asp Ala Pro Asn Pro Lys Val Glu Trp Val Ala Gly
100 105 110
Ser Thr Ala Pro Thr Leu Glu Ser Arg Ala Ile Lys Lys Pro Pro Ile
115 120 125
Pro Asn Asp Ser Ser Asp Phe Pro Thr His Gln Met Thr Gln Ile Asp
130 135 140
Lys Leu Arg Ala Lys Gly Tyr Thr Gly Lys Gly Val Arg Val Ala Val
145 150 155 160
Ile Asp Thr Gly Ile Asp Tyr Thr His Pro Ala Leu Gly Gly Cys Phe
165 170 175
Gly Arg Gly Cys Leu Val Ser Phe Gly Thr Asp Leu Val Gly Asp Asp
180 185 190
Tyr Thr Gly Phe Asn Thr Pro Val Pro Asp Asp Asp Pro Val Asp Cys
195 200 205
Ala Gly His Gly Ser His Val Ala Gly Ile Ile Ala Ala Gln Glu Asn
210 215 220
Pro Tyr Gly Phe Thr Gly Gly Ala Pro Asp Val Thr Leu Gly Ala Tyr
225 230 235 240
Arg Val Phe Gly Cys Asp Gly Gln Ala Gly Asn Asp Val Leu Ile Ser
245 250 255
Ala Tyr Asn Gln Ala Phe Glu Asp Gly Ala Gln Ile Ile Thr Ala Ser
260 265 270
Ile Gly Gly Pro Ser Gly Trp Ala Glu Glu Pro Trp Ala Val Ala Val
275 280 285
Thr Arg Ile Val Glu Ala Gly Val Pro Cys Thr Val Ser Ala Gly Asn
290 295 300
Glu Gly Asp Ser Gly Leu Phe Phe Ala Ser Thr Ala Ala Asn Gly Lys
305 310 315 320
Lys Val Ile Ala Val Ala Ser Val Asp Asn Glu Asn Ile Pro Ser Val
325 330 335
Leu Ser Val Ala Ser Tyr Lys Ile Asp Ser Gly Ala Ala Gln Asp Phe
340 345 350
Gly Tyr Val Ser Ser Ser Lys Ala Trp Asp Gly Val Ser Lys Pro Leu
355 360 365
Tyr Ala Val Ser Phe Asp Thr Thr Ile Pro Asp Asp Gly Cys Ser Pro
370 375 380
Leu Pro Asp Ser Thr Pro Asp Leu Ser Asp Tyr Ile Val Leu Val Arg
385 390 395 400
Arg Gly Thr Cys Thr Phe Val Gln Lys Ala Gln Asn Val Ala Ala Lys
405 410 415
Gly Ala Lys Tyr Leu Leu Tyr Tyr Asn Asn Ile Pro Gly Ala Leu Ala
420 425 430
Val Asp Val Ser Ala Val Pro Glu Ile Glu Ala Val Gly Met Val Asp
435 440 445
Asp Lys Thr Gly Ala Thr Trp Ile Ala Ala Leu Lys Asp Gly Lys Thr
450 455 460
Val Thr Leu Thr Leu Thr Asp Pro Ile Glu Ser Glu Lys Gln Ile Gln
465 470 475 480
Phe Ser Asp Asn Pro Thr Thr Gly Gly Ala Leu Ser Gly Tyr Thr Thr
485 490 495
Trp Gly Pro Thr Trp Glu Leu Asp Val Lys Pro Gln Ile Ser Ser Pro
500 505 510
Gly Gly Asn Ile Leu Ser Thr Tyr Pro Val Ala Leu Gly Gly Tyr Ala
515 520 525
Thr Leu Ser Gly Thr Ser Met Ala Cys Pro Leu Thr Ala Ala Ala Val
530 535 540
Ala Leu Ile Gly Gln Ala Arg Gly Thr Phe Asp Pro Ala Leu Ile Asp
545 550 555 560
Asn Leu Leu Ala Thr Thr Ala Asn Pro Gln Leu Phe Asn Asp Gly Glu
565 570 575
Lys Phe Tyr Asp Phe Leu Ala Pro Val Pro Gln Gln Gly Gly Gly Leu
580 585 590
Ile Gln Ala Tyr Asp Ala Ala Phe Ala Thr Thr Leu Leu Ser Pro Ser
595 600 605
Ser Leu Ser Phe Asn Asp Thr Asp His Phe Ile Lys Lys Lys Gln Ile
610 615 620
Thr Leu Lys Asn Thr Ser Lys Gln Arg Val Thr Tyr Lys Leu Asn His
625 630 635 640
Val Pro Thr Asn Thr Phe Tyr Thr Leu Ala Pro Gly Asn Gly Tyr Pro
645 650 655
Ala Pro Phe Pro Asn Asp Ala Val Ala Ala His Ala Asn Leu Lys Phe
660 665 670
Asn Leu Gln Gln Val Thr Leu Pro Ala Gly Arg Ser Ile Thr Val Asp
675 680 685
Val Phe Pro Thr Pro Pro Arg Asp Val Asp Ala Lys Arg Leu Ala Leu
690 695 700
Trp Ser Gly Tyr Ile Thr Val Asn Gly Thr Asp Gly Thr Ser Leu Ser
705 710 715 720
Val Pro Tyr Gln Gly Leu Thr Gly Ser Leu His Lys Gln Lys Val Leu
725 730 735
Tyr Pro Glu Asp Ser Trp Ile Ala Asp Ser Thr Asp Glu Ser Leu Ala
740 745 750
Pro Val Glu Asn Gly Thr Val Phe Thr Ile Pro Ala Pro Gly Asn Ala
755 760 765
Gly Pro Asp Asp Lys Leu Pro Ser Leu Val Val Ser Pro Ala Leu Gly
770 775 780
Ser Arg Tyr Val Arg Val Asp Leu Val Leu Leu Ser Ala Pro Pro His
785 790 795 800
Gly Thr Lys Leu Lys Thr Val Lys Phe Leu Asp Thr Thr Ser Ile Gly
805 810 815
Gln Pro Ala Gly Ser Pro Leu Leu Trp Ile Ser Arg Gly Ala Asn Pro
820 825 830
Ile Ala Trp Thr Gly Glu Leu Ser Asp Asn Lys Phe Ala Pro Pro Gly
835 840 845
Thr Tyr Lys Ala Val Phe His Ala Leu Arg Ile Phe Gly Asn Glu Lys
850 855 860
Lys Lys Glu Asp Trp Asp Val Ser Glu Ser Pro Ala Phe Thr Ile Lys
865 870 875 880
Tyr Ala
<210> 23
<211> 1302
<212> DNA
<213> 里氏木霉
<400> 23
atgcagacct ttggagcttt tctcgtttcc ttcctcgccg ccagcggcct ggccgcggcc 60
ctccccaccg agggtcagaa gacggcttcc gtcgaggtcc agtacaacaa gaactacgtc 120
ccccacggcc ctactgctct cttcaaggcc aagagaaagt atggcgctcc catcagcgac 180
aacctgaagt ctctcgtggc tgccaggcag gccaagcagg ctctcgccaa gcgccagacc 240
ggctcggcgc ccaaccaccc cagtgacagc gccgattcgg agtacatcac ctccgtctcc 300
atcggcactc cggctcaggt cctccccctg gactttgaca ccggctcctc cgacctgtgg 360
gtctttagct ccgagacgcc caagtcttcg gccaccggcc acgccatcta cacgccctcc 420
aagtcgtcca cctccaagaa ggtgtctggc gccagctggt ccatcagcta cggcgacggc 480
agcagctcca gcggcgatgt ctacaccgac aaggtcacca tcggaggctt cagcgtcaac 540
acccagggcg tcgagtctgc cacccgcgtg tccaccgagt tcgtccagga cacggtcatc 600
tctggcctcg tcggccttgc ctttgacagc ggcaaccagg tcaggccgca cccgcagaag 660
acgtggttct ccaacgccgc cagcagcctg gctgagcccc ttttcactgc cgacctgagg 720
cacggacaga gtaagtagac actcactgga attcgttcct ttcccgatca tcatgaaagc 780
aagtagactg actgaaccaa acaactagac ggcagctaca actttggcta catcgacacc 840
agcgtcgcca agggccccgt tgcctacacc cccgttgaca acagccaggg cttctgggag 900
ttcactgcct cgggctactc tgtcggcggc ggcaagctca accgcaactc catcgacggc 960
attgccgaca ccggcaccac cctgctcctc ctcgacgaca acgtcgtcga tgcctactac 1020
gccaacgtcc agtcggccca gtacgacaac cagcaggagg gtgtcgtctt cgactgcgac 1080
gaggacctcc cttcgttcag cttcggtgtt ggaagctcca ccatcaccat ccctggcgat 1140
ctgctgaacc tgactcccct cgaggagggc agctccacct gcttcggtgg cctccagagc 1200
agctccggca ttggcatcaa catctttggt gacgttgccc tcaaggctgc cctggttgtc 1260
tttgacctcg gcaacgagcg cctgggctgg gctcagaaat aa 1302
<210> 24
<211> 407
<212> PRT
<213> 里氏木霉
<400> 24
Met Gln Thr Phe Gly Ala Phe Leu Val Ser Phe Leu Ala Ala Ser Gly
1 5 10 15
Leu Ala Ala Ala Leu Pro Thr Glu Gly Gln Lys Thr Ala Ser Val Glu
20 25 30
Val Gln Tyr Asn Lys Asn Tyr Val Pro His Gly Pro Thr Ala Leu Phe
35 40 45
Lys Ala Lys Arg Lys Tyr Gly Ala Pro Ile Ser Asp Asn Leu Lys Ser
50 55 60
Leu Val Ala Ala Arg Gln Ala Lys Gln Ala Leu Ala Lys Arg Gln Thr
65 70 75 80
Gly Ser Ala Pro Asn His Pro Ser Asp Ser Ala Asp Ser Glu Tyr Ile
85 90 95
Thr Ser Val Ser Ile Gly Thr Pro Ala Gln Val Leu Pro Leu Asp Phe
100 105 110
Asp Thr Gly Ser Ser Asp Leu Trp Val Phe Ser Ser Glu Thr Pro Lys
115 120 125
Ser Ser Ala Thr Gly His Ala Ile Tyr Thr Pro Ser Lys Ser Ser Thr
130 135 140
Ser Lys Lys Val Ser Gly Ala Ser Trp Ser Ile Ser Tyr Gly Asp Gly
145 150 155 160
Ser Ser Ser Ser Gly Asp Val Tyr Thr Asp Lys Val Thr Ile Gly Gly
165 170 175
Phe Ser Val Asn Thr Gln Gly Val Glu Ser Ala Thr Arg Val Ser Thr
180 185 190
Glu Phe Val Gln Asp Thr Val Ile Ser Gly Leu Val Gly Leu Ala Phe
195 200 205
Asp Ser Gly Asn Gln Val Arg Pro His Pro Gln Lys Thr Trp Phe Ser
210 215 220
Asn Ala Ala Ser Ser Leu Ala Glu Pro Leu Phe Thr Ala Asp Leu Arg
225 230 235 240
His Gly Gln Asn Gly Ser Tyr Asn Phe Gly Tyr Ile Asp Thr Ser Val
245 250 255
Ala Lys Gly Pro Val Ala Tyr Thr Pro Val Asp Asn Ser Gln Gly Phe
260 265 270
Trp Glu Phe Thr Ala Ser Gly Tyr Ser Val Gly Gly Gly Lys Leu Asn
275 280 285
Arg Asn Ser Ile Asp Gly Ile Ala Asp Thr Gly Thr Thr Leu Leu Leu
290 295 300
Leu Asp Asp Asn Val Val Asp Ala Tyr Tyr Ala Asn Val Gln Ser Ala
305 310 315 320
Gln Tyr Asp Asn Gln Gln Glu Gly Val Val Phe Asp Cys Asp Glu Asp
325 330 335
Leu Pro Ser Phe Ser Phe Gly Val Gly Ser Ser Thr Ile Thr Ile Pro
340 345 350
Gly Asp Leu Leu Asn Leu Thr Pro Leu Glu Glu Gly Ser Ser Thr Cys
355 360 365
Phe Gly Gly Leu Gln Ser Ser Ser Gly Ile Gly Ile Asn Ile Phe Gly
370 375 380
Asp Val Ala Leu Lys Ala Ala Leu Val Val Phe Asp Leu Gly Asn Glu
385 390 395 400
Arg Leu Gly Trp Ala Gln Lys
405
<210> 25
<211> 933
<212> DNA
<213> 里氏木霉
<400> 25
atggctcccg cttcccaagt cgtctcagct ctcatgctgc ccgctctcgc cttgggagcc 60
gccatccagc cccgtggcgc tgacatcgtg ggaggaaccg ccgcctcgct cggcgagttc 120
ccctacattg tcagtctgca gaaccccaac cagggcggcc acttctgcgg tggtgtcttg 180
gtcaacgcca acaccgtcgt taccgccgct cactgctccg ttgtctaccc tgcctcgcag 240
atccgcgtcc gcgccggtac tcttgtaagt ttgcttgttt cgagtcctcg aaaagacatg 300
aacctgcgat ggctaaccaa agcacctcct ctctgataga cctggaactc tggcggtacc 360
ctggtcggcg tctcccagat catcgtgaac ccgtcctaca acgaccgcac caccgacttt 420
gacgttgccg tctggcacct gtccagccct atccgcgaga gctccaccat tggctacgcc 480
actcttcccg cccagggctc cgaccccgtg gccggctcga ccgtcaccac cgctggctgg 540
taagcatcat catcattgat agccgggaca tgctggcgtc aaatccgagt ttgctaacca 600
ttcttccaaa aaaacagggg caccaccagc gagaactcca actccatccc ctcccgcctg 660
aacaaggtct ccgtccccgt cgtcgcccgc tccacctgcc aggccgacta ccgcagccag 720
gggctcagtg tcaccaacaa catgttctgc gccggcctca cccagggcgg caaggactct 780
tgctctggcg actctggcgg ccccatcgtt gacgccaacg gtgtcctcca gggtgtcgtt 840
tcttggggta tcggctgtgc tgaggccggt ttccctggtg tctacaccag aatcggcaac 900
tttgtcaact acatcaacca gaacctcgca taa 933
<210> 26
<211> 259
<212> PRT
<213> 里氏木霉
<400> 26
Met Ala Pro Ala Ser Gln Val Val Ser Ala Leu Met Leu Pro Ala Leu
1 5 10 15
Ala Leu Gly Ala Ala Ile Gln Pro Arg Gly Ala Asp Ile Val Gly Gly
20 25 30
Thr Ala Ala Ser Leu Gly Glu Phe Pro Tyr Ile Val Ser Leu Gln Asn
35 40 45
Pro Asn Gln Gly Gly His Phe Cys Gly Gly Val Leu Val Asn Ala Asn
50 55 60
Thr Val Val Thr Ala Ala His Cys Ser Val Val Tyr Pro Ala Ser Gln
65 70 75 80
Ile Arg Val Arg Ala Gly Thr Leu Thr Trp Asn Ser Gly Gly Thr Leu
85 90 95
Val Gly Val Ser Gln Ile Ile Val Asn Pro Ser Tyr Asn Asp Arg Thr
100 105 110
Thr Asp Phe Asp Val Ala Val Trp His Leu Ser Ser Pro Ile Arg Glu
115 120 125
Ser Ser Thr Ile Gly Tyr Ala Thr Leu Pro Ala Gln Gly Ser Asp Pro
130 135 140
Val Ala Gly Ser Thr Val Thr Thr Ala Gly Trp Gly Thr Thr Ser Glu
145 150 155 160
Asn Ser Asn Ser Ile Pro Ser Arg Leu Asn Lys Val Ser Val Pro Val
165 170 175
Val Ala Arg Ser Thr Cys Gln Ala Asp Tyr Arg Ser Gln Gly Leu Ser
180 185 190
Val Thr Asn Asn Met Phe Cys Ala Gly Leu Thr Gln Gly Gly Lys Asp
195 200 205
Ser Cys Ser Gly Asp Ser Gly Gly Pro Ile Val Asp Ala Asn Gly Val
210 215 220
Leu Gln Gly Val Val Ser Trp Gly Ile Gly Cys Ala Glu Ala Gly Phe
225 230 235 240
Pro Gly Val Tyr Thr Arg Ile Gly Asn Phe Val Asn Tyr Ile Asn Gln
245 250 255
Asn Leu Ala
<210> 27
<211> 1684
<212> DNA
<213> 里氏木霉
<400> 27
atgcggtccg ttgtcgccct ctccatggcg gccgttgccc aggccagcac attccagatt 60
ggcaccatcc acgagaagtc ggcccccgtg ctgagcaacg tcgaggccaa cgccatcccc 120
gatgcctaca tcatcaagtt caaggaccac gtgggtgagg atgatgcctc caagcaccac 180
gactggatcc agagcatcca cacaaacgtt gagcaggagc gccttgagct ccgcaagcga 240
agcaacgtct ttggcgccga cgacgtcttt gacggtctga agcacacttt caagattggc 300
gacggcttca agggctacgc cggtcacttc cacgagtctg tcattgagca ggtccggaac 360
caccctgacg taagttttgc acagccgccc tcccttttgg ctccccaaca aagctaaccc 420
ctcccaggtt gagtacatcg agcgcgacag cattgtgcac accatgcttc ccctcgagtc 480
caaggacagc atcatcgttg aggactcgtg caacggcgag acggagaagc aggctccctg 540
gggtcttgcc cgtatctctc accgagagac gctcaacttt ggctccttca acaagtacct 600
ctacaccgct gatggtggtg agggtgttga tgcctatgtc attgacaccg gcaccaacat 660
cgagcacgtc gactttgagg gtcgtgccaa gtggggcaag accatccctg ccggcgatga 720
ggacgaggac ggcaacggcc acggcactca ctgctctggt accgttgctg gtaagaagta 780
cggtgttgcc aagaaggccc acgtctacgc cgtcaaggtg ctccgatcca acggatccgg 840
caccatgtct gacgtcgtca agggcgtcga gtacgctgct ctctcccaca ttgagcaggt 900
gaagaaggcc aagaagggca agcggaaggg cttcaagggc tccgtcgcca acatgtccct 960
cggtggtggc aagacccagg ctcttgacgc tgccgtcaac gccgccgtcc gcgccggtgt 1020
ccactttgcc gttgctgccg gcaacgacaa cgctgatgct tgcaactact cccccgctgc 1080
cgccactgag cccctcaccg tcggtgcttc tgctctcgat gacagccgtg cttacttctc 1140
caactacggc aagtgcactg acatcttcgc ccctggtctg agcatccagt ccacctggat 1200
tggctccaag tatgccgtca acaccatctc tggtacctcc atggcctctc ctcacatctg 1260
cggtctcctg gcctactacc tgtctctcca gcccgctggt gactctgagt tcgctgttgc 1320
ccccatcacc cccaagaagc tcaaggagag cgtcatctct gtcgccacca agaacgccct 1380
ctctgacctg cccgactctg acacccccaa cctgctcgcc tggaacggcg gtggctgcag 1440
caacttctcc cagattgtcg aggccggcag ctacactgtc aagcccaagc agaacaagca 1500
ggccaagctc cccagcacca ttgaggagct cgaggaggcc atcgagggtg actttgaggt 1560
cgtctctggc gagatcgtca agggtgccaa gagctttggc tccaaggcgg agaagtttgc 1620
caagaagatc cacgatctcg tcgaggagga gattgaggag ttcatctctg agctctccga 1680
gtaa 1684
<210> 28
<211> 540
<212> PRT
<213> 里氏木霉
<400> 28
Met Arg Ser Val Val Ala Leu Ser Met Ala Ala Val Ala Gln Ala Ser
1 5 10 15
Thr Phe Gln Ile Gly Thr Ile His Glu Lys Ser Ala Pro Val Leu Ser
20 25 30
Asn Val Glu Ala Asn Ala Ile Pro Asp Ala Tyr Ile Ile Lys Phe Lys
35 40 45
Asp His Val Gly Glu Asp Asp Ala Ser Lys His His Asp Trp Ile Gln
50 55 60
Ser Ile His Thr Asn Val Glu Gln Glu Arg Leu Glu Leu Arg Lys Arg
65 70 75 80
Ser Asn Val Phe Gly Ala Asp Asp Val Phe Asp Gly Leu Lys His Thr
85 90 95
Phe Lys Ile Gly Asp Gly Phe Lys Gly Tyr Ala Gly His Phe His Glu
100 105 110
Ser Val Ile Glu Gln Val Arg Asn His Pro Val Glu Tyr Ile Glu Arg
115 120 125
Asp Ser Ile Val His Thr Met Leu Pro Leu Glu Ser Lys Asp Ser Ile
130 135 140
Ile Val Glu Asp Ser Cys Asn Gly Glu Thr Glu Lys Gln Ala Pro Trp
145 150 155 160
Gly Leu Ala Arg Ile Ser His Arg Glu Thr Leu Asn Phe Gly Ser Phe
165 170 175
Asn Lys Tyr Leu Tyr Thr Ala Asp Gly Gly Glu Gly Val Asp Ala Tyr
180 185 190
Val Ile Asp Thr Gly Thr Asn Ile Glu His Val Asp Phe Glu Gly Arg
195 200 205
Ala Lys Trp Gly Lys Thr Ile Pro Ala Gly Asp Glu Asp Glu Asp Gly
210 215 220
Asn Gly His Gly Thr His Cys Ser Gly Thr Val Ala Gly Lys Lys Tyr
225 230 235 240
Gly Val Ala Lys Lys Ala His Val Tyr Ala Val Lys Val Leu Arg Ser
245 250 255
Asn Gly Ser Gly Thr Met Ser Asp Val Val Lys Gly Val Glu Tyr Ala
260 265 270
Ala Leu Ser His Ile Glu Gln Val Lys Lys Ala Lys Lys Gly Lys Arg
275 280 285
Lys Gly Phe Lys Gly Ser Val Ala Asn Met Ser Leu Gly Gly Gly Lys
290 295 300
Thr Gln Ala Leu Asp Ala Ala Val Asn Ala Ala Val Arg Ala Gly Val
305 310 315 320
His Phe Ala Val Ala Ala Gly Asn Asp Asn Ala Asp Ala Cys Asn Tyr
325 330 335
Ser Pro Ala Ala Ala Thr Glu Pro Leu Thr Val Gly Ala Ser Ala Leu
340 345 350
Asp Asp Ser Arg Ala Tyr Phe Ser Asn Tyr Gly Lys Cys Thr Asp Ile
355 360 365
Phe Ala Pro Gly Leu Ser Ile Gln Ser Thr Trp Ile Gly Ser Lys Tyr
370 375 380
Ala Val Asn Thr Ile Ser Gly Thr Ser Met Ala Ser Pro His Ile Cys
385 390 395 400
Gly Leu Leu Ala Tyr Tyr Leu Ser Leu Gln Pro Ala Gly Asp Ser Glu
405 410 415
Phe Ala Val Ala Pro Ile Thr Pro Lys Lys Leu Lys Glu Ser Val Ile
420 425 430
Ser Val Ala Thr Lys Asn Ala Leu Ser Asp Leu Pro Asp Ser Asp Thr
435 440 445
Pro Asn Leu Leu Ala Trp Asn Gly Gly Gly Cys Ser Asn Phe Ser Gln
450 455 460
Ile Val Glu Ala Gly Ser Tyr Thr Val Lys Pro Lys Gln Asn Lys Gln
465 470 475 480
Ala Lys Leu Pro Ser Thr Ile Glu Glu Leu Glu Glu Ala Ile Glu Gly
485 490 495
Asp Phe Glu Val Val Ser Gly Glu Ile Val Lys Gly Ala Lys Ser Phe
500 505 510
Gly Ser Lys Ala Glu Lys Phe Ala Lys Lys Ile His Asp Leu Val Glu
515 520 525
Glu Glu Ile Glu Glu Phe Ile Ser Glu Leu Ser Glu
530 535 540
<210> 29
<211> 1341
<212> DNA
<213> 里氏木霉
<400> 29
atgaagagcg cgttacttgc cgccgcggcg cttgtcggct ccgcccaagc cggcattcac 60
aagatgaagc tgcagaaggt ctccctggag cagcagctgg taagacgaca ccctcatcca 120
cggcctcgta ctctagccaa gcgcaatcac tgacacgccg cctctctcat ctaggagggt 180
tcgagcatcg aggcccacgt ccagcagctc ggccagaagt acatgggcgt ccgccctact 240
agccgtgccg aggtcatgtt caacgacaag ccgcccaagg tccagggcgg gcacccggtt 300
cccgtcacca acttcatgaa tgcccaatgt aagtcgtgat gcgcagcaca gcacgagagt 360
cccgctccca ggtagcgagc acatgcttac taacttgctc ggacagactt ctctgagatt 420
accatcggca ccccccctca gtcgttcaag gttgtcctcg acacgggaag ctctaacctc 480
tgggttccct ctcagtcgtg caacagcatc gcctgcttcc tgcactccac gtacgattcg 540
tcttcatcgt cgacgtacaa gcccaacggc tccgattttg agatccacta cggatcaggt 600
agcttgactg gcttcatctc caacgatgtc gtgacgattg gcgacctcaa gatcaagggg 660
caggactttg ccgaggcaac cagcgagccc ggccttgcct ttgctttcgg ccgcttcgac 720
ggcattcttg gccttggcta cgataccatc tcggtcaatg gcattgtccc ccccttttac 780
cagatggtca accagaagct gatcgacgag cccgtctttg ctttctacct gggaagcagc 840
gacgagggtt ccgaggctgt ctttggcggc gtcgacgatg ctcactacga gggcaagatt 900
gagtacattc ccctgcgccg caaggcctac tgggaggtgg accttgactc cattgccttc 960
ggtgacgagg tcgccgagct cgagaacact ggcgccatcc ttgacaccgg cacctctctc 1020
aacgtcctcc cctcgggcct cgccgagctc ctgaacgctg agattggcgc caagaagggc 1080
tttggcggtc agtacactgt tgactgctcc aagcgtgatt ccctccccga catcaccttc 1140
agcctggccg gctccaagta cagccttccc gccagcgact acatcattga gatgtctggc 1200
aactgcattt cgtccttcca gggcatggac ttccccgagc ccgtgggccc cctggtcatt 1260
ctgggtgatg ctttcttgcg ccgctactac tccgtctacg accttggcag ggacgccgtt 1320
ggtcttgcca aggccaaata a 1341
<210> 30
<211> 395
<212> PRT
<213> 里氏木霉
<400> 30
Met Lys Ser Ala Leu Leu Ala Ala Ala Ala Leu Val Gly Ser Ala Gln
1 5 10 15
Ala Gly Ile His Lys Met Lys Leu Gln Lys Val Ser Leu Glu Gln Gln
20 25 30
Leu Glu Gly Ser Ser Ile Glu Ala His Val Gln Gln Leu Gly Gln Lys
35 40 45
Tyr Met Gly Val Arg Pro Thr Ser Arg Ala Glu Val Met Phe Asn Asp
50 55 60
Lys Pro Pro Lys Val Gln Gly Gly His Pro Val Pro Val Thr Asn Phe
65 70 75 80
Met Asn Ala Gln Tyr Phe Ser Glu Ile Thr Ile Gly Thr Pro Pro Gln
85 90 95
Ser Phe Lys Val Val Leu Asp Thr Gly Ser Ser Asn Leu Trp Val Pro
100 105 110
Ser Gln Ser Cys Asn Ser Ile Ala Cys Phe Leu His Ser Thr Tyr Asp
115 120 125
Ser Ser Ser Ser Ser Thr Tyr Lys Pro Asn Gly Ser Asp Phe Glu Ile
130 135 140
His Tyr Gly Ser Gly Ser Leu Thr Gly Phe Ile Ser Asn Asp Val Val
145 150 155 160
Thr Ile Gly Asp Leu Lys Ile Lys Gly Gln Asp Phe Ala Glu Ala Thr
165 170 175
Ser Glu Pro Gly Leu Ala Phe Ala Phe Gly Arg Phe Asp Gly Ile Leu
180 185 190
Gly Leu Gly Tyr Asp Thr Ile Ser Val Asn Gly Ile Val Pro Pro Phe
195 200 205
Tyr Gln Met Val Asn Gln Lys Leu Ile Asp Glu Pro Val Phe Ala Phe
210 215 220
Tyr Leu Gly Ser Ser Asp Glu Gly Ser Glu Ala Val Phe Gly Gly Val
225 230 235 240
Asp Asp Ala His Tyr Glu Gly Lys Ile Glu Tyr Ile Pro Leu Arg Arg
245 250 255
Lys Ala Tyr Trp Glu Val Asp Leu Asp Ser Ile Ala Phe Gly Asp Glu
260 265 270
Val Ala Glu Leu Glu Asn Thr Gly Ala Ile Leu Asp Thr Gly Thr Ser
275 280 285
Leu Asn Val Leu Pro Ser Gly Leu Ala Glu Leu Leu Asn Ala Glu Ile
290 295 300
Gly Ala Lys Lys Gly Phe Gly Gly Gln Tyr Thr Val Asp Cys Ser Lys
305 310 315 320
Arg Asp Ser Leu Pro Asp Ile Thr Phe Ser Leu Ala Gly Ser Lys Tyr
325 330 335
Ser Leu Pro Ala Ser Asp Tyr Ile Ile Glu Met Ser Gly Asn Cys Ile
340 345 350
Ser Ser Phe Gln Gly Met Asp Phe Pro Glu Pro Val Gly Pro Leu Val
355 360 365
Ile Leu Gly Asp Ala Phe Leu Arg Arg Tyr Tyr Ser Val Tyr Asp Leu
370 375 380
Gly Arg Asp Ala Val Gly Leu Ala Lys Ala Lys
385 390 395
<210> 31
<211> 37
<212> DNA
<213> 烟曲霉(Aspergillus fumigatus)
<400> 31
actggattta ccatgacttt gtccaagatc acttcca 37
<210> 32
<211> 40
<212> DNA
<213> 烟曲霉
<400> 32
tcacctctag ttaattaagc gttgaacagt gcaggaccag 40
<210> 33
<211> 17
<212> DNA
<213> 烟曲霉
<400> 33
tgtcccttgt cgatgcg 17
<210> 34
<211> 17
<212> DNA
<213> 烟曲霉
<400> 34
cacatgactt ggcttcc 17
<210> 35
<211> 862
<212> DNA
<213> 烟曲霉
<400> 35
atgactttgt ccaagatcac ttccattgct ggccttctgg cctcagcgtc tctcgtggct 60
ggccacggct ttgtttctgg cattgttgct gatgggaaat agtatgtgct tgaaccacac 120
aaatgacagc tgcaacagct aacttctatt ccagttacgg agggtacctt gttaaccaat 180
acccctacat gagcaaccct cccgacacca ttgcctggtc caccaccgcc accgacctcg 240
gctttgtgga cggcaccggc taccagtctc cggatattat ctgccacaga gacgcaaaga 300
atggcaagtt gaccgcaacc gttgcagccg gttcacagat cgaattccag tggacgacgt 360
ggccagagtc tcaccatgga ccggtacgac gccgaagaga agagaacata ttgtgaccag 420
ataggctaac atagcatagt tgattactta cctcgctcca tgcaacggcg actgtgccac 480
cgtggacaag accaccctga agtttgtcaa gatcgccgct caaggcttga tcgacggctc 540
caacccacct ggtgtttggg ctgatgatga aatgatcgcc aacaacaaca cggccacagt 600
gaccattcct gcctcctatg cccccggaaa ctacgtcctt cgccacgaga tcatcgccct 660
tcactctgcg ggtaacctga acggcgcgca gaactacccc cagtgtttca acatccaaat 720
caccggtggc ggcagtgctc agggatctgg caccgctggc acgtccctgt acaagaatac 780
tgatcctggc atcaagtttg acatctactc ggatctgagc ggtggatacc ctattcctgg 840
tcctgcactg ttcaacgctt aa 862
<210> 36
<211> 250
<212> PRT
<213> 烟曲霉
<400> 36
Met Thr Leu Ser Lys Ile Thr Ser Ile Ala Gly Leu Leu Ala Ser Ala
1 5 10 15
Ser Leu Val Ala Gly His Gly Phe Val Ser Gly Ile Val Ala Asp Gly
20 25 30
Lys Tyr Tyr Gly Gly Tyr Leu Val Asn Gln Tyr Pro Tyr Met Ser Asn
35 40 45
Pro Pro Asp Thr Ile Ala Trp Ser Thr Thr Ala Thr Asp Leu Gly Phe
50 55 60
Val Asp Gly Thr Gly Tyr Gln Ser Pro Asp Ile Ile Cys His Arg Asp
65 70 75 80
Ala Lys Asn Gly Lys Leu Thr Ala Thr Val Ala Ala Gly Ser Gln Ile
85 90 95
Glu Phe Gln Trp Thr Thr Trp Pro Glu Ser His His Gly Pro Leu Ile
100 105 110
Thr Tyr Leu Ala Pro Cys Asn Gly Asp Cys Ala Thr Val Asp Lys Thr
115 120 125
Thr Leu Lys Phe Val Lys Ile Ala Ala Gln Gly Leu Ile Asp Gly Ser
130 135 140
Asn Pro Pro Gly Val Trp Ala Asp Asp Glu Met Ile Ala Asn Asn Asn
145 150 155 160
Thr Ala Thr Val Thr Ile Pro Ala Ser Tyr Ala Pro Gly Asn Tyr Val
165 170 175
Leu Arg His Glu Ile Ile Ala Leu His Ser Ala Gly Asn Leu Asn Gly
180 185 190
Ala Gln Asn Tyr Pro Gln Cys Phe Asn Ile Gln Ile Thr Gly Gly Gly
195 200 205
Ser Ala Gln Gly Ser Gly Thr Ala Gly Thr Ser Leu Tyr Lys Asn Thr
210 215 220
Asp Pro Gly Ile Lys Phe Asp Ile Tyr Ser Asp Leu Ser Gly Gly Tyr
225 230 235 240
Pro Ile Pro Gly Pro Ala Leu Phe Asn Ala
245 250
<210> 37
<211> 37
<212> DNA
<213> 烟曲霉
<400> 37
ggactgcgca ccatgacttt gtccaagatc acttcca 37
<210> 38
<211> 38
<212> DNA
<213> 烟曲霉
<400> 38
gccacggagc ttaattaatt aagcgttgaa cagtgcag 38
<210> 39
<211> 37
<212> DNA
<213> 烟曲霉
<400> 39
cgcggtagtg gcgcggtcga ccgaatgtag gattgtt 37
<210> 40
<211> 36
<212> DNA
<213> 烟曲霉
<400> 40
ttaccaattg gcgcgccact accgcgttcg agaaga 36
<210> 41
<211> 3060
<212> DNA
<213> 烟曲霉
<400> 41
atgagattcg gttggctcga ggtggccgct ctgacggccg cttctgtagc caatgcccag 60
gtttgtgatg ctttcccgtc attgtttcgg atatagttga caatagtcat ggaaataatc 120
aggaattggc tttctctcca ccattctacc cttcgccttg ggctgatggc cagggagagt 180
gggcagatgc ccatcgacgc gccgtcgaga tcgtttctca gatgacactg gcggagaagg 240
ttaaccttac aacgggtact gggtgggttg cgactttttt gttgacagtg agctttcttc 300
actgaccatc tacacagatg ggaaatggac cgatgcgtcg gtcaaaccgg cagcgttccc 360
aggtaagctt gcaattctgc aacaacgtgc aagtgtagtt gctaaaacgc ggtggtgcag 420
acttggtatc aactggggtc tttgtggcca ggattcccct ttgggtatcc gtttctgtga 480
gctatacccg cggagtcttt cagtccttgt attatgtgct gatgattgtc tctgtatagc 540
tgacctcaac tccgccttcc ctgctggtac taatgtcgcc gcgacatggg acaagacact 600
cgcctacctt cgtggcaagg ccatgggtga ggaattcaac gacaagggcg tggacatttt 660
gctggggcct gctgctggtc ctctcggcaa atacccggac ggcggcagaa tctgggaagg 720
cttctctcct gatccggttc tcactggtgt acttttcgcc gaaactatca agggtatcca 780
agacgcgggt gtgattgcta ctgccaagca ttacattctg aatgaacagg agcatttccg 840
acaggttggc gaggcccagg gatatggtta caacatcacg gagacgatca gctccaacgt 900
ggatgacaag accatgcacg agttgtacct ttggtgagta gttgacactg caaatgagga 960
ccttgattga tttgactgac ctggaatgca ggccctttgc agatgctgtg cgcggtaaga 1020
ttttccgtag acttgacctc gcgacgaaga aatcgctgac gaaccatcgt agctggcgtt 1080
ggcgctgtca tgtgttccta caatcaaatc aacaacagct acggttgtca aaacagtcaa 1140
actctcaaca agctcctcaa ggctgagctg ggcttccaag gcttcgtcat gagtgactgg 1200
agcgctcacc acagcggtgt cggcgctgcc ctcgctgggt tggatatgtc gatgcctgga 1260
gacatttcct tcgacgacgg actctccttc tggggcacga acctaactgt cagtgttctt 1320
aacggcaccg ttccagcctg gcgtgtcgat gacatggctg ttcgtatcat gaccgcgtac 1380
tacaaggttg gtcgtgaccg tcttcgtatt ccccctaact tcagctcctg gacccgggat 1440
gagtacggct gggagcattc tgctgtctcc gagggagcct ggaccaaggt gaacgacttc 1500
gtcaatgtgc agcgcagtca ctctcagatc atccgtgaga ttggtgccgc tagtacagtg 1560
ctcttgaaga acacgggtgc tcttcctttg accggcaagg aggttaaagt gggtgttctc 1620
ggtgaagacg ctggttccaa cccgtggggt gctaacggct gccccgaccg cggctgtgat 1680
aacggcactc ttgctatggc ctggggtagt ggtactgcca acttccctta ccttgtcacc 1740
cccgagcagg ctatccagcg agaggtcatc agcaacggcg gcaatgtctt tgctgtgact 1800
gataacgggg ctctcagcca gatggcagat gttgcatctc aatccaggtg agtgcgggct 1860
cttagaaaaa gaacgttctc tgaatgaagt tttttaacca ttgcgaacag cgtgtctttg 1920
gtgtttgtca acgccgactc tggagagggt ttcatcagtg tcgacggcaa cgagggtgac 1980
cgcaaaaatc tcactctgtg gaagaacggc gaggccgtca ttgacactgt tgtcagccac 2040
tgcaacaaca cgattgtggt tattcacagt gttgggcccg tcttgatcga ccggtggtat 2100
gataacccca acgtcactgc catcatctgg gccggcttgc ccggtcagga gagtggcaac 2160
tccctggtcg acgtgctcta tggccgcgtc aaccccagcg ccaagacccc gttcacctgg 2220
ggcaagactc gggagtctta cggggctccc ttgctcaccg agcctaacaa tggcaatggt 2280
gctccccagg atgatttcaa cgagggcgtc ttcattgact accgtcactt tgacaagcgc 2340
aatgagaccc ccatttatga gtttggccat ggcttgagct acaccacctt tggttactct 2400
caccttcggg ttcaggccct caatagttcg agttcggcat atgtcccgac tagcggagag 2460
accaagcctg cgccaaccta tggtgagatc ggtagtgccg ccgactacct gtatcccgag 2520
ggtctcaaaa gaattaccaa gtttatttac ccttggctca actcgaccga cctcgaggat 2580
tcttctgacg acccgaacta cggctgggag gactcggagt acattcccga aggcgctagg 2640
gatgggtctc ctcaacccct cctgaaggct ggcggcgctc ctggtggtaa ccctaccctt 2700
tatcaggatc ttgttagggt gtcggccacc ataaccaaca ctggtaacgt cgccggttat 2760
gaagtccctc aattggtgag tgacccgcat gttccttgcg ttgcaatttg gctaactcgc 2820
ttctagtatg tttcactggg cggaccgaac gagcctcggg tcgttctgcg caagttcgac 2880
cgaatcttcc tggctcctgg ggagcaaaag gtttggacca cgactcttaa ccgtcgtgat 2940
ctcgccaatt gggatgtgga ggctcaggac tgggtcatca caaagtaccc caagaaagtg 3000
cacgtcggca gctcctcgcg taagctgcct ctgagagcgc ctctgccccg tgtctactag 3060
<210> 42
<211> 863
<212> PRT
<213> 烟曲霉
<400> 42
Met Arg Phe Gly Trp Leu Glu Val Ala Ala Leu Thr Ala Ala Ser Val
1 5 10 15
Ala Asn Ala Gln Glu Leu Ala Phe Ser Pro Pro Phe Tyr Pro Ser Pro
20 25 30
Trp Ala Asp Gly Gln Gly Glu Trp Ala Asp Ala His Arg Arg Ala Val
35 40 45
Glu Ile Val Ser Gln Met Thr Leu Ala Glu Lys Val Asn Leu Thr Thr
50 55 60
Gly Thr Gly Trp Glu Met Asp Arg Cys Val Gly Gln Thr Gly Ser Val
65 70 75 80
Pro Arg Leu Gly Ile Asn Trp Gly Leu Cys Gly Gln Asp Ser Pro Leu
85 90 95
Gly Ile Arg Phe Ser Asp Leu Asn Ser Ala Phe Pro Ala Gly Thr Asn
100 105 110
Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Lys Ala
115 120 125
Met Gly Glu Glu Phe Asn Asp Lys Gly Val Asp Ile Leu Leu Gly Pro
130 135 140
Ala Ala Gly Pro Leu Gly Lys Tyr Pro Asp Gly Gly Arg Ile Trp Glu
145 150 155 160
Gly Phe Ser Pro Asp Pro Val Leu Thr Gly Val Leu Phe Ala Glu Thr
165 170 175
Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr
180 185 190
Ile Leu Asn Glu Gln Glu His Phe Arg Gln Val Gly Glu Ala Gln Gly
195 200 205
Tyr Gly Tyr Asn Ile Thr Glu Thr Ile Ser Ser Asn Val Asp Asp Lys
210 215 220
Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala
225 230 235 240
Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr
245 250 255
Gly Cys Gln Asn Ser Gln Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu
260 265 270
Gly Phe Gln Gly Phe Val Met Ser Asp Trp Ser Ala His His Ser Gly
275 280 285
Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Ile
290 295 300
Ser Phe Asp Asp Gly Leu Ser Phe Trp Gly Thr Asn Leu Thr Val Ser
305 310 315 320
Val Leu Asn Gly Thr Val Pro Ala Trp Arg Val Asp Asp Met Ala Val
325 330 335
Arg Ile Met Thr Ala Tyr Tyr Lys Val Gly Arg Asp Arg Leu Arg Ile
340 345 350
Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Trp Glu His
355 360 365
Ser Ala Val Ser Glu Gly Ala Trp Thr Lys Val Asn Asp Phe Val Asn
370 375 380
Val Gln Arg Ser His Ser Gln Ile Ile Arg Glu Ile Gly Ala Ala Ser
385 390 395 400
Thr Val Leu Leu Lys Asn Thr Gly Ala Leu Pro Leu Thr Gly Lys Glu
405 410 415
Val Lys Val Gly Val Leu Gly Glu Asp Ala Gly Ser Asn Pro Trp Gly
420 425 430
Ala Asn Gly Cys Pro Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met
435 440 445
Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu
450 455 460
Gln Ala Ile Gln Arg Glu Val Ile Ser Asn Gly Gly Asn Val Phe Ala
465 470 475 480
Val Thr Asp Asn Gly Ala Leu Ser Gln Met Ala Asp Val Ala Ser Gln
485 490 495
Ser Ser Val Ser Leu Val Phe Val Asn Ala Asp Ser Gly Glu Gly Phe
500 505 510
Ile Ser Val Asp Gly Asn Glu Gly Asp Arg Lys Asn Leu Thr Leu Trp
515 520 525
Lys Asn Gly Glu Ala Val Ile Asp Thr Val Val Ser His Cys Asn Asn
530 535 540
Thr Ile Val Val Ile His Ser Val Gly Pro Val Leu Ile Asp Arg Trp
545 550 555 560
Tyr Asp Asn Pro Asn Val Thr Ala Ile Ile Trp Ala Gly Leu Pro Gly
565 570 575
Gln Glu Ser Gly Asn Ser Leu Val Asp Val Leu Tyr Gly Arg Val Asn
580 585 590
Pro Ser Ala Lys Thr Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr
595 600 605
Gly Ala Pro Leu Leu Thr Glu Pro Asn Asn Gly Asn Gly Ala Pro Gln
610 615 620
Asp Asp Phe Asn Glu Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys
625 630 635 640
Arg Asn Glu Thr Pro Ile Tyr Glu Phe Gly His Gly Leu Ser Tyr Thr
645 650 655
Thr Phe Gly Tyr Ser His Leu Arg Val Gln Ala Leu Asn Ser Ser Ser
660 665 670
Ser Ala Tyr Val Pro Thr Ser Gly Glu Thr Lys Pro Ala Pro Thr Tyr
675 680 685
Gly Glu Ile Gly Ser Ala Ala Asp Tyr Leu Tyr Pro Glu Gly Leu Lys
690 695 700
Arg Ile Thr Lys Phe Ile Tyr Pro Trp Leu Asn Ser Thr Asp Leu Glu
705 710 715 720
Asp Ser Ser Asp Asp Pro Asn Tyr Gly Trp Glu Asp Ser Glu Tyr Ile
725 730 735
Pro Glu Gly Ala Arg Asp Gly Ser Pro Gln Pro Leu Leu Lys Ala Gly
740 745 750
Gly Ala Pro Gly Gly Asn Pro Thr Leu Tyr Gln Asp Leu Val Arg Val
755 760 765
Ser Ala Thr Ile Thr Asn Thr Gly Asn Val Ala Gly Tyr Glu Val Pro
770 775 780
Gln Leu Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Arg Val Val Leu
785 790 795 800
Arg Lys Phe Asp Arg Ile Phe Leu Ala Pro Gly Glu Gln Lys Val Trp
805 810 815
Thr Thr Thr Leu Asn Arg Arg Asp Leu Ala Asn Trp Asp Val Glu Ala
820 825 830
Gln Asp Trp Val Ile Thr Lys Tyr Pro Lys Lys Val His Val Gly Ser
835 840 845
Ser Ser Arg Lys Leu Pro Leu Arg Ala Pro Leu Pro Arg Val Tyr
850 855 860
<210> 43
<211> 835
<212> DNA
<213> 青霉(Penicillium sp.)
<400> 43
atgctgtctt cgacgactcg caccctcgcc tttacaggcc ttgcgggcct tctgtccgct 60
cccctggtca aggcccatgg ctttgtccag ggcattgtca tcggtgacca attgtaagtc 120
cctctcttgc agttctgtcg attaactgct ggactgcttg cttgactccc tgctgactcc 180
caacagctac agcgggtaca tcgtcaactc gttcccctac gaatccaacc caccccccgt 240
catcggctgg gccacgaccg ccaccgacct gggcttcgtc gacggcacag gataccaagg 300
cccggacatc atctgccacc ggaatgcgac gcccgcgccg ctgacagccc ccgtggccgc 360
cggcggcacc gtcgagctgc agtggacgcc gtggccggac agccaccacg gacccgtcat 420
cacctacctg gcgccgtgca acggcaactg ctcgaccgtc gacaagacga cgctggagtt 480
cttcaagatc gaccagcagg gcctgatcga cgacacgagc ccgccgggca cctgggcgtc 540
ggacaacctc atcgccaaca acaatagctg gaccgtcacc attcccaaca gcgtcgcccc 600
cggcaactac gtcctgcgcc acgagatcat cgccctgcac tcggccaaca acaaggacgg 660
cgcccagaac tacccccagt gcatcaacat cgaggtcacg ggcggcggct ccgacgcgcc 720
tgagggtact ctgggcgagg atctctacca tgacaccgac ccgggcattc tggtcgacat 780
ttacgagccc attgcgacgt ataccattcc ggggccgcct gagccgacgt tctag 835
<210> 44
<211> 253
<212> PRT
<213> 青霉
<400> 44
Met Leu Ser Ser Thr Thr Arg Thr Leu Ala Phe Thr Gly Leu Ala Gly
1 5 10 15
Leu Leu Ser Ala Pro Leu Val Lys Ala His Gly Phe Val Gln Gly Ile
20 25 30
Val Ile Gly Asp Gln Phe Tyr Ser Gly Tyr Ile Val Asn Ser Phe Pro
35 40 45
Tyr Glu Ser Asn Pro Pro Pro Val Ile Gly Trp Ala Thr Thr Ala Thr
50 55 60
Asp Leu Gly Phe Val Asp Gly Thr Gly Tyr Gln Gly Pro Asp Ile Ile
65 70 75 80
Cys His Arg Asn Ala Thr Pro Ala Pro Leu Thr Ala Pro Val Ala Ala
85 90 95
Gly Gly Thr Val Glu Leu Gln Trp Thr Pro Trp Pro Asp Ser His His
100 105 110
Gly Pro Val Ile Thr Tyr Leu Ala Pro Cys Asn Gly Asn Cys Ser Thr
115 120 125
Val Asp Lys Thr Thr Leu Glu Phe Phe Lys Ile Asp Gln Gln Gly Leu
130 135 140
Ile Asp Asp Thr Ser Pro Pro Gly Thr Trp Ala Ser Asp Asn Leu Ile
145 150 155 160
Ala Asn Asn Asn Ser Trp Thr Val Thr Ile Pro Asn Ser Val Ala Pro
165 170 175
Gly Asn Tyr Val Leu Arg His Glu Ile Ile Ala Leu His Ser Ala Asn
180 185 190
Asn Lys Asp Gly Ala Gln Asn Tyr Pro Gln Cys Ile Asn Ile Glu Val
195 200 205
Thr Gly Gly Gly Ser Asp Ala Pro Glu Gly Thr Leu Gly Glu Asp Leu
210 215 220
Tyr His Asp Thr Asp Pro Gly Ile Leu Val Asp Ile Tyr Glu Pro Ile
225 230 235 240
Ala Thr Tyr Thr Ile Pro Gly Pro Pro Glu Pro Thr Phe
245 250
<210> 45
<211> 36
<212> DNA
<213> 青霉
<400> 45
cggactgcgc accatgctgt cttcgacgac tcgcac 36
<210> 46
<211> 35
<212> DNA
<213> 青霉
<400> 46
tcgccacgga gcttatcgac ttcttctaga acgtc 35
<210> 47
<211> 37
<212> DNA
<213> 烟曲霉
<400> 47
cgcggtagtg gcgcggtcga ccgaatgtag gattgtt 37
<210> 48
<211> 36
<212> DNA
<213> 烟曲霉
<400> 48
ttaccaattg gcgcgccact accgcgttcg agaaga 36
<210> 49
<211> 1713
<212> DNA
<213> 烟曲霉
<400> 49
atgaagcacc ttgcatcttc catcgcattg actctactgt tgcctgccgt gcaggcccag 60
cagaccgtat ggggccaatg tatgttctgg ctgtcactgg aataagactg tatcaactgc 120
tgatatgctt ctaggtggcg gccaaggctg gtctggcccg acgagctgtg ttgccggcgc 180
agcctgtagc acactgaatc cctgtatgtt agatatcgtc ctgagtggag acttatactg 240
acttccttag actacgctca gtgtatcccg ggagccaccg cgacgtccac caccctcacg 300
acgacgacgg cggcgacgac gacatcccag accaccacca aacctaccac gactggtcca 360
actacatccg cacccaccgt gaccgcatcc ggtaaccctt tcagcggcta ccagctgtat 420
gccaacccct actactcctc cgaggtccat actctggcca tgccttctct gcccagctcg 480
ctgcagccca aggctagtgc tgttgctgaa gtgccctcat ttgtttggct gtaagtggcc 540
ttatcccaat actgagacca actctctgac agtcgtagcg acgttgccgc caaggtgccc 600
actatgggaa cctacctggc cgacattcag gccaagaaca aggccggcgc caaccctcct 660
atcgctggta tcttcgtggt ctacgacttg ccggaccgtg actgcgccgc tctggccagt 720
aatggcgagt actcaattgc caacaacggt gtggccaact acaaggcgta cattgacgcc 780
atccgtgctc agctggtgaa gtactctgac gttcacacca tcctcgtcat cggtaggccg 840
tacacctccg ttgcgcgccg cctttctctg acatcttgca gaacccgaca gcttggccaa 900
cctggtgacc aacctcaacg tcgccaaatg cgccaatgcg cagagcgcct acctggagtg 960
tgtcgactat gctctgaagc agctcaacct gcccaacgtc gccatgtacc tcgacgcagg 1020
tatgcctcac ttcccgcatt ctgtatccct tccagacact aactcatcag gccatgcggg 1080
ctggctcgga tggcccgcca acttgggccc cgccgcaaca ctcttcgcca aagtctacac 1140
cgacgcgggt tcccccgcgg ctgttcgtgg cctggccacc aacgtcgcca actacaacgc 1200
ctggtcgctc agtacctgcc cctcctacac ccagggagac cccaactgcg acgagaagaa 1260
gtacatcaac gccatggcgc ctcttctcaa ggaagccggc ttcgatgccc acttcatcat 1320
ggatacctgt aagtgcttat tccaatcgcc gatgtgtgcc gactaatcaa tgtttcagcc 1380
cggaatggcg tccagcccac gaagcaaaac gcctggggtg actggtgcaa cgtcatcggc 1440
accggcttcg gtgttcgccc ctcgactaac accggcgatc cgctccagga tgcctttgtg 1500
tggatcaagc ccggtggaga gagtgatggc acgtccaact cgacttcccc ccggtatgac 1560
gcgcactgcg gatatagtga tgctctgcag cctgctcctg aggctggtac ttggttccag 1620
gtatgtcatc cattagccag atgagggata agtgactgac ggacctaggc ctactttgag 1680
cagcttctga ccaacgctaa cccgtccttt taa 1713
<210> 50
<211> 454
<212> PRT
<213> 烟曲霉
<400> 50
Met Lys His Leu Ala Ser Ser Ile Ala Leu Thr Leu Leu Leu Pro Ala
1 5 10 15
Val Gln Ala Gln Gln Thr Val Trp Gly Gln Cys Gly Gly Gln Gly Trp
20 25 30
Ser Gly Pro Thr Ser Cys Val Ala Gly Ala Ala Cys Ser Thr Leu Asn
35 40 45
Pro Tyr Tyr Ala Gln Cys Ile Pro Gly Ala Thr Ala Thr Ser Thr Thr
50 55 60
Leu Thr Thr Thr Thr Ala Ala Thr Thr Thr Ser Gln Thr Thr Thr Lys
65 70 75 80
Pro Thr Thr Thr Gly Pro Thr Thr Ser Ala Pro Thr Val Thr Ala Ser
85 90 95
Gly Asn Pro Phe Ser Gly Tyr Gln Leu Tyr Ala Asn Pro Tyr Tyr Ser
100 105 110
Ser Glu Val His Thr Leu Ala Met Pro Ser Leu Pro Ser Ser Leu Gln
115 120 125
Pro Lys Ala Ser Ala Val Ala Glu Val Pro Ser Phe Val Trp Leu Asp
130 135 140
Val Ala Ala Lys Val Pro Thr Met Gly Thr Tyr Leu Ala Asp Ile Gln
145 150 155 160
Ala Lys Asn Lys Ala Gly Ala Asn Pro Pro Ile Ala Gly Ile Phe Val
165 170 175
Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly
180 185 190
Glu Tyr Ser Ile Ala Asn Asn Gly Val Ala Asn Tyr Lys Ala Tyr Ile
195 200 205
Asp Ala Ile Arg Ala Gln Leu Val Lys Tyr Ser Asp Val His Thr Ile
210 215 220
Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr Asn Leu Asn
225 230 235 240
Val Ala Lys Cys Ala Asn Ala Gln Ser Ala Tyr Leu Glu Cys Val Asp
245 250 255
Tyr Ala Leu Lys Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp
260 265 270
Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Leu Gly Pro Ala
275 280 285
Ala Thr Leu Phe Ala Lys Val Tyr Thr Asp Ala Gly Ser Pro Ala Ala
290 295 300
Val Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser Leu
305 310 315 320
Ser Thr Cys Pro Ser Tyr Thr Gln Gly Asp Pro Asn Cys Asp Glu Lys
325 330 335
Lys Tyr Ile Asn Ala Met Ala Pro Leu Leu Lys Glu Ala Gly Phe Asp
340 345 350
Ala His Phe Ile Met Asp Thr Ser Arg Asn Gly Val Gln Pro Thr Lys
355 360 365
Gln Asn Ala Trp Gly Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly
370 375 380
Val Arg Pro Ser Thr Asn Thr Gly Asp Pro Leu Gln Asp Ala Phe Val
385 390 395 400
Trp Ile Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asn Ser Thr Ser
405 410 415
Pro Arg Tyr Asp Ala His Cys Gly Tyr Ser Asp Ala Leu Gln Pro Ala
420 425 430
Pro Glu Ala Gly Thr Trp Phe Gln Ala Tyr Phe Glu Gln Leu Leu Thr
435 440 445
Asn Ala Asn Pro Ser Phe
450
<210> 51
<211> 54
<212> DNA
<213> 里氏木霉
<400> 51
acgaattgtt taaacgtcga cccaagtatc cagaggtgta tggaaatatc agat 54
<210> 52
<211> 44
<212> DNA
<213> 里氏木霉
<400> 52
cgcgtagatc tgcggccatg gtgcaataca cagagggtga tctt 44
<210> 53
<211> 48
<212> DNA
<213> 里氏木霉
<400> 53
atctacgcgt actagttaat taaggctttc gtgaccgggc ttcaaaca 48
<210> 54
<211> 46
<212> DNA
<213> 里氏木霉
<400> 54
gcggccgtta ctagtggatc cactcggagt tgttatacgc tactcg 46
<210> 55
<211> 46
<212> DNA
<213> 里氏木霉
<400> 55
atccatcaca ctggcggccg cgcttcaaac aatgatgtgc gatggt 46
<210> 56
<211> 46
<212> DNA
<213> 里氏木霉
<400> 56
gatgcatgct cgagcggccg cctaccttgg cagccctacg agagag 46
<210> 57
<211> 41
<212> DNA
<213> 烟曲霉
<400> 57
ctctgtgtat tgcaccatga agcaccttgc atcttccatc g 41
<210> 58
<211> 40
<212> DNA
<213> 烟曲霉
<400> 58
ccggtcacga aagccttaat taaaaggacg ggttagcgtt 40
<210> 59
<211> 1599
<212> DNA
<213> 烟曲霉
<400> 59
atgctggcct ccaccttctc ctaccgcatg tacaagaccg cgctcatcct ggccgccctt 60
ctgggctctg gccaggctca gcaggtcggt acttcccagg cggaagtgca tccgtccatg 120
acctggcaga gctgcacggc tggcggcagc tgcaccacca acaacggcaa ggtggtcatc 180
gacgcgaact ggcgttgggt gcacaaagtc ggcgactaca ccaactgcta caccggcaac 240
acctgggaca cgactatctg ccctgacgat gcgacctgcg catccaactg cgcccttgag 300
ggtgccaact acgaatccac ctatggtgtg accgccagcg gcaattccct ccgcctcaac 360
ttcgtcacca ccagccagca gaagaacatt ggctcgcgtc tgtacatgat gaaggacgac 420
tcgacctacg agatgtttaa gctgctgaac caggagttca ccttcgatgt cgatgtctcc 480
aacctcccct gcggtctcaa cggtgctctg tactttgtcg ccatggacgc cgacggtggc 540
atgtccaagt acccaaccaa caaggccggt gccaagtacg gtactggata ctgtgactcg 600
cagtgccctc gcgacctcaa gttcatcaac ggtcaggcca acgtcgaagg gtggcagccc 660
tcctccaacg atgccaatgc gggtaccggc aaccacgggt cctgctgcgc ggagatggat 720
atctgggagg ccaacagcat ctccacggcc ttcacccccc atccgtgcga cacgcccggc 780
caggtgatgt gcaccggtga tgcctgcggt ggcacctaca gctccgaccg ctacggcggc 840
acctgcgacc ccgacggatg tgatttcaac tccttccgcc agggcaacaa gaccttctac 900
ggccctggca tgaccgtcga caccaagagc aagtttaccg tcgtcaccca gttcatcacc 960
gacgacggca cctccagcgg caccctcaag gagatcaagc gcttctacgt gcagaacggc 1020
aaggtgatcc ccaactcgga gtcgacctgg accggcgtca gcggcaactc catcaccacc 1080
gagtactgca ccgcccagaa gagcctgttc caggaccaga acgtcttcga aaagcacggc 1140
ggcctcgagg gcatgggtgc tgccctcgcc cagggtatgg ttctcgtcat gtccctgtgg 1200
gatgatcact cggccaacat gctctggctc gacagcaact acccgaccac tgcctcttcc 1260
accactcccg gcgtcgcccg tggtacctgc gacatctcct ccggcgtccc tgcggatgtc 1320
gaggcgaacc accccgacgc ctacgtcgtc tactccaaca tcaaggtcgg ccccatcggc 1380
tcgaccttca acagcggtgg ctcgaacccc ggtggcggaa ccaccacgac aactaccacc 1440
cagcctacta ccaccacgac cacggctgga aaccctggcg gcaccggagt cgcacagcac 1500
tatggccagt gtggtggaat cggatggacc ggacccacaa cctgtgccag cccttatacc 1560
tgccagaagc tgaatgatta ttactctcag tgcctgtag 1599
<210> 60
<211> 532
<212> PRT
<213> 烟曲霉
<400> 60
Met Leu Ala Ser Thr Phe Ser Tyr Arg Met Tyr Lys Thr Ala Leu Ile
1 5 10 15
Leu Ala Ala Leu Leu Gly Ser Gly Gln Ala Gln Gln Val Gly Thr Ser
20 25 30
Gln Ala Glu Val His Pro Ser Met Thr Trp Gln Ser Cys Thr Ala Gly
35 40 45
Gly Ser Cys Thr Thr Asn Asn Gly Lys Val Val Ile Asp Ala Asn Trp
50 55 60
Arg Trp Val His Lys Val Gly Asp Tyr Thr Asn Cys Tyr Thr Gly Asn
65 70 75 80
Thr Trp Asp Thr Thr Ile Cys Pro Asp Asp Ala Thr Cys Ala Ser Asn
85 90 95
Cys Ala Leu Glu Gly Ala Asn Tyr Glu Ser Thr Tyr Gly Val Thr Ala
100 105 110
Ser Gly Asn Ser Leu Arg Leu Asn Phe Val Thr Thr Ser Gln Gln Lys
115 120 125
Asn Ile Gly Ser Arg Leu Tyr Met Met Lys Asp Asp Ser Thr Tyr Glu
130 135 140
Met Phe Lys Leu Leu Asn Gln Glu Phe Thr Phe Asp Val Asp Val Ser
145 150 155 160
Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr Phe Val Ala Met Asp
165 170 175
Ala Asp Gly Gly Met Ser Lys Tyr Pro Thr Asn Lys Ala Gly Ala Lys
180 185 190
Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro Arg Asp Leu Lys Phe
195 200 205
Ile Asn Gly Gln Ala Asn Val Glu Gly Trp Gln Pro Ser Ser Asn Asp
210 215 220
Ala Asn Ala Gly Thr Gly Asn His Gly Ser Cys Cys Ala Glu Met Asp
225 230 235 240
Ile Trp Glu Ala Asn Ser Ile Ser Thr Ala Phe Thr Pro His Pro Cys
245 250 255
Asp Thr Pro Gly Gln Val Met Cys Thr Gly Asp Ala Cys Gly Gly Thr
260 265 270
Tyr Ser Ser Asp Arg Tyr Gly Gly Thr Cys Asp Pro Asp Gly Cys Asp
275 280 285
Phe Asn Ser Phe Arg Gln Gly Asn Lys Thr Phe Tyr Gly Pro Gly Met
290 295 300
Thr Val Asp Thr Lys Ser Lys Phe Thr Val Val Thr Gln Phe Ile Thr
305 310 315 320
Asp Asp Gly Thr Ser Ser Gly Thr Leu Lys Glu Ile Lys Arg Phe Tyr
325 330 335
Val Gln Asn Gly Lys Val Ile Pro Asn Ser Glu Ser Thr Trp Thr Gly
340 345 350
Val Ser Gly Asn Ser Ile Thr Thr Glu Tyr Cys Thr Ala Gln Lys Ser
355 360 365
Leu Phe Gln Asp Gln Asn Val Phe Glu Lys His Gly Gly Leu Glu Gly
370 375 380
Met Gly Ala Ala Leu Ala Gln Gly Met Val Leu Val Met Ser Leu Trp
385 390 395 400
Asp Asp His Ser Ala Asn Met Leu Trp Leu Asp Ser Asn Tyr Pro Thr
405 410 415
Thr Ala Ser Ser Thr Thr Pro Gly Val Ala Arg Gly Thr Cys Asp Ile
420 425 430
Ser Ser Gly Val Pro Ala Asp Val Glu Ala Asn His Pro Asp Ala Tyr
435 440 445
Val Val Tyr Ser Asn Ile Lys Val Gly Pro Ile Gly Ser Thr Phe Asn
450 455 460
Ser Gly Gly Ser Asn Pro Gly Gly Gly Thr Thr Thr Thr Thr Thr Thr
465 470 475 480
Gln Pro Thr Thr Thr Thr Thr Thr Ala Gly Asn Pro Gly Gly Thr Gly
485 490 495
Val Ala Gln His Tyr Gly Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro
500 505 510
Thr Thr Cys Ala Ser Pro Tyr Thr Cys Gln Lys Leu Asn Asp Tyr Tyr
515 520 525
Ser Gln Cys Leu
530
<210> 61
<211> 40
<212> DNA
<213> 烟曲霉
<400> 61
cgcggactgc gcaccatgct ggcctccacc ttctcctacc 40
<210> 62
<211> 48
<212> DNA
<213> 烟曲霉
<400> 62
ctttcgccac ggagcttaat taactacagg cactgagagt aataatca 48
<210> 63
<211> 1131
<212> DNA
<213> 单纯疱疹病毒
<400> 63
atggcttcgt accccggcca tcaacacgcg tctgcgttcg accaggctgc gcgttctcgc 60
ggccatagca accgacgtac ggcgttgcgc cctcgccggc agcaagaagc cacggaagtc 120
cgcccggagc agaaaatgcc cacgctactg cgggtttata tagacggtcc ccacgggatg 180
gggaaaacca ccaccacgca actgctggtg gccctgggtt cgcgcgacga tatcgtctac 240
gtacccgagc cgatgactta ctggcgggtg ctgggggctt ccgagacaat cgcgaacatc 300
tacaccacac aacaccgcct cgaccagggt gagatatcgg ccggggacgc ggcggtggta 360
atgacaagcg cccagataac aatgggcatg ccttatgccg tgaccgacgc cgttctggct 420
cctcatatcg ggggggaggc tgggagctca catgccccgc ccccggccct caccctcatc 480
ttcgaccgcc atcccatcgc cgccctcctg tgctacccgg ccgcgcggta ccttatgggc 540
agcatgaccc cccaggccgt gctggcgttc gtggccctca tcccgccgac cttgcccggc 600
accaacatcg tgcttggggc ccttccggag gacagacaca tcgaccgcct ggccaaacgc 660
cagcgccccg gcgagcggct ggacctggct atgctggctg cgattcgccg cgtttacggg 720
ctacttgcca atacggtgcg gtatctgcag tgcggcgggt cgtggcggga ggactgggga 780
cagctttcgg ggacggccgt gccgccccag ggtgccgagc cccagagcaa cgcgggccca 840
cgaccccata tcggggacac gttatttacc ctgtttcggg gccccgagtt gctggccccc 900
aacggcgacc tgtataacgt gtttgcctgg gccttggacg tcttggccaa acgcctccgt 960
tccatgcacg tctttatcct ggattacgac caatcgcccg ccggctgccg ggacgccctg 1020
ctgcaactta cctccgggat ggtccagacc cacgtcacca cccccggctc cataccgacg 1080
atatgcgacc tggcgcgcac gtttgcccgg gagatggggg aggctaactg a 1131
<210> 64
<211> 376
<212> PRT
<213> 单纯疱疹病毒
<400> 64
Met Ala Ser Tyr Pro Gly His Gln His Ala Ser Ala Phe Asp Gln Ala
1 5 10 15
Ala Arg Ser Arg Gly His Ser Asn Arg Arg Thr Ala Leu Arg Pro Arg
20 25 30
Arg Gln Gln Glu Ala Thr Glu Val Arg Pro Glu Gln Lys Met Pro Thr
35 40 45
Leu Leu Arg Val Tyr Ile Asp Gly Pro His Gly Met Gly Lys Thr Thr
50 55 60
Thr Thr Gln Leu Leu Val Ala Leu Gly Ser Arg Asp Asp Ile Val Tyr
65 70 75 80
Val Pro Glu Pro Met Thr Tyr Trp Arg Val Leu Gly Ala Ser Glu Thr
85 90 95
Ile Ala Asn Ile Tyr Thr Thr Gln His Arg Leu Asp Gln Gly Glu Ile
100 105 110
Ser Ala Gly Asp Ala Ala Val Val Met Thr Ser Ala Gln Ile Thr Met
115 120 125
Gly Met Pro Tyr Ala Val Thr Asp Ala Val Leu Ala Pro His Ile Gly
130 135 140
Gly Glu Ala Gly Ser Ser His Ala Pro Pro Pro Ala Leu Thr Leu Ile
145 150 155 160
Phe Asp Arg His Pro Ile Ala Ala Leu Leu Cys Tyr Pro Ala Ala Arg
165 170 175
Tyr Leu Met Gly Ser Met Thr Pro Gln Ala Val Leu Ala Phe Val Ala
180 185 190
Leu Ile Pro Pro Thr Leu Pro Gly Thr Asn Ile Val Leu Gly Ala Leu
195 200 205
Pro Glu Asp Arg His Ile Asp Arg Leu Ala Lys Arg Gln Arg Pro Gly
210 215 220
Glu Arg Leu Asp Leu Ala Met Leu Ala Ala Ile Arg Arg Val Tyr Gly
225 230 235 240
Leu Leu Ala Asn Thr Val Arg Tyr Leu Gln Cys Gly Gly Ser Trp Arg
245 250 255
Glu Asp Trp Gly Gln Leu Ser Gly Thr Ala Val Pro Pro Gln Gly Ala
260 265 270
Glu Pro Gln Ser Asn Ala Gly Pro Arg Pro His Ile Gly Asp Thr Leu
275 280 285
Phe Thr Leu Phe Arg Gly Pro Glu Leu Leu Ala Pro Asn Gly Asp Leu
290 295 300
Tyr Asn Val Phe Ala Trp Ala Leu Asp Val Leu Ala Lys Arg Leu Arg
305 310 315 320
Ser Met His Val Phe Ile Leu Asp Tyr Asp Gln Ser Pro Ala Gly Cys
325 330 335
Arg Asp Ala Leu Leu Gln Leu Thr Ser Gly Met Val Gln Thr His Val
340 345 350
Thr Thr Pro Gly Ser Ile Pro Thr Ile Cys Asp Leu Ala Arg Thr Phe
355 360 365
Ala Arg Glu Met Gly Glu Ala Asn
370 375
<210> 65
<211> 43
<212> DNA
<213> 里氏木霉
<400> 65
ttagactgcg gccgcgtggc gaaagcctga cgcaccggta gat 43
<210> 66
<211> 41
<212> DNA
<213> 里氏木霉
<400> 66
agtagttagc ggccgcacgg cacggttaag cagggtcttg c 41
<210> 67
<211> 50
<212> DNA
<213> 烟曲霉
<400> 67
tcaagcttgg taccgagctc ggatccaagt atccagaggt gtatggaaat 50
<210> 68
<211> 46
<212> DNA
<213> 烟曲霉
<400> 68
ctggcggccg ttactagtgc tagcactcgg agttgttata cgctac 46
<210> 69
<211> 55
<212> DNA
<213> 里氏木霉
<400> 69
gagtagcgta taacaactcc gagtgctagc tttaagataa cggaatagaa gaaag 55
<210> 70
<211> 42
<212> DNA
<213> 里氏木霉
<400> 70
ctggcggccg ttactagtct agacgcgcca ctaccgcgtt cg 42
<210> 71
<211> 55
<212> DNA
<213> 里氏木霉
<400> 71
tctgcagata tccatcacac tggcggccgc tttaagataa cggaatagaa gaaag 55
<210> 72
<211> 50
<212> DNA
<213> 里氏木霉
<400> 72
aaactctagg atgcatgctc gagcggccgc acggcacggt taagcagggt 50
<210> 73
<211> 30
<212> DNA
<213> 里氏木霉
<400> 73
caagcaaagc gttccgtcgc agtagcaggc 30
<210> 74
<211> 20
<212> DNA
<213> 里氏木霉
<400> 74
cagtggcgct tattactcag 20
<210> 75
<211> 22
<212> DNA
<213> 里氏木霉
<400> 75
gagaacacag tgagaccata gc 22
<210> 76
<211> 22
<212> DNA
<213> 里氏木霉
<400> 76
tctcaaccca atcagcaaca tg 22
<210> 77
<211> 15014
<212> DNA
<213> 里氏木霉
<400> 77
tcgacgaatt ctaggctagg tatgcgaggc acgcggatct agggcagact gggcattgca 60
agctgcttaa gatccgatcc atacgctccg tgcgcctaga tcccgtctga cccgtaacgt 120
tagctatggt gtagtagaac tcccgtcaac ggctattctc acctagactt tccccttcga 180
atcgatacca catcatcttg agggcagttg ccgataagag tggatctgaa aggggaagct 240
actgacaagt tgttatattg cctgtgtacc aagcgctaat gtggacagga ttaatgccag 300
tgactgttca acaatataac ggacacatgg ttcgcgatta cacctgtcct aattacggtc 360
agttcattag cctcaagtag agcctatttc ctcgccggaa agtcatctct cttattgcat 420
tcaagtaatc ggagttcatc tcggataaag gagcggcctt tcagtagaga gaataacgta 480
ttctgccctt cccactaact cagggtgcag cgcaacacta cacgcaacat atacacttta 540
aagacgggaa gggtgattga gtcccacgtc gcgttgtgat gtgcgttgta tatgtgaaat 600
ttagccgtgc aacaaggcta ttctacgaaa aatgctacac tccacatgtt aaaggcgcat 660
aatcggcacg ttgttccgat aagatgcttt ttacgatgtg aggtgtacaa tttccgcgta 720
tcaaccagct tctttattgg gtaatataca gccaggcggg gatgaagctc attagccgcc 780
agttggtcga agaaataacc cattatatgt cggtccgccc ctacttcgag taatcggcgg 840
actcaaggct atacaatgtt gccaactctc cgggctttat cctgtgctcc cgaataccac 900
tgagttccga tatgttacaa cggttgagag gcccgaaata ggacacgagg gcttatggtg 960
atcgtgatga tgcttcagcg cacggaagtc acagacaccg cctgtataaa agggggactg 1020
tagcactact acgaagtcgc gtgccttcag tgtctgtggc ggacatattt tccccctgac 1080
tgaccctgta tgaggcgcaa catggtctca cagcagctca cctgaagagg cttgtaagat 1140
actgggacat actccgcgtt gtaccagagt gtcgtcgagt ggacttctcc gaacattcta 1200
caccctctgt gtattgcacc atggcgttcc tcccccctcc tccgctccgc cgttgtggcc 1260
gtgggagaca cataacgtgg taccgcaagg aggggggagg aggcgaggcg gcaacaccgg 1320
gccctgccgg tgttggccct tgccgctgat ggcaggtcca cccgctactg ggactgctgc 1380
cgggacggcc acaaccggga acggcgacta ccgtccaggt gggcgatgac cctgacgacg 1440
aagccttcgt gcggctgggc caagaaggct cccgtgaacc agcctgtctt ttcctgcaac 1500
ttcggaagca cgccgacccg gttcttccga gggcacttgg tcggacagaa aaggacgttg 1560
gccaacttcc agcgtatcac ggacttcgac gccaagtccg gctgcgagcc gggcggtgtc 1620
cggttgaagg tcgcatagtg cctgaagctg cggttcaggc cgacgctcgg cccgccacag 1680
gcctactcgt gcgccgacca gaccccatgg gctgtgaacg acgacttcgc gctcggtttt 1740
cggatgagca cgcggctggt ctggggtacc cgacacttgc tgctgaagcg cgagccaaaa 1800
gctgccacct ctattgccgg cagcaatgag gcgggctggt gctgcgcctg ctacgagctc 1860
cgacggtgga gataacggcc gtcgttactc cgcccgacca cgacgcggac gatgctcgag 1920
accttcacat ccggtcctgt tgctggcaag aagatggtcg tccagtccac cagcactggc 1980
tggaagtgta ggccaggaca acgaccgttc ttctaccagc aggtcaggtg gtcgtgaccg 2040
ggtgatcttg gcagcaacca cttcgatctc aacatccccg gcggcggcgt cggcatcttc 2100
ccactagaac cgtcgttggt gaagctagag ttgtaggggc cgccgccgca gccgtagaag 2160
gacggatgca ctccccagtt cggcggtctg cccggccagc gctacggcgg catctcgtcc 2220
ctgcctacgt gaggggtcaa gccgccagac gggccggtcg cgatgccgcc gtagagcagg 2280
cgcaacgagt gcgatcggtt ccccgacgcc ctcaagcccg gctgctactg gcgcttcgac 2340
gcgttgctca cgctagccaa ggggctgcgg gagttcgggc cgacgatgac cgcgaagctg 2400
tggttcaaga acgccgacaa tccgagcttc agcttccgtc aggtccagtg cccagccgag 2460
accaagttct tgcggctgtt aggctcgaag tcgaaggcag tccaggtcac gggtcggctc 2520
ctcgtcgctc gcaccggatg ccgccgcaac gacgacggca acttccctgc cgtccagatc 2580
gagcagcgag cgtggcctac ggcggcgttg ctgctgccgt tgaagggacg gcaggtctag 2640
ccctccagca gcaccagctc tccggtcaac cagcctacca gcaccagcac cacgtccacc 2700
gggaggtcgt cgtggtcgag aggccagttg gtcggatggt cgtggtcgtg gtgcaggtgg 2760
tccaccacct cgagcccgcc agtccagcct acgactccca gcggctgcac tgctgagagg 2820
aggtggtgga gctcgggcgg tcaggtcgga tgctgagggt cgccgacgtg acgactctcc 2880
tgggctcagt gcggcggcaa tggctggagc ggctgcacca cctgcgtcgc tggcagcact 2940
acccgagtca cgccgccgtt accgacctcg ccgacgtggt ggacgcagcg accgtcgtga 3000
tgcacgaaga ttaatgactg gtaccatcag tgcctgtaga attcgcggcc gcagatctac 3060
acgtgcttct aattactgac catggtagtc acggacatct taagcgccgg cgtctagatg 3120
gcgtactagt agctccgtgg cgaaagcctg acgcaccggt agattcttgg tgagcccgta 3180
cgcatgatca tcgaggcacc gctttcggac tgcgtggcca tctaagaacc actcgggcat 3240
tcatgacggc ggcgggagct acatggcccc gggtgattta ttttttttgt atctacttct 3300
agtactgccg ccgccctcga tgtaccgggg cccactaaat aaaaaaaaca tagatgaaga 3360
gacccttttc aaatatacgg tcaactcatc tttcactgga gatgcggcct gcttggtatt 3420
ctgggaaaag tttatatgcc agttgagtag aaagtgacct ctacgccgga cgaaccataa 3480
gcgatgttgt cagcttggca aattgtggct ttcgaaaaca caaaacgatt ccttaattaa 3540
cgctacaaca gtcgaaccgt ttaacaccga aagcttttgt gttttgctaa ggaattaatt 3600
ctagaggtga ctgacacctg gcggtagaca atcaatccat ttcgctatag ttaaaggatg 3660
gatctccact gactgtggac cgccatctgt tagttaggta aagcgatatc aatttcctac 3720
gggatgaggg caattggtta tatgatcatg tatgtagtgg gtgtgcataa tagtagtgaa 3780
ccctactccc gttaaccaat atactagtac atacatcacc cacacgtatt atcatcactt 3840
atggaagcca agtcatgtga ttgtaatcga ccgacggaat tgaggatatc cggaaataca 3900
taccttcggt tcagtacact aacattagct ggctgcctta actcctatag gcctttatgt 3960
gacaccgtga aagccatgct ctttccttcg tgtagaagac cagacagaca gtccctgatt 4020
ctgtggcact ttcggtacga gaaaggaagc acatcttctg gtctgtctgt cagggactaa 4080
tacccttgca caaagcacta gaaaattagc attccatcct tctctgcttg ctctgctgat 4140
atgggaacgt gtttcgtgat cttttaatcg taaggtagga agagacgaac gagacgacta 4200
atcactgtca ttcaatgcat ctggaaacgc aaccctgaag ggattcttcc tttgagagat 4260
tagtgacagt aagttacgta gacctttgcg ttgggacttc cctaagaagg aaactctcta 4320
ggaagcgtgt catatctctt cggttctacg gcaggttttt ttctgctctt tcgtagcatg 4380
ccttcgcaca gtatagagaa gccaagatgc cgtccaaaaa aagacgagaa agcatcgtac 4440
gcatggtcac ttcagcgctt atttacagtt gctggtattg atttcttgtg caaattgcta 4500
cgtaccagtg aagtcgcgaa taaatgtcaa cgaccataac taaagaacac gtttaacgat 4560
tctgacactt attagctatg gagtcaccac atttcccagc aacttcccca cttcctctgc 4620
agactgtgaa taatcgatac ctcagtggtg taaagggtcg ttgaaggggt gaaggagacg 4680
aatcgccaac gtcctctctt cactgagtct ccgtccgata acctgcactg caaccggtgc 4740
ttagcggttg caggagagaa gtgactcaga ggcaggctat tggacgtgac gttggccacg 4800
cccatgatac gcctccggat catactcttc ctgcacgagg gcatcaagct cactaaccgc 4860
gggtactatg cggaggccta gtatgagaag gacgtgctcc cgtagttcga gtgattggcg 4920
cttgaaactc tcattcttct tatcgatgtt cttatccgca aaggtaaccg gaacaaccac 4980
gaactttgag agtaagaaga atagctacaa gaataggcgt ttccattggc cttgttggtg 5040
gctcgtgaaa tccagcaggt tgatcacaga ggcataccca tagtaccgga actggtcatg 5100
cgagcacttt aggtcgtcca actagtgtct ccgtatgggt atcatggcct tgaccagtac 5160
ccgtaccgca gcggtaggcg taatcggcgc gatgatggcg tccagttcct tcccggcctt 5220
ggcatggcgt cgccatccgc attagccgcg ctactaccgc aggtcaagga agggccggaa 5280
ttcttcagcc tcccgccatt tctcaaggta ctccatctgg taattccact tctggagatg 5340
aagaagtcgg agggcggtaa agagttccat gaggtagacc attaaggtga agacctctac 5400
cgtgtcccag agctcgttca tgttaacagc tttgatgttc gggttcagta ggtctttgat 5460
gcacagggtc tcgagcaagt acaattgtcg aaactacaag cccaagtcat ccagaaacta 5520
atttggagtc gccggctcgc cggatgcact gatatcgcgc attacgtcgg cgctgccgtc 5580
taaacctcag cggccgagcg gcctacgtga ctatagcgcg taatgcagcc gcgacggcag 5640
agccgcgtag atatgggaga tgagatcgtg gccgaaatcg tgcttgtatg gcgtccacgg 5700
tcggcgcatc tataccctct actctagcac cggctttagc acgaacatac cgcaggtgcc 5760
ggtcacggtg tgaccggctt tggcgagtgc ggcgacggtg gtttccacgc cgcgcaggat 5820
ccagtgccac actggccgaa accgctcacg ccgctgccac caaaggtgcg gcgcgtccta 5880
aggagggtgt ggaaggacat tgccgtcgaa gttgtagtag ccgatattga gcccgccgtt 5940
tcctcccaca ccttcctgta acggcagctt caacatcatc ggctataact cgggcggcaa 6000
cttgatcttg gaggcaataa tgtccgactc ggactggcgc cagggcatgg ggatgacctt 6060
gaactagaac ctccgttatt acaggctgag cctgaccgcg gtcccgtacc cctactggaa 6120
ggagtcgtat ttccaaggct cctgaccgag gacggatttg gtgaagaggc ggaggtctaa 6180
cctcagcata aaggttccga ggactggctc ctgcctaaac cacttctccg cctccagatt 6240
catacttcat cagtgactgc cggtctcgta tatagtataa aaagcaagaa aggaggacag 6300
gtatgaagta gtcactgacg gccagagcat atatcatatt tttcgttctt tcctcctgtc 6360
tggaggcctg gtatagagca ggaaaagaag gaagaggcga aggactcacc ctcaacagag 6420
acctccggac catatctcgt ccttttcttc cttctccgct tcctgagtgg gagttgtctc 6480
tgcgtaatcg gcccgacaac gctgtgcacc gtctcctgac cctccatgct gttcgccatc 6540
acgcattagc cgggctgttg cgacacgtgg cagaggactg ggaggtacga caagcggtag 6600
tttgcatacg gcagccgccc atgactcggc cttagaccgt acaggaagtt gaacgcggcc 6660
aaacgtatgc cgtcggcggg tactgagccg gaatctggca tgtccttcaa cttgcgccgg 6720
ggcactcgaa tcgagccacc gatatccgtt cctacaccga tgacgccacc acgaatccca 6780
ccgtgagctt agctcggtgg ctataggcaa ggatgtggct actgcggtgg tgcttagggt 6840
acgatcgcac cctcaccacc agaactgccg ccgcacgacc agttcttgtt gcgtgggttg 6900
tgctagcgtg ggagtggtgg tcttgacggc ggcgtgctgg tcaagaacaa cgcacccaac 6960
acggtgcgcc cgatgatgtt gttgactgtc tcgcagacca tcagggtctg cgggacagag 7020
tgccacgcgg gctactacaa caactgacag agcgtctggt agtcccagac gccctgtctc 7080
gtcttgacgt agaagacggc accggctttg cggagcatgg ttgtcagaac cgagtcccct 7140
cagaactgca tcttctgccg tggccgaaac gcctcgtacc aacagtcttg gctcagggga 7200
tcgtcgtact tgtttagcca tgagatgtag cccattgatg tttcgtagcc ctggtggcat 7260
agcagcatga acaaatcggt actctacatc gggtaactac aaagcatcgg gaccaccgta 7320
atgttagctg acaaaaaggg acatctaacg acttaggggc aacggtgtac cttgactcga 7380
tacaatcgac tgtttttccc tgtagattgc tgaatccccg ttgccacatg gaactgagct 7440
agctggtctt tgagagagat ggggaggcca tgaagtggac caacgggtct cttgtgcttt 7500
tcgaccagaa actctctcta cccctccggt acttcacctg gttgcccaga gaacacgaaa 7560
gcgtagtatt catcgagttc ccttgcctgc gcgagagcgg cgtcagggaa gaactcgtgg 7620
cgcatcataa gtagctcaag ggaacggacg cgctctcgcc gcagtccctt cttgagcacc 7680
gcgcagtttg tctgcacaga agccagcgtc agcttgatag tcccataagg tggcgttgtt 7740
cgcgtcaaac agacgtgtct tcggtcgcag tcgaactatc agggtattcc accgcaacaa 7800
acatctccct gagaggtaga ggggacccta ctaactgctg ggcgattgct gcccgtttac 7860
tgtagaggga ctctccatct cccctgggat gattgacgac ccgctaacga cgggcaaatg 7920
agaatgctag cgtaacttcc accgaggtca actctccggc cgccagcttg gacacaagat 7980
tcttacgatc gcattgaagg tggctccagt tgagaggccg gcggtcgaac ctgtgttcta 8040
ctgcagcgga ggcctctgtg atcttcagtt cggcctctga aaggatcccc gatttctttg 8100
gacgtcgcct ccggagacac tagaagtcaa gccggagact ttcctagggg ctaaagaaac 8160
ggaaatcaat aacgctgtct tccgcaggca gcgtctggac tttccattca tcagggatgg 8220
cctttagtta ttgcgacaga aggcgtccgt cgcagacctg aaaggtaagt agtccctacc 8280
tttttgcgag gcgggcgcgc ttatcagcgg ccagttcttc ccaggattga ggcattctgt 8340
aaaaacgctc cgcccgcgcg aatagtcgcc ggtcaagaag ggtcctaact ccgtaagaca 8400
gttagcttat agtcaggatg ttggctcgac gagtgtaaac tgggagttgg catgagggtt 8460
caatcgaata tcagtcctac aaccgagctg ctcacatttg accctcaacc gtactcccaa 8520
atgtaggctt ctttagcccc gcatccccct cattctcctc attgatcccg ggggagcgga 8580
tacatccgaa gaaatcgggg cgtaggggga gtaagaggag taactagggc cccctcgcct 8640
tggtgttgat aagagactaa ttatagggtt tagctggtgc ctagctggtg attggctggc 8700
accacaacta ttctctgatt aatatcccaa atcgaccacg gatcgaccac taaccgaccg 8760
ttcgccgaat tttacgggcc aaggaaagct gcagaaccgc ggcactggta aacggtaatt 8820
aagcggctta aaatgcccgg ttcctttcga cgtcttggcg ccgtgaccat ttgccattaa 8880
aagctatcag ccccatgcta acgagtttaa attacgtgta ttgctgataa acaccaacag 8940
ttcgatagtc ggggtacgat tgctcaaatt taatgcacat aacgactatt tgtggttgtc 9000
agctttactg aaagatggga gtcacggtgt ggcttcccca ctgcgattat tgcacaagca 9060
tcgaaatgac tttctaccct cagtgccaca ccgaaggggt gacgctaata acgtgttcgt 9120
gcgagggcga acttgactgt cgtcgctgag cagcctgcag tcaaacatac atatatatca 9180
cgctcccgct tgaactgaca gcagcgactc gtcggacgtc agtttgtatg tatatatagt 9240
accgcgaaga cgtctggcct tgtagaacac gacgctccct agcaacacct gccgtgtcag 9300
tggcgcttct gcagaccgga acatcttgtg ctgcgaggga tcgttgtgga cggcacagtc 9360
cctctacggt tgttacttgc attcaggatg ctctccagcg ggcgagctat tcaaaatatt 9420
ggagatgcca acaatgaacg taagtcctac gagaggtcgc ccgctcgata agttttataa 9480
caaagcaggt atctcgtatt gccaggattc agctgaagca acaggtgcca aggaaatctg 9540
gtttcgtcca tagagcataa cggtcctaag tcgacttcgt tgtccacggt tcctttagac 9600
cgtcggttct catctgggct tgctcggtcc tggcgtagaa tgcatcctag agtttaaaca 9660
gcagccaaga gtagacccga acgagccagg accgcatctt acgtaggatc tcaaatttgt 9720
gcttggcact ggccgtcgtt ttacaacgtc gtgactggga aaaccctggc gttacccaac 9780
cgaaccgtga ccggcagcaa aatgttgcag cactgaccct tttgggaccg caatgggttg 9840
ttaatcgcct tgcagcacat ccccctttcg ccagctggcg taatagcgaa gaggcccgca 9900
aattagcgga acgtcgtgta gggggaaagc ggtcgaccgc attatcgctt ctccgggcgt 9960
ccgatcgccc ttcccaacag ttgcgcagcc tgaacggcga atggcgcctg atgcggtatt 10020
ggctagcggg aagggttgtc aacgcgtcgg acttgccgct taccgcggac tacgccataa 10080
ttctccttac gcatctgtgc ggtatttcac accgcatatg gtgcactctc agtacaatct 10140
aagaggaatg cgtagacacg ccataaagtg tggcgtatac cacgtgagag tcatgttaga 10200
gctctgatgc cgcatagtta agccagcccc gacacccgcc aacacccgct gacgcgccct 10260
cgagactacg gcgtatcaat tcggtcgggg ctgtgggcgg ttgtgggcga ctgcgcggga 10320
gacgggcttg tctgctcccg gcatccgctt acagacaagc tgtgaccgtc tccgggagct 10380
ctgcccgaac agacgagggc cgtaggcgaa tgtctgttcg acactggcag aggccctcga 10440
gcatgtgtca gaggttttca ccgtcatcac cgaaacgcgc gagacgaaag ggcctcgtga 10500
cgtacacagt ctccaaaagt ggcagtagtg gctttgcgcg ctctgctttc ccggagcact 10560
tacgcctatt tttataggtt aatgtcatga taataatggt ttcttagacg tcaggtggca 10620
atgcggataa aaatatccaa ttacagtact attattacca aagaatctgc agtccaccgt 10680
cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt tttctaaata cattcaaata 10740
gaaaagcccc tttacacgcg ccttggggat aaacaaataa aaagatttat gtaagtttat 10800
tgtatccgct catgagacaa taaccctgat aaatgcttca ataatattga aaaaggaaga 10860
acataggcga gtactctgtt attgggacta tttacgaagt tattataact ttttccttct 10920
gtatgagtat tcaacatttc cgtgtcgccc ttattccctt ttttgcggca ttttgccttc 10980
catactcata agttgtaaag gcacagcggg aataagggaa aaaacgccgt aaaacggaag 11040
ctgtttttgc tcacccagaa acgctggtga aagtaaaaga tgctgaagat cagttgggtg 11100
gacaaaaacg agtgggtctt tgcgaccact ttcattttct acgacttcta gtcaacccac 11160
cacgagtggg ttacatcgaa ctggatctca acagcggtaa gatccttgag agttttcgcc 11220
gtgctcaccc aatgtagctt gacctagagt tgtcgccatt ctaggaactc tcaaaagcgg 11280
ccgaagaacg ttttccaatg atgagcactt ttaaagttct gctatgtggc gcggtattat 11340
ggcttcttgc aaaaggttac tactcgtgaa aatttcaaga cgatacaccg cgccataata 11400
cccgtattga cgccgggcaa gagcaactcg gtcgccgcat acactattct cagaatgact 11460
gggcataact gcggcccgtt ctcgttgagc cagcggcgta tgtgataaga gtcttactga 11520
tggttgagta ctcaccagtc acagaaaagc atcttacgga tggcatgaca gtaagagaat 11580
accaactcat gagtggtcag tgtcttttcg tagaatgcct accgtactgt cattctctta 11640
tatgcagtgc tgccataacc atgagtgata acactgcggc caacttactt ctgacaacga 11700
atacgtcacg acggtattgg tactcactat tgtgacgccg gttgaatgaa gactgttgct 11760
tcggaggacc gaaggagcta accgcttttt tgcacaacat gggggatcat gtaactcgcc 11820
agcctcctgg cttcctcgat tggcgaaaaa acgtgttgta ccccctagta cattgagcgg 11880
ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa cgacgagcgt gacaccacga 11940
aactagcaac ccttggcctc gacttacttc ggtatggttt gctgctcgca ctgtggtgct 12000
tgcctgtagc aatggcaaca acgttgcgca aactattaac tggcgaacta cttactctag 12060
acggacatcg ttaccgttgt tgcaacgcgt ttgataattg accgcttgat gaatgagatc 12120
cttcccggca acaattaata gactggatgg aggcggataa agttgcagga ccacttctgc 12180
gaagggccgt tgttaattat ctgacctacc tccgcctatt tcaacgtcct ggtgaagacg 12240
gctcggccct tccggctggc tggtttattg ctgataaatc tggagccggt gagcgtgggt 12300
cgagccggga aggccgaccg accaaataac gactatttag acctcggcca ctcgcaccca 12360
ctcgcggtat cattgcagca ctggggccag atggtaagcc ctcccgtatc gtagttatct 12420
gagcgccata gtaacgtcgt gaccccggtc taccattcgg gagggcatag catcaataga 12480
acacgacggg gagtcaggca actatggatg aacgaaatag acagatcgct gagataggtg 12540
tgtgctgccc ctcagtccgt tgatacctac ttgctttatc tgtctagcga ctctatccac 12600
cctcactgat taagcattgg taactgtcag accaagttta ctcatatata ctttagattg 12660
ggagtgacta attcgtaacc attgacagtc tggttcaaat gagtatatat gaaatctaac 12720
atttaaaact tcatttttaa tttaaaagga tctaggtgaa gatccttttt gataatctca 12780
taaattttga agtaaaaatt aaattttcct agatccactt ctaggaaaaa ctattagagt 12840
tgaccaaaat cccttaacgt gagttttcgt tccactgagc gtcagacccc gtagaaaaga 12900
actggtttta gggaattgca ctcaaaagca aggtgactcg cagtctgggg catcttttct 12960
tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat ctgctgcttg caaacaaaaa 13020
agtttcctag aagaactcta ggaaaaaaag acgcgcatta gacgacgaac gtttgttttt 13080
aaccaccgct accagcggtg gtttgtttgc cggatcaaga gctaccaact ctttttccga 13140
ttggtggcga tggtcgccac caaacaaacg gcctagttct cgatggttga gaaaaaggct 13200
aggtaactgg cttcagcaga gcgcagatac caaatactgt tcttctagtg tagccgtagt 13260
tccattgacc gaagtcgtct cgcgtctatg gtttatgaca agaagatcac atcggcatca 13320
taggccacca cttcaagaac tctgtagcac cgcctacata cctcgctctg ctaatcctgt 13380
atccggtggt gaagttcttg agacatcgtg gcggatgtat ggagcgagac gattaggaca 13440
taccagtggc tgctgccagt ggcgataagt cgtgtcttac cgggttggac tcaagacgat 13500
atggtcaccg acgacggtca ccgctattca gcacagaatg gcccaacctg agttctgcta 13560
agttaccgga taaggcgcag cggtcgggct gaacgggggg ttcgtgcaca cagcccagct 13620
tcaatggcct attccgcgtc gccagcccga cttgcccccc aagcacgtgt gtcgggtcga 13680
tggagcgaac gacctacacc gaactgagat acctacagcg tgagctatga gaaagcgcca 13740
acctcgcttg ctggatgtgg cttgactcta tggatgtcgc actcgatact ctttcgcggt 13800
cgcttcccga agggagaaag gcggacaggt atccggtaag cggcagggtc ggaacaggag 13860
gcgaagggct tccctctttc cgcctgtcca taggccattc gccgtcccag ccttgtcctc 13920
agcgcacgag ggagcttcca gggggaaacg cctggtatct ttatagtcct gtcgggtttc 13980
tcgcgtgctc cctcgaaggt ccccctttgc ggaccataga aatatcagga cagcccaaag 14040
gccacctctg acttgagcgt cgatttttgt gatgctcgtc aggggggcgg agcctatgga 14100
cggtggagac tgaactcgca gctaaaaaca ctacgagcag tccccccgcc tcggatacct 14160
aaaacgccag caacgcggcc tttttacggt tcctggcctt ttgctggcct tttgctcaca 14220
ttttgcggtc gttgcgccgg aaaaatgcca aggaccggaa aacgaccgga aaacgagtgt 14280
tgttctttcc tgcgttatcc cctgattctg tggataaccg tattaccgcc tttgagtgag 14340
acaagaaagg acgcaatagg ggactaagac acctattggc ataatggcgg aaactcactc 14400
ctgataccgc tcgccgcagc cgaacgaccg agcgcagcga gtcagtgagc gaggaagcgg 14460
gactatggcg agcggcgtcg gcttgctggc tcgcgtcgct cagtcactcg ctccttcgcc 14520
aagagcgccc aatacgcaaa ccgcctctcc ccgcgcgttg gccgattcat taatgcagct 14580
ttctcgcggg ttatgcgttt ggcggagagg ggcgcgcaac cggctaagta attacgtcga 14640
ggcacgacag gtttcccgac tggaaagcgg gcagtgagcg caacgcaatt aatgtgagtt 14700
ccgtgctgtc caaagggctg acctttcgcc cgtcactcgc gttgcgttaa ttacactcaa 14760
agctcactca ttaggcaccc caggctttac actttatgct tccggctcgt atgttgtgtg 14820
tcgagtgagt aatccgtggg gtccgaaatg tgaaatacga aggccgagca tacaacacac 14880
gaattgtgag cggataacaa tttcacacag gaaacagcta tgaccatgat tacgaattgt 14940
cttaacactc gcctattgtt aaagtgtgtc ctttgtcgat actggtacta atgcttaaca 15000
ttaaacgaat ttgc 15014
<210> 78
<211> 35
<212> DNA
<213> 里氏木霉
<400> 78
cgaacgcggt agtgggaatt ctaggctagg tatgc 35
<210> 79
<211> 35
<212> DNA
<213> 里氏木霉
<400> 79
ccaaccgaat ctcatggtgc aatacacaga gggtg 35
<210> 80
<211> 35
<212> DNA
<213> 烟曲霉
<400> 80
tctgtgtatt gcaccatgag attcggttgg ctcga 35
<210> 81
<211> 35
<212> DNA
<213> 烟曲霉
<400> 81
ccggtcacga aagccctagt agacacgggg cagag 35
<210> 82
<211> 35
<212> DNA
<213> 里氏木霉
<400> 82
ccccgtgtct actagggctt tcgtgaccgg gcttc 35
<210> 83
<211> 35
<212> DNA
<213> 里氏木霉
<400> 83
gtcattacca attggactcg gagttgttat acgct 35
<210> 84
<211> 35
<212> DNA
<213> 里氏木霉
<400> 84
cgaacgcggt agtgggaatt ctaggctagg tatgc 35
<210> 85
<211> 35
<212> DNA
<213> 里氏木霉
<400> 85
gtcattacca attggactcg gagttgttat acgct 35
<210> 86
<211> 36
<212> DNA
<213> 烟曲霉
<400> 86
ccctttgggt atccgtgact gtgagctata cccgcg 36
<210> 87
<211> 35
<212> DNA
<213> 烟曲霉
<400> 87
cgtcatgagt gactggggcg ctcaccacag cggtg 35
<210> 88
<211> 36
<212> DNA
<213> 烟曲霉
<400> 88
gggtagtggt actgccgagt tcccttacct tgtcac 36
<210> 89
<211> 39
<212> DNA
<213> 烟曲霉
<400> 89
gccgactctg gagagggtta catcagtgtc gacggcaac 39
<210> 90
<211> 33
<212> DNA
<213> 烟曲霉
<400> 90
cggactgcgc accatgagat tcggttggct cga 33
<210> 91
<211> 35
<212> DNA
<213> 烟曲霉
<400> 91
tcgccacgga gcttactagt agacacgggg cagag 35
<210> 92
<211> 61
<212> DNA
<213> 里氏木霉
<400> 92
gcgagtcagt gagcgaggaa gcggaagagc ttaattaatc ttgagtggat gtctgatcta 60
g 61
<210> 93
<211> 58
<212> DNA
<213> 里氏木霉
<400> 93
gttcggataa caatcctaca ttcggtcgac ttataaggat gtatcaatgg gttatacg 58
<210> 94
<211> 20
<212> DNA
<213> 烟曲霉
<400> 94
tcaaccagct tctttattgg 20
<210> 95
<211> 25
<212> DNA
<213> 烟曲霉
<400> 95
gatcgccata ggctcatgct ccgca 25
<210> 96
<211> 21
<212> DNA
<213> 烟曲霉
<400> 96
gcggcatcaa acacgaacct g 21
<210> 97
<211> 20
<212> DNA
<213> 烟曲霉
<400> 97
cagtggcgct tattactcag 20
<210> 98
<211> 25
<212> DNA
<213> 烟曲霉
<400> 98
gatcgccata ggctcatgct ccgca 25
<210> 99
<211> 25
<212> DNA
<213> 里氏木霉
<400> 99
aaaaaacaaa catcccgttc ataac 25
<210> 100
<211> 25
<212> DNA
<213> 里氏木霉
<400> 100
aacaaggttt accggtttcg aaaag 25
<210> 101
<211> 25
<212> DNA
<213> 烟曲霉
<400> 101
agccacatgc cgcatattga caaag 25
<210> 102
<211> 25
<212> DNA
<213> 里氏木霉
<400> 102
agggattcag tgtgctacag gctgc 25
<210> 103
<211> 25
<212> DNA
<213> 里氏木霉
<400> 103
aaaaaacaaa catcccgttc ataac 25
<210> 104
<211> 25
<212> DNA
<213> 里氏木霉
<400> 104
aacaaggttt accggtttcg aaaag 25
<210> 105
<211> 27
<212> DNA
<213> 里氏木霉
<400> 105
gttaagcata caattgaacg agaatgg 27
<210> 106
<211> 25
<212> DNA
<213> 里氏木霉
<400> 106
gatgatataa tggagcaaat aaggg 25
<210> 107
<211> 2077
<212> DNA
<213> 里氏木霉
<400> 107
atgacggatg cacaaaagaa ttggaggaga gacgaaaacg acgaggacga tgaagcagag 60
caggagctcg atgaggctgt aagtcgccgc gagtcgcatc tggtctgaca agcgtcgtct 120
gacactcttt tctcccatct agagcctcaa ggcgcagaaa gatgcaattc ttctagccat 180
tgaagtcagt ccgtcgatgc ttgagcctcc gccagtctcc agctctagga aagctgatcg 240
ggacagcccc gttcaagctg cgctgaaatg cgcccgccac ctgatggagc agcgcatcat 300
ctccaacccc aaagacatga tgggaatcct cctctttggg acagaaaaga ccaagttccg 360
ggacgacaat ggccgcagtg ggctcgggta tccgaattgc tacctcttta tggacctcga 420
cattccggca gctgaagacg tcaaagcgtt gaaggcgctg accgaggacg aagacgaaga 480
cgaagtgctg aagcccgcca ccaccgacac agtttccatg tccaacgtgt tgttttgcgc 540
caaccagata ttcaccacaa aggcggccaa ctttggcagc cggcgacttt tcattgtgac 600
ggacaatgac gatccgcacg cgtcggacaa ggcggcgagg tctgctgccg ctgttcgggc 660
aaaggacttg tacgatctgg gcatcacgat cgacttgttt ccaatcacca caggagactc 720
caagtttgat ctcagcaaat tttacgatgt aagctatatt tcttcgtttc ttcgctctaa 780
aatcacccac cctccgtcgt gacatagact gacaaggaac taggatattg tctatcgcga 840
cccgaatgcc gaggccaatc gcaccgaagt gcgagcctca aaatcgggcg atggactgtc 900
tcttctcaac tcgctcattt caaacatcaa ttccaagcag acgcccaagc gagcattgtt 960
ccatctgcca tttgagattg cacctggact caagatcact gtcaagggct acaacattgt 1020
gcatcggcaa acgccggcga gaacgtgcta catctggctg gaaggggaga aggctcagat 1080
tgcaacaggc gaaacgacgc gagttgcaga ggattctgcc agaacagtcg aaaagcaaga 1140
gataaaaaag gcctacaagt ttggtggcga atacgtatac tttacgcccg aggagcagaa 1200
gaagctccgg gattttggcg cgcccacgat ccggatcatt ggattcaaga agcgcagcat 1260
gattcccgtc tgggccagcg tcaagaagtc gacctttatc tttcccagcg aagaggatta 1320
catcggatcg acacgcgtct tttcagccct atggcagaag cttctaaagg atgacaagat 1380
cggcctcgct tggtgcgtgc ttcgatctaa cgcgcagccc atgtttgccg ctctgattcc 1440
atcaagagag cagtccgaag acgacgcggg gacaccatat ctaccagctg gcctgtggct 1500
gtatcctctc cctacggctg acgacctgcg agatataaat gtcgaacgaa agctcgactg 1560
ctcggaggac ctaaaaacca aaatgagagt cattgtacaa cagctcaatc tccccaaggg 1620
catatataac ccactcaagt acccgaaccc ggctctgcaa tggcactaca agatcctcca 1680
gaccctcgcc ttggaggagg agatgccgga agaacccgaa gacttgacgg agcccaaaaa 1740
caaggcgata agcaaacgcg tcggaggtta cttggaggag tggtccgaga ctctgaaaga 1800
cgaggcggac agggccactc gatccaggtc cttgaagcga gagattgaag atgatgcccc 1860
ggagcgcccc gcaaagcaga gaaaggtagc tggagagcgg cccagcggat cgaatcttag 1920
catggcgcag cttagggatg ccattgagag cgggagcatc tcgaagatga cagtggcaca 1980
gctgaaggat gtcgctggcg ccagaggact cagcacgggt ggtaagaagg ctgatttgct 2040
ggagcggata gagcagtggg ttgaggagaa cagctga 2077
<210> 108
<211> 649
<212> PRT
<213> 里氏木霉
<400> 108
Met Thr Asp Ala Gln Lys Asn Trp Arg Arg Asp Glu Asn Asp Glu Asp
1 5 10 15
Asp Glu Ala Glu Gln Glu Leu Asp Glu Ala Val Ser Arg Arg Asp Leu
20 25 30
Lys Ala Gln Lys Asp Ala Ile Leu Leu Ala Ile Glu Val Ser Pro Ser
35 40 45
Met Leu Glu Pro Pro Pro Val Ser Ser Ser Arg Lys Ala Asp Arg Asp
50 55 60
Ser Pro Val Gln Ala Ala Leu Lys Cys Ala Arg His Leu Met Glu Gln
65 70 75 80
Arg Ile Ile Ser Asn Pro Lys Asp Met Met Gly Ile Leu Leu Phe Gly
85 90 95
Thr Glu Lys Thr Lys Phe Arg Asp Asp Asn Gly Arg Ser Gly Leu Gly
100 105 110
Tyr Pro Asn Cys Tyr Leu Phe Met Asp Leu Asp Ile Pro Ala Ala Glu
115 120 125
Asp Val Lys Ala Leu Lys Ala Leu Thr Glu Asp Glu Asp Glu Asp Glu
130 135 140
Val Leu Lys Pro Ala Thr Thr Asp Thr Val Ser Met Ser Asn Val Leu
145 150 155 160
Phe Cys Ala Asn Gln Ile Phe Thr Thr Lys Ala Ala Asn Phe Gly Ser
165 170 175
Arg Arg Leu Phe Ile Val Thr Asp Asn Asp Asp Pro His Ala Ser Asp
180 185 190
Lys Ala Ala Arg Ser Ala Ala Ala Val Arg Ala Lys Asp Leu Tyr Asp
195 200 205
Leu Gly Ile Thr Ile Asp Leu Phe Pro Ile Thr Thr Gly Asp Ser Lys
210 215 220
Phe Asp Leu Ser Lys Phe Tyr Asp Asp Ile Val Tyr Arg Asp Pro Asn
225 230 235 240
Ala Glu Ala Asn Arg Thr Glu Val Arg Ala Ser Lys Ser Gly Asp Gly
245 250 255
Leu Ser Leu Leu Asn Ser Leu Ile Ser Asn Ile Asn Ser Lys Gln Thr
260 265 270
Pro Lys Arg Ala Leu Phe His Leu Pro Phe Glu Ile Ala Pro Gly Leu
275 280 285
Lys Ile Thr Val Lys Gly Tyr Asn Ile Val His Arg Gln Thr Pro Ala
290 295 300
Arg Thr Cys Tyr Ile Trp Leu Glu Gly Glu Lys Ala Gln Ile Ala Thr
305 310 315 320
Gly Glu Thr Thr Arg Val Ala Glu Asp Ser Ala Arg Thr Val Glu Lys
325 330 335
Gln Glu Ile Lys Lys Ala Tyr Lys Phe Gly Gly Glu Tyr Val Tyr Phe
340 345 350
Thr Pro Glu Glu Gln Lys Lys Leu Arg Asp Phe Gly Ala Pro Thr Ile
355 360 365
Arg Ile Ile Gly Phe Lys Lys Arg Ser Met Ile Pro Val Trp Ala Ser
370 375 380
Val Lys Lys Ser Thr Phe Ile Phe Pro Ser Glu Glu Asp Tyr Ile Gly
385 390 395 400
Ser Thr Arg Val Phe Ser Ala Leu Trp Gln Lys Leu Leu Lys Asp Asp
405 410 415
Lys Ile Gly Leu Ala Trp Cys Val Leu Arg Ser Asn Ala Gln Pro Met
420 425 430
Phe Ala Ala Leu Ile Pro Ser Arg Glu Gln Ser Glu Asp Asp Ala Gly
435 440 445
Thr Pro Tyr Leu Pro Ala Gly Leu Trp Leu Tyr Pro Leu Pro Thr Ala
450 455 460
Asp Asp Leu Arg Asp Ile Asn Val Glu Arg Lys Leu Asp Cys Ser Glu
465 470 475 480
Asp Leu Lys Thr Lys Met Arg Val Ile Val Gln Gln Leu Asn Leu Pro
485 490 495
Lys Gly Ile Tyr Asn Pro Leu Lys Tyr Pro Asn Pro Ala Leu Gln Trp
500 505 510
His Tyr Lys Ile Leu Gln Thr Leu Ala Leu Glu Glu Glu Met Pro Glu
515 520 525
Glu Pro Glu Asp Leu Thr Glu Pro Lys Asn Lys Ala Ile Ser Lys Arg
530 535 540
Val Gly Gly Tyr Leu Glu Glu Trp Ser Glu Thr Leu Lys Asp Glu Ala
545 550 555 560
Asp Arg Ala Thr Arg Ser Arg Ser Leu Lys Arg Glu Ile Glu Asp Asp
565 570 575
Ala Pro Glu Arg Pro Ala Lys Gln Arg Lys Val Ala Gly Glu Arg Pro
580 585 590
Ser Gly Ser Asn Leu Ser Met Ala Gln Leu Arg Asp Ala Ile Glu Ser
595 600 605
Gly Ser Ile Ser Lys Met Thr Val Ala Gln Leu Lys Asp Val Ala Gly
610 615 620
Ala Arg Gly Leu Ser Thr Gly Gly Lys Lys Ala Asp Leu Leu Glu Arg
625 630 635 640
Ile Glu Gln Trp Val Glu Glu Asn Ser
645
<210> 109
<211> 55
<212> DNA
<213> 里氏木霉
<400> 109
gtgtgcggcc gctcgagcat gcatgtttaa acagcttggc actggccgtc gtttt 55
<210> 110
<211> 55
<212> DNA
<213> 里氏木霉
<400> 110
atcagccccg agacggcgcc gcgtttaaac aattcgtaat catggtcata gctgt 55
<210> 111
<211> 55
<212> DNA
<213> 里氏木霉
<400> 111
catgattacg aattgtttaa acgcggcgcc gtctcggggc tgatcttgtc gagga 55
<210> 112
<211> 55
<212> DNA
<213> 里氏木霉
<400> 112
ggcggccgtt actagtggat ccagcccttg acagtgatct tgagtccagg tgcaa 55
<210> 113
<211> 58
<212> DNA
<213> 里氏木霉
<400> 113
tgcagatatc catcacactg gcggccgcag tttccatgtc caacgtgttg ttttgcgc 58
<210> 114
<211> 58
<212> DNA
<213> 里氏木霉
<400> 114
gccagtgcca agctgtttaa acatgcatgc tcgagcggcc gcacacgccc tctcctcg 58
<210> 115
<211> 20
<212> DNA
<213> 里氏木霉
<400> 115
caatgacgat ccgcacgcgt 20
<210> 116
<211> 20
<212> DNA
<213> 里氏木霉
<400> 116
caatgacgat ccgcacgcgt 20
<210> 117
<211> 20
<212> DNA
<213> 里氏木霉
<400> 117
gacactcttt tctcccatct 20
<210> 118
<211> 20
<212> DNA
<213> 里氏木霉
<400> 118
gaggagcaga agaagctccg 20
<210> 119
<211> 22
<212> DNA
<213> 里氏木霉
<400> 119
gcatatataa cccactcaag ta 22
<210> 120
<211> 22
<212> DNA
<213> 里氏木霉
<400> 120
attatcttgg accggccgca gg 22

Claims (24)

1.一种构建用于产生具有生物活性的多种重组多肽的丝状真菌菌株的方法,其包括:
(a)通过向丝状真菌菌株中导入第一串联构建体,通过靶向整合取代内源性第一基因,所述第一串联构建体包含(i)所述第一基因的同源5’区、其同源侧翼区或其组合,(ii)一个或多个第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v)所述第一基因的同源3’区、其同源侧翼区或其组合;
(b)通过向所述丝状真菌菌株中导入第二串联构建体,通过靶向整合取代内源性第二基因,所述第二串联构建体包含(i)所述第二基因的同源5’区、其同源侧翼区或其组合,(ii)一个或多个第二可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v)所述第二基因的同源3’区、其同源侧翼区或其组合;或
(c)(a)和(b)的组合。
2.根据权利要求1所述的方法,其中所述第一基因是编码选自以下的纤维二糖水解酶I的纤维二糖水解酶I基因:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶I,(ii)包含与SEQ ID NO:2的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶I,(iii)由包含与SEQ ID NO:1的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I;
并且其中所述第二基因是编码选自以下的纤维二糖水解酶II的纤维二糖水解酶II基因:(i)包含SEQ ID NO:4的成熟多肽的纤维二糖水解酶II,(ii)包含与SEQ ID NO:4的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II,(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
3.根据权利要求1或2所述的方法,其中一个或多个串联构建体还包含一个或多个可选择性标记物的5’侧翼的第一同源重复和所述一个或多个可选择性标记物的3’侧翼的第二同源重复,其中所述第一同源重复和所述第二同源重复进行同源重组,以切除所述一个或多个可选择性标记物。
4.一种丝状真菌菌株,其包含:
(a)通过靶向整合用第一串联构建体取代的内源性第一基因,所述第一串联构建体包含(i)所述第一基因的同源5’区、其同源侧翼区或其组合,(ii)一个或多个可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v)所述第一基因的同源3’区、其同源侧翼区或其组合;
(b)通过靶向整合用第二串联构建体取代的内源性第二基因,所述第二串联构建体包含(i)所述第二基因的同源5’区、其同源侧翼区或其组合,(ii)一个或多个可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v)所述第二基因的同源3’区、其同源侧翼区或其组合;或
(c)(a)和(b)的组合。
5.根据权利要求4所述的丝状真菌菌株,其中所述第一基因是编码选自以下的纤维二糖水解酶I的纤维二糖水解酶I基因:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶I,(ii)包含与SEQ ID NO:2的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶I,(iii)由包含与SEQ ID NO:1的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I;
并且其中所述第二基因是编码选自以下的纤维二糖水解酶II的纤维二糖水解酶II基因:(i)包含SEQ ID NO:4的成熟多肽的纤维二糖水解酶II,(ii)包含与SEQ ID NO:4的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II,(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
6.根据权利要求4或5所述的丝状真菌菌株,其中一个或多个串联构建体还包含所述一个或多个可选择性标记物的5’侧翼的第一同源重复和所述一个或多个可选择性标记物的3’侧翼的第二同源重复,其中所述第一同源重复和所述第二同源重复进行同源重组,以切除所述一个或多个可选择性标记物。
7.一种在丝状真菌菌株中产生具有生物活性的多种重组多肽的方法,其包括:在有益于产生多肽的条件下培养丝状真菌宿主细胞,其中所述丝状真菌宿主细胞包含:
(a)通过靶向整合用第一串联构建体取代的内源性第一基因,所述第一串联构建体包含(i)所述第一基因的同源5’区、其同源侧翼区或其组合,(ii)一个或多个可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v)所述第一基因的同源3’区、其同源侧翼区或其组合;
(b)通过靶向整合用第二串联构建体取代的内源性第二基因,所述第二串联构建体包含(i)所述第二基因的同源5’区、其同源侧翼区或其组合,(ii)一个或多个可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v)所述第二基因的同源3’区、其同源侧翼区或其组合;或
(c)(a)和(b)的组合。
8.根据权利要求7所述的方法,其还包括回收所述多种重组多肽。
9.根据权利要求7或8所述的方法,其中所述第一基因是编码选自以下的纤维二糖水解酶I的纤维二糖水解酶I基因:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶I,(ii)包含与SEQ ID NO:2的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶I,(iii)由包含与SEQ ID NO:1的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I;
并且其中所述第二基因是编码选自以下的纤维二糖水解酶II的纤维二糖水解酶II基因:(i)包含SEQ ID NO:4的成熟多肽的纤维二糖水解酶II,(ii)包含与SEQ ID NO:4的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II,(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
10.根据权利要求7~9中任一项所述的方法,其中一个或多个串联构建体还包含所述一个或多个可选择性标记物的5’侧翼的第一同源重复和所述一个或多个可选择性标记物的3’侧翼的第二同源重复,其中所述第一同源重复和所述第二同源重复进行同源重组,以切除所述一个或多个可选择性标记物。
11.一种串联构建体,其包含:(i)基因的同源5’区、其同源侧翼区或其组合;(ii)一个或多个第一可选择性标记物;(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸;(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸;和(v)所述基因的同源3’区、其同源侧翼区或其组合。
12.根据权利要求11所述的串联构建体,其中所述基因是编码选自以下的纤维二糖水解酶I的纤维二糖水解酶I基因:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶I,(ii)包含与SEQ ID NO:2的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶I,(iii)由包含与SEQ ID NO:1的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I;
或其中所述基因是编码选自以下的纤维二糖水解酶II的纤维二糖水解酶II基因:(i)包含SEQ ID NO:4的成熟多肽的纤维二糖水解酶II,(ii)包含与SEQ ID NO:4的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II,(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ IDNO:3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
13.一种构建用于产生具有生物活性的多种重组多肽的丝状真菌菌株的方法,其包括:
(a)通过靶向整合向内源性第一基因座中***第一串联构建体,所述第一串联构建体包含(i)所述第一基因座的同源5’区、其同源侧翼区或其组合,(ii)一个或多个第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v)所述第一基因座的同源3’区、其同源侧翼区或其组合;
(b)通过靶向整合向内源性第二基因座中***第二串联构建体,所述第二串联构建体包含(i)所述第二基因座的同源5’区、其同源侧翼区或其组合,(ii)一个或多个第二可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v)所述第二基因座的同源3’区、其同源侧翼区或其组合;或
(c)(a)和(b)的组合。
14.根据权利要求13所述的方法,其中所述第一基因座是编码选自以下的纤维二糖水解酶I的纤维二糖水解酶I基因:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶I,(ii)包含与SEQ ID NO:2的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶I,(iii)由包含与SEQ ID NO:1的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I;
并且其中所述第二基因座是编码选自以下的纤维二糖水解酶II的纤维二糖水解酶II基因:(i)包含SEQ ID NO:4的成熟多肽的纤维二糖水解酶II,(ii)包含与SEQ ID NO:4的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II,(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
15.根据权利要求13或14所述的方法,其中一个或多个串联构建体还包含一个或多个可选择性标记物的5’侧翼的第一同源重复和所述一个或多个可选择性标记物的3’侧翼的第二同源重复,其中所述第一同源重复和所述第二同源重复进行同源重组,以切除所述一个或多个可选择性标记物。
16.一种丝状真菌菌株,其包含:
(a)通过靶向整合经***第一串联构建体而修饰的内源性第一基因座,所述第一串联构建体包含(i)所述第一基因座的同源5’区、其同源侧翼区或其组合,(ii)一个或多个可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v)所述第一基因座的同源3’区、其同源侧翼区或其组合;
(b)通过靶向整合经***第二串联构建体而修饰的内源性第二基因座,所述第二串联构建体包含(i)所述第二基因座的同源5’区、其同源侧翼区或其组合,(ii)一个或多个可选择性标记物;(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v)所述第二基因座的同源3’区、其同源侧翼区或其组合;或
(c)(a)和(b)的组合。
17.根据权利要求16所述的丝状真菌菌株,其中所述第一基因座是编码选自以下的纤维二糖水解酶I的纤维二糖水解酶I基因:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶I,(ii)包含与SEQ ID NO:2的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶I,(iii)由包含与SEQ ID NO:1的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I;
并且其中所述第二基因座是编码选自以下的纤维二糖水解酶II的纤维二糖水解酶II基因:(i)包含SEQ ID NO:4的成熟多肽的纤维二糖水解酶II,(ii)包含与SEQ ID NO:4的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II,(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
18.根据权利要求16或17所述的丝状真菌菌株,其中一个或多个串联构建体还包含所述一个或多个可选择性标记物的5’侧翼的第一同源重复和所述一个或多个可选择性标记物的3’侧翼的第二同源重复,其中所述第一同源重复和所述第二同源重复进行同源重组,以切除所述一个或多个可选择性标记物。
19.一种在丝状真菌菌株中产生具有生物活性的多种重组多肽的方法,其包括:在有益于产生多肽的条件下培养丝状真菌宿主细胞,其中所述丝状真菌宿主细胞包含:
(a)通过靶向整合经***第一串联构建体而修饰的内源性第一基因座,所述第一串联构建体包含(i)所述第一基因座的同源5’区、其同源侧翼区或其组合,(ii)一个或多个可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v)所述第一基因座的同源3’区、其同源侧翼区或其组合;
(b)通过靶向整合经***第二串联构建体而修饰的内源性第二基因座,所述第二串联构建体包含(i)所述第二基因座的同源5’区、其同源侧翼区或其组合,(ii)一个或多个可选择性标记物;(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v)所述第二基因座的同源3’区、其同源侧翼区或其组合;或
(c)(a)和(b)的组合。
20.根据权利要求19所述的方法,其还包括回收所述多种重组多肽。
21.根据权利要求19或20所述的方法,其中所述第一基因座是编码选自以下的纤维二糖水解酶I的纤维二糖水解酶I基因:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶I,(ii)包含与SEQ ID NO:2的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶I,(iii)由包含与SEQ ID NO:1的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I;
并且其中所述第二基因座是编码选自以下的纤维二糖水解酶II的纤维二糖水解酶II基因:(i)包含SEQ ID NO:4的成熟多肽的纤维二糖水解酶II,(ii)包含与SEQ ID NO:4的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II,(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
22.根据权利要求19~21中任一项所述的方法,其中一个或多个串联构建体还包含所述一个或多个可选择性标记物的5’侧翼的第一同源重复和所述一个或多个可选择性标记物的3’侧翼的第二同源重复,其中所述第一同源重复和所述第二同源重复进行同源重组,以切除所述一个或多个可选择性标记物。
23.一种串联构建体,其包含:(i)基因座的同源5’区、其同源侧翼区或其组合;(ii)一个或多个第一可选择性标记物;(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸;(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸;和(v)所述基因座的同源3’区、其同源侧翼区或其组合。
24.根据权利要求23所述的串联构建体,所述基因座是编码选自以下的纤维二糖水解酶I的纤维二糖水解酶I基因:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶I,(ii)包含与SEQ ID NO:2的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶I,(iii)由包含与SEQ ID NO:1的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I;
或其中所述基因座是编码选自以下的纤维二糖水解酶II的纤维二糖水解酶II基因:(i)包含SEQ ID NO:4的成熟多肽的纤维二糖水解酶II,(ii)包含与SEQ ID NO:4的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II,(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ IDNO:3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
CN201810953356.5A 2011-08-24 2012-08-23 在丝状真菌宿主细胞中产生多种重组多肽的方法 Pending CN109136114A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161526809P 2011-08-24 2011-08-24
US61/526,809 2011-08-24
CN201280052277.8A CN103890180A (zh) 2011-08-24 2012-08-23 在丝状真菌宿主细胞中产生多种重组多肽的方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201280052277.8A Division CN103890180A (zh) 2011-08-24 2012-08-23 在丝状真菌宿主细胞中产生多种重组多肽的方法

Publications (1)

Publication Number Publication Date
CN109136114A true CN109136114A (zh) 2019-01-04

Family

ID=47358264

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201810953356.5A Pending CN109136114A (zh) 2011-08-24 2012-08-23 在丝状真菌宿主细胞中产生多种重组多肽的方法
CN201280052277.8A Pending CN103890180A (zh) 2011-08-24 2012-08-23 在丝状真菌宿主细胞中产生多种重组多肽的方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201280052277.8A Pending CN103890180A (zh) 2011-08-24 2012-08-23 在丝状真菌宿主细胞中产生多种重组多肽的方法

Country Status (7)

Country Link
US (3) US9493790B2 (zh)
EP (1) EP2748322A2 (zh)
CN (2) CN109136114A (zh)
AU (1) AU2012298799B2 (zh)
BR (1) BR112014004190A2 (zh)
IN (1) IN2014CN02136A (zh)
WO (1) WO2013028912A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114561303A (zh) * 2022-02-14 2022-05-31 大连理工大学 一株分泌高性能纤维素酶的里氏木霉工程菌株及其应用

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013028915A2 (en) * 2011-08-24 2013-02-28 Novozymes, Inc. Methods for obtaining positive transformants of a filamentous fungal host cell
WO2013028912A2 (en) 2011-08-24 2013-02-28 Novozymes, Inc. Methods for producing multiple recombinant polypeptides in a filamentous fungal host cell
AU2013207165B2 (en) 2012-01-05 2018-10-04 Glykos Finland Oy Protease deficient filamentous fungal cells and methods of use thereof
WO2013174927A1 (en) 2012-05-23 2013-11-28 Novartis International Pharmaceutical Limited Production of fucosylated glycoproteins
CN105980552A (zh) 2013-07-10 2016-09-28 诺华股份有限公司 多种蛋白酶缺陷的丝状真菌细胞及其使用方法
US20150147774A1 (en) * 2013-11-22 2015-05-28 National University Of Singapore Expression construct for yeast and a method of using the construct
EP3152315B1 (en) * 2014-06-06 2018-08-15 Novozymes A/S Enzyme compositions and uses thereof
SG11201700446XA (en) 2014-07-21 2017-02-27 Glykos Finland Oy Production of glycoproteins with mammalian-like n-glycans in filamentous fungi
ES2896153T3 (es) 2014-09-23 2022-02-24 Novozymes As Procedimientos para producir etanol y organismos de fermentación
EP3268482B1 (en) 2015-03-09 2019-12-11 Novozymes A/S Methods of introducing multiple expression constructs into a eukaryotic cell
EP3423577B1 (en) 2016-03-02 2024-05-08 Novozymes A/S Cellobiohydrolase variants and polynucleotides encoding same
WO2018093752A1 (en) * 2016-11-15 2018-05-24 Danisco Us Inc. Filamentous fungi with improved protein production
BR112019011612A2 (pt) 2016-12-06 2020-08-18 Novozymes A/S processos melhorados para a produção de etanol a partir de substratos celulósicos que contêm xilose com o uso de cepas de levedura geneticamente modificadas
WO2018220116A1 (en) 2017-05-31 2018-12-06 Novozymes A/S Xylose fermenting yeast strains and processes thereof for ethanol production
CN110730824A (zh) 2017-06-02 2020-01-24 诺维信公司 用于乙醇生产的改善的酵母
CN109988714B (zh) * 2017-12-29 2021-12-28 青岛蔚蓝生物集团有限公司 一种里氏木霉及其应用
CA3089135A1 (en) 2018-01-29 2019-08-01 Novozymes A/S Microorganisms with improved nitrogen utilization for ethanol production
EP3827088A1 (en) 2018-07-25 2021-06-02 Novozymes A/S Enzyme-expressing yeast for ethanol production
MX2021003955A (es) 2018-10-08 2021-05-27 Novozymes As Levadura que expresa enzimas para la produccion de etanol.
US20220064228A1 (en) * 2018-12-12 2022-03-03 Novozymes A/S Methods For Increasing The Productivity Of A Filamentous Fungal Cell In The Production Of A Polypeptide
EP4004029A1 (en) 2019-07-26 2022-06-01 Novozymes A/S Microorganisms with improved nitrogen transport for ethanol production
US20220307036A1 (en) 2019-08-06 2022-09-29 Novozymes A/S Fusion proteins for improved enzyme expression
CN110724643B (zh) * 2019-11-18 2022-07-15 河南省农业科学院植物保护研究所 一株具有防病促生功能的橘灰青霉及其菌剂和应用
CN115175923A (zh) 2019-12-10 2022-10-11 诺维信公司 用于改善的戊糖发酵的微生物
MX2023002490A (es) 2020-09-04 2023-03-09 Novozymes As Organismo fermentador mejorado para la produccion de etanol.
WO2022261003A1 (en) 2021-06-07 2022-12-15 Novozymes A/S Engineered microorganism for improved ethanol fermentation
WO2024064901A2 (en) 2022-09-23 2024-03-28 Novozymes A/S Improved fermenting organism for ethanol production

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007136865A2 (en) * 2006-05-19 2007-11-29 Glycofi, Inc Recombinant vectors
WO2010039889A2 (en) * 2008-09-30 2010-04-08 Novozymes, Inc. Methods for using positively and negatively selectable genes in a filamentous fungal cell
CN101970651A (zh) * 2007-05-31 2011-02-09 诺维信股份有限公司 用于降解纤维素材料的组合物

Family Cites Families (115)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI864473A (fi) * 1985-11-20 1987-05-21 Panlabs Inc Sammansatta yttryckskassetter foer fungaltransformering.
DK122686D0 (da) 1986-03-17 1986-03-17 Novo Industri As Fremstilling af proteiner
US5989870A (en) 1986-04-30 1999-11-23 Rohm Enzyme Finland Oy Method for cloning active promoters
US5648263A (en) 1988-03-24 1997-07-15 Novo Nordisk A/S Methods for reducing the harshness of a cotton-containing fabric
DK115890D0 (da) 1990-05-09 1990-05-09 Novo Nordisk As Enzym
ES2170748T3 (es) 1990-10-05 2002-08-16 Genencor Int Procedimientos para el tratamiento de tejidos que contienen algodon con celulasa.
DE69333747T2 (de) * 1992-07-31 2005-12-29 Ab Enzymes Gmbh Rekombinante zelle, dna-konstruktionen, vektoren und methoden zur expression von phytatabbauenden enzymen in gewünschten verhältnissen
ATE258224T1 (de) 1993-03-10 2004-02-15 Novozymes As Enzyme mit xylanaseaktivität aus aspergillus aculeatus
WO1995033836A1 (en) 1994-06-03 1995-12-14 Novo Nordisk Biotech, Inc. Phosphonyldipeptides useful in the treatment of cardiovascular diseases
EP1559776A3 (en) 1994-06-30 2006-01-11 Novozymes Biotech, Inc. Non-toxic, non-toxigenic, non-pathogenic Fusarium expression system and promoters and terminators for use therein
US6060305A (en) * 1994-06-30 2000-05-09 Novo Nordisk Biotech, Inc. Non-toxic, non-toxigenic, non-pathogenic Fusarium expression system
US20030044956A1 (en) 1995-08-23 2003-03-06 Short Jay M. Enzymes having carboxymethyl cellulase activity and methods of use thereof
AU1750697A (en) 1996-01-19 1997-08-11 Novo Nordisk Biotech, Inc. Morphological mutants of filamentous fungi
AU4424597A (en) * 1996-09-13 1998-04-02 Novo Nordisk Biotech, Inc. Cells having dna insertion mutations which produce altered amounts of a polypeptide
US6451063B1 (en) 1996-09-25 2002-09-17 Genencor International, Inc. Cellulase for use in industrial processes
US6017870A (en) 1996-10-09 2000-01-25 Genencor International, Inc. Purified cellulase and method of producing
US7883872B2 (en) 1996-10-10 2011-02-08 Dyadic International (Usa), Inc. Construction of highly efficient cellulase compositions for enzymatic hydrolysis of cellulose
US5811381A (en) 1996-10-10 1998-09-22 Mark A. Emalfarb Cellulase compositions and methods of use
US6265204B1 (en) * 1997-01-17 2001-07-24 Genencor International, Inc. DNA sequences, vectors, and fusion polypeptides for secretion of polypeptides in filamentous fungi
US6558937B1 (en) 1997-07-31 2003-05-06 Dsm N.V. Cellulose degrading enzymes of aspergillus
US5871550A (en) 1997-08-26 1999-02-16 Genencor International, Inc. Mutant Thermonospora spp. cellulase
ES2267200T3 (es) 1997-11-19 2007-03-01 Genencor International, Inc. Celulasa producida por actinomycetes y metodo para producirla.
CA2315017C (en) 1997-12-16 2011-10-11 Genencor International, Inc. Novel egiii-like enzymes, dna encoding such enzymes and methods for producing such enzymes
ES2143408B1 (es) * 1998-04-02 2000-12-01 Urquima Sa Promotor y construcciones para expresion de proteinas recombinantes en hongos filamentosos.
AU4188099A (en) * 1998-05-15 1999-12-06 Novo Nordisk A/S Methods for producing polypeptides in filamentous fungal mutant cells
JP4620253B2 (ja) 1999-03-22 2011-01-26 ノボザイムス,インコーポレイティド 菌類細胞中で遺伝子を発現させるためのプロモーター
US20060075519A1 (en) 2001-05-18 2006-04-06 Novozymes A/S Polypeptides having cellobiase activity and ploynucleotides encoding same
US6982159B2 (en) 2001-09-21 2006-01-03 Genencor International, Inc. Trichoderma β-glucosidase
US7056721B2 (en) 2001-12-18 2006-06-06 Genencor International, Inc. EGVI endoglucanase and nucleic acids encoding the same
US7045332B2 (en) 2001-12-18 2006-05-16 Genencor International, Inc. BGL4 β-glucosidase and nucleic acids encoding the same
US7045331B2 (en) 2001-12-18 2006-05-16 Genencor International, Inc. EGVII endoglucanase and nucleic acids encoding the same
US7049125B2 (en) 2001-12-18 2006-05-23 Genencor International, Inc. EGVIII endoglucanase and nucleic acids encoding the same
US7005289B2 (en) 2001-12-18 2006-02-28 Genencor International, Inc. BGL5 β-glucosidase and nucleic acids encoding the same
DK1578943T3 (da) 2002-08-16 2012-01-09 Danisco Us Inc Nye variant-Hypocrea jecorina-CBH1-cellulaser
EP1556512B1 (en) 2002-11-07 2016-06-15 Danisco US Inc. Bgl6 beta-glucosidase and nucleic acids encoding the same
US7407788B2 (en) 2002-11-21 2008-08-05 Danisco A/S, Genencor Division BGL7 beta-glucosidase and nucleic acids encoding the same
JP2007534294A (ja) 2003-03-21 2007-11-29 ジェネンコー・インターナショナル・インク Cbh1相同体及び変異体cbh1セルラーゼ
CA2771875A1 (en) 2003-04-01 2005-01-06 Danisco Us Inc. Variant hypocrea jecorina cbh1
ES2393058T3 (es) 2003-05-02 2012-12-18 Novozymes Inc. Variantes de beta-glucosidasa
ES2340588T3 (es) 2003-05-29 2010-06-07 Genencor Int Genes nuevos de trichoderma.
US7244605B2 (en) 2003-10-28 2007-07-17 Novozymes, Inc. Polypeptides having beta-glucosidase activity and polynucleotides encoding same
ES2469874T3 (es) 2004-01-30 2014-06-20 Novozymes Inc Polip�ptidos con actividad de mejora celulol�tica y polinucle�tidos que los codifican
US7271244B2 (en) 2004-02-06 2007-09-18 Novozymes, Inc. Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
WO2006078256A2 (en) 2004-02-12 2006-07-27 Novozymes, Inc. Polypeptides having xylanase activity and polynucleotides encoding same
US8097445B2 (en) 2004-03-25 2012-01-17 Danisco Us Inc. Exo-endo cellulase fusion protein
CN1930294A (zh) 2004-03-25 2007-03-14 金克克国际有限公司 纤维素酶融合蛋白和编码该纤维素酶融合蛋白的异源纤维素酶融合构建物
US8008056B2 (en) 2004-12-30 2011-08-30 Danisco Us Inc. Variant Hypocrea jecorina CBH2 cellulases
MX2007008050A (es) 2005-01-06 2007-08-21 Novozymes Inc Polipeptidos que tienen actividad de celobiohidrolasa y polinucleotidos que codifican para los mismos.
AR053066A1 (es) 2005-04-26 2007-04-18 Novozymes As Arabinofuranosidasas
PT1874927E (pt) 2005-04-29 2014-04-23 Ab Enzymes Oy Celulases melhoradas
EP1928901B1 (en) 2005-08-04 2011-06-15 Novozymes, Inc. Polypeptides having beta-glucosidase activity and polynucleotides encoding same
BRPI0616721A2 (pt) 2005-09-30 2011-06-28 Novozymes Inc métodos para degradar ou converter um material celulósico e para produzir uma substáncia, e, composição detergente
FI120045B (fi) 2005-12-22 2009-06-15 Roal Oy Selluloosamateriaalin käsittely ja siinä käyttökelpoiset entsyymit
WO2007071820A1 (en) 2005-12-22 2007-06-28 Ab Enzymes Oy Novel enzymes
US8304212B2 (en) 2006-07-10 2012-11-06 Dyadic International, Inc. Methods and compositions for degradation of lignocellulosic material
GB0614442D0 (en) * 2006-07-20 2006-08-30 Fluxome Sciences As Metabolically engineered cells for the production of pinosylvin
US8546106B2 (en) 2006-07-21 2013-10-01 Novozymes, Inc. Methods of increasing secretion of polypeptides having biological activity
EP2102366A4 (en) * 2006-12-10 2010-01-27 Dyadic International Inc EXPRESSION AND HIGH-DROP SCREENING OF COMPLEX EXPRESSED DNA LIBRARIES IN FADENED MUSHROOMS
CA2687609A1 (en) 2007-05-31 2008-12-04 Novozymes, Inc. Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
MX2009012845A (es) 2007-05-31 2009-12-15 Novozymes Inc Metodos para aumentar la actividad celulosica mejorada de un polipeptido.
EP2195424B1 (en) 2007-09-28 2018-11-14 Novozymes A/S Polypeptides having cellobiohydrolase ii activity and polynucleotides encoding same
DK2195421T3 (en) 2007-09-28 2015-12-14 Novozymes As Polypeptides with acetylxylanesteraseaktivitet and polynucleotides encoding them
DK2215224T3 (da) 2007-11-27 2014-01-27 Novozymes As Polypeptider med alfa-glucuronidaseaktivitet og polynukleotider, der koder for dem
US8034599B2 (en) 2007-11-30 2011-10-11 Novozymes A/S Polypeptides having arabinofuranosidase activity and polynucleotides encoding same
BRPI0820102A2 (pt) 2007-12-05 2017-05-23 Novozymes As polipeptídeo isolado, construção de ácido nucléico, célula hospedeira recombinante, métodos de produzir o polipeptídeo, de produzir um mutante de uma célula precursora, de inibir a expressão de um polipeptídeo tendo atividade de xilanase em uma célula, de produzir uma proteína e para degradar um material cotendo xilano, célula mutante, planta transgênica, parte de planta ou célula vegetal, e, molécula de rna inibidora de filamento duplo
EP2224822B1 (en) 2007-12-06 2014-05-21 Novozymes A/S Polypeptides having acetylxylan esterase activity and polynucleotides encoding same
CN101939420A (zh) 2007-12-07 2011-01-05 诺维信公司 具有阿魏酸酯酶活性的多肽和编码该多肽的多核苷酸
EP2245050A2 (en) 2007-12-19 2010-11-03 Novozymes A/S Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
CN101945889A (zh) 2007-12-19 2011-01-12 诺维信公司 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸
JP2011507525A (ja) 2007-12-19 2011-03-10 ノボザイムス アクティーゼルスカブ セルロース分解増強活性を有するポリペプチドとこれをコードするポリヌクレオチド
CA2709367A1 (en) 2007-12-19 2009-07-09 Novozymes A/S Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
EP2247609A1 (en) * 2008-02-25 2010-11-10 Novozymes A/S Method for increasing expression yield of a protein of interest
CA2721108A1 (en) 2008-04-17 2009-10-22 Novozymes A/S Polypeptides having ferulic acid esterase activity and polynucleotides encoding same
US8735128B2 (en) 2008-07-29 2014-05-27 Novozymes A/S Polypeptides having alpha-glucuronidase activity and polynucleotides encoding same
CA2732099A1 (en) 2008-07-31 2010-02-04 Novozymes A/S Polypeptides having acetylxylan esterase activity and polynucleotides encoding same
WO2010039840A1 (en) 2008-09-30 2010-04-08 Novozymes, Inc. Methods for producing polypeptides in enzyme-deficient mutants of fusarium venenatum
EP2356136A1 (en) 2008-11-10 2011-08-17 Novozymes Inc. Polypeptides having feruloyl esterase activity and polynucleotides encoding same
US8805427B2 (en) 2008-11-14 2014-08-12 Microsoft Corporation Channel reuse with cognitive low interference signals
CN102300986A (zh) 2008-12-04 2011-12-28 诺维信股份有限公司 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸
EP2373684A1 (en) 2008-12-04 2011-10-12 Novozymes Inc. Polypeptides having feruloyl esterase activity and polynucleotides encoding same
US8604277B2 (en) 2009-01-28 2013-12-10 Novozymes, Inc. Polypeptides having beta-glucosidase activity and polynucleotides encoding same
WO2010108918A1 (en) 2009-03-24 2010-09-30 Novozymes A/S Polypeptides having acetyl xylan esterase activity and polynucleotides encoding same
CN102482680B (zh) 2009-04-30 2014-09-10 诺维信股份有限公司 具有木聚糖酶活性的多肽和编码该多肽的多核苷酸
DK2435561T3 (en) 2009-05-29 2018-11-05 Novozymes Inc PROCEDURES FOR IMPROVING THE DEGRADATION OR CONVERSION OF CELLULOSE SUBSTANCES
CN104480088A (zh) 2009-06-02 2015-04-01 诺维信股份有限公司 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸
US8143021B2 (en) 2009-07-07 2012-03-27 Novozymes, Inc. Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
EP3269804B1 (en) 2009-09-17 2020-11-11 Novozymes, Inc. Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
CN102712916B (zh) 2009-09-18 2015-11-25 诺维信股份有限公司 具有β-葡糖苷酶活性的多肽和编码该多肽的多核苷酸
DK2483403T3 (en) 2009-09-29 2018-02-12 Novozymes Inc POLYPEPTIDES WITH XYLANASE ACTIVITY AND POLYNUCLEOTIDES CODING THEM
MX2012003473A (es) 2009-09-29 2012-05-22 Novozymes Inc Polipeptidos que tienen actividad celulitica mejorada y polinucleotidos que codifican para los mismos.
US8586829B2 (en) 2009-09-30 2013-11-19 Novozymes A/S Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
US8586827B2 (en) 2009-09-30 2013-11-19 Novozymes, Inc. Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
WO2011050037A1 (en) * 2009-10-23 2011-04-28 Novozymes, Inc. Cellobiohydrolase variants and polynucleotides encoding same
CN102666847B (zh) 2009-10-29 2015-12-09 诺维信股份有限公司 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸
EP2496692B1 (en) 2009-11-06 2016-03-16 Novozymes, Inc. Polypeptides having xylanase activity and polynucleotides encoding same
EP2496694B1 (en) 2009-11-06 2017-04-19 Novozymes, Inc. Compositions for saccharification of cellulosic material
CN102762714B (zh) 2009-12-18 2015-11-25 诺维信股份有限公司 用于在木霉属的蛋白酶缺陷突变体中产生多肽的方法
EP2371963A1 (en) * 2010-03-29 2011-10-05 Heinrich-Heine-Universität Düsseldorf Protein production in filamentous fungi
EP2558566A4 (en) * 2010-04-14 2013-10-02 Penn State Res Found TRANSGENIC HANDLING STRATEGIES OF FILAMENTOUS FUNGI
KR20130119945A (ko) * 2010-11-22 2013-11-01 노보자임스 인코포레이티드 3-히드록시프로피온산 생산을 위한 조성물 및 방법
WO2013024710A1 (ja) * 2011-08-12 2013-02-21 国立大学法人東北大学 免疫応答を回避するための薬剤
WO2013028915A2 (en) * 2011-08-24 2013-02-28 Novozymes, Inc. Methods for obtaining positive transformants of a filamentous fungal host cell
WO2013028912A2 (en) * 2011-08-24 2013-02-28 Novozymes, Inc. Methods for producing multiple recombinant polypeptides in a filamentous fungal host cell
WO2013067028A1 (en) * 2011-10-31 2013-05-10 Bp Corporation North America Inc. Use of mammalian promoters in filamentous fungi
US20140303036A1 (en) * 2011-11-23 2014-10-09 Dsm Ip Assets B.V. Nucleic Acid Assembly System
EP2808388B1 (en) * 2012-01-23 2019-03-13 AGC Inc. Expression vector and method for producing protein
US10023872B2 (en) * 2012-12-21 2018-07-17 Novozymes, Inc. Methods for producing heterologous polypeptides in mutants of trichoderma
EP2964760B1 (en) * 2013-03-08 2021-05-12 Novozymes A/S Cellobiohydrolase variants and polynucleotides encoding same
WO2014145768A2 (en) * 2013-03-15 2014-09-18 Bp Corporation North America Inc. Use of non-fungal 5' utrs in filamentous fungi
EP2840139A1 (en) * 2013-08-23 2015-02-25 Wageningen Universiteit Method for the single step introduction of a plurality of genes in microbial cells
EP3152315B1 (en) * 2014-06-06 2018-08-15 Novozymes A/S Enzyme compositions and uses thereof
US20170260520A1 (en) * 2014-08-20 2017-09-14 Novozymes A/S Recombinase-Mediated Integration Of A Polynucleotide Library
EP3268482B1 (en) * 2015-03-09 2019-12-11 Novozymes A/S Methods of introducing multiple expression constructs into a eukaryotic cell
CN110431224A (zh) * 2017-03-13 2019-11-08 帝斯曼知识产权资产管理有限公司 锌双核簇转录调控因子缺陷型菌株
CN110719956A (zh) * 2017-06-06 2020-01-21 齐默尔根公司 用于改良真菌菌株的高通量基因组工程改造平台

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007136865A2 (en) * 2006-05-19 2007-11-29 Glycofi, Inc Recombinant vectors
CN101970651A (zh) * 2007-05-31 2011-02-09 诺维信股份有限公司 用于降解纤维素材料的组合物
WO2010039889A2 (en) * 2008-09-30 2010-04-08 Novozymes, Inc. Methods for using positively and negatively selectable genes in a filamentous fungal cell

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114561303A (zh) * 2022-02-14 2022-05-31 大连理工大学 一株分泌高性能纤维素酶的里氏木霉工程菌株及其应用
CN114561303B (zh) * 2022-02-14 2023-11-17 大连理工大学 一株分泌高性能纤维素酶的里氏木霉工程菌株及其应用

Also Published As

Publication number Publication date
BR112014004190A2 (pt) 2017-03-01
US10301610B2 (en) 2019-05-28
WO2013028912A2 (en) 2013-02-28
US10822601B2 (en) 2020-11-03
EP2748322A2 (en) 2014-07-02
CN103890180A (zh) 2014-06-25
US20190249161A1 (en) 2019-08-15
US20170015986A1 (en) 2017-01-19
AU2012298799A1 (en) 2014-02-13
WO2013028912A3 (en) 2013-06-06
US9493790B2 (en) 2016-11-15
US20140212977A1 (en) 2014-07-31
IN2014CN02136A (zh) 2015-05-29
AU2012298799B2 (en) 2018-02-01

Similar Documents

Publication Publication Date Title
CN109136114A (zh) 在丝状真菌宿主细胞中产生多种重组多肽的方法
US11713476B2 (en) Compositions for saccharification of cellulosic material
AU2019200618B2 (en) Cellulolytic enzyme compositions and uses thereof
DK2802651T3 (en) GH61 POLYPEPTIDE VARIATIONS AND POLYNUCLEOTIDES CODING THEM
US10308967B2 (en) Milling process
DK2841567T3 (en) GH61 polypeptide variants and polynucleotides encoding them
US20230183385A1 (en) Wheat Milling Process and GH8 Xylanases
EP3894565A1 (en) Methods for increasing the productivity of a filamentous fungal cell in the production of a polypeptide
US10647972B2 (en) Methods for obtaining positive transformants of a filamentous fungal host cell
US20230242960A1 (en) Mutants of a filamentous fungal cell having increased productivity in the production of a polypeptide

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190104