CN111500474B - 用于在木霉属的蛋白酶缺陷突变体中产生多肽的方法 - Google Patents

用于在木霉属的蛋白酶缺陷突变体中产生多肽的方法 Download PDF

Info

Publication number
CN111500474B
CN111500474B CN201911359760.0A CN201911359760A CN111500474B CN 111500474 B CN111500474 B CN 111500474B CN 201911359760 A CN201911359760 A CN 201911359760A CN 111500474 B CN111500474 B CN 111500474B
Authority
CN
China
Prior art keywords
seq
polypeptide
trichoderma reesei
serine protease
strain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911359760.0A
Other languages
English (en)
Other versions
CN111500474A (zh
Inventor
S.梅宇兰
A.詹
K.布朗
S.梅里诺
J.沙斯基
E.阿巴特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novozymes Inc
Original Assignee
Novozymes Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novozymes Inc filed Critical Novozymes Inc
Priority to CN201911359760.0A priority Critical patent/CN111500474B/zh
Publication of CN111500474A publication Critical patent/CN111500474A/zh
Application granted granted Critical
Publication of CN111500474B publication Critical patent/CN111500474B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/58Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/02Preparation of hybrid cells by fusion of two or more cells, e.g. protoplast fusion
    • C12N15/04Fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Mycology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Detergent Compositions (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明涉及用于在木霉属的蛋白酶缺陷突变体中产生多肽的方法,具体涉及亲本木霉属菌株的突变体,其包含多核苷酸,所述多核苷酸编码多肽和一个或多个选自下组的基因:第一和第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第一和第二天冬氨酸蛋白酶基因,胰蛋白酶样丝氨酸蛋白酶基因,其中一个或多个基因经修饰使得突变体菌株当在相同条件下培养时,相对于亲本木霉属菌株,分别在一种或多种选自下组的酶的产生方面有缺陷:第一和第二枯草杆菌蛋白酶样丝氨酸蛋白酶,第一和第二天冬氨酸蛋白酶,和胰蛋白酶样丝氨酸蛋白酶。本发明还涉及产生此类突变体中的多肽的方法,和用于产生此类突变体的方法。

Description

用于在木霉属的蛋白酶缺陷突变体中产生多肽的方法
本发明申请是基于申请日为2010年12月17日,申请号为“201510645406.X”、名称为“用于在木霉属的蛋白酶缺陷突变体中产生多肽的方法”的发明专利申请的分案申请。
涉及序列表
本申请包含计算机可读形式的序列表,其通过提述并入本文。
发明背景
技术领域
本发明涉及在蛋白酶缺陷的木霉属(Trichoderma)突变体菌株中产生多肽的方法,涉及所述蛋白酶缺陷的木霉属突变体菌株,并涉及获得所述蛋白酶缺陷的木霉属突变体菌株的方法。
背景技术
已显示木霉属可用作宿主细胞以供重组产生具有生物活性的多肽(WO96/00787,WO 97/26330)。具有所需的蛋白表达和分泌增加的性状的木霉属宿主不一定具有对于成功的发酵最需要的特征。由于生物物质例如酶的产生对感兴趣的具体多肽的产生、回收或应用有害,发酵可能不是最佳的。
Martinez等,2008,Nature Biotechnology 26:553-560描述了生物质降解真菌里氏木霉(Trichoderma reesei)的基因组测序和分析。Dienes等,2007,Enzyme andMicrobial Technology 40:1087-1094公开了从里氏木霉QM9414鉴定胰蛋白酶样丝氨酸蛋白酶。Eneyskaya等,1999,Appl.Microbiol.Biotechnol.52:226-231描述了来自里氏木霉的酸性蛋白酶。Haub等,1990,J。Biotechnology 16:187-198公开了从里氏木霉QM9414形成胞外蛋白酶。Hagspiel等,1989,Appl.Microbiol.Biotechnol.32:61-67公开了来自里氏木霉QM9414选择体(selectant)的蛋白酶活性和纤维素酶的蛋白水解修饰。WO2006/073839公开了真菌酸性蛋白酶。
WO 2007/045248描述了真菌突变体用于表达异源多肽的用途。
本发明涉及改善的木霉属宿主,其结合了表达商业量的感兴趣的多肽的能力,而在可使得所述多肽的回收和下游加工复杂化的蛋白酶的产生方面有缺陷。
发明内容
本发明涉及亲本木霉属菌株的突变体,其包含编码多肽的多核苷酸,和一种或多种(几种)选自下组的基因:第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第一天冬氨酸蛋白酶基因,胰蛋白酶样丝氨酸蛋白酶基因,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因,和第二天冬氨酸蛋白酶基因,其中所述一种或多种(几种)基因经修饰,使得突变体菌株在相同条件下培养时,与亲本木霉属菌株相比,分别在一种或多种(几种)选自下组的酶的产生方面有缺陷:第一枯草杆菌蛋白酶样丝氨酸蛋白酶,第一天冬氨酸蛋白酶,胰蛋白酶样丝氨酸蛋白酶,第二枯草杆菌蛋白酶样丝氨酸蛋白酶,和第二天冬氨酸蛋白酶。
本发明还涉及产生多肽的方法,包括:
(a)在用于产生所述多肽的培养基中培养亲本木霉属菌株的突变体,其中所述突变体菌株包含编码所述多肽的多核苷酸,和一种或多种(几种)选自下组的基因:第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第一天冬氨酸蛋白酶基因,胰蛋白酶样丝氨酸蛋白酶基因,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因,和第二天冬氨酸蛋白酶基因,其中所述一种或多种(几种)基因经修饰,使得突变体菌株在相同条件下培养时,与亲本木霉属菌株相比,分别在一种或多种(几种)选自下组的酶的产生方面有缺陷:第一枯草杆菌蛋白酶样丝氨酸蛋白酶,第一天冬氨酸蛋白酶,胰蛋白酶样丝氨酸蛋白酶,第二枯草杆菌蛋白酶样丝氨酸蛋白酶,和第二天冬氨酸蛋白酶;和
(b)从所述培养基回收所述多肽。
本发明进一步涉及获得亲本木霉属菌株的突变体的方法,包括:
(a)修饰一种或多种(几种)选自下组的基因:第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第一天冬氨酸蛋白酶基因,胰蛋白酶样丝氨酸蛋白酶基因,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因,和第二天冬氨酸蛋白酶基因;和
(b)鉴定来自步骤(a)的突变体菌株,其中所述一种或多种(几种)选自下组的基因经修饰:第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第一天冬氨酸蛋白酶基因,胰蛋白酶样丝氨酸蛋白酶基因,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因,和第二天冬氨酸蛋白酶基因,使得突变体菌株在相同条件下培养时,与亲本木霉属菌株相比,分别在一种或多种(几种)选自下组的酶的产生方面有缺陷:第一枯草杆菌蛋白酶样丝氨酸蛋白酶,第一天冬氨酸蛋白酶,胰蛋白酶样丝氨酸蛋白酶,第二枯草杆菌蛋白酶样丝氨酸蛋白酶,和第二天冬氨酸蛋白酶。
具体地,本发明涉及如下各项:
1.一种亲本木霉属(Trichoderma)菌株的突变体,其包含编码多肽的多核苷酸和一个或多个(几个)选自下组的基因:第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第一天冬氨酸蛋白酶基因,胰蛋白酶样丝氨酸蛋白酶基因,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因,和第二天冬氨酸蛋白酶基因,其中所述一个或多个(几个)基因经修饰使得突变体菌株当在相同条件下培养时,相对于亲本木霉属菌株,分别在选自下组的一种或多种(几种)酶的产生方面有缺陷:第一枯草杆菌蛋白酶样丝氨酸蛋白酶,第一天冬氨酸蛋白酶,胰蛋白酶样丝氨酸蛋白酶,第二枯草杆菌蛋白酶样丝氨酸蛋白酶,和第二天冬氨酸蛋白酶。
2.项1的突变体,其包含第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第一天冬氨酸蛋白酶基因,胰蛋白酶样丝氨酸蛋白酶基因,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因,和第二天冬氨酸蛋白酶基因的修饰。
3.项1或2的突变体,其中所述多肽对于木霉属菌株是天然或外源的。
4.项1-3任一项的突变体,其中所述木霉属菌株选自下组:哈茨木霉(Trichodermaharzianum),康宁木霉(Trichoderma koningii),长枝木霉(Trichodermalongibrachiatum),里氏木霉(Trichoderma reesei),和绿色木霉(Trichoderma viride)。
5.项1-4任一项的突变体,其中所述木霉属菌株是里氏木霉。
6.项1-5任一项的突变体,当其在相同条件下培养时,相对于亲本木霉属菌株,完全缺陷或产生少至少25%的选自下组的一种或多种(几种)酶:第一枯草杆菌蛋白酶样丝氨酸蛋白酶,第一天冬氨酸蛋白酶,胰蛋白酶样丝氨酸蛋白酶,第二枯草杆菌蛋白酶样丝氨酸蛋白酶,和第二天冬氨酸蛋白酶。
7.项1-6任一项的突变体,其中所述第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因选自下组:
(a)多肽,其包含氨基酸序列或由氨基酸序列组成,所述氨基酸序列与SEQ ID NO:2或其成熟多肽具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性;
(b)多肽,其由多核苷酸编码,所述多核苷酸在至少低严格条件,至少中等严格条件,至少中-高严格条件,至少高严格条件,或至少非常高严格条件下与以下杂交:(i)SEQID NO:1;(ii)SEQ ID NO:1的成熟多肽编码序列,(iii)(i)或(ii)的cDNA序列,或(iv)(i),(ii),或(iii)的全长互补链;和
(c)多肽,其由多核苷酸编码,所述多核苷酸包含核苷酸序列或由核苷酸序列组成,所述核苷酸序列与SEQ ID NO:1或其cDNA,或它们的成熟多肽编码序列具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性。
8.项1-7任一项的突变体,其中所述第一天冬氨酸蛋白酶基因选自下组:
(a)多肽,其包含氨基酸序列,所述氨基酸序列与SEQ ID NO:4或其成熟多肽具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性;
(b)多肽,其由多核苷酸编码,所述多核苷酸在至少低严格条件,至少中等严格条件,至少中-高严格条件,至少高严格条件,或至少非常高严格条件下与以下杂交:(i)SEQID NO:3;(ii)SEQ ID NO:3的成熟多肽编码序列,(iii)(i)或(ii)的cDNA序列,或(iv)(i),(ii),或(iii)的全长互补链;和
(c)多肽,其由多核苷酸编码,所述多核苷酸包含核苷酸序列,所述核苷酸序列与SEQ ID NO:3或其cDNA,或它们的成熟多肽编码序列具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性。
9.项1-8任一项的突变体,其中所述胰蛋白酶样丝氨酸蛋白酶基因选自下组:
(a)多肽,其包含氨基酸序列,所述氨基酸序列与SEQ ID NO:6或其成熟多肽具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性;
(b)多肽,其由多核苷酸编码,所述多核苷酸在至少低严格条件,至少中等严格条件,至少中-高严格条件,至少高严格条件,或至少非常高严格条件下与以下杂交:(i)SEQID NO:5;(ii)SEQ ID NO:5的成熟多肽编码序列,(iii)包含于(i)或(ii)的cDNA序列,或(iv)(i),(ii),或(iii)的全长互补链;和
(c)多肽,其由多核苷酸编码,所述多核苷酸包含核苷酸序列,所述核苷酸序列与SEQ ID NO:5或其cDNA,或它们的成熟多肽编码序列具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性。
10.项1-9任一项的突变体,其中所述第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因选自下组:
(a)多肽,其包含氨基酸序列或由氨基酸序列组成,所述氨基酸序列与SEQ ID NO:100或其成熟多肽具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性;
(b)多肽,其由多核苷酸编码,所述多核苷酸在至少低严格条件,至少中等严格条件,至少中-高严格条件,至少高严格条件,或至少非常高严格条件下与以下杂交:(i)SEQID NO:99;(ii)SEQ ID NO:99的成熟多肽编码序列,(iii)(i)或(ii)的cDNA序列,或(iv)(i),(ii),或(iii)的全长互补链;和
(c)多肽,其由多核苷酸编码,所述多核苷酸包含核苷酸序列或由核苷酸序列组成,所述核苷酸序列与SEQ ID NO:100或其cDNA,或它们的成熟多肽编码序列具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性。
11.项1-10任一项的突变体,其中所述第二天冬氨酸蛋白酶基因选自下组:
(a)多肽,其包含氨基酸序列,所述氨基酸序列与SEQ ID NO:108或其成熟多肽具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性;
(b)多肽,其由多核苷酸编码,所述多核苷酸在至少低严格条件,至少中等严格条件,至少中-高严格条件,至少高严格条件,或至少非常高严格条件下与以下杂交:(i)SEQID NO:3;(ii)SEQ ID NO:107的成熟多肽编码序列,(iii)(i)或(ii)的cDNA序列,或(iv)(i),(ii),或(iii)的全长互补链;和
(c)多肽,其由多核苷酸编码,所述多核苷酸包含核苷酸序列,所述核苷酸序列与SEQ ID NO:107或其cDNA,或它们的成熟多肽编码序列具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性。
12.一种产生多肽的方法,其包括:
(a)在用于产生多肽的培养基中培养项1-11任一项的突变体;和
(b)从培养基回收所述多肽。
13.一种用于获得亲本木霉属菌株的突变体的方法,其包括:
(a)修饰一个或多个(几个)选自下组的基因:第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第一天冬氨酸蛋白酶基因,胰蛋白酶样丝氨酸蛋白酶基因,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因,和第二天冬氨酸蛋白酶基因;和
(b)鉴定来自步骤(a)的突变体菌株,其中一个或多个(几个)选自下组的基因经修饰:第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第一天冬氨酸蛋白酶基因,和胰蛋白酶样丝氨酸蛋白酶基因,使得突变体菌株当在相同条件下培养时,相对于亲本木霉属菌株,分别在一种或多种(几种)选自下组的酶的产生方面有缺陷:第一枯草杆菌蛋白酶样丝氨酸蛋白酶,第一天冬氨酸蛋白酶,胰蛋白酶样丝氨酸蛋白酶,第二枯草杆菌蛋白酶样丝氨酸蛋白酶,和第二天冬氨酸蛋白酶。
14.项13的方法,其中所述突变体包含第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第一天冬氨酸蛋白酶基因,胰蛋白酶样丝氨酸蛋白酶基因,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因,和第二天冬氨酸蛋白酶基因的修饰。
15.项13或14的方法,其中所述突变体菌株当在相同条件下培养时,相对于亲本木霉属菌株,完全缺陷或产生少至少25%的一种或多种(几种)选自下组的酶:第一枯草杆菌蛋白酶样丝氨酸蛋白酶,第一天冬氨酸蛋白酶,胰蛋白酶样丝氨酸蛋白酶,第二枯草杆菌蛋白酶样丝氨酸蛋白酶,和第二天冬氨酸蛋白酶。
16.项13-15任一项的方法,其中所述第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因选自下组:
(a)多肽,其包含氨基酸序列或由氨基酸序列组成,所述氨基酸序列与SEQ ID NO:2或其成熟多肽具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性;
(b)多肽,其由多核苷酸编码,所述多核苷酸在至少低严格条件,至少中等严格条件,至少中-高严格条件,至少高严格条件,或至少非常高严格条件下与以下杂交:(i)SEQID NO:1;(ii)SEQ ID NO:1的成熟多肽编码序列,(iii)(i)或(ii)的cDNA序列,或(iv)(i),(ii),或(iii)的全长互补链;和
(c)多肽,其由多核苷酸编码,所述多核苷酸包含核苷酸序列或由核苷酸序列组成,所述核苷酸序列与SEQ ID NO:1或其cDNA,或它们的成熟多肽编码序列具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性。
17.项13-16任一项的方法,其中第一天冬氨酸蛋白酶基因选自下组:
(a)多肽,其包含氨基酸序列,所述氨基酸序列与SEQ ID NO:4或其成熟多肽具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性;
(b)多肽,其由多核苷酸编码,所述多核苷酸在至少低严格条件,至少中等严格条件,至少中-高严格条件,至少高严格条件,或至少非常高严格条件下与以下杂交:(i)SEQID NO:3;(ii)SEQ ID NO:3的成熟多肽编码序列,(iii)(i)或(ii)的cDNA序列,或(iv)(i),(ii),或(iii)的全长互补链;和
(c)多肽,其由多核苷酸编码,所述多核苷酸包含核苷酸序列,所述核苷酸序列与SEQ ID NO:3或其cDNA,或它们的成熟多肽编码序列具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性。
18.项13-17任一项的方法,其中所述胰蛋白酶样丝氨酸蛋白酶基因选自下组:
(a)多肽,其包含氨基酸序列,所述氨基酸序列与SEQ ID NO:6或其成熟多肽具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性;
(b)多肽,其由多核苷酸编码,所述多核苷酸在至少低严格条件,至少中等严格条件,至少中-高严格条件,高严格条件,或非常高严格条件下与以下杂交:(i)SEQ ID NO:5;(ii)SEQ ID NO:5的成熟多肽编码序列,(iii)包含于(i)或(ii)的cDNA序列,或(iv)(i),(ii),或(iii)的全长互补链;和
(c)多肽,其由多核苷酸编码,所述多核苷酸包含核苷酸序列,所述核苷酸序列与SEQ ID NO:5或其cDNA,或它们的成熟多肽编码序列具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性。
19.项13-18任一项的方法,其中所述第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因选自下组:
(a)多肽,其包含氨基酸序列或由氨基酸序列组成,所述氨基酸序列与SEQ ID NO:100或其成熟多肽具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性;
(b)多肽,其由多核苷酸编码,所述多核苷酸在至少低严格条件,至少中等严格条件,至少中-高严格条件,至少高严格条件,或至少非常高严格条件下与以下杂交:(i)SEQID NO:99;(ii)SEQ ID NO:99的成熟多肽编码序列,(iii)(i)或(ii)的cDNA序列,或(iv)(i),(ii),或(iii)的全长互补链;和
(c)多肽,其由多核苷酸编码,所述多核苷酸包含核苷酸序列或由核苷酸序列组成,所述核苷酸序列与SEQ ID NO:100或其cDNA,或它们的成熟多肽编码序列具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性。
20.项13-19任一项的方法,其中所述第二天冬氨酸蛋白酶基因选自下组:
(a)多肽,其包含氨基酸序列,所述氨基酸序列与SEQ ID NO:108或其成熟多肽具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性;
(b)多肽,其由多核苷酸编码,所述多核苷酸在至少低严格条件,至少中等严格条件,至少中-高严格条件,至少高严格条件,或至少非常高严格条件下与以下杂交:(i)SEQID NO:3;(ii)SEQ ID NO:107的成熟多肽编码序列,(iii)(i)或(ii)的cDNA序列,或(iv)(i),(ii),或(iii)的全长互补链;和
(c)多肽,其由多核苷酸编码,所述多核苷酸包含核苷酸序列,所述核苷酸序列与SEQ ID NO:107或其cDNA,或它们的成熟多肽编码序列具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性。
附图说明
图1显示pDM156.2的限制图。
图2显示pEmY21的限制图。
图3显示pEmY23的限制图。
图4显示pWTY1470-19-07的限制图。
图5显示pWTY1515-2-01的限制图。
图6显示pJaL504-[Bam HI]的限制图。
图7显示pJaL504-[Bgl II]的限制图。
图8显示pJaL574的限制图。
图9显示pWTY1449-02-01的限制图。
图10显示pJfyS1540-75-5的限制图。
图11显示pJfyS1579-1-13的限制图。
图12显示pJfyS1579-8-6的限制图。
图13显示pJfyS1579-21-16的限制图。
图14显示pAlLo1492-24的限制图。
图15显示pJfyS1579-35-2的限制图。
图16显示pJfyS1579-41-11的限制图。
图17显示pDAtw18的限制图。
图18显示pSaMe-AaXYL的限制图。
图19显示pAgJg111的限制图。
图20显示pAgJg116的限制图。
图21显示pAgJg115的限制图。
图22显示pAgJg117的限制图。
图23显示pAgJg118的限制图。
图24显示来自里氏木霉AgJg117-3-10A和里氏木霉AgJg118-02-2E的培养液在40℃两周相对于相同条件下的亲本菌株的培养液的残余纤维素酶活性。
图25显示pJfyS152的限制图。
图26显示pJfyS153的限制图。
定义
枯草杆菌蛋白酶样丝氨酸蛋白酶:术语“枯草杆菌蛋白酶样丝氨酸蛋白酶”意指具有类似于枯草杆菌蛋白酶的底物特异性、使用丝氨酸残基以供催化肽和蛋白中肽键的水解的蛋白酶。枯草杆菌蛋白酶样蛋白酶(枯草杆菌酶)是通过三个氨基酸天冬氨酸、组氨酸和丝氨酸组成的催化三联体表征的丝氨酸蛋白酶。这些催化残基的安排类似于来自地衣芽孢杆菌(Bacillus licheniformis)的原型枯草杆菌蛋白酶(Siezen和Leunissen,1997,Protein Science6:501-523)。就本发明而言,枯草杆菌蛋白酶样丝氨酸蛋白酶活性根据实施例13中所述的步骤确定。
天冬氨酸蛋白酶:术语“天冬氨酸蛋白酶”意指使用天冬氨酸残基以供催化肽和蛋白中肽键水解的蛋白酶。天冬氨酸蛋白酶类为使用天冬氨酸残基以供催化其肽底物的蛋白酶家族。一般而言,它们在其活性位点具有两个高度保守的天冬氨酸,并任选地在酸性pH有活性(Szecsi,1992,Scand.J.Clin.Lab.In vest.Suppl.210:5–22)。就本发明而言,天冬氨酸蛋白酶活性根据Aikawa等,2001,J.Biochem.129:791-794所述的步骤确定。
胰蛋白酶样丝氨酸蛋白酶:术语“胰蛋白酶样丝氨酸蛋白酶“意指具有类似于胰蛋白酶的底物特异性、使用丝氨酸残基以供催化肽和蛋白中肽键的水解的蛋白酶。就本发明而言,胰蛋白酶样丝氨酸蛋白酶活性根据由Dienes等,2007,上文,或实施例20所述的步骤确定。
缺陷:术语“缺陷”意指在相同条件下培养时,与亲本木霉属菌株相比较,不产生一种或多种(几种)选自下组的酶的可检测的活性的木霉属突变体菌株:第一枯草杆菌蛋白酶样丝氨酸蛋白酶,第一天冬氨酸蛋白酶,胰蛋白酶样丝氨酸蛋白酶,第二枯草杆菌蛋白酶样丝氨酸蛋白酶,和第二天冬氨酸蛋白酶,或者,在相同条件下培养时,与亲本木霉属菌株相比较产生优选少至少25%,更优选少至少50%,甚至更优选少至少75%,并且最优选少至少95%的一种或多种(几种)选自下组的酶的木霉属突变体菌株:第一枯草杆菌蛋白酶样丝氨酸蛋白酶,第一天冬氨酸蛋白酶,胰蛋白酶样丝氨酸蛋白酶,第二枯草杆菌蛋白酶样丝氨酸蛋白酶,和第二天冬氨酸蛋白酶。由本发明的木霉属突变体菌株产生的蛋白酶的水平可使用本文中所述或本领域中已知的方法来确定。
分离的或纯化的:术语“分离的”或“纯化的”意指从与其天然结合(naturallyassociated)的至少一种成分移出的多肽或多核苷酸。举例而言,多肽如通过SDS-PAGE确定的,可为至少1%纯,例如,至少5%纯,至少10%纯,至少20%纯,至少40%纯,至少60%纯,至少80%纯,至少90%纯,或至少95%纯,而多核苷酸如通过琼脂糖电泳确定的,可为至少1%纯,例如,至少5%纯,至少10%纯,至少20%纯,至少40%纯,至少60%纯,至少80%纯,至少90%纯,或至少95%纯。
成熟多肽:术语“成熟多肽”意指在翻译和任何翻译后修饰如N端加工,C端截短,糖基化,磷酸化等之后以其最终形式存在的多肽。在一个方面,基于预测SEQ ID NO:2的氨基酸1至19为信号肽的SignalP程序(Nielsen等,1997,Protein Engineering 10:1-6),所述成熟多肽为SEQ ID NO:2的氨基酸20至882。在另一个方面,基于预测SEQ ID NO:4的氨基酸1至20为信号肽的SignalP程序,所述成熟多肽为SEQ ID NO:4的氨基酸21至407。在另一个方面,基于预测SEQ ID NO:6的氨基酸1至19为信号肽的SignalP程序,所述成熟多肽为SEQID NO:6的氨基酸20至259。在另一个方面,基于预测SEQ ID NO:100的氨基酸1至15为信号肽的SignalP程序,所述成熟多肽为SEQ ID NO:100的氨基酸16至540。在另一个方面,基于预测SEQ ID NO:108的氨基酸1至17为信号肽的SignalP程序,所述成熟多肽为SEQ ID NO:108的氨基酸18至395。
成熟多肽编码序列:术语“成熟多肽编码序列”意指编码具有酶活性的成熟多肽的多核苷酸。在一个方面,基于预测SEQ ID NO:3的核苷酸1至57编码信号肽的SignalP程序(Nielsen等,1997,见上文),所述成熟多肽编码序列是SEQ ID NO:1的核苷酸58至2774。在另一个方面,基于预测SEQ ID NO:1的核苷酸1至60编码信号肽的SignalP程序,所述成熟多肽编码序列是SEQ ID NO:3的核苷酸61至1299。在另一个方面,基于预测SEQ ID NO:5的核苷酸1至57编码信号肽的SignalP程序,所述成熟多肽编码序列是SEQ ID NO:5的核苷酸58至930。在另一个方面,基于预测SEQ ID NO:99的核苷酸1至45编码信号肽的SignalP程序,所述成熟多肽编码序列是SEQ ID NO:99的核苷酸46至1681。在另一个方面,基于预测SEQID NO:107的核苷酸1至51编码信号肽的SignalP程序,所述成熟多肽编码序列是SEQ IDNO:107的核苷酸52至1339。
同一性:两个氨基酸序列间或两个核苷酸序列间的相关性由参数”同一性”所描述。
就本发明而言,两个氨基酸序列之间的同一性程度使用如EMBOSS软件包(EMBOSS:欧洲分子生物学开放软件组(The European Molecular Biology Open Software Suite),Rice等,2000,Trends in Genetics 16:276-277)的Needle程序,优选为3.0.0版或之后的版本中执行的Needleman-Wunsch算法(Needleman和Wunsch,1970,J。Mol。Biol。48:443-453)确定。所用的可选参数为缺口开放罚分(gap open penalty)10,缺口延伸罚分(gapextension penalty)0.5,和EBLOSUM62(BLOSUM62的EMBOSS版)取代矩阵。使用标记为“最长同一性”的Needle输出(使用-nobrief选项获得)作为百分比同一性并计算如下:
(相同的残基×100)/(比对长度-比对中缺口总数)
就本发明而言,两个脱氧核糖核苷酸序列之间的同一性程度使用如EMBOSS软件包(EMBOSS:欧洲分子生物学开放软件组(The European Molecular Biology Open SoftwareSuite),Rice等,2000,见上)的Needle程序,优选为3.0.0版或之后的版本中执行的Needleman-Wunsch算法(Needleman和Wunsch,1970,见上)确定。所用的可选参数为缺口开放罚分10,缺口延伸罚分0.5,和EDNAFULL(NCBI NUC4.4的EMBOSS版)取代矩阵。使用标记为”最长同一性”的Needle输出(使用-nobrief选项获得)作为百分比同一性并计算如下:
(相同的脱氧核糖核苷酸×100)/(比对长度–比对中缺口总数)
多肽片段:术语“多肽片段”意指从成熟多肽的氨基和/或羧基末端缺失了一个或多个(几个)氨基酸的多肽;其中所述片段具有酶活性,例如枯草杆菌蛋白酶样丝氨酸蛋白酶、天冬氨酸蛋白酶或丝氨酸蛋白酶活性。在一个方面,所述片段含有SEQ ID NO:2的成熟多肽或其同源序列的至少740个氨基酸残基,例如至少780个氨基酸残基或至少820个氨基酸残基。在另一个方面,所述片段含有SEQ ID NO:4的成熟多肽或其同源序列的至少320个氨基酸残基,例如至少340个氨基酸残基或至少360个氨基酸残基。在另一个方面,所述片段含有SEQ ID NO:6的成熟多肽或其同源序列的至少210个氨基酸残基,例如至少220个氨基酸残基或至少230个氨基酸残基。在另一个方面,所述片段含有SEQ ID NO:100的成熟多肽或其同源序列的至少460个氨基酸残基,例如至少480个氨基酸残基或至少500个氨基酸残基。在另一个方面,所述片段含有SEQ ID NO:108的成熟多肽或其同源序列的至少320个氨基酸残基,例如至少340个氨基酸残基或至少360个氨基酸残基。
亚序列:术语“亚序列(subsequence)”意指从成熟多肽编码序列的5'和/或3'端缺失了一个或多个(几个)核苷酸的多核苷酸序列;其中所述亚序列编码具有酶活性,例如枯草杆菌蛋白酶样丝氨酸蛋白酶、天冬氨酸蛋白酶或丝氨酸蛋白酶活性的多肽片段。在一个方面,亚序列含有SEQ ID NO:1的成熟多肽编码序列或其cDNA序列,或它们的同源序列的至少2220个核苷酸,例如至少2340个核苷酸或至少2460个核苷酸。在另一个方面,亚序列含有SEQ ID NO:3的成熟多肽编码序列或其cDNA序列,或它们的同源序列的至少960个核苷酸,例如至少1020个核苷酸或至少1080个核苷酸。在另一个方面,亚序列含有SEQ ID NO:5的成熟多肽编码序列或其cDNA序列,或它们的同源序列的至少630个核苷酸,例如至少660个核苷酸或至少690个核苷酸。在另一个方面,亚序列含有SEQ ID NO:99的成熟多肽编码序列或其cDNA序列,或它们的同源序列的至少1380个核苷酸,例如至少1440个核苷酸或至少1500个核苷酸。在另一个方面,亚序列含有SEQ ID NO:107的成熟多肽编码序列或其cDNA序列,或它们的同源序列的至少960个核苷酸,例如至少1020个核苷酸或至少1080个核苷酸。
等位变体(allelic variant):术语“等位变体”意指占据相同染色体基因座的基因的任何两种或更多种可选形式。等位变异通过突变天然地发生,并且可导致种群内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。
编码序列:术语“编码序列”意指直接指定多肽氨基酸序列的多核苷酸。编码序列的边界通常由开读框确定,所述开读框通常以ATG起始密码子或可供选择的起始密码子如GTG和TTG开始,并且以终止密码子如TAA、TAG和TGA结束。编码序列可以是基因组DNA、cDNA、合成的或其组合。
cDNA:术语“cDNA”意指能够通过反转录从得自真核细胞的成熟的、已剪接的mRNA分子制备的DNA分子。cDNA缺少通常存在于相应基因组DNA中的内含子序列。起始的(initial)、初级的RNA转录物是mRNA的前体,其通过一系列的步骤包括间接进行加工然后作为成熟的已剪接的mRNA出现。
核酸构建体:术语“核酸构建体”意指单链或双链的核酸分子,所述核酸分子分离自天然存在的基因,或将所述核酸分子以本来不存在于(not otherwise exist)自然界中的方式修饰以含有核酸的区段或所述核酸分子是合成的。当所述核酸构建体含有表达编码序列所需的调控序列时,术语核酸构建体与术语“表达盒”同义。
调控序列(control sequence):术语“调控序列”意指包括编码多肽的多核苷酸表达所必需的所有组分。各个调控序列对于编码所述多肽的多核苷酸可以是天然的或外源的,或各个调控序列对于彼此可以是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最少的情况,调控序列包括启动子和转录和翻译的终止信号。调控序列可以和用于引入特异性限制位点的接头一起提供,所述特异性限制位点促进调控序列与编码多肽的多核苷酸编码区的连接。
可操作地连接:术语“可操作地连接”意指这样的构型,其中将调控序列置于相对于多核苷酸序列的编码序列的适当位置,使得调控序列指导多肽的编码序列的表达。
表达:术语“表达”包括涉及多肽产生的任何步骤,其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。
表达载体:术语“表达载体”意指线性的或环状的DNA分子,其包含编码多肽的多核苷酸,并与供用于其表达的额外核苷酸可操作地连接。
宿主细胞:术语“宿主细胞”意指任何细胞类型,所述细胞类型对于用包含多核苷酸的核酸构建体或表达载体的转化、转染、转导等是易感的(susceptible)。术语“宿主细胞”涵盖由于在复制过程中发生的突变而与亲本细胞不完全相同的亲本细胞的任何后代。
修饰:术语“修饰”意指在基因或其转录或表达所需的调控序列中导入、取代或去除一个或多个(几个)核苷酸,或基因破坏,基因转换,基因缺失,或基因的随机或特异性诱变,所述基因例如第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第一天冬氨酸蛋白酶基因,胰蛋白酶样丝氨酸蛋白酶基因,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第二天冬氨酸蛋白酶基因,或其组合。所述第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第一天冬氨酸蛋白酶基因,胰蛋白酶样丝氨酸蛋白酶基因,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因和/或第二天冬氨酸蛋白酶基因中的一种或多种(几种)的缺失可为部分的或完全的。所述修饰导致所述第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第一天冬氨酸蛋白酶基因,胰蛋白酶样丝氨酸蛋白酶基因,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第二天冬氨酸蛋白酶基因,或其组合的表达的减少或消除(失活)。在一个优选的方面,所述第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第一天冬氨酸蛋白酶基因,胰蛋白酶样丝氨酸蛋白酶基因,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第二天冬氨酸蛋白酶基因中的一种或多种(几种)失活。
具体实施方式
本发明涉及亲本木霉属菌株的突变体,其包含编码多肽的多核苷酸,和一种或多种(几种)选自下组的基因:第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第一天冬氨酸蛋白酶基因,胰蛋白酶样丝氨酸蛋白酶基因,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因和第二天冬氨酸蛋白酶基因,其中所述一种或多种(几种)基因经修饰,使得突变体菌株在相同条件下培养时,与亲本木霉属菌株相比,分别在一种或多种(几种)选自下组的酶的产生方面有缺陷:第一枯草杆菌蛋白酶样丝氨酸蛋白酶,第一天冬氨酸蛋白酶,胰蛋白酶样丝氨酸蛋白酶,第二枯草杆菌蛋白酶样丝氨酸蛋白酶,和第二天冬氨酸蛋白酶。
本发明还涉及产生多肽的方法,包括:(a)在用于产生所述多肽的培养基中培养亲本木霉属菌株的突变体,其中所述突变体菌株包含编码所述多肽的多核苷酸,和一种或多种(几种)选自下组的基因:第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第一天冬氨酸蛋白酶基因,胰蛋白酶样丝氨酸蛋白酶基因,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因,和第二天冬氨酸蛋白酶基因,其中所述一种或多种(几种)基因经修饰,使得突变体菌株在相同条件下培养时,与亲本木霉属菌株相比,分别在一种或多种(几种)选自下组的酶的产生方面有缺陷:第一枯草杆菌蛋白酶样丝氨酸蛋白酶,第一天冬氨酸蛋白酶,胰蛋白酶样丝氨酸蛋白酶,第二枯草杆菌蛋白酶样丝氨酸蛋白酶,和第二天冬氨酸蛋白酶;和(b)从所述培养基回收所述多肽。
本发明进一步涉及获得亲本木霉属菌株的突变体的方法,包括:(a)修饰一种或多种(几种)选自下组的基因:第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第一天冬氨酸蛋白酶基因,胰蛋白酶样丝氨酸蛋白酶基因,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因,和第二天冬氨酸蛋白酶基因;和(b)鉴定来自步骤(a)的突变体菌株,其中所述一种或多种(几种)基因经修饰,使得突变体菌株在相同条件下培养时,与亲本木霉属菌株相比,分别在一种或多种(几种)选自下组的酶的产生方面有缺陷:第一枯草杆菌蛋白酶样丝氨酸蛋白酶,第一天冬氨酸蛋白酶,胰蛋白酶样丝氨酸蛋白酶,第二枯草杆菌蛋白酶样丝氨酸蛋白酶,和第二天冬氨酸蛋白酶。
本发明的优点在于消除或减少了一种或多种(几种)酶活性,其可对感兴趣的具体多肽的产生,下游加工例如回收,和/或应用是有害的。
在本发明的方法中,亲本木霉属菌株可为任何木霉属菌株,如野生型木霉属菌株或其突变体。亲本木霉属菌株可为哈茨木霉(Trichoderma harzianum)、康宁木霉(Trichoderma koningii)、长枝木霉(Trichoderma longibrachiatum)、里氏木霉(Trichoderma reesei)或绿色木霉(Trichoderma viride);或其可替换的有性形式,即肉座菌属(Hypocrea)。
在另一个方面,亲本木霉属菌株是哈茨木霉。在另一个方面,亲本木霉属菌株是康宁木霉。在另一个方面,亲本木霉属菌株是长枝木霉。在另一个方面,亲本木霉属菌株是里氏木霉。在另一个方面,亲本木霉属菌株是绿色木霉。
在另一个方面,亲本里氏木霉菌株是里氏木霉RutC30。在另一个方面,亲本里氏木霉菌株是里氏木霉TV10。在另一个方面,亲本里氏木霉菌株是里氏木霉的突变体。在另一个方面,亲本里氏木霉菌株是里氏木霉的形态突变体(参见WO 97/26330)。
蛋白酶缺陷的木霉属突变体菌株可通过使用本领域公知的方法,如***、破坏、替代或缺失来减少或消除一种或多种(几种)选自下组的基因的表达来构建:第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第一天冬氨酸蛋白酶基因,胰蛋白酶样丝氨酸蛋白酶基因,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因和第二天冬氨酸蛋白酶基因。可修饰一部分基因,如编码区或编码区表达所需的调控区。基因的此种调控序列可为启动子序列或其功能性部分,即足以影响基因表达的部分。举例而言,可使得启动子序列失活,导致无表达,或可用较弱的启动子替代天然启动子序列以减少编码序列的表达。可修饰的其他调控序列包括但不限于前导序列,前肽序列,信号序列,转录终止子和转录激活子。
所述木霉属突变体菌株可通过消除或减少基因表达的基因缺失技术来构建。基因缺失技术使得可以部分或全部去除基因,从而消除其表达。在此类方法中,基因的缺失通过使用经构建连续地含有基因侧翼的5’和3’区的质粒进行同源重组来实现。
所述木霉属突变体菌株亦可通过在基因或其转录或翻译所需的其调控序列中导入、取代和/或去除一个或多个(几个)核苷酸来构建。举例而言,可***或去除核苷酸以供导入终止密码子,去除起始密码子,或使得开读框移码。此种修饰可依照本领域已知技术通过定点诱变或PCR生成的诱变来实现。参见,例如Botstein和Shortle,1985,Science 229:4719;Lo等,1985,Proceedings of National Academy of Sciences USA 81:2285;Higuchi等,1988,Nucleic Acids Research 16:7351;Shimada,1996,Meth。Mol。Biol。57:157;Ho等,1989,Gene 77:61;Horton等,1989,Gene 77:61;以及Sarkar和Sommer,1990,BioTechniques 8:404。
所述木霉属突变体菌株亦可通过基因破坏技术来构建,即将包含与基因同源的核酸片段的破坏性核酸构建体***所述基因,这会构建同源区的重复,并在重复的区之间并入构建体DNA。若***的构建体使得基因启动子与编码区分开,或打断编码序列使得产生非功能性基因产物,则此种基因破坏可消除基因表达。破坏构建体可简单地为伴以同源于基因的5’和3’区的选择性标记基因。所述选择性标记基因使得能够鉴定含有破坏的基因的转化体。
所述木霉属突变体菌株亦可通过基因转换的工艺构建(参见,例如Iglesias和Trautner,1983,Molecular General Genetics 189:73-76)。举例而言,在基因转换方法中,在体外对对应于基因的核苷酸序列进行诱变,以产生缺陷的核苷酸序列,然后将其转化入木霉属菌株以产生缺陷基因。通过同源重组,缺陷的核苷酸序列取代了内源基因。可为理想的是所述缺陷的核苷酸序列亦包含标记以供选择含有缺陷基因的转化体。
所述木霉属突变体菌株亦可通过已确立的使用互补于基因核苷酸序列的核苷酸序列的反义技术来构建(Parish和Stoker,1997,FEMS Microbiology Letters 154:151-157)。更具体而言,木霉属菌株的基因表达可通过导入互补于基因核苷酸序列、可在菌株中转录并能够杂交于菌株中产生的mRNA的核苷酸序列来减少或失活。在允许互补性反义核苷酸序列杂交于mRNA的条件下,由此减少或消除了翻译的蛋白的量。
所述木霉属突变体菌株亦可通过已确立的RNA干扰(RNAi)技术来构建(参见,例如WO 2005/056772和WO 2008/080017)。
所述木霉属突变体菌株亦可进一步通过使用本领域中公知方法的随机或特异性诱变(包括但不限于化学诱变)来构建(参见,例如Hopwood,Isolation of Mutants inMethods in Microbiology(J.R。Norris和D.W。Ribbons编)pp.363-433,Academic Press,New York,1970)。对基因的修饰通过对亲本菌株进行诱变,并筛选其中基因表达减少或失活的突变体菌株来进行。可为特异性或随机的诱变可通过例如使用合适的物理或化学诱变剂,使用合适的寡核苷酸,或对DNA序列进行PCR生成的诱变来进行。此外,诱变可通过使用任何这些诱变方法的组合来进行。
适于本发明目的的物理或化学诱变剂的实例包括紫外(UV)辐照,羟胺,N-甲基-N’-硝基-N-亚硝基胍(MNNG),N-甲基-N’-亚硝基胍(NTG),O-甲基羟胺,亚硝酸,甲磺酸乙酯(EMS),亚硫酸氢钠,甲酸,和核苷酸类似物。当使用此类试剂时,诱变通常通过在所选诱变剂存在下在合适条件下温育待诱变的亲本菌株,并选择呈现基因表达减少或无表达的突变体来进行。
在一个方面,修饰导致一个或多个(几个)选自下组的基因的失活:第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第一天冬氨酸蛋白酶基因,胰蛋白酶样丝氨酸蛋白酶基因,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因和第二天冬氨酸蛋白酶基因。在另一个方面,修饰导致一个或多个(几个)选自下组的基因的表达的减少:第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第一天冬氨酸蛋白酶基因,胰蛋白酶样丝氨酸蛋白酶基因,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因和第二天冬氨酸蛋白酶基因。在另一个方面,修饰导致一个或多个(几个)选自下组的基因的表达的减少,失活,或其组合:第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第一天冬氨酸蛋白酶基因,胰蛋白酶样丝氨酸蛋白酶基因,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因和第二天冬氨酸蛋白酶基因。
在另一个方面,突变体包含第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因的修饰。在另一个方面,突变体包含第一天冬氨酸蛋白酶基因的修饰。在另一个方面,突变体包含胰蛋白酶样丝氨酸蛋白酶基因的修饰。在另一个方面,突变体包含第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因的修饰。在另一个方面,突变体包含第二天冬氨酸蛋白酶基因的修饰。
在另一个方面,突变体包含第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因和第一天冬氨酸蛋白酶基因的修饰。在另一个方面,突变体包含第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因和胰蛋白酶样丝氨酸蛋白酶基因的修饰。在另一个方面,突变体包含第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因和第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因的修饰。在另一个方面,突变体包含第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因和第二天冬氨酸蛋白酶基因的修饰。在另一个方面,突变体包含第一天冬氨酸蛋白酶基因和胰蛋白酶样丝氨酸蛋白酶基因的修饰。在另一个方面,突变体包含第一天冬氨酸蛋白酶基因和第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因的修饰。在另一个方面,突变体包含第一天冬氨酸蛋白酶基因和第二天冬氨酸蛋白酶基因的修饰。在另一个方面,突变体包含胰蛋白酶样丝氨酸蛋白酶基因和第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因的修饰。在另一个方面,突变体包含胰蛋白酶样丝氨酸蛋白酶基因和第二天冬氨酸蛋白酶基因的修饰。在另一个方面,突变体包含第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因和第二天冬氨酸蛋白酶基因的修饰。
在另一个方面,突变体包含第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第一天冬氨酸蛋白酶基因和胰蛋白酶样丝氨酸蛋白酶基因的修饰。在另一个方面,突变体包含第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因,胰蛋白酶样丝氨酸蛋白酶基因和第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因的修饰。在另一个方面,突变体包含第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因和第二天冬氨酸蛋白酶基因的修饰。在另一个方面,突变体包含第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第一天冬氨酸蛋白酶基因和第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因的修饰。在另一个方面,突变体包含第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第一天冬氨酸蛋白酶基因和第二天冬氨酸蛋白酶基因的修饰。在另一个方面,突变体包含第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因,胰蛋白酶样丝氨酸蛋白酶基因和第二天冬氨酸蛋白酶基因的修饰。在另一个方面,突变体包含第一天冬氨酸蛋白酶基因,胰蛋白酶样丝氨酸蛋白酶基因和第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因的修饰。在另一个方面,突变体包含第一天冬氨酸蛋白酶基因,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因和第二天冬氨酸蛋白酶基因的修饰。在另一个方面,突变体包含第一天冬氨酸蛋白酶基因,胰蛋白酶样丝氨酸蛋白酶基因和第二天冬氨酸蛋白酶基因的修饰。在另一个方面,突变体包含胰蛋白酶样丝氨酸蛋白酶基因,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因和第二天冬氨酸蛋白酶基因的修饰。
在另一个方面,突变体包含第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第一天冬氨酸蛋白酶基因,胰蛋白酶样丝氨酸蛋白酶基因和第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因的修饰。在另一个方面,突变体包含第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因,胰蛋白酶样丝氨酸蛋白酶基因,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因和第二天冬氨酸蛋白酶基因的修饰。在另一个方面,突变体包含第一天冬氨酸蛋白酶基因,胰蛋白酶样丝氨酸蛋白酶基因,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因和第二天冬氨酸蛋白酶基因的修饰。在另一个方面,突变体包含第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第一天冬氨酸蛋白酶基因,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因和第二天冬氨酸蛋白酶基因的修饰。在另一个方面,突变体包含第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第一天冬氨酸蛋白酶基因,胰蛋白酶样丝氨酸蛋白酶基因和第二天冬氨酸蛋白酶基因的修饰。
在另一个方面,突变体包含第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第一天冬氨酸蛋白酶基因,胰蛋白酶样丝氨酸蛋白酶基因,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因和第二天冬氨酸蛋白酶基因。
在一个方面,所述枯草杆菌蛋白酶样丝氨酸蛋白酶基因编码具有枯草杆菌蛋白酶样丝氨酸蛋白酶活性的多肽,其包含或组成为与SEQ ID NO:2或其成熟多肽具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性的氨基酸序列。在另一个方面,第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因编码包含或组成为SEQ ID NO:2的具有枯草杆菌蛋白酶样丝氨酸蛋白酶活性的多肽。在另一个方面,第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因编码包含或组成为SEQ ID NO:2的成熟多肽的具有枯草杆菌蛋白酶样丝氨酸蛋白酶活性的多肽。
在另一个方面,第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因包含多核苷酸,所述多核苷酸包含或组成为与SEQ ID NO:1或其成熟多肽编码序列具有至少60%,例如,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性的核苷酸序列。在另一个方面,第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因包含多核苷酸,所述多核苷酸包含或组成为SEQ ID NO:1。在另一个方面,第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因包含多核苷酸,所述多核苷酸包含或组成为SEQ ID NO:1的成熟多肽编码序列。
在另一个方面,第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因包含多核苷酸,所述多核苷酸在非常低严格条件,低严格条件,中等严格条件,中-高严格条件,高严格条件,或非常高严格条件下与以下杂交:(i)SEQ ID NO:1;(ii)SEQ ID NO:1的成熟多肽编码序列;(iii)(i)或(ii)的cDNA序列,或(iv)(i),(ii)或(iii)的全长互补链。
在另一个方面,第一枯草杆菌蛋白酶样丝氨酸蛋白酶包含或组成为与SEQ ID NO:2或其成熟多肽具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性的氨基酸序列。在另一个方面,第一枯草杆菌蛋白酶样丝氨酸蛋白酶包含或组成为SEQ ID NO:2。在另一个方面,第一枯草杆菌蛋白酶样丝氨酸蛋白酶包含或组成为SEQ ID NO:2的成熟多肽。
在另一个方面,第一枯草杆菌蛋白酶样丝氨酸蛋白酶由多核苷酸编码,所述多核苷酸包含或组成为与SEQ ID NO:1或其cDNA,或它们的成熟多肽编码序列具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性的核苷酸序列。在另一个方面,第一枯草杆菌蛋白酶样丝氨酸蛋白酶由多核苷酸编码,所述多核苷酸包含或组成为SEQ ID NO:1。在另一个方面,第一枯草杆菌蛋白酶样丝氨酸蛋白酶由多核苷酸编码,所述多核苷酸包含或组成为SEQ ID NO:1的成熟多肽编码序列。
在另一个方面,第一枯草杆菌蛋白酶样丝氨酸蛋白酶由多核苷酸编码,所述多核苷酸在非常低严格条件,低严格条件,中等严格条件,中-高严格条件,高严格条件,或非常高严格条件下与以下杂交:(i)SEQ ID NO:1;(ii)SEQ ID NO:1的成熟多肽编码序列;(iii)(i)或(ii)的cDNA序列,或(iv)(i),(ii)或(iii)的全长互补链。
在另一个方面,第一天冬氨酸蛋白酶基因编码具有天冬氨酸蛋白酶活性的多肽,所述多肽包含或组成为与SEQ ID NO:4或其成熟多肽具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性的氨基酸序列。在另一个方面,第一天冬氨酸蛋白酶基因编码具有天冬氨酸蛋白酶活性的多肽,所述多肽包含或组成为SEQ ID NO:4。在另一个方面,第一天冬氨酸蛋白酶基因编码具有天冬氨酸蛋白酶活性的多肽,所述多肽包含或组成为SEQ ID NO:4的成熟多肽。
在另一个方面,第一天冬氨酸蛋白酶基因包含多核苷酸,所述多核苷酸包含或组成为与SEQ ID NO:3或其cDNA序列,或其成熟多肽编码序列具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性的核苷酸序列。在另一个方面,第一天冬氨酸蛋白酶基因包含或组成为SEQ ID NO:3。在另一个方面,第一天冬氨酸蛋白酶基因包含或组成为SEQ ID NO:3的成熟多肽编码序列。
在另一个方面,第一天冬氨酸蛋白酶基因包含多核苷酸,所述多核苷酸在非常低严格条件,低严格条件,中等严格条件,中-高严格条件,高严格条件,或非常高严格条件下与以下杂交:(i)SEQ ID NO:3;(ii)SEQ ID NO:3的成熟多肽编码序列,(iii)(i)或(ii)的cDNA序列,或(iv)(i),(ii),或(iii)的全长互补链。
在另一个方面,第一天冬氨酸蛋白酶包含或组成为与SEQ ID NO:4或其成熟多肽具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性的氨基酸序列。在另一个方面,第一天冬氨酸蛋白酶包含或组成为SEQID NO:4。在另一个方面,第一天冬氨酸蛋白酶包含或组成为SEQ ID NO:4的成熟多肽。
在另一个方面,第一天冬氨酸蛋白酶由多核苷酸编码,所述多核苷酸包含或组成为与SEQ ID NO:3或其cDNA,或它们的成熟多肽编码序列具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性的核苷酸序列。在另一个方面,第一天冬氨酸蛋白酶由多核苷酸编码,所述多核苷酸包含或组成为SEQID NO:3。在另一个方面,第一天冬氨酸蛋白酶由多核苷酸编码,所述多核苷酸包含或组成为SEQ ID NO:3的成熟多肽编码序列。
在另一个方面,第一天冬氨酸蛋白酶由多核苷酸编码,所述多核苷酸在非常低严格条件,低严格条件,中等严格条件,中-高严格条件,高严格条件,或非常高严格条件下与以下杂交:(i)SEQ ID NO:3;(ii)SEQ ID NO:3的成熟多肽编码序列,(iii)(i)或(ii)的cDNA序列,或(iv)(i),(ii),或(iii)的全长互补链。
在另一个方面,胰蛋白酶样丝氨酸蛋白酶基因编码具有胰蛋白酶样丝氨酸蛋白酶活性的多肽,所述多肽包含或组成为与SEQ ID NO:6或其成熟多肽具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性的氨基酸序列。在另一个方面,胰蛋白酶样丝氨酸蛋白酶基因编码具有胰蛋白酶样丝氨酸蛋白酶活性的多肽,所述多肽包含或组成为SEQ ID NO:6。在另一个方面,胰蛋白酶样丝氨酸蛋白酶基因编码具有胰蛋白酶样丝氨酸蛋白酶活性的多肽,所述多肽包含或组成为SEQID NO:6的成熟多肽。
在另一个方面,胰蛋白酶样丝氨酸蛋白酶基因包含多核苷酸,所述多核苷酸包含或组成为与SEQ ID NO:5或其cDNA,或它们的成熟多肽编码序列具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性的核苷酸序列。在另一个方面,胰蛋白酶样丝氨酸蛋白酶基因包含多核苷酸,所述多核苷酸包含或组成为SEQ ID NO:5。在另一个方面,胰蛋白酶样丝氨酸蛋白酶基因包含多核苷酸,所述多核苷酸包含或组成为SEQ ID NO:5的成熟多肽编码序列。
在另一个方面,胰蛋白酶样丝氨酸蛋白酶基因包含多核苷酸,所述多核苷酸在非常低严格条件,低严格条件,中等严格条件,中-高严格条件,高严格条件,或非常高严格条件下与以下杂交:(i)SEQ ID NO:5;(ii)SEQ ID NO:5的成熟多肽编码序列,(iii)(i)或(ii)的cDNA序列,或(iv)(i),(ii),或(iii)的全长互补链。
在另一个方面,胰蛋白酶样丝氨酸蛋白酶包含或组成为与SEQ ID NO:6或其成熟多肽具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性的氨基酸序列。在另一个方面,第一天冬氨酸蛋白酶包含或组成为SEQ ID NO:6。在另一个方面,第一天冬氨酸蛋白酶包含或组成为SEQ ID NO:6的成熟多肽。
在另一个方面,胰蛋白酶样丝氨酸蛋白酶由多核苷酸编码,所述多核苷酸包含或组成为与SEQ ID NO:5或其cDNA,或它们的成熟多肽编码序列具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性的核苷酸序列。在另一个方面,胰蛋白酶样丝氨酸蛋白酶由多核苷酸编码,所述多核苷酸包含或组成为SEQ ID NO:5。在另一个方面,胰蛋白酶样丝氨酸蛋白酶由多核苷酸编码,所述多核苷酸包含或组成为SEQ ID NO:5的成熟多肽编码序列。
在另一个方面,胰蛋白酶样丝氨酸蛋白酶由多核苷酸编码,所述多核苷酸在非常低严格条件,低严格条件,中等严格条件,中-高严格条件,高严格条件,或非常高严格条件下与以下杂交:(i)SEQ ID NO:5;(ii)SEQ ID NO:5的成熟多肽编码序列,(iii)(i)或(ii)的cDNA序列,或(iv)(i),(ii),或(iii)的全长互补链。
在另一个方面,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因编码具有枯草杆菌蛋白酶样丝氨酸蛋白酶活性的多肽,所述多肽包含或组成为与SEQ ID NO:100或其成熟多肽具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性的氨基酸序列。在另一个方面,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因编码具有枯草杆菌蛋白酶样丝氨酸蛋白酶活性的多肽,所述多肽包含或组成为SEQ IDNO:100。在另一个方面,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因编码具有枯草杆菌蛋白酶样丝氨酸蛋白酶活性的多肽,所述多肽包含或组成为SEQ ID NO:100的成熟多肽。
在另一个方面,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因包含多核苷酸,所述多核苷酸包含或组成为与SEQ ID NO:99或其cDNA,或它们的成熟多肽编码序列具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性的核苷酸序列。在另一个方面,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因包含或组成为SEQ ID NO:99。在另一个方面,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因包含或组成为SEQ ID NO:99的成熟多肽编码序列。
在另一个方面,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因包含多核苷酸,所述多核苷酸在非常低严格条件,低严格条件,中等严格条件,中-高严格条件,高严格条件,或非常高严格条件下与以下杂交:(i)SEQ ID NO:99;(ii)SEQ ID NO:99的成熟多肽编码序列,(iii)(i)或(ii)的cDNA序列,或(iv)(i),(ii),或(iii)的全长互补链。
在另一个方面,第二枯草杆菌蛋白酶样丝氨酸蛋白酶包含或组成为与SEQ ID NO:100或其成熟多肽具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性的氨基酸序列。在另一个方面,第二枯草杆菌蛋白酶样丝氨酸蛋白酶包含或组成为SEQ ID NO:100。在另一个方面,第二枯草杆菌蛋白酶样丝氨酸蛋白酶包含或组成为SEQ ID NO:100的成熟多肽。
在另一个方面,第二枯草杆菌蛋白酶样丝氨酸蛋白酶由多核苷酸编码,所述多核苷酸包含或组成为与SEQ ID NO:99或其cDNA,或它们的成熟多肽编码序列具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性的核苷酸序列。在另一个方面,第二枯草杆菌蛋白酶样丝氨酸蛋白酶由多核苷酸编码,所述多核苷酸包含或组成为SEQ ID NO:99。在另一个方面,第二枯草杆菌蛋白酶样丝氨酸蛋白酶由多核苷酸编码,所述多核苷酸包含或组成为SEQ ID NO:99的成熟多肽编码序列。
在另一个方面,第二枯草杆菌蛋白酶样丝氨酸蛋白酶由多核苷酸编码,所述多核苷酸在非常低严格条件,低严格条件,中等严格条件,中-高严格条件,高严格条件,或非常高严格条件下与以下杂交:(i)SEQ ID NO:99;(ii)SEQ ID NO:99的成熟多肽编码序列,(iii)(i)或(ii)的cDNA序列,或(iv)(i),(ii),或(iii)的全长互补链。
在一个方面,第二天冬氨酸蛋白酶基因编码具有天冬氨酸蛋白酶活性的多肽,所述多肽包含或组成为与SEQ ID NO:108或其成熟多肽具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性的氨基酸序列。在另一个方面,第二天冬氨酸蛋白酶基因编码具有天冬氨酸蛋白酶活性的多肽,所述多肽包含或组成为SEQ ID NO:108。在另一个方面,第二天冬氨酸蛋白酶基因编码具有天冬氨酸蛋白酶活性的多肽,所述多肽包含或组成为SEQ ID NO:108的成熟多肽。
在另一个方面,第二天冬氨酸蛋白酶基因包含多核苷酸,所述多核苷酸包含或组成为与SEQ ID NO:107或其cDNA,或它们的成熟多肽编码序列具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性的核苷酸序列。在另一个方面,第二天冬氨酸蛋白酶基因包含或组成为SEQ ID NO:107。在另一个方面,第二天冬氨酸蛋白酶基因包含或组成为SEQ ID NO:107的成熟多肽编码序列。
在另一个方面,第二天冬氨酸蛋白酶基因包含多核苷酸,所述多核苷酸在非常低严格条件,低严格条件,中等严格条件,中-高严格条件,高严格条件,或非常高严格条件下与以下杂交:(i)SEQ ID NO:107;(ii)SEQ ID NO:107的成熟多肽编码序列,(iii)(i)或(ii)的cDNA序列,或(iv)(i),(ii),或(iii)的全长互补链。
在另一个方面,第二天冬氨酸蛋白酶包含或组成为与SEQ ID NO:108或其成熟多肽具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性的氨基酸序列。在另一个方面,第二天冬氨酸蛋白酶包含或组成为SEQ ID NO:108。在另一个方面,第二天冬氨酸蛋白酶包含或组成为SEQ ID NO:108的成熟多肽。
在另一个方面,第二天冬氨酸蛋白酶由多核苷酸编码,所述多核苷酸包含或组成为与SEQ ID NO:107或其cDNA,或它们的成熟多肽编码序列具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性的核苷酸序列。在另一个方面,第二天冬氨酸蛋白酶由多核苷酸编码,所述多核苷酸包含或组成为SEQID NO:107。在另一个方面,第二天冬氨酸蛋白酶由多核苷酸编码,所述多核苷酸包含或组成为SEQ ID NO:107的成熟多肽编码序列。
在另一个方面,第二天冬氨酸蛋白酶由多核苷酸编码,所述多核苷酸在非常低严格条件,低严格条件,中等严格条件,中-高严格条件,高严格条件,或非常高严格条件下与以下杂交:(i)SEQ ID NO:107;(ii)SEQ ID NO:107的成熟多肽编码序列,(iii)(i)或(ii)的cDNA序列,或(iv)(i),(ii),或(iii)的全长互补链。
本文中公开的核苷酸序列或其亚序列,及其氨基酸序列或其片段,可用于设计核酸探针,以根据本领域内公知的方法从不同属和种的菌株鉴定和克隆如上所述的基因的同源DNA。具体而言,根据标准的Southern印迹方法,可将这些探针用于与感兴趣的属或种的基因组DNA或cDNA杂交,以鉴定和从其中分离相应的基因。这些探针可明显短于完整序列,但长度上应为至少14,例如至少25,至少35,或至少70个核苷酸。优选地,所述核酸探针是至少100个核苷酸长度,例如,至少200个核苷酸,至少300个核苷酸,至少400个核苷酸,至少500个核苷酸,至少600个核苷酸,至少700个核苷酸,至少800个核苷酸,或至少900个核苷酸长度。DNA和RNA探针二者均可使用。通常将探针标记以探测相应的基因(例如,用32P、3H、35S、生物素或抗生物素蛋白(avidin)标记)。
因此,可从由这些其它生物体制备的基因组DNA或cDNA文库中筛选与上述探针杂交的DNA。可以通过琼脂糖或聚丙烯酰胺凝胶电泳,或通过其它分离技术分离来自这些其它生物体的基因组DNA或其它DNA。可以将来自文库的DNA或分离的DNA转移至硝化纤维素(nitrocellulose)或其它合适的载体材料并且固定于其上。为了鉴定与本文中公开的核苷酸序列或其亚序列同源的克隆或DNA,将所述载体材料优选用在Sounthern印迹中。就本发明而言,杂交表示核酸序列在非常低至非常高的严格条件下与标记的核酸探针杂交,所述核酸探针对应本文中公开的核苷酸序列,其互补链,或其亚序列。使用X射线片(X-rayfilm)检测在这些条件下与核酸探针杂交的分子。
对于长度至少100个核苷酸的长探针,将非常低至非常高的严格条件定义为在42℃,在5X SSPE、0.3%SDS、200μg/ml已剪切并且变性的鲑精DNA中,并且对于非常低和低严格性为25%的甲酰胺、对于中和中-高严格性为35%的甲酰胺、或对于高和非常高严格性为50%的甲酰胺,根据标准的Southern印迹法进行预杂交和杂交最佳12至24小时。使用2XSSC、0.2%SDS在45℃(非常低严格性),在50℃(低严格性),在55℃(中严格性),在60℃(中-高严格性),在65℃(高严格性),并且在70℃(非常高严格性)将载体材料最终洗涤三次,每次15分钟。
对于长度大约15个核苷酸至大约70个核苷酸的短探针,将严格条件定义为在比根据Bolton和McCarthy计算法(1962,Proc.Natl.Acad.Sci.USA48:1390)得出的Tm低大约5℃至大约10℃,在0.9M NaCl,0.09M Tris-HCl pH7.6,6mM EDTA,0.5%NP-40,1×Denhardt溶液,1mM焦磷酸钠,1mM磷酸二氢钠(sodium monobasic phosphate),0.1mM ATP和0.2mg每ml的酵母RNA中,根据标准的Southern印迹步骤进行预杂交和杂交最佳12至24小时。将所述载体材料在6×SSC加0.1%SDS中最终洗涤一次15分钟,并用6×SSC在比计算的Tm低5℃至10℃的温度洗涤两次,每次15分钟。
同源于或互补于本文中所述的基因的核苷酸序列可使用来自其他微生物来源的以修饰所选的木霉属菌株中的相应基因。
在另一个方面,木霉属突变体菌株中基因的修饰去除选择性标记。选择性标记基因的去除可通过在反选择培养基上培养突变体来实现。在选择性标记基因含有在其5’和3’端侧翼的重复时,当对突变体菌株进行反选择时,重复会协助选择性标记基因通过同源重组的环出(looping out)。选择性标记基因亦可通过同源重组去除,即将包含缺陷基因的5’和3’区、但缺乏选择性标记基因的核酸片段导入突变体菌株,然后在反选择培养基上选择。通过同源重组,用缺乏选择性标记基因的核酸片段替代了含有选择性标记基因的缺陷基因。亦可使用其他本领域中已知的方法。
应理解本发明的方法并不特别限于获得木霉属突变体菌株的特定顺序。可在构建用于产生感兴趣的多肽的菌株中的任意步骤向亲本菌株导入基因的修饰。优选木霉属突变体菌株在此种构建之前已经制成蛋白酶缺陷的。
在本发明的进一步的方面,木霉属菌株的突变体可含有对可编码有害于感兴趣的多肽的产生、回收或应用的物质的其他基因的其他修饰,例如缺失或破坏。
在一个方面,木霉属菌株进一步包含一个或多个(几个)编码选自下组的蛋白水解活性的基因的修饰,例如破坏或缺失:氨肽酶,二肽基氨肽酶,三肽基氨肽酶,羧肽酶,金属蛋白酶,半胱氨酸蛋白酶,和液泡蛋白酶。
在另一个方面,木霉属菌株进一步包含编码氧化还原酶、转移酶、水解酶、裂合酶、异构酶或连接酶的一种或多种(几种)其他基因的修饰,例如破坏或缺失。
在另一个方面,木霉属菌株进一步包含编码选自下组的酶的一种或多种(几种)其他基因的修饰,例如破坏或缺失:α-淀粉酶,***呋喃糖苷酶,糖酶,过氧化氢酶,纤维二糖水解酶,纤维素酶,甲壳酶,环糊精糖基转移酶,角质酶,环糊精糖基转移酶,脱氧核糖核酸酶,内切葡聚糖酶,酯酶,α-半乳糖苷酶,β-半乳糖苷酶,葡糖脑苷脂酶,葡糖氧化酶,α-葡糖苷酶,β-葡糖苷酶,葡糖醛酸糖苷酶,卤素过氧化物酶,半纤维素酶,转化酶,异构酶,漆酶,连接酶,脂肪酶,甘露糖苷酶,变聚糖酶(mutanase),氧化酶,果胶分解酶,过氧化物酶,磷脂酶,肌醇六磷酸酶,酚氧化酶,多酚氧化酶,核糖核酸酶,α-1,6-转糖苷酶,转谷氨酰胺酶,尿激酶,木聚糖酶,和β-木糖苷酶。
在另一个方面,木霉属菌株进一步包含编码选自下组的酶的一个或多个(几个)其他基因的修饰,例如破坏或缺失:内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。
在本发明的方法中,木霉属突变体菌株在相同产生条件下培养时,优选产生与相应的亲本木霉属菌株至少相同量的感兴趣的生物活性多肽。在另一个方面,突变体菌株在相同产生条件下培养时,与相应的亲本木霉属菌株相比产生优选多至少5%,更优选多至少10%,更优选多至少25%,更优选多至少50%,甚至更优选多至少75%,且最优选多至少100%生物活性多肽。
将木霉属突变体菌株在营养培养基中使用本领域已知方法培养以供产生感兴趣的多肽。例如,可以通过在合适培养基中和允许表达和/或分离所述多肽的条件下进行的摇瓶培养,和实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养,所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据公开的组成制备(例如,在美国典型培养物保藏中心的目录中)。分泌的多肽能够从所述培养基中直接回收。如果多肽不分泌,可从细胞裂解物(lysate)获得。
感兴趣的多肽可使用对于多肽具特异性的本领域中已知方法来检测。这些检测方法可包括使用特异性抗体,高效液相色谱,毛细管色谱,酶产物的形成,酶底物的消失,或SDS-PAGE。举例而言,可使用酶测定来确定酶活性。对于许多酶,确定酶活性的步骤在本领域中是已知的(参见,例如D.Schomburg和M.Salzmann(编),Enzyme Handbook,Springer-Verlag,New York,1990)。
可通过本领域中已知的方法来分离所得的多肽。举例而言,感兴趣的多肽可从培养基通过常规方法分离,所述方法包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。然后,分离的多肽可进一步通过多种本领域中已知的方法来纯化,所述方法包括但不限于层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型(preparative)等电聚焦(IEF))、差示溶解度(例如,硫酸铵沉淀)、或提取(参见,例如,Protein Purification,J.-C.Janson和Lars Ryden编,VCH Publishers,New York,1989)。
感兴趣的多肽可为任何对于木霉属菌株是天然或外源(异源)的多肽。所述多肽可由单个基因或两个或更多个基因编码。术语“编码多肽的多核苷酸”应理解为涵盖涉及多肽产生的一个或多个(几个)基因。术语“异源多肽”在本文中定义为对于宿主菌株并非天然的多肽,其中进行了结构修饰以改变天然多肽(例如天然多肽的蛋白序列)的天然多肽;或由于通过重组DNA技术(例如,较强的启动子,编码多肽的DNA的多拷贝)操纵多核苷酸或宿主菌株的结果其表达发生数量上变化的天然多肽。因此,本发明在术语“异源多肽”的范围内还涵盖天然多肽的重组产生,只要此种表达涉及使用对于木霉属菌株并非天然的基因元件(genetic element),或使用经操纵以不同于宿主株中正常发生的方式发挥功能的天然元件。在一个方面,多肽是对于木霉属菌株的天然多肽。在另一个方面,多肽是对于木霉属菌株的异源多肽。
所述多肽可为任何具有感兴趣的生物活性的多肽。术语多肽在本文中并不意指特定长度的编码产物,因此,涵盖肽、寡肽和蛋白质。术语“多肽”亦涵盖组合以形成编码产物的两个或更多个多肽。多肽还包括融合多肽,其包含由至少两个不同多肽获得的部分或完整的多肽序列的组合,其中一种或多种(几种)对于木霉属菌株可为异源的。多肽进一步包括上述提及的多肽的天然出现的等位变体和工程改造变体,和杂合多肽。
在一个方面,多肽是抗体、抗原、抗微生物肽、酶、生长因子、激素、免疫扩张剂(immunodilator)、神经递质、受体、报道蛋白、结构蛋白或转录因子。
在另一个方面,多肽是氧化还原酶、转移酶、水解酶、裂合酶、异构酶或连接酶。在另一个方面,多肽是乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、氨肽酶、α-淀粉酶、***聚糖酶、***呋喃糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、香豆酸酯酶、环糊精糖基转移酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、阿魏酸酯酶、具有纤维素分解增强活性的GH61多肽、α-半乳糖苷酶、β-半乳糖苷酶、葡糖脑苷酯酶、葡糖氧化酶、α-葡糖苷酶、β-葡糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、卤素过氧化物酶、半纤维素酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、甘露聚糖酶、甘露糖苷酶、变聚糖酶、氧还酶、果胶水解酶、过氧化物酶、磷脂酶、肌醇六磷酸酶、酚氧化酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、α-1,6-转糖苷酶、转谷氨酰胺酶、尿激酶、木聚糖酶或β-木糖苷酶。
在另一个方面,多肽是白蛋白、胶原、原弹性蛋白、弹性蛋白或明胶。
在另一个方面,多肽是内切葡聚糖酶。在另一个方面,多肽是纤维二糖水解酶。在另一个方面,多肽是β-葡糖苷酶。在另一个方面,多肽是具有纤维素分解增强活性的GH61多肽。在另一个方面,多肽是木聚糖酶。在另一个方面,多肽是β-木糖苷酶。在另一个方面,多肽是乙酰木聚糖酯酶。在另一个方面,多肽是阿魏酸酯酶。在另一个方面,多肽是***呋喃糖苷酶。在另一个方面,多肽是葡糖醛酸糖苷酶。在另一个方面,多肽是乙酰甘露聚糖酯酶。在另一个方面,多肽是***聚糖酶。在另一个方面,多肽是香豆酸酯酶。在另一个方面,多肽是半乳糖苷酶。在另一个方面,多肽是葡糖醛酸酯酶。在另一个方面,多肽是甘露聚糖酶。在另一个方面,多肽是甘露糖苷酶。
在本发明的方法中,木霉属菌株的突变体是重组菌株,其包含编码异源多肽的多核苷酸,并有利地用于多肽的重组产生。菌株优选用包含编码异源多肽的多核苷酸的载体转化,接着将载体整合入染色体。“转化”意指将包含多核苷酸的载体导入宿主株,使得载体作为染色体整合物或作为自主复制的染色体外载体维持。整合一般认为是有利的,因为多核苷酸更可能在菌株中稳定维持。载体对染色体的整合可通过同源重组、非同源重组或转座进行。
编码异源多肽的多核苷酸可从任何原核、真核或其他来源例如古菌(archaeabacteria)获得。就本发明而言,术语“从…获得”用于本文中与给定来源相联意指多肽由所述来源产生,或由***来自所述来源的基因的菌株产生。
在本发明的方法中,多肽亦可为融合多肽或可切割的融合多肽,其中另一种多肽融合于本发明多肽的N端或C端。所述融合多肽是通过将编码另一个多肽的多核苷酸融合于本发明的多核苷酸来产生的。用于产生融合多肽的技术在本领域是已知的,并包括连接编码所述多肽的编码序列,从而使得其符合读框,且融合多肽的表达处于相同启动子和终止子调控之下。融合多肽亦可使用内蛋白(intein)技术来构建,其中融合体在翻译后构建(Cooper等,1993,EMBO J.12:2575-2583;Dawson等,1994,Science 266:776-779)。
融合多肽可进一步在两个多肽之间包含切割位点。在融合蛋白分泌之后,该位点受切割,释放所述两个多肽。切割位点的实例包括但不限于Martin等,2003,J.Ind.Microbiol.Biotechnol.3:568-576;Svetina等,2000,J.Biotechnol.76:245-251;Rasmussen-Wilson等,1997,Appl.Environ.Microbiol.63:3488-3493;Ward等,1995,Biotechnology 13:498-503;以及Contreras等,1991,Biotechnology 9:378-381;Eaton等,1986,Biochemistry 25:505-512;Collins-Racie等,1995,Biotechnology 13:982-987;Carter等,1989,Proteins:Structure,Function,and Genetics 6:240-248;以及Stevens,2003,Drug Discovery World 4:35-48中公开的位点。
在本发明的方法中,本发明的突变体木霉属菌株亦可用于重组产生对于木霉属菌株是天然的多肽。天然多肽可通过重组方式产生,即,例如将编码多肽的基因置于不同启动子的调控之下以增强物质的表达,通过例如使用信号序列加速其从菌株输出,或增加编码木霉属菌株通常产生的多肽的基因的拷贝数。
用于分离或克隆编码感兴趣的多肽的多核苷酸的技术在本领域是已知的,并包括从基因组DNA分离,从cDNA制备,或其组合。可通过例如使用熟知的聚合酶链式反应(PCR)实现从此种基因组DNA克隆此种多核苷酸。参见,例如,Innis等,1990,PCR:A Guide toMethods and Application,Academic Press,New York。克隆方法可涉及将包含编码多肽的多核苷酸的所需的核酸片段切出并分离,将片段***载体分子,并将重组载体并入本发明的突变体木霉属菌株,其中会复制多核苷酸的多重拷贝或克隆。多核苷酸可为基因组、cDNA、RNA、半合成、合成来源的,或其任意组合。
可以以多种方式操纵编码异源多肽的分离的多核苷酸以提供多肽在本发明的突变体木霉属菌株中的表达。取决于表达载体,在将多核苷酸序列***载体之前对其进行操纵可为期望的或必需的。利用重组DNA方法修饰多核苷酸序列的技术在本领域是公知的。
可将包含编码多肽的多核苷酸的核酸构建体可操作地连接于一个或多个(几个)调控序列,所述调控序列能够在与调控序列相容的条件下指导编码序列在本发明的突变体木霉属菌株中的表达。
所述调控序列可为合适的启动子序列,其为由本发明的突变体木霉属菌株识别、用于表达编码多肽的多核苷酸的核苷酸序列。启动子序列含有介导多肽表达的转录调控序列。启动子可为任何在突变体木霉属菌株中显示转录活性的核苷酸序列,包括突变的、截短的和杂合的启动子,并可从编码对突变体木霉属菌株天然或异源(外源)的胞外或胞内多肽的基因获得。
用于在本发明的方法中指导核酸构建体转录的合适启动子的实例是从下列酶的基因获得的启动子:米曲霉TAKA淀粉酶、曼赫根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、曼赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、构巢曲霉乙酰胺酶、镶片镰孢淀粉葡糖苷酶(WO 00/56900)、镶片镰孢Daria(WO 00/56900)、镶片镰孢Quinn(WO 00/56900)、尖镰孢胰蛋白酶样蛋白酶(WO 96/00787)、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶,以及NA2-tpi启动子(一种修饰的启动子,其包含在曲霉属中编码中性α-淀粉酶的基因,其中未翻译的前导序列由在曲霉属(Aspergilli)中编码丙糖磷酸异构酶的基因的未翻译的前导序列所替代;非限制性实例包括修饰的启动子,其包含在黑曲霉中编码中性α-淀粉酶的基因,其中未翻译的前导序列由在构巢曲霉或米曲霉中编码丙糖磷酸异构酶的基因的未翻译的前导序列所替代);和它们的突变的、截短的和杂合的启动子。
调控序列也可以是合适的转录终止子序列,其由本发明的突变体木霉属菌株识别以终止转录。所述终止子序列与编码异源多肽的核苷酸序列的3’末端可操作地连接。可以将在木霉属菌株中有功能的任何终止子用在本发明中。
优选的终止子从如下酶的基因获得:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶和尖镰孢胰蛋白酶样蛋白酶。
调控序列还可以是合适的前导序列,其为对于本发明的突变体木霉属菌株的翻译重要的mRNA非翻译区。前导序列可操作地连接于编码异源多肽的核苷酸序列的5’-末端。可在本发明中使用在突变体木霉属菌株中有功能的任何前导序列。
对于丝状真菌宿主细胞优选的前导序列从如下酶的基因获得:米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶。
调控序列也可以是聚腺苷酸化序列,其是与核苷酸序列的3’末端可操作地连接的序列,并且在转录时,突变体木霉属菌株将其识别为将聚腺苷残基添加至转录的mRNA的信号。可在本发明中使用在突变体木霉属菌株中有功能的任何聚腺苷酸化序列。
对于丝状真菌宿主细胞优选的聚腺苷酸化序列从如下酶的基因获得:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖镰孢胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶。
调控序列还可以是信号肽编码区,其编码与多肽的氨基端相连的氨基酸序列,并且指导编码多肽进入细胞分泌途径。核苷酸序列的编码序列5’端可固有地包含信号肽编码序列,其与编码分泌的多肽的编码序列的区段一起天然地连接在翻译阅读框中。可供选择的是,编码序列5’端可含有对于所述编码序列外源的信号肽编码序列。外源信号肽编码序列在编码序列不天然地含有信号肽编码序列时可为必需的。或者,外源信号肽编码序列可以简单地取代天然信号肽编码序列以增强多肽的分泌。然而,可在本发明中使用指导表达的多肽进入突变体木霉属菌株的分泌途径,即分泌至培养基的任何信号肽编码序列。
对于突变体木霉属菌株有效的信号肽编码区是从如下酶的基因获得的信号肽编码区:米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、曼赫根毛霉天冬氨酸蛋白酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V和疏棉状腐质霉脂肪酶。
调控序列还可以是前肽编码区,其编码位于多肽N端的氨基酸序列。所得多肽称为酶原(proenzyme)或前多肽(propolypeptide)(或在某些情况下称为酶原(zymogen))。前多肽通常是无活性的,并且能够通过前肽的催化或自催化切割从前多肽转化为成熟、活性多肽。可以从酿酒酵母α因子、曼赫根毛霉天冬氨酸蛋白酶和嗜热毁丝霉漆酶(WO 95/33836)的基因获得前肽编码区。
当信号肽和前肽序列二者均出现在多肽的氨基端时,将前肽序列置于紧接着(next to)多肽氨基端,并且将信号肽序列置于紧接着前肽序列的氨基端。
所述核酸构建体亦可包含一个或多个(几个)编码一个或多个(几个)因子的多核苷酸,所述因子有利于指导异源多肽的表达,例如,转录激活子(例如,反式作用因子),分子伴侣,和加工蛋白酶。任何在突变体木霉属菌株中起作用的因子可用于本发明。编码一种或多种(几种)这些因子的核酸并不需要与编码异源多肽的核苷酸序列串联。
同样理想的是添加调节或调控序列,其允许相对于突变体木霉属菌株的生长来调节多肽的表达。调节***的实例是引起基因表达响应化学或物理刺激物,包括调节化合物的存在而开启或关闭的那些***。丝状真菌中的调节***如TAKA α-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子可用作调节序列。调节序列的其它实例是那些允许基因扩增的序列。在真核***中,这些调节序列包括在氨甲蝶呤(methotrexate)存在下扩增的二氢叶酸还原酶基因,和以重金属(with heavy metal)扩增的金属硫蛋白基因。在这些情况下,编码多肽的核苷酸序列将与调节序列可操作地连接。
在本发明的方法中,包含核苷酸序列、启动子和转录和翻译终止信号的重组表达载体可用于重组产生感兴趣的多肽。多种核酸和本文中所述的调控序列可以结合在一起以产生重组表达载体,所述表达载体可以包括一个或多个(几个)方便的限制位点以允许在这些位点***或取代编码多肽的核苷酸序列。可供选择的是,可以通过在适当的用于表达的载体中***核苷酸序列或包含所述序列的核酸构建体来表达所述核苷酸序列。在表达载体的制备中,将编码序列置于载体中,从而将该编码序列与适当的表达调控序列可操作地连接。
重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA步骤,并且能够达成核苷酸序列的表达。载体的选择将通常依赖于其与将引入该载体的突变体木霉属菌株的相容性。载体可以是线状或闭合环状质粒。
载体可以是自主复制载体,即,作为染色体外实体(entity)存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微型染色体(minichromosome)或人工染色体。载体可以含有任何用于确保自复制的手段(means)。或者,载体可以是一种当被引入突变体木霉属菌株中时,整合到基因组中并且与整合了该载体的染色体一起复制的载体。此外,可以使用单独的载体或质粒或两个或更多个载体或质粒,其共同含有待引入突变体木霉属菌株基因组的完整DNA (total DNA),或可以使用转座子(transposon)。
所述载体优选地含有一个或多个(几个)选择性标记,其允许简单选择经转化的突变体木霉属菌株。选择性标记是基因,其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophy to auxotrophs)等。
用于突变体木霉属菌株的选择性标记的实例包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦(phosphinothricin)乙酰转移酶)、hpt(潮霉素磷酸转移酶)、niaD(硝酸还原酶)(nitrate reductase)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)(orotidine-5’-phosphate decarboxylase)、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合酶(anthranilate synthase))以及它们的等同物。优选用于突变体木霉属菌株的是构巢曲霉的amdS基因和吸水链霉菌(Streptomyces hygroscopicus)的bar基因。
所述载体优选含有元件,其允许载体整合入宿主细胞基因组或载体在细胞中独立于基因组的自主复制。
为了整合入突变体木霉属菌株的基因组,载体可依赖编码多肽的多核苷酸的序列或用于通过同源或非同源重组整合入基因组的任何其它载体元件。或者,载体可以含有额外的核苷酸序列,用于指导通过同源重组整合入突变体木霉属菌株基因组染色体中的精确位置。为了增加在精确位置整合的可能性,整合元件应优选含有足够数量的核酸,如100至10,000碱基对,优选400至10,000碱基对,和最优选800至10,000碱基对,其与相应的目标序列具有高度同一性以增强同源重组的概率。整合元件可以是任何序列,其与突变体木霉属菌株基因组中的目标序列同源。此外,整合元件可以是非编码或编码的核苷酸序列。另一方面,可以将载体通过非同源重组整合到突变体木霉属菌株的基因组中。
为了自主复制,载体可以进一步包含复制起点,其使载体能够在突变体木霉属菌株中自主地复制。复制起点可以是介导自主复制的任何质粒复制子(replicator),其在细胞中发挥功能。术语“复制起点”或“质粒复制子”在本文中定义为能够使质粒或载体体内复制的核苷酸序列。
可用于突变体木霉属菌株的复制起点的实例是AMA1和ANS1(Gems等,1991,Gene98:61-67;Cullen等,1987,Nucleic Acids Research 15:9163-9175;WO 00/24883)。分离AMA1基因和构建包含该基因的质粒或载体能够根据公开于WO 00/24883中的方法完成。
用于连接本文中所述元件以构建重组表达载体的方法对本领域技术人员是公知的(参见,例如,J.Sambrook,E.F.Fritsch,和T.Maniatus,1989,Molecular Cloning,Laboratory Manual,第2版,Cold Spring Harbor,New York)。
包含核苷酸序列的载体可通过例如转化导入突变体木霉属菌株,使得所述载体作为染色体整合物或作为自主复制的染色体外载体维持。整合一般认为是有利的,因为核苷酸序列更可能稳定维持于菌株中。载体整合入染色体通过同源重组、非同源重组或转座发生。
将表达载体导入突变体木霉属菌株可涉及包括原生质体形成、原生质体转化和细胞壁再生的本身已知的过程。用于转化木霉属菌株的合适方法描述于Malardier等,1989,Gene 78:147-156,和WO 96/00787。
本发明通过下述实施例进一步描述,其不应视作对本发明范围的限制。
实施例
菌株
里氏木霉菌株981-O-8(D4)是里氏木霉RutC30(ATCC 56765;Montenecourt和Eveleigh,1979,Adv.Chem.Ser.181:289-301)的诱变菌株。
培养基和缓冲溶液
LB培养基包含10g的胰蛋白胨,5g的酵母提取物,和5g的氯化钠,和去离子水加至1升。
LB平板包含10g的胰蛋白胨,5g的酵母提取物,5g的NaCl,15g的Bacto琼脂,和去离子水加至1升。
PDA平板包含39g的Potato Dextrose Agar(Difco)和去离子水加至1升。
NZY顶层琼脂糖包含5g的NaCl,5g的酵母提取物,10g的NZ胺,2g的MgSO4,7g的琼脂糖,和去离子水加至1升。
YEG培养基包含5g的酵母提取物,20g的葡萄糖,和去离子水加至1升。
2X YT琼脂平板包含16g的胰蛋白胨,10g的酵母提取物,5g的氯化钠,15g的Bacto琼脂,和去离子水加至1升。
木霉属基本培养基平板包含30g的蔗糖,20ml的COVE盐溶液,0.6g的CaCl2·2H2O,6g的(NH4)2SO4,25g的Noble琼脂,和去离子水加至1升。
COVE平板包含每升342.3g的蔗糖,25g的Noble琼脂,20ml的COVE盐溶液,10mM乙酰胺,和15或20mM CsCl。在高压灭菌之前,将溶液调整至pH 7.0。
COVE2平板包含30g的蔗糖,20ml的COVE盐溶液,10mM乙酰胺,25g或30g的Noble琼脂,和去离子水加至1升。
COVE盐溶液包含26g的KCl,26g的MgSO4·7H2O,76g的KH2PO4,50ml的COVE痕量金属溶液,和去离子水加至1升。
COVE痕量金属溶液包含0.04g的NaB4O7·10H2O,0.4g的CuSO4·5H2O,1.2g的FeSO4·7H2O,0.7g或1g的MnSO4·H2O,0.8g的Na2MoO2·2H2O,10g的ZnSO4·7H2O,和去离子水加至1升。
COVE顶层琼脂糖包含342.3g的蔗糖,20ml的COVE盐溶液,10mM乙酰胺,10g的低熔点琼脂糖,和去离子水加至1升。
纤维素酶诱导培养基包含20g的Arbocel-天然纤维素纤维(J.Rettenmaier USALP,Schoolcraft,MI,USA),10g的玉米浸渍固形物(corn steep solids)(Sigma ChemicalCo.,St.Louis,MO,USA),1.45g的(NH4)2SO4,2.08g的KH2PO4,0.28g的CaCl2,0.42g的MgSO4·7H2O,0.42ml的痕量金属溶液,2滴Pluronic Acid,和去离子水加至1升。在高压灭菌之前,将pH用10N NaOH调整至6.0。
摇瓶培养基包含20g的右旋糖,10g的玉米浸渍固形物,1.45g的(NH4)2SO4,2.08g的KH2PO4,0.36g的CaCl2,0.42g的MgSO4·7H2O,和0.42ml的痕量金属溶液。
发酵分批培养基包含每升30g的纤维素,4g的右旋糖,10g的玉米浸渍固形物,3.8g的(NH4)2SO4,2.8g的KH2PO4,2.64g的CaCl2,1.63g的MgSO4·7H2O,1.8ml的消泡剂,0.66ml的痕量金属溶液,和去离子水加至1升。
发酵补料培养基包含右旋糖。
痕量金属溶液包含216g的FeCl3·6H2O,58g的ZnSO4·7H2O,27g的MnSO4·H2O,10g的CuSO4·5H2O,2.4g的H3BO3,336g的柠檬酸,和去离子水加至1升。
YP培养基包含10g的酵母提取物,20g的Bacto蛋白胨,和去离子水加至1升。
YP+2%葡萄糖培养基包含去离子水中的1%酵母提取物,2%蛋白胨和2%葡萄糖。
YP+2%麦芽糊精培养基包含去离子水中的2%蛋白胨,2%麦芽糊精,和1%酵母提取物。
DAP-2C-1培养基包含去离子水中的2%葡萄糖,1.1%硫酸镁,1.0%麦芽糖,0.52%磷酸三钾,0.2%柠檬酸,0.1%磷酸二氢钾,0.1%Dowfax 63N10,0.05%酵母提取物,和0.05%的痕量元素溶液(1.39%硫酸亚铁,0.845%硫酸锰,0.68%氯化锌,0.3%柠檬酸,0.25%硫酸铜,和0.013%氯化镍)。
PEG缓冲液包含500g的PEG 4000,10mM CaCl2,10mM Tris-HCl pH7.5,和去离子水加至1升;并过滤灭菌。
STC包含0.8M或1M山梨醇,10mM或25mM CaCl2,和10mM或25mM Tris-HCl,pH 7.5或pH 8;并过滤灭菌。
TE缓冲液包含1M Tris pH 8.0和0.5M EDTA pH 8.0
20X SSC包含175.3g NaCl,88.2g的柠檬酸钠,和去离子水加至1升。
实施例1:质粒pDM156.2的构建
粗糙脉孢菌乳清苷核苷-5’-单磷酸脱羧酶(pyr-4)基因(SEQ ID NO:7为DNA序列,而SEQ ID NO:8为推导的氨基酸序列)的探针使用如下所述的引物通过PCR并入异羟洋地黄毒苷配基-标记的脱氧尿苷-三磷酸(dUTP)来制备。
引物(有义):
5’-GTCAGGAAACGCAGCCACAC-3’(SEQ ID NO:9)
引物(反义):
5’-AGGCAGCCCTTGGACGACAT-3’(SEQ ID NO:10)
将质粒pFB6(Buxton等,1983,Molecular and General Genetics 190:403-405)用Hind III消化并将消化物通过使用40mM Tris碱-20mM乙酸钠-1mM二钠盐EDTA (TAE)缓冲液的1%琼脂糖凝胶电泳纯化。将1.1kb pyr-4片段从凝胶切出并使用Gel Extraction Kit(QIAGEN Inc.,Valencia CA,USA)依照生产商提出的实验方案提取。
扩增反应物(50μl)包含1X Taq DNA聚合酶缓冲液(New England Biolabs Inc.,Ipswich,MA,USA),5μl的PCR DIG Labeling Mix(Roche Molecular Biochemicals,Indianapolis,IN,USA),10ng的1.1kb Hind III pyr-4片段,10pmol的有义引物,10pmol的反义引物,和1单位的Taq DNA聚合酶(New England Biolabs Inc.,Ipswich,MA,USA)。将反应物在(StrataGene,La Jolla,CA,USA)中温育,程序如下:1个循环在95℃进行3分钟,接着35个循环,每个在95℃进行30秒,55℃进行1分钟,和72℃进行1分钟。在72℃进行最终延伸5分钟。
扩增反应产物通过使用TAE缓冲液的1%的琼脂糖凝胶电泳纯化。将大约0.78kb的异羟洋地黄毒苷配基(DIG)标记的探针从凝胶切出并使用Gel ExtractionKit提取。
生成镶片镰孢菌株A3/5的基因组DNA文库并克隆入λ载体EMBL4,如WO 99/60137中所述。
将DIG标记的探针用于筛选克隆入λ载体EMBL4的镶片镰孢A3/5DNA的基因组文库。将λ噬菌体与大肠杆菌K802细胞(New England Biolabs,Ipswich,MA,USA)铺板于含NZY顶层琼脂糖的LB平板上。使用Sambrook等(Molecular Cloning,Laboratory Manual,第2版;J.Sambrook,E.F.Fritsch,和T.Maniatis;Cold Spring Harbor Laboratory Press,1989)的技术将噬菌斑转印至HYBONDTMN尼龙膜(Amersham Biosciences,Buckinghamshire,UK)。DNA通过使用UV STRATALINKERTM(StrataGene,La Jolla,CA,USA)的UV交联结合于膜。然后将滤纸与0.78kb DIG标记的粗糙脉孢菌pyr-4探针杂交。pyrG克隆的杂交和检测依照GENIUSTMSystem User's Guide(Boehringer Hammheim,Manheim,Germany)在42℃用包含5XSSC,35%甲酰胺,0.1%L-月桂酰肌氨酸,0.02%SDS,和1%封闭剂(Boehringer Hammheim,Manheim,Germany)的杂交溶液进行。使用的DIG-标记的探针的浓度为2.5ng每ml的杂交溶液。杂交DNA用碱性磷酸酶缀合的抗异羟洋地黄毒苷配基抗体(Boehringer Hammheim,Manheim,Germany)免疫检测并用Lumiphos 530,一种化学发光底物(BoehringerHammheim,Manheim,Germany)显影。DNA制备物从推定的阳性λ克隆使用Lambda Midi Kit(QIAGEN Inc.,Valencia,CA,USA)制备。
来自上述鉴定的克隆的λDNA用Eco RI消化并对其进行TAE缓冲液中的1%的琼脂糖凝胶电泳。将3.9kb片段切出并使用Gel Extraction Kit(QIAGEN Inc.,Valencia,CA,USA)提取。然后将片段克隆入pUC18(Viera和Messing,1987,Methods inEnzymology 153:3-11)的Eco RI位点,并用2μl的克隆反应物转化ONE/>TOP10感受态细胞(Invitrogen,Carlsbad,CA,USA)。将来自八个所得的转化体的质粒DNA通过DNA测序进行分析。选择一个具有所需序列的克隆,并命名为pDM156.2(图1)。pyrG片段携带整个编码区加上1.3kb的启动子和1.5kb的终止子。
实施例2:质粒pEmY21的构建
将大肠杆菌潮霉素磷酸转移酶(hpt)基因(SEQ ID NO:11为DNA序列,而SEQ IDNO:12为推导的氨基酸序列)从质粒pPHTI(Cummings等,1999,Current Genetics 36:371-382)使用下述引物扩增:
正向引物:
5’-GGGttcgaaTTCATTTAAACGGCT-3’(SEQ ID NO:13)
反向引物:
5’-GGGagcgctCAATATTCATCTCTC-3’(SEQ ID NO:14)
将由下划线序列表示的限制性酶位点Bst BI(正向引物)和Eco 47III(反向引物)通过工程引入引物以供克隆。
PCR反应物(用于扩增hpt基因)包含1X ThermoPol反应缓冲液(New EnglandBiolabs,Inc,Ipswich,MA,USA),各200μM的dNTP,50pmol的正向和反向引物,100pg的pPHT1,1单位的DNA聚合酶(New England Biolabs Inc.,Ipswich,MA USA),和灭菌蒸馏水,总体积为100μl。扩增反应使用/>进行,程序如下:1个循环在95℃进行2分钟;25个循环,每个在95℃进行1分钟,51℃进行1分钟,和72℃进行2分钟;和1个循环在72℃进行7分钟。/>
PCR产物通过TAE缓冲液中的1%琼脂糖凝胶电泳分离。将1.8kb片段从凝胶切出并使用Gel Extraction Kit提取。然后将凝胶纯化的片段使用/>BluntCloning Kit(Invitrogen,Carlsbad,CA,USA)克隆入/>(Invitrogen,Carlsbad,CA,USA)。所得质粒命名为pEmY10。
然后将Eco RI位点从pEmY10中的hpt基因的编码序列使用Site-Directed Mutagenesis Kit(StrataGene,La Jolla,CA,USA)依照生产商的指示使用如下所示的引物去除,其中小写字母代表靶Eco RI位点的未突变的核苷酸,而下划线字母代表突变的核苷酸。所得质粒命名为pBK3。
正向引物:
5'-GGGTACCCCAAGGGCgTattcTGCAGATGGG-3'(SEQ ID NO:15)
反向引物:
5’-CCCATCTGCAgaatAcGCCCTTGGGGTACCC-3'(SEQ ID NO:16)
将所得的不含Eco RI位点的hpt基因使用如下所示的正向和反向引物从pBK3 PCR扩增。
正向引物:
5’-GGggtaccTTCATTTAAACGGCTTCAC-3’(SEQ ID NO:17)
反向引物:
5’-GGggtaccCGACCAGCAGACGGCCC-3’(SEQ ID NO:18)
下划线部分代表导入的用于克隆的Kpn I位点。
米曲霉pyrG基因的部分用于生成直接重复并使用下述引物从pSO2(WO98/12300)PCR扩增:
重复1:
正向引物:
5’-TCCcccgggTCTCTGGTACTCTTCGATC-3’(SEQ ID NO:19)
反向引物:
5’-GGggtaccCGACCAGCAGACGGCCC-3’(SEQ ID NO:20)
重复2:
正向引物:
5’-GGggtaccTCTCTGGTACTCTTCGATC-3’(SEQ ID NO:21)
反向引物:
5’-TCCcccgggCGACCAGCAGACGGCCC-3’(SEQ ID NO:22)
下划线部分代表导入的用于克隆的限制位点Sma I(cccggg)或Kpn I(ggtacc)。
将三个片段(hpt,重复#1和重复#2)在不同反应中扩增(各50μl),所述反应物包含1XThermoPol反应缓冲液,200μM dNTP,各0.25μM的引物,50ng的模板DNA,和1单位的DNA聚合酶。扩增反应使用/>进行,程序如下:1个循环在95℃进行2分钟;30个循环,每个在95℃进行1分钟,61℃进行1分钟,和72℃进行2分钟;和1个循环在72℃进行7分钟。
PCR产物通过TAE缓冲液中的1.5%的琼脂糖凝胶电泳分离。将大约2kb扩增的hpt片段和大约0.2kb重复片段从凝胶切出并使用Gel Extraction Kit(QIAGEN Inc.,Valencia,CA,USA)提取。将两个pyrG重复片段用Kpn I消化,用小牛肠磷酸酶(New England Biolabs Inc.,Ipswich,MA,USA)脱磷酸,和用/>ReactionCleanup Kit(QIAGEN Inc.,Valencia,CA,USA)依照生产商的指示处理。然后将携带重复#1和hpt的片段使用QUICK LIGATIONTMKit(New England Biolabs Inc.,Ipswich,MA,USA)依照生产商的指示连接在一起,并用/>Reaction Cleanup Kit处理,并将所得连接物使用/>Blunt Cloning Kit克隆入/>Blunt。序列分析确认一个克隆,其中重复#1和hpt片段在/>Blunt中连接在一起。该质粒命名为pEmY18。
为了将第二重复克隆入pEmY18,将pEmy18用Eco RV消化并将消化物通过TAE缓冲液中的1%的琼脂糖凝胶电泳纯化。将5.6kb片段从凝胶切出并使用GelExtraction Kit提取。将0.2kb重复2片段(如上所述)和消化的pEmY18使用QUICKLIGATIONTMKit连接在一起。将连接混合物用于转化/>Gold Supercompetent细胞(StrataGene,La Jolla,CA,USA)。序列分析鉴定了其中三个组分(重复#1,hpt和重复#2)处于所需顺序和取向,且没有PCR错误的质粒。所得质粒命名为pEmY20。
为了确保pEmY20用Eco RI的后续消化会释放单一片段,使用位点-Directed Mutagenesis Kit和如下所示的正向和反向引物依照生产商的指示去除Eco RI位点。在序列验证之后将所得质粒命名为pEmY21(图2)。
正向引物:
5'-GGGTACCCCAAGGGCQTATTCTGCAGATGGG-3'(SEQ ID NO:23)
反向引物:
5'-CCCATCTGCAGAATACGCCCTTGGGGTACCC-3'(SEQ ID NO:24)
实施例3:质粒pEmY23的构建
将镶片镰孢pyrG编码序列(2,678bp)从pDM156.2(实施例1)通过用Eco RV和Stu I限制内切酶消化而切出,并将剩余的4,398bp载体使用Gel ExtractionKit依照生产商的指示凝胶纯化。将pEmY21的Sma I片段分离并使用/>GelExtraction Kit凝胶纯化,并将两个凝胶纯化的片段连接在一起。对其就***取向进行筛选,就错误存在与否进行测序,并选择一个具有正确***序列的克隆,并命名为pEmY23(图3)。
实施例4:质粒pWTY1470-19-07的构建
将携带镶片镰孢单端孢霉烯合酶(tri5)基因(SEQ ID NO:25为DNA序列,而SEQ IDNO:26为推导的氨基酸序列)的5’和3’侧翼序列的质粒pJRoy40(美国专利号7,332,341)用作模板以供扩增5’tri5基因侧翼序列的部分。PCR反应含有200μM dNTPs,1X Taq DNA聚合酶缓冲液,125pg的pJRoy40 DNA,50pmol的各下述引物,和1单位的Taq DNA聚合酶,最终体积为50μl。
正向引物:
5’-GGGAGATCTTCGTTATCTGTGCC-3’(SEQ ID NO:27)
反向引物:
5’-GGGAGATCTTAGTAGTCGGCATTTGAAAC-3’(SEQ ID NO:28)
(下划线核苷酸指示导入的Bgl II位点)。
扩增反应物在中温育,程序如下:1个循环在95℃进行3分钟;10个循环,每个在95℃进行30秒,52℃进行45秒,和7℃进行2分钟;20个循环,每个在95℃进行30秒,52℃进行45秒,和72℃进行5分钟;和1个循环在72℃进行7分钟。
PCR产物通过使用TBE缓冲液的1.5%琼脂糖凝胶电泳分离。将大约600bp的片段从凝胶切出并使用Gel Extraction Kit提取。将片段使用/>TACloning Kit(Invitrogen,Carlsbad,CA,USA)***/>(Invitrogen,Carlsbad,CA,USA),并将ONE/>TOP10感受态细胞用2μl的/>TA克隆反应液转化。将来自八个所得转化体的质粒DNA用Eco RI和Bgl II在不同反应中消化,并通过DNA测序确证三个具有正确限制消化样式的转化体的***。选择一个具有所需序列的克隆并命名为pWTY1470-09-05。
将携带tri5基因5’重复的608bp Bgl II片段从pWTY1470-09-05通过用Bgl II消化释放,通过使用TBE缓冲液的1.0%的琼脂糖凝胶电泳纯化,从凝胶切出,并使用Gel Extraction Kit提取。
将质粒pJRoy40通过用Bgl II消化而直链化,之后将其使用虾碱性磷酸酶(RocheDiagnostics Corporation,Indianapolis,IN,USA)依照生产商的指示脱磷酸,并使用PCR Purification Kit(QIAGEN Inc.,Valencia,CA,USA)纯化。将直链化的pJRoy40和凝胶纯化的Bgl II片段使用T4 DNA连接酶(New England Biolabs Inc.,Ipswich,MA,USA)依照生产商的指示连接在一起。大肠杆菌/>化学感受态细胞(StrataGene,La Jolla,CA,USA)的转化依照生产商的指示进行。一个转化体通过DNA测序确认含有所需载体,即,携带tri5 5’和3’侧翼序列和部分5’侧翼序列的重复。所得质粒命名为pWTY1470-19-07(图4)。
实施例5:质粒pWTY1515-02-01的构建
对质粒pWTY1470-19-07使用Site-Directed MutagenesisKit和如下所示的正向和反向引物依照生产商的指示进行体外诱变。
正向引物:
5’-CAAGTAACAGACGCGACAGCTTGCAAAATCTTCGTTATCTGTG-3’(SEQ ID NO:29)
反向引物:
5’-CACAGATAACGAAGATTTTGCAAGCTGTCGCGTCTGTTACTTG-3’(SEQ ID NO:30)
诱变去除在1779bp的Bgl II位点,并使得在2386bp的Bgl II位点称为独特的,并可用于后续操纵以***携带胸腺嘧啶激酶(tk)和潮霉素磷酸转移酶(hpt)基因盒的片段。将诱变反应用于依照生产商提出的实验方案转化试剂盒提供的大肠杆菌Ultra-感受态细胞(StrataGene,La Jolla,CA,USA)。
通过序列分析验证,一个转化体携带如上所示的突变,将其命名为pWTY1515-2-01(图5)并在实施例8中用作骨架。
实施例6:质粒pJaL574的构建
质粒pDV8(美国专利号6,806,062)携带单纯疱疹病毒(Herpes simplex virus)类型1胸腺嘧啶激酶(HSV1-TK;tk)基因(SEQ ID NO:31为DNA序列,而SEQ ID NO:32为推导的氨基酸序列)作为***构巢曲霉甘油醛-3-磷酸脱氢酶(gpdA)启动子的1.0kb Xho I/BglII片段和携带三功能性构巢曲霉吲哚甘油磷酸合酶、磷酸核糖邻氨基苯甲酸异构酶和谷氨酰胺酰胺基转移酶(trpC)转录终止子的1.8kb Bam HI/Hind III片段之间的1.2kb BglII/Bam HI片段。将质粒pDV8用Bam HI消化,用酚-氯仿提取,用乙醇沉淀,然后使用Klenow聚合酶(StrataGene,La Jolla,CA,USA)填充。将消化的质粒使用QUICK LIGATIONTMKit遵循生产商的实验方案重新连接,用Gel Extraction Kit处理,并将所得连接产物使用/>Blunt Cloning Kit依照生产商的指示克隆入/>(Invitrogen,Carlsbad,CA,USA)。将克隆反应物依照生产商的指示转化入ONE/>化学感受态TOP10细胞。从八个所得转化体使用/>9600(QIAGEN Inc,Valencia,CA,USA)提取质粒DNA并通过使用Xho I/Bam HI和Xho I/Hind III的限制性消化筛选。来自两个具有正确的限制性消化样式的转化体的质粒DNA的DNA测序确证两者均携带所需序列。将一个命名为pJaL504-[Bam HI](图6)。
将质粒pJaL504-[Bam HI]用Bgl II消化,用酚-氯仿提取,用乙醇沉淀,然后使用Klenow聚合酶填充。将消化的质粒使用QUICK LIGATIONTMKit遵循生产商的实验方案重新连接,用Reaction Cleanup Kit处理,并将所得连接物使用/>Blunt CloningKit依照生产商的指示克隆入/>将克隆反应物依照生产商的指示转化入ONE/>化学感受态大肠杆菌TOP10细胞。从八个所得转化体使用/>9600提取质粒DNA,并通过使用Xho I/Bgl II和Xho I/Hind III的限制性消化筛选。来自两个具有正确的限制性消化样式的转化体的质粒DNA的DNA测序确认两者均携带所需序列。将一个命名为pJaL504-[Bgl II](图7)。Punt等(1990,Gene 3:101-109)之前显示可缺失构巢曲霉gpdA启动子的364bp而不影响启动子强度。基于这些研究者的观察,设计了如下所示的引物#172450以截短构巢曲霉gpdA启动子并减小载体大小。
引物172450:
5’-GACGAATTCTCTAGAAGATCTCTCGAGGAGCTCAAGCTTCTGTACAGTGACCGGTGACTC-3’(SEQ ID NO:33)
下划线序列对应于gpdA启动子序列。剩余的序列为携带以下限制性位点的柄(handle):Eco RI,Xba I,Bgl II,Xho I,和Hind III。
为了截短构巢曲霉trpC终止子(同样用于减少载体大小),将如下所示的引物#172499设计为携带Eco RI柄。
引物172499:
5’-GACGAATTCCGATGAATGTGTGTCCTG-3’(SEQ ID NO:34)
下划线序列对应于trpC终止子序列。使用引物172499和172450的扩增将启动子截短364bp并将trpC终止子序列截短239bp。
用上述两个引物使用pJaL504-[Bgl II]作为模板进行PCR以生成包含截短型式的构巢曲霉gpdA启动子,HSV1-TK基因的编码序列,和截短型式的构巢曲霉trpC终止子的2,522bp片段。
扩增反应物由5μl的10X缓冲液(Promega Corporation,Madison,WI,USA),各0.4μl的25mM dNTP,1.25μl的引物172450(100ng/μl),1.25μl的引物172499(100ng/μl),0.5μl的pJaL504-[Bgl II](100ng/μl),2μl的Pfu DNA聚合酶(Promega Corporation,Madison,WI,USA)(2.5U/μl),和39.6μl的灭菌蒸馏水组成。将扩增反应物在中温育,程序如下:1个循环在95℃进行45秒;和28个循环,每个在95℃进行45秒,57℃进行45秒,和72℃进行5分钟。在72℃进行最终延伸10分钟。
对扩增反应物进行使用50mM Tris-50mM硼酸-1mMEDTA二钠盐(TBE)缓冲液中的低熔点琼脂糖的1%的琼脂糖凝胶电泳。将2,522bp片段从凝胶切出并使用GelExtraction Kit提取。然后将凝胶纯化的DNA使用/>Blunt Cloning Kit依照生产商的指示***/>将克隆反应物依照生产商的指示转化入ONE/>化学感受态TOP10细胞。从八个所得转化体使用/>9600提取质粒DNA并通过使用Eco RI和Bgl II的限制性消化筛选。来自两个具有正确的限制性消化样式的转化体的质粒DNA的DNA测序确认两者均携带所需序列。将一个命名为pJaL574(图8)。
实施例7:质粒pWTY1449-02-01的构建
将质粒pJaL574遵循生产商推荐的实验方案转化入感受态大肠杆菌SCS110细胞(StrataGene,La Jolla,CA,USA)。从二十四个所得转化体使用9600提取质粒DNA,然后对其进行使用Eco RI和Bgl II的分析性消化。后续DNA序列分析导致鉴定出具有正确的序列的克隆,其命名为pWTY1449-02-01(图9)。
实施例8:tri5缺失载体pJfyS1579-21-16的生成
将大肠杆菌潮霉素磷酸转移酶(hpt)基因盒使用GC GenomicPCR Kit(Clontech,Palo Alto,CA,USA)和如下所示的基因特异性正向和反向引物从质粒pEmY23 PCR扩增。反向引物中的下划线部分引物为用于克隆的Bgl II位点。
正向引物:
5’-TTGAACTCTCAGATCCCTTCATTTAAACGGCTTCACGGGC-3’(SEQ ID NO:35)
反向引物:
5’-CAGATAACGAAGATCTACGCCCTTGGGGTACCCAATATTC-3’(SEQ ID NO:36)
扩增反应物含有362ng的pEmY23作为DNA模板,各200μm的dNTP,1.1mM乙酸镁,0.4μM引物,1X GC反应缓冲液(Clontech,Palo Alto,CA,USA),0.5M GC Melt(Clontech,PaloAlto,CA,USA),和1X GC Genomic Polymerase Mix(Clontech,Palo Alto,CA,USA),最终体积为50μl。将扩增反应物在(Eppendorf,Munich,Germany)中温育,程序如下:1个循环在95℃进行2分钟;25个循环,每个在94℃进行30秒和66℃进行3分钟;和1个循环在66℃进行3分钟;和维持在4℃。
通过使用TAE缓冲液的1%的琼脂糖凝胶电泳分离PCR产物。将大约1.9kb的片段从凝胶切出并使用Gel Extraction Kit提取。将片段使用/>TACloning Kit依照生产商的指示克隆入/> TOP10感受态细胞用2μl的/>TA反应物转化。来自8个转化体的质粒DNA的序列分析确认与预期序列无偏差,并将质粒命名为pJfyS1540-75-5(图10)。
将hpt***物通过用Bam HI和Bgl II消化从pJfyS1540-75-5释放并通过TAE缓冲液中的1%的琼脂糖凝胶电泳纯化。将1.9kb的片段切出并使用GelExtraction Kit提取。使用Rapid DNA Ligation Kit将该片段连接至使用小牛肠磷酸酶脱磷酸的Bgl II-直链化的空tri5缺失载体pWTY1515-2-01(实施例5)。大肠杆菌/>化学感受态细胞用连接反应物转化,并将来自24个所得转化体的质粒DNA通过用Eco RI的限制消化分析以确证***物的取向。选择一个携带具有所需取向的***物的转化体,并命名为pJfyS1579-1-13(图11)。
使用pWTY1449-02-01作为模板和如下所示的基因特异性正向和反向引物PCR扩增单纯疱疹病毒胸腺嘧啶激酶(tk)基因(SEQ ID NO:31为DNA序列,而SEQ ID NO:32为推导的氨基酸序列)。粗体序列代表导入的Bgl II位点。
正向引物:
5’-GCCGACTACTAGATCGACCGGTGACTCTTTCTGGCATGCG-3’(SEQ ID NO:37)
反向引物:
(SEQ ID NO:38)
扩增反应物含有1X反应缓冲液(StrataGene,La Jolla,CA,USA),各200μM的dNTP,55ng的pWTY1449-02-01,0.2μM引物,2%DMSO,和2.5单位的DNA聚合酶(StrataGene,La Jolla,CA,USA),最终体积为50μl。将扩增反应物在/>中温育,程序如下:1个循环在95℃进行1分钟;25个循环,每个在94℃进行30秒,60℃进行30秒,和68℃进行2分45秒;和1个循环在68℃进行2分45秒;和维持在4℃。
将PCR产物通过使用TAE缓冲液的1%的琼脂糖凝胶电泳分离。将大约2.8kb的片段从凝胶切出并使用Gel Extraction Kit纯化。将片段使用/>TACloning Kit克隆入/>ONE/>TOP10感受态细胞用2μl的/>TA反应物转化。来自一个转化体质粒DNA的序列分析鉴定出tk编码序列(C1621G)中导致甘氨酸至丙氨酸的氨基酸变化的突变。使用/>II XL Site-Directed MutagenesisKit(StrataGene,La Jolla,CA,USA)和如下所示的正向和反向引物依照生产商的指示校正该突变。小写字母指示所需变化。16个克隆的序列分析导致选择一个克隆,将其命名为pJfyS1579-8-6(图12)。
正向引物:
5’-CCCTGTTTCGGGGCCCCGAGTTGCTGG-3’(SEQ ID NO:39)
反向引物:
5’-CCAGCAACTCGGGGCCCCGAAACAGGG-3’(SEQ ID NO:40)
将质粒pJfyS1579-8-6用Bam HI和Bgl II消化以释放2.8kb tk片段,并将该片段如上所述进行纯化。将该片段使用QUICK LIGATIONTMKit连接至pJfyS1579-1-13,其经用BglII直链化和用小牛肠磷酸酶处理,并用于依照生产商的实验方案转化大肠杆菌化学感受态细胞。所得质粒命名为pJfyS1579-21-16(图13)并用作tri5缺失盒。/>
实施例9:携带胸腺嘧啶激酶(tk)阴性选择标记和潮霉素磷酸转移酶(hpt)阳性选择标记的通用缺失载体的构建
构建携带胸腺嘧啶激酶(tk)和潮霉素磷酸转移酶(hpt)标志物两者的通用缺失载体以促进后续缺失质粒的装配。对于靶向缺失的基因的5’和3’区的侧翼序列可在用Pme I或Asc I(对于5’侧翼序列)和Sbf I或Swa I(对于3’侧翼序列)消化载体之后,方便地连接至该载体。
为了PCR扩增来源于镶片镰孢pyrG基因的5’侧翼区的直接重复,将50皮摩尔的如下所示的引物用于两个PCR反应,反应物含有50ng的pDM156.2,1X Pfx AmplificationBuffer(Invitrogen,Carlsbad,CA,USA),6μl的dNTP 10mM混合物,2.5单位的Pfx DNA聚合酶(Invitrogen,Carlsbad,CA,USA),和1μl的50mM MgSO4,总体积为50μl。
引物:
重复#1
有义引物:
5’-GTTTAAACGGCGCGCC CGACAAAACAAGGCTACTGCAGGCAGG-3’(SEQ ID NO:41)
反义引物:
5’-TTGTCGCCCGGG AATACTCCAACTAGGCCTTG-3’(SEQ ID NO:42)
重复#2
有义引物:
5’-AGTATTCCCGGG CGACAAAACAAGGCTACTGCA-3’(SEQ ID NO:43)
反义引物:
5’-ATTTAAATCCTGCAGG AATACTCCAACTAGGCCTTG-3’(SEQ ID NO:44)
将扩增反应物在中温育,其程序如下。对于重复#1:1个循环在98℃进行2分钟;和5个循环,每个在94℃进行30秒,55℃进行30秒,和68℃进行1分钟。接着进行35个循环,每个在94℃进行30秒,59℃进行30秒,和68℃进行1分钟。对于重复#2,循环参数为:1个循环在98℃进行2分钟;和5个循环,每个在94℃进行30秒,55℃进行30秒,和68℃进行1分钟。接着进行35个循环,每个在94℃进行30秒,56℃进行30秒,和68℃进行1分钟。在35个循环之后,将两个反应(即重复#1和#2)在68℃温育10分钟然后在10℃冷却直至进行进一步处理。
将来自两个反应的PCR产物通过使用TAE缓冲液的0.8%GTG-琼脂糖(CambrexBioproducts,East Rutherford,NJ,USA)凝胶电泳分离。对于重复#1和重复#2,将大约0.26kb的片段从凝胶切出和使用旋转杯(Millipore,Billerica,MA,USA)依照生产商的指示纯化。然后将十微升的各纯化的重复用于单个重叠PCR反应,其含有1XPfx Amplification缓冲液,6μl的dATP,dTTP,dGTP,和dCTP的10mM混合物,2.5单位的Pfx DNA聚合酶,和1μl的50mM MgSO4,总体积为50μl。将扩增反应物在中温育,程序如下:1个循环在98℃进行2分钟;和5个循环,每个在94℃进行30秒,50℃进行30秒,和68℃进行1分钟。然后将反应物与预温热的溶液混合,所述溶液含有50皮摩尔的对于重复#1的有义引物和50皮摩尔的对于重复#2的反义引物,1X Pfx Amplification缓冲液,6μl的10mM dNTP,2.5单位的/>Pfx DNA聚合酶,和1μl的50mM MgSO4,最终体积为50μl。
将新的100μl扩增反应物在中温育,程序如下:35个循环,每个在94℃进行30秒,58℃进行30秒,和68℃进行1分钟。在35个循环之后,将反应在68℃进行温育10分钟然后在10℃冷却直至进一步加工。0.5kb PCR产物(携带重复装配物)如上所述通过0.8%GTG-琼脂糖凝胶电泳分离。
将质粒pCR4(Invitrogen,Carlsbad,CA,USA)用作载体骨架的来源以供通用缺失载体的构建。为了去除pCR4 DNA的非必需部分,将2.5μg的质粒pTter61C(WO 2005/074647)用Bsp LU11 I和Bst XI顺序消化。然后将消化的载体用南极磷酸酶(Antarcticphosphatase)(New England Biolabs Inc.,Ipswich,MA,USA)处理。将3.1kb消化的骨架如上所述通过0.8%GTG-琼脂糖凝胶电泳分离。然后将纯化的重复装配物连接至用RapidLigation Kit(Roche Diagnostics Corporation,Indianapolis,IN,USA)纯化的载体骨架。连接反应物组成为:75ng的纯化的载体骨架和3μl的纯化重复装配物。将一微升的该连接反应物用于使用生产商的实验方案转化化学感受态Super感受态细胞(StrataGene,Carlsbad,CA,USA)。将二十四个转化体通过Nco I/Pme I限制消化分析。二十四个转化体中的二十三个具有预期的限制消化样式。随机选择克隆pFvRs#10用于测序以确证无PCR诱导的错误。测序分析显示克隆pFvRs#10中的重复装配物具有预期的序列,并将其命名为pAlLo1492-24(图14)。
携带潮霉素磷酸转移酶(hpt)基因的盒使用如下所示的基因-特异性正向和反向引物从pEmY23 PCR扩增。下划线序列代表Xma I位点,而粗体字母代表Bgl II位点。在各5‘端的四个“a”允许PCR产物末端的后续消化。
正向引物:
5’-aaaacccgggCCTTCATTTAAACGGCTTCACGGGC-3’(SEQ ID NO:45)
反向引物:
(SEQ ID NO:46)
扩增反应物含有60ng的pEmY23,各200μm的dNTP,1mM乙酸镁,0.4μM引物,1X PfxAmplification缓冲液,0.5M GC Melt,和2.5单位的Pfx DNA聚合酶,最终体积为50μl。将反应物在/> 中温育,程序如下:1个循环在95℃进行2分钟;10个循环,每个在94℃进行30秒,60℃进行30秒,和68℃进行1分50秒;和1个循环在68℃进行7分钟接着维持在4℃。
PCR产物通过使用TAE缓冲液的1%的琼脂糖凝胶电泳分离。将大约1.8kb的片段从凝胶切出并使用Gel Extraction Kit提取。将凝胶纯化的PCR产物接着用Xma I消化,并在1%琼脂糖凝胶上运行,并如上所述再次进行凝胶纯化。将QUICKLIGATIONTMKit用于将hpt PCR产物连接至Xma I-直链化的、经小牛肠磷酸酶处理的pAlLo1492-24。所得质粒命名为pJfyS1579-35-2(图15),并用作供胸腺嘧啶激酶基因***的受体。
单纯疱疹病毒tk盒的来源是质粒pJfyS1579-8-6(实施例8),将***通过用Bam HI和Bgl II消化从其释放。通过使用TAE缓冲液的1%的琼脂糖凝胶电泳分离消化产物,将对应于2.8kb tk基因***物的片段切出并使用Gel Extraction Kit提取。将QUICK LIGATIONTMKit用于将tk基因盒连接至Bgl II-直链化、经小牛肠磷酸酶处理的pJfyS1579-35-2。所得质粒命名为为pJfyS1579-41-11(图16)。
实施例10:里氏木霉菌株981-O-8基因组DNA提取
将里氏木霉菌株981-O-8在带挡板的摇瓶中的50ml的YEG培养基中在28℃以200rpm振荡生长2日。将菌丝体通过使用(Calbiochem,La Jolla,CA,USA)的过滤来收获,去离子水中洗涤两次,并在液氮下冻结。将冻结的菌丝体通过杵和研钵磨碎至细微粉末,且使用/>Plant Maxi Kit(QIAGEN Inc.,Valencia,CA,USA)分离总DNA。
实施例11:里氏木霉枯草杆菌蛋白酶样丝氨酸蛋白酶基因缺失质粒pDAtw18的构建
为了构建里氏木霉枯草杆菌蛋白酶样丝氨酸蛋白酶基因缺失盒,将里氏木霉枯草杆菌蛋白酶样丝氨酸蛋白酶基因(SEQ ID NO:1为DNA序列,而SEQ ID NO:2为推导的氨基酸序列)的下游非编码区的1.4kb片段使用如下所示的寡核苷酸067375和067376进行PCR扩增。
引物067375:
5’-AAAAAACCTGCAGGGATGTAAGAGGGTTTCTTGAGGGGT-3’(SEQ ID NO:47)
引物067376:
(SEQ ID NO:48)
下划线字母代表添加至有义和反义引物以促进克隆扩增片段的Sbf I位点,而粗体区代表导入用于后续限制性消化以去除β-内酰胺酶基因以供真菌转化的Not I位点。
扩增反应物包含300ng的里氏木霉菌株981-O-8基因组DNA(实施例10),各300μM的dNTP,50pmol的引物067375,50pmol的引物067376,1X反应缓冲液,1mM MgSO4和2.5单位的Pfx DNA聚合酶(Invitrogen Corp.,Carlsbad,CA,USA)。将反应物在5333(Eppendorf Scientific,Inc.,Westbury,NY,USA)中温育,其程序如下:1个循环在98℃进行5分钟;30个循环,每个在98℃进行30秒,58℃进行30秒,和72℃进行1.6分钟;和1个循环在72℃进行15分钟。将1442bp PCR片段通过使用TAE缓冲液的1%的琼脂糖凝胶电泳分离,从凝胶切出,并使用/>GelExtraction Kit提取。将1442bp PCR产物克隆入/>(Invitrogen Corp.,Carlsbad,CA,USA)并依照生产商的指示转化入化学感受态大肠杆菌细胞。在补充100μg每ml的氨苄青霉素的2X YT琼脂平板上选择转化体,并在37℃进行温育16小时。克隆片段的DNA序列通过用M13正向和反向引物的DNA测序验证。所得质粒命名为pClone10。
类似地,将里氏木霉枯草杆菌蛋白酶样丝氨酸蛋白酶基因(SEQ ID NO:1为DNA序列,而SEQ ID NO:2为推导的氨基酸序列)的上游非编码区的1.5kb片段使用如下所示的引物067377和067374进行PCR扩增。
引物067377:
(SEQ ID NO:40)
引物067374:
5’-AAAAAAGGCGCGCCACTGTGGGAGGGCTGTATGGACA-3’(SEQ ID NO:50)
下划线字母代表添加至有义和反义引物以协助克隆扩增片段的Asc I位点,而粗体区代表Not I位点
PCR扩增在如上所述的相同条件下进行,但是使用引物067377和067374。将1530bp PCR片段通过使用TAE缓冲液的1%的琼脂糖凝胶电泳分离,从凝胶切出,并使用Gel Extraction Kit提取。将1530bp扩增片段克隆入/>载体并依照生产商的指示转化入化学感受态大肠杆菌细胞。转化体在补充100μg每ml的氨苄青霉素的2X YT琼脂平板上选择,并在37℃温育16小时。克隆片段的DNA序列通过用M13正向和反向引物的DNA测序验证。所得质粒命名为pClone1。
将质粒pClone1用Asc I消化并将消化物通过TAE缓冲液中的1%的琼脂糖凝胶电泳纯化。将含有里氏木霉枯草杆菌蛋白酶样丝氨酸蛋白酶基因片段的上游非编码区的1415bp片段从凝胶切出并使用Gel Extraction Kit提取。将该***物使用QUICK LIGATIONTMKit(New England Biolabs,Beverly,MA,USA)依照生产商提出的实验方案连接至经Asc I消化并经小牛小肠磷酸酶(CIP)脱磷酸的pJfyS1579-41-11(实施例9)。使用限制分析鉴定含有具所需取向的***物的转化体,并进行序列分析确证无PCR错误。所得质粒命名为pClone14。
构建最终里氏木霉枯草杆菌蛋白酶样丝氨酸蛋白酶基因缺失盒,pDAtw18(图17),即用Sbf I消化pClone10以释放里氏木霉枯草杆菌蛋白酶样丝氨酸蛋白酶基因片段的1.5kb下游非编码区,然后将其使用QUICK LIGATIONTMKit依照生产商提出的实验方案连接至经Sbf I消化并经小牛小肠磷酸酶(CIP)脱磷酸的pClone14。然后可通过用Not I消化生成含有TrSpΔ::hpt/tk等位基因的直链7.7kb片段。
实施例12:里氏木霉原生质体生成和转化
原生质体制备和转化使用Penttila等,1987,Gene 61:155-164的修饰的实验方案进行。简言之,将里氏木霉菌株981-O-8在25ml的补充2%(w/v)葡萄糖和10mM尿苷的YP培养基在27℃以90rpm轻柔搅拌17小时。菌丝体通过使用Millipore Vacuum DrivenDisposable Filtration System(Millipore,Bedford,MA,USA)过滤来收集,并用去离子水洗涤两次和用1.2M山梨醇洗涤两次。生成原生质体,即,将经洗涤菌丝体在34℃以90rpm轻柔振荡悬于含有15mg每ml的200G(Novozymes A/S,Bagsvaerd,Denmark)和0.36单位每ml的壳多糖酶(Sigma Chemical Co.,St。Louis,MO,USA)的20ml的1.2M山梨醇中15-25分钟。通过在400x g离心7分钟并用冷1.2M山梨醇洗涤两次来收集原生质体。将原生质体使用血细胞计数器计数,并重悬于STC中至最终浓度为1x 108个原生质体/ml。将过量的原生质体在-80℃储藏于Cryo 1℃Freezing Container(Nalgene,Rochester,NY,USA)。
将大约各10μg的下文实施例中所述的缺失盒用Not I(实施例13和20)或HindIII/Bgl II(实施例17)消化。将每个消化反应物通过TAE缓冲液中的1%的琼脂糖凝胶电泳纯化,将DNA条带从凝胶切出,并使用Gel Extraction Kit提取。将所得纯化DNA添加至100μl的原生质体溶液,并轻柔地混合。添加PEG缓冲液(250μl),混合,并在34℃温育30分钟。然后添加STC(3ml),混合,并铺板于补充1M蔗糖的PDA培养基。在28℃温育16小时之后,将15ml的补充100μg每ml的潮霉素B的覆层PDA培养基添加至各平板,将平板在28℃温育4-6日。
实施例13:枯草杆菌蛋白酶样丝氨酸蛋白酶基因缺失里氏木霉菌株DAtw18-97的生成
将里氏木霉菌株981-O-8原生质体使用实施例12中所述的方法用Not I-直链化的pDAtw18转化以缺失枯草杆菌蛋白酶样丝氨酸蛋白酶基因。在含有25μg每ml的潮霉素B的PDA平板上选择一百六十六个转化体。将转化体传代培养至PDA平板以生成孢子。将每个转化体在含有25ml的纤维素酶诱导培养基pH 6.0的125ml带挡板的摇瓶中培养,并在28℃以200rpm振荡温育7日。运行里氏木霉菌株981-O-8作为对照。在接种后7日移出培养液样品,在微离心机中以15,700x g离心5分钟,并将上清转移至新管。
对上述上清进行使用合成底物N-琥珀酰-L-Ala-L-Ala-L-Pro-L-Phe-对硝基苯胺(AAPF)(Bachem AG,Bubendorf,Switzerland)蛋白酶测定法以确定是否有任何转化体缺失枯草杆菌蛋白酶样丝氨酸蛋白酶基因。底物最初溶解于浓度为100mg/ml的二甲亚砜。然后将溶解底物50倍稀释于100mM NaCl-100mM MOPS pH 7.0。通过在平底96孔板(CorningInc.,Acton,MA,USA)中将各10μl的转化上清添加至100μl的稀释底物来起始反应。将反应平板在50℃温育3小时,然后使用Microplate Reader(MolecularDevices,Sunnyvale,CA,USA)测量在405nm的吸光度。将里氏木霉DAtw18转化体的蛋白酶活性与亲本株里氏木霉菌株981-O-8的相比较。
然后通过Southern分析来分析与里氏木霉菌株981-O-8相比较显示较低胞外蛋白酶活性的十五个转化体。如实施例11中所述提取来自15个转化体的基因组DNA,并取各2μg用20单位的Nco I-HFTM(New England Biolabs,Inc.,Ipswich,MA,USA)在37℃消化16小时。将消化的DNA通过使用TAE缓冲液的0.7%的琼脂糖凝胶电泳分级4小时,并使用TURBOBLOTTERTM(Schleicher&Schuell BioScience,Keene,NH,USA)遵循生产商的推荐印迹于NYTRANTMSuperCharge膜(Schleicher&Schuell BioScience,Keene,NH,USA)进行16小时。将膜与502bp异羟洋地黄毒苷配基标记的枯草杆菌蛋白酶样丝氨酸蛋白酶基因探针杂交,所述探针通过藉由使用如下所示的引物067911(有义)和067912(反义)的PCR并入异羟洋地黄毒苷配基-11-dUTP来合成。
引物067911(有义):
GCGGTCATTTACAGTGCCTCGAATA(SEQ ID NO:51)
引物996117(反义):
CTGCTCTGTTAGCAATCCTCAAGCA(SEQ ID NO:52)
扩增反应物(50μl)包含1X ThermoPol Reaction缓冲液,5μl的PCR DIG LabelingMix,10ng的pDAtw18,0.3μM引物067911,0.3μM引物067912,和2.5单位的Taq DNA聚合酶。反应物在5333中温育,程序如下:30个循环,每个在95℃进行30秒,56℃进行30秒,和72℃进行40秒(15分钟延伸)。将五微升的PCR产物通过使用TAE缓冲液的1.5%的琼脂糖凝胶电泳进行大小选择,用溴乙锭染色,并在UV透照器下显色。异羟洋地黄毒苷配基的并入通过分子量增加指示。
杂交在DIG Easy Hyb缓冲液(Roche Molecular Biochemicals,Indianapolis,IN,USA)中在42℃进行17小时。然后将膜在高严格条件下在2X SSC加0.1%SDS中在室温洗涤5分钟,接着在65℃在0.5X SSC加0.1%SDS中洗涤两次各15分钟。通过化学发光测定法(Roche Molecular Biochemicals,Indianapolis,IN,USA)遵循生产商的指示检测探针-靶杂合物。Southern分析表明所有15个转化体在枯草杆菌蛋白酶样丝氨酸蛋白酶基因基因座中含有缺失盒的单个整合,而在其他基因座不含缺失片段的任何其他整合。选择一个命名为里氏木霉DAtw18-97的菌株用于后续转化。
实施例14:质粒pSaMe-AaXYL的构建
构建质粒pSaMe-AaXYL以包含里氏木霉纤维二糖水解酶I基因启动子和终止子和棘孢曲霉GH10木聚糖酶编码序列。
棘孢曲霉木聚糖酶的克隆大致遵循等,1994,Mol.Gen.Genet.243:253-260概述的总体表达克隆实验方案。
从棘孢曲霉CBS 101.43菌丝体分离RNA。将Poly(A)+RNA从总RNA通过寡聚(dT)纤维素上的层析分离。如Maniatis等(Molecular cloning:laboratory manual.Cold SpringHarbor Laboratory Press,1982)所述合成双链cDNA。在合成之后,将cDNA用绿豆核酸酶处理,用T4 DNA聚合酶平端化,并连接于非回文的Bst XI衔接头(Invitrogen,Carlsbad,CA,USA)。将cDNA通过使用TAE缓冲液的1%的琼脂糖凝胶电泳进行大小分级,其中将600bp至4000bp范围的片段用于文库构建。将DNA在GAL1启动子和异-1-细胞色素c终止子之间连接入Bst XI-消化的pYES 2.0,并转化入大肠杆菌MC1061细胞(StrataGene,La Jolla,CA,USA)。将文库铺板于LB平板并在37℃温育过夜。将菌落从平板刮取,并重悬于补充100μg每ml的氨苄青霉素的LB培养基。使用Plasmid Midi Kit(QIAGEN Inc.,Valenicia,CA,USA)分离质粒DNA。将纯化的质粒DNA汇集。
将纯化的质粒DNA混合物转化入酿酒酵母W3124细胞(MATa;ura 3-52;leu 2-3,112;his 3-D200;pep 4-1137;prcl::HIS3;prbl::LEU2;cir+;van den Hazel等,1992,Eur.J.Biochem.207:277-283)。培养、转化和培养基如Guthrie等,1991,Meth.Enzymol.Vol194,Academic Press所述。将转化细胞在30℃铺板于含有2%葡萄糖的合成完全琼脂3日,在3日之后,将菌落复制铺板至含2%半乳糖的SC培养基(Sherman,2002,MethodsEnzymol.350:3-41),并在30℃温育4日。表达木聚糖酶的菌落通过含0.1%AZCL-Birch-Xylan的1%琼脂糖覆层在pH 4.5鉴定(2006,FEMS Microbiology Reviews 21:29-42)。表达木聚糖酶活性的菌落有蓝色区围绕。从阳性克隆拯救的质粒DNA含有大约1.3kb的DNA***物。分离的基因片段的测序揭示了1218bp开读框,其编码具有43.0kDa的理论分子量的多肽。将cDNA片段亚克隆入用Bam HI和Xho I消化的曲霉属表达载体pHD464(和Heldt-Hansen,1994,Mol.Gen.Genet.243,253–260),即用Bam HI和Xho I切割克隆,并分离1.2kb cDNA***物(Christgau等,1996,Biochem.J.319:705-712)以生成质粒pA2X2。
对棘孢曲霉GH10木聚糖酶编码序列使用质粒pA2x2作为模板和如下所示的引物153505和153506使用标准方法进行PCR扩增以得到大约1.2kb片段。将1.2kb片段用Bam HI和Xho I(已导入PCR引物)消化,并克隆入载体pCaHj527(WO 2004/099228)。所得质粒命名为pMT2155,其中cDNA处于来自黑曲霉的中性淀粉酶II(NA2)启动子和来自黑曲霉的AMG终止子的转录调控之下。
引物153505:
5’-TCTTGGATCCACCATGGTCGGACTGCTTTCAATCACC-3’(SEQ ID NO:53)
引物153506:
5’-TTAACTCGAGTCACAGACACTGCGAGTAATAGTC-3’(SEQ ID NO:54)
设计两个如下所示的合成寡核苷酸引物以从质粒pMT2155 PCR扩增棘孢曲霉GH10基因,并将用于***的侧翼区导入表达载体pMJ09(WO 2005/056772)。粗体字母代表编码序列,而剩余的序列与pMJ09的***位点同源。
正向引物:
(SEQ ID NO:55)
反向引物:
(SEQ ID NO:56)
扩增反应物包含50皮摩尔的上述各引物,50ng的pMT2155,1μl的10mM的dATP,dTTP,dGTP和dCTP的混合物,5μl的10X ACCUTAQTMDNA聚合酶缓冲液(Sigma-Aldrich,St.Louis,MO,USA),和5单位的ACCUTAQTMDNA聚合酶(Sigma-Aldrich,St.Louis,MO,USA),最终体积为50μl。将5333用于扩增DNA片段,其程序如下:1个循环在95℃进行3分钟;和30个循环,每个在94℃进行45秒,55℃进行60秒,和72℃进行1分30秒。在30个循环之后将反应物在72℃进行温育10分钟然后冷却至4℃直至进一步加工。
反应产物通过使用TAE缓冲液的1.0%的琼脂糖凝胶电泳分离,其中将1.2kb产物条带从凝胶切出,并使用Gel Extraction Kit依照生产商的指示纯化。
然后将片段使用IN-FUSIONTMCloning Kit(Clontech,Inc.,Palo Alto,CA,USA)克隆入pMJ09。将载体用Nco I和Pac I消化并通过如上所述的琼脂糖凝胶电泳纯化。将1.2kb基因片段和消化的载体在反应中连接在一起得到表达质粒pSaMe-AaXYL,其中家族GH10基因的转录处于里氏木霉cbh1启动子的调控之下。连接反应物(50μl)包含1X IN-FUSIONTM缓冲液(Clontech,Inc.,Palo Alto,CA,USA),1X BSA,1μl的IN-FUSIONTM酶(1:10稀释)(Clontech,Inc.,Palo Alto,CA,USA),100ng的用Nco I和Pac I消化的pAlLo2,和100ng的棘孢曲霉GH10木聚糖酶纯化的PCR产物。将反应物在室温温育30分钟。将一μl的反应物用于依照生产商转化大肠杆菌XL10Gold细胞(StrataGene,La Jolla,CA,USA)。含有pSaMe-AaXYL(图18)的大肠杆菌转化体通过限制酶消化检测,并使用/>9600制备质粒DNA。来自pSaMe-AaXYL的棘孢曲霉GH10基因的DNA测序使用染料终止子化学(Giesecke等,1992,Journal of Virology Methods 38:47-60)和引物步移策略进行。
实施例15:枯草杆菌蛋白酶样丝氨酸蛋白酶缺陷菌株DAtw18-97中的棘孢曲霉GH10木聚糖酶表达
原生质体依照实施例12中描述的步骤从枯草杆菌蛋白酶样丝氨酸蛋白酶缺陷菌株里氏木霉DAtw18-97生成,并用含有棘孢曲霉GH10木聚糖酶编码序列的里氏木霉表达构建体pSaMe-AaXYL(实施例14)转化以确定由里氏木霉DAtw18-97表达的棘孢曲霉木聚糖酶GH10的稳定性。通过将大约3μg的经Pme I消化并经凝胶纯化的pSaMe-AaXYL添加至100μl的原生质体溶液并轻柔地混合来进行转化。添加PEG缓冲液(250μl)、混合,并在37℃温育30分钟。然后添加STC(3ml),混合,并铺板于COVE平板。将平板在28℃温育7-10日。在COVE2平板上的单轮孢子纯化之后,将20个转化体在含有25ml的纤维素酶诱导培养基的小规模摇瓶中在28℃生长5日,之后通过在微离心机中在15,700x g离心10分钟来收集上清。
棘孢曲霉GH10木聚糖酶的表达使用8-16%CRITERIONTMTris-HCl凝胶(Bio-RadLaboratories,Hercules,CA,USA)与CRITERIONTMCell(Bio-Rad Laboratories,Hercules,CA,USA)进行分析。将5μl的第5日样品悬于2X浓度的Laemmli Sample缓冲液(Bio-RadLaboratories,Hercules,CA,USA),并在5%β-巯基乙醇的存在下在95℃加热5分钟。将所有样品加载于CRITERIONTMTris-HCl凝胶,并在1X Tris/Glycine/SDS运行缓冲液(Bio-RadLaboratories,Hercules,CA,USA)中进行电泳。将所得凝胶用BIO-SAFETMCoomassie Stain(Bio-Rad Laboratories,Hercules,CA,USA)染色。培养物的SDS-PAGE概貌显示主要是全长棘孢曲霉GH10木聚糖酶蛋白的存在,但亦有以较低量存在的较小片段。结果表明用于产生棘孢曲霉GH10木聚糖酶的枯草杆菌蛋白酶样丝氨酸蛋白酶基因的缺失并未完全阻止蛋白质的蛋白水解。
实施例16:里氏木霉天冬氨酸蛋白酶基因缺失质粒pAgJg111的构建
构建缺失载体pAgJg111以破坏里氏木霉42kDa天冬氨酸蛋白酶(SEQ ID NO:3为DNA序列,而SEQ ID NO:4为推导的氨基酸序列)在里氏木霉菌株981-O-8中的表达。首先通过使用如下所示的引物066694(有义)和066695(反义)扩增天冬氨酸蛋白酶编码区加减编码区的上游和下游600bp来生成质粒pAgJg110。
引物066694(有义):
ACGAATGGTCAAAGGACTATGTATCAT(SEQ ID NO:57)
引物066695(反义):
CACATACCCAGAGTCAGGCCCTGCG(SEQ ID NO:58)
天冬氨酸蛋白酶区通过PCR在反应中扩增,反应物包含316ng的里氏木霉菌株981-O-8基因组DNA(实施例10),1μl的Herculase II Fusion DNA聚合酶(StrataGene,LaJolla,CA,USA),50pmol的引物066694,50pmol的引物066695,5μl的10mM dNTP,5μl的5XHerculase II反应缓冲液(StrataGene,LaJolla,CA,USA),和35μl的水。将反应物在 5333中温育,程序如下:1个循环在95℃进行2分钟;30个循环,每个在95℃进行20秒,60℃进行20秒,和72℃进行1分30秒;1个循环在72℃进行3分钟;和4℃维持。将2.5kb PCR片段通过使用TAE缓冲液1%的琼脂糖凝胶电泳纯化,从凝胶切出,并使用/>Gel Extraction Kit依照生产商的指示提取。
将凝胶纯化的PCR片段用Taq DNA聚合酶处理以在反应中对片段添加3’A-悬突,反应物包含5μl的纯化PCR片段,1μl的10X Thermopol缓冲液(New England Biolabs,Inc,Ipswich,MA,USA),0.5μl的10mM dNTP,0.5μl的Taq DNA聚合酶,和3μl的水。将反应物在72℃温育15分钟。将天冬氨酸蛋白酶基因片段依照生产商的指示克隆入以生成pAgJg110。克隆反应物包含2μl的天冬氨酸蛋白酶PCR片段,1μl的盐溶液(Invitrogen,Carlsbad,CA,USA),2μl的水,和1μl的/>
为了构建质粒pAgJg111,将pAgJg110在反应中用Bmg I和BstE II消化,反应物包含5μg的pAgJg110 DNA,3μl的Bmg I,3μl的BstE II,10μl 10X NEB Buffer 3(New EnglandBiolabs,Inc,Ipswich,MA,USA),1μl 100X BSA,和53μl的水。将pAgJg110的消化物在37℃温育1小时,然后在60℃温育1小时。然后通过添加各10μl的10mM dNTP,和12.5单位的DNA聚合酶I,大(Klenow)片段(New England Biolabs,Inc,Ipswich,MA,USA)将消化的pAgJg110平端化。将反应物在37℃温育15分钟。将消化的、平端化的pAgJg110通过使用TAE缓冲液的1%的琼脂糖凝胶电泳来纯化,从凝胶切出,并使用Gel Extraction Kit依照生产商的指示提取。
将质粒pHT(Cummings等,1999,Current genetics 36:371-382)在反应中用HindIII和Ava I消化,反应物包含1.86μg的pHT DNA,3μl的Hind III,3μl的Ava I,10μl的10XNEB BUFFER 2(New England Biolabs,Inc,Ipswich,MA,USA),和51μl的水,在37℃进行2.5小时,然后通过添加10μl的10mM dNTP和12.5μl单位的DNA聚合酶I,大(Klenow)片段和在37℃温育15分钟来平端化。将消化的、平端化的pHT通过使用TAE缓冲液的1%的琼脂糖凝胶电泳纯化,并将1.9kb片段从凝胶切出并使用Gel Extraction Kit依照生产商的指示提取。
在反应中使用T4 DNA Ligase将来自pAgJg110和pHT的所得片段连接在一起以形成pAgJg111(图19),反应物包含88ng的pHT片段,106ng的pAgJg110片段,1.5μl的10X T4DNA Ligase Buffer(New England Biolabs,Inc,Ipswich,MA,USA),1μl的T4 DNA Ligase(New England Biolabs,Inc,Ipswich,MA,USA),和0.5μl的水。
实施例17:天冬氨酸蛋白酶基因缺失里氏木霉菌株AgJg111-50的生成
使用实施例12中所述的方法用Hind III/Bgl I-直链化的pAgJg111转化里氏木霉菌株981-O-8原生质体以缺失天冬氨酸蛋白酶基因。在含有25μg每ml的潮霉素B的PDA平板上选择了九十个转化体。将转化体传代培养至PDA平板以生成孢子。
在天冬氨酸蛋白酶基因座中含有pAgJg111缺失载体,由此破坏天冬氨酸蛋白酶的表达的里氏木霉菌株981-O-8的可能候选物,是通过使用Suzuki等,2006,J.Bioscienceand Bioengineering 102:572-574的修饰的实验方案的Fungal Colony PCR进行筛选的。将来自各候选物的少量孢子悬于25μl的TE缓冲液,并在微波炉中以高档位和加热1分钟。将经微波处理的孢子悬液在PCR反应中用作模板以筛选天冬氨酸蛋白酶缺失。反应物包含1μl的孢子悬液,各1μl的10mM dNTP,12.5μl的2XGC-Melt LA缓冲液(Clontech,Mountain View,CA,USA),25pmol的引物066694(16),25pmol的引物066695(实施例16),1.25单位的/>GC Genomic LA Polymerase Mix(Clontech,MountainView,CA,USA),和9.25μl水。将反应物在/>中温育,程序如下:1个循环在95℃进行10分钟;35个循环,每个在95℃进行30秒,60℃进行30秒,和72℃进行4分30秒;1个循环在72℃进行5分钟;和4℃维持。用于该筛选的引物起初用于扩增天冬氨酸蛋白酶区。若将缺失载体***天冬氨酸蛋白酶基因座,扩增的PCR片段应大于野生型片段,因为其含有用于破坏天冬氨酸蛋白酶基因的hph盒。对在第一Fungal Colony PCR筛选中显示一个较大条带的候选物使用如下所示的引物进行第二PCR筛选。
引物068331(有义):
ATATCTCTCTCGAGGCCTGCTTATT(SEQ ID NO:59)
引物067947(反义):
CTACATCGAAGCTGAAAGCACGAGA(SEQ ID NO:60)
引物068331在缺失菌株中含有的天冬氨酸蛋白酶基因的5’区上游,且引物067947在hph盒中。仅那些含有天冬氨酸蛋白酶破坏的候选物会产生PCR片段。扩增反应包含1μl的来自候选物的基因组DNA(依照实施例10提取),各1μl的10mM dNTP,12.5μl的2XGC-Melt LA Buffer,25pmol的引物068331,25pmol的引物067947,0.25μl 1.25单位的/>GC Genomic LA POLYMERASE Mix,和9.25μl的水。将反应物在/>中温育,程序如下:1个循环在95℃进行2分钟;30个循环,每个在95℃进行30秒,55℃进行30秒,和72℃进行2分钟;1个循环在72℃进行5分钟;和4℃维持。
进行了Southern印迹分析以确证通过质粒pAgJg111的天冬氨酸蛋白酶基因破坏。基因组DNA从缺失菌株和里氏木霉菌株981-O-8如实施例10中所述提取。将两μg的来自缺失菌株和里氏木霉菌株981-O-8的基因组DNA,以及1ng的来自pAgJg111的质粒DNA用Nco I和Pvu II消化。将里氏木霉菌株981-O-8和pAgJg111包括在Southern印迹中作为对照。基因组DNA消化反应物包含2μg的基因组DNA,1μl的Nco I,1μl的Pvu II,5μl的10X NEB BUFFER 2,和水至50μl。将两种基因组DNA消化物在37℃温育大约14-16小时。将质粒pAgJg111在反应中消化,反应物包含1ng的pAgJg111DNA,0.5μl的Nco I,0.5μl的Pvu II,2μl的10X NEBBUFFER 2,和水至20μl。将消化物在37℃温育大约1小时。
对消化物进行使用TAE缓冲液的0.7%的琼脂糖凝胶电泳,并遵循生产商的推荐使用印迹于/>SuperCharge印迹膜进行14-16小时。将膜与500bp异羟洋地黄毒苷配基标记的里氏木霉42kDa天冬氨酸蛋白酶探针杂交,所述探针通过藉由使用如下所示的引物068128(有义)和068129(反义)的PCR并入异羟洋地黄毒苷配基-11-dUTP来合成。
引物068128(有义):
AGTCAGGTTCAGCAGATCGCCAGGGATGG(SEQ ID NO:61)
引物068129(反义):
GTGGTTCTCCAACGCCGCCAGCAGC(SEQ ID NO:62)
扩增反应物包含5μl的10X ThermoPol Reaction缓冲液,2.5μl的PCR DIG LabelingMix,2ng的pAgJg111,50pmol的引物068128,50pmol的引物068129,2.5μl的10mM dNTP,5单位的Taq DNA聚合酶,和35.5μl的水。将反应在5333中温育,其程序如下:1个循环在95℃进行2分钟;30个循环,每个在95℃进行30秒,60℃进行30秒,和72℃进行40秒;1个循环在72℃进行15分钟;和4℃维持。将PCR反应产物通过使用TAE缓冲液的1%的琼脂糖凝胶电泳纯化,从凝胶切出,并使用/>GelExtraction Kit依照生产商的指示提取。异羟洋地黄毒苷配基的并入通过分子量的增加指示。
杂交在DIG Easy Hyb缓冲液中在42℃进行15-17小时。然后将膜在室温在高严格条件下在2X SSC加0.1%SDS中洗涤5分钟,接着在65℃在0.5XSSC加0.1%SDS中洗涤两次各15分钟。探针-靶杂合物的检测是通过化学发光测定法(Roche Molecular Biochemicals,Indianapolis,IN,USA)遵循生产商的指示进行。含有天冬氨酸蛋白酶缺失的菌株命名为里氏木霉AgJg111-50。
实施例18:天冬氨酸蛋白酶缺陷菌株AgJg111-50中的棘孢曲霉GH10木聚糖酶表达
为了确定42kDa天冬氨酸蛋白酶的缺失是否有效地消除了棘孢曲霉GH10木聚糖酶的降解,将含有棘孢曲霉GH10木聚糖酶编码序列的质粒pSaMe-AaXYL(实施例14)转化入里氏木霉AgJg111-50。里氏木霉AgJg111-50的原生质体如实施例12中所述生成,并用质粒pSaMe-AaXYL转化。从COVE平板随机选择含有棘孢曲霉GH10木聚糖酶的二十个转化体,并在含有25ml的纤维素酶诱导培养基pH 6.0的125ml摇瓶中培养,所述摇瓶用转化体孢子接种,并在28℃在200rpm振荡温育5日。运行里氏木霉菌株981-O-8和里氏木霉AgJg111-50两者作为对照。在接种后5日移出培养液样品,在微离心机中在15,700x g离心10分钟,并将上清转移至新管。
通过使用8-16%CRITERIONTMTris-HCl凝胶与CRITERIONTMCell的SDS-PAGE分析上清。将五μl的第5日样品悬于2X浓度的Laemmli Sample Buffer,并在5%β-巯基乙醇存在下在95℃进行加热5分钟。将所有样品加载于SDS-PAGE凝胶上,并在1X Tris/Glycine/SDS运行缓冲液中进行电泳。将所得凝胶用BIO-SAFETMCoomassie Stain染色。SDS-PAGE分析表明用于产生棘孢曲霉GH10木聚糖酶的天冬氨酸蛋白酶基因缺失并未完全阻止蛋白质的蛋白水解。天冬氨酸蛋白酶缺失菌株里氏木霉AgJg111-50并未展示任何蛋白的任何不寻常的表达样式,并与亲本株里氏木霉菌株981-O-8表现类似。
实施例19:里氏木霉胰蛋白酶样丝氨酸蛋白酶基因缺失质粒pAgJg116的构建
构建缺失载体pAgJg116以破坏里氏木霉25kDa胰蛋白酶样丝氨酸蛋白酶基因(SEQID NO:5为DNA序列,而SEQ ID NO:6为推导的氨基酸序列)的表达。首先通过扩增5’和3’侧翼区并将其克隆入载体来生成质粒pAgJg116。5’侧翼区包含25kDa丝氨酸蛋白酶编码区上游的区,和25kDa胰蛋白酶样丝氨酸蛋白酶编码区的一部分。5’侧翼区使用如下所示的引物067518(有义)和067519(反义)扩增。将引物067518工程改造为在引物5’端含有Asc I和Not I位点。将引物067519工程改造为在引物5’端含有Asc I位点。
引物067518(有义):
AAAGGCGCGCCGCGGCCGCGAAGAAGAAGAAGAACGTGAAAGAG(SEQ ID NO:63)
引物067519(反义):
AAAGGCGCGCCCGGTCGAGCCGGCCACGGGGTCGGA(SEQ ID NO:64)
胰蛋白酶样丝氨酸蛋白酶的5’区通过PCR在反应中扩增,反应物包含175μg的里氏木霉基因组DNA(实施例10),1μl的Herculase II Fusion DNA聚合酶,50pmol的引物067518,50pmol的引物067519,各5μl的10mM dNTP,5μl的5X Herculase II反应缓冲液(StrataGene,LaJolla,CA,USA),和31μl的水。将反应物在中温育,程序如下:1个循环在95℃进行2分钟;30个循环,每个在95℃进行20秒,60℃进行20秒,和72℃进行45秒;1个循环在72℃进行3分钟;和4℃维持。将1.5kb PCR片段通过使用TAE缓冲液的1%的琼脂糖凝胶电泳纯化,从凝胶切出,并使用/>Gel ExtractionKit依照生产商的指示提取。将凝胶纯化的PCR片段用Taq DNA聚合酶处理以在反应中将3’A-悬突添加至片段,反应物包含5μl的纯化PCR片段,1μl的10X Thermopol缓冲液,各0.5μl的10mM dNTP,0.5μl的Taq DNA聚合酶,和3μl的水。将反应物在72℃温育15分钟。将胰蛋白酶样丝氨酸蛋白酶片段的5’区在反应中克隆入/>反应物包含2.5μl的胰蛋白酶样丝氨酸蛋白酶5’区PCR片段,1μl的盐溶液,1.5μl的水,和1μl的/>所得质粒命名为5’SP-TOPO。
将胰蛋白酶样丝氨酸蛋白酶片段的3’区使用如下所示的引物067520(有义)和067521(反义)克隆入将引物067520工程改造为在引物5’端含有SbfI位点。将引物067521工程改造为在引物5’端含有SbfI和Not I位点。
引物067520(有义):
AAACCTGCAGGTCACCACCGCTGGCTGGTAAGCATCATC(SEQ ID NO:65)
引物067521(反义):
AAACCTGCAGGCGGCCGCACAAAGCTAGGAGTCTTGACGTGAT(SEQ ID NO:66)
将胰蛋白酶样丝氨酸蛋白酶基因的3’区通过PCR在反应中扩增,反应物包含175μg的里氏木霉基因组DNA(实施例10),1μl的Herculase II Fusion DNA聚合酶,50pmol的引物067520,50pmol的引物067521,5μl的10mM dNTPs,5μl的5X Herculase II反应缓冲液,和31μl的水。将反应物在 中温育,程序如下:1个循环在95℃进行2分钟;30个循环,每个在95℃进行20秒,60℃进行20秒,和72℃进行45秒;1个循环在72℃进行3分钟;和4℃维持。将1.5kb PCR片段通过使用TAE缓冲液的1%的琼脂糖凝胶电泳纯化,从凝胶切出,并使用/>Gel Extraction Kit依照生产商的指示提取。将凝胶纯化的PCR片段用Taq DNA聚合酶处理以在反应中将3’A-悬突添加至片段,反应物包含5μl的纯化PCR片段,1μl的10X Thermopol缓冲液,0.5μl的10mM dNTP,0.5μl的TaqDNA聚合酶,和3μl的水。将反应物在72℃温育15分钟。将胰蛋白酶样丝氨酸蛋白酶片段的5’区依照生产商的指示在反应中克隆入/>反应物包含2.5μl的5’胰蛋白酶样丝氨酸蛋白酶区PCR片段,1μl的盐溶液,1.5μl的水,和1μl的/>所得质粒命名为3’SP-TOPO。
将质粒5’SP-TOPO用Asc I消化并在反应中克隆入Asc I消化的质粒pJfyS1579-41-11(实施例9),反应物包含12.4μg的消化的5’SP-TOPO质粒DNA,5μl的Asc I,10μl的10XNEB BUFFER 4(New England Biolabs,Inc,Ipswich,MA,USA),和55μl的水。将限制性酶消化物在37℃温育2小时。将消化物通过使用TAE缓冲液的1%的琼脂糖凝胶电泳纯化,其中将1.5kb片段从凝胶切出并使用Gel Extraction Kit依照生产商的指示提取。将Asc I消化的5’SP-TOPO片段在反应中连接至Asc I消化的pJfyS1579-49-11,反应物包含282ng的Asc I消化的5’SP-TOPO,120ng的Asc I消化的pJfyS1579-49-11,2μl的QuickLigase(New England Biolabs,Inc,Ipswich,MA,USA),15μl的2X Quick Ligase Buffer(New England Biolabs,Inc,Ipswich,MA,USA),和2μl的水。将连接反应物在室温温育15分钟。所得质粒命名为pJfyS1579+5’SP。
为了构建质粒pAgJg116,将质粒3’SP-TOPO和pJfyS1579+5’SP用SbfI消化。消化物包含7.5μg的pJfyS1579+5’SP或12.5μg的3’SP-TOPO,5μl的Sbf I,10μl的10X NEB BUFFER4,和55μl的水。将两种消化反应物在37℃温育过夜。将两μl的小牛小肠碱性磷酸酶(CIP)添加至pJfyS1579+5’SP消化反应物并在37℃再温育一小时。将来自pJfyS1579+5SP/Sbf I的9.5kb片段和来自3SP-TOPO/SbfI的1.5kb片段通过使用TAE缓冲液的0.8%的琼脂糖凝胶电泳纯化,从凝胶切出,并使用Gel Extraction Kit依照生产商的指示提取。将SbfI消化的3’SP-TOPO片段在反应中连接至SbfI消化的pJfyS1579+5’SP片段,反应物包含767ng的Sbf I消化的3’SP-TOPO,380ng的Sbf I消化的pJfyS1579+5’SP,2μl的QuickLigase,15μl的2X Quick Ligase Buffer,和1μl的水。将连接反应物在室温温育20分钟。所得质粒命名为pAgJg116(图20)。
实施例20:胰蛋白酶样丝氨酸蛋白酶基因缺失里氏木霉菌株AgJg116-19的生成
用Not I-直链化的pAgJg116使用实施例12中所述的方法转化里氏木霉菌株981-O-8原生质体以缺失胰蛋白酶样丝氨酸蛋白酶基因。在含有25μg每ml的潮霉素B的PDA平板上选择九十个转化体。将转化体传代培养至PDA平板以生成孢子。
将含有缺失载体pAgJg116的里氏木霉菌株981-O-8的转化体在含有25ml的纤维素酶诱导培养基pH 6.0的125ml摇瓶中培养,所述摇瓶用转化体的孢子接种并在28℃在200rpm振荡温育5日。运行里氏木霉菌株981-O-8作为对照。在接种后5日移出培养液样品,在微离心机中在15,700x g离心10分钟,并将上清转移至新管。
对各转化体的上清使用合成底物Val-Leu-Lys 4-硝基苯胺(Bachem AG,Bubendorf,Switzerland)测定蛋白酶活性。首先将底物以100mg/ml的浓度溶解于二甲亚砜。然后将溶解的底物用100mM NaCl-100mM MOPS pH 7.0稀释200倍。通过将10μl的各转化体上清添加至平底96孔板中的100μl的稀释底物来起始反应。将反应平板在50℃温育30分钟,然后使用Microplate Reader测量405nm的吸光度。使用如下所示的引物对展示很少至没有蛋白酶活性的转化体进行PCR筛选。
引物068155(有义):
GCTGTTTGGCCCTCGAAACTGCCGG(SEQ ID NO:67)
引物067947(反义):
CTACATCGAAGCTGAAAGCACGAGA(SEQ ID NO:68)
引物068155在缺失菌株中含有的胰蛋白酶样丝氨酸蛋白酶基因的5’区上游,而引物067947在hph盒中。仅那些含有胰蛋白酶样丝氨酸蛋白酶破坏的候选物会产生PCR片段。PCR筛选通过Fungal Colony PCR依照实施例17中所述的修饰的实验方案进行。将来自各候选物的少量孢子悬于25μl的TE缓冲液中,并在微波炉中以高档位加热1分钟。将经微波处理的孢子悬液在PCR反应中用作模板以筛选天冬氨酸蛋白酶缺失。反应物包含1μl的孢子悬液,各1μl的10mM dNTP,12.5μl的2XGC-Melt LA缓冲液,25pmol的引物068155,25pmol的引物067947,1.25单位的/>GC GENOME LA POLYMERASEMix,和9.25μl水。将反应物在/>中温育,程序如下:1个循环在95℃进行10分钟;35个循环,每个在95℃进行30秒,60℃进行30秒,和72℃进行2分30秒;1个循环在72℃进行5分钟;和4℃维持。
进行了Southern印迹分析以确证通过载体pAgJg116的25kDa胰蛋白酶样丝氨酸蛋白酶基因的破坏。从缺失菌株和里氏木霉菌株981-O-8依照实施例10提取基因组DNA。将来自缺失菌株和里氏木霉菌株981-O-8的两μg的基因组DNA,以及1ng的来自pAgJg116的质粒DNA用Nco I和Sac I消化。里氏木霉菌株981-O-8和pAgJg116包括在Southern印迹中作为对照。将基因组DNA在反应中消化,反应物包含2μg的基因组DNA,1μl的Nco I,1μl的Sac I,5μl的10X NEB BUFFER 1(New England Biolabs,Inc,Ipswich,MA,USA),0.5μl的100X BSA,和水,反应体积为50μl。将两种消化物在37℃温育大约14-16小时。将质粒pAgJg116在反应中消化,反应物包含1ng的pAgJg116 DNA,0.5μl的Nco I,0.5μl的Sac I,2μl的10X NEBBUFFER 1,0.2μl的100X BSA,和水,反应体积为20μl。将消化物在37℃温育大约1小时30分钟。
对消化物进行使用TAE缓冲液的0.7%的琼脂糖凝胶电泳,并遵循生产商的推荐使用印迹于/>SuperCharge印迹膜14-16小时。将膜与500bp异羟洋地黄毒苷配基标记的里氏木霉25kDa胰蛋白酶样丝氨酸蛋白酶探针杂交,所述探针通过在使用如下所示的引物068128(有义)和068129(反义)的PCR过程中并入异羟洋地黄毒苷配基-11-dUTP来合成。
引物068233(有义):
CAACCCAAAGATATCGCCAGATCCA(SEQ ID NO:69)
引物068234(反义):
ACGATAAACTCCCCCACGGCTGAAG(SEQ ID NO:70)
扩增反应物包含5μl的10X ThermoPol Reaction缓冲液,2.5μl的PCR DIG LabelingMix,2ng的pAgJg116,50pmol的引物068233,50pmol的引物068234,2.5μl的10mM dNTPs,5单位的Taq DNA聚合酶,和35.5μl水。将反应物在中温育,程序如下:1个循环在95℃进行2分钟;30个循环,每个循环在95℃进行30秒,60℃进行30秒,和72℃进行40秒;1个循环在72℃进行15分钟;和4℃维持。将PCR产物通过使用TAE缓冲液1.5%的琼脂糖凝胶电泳进行大小选择,从凝胶切出,并使用/>GelExtraction Kit依照生产商的指示提取。异羟洋地黄毒苷配基的并入通过分子量的增加指示。
在DIG Easy Hyb缓冲液中在42℃进行杂交15-17小时。然后将膜在室温在高严格条件下在2X SSC加0.1%SDS中洗涤5分钟接着在65℃在0.5X SSC加0.1%SDS中洗涤两次各15分钟。探针-靶杂合物的检测是遵循生产商的指示通过化学发光测定法进行的。确证数个转化体含有胰蛋白酶样丝氨酸蛋白酶缺失。选择一个转化体并命名为里氏木霉AgJg116-19。
实施例21:胰蛋白酶样丝氨酸蛋白酶缺陷菌株AgJg116-19中的棘孢曲霉GH10木聚糖酶表达
为了确定25kDa胰蛋白酶样丝氨酸蛋白酶的缺失是否有效地阻止重组表达的棘孢曲霉GH10木聚糖酶的降解,将包含棘孢曲霉GH10木聚糖酶编码序列的质粒pSaMe-AaXYL(实施例14)转化入里氏木霉AgJg116-19菌株。如实施例12中所述生成里氏木霉AgJg116-19的原生质体,并用质粒pSaMe-AaXYL转化。从COVE平板随机选择三十六个含有棘孢曲霉GH10木聚糖酶的转化体,并在含有25ml的纤维素酶诱导培养基pH 6.0的125ml摇瓶中培养,所述摇瓶用转化体的孢子接种并在28℃在200rpm振荡温育5日。运行里氏木霉菌株981-O-8和里氏木霉AgJg116-19两者作为对照。在接种后5日移出培养液样品,在微离心机中在15,700x g离心10分钟,并将上清转移至新管。
上清通过使用8-16%CRITERIONTMTris-HCl凝胶与CRITERIONTMCell的SDS-PAGE分析。将五μl的第5日样品悬于2X浓度的Laemmli Sample Buffer,在5%β-巯基乙醇存在下在95℃进行加热5分钟。将所有样品加载于SDS-PAGE凝胶上并在1X Tris/Glycine/SDS运行缓冲液中进行电泳。将所得凝胶用BIO-SAFETMCoomassie Stain染色。SDS-PAGE分析表明所有表达棘孢曲霉GH10木聚糖酶的转化体均未产生任何木聚糖酶降解的痕迹。同样,胰蛋白酶样丝氨酸蛋白酶缺失菌株里氏木霉AgJg116-19并未展示任何蛋白的任何不寻常的表达样式,并与亲本株里氏木霉菌株981-O-8表现类似。显示里氏木霉菌株981-O-8中25kDa胰蛋白酶样丝氨酸蛋白酶基因的缺失有效地消除了棘孢曲霉GH10木聚糖酶的降解。
实施例22:里氏木霉ku70基因缺失质粒pAgJg115的构建
构建缺失载体pAgJg115以破坏里氏木霉ku70基因。需要破坏ku70以增加里氏木霉中基因靶向的效率。
首先通过扩增5’和3’侧翼区并将其克隆入载体来生成质粒pAgJg115。1.5kb 5’侧翼包含ku70基因上游的区以及ku70编码序列的一部分。使用如下所示的引物067491(有义)和067492(反义)扩增5’侧翼区。将引物067491工程改造为在引物5’端含有Asc I和Not I位点在。将引物067492工程改造为在引物5’端含有Asc I位点。
引物067491(有义):
5’-AAAGGCGCGCCGCGGCCGCCCATGGTGAGAAGCCGGGTTCGGGAG-3’(SEQ ID NO:71)
引物067492(反义):
5’-AAAGGCGCGCC AGCCCTTGACAGTGATCTTGAGTCC-3’(SEQ ID NO:72)
ku70基因的5’区通过PCR在反应中扩增,反应物包含175μg的里氏木霉基因组DNA,1μl的Herculase II Fusion DNA聚合酶,50pmol的引物067491,50pmol的引物067492,5μl的10mM dNTP,10μl的5X Herculase II Reaction缓冲液(StrataGene),和31μl的水。将反应物在 中温育,程序如下:1个循环在95℃进行2分钟;30个循环,每个在95℃进行20秒,61℃进行20秒,和72℃进行45秒;1个循环在72℃进行3分钟;和4℃维持。
将1.5kb PCR片段通过使用TAE缓冲液的1%的琼脂糖凝胶电泳纯化,从凝胶切出,并使用Gel Extraction Kit依照生产商的指示提取。将凝胶纯化的PCR片段用Taq DNA聚合酶处理以在反应中将3’A-悬突添加至片段,反应物包含5μl的纯化PCR片段,1μl的10X Thermopol缓冲液,各0.5μl的10mM dNTP,1μl的Taq DNA聚合酶,和3μl的水。将反应物在72℃温育15分钟。将ku70片段的5’区在反应中克隆入/>反应物包含2.5μl的5’侧翼ku70 PCR片段,1μl的盐溶液,1μl的水,和1μl的/>并将2μl的反应物依照生产商的指示转化入ONE/>TOP10化学感受态大肠杆菌细胞(Invitrogen,Inc.,Carlsbad,CA,USA)。转化体在补充100μg每ml的氨苄青霉素2X YT琼脂平板上选择,并在37℃温育16小时。所得质粒命名为5’ku70-TOPO。
将ku70片段的3’区使用如下所示的引物067493(有义)和067494(反义)克隆入将引物067493工程改造为在引物5’端含有Sbf I位点。将引物067494工程改造为在引物5’端含有SbfI和Not I位点。/>
引物067493(有义):
5’-AAACCTGCAGGACAACATTGTGCATCGGCAAACGCC-3’(SEQ ID NO:73)
引物067494(反义):
5’-AAACCTGCAGGCGGCCGCAAAGTGCCGGGGGTGCCCCAAGTCG-3’(SEQ ID NO:74)
将ku70基因的3’区通过PCR在反应中扩增,反应物包含175μg的里氏木霉基因组DNA,1μl的Herculase II Fusion DNA聚合酶,50pmol的引物067493,50pmol的引物067494,5μl的10mM dNTP,10μl的5X Herculase II Reaction缓冲液,和31μl的水。将反应物在 中温育,程序如下:1个循环在95℃进行2分钟;30个循环,每个在95℃进行20秒,61℃进行20秒,和72℃进行45秒;1个循环在72℃进行3分钟;和4℃维持。
将1.5kb PCR片段通过使用TAE缓冲液的1%的琼脂糖凝胶电泳纯化,从凝胶切出,并使用Gel Extraction Kit依照生产商的指示提取。将凝胶纯化的PCR片段用Taq DNA聚合酶处理以在反应中将3’A-悬突添加至片段,反应物包含5μl的纯化PCR片段,1μl的10X Thermopol缓冲液,各0.5μl的10mM dNTP,1μl的Taq DNA聚合酶,和3μl的水。将反应物在72℃温育15分钟。将ku70片段的3’区在反应中克隆入/>反应物包含2.5μl的3’侧翼ku70 PCR片段,1μl的盐溶液,1μl的水,和1μl的/>并将2μl的反应物依照生产商的指示转化入ONE/>TOP10化学感受态大肠杆菌细胞。转化体在补充100μg每ml的氨苄青霉素的2X YT琼脂平板上选择,并在37℃温育16小时。所得质粒命名为3’ku70-TOPO。
将质粒5’ku70-TOPO用Asc I消化以供在反应中克隆入Asc I消化的质粒pJfyS1579-41-11(实施例9),反应物包含14.6μg的5’ku70-TOPO质粒DNA,5μl的Asc I,10μl的10X NEB BUFFER 4,和55μl的水。将限制性酶消化物在37℃温育大约14-16小时。将消化物通过使用TAE缓冲液的1%的琼脂糖凝胶电泳纯化,其中将1.5kb片段从凝胶切出并使用Gel Extraction Kit依照生产商的指示提取。将Asc I消化的5’ku70-TOPO片段在反应中连接至Asc I消化的pJfyS1579-49-11,反应物包含329.6ng的Asc I消化的5’ku70-TOPO,120ng的Asc I消化的pJfyS1579-49-11,2μl的Quick Ligase,15μl的2X QuickLigase Buffer,和2μl的水。将连接反应物在室温温育15分钟,并将4μl的连接反应物依照生产商的指示转化入ONE/>TOP10化学感受态大肠杆菌细胞。转化体在补充100μg每ml的氨苄青霉素的2X YT琼脂平板上选择,并在37℃温育16小时。所得质粒命名为pJfyS1579+5ku70。
为了构建质粒pAgJg115,将质粒3’ku70-TOPO和pJfyS1579+5ku70用Sbf I消化。pJfyS1579+5ku70的消化物包含3.98μg的pJfyS1579+5ku70,5μl的SbfI,30μl的10X NEBBUFFER 4,和165μl的水。3’ku70-TOPO的消化物包含13.8μg的3’ku70-TOPO,5μl的SbfI,10μl的10X NEB BUFFER 4,和55μl的水。将两种消化反应物在37℃温育4小时。将来自pJfyS1579+5ku70/SbfI的9.5kb片段和来自3’ku70-TOPO/SbfI的1.5kb片段通过使用TAE缓冲液的1%的琼脂糖凝胶电泳纯化,从凝胶切出,并使用Gel ExtractionKit依照生产商的指示提取。将Sbf I消化的3’ku70-TOPO片段在反应中连接至SbfI消化的pJfyS1579+5ku70片段,反应物包含335.8ng的Sbf I消化的3’ku70-TOPO,69.76ng的Sbf I消化的pJfyS1579+5ku70,2μl的Quick Ligase,20μl的2X Quick Ligase Buffer,和2μl的水。将连接反应物在室温温育20分钟,并将5μl的连接反应物依照生产商的指示转化入ONETOP10化学感受态大肠杆菌细胞。转化体在补充100μg每ml的氨苄青霉素的2X YT琼脂平板上选择,并在37℃温育16小时,所得质粒命名为pAgJg115(图21)。
实施例23:在里氏木霉中生成ku70基因破坏
用Not I-直链化的pAgJg115使用之前在实施例12中描述的方法转化里氏木霉菌株981-O-8原生质体。将转化体铺板于PDA+1M蔗糖上,然后用含有PDA+10mM尿苷+潮霉素(100μg/ml)的薄层覆盖。将一百二十九个转化体传代培养至PDA平板上以生成孢子。
在ku70基因座含有pAgJg115缺失载体,由此破坏ku70基因的里氏木霉菌株981-O-8的可能候选物,通过真菌孢子PCR使用Suzuki等,2006,见上文的经修饰的实验方案进行筛选。将来自各候选物的少量孢子悬于25μl的TE缓冲液,并在微波炉中以高档位加热1分钟。将经微波处理的孢子悬液在PCR反应中用作模板以筛选丝氨酸蛋白酶缺失。反应物包含1μl的孢子悬液,各1μl的10mM dNTP,12.5μl的2XGC-Melt LA缓冲液,25pmol的引物067946,25pmol的引物067947,1.25单位的/>GC GENOME LAPOLYMERASE Mix,和9.25μl水。将反应物在/> 中温育,程序如下:1个循环在95℃进行10分钟;35个循环,每个在95℃进行30秒,60℃进行30秒,和72℃进行2分30秒;1个循环在72℃进行5分钟;和4℃维持。引物067946位于5’侧翼区的上游,而引物067947位于hpt标志物中;仅在正确的基因座中具有缺失盒的菌株会生成PCR产物。鉴定出了里氏木霉菌株AgJg118-02,其中ku70基因已破坏。
引物067946(有义):
5’-GCCAGGTGTCTGGCATGGCTGGCAAGCTGCGAC-3’(SEQ ID NO:75)
引物067947(反义):
5’-CTACATCGAAGCTGAAAGCACGAGA-3’(SEQ ID NO:76)
对八个候选通过Southern印迹分析进行进一步衡量以确证里氏木霉ku70基因的破坏。从缺失菌株和里氏木霉菌株981-O-8如实施例10中所述提取基因组DNA。将两μg的来自缺失菌株和里氏木霉菌株981-O-8的基因组DNA,以及1ng的来自pAgJg115的质粒DNA用Hind III和Bam HI消化。将里氏木霉菌株981-O-8和pAgJg115包括在Southern印迹中作为对照。基因组DNA消化反应物包含2μg的基因组DNA,1μl的Hind III,1μl的Bam HI,5μl的10XNEB BUFFER 2,0.5μl的100X BSA,和水至50μl。将两种基因组DNA消化物在37℃温育大约14-16小时。将质粒pAgJg115在反应中消化,反应物包含1ng的pAgJg111 DNA,0.5μl的HindIII,0.5μl的Bam HI,2μl的10X NEB BUFFER 2,0.2μl的100X BSA,和水至20μl。将消化物在37℃温育大约1小时。
对消化物进行使用TAE缓冲液的0.7%的琼脂糖凝胶电泳,并遵循生产商的推荐使用印迹于/>SuperCharge印迹膜14-16小时。将膜与500bp异羟洋地黄毒苷配基标记的里氏木霉ku70基因探针杂交,所述探针通过藉由使用如下所示的引物068067(有义)和068068(反义)的PCR并入异羟洋地黄毒苷配基-11-dUTP来合成。/>
引物068067(有义):
5’-CATCCACTCGGAGATGCTGA-3’(SEQ ID NO:77)
引物068068(反义):
5’-CGGAACTTGGTCTTTTCTGT-3’(SEQ ID NO:78)
扩增反应物包含5μl的10X ThermoPol Reaction缓冲液,2.5μl的PCR DIG LabelingMix,2ng的pAgJg115,50pmol的引物068067,50pmol的引物068068,2.5μl的10mM dNTPs,5单位的Taq DNA聚合酶,和35.5μl的水。将反应在5333中温育,程序如下:1个循环在95℃进行2分钟;30个循环,每个在95℃进行30秒,55℃进行30秒,和72℃进行40秒;1个循环在72℃进行15分钟;和4℃维持。将PCR反应产物通过使用TAE缓冲液的1%的琼脂糖凝胶电泳纯化,从凝胶切出,并使用/>GelExtraction Kit依照生产商的指示提取。异羟洋地黄毒苷配基的并入通过分子量的增加指示。
在DIG Easy Hyb缓冲液中在42℃进行杂交15-17小时。然后将膜在室温在高严格条件下在2X SSC加0.1%SDS中洗涤5分钟,接着在65℃在0.5X SSC加0.1%SDS中洗涤两次各15分钟。探针-靶杂合物的检测是通过化学发光测定法(Roche MolecularBiochemicals,Indianapolis,IN,USA)遵循生产商的指示进行的。含有ku70基因破坏的菌株命名为里氏木霉AgJg115-104。
破坏构建体pAgJg115包含侧翼为直接重复的单纯疱疹病毒胸腺嘧啶激酶(tk)基因和大肠杆菌潮霉素磷酸转移酶(hpt)基因。***直接重复以促进hpt和tk选择性标志物的切出。
将来自里氏木霉AgJg115-104的孢子以1x 105和1x 106浓度铺板于含有1μM 5-氟-2’-脱氧尿苷(FdU)的木霉属基本培养基平板,并在28℃温育。将十五个分离物传代培养于含有1μM FdU的木霉属基本培养基平板并在28℃温育。然后对该十五个分离物测试对潮霉素的敏感性,即将其传代培养于含25μg/ml潮霉素的PDA平板,并在28℃温育。这些分离物均无法在潮霉素平板上生长,表明hpt和tk标志物已从菌株切出。
为了确证里氏木霉菌株AgJg115-104缺乏hpt和tk标志物,通过Southern印迹衡量了两个分离物。从不含标志物的破坏菌株和里氏木霉菌株981-O-8如实施例10中所述提取基因组DNA。将两μg的来自缺失菌株和里氏木霉菌株981-O-8的基因组DNA用Hind III和BamHI消化。将里氏木霉菌株981-O-8包括在Southern印迹中作为对照。基因组DNA消化反应物包含2μg的基因组DNA,1μl的Hind III,1μl的Bam HI,5μl的10X NEB BUFFER 2,0.5μl的100X BSA,和水至50μl。将两种基因组DNA消化物在37℃温育大约14-16小时
对消化物进行使用TAE缓冲液的0.7%的琼脂糖凝胶电泳,并遵循生产商的推荐使用印迹于/>SuperCharge印迹膜14-16小时。如上所述将膜与500bp异羟洋地黄毒苷配基标记的里氏木霉ku70基因探针杂交。
在DIG Easy Hyb缓冲液中在42℃进行杂交15-17小时。然后将膜在室温在高严格条件下在2X SSC加0.1%SDS中洗涤5分钟,接着在65℃在0.5X SSC加0.1%SDS中洗涤两次各15分钟。探针-靶杂合物的检测是通过化学发光测定法(Roche MolecularBiochemicals,Indianapolis,IN,USA)遵循生产商的指示进行的。将含有ku70基因破坏、不含标志物的菌株命名为里氏木霉AgJg115-104-7B1。
实施例24:单蛋白酶缺失里氏木霉菌株SMai-TrSP-30-22的生成
用Not I-直链化的pDAtw18(实施例11)使用实施例12中所述的方法转化里氏木霉KU70-缺陷菌株AgJg115-104-7B1原生质体以缺失里氏木霉枯草杆菌蛋白酶样丝氨酸蛋白酶基因。在含有10μg每ml的潮霉素B的PDA平板上选择三十六个转化体。将转化体传代培养至PDA平板以生成孢子。
将使用Suzuki等,2006,见上文的经修饰的实验方案的Fungal孢子PCR用于筛选携带推定缺失的转化体,其中使用设计在枯草杆菌蛋白酶样丝氨酸蛋白酶基因5’-UTR中的有义引物(067871)和在3’-UTR内的反义引物(067872)。
引物067871(有义引物):
5’-ACTTCGGGGGATGGAAGTACATAAACTG-3’(SEQ ID NO:79)
引物067872(反义引物):
5’-CTCGATTCGCCATTAGATGTTTTATACCTG-3’(SEQ ID NO:80)
仅当在枯草杆菌蛋白酶样丝氨酸蛋白酶基因基因座中发生精确的基因取代时会生成5kb PCR产物。若盒整合在基因组其他位置,则会导致野生型3Kb枯草杆菌蛋白酶样丝氨酸蛋白酶基因的扩增。
将来自各候选物的少量孢子悬于25μl的TE缓冲液,并在微波炉中以高档位加热1分钟。将经微波处理的孢子悬液在PCR反应中用作模板以筛选枯草杆菌蛋白酶样丝氨酸蛋白酶基因缺失。反应物包含1μl的孢子悬液,各1μl的10mM dNTP,12.5μl的2XGC-Melt LA缓冲液,25pmol的引物067871,25pmol的引物067872,1.25单位的/>GC GENOME LA POLYMERASE Mix,和9.25μl水。将反应物在/> 中温育,程序如下:1个循环在95℃进行10分钟;35个循环,每个在94℃进行30秒,60℃进行30秒,和72℃进行5分30秒;1个循环在72℃进行15分钟;和4℃维持。
将里氏木霉菌株SMai-TrSP-30鉴定为缺失枯草杆菌蛋白酶样丝氨酸蛋白酶基因。
缺失构建体pDAtw18包含侧翼为直接重复的阳性选择性潮霉素磷酸转移酶(hpt)基因和其他编码阴性选择性胸腺嘧啶激酶(tk)基因。***直接重复以促进hpt和tk选择性标志物的切出和生成不含标志物的菌株,从而可将其用作宿主以缺失第二蛋白酶基因。
将来自里氏木霉SMai-TrSP-30的孢子以1x 105和1x 106的浓度铺板于含有1μM 5-氟-2’-脱氧尿苷(FdU)的木霉属基本培养基平板,并在28℃温育。将二十三个分离物传代培养于含有1μM FdU的木霉属基本培养基平板,并在28℃温育。然后对所有23个分离物通过真菌孢子PCR以实施例26中所述相同的方式筛选hpt和tk标志物的缺乏。
进行了Southern印迹分析以确证枯草杆菌蛋白酶样丝氨酸蛋白酶基因的缺失和hpt和tk标志物的缺乏。如之前实施例10中所述从缺失菌株和里氏木霉ku70缺失菌株AgJg115-104-7B1提取基因组DNA,并将各2μg用20单位的Nco I-HFTM在37℃消化16小时。将消化的DNA通过使用TAE缓冲液的0.7%的琼脂糖凝胶电泳分级4小时,并遵循生产商的推荐使用TURBOBLOTTERTM印迹于NYTRANTMSuperCharge膜16小时。将膜与502bp异羟洋地黄毒苷配基标记的枯草杆菌蛋白酶样丝氨酸蛋白酶基因探针杂交,所述探针通过如上所述藉由使用引物067911(有义)和067912(反义)的PCR并入异羟洋地黄毒苷配基-11-dUTP来合成。
扩增反应物(50μl)包含1X ThermoPol Reaction Buffer,5μl的PCR DIGLabeling Mix,10ng的pDAtw18,0.3μM引物067911,0.3μM引物067912,和2.5单位的Taq DNA聚合酶。将反应在5333中温育,程序如下:30个循环,每个在95℃进行30秒,56℃进行30秒,和72℃进行40秒(15分钟最终延伸)。将五微升的PCR产物通过使用TAE缓冲液1.5%的琼脂糖凝胶电泳进行大小选择,用溴乙锭染色,并在UV透照器下显示。异羟洋地黄毒苷配基的并入通过分子量的增加指示。
在DIG Easy Hyb缓冲液(Roche Molecular Biochemicals,Indianapolis,IN,USA)中在42℃进行杂交17小时。然后将膜在室温在高严格条件下在2X SSC加0.1%SDS中洗涤5分钟,接着在65℃在0.5X SSC加0.1%SDS中洗涤两次各15分钟。探针-靶杂合物的检测是通过化学发光测定法(Roche Molecular Biochemicals,Indianapolis,IN,USA)遵循生产商的指示进行的。将含有枯草杆菌蛋白酶样丝氨酸蛋白酶基因缺失、不含标志物的菌株命名为里氏木霉SMai-TrSP-30-22。
实施例25:里氏木霉胰蛋白酶样丝氨酸蛋白酶基因缺失质粒pAgJg117的构建
构建缺失载体pAgJg117以缺失里氏木霉25kDa胰蛋白酶样丝氨酸蛋白酶基因。首先通过扩增5’和3’侧翼区并将其克隆入载体生成质粒pAgJg117。5’侧翼区包含25kDa丝氨酸蛋白酶编码区上游的1.5kb区。5’侧翼区使用如下所示的引物068616(有义)和068617(反义)扩增。将引物068616工程改造为在引物5’端含有Asc I和Not I位点。将引物068617工程改造为在引物5’端含有Asc I位点。
引物068616(有义):
5’-AAAGGCGCGCCGCGGCCGCAAAACACACACAATAACCAACCCCCA-3’(SEQ ID NO:81)
引物068617(反义):
5’-AAAGGCGCGCC TGCGATGGAGGAAAAGCTGCGAGGGATGA-3’(SEQ ID NO:82)
将胰蛋白酶样丝氨酸蛋白酶的5’区通过PCR在反应中扩增,反应物包含175μg的里氏木霉基因组DNA,1μl的Pfx DNA聚合酶,50pmol的引物068616,50pmol的引物068617,各1.5μl的10mM dNTP,10μl的10X Pfx Amplification缓冲液,和33.5μl的水。将反应物在/> 中温育,程序如下:1个循环在98℃进行3分钟;30个循环,每个在98℃进行30秒,60℃进行30秒,和72℃进行1分30秒;1个循环在72℃进行15分钟;和4℃维持。将1.5kb PCR片段通过使用TAE缓冲液的1%的琼脂糖凝胶电泳纯化,从凝胶切出,并使用/>Gel Extraction Kit依照生产商的指示提取。将凝胶纯化的PCR片段用Taq DNA聚合酶处理以在反应中将3’A-悬突添加至片段,反应物包含5μl的纯化PCR片段,1μl的10X Thermopol缓冲液,各0.5μl的10mM dNTP,0.5μl的Taq DNA聚合酶,和3μl的水。将反应物在72℃温育15分钟。将胰蛋白酶样丝氨酸蛋白酶片段的5’区在反应中克隆入/>反应物包含3μl的5’胰蛋白酶样丝氨酸蛋白酶区PCR片段,1μl的盐溶液,1μl的水,和1μl的/>所得质粒命名为5’Serine。
将胰蛋白酶样丝氨酸蛋白酶片段的3’区使用如下所示的引物068618(有义)和068619(反义)克隆入将引物068618工程改造为在引物5’端含有SbfI位点。将引物0668619工程改造为在引物5’端含有Sbf I和Not I位点。/>
引物068618(有义):
5’-AAACCTGCAGGGCGATTCCCTGTGTTGGCAACCAAA-3’(SEQ ID NO:83)
引物068619(反义):
5’-AAACCTGCAGGCGGCCGCAAGAAATACTCAGGAAAGGTGCCCA-3’(SEQ ID NO:84)
通过PCR在反应中扩增胰蛋白酶样丝氨酸蛋白酶基因的3’区,反应物包含175μg的里氏木霉基因组DNA,1μl的Pfx DNA聚合酶,50pmol的引物068618,50pmol的引物068619,各1.5μl的10mM dNTP,10μl的10X Pfx Amplification缓冲液,和33.5μl的水。将反应物在/> 中温育,程序如下:1个循环在98℃进行3分钟;30个循环,每个在98℃进行30秒,60℃进行30秒,和72℃进行1分30秒;1个循环在72℃进行15分钟;和4℃维持。将1.5kb PCR片段通过使用TAE缓冲液的1%的琼脂糖凝胶电泳纯化,从凝胶切出,并使用/>Gel Extraction Kit依照生产商的指示提取。将凝胶纯化的PCR片段用Taq DNA聚合酶处理以在反应中将3’A-悬突添加至片段,反应物包含5μl的纯化PCR片段,1μl的10X Thermopol缓冲液,0.5μl的10mM dNTP,0.5μl的TaqDNA聚合酶,和3μl的水。将反应物在72℃温育15分钟。将胰蛋白酶样丝氨酸蛋白酶片段的3’区在反应中克隆入/>反应物包含3μl的5’胰蛋白酶样丝氨酸蛋白酶区PCR片段,1μl盐溶液,1μl的水,和1μl的/>所得质粒命名为3’Serine。
将质粒5’Serine用Asc I消化以供在反应中克隆入Asc I消化的质粒pJfyS1579-41-11(实施例9),反应物包含12.4μg的5’Serine质粒DNA,5μl的Asc I,10μl的10X NEBBUFFER 4,和55μl的水。将限制性酶消化物在37℃温育2小时。将消化物通过使用TAE缓冲液的1%的琼脂糖凝胶电泳纯化,其中将1.5kb片段从凝胶切出并使用GelExtraction Kit依照生产商的指示提取。将Asc I消化的5’Serine片段在反应中连接至AscI消化的pJfyS1579-49-11,反应物包含233.7ng的Asc I消化的5’SP-TOPO,160ng的Asc I消化的pJfyS1579-49-11,3μl的Quick Ligase,25μl的2X Quick Ligase Buffer,和3μl的水。将连接反应物在室温温育15分钟。所得质粒命名为5’Serine+pJfyS1579。
为了构建质粒pAgJg117,将质粒3’Serine和5’Serine+pJfyS1579用Sbf I消化。消化物包含3.96μg的5’Serine+pJfyS1579或8.85μg的3’Serine,4μl的Sbf I,10μl的10X NEBBUFFER 4,和56μl的水。将两种消化反应物在37℃温育两小时。将一μl的小牛小肠碱性磷酸酶(CIP)添加至5’Serine+pJfyS1579消化反应,并在37℃再温育一小时。将来自5’Serine+pJfyS1579/SbfI的9.5kb片段和来自3SP-TOPO/SbfI的1.5kb片段通过使用TAE缓冲液的0.8%的琼脂糖凝胶电泳纯化,从凝胶切出,并使用Gel Extraction Kit依照生产商的指示提取。将Sbf I消化的3’Serine片段在反应中连接至Sbf I消化的5’Serine+pJfyS1579片段,反应物包含486ng的SbfI消化的3’Serine,252ng的SbfI消化的5’Serine+pJfyS1579,1μl的Quick Ligase,10μl的2X Quick Ligase Buffer,和1.5μl的水。将连接反应物在室温温育20分钟。所得质粒命名为pAgJg117(图22)。
实施例26:双重蛋白酶基因缺失里氏木霉菌株AgJg117-3-10A的生成
生成里氏木霉枯草杆菌蛋白酶样丝氨酸蛋白酶基因缺失菌株SMai-TrSP-30-22原生质体并用Not I-直链化的pAgJg117使用之前在实施例12中描述的方法转化,并铺板于PDA+1M蔗糖+10μg/ml的潮霉素。将六个转化体传代培养于PDA平板以生成孢子。
在25kDa丝氨酸蛋白酶基因座含有pAgJg117缺失载体,由此缺失丝氨酸蛋白酶的里氏木霉菌株SMai-TrSP-30-22的可能候选物,通过真菌孢子PCR使用Suzuki等,2006,见上文的经修饰的实验方案筛选。将来自各候选物的少量孢子悬于25μl的TE缓冲液,并在微波炉中以高档位加热1分钟。将经微波处理的孢子悬液在PCR反应中用作模板以筛选丝氨酸蛋白酶缺失。反应物包含1μl的孢子悬液,各1μl的10mM dNTP,12.5μl的2XGC-Melt LA缓冲液,25pmol的引物068980,25pmol的引物067556,1.25单位的/>GC GENOMELAPOLYMERASE Mix,和9.25μl水。将反应物在/>中温育,程序如下:1个循环在95℃进行10分钟;35个循环,每个在95℃进行30秒,55℃进行30秒,和72℃进行5分45秒;1个循环在72℃进行15分钟;和4℃维持。用于该筛选的引物起初用作测序引物;引物067556位于5’侧翼区的末端而引物068980位于在3’侧翼区的起始。若缺失载体***丝氨酸蛋白酶基因座,则扩增的PCR片段应大于野生型片段,因为其包含用于缺失丝氨酸蛋白酶基因的hpt和tk盒。鉴定出了里氏木霉菌株AgJg117-3,其中丝氨酸蛋白酶已缺失。
引物067556(有义):
5’-CTTCTCTTTCTGGCATTGAC-3’(SEQ ID NO:85)
引物068980(反义):
5’-CTCGGAATCCTGCGGTTGCC-3’(SEQ ID NO:86)
缺失构建体pAgJg117包含侧翼为直接重复的单纯疱疹病毒胸腺嘧啶激酶(tk)基因和大肠杆菌潮霉素磷酸转移酶(hpt)基因。***直接重复以促进hpt和tk选择性标志物的切出和生成不含标志物的菌株,从而可将其用作宿主以缺失第三蛋白酶基因。
将来自AgJg117-3的孢子以1x 105和1x 106的浓度铺板于含有1μM 5-氟-2’-脱氧尿苷(FdU)的木霉属基本培养基平板,并在28℃温育。将十七个分离物传代培养于含有1μMFdU的木霉属基本培养基平板,并在28℃温育。在十七个分离物中,仅七个形成了孢子;然后将这七个传代培养于PDA平板并在28℃温育。然后对七个分离物通过真菌孢子PCR以上述相同的方式筛选hpt和tk标志物的缺乏。
进行了Southern印迹分析以确证25kDa丝氨酸蛋白酶基因的缺失和hpt和tk标志物的缺乏。从缺失菌株和里氏木霉菌株SMai-TrSP-30-22如之前实施例10中所述提取基因组DNA。将两μg来自缺失菌株,里氏木霉菌株SMai-TrSP-30-22,和里氏木霉菌株981-O-8的基因组DNA分别用Hind III和Nco I消化。将里氏木霉菌株981-O-8和里氏木霉菌株SMai-TrSP-30-22包括在Southern印迹中作为对照。基因组DNA消化反应物包含2μg的基因组DNA,1μl的Nco I,1μl的Hind III,3.5μl的10X NEB BUFFER 2,和水至35μl。将两种基因组DNA消化物在37℃温育大约3.5小时。
对消化物进行使用TAE缓冲液的0.8%的琼脂糖凝胶电泳和遵循生产商的推荐使用印迹于/>SuperCharge印迹膜大约5小时。将膜与500bp异羟洋地黄毒苷配基标记的里氏木霉25kDa丝氨酸蛋白酶探针杂交,所述探针通过藉由如下所示的使用引物069279(有义)和069280(反义)的PCR并入异羟洋地黄毒苷配基-11-dUTP来合成。/>
引物069279(有义):
5’-GGCGCCTCAATCCAGAAGGTCGCAC-3’(SEQ ID NO:87)
引物069280(反义):
5’-GTGTATGTAGTGAAACGAAGCATTCG-3’(SEQ ID NO:88)
扩增反应物包含5μl的10X ThermoPol Reaction缓冲液,2.5μl的PCR DIG LabelingMix,1ng的pAgJg117,50pmol的引物069279,50pmol的引物069280,各2.5μl的10mM dNTP,5单位的Taq DNA聚合酶,和35.5μl的水。将反应在5333中温育,程序如下:1个循环在95℃进行2分钟;30个循环,每个在95℃进行30秒,55℃进行30秒,和72℃进行40秒;1个循环在72℃进行15分钟;和4℃维持。PCR反应产物通过使用TAE缓冲液的1%的琼脂糖凝胶电泳纯化,从凝胶切出,并使用/>GelExtraction Kit依照生产商的指示提取。异羟洋地黄毒苷配基的并入通过分子量的增加指示。
在DIG Easy Hyb缓冲液中在42℃进行杂交15-17小时。然后将膜在室温在高严格条件下在洗涤2X SSC加0.1%SDS中5分钟,接着在65℃在0.5X SSC加0.1%SDS中洗涤两次各15分钟。探针-靶杂合物的检测是通过化学发光测定法(Roche MolecularBiochemicals,Indianapolis,IN,USA)遵循生产商的指示进行的。将含有25kDa丝氨酸蛋白酶缺失的菌株命名为里氏木霉AgJg117-3-10A。
实施例27:里氏木霉天冬氨酸蛋白酶基因缺失质粒pAgJg118的构建
构建缺失载体pAgJg118以缺失里氏木霉42kDa天冬氨酸蛋白酶基因。通过首先扩增5’和3’侧翼区并将其克隆入载体来生成质粒pAgJg118。5’侧翼区包含42kDa天冬氨酸蛋白酶编码区的上游1.5kb区。使用如下所示的引物068620(有义)和068621(反义)扩增5’侧翼区。引物068620工程改造为在引物5’端含有Asc I和Not I位点。引物068621工程改造为在引物5’端含有Asc I位点。
引物068620(有义):
5’-AAAGGCGCGCCGCGGCCGCTCGCTGTAACGAACTTCTGTCCGCA-3’(SEQ ID NO:89)
引物068621(反义):
5’-AAAGGCGCGCCCTTGAATATCGGAGAAGGTTGCTCACGG-3’(SEQ ID NO:90)
天冬氨酸蛋白酶基因的5’区通过PCR在反应中扩增,反应物包含175μg的里氏木霉基因组DNA,1μl的Pfx DNA聚合酶,50pmol的引物068620,50pmol的引物068621,1.5μl的10mM dNTP,10μl的10X Pfx Amplification缓冲液,并33.5μl的水。将反应物在/> 中温育,程序如下:1个循环在98℃进行3分钟;30个循环,每个在98℃进行30秒,60℃进行30秒,和72℃进行1分30秒;1个循环在72℃进行15分钟;和4℃维持。1.5kb PCR片段通过使用TAE缓冲液的1%的琼脂糖凝胶电泳纯化,从凝胶切出,并使用/>Gel Extraction Kit依照生产商的指示提取。凝胶纯化的PCR片段用Taq DNA聚合酶处理以在反应中将3’A-悬突添加至片段,反应物包含5μl的纯化PCR片段,1μl的10X Thermopol缓冲液,0.5μl的10mM dNTP,1μl的Taq DNA聚合酶,和3μl的水。将反应物在72℃温育15分钟。将天冬氨酸蛋白酶片段的5’区在反应中克隆入/>反应物包含3μl的5’天冬氨酸蛋白酶区PCR片段,1μl的盐溶液,1μl的水,和1μl的/>所得质粒命名为5’Aspartic。
使用如下所示的引物068622(有义)和068623(反义)将天冬氨酸蛋白酶片段的3’区克隆入引物068622工程改造为在引物5’端含有SbfI位点。引物068623工程改造为在引物5’端含有SbfI和NotI位点。
引物068622(有义):
AAACCTGCAGGGCGGCGATGGTGGACTTGTTTATGA-3’(SEQ ID NO:91)
引物068623(反义):
AAACCTGCAGGCGGCCGCAGCAAGTGAGTATCGAGTTTGTAGG-3’(SEQ ID NO:92)
天冬氨酸蛋白酶基因的3’区通过PCR在反应中扩增,反应物包含175μg的里氏木霉基因组DNA,1μl的Pfx DNA聚合酶,50pmol的引物068622,50pmol的引物068623,1.5μl的10mM dNTP,10μl的10X Pfx Amplification缓冲液,和33.5μl的水。将反应物在/> 中温育,程序如下:1个循环在98℃进行3分钟;30个循环,每个在98℃进行30秒,60℃进行30秒,和72℃进行1分30秒;1个循环在72℃进行15分钟;和4℃维持。1.5kb PCR片段通过使用TAE缓冲液的1%的琼脂糖凝胶电泳纯化,从凝胶切出,并使用/>Gel Extraction Kit依照生产商的指示提取。凝胶纯化的PCR片段用Taq DNA聚合酶处理以在反应中将3’A-悬突添加至片段,反应物包含5μl的纯化PCR片段,1μl的10X Thermopol缓冲液,0.5μl的10mM dNTP,1μl的Taq DNA聚合酶,和3μl的水。将反应物在72℃温育15分钟。将天冬氨酸蛋白酶片段的3’区在反应中克隆入反应物包含3μl的3’天冬氨酸蛋白酶区PCR片段,1μl的盐溶液,1μl的水,和1μl的/>所得质粒命名为3’Aspartic。
用Asc I消化质粒5’Aspartic以在反应中克隆入Asc I消化的质粒pJfyS1579-41-11(实施例9),反应物包含6.45μg的5’Aspartic质粒DNA,5μl的Asc I,10μl的10X NEBBUFFER 4,和61μl的水。限制性酶消化物在37℃温育4小时。消化物通过使用TAE缓冲液的1%的琼脂糖凝胶电泳纯化,其中将1.5kb片段从凝胶切出并使用GelExtraction Kit依照生产商的指示提取。将Asc I消化的5’Aspartic片段在反应中连接至Asc I消化的pJfyS1579-49-11,反应物包含307.2ng的Asc I消化的5’Aspartic,160ng的Asc I消化的pJfyS1579-49-11,3μl的Quick Ligase,25μl的2X Quick Ligase Buffer,和3μl的水。连接反应物在室温温育15分钟。所得质粒命名为5’Aspartic+pJfyS1579。
为了构建质粒pAgJg118,将质粒3’Aspartic和5’Aspartic+pJfyS1579用Sbf I消化。消化物包含3.5μg的5’Aspartic+pJfyS1579或5.3μg的3’Aspartic,4μl的SbfI,10μl的10X NEB BUFFER 4,和56μl的水。将两种消化反应物在37℃温育1.5小时。将一μl的小牛小肠碱性磷酸酶(CIP)添加至5’Aspartic+pJfyS1579消化反应物并在37℃再温育一小时。来自5’Aspartic+pJfyS1579/SbfI的9.5kb片段和来自3’Aspartic/SbfI的1.5kb片段通过使用TAE缓冲液的0.8%的琼脂糖凝胶电泳纯化,从凝胶切出,并使用GelExtraction Kit依照生产商的指示提取。将SbfI消化的3’Aspartic片段在反应中连接至SbfI消化的5’Aspartic+pJfyS1579片段,反应物包含349.5ng的SbfI消化的3’Aspartic,122.35ng的Sbf I消化的5’Aspartic+pJfyS1579,2μl的Quick Ligase,20μl的2X QuickLigase Buffer,和3μl的水。连接反应物在室温温育20分钟并将3μl的连接反应物依照生产商的指示转化入/>Gold Ultra感受态大肠杆菌细胞。转化体在补充100μg每ml的氨苄青霉素的2X YT琼脂平板上选择并在37℃温育16小时。所得质粒命名为pAgJg118(图23)。
实施例28:三重蛋白酶基因缺失里氏木霉菌株AgJg118-02-2E的生成
用Not I-直链化的pAgJg118使用之前在实施例12中描述的方法转化里氏木霉双重蛋白酶缺失菌株AgJg117-3-10A原生质体,并铺板于含10μg每ml的潮霉素的PDA平板加1M蔗糖。将六个转化体传代培养入PDA平板以生成孢子。
在42kDa天冬氨酸蛋白酶基因座含有pAgJg118缺失载体,由此缺失天冬氨酸蛋白酶的里氏木霉菌株AgJg117-3-10A的可能候选物,通过真菌孢子PCR使用Suzuki等,2006,见上文的经修饰的实验方案筛选。将来自各候选物的少量孢子悬于25μl的TE缓冲液,并在微波炉中以高档位加热1分钟。将经微波处理的孢子悬液在PCR反应中用作模板以筛选丝氨酸蛋白酶缺失。反应物包含1μl的孢子悬液,各1μl的10mM dNTP,12.5μl的2XGC-Melt LA缓冲液,25pmol的引物069858,25pmol的引物069859,1.25单位的/>GC GENOMELAPOLYMERASE Mix,和9.25μl水。将反应物在/>中温育,程序如下:1个循环在95℃进行10分钟;35个循环,每个在95℃进行30秒,60℃进行30秒,和72℃进行5分30秒;1个循环在72℃进行15分钟;和4℃维持。引物069858位于5’侧翼区的末端而引物069859位于3’侧翼区的起始。若缺失载体***天冬氨酸蛋白酶基因座,则扩增的PCR片段应大于野生型片段,因其包含用于缺失丝氨酸蛋白酶基因的hpt和tk盒。鉴定出了里氏木霉AgJg118-02,其中天冬氨酸蛋白酶已缺失。
引物069858(有义):
5’-TCGGGGAGGATGGCGCAAACCGACCTTCCTAAA-3’(SEQ ID NO:93)
引物069859(反义):
5’-GCACCTTACCCCTACGGACCACGAT-3’(SEQ ID NO:94)
缺失构建体pAgJg118包含侧翼为直接重复的单纯疱疹病毒胸腺嘧啶激酶(tk)基因和大肠杆菌潮霉素磷酸转移酶(hpt)基因。***直接重复以促进切出hpt和tk选择性标志物和生成42kDa天冬氨酸蛋白酶的完整(clean)缺失。
将来自里氏木霉AgJg118-02的孢子以1x 105和1x 106的浓度铺板于含有1μM 5-氟-2’-脱氧尿苷(FdU)的木霉属基本培养基平板,并在28℃温育。将十个分离物传代培养入PDA平板并在28℃温育。然后对十个分离物通过真菌孢子PCR以上述相同的方式筛选hpt和tk标志物的缺乏。
进行了Southern印迹分析以确证42kDa天冬氨酸蛋白酶基因的缺失和hpt和tk标志物的缺乏。从缺失菌株和里氏木霉菌株981-O-8如之前在实施例10中所述提取基因组DNA。将两μg的来自缺失菌株和里氏木霉菌株981-O-8的基因组DNA用Nco I消化。将里氏木霉菌株981-O-8包括在Southern印迹中作为对照。基因组DNA消化反应物包含2μg的基因组DNA,1μl的Nco I,5μl的10X NEB BUFFER 3,和水至50μl。将两种基因组DNA消化物在37℃温育大约14-16小时。
对消化物进行使用TAE缓冲液的0.8%的琼脂糖凝胶电泳和遵循生产商的推荐使用印迹于/>SuperCharge印迹膜大约12-16小时。将膜与500bp异羟洋地黄毒苷配基标记的里氏木霉42kDa天冬氨酸蛋白酶探针杂交,所述探针通过藉由使用如下所示的引物069860(有义)和069861(反义)的PCR并入异羟洋地黄毒苷配基-11-dUTP来合成。
引物069860(有义):
5’-CTTCTATCTTGGGATGCTTCACGATACGTGA-3’(SEQ ID NO:95)
引物069861(反义):
5’-CGCGCCCTTGAATATCGGAGAAGGT-3’(SEQ ID NO:96)
扩增反应物包含5μl的10X Taq缓冲液,2.5μl的PCR DIG Labeling Mix,5ng的pAgJg118,10pmol的引物069860,10pmol的引物069861,各2.5μl的10mM dNTP,5单位的TaqDNA聚合酶,和36.5μl的水。将反应在5333中温育,程序如下:1个循环在95℃进行2分钟;30个循环,每个在95℃进行30秒,56℃进行30秒,和72℃进行40秒;1个循环在72℃进行15分钟;和4℃维持。将PCR反应产物通过使用TAE缓冲液的1%的琼脂糖凝胶电泳纯化,从凝胶切出,并使用/>Gel Extraction Kit依照生产商的指示提取。异羟洋地黄毒苷配基的并入通过分子量的增加指示。
在DIG Easy Hyb缓冲液中在42℃进行杂交15-17小时。然后将膜在室温在高严格条件下在洗涤2X SSC加0.1%SDS中5分钟,接着在65℃在0.5X SSC加0.1%SDS中洗涤两次各15分钟。探针-靶杂合物的检测是通过化学发光测定法(Roche MolecularBiochemicals,Indianapolis,IN,USA)遵循生产商的指示进行的。含有天冬氨酸蛋白酶缺失的菌株命名为里氏木霉AgJg118-02-2E。
实施例29:里氏木霉AgJg117-3-10A和里氏木霉AgJg118-02-2E的发酵
将来自PDA平板的里氏木霉AgJg117-3-10A和里氏木霉AgJg118-02-2E的孢子接种入含有100ml的摇瓶培养基的500ml摇瓶。在相同条件下运行里氏木霉菌株981-O-8作为对照。将烧瓶置入定轨振荡器在28℃进行大约48小时,此时将50ml的培养物添加至包含1.8升的发酵分批培养基的三升玻璃夹套发酵器(three liter glass jacketedfermentor)(Applikon Biotechnology,Inc.,Foster City CAUSA)。发酵补料培养基以0至4g/l/小时的速率添加185小时的时间。将发酵容器维持在28℃的温度,并使用/>1030控制***(Applikon Biotechnology,Inc.,Foster City CAUSA)将pH控制在4.5+/-0.1的设定点。将空气以1vvm的速率添加至容器,并通过以1100至1300rpm旋转的Rushton叶轮搅拌培养液。在发酵结束时,将全培养液从容器收获,并在3000x g离心以去除生物质。将上清过滤灭菌,并储藏在5至10℃。
实施例30:棘孢曲霉菌株CBS 186.67GH3β-木糖苷酶的制备
依照以下步骤重组制备棘孢曲霉菌株CBS 186.67GH3β-木糖苷酶。
为了生成用于PCR扩增的基因组DNA,将棘孢曲霉CBS 186.67通过在26℃生长7日在PDA琼脂平板上繁殖。将从PDA平板收获的孢子接种入带挡板的摇瓶中的25ml的YP+2%葡萄糖培养基,并在26℃在200rpm振荡温育48小时。
基因组DNA分离依照修饰的SPIN实验方案(Qbiogene,Inc.,Carlsbad,CA,USA)进行。简言之,将/>SPIN Kit for Soil(Qbiogene,Inc.,Carlsbad,CA,USA)用于/>24Homogenization System(MP Biosciences,SantaAna,CA,USA)中。两ml的真菌材料通过在14,000x g离心2分钟来收获。去除上清并将沉淀重悬于500μl的去离子水。将悬液转移至Lysing Matrix E/>管(Qbiogene,Inc.,Carlsbad,CA,USA)并将790μl的磷酸钠缓冲液和100μl的来自/>SPIN Kit的MT缓冲液添加至管。然后将样品放置在/>Instrument(Qbiogene,Inc.,Carlsbad,CA,USA)中,并在5.5m/秒的速度处理60秒。然后将样品在14,000x g离心2分钟,并将上清转移至干净的/>管。添加来自/>SPIN Kit的250μl体积的PPS试剂,然后将样品通过倒置轻柔地混合。然后将样品再次在14,000x g离心5分钟。将上清转移至15ml管,接着加入1ml的来自/>SPIN Kit的Binding Matrix悬液,然后通过倒置混合两分钟。将样品放置在固定的管架中,并允许二氧化硅基质沉降3分钟。移除并弃去500μl体积的上清,然后将剩余样品重悬于基质。然后将样品转移至来自/>SPIN Kit的SPIN过滤管,并在14,000x g离心1分钟。清空接收管(catch tube),并将剩余的基质悬液添加至SPIN过滤管。再次离心样品(14,000x g,1分钟)。将来自/>SPIN Kit的500μl体积的SEWS-M溶液添加至SPIN过滤管,并将样品在相同速度离心1分钟。清空接收管,并将SPIN过滤器重新置于(replace)接收管中。将该单元在14000x g离心2分钟以“干燥”残余SEWS-M洗涤溶液的基质。将SPIN过滤器置于新鲜的接收管,并允许在室温风干5分钟。用移液尖将基质轻柔地重悬于100μl的DES(不含DNase/致热原的水)中。将该单元离心(14,000xg,1分钟)以洗脱基因组DNA,接着通过在14000x g重新离心1分钟用100μl的10mM Tris,0.1mM EDTA,pH 8.0洗脱,并合并洗脱物。从接收管收获的DNA的浓度通过UV分光光度计在260nm测量。
棘孢曲霉β-木糖苷酶基因通过PCR使用如下所示的两个克隆引物GH3-101f和GH3-101r分离,所述引物基于公众可获得的棘孢曲霉xyl2全长序列(GenBank AB462375.1)设计以供使用IN-FUSIONTM策略进行直接克隆。
引物GH3-101f:
5’-acacaactggggatccaccatggctgtggcggctcttgctctgctgg-3’(SEQ ID NO:97)
引物GH3-101r:
5’-agatctcgagaagcttaCTCATCCCCCGCCACCCCCTGCACCTCC-3’(SEQ ID NO:98)
用从棘孢曲霉CBS 186.67制备的基因组DNA进行PCR反应以扩增全长基因。PCR反应物包含1μl的基因组DNA,0.75μl的引物GH3-101.1f(10μM),0.75μl的引物GH3-101.1r(10μM),3μl的5X HF缓冲液(Finnzymes Oy,Finland),0.25μl的50mM MgCl2,0.3μl的10mMdNTP,0.15μl的DNA聚合酶(New England Biolabs,Ipswich,MA,USA),和PCR-级水加至15μl。PCR反应使用/>PCR仪(Bio-Rad Laboratories,Inc.,Hercules,CA,USA)进行,程序如下:在98℃进行2分钟,接着是在98℃进行15秒,70℃(-1℃/循环)进行30秒,和72℃进行2分30秒的10个降落循环;和25个循环,每个在98℃进行15秒,60℃进行30秒,72℃进行2分30秒,和在72℃进行5分钟。/>
反应产物通过使用TAE缓冲液的1.0%琼脂糖凝胶电泳分离,其中将大约2.4kbPCR产物条带从凝胶切出并使用PCRDNA和Gel Band Purification Kit(GEHealthcare Life Sciences,Piscataway,NJ,USA)依照生产商的指示纯化。将对应于棘孢曲霉β-木糖苷酶基因的DNA使用IN-FUSIONTM Dry-Down PCR Cloning Kit(BDBiosciences,Palo Alto,CA,USA)依照生产商的指示克隆入用Bam HI和Hind III直链化的表达载体pDAu109(WO 2005042735)。
将2.5μl体积的稀释的连接混合物用于转化ONE化学感受态TOP10细胞。在含有100μg每ml的氨苄青霉素的LB琼脂平板上选择三个菌落,并在补充100μg每ml的氨苄青霉素的3ml的LB培养基中培养过夜。使用/>Plasmid Mini Kit(Omega Bio-Tek,Inc.,Norcross,GA,USA)依照生产商的指示纯化质粒DNA。在异源表达之前,通过Sanger测序验证棘孢曲霉β-木糖苷酶基因序列。
编码序列为2454bp,包含终止密码子。基因不含内含子。编码的预期蛋白为817个氨基酸。使用SignalP program(Nielsen等,1997,Protein Engineering10:1-6)预测出17个残基的信号肽。预期的成熟蛋白包含800个氨基酸。
米曲霉MT3568的原生质体如WO 95/02043中所述制备。米曲霉MT3568是米曲霉JaL355(WO 2002/40694)的amdS(乙酰胺酶)破坏的基因衍生物,其中pyrG营养缺陷型通过用pyrG基因破坏米曲霉乙酰胺酶(amdS)基因而得到恢复。将一百微升的原生质体悬液与2.5-15μg的曲霉属表达载体混合,并添加250μl的60%PEG 4000,10mM CaCl2,和10mMTris-HCl pH 7.5并轻柔地混合。将混合物在37℃温育30分钟,并将原生质体铺于补充10mM乙酰胺和15mM CsCl的COVE蔗糖(1M)平板(Cove,1996,Biochim。Biophys。Acta 133:51-56)上以供转化体选择。在37℃温育4-7日之后,将几个转化体的孢子接种于YP-2%麦芽糊精培养基上。在30℃培养4日之后,分析培养液以基于其产生大量活性棘孢曲霉β-木糖苷酶的能力鉴定最佳转化体。筛选是基于通过SDS-PAGE确定的对应于异源表达蛋白的条带强度,和如下所示的酶对4-硝基苯基-β-D-木糖吡喃糖苷(4-nitrophenyl-beta-D-xylopyranoside,pNPX)的活性。将十μl的培养液与含有10μl的0.1%20,10μl的1M柠檬酸钠pH 5,4μl的溶解于DMSO的100mM的pNPX底物(SigmaAldrich,St.Louis,MO,USA)(储液中0.4%的最终体积)和过滤水的90μl的测定试剂混合。测定在37℃进行30分钟,并在添加100μl的1M碳酸钠pH 10之前和之后在405nm确定吸光度。将在405nm最高的吸光度值关联于SDS-PAGE数据以供选择最佳转化体。
将命名为米曲霉EXP3611的最佳转化体的孢子铺于含有0.01%X-100的COVE平板上以供分离单菌落。铺板在补充10mM乙酰胺和15mM CsCl的含有1M蔗糖和10mM硝酸钠的COVE蔗糖培养基(Cove,1996,Biochim。Biophys。Acta 133:51-56)上总共重复两次。然后在30℃在250ml烧瓶中使用DAP-4C-1培养基在100rpm振荡进行发酵4日。发酵液使用标准方法过滤。蛋白浓度使用Microplate BCATMProtein Assay Kit(Thermo FischerScientific,Waltham,MA,USA)确定,其中使用牛血清白蛋白作为蛋白标样。
实施例31:来自里氏木霉AgJg117-3-10A和里氏木霉AgJg118-02-2E的培养液在高温的储藏稳定性
对里氏木霉AgJg117-3-10A、里氏木霉AgJg118-02-2E和里氏木霉菌株981-O-8(对照)的培养液衡量在升高温度的储藏稳定性,并将其与亲本株的稳定性相比较。将从实施例29获得的发酵液过滤灭菌(0.2μM注射器式滤器,聚醚砜膜,GE Healthcare,Piscataway,NJ,USA),等分入1.8mL Nunc CRYOTUBETM小瓶(Thermo Fisher Scientific,Waltham,MA,USA)并在液氮中骤冻(flash freeze)。然后将小瓶储藏在40℃或-80℃(作为对照)两周。在温育之后,对样品测定PCS水解活性。
PCS的水解使用2.2ml深孔板(Axygen,Union City,CA,USA)以1.0ml的总反应体积进行。水解用50mg的PCS每ml的含有1mM硫酸镁的50mM乙酸钠pH 5.0缓冲液进行,并获得蛋白酶缺失菌株和亲本株(2,4,8和12mg每克纤维素)的剂量应答。每个反应以5%添加补充棘孢曲霉β-葡糖苷酶的蛋白(实施例30)。水解测定在50℃以三次重复进行72小时。在水解之后,将样品用0.45μm Multiscreen 96孔过滤板(Millipore,Bedford,MA,USA)过滤,并如下所示就糖含量分析滤过物。
在通过含0.05%w/w苯甲酸的0.005M H2SO4以0.6mL/分钟的流速从4.6x 250mmHPX-87H柱(Bio-Rad Laboratories,Inc.,Hercules,CA,USA)洗脱之后,稀释于0.005M H2SO4的样品的糖浓度以通过由通过纯糖样品校正的折光率检测器(1100HPLC,Agilent Technologies,Santa Clara,CA,USA)的葡萄糖和纤维二糖信号的积分的定量来测量。将所得的当量用于计算各反应的纤维素转化百分率。
纤维素转化程度使用以下方程计算:
%转化=[葡萄糖浓度+1.053x(纤维二糖浓度)]/[(葡萄糖浓度+1.053x限制消化中的(纤维二糖浓度)]。对于纤维二糖的1.053因子考虑了当纤维二糖转化为葡萄糖时质量的增加。使用六十mg的里氏木霉纤维素分解蛋白制备物每g纤维素以供限制消化。
显示于图24的结果说明来自里氏木霉AgJg117-3-10A和里氏木霉AgJg118-02-2E的培养液在40℃两周之后残余纤维素酶活性相对于在相同条件下的里氏木霉菌株981-O-8的培养液较优。为了达到80%的底物转化,对于亲本株,在40℃温育的样品相对于在-80℃温育的对照样品需要蛋白加载量增加至1.76倍。在相同条件下,对于三重和双重蛋白酶缺失的菌株培养液,蛋白加载量分别增加至1.43和1.61倍。因此,三重蛋白酶缺失菌株培养液在40℃两周的储藏稳定性方面显示19%的改善。双重蛋白酶缺失培养液当在40℃储藏两周时显示8.5%的改善。
实施例32:枯草杆菌蛋白酶样丝氨酸蛋白酶缺失载体pJfyS152的生成
将里氏木霉981-O-8枯草杆菌蛋白酶样丝氨酸蛋白酶(pepC)基因(SEQ ID NO:99为DNA序列,而SEQ ID NO:100为推导的氨基酸序列)5’侧翼序列使用HotStart High-Fidelity DNA聚合酶(New England Biolabs,Ipswich,MA,USA)和如下所示的基因-特异性正向和反向引物扩增。下划线部分为导入供克隆的Asc I位点,而斜体区代表对应于/>Cloning(Clontech,Palo Alto,CA,USA)所需的载体***的位点的同源区的导入的延伸。
正向引物:
(SEQ ID NO:101)
反向引物:
(SEQ ID NO:102)
扩增反应物含有150ng的里氏木霉981-O-8基因组DNA,各200μm的dNTP,0.4μM引物,1XGC缓冲液(New England Biolabs,Ipswich,MA,USA),和2单位的/>DNA聚合酶,最终体积为50μl。将扩增反应在/>中温育,程序如下:1个循环在98℃进行2分钟;30个循环,每个在98℃进行30秒,57℃进行30秒,和72℃进行1分30秒;和一个循环在72℃进行7分钟。PCR产物通过使用TAE缓冲液的1%的琼脂糖凝胶电泳分离,并将2.2kb片段切出,使用/>Extract II Kit(Machery-Nagel,Dueren,Germany)依照生产商的实验方案提取琼脂糖。
将2.2kb PCR产物使用PCR Cloning Kit(Clontech,Palo Alto,CA,USA)依照生产商的实验方案***Asc I-消化的pJfyS1579-41-11(实施例9)。/>反应物在10μl反应体积中含有1X/>反应缓冲液(Clontech,Palo Alto,CA,USA),150ng的pJfyS1579-41-11,100ng的PCR产物,和1μl的Enzyme(Clontech,Palo Alto,CA,USA)。将反应物在37℃温育15分钟和并在50℃温育15分钟。向反应物添加40μl的TE。将两个2μl用于依照生产商的实验方案转化ONE/>TOP10感受态细胞。转化体通过测序筛选,并鉴定出一个含有不具PCR错误的***物的克隆,并命名为pJfyS152A,将质粒pJfyS152A用于***pepC基因的3’侧翼。
将3’pepC侧翼序列从里氏木霉981-O-8基因组DNA(实施例13)使用Hot Start High-Fidelity DNA聚合酶和如下所示的基因-特异性正向和反向引物扩增。下划线部分为导入供克隆的SbfI位点,而斜体区代表对应于/>Cloning所需的载体***的位点的同源区的导入的延伸,且粗体部分为导入供之后去除质粒的细菌繁殖部分的Pme I位点。
正向引物:
(SEQ ID NO:103)
反向引物:
(SEQ ID NO:104)
扩增反应物含有150ng的里氏木霉981-O-8基因组DNA,各200μm的dNTP,0.4μM引物,含5mM MgCl2的1XHF缓冲液(New England Biolabs,Ipswich,MA,USA),和2单位的/>DNA聚合酶,最终体积为50μl。将扩增反应物在中温育,程序如下:1个循环在98℃进行2分钟;30个循环,每个在98℃进行30秒,56℃进行30秒,和72℃进行1分30秒;和一个循环在72℃进行7分钟。PCR产物通过使用TAE缓冲液的1%的琼脂糖凝胶电泳分离,其中将2.2kb片段切出,并使用/>Extract II Kit依照生产商的实验方案提取琼脂糖。
将2.2kb PCR产物使用PCR Cloning Kit依照生产商的实验方案***Sbf I-消化的pJfyS152A。/>反应物在10μl反应体积中含有1X/>Reaction缓冲液,150ng的pJfyS1579-41-11,100ng的PCR产物,和1μl的/>Enzyme。将反应物在37℃温育15分钟和在50℃温育15分钟。向反应物添加40μl的TE,并将2μl用于依照生产商的实验方案转化ONE/>TOP10感受态细胞。转化体通过测序筛选,并鉴定出一个含有不具PCR错误的***物的克隆,并命名为pJfyS152(图25)。将质粒pJfyS152用于缺失pepC基因。
实施例33:枯草杆菌蛋白酶样丝氨酸蛋白酶缺失的里氏木霉菌株JfyS152-1的生成
将用Pme I-消化的并凝胶纯化的pJfyS152依照实施例12中描述的步骤转化的里氏木霉AgJg115-104-7B1(实施例23)的六个转化体,从转化平板用灭菌接种环转移至新的含有PDA培养基的平板,并在28℃生长7日。然后所有6个转化体通过Southern分析进行分析。将来自6个转化体的每一个的基因组DNA如实施例21中所述提取,并将各2.5μg用20单位的Nsi II和20单位的Bgl II消化16小时。对消化物进行0.9%的琼脂糖凝胶电泳并遵循生产商的推荐使用印迹于/>SuperCharge印迹膜大约12-16小时。杂交于pepC基因的3’侧翼序列的PCR探针,使用PCR DIG Probe Synthesis Kit依照生产商的实验方案用以下正向和反向引物生成:
正向引物:
5’-TGATTTCGTGGACAGCGTTTCTCGC-3’(SEQ ID NO:105)
反向引物:
5'-TTGCCTTACAGCTGGCAACAATGGCGTC-3’(SEQ ID NO:106)
将扩增反应物在中温育,程序如下:1个循环在95℃进行2分钟;30个循环,每个在94℃进行30秒,59℃进行30秒,和72℃进行40秒,和一个循环在72℃进行7分钟。PCR产物通过使用TAE缓冲液的1%的琼脂糖凝胶电泳分离,并将0.3kb片段切出,并使用/>Extract II Kit依照生产商的实验方案提取琼脂糖。异羟基洋地黄毒苷元的并入通过在大约0.5kb运行的标记探针的分子量变动来确证。
在DIG Easy Hyb缓冲液中在42℃进行杂交15-17小时。然后将膜在室温在高严格条件下在2X SSC加0.1%SDS中洗涤5分钟,接着在65℃在0.5X SSC加0.1%SDS中洗涤两次各15分钟。探针-靶杂合物的检测是通过化学发光测定(Roche Molecular Biochemicals,Indianapolis,IN,USA)遵循生产商的指示进行的。
Southern分析表明6个转化体中的3个以单拷贝携带缺失盒。含有pepC缺失的菌株命名为里氏木霉JfyS152-1。
实施例34:胃蛋白酶样天冬氨酸蛋白酶缺失载体pJfyS153的生成
将里氏木霉981-O-8胃蛋白酶样天冬氨酸蛋白酶基因(SEQ ID NO:107为DNA序列,而SEQ ID NO:108为推导的氨基酸序列)的5’侧翼序列使用Hot Start High-Fidelity DNA聚合酶New England Biolabs,Ipswich,MA,USA)和如下所示的基因-特异性正向和反向引物扩增。下划线部分为导入供克隆的Asc I位点,而斜体区代表同源于/>的***位点的载体。
正向引物:
(SEQ ID NO:109)/>
反向引物:
(SEQ ID NO:110)
扩增反应物含有150ng的里氏木霉981-O-8基因组DNA,各200μm的dNTP,0.4μM引物,1XGC缓冲液(New England Biolabs,Ipswich,MA,USA)和2单位的DNA聚合酶(New England Biolabs,Ipswich,MA,USA),最终体积为50μl。
将扩增反应物在中温育,程序如下:1个循环在95℃进行2分钟;30个循环,每个在95℃进行30秒,57℃进行30秒,和72℃进行1分30秒;和一个循环在72℃进行7分钟。
PCR产物通过使用TAE缓冲液的1%的琼脂糖凝胶电泳分离,并将2.2kb片段切出,并使用Extract II Kit依照生产商的实验方案提取琼脂糖。
将2.2kb PCR产物使用PCR Cloning Kit依照生产商的实验方案***Asc I-消化的pJfyS1579-41-11。/>反应物在10μl反应体积中含有1X/>Reaction缓冲液,150ng pJfyS1579-41-11,100ng PCR产物和1μl/>Enzyme。将反应物在37℃温育15分钟和在50℃温育15分钟。向反应物添加40μl的TE,并将2μl用于依照生产商的实验方案转化ONE/>TOP 10感受态细胞。转化体通过测序筛选,鉴定出一个含有不具PCR错误的***物的克隆并命名为pJfyS153A,并将其用作质粒以***胃蛋白酶样天冬氨酸蛋白酶基因的3’侧翼。
将胃蛋白酶样天冬氨酸蛋白酶基因的3’侧翼序列从里氏木霉981-O-8基因组DNA(实施例13)使用Hot Start High-Fidelity DNA聚合酶(New EnglandBiolabs,Ipswich,MA,USA)和如下所示的基因-特异性正向和反向引物扩增。下划线部分为导入供克隆的SbfI位点,而斜体区代表同源于/>的***位点的载体,且粗体部分为导入以供之后去除质粒的细菌繁殖部分的Pme I位点。
(SEQ ID NO:111)
反向引物:
(SEQ ID NO:112)
扩增反应物含有150ng的里氏木霉981-O-8基因组DNA,各200μm的dNTP,0.4μM引物,含5mM MgCl2的1XHF缓冲液,和2单位的/>DNA聚合酶,最终体积为50μl。
将扩增反应物在中温育,程序如下:1个循环在95℃进行2分钟;30个循环,每个在95℃进行30秒,59℃进行30秒,和72℃进行1分30秒;和一个循环在72℃进行7分钟。
PCR产物通过使用TAE缓冲液的1%的琼脂糖凝胶电泳分离,将1.5kb片段切出,并使用Extract II Kit依照生产商的实验方案提取琼脂糖。
将1.5kb PCR产物使用PCR Cloning Kit依照生产商的实验方案***Sbf I-消化的pJfyS153A。/>反应物在10μl反应体积中含有1X/>Reaction缓冲液,150ng的pJfyS1579-41-11,100ng的PCR产物,和1μl的/>Enzyme。将反应物在37℃温育15分钟和在50℃温育15分钟。向反应物添加40μl的TE,并将2μl用于依照生产商的实验方案(Invitrogen,Carlsbad,CA,USA)转化ONE/>TOP 10感受态细胞。转化体通过测序筛选,并鉴定出一个含有不具PCR错误的***物的克隆,并命名为pJfyS153(图26),并将其用于缺失胃蛋白酶样天冬氨酸蛋白酶基因。
实施例35:胃蛋白酶样天冬氨酸蛋白酶缺失里氏木霉菌株JfyS153-6的生成
当用Pme I-消化的并凝胶纯化的pJfyS152依照实施例12中描述的步骤转化原生质体时,获得了里氏木霉AgJg115-104-7B1(描述于实施例23)的十六个转化体。将所有16个用灭菌接种环从转化平板转移至含有PDA培养基的新平板,并在28℃生长4日。将16转化体通过真菌孢子PCR依照实施例23中所述的方法用下述引物进行分析:
正向引物:
5'-CGCGGAGGTGAGGTGTTGATGATG-3'(SEQ ID NO:113)
反向引物1(野生型):
5'-CGGCGGTCTTTAAGGTGATGTCGC-3'(SEQ ID NO:114)
反向引物2(缺失的):
5'-GTTTCAGGCAGGTCTTGCAACG-3'(SEQ ID NO:115)
将反应物在中温育,程序如下:1个循环在98℃进行5分钟;35个循环,每个在98℃进行20秒,53℃进行30秒,和72℃进行3分30秒;1个循环在72℃进行7分钟;和4℃维持。对PCR反应物进行TAE缓冲液中的1%的琼脂糖凝胶电泳。
设计PCR引物使得若野生型基因是完整的,则正向和反向引物1会退火,得到2.5kb片段,而若基因缺失,则正向和反向引物2会退火,得到3.5kb片段。真菌孢子PCR表明16个转化体中仅一个含有仅显示3.5kb片段的缺失。接着通过Southern分析来分析该菌株。
如实施例21中所述提取基因组DNA,并将2μg用21.4单位的Nco I和21.4单位的BglII消化16小时。对消化物进行TAE缓冲液中的0.9%的琼脂糖凝胶电泳并遵循生产商的推荐印迹于SuperCharge印迹膜使用/>大约12-16小时。杂交于胃蛋白酶样天冬氨酸蛋白酶基因的3’侧翼序列的PCR探针使用PCR DIG ProbeSynthesis Kit依照生产商的实验方案(Roche Diagnostics,Indianapolis,ID)用以下正向和反向引物生成:
正向引物:
5'-GAAGACAGTCCTACTGCTGCGGAG-3'(SEQ ID NO:116)
反向引物:
5'-GTAGCTCTCCCCGTATAATGCAGG-3'(SEQ ID NO:117)
将扩增反应物在中温育,程序如下:1个循环在95℃进行2分钟;30个循环,每个在95℃进行20秒,57℃进行30秒,和72℃进行40秒;和一个循环在72℃进行7分钟。
PCR产物通过使用TAE缓冲液的1.2%的琼脂糖凝胶电泳分离,并将0.6kb片段切出,并使用Nucleospin ExtractKit依照生产商的实验方案提取琼脂糖。异羟基洋地黄毒苷元的并入通过在大约0.6kb运行的标记探针的分子量变动来确证。
在DIG Easy Hyb缓冲液中在42℃进行杂交15-17小时。然后将膜在室温在高严格条件下在2X SSC加0.1%SDS中洗涤5分钟,接着在65℃在0.5X SSC加0.1%SDS中洗涤两次各15分钟。探针-靶杂合物的检测是通过化学发光测定法(Roche MolecularBiochemicals,Indianapolis,IN,USA)遵循生产商的指示进行的。
Southern分析表明菌株以单拷贝在意图的基因座携带缺失盒。将含有胃蛋白酶样蛋白酶缺失的菌株命名为里氏木霉JfyS153-6。
通过以下编号的段落进一步描述本发明:
[1]一种亲本木霉属菌株的突变体,其包含编码多肽的多核苷酸,和一个或多个(几个)选自下组的基因:第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第一天冬氨酸蛋白酶基因,胰蛋白酶样丝氨酸蛋白酶基因,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因,和第二天冬氨酸蛋白酶基因,其中一个或多个(几个)基因经修饰使得突变体菌株当在相同条件下培养时,相对于亲本木霉属菌株,分别在一种或多种(几种)选自下组的酶的产生方面有缺陷:第一枯草杆菌蛋白酶样丝氨酸蛋白酶,第一天冬氨酸蛋白酶,胰蛋白酶样丝氨酸蛋白酶,第二枯草杆菌蛋白酶样丝氨酸蛋白酶,和第二天冬氨酸蛋白酶。
[2]段1的突变体,其包含第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因的修饰。
[3]段1或2的突变体,其包含第一天冬氨酸蛋白酶基因的修饰。
[4]段1-3任一项的突变体,其包含胰蛋白酶样丝氨酸蛋白酶基因的修饰。
[5]段1-4任一项的突变体,其包含第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因的修饰。
[6]段1-5任一项的突变体,其包含第二天冬氨酸蛋白酶基因的修饰。
[7]段1-6的突变体,其包含第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第一天冬氨酸蛋白酶基因,胰蛋白酶样丝氨酸蛋白酶基因,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因,和第二天冬氨酸蛋白酶基因的修饰。
[8]段1-7任一项的突变体,其中所述多肽对木霉属菌株是天然或外源的。
[9]段1-8任一项的突变体,其中所述木霉属菌株选自下组:哈茨木霉,康宁木霉,长枝木霉,里氏木霉,和绿色木霉。
[10]段1-9任一项的突变体,其中所述木霉属菌株是里氏木霉。
[11]段1-10任一项的突变体,当其在相同条件下培养时,相对于亲本木霉属菌株,产生少至少25%的一种或多种(几种)选自下组的酶:第一枯草杆菌蛋白酶样丝氨酸蛋白酶,第一天冬氨酸蛋白酶,胰蛋白酶样丝氨酸蛋白酶,第二枯草杆菌蛋白酶样丝氨酸蛋白酶,和第二天冬氨酸蛋白酶。
[12]段1-10任一项的突变体,当其在相同条件下培养时,相对于亲本木霉属菌株,在一种或多种(几种)选自下组的酶方面完全缺陷:第一枯草杆菌蛋白酶样丝氨酸蛋白酶,第一天冬氨酸蛋白酶,胰蛋白酶样丝氨酸蛋白酶,第二枯草杆菌蛋白酶样丝氨酸蛋白酶,和第二天冬氨酸蛋白酶。
[13]段1-12任一项的突变体,其中所述第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因选自下组:(a)多肽,包含氨基酸序列或由氨基酸序列组成,所述氨基酸序列与SEQ ID NO:2或其成熟多肽具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性;(b)多肽,其由多核苷酸编码,所述多核苷酸在至少低严格条件,至少中等严格条件,至少中-高严格条件,至少高严格条件,或至少非常高严格条件下与以下杂交:(i)SEQ ID NO:1;(ii)SEQ ID NO:1的成熟多肽编码序列,(iii)(i)或(ii)的cDNA序列,或(iv)(i),(ii),或(iii)的全长互补链;和(c)多肽,其由多核苷酸编码,所述多核苷酸包含核苷酸序列或由核苷酸序列组成,所述核苷酸序列与SEQ ID NO:1或其cDNA,或它们的成熟多肽编码序列具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性。
[14]段1-13任一项的突变体,其中所述第一枯草杆菌蛋白酶样丝氨酸蛋白酶包含SEQ ID NO:2或其成熟多肽或由SEQ ID NO:2或其成熟多肽组成。
[15]段1-14任一项的突变体,其中所述第一天冬氨酸蛋白酶基因选自下组:(a)多肽,其包含氨基酸序列,所述氨基酸序列与SEQ ID NO:4或其成熟多肽具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性;(b)多肽,其由多核苷酸编码,所述多核苷酸在至少低严格条件,至少中等严格条件,至少中-高严格条件,至少高严格条件,或至少非常高严格条件下与以下杂交:(i)SEQ IDNO:3;(ii)SEQ ID NO:3的成熟多肽编码序列,(iii)(i)或(ii)的cDNA序列,或(iv)(i),(ii),或(iii)的全长互补链;和(c)多肽,其由多核苷酸编码,所述多核苷酸包含核苷酸序列,所述氨基酸序列与SEQ ID NO:3或其cDNA,或它们的成熟多肽编码序列具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性。
[16]段1-15任一项的突变体,其中所述第一天冬氨酸蛋白酶包含SEQ ID NO:4或其成熟多肽或由SEQ ID NO:4或其成熟多肽组成。
[17]段1-16任一项的突变体,其中所述胰蛋白酶样丝氨酸蛋白酶基因选自下组:(a)多肽,其包含氨基酸序列,所述氨基酸序列与SEQ ID NO:6或其成熟多肽具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性;(b)多肽,其由多核苷酸编码,所述多核苷酸在至少低严格条件,至少中等严格条件,至少中-高严格条件,至少高严格条件,或至少非常高严格条件下与以下杂交:(i)SEQID NO:5;(ii)SEQ ID NO:5的成熟多肽编码序列,(iii)包含于(i)或(ii)的cDNA序列,或(iv)的(i),(ii),或(iii)全长互补链;和(c)多肽,其由多核苷酸编码,所述多核苷酸包含核苷酸序列,所述核苷酸序列与SEQ ID NO:5或其cDNA,或它们的成熟多肽编码序列具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性。
[18]段1-17任一项的突变体,其中所述胰蛋白酶样丝氨酸蛋白酶包含SEQ ID NO:6或其成熟多肽或由SEQ ID NO:6或其成熟多肽组成。
[19]段1-18任一项的突变体,其中所述第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因选自下组:(a)多肽,其包含氨基酸序列或由氨基酸序列组成,所述氨基酸序列与SEQ IDNO:100或其成熟多肽具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性;(b)多肽,其由多核苷酸编码,所述多核苷酸在至少低严格条件,至少中等严格条件,至少中-高严格条件,至少高严格条件,或至少非常高严格条件下与以下杂交:(i)SEQ ID NO:99;(ii)SEQ ID NO:99的成熟多肽编码序列,(iii)(i)或(ii)的cDNA序列,或(iv)(i),(ii),或(iii)的全长互补链;和(c)多肽,其由多核苷酸编码,所述多核苷酸包含核苷酸序列或由核苷酸序列组成,所述核苷酸序列与SEQID NO:100或其cDNA,或它们的成熟多肽编码序列具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性。
[20]段1-19任一项的突变体,其中所述第二枯草杆菌蛋白酶样丝氨酸蛋白酶包含SEQ ID NO:100或其成熟多肽或由SEQ ID NO:100或其成熟多肽组成。
[21]段1-20任一项的突变体,其中所述第二天冬氨酸蛋白酶基因选自下组:(a)多肽,其包含氨基酸序列,所述氨基酸序列与SEQ ID NO:108或其成熟多肽具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性;(b)多肽,其由多核苷酸编码,所述多核苷酸在至少低严格条件,至少中等严格条件,至少中-高严格条件,至少高严格条件,或至少非常高严格条件下与以下杂交:(i)SEQID NO:3;(ii)SEQ ID NO:107的成熟多肽编码序列,(iii)(i)或(ii)的cDNA序列,或(iv)(i),(ii),或(iii)的全长互补链;和(c)多肽,其由多核苷酸编码,所述多核苷酸包含核苷酸序列,所述核苷酸序列与SEQ ID NO:107或其cDNA,或它们的成熟多肽编码序列具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性。
[22]段1-21任一项的突变体,其中所述第二天冬氨酸蛋白酶包含SEQ ID NO:108或其成熟多肽或由SEQ ID NO:108或其成熟多肽组成。
[23]一种产生多肽的方法,其包括:在用于产生多肽的培养基中培养亲本木霉属菌株的突变体,其中突变体菌株包含编码多肽的多核苷酸,和一个或多个(几个)选自下组的基因:第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第一天冬氨酸蛋白酶基因,胰蛋白酶样丝氨酸蛋白酶基因,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因,和第二天冬氨酸蛋白酶基因,其中一个或多个(几个)基因经修饰使得突变体菌株当在相同条件下培养时,相对于亲本木霉属菌株,分别在一种或多种(几种)选自下组的酶的产生方面有缺陷:第一枯草杆菌蛋白酶样丝氨酸蛋白酶,第一天冬氨酸蛋白酶,胰蛋白酶样丝氨酸蛋白酶,第二枯草杆菌蛋白酶样丝氨酸蛋白酶,和第二天冬氨酸蛋白酶;和从培养基回收所述多肽。
[24]段23的方法,其中所述突变体包含第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因的修饰。
[25]段23或24的方法,其中所述突变体包含第一天冬氨酸蛋白酶基因的修饰。
[26]段23-25任一项的方法,其中所述突变体包含胰蛋白酶样丝氨酸蛋白酶基因的修饰。
[27]段23-26任一项的方法,其中所述突变体包含第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因的修饰。
[28]段23-27任一项的方法,其中所述突变体包含第二天冬氨酸蛋白酶基因的修饰。
[29]段23-28任一项的方法,其中所述突变体包含第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第一天冬氨酸蛋白酶基因,胰蛋白酶样丝氨酸蛋白酶基因,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因,和第二天冬氨酸蛋白酶基因的修饰。
[30]段23-29任一项的方法,其中所述多肽对于木霉属菌株是天然或外源的。
[31]段23-30任一项的方法,其中木霉属菌株选自下组:哈茨木霉,康宁木霉,长枝木霉,里氏木霉,和绿色木霉。
[32]段23-31任一项的方法,其中所述木霉属菌株是里氏木霉。
[33]段23-32任一项的方法,其中所述突变体菌株当在相同条件下培养时,相对于亲本木霉属菌株,产生少至少25%的一种或多种(几种)选自下组的酶:第一枯草杆菌蛋白酶样丝氨酸蛋白酶,第一天冬氨酸蛋白酶,胰蛋白酶样丝氨酸蛋白酶,第二枯草杆菌蛋白酶样丝氨酸蛋白酶,和第二天冬氨酸蛋白酶。
[34]段23-32任一项的方法,其中所述突变体菌株当在相同条件下培养时,相对于亲本木霉属菌株,在一种或多种(几种)选自下组的酶方面完全缺陷:第一枯草杆菌蛋白酶样丝氨酸蛋白酶,第一天冬氨酸蛋白酶,胰蛋白酶样丝氨酸蛋白酶,第二枯草杆菌蛋白酶样丝氨酸蛋白酶,和第二天冬氨酸蛋白酶。
[35]段23-34任一项的方法,其中所述第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因选自下组:(a)多肽,其包含氨基酸序列或由氨基酸序列组成,所述氨基酸序列与SEQ IDNO:2或其成熟多肽具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性;(b)多肽,其由多核苷酸编码,所述多核苷酸在至少低严格条件,至少中等严格条件,至少中-高严格条件,高严格条件,或非常高严格条件下与以下杂交:(i)SEQ ID NO:1;(ii)SEQ ID NO:1的成熟多肽编码序列,(iii)(i)或(ii)的cDNA序列,或(iv)(i),(ii),或(iii)的全长互补链;和(c)多肽,其由多核苷酸编码,所述多核苷酸包含核苷酸序列或由核苷酸序列组成,所述核苷酸序列与SEQ ID NO:1或其cDNA,或它们的成熟多肽编码序列具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性。
[36]段23-35任一项的方法,其中所述第一枯草杆菌蛋白酶样丝氨酸蛋白酶包含SEQ ID NO:2或其成熟多肽或由SEQ ID NO:2或其成熟多肽组成。
[37]段23-36任一项的方法,其中所述第一天冬氨酸蛋白酶基因选自下组:(a)多肽,其包含氨基酸序列,所述氨基酸序列与SEQ ID NO:4或其成熟多肽具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性;(b)多肽,其由多核苷酸编码,所述多核苷酸在至少低严格条件,至少中等严格条件,至少中-高严格条件,至少高严格条件,或至少非常高严格条件下与以下杂交:(i)SEQ IDNO:3;(ii)SEQ ID NO:3的成熟多肽编码序列,(iii)(i)或(ii)的cDNA序列,或(iv)(i),(ii),或(iii)的全长互补链;和(c)多肽,其由多核苷酸编码,所述多核苷酸包含核苷酸序列,所述核苷酸序列与SEQ ID NO:3或其cDNA,或它们的成熟多肽编码序列具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性。
[38]段23-37任一项的方法,其中所述第一天冬氨酸蛋白酶包含SEQ ID NO:4或其成熟多肽或由SEQ ID NO:4或其成熟多肽组成。
[39]段23-38任一项的方法,其中所述胰蛋白酶样丝氨酸蛋白酶基因选自下组:(a)多肽,其包含氨基酸序列,所述氨基酸序列与SEQ ID NO:6或其成熟多肽具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性;(b)多肽,其由多核苷酸编码,所述多核苷酸在至少低严格条件,至少中等严格条件,至少中-高严格条件,至少高严格条件,或至少非常高严格条件下与以下杂交:(i)SEQID NO:5;(ii)SEQ ID NO:5的成熟多肽编码序列,(iii)包含于(i)或(ii)的cDNA序列,或(iv)(i),(ii)的全长互补链,或(iii);和(c)多肽,其由多核苷酸编码,所述多核苷酸包含核苷酸序列,所述核苷酸序列与SEQ ID NO:5或其cDNA,或它们的成熟多肽编码序列具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性。
[40]段23-39任一项的方法,其中所述胰蛋白酶样丝氨酸蛋白酶包含SEQ ID NO:6或其成熟多肽或由SEQ ID NO:6或其成熟多肽组成。
[41]段23-40任一项的方法,其中所述第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因选自下组:(a)多肽,其包含氨基酸序列或由氨基酸序列组成,所述氨基酸序列与SEQ IDNO:100或其成熟多肽具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性;(b)多肽,其由多核苷酸编码,所述多核苷酸在至少低严格条件,至少中等严格条件,至少中-高严格条件,至少高严格条件,或至少非常高严格条件下与以下杂交:(i)SEQ ID NO:99;(ii)SEQ ID NO:99的成熟多肽编码序列,(iii)(i)或(ii)的cDNA序列,或(iv)(i),(ii),或(iii)的全长互补链;和(c)多肽,其由多核苷酸编码,所述多核苷酸包含核苷酸序列或由核苷酸序列组成,所述核苷酸序列具有与SEQ ID NO:100或其cDNA,或它们的成熟多肽编码序列至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性。
[42]段23-41任一项的方法,其中所述第二枯草杆菌蛋白酶样丝氨酸蛋白酶包含SEQ ID NO:100或其成熟多肽或由SEQ ID NO:100或其成熟多肽组成。
[43]段23-42任一项的方法,其中所述第二天冬氨酸蛋白酶基因选自下组:(a)多肽,其包含氨基酸序列,所述氨基酸序列与SEQ ID NO:108或其成熟多肽具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性;(b)多肽,其由多核苷酸编码,所述多核苷酸在至少低严格条件,至少中等严格条件,至少中-高严格条件,至少高严格条件,或至少非常高严格条件下与以下杂交:(i)SEQID NO:107;(ii)SEQ ID NO:107的成熟多肽编码序列,(iii)(i)或(ii)的cDNA序列,或(iv)(i),(ii),或(iii)的全长互补链;和(c)多肽,其由多核苷酸编码,所述多核苷酸包含核苷酸序列,所述核苷酸序列与SEQ ID NO:107或其cDNA,或它们的成熟多肽编码序列具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性。
[44]段23-43任一项的方法,其中所述第二天冬氨酸蛋白酶包含SEQ ID NO:108或其成熟多肽或由SEQ ID NO:108或其成熟多肽组成。
[45]一种用于获得亲本木霉属菌株的突变体的方法,其包括:修饰一个或多个(几个)选自下组的基因:第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第一天冬氨酸蛋白酶基因,胰蛋白酶样丝氨酸蛋白酶基因,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因,和第二天冬氨酸蛋白酶基因;和鉴定来自步骤(a)的突变体菌株,其中一个或多个(几个)选自下组的基因经修饰:第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第一天冬氨酸蛋白酶基因,和胰蛋白酶样丝氨酸蛋白酶基因,使得突变体菌株当在相同条件下培养时,相对于亲本木霉属菌株,分别在一种或多种(几种)选自下组的酶的产生方面有缺陷:第一枯草杆菌蛋白酶样丝氨酸蛋白酶,第一天冬氨酸蛋白酶,胰蛋白酶样丝氨酸蛋白酶,第二枯草杆菌蛋白酶样丝氨酸蛋白酶,和第二天冬氨酸蛋白酶。
[46]段45的方法,其中所述突变体包含第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因的修饰。
[47]段45或46的方法,其中所述突变体包含第一天冬氨酸蛋白酶基因的修饰。
[48]段45-47任一项的方法,其中所述突变体包含胰蛋白酶样丝氨酸蛋白酶基因的修饰。
[49]段45-48任一项的方法,其中所述突变体包含第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因的修饰。
[50]段45-49任一项的方法,其中所述突变体包含第二天冬氨酸蛋白酶基因的修饰。
[51]段45-50任一项的方法,其中所述突变体包含第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因,第一天冬氨酸蛋白酶基因,胰蛋白酶样丝氨酸蛋白酶基因,第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因,和第二天冬氨酸蛋白酶基因的修饰。
[52]段45-51任一项的方法,其中所述多肽对于木霉属菌株是天然或外源的。
[53]段45-52任一项的方法,其中所述木霉属菌株选自下组:哈茨木霉,康宁木霉,长枝木霉,里氏木霉,和绿色木霉。
[54]段45-53任一项的方法,其中所述木霉属菌株是里氏木霉。
[55]段45-54任一项的方法,其中所述突变体菌株当在相同条件下培养时,相对于亲本木霉属菌株,产生少至少25%的一种或多种(几种)选自下组的酶:第一枯草杆菌蛋白酶样丝氨酸蛋白酶,第一天冬氨酸蛋白酶,胰蛋白酶样丝氨酸蛋白酶,第二枯草杆菌蛋白酶样丝氨酸蛋白酶,和第二天冬氨酸蛋白酶。
[56]段45-54任一项的方法,其中所述突变体菌株当在相同条件下培养时,相对于亲本木霉属菌株,在一种或多种(几种)选自下组的酶方面完全缺陷:第一枯草杆菌蛋白酶样丝氨酸蛋白酶,第一天冬氨酸蛋白酶,胰蛋白酶样丝氨酸蛋白酶,第二枯草杆菌蛋白酶样丝氨酸蛋白酶,和第二天冬氨酸蛋白酶。
[57]段45-56任一项的方法,其中所述第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因选自下组:(a)多肽,其包含氨基酸序列或由氨基酸序列组成,所述氨基酸序列与SEQ IDNO:2或其成熟多肽具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性;(b)多肽,其由多核苷酸编码,所述多核苷酸在至少低严格条件,至少中等严格条件,至少中-高严格条件,至少高严格条件,或至少非常高严格条件下与以下杂交:(i)SEQ ID NO:1;(ii)SEQ ID NO:1的成熟多肽编码序列,(iii)(i)或(ii)的cDNA序列,或(iv)(i),(ii),或(iii)的全长互补链;和(c)多肽,其由多核苷酸编码,所述多核苷酸包含核苷酸序列或由核苷酸序列组成,所述核苷酸序列与SEQID NO:1或其cDNA,或它们的成熟多肽编码序列具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性。
[58]段45-57任一项的方法,其中所述第一枯草杆菌蛋白酶样丝氨酸蛋白酶包含SEQ ID NO:2或其成熟多肽或由SEQ ID NO:2或其成熟多肽组成。
[59]段45-58任一项的方法,其中所述第一天冬氨酸蛋白酶基因选自下组:(a)多肽,其包含氨基酸序列,所述氨基酸序列与SEQ ID NO:4或其成熟多肽具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性;(b)多肽,其由多核苷酸编码,所述多核苷酸在至少低严格条件,至少中等严格条件,至少中-高严格条件,至少高严格条件,或至少非常高严格条件下与以下杂交:(i)SEQ IDNO:3;(ii)SEQ ID NO:3的成熟多肽编码序列,(iii)(i)或(ii)的cDNA序列,或(iv)(i),(ii),或(iii)的全长互补链;和(c)多肽,其由多核苷酸编码,所述多核苷酸包含核苷酸序列,所述核苷酸序列与SEQ ID NO:3或其cDNA,或它们的成熟多肽编码序列具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性。
[60]段45-59任一项的方法,其中所述第一天冬氨酸蛋白酶包含SEQ ID NO:4或其成熟多肽或由SEQ ID NO:4或其成熟多肽组成。
[61]段45-60任一项的方法,其中所述胰蛋白酶样丝氨酸蛋白酶基因选自下组:(a)多肽,其包含氨基酸序列,所述氨基酸序列与SEQ ID NO:6或其成熟多肽具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性;(b)多肽,其由多核苷酸编码,所述多核苷酸在至少低严格条件,至少中等严格条件,至少中-高严格条件,高严格条件,或非常高严格条件下与以下杂交:(i)SEQ ID NO:5;(ii)SEQ ID NO:5的成熟多肽编码序列,(iii)包含于(i)或(ii)的cDNA序列,或(iv)(i),(ii),或(iii)的全长互补链;和(c)多肽,其由多核苷酸编码,所述多核苷酸包含核苷酸序列,所述核苷酸序列与SEQ ID NO:5或其cDNA,或它们的成熟多肽编码序列具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性。
[62]段45-61任一项的方法,其中所述胰蛋白酶样丝氨酸蛋白酶包含SEQ ID NO:6或其成熟多肽或由SEQ ID NO:6或其成熟多肽组成。
[63]段45-62任一项的方法,其中所述第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因选自下组:(a)多肽,其包含氨基酸序列或由氨基酸序列组成,所述氨基酸序列与SEQ IDNO:100或其成熟多肽具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性;(b)多肽,其由多核苷酸编码,所述多核苷酸在至少低严格条件,至少中等严格条件,至少中-高严格条件,至少高严格条件,或至少非常高严格条件下与以下杂交:(i)SEQ ID NO:99;(ii)SEQ ID NO:99的成熟多肽编码序列,(iii)(i)或(ii)的cDNA序列,或(iv)(i),(ii),或(iii)的全长互补链;和(c)多肽,其由多核苷酸编码,所述多核苷酸包含核苷酸序列或由核苷酸序列组成,所述核苷酸序列具有与SEQ ID NO:100或其cDNA,或它们的成熟多肽编码序列至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性。
[64]段45-63任一项的方法,其中所述第二枯草杆菌蛋白酶样丝氨酸蛋白酶包含SEQ ID NO:100或其成熟多肽或由SEQ ID NO:100或其成熟多肽组成。
[65]段45-64任一项的方法,其中所述第二天冬氨酸蛋白酶基因选自下组:(a)多肽,其包含氨基酸序列,所述氨基酸序列与SEQ ID NO:108或其成熟多肽具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性;(b)多肽,其由多核苷酸编码,所述多核苷酸在至少低严格条件,至少中等严格条件,至少中-高严格条件,至少高严格条件,或至少非常高严格条件下与以下杂交:(i)SEQID NO:3;(ii)SEQ ID NO:107的成熟多肽编码序列,(iii)(i)或(ii)的cDNA序列,或(iv)(i),(ii),或(iii)的全长互补链;和(c)多肽,其由多核苷酸编码,所述多核苷酸包含核苷酸序列,所述核苷酸序列与SEQ ID NO:107或其cDNA,或它们的成熟多肽编码序列具有至少60%,例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或100%序列同一性。
[66]段45-65任一项的方法,其中所述第二天冬氨酸蛋白酶包含SEQ ID NO:108或其成熟多肽或由SEQ ID NO:108或其成熟多肽组成。
本文描述和要求保护的本发明并不局限于本文公开的具体方面的范围内,因为这些方面旨在作为本发明几个方面的说明。旨在将任何等同的方面包含于本发明的范围内。实际上,从前面的说明中,除本文所显示和描述的之外,本发明的多种修改对于本领域的技术人员来说是显而易见的。这些修改也旨在落入所附的权利要求的范围内。在冲突的情况下,将以包括定义部分的本公开为准。本文中引用了多种参考文献,其公开通过全文提述并入本文。
序列表
<110> 诺维信股份有限公司(Novozymes, Inc.)
S.梅宇兰(Maiyuran, Suchindra)
A.简(Jang, Abigail)
K.布朗(Brown, Kimberly)
S.梅里诺(Merino, Sandra)
J.沙斯基(Shasky, Jeffrey)
E.阿巴特(Abbate, Eric)
<120> 用于在木霉属的酶缺陷突变体中产生多肽的方法
<130> 11700-CN-PCD[2]
<150> US 61/287,844
<151> 2009-12-18
<160> 117
<170> PatentIn 3.5版
<210> 1
<211> 2777
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 1
atggtgcgct ccgccctatt cgtgtcgctg ctcgcgacct tctccggagt cattgcccgt 60
gtctccgggc atgggtcaaa gatcgttccc ggcgcgtaca tcttcgaatt cgaggattca 120
caggtgagtc tcgctcggcc gttggcaccg gatgacatgc ctccagctgt ggcaatgctg 180
acgggactcc atccaggaca cggccgattt ctacaagaag ctcaacggcg agggctcaac 240
gcgcctgaag ttcgactaca agctgttcaa gggcgtctcc gtccagctca aggacctaga 300
caaccatgag gcaaaggccc agcagatggc ccagctgcct gctgtcaaga acgtgtggcc 360
cgtcaccctc atcgacgccc ccaaccccaa ggtcgagtgg gttgccggca gcacggcgcc 420
tactctggag agcagggcga tcaagaagcc accgatcccg aacgactcga gcgacttccc 480
cacgcaccag atgacccaaa tcgacaagct gcgagccaag ggctacacgg gcaagggcgt 540
cagggttgcc gtcattgata caggcgtgag tacaagccca ctgtcccaag caagtcgtgt 600
agacgctcac atacggccag attgactaca cccaccctgc tctcggcggc tgctttggta 660
ggggctgtct ggtctccttt ggcaccgatt tggtcggtga cgactacacc ggctttaaca 720
cgcctgtccc cgatgatgac cccgtcgact gcgccggcca cggttctcac gttgctggta 780
tcattgctgc gcaggagaat ccgtacggct tcactggcgg cgctcccgat gtcaccctcg 840
gcgcttatcg agtctttggc tgcgacggcc aggccggtaa cgatgtcctg atttccgctt 900
acaaccaggc ctttgaggac ggtgcccaga tcatcactgc ctccattggc ggtccctctg 960
gctgggctga ggagccgtgg gccgttgccg tcacccgcat cgttgaggca ggtgttccct 1020
gcacggtctc tgccggcaac gagggcgact ctggtctctt ctttgccagc acggcagcca 1080
atggcaagaa agtcattgct gtcgcctccg tcgacaacga gaacatccct tcagtgctgt 1140
ccgtggcctc ttacaaaatt gacagcggcg ctgcccagga ctttggctac gtctcctcct 1200
ccaaggcgtg ggacggcgtg agcaagcccc tgtatgctgt gtcgttcgac actactattc 1260
ccgacgatgg ctgctcgcct ctccctgaca gcactcccga cctctctgac tacattgtcc 1320
ttgtccgccg tggcacctgc acctttgtcc agaaagccca aaatgtcgct gcaaagggcg 1380
ccaagtacct gctctattat aacaacattc ccggtgcgct ggccgtcgat gtcagcgccg 1440
tccccgagat tgaggctgtc ggcatggtcg atgacaagac gggtgctacc tggattgccg 1500
ccctcaagga tggaaagacc gtcaccctga cactgactga cccgatcgag agcgagaagc 1560
aaattcagtt cagcgacaac ccgacaactg gcggtgctct gagcggctac acaacctggg 1620
gccctacctg ggagctggac gtcaagcctc agatcagctc tcccggcggc aacattctct 1680
ccacgtaccc cgtggctctc ggaggatatg ccaccctgtc cggtacctcc atggcctgcc 1740
ccctgacggc ggctgctgtt gctctgattg gacaagctcg tggcaccttt gaccctgcct 1800
tgatcgacaa cttgttggca acgactgcga acccccagct gttcaacgac ggcgagaagt 1860
tctacgactt cctcgccccc gttccccaac agggcggtgg cctcatccag gcctacgatg 1920
ccgcctttgc gaccactctc ctgtcaccgt ccagcctgtc gttcaacgac actgaccact 1980
tcatcaagaa gaagcagatc accctcaaga acaccagcaa gcagagggtc acctacaagc 2040
tcaaccacgt ccccaccaac accttttaca ctctggcacc cggtaacggc tatccagctc 2100
cctttcctaa cgacgccgtt gccgctcacg ccaatctcaa gtttaatctg cagcaagtga 2160
ccctgcccgc cggcaggtcc atcactgtcg acgtcttccc tactcccccc agggacgtcg 2220
acgccaagcg cctggcgctt tggtcgggct acatcacggt caacggcacg gatggcacca 2280
gtctgtctgt cccgtaccag ggcctcaccg gctccctgca caagcagaag gtgctctatc 2340
cggaggactc ctggatcgcc gattccaccg atgaaagcct ggcccctgtt gagaacggca 2400
ccgtcttcac cattcccgcg ccgggcaacg ctggccccga tgacaagctc ccatcgctcg 2460
tcgtcagccc tgcccttggc tctcgttatg tccgcgttga tctcgtcctc ctgtccgcgc 2520
ctcctcatgg caccaagctc aagacggtca agttcctcga caccacctcc atcggccagc 2580
ctgccggatc accgctcctc tggatcagcc gtggcgccaa ccctattgct tggaccggcg 2640
agctgtctga caacaagttt gctccccctg gaacgtacaa ggccgtgttc catgctctgc 2700
gtattttcgg caacgagaag aagaaggagg actgggatgt gagcgaatct cctgccttca 2760
ccatcaagta tgcgtag 2777
<210> 2
<211> 882
<212> PRT
<213> 里氏木霉(Trichoderma reesei)
<400> 2
Met Val Arg Ser Ala Leu Phe Val Ser Leu Leu Ala Thr Phe Ser Gly
1 5 10 15
Val Ile Ala Arg Val Ser Gly His Gly Ser Lys Ile Val Pro Gly Ala
20 25 30
Tyr Ile Phe Glu Phe Glu Asp Ser Gln Asp Thr Ala Asp Phe Tyr Lys
35 40 45
Lys Leu Asn Gly Glu Gly Ser Thr Arg Leu Lys Phe Asp Tyr Lys Leu
50 55 60
Phe Lys Gly Val Ser Val Gln Leu Lys Asp Leu Asp Asn His Glu Ala
65 70 75 80
Lys Ala Gln Gln Met Ala Gln Leu Pro Ala Val Lys Asn Val Trp Pro
85 90 95
Val Thr Leu Ile Asp Ala Pro Asn Pro Lys Val Glu Trp Val Ala Gly
100 105 110
Ser Thr Ala Pro Thr Leu Glu Ser Arg Ala Ile Lys Lys Pro Pro Ile
115 120 125
Pro Asn Asp Ser Ser Asp Phe Pro Thr His Gln Met Thr Gln Ile Asp
130 135 140
Lys Leu Arg Ala Lys Gly Tyr Thr Gly Lys Gly Val Arg Val Ala Val
145 150 155 160
Ile Asp Thr Gly Ile Asp Tyr Thr His Pro Ala Leu Gly Gly Cys Phe
165 170 175
Gly Arg Gly Cys Leu Val Ser Phe Gly Thr Asp Leu Val Gly Asp Asp
180 185 190
Tyr Thr Gly Phe Asn Thr Pro Val Pro Asp Asp Asp Pro Val Asp Cys
195 200 205
Ala Gly His Gly Ser His Val Ala Gly Ile Ile Ala Ala Gln Glu Asn
210 215 220
Pro Tyr Gly Phe Thr Gly Gly Ala Pro Asp Val Thr Leu Gly Ala Tyr
225 230 235 240
Arg Val Phe Gly Cys Asp Gly Gln Ala Gly Asn Asp Val Leu Ile Ser
245 250 255
Ala Tyr Asn Gln Ala Phe Glu Asp Gly Ala Gln Ile Ile Thr Ala Ser
260 265 270
Ile Gly Gly Pro Ser Gly Trp Ala Glu Glu Pro Trp Ala Val Ala Val
275 280 285
Thr Arg Ile Val Glu Ala Gly Val Pro Cys Thr Val Ser Ala Gly Asn
290 295 300
Glu Gly Asp Ser Gly Leu Phe Phe Ala Ser Thr Ala Ala Asn Gly Lys
305 310 315 320
Lys Val Ile Ala Val Ala Ser Val Asp Asn Glu Asn Ile Pro Ser Val
325 330 335
Leu Ser Val Ala Ser Tyr Lys Ile Asp Ser Gly Ala Ala Gln Asp Phe
340 345 350
Gly Tyr Val Ser Ser Ser Lys Ala Trp Asp Gly Val Ser Lys Pro Leu
355 360 365
Tyr Ala Val Ser Phe Asp Thr Thr Ile Pro Asp Asp Gly Cys Ser Pro
370 375 380
Leu Pro Asp Ser Thr Pro Asp Leu Ser Asp Tyr Ile Val Leu Val Arg
385 390 395 400
Arg Gly Thr Cys Thr Phe Val Gln Lys Ala Gln Asn Val Ala Ala Lys
405 410 415
Gly Ala Lys Tyr Leu Leu Tyr Tyr Asn Asn Ile Pro Gly Ala Leu Ala
420 425 430
Val Asp Val Ser Ala Val Pro Glu Ile Glu Ala Val Gly Met Val Asp
435 440 445
Asp Lys Thr Gly Ala Thr Trp Ile Ala Ala Leu Lys Asp Gly Lys Thr
450 455 460
Val Thr Leu Thr Leu Thr Asp Pro Ile Glu Ser Glu Lys Gln Ile Gln
465 470 475 480
Phe Ser Asp Asn Pro Thr Thr Gly Gly Ala Leu Ser Gly Tyr Thr Thr
485 490 495
Trp Gly Pro Thr Trp Glu Leu Asp Val Lys Pro Gln Ile Ser Ser Pro
500 505 510
Gly Gly Asn Ile Leu Ser Thr Tyr Pro Val Ala Leu Gly Gly Tyr Ala
515 520 525
Thr Leu Ser Gly Thr Ser Met Ala Cys Pro Leu Thr Ala Ala Ala Val
530 535 540
Ala Leu Ile Gly Gln Ala Arg Gly Thr Phe Asp Pro Ala Leu Ile Asp
545 550 555 560
Asn Leu Leu Ala Thr Thr Ala Asn Pro Gln Leu Phe Asn Asp Gly Glu
565 570 575
Lys Phe Tyr Asp Phe Leu Ala Pro Val Pro Gln Gln Gly Gly Gly Leu
580 585 590
Ile Gln Ala Tyr Asp Ala Ala Phe Ala Thr Thr Leu Leu Ser Pro Ser
595 600 605
Ser Leu Ser Phe Asn Asp Thr Asp His Phe Ile Lys Lys Lys Gln Ile
610 615 620
Thr Leu Lys Asn Thr Ser Lys Gln Arg Val Thr Tyr Lys Leu Asn His
625 630 635 640
Val Pro Thr Asn Thr Phe Tyr Thr Leu Ala Pro Gly Asn Gly Tyr Pro
645 650 655
Ala Pro Phe Pro Asn Asp Ala Val Ala Ala His Ala Asn Leu Lys Phe
660 665 670
Asn Leu Gln Gln Val Thr Leu Pro Ala Gly Arg Ser Ile Thr Val Asp
675 680 685
Val Phe Pro Thr Pro Pro Arg Asp Val Asp Ala Lys Arg Leu Ala Leu
690 695 700
Trp Ser Gly Tyr Ile Thr Val Asn Gly Thr Asp Gly Thr Ser Leu Ser
705 710 715 720
Val Pro Tyr Gln Gly Leu Thr Gly Ser Leu His Lys Gln Lys Val Leu
725 730 735
Tyr Pro Glu Asp Ser Trp Ile Ala Asp Ser Thr Asp Glu Ser Leu Ala
740 745 750
Pro Val Glu Asn Gly Thr Val Phe Thr Ile Pro Ala Pro Gly Asn Ala
755 760 765
Gly Pro Asp Asp Lys Leu Pro Ser Leu Val Val Ser Pro Ala Leu Gly
770 775 780
Ser Arg Tyr Val Arg Val Asp Leu Val Leu Leu Ser Ala Pro Pro His
785 790 795 800
Gly Thr Lys Leu Lys Thr Val Lys Phe Leu Asp Thr Thr Ser Ile Gly
805 810 815
Gln Pro Ala Gly Ser Pro Leu Leu Trp Ile Ser Arg Gly Ala Asn Pro
820 825 830
Ile Ala Trp Thr Gly Glu Leu Ser Asp Asn Lys Phe Ala Pro Pro Gly
835 840 845
Thr Tyr Lys Ala Val Phe His Ala Leu Arg Ile Phe Gly Asn Glu Lys
850 855 860
Lys Lys Glu Asp Trp Asp Val Ser Glu Ser Pro Ala Phe Thr Ile Lys
865 870 875 880
Tyr Ala
<210> 3
<211> 1302
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 3
atgcagacct ttggagcttt tctcgtttcc ttcctcgccg ccagcggcct ggccgcggcc 60
ctccccaccg agggtcagaa gacggcttcc gtcgaggtcc agtacaacaa gaactacgtc 120
ccccacggcc ctactgctct cttcaaggcc aagagaaagt atggcgctcc catcagcgac 180
aacctgaagt ctctcgtggc tgccaggcag gccaagcagg ctctcgccaa gcgccagacc 240
ggctcggcgc ccaaccaccc cagtgacagc gccgattcgg agtacatcac ctccgtctcc 300
atcggcactc cggctcaggt cctccccctg gactttgaca ccggctcctc cgacctgtgg 360
gtctttagct ccgagacgcc caagtcttcg gccaccggcc acgccatcta cacgccctcc 420
aagtcgtcca cctccaagaa ggtgtctggc gccagctggt ccatcagcta cggcgacggc 480
agcagctcca gcggcgatgt ctacaccgac aaggtcacca tcggaggctt cagcgtcaac 540
acccagggcg tcgagtctgc cacccgcgtg tccaccgagt tcgtccagga cacggtcatc 600
tctggcctcg tcggccttgc ctttgacagc ggcaaccagg tcaggccgca cccgcagaag 660
acgtggttct ccaacgccgc cagcagcctg gctgagcccc ttttcactgc cgacctgagg 720
cacggacaga gtaagtagac actcactgga attcgttcct ttcccgatca tcatgaaagc 780
aagtagactg actgaaccaa acaactagac ggcagctaca actttggcta catcgacacc 840
agcgtcgcca agggccccgt tgcctacacc cccgttgaca acagccaggg cttctgggag 900
ttcactgcct cgggctactc tgtcggcggc ggcaagctca accgcaactc catcgacggc 960
attgccgaca ccggcaccac cctgctcctc ctcgacgaca acgtcgtcga tgcctactac 1020
gccaacgtcc agtcggccca gtacgacaac cagcaggagg gtgtcgtctt cgactgcgac 1080
gaggacctcc cttcgttcag cttcggtgtt ggaagctcca ccatcaccat ccctggcgat 1140
ctgctgaacc tgactcccct cgaggagggc agctccacct gcttcggtgg cctccagagc 1200
agctccggca ttggcatcaa catctttggt gacgttgccc tcaaggctgc cctggttgtc 1260
tttgacctcg gcaacgagcg cctgggctgg gctcagaaat aa 1302
<210> 4
<211> 407
<212> PRT
<213> 里氏木霉(Trichoderma reesei)
<400> 4
Met Gln Thr Phe Gly Ala Phe Leu Val Ser Phe Leu Ala Ala Ser Gly
1 5 10 15
Leu Ala Ala Ala Leu Pro Thr Glu Gly Gln Lys Thr Ala Ser Val Glu
20 25 30
Val Gln Tyr Asn Lys Asn Tyr Val Pro His Gly Pro Thr Ala Leu Phe
35 40 45
Lys Ala Lys Arg Lys Tyr Gly Ala Pro Ile Ser Asp Asn Leu Lys Ser
50 55 60
Leu Val Ala Ala Arg Gln Ala Lys Gln Ala Leu Ala Lys Arg Gln Thr
65 70 75 80
Gly Ser Ala Pro Asn His Pro Ser Asp Ser Ala Asp Ser Glu Tyr Ile
85 90 95
Thr Ser Val Ser Ile Gly Thr Pro Ala Gln Val Leu Pro Leu Asp Phe
100 105 110
Asp Thr Gly Ser Ser Asp Leu Trp Val Phe Ser Ser Glu Thr Pro Lys
115 120 125
Ser Ser Ala Thr Gly His Ala Ile Tyr Thr Pro Ser Lys Ser Ser Thr
130 135 140
Ser Lys Lys Val Ser Gly Ala Ser Trp Ser Ile Ser Tyr Gly Asp Gly
145 150 155 160
Ser Ser Ser Ser Gly Asp Val Tyr Thr Asp Lys Val Thr Ile Gly Gly
165 170 175
Phe Ser Val Asn Thr Gln Gly Val Glu Ser Ala Thr Arg Val Ser Thr
180 185 190
Glu Phe Val Gln Asp Thr Val Ile Ser Gly Leu Val Gly Leu Ala Phe
195 200 205
Asp Ser Gly Asn Gln Val Arg Pro His Pro Gln Lys Thr Trp Phe Ser
210 215 220
Asn Ala Ala Ser Ser Leu Ala Glu Pro Leu Phe Thr Ala Asp Leu Arg
225 230 235 240
His Gly Gln Asn Gly Ser Tyr Asn Phe Gly Tyr Ile Asp Thr Ser Val
245 250 255
Ala Lys Gly Pro Val Ala Tyr Thr Pro Val Asp Asn Ser Gln Gly Phe
260 265 270
Trp Glu Phe Thr Ala Ser Gly Tyr Ser Val Gly Gly Gly Lys Leu Asn
275 280 285
Arg Asn Ser Ile Asp Gly Ile Ala Asp Thr Gly Thr Thr Leu Leu Leu
290 295 300
Leu Asp Asp Asn Val Val Asp Ala Tyr Tyr Ala Asn Val Gln Ser Ala
305 310 315 320
Gln Tyr Asp Asn Gln Gln Glu Gly Val Val Phe Asp Cys Asp Glu Asp
325 330 335
Leu Pro Ser Phe Ser Phe Gly Val Gly Ser Ser Thr Ile Thr Ile Pro
340 345 350
Gly Asp Leu Leu Asn Leu Thr Pro Leu Glu Glu Gly Ser Ser Thr Cys
355 360 365
Phe Gly Gly Leu Gln Ser Ser Ser Gly Ile Gly Ile Asn Ile Phe Gly
370 375 380
Asp Val Ala Leu Lys Ala Ala Leu Val Val Phe Asp Leu Gly Asn Glu
385 390 395 400
Arg Leu Gly Trp Ala Gln Lys
405
<210> 5
<211> 933
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 5
atggctcccg cttcccaagt cgtctcagct ctcatgctgc ccgctctcgc cttgggagcc 60
gccatccagc cccgtggcgc tgacatcgtg ggaggaaccg ccgcctcgct cggcgagttc 120
ccctacattg tcagtctgca gaaccccaac cagggcggcc acttctgcgg tggtgtcttg 180
gtcaacgcca acaccgtcgt taccgccgct cactgctccg ttgtctaccc tgcctcgcag 240
atccgcgtcc gcgccggtac tcttgtaagt ttgcttgttt cgagtcctcg aaaagacatg 300
aacctgcgat ggctaaccaa agcacctcct ctctgataga cctggaactc tggcggtacc 360
ctggtcggcg tctcccagat catcgtgaac ccgtcctaca acgaccgcac caccgacttt 420
gacgttgccg tctggcacct gtccagccct atccgcgaga gctccaccat tggctacgcc 480
actcttcccg cccagggctc cgaccccgtg gccggctcga ccgtcaccac cgctggctgg 540
taagcatcat catcattgat agccgggaca tgctggcgtc aaatccgagt ttgctaacca 600
ttcttccaaa aaaacagggg caccaccagc gagaactcca actccatccc ctcccgcctg 660
aacaaggtct ccgtccccgt cgtcgcccgc tccacctgcc aggccgacta ccgcagccag 720
gggctcagtg tcaccaacaa catgttctgc gccggcctca cccagggcgg caaggactct 780
tgctctggcg actctggcgg ccccatcgtt gacgccaacg gtgtcctcca gggtgtcgtt 840
tcttggggta tcggctgtgc tgaggccggt ttccctggtg tctacaccag aatcggcaac 900
tttgtcaact acatcaacca gaacctcgca taa 933
<210> 6
<211> 259
<212> PRT
<213> 里氏木霉(Trichoderma reesei)
<400> 6
Met Ala Pro Ala Ser Gln Val Val Ser Ala Leu Met Leu Pro Ala Leu
1 5 10 15
Ala Leu Gly Ala Ala Ile Gln Pro Arg Gly Ala Asp Ile Val Gly Gly
20 25 30
Thr Ala Ala Ser Leu Gly Glu Phe Pro Tyr Ile Val Ser Leu Gln Asn
35 40 45
Pro Asn Gln Gly Gly His Phe Cys Gly Gly Val Leu Val Asn Ala Asn
50 55 60
Thr Val Val Thr Ala Ala His Cys Ser Val Val Tyr Pro Ala Ser Gln
65 70 75 80
Ile Arg Val Arg Ala Gly Thr Leu Thr Trp Asn Ser Gly Gly Thr Leu
85 90 95
Val Gly Val Ser Gln Ile Ile Val Asn Pro Ser Tyr Asn Asp Arg Thr
100 105 110
Thr Asp Phe Asp Val Ala Val Trp His Leu Ser Ser Pro Ile Arg Glu
115 120 125
Ser Ser Thr Ile Gly Tyr Ala Thr Leu Pro Ala Gln Gly Ser Asp Pro
130 135 140
Val Ala Gly Ser Thr Val Thr Thr Ala Gly Trp Gly Thr Thr Ser Glu
145 150 155 160
Asn Ser Asn Ser Ile Pro Ser Arg Leu Asn Lys Val Ser Val Pro Val
165 170 175
Val Ala Arg Ser Thr Cys Gln Ala Asp Tyr Arg Ser Gln Gly Leu Ser
180 185 190
Val Thr Asn Asn Met Phe Cys Ala Gly Leu Thr Gln Gly Gly Lys Asp
195 200 205
Ser Cys Ser Gly Asp Ser Gly Gly Pro Ile Val Asp Ala Asn Gly Val
210 215 220
Leu Gln Gly Val Val Ser Trp Gly Ile Gly Cys Ala Glu Ala Gly Phe
225 230 235 240
Pro Gly Val Tyr Thr Arg Ile Gly Asn Phe Val Asn Tyr Ile Asn Gln
245 250 255
Asn Leu Ala
<210> 7
<211> 1193
<212> DNA
<213> 粗糙脉孢菌(Neurospora crassa)
<400> 7
atgtcgacaa gtaggaaacg cagccacact ggtccctcaa gcagtcgttt gctgagcggg 60
tagagagctc gacgcatccc ctcaccagct acctcttccg cctgatggag gtcaagcagt 120
ccaacctctg cctcagcgcc gatgtcgagc acgcgcggga tctcctcgcc cttgccgaca 180
aggtgggccc ctcgattgtc gtcctcaaga cccactacga cctgatcaca gggtgggact 240
accacccgca cacgggcacc ggcgccaagc tggccgccct tgcccggaag cacggcttcc 300
tcatcttcga ggaccgcaag ttcgtcgaca ttggcagcac cgtccagaag cagtacacgg 360
ccggcaccgc gcgcattgtc gaatgggccc acatcaccaa cgccgacatc cacgccggag 420
aggccatggt gagcgccatg gcccaggccg cgcaaaagtg gagggagcgc atcccctacg 480
aggtcaagac gtcggtttcg gtgggcaccc cggtcgcgga ccagttcgcc gacgaggaag 540
ccgaggacca ggttgaggag ctgcgcaagg tcgtcacccg cgagaccagc accaccacaa 600
aggacacgga tgggaggaag agtagcatcg tctccatcac gaccgtcacg cagacatatg 660
agccggccga ctcgccacgt ctggtcaaga ccatctcgga ggacgatgag atggtgttcc 720
ccggcatcga ggaggcgcct ctggaccgcg gcctgctgat cttggcccag atgtcgtcca 780
agggctgcct catggacggc aagtacacat gggagtgtgt caaggcggcc cgcaagaaca 840
agggctttgt catgggctac gttgcgcagc agaacctgaa cggcattacc aaggaagctt 900
tggccccaag ctacgaagac ggcgaaagca cgacagagga agaagcgcaa gcagacaact 960
tcatccacat gacacccggc tgcaagttgc cgccaccagg agaggaagcg cctcagggcg 1020
acggactggg tcagcagtac aacacgccgg ataaccttgt caacatcaag ggcaccgata 1080
tcgcgattgt tgggcgtggc atcatcaccg cggcggatcc tccggccgag gctgagcgct 1140
acaggaggaa agcctggaag gcgtaccagg atcgccggga gcgtctggca tag 1193
<210> 8
<211> 397
<212> PRT
<213> 粗糙脉孢菌(Neurospora crassa)
<400> 8
Met Ser Thr Ser Gln Glu Thr Gln Pro His Trp Ser Leu Lys Gln Ser
1 5 10 15
Phe Ala Glu Arg Val Glu Ser Ser Thr His Pro Leu Thr Ser Tyr Leu
20 25 30
Phe Arg Leu Met Glu Val Lys Gln Ser Asn Leu Cys Leu Ser Ala Asp
35 40 45
Val Glu His Ala Arg Asp Leu Leu Ala Leu Ala Asp Lys Val Gly Pro
50 55 60
Ser Ile Val Val Leu Lys Thr His Tyr Asp Leu Ile Thr Gly Trp Asp
65 70 75 80
Tyr His Pro His Thr Gly Thr Gly Ala Lys Leu Ala Ala Leu Ala Arg
85 90 95
Lys His Gly Phe Leu Ile Phe Glu Asp Arg Lys Phe Val Asp Ile Gly
100 105 110
Ser Thr Val Gln Lys Gln Tyr Thr Ala Gly Thr Ala Arg Ile Val Glu
115 120 125
Trp Ala His Ile Thr Asn Ala Asp Ile His Ala Gly Glu Ala Met Val
130 135 140
Ser Ala Met Ala Gln Ala Ala Gln Lys Trp Arg Glu Arg Ile Pro Tyr
145 150 155 160
Glu Val Lys Thr Ser Val Ser Val Gly Thr Pro Val Ala Asp Gln Phe
165 170 175
Ala Asp Glu Glu Ala Glu Asp Gln Val Glu Glu Leu Arg Lys Val Val
180 185 190
Thr Arg Glu Thr Ser Thr Thr Thr Lys Asp Thr Asp Gly Arg Lys Ser
195 200 205
Ser Ile Val Ser Ile Thr Thr Val Thr Gln Thr Tyr Glu Pro Ala Asp
210 215 220
Ser Pro Arg Leu Val Lys Thr Ile Ser Glu Asp Asp Glu Met Val Phe
225 230 235 240
Pro Gly Ile Glu Glu Ala Pro Leu Asp Arg Gly Leu Leu Ile Leu Ala
245 250 255
Gln Met Ser Ser Lys Gly Cys Leu Met Asp Gly Lys Tyr Thr Trp Glu
260 265 270
Cys Val Lys Ala Ala Arg Lys Asn Lys Gly Phe Val Met Gly Tyr Val
275 280 285
Ala Gln Gln Asn Leu Asn Gly Ile Thr Lys Glu Ala Leu Ala Pro Ser
290 295 300
Tyr Glu Asp Gly Glu Ser Thr Thr Glu Glu Glu Ala Gln Ala Asp Asn
305 310 315 320
Phe Ile His Met Thr Pro Gly Cys Lys Leu Pro Pro Pro Gly Glu Glu
325 330 335
Ala Pro Gln Gly Asp Gly Leu Gly Gln Gln Tyr Asn Thr Pro Asp Asn
340 345 350
Leu Val Asn Ile Lys Gly Thr Asp Ile Ala Ile Val Gly Arg Gly Ile
355 360 365
Ile Thr Ala Ala Asp Pro Pro Ala Glu Ala Glu Arg Tyr Arg Arg Lys
370 375 380
Ala Trp Lys Ala Tyr Gln Asp Arg Arg Glu Arg Leu Ala
385 390 395
<210> 9
<211> 20
<212> DNA
<213> 粗糙脉孢菌(Neurospora crassa)
<400> 9
gtcaggaaac gcagccacac 20
<210> 10
<211> 20
<212> DNA
<213> 粗糙脉孢菌(Neurospora crassa)
<400> 10
aggcagccct tggacgacat 20
<210> 11
<211> 1026
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 11
atgaaaaagc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga aaagttcgac 60
agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt cagcttcgat 120
gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt ctacaaagat 180
cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt gcttgacatt 240
ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg tgtcacgttg 300
caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga ggccatggat 360
gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg accgcaagga 420
atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc ccatgtgtat 480
cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc tctcgatgag 540
ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc ggatttcggc 600
tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg gagcgaggcg 660
atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc gtggttggct 720
tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc aggatcgccg 780
cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag cttggttgac 840
ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt ccgatccgga 900
gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg gaccgatggc 960
tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc gagggcaaag 1020
gaatag 1026
<210> 12
<211> 343
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 12
Met Lys Lys Pro Glu Leu Thr Ala Thr Ser Val Glu Lys Phe Leu Ile
1 5 10 15
Glu Lys Phe Asp Ser Val Ser Asp Leu Met Gln Leu Ser Glu Gly Glu
20 25 30
Glu Ser Arg Ala Phe Ser Phe Asp Val Gly Gly Arg Gly Tyr Val Leu
35 40 45
Arg Val Asn Ser Cys Ala Asp Gly Phe Tyr Lys Asp Arg Tyr Val Tyr
50 55 60
Arg His Phe Ala Ser Ala Ala Leu Pro Ile Pro Glu Val Leu Asp Ile
65 70 75 80
Gly Glu Phe Ser Glu Ser Leu Thr Tyr Cys Ile Ser Arg Arg Ala Gln
85 90 95
Gly Val Thr Leu Gln Asp Leu Pro Glu Thr Glu Leu Pro Ala Val Leu
100 105 110
Gln Pro Val Ala Glu Ala Met Asp Ala Ile Ala Ala Ala Asp Leu Ser
115 120 125
Gln Thr Ser Gly Phe Gly Pro Phe Gly Pro Gln Gly Ile Gly Gln Tyr
130 135 140
Thr Thr Trp Arg Asp Phe Ile Cys Ala Ile Ala Asp Pro His Val Tyr
145 150 155 160
His Trp Gln Thr Val Met Asp Asp Thr Val Ser Ala Ser Val Ala Gln
165 170 175
Ala Leu Asp Glu Leu Met Leu Trp Ala Glu Asp Cys Pro Glu Val Arg
180 185 190
His Leu Val His Ala Asp Phe Gly Ser Asn Asn Val Leu Thr Asp Asn
195 200 205
Gly Arg Ile Thr Ala Val Ile Asp Trp Ser Glu Ala Met Phe Gly Asp
210 215 220
Ser Gln Tyr Glu Val Ala Asn Ile Phe Phe Trp Arg Pro Trp Leu Ala
225 230 235 240
Cys Met Glu Gln Gln Thr Arg Tyr Phe Glu Arg Arg His Pro Glu Leu
245 250 255
Ala Gly Ser Pro Arg Leu Arg Ala Tyr Met Leu Arg Ile Gly Leu Asp
260 265 270
Gln Leu Tyr Gln Ser Leu Val Asp Gly Asn Phe Asp Asp Ala Ala Trp
275 280 285
Ala Gln Gly Arg Cys Asp Ala Ile Val Arg Ser Gly Ala Gly Thr Val
290 295 300
Gly Arg Thr Gln Ile Ala Arg Arg Ser Ala Ala Val Trp Thr Asp Gly
305 310 315 320
Cys Val Glu Val Leu Ala Asp Ser Gly Asn Arg Arg Pro Ser Thr Arg
325 330 335
Pro Arg Ala Arg Asn Ser Lys
340
<210> 13
<211> 24
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 13
gggttcgaat tcatttaaac ggct 24
<210> 14
<211> 24
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 14
gggagcgctc aatattcatc tctc 24
<210> 15
<211> 31
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 15
gggtacccca agggcgtatt ctgcagatgg g 31
<210> 16
<211> 31
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 16
cccatctgca gaatacgccc ttggggtacc c 31
<210> 17
<211> 27
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 17
ggggtacctt catttaaacg gcttcac 27
<210> 18
<211> 25
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 18
ggggtacccg accagcagac ggccc 25
<210> 19
<211> 27
<212> DNA
<213> 米曲霉(Aspergillus oryzae)
<400> 19
ggggtacctc tctggtactc ttcgatc 27
<210> 20
<211> 26
<212> DNA
<213> 米曲霉(Aspergillus oryzae)
<400> 20
tcccccgggc gaccagcaga cggccc 26
<210> 21
<211> 27
<212> DNA
<213> 米曲霉(Aspergillus oryzae)
<400> 21
ggggtacctc tctggtactc ttcgatc 27
<210> 22
<211> 26
<212> DNA
<213> 米曲霉(Aspergillus oryzae)
<400> 22
tcccccgggc gaccagcaga cggccc 26
<210> 23
<211> 31
<212> DNA
<213> 米曲霉(Aspergillus oryzae)
<400> 23
gggtacccca agggcgtatt ctgcagatgg g 31
<210> 24
<211> 31
<212> DNA
<213> 米曲霉(Aspergillus oryzae)
<400> 24
cccatctgca gaatacgccc ttggggtacc c 31
<210> 25
<211> 1203
<212> DNA
<213> 镶片镰孢(Fusarium venenatum)
<400> 25
atggagaact ttcccactga gtattttctc aacacttctg tgcgccttct cgagtacatt 60
cgataccgag atagcaatta tacccgggaa gagcgtatcg agaatttgca ctatgcttac 120
aacaaggctg ctcatcactt tgctcagcca cgacaacagc agctgctcaa ggtagaccct 180
aagcgactac aggcttccct ccaaactatt gttggcatgg tggtatacag ttgggcaaag 240
gtctccaaag agtgtatggc ggatctatct attcattaca cgtacacact cgttttggat 300
gacagcagcg atgatccgta tccagccatg atgaactatt tcaacgatct tcaggctgga 360
cgagaacagg cccacccatg gtgggcgctt gttaatgagc actttcccaa tgtccttcga 420
cattttggtc ccttctgctc attgaacctt atccgcagca ctcttgactg taagtaccct 480
ggctctatta tttcaccgcc ttaataagct aacagtgatg gaattatagt ttttgaggga 540
tgctggatcg agcagtacaa ctttggagga tttccaggat ctcatgacta tcctcagttt 600
cttcgacgca tgaatggctt gggtcactgt gtcggggctt ctttgtggcc caaagagcag 660
tttgatgaga gaggtctatt ccttgaaatc acatcagcca ttgctcagat ggagaactgg 720
atggtctggg tcaatgatct catgtctttc tacaaggagt tcgatgatga gcgtgaccag 780
atcagtctcg tcaagaacta cgtcgtctct gatgagatca ctctccacga agctttagag 840
aagctcaccc aggacactct acactcgtcc aagcagatgg tagctgtctt ctctgacaag 900
gaccctcagg tgatggacac gattgagtgc ttcatgcacg gctatgtcac gtggcacttg 960
tgcgatcaca ggtaccgtct gaatgagatc tacgaaaagg tcaaaggaca aaagaccgag 1020
gacgctcaga agttctgcaa gttctatgag caggctgcta acgtcggagc cgtttcgccc 1080
tcggagtggg cttatccacc tattgcgcaa ctggcaaaca ttcggtccaa ggatgtgaag 1140
gatgtgaagg atgtgaagga gattcagaag cctctgctga gctcaattga gctagtggaa 1200
tga 1203
<210> 26
<211> 380
<212> PRT
<213> 镶片镰孢(Fusarium venenatum)
<400> 26
Met Glu Asn Phe Pro Thr Glu Tyr Phe Leu Asn Thr Ser Val Arg Leu
1 5 10 15
Leu Glu Tyr Ile Arg Tyr Arg Asp Ser Asn Tyr Thr Arg Glu Glu Arg
20 25 30
Ile Glu Asn Leu His Tyr Ala Tyr Asn Lys Ala Ala His His Phe Ala
35 40 45
Gln Pro Arg Gln Gln Gln Leu Leu Lys Val Asp Pro Lys Arg Leu Gln
50 55 60
Ala Ser Leu Gln Thr Ile Val Gly Met Val Val Tyr Ser Trp Ala Lys
65 70 75 80
Val Ser Lys Glu Cys Met Ala Asp Leu Ser Ile His Tyr Thr Tyr Thr
85 90 95
Leu Val Leu Asp Asp Ser Ser Asp Asp Pro Tyr Pro Ala Met Met Asn
100 105 110
Tyr Phe Asn Asp Leu Gln Ala Gly Arg Glu Gln Ala His Pro Trp Trp
115 120 125
Ala Leu Val Asn Glu His Phe Pro Asn Val Leu Arg His Phe Gly Pro
130 135 140
Phe Cys Ser Leu Asn Leu Ile Arg Ser Thr Leu Asp Phe Phe Glu Gly
145 150 155 160
Cys Trp Ile Glu Gln Tyr Asn Phe Gly Gly Phe Pro Gly Ser His Asp
165 170 175
Tyr Pro Gln Phe Leu Arg Arg Met Asn Gly Leu Gly His Cys Val Gly
180 185 190
Ala Ser Leu Trp Pro Lys Glu Gln Phe Asp Glu Arg Gly Leu Phe Leu
195 200 205
Glu Ile Thr Ser Ala Ile Ala Gln Met Glu Asn Trp Met Val Trp Val
210 215 220
Asn Asp Leu Met Ser Phe Tyr Lys Glu Phe Asp Asp Glu Arg Asp Gln
225 230 235 240
Ile Ser Leu Val Lys Asn Tyr Val Val Ser Asp Glu Ile Thr Leu His
245 250 255
Glu Ala Leu Glu Lys Leu Thr Gln Asp Thr Leu His Ser Ser Lys Gln
260 265 270
Met Val Ala Val Phe Ser Asp Lys Asp Pro Gln Val Met Asp Thr Ile
275 280 285
Glu Cys Phe Met His Gly Tyr Val Thr Trp His Leu Cys Asp His Arg
290 295 300
Tyr Arg Leu Asn Glu Ile Tyr Glu Lys Val Lys Gly Gln Lys Thr Glu
305 310 315 320
Asp Ala Gln Lys Phe Cys Lys Phe Tyr Glu Gln Ala Ala Asn Val Gly
325 330 335
Ala Val Ser Pro Ser Glu Trp Ala Tyr Pro Pro Ile Ala Gln Leu Ala
340 345 350
Asn Ile Arg Ser Lys Asp Val Lys Asp Val Lys Asp Val Lys Glu Ile
355 360 365
Gln Lys Pro Leu Leu Ser Ser Ile Glu Leu Val Glu
370 375 380
<210> 27
<211> 23
<212> DNA
<213> 镶片镰孢(Fusarium venenatum)
<400> 27
gggagatctt cgttatctgt gcc 23
<210> 28
<211> 29
<212> DNA
<213> 镶片镰孢(Fusarium venenatum)
<400> 28
gggagatctt agtagtcggc atttgaaac 29
<210> 29
<211> 43
<212> DNA
<213> 镶片镰孢(Fusarium venenatum)
<400> 29
caagtaacag acgcgacagc ttgcaaaatc ttcgttatct gtg 43
<210> 30
<211> 43
<212> DNA
<213> 镶片镰孢(Fusarium venenatum)
<400> 30
cacagataac gaagattttg caagctgtcg cgtctgttac ttg 43
<210> 31
<211> 1131
<212> DNA
<213> 单纯疱疹病毒(Herpes simplex virus)
<400> 31
atggcttcgt accccggcca tcaacacgcg tctgcgttcg accaggctgc gcgttctcgc 60
ggccatagca accgacgtac ggcgttgcgc cctcgccggc agcaagaagc cacggaagtc 120
cgcccggagc agaaaatgcc cacgctactg cgggtttata tagacggtcc ccacgggatg 180
gggaaaacca ccaccacgca actgctggtg gccctgggtt cgcgcgacga tatcgtctac 240
gtacccgagc cgatgactta ctggcgggtg ctgggggctt ccgagacaat cgcgaacatc 300
tacaccacac aacaccgcct cgaccagggt gagatatcgg ccggggacgc ggcggtggta 360
atgacaagcg cccagataac aatgggcatg ccttatgccg tgaccgacgc cgttctggct 420
cctcatatcg ggggggaggc tgggagctca catgccccgc ccccggccct caccctcatc 480
ttcgaccgcc atcccatcgc cgccctcctg tgctacccgg ccgcgcggta ccttatgggc 540
agcatgaccc cccaggccgt gctggcgttc gtggccctca tcccgccgac cttgcccggc 600
accaacatcg tgcttggggc ccttccggag gacagacaca tcgaccgcct ggccaaacgc 660
cagcgccccg gcgagcggct ggacctggct atgctggctg cgattcgccg cgtttacggg 720
ctacttgcca atacggtgcg gtatctgcag tgcggcgggt cgtggcggga ggactgggga 780
cagctttcgg ggacggccgt gccgccccag ggtgccgagc cccagagcaa cgcgggccca 840
cgaccccata tcggggacac gttatttacc ctgtttcggg gccccgagtt gctggccccc 900
aacggcgacc tgtataacgt gtttgcctgg gccttggacg tcttggccaa acgcctccgt 960
tccatgcacg tctttatcct ggattacgac caatcgcccg ccggctgccg ggacgccctg 1020
ctgcaactta cctccgggat ggtccagacc cacgtcacca cccccggctc cataccgacg 1080
atatgcgacc tggcgcgcac gtttgcccgg gagatggggg aggctaactg a 1131
<210> 32
<211> 376
<212> PRT
<213> 单纯疱疹病毒(Herpes simplex virus)
<400> 32
Met Ala Ser Tyr Pro Gly His Gln His Ala Ser Ala Phe Asp Gln Ala
1 5 10 15
Ala Arg Ser Arg Gly His Ser Asn Arg Arg Thr Ala Leu Arg Pro Arg
20 25 30
Arg Gln Gln Glu Ala Thr Glu Val Arg Pro Glu Gln Lys Met Pro Thr
35 40 45
Leu Leu Arg Val Tyr Ile Asp Gly Pro His Gly Met Gly Lys Thr Thr
50 55 60
Thr Thr Gln Leu Leu Val Ala Leu Gly Ser Arg Asp Asp Ile Val Tyr
65 70 75 80
Val Pro Glu Pro Met Thr Tyr Trp Arg Val Leu Gly Ala Ser Glu Thr
85 90 95
Ile Ala Asn Ile Tyr Thr Thr Gln His Arg Leu Asp Gln Gly Glu Ile
100 105 110
Ser Ala Gly Asp Ala Ala Val Val Met Thr Ser Ala Gln Ile Thr Met
115 120 125
Gly Met Pro Tyr Ala Val Thr Asp Ala Val Leu Ala Pro His Ile Gly
130 135 140
Gly Glu Ala Gly Ser Ser His Ala Pro Pro Pro Ala Leu Thr Leu Ile
145 150 155 160
Phe Asp Arg His Pro Ile Ala Ala Leu Leu Cys Tyr Pro Ala Ala Arg
165 170 175
Tyr Leu Met Gly Ser Met Thr Pro Gln Ala Val Leu Ala Phe Val Ala
180 185 190
Leu Ile Pro Pro Thr Leu Pro Gly Thr Asn Ile Val Leu Gly Ala Leu
195 200 205
Pro Glu Asp Arg His Ile Asp Arg Leu Ala Lys Arg Gln Arg Pro Gly
210 215 220
Glu Arg Leu Asp Leu Ala Met Leu Ala Ala Ile Arg Arg Val Tyr Gly
225 230 235 240
Leu Leu Ala Asn Thr Val Arg Tyr Leu Gln Cys Gly Gly Ser Trp Arg
245 250 255
Glu Asp Trp Gly Gln Leu Ser Gly Thr Ala Val Pro Pro Gln Gly Ala
260 265 270
Glu Pro Gln Ser Asn Ala Gly Pro Arg Pro His Ile Gly Asp Thr Leu
275 280 285
Phe Thr Leu Phe Arg Gly Pro Glu Leu Leu Ala Pro Asn Gly Asp Leu
290 295 300
Tyr Asn Val Phe Ala Trp Ala Leu Asp Val Leu Ala Lys Arg Leu Arg
305 310 315 320
Ser Met His Val Phe Ile Leu Asp Tyr Asp Gln Ser Pro Ala Gly Cys
325 330 335
Arg Asp Ala Leu Leu Gln Leu Thr Ser Gly Met Val Gln Thr His Val
340 345 350
Thr Thr Pro Gly Ser Ile Pro Thr Ile Cys Asp Leu Ala Arg Thr Phe
355 360 365
Ala Arg Glu Met Gly Glu Ala Asn
370 375
<210> 33
<211> 60
<212> DNA
<213> 构巢曲霉(Aspergillus nidulans)
<400> 33
gacgaattct ctagaagatc tctcgaggag ctcaagcttc tgtacagtga ccggtgactc 60
<210> 34
<211> 27
<212> DNA
<213> 构巢曲霉(Aspergillus nidulans)
<400> 34
gacgaattcc gatgaatgtg tgtcctg 27
<210> 35
<211> 40
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 35
ttgaactctc agatcccttc atttaaacgg cttcacgggc 40
<210> 36
<211> 40
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 36
cagataacga agatctacgc ccttggggta cccaatattc 40
<210> 37
<211> 40
<212> DNA
<213> 单纯疱疹病毒(Herpes simplex virus)
<400> 37
gccgactact agatcgaccg gtgactcttt ctggcatgcg 40
<210> 38
<211> 40
<212> DNA
<213> 单纯疱疹病毒(Herpes simplex virus)
<400> 38
cagataacga agatctgaga gttcaaggaa gaaacagtgc 40
<210> 39
<211> 27
<212> DNA
<213> 单纯疱疹病毒(Herpes simplex virus)
<400> 39
ccctgtttcg gggccccgag ttgctgg 27
<210> 40
<211> 27
<212> DNA
<213> 单纯疱疹病毒(Herpes simplex virus)
<400> 40
ccagcaactc ggggccccga aacaggg 27
<210> 41
<211> 43
<212> DNA
<213> 镶片镰孢(Fusarium venenatum)
<400> 41
gtttaaacgg cgcgcccgac aaaacaaggc tactgcaggc agg 43
<210> 42
<211> 32
<212> DNA
<213> 镶片镰孢(Fusarium venenatum)
<400> 42
ttgtcgcccg ggaatactcc aactaggcct tg 32
<210> 43
<211> 33
<212> DNA
<213> 镶片镰孢(Fusarium venenatum)
<400> 43
agtattcccg ggcgacaaaa caaggctact gca 33
<210> 44
<211> 36
<212> DNA
<213> 镶片镰孢(Fusarium venenatum)
<400> 44
atttaaatcc tgcaggaata ctccaactag gccttg 36
<210> 45
<211> 35
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 45
aaaacccggg ccttcattta aacggcttca cgggc 35
<210> 46
<211> 40
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 46
aaaacccggg agatctacgc ccttggggta cccaatattc 40
<210> 47
<211> 39
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 47
aaaaaacctg cagggatgta agagggtttc ttgaggggt 39
<210> 48
<211> 42
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 48
aaaaaacctg cagggcggcc gctgatagta gacatgatac tg 42
<210> 49
<211> 42
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 49
aaaaaaggcg cgccgcggcc gcaatggata gctaataatc aa 42
<210> 50
<211> 37
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 50
aaaaaaggcg cgccactgtg ggagggctgt atggaca 37
<210> 51
<211> 25
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 51
gcggtcattt acagtgcctc gaata 25
<210> 52
<211> 25
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 52
ctgctctgtt agcaatcctc aagca 25
<210> 53
<211> 37
<212> DNA
<213> 棘孢曲霉(Aspergillus aculeatus)
<400> 53
tcttggatcc accatggtcg gactgctttc aatcacc 37
<210> 54
<211> 34
<212> DNA
<213> 棘孢曲霉(Aspergillus aculeatus)
<400> 54
ttaactcgag tcacagacac tgcgagtaat agtc 34
<210> 55
<211> 33
<212> DNA
<213> 棘孢曲霉(Aspergillus aculeatus)
<400> 55
cggactgcgc accatggtcg gactgctttc aat 33
<210> 56
<211> 35
<212> DNA
<213> 棘孢曲霉(Aspergillus aculeatus)
<400> 56
tcgccacgga gcttatcaca gacactgcga gtaat 35
<210> 57
<211> 27
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 57
acgaatggtc aaaggactat gtatcat 27
<210> 58
<211> 25
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 58
cacataccca gagtcaggcc ctgcg 25
<210> 59
<211> 25
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 59
atatctctct cgaggcctgc ttatt 25
<210> 60
<211> 25
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 60
ctacatcgaa gctgaaagca cgaga 25
<210> 61
<211> 29
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 61
agtcaggttc agcagatcgc cagggatgg 29
<210> 62
<211> 25
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 62
gtggttctcc aacgccgcca gcagc 25
<210> 63
<211> 44
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 63
aaaggcgcgc cgcggccgcg aagaagaaga agaacgtgaa agag 44
<210> 64
<211> 36
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 64
aaaggcgcgc ccggtcgagc cggccacggg gtcgga 36
<210> 65
<211> 39
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 65
aaacctgcag gtcaccaccg ctggctggta agcatcatc 39
<210> 66
<211> 43
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 66
aaacctgcag gcggccgcac aaagctagga gtcttgacgt gat 43
<210> 67
<211> 25
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 67
gctgtttggc cctcgaaact gccgg 25
<210> 68
<211> 25
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 68
ctacatcgaa gctgaaagca cgaga 25
<210> 69
<211> 25
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 69
caacccaaag atatcgccag atcca 25
<210> 70
<211> 25
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 70
acgataaact cccccacggc tgaag 25
<210> 71
<211> 45
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 71
aaaggcgcgc cgcggccgcc catggtgaga agccgggttc gggag 45
<210> 72
<211> 36
<212> DNA
<213> .里氏木霉(Trichoderma reesei)
<400> 72
aaaggcgcgc cagcccttga cagtgatctt gagtcc 36
<210> 73
<211> 36
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 73
aaacctgcag gacaacattg tgcatcggca aacgcc 36
<210> 74
<211> 43
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 74
aaacctgcag gcggccgcaa agtgccgggg gtgccccaag tcg 43
<210> 75
<211> 33
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 75
gccaggtgtc tggcatggct ggcaagctgc gac 33
<210> 76
<211> 25
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 76
ctacatcgaa gctgaaagca cgaga 25
<210> 77
<211> 20
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 77
catccactcg gagatgctga 20
<210> 78
<211> 20
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 78
cggaacttgg tcttttctgt 20
<210> 79
<211> 28
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 79
acttcggggg atggaagtac ataaactg 28
<210> 80
<211> 30
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 80
ctcgattcgc cattagatgt tttatacctg 30
<210> 81
<211> 45
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 81
aaaggcgcgc cgcggccgca aaacacacac aataaccaac cccca 45
<210> 82
<211> 40
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 82
aaaggcgcgc ctgcgatgga ggaaaagctg cgagggatga 40
<210> 83
<211> 36
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 83
aaacctgcag ggcgattccc tgtgttggca accaaa 36
<210> 84
<211> 43
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 84
aaacctgcag gcggccgcaa gaaatactca ggaaaggtgc cca 43
<210> 85
<211> 20
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 85
cttctctttc tggcattgac 20
<210> 86
<211> 20
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 86
ctcggaatcc tgcggttgcc 20
<210> 87
<211> 25
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 87
ggcgcctcaa tccagaaggt cgcac 25
<210> 88
<211> 26
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 88
gtgtatgtag tgaaacgaag cattcg 26
<210> 89
<211> 44
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 89
aaaggcgcgc cgcggccgct cgctgtaacg aacttctgtc cgca 44
<210> 90
<211> 39
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 90
aaaggcgcgc ccttgaatat cggagaaggt tgctcacgg 39
<210> 91
<211> 36
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 91
aaacctgcag ggcggcgatg gtggacttgt ttatga 36
<210> 92
<211> 43
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 92
aaacctgcag gcggccgcag caagtgagta tcgagtttgt agg 43
<210> 93
<211> 33
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 93
tcggggagga tggcgcaaac cgaccttcct aaa 33
<210> 94
<211> 25
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 94
gcaccttacc cctacggacc acgat 25
<210> 95
<211> 31
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 95
cttctatctt gggatgcttc acgatacgtg a 31
<210> 96
<211> 25
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 96
cgcgcccttg aatatcggag aaggt 25
<210> 97
<211> 47
<212> DNA
<213> 棘孢曲霉(Aspergillus aculeatus)
<400> 97
acacaactgg ggatccacca tggctgtggc ggctcttgct ctgctgg 47
<210> 98
<211> 45
<212> DNA
<213> 棘孢曲霉(Aspergillus aculeatus)
<400> 98
agatctcgag aagcttactc atcccccgcc accccctgca cctcc 45
<210> 99
<211> 1684
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 99
atgcggtccg ttgtcgccct ctccatggcg gccgttgccc aggccagcac attccagatt 60
ggcaccatcc acgagaagtc ggcccccgtg ctgagcaacg tcgaggccaa cgccatcccc 120
gatgcctaca tcatcaagtt caaggaccac gtgggtgagg atgatgcctc caagcaccac 180
gactggatcc agagcatcca cacaaacgtt gagcaggagc gccttgagct ccgcaagcga 240
agcaacgtct ttggcgccga cgacgtcttt gacggtctga agcacacttt caagattggc 300
gacggcttca agggctacgc cggtcacttc cacgagtctg tcattgagca ggtccggaac 360
caccctgacg taagttttgc acagccgccc tcccttttgg ctccccaaca aagctaaccc 420
ctcccaggtt gagtacatcg agcgcgacag cattgtgcac accatgcttc ccctcgagtc 480
caaggacagc atcatcgttg aggactcgtg caacggcgag acggagaagc aggctccctg 540
gggtcttgcc cgtatctctc accgagagac gctcaacttt ggctccttca acaagtacct 600
ctacaccgct gatggtggtg agggtgttga tgcctatgtc attgacaccg gcaccaacat 660
cgagcacgtc gactttgagg gtcgtgccaa gtggggcaag accatccctg ccggcgatga 720
ggacgaggac ggcaacggcc acggcactca ctgctctggt accgttgctg gtaagaagta 780
cggtgttgcc aagaaggccc acgtctacgc cgtcaaggtg ctccgatcca acggatccgg 840
caccatgtct gacgtcgtca agggcgtcga gtacgctgct ctctcccaca ttgagcaggt 900
gaagaaggcc aagaagggca agcggaaggg cttcaagggc tccgtcgcca acatgtccct 960
cggtggtggc aagacccagg ctcttgacgc tgccgtcaac gccgccgtcc gcgccggtgt 1020
ccactttgcc gttgctgccg gcaacgacaa cgctgatgct tgcaactact cccccgctgc 1080
cgccactgag cccctcaccg tcggtgcttc tgctctcgat gacagccgtg cttacttctc 1140
caactacggc aagtgcactg acatcttcgc ccctggtctg agcatccagt ccacctggat 1200
tggctccaag tatgccgtca acaccatctc tggtacctcc atggcctctc ctcacatctg 1260
cggtctcctg gcctactacc tgtctctcca gcccgctggt gactctgagt tcgctgttgc 1320
ccccatcacc cccaagaagc tcaaggagag cgtcatctct gtcgccacca agaacgccct 1380
ctctgacctg cccgactctg acacccccaa cctgctcgcc tggaacggcg gtggctgcag 1440
caacttctcc cagattgtcg aggccggcag ctacactgtc aagcccaagc agaacaagca 1500
ggccaagctc cccagcacca ttgaggagct cgaggaggcc atcgagggtg actttgaggt 1560
cgtctctggc gagatcgtca agggtgccaa gagctttggc tccaaggcgg agaagtttgc 1620
caagaagatc cacgatctcg tcgaggagga gattgaggag ttcatctctg agctctccga 1680
gtaa 1684
<210> 100
<211> 540
<212> PRT
<213> 里氏木霉(Trichoderma reesei)
<400> 100
Met Arg Ser Val Val Ala Leu Ser Met Ala Ala Val Ala Gln Ala Ser
1 5 10 15
Thr Phe Gln Ile Gly Thr Ile His Glu Lys Ser Ala Pro Val Leu Ser
20 25 30
Asn Val Glu Ala Asn Ala Ile Pro Asp Ala Tyr Ile Ile Lys Phe Lys
35 40 45
Asp His Val Gly Glu Asp Asp Ala Ser Lys His His Asp Trp Ile Gln
50 55 60
Ser Ile His Thr Asn Val Glu Gln Glu Arg Leu Glu Leu Arg Lys Arg
65 70 75 80
Ser Asn Val Phe Gly Ala Asp Asp Val Phe Asp Gly Leu Lys His Thr
85 90 95
Phe Lys Ile Gly Asp Gly Phe Lys Gly Tyr Ala Gly His Phe His Glu
100 105 110
Ser Val Ile Glu Gln Val Arg Asn His Pro Val Glu Tyr Ile Glu Arg
115 120 125
Asp Ser Ile Val His Thr Met Leu Pro Leu Glu Ser Lys Asp Ser Ile
130 135 140
Ile Val Glu Asp Ser Cys Asn Gly Glu Thr Glu Lys Gln Ala Pro Trp
145 150 155 160
Gly Leu Ala Arg Ile Ser His Arg Glu Thr Leu Asn Phe Gly Ser Phe
165 170 175
Asn Lys Tyr Leu Tyr Thr Ala Asp Gly Gly Glu Gly Val Asp Ala Tyr
180 185 190
Val Ile Asp Thr Gly Thr Asn Ile Glu His Val Asp Phe Glu Gly Arg
195 200 205
Ala Lys Trp Gly Lys Thr Ile Pro Ala Gly Asp Glu Asp Glu Asp Gly
210 215 220
Asn Gly His Gly Thr His Cys Ser Gly Thr Val Ala Gly Lys Lys Tyr
225 230 235 240
Gly Val Ala Lys Lys Ala His Val Tyr Ala Val Lys Val Leu Arg Ser
245 250 255
Asn Gly Ser Gly Thr Met Ser Asp Val Val Lys Gly Val Glu Tyr Ala
260 265 270
Ala Leu Ser His Ile Glu Gln Val Lys Lys Ala Lys Lys Gly Lys Arg
275 280 285
Lys Gly Phe Lys Gly Ser Val Ala Asn Met Ser Leu Gly Gly Gly Lys
290 295 300
Thr Gln Ala Leu Asp Ala Ala Val Asn Ala Ala Val Arg Ala Gly Val
305 310 315 320
His Phe Ala Val Ala Ala Gly Asn Asp Asn Ala Asp Ala Cys Asn Tyr
325 330 335
Ser Pro Ala Ala Ala Thr Glu Pro Leu Thr Val Gly Ala Ser Ala Leu
340 345 350
Asp Asp Ser Arg Ala Tyr Phe Ser Asn Tyr Gly Lys Cys Thr Asp Ile
355 360 365
Phe Ala Pro Gly Leu Ser Ile Gln Ser Thr Trp Ile Gly Ser Lys Tyr
370 375 380
Ala Val Asn Thr Ile Ser Gly Thr Ser Met Ala Ser Pro His Ile Cys
385 390 395 400
Gly Leu Leu Ala Tyr Tyr Leu Ser Leu Gln Pro Ala Gly Asp Ser Glu
405 410 415
Phe Ala Val Ala Pro Ile Thr Pro Lys Lys Leu Lys Glu Ser Val Ile
420 425 430
Ser Val Ala Thr Lys Asn Ala Leu Ser Asp Leu Pro Asp Ser Asp Thr
435 440 445
Pro Asn Leu Leu Ala Trp Asn Gly Gly Gly Cys Ser Asn Phe Ser Gln
450 455 460
Ile Val Glu Ala Gly Ser Tyr Thr Val Lys Pro Lys Gln Asn Lys Gln
465 470 475 480
Ala Lys Leu Pro Ser Thr Ile Glu Glu Leu Glu Glu Ala Ile Glu Gly
485 490 495
Asp Phe Glu Val Val Ser Gly Glu Ile Val Lys Gly Ala Lys Ser Phe
500 505 510
Gly Ser Lys Ala Glu Lys Phe Ala Lys Lys Ile His Asp Leu Val Glu
515 520 525
Glu Glu Ile Glu Glu Phe Ile Ser Glu Leu Ser Glu
530 535 540
<210> 101
<211> 47
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 101
tcacatggtt taaacggcgc gccggtacta tattagaaag gggttcc 47
<210> 102
<211> 47
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 102
agccttgttt tgtcgggcgc gccgaagaag agaagaggag gaggatg 47
<210> 103
<211> 47
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 103
cctagttgga gtattcctgc aggtctatct cttttgagta gtcccca 47
<210> 104
<211> 55
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 104
tggccatatt taaatcctgc agggtttaaa cagctagtga ctcgcgattt atcgt 55
<210> 105
<211> 25
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 105
tgatttcgtg gacagcgttt ctcgc 25
<210> 106
<211> 28
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 106
ttgccttaca gctggcaaca atggcgtc 28
<210> 107
<211> 1341
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 107
atgaagagcg cgttacttgc cgccgcggcg cttgtcggct ccgcccaagc cggcattcac 60
aagatgaagc tgcagaaggt ctccctggag cagcagctgg taagacgaca ccctcatcca 120
cggcctcgta ctctagccaa gcgcaatcac tgacacgccg cctctctcat ctaggagggt 180
tcgagcatcg aggcccacgt ccagcagctc ggccagaagt acatgggcgt ccgccctact 240
agccgtgccg aggtcatgtt caacgacaag ccgcccaagg tccagggcgg gcacccggtt 300
cccgtcacca acttcatgaa tgcccaatgt aagtcgtgat gcgcagcaca gcacgagagt 360
cccgctccca ggtagcgagc acatgcttac taacttgctc ggacagactt ctctgagatt 420
accatcggca ccccccctca gtcgttcaag gttgtcctcg acacgggaag ctctaacctc 480
tgggttccct ctcagtcgtg caacagcatc gcctgcttcc tgcactccac gtacgattcg 540
tcttcatcgt cgacgtacaa gcccaacggc tccgattttg agatccacta cggatcaggt 600
agcttgactg gcttcatctc caacgatgtc gtgacgattg gcgacctcaa gatcaagggg 660
caggactttg ccgaggcaac cagcgagccc ggccttgcct ttgctttcgg ccgcttcgac 720
ggcattcttg gccttggcta cgataccatc tcggtcaatg gcattgtccc ccccttttac 780
cagatggtca accagaagct gatcgacgag cccgtctttg ctttctacct gggaagcagc 840
gacgagggtt ccgaggctgt ctttggcggc gtcgacgatg ctcactacga gggcaagatt 900
gagtacattc ccctgcgccg caaggcctac tgggaggtgg accttgactc cattgccttc 960
ggtgacgagg tcgccgagct cgagaacact ggcgccatcc ttgacaccgg cacctctctc 1020
aacgtcctcc cctcgggcct cgccgagctc ctgaacgctg agattggcgc caagaagggc 1080
tttggcggtc agtacactgt tgactgctcc aagcgtgatt ccctccccga catcaccttc 1140
agcctggccg gctccaagta cagccttccc gccagcgact acatcattga gatgtctggc 1200
aactgcattt cgtccttcca gggcatggac ttccccgagc ccgtgggccc cctggtcatt 1260
ctgggtgatg ctttcttgcg ccgctactac tccgtctacg accttggcag ggacgccgtt 1320
ggtcttgcca aggccaaata a 1341
<210> 108
<211> 395
<212> PRT
<213> 里氏木霉(Trichoderma reesei)
<400> 108
Met Lys Ser Ala Leu Leu Ala Ala Ala Ala Leu Val Gly Ser Ala Gln
1 5 10 15
Ala Gly Ile His Lys Met Lys Leu Gln Lys Val Ser Leu Glu Gln Gln
20 25 30
Leu Glu Gly Ser Ser Ile Glu Ala His Val Gln Gln Leu Gly Gln Lys
35 40 45
Tyr Met Gly Val Arg Pro Thr Ser Arg Ala Glu Val Met Phe Asn Asp
50 55 60
Lys Pro Pro Lys Val Gln Gly Gly His Pro Val Pro Val Thr Asn Phe
65 70 75 80
Met Asn Ala Gln Tyr Phe Ser Glu Ile Thr Ile Gly Thr Pro Pro Gln
85 90 95
Ser Phe Lys Val Val Leu Asp Thr Gly Ser Ser Asn Leu Trp Val Pro
100 105 110
Ser Gln Ser Cys Asn Ser Ile Ala Cys Phe Leu His Ser Thr Tyr Asp
115 120 125
Ser Ser Ser Ser Ser Thr Tyr Lys Pro Asn Gly Ser Asp Phe Glu Ile
130 135 140
His Tyr Gly Ser Gly Ser Leu Thr Gly Phe Ile Ser Asn Asp Val Val
145 150 155 160
Thr Ile Gly Asp Leu Lys Ile Lys Gly Gln Asp Phe Ala Glu Ala Thr
165 170 175
Ser Glu Pro Gly Leu Ala Phe Ala Phe Gly Arg Phe Asp Gly Ile Leu
180 185 190
Gly Leu Gly Tyr Asp Thr Ile Ser Val Asn Gly Ile Val Pro Pro Phe
195 200 205
Tyr Gln Met Val Asn Gln Lys Leu Ile Asp Glu Pro Val Phe Ala Phe
210 215 220
Tyr Leu Gly Ser Ser Asp Glu Gly Ser Glu Ala Val Phe Gly Gly Val
225 230 235 240
Asp Asp Ala His Tyr Glu Gly Lys Ile Glu Tyr Ile Pro Leu Arg Arg
245 250 255
Lys Ala Tyr Trp Glu Val Asp Leu Asp Ser Ile Ala Phe Gly Asp Glu
260 265 270
Val Ala Glu Leu Glu Asn Thr Gly Ala Ile Leu Asp Thr Gly Thr Ser
275 280 285
Leu Asn Val Leu Pro Ser Gly Leu Ala Glu Leu Leu Asn Ala Glu Ile
290 295 300
Gly Ala Lys Lys Gly Phe Gly Gly Gln Tyr Thr Val Asp Cys Ser Lys
305 310 315 320
Arg Asp Ser Leu Pro Asp Ile Thr Phe Ser Leu Ala Gly Ser Lys Tyr
325 330 335
Ser Leu Pro Ala Ser Asp Tyr Ile Ile Glu Met Ser Gly Asn Cys Ile
340 345 350
Ser Ser Phe Gln Gly Met Asp Phe Pro Glu Pro Val Gly Pro Leu Val
355 360 365
Ile Leu Gly Asp Ala Phe Leu Arg Arg Tyr Tyr Ser Val Tyr Asp Leu
370 375 380
Gly Arg Asp Ala Val Gly Leu Ala Lys Ala Lys
385 390 395
<210> 109
<211> 48
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 109
tcacatggtt taaacggcgc gccttccggc ttctttttat gtatacct 48
<210> 110
<211> 47
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 110
agccttgttt tgtcgggcgc gccaagctag gaaccagcct ctttgta 47
<210> 111
<211> 47
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 111
ctagttggag tattcctgca ggagccgagc tcctgaacgc tgagatt 47
<210> 112
<211> 54
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 112
tggccatatt taaatcctgc aggtttaaac gagggaaaag ggccgctgca cgat 54
<210> 113
<211> 24
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 113
cgcggaggtg aggtgttgat gatg 24
<210> 114
<211> 24
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 114
cggcggtctt taaggtgatg tcgc 24
<210> 115
<211> 22
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 115
gtttcaggca ggtcttgcaa cg 22
<210> 116
<211> 24
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 116
gaagacagtc ctactgctgc ggag 24
<210> 117
<211> 24
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 117
gtagctctcc ccgtataatg cagg 24

Claims (12)

1.一种亲本里氏木霉(Trichoderma reesei)菌株的突变体,所述亲本里氏木霉菌株包含胰蛋白酶样丝氨酸蛋白酶基因,其中所述突变体包含编码多肽的多核苷酸,所述多肽对于所述亲本里氏木霉菌株是外源的,其中所述亲本里氏木霉菌株中胰蛋白酶样丝氨酸蛋白酶基因经修饰以获得所述突变体,其中所述突变体当在相同条件下培养时,相对于所述亲本里氏木霉菌株,在由所述蛋白酶基因编码的蛋白酶的产生方面有缺陷;
其中所述胰蛋白酶样丝氨酸蛋白酶选自下组:
(a)多肽,其由氨基酸序列组成,所述氨基酸序列与SEQ ID NO:6或其成熟多肽具有至少99%同一性;
(b)多肽,其由多核苷酸编码,所述多核苷酸由核苷酸序列组成,所述核苷酸序列与SEQID NO:5或其cDNA,或它们的成熟多肽编码序列具有至少99%序列同一性;和
其中胰蛋白酶样丝氨酸蛋白酶源自里氏木霉。
2.根据权利要求1所述的亲本里氏木霉菌株的突变体,
其中所述胰蛋白酶样丝氨酸蛋白酶选自下组:
(a)多肽,其由SEQ ID NO:6或其成熟多肽组成;
(b)多肽,其由多核苷酸编码,所述多核苷酸由核苷酸序列组成,所述核苷酸序列如SEQID NO:5或其cDNA,或它们的成熟多肽编码序列所示。
3.根据权利要求1所述的亲本里氏木霉菌株的突变体,当在相同条件下培养时,相对于亲本里氏木霉菌株,其产生少至少25%的由经修饰的所述蛋白酶基因编码的蛋白酶。
4.根据权利要求1所述的亲本里氏木霉菌株的突变体,当在相同条件下培养时,相对于亲本里氏木霉菌株,其在由经修饰的所述蛋白酶基因编码的蛋白酶方面是完全缺陷的。
5.一种产生多肽的方法,其包括:
在用于产生所述多肽的培养基中培养亲本里氏木霉菌株的突变体,其中所述亲本里氏木霉菌株包含,胰蛋白酶样丝氨酸蛋白酶基因,其中所述突变体包含编码多肽的多核苷酸,所述多肽对于所述亲本里氏木霉菌株是外源的,其中所述亲本里氏木霉菌株中胰蛋白酶样丝氨酸蛋白酶基因经修饰以获得所述突变体,其中所述突变体当在相同条件下培养时,相对于所述亲本里氏木霉菌株,在由所述蛋白酶基因编码的蛋白酶的产生方面有缺陷;和
从所述培养基回收所述多肽;
其中所述胰蛋白酶样丝氨酸蛋白酶选自下组:
(a)多肽,其由氨基酸序列组成,所述氨基酸序列与SEQ ID NO:6或其成熟多肽具有至少99%同一性;
(b)多肽,其由多核苷酸编码,所述多核苷酸由核苷酸序列组成,所述核苷酸序列与SEQID NO:5或其cDNA,或它们的成熟多肽编码序列具有至少99%序列同一性;
其中胰蛋白酶样丝氨酸蛋白酶源自里氏木霉。
6.根据权利要求5所述的产生多肽的方法,
其中所述胰蛋白酶样丝氨酸蛋白酶选自下组:
(a)多肽,其由SEQ ID NO:6或其成熟多肽组成;
(b)多肽,其由多核苷酸编码,所述多核苷酸由核苷酸序列组成,所述核苷酸序列如SEQID NO:5或其cDNA,或它们的成熟多肽编码序列所示。
7.根据权利要求5所述的产生多肽的方法,其中当在相同条件下培养时,相对于亲本里氏木霉菌株,所述突变体菌株产生少至少25%的由经修饰的所述蛋白酶基因编码的蛋白酶。
8.根据权利要求5所述的产生多肽的方法,其中当在相同条件下培养时,相对于亲本里氏木霉菌株,所述突变体菌株在由经修饰的所述蛋白酶基因编码的蛋白酶方面是完全缺陷的。
9.一种用于获得亲本里氏木霉菌株的突变体的方法,其包括:
修饰亲本里氏木霉菌株中的胰蛋白酶样丝氨酸蛋白酶基因以获得所述突变体,其中当在相同条件下培养时,相对于亲本里氏木霉菌株,所述突变体在由经修饰的所述蛋白酶基因编码的蛋白酶的产生方面有缺陷;
其中所述胰蛋白酶样丝氨酸蛋白酶选自下组:
(a)多肽,其由氨基酸序列组成,所述氨基酸序列与SEQ ID NO:6或其成熟多肽具有至少99%同一性;
(b)多肽,其由多核苷酸编码,所述多核苷酸由核苷酸序列组成,所述核苷酸序列与SEQID NO:5或其cDNA,或它们的成熟多肽编码序列具有至少99%序列同一性;
其中胰蛋白酶样丝氨酸蛋白酶源自里氏木霉。
10.根据权利要求9所述的用于获得亲本里氏木霉菌株的突变体的方法,
其中所述胰蛋白酶样丝氨酸蛋白酶选自下组:
(a)多肽,其由SEQ ID NO:6或其成熟多肽组成;
(b)多肽,其由多核苷酸编码,所述多核苷酸由核苷酸序列组成,所述核苷酸序列如SEQID NO:5或其cDNA,或它们的成熟多肽编码序列所示。
11.根据权利要求9所述的用于获得亲本里氏木霉菌株的突变体的方法,其中当在相同条件下培养时,相对于亲本里氏木霉菌株,所述突变体菌株产生少至少25%的由经修饰的所述蛋白酶基因编码的蛋白酶。
12.根据权利要求9所述的用于获得亲本里氏木霉菌株的突变体的方法,其中当在相同条件下培养时,相对于亲本里氏木霉菌株,所述突变体菌株在由经修饰的所述蛋白酶基因编码的蛋白酶方面是完全缺陷的。
CN201911359760.0A 2009-12-18 2010-12-17 用于在木霉属的蛋白酶缺陷突变体中产生多肽的方法 Active CN111500474B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911359760.0A CN111500474B (zh) 2009-12-18 2010-12-17 用于在木霉属的蛋白酶缺陷突变体中产生多肽的方法

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US28784409P 2009-12-18 2009-12-18
US61/287,844 2009-12-18
CN201911359760.0A CN111500474B (zh) 2009-12-18 2010-12-17 用于在木霉属的蛋白酶缺陷突变体中产生多肽的方法
CN201080063993.7A CN102762714B (zh) 2009-12-18 2010-12-17 用于在木霉属的蛋白酶缺陷突变体中产生多肽的方法
PCT/US2010/061105 WO2011075677A2 (en) 2009-12-18 2010-12-17 Methods for producing polypeptides in protease-deficient mutants of trichoderma

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201080063993.7A Division CN102762714B (zh) 2009-12-18 2010-12-17 用于在木霉属的蛋白酶缺陷突变体中产生多肽的方法

Publications (2)

Publication Number Publication Date
CN111500474A CN111500474A (zh) 2020-08-07
CN111500474B true CN111500474B (zh) 2023-10-03

Family

ID=43735416

Family Applications (3)

Application Number Title Priority Date Filing Date
CN201080063993.7A Active CN102762714B (zh) 2009-12-18 2010-12-17 用于在木霉属的蛋白酶缺陷突变体中产生多肽的方法
CN201911359760.0A Active CN111500474B (zh) 2009-12-18 2010-12-17 用于在木霉属的蛋白酶缺陷突变体中产生多肽的方法
CN201510645406.XA Active CN105368717B (zh) 2009-12-18 2010-12-17 用于在木霉属的蛋白酶缺陷突变体中产生多肽的方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201080063993.7A Active CN102762714B (zh) 2009-12-18 2010-12-17 用于在木霉属的蛋白酶缺陷突变体中产生多肽的方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201510645406.XA Active CN105368717B (zh) 2009-12-18 2010-12-17 用于在木霉属的蛋白酶缺陷突变体中产生多肽的方法

Country Status (9)

Country Link
US (7) US8986974B2 (zh)
EP (2) EP3000871A1 (zh)
CN (3) CN102762714B (zh)
AU (6) AU2010330835B2 (zh)
BR (4) BR122019011255B1 (zh)
CA (1) CA2784599C (zh)
DK (1) DK2513290T3 (zh)
MX (2) MX350399B (zh)
WO (1) WO2011075677A2 (zh)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102762714B (zh) 2009-12-18 2015-11-25 诺维信股份有限公司 用于在木霉属的蛋白酶缺陷突变体中产生多肽的方法
WO2012057781A1 (en) * 2010-10-29 2012-05-03 The Procter & Gamble Company Cleaning and/or treatment compositions comprising a fungal serine protease
EP2527448A1 (en) 2011-05-23 2012-11-28 Novozymes A/S Simultaneous site-specific integrations of multiple gene-copies in filamentous fungi
CN108179139A (zh) 2011-08-24 2018-06-19 诺维信股份有限公司 纤维素分解酶组合物及其用途
WO2013028912A2 (en) 2011-08-24 2013-02-28 Novozymes, Inc. Methods for producing multiple recombinant polypeptides in a filamentous fungal host cell
EP2748314B1 (en) 2011-08-24 2016-12-28 Novozymes, Inc. Aspergillus fumigatus cellulolytic enzyme compositions and uses thereof
WO2013028915A2 (en) 2011-08-24 2013-02-28 Novozymes, Inc. Methods for obtaining positive transformants of a filamentous fungal host cell
WO2013048661A1 (en) * 2011-09-30 2013-04-04 Codexis, Inc. Fungal proteases
AU2013207165B2 (en) 2012-01-05 2018-10-04 Glykos Finland Oy Protease deficient filamentous fungal cells and methods of use thereof
WO2013174927A1 (en) * 2012-05-23 2013-11-28 Novartis International Pharmaceutical Limited Production of fucosylated glycoproteins
EP2945742A4 (en) 2013-01-18 2016-09-21 Biomeme Inc ANALYTICAL DEVICE
KR102111078B1 (ko) 2013-07-04 2020-05-18 노파르티스 아게 O-만노실트랜스퍼라제 결핍 사상균 세포 및 이의 이용 방법
CN105980552A (zh) * 2013-07-10 2016-09-28 诺华股份有限公司 多种蛋白酶缺陷的丝状真菌细胞及其使用方法
WO2015025055A1 (en) * 2013-08-23 2015-02-26 Novozymes A/S Regulated pepc expression
EP3074513A1 (en) 2013-11-26 2016-10-05 Novozymes A/S Enzyme compositions and uses thereof
EP3152315B1 (en) * 2014-06-06 2018-08-15 Novozymes A/S Enzyme compositions and uses thereof
SG11201700446XA (en) 2014-07-21 2017-02-27 Glykos Finland Oy Production of glycoproteins with mammalian-like n-glycans in filamentous fungi
EP3268482B1 (en) 2015-03-09 2019-12-11 Novozymes A/S Methods of introducing multiple expression constructs into a eukaryotic cell
TW201703638A (zh) * 2015-07-06 2017-02-01 Godo Shusei Co Ltd 乳製品
WO2018093752A1 (en) * 2016-11-15 2018-05-24 Danisco Us Inc. Filamentous fungi with improved protein production
AU2019277550A1 (en) * 2018-05-31 2020-12-24 Toray Industries, Inc. Trichoderma filamentous fungus mutant strain and method for producing protein
WO2020081789A1 (en) * 2018-10-17 2020-04-23 Perfect Day, Inc. Recombinant components and compositions for use in food products
WO2020112911A1 (en) 2018-11-28 2020-06-04 Novozymes A/S Improved filamentous fungal host cells
US20220064228A1 (en) 2018-12-12 2022-03-03 Novozymes A/S Methods For Increasing The Productivity Of A Filamentous Fungal Cell In The Production Of A Polypeptide
WO2020191193A1 (en) 2019-03-21 2020-09-24 Biomeme, Inc. Multi-function analytic devices
CN114585726A (zh) * 2019-07-16 2022-06-03 能源与材料国家研究中心 被修饰以用于生产复合酶的木霉属真菌菌株
CA3155372A1 (en) 2019-10-28 2021-05-06 Sharief Barends Microbial host cells for the production of heterologous cyanuric acid hydrolases and biuret hydrolases
US20230242960A1 (en) 2020-01-24 2023-08-03 Novozymes A/S Mutants of a filamentous fungal cell having increased productivity in the production of a polypeptide
JP2023545631A (ja) 2020-09-18 2023-10-31 バイオミーム,インコーポレイテッド 試料を分析するための運搬可能デバイスおよび方法
WO2022078910A1 (en) 2020-10-13 2022-04-21 Novozymes A/S Glycosyltransferase variants for improved protein production
EP4237430A1 (en) 2020-11-02 2023-09-06 Novozymes A/S Leader peptides and polynucleotides encoding the same
CN114585734B (zh) * 2021-01-25 2022-11-04 Cj第一制糖株式会社 新型水解酶变体及使用其生产l-色氨酸的方法
WO2022251056A1 (en) 2021-05-27 2022-12-01 Novozymes A/S Transcriptional regulators and polynucleotides encoding the same
WO2023148301A1 (en) 2022-02-02 2023-08-10 Biotalys NV Modified microbial cells and uses thereof

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5585253A (en) * 1989-11-27 1996-12-17 The Regents Of The University Of California Extracellular serine protease and a Bacillus subtilis alkaline neutral an serine protease mutant strain
CN1301307A (zh) * 1998-05-15 2001-06-27 诺沃诺尔迪斯克生物技术有限公司 在丝状真菌突变细胞中生产多肽的方法
CN1798848A (zh) * 2003-03-31 2006-07-05 诺维信股份有限公司 在缺乏酶的黑曲霉突变体中生产生物物质的方法
WO2007042289A2 (en) * 2005-10-11 2007-04-19 Ablynx N.V. Nanobodies™ and polypeptides against egfr and igf-ir
CN101160396A (zh) * 2004-10-21 2008-04-09 诺维信股份有限公司 具有脂肪酶活性的多肽以及编码该多肽的多核苷酸
CN101292024A (zh) * 2005-10-17 2008-10-22 诺维信公司 用于表达抗体的真菌突变体的用途
CN104884631A (zh) * 2012-12-21 2015-09-02 诺维信股份有限公司 用于在木霉属的突变体中产生异源多肽的方法

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1333777C (en) * 1988-07-01 1995-01-03 Randy M. Berka Aspartic proteinase deficient filamentous fungi
ATE252156T1 (de) * 1992-04-15 2003-11-15 Novartis Pharma Gmbh Neue schimmel-protease
DK81293D0 (da) 1993-07-06 1993-07-06 Novo Nordisk As Enzym
WO1995033836A1 (en) 1994-06-03 1995-12-14 Novo Nordisk Biotech, Inc. Phosphonyldipeptides useful in the treatment of cardiovascular diseases
EP1559776A3 (en) 1994-06-30 2006-01-11 Novozymes Biotech, Inc. Non-toxic, non-toxigenic, non-pathogenic Fusarium expression system and promoters and terminators for use therein
JP2000501620A (ja) 1995-12-15 2000-02-15 ノボ ノルディスク アクティーゼルスカブ areA,pepC及び/又はpepE遺伝子が不活性化されている菌類
AU1750697A (en) 1996-01-19 1997-08-11 Novo Nordisk Biotech, Inc. Morphological mutants of filamentous fungi
JP4091119B2 (ja) 1996-09-19 2008-05-28 ノボザイムス アクティーゼルスカブ 新規な宿主細胞およびタンパク質生産方法
ATE395424T1 (de) 1998-05-20 2008-05-15 Novozymes Inc Verfahren zur herstellung von heterologen polypeptiden in trichothecene mangelmutanten filamentlösen pilzen
US6806062B1 (en) 1998-10-05 2004-10-19 Novozymes A/S Fungal transcriptional activator useful in methods for producing polypeptides
EP1124949B1 (en) 1998-10-26 2006-07-12 Novozymes A/S Constructing and screening a dna library of interest in filamentous fungal cells
JP4620253B2 (ja) 1999-03-22 2011-01-26 ノボザイムス,インコーポレイティド 菌類細胞中で遺伝子を発現させるためのプロモーター
AU2002223504A1 (en) 2000-11-17 2002-05-27 Novozymes A/S Heterologous expression of taxanes
ES2393058T3 (es) 2003-05-02 2012-12-18 Novozymes Inc. Variantes de beta-glucosidasa
DE602004022967D1 (de) 2003-10-30 2009-10-15 Novozymes As Kohlenhydratbindende module
WO2005052146A2 (en) 2003-11-19 2005-06-09 Genencor International, Inc. Serine proteases, nucleic acids encoding serine enzymes and vectors and host cells incorporating same
US8716023B2 (en) 2003-12-09 2014-05-06 Novozymes, Inc. Methods for eliminating or reducing the expression of a genes in a filamentous fungal strains
ES2469874T3 (es) 2004-01-30 2014-06-20 Novozymes Inc Polip�ptidos con actividad de mejora celulol�tica y polinucle�tidos que los codifican
ATE530643T1 (de) 2004-12-30 2011-11-15 Genencor Int Säureaktive fungale protease
CA2644273A1 (en) * 2006-04-05 2008-03-27 Metanomics Gmbh Process for the production of a fine chemical
EP2082047A2 (en) * 2006-08-29 2009-07-29 Danisco US, INC., Genencor Division Compositions and methods for improved protein production
EP2097525B1 (en) 2006-12-21 2013-06-19 Novozymes Inc. Methods of reducing or eliminating expression of genes in filamentous fungal strains by transitive rna interference
CN102762714B (zh) 2009-12-18 2015-11-25 诺维信股份有限公司 用于在木霉属的蛋白酶缺陷突变体中产生多肽的方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5585253A (en) * 1989-11-27 1996-12-17 The Regents Of The University Of California Extracellular serine protease and a Bacillus subtilis alkaline neutral an serine protease mutant strain
CN1301307A (zh) * 1998-05-15 2001-06-27 诺沃诺尔迪斯克生物技术有限公司 在丝状真菌突变细胞中生产多肽的方法
CN1798848A (zh) * 2003-03-31 2006-07-05 诺维信股份有限公司 在缺乏酶的黑曲霉突变体中生产生物物质的方法
CN101160396A (zh) * 2004-10-21 2008-04-09 诺维信股份有限公司 具有脂肪酶活性的多肽以及编码该多肽的多核苷酸
WO2007042289A2 (en) * 2005-10-11 2007-04-19 Ablynx N.V. Nanobodies™ and polypeptides against egfr and igf-ir
CN101292024A (zh) * 2005-10-17 2008-10-22 诺维信公司 用于表达抗体的真菌突变体的用途
CN104884631A (zh) * 2012-12-21 2015-09-02 诺维信股份有限公司 用于在木霉属的突变体中产生异源多肽的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
丝状真菌基因工程进展;杨丰科;姜萍;李思东;王守满;;氨基酸和生物资源(01);29-32 *

Also Published As

Publication number Publication date
MX2012006900A (es) 2012-07-04
AU2017254852A1 (en) 2017-11-16
WO2011075677A3 (en) 2011-08-11
US20200385772A1 (en) 2020-12-10
CN105368717B (zh) 2020-01-21
US11427847B2 (en) 2022-08-30
EP2513290A2 (en) 2012-10-24
BR122019011255B1 (pt) 2020-12-01
AU2019222857A1 (en) 2019-09-19
DK2513290T3 (en) 2016-01-25
US20210155967A1 (en) 2021-05-27
BR112012013205B1 (pt) 2020-11-03
WO2011075677A2 (en) 2011-06-23
BR122018077148B1 (pt) 2020-11-03
US11078509B2 (en) 2021-08-03
AU2021250953A1 (en) 2021-11-11
US8986974B2 (en) 2015-03-24
CA2784599A1 (en) 2011-06-23
BR112012013205A2 (pt) 2015-11-24
US11078508B2 (en) 2021-08-03
US20120288892A1 (en) 2012-11-15
AU2024201764A1 (en) 2024-04-04
AU2016201422B2 (en) 2017-08-31
AU2021250953B2 (en) 2024-03-07
CN102762714B (zh) 2015-11-25
US20150225761A1 (en) 2015-08-13
AU2010330835A1 (en) 2012-04-19
EP2513290B1 (en) 2015-11-11
AU2019222857B2 (en) 2021-07-22
US10400260B2 (en) 2019-09-03
CN102762714A (zh) 2012-10-31
US11078510B2 (en) 2021-08-03
CN111500474A (zh) 2020-08-07
CA2784599C (en) 2020-06-02
US11001869B2 (en) 2021-05-11
US20200377921A1 (en) 2020-12-03
EP3000871A1 (en) 2016-03-30
CN105368717A (zh) 2016-03-02
AU2010330835B2 (en) 2016-02-11
AU2017254852B2 (en) 2019-06-13
AU2016201422A1 (en) 2016-03-24
BR122018077153B1 (pt) 2020-10-27
MX350399B (es) 2017-09-06
US20190093143A1 (en) 2019-03-28
US20200385773A1 (en) 2020-12-10

Similar Documents

Publication Publication Date Title
CN111500474B (zh) 用于在木霉属的蛋白酶缺陷突变体中产生多肽的方法
EP3491130B1 (en) An assembly system for a eukaryotic cell
CN105586355B (zh) 在镶片镰孢的酶缺陷突变体中产生多肽的方法
WO2019046703A1 (en) METHODS OF ENHANCING GENOME EDITION IN FUNGI
JP2021521821A (ja) 粘性が低下した表現型を含む糸状菌株
US20220010305A1 (en) Genome Editing by Guided Endonuclease and Single-stranded Oligonucleotide
EP4347813A1 (en) Transcriptional regulators and polynucleotides encoding the same
KR102489871B1 (ko) 진균 숙주 주, dna 구성물, 및 사용 방법
CN115427560A (zh) 使用无催化活性rna指导的内切核酸酶的crispr-aid
CN112105740A (zh) 真菌宿主中的长链非编码rna表达
CN116583534A (zh) 前导肽和编码其的多核苷酸
KR20210038591A (ko) 향상된 단백질 생산성 표현형을 포함하는 돌연변이체 및 유전자 변형된 사상성 진균 균주 및 이의 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant