CN111372941A - 用于周质蛋白质表达的细菌前导序列 - Google Patents

用于周质蛋白质表达的细菌前导序列 Download PDF

Info

Publication number
CN111372941A
CN111372941A CN201880074902.6A CN201880074902A CN111372941A CN 111372941 A CN111372941 A CN 111372941A CN 201880074902 A CN201880074902 A CN 201880074902A CN 111372941 A CN111372941 A CN 111372941A
Authority
CN
China
Prior art keywords
protein
antibody
polypeptide
pseudomonas
interest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880074902.6A
Other languages
English (en)
Inventor
R·J·科尔曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pfenex Inc
Original Assignee
Pfenex Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pfenex Inc filed Critical Pfenex Inc
Publication of CN111372941A publication Critical patent/CN111372941A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/21Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Pseudomonadaceae (F)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • C12N1/205Bacterial isolates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • C12N15/625DNA sequences coding for fusion proteins containing a sequence coding for a signal sequence
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/78Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Pseudomonas
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • C12N9/80Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5) acting on amide bonds in linear amides (3.5.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • C12N9/80Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5) acting on amide bonds in linear amides (3.5.1)
    • C12N9/82Asparaginase (3.5.1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/01Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in linear amides (3.5.1)
    • C12Y305/01001Asparaginase (3.5.1.1)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/38Pseudomonas
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/38Pseudomonas
    • C12R2001/39Pseudomonas fluorescens

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Virology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本文提供了用于异源蛋白的周质表达的细菌前导序列、包含细菌前导序列的融合蛋白及其表达方法。

Description

用于周质蛋白质表达的细菌前导序列
相关申请的交叉引用
本申请要求2017年10月27日提交的美国临时申请号62/578,304的权益,其通过引用合并于此。
序列表
本申请包含已经以ASCII格式电子提交并且通过引用整体并入本文的序列表。创建于2018年10月16日的所述ASCII拷贝名为38194-752_601_SL.txt,且大小为13,698字节。
背景技术
美国食品和药物管理局(FDA)已批准超过150种重组产生的蛋白质和多肽用作生物技术药物和疫苗,另有370种处于临床试验中。与通过化学合成产生的小分子治疗剂不同,蛋白质和多肽在活细胞中最有效地产生。但是,目前在细菌中生产重组蛋白的方法通常产生不正确折叠的、聚集的或失活的蛋白,并且许多类型的蛋白需要使用已知方法无法有效实现的次级修饰。
已知方法的一个主要问题在于在细胞质中形成由聚集的蛋白质造成的包涵体,这在过量的蛋白质在细胞中积累时发生。重组蛋白质生产中的另一个问题是为表达的蛋白质建立适当的二级和三级构象。一种障碍是细菌细胞质有效对抗二硫键的形成,其通常是适当的蛋白质折叠的基础(Derman等,1993,Science,1744-7)。结果,当在细菌中产生时,许多重组蛋白,特别是真核来源的那些,不正确地折叠且是无活性的。
已经进行了许多尝试来增加重组***中适当折叠的、可溶性和/或活性蛋白质的产生。例如,研究人员改变了发酵条件,改变启动子强度,或者使用过表达的伴侣蛋白,这通常有助于防止包涵体的形成。
增加适当折叠的、可溶性和/或活性的蛋白质的收获的替代方法是从细胞内环境分泌蛋白质。具有信号序列的多肽的最常见分泌形式涉及Sec***。该Sec***负责具有Sec***N末端分泌前导的蛋白质跨质膜的输出。
已经开发了将蛋白质从细胞排出到上清液中的策略。增加表达的其他策略涉及将蛋白质靶向于周质。一些研究集中在非-Sec型分泌。但是,大多数研究集中于用Sec型分泌***分泌外源蛋白质。已经描述了许多用于表达重组多肽或蛋白质的分泌信号。
依赖于信号序列将蛋白质靶向到细胞质之外的策略通常产生不正确加工的蛋白质。这对于氨基末端分泌信号,例如导致通过Sec***分泌的那些,尤其如此。通过该***加工的蛋白质通常保留一部分分泌信号,需要通常不正确切割的连接元件,或者在末端被截短。
从上述技术显而易见的是,已经开发了许多策略来将蛋白质靶向于宿主细胞的周质。但是,已知的策略并不能始终获得正确加工的、活性的重组蛋白的高产率,这些蛋白质通常被纯化用于治疗性用途。先前策略的一个主要限制是在不足的细胞***中表达具有不良分泌信号序列的蛋白质。
仍然需要能够分泌和适当加工重组多肽而以正确加工的形式产生它们的改进的大规模表达***。
发明内容
本文提供了具有第一部分和第二部分的多肽,其中第一部分具有与SEQ ID NOS:1-3中的一个或多个同源的氨基酸序列和第二部分具有目的蛋白质或多肽的氨基酸序列,且其中第一部分和第二部分可操作地连接。在一些实施方案中,多肽的第一部分不是目的蛋白质或多肽天然的。在一些实施方案中,目的蛋白质选自抗体或抗体衍生物、酶、细胞因子、趋化因子、生长因子和疫苗抗原。在一些实施方案中,抗体或抗体衍生物是scFv、Fab、人源化抗体、修饰的抗体、单结构域抗体、异种特异性抗体(heterospecific antibody)、三价抗体、双特异性抗体、单链抗体、Fab片段、线性抗体、双抗体或全链抗体。在一些实施方案中,多肽进一步包含接头。在一些实施方案中,多肽进一步包含切割结构域。在一些实施方案中,第一部分是前导肽,其将目的蛋白质的表达指引至原核宿主细胞的周质。在一些实施方案中,宿主细胞选自假单胞菌细胞或大肠杆菌细胞。
本文还提供了包含前导肽和目的蛋白质或多肽的多肽,其中前导肽具有选自SEQID NOS:1-3中的一个或多个的氨基酸序列。在一些实施方案中,前导肽不是目的蛋白质或多肽天然的。在一些实施方案中,目的蛋白质或多肽选自抗体或抗体衍生物、酶、细胞因子、趋化因子、生长因子和疫苗抗原。在一些实施方案中,抗体或抗体衍生物是scFv、Fab、人源化抗体、修饰的抗体、单结构域抗体、异种特异性抗体、三价抗体、双特异性抗体、单链抗体、Fab片段、线性抗体、双抗体或全链抗体。在一些实施方案中,多肽进一步包含接头。在一些实施方案中,多肽进一步包含切割结构域。在一些实施方案中,第一部分是前导肽,其将目的蛋白质或多肽的表达指引至原核宿主细胞的周质。在一些实施方案中,宿主细胞选自假单胞菌细胞或大肠杆菌细胞。
本文进一步提供了编码具有第一部分和第二部分的多肽的多核苷酸,其中第一部分通过选自SEQ ID NS:4-6中的一个或多个的核酸序列编码和第二部分通过目的蛋白质或多肽的核酸序列编码,且其中第一部分和第二部分可操作地连接。在一些实施方案中,多肽的第一部分不是目的蛋白质或多肽天然的。在一些实施方案中,目的蛋白质或多肽选自抗体或抗体衍生物、酶、细胞因子、趋化因子、生长因子和疫苗抗原。在一些实施方案中,抗体或抗体衍生物是scFv、Fab、人源化抗体、修饰的抗体、单结构域抗体、异种特异性抗体、三价抗体、双特异性抗体、单链抗体、Fab片段、线性抗体、双抗体或全链抗体。在一些实施方案中,多核苷酸还包含编码接头的核酸。在一些实施方案中,多核苷酸还包含编码切割结构域的核酸。在一些实施方案中,第一部分是前导肽,其将目的蛋白质或多肽的表达指引至原核宿主细胞的周质。在一些实施方案中,宿主细胞选自假单胞菌细胞或大肠杆菌细胞。
本文还提供了用于蛋白质表达的载体,其包含编码前导肽的核酸,其中所述核酸具有选自SEQ ID NO:4-6中的一个或多个的核酸序列。在一些实施方案中,载体还包含接头。在一些实施方案中,载体还包含切割结构域。在一些实施方案中,前导肽将目的蛋白质或多肽的表达指引至原核宿主细胞的周质。在一些实施方案中,宿主细胞选自假单胞菌细胞或大肠杆菌细胞。
本文还提供了在原核细胞培养物中产生目的蛋白质或多肽的方法。在一些实施方案中,该方法包括:(a)在细胞培养生长培养基中培养包含编码目的蛋白质或多肽和前导肽的核酸的原核细胞;和(b)从原核细胞的周质分离目的蛋白质或多肽,其中所述前导肽包含选自SEQ ID NO:1-3中的一个或多个的氨基酸序列。在一些实施方案中,目的蛋白质或多肽选自抗体或抗体衍生物、酶、细胞因子、趋化因子、生长因子和疫苗抗原。在一些实施方案中,抗体或抗体衍生物是scFv、Fab、人源化抗体、修饰的抗体、单结构域抗体、异种特异性抗体、三价抗体、双特异性抗体、单链抗体、Fab片段、线性抗体、双抗体或全链抗体。在一些实施方案中,核酸编码接头。在一些实施方案中,核酸编码切割结构域。在一些实施方案中,原核细胞选自假单胞菌细胞或大肠杆菌细胞。在一些实施方案中,通过向培养基中添加IPTG来诱导目的蛋白质或多肽的表达。在一些实施方案中,原核细胞在约5.0至约8.0的pH下培养。在一些实施方案中,原核细胞在约22℃至约33℃的温度下培养。
在一些实施方案中,本文的方法包括在原核细胞培养物中产生目的蛋白质或多肽的方法,该方法包括:(a)在细胞培养生长培养基中培养包含编码目的蛋白质或多肽和前导肽的核酸的原核细胞;和(b)从原核细胞的周质分离目的蛋白质或多肽,其中所述前导肽由选自SEQ ID NO:4-6中的一个或多个的核酸序列编码。在一些实施方案中,目的蛋白质或多肽选自抗体或抗体衍生物、酶、细胞因子、趋化因子、生长因子和疫苗抗原。在一些实施方案中,抗体或抗体衍生物是scFv、Fab、人源化抗体、修饰的抗体、单结构域抗体、异种特异性抗体、三价抗体、双特异性抗体、单链抗体、Fab片段、线性抗体、双抗体或全链抗体。在一些实施方案中,核酸编码接头。在一些实施方案中,核酸编码切割结构域。在一些实施方案中,原核细胞选自假单胞菌细胞或大肠杆菌细胞。在一些实施方案中,通过向培养基中添加IPTG来诱导目的蛋白质或多肽的表达。在一些实施方案中,原核细胞在约5.0至约8.0的pH下培养。在一些实施方案中,原核细胞在约22℃至约33℃的温度下培养。
在一些实施方案中,本文的方法包括在原核细胞的周质中表达目的蛋白质或多肽的方法,该方法包括在细胞培养生长培养基中培养包含编码目的蛋白质或多肽和前导肽的核酸的原核细胞,其中前导肽包含选自SEQ ID NO:1-3中的一个或多个的氨基酸序列。在一些实施方案中,目的蛋白质或多肽选自抗体或抗体衍生物、酶、细胞因子、趋化因子、生长因子和疫苗抗原。在一些实施方案中,抗体或抗体衍生物是scFv、Fab、人源化抗体、修饰的抗体、单结构域抗体、异种特异性抗体、三价抗体、双特异性抗体、单链抗体、Fab片段、线性抗体、双抗体或全链抗体。在一些实施方案中,核酸编码接头。在一些实施方案中,核酸编码切割结构域。在一些实施方案中,原核细胞选自假单胞菌细胞或大肠杆菌细胞。在一些实施方案中,通过向培养基中添加IPTG来诱导目的蛋白质或多肽的表达。在一些实施方案中,原核细胞在约5.0至约8.0的pH下培养。在一些实施方案中,原核细胞在约22℃至约33℃的温度下培养。
在一些实施方案中,本文的方法包括在原核细胞的周质中表达目的蛋白质或多肽的方法,该方法包括在细胞培养生长培养基中培养包含编码目的蛋白质或多肽和前导肽的核酸的原核细胞,其中前导肽由选自SEQ ID NO:4-6中的一种或多种的核酸序列编码。在一些实施方案中,目的蛋白质或多肽选自抗体或抗体衍生物、酶、细胞因子、趋化因子、生长因子和疫苗抗原。在一些实施方案中,抗体或抗体衍生物是scFv、Fab、人源化抗体、修饰的抗体、单结构域抗体、异种特异性抗体、三价抗体、双特异性抗体、单链抗体、Fab片段、线性抗体、双抗体或全链抗体。在一些实施方案中,核酸编码接头。在一些实施方案中,核酸编码切割结构域。在一些实施方案中,原核细胞选自假单胞菌细胞或大肠杆菌细胞。在一些实施方案中,通过向培养基中添加IPTG来诱导目的蛋白质或多肽的表达。在一些实施方案中,原核细胞在约5.0至约8.0的pH下培养。在一些实施方案中,原核细胞在约22℃至约33℃的温度下培养。
通过引用并入
本说明书中提及的所有公开出版物、专利和专利申请都通过引用并入本文,达到好像每个单独的公开出版物、专利或专利申请被明确地并单独地指明通过引用并入的相同程度。
附图简要说明
本公开的新颖特征特别地在所附权利要求中示出。通过参考下面阐述了说明性实施方案的详细说明并结合附图可以更好地理解本公开的特征和优点,在该说明性实施方案中利用了本公开的原理,其中:
图1显示了TrxA表达的SDS-CGE凝胶样图像。
图2显示了Gal2表达的SDS-CGE凝胶样图像。
图3显示了mrPA表达的SDS-CGE凝胶样图像。
图4.克立他酶(Crisantaspase)示例序列。显示了编码克立他酶的示例性核酸序列(SEQ ID NO:8)以及相应的氨基酸序列(SEQ ID NO:7)。图4还公开了如SEQ ID NO:20的包括克隆位点的全长核苷酸序列。
图5.SDS-CGE凝胶样图像-克立他酶表达质粒筛选。通过还原SDS-CGE分析来自DC454(上图)和DC441(下图)的克立他酶小规模生长全肉汤超声可溶样品。最左侧的泳道显示分子量标记梯状物1(上图MW梯状物48KD、29KD;下图MW梯状物48KD、29KD、21KD),且最右侧的泳道显示相同的梯状物。从左到右(泳道1到46),紧接着梯状物1右侧开始的是显示在以下分泌前导肽与克立他酶蛋白(高RBS,除非另有说明)的N末端融合时观察到的表达谱的泳道:无前导肽;DsbD;前导A;DsbA;DsbA-中等RBS;Azu;Azu-中等RBS;Lao;Ibp-S31A;TolB;DC432null(携带仅载体质粒的野生型宿主菌株);Tpr;Ttg2C;FlgI;CupC2;CupB2;Pbp;PbpA20V;DsbC;前导肽B;前导肽C;DC432null;前导肽D;前导肽E;前导肽F;前导肽G;前导肽H;PorE;前导肽I;前导肽J;前导肽K;前导肽L;DC432null;前导肽M;前导肽N;前导肽O;5193;前导肽P;前导肽Q;前导肽R;8484;前导肽S;前导肽T;DC432null。凝胶图像右侧的箭头指示克立他酶靶蛋白(35kDa)的迁移。
图6.SDS-CGE凝胶样图像-大肠杆菌天冬酰胺酶表达质粒筛选。通过还原SDS-CGE分析天冬酰胺酶小规模(0.5毫升)生长全肉汤超声可溶(上图)和不溶(下图)样品。最左侧的泳道显示分子量标记梯状物(上图MW梯状物119kDa、68kDa、48kDa、29kDa、21kDa、16kDa;下图MW梯状物119kDa、68KDa、48kDa、29kDa、21kDa、16kDa)和最右侧的泳道显示相同的梯状物。从左到右,紧接梯状物1右侧开始的是显示在Null、STR55467、STR55689、STR55559、STR55561、STR55569、STR55575、STR55555、STR55571、STR55560、STR55570、STR55572、STR55601、STR55585、STR55592、STR55501和对照中观察到的表达谱的泳道:Sigma大肠杆菌L-天冬酰胺酶1000μg/ml、Sigma大肠杆菌L-天冬酰胺酶500μg/ml、Sigma大肠杆菌L-天冬酰胺酶250μg/ml、Sigma大肠杆菌L-天冬酰胺酶125μg/ml和Sigma大肠杆菌L-天冬酰胺酶62.5μg/ml。凝胶图像右侧的箭头指示天冬酰胺酶靶蛋白(35kDa)的迁移。
图7.SDS-CGE凝胶样图像–克立他酶摇瓶表达分析。显示了在不同生长条件下的表达,如通过可溶性还原毛细管凝胶电泳(SDS-CGE)所测量的。从左到右是显示在以下样品中观察到的表达谱的泳道:梯形物1(分子量标记68、48、29、21和16KD);I0的STR55987(胞质表达,无前导肽);I24的STR55987(胞质表达,无前导肽);I24的STR55987(胞质表达,无前导肽);I24的STR55987(胞质表达,无前导肽);I0的STR55979(前导肽O);I24的STR55979(前导肽O);I24的STR55979(前导肽O);I24的STR55979(前导肽O);I0的STR55980(8484前导肽);I24的STR55980(8484前导肽);I24的STR55980(8484前导肽);I24的STR55980(8484前导肽);I0的STR55982(Null质粒);I24的STR55982(Null质粒);I24的STR55982(Null质粒);I24的STR55982(Null质粒);梯状物2(与梯状物1中的相同标记);Sigma大肠杆菌AspG 1,000ug/ml(标准大肠杆菌Asp2);Sigma大肠杆菌AspG 500ug/ml;Sigma大肠杆菌AspG250ug/ml;Sigma大肠杆菌AspG 125ug/ml;Sigma大肠杆菌AspG 62.5ug/ml;和梯状物3(与梯状物1中的相同标记),其中I0样品在诱导时获取,和I24样品在诱导后24小时获取。右侧的箭头指示大肠杆菌L-Asp2(35KD)的迁移。
图8显示了用于分析蛋白质表达样品的LC-MS输出。
具体实施方式
概述
提供了用于在宿主细胞中产生高水平的适当加工的重组蛋白或多肽的组合物和方法。特别地,提供了新的分泌信号,其促进重组目的蛋白质或多肽靶向革兰氏阴性细菌的周质或到细胞外环境中。本文公开的周质分泌前导肽使蛋白质能够跨过内膜转运至革兰氏阴性细菌的周质空间。对于重组表达,周质表达允许在周质中形成二硫键,并且在某些情况下,使高水平重组蛋白表达成为可能。表达到周质空间还可以使重组蛋白能够更有效地回收/纯化。为了本公开的目的,“分泌信号”、“分泌前导肽”、“分泌信号多肽”、“信号肽”或“前导序列”旨在指可用于将目的蛋白质或多肽靶向于革兰氏阴性细菌的周质或细胞外空间中的肽序列(或编码该肽序列的多核苷酸)。本发明的分泌信号序列包括选自AnsB、8484和5193分泌信号的分泌前导肽及其片段和变体。分泌信号的氨基酸序列在SEQ ID NO:1-3中示出。在SEQ ID NO:4-6中分别提供了编码SEQ ID NO:1-3并且可用于本方法中的核苷酸序列的实例(表1)。如本领域技术人员已知的,由于遗传密码的冗余性,氨基酸序列可以由不同的核苷酸序列编码。因此,本发明包括使用具有相同氨基酸序列但由不同核苷酸序列编码的肽或蛋白质。本文还提供了这些分泌信号序列的片段和变体,其可以指导可操作地连接的重组目的蛋白质或多肽的周质表达。
Figure BDA0002498380930000091
本文公开的方法提供了对于在细菌中产生重组蛋白的当前生产方法的改进,所述细菌通常产生不正确折叠的、聚集的或失活的蛋白质。另外,许多类型的蛋白质需要使用已知方法无法有效实现的二级修饰。本文的方法通过从细胞内环境分泌蛋白质来增加正确折叠的、可溶性和/或活性蛋白质的收获。在革兰氏阴性细菌中,从细胞质分泌的蛋白质通常终止于周质空间,附着于外膜或在细胞外液体培养基中。该方法还避免形成由聚集的蛋白质构成的包涵体。分泌到周质空间中还具有促进适当的二硫键形成的作用(Bardwell等,1994,“Pathways of Disulfide Bond Formation in Proteins In Vivo”,Phosphate inmicroorganisms:cellular and molecular biology,Torriani-Gorini等人编辑,第270-5页,和Manoil,2000,Methods in Enzymol.326:35-47,两者均通过引用并入本文)。重组蛋白分泌的益处包括更有效的蛋白质分离;转基因蛋白的正确折叠和二硫键形成,从而导致可溶性和/或活性形式的蛋白质百分比的增加;包涵体形成的减少和对宿主细胞的毒性的降低。在某些情况中,将目的蛋白质分泌到培养基中的潜力促进连续的蛋白质生产,而不是分批培养。
革兰氏阴性细菌已经进化出多种用于跨其双重膜主动输出蛋白质的***。这些分泌途径包括,例如,ABC(I型)途径、Path/Fla(III型)途径和Path/Vir(IV型)途径,其用于跨质膜和外膜两者的一步转位;Sec(II型)、Tat、MscL和Holins途径,其用于跨质膜转位;和Sec+菌毛引座孔蛋白(fimbrial usher porin)(FUP)、Sec+自动转运蛋白(autotransporter)(AT)、Sec+双伴体分泌(two partner secretion)(TPS)、Sec+主末端分支(main terminal branch)(MTB)和Tat-+-MTB途径,其用于跨质膜和外膜的两步转位。并非所有细菌具有所有这些分泌途径。
三个蛋白质***(I、III和IV型)在单一能量耦合步骤中跨两个膜分泌蛋白质。四个***(Sec、Tat、MscL和Holins)仅跨内膜分泌,且其它四个***(MTB、FUP、AT和TPS)仅跨外膜分泌。
在某些情况下,本文的信号序列利用Sec分泌***。Sec***负责跨细胞质膜输出具有N末端分泌前导序列的蛋白质(参见Agarraberes和Dice,2001,Biochim BiophysActa.1513:1-24;Muller等人,2001,Prog Nucleic Acid Res Mol.Biol.66:107-157)。Sec家族的蛋白质复合物普遍存在于原核生物和真核生物中。细菌Sec***由转运蛋白、伴侣蛋白(SecB)或信号识别颗粒(SRP)和信号肽酶(SPase I和SPase II)组成。大肠杆菌中的Sec转运复合物由三个整合的内膜蛋白(SecY、SecE和SecG)以及胞质ATPase(SecA)组成。SecA募集SecY/E/G复合物以形成主动的转位通道。伴侣蛋白SecB与新生多肽链结合以防止其折叠并将其靶向至SecA。线性多肽链随后通过SecYEG通道转运,且在信号肽切割后,蛋白质在周质中折叠。三种辅助蛋白(SecD、SecF和YajC)形成不是分泌所必需的复合物,而是在许多条件下(尤其是在低温下)刺激分泌多达十倍。
被转运到周质中(即通过II型分泌***)的蛋白质也通常在进一步的步骤中输出到细胞外培养基中。该机制一般通过自动转运蛋白、两伴体分泌***、主末端分支***或菌毛引座孔蛋白。
在革兰氏阴性细菌的十二种已知的分泌***中,已知八种利用作为表达的蛋白质的部分存在的靶向信号肽。这些信号肽与分泌***的蛋白质相互作用,使得细胞正确地将蛋白质指引至其适当的目的地。这八种基于信号肽的分泌***中五种是涉及Sec***的。这五种被称为参与Sec依赖性细胞质膜转位,并且在一些情况下在其中起作用的它们的信号肽被称为Sec依赖性分泌信号。产生合适的分泌信号的问题之一是确保信号被适当地表达并从表达的蛋白质切割。
用于sec途径的信号肽通常具有以下三个结构域:(i)带正电的n-区域,(ii)疏水性区域和(iii)不带电但极性的c-区域。用于信号肽酶的切割位点位于c区域中。但是,信号序列保守性的程度和长度,以及切割位点的位置,在不同蛋白质之间通常是变化的。
Sec依赖性蛋白输出的特征是在输出的蛋白质中存在短的(约30个氨基酸)、主要疏水性的氨基末端信号序列。该信号序列有助于蛋白质输出并在输出的蛋白质到达周质时被周质信号肽酶切除。典型的N末端Sec信号肽包含具有至少一个精氨酸或赖氨酸残基的N结构域,随后是包含一段疏水性残基的结构域,以及包含信号肽酶的切割位点的C结构域。
已经开发了细菌蛋白质生产***,其中将转基因蛋白质构建体工程化为包含目的蛋白质和分泌信号两者的融合蛋白以试图将蛋白质靶向到细胞质外。
荧光假单胞菌已被证明是用于生产多种蛋白质的改进的平台,并且已从该生物体鉴定出几种有效的分泌信号(参见美国专利号7,985,564,“Expression Systems withSec-system Secretion”,在此全文引入作为参考)。荧光假单胞菌以正确加工的形式产生外源蛋白质(其水平高于其他细菌表达***中通常所见的水平),并将这些蛋白质以较高的水平转运至细胞的周质,从而导致完全加工的重组蛋白的回收率提高。因此,在一个实施方案中,提供了一种通过表达与分泌信号可操作地连接的靶蛋白在荧光假单胞菌细胞中产生外源蛋白质的方法。
在一些情况下,本文的分泌信号序列可用于假单胞菌中。与其他细菌表达***相比,假单胞菌***为多肽和酶的商业表达提供了优势。特别地,荧光假单胞菌已被确认为有利的表达***。荧光假单胞菌涵盖定植于土壤、水和植物表面环境的一组常见的非致病性腐生菌。源自荧光假单胞菌的商业酶已用于减少环境污染,用作洗涤剂添加剂,和用于立体选择性水解。荧光假单胞菌也在农业上用于控制病原体。美国专利号4,695,462,“CellularEncapsulation of Biological Pesticides”描述了重组细菌蛋白在荧光假单胞菌中的表达。
组合物
分泌前导肽
在本文的一个实施方案中,提供了一种肽,其中该肽是可用于将目的蛋白质或多肽靶向于革兰氏阴性细菌的周质或靶向于细胞外空间中的新型分泌前导肽或信号。在一个实施方案中,该肽具有作为AnsB、8484或5193分泌信号或其片段或变体,或者与之基本上同源的氨基酸序列。本发明还提供了一种包含与目的靶蛋白或多肽融合的本发明的分泌信号肽的多肽,以及产生包含分泌信号肽和目的多肽的融合蛋白的表达构建体。在实施方案中,分泌信号肽与目的多肽可操作地连接。
在实施方案中,分泌信号序列与SEQ ID NO:1-3中任一个所示的分泌信号肽同源或基本上同源,或由SEQ ID NO:4-6中任一个所示的多核苷酸序列编码。在另一个实施方案中,分泌信号序列包含SEQ ID NO:1的至少氨基酸2-25、SEQ ID NO:2的至少氨基酸2-18或SEQ ID NO:3的至少氨基酸2-29。在又一个实施方案中,分泌信号序列包含SEQ ID NO:1-3之一的片段,其从氨基末端截短1、2、3、4、5、6、7、8、9或10个氨基酸,但保留生物学活性,即分泌信号活性。
在一个实施方案中,该肽的氨基酸序列是给定原始肽的变体,其中该变体的序列可通过用其它氨基酸残基替代多达或约30%的原始肽的氨基酸残基(包括最多约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%或30%)获得,条件是该变体保留原始肽的所需功能。具有显著同源性的变体氨基酸为与原始肽至少约70%、至少约75%、至少约80%、约85%、约90%、约95%、约96%、约97%、约98%或至少约99%同源。变体氨基酸序列可以以各种方式获得,包括SEQ ID NO:1-3中任一个的一个或多个氨基酸的氨基酸置换、删除、截短和***,包括1个或多个、1-5、1-10、1、2、3、4、5、6、7、8、9、10、15、20、25个或更多个氨基酸置换、删除、***或其组合。
“基本上同源”、“基本上相同”或“基本上相似”是指使用本文中描述的或本领域中已知的合适比对程序利用标准参数与参考序列相比,具有大约或至少约60%、大约或至少约65%、大约或至少约70%、大约或至少约75%、大约或至少约80%、大约或至少约85%、大约或至少约81%、大约或至少约82%、大约或至少约83%、大约或至少约84%、大约或至少约85%、大约或至少约86%、大约或至少约87%、大约或至少约88%、大约或至少约89%、大约或至少约90%、大约或至少约91%、大约或至少约92%、大约或至少约93%、大约或至少约94%、大约或至少约95%、大约或至少约96%、大约或至少约97%、大约或至少约98%或者大约或至少约99%或更大的序列同一性的氨基酸或核苷酸序列。本领域技术人员将认识到,可以通过考虑密码子简并性、氨基酸相似性、阅读框定位等来适当地调节这些值以确定由两个核苷酸序列编码的蛋白质的对应同一性。
在实施方案中,用于本发明的肽、蛋白质或多肽可以包括“非必需”氨基酸残基的一个或多个修饰。在这种情况中,“非必需”氨基酸残基是可以在新的氨基酸序列中被改变(例如删除、置换或衍生)而不消除或显著降低原始肽、蛋白质或多肽(也称为“类似”或“参考”肽、蛋白质或多肽)的活性(例如,激动剂活性)的残基。在一些实施方案中,肽、蛋白质或多肽可包括“必需”氨基酸残基的一个或多个修饰。在这种情况中,“必需”氨基酸残基是当其在新的氨基酸序列中被改变(例如,删除、置换或衍生)时,参考肽、蛋白质或多肽的活性被显著降低或消除的残基。在其中必需氨基酸残基被改变的这类实施方案中,修饰的肽、蛋白质或多肽可以具有原始肽、蛋白质或多肽的活性。置换、***和缺失可以在N末端或C末端,或者可以在肽、蛋白质或多肽的内部部分。举例来说,肽、蛋白质或多肽可包括1、2、3、4、5、6、7、8、9、10个或更多个置换,以连续的方式或在整个肽、蛋白质或多肽分子中分隔开。单独或与置换组合,肽、蛋白质或多肽可以包括1、2、3、4、5、6、7、8、9、10个或更多个***,同样以连续方式或在整个肽、蛋白质或多肽分子序列中分隔开。单独或与置换和/或***组合,肽、蛋白质或多肽还可包括1、2、3、4、5、6、7、8、9、10个或更多个删除,同样以连续方式或在整个肽、蛋白质或多肽分子序列中分隔开。单独或与置换、***和/或删除组合,肽、蛋白质或多肽还可以包括1、2、3、4、5、6、7、8、9、10个或更多个氨基酸添加。
置换包括保守的氨基酸置换。“保守氨基酸置换”是其中氨基酸残基被具有相似侧链或物理化学特征(例如,静电、氢键键合、电子等排、疏水性特征)的氨基酸残基替代的氨基酸置换。氨基酸可以是天然存在的或非天然的。具有相似侧链的氨基酸残基家族是本领域已知的。这些家族包括具有碱性侧链(例如赖氨酸、精氨酸、组氨酸)、酸性侧链(例如天冬氨酸、谷氨酸)、不带电的极性侧链(例如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、蛋氨酸、半胱氨酸)、非极性侧链(例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、色氨酸)、β分支侧链(例如苏氨酸、缬氨酸、异亮氨酸)和芳香族侧链(例如酪氨酸、苯丙氨酸、色氨酸、组氨酸)的氨基酸。置换也可以包括非保守的变化。
本文涵盖的变体肽、蛋白质或多肽是生物活性的,即它们继续具有原始肽、蛋白质或多肽的所需生物学活性;例如,变体分泌前导肽保留了分泌信号活性。“保留活性”意指变体具有原始肽,蛋白质或多肽的大约或至少约30%、大约或至少约35%、大约或至少约40%、大约或至少约45%、大约或至少约50%、大约或至少约55%、大约或至少约60%、大约或至少约65%、大约或至少约70%、大约或至少约75%、大约或至少约80%、大约或至少约85%、大约或至少约81%、大约或至少约82%、大约或至少约83%、大约或至少约84%、大约或至少约85%、大约或至少约86%、大约或至少约87%、大约或至少约88%、大约或至少约89%、大约或至少约90%、大约或至少约91%、大约或至少约92%、大约或至少约93%、大约或至少约94%、大约或至少约95%、大约或至少约96%、大约或至少约97%、大约或至少约98%或者大约或至少约99%、大约或至少约100%活性、大约或至少约110%、大约或至少约125%、大约或至少约150%、大约或至少约200%或更高的活性,例如分泌信号活性。
多核苷酸
本公开还包括具有编码可用于将目的蛋白质或多肽靶向于革兰氏阴性细菌的周质或靶向到细胞外空间中的新的分泌信号的序列的核酸。在一个实施方案中,分离的多核苷酸编码与AnsB、8484或5193分泌信号肽基本上同源的肽序列。在另一个实施方案中,本公开提供了一种编码与SEQ ID NO:1的至少氨基酸2-25、SEQ ID NO:2的至少氨基酸2-18或SEQ ID NO:2的至少氨基酸2-29基本上同源的肽序列的核酸,或提供与SEQ ID NO:4-6所示的核苷酸序列的任何一个基本上同源的核酸,包括其生物活性变体和片段。在另一个实施方案中,核酸序列与SEQ ID NO:4-6所示的任何一个核酸序列大约或至少约60%、大约或至少约65%、大约或至少约70%、大约或至少约75%、大约或至少约80%、大约或至少约85%、大约或至少约81%、大约或至少约82%、大约或至少约83%、大约或至少约84%、大约或至少约85%、大约或至少约86%、大约或至少约87%、大约或至少约88%、大约或至少约89%、大约或至少约90%、大约或至少约91%、大约或至少约92%、大约或至少约93%、大约或至少约94%、大约或至少约95%、大约或至少约96%、大约或至少约97%、大约或至少约98%或者大约或至少约99%或更高相同。
在实施方案中,本文的分泌信号肽由与SEQ ID NO:4-6所示的任一核苷酸序列基本上同源的核苷酸序列编码。与本发明的分泌信号序列具有实质同一性的相应分泌信号肽序列可以使用本领域已知的任何合适方法来鉴定,例如PCR、杂交方法,或如文献中所述。参见,例如,Sambrook J.和Russell,D.W.,2001,Molecular Cloning:A LaboratoryManual.Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY;和Innis等,1990,PCR Protocols:A Guide to Methods and Applications;Academic Press,NY。变体核苷酸序列可以包括例如通过使用定点诱变产生的合成衍生的核苷酸序列。在实施方案中,诱变的序列仍然编码本文公开的分泌信号肽。变体分泌信号肽是生物学活性的,也就是说,它们继续具有天然蛋白质的所需生物学活性,即它们保留了分泌信号活性。“保留活性”是指该变体具有原始分泌信号肽的活性的大约30%、大约或至少约35%、大约或至少约40%、大约或至少约45%、大约或至少约50%、大约或至少约55%、大约或至少约60%、大约或至少约65%、大约或至少约70%、大约或至少约75%、大约或至少约80%、大约或至少约85%、大约或至少约81%、大约或至少约82%、大约或至少约83%、大约或至少约84%、大约或至少约85%、大约或至少约86%、大约或至少约87%、大约或至少约88%、大约或至少约89%、大约或至少约90%、大约或至少约91%、大约或至少约92%、大约或至少约93%、大约或至少约94%、大约或至少约95%、大约或至少约96%、大约或至少约97%、大约或至少约98%或者大约或至少约99%、大约或至少约100%、大约或至少约110%、大约或至少约125%、大约或至少约150%、大约或至少约200%或更高。用于测量肽、蛋白质或多肽活性,例如分泌信号活性的任何合适方法。这样的方法在本领域中是众所周知的,具有本文讨论的实例。
技术人员将进一步理解,在一些情况下,通过突变将改变引入本文提供的核苷酸序列中,从而导致所编码的分泌信号肽的氨基酸序列的变化而不改变分泌信号肽的生物学活性。因此,通常通过将一个或多个核苷酸取代、添加或缺失引入本文公开的相应核苷酸序列中来产生分离的变体核酸分子,从而将一个或多个氨基酸置换、添加或缺失引入编码的蛋白质中。突变可以通过任何标准技术引入,例如定点诱变和PCR介导的诱变。
核酸和氨基酸同源性
核酸和氨基酸序列同源性根据本领域已知的任何合适方法来确定,包括但不限于本文所述的那些。
可使用U.S.National Center for Biotechnology Information(NCBI,Bethesda,MD))程序MegaBLAST来进行类似序列的比对和搜索。这一程序以百分比同一性选项设置在例如氨基酸序列的70%或例如核苷酸序列的90%使用鉴定出那些与查询序列具有70%或90%或更大序列同一性的序列。本领域中已知的其它软件也可用于比对和/或搜索类似的序列,例如与含有本文的分泌信号序列的信息串至少70%或90%相同的序列。例如,用于比较以鉴定与查询序列至少70%或90%相同的序列的序列比对通常通过使用例如可在GCG序列分析软件包(可获自Genetics Computer Group,University of WisconsinBiotechnology Center,1710University Avenue,Madison,Wis.53705)中获得的GAP、BESTFIT、BLAST、FASTA和TFASTA程序进行,其中缺省参数如在其中所指定的,加上用于以百分比设定的所需序列同一性程度的参数。而且,例如可使用CLUSTAL程序(可在来自Intelligenetics,Mountain View,Cal.的PC/Gene软件包中获得)。
这些和其它序列比对方法在本领域中是公知的,并且可通过手动比对、通过目视检查或通过序列比对算法(诸如由上文所述程序所实施的那些中的任一种)的手动或自动应用来进行。各种有用的算法包括例如W.R.Pearson和D.J.Lipman,Proc.Natl.Acad.Sci.USA 85:2444-48(1988年4月)中所描述的相似性搜索方法;T.F.Smith和M.S.Waterman,于Adv.Appl.Math.2:482-89(1981)和于J.Molec.Biol.147:195-97(1981)中所描述的局部同源性方法;S.B.Needleman和C.D.Wunsch,J.Molec.Biol.48(3):443-53(1970年3月)中所描述的同源性比对方法;及例如由W.R.Pearson,于Genomics 11(3):635-50(1991年11月);由W.R.Pearson,于MethodsMolec.Biol.24:307-31和25:365-89(1994);和由D.G.Higgins和P.M.Sharp,于Comp.Appl’ns in Biosci.5:151-53(1989)和于Gene 73(1):237-44(1988年12月15日)中描述的各种方法。
可以使用GAP第10版(其使用Needleman和Wunsch(1970)(见上文)的算法)来确定序列同一性或相似性,其使用如下参数:核苷酸序列的%同一性和%相似性使用GAP权重50和长度权重3,及nwsgapdna.cmp评分矩阵;氨基酸序列的%同一性或%相似性使用GAP权重8和长度权重2,及BLOSUM62评分程序。也可如本领域技术人员理解的使用等同或相似的程序。例如,可以使用序列比较程序,在与由GAP第10版所产生的相应比对相比时,其对任何两种所讨论的序列产生具有相同的核苷酸残基匹配和相同的百分比序列同一性的比对。在实施方案中,序列比较在查询序列或目标序列或两者的整体上进行。
杂交条件
在本文的另一方面,提供了与具有编码肽的序列的分离的核酸杂交的核酸,所述肽具有与AnsB、8484或5193分泌信号肽基本相似的序列。在某些实施方案中,杂交核酸在高严格性条件下结合。在各种实施方案中,杂交发生在编码分泌信号肽的核苷酸序列的基本上整个长度上,例如,在SEQ ID NO:4-6中的一个或多个的基本上整个长度上。当核酸分子在SEQ ID NO:4-6中一个或多个的整个长度的至少80%,至少整个长度的85%、至少90%或至少95%上杂交时,核酸分子与本文公开的分泌信号编码核苷酸序列的“基本上整个长度”杂交。除非另有说明,“基本上整个长度”是指分泌信号编码核苷酸序列的整个长度的至少80%,其中该长度以连续的核苷酸测量(例如,与SEQ ID NO:4的至少60个连续的核苷酸,SEQ ID NO:5的至少43个连续核苷酸或SEQ ID NO:6的至少43个连续核苷酸等等杂交)。
在杂交方法中,在一些情况下,编码分泌信号肽的全部或部分核苷酸序列用于筛选cDNA或基因组文库。用于构建这类cDNA和基因组文库的方法一般是本领域已知的,并在Sambrook和Russell,2001中公开。所谓的杂交探针可以是基因组DNA片段、cDNA片段、RNA片段或其它寡核苷酸,并且可以用可检测基团(如32P)或任何其他可检测标志物(如其它放射性同位素、荧光化合物、酶或酶辅因子)进行标记。用于杂交的探针通常通过标记基于本文公开的已知分泌信号肽编码核苷酸序列的合成寡核苷酸来制备。有时另外使用基于核苷酸序列或编码的氨基酸序列中的保守核苷酸或氨基酸残基设计的简并引物。探针通常包含在严格条件下与本文的分泌信号肽编码核苷酸序列或其片段或变体的至少约10个、至少约11个、至少约12个、至少约13个、至少约14个、至少约15个、至少约16个、至少约17个、至少约18个、至少约19个、至少约20个或更多个连续核苷酸杂交的核苷酸序列的区域。制备用于杂交的探针的方法通常是本领域已知的,并且公开于Sambrook和Russell,2001中,其在此通过引用并入。
在杂交技术中,全部或部分的已知核苷酸序列用作探针,其与来自选定生物体的克隆的基因组DNA片段或cDNA片段的群体(即,基因组或cDNA文库)中所存在的其它相应核苷酸序列选择性地杂交。杂交探针可以是基因组DNA片段、cDNA片段、RNA片段或其它寡核苷酸,而且可以用可检测的基团(如32P)或任何其它可检测的标志物标记。因此,例如,用于杂交的探针通常通过标记基于本文中的分泌信号多肽编码核苷酸序列的合成寡核苷酸来制备。用于制备杂交探针和用于构建cDNA和基因组文库的方法通常是本领域中已知的,并且公开于Sambrook等(1989)Molecular Cloning:A Laboratory Manual,第2版,Cold SpringHarbor Laboratory Press,Plainview,New York中。
本文公开的整个分泌信号肽编码核苷酸序列或其一个或多个部分可以用作能够与编码分泌信号肽的相应核苷酸序列和信使RNA特异性杂交的探针。这些探针可以包括独特的且长度优选至少约10个核苷酸或长度至少约15个核苷酸的序列。此类探针可用于通过PCR扩增来自所选择生物体的相应分泌信号肽编码核苷酸序列。该技术可用于从所需生物体分离另外的编码序列,或用作确定生物体中编码序列的存在的诊断分析。杂交技术包括对铺板的DNA文库(斑块或集落;例如参见Sambrook等,1989)的杂交筛选。
此类序列的杂交可以在严格条件下进行。“严格条件”或“严格杂交条件”是指在该条件下探针与其靶序列杂交达到比与其它序列可检测地更大的程度(例如,比背景高至少2倍)的条件。严格条件是序列依赖性的,并且在不同情况下是不同的。通过控制杂交和/或洗涤条件的严格性,通常鉴定与探针100%互补的靶序列(同源探测)。或者,严格性条件有时被调整以允许序列中的一些错配,以便检测较低的相似度水平(异源探测)。通常,探针的长度小于约1000个核苷酸,优选地长度小于500个核苷酸。
通常,严格条件是其中在pH 7.0至8.3下盐浓度小于约1.5M Na离子,典型地约0.01至1.0M Na离子浓度(或其他盐),且温度为至少约60℃的条件。在实施方案中,温度为约68℃。严格条件也可以通过添加去稳定剂如甲酰胺实现。低严格性条件可包括,例如,在37℃下用30至35%甲酰胺,1M NaCl,1%SDS(十二烷基硫酸钠)的缓冲溶液杂交,并在1X至2X SSC(20X SSC=3.0M NaCl/0.3M柠檬酸三钠)中50到55℃下洗涤。示例性的中等严格性条件包括在37℃下于40%至45%甲酰胺,1.0M NaCl,1%SDS中杂交,并在55至60℃下于0.5X至1X SSC中洗涤。示例性的高严格性条件包括在37℃下50%甲酰胺,1M NaCl,1%SDS中杂交,并在60至68℃下0.1X SSC中洗涤。任选地,洗涤缓冲液可包含约0.1%至约1%的SDS。杂交的持续时间通常小于约24小时,并且通常为约4至约12小时。
特异性通常随杂交后洗涤而变化,关键的因素是最终洗涤溶液的离子强度和温度。对于DNA-DNA杂合体,Tm通常从Meinkoth和Wahl(1984)Anal.Biochem.138:267-284的方程式估算:Tm=81.5℃+16.6(log M)+0.41(%GC)-0.61(%form)-500/L;其中M是单价阳离子的摩尔浓度,%GC是DNA中鸟嘌呤和胞嘧啶核苷酸的百分比,%form是杂交溶液中甲酰胺的百分比,而L是以碱基对计的杂合体长度。Tm是50%的互补靶序列与完全匹配的探针杂交的温度(在规定的离子强度和pH下)。对于每1%的错配,Tm下降约1℃;因此,Tm、杂交和/或洗涤条件有时进行调整以与具有所需同一性的序列杂交。例如,若寻求具有>90%同一性的序列,则Tm通常下降10℃。一般地,严格条件选择为比特定序列及其互补序列在规定离子强度和pH下的热熔点(Tm)低约5℃。然而,极严格条件通常利用比热熔点(Tm)低1、2、3或4℃的杂交和/或洗涤;中等严格条件通常利用比热熔点(Tm)低6、7、8、9或10℃下的杂交和/或洗涤;低严格性条件通常利用比热熔点(Tm)低11、12、13、14、15或20℃下的杂交和/或洗涤。使用该方程式、杂交和洗涤组合物及所需的Tm,普通技术人员将理解,内在地描述了杂交和/或洗涤溶液的严格性的变化。如果所需的错配程度导致Tm小于45℃(水性溶液)或32℃(甲酰胺溶液),则优选提高SSC浓度以使得使用较高的温度。对核酸杂交的指导见于Tijssen,1993,Laboratory Techniques in Biochemistry and Molecular Biology—Hybridization with Nucleic Acid Probes,部分I,第2章,Elsevier,New York;及Ausubel等编辑1995,Current Protocols in Molecular Biology,第2章,GreenePublishing and Wiley-Interscience,New York。参见Sambrook等,1989。
密码子优化
在一个实施方案中,本文的组合物和方法包括从针对目的菌株中的密码子使用而优化的构建体表达目的重组蛋白或多肽。在实施方案中,菌株是假单胞菌宿主细胞,例如荧光假单胞菌。用于优化密码子以改善在细菌宿主中的表达的方法是本领域已知的并在文献中有描述。例如,在美国专利申请公开No.2007/0292918,“Codon Optimization Method”中描述了用于在假单胞菌宿主菌株中表达的密码子的优化,其全部内容通过引用合并于此。
在异源表达***中,优化步骤可以提高宿主产生外源蛋白质的能力。蛋白质表达受许多因素控制,包括那些影响转录、mRNA加工及稳定性和翻译起始的因素。多核苷酸优化步骤可以包括提高宿主产生外源蛋白质的能力的步骤,以及帮助研究人员高效地设计表达构建体的步骤。优化策略可以包括例如翻译起始区的修饰、mRNA结构元件的改变以及不同密码子偏倚的使用。优化其核酸序列以改善异源蛋白质在细菌宿主中的表达的方法是本领域已知的并在文献中描述。例如,在美国专利申请公开No.2007/0292918,“CodonOptimization Method”中描述了用于在假单胞菌宿主菌株中表达的密码子的优化,其全部内容通过引用合并于此。
优化解决了异源基因的多种序列特征中的任何一种。作为具体的例子,罕见密码子诱导的翻译暂停通常导致异源蛋白表达减少。罕见密码子诱导的翻译暂停包括目的多核苷酸中在宿主生物中很少使用的密码子的存在可能由于其在可用的tRNA池中的稀缺而对蛋白质翻译产生负面影响。一种提高宿主生物体中的最佳翻译的方法包括进行密码子优化,这有时导致罕见的宿主密码子从合成多核苷酸序列去除。
替代的翻译起始有时也导致异源蛋白质表达减少。替代的翻译起始包括无意地包含能够充当核糖体结合位点(RBS)的基序的合成多核苷酸序列。在一些情况下,这些位点导致从基因内部位点启动截短蛋白质的翻译。降低产生通常在纯化过程中难以去除的截短蛋白质的可能性的一种方法包括从优化的多核苷酸序列消除推定的内部RBS序列。
重复序列诱导的聚合酶滑动(polymerase slippage)通常导致异源蛋白质表达减少。重复序列诱导的聚合酶滑动涉及已显示引起DNA聚合酶滑动或断续(其有时导致移码突变)的核苷酸序列重复。这样的重复序列也经常引起RNA聚合酶的滑动。在具有高G+C含量偏倚的生物体中,有时会有更高程度的由G或C核苷酸重复组成的重复序列。因此,减少诱导RNA聚合酶滑动的可能性的一种方法包括改变延伸的G或C核苷酸重复序列。
干扰二级结构有时也导致异源蛋白质表达减少。二级结构通常隔绝RBS序列或起始密码子,并与蛋白质表达的减少相关。茎环结构也经常参与转录暂停和减弱。优化的多核苷酸序列通常在RBS和核苷酸序列的基因编码区中包含最少的二级结构,以允许改善的转录和翻译。
有时影响异源蛋白表达的另一个特征是限制性位点的存在。通过去除可能干扰转录单元随后亚克隆到宿主表达载体中的限制性位点,对多核苷酸序列进行优化。
例如,优化过程通常始于鉴定宿主异源表达的所需氨基酸序列。从该氨基酸序列设计候选多核苷酸或DNA。在合成DNA序列的设计过程中,密码子使用的频率通常与宿主表达生物体的密码子使用进行比较,并从合成序列中去除稀有的宿主密码子。另外,有时对合成的候选DNA序列进行修饰以去除不希望的酶限制性位点,并添加或去除任何所需的信号序列、接头或未翻译区。通常分析合成DNA序列中可能干扰翻译过程的二级结构如G/C重复序列和茎环结构的存在。在合成候选DNA序列之前,通常检查优化的序列设计以验证该序列正确编码所需的氨基酸序列。最后,使用DNA合成技术如本领域已知的那些合成候选DNA序列。
在本文的另一个实施方案中,宿主生物体如荧光假单胞菌中的通用密码子使用通常用于优化异源多核苷酸序列的表达。评价了很少被认为对于在宿主表达***中的特定氨基酸优选的密码子的百分比和分布。5%和10%使用的值通常用作确定稀有密码子的截止值。例如,表2中列出的密码子在荧光假单胞菌MB214基因组中具有小于5%的计算的出现率,并且一般在荧光假单胞菌宿主中表达的优化基因中避免。
Figure BDA0002498380930000241
本公开预期使用任何目的多肽或蛋白质编码序列,包括已经针对在所使用的假单胞菌宿主细胞中表达而优化的任何序列。预期使用的序列通常优化至所需的任何程度,包括但不限于优化以消除:假单胞菌宿主细胞中以低于5%出现的密码子、假单胞菌宿主细胞中以低于10%出现的密码子、罕见密码子诱导的翻译暂停、推定的内部RBS序列、G或C核苷酸的延伸重复序列、干扰二级结构、限制性位点或其组合。
此外,可用于实施本文提供的方法的任何分泌前导肽的氨基酸序列由任何合适的核酸序列编码。用于在大肠杆菌中表达的密码子优化由例如Welch等人,2009,PLoS One,“Design Parameters to Control Synthetic Gene Expression in Escherichia coli”,4(9):e7002,Ghane等人,2008,Krishna R.等人,(2008)Mol Biotechnology,“Optimization of the AT-content of Codons Immediately Downstream of theInitiation Codon and Evaluation of Culture Conditions for High-levelExpression of Recombinant Human G-CSF in Escherichia coli”38:221-232描述。
表达***
在一些情况下,本文的方法包括表达包含与分泌信号肽可操作地连接的目的蛋白质或多肽的多肽,所述分泌信号肽选自AnsB、8484或5193分泌信号序列,或基本上与本文中作为SEQ ID NO:1-3公开的分泌信号肽序列同源的序列。在实施方案中,分泌信号肽序列从假单胞菌宿主细胞中的表达构建体通过SEQ ID NO:4-6所示的核苷酸序列编码。在一些情况下,表达构建体是质粒。在一些实施方案中,编码目的多肽或蛋白质序列的质粒包含选择标记,并且维持该质粒的宿主细胞在选择性条件下生长。在一些实施方案中,质粒不包含选择标记。在一些实施方案中,表达构建体整合到宿主细胞基因组中。
用于表达异源蛋白质的方法,包括在宿主菌株(包括假单胞菌宿主菌株)中可用于本发明方法中调控序列(例如,启动子、分泌前导序列和核糖体结合位点),在例如美国专利No.7,618,799,“Bacterial leader sequences for increased expression”,美国专利No.7,985,564,“Expression systems with Sec-system secretion”,美国专利No.9,394,571和9,580,719,均题为“Method for Rapidly Screening Microbial Hosts toIdentify Certain Strains with Improved Yield and/or Quality in the Expressionof Heterologous Proteins”,美国专利No.9,453,251,“Expression of MammalianProteins in Pseudomonas fluorescens”,美国专利No.8,603,824,“Process forImproved Protein Expression by Strain Engineering”和美国专利No.8,530,171,“High Level Expression of Recombinant Toxin Proteins”中描述,其各自通过引用整体并入本文。在实施方案中,在本发明的情况中使用的分泌前导肽是如美国专利No.7,618,799、7,985,564、9,394,571、9,580,719、9,453,251、8,603,824和8,530,171中任一个公开的分泌前导肽。这些专利还描述了可用于实施本文的方法的细菌宿主菌株,其已被工程化以过表达折叠调节子,或其中已引入蛋白酶突变以增加异源蛋白质表达。
在实施方案中,用于本发明方法的表达菌株是实施例4中描述的任何表达菌株,如表13中所列的。在实施方案中,用于本发明方法的表达菌株是如表13中所列的具有实施例4中描述的表达菌株的背景表型的微生物表达菌株。在实施方案中,本发明方法中使用的表达菌株是如表13所列的具有实施例4中描述的表达菌株的背景表型的微生物表达菌株,且其中该菌株表达如表13所列的与相应的分泌前导肽融合的重组天冬酰胺酶。在实施方案中,本发明方法中使用的表达菌株是如表13所列的具有实施例4中描述的表达菌株STR57864、STR57865、STR57866、STR57860、STR57861、STR57862、STR57863的背景表型的微生物表达菌株,除了该表达菌株不是折叠调节子过表达体。在实施方案中,用于本发明方法中的表达菌株是如表13中所列的具有实施例4中描述的表达菌株STR57864、STR57865、STR57866、STR57860、STR57861、STR57862、STR57863的背景表型的微生物表达菌株,其在没有甘露醇的情况下培养。
启动子
根据本文方法使用的启动子可以是组成型启动子或调节型启动子。有用的调节型启动子的常见实例包括源自lac启动子的家族(即lacZ启动子)的那些启动子,尤其是授予DeBoer的美国专利No.4551433中描述的tac和trc启动子,以及Ptac16、Ptac17、PtacII、PlacUV5和T7lac启动子。在一个实施方案中,启动子不是源自宿主细胞生物体。在某些实施方案中,启动子源自大肠杆菌生物体。
根据本文的方法,诱导型启动子序列用于调节目的多肽或蛋白质的表达。在实施方案中,可用于本文方法中的诱导型启动子包括源自lac启动子的家族(即lacZ启动子)的那些启动子,特别是授予DeBoer的美国专利No.4551433中描述的tac和trc启动子,以及Ptac16、Ptac17、PtacII、PlacUV5和T7lac启动子。在一个实施方案中,启动子不是源自宿主细胞生物体。在某些实施方案中,启动子源自大肠杆菌生物体。在一些实施方案中,lac启动子用于调节从质粒的目的多肽或蛋白质的表达。在lac启动子衍生物或家族成员例如tac启动子的情况中,诱导剂是IPTG(异丙基-β-D-1-硫代半乳糖吡喃糖苷,也称为“异丙基硫代半乳糖苷”)。在某些实施方案中,IPTG添加到培养物中以在假单胞菌宿主细胞中诱导从lac启动子的目的多肽或蛋白质的表达。
根据本文的方法在表达***中有用的非lac型启动子的常见实例包括,例如,表3中列出的那些。
Figure BDA0002498380930000271
参见,例如,J.Sanchez-Romero&V.De Lorenzo(1999)Manual of IndustrialMicrobiology and Biotechnology(A.Demain&J.Davies,eds.)pp.460-74(ASM Press,Washington,D.C.);H.Schweizer(2001)Current Opinion in Biotechnology,12:439-445;R.Slater&R.Williams(2000Molecular Biology and Biotechnology(J.Walker&R.Rapley,eds.)pp.125-54(The Royal Society of Chemistry,Cambridge,UK);和L.-M.Guzman等人,1995,J.Bacteriol.177(14):4121-4130,其全部通过引用并入本文。具有所选择细菌宿主细胞天然的启动子的核苷酸序列的启动子也可用于控制编码重组目的蛋白质或多肽的转基因的表达,例如假单胞菌邻氨基苯甲酸盐或苯甲酸盐操纵子启动子(Pant,Pben)。也可以使用串联启动子,其中多于一个的启动子与另一个启动子共价连接,无论序列相同还是不同,例如,Pant-Pben串联启动子(启动子间杂合体)或Plac-Plac串联启动子,或者是否源自相同或不同的生物体。
调节型启动子利用启动子调节蛋白从而控制该启动子是其部分的基因的转录。在本文中使用调节型启动子的情况下,相应的启动子调节蛋白也是根据本文的方法的表达***的部分。启动子调节蛋白的实例包括:激活蛋白,例如大肠杆菌分解代谢物激活蛋白;MalT蛋白;AraC家族转录激活因子;阻遏蛋白,例如大肠杆菌LacI蛋白;以及双重功能调节蛋白,例如大肠杆菌NagC蛋白。许多调节型启动子/启动子调节蛋白对是本领域已知的。在一个实施方案中,靶蛋白和异源目的蛋白质的表达构建体在相同调控元件的控制下。
启动子调节蛋白与效应化合物(即与调节蛋白可逆或不可逆地结合的化合物)相互作用以使该蛋白质能够释放或结合于该启动子控制下的基因的至少一个DNA转录调节区域,从而允许或阻断转录酶在启动基因转录中的作用。效应化合物被分类为诱导剂或共阻遏物,并且这些化合物包括天然效应化合物和安慰诱导剂化合物。许多调节型启动子/启动子调节蛋白/效应化合物三元组是本领域已知的。尽管在一些情况下,效应化合物会在整个细胞培养或发酵过程中使用,但在其中使用调节型启动子的一个实施方案中,在所需量或密度的宿主细胞生物质生长后,合适的效应化合物添加到培养物以直接或间接导致编码目的蛋白质或多肽的所需基因的表达。
在其中使用lac家族启动子的实施方案中,***中有时存在lacI基因。lacI基因,其通常是组成性表达的基因,编码Lac阻遏蛋白LacI蛋白,其与lac家族启动子的lac操纵基因结合。因此,在使用lac家族启动子的情况下,有时还包括lacI基因并在表达***中表达。
假单胞菌中有用的启动子***在文献中,例如美国专利申请公开No.2008/0269070中描述,其也在上面引用。
其它调控元件
在实施方案中,表达载体包含最佳核糖体结合序列。通过改变目的蛋白质的翻译起始区来调节翻译强度可用于提高异源胞质蛋白质(其由于翻译速率太快而主要作为包涵体累积)的产生。还可以通过优化而不是最大化蛋白质翻译水平来增强异源蛋白质向细菌细胞周质空间中的分泌,以使得翻译速率与蛋白质分泌速率同步。
翻译起始区被定义为在核糖体结合位点(RBS)的紧邻上游延伸至起始密码子下游约20个核苷酸的序列(McCarthy等人(1990)Trends in Genetics 6:78-85,通过引用整体并入本文)。在原核生物中,可以通过使用Shine和Dalgarno(Proc.Natl.Acad.Sci.USA 71:1342-1346,1974)所描述的规范或共有RBS序列(AGGAGG;SEQ ID NO:11)提供相对于翻译水平降低的翻译速率而利用替代RBS序列来优化异源蛋白质的翻译水平。“翻译速率”或“翻译效率”是指细胞内mRNA翻译成蛋白质的速率。在大多数原核生物中,Shine-Dalgarno序列通过与16S核糖体RNA的富嘧啶区域相互作用而帮助30S核糖体组分相对于mRNA上的起始密码子的结合和定位。RBS(在本文中也称为Shine-Dalgarno序列)位于转录起始下游和翻译起始上游的mRNA上,其通常为起始密码子上游的4至14个核苷酸,更通常是起始密码子上游的8至10个核苷酸。由于RBS序列在翻译中的作用,翻译效率与RBS序列的效率(或强度)之间存在直接关系。
在一些实施方案中,RBS序列的修饰导致异源蛋白质翻译速率的降低。翻译速率的这种降低可能对应于每克所产生的蛋白质或每克宿主蛋白质的适当加工蛋白质或多肽水平的提高。降低的翻译速率还可以与每克重组体或每克宿主细胞蛋白质的所产生的可回收蛋白质或多肽水平的提高相关。降低的翻译速率还可以对应于表达增加、活性提高、溶解度增加或转位增加(例如向周质区室或分泌到细胞外空间中)的任何组合。在该实施方案中,术语“增加”是相对于在相同条件下表达目的蛋白质或多肽时和其中编码该多肽的核苷酸序列包含规范RBS序列所产生的、适当加工的、可溶的和/或可回收的蛋白质或多肽的水平。类似地,术语“降低”是相对于其中编码蛋白质或多肽的基因包含规范RBS序列的目的蛋白质或多肽的翻译速率。可以将翻译速率降低至少约5%、至少约10%、至少约15%、至少约20%、约25%、约30%、约35%、约40%、约45%、约50%、约55%、约60%、约65%、约70%、至少约75%或更多、或至少约2倍、约3倍、约4倍、约5倍、约6倍、约7倍或更多。
在一些实施方案中,本文描述的RBS序列变体可以分类为导致高、中等或低翻译效率。在一个实施方案中,序列根据与规范RBS序列的翻译活性相比的翻译活性水平进行分级。高RBS序列具有规范序列活性的约60%至约100%。中等RBS序列具有规范序列活性的约40%至约60%。低RBS序列具有低于约40%的规范序列的活性。
RBS序列的实例显示在表4中。使用COP-GFP作为报告基因对序列进行翻译强度的筛选,并根据共有RBS荧光的百分比分级。每个RBS变体被置于以下三个总体荧光等级之一中:高(“Hi”-100%的共有RBS荧光)、中等(“Med”-46-51%的共有RBS荧光)和低(“Lo”-16-29%的共有RBS荧光)。
Figure BDA0002498380930000301
除蛋白质编码序列外,可用于实施本文方法的表达构建体包括与其可操作地连接的以下调控元件:启动子、核糖体结合位点(RBS)、转录终止子以及翻译起始和终止信号。有用的RBS根据例如美国专利申请公开No.2008/0269070和美国专利系列No.12/610,207从可用作表达***中的宿主细胞的任何种类获得。许多特异性的和多种共有的RBS是已知的,例如D.Frishman等人,Gene 234(2):257-65(8Jul.1999)和B.E.Suzek等人,Bioinformatics17(12):1123-30(December 2001)中描述和提及的那些。另外,可以使用天然或合成的RBS,例如,在EP 0207459(合成的RBS);O.Ikehata等人,Eur.J.Biochem.181(3):563-70(1989)中描述的那些。方法、载体及翻译和转录元件以及在本文的方法中有用的其他元件的进一步实例描述于例如授予Gilroy的美国专利No.5,055,294和授予Gilroy等人的美国专利No.5,128,130,授予Rammler等人的美国专利No.5,281,532,授予Barnes等人的美国专利No.4,695,455和4,861,595,授予Gray等人的美国专利No.4,755,465,和授予Wilcox的美国专利No.5,169,760中。
宿主菌株
细菌宿主(包括假单胞菌)和紧密相关的细菌生物体预期用于实施本文的方法。在某些实施方案中,假单胞菌宿主细胞是荧光假单胞菌。在一些情况下,宿主细胞是大肠杆菌细胞。
使用本领域已知的并且在文献中,例如在美国专利申请公开No.2009/0325230,“Protein Expression Systems”(通过引用整体并入本文)中描述的试剂和方法鉴定或制备可用于实施本文方法的宿主细胞和构建体。该公开描述了通过将核酸构建体引入包含染色体lacI基因***序列的营养缺陷型荧光假单胞菌宿主细胞中来产生重组多肽。核酸构建体包含编码重组多肽的核苷酸序列,其可操作地连接于能够指导核酸在宿主细胞中表达的启动子,并且也包含编码营养缺陷选择标记的核苷酸序列。营养缺陷选择标记是对营养缺陷型宿主细胞恢复原养性的多肽。在实施方案中,细胞对于脯氨酸、尿嘧啶或其组合是营养缺陷的。在实施方案中,宿主细胞源自MB101(ATCC保藏号PTA-7841)。美国专利申请公开No.2009/0325230,“Protein Expression Systems”以及Schneider等人,2005,“Auxotrophic markers pyrF and proC,in some cases,replace antibiotic markerson protein production plasmids in high-cell-density Pseudomonas fluorescensfermentation”,Biotechnol.Progress 21(2):343-8(两者均通过引用整体并入本文)描述了通过删除菌株MB101中的pyrF基因构建的尿嘧啶营养缺陷的生产宿主菌株。pyrF基因从菌株MB214(ATCC保藏号PTA-7840)克隆以生成补偿pyrF缺失以恢复原养性的质粒。在特定的实施方案中,使用荧光假单胞菌宿主细胞中的双重pyrF-proC双营养缺陷选择标记***。如所描述的pyrF缺失的生产宿主菌株通常用作引入其它所需基因组变化的背景,包括本文描述为可用于实施本文方法的那些。
在实施方案中,宿主细胞是假单胞菌目(Pseudomonadales)的。在宿主细胞属于假单胞菌目的情况下,它可能是假单胞菌科(Pseudomonadaceae)的成员,包括假单胞菌属(Pseudomonas)。γ变形杆菌宿主包括大肠杆菌种的成员和荧光假单胞菌种的成员。假单胞菌目、假单胞菌科或假单胞菌属的宿主细胞可由本领域技术人员鉴定,并且在文献中有描述(例如,Bergey’s Manual of Systematics of Archaea and Bacteria(在线出版,2015))。另外,在这类菌株中,可以使用本领域众所周知的方法使蛋白酶失活,并引入折叠调节子过表达构建体。
本领域技术人员应理解,可使用可公开获得的宿主细胞,例如荧光假单胞菌MB101,例如通过使用本领域已知的和文献中所描述的许多合适方法中的任何一种使pyrF基因灭活来产生可用于本发明方法中的生产宿主菌株。还应理解,可以使用本领域已知的和文献中所描述的许多合适方法中的任何一种将原养恢复质粒转化到菌株中,例如携带来自菌株MB214的pyrF基因的质粒。另外,在这些菌株中,可以使用本领域众所周知的方法使蛋白酶失活,并引入折叠调节子过表达构建体。
其他假单胞菌生物体也可能是有用的。假单胞菌和密切相关的物种包括革兰氏阴性变形杆菌亚组1,其包括属于Bergey’s Manual of Systematics of Archaea andBacteria(在线出版,2015)中描述的科和/或属的变形杆菌的组。表5列出了生物体的这些科和属。
Figure BDA0002498380930000331
假单胞菌和密切相关的细菌通常是被定义为“格兰氏(-)变形杆菌亚组1”或“格兰氏阴性需氧杆菌和球菌”(Bergey’s Manual of Systematics of Archaea and Bacteria(在线出版,2015))的组的部分。假单胞菌宿主菌株在文献中,例如在上面引用的美国专利申请公开No.2006/0040352中描述。
“革兰氏阴性变形杆菌亚组1”还包括根据分类中使用的标准分类在该标题下的变形杆菌。该标题还包括先前分类在该部分中但不再如此分类的组,如食酸菌属(Acidovorax)、短孢单胞菌属(Brevundimonas)、伯克霍尔德氏菌属(Burkholderia)、氢噬菌属(Hydrogenophaga)、海洋单胞菌属(Oceanimonas)、劳尔氏菌属(Ralstonia)和寡养单胞菌属(Stenotrophomonas)、鞘氨醇单胞菌属(Sphingomonas)(以及由此衍生的芽单胞菌属(Blastomonas)),其通过重新组合属于黄单胞菌属(Xanthomonas)(且以前称为该属的种)的生物体而创建、酸单胞菌属(Acidomonas),其通过重新组合属于如Bergey’s Manualof Systematics of Archaea and Bacteria(在线出版,2015)中定义的醋杆菌属的生物体而创建。另外,宿主包括来自假单胞菌属的细胞,黄花假单胞菌(Pseudomonas enalia)(ATCC 14393)、生黑假单胞菌(Pseudomonas nigrifaciensi)(ATCC 19375)和腐败假单胞菌(Pseudomonas putrefaciens)(ATCC 8071),它们分别被重新分类为河豚毒素交替单胞菌(Alteromonas haloplanktis)、产黑交替单胞菌(Alteromonas nigrifaciens)和腐败交替单胞菌(Alteromonas putrefaciens)。类似地,例如,食酸假单胞菌(Pseudomonasacidovorans)(ATCC 15668)和***假单胞菌(Pseudomonas testosterone)(ATCC11996)已经被分别重新分类为食酸丛毛单胞菌(Comamonas acidovorans)和***丛毛单胞菌(Comamonas testosterone);且生黑假单胞菌(ATCC 19375)和杀鱼假单胞菌(Pseudomonas piscicida)(ATCC 15057)已经被分别重新分类为生黑假交替单胞菌(Pseudoalteromonas nigrifaciens)和杀鱼假交替单胞菌(Pseudoalteromonaspiscicida)。“革兰氏阴性变形杆菌亚组1”还包括分类为属于以下任何科的变形杆菌:假单胞菌科、固氮菌科(Azotobacteraceae)(现在通常以同义词即假单胞菌科的“固氮菌组”称呼)、根瘤菌科(Rhizobiaceae)和甲基单胞菌科(Methylomonadaceae)(现在通常以同义词即“甲基球菌科(Methylococcaceae)”称呼)。因此,除了本文另外描述的那些属之外,落入“革兰氏阴性变形杆菌亚组1”内的其它变形杆菌属包括:1)嗜氮根瘤菌属(Azorhizophilus)的固氮菌组细菌;2)纤维弧菌属(Cellvibrio)、寡源杆菌属(Oligella)和Teredinibacter的假单胞菌科细菌;3)螯合杆菌属(Chelatobacter)、剑菌属(Ensifer)、韧皮杆菌属(Liberibacter)(也称为“柑橘黄龙病菌(Candidatus Liberibacter)”)和中华根瘤菌属(Sinorhizobium)的根瘤菌科细菌;及4)甲基杆菌属(Methylobacter)、甲基暖菌属(Methylocaldum)、甲基微菌属(Methylomicrobium)、甲基八叠球菌属(Methylosarcina)和甲基球形菌属(Methylosphaera)的甲基球菌科细菌。
在一些情况下,宿主细胞选自“革兰氏阴性变形杆菌亚组16”。“革兰氏阴性变形杆菌亚组16”定义为以下假单胞菌种(示例性菌株的ATCC或其他保藏号在括号中显示)的变形杆菌的组:嗜松香假单胞菌(Pseudomonas abietaniphila)(ATCC 700689);铜绿假单胞菌(Pseudomonas aeruginosa)(ATCC 10145);产碱假单胞菌(Pseudomonas alcaligenes)(ATCC 14909);鳗败血假单胞菌(Pseudomonas anguilliseptica)(ATCC 33660);香茅醇假单胞菌(Pseudomonas citronellolis)(ATCC 13674);变黄假单胞菌(Pseudomonasflavescens)(ATCC 51555);门多萨假单胞菌(Pseudomonas mendocina)(ATCC 25411);硝基还原假单胞菌(Pseudomonas nitroreducens)(ATCC 33634);食油假单胞菌(Pseudomonas oleovorans)(ATCC 8062);类产碱假单胞菌(Pseudomonaspseudoalcaligenes)(ATCC 17440);食树脂假单胞菌(Pseudomonas resinovorans)(ATCC14235);稻草假单胞菌(Pseudomonas straminea)(ATCC 33636);伞菌假单胞菌(Pseudomonas agarici)(ATCC25941);嗜碱假单胞菌(Pseudomonas alcaliphila);海藻假单胞菌(Pseudomonas alginovora);安氏假单胞菌(Pseudomonas andersonii);铁角蕨假单胞菌(Pseudomonas asplenii)(ATCC 23835);壬二酸假单胞菌(Pseudomonas azelaica)(ATCC 27162);拜氏假单胞菌(Pseudomonas beyerinckii)(ATCC 19372);Pseudomonasborealis;北城假单胞菌(Pseudomonas boreopolis)(ATCC 33662);油菜假单胞菌(Pseudomonas brassicacearum);食丁酸假单胞菌(Pseudomonas butanovora)(ATCC43655);纤维素假单胞菌(Pseudomonas cellulosa)(ATCC 55703);桔黄假单胞菌(Pseudomonas aurantiaca)(ATCC 33663);绿针假单胞菌(Pseudomonas chlororaphis)(ATCC 9446,ATCC13985,ATCC 17418,ATCC 17461);莓实假单胞菌(Pseudomonas fragi)(ATCC 4973);海雀假单胞菌(Pseudomonas lundensis)(ATCC 49968);腐臭假单胞菌(Pseudomonas taetrolens)(ATCC 4683);青紫葛假单胞菌(Pseudomonas cissicola)(ATCC 33616);晕斑假单胞菌(Pseudomonas coronafaciens);Pseudomonasditerpeniphila;伸长假单胞菌(Pseudomonas elongata)(ATCC10144);弯曲假单胞菌(Pseudomonas flectens)(ATCC12775);产氮假单胞菌(Pseudomonas azotoformans);布氏假单胞菌(Pseudomonas brenneri);Pseudomonas cedrella;起皱假单胞菌(Pseudomonascorrugate)(ATCC 29736);极端东方化假单胞菌(Pseudomonas extremorientalis);荧光假单胞菌(Pseudomonas fluorescens)(ATCC 35858);盖氏假单胞菌(Pseudomonasgessardii);黎巴嫩假单胞菌(Pseudomonas libanensis);曼氏假单胞菌(Pseudomonasmandelii)(ATCC 700871);边缘假单胞菌(Pseudomonas marginalis)(ATCC 10844);米氏假单胞菌(Pseudomonas migulae);霉味假单胞菌(Pseudomonas mucidolens)(ATCC4685);东方假单胞菌(Pseudomonas orientalis);罗氏假单胞菌(Pseudomonasrhodesiae);产黄假单胞菌(Pseudomonas synxantha)(ATCC 9890);托拉氏假单胞菌(Pseudomonas tolaasii)(ATCC 33618);维罗纳假单胞菌(Pseudomonas veronii)(ATCC700474);Pseudomonas frederiksbergensis;弯曲假单胞菌(Pseudomonas geniculata)(ATCC 19374);姜黄色假单胞菌(Pseudomonas gingeri);革兰氏假单胞菌(Pseudomonasgraminis);格氏假单胞菌(Pseudomonas grimontii);盐脱氮假单胞菌(Pseudomonashalodenitrificans);嗜盐假单胞菌(Pseudomonas halophila);栖木槿假单胞菌(Pseudomonas hibiscicola)(ATCC 19867);哈特假单胞菌(Pseudomonas huttiensis)(ATCC 14670);噬氢假单胞菌(Pseudomonas hydrogenovora);杰氏假单胞菌(Pseudomonasjessenii)(ATCC 700870);基尔假单胞菌(Pseudomonas kilonensis);柳叶刀假单胞菌(Pseudomonas lanceolata)(ATCC 14669);Pseudomonas lini;划界假单胞菌(Pseudomonas marginata)(ATCC 25417);臭味假单胞菌(Pseudomonas mephitica)(ATCC33665);脱氮假单胞菌(Pseudomonas denitrificans)(ATCC 19244);穿孔假单胞菌(Pseudomonas pertucinogena)(ATCC 190);皮克特假单胞菌(Pseudomonas pictorum)(ATCC 23328);嗜冷假单胞菌(Pseudomonas psychrophila);黄褐假单胞菌(Pseudomonasfilva)(ATCC 31418);蒙氏假单胞菌(Pseudomonas monteilii)(ATCC 700476);莫氏假单胞菌(Pseudomonas mosselii);栖稻假单胞菌(Pseudomonas oryzihabitans)(ATCC43272);杀香鱼假单胞菌(Pseudomonas plecoglossicida)(ATCC 700383);恶臭假单胞菌(Pseudomonas putida)(ATCC 12633);Pseudomonas reactans;多刺假单胞菌(Pseudomonas spinosa)(ATCC 14606);巴利阿里假单胞菌(Pseudomonas balearica);浅黄假单胞菌(Pseudomonas luteola)(ATCC 43273);施氏假单胞菌(Pseudomonasstutzeri)(ATCC17588);扁桃假单胞菌(Pseudomonas amygdali)(ATCC 33614);榛色假单胞菌(Pseudomonas avellanae)(ATCC 700331);番木瓜假单胞菌(Pseudomonascaricapapayae)(ATCC 33615);菊苣假单胞菌(Pseudomonas cichorii)(ATCC 10857);天仙果假单胞菌(Pseudomonas ficuserectae)(ATCC 35104);褐鞘假单胞菌(Pseudomonasfuscovaginae);苦楝假单胞菌(Pseudomonas meliae)(ATCC 33050);丁香假单胞菌(Pseudomonas syringae)(ATCC 19310);绿黄假单胞菌(Pseudomonas viridiflava)(ATCC13223);Pseudomonas thermocarboxydovorans(ATCC 35961);耐热假单胞菌(Pseudomonasthermotolerans);赛维瓦尔假单胞菌(Pseudomonas thivervalensis);温哥华假单胞菌(Pseudomonas vancouverensis)(ATCC 700688);威斯康星假单胞菌(Pseudomonaswisconsinensis)和厦门假单胞菌(Pseudomonas xiamenensis)。在一个实施方案中,用于表达目的多肽或蛋白质的宿主细胞是荧光假单胞菌。
在一些情况下,宿主细胞选自“革兰氏阴性变形杆菌亚组17”。“革兰氏阴性变形杆菌亚组17”定义为被定义为本领域中称为“发荧光的假单胞菌”的变形杆菌的组,包括例如属于下列假单胞菌种的那些:生氮假单胞菌;布氏假单胞菌;Pseudomonas cedrella;Pseudomonas cedrina;起皱假单胞菌;极端东方化假单胞菌;荧光假单胞菌;盖氏假单胞菌、黎巴嫩假单胞菌;孟氏假单胞菌;边缘假单胞菌;米氏假单胞菌;霉味假单胞菌;东方假单胞菌;罗氏假单胞菌;产黄假单胞菌;托拉氏假单胞菌和维罗纳假单胞菌。
蛋白酶
在一个实施方案中,本文提供的方法包括使用假单胞菌宿主细胞,其包含一个或多个蛋白酶基因中的一个或多个突变(例如,部分或完全缺失),以产生目的多肽或蛋白质。在一些实施方案中,蛋白酶基因中的突变促进可溶性目的多肽或蛋白质的产生。
示例性的目标蛋白酶基因包括分类为氨基肽酶、二肽酶、二肽基肽酶和三肽基肽酶、肽基二肽酶、丝氨酸型羧肽酶、金属羧肽酶、半胱氨酸型羧肽酶、Ω肽酶、丝氨酸蛋白酶、半胱氨酸蛋白酶、天冬氨酸蛋白酶、金属蛋白酶或未知机制的蛋白酶的那些蛋白酶。
氨基肽酶包括胞质溶胶氨基肽酶(亮氨酰氨基肽酶)、膜丙氨酰氨基肽酶、胱氨酰氨基肽酶、三肽氨基肽酶、脯氨酰氨基肽酶、精氨酰氨基肽酶、谷氨酰氨基肽酶、x-pro氨基肽酶、细菌亮氨酰氨基肽酶、嗜热氨基肽酶、梭菌氨基肽酶、胞质溶胶丙氨酰氨基肽酶、赖氨酰氨基肽酶、x-trp氨基肽酶、色氨酰氨基肽酶、甲硫氨酰氨基肽酶、d-立体特异性氨基肽酶、氨基肽酶ey。二肽酶包括包括x-his二肽酶、x-arg二肽酶、x-甲基-his二肽酶、cys-gly二肽酶、glu-glu二肽酶、pro-x二肽酶、x-pro二肽酶、met-x二肽酶、非立体特异性二肽酶、胞质溶胶非特异性二肽酶、膜二肽酶、β-ala-his二肽酶。二肽基肽酶和三肽基肽酶包括二肽基肽酶i、二肽基肽酶ii、二肽基肽酶iii、二肽基肽酶iv、二肽基二肽酶、三肽基肽酶I、三肽基肽酶II。肽基二肽酶包括肽基二肽酶a和肽基二肽酶b。丝氨酸型羧肽酶包括溶酶体pro-x羧肽酶、丝氨酸型D-ala-D-ala羧肽酶、羧肽酶C、羧肽酶D。金属羧肽酶包括羧肽酶a、羧肽酶B、赖氨酸(精氨酸)羧肽酶、gly-X羧肽酶、丙氨酸羧肽酶、胞壁酰五肽羧肽酶、羧肽酶h、谷氨酸羧肽酶、羧肽酶M、胞壁酰四肽羧肽酶、锌d-ala-d-ala羧肽酶、羧肽酶A2、膜pro-x羧肽酶、微管蛋白基-tyr羧肽酶、羧肽酶t。Ω肽酶包括酰基氨基酰基肽酶、肽基甘胺酰胺酶、焦谷氨酰肽酶I、β-天冬氨酰肽酶、焦谷氨酰肽酶II、n-甲酰基甲硫氨酰肽酶、蝶酰基聚-[γ]-谷氨酸羧肽酶、γ-glu-X羧肽酶、酰基胞壁酰-ala肽酶。丝氨酸蛋白酶包括胰凝乳蛋白酶、胰凝乳蛋白酶C、metridin、胰蛋白酶、凝血酶、凝血因子Xa、纤溶酶、肠肽酶、***、α分解蛋白酶、谷氨酰、内肽酶、组织蛋白酶G、凝血因子VIIa、凝血因子IXa、cucumisi、脯氨酰寡肽酶、凝血因子XIa、速尿素、血浆激肽释放酶、组织激肽释放酶、胰弹性蛋白酶、白细胞弹性蛋白酶、凝血因子XIIa、糜酶、补体成分c1r55、补体成分c1s55、经典补体途径c3/c5转化酶、补体因子I、补体因子D、替代补体途径c3/c5转化酶、干酵母菌(cerevisin)、皮蝇素C、赖氨酰内肽酶、内肽酶1a、gamma-reni、蛇毒类凝血酶(venombin)ab、亮氨酰内肽酶、类胰蛋白酶、scutelarin、kexin、枯草杆菌蛋白酶、oryzin、内肽酶k、高温真菌蛋白酶(thermomycolin)、嗜热蛋白酶(thermitase)、内肽酶SO、T-纤溶酶原激活剂、蛋白C、胰内肽酶E、胰弹性蛋白酶ii、IGA特异性丝氨酸内肽酶、U-纤溶酶原、激活剂、蛇毒类凝血酶A、弗林蛋白酶、成髓细胞素、精原酶(semenogelase)、颗粒酶A或细胞毒性T淋巴细胞蛋白酶1、颗粒酶B或细胞毒性T淋巴细胞蛋白酶2、链球菌素(streptogrisin)A、treptogrisin B、谷氨酰内肽酶II、寡肽酶B、鲎凝血因子c、鲎凝血因子、鲎凝血酶、omptin、阻遏物lexa、细菌前导肽酶I、togavirin、flavirin。半胱氨酸蛋白酶包括组织蛋白酶B、木瓜蛋白酶、无花果蛋白酶、木瓜凝乳蛋白酶、萝蘼蛋白酶(asclepain)、梭菌蛋白酶、链菌蛋白酶(streptopain)、actinide、组织蛋白酶1、组织蛋白酶H、钙蛋白酶、组织蛋白酶t、甘氨酰,内肽酶、癌性促凝血酶、组织蛋白酶S、picornain3C、picornain 2A、番木瓜蛋白酶(caricain)、菠萝蛋白酶(ananain)、茎菠萝蛋白酶、果菠萝蛋白酶、豆荚蛋白(legumain)、组织溶菌素(histolysain)、白介素1-β转化酶。天冬氨酸蛋白酶包括胃蛋白酶A、胃蛋白酶B、胃亚蛋白酶(gastricsin)、凝乳酶、组织蛋白酶D、neopenthesin、肾素、逆转录胃蛋白酶(retropepsin)、阿黑皮素原转化酶、曲霉胃蛋白酶(aspergillopepsin)I、曲霉胃蛋白酶II、青霉胃蛋白酶、根霉胃蛋白酶、内座壳菌胃蛋白酶(endothiapepsin)、毛霉胃蛋白酶(mucoropepsin)、念珠菌胃蛋白酶(candidapepsin)、酵母胃蛋白酶(saccharopepsin)、红酵母胃蛋白酶(rhodotorulapepsin)、绒泡粘菌胃蛋白酶(physaropepsin)、顶柱霉胃蛋白酶(acrocylindropepsin)、多孔菌胃蛋白酶(polyporopepsin)、密孔菌胃蛋白酶(pycnoporopepsin)、柱顶孢霉胃蛋白酶(scytalidopepsin)a、柱顶孢霉胃蛋白酶b、黄单胞菌胃蛋白酶、组织蛋白酶e、屏障胃蛋白酶(barrierpepsin)、细菌前导肽酶I、假单胞菌胃蛋白酶、疟原虫胃蛋白酶(plasmepsin)。金属蛋白酶包括大响尾蛇金属内肽酶(atrolysin)a、微生物胶原酶、白细胞溶素、间质胶原酶、脑啡肽酶(neprilysin)、envelysin、iga特异性金属内肽酶、前胶原N-内肽酶、甲拌磷寡肽酶、神经溶素、溶基质素1、穿膜肽酶A、前胶原C-内肽酶、肽基-lys金属内肽酶、虾红素、溶基质素2、基质溶素明胶酶、气单胞菌溶素(aeromonolysin)、假单胞菌溶素(pseudolysin)、嗜热菌蛋白酶(thermolysin)、杆菌溶素、金黄色葡萄球菌溶素(aureolysin)、球菌溶素(coccolysin)、mycolysin、β-裂解金属内肽酶、肽基-asp金属内肽酶、嗜中性粒细胞胶原酶、明胶酶B、利什曼原虫溶素(leishmanolysin)、酵母溶素溶素(saccharolysin)、自溶素、deuterolysin、serralysin、大响尾蛇金属内肽酶B、大响尾蛇金属内肽酶C、纤溶蛋白酶(atroxase)、大响尾蛇金属内肽酶E、大响尾蛇金属内肽酶F、去整合素基质金属蛋白酶(adamalysin)、horrilysin、ruberlysin、蝮蛇止血素(bothropasin)、蝮蛇溶素(bothrolysin)、ophiolysin、竹叶青蛇溶素(trimerelysin)I、竹叶青蛇溶素II、mucrolysin、溶加压素(pitrilysin)、胰岛素溶素(insulysin)、O-唾液酸糖蛋白内肽酶、圆斑蝰蛇溶素溶素(russellysin)、线粒体,中间,肽酶、dactylysin、nardilysin、magnolysin、穿膜肽酶B、线粒体加工肽酶、巨噬细胞弹性蛋白酶、绒毛溶素(choriolysin)、毒素溶素(toxilysin)。未知机制的蛋白酶包括thermopsin和多催化内肽酶复合物。
某些蛋白酶同时具有蛋白酶和伴侣蛋白(chaperone)样活性。当这些蛋白酶对蛋白质的产率和/或质量产生负面影响时,使其蛋白酶活性特异性缺失经常是有用的,并且当它们的伴侣蛋白活性可对蛋白质的产率和/或质量产生积极影响时,它们被过表达。这些蛋白酶包括但不限于:Hsp100(Clp/Hsl)家族成员RXF04587.1(clpA)、RXF08347.1、RXF04654.2(clpX)、RXF04663.1、RXF01957.2(hslU)、RXF01961.2(hslV);肽基-脯氨酰顺反异构酶家族成员RXF05345.2(ppiB);金属肽酶M20家族成员RXF04892.1(氨基水解酶);金属肽酶M24家族成员RXF04693.1(蛋氨酸氨肽酶)和RXF03364.1(蛋氨酸氨肽酶);和丝氨酸肽酶S26信号肽酶I家族成员RXF01181.1(信号肽酶)。
这些和其他蛋白酶和折叠调节子是本领域已知的并且描述在文献,例如美国专利号8,603,824中。例如,该专利的表D描述了Tig(tig、触发因子、FKBP型ppiase(ec 5.2.1.8)RXF04655、UniProtKB-P0A850(TIG_ECOLI))。WO 2008/134461和美国专利No.9,394,571,名称为"Method for Rapidly Screening Microbial Hosts to Identify Certain Strainswith Improved Yield and/or Quality in the Expression of HeterologousProteins"并通过引用整体并入本文,描述了Tig(RXF04655.2,其中的SEQ ID NO:34)、LepB(RXF01181.1,其中的SEQ ID NO:56)、DegP1(RXF01250,其中的SEQ ID NO:57)、AprA(RXF04304.1,其中的SEQ ID NO:86)、Prc1(RXF06586.1,其中的SEQ ID NO:120)、DegP2(RXF07210.1,其中的SEQ ID NO:124)、Lon(RXF04653,其中的SEQ ID NO:92);DsbA(RXF01002.1,其中的SEQ ID NO:25),和DsbC(RXF03307.1,其中的SEQ ID NO:26)。这些序列以及用于其他蛋白酶和折叠调节子的那些也在美国专利号9,580,719中示出(其中第93-98列中的SEQ ID NO的表格)。例如,美国专利号9,580,719提供了分别作为SEQ ID NO:18和19编码HslU(RXF01957.2)和HslV(RXF01961.2)的序列。
高通量筛选
在实施方案中,经常进行高通量筛选以确定用于表达重组目的多肽或蛋白质的最佳条件。在筛选中可以变化的条件包括例如宿主细胞、宿主细胞的基因背景(例如不同蛋白酶的缺失)、表达构建体中启动子的类型、与编码的目的多肽或蛋白质融合的分泌前导肽的类型、生长温度、使用诱导型启动子时的诱导OD、诱导剂添加量(例如使用lacZ启动子或其衍生物时用于诱导的IPTG的量)、蛋白质诱导的持续时间、向培养物中添加诱导剂后的生长温度、培养物的搅动速度、质粒维持的选择方法、容器中的培养体积和细胞裂解方法。
在一些实施方案中,提供了宿主菌株的文库(或"阵列"),其中已对文库中的每个菌株(或"宿主细胞群体")进行遗传修饰以调节一个或多个靶基因在宿主细胞中的表达。"最佳宿主菌株"或"最佳表达***"通常基于表达的目的蛋白与阵列中的表型上不同的其他宿主细胞群体相比的数量、质量和/或位置来确定或选择。因此,最佳宿主菌株是根据期望的规格产生目的多肽的菌株。尽管期望的规格根据所产生的多肽而变化,但该规格包括蛋白的质量和/或数量、蛋白质是否被隔离或分泌、蛋白折叠等。例如,最佳宿主菌株或最佳表达***产生通过特定的绝对水平或相对于指标菌株(即用于比较的菌株)产生的特定水平表征的可溶性异源蛋白质的量、可回收异源蛋白质的量、适当加工的异源蛋白质的量、适当折叠的异源蛋白质的量、活性异源蛋白质的量和/或异源蛋白质的总量的产率。
筛选微生物宿主以鉴定在异源蛋白质的表达方面具有改善的产率和/或质量的菌株的方法描述于例如美国专利申请公开号20080269070中。
细菌生长条件
可用于本文方法的生长条件通常包括约4℃至约42℃的温度和约5.7至约8.8的pH。当使用具有lacZ启动子或其衍生物的表达构建体时,表达通常通过以约0.01mM至约1.0mM的终浓度添加IPTG至培养物中来诱导。
有时使用pH缓冲剂和本领域技术人员已知的方法来维持培养物的pH。通常也使用氨水来实现培养期间对pH的控制。在实施方案中,培养物的pH是约5.7至约8.8。在某些实施方案中,pH是约5.7、5.8、5.9、6.0、6.1、6.2、6.3、6.4、6.5、6.6、6.7、6.8、6.9、7.0、7.1、7.2、7.3、7.4、7.5、7.6、7.7、7.8、7.9、8.0、8.1、8.2、8.3、8.4、8.5、8.6、8.7或8.8。在其他实施方案中,pH是约5.7至5.9、5.8至6.0、5.9至6.1、6.0至6.2、6.1至6.3、6.2至6.5、6.4至6.7、6.5至6.8、6.6至6.9、6.7至7.0、6.8至7.1、6.9至7.2、7.0至7.3、7.1至7.4、7.2至7.5、7.3至7.6、7.4至7.7、7.5至7.8、7.6至7.9、7.7至8.0、7.8至8.1、7.9至8.2、8.0至8.3、8.1至8.4、8.2至8.5、8.3至8.6、8.4至8.7或8.5至8.8。在又一些实施方案中,pH是约5.7至6.0、5.8至6.1、5.9至6.2、6.0至6.3、6.1至6.4或6.2至6.5。在某些实施方案中,pH是约5.7至约6.25。
在实施方案中,生长温度维持在约4℃至约42℃。在某些实施方案中,生长温度是约4℃、约5℃、约6℃、约7℃、约8℃、约9℃、约10℃、约11℃、约12℃、约13℃、约14℃、约15℃、约16℃、约17℃、约18℃、约19℃、约20℃、约21℃、约22℃、约23℃、约24℃、约25℃、约26℃、约27℃、约28℃、约29℃、约30℃、约31℃、约32℃、约33℃、约34℃、约35℃、约36℃、约37℃、约38℃、约39℃、约40℃、约41℃或约42℃。在其他实施方案中,生长温度维持在约25℃至约27℃、约25℃至约28℃、约25℃至约29℃、约25℃至约30℃、约25℃至约31℃、约25℃至约32℃、约25℃至约33℃、约26℃至约28℃、约26℃至约29℃、约26℃至约30℃、约26℃至约31℃、约26℃至约32℃、约27℃至约29℃、约27℃至约30℃、约27℃至约31℃、约27℃至约32℃、约26℃至约33℃、约28℃至约30℃、约28℃至约31℃、约28℃至约32℃、约29℃至约31℃、约29℃至约32℃、约29℃至约33℃、约30℃至约32℃、约30℃至约33℃、约31℃至约33℃、约31℃至约32℃、约30℃至约33℃或约32℃至约33℃。在其他实施方案中,温度在培养期间改变。在某些实施方案中,在将诱导编码目的多肽或蛋白质的构建体的表达的试剂加入培养物中之前,将温度维持在约30℃至约32℃,并且在加入诱导表达的试剂(例如将IPTG加入培养物中)后,将温度降至约25℃至约27℃。在一个实施方案中,在将诱导编码目的多肽或蛋白质的构建体的表达的试剂加入培养物中之前,将温度维持在约30℃,并且在向培养物加入诱导表达的试剂后将温度降至约25℃。
诱导
如本文其他地方所述,诱导型启动子通常用于表达构建体中以控制目的多肽或蛋白质的表达,例如lac启动子。在lac启动子衍生物或家族成员例如tac启动子的情况下,效应化合物是诱导剂,例如安慰诱导剂,如IPTG(异丙基-β-D-1-硫代半乳吡喃糖苷,也称为"异丙基硫代半乳糖苷")。在实施方案中,使用lac启动子衍生物,并且当细胞密度达到通过OD575所确定的约25至约160的水平时,目的多肽或蛋白质的表达通过添加IPTG至终浓度约0.01mM至约1.0mM来诱导。在实施方案中,在用于目的多肽或蛋白质的培养物诱导时的OD575是约25、约50、约55、约60、约65、约70、约80、约90、约100、约110、约120、约130、约140、约150、约160、约170、约180。在其他实施方案中,OD575是约80至约100、约100至约120、约120至约140、约140至约160。在其他实施方案中,OD575是约80至约120、约100至约140或约120至约160。在其他实施方案中,OD575是约80至约140或约100至160。细胞密度通常通过其他方法测量并以其他单位表示,例如以每单位体积的细胞表示。例如,荧光假单胞菌培养物的OD575为约25至约160等同于每毫升约4×1010至约1.6×1011集落形成单位或11至70g/L干细胞重量。在实施方案中,当细胞密度达到约0.05g/g至约0.4g/g的湿细胞重量时,目的多肽或蛋白质的表达通过添加IPTG至终浓度约0.01mM至约1.0mM来诱导。在实施方案中,湿细胞重量是约0.05g/g、约0.1g/g、约0.15g/g、约0.2g/g、约0.25g/g、约0.30g/g、约0.35g/g、约0.40g/g、约0.05g/g至约0.1g/g、约0.05g/g至约0.15g/g、约0.05g/g至约0.20g/g、约0.05g/g至约0.25g/g、约0.05g/g至约0.30g/g、约0.05g/g至约0.35g/g、约0.1g/g至约0.40g/g、约0.15g/g至约0.40g/g、约0.20g/g至约0.40g/g、约0.25g/g至约0.40g/g、约0.30g/g至约0.40g/g或约0.35g/g至约0.40g/g。在实施方案中,培养物诱导时的细胞密度等同于如本文中通过OD 575处的吸光度所指明的细胞密度,不论用于测定细胞密度的方法或测量单位如何。本领域技术人员将知道如何对任何细胞培养物进行适当的转化。
在实施方案中,培养物的最终IPTG浓度是约0.01mM、约0.02mM、约0.03mM、约0.04mM、约0.05mM、约0.06mM、约0.07mM、约0.08mM、约0.09mM、约0.1mM、约0.2mM、约0.3mM、约0.4mM、约0.5mM、约0.6mM、约0.7mM、约0.8mM、约0.9mM或约1mM。在其他实施方案中,培养物的最终IPTG浓度为约0.08mM至约0.1mM、约0.1mM至约0.2mM、约0.2mM至约0.3mM、约0.3mM至约0.4mM、约0.2mM至约0.4mM、约0.08mM至约0.2mM或约0.1mM至约1mM。
如本文和文献中所述,在其中使用非lac型启动子的实施方案中,通常使用其他诱导剂或效应物。在一个实施方案中,启动子是组成型启动子。
在添加诱导剂后,培养物通常生长一段时间,例如约24小时,在此期间目的多肽或蛋白质被表达。在添加诱导剂后,培养物通常生长约1小时、约2小时、约3小时、约4小时、约5小时、约6小时、约7小时、约8小时、约9小时、约10小时、约11小时、约12小时、约13小时、约14小时、约15小时、约16小时、约17小时、约18小时、约19小时、约20小时、约21小时、约22小时、约23小时、约24小时、约36小时或约48小时。在将诱导剂添加到培养物后,培养物生长约1至48小时、约1至24小时、约10至24小时、约15至24小时或约20至24小时。细胞培养物通常通过离心浓缩,并将培养物沉淀重悬于适合后续裂解程序的缓冲液或溶液中。
在实施方案中,使用用于高压机械细胞破坏的设备(其是可商购的,例如Microfluidics Microfluidizer、Constant Cell Disruptor、Niro-Soavi均质器或APV-Gaulin均质器)破坏细胞。表达目的多肽或蛋白质的细胞通常例如使用超声处理破坏。通常使用本领域已知的用于裂解细胞的任何合适方法来释放可溶部分。例如,在实施方案中,通常使用化学和/或酶促细胞裂解试剂,例如细胞壁裂解酶和EDTA。在本文的方法中也考虑使用冷冻的或之前储存的培养物。有时在裂解前将培养物进行OD标准化。例如,细胞通常对于约10、约11、约12、约13、约14、约15、约16、约17、约18、约19或约20的OD600标准化。
使用任何合适的设备和方法进行离心。细胞培养物或裂解物为了将可溶部分与不溶部分分离的目的的离心是本领域众所周知的。例如,裂解的细胞有时以20,800×g离心20分钟(4℃下),并且然后使用手动或自动液体处理去除上清液。将沉淀(不溶的)部分重悬于缓冲的溶液中,例如磷酸盐缓冲盐水(PBS),pH 7.4。重悬通常使用例如连接至顶置式混合器的叶轮、磁力搅拌棒、摇床等设备进行。
"可溶部分",即裂解物离心后获得的可溶性上清液,和"不溶部分",即裂解物离心后获得的沉淀,通过培养物裂解和离心得到。
发酵形式
在一个实施方案中,发酵用于生产本文的目的多肽或蛋白质的方法。根据本公开的表达***以任何发酵形式培养。例如,本文可采用分批、补料分批、半连续和连续发酵模式。
在实施方案中,发酵培养基可选自富培养基、最低培养基和矿物盐培养基。在其他实施方案中,选择基本培养基或矿物盐培养基。在某些实施方案中,选择矿物盐培养基。
矿物盐培养基由无机盐和碳源(例如葡萄糖、蔗糖或甘油)组成。矿物盐培养基的实例包括例如M9培养基、假单胞菌培养基(ATCC179)和Davis and Mingioli培养基(参见BD Davis&E S Mingioli(1950)J.Bact.60:17-28)。用于制造矿物盐培养基的无机盐包括选自以下的那些:例如,钾磷酸盐、硫酸铵或氯化铵、硫酸镁或氯化镁以及微量矿物质如氯化钙、硼酸盐,以及铁、铜、锰和锌的硫酸盐。通常,没有有机氮源例如蛋白胨、胰蛋白胨、氨基酸或酵母提取物包含在矿物盐培养基中。相反,使用无机氮源,且这可以选自例如铵盐、氨水和气态氨。矿物盐培养基通常包含葡萄糖或甘油作为碳源。与矿物盐培养基相比,基本培养基通常包含无机盐和碳源,但通常补充有例如低水平的氨基酸、维生素、蛋白胨或其他成分,尽管这些是以非常低的含量添加。培养基通常使用本领域描述的,例如在在上文提到并通过引用并入的美国专利申请公开号2006/0040352中描述的,方法制备。可用于本文方法中的培养程序和矿物盐培养基的细节由Riesenberg,D等,1991,"High cell densitycultivation of Escherichia coli at controlled specific growth rate,"J.Biotechnol.20(1):17-27描述。
发酵可以以任何规模进行。根据本公开的表达***可用于任何规模的重组蛋白表达。因此,例如,可以使用微升规模、毫升规模、厘升规模和分升规摸的发酵体积,并且通常使用1升规模或更大的发酵体积。
在实施方案中,发酵体积是或高于约1升。在实施方案中,发酵体积是约0.5升至约100升。在实施方案中,发酵体积是约1升、约2升、约3升、约4升、约5升、约6升、约7升、约8升、约9升或约10升。在实施方案中,发酵体积是约0.5升至约2升、约0.5升至约5升、约0.5升至约10升、约0.5升至约25升、约0.5升至约50升、约0.5升至约75升、约10升至约25升、约25升至约50升或约50升至约100升。在其他实施方案中,发酵体积是或高于5升、10升、15升、20升、25升、50升、75升、100升、200升、500升、1,000升、2,000升、5,000升、10,000升或50,000升。
蛋白质分析
在实施方案中,分析了通过本文提供的方法产生的目的多肽或蛋白质。目的多肽或蛋白质可以通过本领域技术人员已知的任何合适的方法分析,例如通过生物层干涉测定法、SDS-PAGE、蛋白质印迹、远蛋白质印迹、ELISA、吸光度或质谱法(例如串联质谱法)。
在一些实施方案中,例如通过Bradford测定、吸光度、Coomassie染色、质谱法等确定所产生的目的多肽或蛋白质的浓度和/或量。
本文所述的不溶和可溶部分中的蛋白质产率通常通过本领域技术人员已知的方法来确定,例如通过毛细管凝胶电泳(CGE)、SDS-PAGE和蛋白质印迹分析。例如,通常使用生物层干涉分析来评估可溶部分。
蛋白质产率的可用测量包括例如每培养物体积的重组蛋白的量(例如克或毫克蛋白质/升培养物)、裂解后获得的不溶沉淀物中测量的重组蛋白的百分比或分数(例如提取物上清液中重组蛋白的量/不溶部分中蛋白质的量)、活性蛋白质的百分比或分数(例如活性蛋白质的量/测定中使用的蛋白质的量)、总细胞蛋白(tcp)的百分比或分数、蛋白质的量/细胞和干生物量百分比。
在实施方案中,本文的方法用于获得约20%至约90%总细胞蛋白的可溶性目的多肽或蛋白质的产率。在某些实施方案中,可溶性目的多肽或蛋白质的产率是约20%总细胞蛋白、约25%总细胞蛋白、约30%总细胞蛋白、约31%总细胞蛋白、约32%总细胞蛋白、约33%总细胞蛋白、约34%总细胞蛋白、约35%总细胞蛋白、约36%总细胞蛋白、约37%总细胞蛋白、约38%总细胞蛋白、约39%总细胞蛋白、约40%总细胞蛋白、约41%总细胞蛋白、约42%总细胞蛋白、约43%总细胞蛋白、约44%总细胞蛋白、约45%总细胞蛋白、约46%总细胞蛋白、约47%总细胞蛋白、约48%总细胞蛋白、约49%总细胞蛋白、约50%总细胞蛋白、约51%总细胞蛋白、约52%总细胞蛋白、约53%总细胞蛋白、约54%总细胞蛋白、约55%总细胞蛋白、约56%总细胞蛋白、约57%总细胞蛋白、约58%总细胞蛋白、约59%总细胞蛋白、约60%总细胞蛋白、约65%总细胞蛋白、约70%总细胞蛋白、约75%总细胞蛋白、约80%总细胞蛋白、约85%总细胞蛋白或约90%总细胞蛋白。在一些实施方案中,可溶性目的多肽或蛋白质的产率是约20%至约25%总细胞蛋白、约20%至约30%总细胞蛋白、约20%至约35%总细胞蛋白、约20%至约40%总细胞蛋白、约20%至约45%总细胞蛋白、约20%至约50%总细胞蛋白、约20%至约55%总细胞蛋白、约20%至约60%总细胞蛋白、约20%至约65%总细胞蛋白、约20%至约70%总细胞蛋白、约20%至约75%总细胞蛋白、约20%至约80%总细胞蛋白、约20%至约85%总细胞蛋白、约20%至约90%总细胞蛋白、约25%至约90%总细胞蛋白、约30%至约90%总细胞蛋白、约35%至约90%总细胞蛋白、约40%至约90%总细胞蛋白、约45%至约90%总细胞蛋白、约50%至约90%总细胞蛋白、约55%至约90%总细胞蛋白、约60%至约90%总细胞蛋白、约65%至约90%总细胞蛋白、约70%至约90%总细胞蛋白、约75%至约90%总细胞蛋白、约80%至约90%总细胞蛋白、约85%至约90%总细胞蛋白、约31%至约60%总细胞蛋白、约35%至约60%总细胞蛋白、约40%至约60%总细胞蛋白、约45%至约60%总细胞蛋白、约50%至约60%总细胞蛋白、约55%至约60%总细胞蛋白、约31%至约55%总细胞蛋白、约31%至约50%总细胞蛋白、约31%至约45%总细胞蛋白、约31%至约40%总细胞蛋白、约31%至约35%总细胞蛋白、约35%至约55%总细胞蛋白或约40%至约50%总细胞蛋白。
在实施方案中,本文的方法用于获得约1克/升至约50克/升的可溶性目的多肽或蛋白质的产率。在某些实施方案中,可溶性目的多肽或蛋白质的产率是约1克/升、约2克/升、约3克/升、约4克/升、约5克/升、约6克/升、约7克/升、约8克/升、约9克/升、约10克/升、约11克/升、约12克/升、约13克/升、约14克/升、约15克/升、约16克/升、约17克/升、约18克/升、约19克/升、约20克/升、约21克/升、约22克/升、约23克/升、约24克/升、约25克/升、约26克/升、约27克/升、约28克/升、约30克/升、约35克/升、约40克/升、约45克/升、约50克/升、约1克/升至约5克/升、约1克/升至约10克/升、约10克/升至约12克/升、约10克/升至约13克/升、约10克/升至约14克/升、约10克/升至约15克/升、约10克/升至约16克/升、约10克/升至约17克/升、约10克/升至约18克/升、约10克/升至约19克/升、约10克/升至约20克/升、约10克/升至约21克/升、约10克/升至约22克/升、约10克/升至约23克/升、约10克/升至约24克/升、约10克/升至约25克/升、约10克/升至约30克/升、约10克/升至约40克/升、约10克/升至约50克/升、约10克/升至约12克/升、约12克/升至约14克/升、约14克/升至约16克/升、约16克/升至约18克/升、约18克/升至约20克/升、约20克/升至约22克/升、约22克/升至约24克/升、约23克/升至约25克/升、约10克/升至约25克/升、约11克/升至约25克/升、约12克/升至约25克/升、约13克/升至约25克/升、约14克/升至约25克/升、约15克/升至约25克/升、约16克/升至约25克/升、约17克/升至约25克/升、约18克/升至约25克/升、约19克/升至约25克/升、约20克/升至约25克/升、约21克/升至约25克/升、约22克/升至约25克/升、约23克/升至约25克/升或约24克/升至约25克/升。在实施方案中,可溶重组蛋白产率是约10克/升至约13克/升、约12克/升至约14克/升、约13克/升至约15克/升、约14克/升至约16克/升、约15克/升至约17克/升、约16克/升至约18克/升、约17克/升至约19克/升、约18克/升至约20克/升、约20克/升至约22克/升、约22克/升至约24克/升或约23克/升至约25克/升。在实施方案中,可溶性重组蛋白产率是约10克/升至约25克/升、约12克/升至约24克/升、约14克/升至约22克/升、约16克/升至约20克/升或约18克/升至约20克/升。在实施方案中,提取的蛋白质产率是约5克/升至约15克/升、约5克/升至约25克/升、约10克/升至约15克/升、约10克/升至约25克/升、约15克/升至约20克/升、约15克/升至约25克/升或约18克/升至约25克/升。
在实施方案中,在可溶部分中检测的可溶性目的多肽或蛋白质的量是所产生的总可溶性目的多肽或蛋白质的量的约10%至约100%。在实施方案中,该量是所产生的总可溶性目的多肽或蛋白质的量的约10%、约15%、约20%、约25%、约30%、约35%、约40%、约45%、约50%、约55%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约95%或约99%、或约100%。在实施方案中,该量是所产生的总可溶性目的多肽或蛋白质的量的约10%至约20%、约20%至约50%、约25%至约50%、约25%至约50%、约25%至约95%、约30%至约50%、约30%至约40%、约30%至约60%、约30%至约70%、约35%至约50%、约35%至约70%、约35%至约75%、约35%至约95%、约40%至约50%、约40%至约95%、约50%至约75%、约50%至约95%、约70%至约95%或约80至约100%。
在一些实施方案中,可溶性目的多肽或蛋白质的量表示为培养物中产生的总可溶性蛋白质的百分比。可以将在给定细胞密度下以可溶性目的多肽或蛋白质重量/细胞培养物体积表示的数据转换为总细胞蛋白的重组蛋白百分比表示的数据。将体积蛋白质产率转换为%总细胞蛋白,例如知晓在给定细胞密度下每细胞培养物体积的总细胞蛋白量的情况下,是在技术人员的能力之内。如果知道1)给定细胞密度下的细胞重量/培养物体积,和2)总蛋白所占细胞重量的百分比,则可以确定该数字。例如,在OD550为1.0时,大肠杆菌的干细胞重报告为0.5克/升(“Production of Heterologous Proteins from RecombinantDNA Escherichia coli in Bench Fermentors,”Lin,N.S.和Swartz,J.R.,1992,METHODS:A Companion to Methods in Enzymology 4:159-168)。细菌细胞由多糖、脂质和核酸以及蛋白质组成。据参考文献报道大肠杆菌细胞为约52.4至55%的蛋白质,包括但不限于DaSilva,N.A.等,1986,“Theoretical Growth Yield Estimates for Recombinant Cells,”Biotechnology and Bioengineering,Vol.XXVIII:741-746,其估计蛋白质构成大肠杆菌细胞的52.4重量%,和“Escherichia coli and Salmonella typhimurium Cellular andMolecular Biology,”1987,Ed.Chief Frederick C.Neidhardt,Vol.1,pp.3-6,其报道大肠杆菌中的蛋白质含量为55%干细胞重量。使用上述测量值(即,干细胞重量0.5克/升,蛋白质为55%细胞重量),大肠杆菌在1.0的A550下每细胞培养物体积的总细胞蛋白的量计算为275μg总细胞蛋白/ml/A550。基于湿细胞重量的每细胞培养物体积的总细胞蛋白的计算可以使用例如Glazyrina等(Microbial Cell Factories 2010,9:42,通过引用并入本文)的测定:对于大肠杆菌,1.0的A600导致湿细胞重量为1.7克/升且干细胞重量为0.39克/升。例如,使用该湿细胞重量与干细胞重量的比较,以及如上所述为55%干细胞重量的蛋白质,则对于大肠杆菌,在1.0的A600下每体积细胞培养物的总细胞蛋白的量可以计算为215μg总细胞蛋白/ml/A600。对于荧光假单胞菌,在给定细胞密度下每体积细胞培养物的总细胞蛋白的量与对大肠杆菌发现的相似。荧光假单胞菌与大肠杆菌一样是革兰氏阴性的杆状细菌。如Edwards等,1972,“Continuous Culture of Pseudomonas fluorescens withSodium Maleate as a Carbon Source,”Biotechnology and Bioengineering,Vol.XIV,第123-147页报道的,荧光假单胞菌ATCC 11150的干细胞重量是0.5克/升/A500。这是与Lin等对1.0的A550下的大肠杆菌报道的相同的重量。在500nm和550nm处进行的光散射测量预期是非常相似的。对于荧光假单胞菌HK44,总细胞蛋白所占的细胞重量的百分比由例如Yarwood等,2002年7月,“Noninvasive Quantitative Measurement of Bacterial Growthin Porous Media under Unsaturated-Flow Conditions,”Applied and EnvironmentalMicrobiology 68(7):3597-3605描述为55%。该百分比与上述参考文献对大肠杆菌给出的那些相似或相同。
在实施方案中,产生的可溶性目的多肽或蛋白质的量是培养物中产生的总可溶蛋白质的约0.1%至约95%。在实施方案中,该量大于培养物中产生的总可溶蛋白质的0.1%、0.5%、1%、5%、10%、15%、20%、25%、30%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或95%。在实施方案中,该量是培养物中产生的总可溶蛋白质的约0.1%、0.5%、1%、5%、10%、15%、20%、25%、30%、40%、50%、55%、60%、65%、70%、75%、80%、85%、90%或95%。在实施方案中,该量是培养物中产生的总可溶蛋白质的约5%至约95%、约10%至约85%、约20%至约75%、约30%至约65%、约40%至约55%、约1%至约95%、约5%至约30%、约1%至约10%、约10%至约20%、约20%至约30%、约30%至约40%、约40%至约50%、约50%至约60%、约60%至约70%或约80%至约90%。
在实施方案中,产生的可溶性目的多肽或蛋白质的量是干细胞重量(DCW)的约0.1%至约50%。在实施方案中,该量大于DCW的约0.1%、0.5%、1%、5%、10%、15%、20%、25%、30%、40%、45%或50%。在实施方案中,该量是DCW的约0.1%、0.5%、1%、5%、10%、15%、20%、25%、30%、40%、45%或50%。在实施方案中,该量是培养物中产生的总可溶蛋白质的约5%至约50%、约10%至约40%、约20%至约30%、约1%至约20%、约5%至约25%、约1%至约10%、约10%至约20%、约20%至约30%、约30%至约40%或约40%至约50%。
在实施方案中,当在基本上相似的条件(例如,生长条件,包括宿主细胞)下产生时,使用本发明的方法产生的与分泌前导肽异源的可溶性目的多肽或蛋白质的量大于该分泌前导肽天然的蛋白质的量。在实施方案中,按照本发明的方法可操作地连接于AnsB、8484或5193分泌前导肽的可溶性异源目的多肽或蛋白质的产生量大于相应前导肽天然的蛋白质的量。在实施方案中,与AnsB、8484或5193分泌前导肽可操作地连接的可溶性异源目的多肽或蛋白质以比在基本相似的条件下产生的该前导肽天然的蛋白质的量高约1.2倍至约5倍、约1.2倍至约2.5倍、约1.2倍至约2倍、约1.2倍至约1.5倍、约1.4倍至约3倍、约1.4倍至约2.5倍、约1.4倍至约2倍、约1.5倍至约3倍、约1.5倍至约2.5倍、约1.5倍至约2倍、约2倍至约3倍、约1.2倍、约1.3倍、约1.4倍、约1.5倍、约1.6倍、约1.7倍、约1.8倍、约1.9倍、约2倍、约2.5倍、约3倍、约4倍或约5倍的产率产生。
在实施方案中,当在基本上相似的条件(例如,生长条件)下产生时,使用本发明的方法产生的与分泌前导肽可操作地连接的可溶性目的多肽或蛋白质的量大于在没有分泌前导肽或具有不同分泌前导肽的情况下产生的目的多肽或蛋白质的量。生长条件可包括例如所用的培养基和宿主细胞。在实施方案中,按照本发明方法可操作地连接于AnsB、8484或5193分泌前导肽的可溶性异源目的多肽或蛋白质的产生量大于在没有分泌前导肽或具有不同的分泌前导肽的情况下产生的目的蛋白质的量。在实施方案中,与AnsB、8484或5193分泌前导肽可操作地连接的可溶性异源目的多肽或蛋白质以比在基本相似条件下没有分泌前导肽或具有不同的分泌前导肽的情况下产生的蛋白质量高约1.2倍至约20倍、约1.2倍至约2.5倍、约1.2倍至约2倍、约1.2倍至约1.5倍、约1.4倍至约3倍、约1.4倍至约2.5倍、约1.4倍至约2倍、约1.5倍至约3倍、约1.5倍至约2.5倍、约1.5倍至约2倍、约2倍至约5倍、约2倍至约10倍、约5倍至约15倍、约10倍至约20倍、约1.2倍、约1.3倍、约1.4倍、约1.5倍、约1.6倍、约1.7倍、约1.8倍、约1.9倍、约2倍、约2.5倍、约3倍、约4倍、约5倍、约10倍、约15倍或约20倍的产率产生。
溶解性和活性
蛋白质的"溶解度"和"活性"虽然是相关的性质,但通常由不同的方式来确定。蛋白质的溶解度,特别是疏水性蛋白质,指示疏水性氨基酸残基不适当地位于折叠蛋白的外侧。蛋白质活性,其通常使用例如如下所述的不同方法评估,是适当的蛋白质构象的另一指标。如在本文中所使用的"可溶的、活性的或两者"是指通过本领域技术人员已知的方法测定为可溶的、活性的或者可溶且活性的蛋白质。
活性测定
用于评估目的肽、多肽或蛋白质活性的测定法是本领域已知的,且包括但不限于荧光测定法、比色测定法、化学发光测定法、分光光度测定法和本领域技术人员可用的其他酶测定法。这些测定法用于比较目的肽、多肽或蛋白质的制剂与肽、多肽或蛋白质的商业或其他制剂的活性。
在实施方案中,活性由提取物上清液中的活性蛋白与分析的总量相比的百分比表示。这是基于通过测定法确定为活性的蛋白质相对于测定中所用蛋白质的总量的量。在其他实施方案中,活性由与标准(例如,原始蛋白)相比的蛋白质的%活性水平表示。这是基于上清液提取样品中活性蛋白的量相对于标准样品中活性蛋白的量(其中在测定中使用来自每个样品的相同量的蛋白质)。
在实施方案中,约40%至约100%的目的肽、多肽或蛋白质确定为活性的。在实施方案中,约40%、约50%、约60%、约70%、约80%、约90%或约100%的目的肽、多肽或蛋白质被确定为活性的。在实施方案中,约40%至约50%、约50%至约60%、约60%至约70%、约70%至约80%、约80%至约90%、约90%至约100%、约50%至约100%、约60%至约100%、约70%至约100%、约80%至约100%、约40%至约90%、约40%至约95%、约50%至约90%、约50%至约95%、约50%至约100%、约60%至约90%、约60%至约95%、约60%至约100%、约70%至约90%、约70%至约95%、约70%至约100%或约70%至约100%的目的肽、多肽或蛋白质被确定为活性的。
在其它实施方案中,约75%至约100%的目的肽、多肽或蛋白质确定为活性的。在实施方案中,约75%至约80%、约75%至约85%、约75%至约90%、约75%至约95%、约80%至约85%、约80%至约90%、约80%至约95%、约80%至约100%、约85%至约90%、约85%至约95%、约85%至约100%、约90%至约95%、约90%至约100%或约95%至约100%的目的肽、多肽或蛋白质确定为活性的。
目的蛋白质
本文的方法和组合物对于在细胞表达***中产生高水平的正确加工的重组目的蛋白质或多肽是有用的。在实施方案中,目的蛋白质或多肽(在本文中也称为“靶蛋白”或“靶多肽”)可以是任何种类和任何大小的。在某些实施方案中,目的蛋白质或多肽是治疗上有用的蛋白质或多肽。在一些实施方案中,蛋白质是哺乳动物蛋白质,例如人蛋白质,例如生长因子、细胞因子、趋化因子或血液蛋白质。在实施方案中,目的蛋白质或多肽以与参考蛋白质或多肽类似的方式加工。在某些实施方案中,蛋白质或多肽不包括编码序列中的分泌信号。在实施方案中,目的蛋白质或多肽大小小于100kD、小于50kD或小于30kD。在实施方案中,目的蛋白质或多肽具有至少约5个、10个、15个、20个、30个、40个、50个或100个氨基酸。
分子遗传学和遗传工程技术所要求的大量序列信息是可广泛地公开获得的。可于网站//www.ncbi.nlm.nih.gov/Entrez上从GenBank获得哺乳动物以及人的基因、cDNA序列、氨基酸序列和基因组的完整核苷酸序列的访问。另外的信息有时也可自GeneCards(来自Weizmann Institute of Science Genome and Bioinformatics的整合关于基因及其产物和生物医学应用的信息的电子百科全书)获得,核苷酸序列信息有时也可自EMBL核苷酸序列数据库或日本的DNA数据库(DDBJ)获得;关于氨基酸序列的信息的另外的位置包括Georgetown的蛋白质信息资源网站和Swiss-Prot。
通常在本文的组合物和方法中表达的蛋白质的实例包括但不限于以下的分子,例如,肾素、生长激素,包括人生长激素;牛生长激素;生长激素释放因子;甲状旁腺激素;促甲状腺激素;脂蛋白;α-1-抗胰蛋白酶;胰岛素A链;胰岛素B链;胰岛素原;血小板生成素;促卵泡激素;降钙素;***;胰高血糖素;凝血因子,如因子VIIIC、因子IX、组织因子和vonWillebrands因子;抗凝血因子,如蛋白C;心房钠尿肽;肺表面活性剂;纤溶酶原激活物,如尿激酶或人尿或组织型纤溶酶原激活物(t-PA);铃蟾肽;凝血酶;造血生长因子;肿瘤坏死因子-α和-β;脑啡肽酶;血清白蛋白,如人血清白蛋白;缪勒抑制物质(mullerian-inhibiting substance);松弛素A链;松弛素B链;松弛素原;小鼠***相关多肽;微生物蛋白质,如β-内酰胺酶;DNA酶;抑制素;活化素(activin);血管内皮生长因子(VEGF);激素或生长因子的受体;整联蛋白;蛋白A或D;类风湿因子;神经营养因子,如脑源神经营养因子(BDNF)、神经营养因子-3、-4、-5或-6(NT-3、NT-4、NT-5或NT-6)或者神经生长因子,如NGF-β;心肌营养蛋白(心脏肥大因子),如心肌营养蛋白-1(CT-1);血小板源生长因子(PDGF);成纤维细胞生长因子,如aFGF和bFGF;表皮生长因子(EGF);转化生长因子(TGF),如TGF-α和TGF-β,包括TGF-β1、TGF-β2、TGF-β3、TGF-β4或TGF-β5;***-I和-II(IGF-I和IGF-II);des(1-3)-IGF-I(脑IGF-I)、***结合蛋白;CD蛋白,如CD-3、CD-4、CD-8和CD-19;红细胞生成素;骨诱导因子;免疫毒素;骨形态发生蛋白(BMP);干扰素,如干扰素-α、-β和-γ;集落刺激因子(CSF),例如M-CSF、GM-CSF和G-CSF;白介素(IL),例如IL-1至IL-10;抗HER-2抗体;超氧化物歧化酶;T细胞受体;表面膜蛋白;衰变加速因子;病毒抗原,如例如AIDS包膜的部分;转运蛋白;归巢受体;地址素;调控蛋白;抗体;及上文所列多肽中任一种的片段。
在某些实施方案中,蛋白质或多肽选自IL-1、IL-1a、IL-1b、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12、IL-12elasti、IL-13、IL-15、IL-16、IL-18、IL-18BPa、IL-23、IL-24、VIP、红细胞生成素、GM-CSF、G-CSF、M-CSF、血小板源生长因子(PDGF)、MSF、FLT-3配体、EGF、成纤维细胞生长因子(FGF;例如α-FGF(FGF-1)、β-FGF(FGF-2)、FGF-3、FGF-4、FGF-5、FGF-6或FGF-7)、***(例如IGF-1、IGF-2);肿瘤坏死因子(例如,TNF、淋巴毒素)、神经生长因子(例如,NGF)、血管内皮生长因子(VEGF);干扰素(例如IFN-α、IFN-β、IFN-γ);白血病抑制因子(LIF);睫状节神经营养因子(CNTF);制瘤素M;干细胞因子(SCF);转化生长因子(例如,TGF-α、TGF-β1、TGF-β2、TGF-β3);TNF超家族(例如,LIGHT/TNFSF14、STALL-1/TNFSF13B(BLy5、BAFF、THANK)、TNFα/TNFSF2和TWEAK/TNFSF12);或趋化因子(BCA-1/BLC-1、BRAK/Kec、CXCL16、CXCR3、ENA-78/LIX、Eotaxin-1、Eotaxin-2/MPIF-2、Exodus-2/SLC、Fractalkine/神经趋化蛋白(Neurotactin)、GROα/MGSA、HCC-1、I-TAC、淋巴细胞趋化因子(Lymphotactin)/ATAC/SCM、MCP-1/MCAF、MCP-3、MCP-4、MDC/STCP-1/ABCD-1、MIP-1.quadrature.、MIP-1.quadrature.、MIP-2.quadrature./GRO.quadrature.、MIP-3.quadrature./Exodus/LARC、MIP-3/Exodus-3/ELC、MIP-4/PARC/DC-CK1、PF-4、RANTES、SDF1、TARC、TECK或毒素(例如,ω-漏斗网蛛毒素(agatoxin)、μ-漏斗网蛛毒素、aitoxin、allopumilotoxin 267A、ω-阿特拉科毒素(atracotoxin)-HV1、δ-阿特拉科毒素-Hv1b、箭毒蛙毒素(Batrachotoxin)、Botocetin、沙地蟾蜍素(Arenobufagin)、蟾蜍他灵(Bufotalin)、蟾毒色胺(Bufotenin)华蟾蜍毒素(Cinobufagin)、海蟾蜍毒素(Marinobufagin)、金环蛇毒素(Bungarotoxin)、Calcicludine、Calcisptine、心脏毒素(Cardiotoxin)III、Catrocollastatin C、北非蝎毒素(Charybdotoxin)、眼镜蛇毒液细胞毒素、芋螺毒素、海胆素(Echinoidin)、章鱼素(Eledoisin)、地棘蛙素(Epibatidine)、蛇毒溶栓酶(Fibrolase)、Hefutoxin、Histrionicotoxin、Huwentoxin I、Huwentoxin II、J-ACTX-Hv1c Kunitz型毒素、树眼睛蛇毒素(Dendrotoxin)K、树眼睛蛇毒素1、黑寡妇蜘蛛卵粒毒素(Latrotoxin)、玛格(斑蝎)毒素(Margatoxin)、莫鲁蝎毒素(Maurotoxin)、Onchidal、PhTx3、Pumilotoxin 251D、响尾蛇凝集素、澳毒蛛毒素(Robustoxin)、蛤蚌毒素(Saxitoxin)、Scyllatoxin、Slotoxin、Stromatoxin、太卡毒素(Taicatoxin)、蝾螈毒素(Tarichatoxin)、河豚毒素(Tetrodotoxin)、篦麻毒素、白树毒素(Gelonin)、黄曲霉毒素(Aflatoxin)、蝇蕈毒素(Amatoxin)、橘霉素(Citrinin)、细胞松弛素(Cytochalasin)、麦角胺、烟曲霉素、伏马菌素(Fumonisin)、胶霉毒素(Gliotoxin)、烟曲霉酸(Helvolic Acid)、鹅膏蕈氨酸(IbotenicAcid)、蝇蕈醇(Muscimol)、赭曲霉素(Ochratoxin)、棒曲霉素(Patulin)、杂色曲霉毒素(Sterigmatocytstin)、单端孢霉烯(Trichothecene)、呕吐毒素(Vomitoxin)、玉米赤霉醇(Zeranol)、玉米烯酮(Zearalenone)、炭疽毒素、腺苷酸保护性抗原环化酶、rPA、Cry毒素、百日咳杆菌毒素、肉毒杆菌毒素、艰难梭菌毒素、产气荚膜梭菌毒素、破伤风毒素、白喉毒素、Vero毒素/志贺样毒素、热稳定肠毒素、热不稳定肠毒素、肠毒素、李斯特菌溶血素(Listeriolysin)O、结核分枝杆菌索状因子、假单胞菌外毒素、沙门氏菌内毒素、沙门氏菌外毒素、志贺菌毒素、金黄色葡萄球菌α毒素、金黄色葡萄球菌β毒素、金黄色葡萄球菌δ毒素、剥脱性毒素(Exfoliatin toxin)、中毒性休克综合征毒素、肠毒素、杀白细胞素(Leukocidin)、链球菌溶血素S或霍乱毒素)。
在本发明的一个实施方案中,目的蛋白质可以是多亚基蛋白质或多肽。可以表达的多亚基蛋白质包括同聚体和异聚体蛋白质。多亚基蛋白质可以包括两个或更多个亚基,它们可以是相同的或不同的。例如,蛋白质可以是包含2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个或更多个亚基的同聚体蛋白质。蛋白质也可以是包含2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个或更多个亚基的异聚体蛋白质。示例性的多亚基蛋白质包括:受体,包括离子通道受体;细胞外基质蛋白质,包括软骨素;胶原;免疫调节剂,包括MHC蛋白、全链抗体、抗体衍生物和抗体片段;酶,包括RNA聚合酶和DNA聚合酶;及膜蛋白。
在另一个实施方案中,目的蛋白质有时是血液蛋白质。在此实施方案中所表达的血液蛋白质包括但不限于载体蛋白,如白蛋白(包括人的和牛白蛋白)、转铁蛋白、重组运铁蛋白半分子、触珠蛋白、血纤蛋白原和其它凝血因子、补体成分、免疫球蛋白、酶抑制剂、物质(诸如血管紧张素和缓激肽)的前体、胰岛素、内皮缩血管肽和球蛋白(包括α、β、γ-球蛋白),及主要在哺乳动物的血液中存在的其它类型的蛋白质、多肽及其片段。已经报告了许多血液蛋白质的氨基酸序列(参见S.S.Baldwin(1993)Comp.Biochem Physiol.106b:203-218),包括人血清白蛋白(Lawn,L.M.等(1981)Nucleic Acids Research,9:6103-6114)和人血清转铁蛋白(Yang,F.等(1984)Proc.Natl.Acad.Sci.USA 81:2752-2756)的氨基酸序列。
在另一个实施方案中,目的蛋白质有时是重组酶或辅因子。在此实施方案中所表达的酶和辅因子包括但不限于醛缩酶、胺氧化酶、氨基酸氧化酶、天冬氨酸酶、B12依赖性酶、羧肽酶、羧酸酯酶、羧酸分解酶(carboxylyase)、糜蛋白酶(chemotrypsin)、需要CoA的酶(CoA requiring enzyme)、羟腈合成酶、胱硫醚合酶、脱羧酶、脱氢酶、醇脱氢酶、脱水酶、黄递酶(diaphorase)、加双氧酶、烯酸还原酶(enoate reductase)、环氧化物水化酶(epoxide hydrase)、延胡索酸酶(fumerase)、半乳糖氧化酶、葡萄糖异构酶、葡萄糖氧化酶、糖基转移酶、甲基转移酶、腈水化酶(nitrile hydrase)、核苷磷酸化酶、氧化还原酶、氧腈酶(oxynitilase)、肽酶、糖基转移酶、过氧化物酶、与治疗活性多肽融合的酶、组织纤溶酶原激活物;尿激酶、蛇毒凝血酶(reptilase)、链激酶;过氧化氢酶、超氧化物歧化酶;DNA酶、氨基酸水解酶(例如天冬酰胺酶、酰胺水解酶);羧肽酶;蛋白酶、胰蛋白酶、胃蛋白酶、胰凝乳蛋白酶、木瓜蛋白酶、菠萝蛋白酶、胶原酶;神经氨酸酶(neuramimidase);乳糖酶、麦芽糖酶、蔗糖酶和***呋喃糖苷酶。
在另一个实施方案中,目的蛋白质有时是抗体或抗体衍生物。在实施方案中,抗体或抗体衍生物是人源化抗体、修饰的抗体、单结构域抗体(例如,纳米抗体、鲨鱼单结构域IgNAR或VNAR抗体、骆驼单结构域抗体)、异种特异性抗体、三价抗体、双特异性抗体(例如,BiTE分子)、单链抗体、Fab、Fab片段、线性抗体、双抗体、全链抗体或其片段或部分。单链抗体通常在单一稳定折叠的多肽链上包含抗体的抗原结合区。Fab片段通常包含特定抗体的一个片段。Fab片段通常包含抗原结合位点。Fab片段通常包含2条链:轻链和重链片段。这些片段通常通过接头或二硫键连接。可用于本发明方法的抗体和抗体衍生物是本领域已知的,并且描述于文献中,例如,在美国专利9,580,719的表9中,其在本文其他地方引用并通过引用并入。
目的蛋白质或多肽的编码序列可以是靶多肽的天然编码序列(若可获得的话),但是更通常是已经过选择、改进或优化以在选定的表达宿主细胞中使用的编码序列:例如,通过合成反映假单胞菌物种(诸如荧光假单胞菌)或其它合适的生物体的密码子使用偏倚的基因来实现。所得的基因在一个或多个载体内构建或被***一个或多个载体中,然后所述载体被转化到表达宿主细胞中。所谓以“可表达形式”提供的核酸或多核苷酸指含有能由选定的表达宿主细胞表达的至少一种基因的核酸或多核苷酸。
在某些实施方案中,目的蛋白质是天然蛋白质(诸如天然哺乳动物或人蛋白质)或与其基本上同源。在这些实施方案中,蛋白质不是以多联体形式存在,而是仅连接至分泌信号和任选地供纯化和/或识别用的标签序列。
在其它实施方案中,目的蛋白质是在约20至约42℃的温度下有活性的蛋白质。在一个实施方案中,蛋白质在生理温度是活性的,而在加热至高的或极端的温度(诸如超过65℃的温度)时被灭活。
在一个实施方案中,目的蛋白质是在约20至约42℃的温度下是活性的和/或在加热至高的或极端的温度(诸如超过65℃的温度)时被灭活的蛋白质;是天然蛋白质(诸如天然哺乳动物或人蛋白质)或与其基本上同源,并且不是以多联体形式从核酸表达;并且启动子不是荧光假单胞菌中的天然启动子,而是源自另一种生物体,诸如大肠杆菌。
在其它实施方案中,蛋白质在产生时还包括另外的靶向序列,例如将蛋白质靶向至细胞外培养基的序列。在一个实施方案中,另外的靶向序列可操作连接至蛋白质的羧基末端。在另一个实施方案中,蛋白质包括自动转运蛋白、双伴体分泌***、主末端分支***或菌毛引座孔蛋白的分泌信号。
以示例而非限制性的方式提供了下列实施例。
实施例
给出以下实施例是出于说明本公开的各种实施方案的目的,并不意味着以任何方式限制本公开。本实施例以及本文所述的方法是当前的代表性实施方案,是示例性的,而不意在作为对范围的限制。本领域技术人员将想到其中的改变和包含在由权利要求的范围所限定的本公开的精神内的其他用途。
实施例1:蛋白质表达分析
以0.5mL培养规模评估了三种荧光假单胞菌分泌前导肽AnsB、8484和5193中每一种指导三种不同重组蛋白的可溶性表达的效率。
每种分泌前导编码序列与编码大肠杆菌K-12硫氧还蛋白1(Trx-1或TrxA,11.9kDa)、Gal2单链抗体(gal2scFv,29.6kDa)和炭疽芽孢杆菌突变体重组保护性抗原(mrPA,83.7kDa)的基因同框融合。这些构建体的蛋白质表达与具有与相同重组蛋白各自融合的Pbp分泌前导编码序列的构建体的表达,以及与构建用于每种蛋白质的胞质表达的菌株相比较。胞质表达菌株构建体编码起始甲硫氨酸和接着丙氨酸,其与TrxA、Gal2或mrPA编码序列融合。质粒构建体转化到荧光假单胞菌菌株DC454中,并使其在选择培养基(M9葡萄糖)中生长以分离阳性克隆。该测试的结果显示在下表6中。示例性的SDS-CGE图像在图1(TrxA)、图2(Gal2scFv)和图3(mrPA)中示出。
Figure BDA0002498380930000621
Figure BDA0002498380930000631
每个菌株在矿物盐培养基中一式三份生长24小时,然后用IPTG诱导和孵育另外24小时。收集肉汤,用PBS三倍稀释,超声处理并离心。收集上清液作为可溶性蛋白质部分,并通过SDS-CGE(使用Caliper
Figure BDA0002498380930000632
GXII***)进行分析。与***内部梯状物相比,对诱导的条带进行定量。当与AnsB、8484和5193前导肽融合时,Gal2scFv和mrPA蛋白的表达水平高于TrxA,但是当将蛋白质靶向于细胞质时,未检测到Gal2或mrPA的表达。
实施例2:96孔形式的克立他酶Tier 1表达质粒筛选
另外,评估了欧文氏菌II型L-天冬酰胺酶(克立他酶)-前导肽融合构建体的蛋白质表达。
对于表达质粒筛选,设计并合成了优化的克立他酶蛋白质编码序列用于在荧光假单胞菌中表达。设计编码克立他酶肽序列的DNA(图4,氨基酸序列如SEQ ID NO:7所示,和核酸序列如SEQ ID NO:8所示)以反映对于荧光假单胞菌的适当密码子使用。含有独特限制性酶位点(SapI或LguI)的DNA区域添加到克立他酶编码序列的上游,其设计用于与表达载体中存在的分泌前导序列框内直接融合。在编码序列的下游添加包含3个终止密码子和独特的限制性酶位点(SapI)的DNA区域。构建携带与37种不同的荧光假单胞菌分泌前导肽融合的优化克立他酶基因和两个核糖体结合位点(RBS)亲和性的质粒(表7)。构建另外的质粒以表达没有周质前导序列的克立他酶蛋白,以便将克立他酶蛋白定位在细胞质内。靶标的表达从Ptac启动子驱动,且翻译从高活性核糖体结合位点(RBS)启动。所得的40个质粒转化到两个荧光假单胞菌宿主菌株DC454(WT)和DC441(PD)中,以产生80种表达菌株用于Tier 1(表达策略)筛选。表达策略的排序是基于SDS-CGE估计的克立他酶单体的滴度。表达策略筛选的主要目的是评估表达质粒及其掺入的遗传元件的大亚组,并消除产生低或差质量的靶标表达的那些表达策略。
如实施例2中所述,来自80个转化(40种表达策略x 2个宿主菌株)的所得培养物在96孔板中生长。通过SDS-CGE分析来自诱导后24小时收获的全肉汤培养物的超声部分样品。对与克立他酶单体的预期分子量(35kDa)一致的诱导蛋白质的表达进行定量,其也与大肠杆菌L-Asp(Sigma产品#A3809)共同迁移。通过将诱导的条带与大肠杆菌L-Asp标准曲线进行比较完成还原样品的SDS-CGE定量。基于估计的可溶性克立他酶单体滴度对来自DC454和DC441宿主菌株两者的20个最高产率的样品进行分级(表9)。图5显示了从96孔培养物可溶性超声样品的分析产生的SDS-CGE凝胶样图。表9显示了诱导后24小时(I24)滴度,如通过还原的可溶性超声样品的SDS-CGE分析估计的和对DC454(左侧表)和DC441(右侧表)宿主菌株中表达的质粒通过
Figure BDA0002498380930000641
内部梯状物定量的。还显示了由每个p743表达质粒产生的分泌前导融合体。
在表9中用**标记了在源自DC454和DC441宿主菌株的前10个最高产率的表达菌株中观察到的六个质粒和掺入的分泌前导肽(p743-013(FlgI)、p743-038(8484)、p743-020(LolA)、p743-018(DsbC)、p743-009(Ibp-S31A)和p743-034(5193))。此外,设计用于克立他酶蛋白质胞质表达的p743-001表达质粒对于两个宿主以前两个最高的可溶性产率排序。从综合的两个宿主菌株,前十个最高的可溶性滴度范围为525至1,523μg/mL。对于所有观察到的表达,不溶性产率均较低,使用p743-013质粒最高不溶性产率达到230μg/mL。SDS-CGE条带模式的观察(图5)显示,使用p743-013、p743-033(前导肽O)、p743-038、p743-009和p743-018表达质粒发生最完整的分泌前导加工(在输出到周质时去除),而观察到p743-016和p743-017质粒产生明显较低分子量的截短产物。基于SDS-CGE估计的高可溶性滴度,选择表8中所示的10个表达质粒用于96孔HTP规模的后续宿主菌株筛选。然后将十种选择的表达策略与24个独特的宿主菌株组合,其可进一步影响克立他酶蛋白的滴度和质量。
Figure BDA0002498380930000651
Figure BDA0002498380930000661
Figure BDA0002498380930000662
Figure BDA0002498380930000671
表9显示了诱导后24小时(I24)滴度,如通过还原的可溶性超声样品的SDS-CGE分析估计的和对于DC454(左侧表)和DC441(右侧表)宿主菌株中表达的质粒通过
Figure BDA0002498380930000673
内部梯状物定量的。还显示了由每个p743表达质粒产生的分泌前导融合体。
Figure BDA0002498380930000672
Figure BDA0002498380930000681
Figure BDA0002498380930000691
实施例3:大肠杆菌天冬酰胺酶II型表达构建体的制备
评估了大肠杆菌天冬酰胺酶-前导融合构建体的蛋白质表达。
优化大肠杆菌A-1-3L-天冬酰胺酶II基因用于在荧光假单胞菌中表达,并将其克隆到一组表达载体中用于胞质和周质表达。使用的氨基酸序列在本文中以SEQ ID NO:9公开。使用的核酸序列在本文中以SEQ ID NO:10公开。
表达使用一系列的分泌前导序列评估,其中一些具有高RBS序列,而一些具有中等RBS序列。另外,不使用前导序列评估细胞质表达。
每个构建体转化到荧光假单胞菌宿主菌株DC454(pyrF缺陷,无PD或FMO)和DC441(pyrF缺陷,PD)中,并对所得表达菌株在0.5mL培养物中进行大肠杆菌A-1-3L-天冬酰胺酶II产生的评估。将全肉汤超声处理,离心,并通过SDS-CGE分析可溶部分。
96孔形式的生长和表达
为了表达质粒筛选,如下将每种大肠杆菌A-1-3L-天冬酰胺酶II表达质粒的连接混合物转化到荧光假单胞菌宿主菌株DC454和DC441细胞中。25微升感受态细胞解冻和转移至96多孔
Figure BDA0002498380930000692
板(Lonza)中,并向每个孔中加入连接混合物。使用NucleofectorTM96孔ShuttleTM***(Lonza AG)对细胞进行电穿孔。然后将细胞转移至具有400μl M9盐1%葡萄糖培养基和微量元素的96孔深孔板。96孔板(种子板)在30℃下伴随振荡孵育48小时。十微升种子培养物一式两份转移到96孔深孔板,每个孔含500μl HTP培养基,其补充有微量元素和5%甘油,并如之前孵育24小时。在24小时时间点向每个孔添加异丙基-β-D-1-硫代吡喃半乳糖苷(IPTG)达到终浓度0.3mM以诱导靶蛋白的表达。甘露醇(Sigma)添加到每个孔中达到终浓度1%以在折叠调节子过表达菌株中诱导折叠调节子的表达。诱导后24小时通过600nm处的光密度(OD 600)测量细胞密度以监测生长。诱导后二十四小时,收获细胞,在1X PBS中以1:3稀释至最终体积400μl,然后冷冻。样品如下所述制备并分析。
在表达质粒筛选中鉴定出的在先样品的表达结果示于表10和11中。
Figure BDA0002498380930000701
Figure BDA0002498380930000702
Figure BDA0002498380930000711
对于宿主菌株的筛选,基于表达质粒筛选结果选择的表达质粒各自转化到阵列中的24个荧光假单胞菌宿主菌株的每一个中,包括野生型(WT)或亲本DC454菌株、蛋白酶缺失(PD)菌株、折叠调节子过表达(FMO)菌株和蛋白酶缺失+折叠调节子过表达(PD/FMO)菌株。与荧光假单胞菌天冬酰胺酶分泌前导肽(AnsB)融合的大肠杆菌天冬酰胺酶被包括在阵列中(如SEQ ID NO:1所示的氨基酸序列;如SEQ ID NO:4所示的编码序列)。折叠调节子(当存在时)在第二质粒上编码,并且表达由荧光假单胞菌天然的甘露醇诱导启动子驱动。宿主菌株筛选转化如下进行:25微升的荧光假单胞菌宿主菌株感受态细胞解冻和转移到96多孔
Figure BDA0002498380930000712
板中,并向每个孔添加10μl质粒DNA(10ng)。如上文对于质粒表达筛选所述的,将细胞电穿孔,培养,以HTP形式诱导并收获。如下所述制备并分析样品。
用于分析的样品的制备
可溶部分通过超声处理然后离心来制备。培养肉汤样品(400μL)用具有24探针尖角的Cell Lysis Automated Sonication System(CLASS,Scinomix)在以下设置下进行超声处理:每孔20脉冲,每脉冲10秒,以及60%功率,每个脉冲之间10秒(Sonics Ultra-Cell)。裂解产物在5500x g下离心15分钟(4℃),并收集上清液(可溶部分)。
SDS-CGE分析
蛋白质样品使用具有HT Protein Express芯片和相应试剂(PerkinElmer)的LabChip GXII仪器(PerkinElmer)通过微芯片SDS毛细管凝胶电泳进行分析。按照制造商的方案(Protein User Guide Document No.450589,Rev.3)制备样品。简而言之,在96孔聚丙烯锥形孔PCR板中,将4μL样品与具有70mM DTT还原剂的14μL样品缓冲液混合,在下加热
如上所述处理诱导后24小时取样的全肉汤,并通过SDS-CGE分析可溶部分。
当与Null样品相比时,可商购的L-天冬酰胺酶活性测定试剂盒(Sigma)检测来自最高产率菌株STR55382(Lao前导肽)的HTP培养物裂解产物样品中的显著L-天冬酰胺酶活性。
在表达质粒筛选实验中筛选的质粒和相应的分泌前导肽包括:
p742-006(Azu)
p742-008(LAO)
p742-009(Ibp-S31A)
p742-016(Pbp)
p742-017(PbpA20V)
p742-021(前导肽D)
p742-037(前导肽R)
p742-038(8484)
p742-041(荧光假单胞菌AnsB)。
表达菌株如上所述培养和诱导。可溶和不溶部分的SDS-CGE分析显示了天冬酰胺酶的高水平表达(图6)。在表达菌株中观察到高滴度,包括表12中列出的那些。
Figure BDA0002498380930000721
Figure BDA0002498380930000731
实施例4:菌株的构建
产生了以下荧光假单胞菌天冬酰胺酶KO宿主菌株。
PF1433(PyrF、AspG1和AspG2缺陷的)是通过在宿主菌株DC454(PyrF缺陷)中顺序删除aspG2和aspG1基因而构建的。
PF1434(PyrF、ProC、AspG1和AspG2缺陷的)是通过在宿主菌株DC455(pyrF proC)中顺序删除aspG1和aspG2基因而构建的。菌株DC455是DC542和DC549两者的亲本菌株。
PF1442(PyrF、ProC、AspG1、AspG2、Lon、DegP1、DegP2S219A、Prc1和AprA缺陷的)是通过在宿主菌株PF1201(PyrF、ProC、蛋白酶Lon、DegP1、DegP2S219A、Prc1和AprA缺陷的)中顺序删除aspG2和aspG1而构建的。
PF1443(PyrF、ProC、AspG1和AspG2缺陷的;从pDOW3700表达的FMO LepB)通过将LepB编码FMO质粒pDOW3700转化到PF1434中来构建。
PF1444(PyrF、ProC、AspG1和AspG2缺陷的;从pDOW3707表达的FMO Tig)是通过将Tig编码FMO质粒pDOW3703转化到PF1434中而构建的。
PF1445(PyrF、ProC、AspG1、AspG2、Lon、DegP1、DegP2、S219A、Prc1和AprA缺陷的;从pFNX4142表达的FMO DsbAC-Skp)是通过用DsbAC-Skp编码质粒pFNX4142转化PF1442而构建的。
表13中描述了所用的菌株。
Figure BDA0002498380930000732
Figure BDA0002498380930000741
*关于蛋白酶缺陷/删除和重折叠调节子过表达。
实施例5:选择的表达菌株的2L发酵和可溶性%TCP的计算
将实施例3中所描述的菌株STR57863和STR57860放大至2L发酵,并各自在多达八种不同的发酵条件下进行筛选。通过用所选菌株的冷冻培养原液接种含有600mL化学限定的培养基(补充有酵母提取物和甘油)的摇瓶产生2L规模的发酵(最终发酵体积约1L)。在30℃下振荡孵育16至24小时后,将每种摇瓶培养物的均等部分随后无菌转移到包含设计用于支持高生物量的化学限定培养基的每个8单元多重发酵***中。在2L发酵罐中,培养物以甘油补料分批模式在对于pH、温度和溶解氧的受控条件下操作。分批补料的高细胞密度发酵过程包括生长阶段,然后是诱导阶段,该诱导阶段通过在培养物达到目标生物量(湿细胞重量)时添加IPTG和5g/L甘露糖醇开始。诱导阶段期间的条件根据实验设计而变化。发酵的诱导阶段允许进行约24小时。从发酵罐中抽取分析样品以确定细胞密度(575nm处的光密度),且然后冷冻用于随后的分析以确定靶基因表达的水平。在诱导后24小时的最终时间点,通过以15,900×g离心60至90分钟来收获每个容器的全发酵肉汤。分离细胞糊和上清液,并将糊保留和在-80℃下冷冻。
表14显示了菌株STR57863和STR57860在几种发酵条件下的表达结果。如所示的,几种初始菌株/发酵条件组合导致>30%的TCP天冬酰胺酶表达。总细胞蛋白计算如下:
0.55 DCW总细胞蛋白x A550下500μg/mL DCW=A550下275μg总细胞蛋白/ml(或mg/L)=1
最终时间点(I24)的TCP=OD575*275mg/L TCP
可溶性%TCP=100*(可溶性滴度/TCP)
Figure BDA0002498380930000751
实施例6:天冬酰胺酶摇瓶表达
进行摇瓶表达(200mL)以评价克立他酶、大肠杆菌II型L-天冬酰胺酶和荧光假单胞菌II型L-天冬酰胺酶表达菌株的蛋白质产生。如表15所示,将天冬酰胺酶表达质粒转化到天冬酰胺酶缺陷的宿主菌株PF1433中以产生表达菌株。从摇瓶样品产生的裂解产物用于初始活性分析和通过LC-MS分析确认完整质量。
Figure BDA0002498380930000761
表15显示了通过以200mL工作体积摇瓶规模分析的使用PF1433宿主菌株(天然天冬酰胺酶缺陷的,野生型菌株)构建的三个克立他酶表达菌株的还原的可溶和不溶超声部分(十个不同重复)的SDS-CGE分析确定的平均估计滴度。基于与大肠杆菌L-Asp(Sigma)标准曲线的比较估算SDS-CGE滴度。从每个菌株的可溶和不溶超声样品分析获得的SDS-CGE凝胶样图像显示在图7中。值得注意的是,从包含AnsB前导肽的构建体(STR55981,天然分泌前导肽-天然天冬酰胺酶蛋白融合体)产生的荧光假单胞菌天然L-Asp2蛋白的滴度明显低于从包含AnsB前导肽的构建体(STR55976)产生的大肠杆菌天冬酰胺酶蛋白的滴度,即其中AnsB前导肽与异源天冬酰胺酶蛋白融合,(677μg/ml与1011μg/ml相比较,相差约1.5倍)。
分析中包括来自两个null菌株:STR55982和DC432的摇瓶生长。DC432菌株在野生型荧光假单胞菌宿主菌株中携带质粒pDOW1169,其不包含克立他酶编码区。STR55982在宿主菌株PF1433中携带质粒pDOW1169,其包含两个天然天冬酰胺酶编码序列的染色体缺失。所有三种克立他酶表达菌株均产生主要可溶性的克立他酶蛋白表达,菌株STR55978实现高达14g/L的最高可溶性滴度。此外,没有观察到生长惩罚(growth penalty),因为所有三个克立他酶表达菌株在诱导后24小时与诱导后24小时分别达到21.7和23.7的OD600的STR55982和DC432null菌株相比达到了相似的细胞密度(OD600=23.0、27.0和27.8)。
使用购自Sigma的商业试剂盒(Asparaginase Activity Assay Kit)根据制造商的说明书分析从五个摇瓶表达菌株中每一个产生的可溶超声样品的天冬酰胺酶活性。该试剂盒使用偶联酶反应测量活性,其产生与生成的天冬氨酸成比例的比色终产物。将来自Sigma的大肠杆菌II型天冬酰胺酶(A3809)掺入STR55982null裂解产物中作为阳性对照(最后一行)。
活性结果显示于表16中。
Figure BDA0002498380930000771
Figure BDA0002498380930000781
尽管两个null样品在1:25,000稀释因子下均未显示可测量的活性,但是以1:25,000稀释的来自菌株STR55976、STR55977、STR55978、STR55979和STR55980的可溶超声样品显示出与掺有来自Sigma的250μg/mL大肠杆菌L-天冬酰胺酶(A3809)的相似稀释的STR55982null菌株样品相当的活性。使用市售试剂盒获得的这些初始活性结果似乎表明,在荧光假单胞菌中表达的克立他酶蛋白和大肠杆菌天冬酰胺酶蛋白可以容易地在生成的超声样品中形成活性的四聚体天冬酰胺酶。
表17显示了分析来自由摇瓶中菌株STR55978、STR55979和STR55980产生的可溶超声样品的克立他酶蛋白,以及来自由菌株STR55976和STR55977产生的可溶超声样品的大肠杆菌天冬酰胺酶的LC-MS完整质量结果。来自每个菌株的克立他酶蛋白的观察分子量(35053Da)与理论分子量(35054.2Da)一致,表明所有三个菌株产生预期的氨基酸序列,及分泌前导肽(如果存在的话)的完全加工或去除。来自每个菌株的大肠杆菌天冬酰胺酶的观察分子量(34591)与理论分子量(34591.96)一致,表明这两个菌株产生了预期的氨基酸序列,并且发生分泌前导肽的完全加工或去除。分析Sigma大肠杆菌L-Asp作为对照。图8显示了STR55978的质谱读数,表明克立他酶与AnsB前导肽正确切割。通过LC-MS显示在STR55976和STR55977中表达的大肠杆菌Asp2分别从AnsB和Ibp-S31A前导肽正确切割。
Figure BDA0002498380930000782
Figure BDA0002498380930000791
Figure BDA0002498380930000792
Figure BDA0002498380930000801
Figure BDA0002498380930000811
尽管本文已经示出和描述了本公开的优选实施方案,但是这些实施方案仅以示例的方式提供。在不脱离本公开的情况下,本领域技术人员现在可想到许多变化、改变和替换。应该理解的是,本文描述的本公开的实施方案的各种替代方案可以用于实施本文的方法。意图的是所附权利要求限定本发明的范围,并且由此涵盖这些权利要求范围内的方法和结构及其等同物。
Figure IDA0002498380980000011
Figure IDA0002498380980000021
Figure IDA0002498380980000031
Figure IDA0002498380980000041
Figure IDA0002498380980000051
Figure IDA0002498380980000061
Figure IDA0002498380980000071
Figure IDA0002498380980000081
Figure IDA0002498380980000091
Figure IDA0002498380980000101
Figure IDA0002498380980000111
Figure IDA0002498380980000121

Claims (20)

1.一种多肽,其包含与目的蛋白质或多肽可操作地连接的前导肽,其中所述前导肽具有如SEQ ID NO:1、2或3所示的氨基酸序列。
2.根据权利要求1所述的多肽,其中所述前导肽不是所述目的蛋白质或多肽天然的前导肽。
3.根据权利要求1所述的多肽,其中所述目的蛋白质或多肽选自抗体或抗体衍生物、酶、细胞因子、趋化因子、生长因子和疫苗抗原。
4.根据权利要求2所述的多肽,其中所述抗体或抗体衍生物是scFv、Fab、人源化抗体、修饰的抗体、单结构域抗体、异种特异性抗体、三价抗体、双特异性抗体、单链抗体、Fab片段、线性抗体、双抗体或全链抗体。
5.根据权利要求1所述的多肽,其进一步包含接头。
6.根据权利要求1所述的多肽,其进一步包含切割结构域。
7.根据权利要求1所述的多肽,其中第一部分是将所述目的蛋白质或多肽的表达指引至原核宿主细胞的周质的前导肽。
8.根据权利要求7所述的多肽,其中所述原核宿主细胞选自假单胞菌细胞或大肠杆菌细胞。
9.一种在原核细胞培养物中产生目的蛋白质或多肽的方法,该方法包括:(a)在细胞培养生长培养基中培养原核细胞,其中所述原核细胞包含编码与前导肽可操作地连接的所述目的蛋白质或多肽的核酸;和(b)从所述原核细胞的周质分离所述目的蛋白质或多肽,其中所述前导肽包含选自SEQ ID NO:1、2和3的氨基酸序列。
10.根据权利要求9所述的方法,其中所述目的蛋白质或多肽选自抗体或抗体衍生物、酶、细胞因子、趋化因子、生长因子和疫苗抗原。
11.根据权利要求10所述的方法,其中所述抗体或抗体衍生物是scFv、Fab、人源化抗体、修饰的抗体、单结构域抗体、异种特异性抗体、三价抗体、双特异性抗体、单链抗体、Fab片段、线性抗体、双抗体或全链抗体。
12.根据权利要求9所述的方法,其中所述核酸编码接头。
13.根据权利要求9所述的方法,其中所述核酸编码切割结构域。
14.根据权利要求9所述的方法,其中所述原核细胞选自假单胞菌细胞或大肠杆菌细胞。
15.一种在原核细胞的周质中表达目的蛋白质或多肽的方法,该方法包括在细胞培养生长培养基中培养所述原核细胞,该原核细胞包含编码与前导肽可操作地连接的目的蛋白质或多肽的核酸,其中所述前导肽包含选自SEQ ID NO:1、2和3的氨基酸序列。
16.根据权利要求15所述的方法,其中所述目的蛋白质或多肽选自抗体或抗体衍生物、酶、细胞因子、趋化因子、生长因子和疫苗抗原。
17.根据权利要求16所述的方法,其中所述抗体或抗体衍生物是scFv、Fab、人源化抗体、修饰的抗体、单结构域抗体、异种特异性抗体、三价抗体、双特异性抗体、单链抗体、Fab片段、线性抗体、双抗体或全链抗体。
18.根据权利要求15所述的方法,其中所述核酸编码接头。
19.根据权利要求15所述的方法,其中所述核酸编码切割结构域。
20.根据权利要求15所述的方法,其中所述原核细胞选自假单胞菌细胞或大肠杆菌细胞。
CN201880074902.6A 2017-10-27 2018-10-17 用于周质蛋白质表达的细菌前导序列 Pending CN111372941A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762578304P 2017-10-27 2017-10-27
US62/578,304 2017-10-27
PCT/US2018/056376 WO2019083795A1 (en) 2017-10-27 2018-10-17 GUIDED BACTERIAL SEQUENCES FOR EXPRESSION OF PERIPLASMIC PROTEINS

Publications (1)

Publication Number Publication Date
CN111372941A true CN111372941A (zh) 2020-07-03

Family

ID=66242728

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880074902.6A Pending CN111372941A (zh) 2017-10-27 2018-10-17 用于周质蛋白质表达的细菌前导序列

Country Status (10)

Country Link
US (1) US20190127744A1 (zh)
EP (1) EP3700915A4 (zh)
JP (1) JP2021501157A (zh)
KR (1) KR20200073280A (zh)
CN (1) CN111372941A (zh)
AU (1) AU2018354069A1 (zh)
BR (1) BR112020008369A2 (zh)
CA (1) CA3077393A1 (zh)
SG (1) SG11202002989SA (zh)
WO (1) WO2019083795A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3700921A4 (en) 2017-10-27 2021-12-15 Pfenex Inc. PROCESS FOR THE PRODUCTION OF RECOMBINANT ERWINIA ASPARAGINASE
EP4202054A1 (en) * 2020-08-24 2023-06-28 Amano Enzyme Inc. Method for producing modified protein

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101641441A (zh) * 2007-01-31 2010-02-03 陶氏环球技术公司 用于提高表达的细菌前导序列
US20170044224A1 (en) * 2014-04-30 2017-02-16 Lg Life Sciences Ltd. A protein secretory factor with high secretory efficiency and an expression vector comprising the same

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4551433A (en) 1981-05-18 1985-11-05 Genentech, Inc. Microbial hybrid promoters
US4755465A (en) 1983-04-25 1988-07-05 Genentech, Inc. Secretion of correctly processed human growth hormone in E. coli and Pseudomonas
US5281532A (en) 1983-07-27 1994-01-25 Mycogen Corporation Pseudomas hosts transformed with bacillus endotoxin genes
US4695462A (en) 1985-06-28 1987-09-22 Mycogen Corporation Cellular encapsulation of biological pesticides
US4695455A (en) 1985-01-22 1987-09-22 Mycogen Corporation Cellular encapsulation of pesticides produced by expression of heterologous genes
GB8517071D0 (en) 1985-07-05 1985-08-14 Hoffmann La Roche Gram-positive expression control sequence
US5128130A (en) 1988-01-22 1992-07-07 Mycogen Corporation Hybrid Bacillus thuringiensis gene, plasmid and transformed Pseudomonas fluorescens
US5055294A (en) 1988-03-03 1991-10-08 Mycogen Corporation Chimeric bacillus thuringiensis crystal protein gene comprising hd-73 and berliner 1715 toxin genes, transformed and expressed in pseudomonas fluorescens
US5169760A (en) 1989-07-27 1992-12-08 Mycogen Corporation Method, vectors, and host cells for the control of expression of heterologous genes from lac operated promoters
US9453251B2 (en) 2002-10-08 2016-09-27 Pfenex Inc. Expression of mammalian proteins in Pseudomonas fluorescens
JP5087741B2 (ja) 2003-11-19 2012-12-05 フェネックス インコーポレイテッド 改良タンパク質発現系
CA2546157C (en) * 2003-11-21 2014-07-22 Dow Global Technolgies Inc. Improved expression systems with sec-system secretion
JP2008507294A (ja) 2004-07-26 2008-03-13 ダウ グローバル テクノロジーズ インコーポレイティド 菌株遺伝子操作による改善されたタンパク質発現のための方法
AU2007254993A1 (en) 2006-05-30 2007-12-13 Dow Global Technologies Llc Codon optimization method
US9580719B2 (en) 2007-04-27 2017-02-28 Pfenex, Inc. Method for rapidly screening microbial hosts to identify certain strains with improved yield and/or quality in the expression of heterologous proteins
AU2008245696B2 (en) 2007-04-27 2013-11-07 Pelican Technology Holdings, Inc. Method for rapidly screening microbial hosts to identify certain strains with improved yield and/or quality in the expression of heterologous proteins
GB0917647D0 (en) 2009-10-08 2009-11-25 Glaxosmithkline Biolog Sa Expression system
NZ602958A (en) 2010-03-30 2014-07-25 Pfenex Inc High level expression of recombinant toxin proteins
PL2552949T3 (pl) 2010-04-01 2017-01-31 Pfenex Inc. Sposoby wytwarzania G-CSF w komórce gospodarza Pseudomonas

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101641441A (zh) * 2007-01-31 2010-02-03 陶氏环球技术公司 用于提高表达的细菌前导序列
CN102517280A (zh) * 2007-01-31 2012-06-27 菲尼克斯股份有限公司 用于提高表达的细菌前导序列
US20170044224A1 (en) * 2014-04-30 2017-02-16 Lg Life Sciences Ltd. A protein secretory factor with high secretory efficiency and an expression vector comprising the same

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HUSER,ET AL.: "cloning,sequence analysis,and expression of ansB from Pseudomonas fluorescens,encoding periplasmic glutaminase/asparaginase" *
无: "Asparaginase from pseudomonas fluorescens" *

Also Published As

Publication number Publication date
WO2019083795A1 (en) 2019-05-02
US20190127744A1 (en) 2019-05-02
CA3077393A1 (en) 2019-05-02
BR112020008369A2 (pt) 2020-11-03
JP2021501157A (ja) 2021-01-14
AU2018354069A1 (en) 2020-06-11
SG11202002989SA (en) 2020-05-28
EP3700915A1 (en) 2020-09-02
KR20200073280A (ko) 2020-06-23
EP3700915A4 (en) 2021-07-28

Similar Documents

Publication Publication Date Title
EP2553102B1 (en) High level expression of recombinant toxin proteins
US11377661B2 (en) Method for production of recombinant Erwinia asparaginase
KR20170085129A (ko) 펩티드 생산용 융합 파트너
JP7358347B2 (ja) 組み換えE.coliアスパラギナーゼの製造のための方法
AU2010201410B2 (en) High level expression of recombinant CRM197
CN111372941A (zh) 用于周质蛋白质表达的细菌前导序列
JPWO2007013265A1 (ja) 新規なエンドリボヌクレアーゼ
JP2013066446A (ja) σD因子抑制解除株及びそれを用いたタンパク質の製造方法
JP5520498B2 (ja) タンパク質又はポリペプチドの製造方法
US20230100757A1 (en) Bacterial hosts for recombinant protein expression
JP5828634B2 (ja) 組換え微生物を用いたタンパク質の製造方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200703