CN117836315A - 用于增强芽孢杆菌属细胞中蛋白质产生的方法和组合物 - Google Patents

用于增强芽孢杆菌属细胞中蛋白质产生的方法和组合物 Download PDF

Info

Publication number
CN117836315A
CN117836315A CN202280054831.XA CN202280054831A CN117836315A CN 117836315 A CN117836315 A CN 117836315A CN 202280054831 A CN202280054831 A CN 202280054831A CN 117836315 A CN117836315 A CN 117836315A
Authority
CN
China
Prior art keywords
seq
poi
nucleic acid
operably linked
acid encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280054831.XA
Other languages
English (en)
Inventor
R·L·弗里希
W·徐
C·莱夫朗
M·科尔克曼
H·贺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Danisco US Inc
Original Assignee
Danisco US Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Danisco US Inc filed Critical Danisco US Inc
Publication of CN117836315A publication Critical patent/CN117836315A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/32Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/75Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • C12N9/1055Levansucrase (2.4.1.10)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2408Glucanases acting on alpha -1,4-glucosidic bonds
    • C12N9/2411Amylases
    • C12N9/2414Alpha-amylase (3.2.1.1.)
    • C12N9/2417Alpha-amylase (3.2.1.1.) from microbiological source
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/07Bacillus
    • C12R2001/10Bacillus licheniformis

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本公开总体上涉及表达异源目的蛋白的重组微生物细胞。因此,本公开的某些方面尤其涉及具有增强的蛋白质生产能力的重组芽孢杆菌属细胞、新型蛋白质信号序列、编码异源目的蛋白的重组多核苷酸及其相关组合物和/或方法。因此,如本文所举例说明的,本公开的重组芽孢杆菌属细胞特别适合用于在异源蛋白质的表达、生产和分泌中使用。

Description

用于增强芽孢杆菌属细胞中蛋白质产生的方法和组合物
技术领域
本公开总体上涉及微生物细胞、分子生物学、发酵、蛋白质生产等领域。本公开的某些方面尤其涉及具有增强的蛋白质生产能力的重组芽孢杆菌属(Bacillus)细胞。
序列表的引用
命名为“NB41810-US-PSP_SequenceListing.txt”的文本文件序列表的电子提交的内容创建于2022年8月15日,并且大小为192KB,将其通过引用以其全文特此并入。
背景技术
***如枯草芽孢杆菌(Bacillus subtilis)、地衣芽孢杆菌(Bacilluslicheniformis)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)等由于其优异的发酵特性和高产率(例如,高达25克/升培养物;Van Dijl和Hecker,2013)经常被用作用于产生工业相关蛋白质的微生物工厂。例如,芽孢杆菌属物种细胞因其生产食品、纺织品、洗衣、医疗器械清洗、制药工业等所必需的淀粉酶(Jensen等人,2000;Raul等人,2014)和蛋白酶(Brode等人,1996)而被熟知(Westers等人,2004)。因为这些非致病性***产生的蛋白质完全没有毒性副产物(例如,脂多糖;LPS,也称为内毒素),因此它们获得了欧洲食品***(European Food Safety Authority)的“安全资格认证”(QPS)地位,并且其许多产品获得了美国食品药品监督管理局(US Food and Drug Administration)的“公认安全”(GRAS)地位(Olempska-Beer等人,2006;Earl等人,2008;Caspers等人,2010)。因此,在***细胞中生产蛋白质(例如,酶、抗体、受体等)是生物技术领域高度关注的领域,其中当蛋白质以大工业量生产时,蛋白质产量的微小提高是相当重要的。
如下文所述,本公开涉及对于获得、构建、产生等具有增加的蛋白质生产能力的革兰氏阳性宿主细胞的高度期望和未满足的需求。更特别地,除了别的之外,本公开的某些方面涉及用于构建具有增强的蛋白质生产能力的重组芽孢杆菌属细胞的组合物和方法,这些重组细胞特别可用于生产异源蛋白质。
发明内容
如上文简单阐述,本公开的某些方面涉及具有增强的蛋白质生产表型的重组芽孢杆菌属细胞(菌株)。因此,在某些方面,除了别的之外,本公开提供了编码新型蛋白质信号序列的核酸及其多核苷酸构建体(例如,载体、表达盒),其特别适用于构建具有本文所述增加的蛋白质生产能力的重组(经修饰的)芽孢杆菌属宿主细胞。
更特别地,在某些实施例中,本公开的核酸编码包含SEQ ID NO:2的经修饰的地衣芽孢杆菌SacB信号序列(modSacBss)。在某些其他实施例中,本公开的核酸编码包含SEQ IDNO:6的经修饰的地衣芽孢杆菌Bli03445信号序列(modBli03445ss)。
在其他实施例中,本公开的重组多核苷酸包含编码包含SEQ ID NO:2的信号序列的上游(5′)核酸,该上游核酸可操作地连接到编码目的蛋白(POI)的下游(3′)核酸。在某些其他实施例中,本公开的重组多核苷酸包含编码包含SEQ ID NO:6的信号序列的上游(5′)核酸,该上游核酸可操作地连接到编码目的蛋白(POI)的下游(3′)核酸。
在其他方面,本公开的重组多核苷酸包含上游(5′)启动子序列,该上游启动子序列可操作地连接到编码包含SEQ ID NO:2的信号序列的下游核酸,该下游核酸可操作地连接到编码目的蛋白(POI)的下游(3′)核酸。在某些其他实施例中,本公开的重组多核苷酸包含上游(5′)启动子序列,该上游启动子序列可操作地连接到编码包含SEQ ID NO:6的信号序列的下游核酸,该下游核酸可操作地连接到编码目的蛋白(POI)的下游(3′)核酸。在其他实施例中,该重组多核苷酸进一步包含位于编码POI的核酸下游(3′)并与其可操作地连接的终止子序列。
因此,某些其他实施例提供了包含至少一种引入的本文所阐述多核苷酸的重组芽孢杆菌属细胞。在其他方面,本公开的重组芽孢杆菌属细胞包含至少两种引入的本文所阐述的多核苷酸。在某些其他方面,使本公开的重组芽孢杆菌属细胞缺乏一种或多种天然(内源)基因的产生。在某些实施例中,使芽孢杆菌属细胞缺乏一种或多种天然(内源)蛋白酶的产生。
本公开的其他实施例涉及重组芽孢杆菌属细胞,其表达编码异源目的蛋白(POI)的引入的多核苷酸,其中该多核苷酸包含编码包含SEQ ID NO:2的信号序列的上游(5′)核酸,该上游核酸可操作地连接到编码POI的下游(3′)核酸。在其他实施例中,本公开涉及重组芽孢杆菌属细胞,其表达至少两种编码异源目的蛋白(POI)的引入的多核苷酸,其中引入的多核苷酸包含编码包含SEQ ID NO:2的信号序列的、可操作地连接到编码POI的下游(3′)核酸的上游(5′)核酸。
在其他实施例中,本公开涉及重组芽孢杆菌属细胞,其表达编码异源目的蛋白(POI)的引入的多核苷酸,其中该多核苷酸包含编码包含SEQ ID NO:6的信号序列的上游(5′)核酸,该上游核酸可操作地连接到编码POI的下游(3′)核酸。在某些其他实施例中,本公开涉及重组芽孢杆菌属细胞,其表达至少两种编码异源目的蛋白(POI)的引入的多核苷酸,其中引入的多核苷酸包含编码包含SEQ ID NO:6的信号序列的、可操作地连接到编码POI的下游(3′)核酸的上游(5′)核酸。
因此,某些其他实施例涉及重组芽孢杆菌属细胞,其表达至少两种编码异源目的蛋白(POI)的引入的多核苷酸,其中该第一和第二引入的多核苷酸分别包含编码包含SEQID NO:2的信号序列的、可操作地连接到编码POI的下游(3′)核酸的上游(5′)核酸,以及编码包含SEQ ID NO:6的信号序列的、可操作地连接到编码POI的下游(3′)核酸的上游(5′)核酸。
在其他实施例中,本公开涉及用于在芽孢杆菌属宿主细胞中表达异源目的蛋白的方法。更特别地,某些实施例涉及用于在芽孢杆菌属细胞中表达异源目的蛋白(POI)的方法,这些方法包括获得或构建包含引入的多核苷酸的芽孢杆菌属细胞,该引入的多核苷酸包含上游(5′)启动子序列,该上游启动子序列可操作地连接到编码包含SEQ ID NO:2的信号序列的下游核酸,该下游核酸可操作地连接到编码POI的下游(3′)核酸,以及在适用于表达POI的条件下发酵芽孢杆菌属细胞。某些其他实施例涉及用于在芽孢杆菌属细胞中表达异源目的蛋白(POI)的方法,这些方法包括获得或构建包含引入的多核苷酸的芽孢杆菌属细胞,该引入的多核苷酸包含上游(5′)启动子序列,该上游启动子序列可操作地连接到编码包含SEQ ID NO:6的信号序列的下游核酸,该下游核酸可操作地连接到编码POI的下游(3′)核酸,以及在适用于表达POI的条件下发酵芽孢杆菌属细胞。
在这些方法的某些方面,当在适用于表达POI的条件下发酵时,芽孢杆菌属细胞将POI分泌到发酵肉汤中。
附图说明
图1显示了天然地衣芽孢杆菌SacB(蛋白质)信号序列(图1A-SacBss;SEQ ID NO:1)和经修饰的SacB信号序列(图1B-modSacBss;SEQ ID NO:2)的氨基酸序列。如图1所呈现,特定蛋白质信号序列的氨基酸位置可以根据一级氨基酸序列来描述(图1A和图1B;参见第1序列),从氨基-末端开始描述和编号(NH2;图1A和图1B;参见第2序列),和/或根据特定信号序列的切割位点进行描述和编号(图1A和图1B;参见第3序列)。图1C呈现了天然(SacBss)和经修饰的(modSacBss)信号序列的比对。
图2显示了天然地衣芽孢杆菌AmyLss信号序列的氨基酸序列(图2A,AmyLss;SEQID NO:3)和经修饰的modAmyLss信号序列(图2B,modAmyLss;SEQ ID NO:4)。图2C显示了天然(AmyLss)和经修饰的(modAmyLss)信号序列的比对。
图3显示了天然地衣芽孢杆菌Bli03445信号序列的氨基酸序列(图3A,Bli03445;SEQ ID NO:5)和经修饰的Bli03445信号序列(图3B,modBli03445;SEQ ID NO:6)。图3C显示了天然(Bli03445)和经修饰的(modBli03445)信号序列的比对。
生物序列说明
SEQ ID NO:1是天然地衣芽孢杆菌SacB信号序列(SacBss)的氨基酸序列。
SEQ ID NO:2是经修饰的地衣芽孢杆菌SacB信号序列(modSacBss)的序列的氨基酸序列。
SEQ ID NO:3是天然地衣芽孢杆菌AmyL信号序列(AmyLss)的氨基酸序列。
SEQ ID NO:4是经修饰的AmyL B信号序列(modAmyLss)的序列的氨基酸序列。
SEQ ID NO:5是天然地衣芽孢杆菌Bli03445信号序列(Bli03445ss)的氨基酸序列。
SEQ ID NO:6是经修饰的Bli03445信号序列(modBli03445ss)的序列的氨基酸序列。
SEQ ID NO:7是pWS733的合成DNA序列。
SEQ ID NO:8是淀粉酶1报告蛋白的氨基酸序列。
SEQ ID NO:9是第1淀粉酶1盒(modSacBss;[pro-modSacBss-淀粉酶1]lysA)的合成DNA序列。
SEQ ID NO:10是地衣芽孢杆菌lysA上游(lysA.上游)序列。
SEQ ID NO:11是地衣芽孢杆菌lysA可读框(ORF)。
SEQ ID NO:12是合成的p2启动子。
SEQ ID NO:13是枯草芽孢杆菌aprE 5'-UTR序列。
SEQ ID NO:14是地衣芽孢杆菌amyL终止子序列。
SEQ ID NO:15是地衣芽孢杆菌lysA下游(lysA.下游)序列。
SEQ ID NO:16是名为“ws683”的合成引物序列。
SEQ ID NO:17是名为“ws688”的合成引物序列。
SEQ ID NO:18是pWS735的合成DNA序列。
SEQ ID NO:19是第2淀粉酶1盒(modSacBss;[pro-modSacBss-淀粉酶1]serA)的合成DNA序列。
SEQ ID NO:20是地衣芽孢杆菌serA上游(serA.上游)序列。
SEQ ID NO:21是地衣芽孢杆菌serA ORF。
SEQ ID NO:22是合成的p3启动子。
SEQ ID NO:23是地衣芽孢杆菌serA下游(serA.下游)序列。
SEQ ID NO:24是名为“ws709”的合成引物序列。
SEQ ID NO:25是名为“ws714”的合成引物序列。
SEQ ID NO:26是名为“ws775”的合成引物序列。
SEQ ID NO:27是名为“ws776”的合成引物序列。
SEQ ID NO:28是合成的1904bp DNA片段,用于筛选第1淀粉酶1(modSacBss)盒的整合。
SEQ ID NO:29是名为“1617”的合成引物序列。
SEQ ID NO:30是名为“ws717”的合成引物序列。
SEQ ID NO:31是合成的1864bp片段,用于筛选第2淀粉酶1(modSacBss)盒的整合。
SEQ ID NO:32是第1淀粉酶1盒(modAmyLss;pro-modAmyLss-淀粉酶1]lysA)的合成DNA序列。
SEQ ID NO:33是第2淀粉酶1盒(modAmyLss;pro-modAmyLss-淀粉酶1]serA)的合成DNA序列。
SEQ ID NO:34是pWS743的合成DNA序列。
SEQ ID NO:35是淀粉酶2报告蛋白的氨基酸序列。
SEQ ID NO:36是第1淀粉酶2盒(modBli03445ss;[pro-modBli03445ss-淀粉酶2]lysA)的合成DNA序列。
SEQ ID NO:37是pWS745的合成DNA序列。
SEQ ID NO:38是第2淀粉酶2盒(modBli03445ss;[pro-modBli03445ss-淀粉酶2]serA)的合成DNA序列。
SEQ ID NO:39是合成的p1启动子。
SEQ ID NO:40是合成的1905bp片段,用于筛选第1淀粉酶2盒(modBli03445ss;[pro-modBli03445ss-淀粉酶2]lysA)的整合。
SEQ ID NO:41是合成的1849bp片段,用于筛选第2淀粉酶2盒(modBli03445ss;[pro-modBli03445ss-淀粉酶2]serA)的整合。
SEQ ID NO:42是第1淀粉酶2盒(modAmyLss;[pro-modAmyLss-淀粉酶2]serA)的合成DNA序列。
SEQ ID NO:43是第2淀粉酶2盒(modAmyLss;[pro-modAmyLss-淀粉酶2]lysA)的合成DNA序列。
SEQ ID NO:44是经修饰的枯草芽孢杆菌aprE 5′-UTR序列的合成DNA序列。
SEQ ID NO:45是经修饰的地衣芽孢杆菌AmyL信号序列(modAmyLss)的合成DNA序列(modAmyLss)。
SEQ ID NO:46是经修饰的地衣芽孢杆菌Bli03445信号序列(mod Bli03445ss)的合成DNA序列(modBli03445ss)。
SEQ ID NO:47是地衣芽孢杆菌serA上游(serA.上游)序列。
SEQ ID NO:48是serA盒和serA盒的下游同源臂。
具体实施方式
I.概述
如本文所述,本公开解决了本领域中许多正在进行的和未满足的需求,特别是与工业规模生产重组蛋白相关的需求。除了别的之外,本公开的某些实施例提供了能够表达增加量的目的蛋白的重组芽孢杆菌属细胞。因此,除了别的之外,本公开的某些方面提供了新型(重组)芽孢杆菌属细胞,其包含编码目的蛋白的引入的核酸(例如,载体、表达盒),编码经修饰的(蛋白质)信号序列的多核苷酸构建体,这些信号序列可操作地连接到编码目的蛋白的下游核酸,包含一种或多种引入的多核苷酸构建体的重组芽孢杆菌属细胞,以及用于在本公开的重组芽孢杆菌属细胞中培养和表达异源目的蛋白的相关方法等。
II.定义
鉴于重组细胞、核酸、多核苷酸、目的蛋白等,定义了以下术语和短语。本文未定义的术语应当符合如本领域使用的其常规含义。
除非另外定义,否则本文使用的所有技术和科学术语都具有与本发明组合物和方法应用的领域的普通技术人员通常所理解的相同的含义。尽管在本发明组合物和方法的实践或测试中也可以使用与本文所述的方法和材料类似或等同的任何方法和材料,但现在描述了代表性的说明性方法和材料。将本文引用的所有出版物和专利都通过引用以其全文并入。
应进一步注意,可以撰写权利要求书以排除任何任选的要素。因此,此陈述旨在作为使用与权利要求要素的叙述有关的排他性术语如“单独”、“仅”、“排除”、“不包括”等或使用“否定型”限定的前提基础(或其条件)。在某些实施例中,本文使用的条件的实例是根据本公开内容生产和/或纯化的“重组凝集素蛋白”不是“His标记的凝集素”。
在阅读本公开后,如将对于本领域技术人员显而易见的,本文描述和说明的单独实施例中的每一个具有离散的组分和特征,这些组分和特征可以在不偏离本文所述的本发明组合物和方法的范围或精神的情况下容易地与其他几个实施例中的任一个的特征分离或组合。可以按照所叙述的事件的顺序或按照逻辑上可能的任何其他顺序来进行任何叙述的方法。
如本文使用的,术语“重组”或“非天然”是指具有至少一个工程化遗传改变或已通过引入异源核酸分子而修饰的生物体、微生物、细胞、核酸分子或载体,或者是指已经被改变使得可以控制异源核酸分子或内源核酸分子或基因的表达的细胞(例如,革兰氏阳性细胞)。重组还指衍生自非天然细胞的细胞,或者是具有一个或多个此类修饰的非天然细胞的后代。遗传改变包括例如引入编码蛋白质的可表达核酸分子的修饰,或细胞遗传物质的其他核酸分子添加、缺失、取代或其他功能性改变。例如,重组细胞可以表达未在天然(野生型)细胞内发现的相同或同源形式的基因或其他核酸分子(例如,多核苷酸表达构建体),或者可以提供改变的内源基因表达模式,如过表达、低表达、最低表达或根本不表达。“重组(Recombination)”、“重组(recombining)”或产生“重组”核酸通常是两个或更多个核酸片段的组装,其中该组装产生否则将不会在基因组中发现的嵌合DNA序列。
术语“衍生的”涵盖术语“起源的”、“获得的”“可获得的”和“创建的”,并且通常表示一种指定的材料或组合物在另一种指定的材料或组合物中找到它的起源或具有可以参考另一种指定材料或组合物描述的特征。例如,本公开的重组***细胞可以衍生自/获得自任何已知的***菌株。
如本文使用的,“核酸”是指核苷酸或多核苷酸序列及其片段或部分,以及基因组或合成起点的DNA、cDNA和RNA,其可以是双链或单链,无论代表有义链还是反义链。应理解,由于遗传密码的简并性,多种核苷酸序列可以编码给定的蛋白质。
应理解,本文所述的多核苷酸(或核酸分子)包括“基因”、“载体”和“质粒”。
相应地,术语“基因”是指编码氨基酸的特定序列的多核苷酸,其包含所有或部分蛋白质编码序列,并且可以包括调节性(非转录的)DNA序列,如启动子序列,该启动子序列确定例如表达基因的条件。基因的转录区可以包括非翻译区(UTR)(包括内含子、5'-非翻译区(UTR)和3'-UTR)以及编码序列。
如本文使用的,“内源基因”是指位于生物体基因组的其天然位置中的基因。
如本文使用的,“异源”基因、“非内源”基因或“外源”基因是指通常未在宿主生物体中发现,但通过基因转移引入宿主生物体中的基因。术语一个或多个“外源”基因包含***非天然生物体中的天然基因和/或***天然或非天然生物体中的嵌合基因。
如本文使用的,“异源控制序列”是指基因表达控制序列(例如,启动子、增强子、终止子等),其本质上不起作用以调控(控制)目的基因的表达。通常,异源核酸对于它们存在的细胞或基因组的一部分而言不是内源(天然)的,并且已通过感染、转染、转导、转化、显微注射、电穿孔等添加到细胞中。“异源”核酸构建体可以含有与在天然宿主细胞中发现的控制序列/DNA编码序列组合相同或不同的控制序列/DNA编码(ORF)序列组合。
如本文使用的,术语“信号序列”和“信号肽”是指可以参与成熟蛋白或蛋白质的前体形式的分泌或定向转运的氨基酸残基的序列。典型地,信号序列位于前体或成熟蛋白序列的N-末端。信号序列可以是内源的或外源的。正常情况下,成熟蛋白中不存在信号序列。典型地,信号序列在易位过程中通过信号肽酶从蛋白质切割。
如本文使用的,术语“表达”是指衍生自本公开的核酸分子的有义(mRNA)或反义RNA的转录和稳定积累。表达也可指将mRNA翻译成多肽。因此,术语“表达”包括涉及多肽产生的任何步骤,这些步骤包括但不限于转录、转录后修饰、翻译、翻译后修饰、分泌等。
如本文使用的,术语“编码序列”是指直接指定其(所编码的)蛋白质产物的氨基酸序列的核苷酸序列。编码序列的边界一般由通常以ATG起始密码子开始的可读框(在下文中,“ORF”)确定。编码序列典型地包括DNA、cDNA和重组核苷酸序列。
如本文使用的,术语“启动子”是指能够控制编码序列或功能性RNA表达的核酸序列。通常,编码序列位于启动子序列的3'(下游)。启动子可以全部衍生自天然基因,或者由衍生自在自然界中发现的不同启动子的不同元件组成,或者甚至包含合成核酸区段。本领域技术人员应理解,不同的启动子可以指导基因在不同细胞类型中、或在不同发育阶段、或响应于不同环境或生理条件而表达。启动子可以是组成型启动子、诱导型启动子、可调启动子、杂合启动子、合成启动子、串联启动子等。使基因在大多数细胞类型中在大多数时间表达的启动子通常被称为“组成型启动子”。应进一步认识到,由于在大多数情况下,尚未完全界定调节序列的确切边界,因此不同长度的DNA片段可以具有相同启动子活性。
如本文使用的,“控制与目的基因的蛋白质编码序列连接的目的基因的表达的功能性启动子序列”是指控制所期望的革兰氏阳性宿主细胞中编码序列的转录和翻译的启动子序列。例如,在某些实施例中,本公开涉及包含在革兰氏阳性细胞中有功能的上游(5′)启动子(或5′启动子区、或串联5′启动子等)的多核苷酸,其中启动子区可操作地连接到编码目的蛋白的核酸序列。
如本文使用的,术语“可操作地连接”是指核酸序列在单个核酸片段上的缔合,使得一者的功能受到另一者影响。例如,当启动子能够影响编码序列的表达时,它与编码序列可操作地连接(即,编码序列在启动子的转录控制下)。编码序列可以在有义或反义方向上可操作地连接到调节序列。
当核酸被放置成与另一个核酸序列具有功能性关系时,该核酸与该另一个核酸序列“可操作地连接”。例如,如果编码分泌性前导序列(即,信号序列)的DNA表达为参与多肽分泌的前蛋白,则该编码分泌性前导序列的DNA可操作地连接到该多肽的DNA;如果启动子或增强子影响编码序列的转录,则该启动子或增强子可操作地连接到该序列;或者如果核糖体结合位点被定位以促进翻译,则该核糖体结合位点可操作地连接到编码序列。通常,“可操作地连接”意指被连接的DNA序列是连续的,并且在分泌性前导序列的情况下,是连续的并且处于阅读相中。然而,增强子不必是连续的。通过在方便的限制位点处连接来实现连接。如果这样的位点不存在,则按照常规实践使用合成的寡核苷酸衔接子或接头。
如本文使用的,“合适的调节序列”是指位于编码序列上游(5′非编码序列)、内部或下游(3′非编码序列),并且影响相关编码序列的转录、RNA加工或稳定性或者翻译的核苷酸序列。调控序列可以包括启动子、转录前导序列、RNA加工位点、效应子结合位点和茎环结构。
如本文使用的,天然地衣芽孢杆菌“SacB(蛋白质)信号序列”(缩写为“SacBss”)包含SEQ ID NO:1的氨基酸序列,如图1所示。
如本文使用的,经修饰的“SacB信号序列”(缩写为“modSacBss”)不包含SEQ IDNO:1的氨基酸序列。在某些实施例中,modSacBss包含氨基酸位置27处的氨基酸取代,和/或包含氨基酸位置28处的氨基酸取代,如图1所示。在某些方面,modSacBss包含位置27处的苏氨酸(T)至丙氨酸(A)取代和/或位置28处的苯丙氨酸(F)至丝氨酸(S)取代。在某些实施例中,modSacBss包含位置27处的T至A取代和位置28处的F至S取代,如SEQ ID NO:2所示。
如本文使用的,天然地衣芽孢杆菌“AmyL(蛋白质)信号序列”(缩写为“AmyLss”)包含SEQ ID NO:3的氨基酸序列,如图2所示。
如本文使用的,经修饰的地衣芽孢杆菌“AmyL(蛋白质)信号序列”(缩写为“modAmyLss”)包含SEQ ID NO:4的氨基酸序列,如图2所示。
如本文使用的,天然地衣芽孢杆菌“Bli03445(蛋白质)信号序列”(缩写为“Bli03445ss”)包含SEQ ID NO:5的氨基酸序列,如图3所示。
如本文使用的,经修饰的“Bli03445信号序列”(缩写为“modBli03445ss”)不包含SEQ ID NO:5的氨基酸序列。在某些实施例中,modBli03445ss包含氨基酸位置1处的氨基酸取代,和/或包含氨基酸位置26处的氨基酸取代,如图3所示。在某些方面,modBli03445ss包含氨基酸位置1处的缬氨酸(V)至甲硫氨酸(M)取代,和/或包含氨基酸位置26处的苯丙氨酸(F)至丝氨酸(S)取代,如SEQ ID NO:6所示。
如本文使用的,术语“淀粉酶1”(缩写为“Amy1”)和/或“淀粉酶2”(缩写为“Amy2”)并不意味着是限制性的,而是指本公开的示例性淀粉酶报告蛋白。例如,在某些方面,本公开证明了此类示例性淀粉酶报告蛋白(例如,Amy1(SEQ ID NO:8);Amy2(SEQ ID NO:35))的增强表达。如本文所述和预期的,可以根据本公开的重组菌株和相关方法来生产任何合适的目的蛋白(例如,酶)。
如本文使用的,短语如“淀粉酶1modSacBss盒”的第一(第1)拷贝或第1拷贝“淀粉酶1modSacBss”是指编码淀粉酶1的示例性表达盒(第1淀粉酶1盒;SEQ ID NO:9)。更特别地,第1淀粉酶1(modSacBss)盒的DNA序列包含上游(5′)启动子(pro)序列,该启动子序列可操作地连接到编码经修饰的SacB信号序列(modSacBss)的DNA序列(modSacBss),该DNA序列可操作地连接到编码成熟淀粉酶1蛋白的DNA序列。在某些方面,“第1拷贝淀粉酶1modSacBss”盒可以缩写为第1拷贝Amy1“[pro-modSacBss-淀粉酶1]”。
如本文使用的,短语如“淀粉酶1modSacBss盒”的第二(第2)拷贝或第2拷贝“淀粉酶1modSacBss”是指编码淀粉酶1的示例性表达盒(第2淀粉酶1盒;SEQ ID NO:19)。更特别地,第2淀粉酶1(modSacBss)盒的DNA序列包含上游(5′)启动子(pro)序列,该启动子序列可操作地连接到编码经修饰的SacB信号序列(modSacBss)的DNA序列(modSacBss),该DNA序列可操作地连接到编码成熟淀粉酶1蛋白的DNA序列。在某些方面,“第2拷贝淀粉酶1modSacBss”盒可以缩写为第2拷贝Amy1“[pro-modSacBss-淀粉酶1]”。
如本文使用的,短语如“淀粉酶1modAmyLss盒”的第一(第1)拷贝或第1拷贝“淀粉酶1modAmyLss”是指编码淀粉酶1的示例性表达盒(第1淀粉酶1盒;SEQ ID NO:32)。更特别地,第1淀粉酶1(modAmyLss)盒的DNA序列包含上游(5′)启动子(pro)序列,该启动子序列可操作地连接到编码经修饰的AmyLss信号序列(modAmyLss)的DNA序列(modAmyLss),该DNA序列可操作地连接到编码成熟淀粉酶1蛋白的DNA序列。在某些方面,“第1拷贝淀粉酶1modAmyLss”盒可以缩写为第1拷贝Amy1“[pro-modAmyLss-淀粉酶1]”。
如本文使用的,短语如“淀粉酶1modAmyLss盒”的第二(第2)拷贝或第2拷贝“淀粉酶1modAmyLss”是指编码淀粉酶1的示例性表达盒(第2淀粉酶1盒;SEQ ID NO:33)。更特别地,第2淀粉酶1(modAmyLss)盒的DNA序列包含上游(5′)启动子(pro)序列,该启动子序列可操作地连接到编码经修饰的AmyLss信号序列(modAmyLss)的DNA序列(modAmyLss),该DNA序列可操作地连接到编码成熟淀粉酶1蛋白的DNA序列。在某些方面,“第2拷贝淀粉酶1modAmyLss”盒可以缩写为第2拷贝Amy1“[pro-modAmyLss-淀粉酶1]”。
如本文使用的,短语如“淀粉酶2modBli03445ss盒”的第一(第1)拷贝或第1拷贝“淀粉酶2modBli03445ss”是指编码淀粉酶2的示例性表达盒(第1淀粉酶2盒;SEQ ID NO:36)。更特别地,第1淀粉酶2(modBli03445ss)盒的DNA序列包含上游(5′)启动子(pro)序列,该启动子序列可操作地连接到编码经修饰的Bli03445信号序列(modBli03445ss)的DNA序列(modBli03445ss),该DNA序列可操作地连接到编码成熟淀粉酶2蛋白的DNA序列。在某些方面,“第1拷贝淀粉酶2modBli03445ss”盒可以缩写为第1拷贝Amy2“[pro-modBli03445ss-淀粉酶2]”。
如本文使用的,短语如“淀粉酶2modBli03445ss盒”的第二(第2)拷贝或第2拷贝“淀粉酶2modBli03445ss”是指编码淀粉酶2的示例性表达盒(第2淀粉酶2盒;SEQ ID NO:38)。更特别地,第2淀粉酶2(modBli03445ss)盒的DNA序列包含上游(5′)启动子(pro)序列,该启动子序列可操作地连接到编码经修饰的Bli03445信号序列(modBli03445ss)的DNA序列(modBli03445ss),该DNA序列可操作地连接到编码成熟淀粉酶2蛋白的DNA序列。在某些方面,“第2拷贝淀粉酶2modBli03445ss”盒可以缩写为第2拷贝Amy2“[pro-modBli03445ss-淀粉酶2]”。
如本文使用的,短语如“淀粉酶2modAmyLss盒”的第一(第1)拷贝或第1拷贝“淀粉酶2modAmyLss”是指编码淀粉酶2的示例性表达盒(第1淀粉酶2盒;SEQ ID NO:42)。更特别地,第1淀粉酶2(modAmyLss)盒的DNA序列包含上游(5′)启动子(pro)序列,该启动子序列可操作地连接到编码经修饰的AmyLss信号序列(modAmyLss)的DNA序列(modAmyLss),该DNA序列可操作地连接到编码成熟淀粉酶2蛋白的DNA序列。在某些方面,“第1拷贝淀粉酶2modAmyLss”盒可以缩写为第1拷贝Amy2“[pro-modAmyLss-淀粉酶2]”。
如本文使用的,短语如“淀粉酶2modAmyLss盒”的第二(第2)拷贝或第2拷贝“淀粉酶2modAmyLss”是指编码淀粉酶2的示例性表达盒(第2淀粉酶2盒;SEQ ID NO:43)。更特别地,第2淀粉酶2(modAmyLss)盒的DNA序列包含上游(5′)启动子(pro)序列,该启动子序列可操作地连接到编码经修饰的AmyLss信号序列(modAmyLss)的DNA序列(modAmyLss),该DNA序列可操作地连接到编码成熟淀粉酶2蛋白的DNA序列。在某些方面,“第2拷贝淀粉酶2modAmyLss”盒可以缩写为第2拷贝Amy2“[pro-modAmyLss-淀粉酶2]”。
如本文使用的,名为“BF619”的亲本地衣芽孢杆菌(宿主)菌株包含至少其内源(天然)lysA(ΔlysA)和serA(ΔserA)基因的缺失。例如,在某些实施例中,亲本地衣芽孢杆菌菌株包含其天然lysA(ΔlysA)和serA(ΔserA)基因的缺失,并且可以进一步包含引入其中的另外的遗传修饰。在某些方面,重组地衣芽孢杆菌宿主细胞可以进一步包含内源(天然)蛋白酶基因的缺失或破坏。
如本文使用的,“芽孢杆菌属”包括如本领域技术人员已知的“芽孢杆菌”属内的所有物种,包括但不限于枯草芽孢杆菌、地衣芽孢杆菌、迟缓芽孢杆菌(B.lentus)、短芽孢杆菌(B.brevis)、嗜热脂肪芽孢杆菌(B.stearothermophilus)、嗜碱芽孢杆菌(B.alkalophilus)、解淀粉芽孢杆菌(B.amyloliquefaciens)、克劳氏芽孢杆菌(B.clausii)、耐盐芽孢杆菌(B.halodurans)、巨大芽孢杆菌(B.megaterium)、凝结芽孢杆菌(B.coagulans)、环状芽孢杆菌(B.circulans)、灿烂芽孢杆菌(B.lautus)和苏云金芽孢杆菌(B.thuringiensis)。应认识到,芽孢杆菌属不断进行分类学重组。因此,该属旨在包括已重新分类的物种,包括但不限于如嗜热脂肪芽孢杆菌(其现在名为“嗜热脂肪土芽孢杆菌(Geobacillus stearothermophilus)”)等的生物体。
如本文使用的,“宿主细胞”是指具有作为新引入的DNA序列的宿主或表达媒介物的能力的细胞。在本公开的某些实施例中,宿主细胞是芽孢杆菌属物种或大肠杆菌(E.coli)细胞。
如本文使用的,“经修饰的细胞”是指包含至少一个遗传修饰的重组细胞,该遗传修饰不存在于衍生出经修饰的(子代)细胞的亲本细胞中。
如本文使用的,当将重组(经修饰的)细胞中目的蛋白(POI)的表达和/或产生与未经修饰的(对照或亲本)细胞中相同POI的表达和/或产生相比较时,应理解,在相同条件(例如,相同条件如培养基、温度、pH等)下生长/培养/发酵经修饰的和未经修饰的细胞。
如本文使用的,当在短语如“相对于未经修饰的(对照或亲本)细胞,重组细胞‘表达/产生增加量’的目的蛋白”中使用时,“增加量”特别是指在重组细胞中表达/产生的“增加量”目的蛋白(POI),该“增加量”总是相对于表达/产生相同POI的未经修饰的(对照或亲本)细胞,其中经修饰的和未经修饰的细胞在相同条件下生长/培养/发酵。
如本文使用的,“增加”蛋白质产生或“增加的”蛋白质产生意指产生的蛋白质(例如,目的蛋白)的量增加。蛋白质可以在宿主细胞内产生,或分泌(或转运)到培养基中。在某些实施例中,目的蛋白被产生(被分泌)到培养基中。增加的蛋白质生产可以被检测为例如,如与亲本宿主细胞相比更高的最大水平的蛋白质或酶活性(例如像淀粉酶活性),或生产的总的细胞外蛋白质。
如本文使用的,术语“表达”是指衍生自本公开的核酸分子的有义(mRNA)或反义RNA的转录和稳定积累。表达也可指将mRNA翻译成多肽。因此,术语“表达”包括涉及多肽的生产的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰、分泌等。
如本文使用的,术语“修饰”和“遗传修饰”可以互换使用,并且包括:(a)引入、取代或去除基因(或其ORF)中的一个或多个核苷酸,或者引入、取代或去除基因或其ORF的转录或翻译所需的调节元件中的一个或多个核苷酸,(b)基因破坏,(c)基因转换,(d)基因缺失,(e)基因下调,(f)本文公开的任何一个或多个基因的特异性诱变和/或(g)随机诱变。
如本文使用的,如短语如“向细菌细胞中引入”或“向地衣芽胞杆菌细胞中引入”至少一种多核苷酸可读框(ORF)、或其基因、或其载体中使用的,术语“引入”包括本领域已知的用于将多核苷酸引入细胞中的方法,这些方法包括但不限于原生质体融合、自然或人工转化(例如,氯化钙、电穿孔)、转导、转染、缀合等(例如,参见Ferrari等人,1989)。
如本文使用的,“转化的”或“转化”意指通过使用重组DNA技术转化的细胞。转化典型地通过将一个或多个核苷酸序列(例如,多核苷酸、ORF或基因)***细胞中而发生。***的核苷酸序列可以是异源核苷酸序列(即,在待转化的细胞中非天然存在的序列)。因此,转化通常是指将外源DNA引入宿主细胞中,使得DNA保持为染色体整合体或自我复制的染色体外载体。
如本文使用的,“转化DNA”、“转化序列”和“DNA构建体”是指用于将序列引入宿主细胞或生物体中的DNA。转化DNA是用于将序列引入宿主细胞或生物体中的DNA。可以通过PCR或任何其他合适的技术在体外产生DNA。在一些实施例中,转化DNA包含输入序列,而在其他实施例中,它进一步包含侧翼为同源盒的输入序列。在又另外的实施例中,转化DNA包含添加到末端的其他非同源序列(即,填充序列或侧翼)。末端可以闭合,使得转化DNA形成闭环,例如像***载体中。
如本文使用的,“基因的破坏”或“基因破坏”可以互换使用,并且广泛地是指基本上防止宿主细胞产生功能性基因产物(例如,蛋白质)的任何遗传修饰。因此,如本文使用的,基因破坏包括但不限于移码突变、提前终止密码子(即,使得不产生功能性蛋白质)、消除或降低活性的蛋白质内部缺失的取代(使得不产生功能性蛋白质)、破坏编码序列的***,去除转录所需的天然启动子与可读框之间的可操作连接的突变等。
如本文使用的,“输入序列”是指引入芽孢杆菌属物种染色体中的DNA序列。在一些实施例中,输入序列是DNA构建体的一部分。在其他实施例中,输入序列编码一种或多种目的蛋白。在一些实施例中,输入序列包含可以已经或可以不存在于待转化的细胞的基因组中的序列(即,它可以是同源或异源序列)。在一些实施例中,输入序列编码一种或多种目的蛋白、基因和/或突变的或修饰的基因。在可替代的实施例中,输入序列编码功能性野生型基因或操纵子、功能性突变型基因或操纵子或者非功能性基因或操纵子。在一些实施例中,可以将非功能性序列***基因中以破坏基因的功能。在另一实施例中,输入序列包括选择性标记。在另外的实施例中,输入序列包括两个同源盒。
如本文使用的,“同源盒”是指与芽孢杆菌属染色体中的序列同源的核酸序列。更特别地,根据本发明,同源盒是上游或下游区,该上游或下游区与待缺失、破坏、灭活、下调等的基因或基因的一部分的直接侧翼编码区具有约80%与100%之间的序列同一性、约90%与100%之间的序列同一性、或约95%与100%之间的序列同一性。这些序列指导在芽孢杆菌属染色体中,DNA构建体被整合到何处,并且指导哪一部分芽孢杆菌属染色体被输入序列替代。虽然不意在限制本公开,但同源盒可以包括约1个碱基对(bp)至200千碱基(kb)之间。优选地,同源盒包括约1bp与10.0kb之间;1bp与5.0kb之间;1bp与2.5kb之间;1bp与1.0kb之间;以及0.25kb与2.5kb之间。同源盒还可以包括约10.0kb、5.0kb、2.5kb、2.0kb、1.5kb、1.0kb、0.5kb、0.25kb和0.1kb。在一些实施例中,选择性标记的5'和3'端的侧翼为同源盒,其中该同源盒包含与基因的编码区紧密侧接的核酸序列。
如本文使用的,宿主细胞“基因组”、细菌(宿主)细胞“基因组”、或芽孢杆菌属物种(宿主)细胞“基因组”包括染色体基因和染色体外基因。
如本文使用的,术语“质粒”、“载体”和“盒”是指染色体外元件,其通常携带典型地不是细胞的中心代谢的一部分的基因,并且通常呈环状双链DNA分子的形式。这样的元件可以是衍生自任何来源的单链或双链DNA或RNA的线性或环状自主复制序列、基因组整合序列、噬菌体或核苷酸序列,其中多种核苷酸序列已连接或重组到单一结构中,该单一结构能够将用于选定基因产物的启动子片段和DNA序列连同适当3'未翻译序列一起引入到细胞中。
如本文使用的,术语“质粒”是指用作克隆载体,并且在许多细菌和一些真核生物中形成染色体外自我复制遗传元件的环状双链(ds)DNA构建体。在一些实施例中,质粒被掺入宿主细胞的基因组中。在一些实施例中,质粒存在于亲本细胞中并且在子细胞中丢失。
如本文使用的,“转化盒”是指包含基因(或其ORF)并且除了外源基因之外还具有促进特定宿主细胞的转化的元件的特定载体。
如本文使用的,术语“载体”是指可以在细胞中复制(传播)并且可以携带新基因或DNA区段到细胞中的任何核酸。因此,该术语是指设计用于在不同宿主细胞之间转移的核酸构建体。载体包括为“附加体”(即,其自主复制或可以整合到宿主生物体的染色体中)的病毒、噬菌体、前病毒、质粒、噬菌粒、转座子、和人工染色体如YAC(酵母人工染色体)、BAC(细菌人工染色体)、PLAC(植物人工染色体)等。
“表达载体”是指能够在细胞中掺入和表达异源DNA的载体。许多原核和真核表达载体是可商购获得的,并且是本领域技术人员已知的。适当的表达载体的选择在本领域技术人员的知识范围内。
如本文使用的,术语“表达盒”和“表达载体”是指重组或合成生成的具有允许特定核酸在靶细胞中转录的一系列指定核酸元件的核酸构建体(即,这些是载体或载体元件,如上所述)。可以将重组表达盒掺入质粒、染色体、线粒体DNA、质体DNA、病毒或核酸片段中。典型地,表达载体的重组表达盒部分包括(除了其他序列之外)待转录的核酸序列和启动子。在一些实施例中,DNA构建体还包括一系列特定的核酸元件,其允许特定核酸在靶细胞中转录。在某些实施例中,本公开的DNA构建体包含选择性标记和如本文定义的失活染色体或基因或DNA片段。
如本文使用的,“靶向载体”是如下载体,该载体包括与该靶向载体转化至其中的宿主细胞的染色体中的区同源并且可以驱动在该区处的同源重组的多核苷酸序列。例如,靶向载体可用于通过同源重组将突变引入宿主细胞的染色体中。在一些实施例中,靶向载体包含例如添加到末端的其他非同源序列(即,填充序列或侧翼序列)。末端可以闭合,使得靶向载体形成闭环,例如像***载体中。例如,在某些实施例中,通过在亲本地衣芽孢杆菌(宿主)细胞中引入一个或多个“靶向载体”来修饰(例如转化)该细胞。
如本文使用的,术语“目的蛋白”或“POI”是指期望在修饰的地衣芽孢杆菌(子)宿主细胞中表达的目的多肽,其中该POI优选地以增加的水平表达(即,相对于“未经修饰的”(亲本)细胞)。因此,如本文使用的,POI可以是酶、底物结合蛋白、表面活性蛋白、结构蛋白、受体蛋白等。在某些实施例中,相对于亲本细胞,本公开的经修饰的细胞产生增加量的异源目的蛋白或内源目的蛋白。在特定的实施例中,由本公开的经修饰的细胞产生的目的蛋白的增加量是相对于亲本细胞至少0.5%增加、至少1.0%增加、至少5.0%增加、或超过5.0%增加。
类似地,如本文定义的,“目的基因”或“GOI”是指编码POI的核酸序列(例如,多核苷酸、基因、或ORF)。编码“目的蛋白”的“目的基因”可以是天然存在的基因、经突变的基因或合成基因。
如本文使用的,术语“多肽”和“蛋白质”可互换地使用,并且是指包含通过肽键连接的氨基酸残基的任何长度的聚合物。在本文中使用氨基酸残基的常规一(1)字母或三(3)字母代码。多肽可以是线性的或支链的,它可以包含经修饰的氨基酸,并且它可以被非氨基酸中断。术语多肽还涵盖如下氨基酸聚合物,该氨基酸聚合物已经天然地或通过干预修饰;例如,二硫键形成、糖基化、脂化、乙酰化、磷酸化或任何其他操作或修饰,如与标记组分缀合。该定义内还包括例如含有一种或多种氨基酸类似物(包括例如非天然氨基酸等)以及本领域已知的其他修饰的多肽。
在某些实施例中,本公开的基因编码商业上相关的工业目的蛋白,如酶(例如,乙酰酯酶、氨肽酶、淀粉酶、***聚糖酶、***呋喃糖苷酶、碳酸酐酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、凝乳酶、角质酶、脱氧核糖核酸酶、差向异构酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡聚糖酶、葡聚糖裂合酶、内切-β-葡聚糖酶、葡糖淀粉酶、葡萄糖氧化酶、α-葡糖苷酶、β-葡糖苷酶、葡糖醛酸酶、糖基水解酶、半纤维素酶、己糖氧化酶、水解酶、转化酶、异构酶、漆酶、脂肪酶、裂合酶、甘露糖苷酶、氧化酶、氧化还原酶、果胶酸裂合酶、果胶乙酰酯酶、果胶解聚酶、果胶甲基酯酶、果胶分解酶、过水解酶、多元醇氧化酶、过氧化物酶、酚氧化酶、植酸酶、聚半乳糖醛酸酶、蛋白酶、肽酶、鼠李糖-半乳糖醛酸酶、核糖核酸酶、转移酶、转运蛋白、转谷氨酰胺酶、木聚糖酶、己糖氧化酶、及其组合)。
如本文使用的,“变体”多肽是指典型地通过重组DNA技术,通过取代、添加或缺失一个或多个氨基酸,衍生自亲本(或参考)多肽的多肽。变体多肽与亲本多肽可以相差小数量的氨基酸残基,并且可以通过它们与亲本(参考)多肽的一级氨基酸序列同源性/同一性的水平来定义。
优选地,变体多肽与亲本(参考)多肽序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或甚至至少99%氨基酸序列同一性。如本文使用的,“变体”多核苷酸是指编码变体多肽的多核苷酸,其中“变体多核苷酸”与亲本多核苷酸具有指定程度的序列同源性/同一性,或者与亲本多核苷酸(或其互补序列)在严格杂交条件下杂交。优选地,变体多核苷酸与亲本(参考)多核苷酸序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或甚至至少99%核苷酸序列同一性。
如本文使用的,“突变”是指核酸序列中的任何变化或改变。存在几种类型的突变,包括点突变、缺失突变、沉默突变、移码突变、剪接突变等。突变可以特异性地(例如,经由定点诱变)或随机地(例如,经由化学试剂、通过修复减去细菌菌株传代)进行。
如本文使用的,在多肽或其序列的上下文中,术语“取代”意指一个氨基酸被另一个氨基酸替代(即,取代)。
如本文使用的,术语“同源性”涉及同源多核苷酸或多肽。如果两个或更多个多核苷酸或者两个或更多个多肽是同源的,则这意味着同源多核苷酸或多肽具有至少60%、更优选至少70%、甚至更优选至少85%、仍更优选至少90%、更优选至少95%、以及最优选至少98%的“同一性程度”。两个多核苷酸或多肽序列是否具有如本文定义的同源程度足够高的同一性,可以通过使用本领域已知的计算机程序比对两个序列来适当地研究,该计算机程序如GCG程序包中提供的“GAP”(威斯康星程序包手册(Program Manual for theWisconsin Package),第8版,1994年8月,遗传学计算机集团(Genetics Computer Group),科学大道575号(575Science Drive),麦迪逊,威斯康星州,美国53711)(Needleman和Wunsch,(1970))。使用具有以下设置的GAP进行DNA序列比较:GAP产生罚分5.0和GAP扩展罚分0.3。
如本文使用的,术语“百分比(%)同一性”是指当使用序列比对程序进行比对时,编码多肽的核酸序列或多肽的氨基酸序列之间的核酸或氨基酸序列同一性的水平。
如本文使用的,“比生产力”是在给定时间段内产生的蛋白质的总量/细胞/时间。
如本文使用的,术语“纯化的”、“分离的”或“富集的”意指生物分子(例如,多肽或多核苷酸)通过将其与它在自然界中相关联的天然存在的成分中的一些或所有分离而被从其天然状态改变。这样的分离或纯化可以通过本领域公认的分离技术如离子交换色谱法、亲和色谱法、疏水分离、透析、蛋白酶处理、硫酸铵沉淀或其他蛋白质盐沉淀、离心、尺寸排阻色谱法、过滤、微量过滤、凝胶电泳或梯度分离完成,以去除最终组合物中所不期望的全细胞、细胞碎片、杂质、外来蛋白质或酶。然后可以进一步向纯化的或分离的生物分子组合物中添加提供另外益处的成分,例如激活剂、抗抑制剂、期望的离子、控制pH的化合物或者其他酶或化学品。
III.用于改善蛋白质分泌的信号序列
普遍接受的分泌异源蛋白质的方法通常依赖于使用相似蛋白质的天然(蛋白质)信号序列(例如,来自淀粉酶的AmyL或AmyE的信号序列,或者来自蛋白酶的AprE、NprE或AprL的信号序列),或对于异源蛋白质序列为天然的信号序列。例如,蛋白质翻译、分泌和折叠可以是连续过程和/或并发过程,其中蛋白质的信号序列在所有三个过程中起动态作用。更特别地,如本领域技术人员所理解的,除了别的之外,次优信号序列的使用可能存在特定的问题,包括异源蛋白质的翻译、分泌和/或折叠差或不足,其中信号序列与成熟蛋白质序列的非最佳配对可能导致蛋白质生产和分泌的瓶颈,导致错误折叠/无活性产物和/或诱导细胞应激反应,从而进一步降低宿主细胞的生产力。
如本文所阐述,申请人设计并构建了表达示例性报告蛋白(即,异源目的蛋白)的重组地衣芽孢杆菌菌株,其中报告蛋白(例如,Amy1、Amy2)的成熟(氨基酸)序列可操作地连接到本公开的上游(N-末端)蛋白(分泌)信号序列。更特别地,如下文实例(参见,实例1-4)所呈现,并在本文中简要描述,在某些方面,将淀粉酶1盒的第一(第1)拷贝(SEQ ID NO:7)整合到亲本地衣芽孢杆菌宿主菌株的lysA基因座中(实例1),并且将淀粉酶1盒的第二(第2)拷贝(SEQ ID NO:19)整合到其serA基因座中(实例2),该亲本地衣芽孢杆菌宿主菌株包含其天然(内源)lysA(ΔlysA)和serA(ΔserA)基因的缺失(例如,菌株BF613;ΔlysAΔserA)。
如实例1和2中一般性详述,第1拷贝淀粉酶1盒(第1Amy1盒;[pro-modSacBss-淀粉酶1]lysA;SEQ ID NO:9)包含编码经修饰的地衣芽孢杆菌SacB信号序列(modSacBss;SEQID NO:2)的DNA序列,该DNA序列可操作地连接到编码淀粉酶1报告蛋白的DNA序列(淀粉酶1);并且第2拷贝淀粉酶1盒(第2Amy1盒;[pro-modSacBss-淀粉酶1]serA;SEQ ID NO:19)包含编码经修饰的SacB信号序列(modSacBss;SEQ ID NO:2)的DNA序列,该DNA序列可操作地连接到编码淀粉酶1报告蛋白的DNA序列(淀粉酶1)。
如图1所示,经修饰的SacB信号序列(modSacBss;SEQ ID NO:2;图1B),相对于天然SacB信号序列(SacBss;SEQ ID NO:1;图1A),包括在-3位置处将Thr(T)取代为Ala(A)以及在-2位置处将Phe(F)取代为Ser(S)(即,相对于信号肽酶切割位点,例如图1A/图1B,所呈现的第3序列)。
如实例3中所阐述,构建了示例性地衣芽孢杆菌菌株(WS2806),其包含分别整合到lysA和serA基因座中的第1和第2拷贝Amy1盒。如实例4中所述,与包含分别整合到lysA和serA基因座中的第1和第2拷贝Amy1盒的对照菌株相比,测定WS2806菌株(包含第1和第2拷贝Amy1盒,modSacBss;SEQ ID NO:2)的淀粉酶1的产生。
如实例4中所阐述,整合到对照菌株中的第1拷贝Amy1盒(第1Amy1盒;[pro-modAmyLss-淀粉酶1]lysA)包含编码经修饰的地衣芽孢杆菌AmyLss信号序列(modAmyLss;SEQ ID NO:4;图2B)的DNA序列,该DNA序列可操作地连接到编码淀粉酶1的DNA序列(淀粉酶1),并且整合到对照菌株中的第2拷贝Amy1盒(第2Amy1盒;[pro-modAmyLss-淀粉酶1]serA)包含编码经修饰的AmyLss信号序列(modAmyLss;SEQ ID NO:4)的DNA序列,该DNA序列可操作地连接到编码淀粉酶1的DNA序列(淀粉酶1)。如表6所呈现(实例4),当用经修饰的SacB信号序列(modSacBss;SEQ ID NO:2)表达和分泌时,与来自对照菌株(modAmyLss)的相同淀粉酶1报告蛋白的产生相比,来自WS2806菌株(modSacBss)的淀粉酶1报告蛋白的产生的相对提高显著增强(约18%)。
如下文实例(参见,实例5-8)所呈现,并在本文中简要描述,在某些方面,(实例5)将Amy2盒的第一(第1)拷贝(SEQ ID NO:36)整合到亲本地衣芽孢杆菌宿主菌株(BF613;ΔlysAΔserA)的lysA基因座中,并且(实例6)将Amy2盒的第二(第2)拷贝(SEQ ID NO:38)整合到其serA基因座中,该亲本地衣芽孢杆菌宿主菌株包含其天然lysA(ΔlysA)和serA(ΔserA)基因的缺失。
如实例5和6中一般性详述,第1拷贝Amy2盒(第1Amy2盒;[pro-modBli03445ss-淀粉酶2]lysA];SEQ ID NO:36)包含编码经修饰的地衣芽孢杆菌Bli03445信号序列(modBli03445ss;SEQ ID NO:6)的DNA序列,该DNA序列可操作地连接到编码淀粉酶2报告蛋白的DNA序列(淀粉酶2);并且第2拷贝Amy2盒(第2Amy2盒;[pro-modBli03445ss-淀粉酶2]serA;SEQ ID NO:38)包含编码经修饰的Bli03445信号序列(modBli0344ss;SEQ ID NO:6)的DNA序列,该DNA序列可操作地连接到编码淀粉酶2报告蛋白的DNA序列(淀粉酶2)。
如图3所示,经修饰的Bli03445信号序列(modBli03445ss;SEQ ID NO:6;图3B),相对于天然Bli03445信号序列(Bli03445ss;SEQ ID NO:5;图3A),包含在起始密码子(-29位置)处将缬氨酸(V)取代为甲硫氨酸(M)以及在-2位置处将苯丙氨酸(F)取代为丝氨酸(S)(即,相对于与其可操作地连接的成熟目的蛋白的信号肽酶切割位点(+1个氨基酸位置))。
如实例7中所阐述,构建了示例性地衣芽孢杆菌菌株(WS2835),其包含分别整合到lysA和serA基因座中的第1和第2拷贝Amy2盒。如实例8中所述,与包含分别整合到lysA和serA基因座中的第1和第2拷贝Amy2盒(具有modAmyLss)的对照菌株相比,测定WS2835菌株(包含第1和第2拷贝Amy2盒,具有modBli03445ss;SEQ ID NO:6)的淀粉酶2的产生。如表9所呈现(实例8),当用经修饰的Bli03345信号序列(modBli03345ss;SEQ ID NO:6)表达和分泌时,与来自对照菌株(modAmyLss)的相同淀粉酶2报告蛋白的产生相比,来自WS2835菌株(modBli03345ss)的淀粉酶2报告蛋白的产生的相对提高显著增强(约19%)。
因此,除了别的之外,本公开的某些实施例提供了适用于构建重组(经修饰的)芽孢杆菌属宿主细胞的核酸、多核苷酸、载体、表达盒、调节元件等。因此,某些方面涉及多核苷酸(例如,表达盒),其包含上游(5′)启动子(pro)序列,该上游启动子序列可操作地连接到编码经修饰的(蛋白质)信号序列的下游核酸序列(ss),该下游核酸序列可操作地连接到编码目的蛋白的下游(3′)核酸序列(poi)。
例如,与成熟目的蛋白(POI)可操作组合的编码氨基(N)末端信号序列的通用多核苷酸序列示于以下方案1中:
方案1:5′-[ss]-[poi]-3′
其中编码N-末端信号序列(SS)的核酸(ss)序列位于上游(5′)并可操作地连接到编码成熟目的蛋白(POI)的核酸(poi)序列。
在某些实施例中,多核苷酸表达盒可以如方案2所示进行一般性描述:
方案2:5′-[pro]-[ss]-[poi]-3′
其中启动子(pro)序列位于上游(5′)并可操作地连接到编码N-末端信号序列(SS)的核酸(ss)序列,该核酸序列位于上游(5′)并可操作地连接到编码目的蛋白(POI)的核酸(poi)序列。在某些其他实施例中,多核苷酸可以进一步包含终止子(term)序列,其位于编码成熟POI的核酸(poi)序列下游(3′)并与其可操作地连接。
在某些其他方面,本公开涉及一种或多种编码本公开的一种或多种经修饰的信号序列(如图1和/或图3中所阐述的经修饰的信号序列)的核酸。
在某些实施例中,本公开涉及编码目的蛋白(POI)的多核苷酸构建体(例如,方案2),其中信号序列(ss)包含经修饰的地衣芽孢杆菌SacB(蛋白质)信号序列或经修饰的地衣芽孢杆菌Bli03445(蛋白质)信号序列,其可操作地连接到编码成熟淀粉酶蛋白(Amy)的核酸(amy)序列,如方案3中一般性所示:
方案3:5′-[pro]-[Modss]-[amy]-3′
因此,本公开的某些方面提供了重组地衣芽孢杆菌菌株/细胞,其包含一种或多种引入的多核苷酸构建体(例如,表达盒),这些多核苷酸构建体编码一种或多种成熟淀粉酶,这些成熟淀粉酶包含本公开的新型(经修饰的)N-末端信号序列。更特别地,如下文所举例说明的,申请人已经构建了能够分泌增加量的淀粉酶蛋白的示例性地衣芽孢杆菌菌株。
如图1所呈现,天然地衣芽孢杆菌SacB蛋白信号序列包含二十九(29)个氨基酸残基序列(图1A;SEQ ID NO:1)。例如,可以从氨基-末端(NH2)开始对特定蛋白质信号序列的氨基酸位置进行描述和编号,如图1A(第2序列)和图1B(第2序列)所示。可替代地,可以根据特定信号序列的切割位点对氨基酸位置进行描述和编号。例如,SacBss(SEQ ID NO:1)和modSacBss(SEQ ID NO:2)信号序列的最C-末端氨基酸位置可以指定为负1(-1)氨基酸(位置),其左侧的氨基酸位置为负2(-2)等,如图1A(第3序列)和图1B(第3序列)所示。同样,本公开的其他天然和/或经修饰的信号序列(图2和图3)可以被指定为具有类似的特异性。
IV.重组多核苷酸和分子生物学
如上文一般性阐述和下文实例中进一步描述的,本公开的某些实施例涉及能够产生增加量的异源目的蛋白的重组(经修饰的)芽孢杆菌属细胞。因此,某些实施例涉及用于构建此类具有增加的蛋白质生产能力的重组芽孢杆菌属细胞的方法。在某些实施例中,将编码目的蛋白的一种或多种表达盒引入本公开的芽孢杆菌属细胞中。在示例性实施例中,将这些盒整合到细胞的基因组中。例如,在某些实施例中,将编码目的蛋白的表达盒整合到包含其天然lysA(ΔlysA)和serA(ΔserA)基因缺失的亲本地衣芽孢杆菌细胞的lysA基因座和serA基因座中。因此,除了别的之外,某些实施例涉及适用于构建重组(经修饰的)芽孢杆菌属宿主细胞的核酸、多核苷酸(例如,载体、表达盒)、调节元件等。
在某些其他方面,使本公开的芽孢杆菌属细胞缺乏一种或多种天然(内源)基因的产生。在某些实施例中,使本公开的芽孢杆菌属细胞缺乏一种或多种天然(内源)蛋白酶的产生。例如,在某些实施例中,本公开的宿主细胞是地衣芽孢杆菌细胞,其缺乏一种或多种选自由wprA、nprE、mpr、aprL、bprE、htrA、vpr和ispA组成的组的天然蛋白酶的产生。
因此,如实例中所示和本文一般所述,可以由本领域技术人员使用本领域熟知的标准和常规重组DNA和分子克隆技术来构建本公开的重组细胞。用于遗传修饰细胞的方法包括但不限于(a)在基因中引入、取代、或去除一个或多个核苷酸,或者在基因的转录或翻译所需的调节元件中引入、取代、或去除一个或多个核苷酸,(b)基因破坏,(c)基因转换,(d)基因缺失,(e)基因下调,(f)位点特异性诱变,和/或(g)随机诱变。
在某些实施例中,可以通过使用本领域熟知的方法(例如,***、破坏、替代或缺失)减少或消除基因的表达来构建本公开的经修饰的细胞。待修饰或灭活的基因的部分可以是例如编码区或编码区表达所需的调节元件。
此类调控或控制序列的实例可以是启动子序列或其功能部分(即,足以影响核酸序列表达的部分)。用于修饰的其他控制序列包括但不限于前导序列、前肽序列、信号序列、转录终止子、转录激活子等。
在某些其他实施例中,通过基因缺失构建经修饰的细胞以消除或减少基因的表达。基因缺失技术使得能够部分或完全去除一个或多个基因,从而消除它们的表达,或者表达非功能性(或活性降低的)蛋白质产物。在此类方法中,一个或多个基因的缺失可以通过使用已构建为连续含有与该基因侧接的5'和3'区的质粒进行同源重组来完成。可以将连续的5'和3'区引入芽孢杆菌属细胞中,例如,在温度敏感质粒(如pE194)上,在允许的温度下与第二个选择性标记缔合,以允许质粒在细胞中建立。然后将细胞转移到非许可温度,以选择质粒整合到染色体同源侧翼区之一的细胞。通过选择第二可选择性标记来实现质粒整合的选择。在整合后,通过将细胞移至允许温度持续几代而不进行选择来刺激第二同源侧翼区处的重组事件。将细胞铺板以获得单菌落,并检查菌落是否损失两种可选择标记。因此,本领域的技术人员可容易地鉴定在基因的编码序列和/或基因的非编码序列中的核苷酸区(适于完全或部分缺失)。
在其他实施例中,通过在基因或者其转录或翻译所需的调节元件中引入、取代或去除一个或多个核苷酸来构建经修饰的细胞。例如,可以***或去除核苷酸,以便导致终止密码子的引入、起始密码子的去除或可读框的移码。此种修饰可以根据本领域已知的方法通过定点诱变或PCR产生的诱变来完成。因此,在某些实施例中,通过完全或部分缺失使本公开的基因失活。
在另一个实施例中,通过基因转化工艺构建经修饰的细胞。例如,在基因转换方法中,对应于一个或多个基因的核酸序列在体外诱变以生产缺陷核酸序列,然后将该缺陷核酸序列转化到亲本芽孢杆菌属细胞中以产生缺陷基因。通过同源重组,缺陷核酸序列替代内源基因。可能期望的是,缺陷基因或基因片段也编码可以用于选择含有缺陷基因的转化体的标记。例如,可以将缺陷基因与可选择标记缔和引入非复制或温度敏感的质粒上。通过在不允许质粒复制的条件下选择标记来实现质粒整合的选择。通过检查菌落是否丢失可选择性标记和是否获得经突变的基因来实现导致基因替代的第二重组事件的选择。可替代地,缺陷核酸序列可以含有基因的一个或多个核苷酸的***、取代或缺失,如下文所述。
在其他实施例中,通过建立的反义技术使用与基因的核酸序列互补的核苷酸序列来构建经修饰的细胞。更特别地,可以通过引入与基因的核酸序列互补的核苷酸序列来减少(下调)或消除芽孢杆菌属细胞的基因的表达,该核苷酸序列可以在细胞中转录并且能够与细胞中产生的mRNA杂交。在允许互补反义核苷酸序列与mRNA杂交的条件下,翻译的蛋白质的量因此减少或消除。此类反义方法包括但不限于RNA干扰(RNAi)、小干扰RNA(siRNA)、微小RNA(miRNA)、反义寡核苷酸等,所有这些都是熟练技术人员熟知的。
在其他实施例中,经由CRISPR-Cas9编辑产生/构建经修饰的细胞。例如,编码目的蛋白的基因可以通过核酸指导的内切核酸酶的方式被编辑或破坏(或缺失或下调),该方式通过将指导RNA(例如,Cas9)和Cpf1或指导DNA(例如,NgAgo)结合发现其靶DNA,这将内切核酸酶募集到DNA上的靶序列上,其中该内切核酸酶可以在DNA中产生单链或双链断裂。此靶向DNA断裂成为DNA修复的底物,并且可以与所提供的编辑模板重组以使基因破坏或缺失。例如,编码核酸指导的内切核酸酶(出于此目的,来自化脓链球菌的Cas9)的基因或编码Cas9核酸酶的密码子优化的基因可操作地连接到在芽孢杆菌属细胞中有活性的启动子和在芽孢杆菌属细胞中有活性的终止子,从而产生芽孢杆菌Cas9表达盒。同样,本领域技术人员容易地鉴定目的基因特有的一个或多个靶位点。例如,为了构造编码gRNA的DNA构建体-指向目的基因内的靶位点,可变的靶向结构域(VT)将包含靶位点的核苷酸,所述核苷酸为(PAM)前间区序列邻近基序(TGG)的5′,所述核苷酸与编码化脓链球菌Cas9的Cas9核酸内切酶识别结构域(CER)的DNA融合。将编码VT结构域的DNA和编码CER结构域的DNA组合,从而产生编码gRNA的DNA。因此,通过将编码gRNA的DNA可操作地连接到在芽孢杆菌属细胞中具有活性的启动子和在芽孢杆菌属细胞中具有活性的终止子来产生gRNA的芽孢杆菌属表达盒。
在某些实施例中,将由内切核酸酶诱导的DNA断裂用输入序列修复/替代。例如,为了精确修复由上述Cas9表达盒和gRNA表达盒产生的DNA断裂,提供了核苷酸编辑模板,使得细胞的DNA修复机构可以利用该编辑模板。例如,靶基因的约500bp 5'可以与靶基因的约500bp 3'融合以产生编辑模板,所述模板由芽孢杆菌宿主的机器用于修复由RGEN产生的DNA断裂。
可以使用许多不同的方法(例如,原生质体融合、电穿孔、自然感受态或诱导感受态)将Cas9表达盒、gRNA表达盒、和编辑模板共同递送至丝状真菌细胞。通过用正向和反向引物扩增基因座,通过PCR扩增靶基因座来筛选经转化的细胞。这些引物可以扩增野生型基因座或已由RGEN编辑的经修饰的基因座。然后使用测序引物对这些片段进行测序以鉴定经编辑的菌落。
在又其他实施例中,使用本领域熟知的方法(包括但不限于化学诱变和转座),通过随机或特异性诱变构建经修饰的细胞。可以通过使亲本细胞经受诱变并且筛选基因表达已减少或消除的突变型细胞来进行基因的修饰。可以例如通过使用合适的物理或化学诱变剂、使用合适的寡核苷酸或使DNA序列经受PCR产生的诱变来进行可以是特异性的或随机的诱变。此外,诱变可以通过使用这些诱变方法的任何组合来进行。
适合用于本发明目的的物理或化学诱变剂的实例包括紫外线(UV)辐照、羟胺、N-甲基-N'-硝基-N-亚硝基胍(MNNG)、N-甲基-N'-亚硝基胍(NTG)、O-甲基羟胺、亚硝酸、甲烷磺酸乙酯(EMS)、亚硫酸氢钠、甲酸、和核苷酸类似物。当使用这样的试剂时,典型地通过如下方式来进行诱变:在合适的条件下在选择的诱变剂的存在下孵育待诱变的亲本细胞,并且选择展现出基因的表达降低或无表达的突变型细胞。
PCT公开号WO 2003/083125公开了用于修饰芽孢杆菌属细胞的方法,如使用PCR融合来产生芽孢杆菌属缺失菌株和DNA构建体以绕过大肠杆菌。PCT公开号WO 2002/14490公开了用于修饰芽孢杆菌属细胞的方法,这些方法包括(1)构建和转化整合的质粒(pComK),(2)随机诱变编码序列、信号序列和前肽序列,(3)同源重组,(4)通过向转化DNA添加非同源侧翼提高转化效率,(5)优化双交叉整合,(6)定向诱变和(7)无标记缺失。
本领域技术人员熟知用于将多核苷酸序列引入细菌细胞(例如,大肠杆菌和芽孢杆菌属)中的合适方法。实际上,包括原生质体转化和中板集合、转导和原生质体融合在内的如转化等的方法是已知的并且适合用于本公开。转化方法特别优选地用于将本公开的DNA构建体引入宿主细胞中。
除了常用方法之外,在一些实施例中,直接转化宿主细胞(即,在引入宿主细胞之前,中间细胞不用于扩增DNA构建体或以其他方式处理DNA构建体)。将DNA构建体引入宿主细胞中包括本领域已知的将DNA引入宿主细胞中而不***质粒或载体中的那些物理和化学方法。此类方法包括但不限于氯化钙沉淀、电穿孔、裸DNA、脂质体等。在另外的实施例中,将DNA构建体与质粒一起共转化而不***该质粒中。在另外的实施例中,通过本领域已知的方法,将选择性标记从经修饰的芽孢杆菌属菌株中缺失或基本上切除。在一些实施例中,载体从宿主染色体上分解下来,将侧翼区留在染色体上,而将固有的染色体区去除。
用于在芽孢杆菌属细胞中表达基因、其可读框(ORF)和/或其变体序列的启动子和启动子序列区通常是本领域技术人员已知的。通常选择本公开的启动子序列,使得它们在芽孢杆菌属细胞(例如,地衣芽孢杆菌细胞、枯草芽孢杆菌细胞等)中起作用。例如,可用于驱动芽孢杆菌属细胞中基因表达的启动子包括但不限于枯草芽孢杆菌碱性蛋白酶(aprE)启动子、枯草芽孢杆菌的α-淀粉酶启动子(amyE)、地衣芽孢杆菌的α-淀粉酶启动子(amyL)、解淀粉芽孢杆菌的α-淀粉酶启动子、来自枯草芽孢杆菌的中性蛋白酶(nprE)启动子、突变aprE启动子,或者来自地衣芽孢杆菌或其他相关芽孢杆菌的任何其他启动子。在公开号WO2002/14490中描述了用于在芽孢杆菌属细胞中筛选和产生具有一系列活性(启动子强度)的启动子文库的方法。
V.发酵用于产生目的蛋白的芽孢杆菌属细胞
如上文一般性描述的,某些实施例涉及用于构建和获得具有增加的蛋白质产生表型的芽孢杆菌属细胞的组合物和方法。因此,某些实施例涉及通过在合适的培养基中发酵细胞而在芽孢杆菌属细胞中产生目的蛋白的方法。本领域熟知的发酵方法可用于发酵本公开的芽孢杆菌属细胞。
在一些实施例中,将细胞在分批或连续发酵条件下培养。经典的分批发酵是封闭的***,其中在发酵开始时设定培养基的组成,并且该组成在发酵期间不改变。在发酵开始时,将培养基用一种或多种期望的生物体接种。在该方法中,允许发酵发生而不向***中添加任何组分。典型地,分批发酵符合关于添加碳源的“分批”的资格,并且经常对控制因素(如pH和氧浓度)进行尝试。分批***的代谢物和生物质组成不断变化直到发酵停止时。在典型分批培养中,细胞可以通过静态停滞期进展到高生长对数期,并且最后进入生长速率减小或停止的静止期。如果不经处理,处于静止期的细胞最终死亡。通常,处于对数期的细胞负责产物的大量产生。
标准分批***的合适变化是“补料分批”发酵***。在典型分批***的该变化中,随着发酵的进展,以增量添加底物。当分解代谢物阻遏可能抑制细胞的代谢时并且在培养基中期望具有有限量的底物的情况下,补料分批***是有用的。在补料分批***中实际底物浓度的测量是困难的并且因此基于可测量因素(如pH、溶解氧和废气(如CO2)的分压)的变化对其进行估计。分批和补料分批发酵在本领域中是常用并且已知的。
连续发酵是开放的***,其中将限定的发酵培养基连续添加到生物反应器中,并同时去除等量的条件培养基以用于加工。连续发酵通常将培养物维持在恒定的高密度,其中细胞主要处于对数期生长。连续发酵允许对影响细胞生长和/或产物浓度的一种或多种因素进行调节。例如,在一个实施例中,将限制营养物质(如碳源或氮源)维持在固定的速率,并且允许调节所有其他参数。在其他***中,影响生长的许多因素可以不断改变,而通过培养基浊度测量的细胞浓度保持不变。连续***努力保持稳态生长条件。因此,由于抽出培养基而引起的细胞损失应当与发酵中的细胞生长速率相平衡。调节用于连续发酵过程的营养物质和生长因子的方法以及用于最大化产物形成速率的技术是工业微生物学领域中熟知的。
在某些实施例中,可以通过常规程序从培养基中回收由本公开的芽孢杆菌属细胞表达/产生的目的蛋白,这些常规程序包括通过离心或过滤从培养基中分离宿主细胞,或者如果需要,破坏细胞并从细胞部分和碎片中去除上清液。典型地,在澄清后,将上清液或滤液的蛋白质组分借助盐(例如,硫酸铵)沉淀。然后将沉淀出的蛋白质溶解,并且可以通过多种色谱程序(例如,离子交换色谱法、凝胶过滤)进行纯化。
在一些实施例中,将细胞在分批或连续发酵条件下培养。经典的分批发酵是封闭的***,其中在发酵开始时设定培养基的组成,并且该组成在发酵期间不改变。在发酵开始时,将培养基用一种或多种期望的生物体接种。在该方法中,允许发酵发生而不向***中添加任何组分。典型地,分批发酵符合关于添加碳源的“分批”的资格,并且经常对控制因素(如pH和氧浓度)进行尝试。分批***的代谢物和生物质组成不断变化直到发酵停止时。在典型分批培养中,细胞可以通过静态停滞期进展到高生长对数期,并且最后进入生长速率减小或停止的静止期。如果不经处理,处于静止期的细胞最终死亡。通常,处于对数期的细胞负责产物的大量产生。
标准分批***的合适变化是“补料分批”发酵***。在典型分批***的该变化中,随着发酵的进展,以增量添加底物。当分解代谢物阻遏可能抑制细胞的代谢时并且在培养基中期望具有有限量的底物的情况下,补料分批***是有用的。在补料分批***中实际底物浓度的测量是困难的并且因此基于可测量因素(如pH、溶解氧和废气(如CO2)的分压)的变化对其进行估计。分批和补料分批发酵在本领域中是常用并且已知的。
连续发酵是开放的***,其中将限定的发酵培养基连续添加到生物反应器中,并同时去除等量的条件培养基以用于加工。连续发酵通常将培养物维持在恒定的高密度,其中细胞主要处于对数期生长。连续发酵允许对影响细胞生长和/或产物浓度的一种或多种因素进行调节。例如,在一个实施例中,将限制营养物质(如碳源或氮源)维持在固定的速率,并且允许调节所有其他参数。在其他***中,影响生长的许多因素可以不断改变,而通过培养基浊度测量的细胞浓度保持不变。连续***努力保持稳态生长条件。因此,由于抽出培养基而引起的细胞损失应当与发酵中的细胞生长速率相平衡。调节用于连续发酵过程的营养物质和生长因子的方法以及用于最大化产物形成速率的技术是工业微生物学领域中熟知的。
在某些实施例中,可以通过常规程序从培养基中回收由本公开的芽孢杆菌属细胞表达/产生的目的蛋白,这些常规程序包括通过离心或过滤从培养基中分离宿主细胞,或者如果需要,破坏细胞并从细胞部分和碎片中去除上清液。典型地,在澄清后,将上清液或滤液的蛋白质组分借助盐(例如,硫酸铵)沉淀。然后将沉淀出的蛋白质溶解,并且可以通过多种色谱程序(例如,离子交换色谱法、凝胶过滤)进行纯化。
VI.目的蛋白
本公开的目的蛋白(POI)可以是任何内源或异源蛋白质,并且它可以是这样的POI的变体。蛋白质可以含有一个或多个二硫桥,或者是其功能形式为单体或多聚体的蛋白质,即蛋白质具有四级结构并且由多个相同的(同源)或不相同的(异源)亚基组成,其中POI或其变体POI优选是具有目的特性的POI。
例如,在某些实施例中,相对于其未经修饰的(亲本)细胞,本公开的修饰的芽孢杆菌属细胞产生多至少约0.1%、多至少约0.5%、多至少约1%、多至少约5%、多至少约6%、多至少约7%、多至少约8%、多至少约9%、或多至少约10%或更多的POI。
在某些实施例中,相对于(未经修饰的)亲本细胞,本公开的经修饰的芽孢杆菌属细胞表现出POI的比生产力(Qp)增加。例如,比生产力(Qp)的检测是用于评价蛋白质生产的合适方法。比生产力(Qp)可以使用以下等式确定:
“Qp=gP/gDCW·hr”
其中,“gP”是罐中产生的蛋白质的克数;“gDCW”是罐中的干细胞重量(DCW)的克数;并且“hr”是从接种时间开始的以小时计的发酵时间,其包括产生时间以及生长时间。
因此,在某些其他实施例中,相对于未经修饰的(亲本)细胞,本公开的修饰的芽孢杆菌属细胞包含至少约0.1%、至少约1%、至少约5%、至少约6%、至少约7%、至少约8%、至少约9%、或至少约10%或更多的比生产力(Qp)增加。
在某些实施例中,POI或其变体POI选自由以下组成的组:乙酰酯酶、氨肽酶、淀粉酶、***聚糖酶、***呋喃糖苷酶、碳酸酐酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、凝乳酶、角质酶、脱氧核糖核酸酶、差向异构酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡聚糖酶、葡聚糖裂合酶、内切-β-葡聚糖酶、葡糖淀粉酶、葡萄糖氧化酶、α-葡糖苷酶、β-葡糖苷酶、葡糖醛酸酶、糖基水解酶、半纤维素酶、己糖氧化酶、水解酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、裂合酶、甘露糖苷酶、氧化酶、氧化还原酶、果胶酸裂合酶、果胶乙酰酯酶、果胶解聚酶、果胶甲基酯酶、果胶分解酶、过水解酶、多元醇氧化酶、过氧化物酶、酚氧化酶、植酸酶、聚半乳糖醛酸酶、蛋白酶、肽酶、鼠李糖-半乳糖醛酸酶、核糖核酸酶、转移酶、转运蛋白、转谷氨酰胺酶、木聚糖酶、己糖氧化酶、及其组合。
因此,在某些实施例中,POI或其变体POI是选自酶学委员会(EC)编号EC 1、EC 2、EC 3、EC 4、EC 5或EC 6的酶。
存在本领域普通技术人员已知的用于检测和测量细胞内和细胞外表达的蛋白质的活性的各种测定。
VII.示例性实施例
1.一种核酸,其编码包含SEQ ID NO:2的经修饰的SacB信号序列(modSacBss)。
2.一种核酸,其编码包含SEQ ID NO:6的经修饰的Bli03445信号序列(modBli03445ss)。
3.一种多核苷酸,其包含编码包含SEQ ID NO:2的信号序列的上游(5′)核酸,该上游核酸可操作地连接到编码目的蛋白(POI)的下游(3′)核酸。
4.一种多核苷酸,其包含编码包含SEQ ID NO:6的信号序列的上游(5′)核酸,该上游核酸可操作地连接到编码目的蛋白(POI)的下游(3′)核酸。
5.一种多核苷酸,其包含上游(5′)启动子,该上游启动子可操作地连接到编码包含SEQ ID NO:2的信号序列的下游核酸,该下游核酸可操作地连接到编码目的蛋白(POI)的下游(3′)核酸。
6.一种多核苷酸,其包含上游(5′)启动子序列,该上游启动子序列可操作地连接到编码包含SEQ ID NO:6的信号序列的下游核酸,该下游核酸可操作地连接到编码目的蛋白(POI)的下游(3′)核酸。
7.如实施例3-6中任一项所述的多核苷酸,其进一步包含位于编码该POI的核酸下游(3′)并与其可操作地连接的终止子序列。
8.如实施例3-7中任一项所述的多核苷酸,其中编码该POI的核酸编码酶。
9.如实施例8所述的多核苷酸,其中该酶是水解酶。
10.如实施例9所述的多核苷酸,其中该水解酶是淀粉酶。
11.一种重组芽孢杆菌属细胞,其包含至少一种引入的如实施例5-7中任一项所述的多核苷酸。
12.一种重组芽孢杆菌属细胞,其包含至少两种引入的如实施例5-7中任一项所述的多核苷酸。
13.如实施例11或实施例12所述的重组芽孢杆菌属细胞,使其缺乏一种或多种天然(内源)基因的产生。
14.如实施例13所述的重组芽孢杆菌属细胞,使其缺乏一种或多种天然(内源)蛋白酶的产生。
15.一种重组芽孢杆菌属细胞,其表达编码异源目的蛋白(POI)的引入的多核苷酸,其中该多核苷酸包含编码包含SEQ ID NO:2的信号序列的上游(5′)核酸,该上游核酸可操作地连接到编码该POI的下游(3′)核酸。
16.一种重组芽孢杆菌属细胞,其表达至少两种编码异源目的蛋白(POI)的引入的多核苷酸,其中引入的多核苷酸包含编码包含SEQ ID NO:2的信号序列的、可操作地连接到编码该POI的下游(3′)核酸的上游(5′)核酸。
17.一种重组芽孢杆菌属细胞,其表达编码异源目的蛋白(POI)的引入的多核苷酸,其中该多核苷酸包含编码包含SEQ ID NO:6的信号序列的上游(5′)核酸,该上游核酸可操作地连接到编码该POI的下游(3′)核酸。
18.一种重组芽孢杆菌属细胞,其表达至少两种编码异源目的蛋白(POI)的引入的多核苷酸,其中引入的多核苷酸包含编码包含SEQ ID NO:6的信号序列的、可操作地连接到编码该POI的下游(3′)核酸的上游(5′)核酸。
18.一种重组芽孢杆菌属细胞,其表达至少两种编码异源目的蛋白(POI)的引入的多核苷酸,其中该第一和第二引入的多核苷酸分别包含编码包含SEQ ID NO:2的信号序列的、可操作地连接到编码该POI的下游(3′)核酸的上游(5′)核酸,以及编码包含SEQ ID NO:6的信号序列的、可操作地连接到编码该POI的下游(3′)核酸的上游(5′)核酸。
19.一种用于在芽孢杆菌属细胞中表达异源目的蛋白(POI)的方法,该方法包括:(a)获得或构建包含引入的多核苷酸的芽孢杆菌属细胞,该引入的多核苷酸包含上游(5′)启动子序列,该上游启动子序列可操作地连接到编码包含SEQ ID NO:2的经修饰的SacB信号序列(modSacBss)的下游核酸,该下游核酸可操作地连接到编码该POI的下游(3′)核酸,以及(b)在适用于表达该POI的条件下发酵该芽孢杆菌属细胞。
20.如实施例19所述的方法,其中当在相同条件下发酵时,该芽孢杆菌属细胞相对于表达该异源POI的对照芽孢杆菌属细胞表达增加量的相同POI,其中该对照芽孢杆菌属细胞包含引入的多核苷酸,该引入的多核苷酸包含上游(5′)启动子序列,该上游启动子序列可操作地连接到编码包含SEQ ID NO:1的天然SacB信号序列(SacBss)的下游核酸,该下游核酸可操作地连接到编码相同POI的下游(3′)核酸。
21.如实施例19所述的方法,其中当在相同条件下发酵时,该芽孢杆菌属细胞相对于表达相同POI的对照芽孢杆菌属细胞表达增加量的该POI,其中该对照芽孢杆菌属细胞包含引入的多核苷酸,该引入的多核苷酸包含上游(5′)启动子,该上游启动子可操作地连接到编码包含SEQ ID NO:4的经修饰的AmyL信号序列(modAmyLss)的下游核酸,该下游核酸可操作地连接到编码相同POI的下游(3′)核酸。
22.如实施例19所述的方法,其中当在适用于表达该POI的条件下发酵时,该芽孢杆菌属细胞将该POI分泌到该发酵肉汤中。
23.如实施例19所述的方法,其进一步包括从该发酵肉汤中回收该POI。
24.一种蛋白质制剂,其包含根据实施例23回收的POI。
25.一种用于在芽孢杆菌属细胞中表达异源目的蛋白(POI)的方法,该方法包括:(a)获得或构建包含引入的多核苷酸的芽孢杆菌属细胞,该引入的多核苷酸包含上游(5′)启动子,该上游启动子可操作地连接到编码包含SEQ ID NO:6的经修饰的Bli03445信号序列(modBli03445)的下游核酸,该下游核酸可操作地连接到编码该POI的下游(3′)核酸,以及(b)在适用于表达该POI的条件下发酵该芽孢杆菌属细胞。
26.如实施例25所述的方法,其中当在相同条件下发酵时,该芽孢杆菌属细胞相对于表达相同POI的对照芽孢杆菌属细胞表达增加量的该POI,其中该对照芽孢杆菌属细胞包含引入的多核苷酸,该引入的多核苷酸包含上游(5′)启动子,该上游启动子可操作地连接到编码包含SEQ ID NO:5的天然Bli03445信号序列(Bli03445)的下游核酸,该下游核酸可操作地连接到编码相同POI的下游(3′)核酸。
27.如实施例25所述的方法,其中当在相同条件下发酵时,该芽孢杆菌属细胞相对于表达相同POI的对照芽孢杆菌属细胞表达增加量的该POI,其中该对照芽孢杆菌属细胞包含引入的多核苷酸,该引入的多核苷酸包含上游(5′)启动子,该上游启动子可操作地连接到编码包含SEQ ID NO:4的经修饰的AmyL信号序列(modAmyLss)的下游核酸,该下游核酸可操作地连接到编码相同POI的下游(3′)核酸。
28.如实施例25所述的方法,其中当在适用于表达该POI的条件下发酵时,该芽孢杆菌属细胞将该POI分泌到该发酵肉汤中。
29.如实施例28所述的方法,其进一步包括从该发酵肉汤中回收该POI。
30.一种蛋白质制剂,其包含根据权利要求29回收的POI。
实例
根据以下实例可以进一步理解本公开的某些方面,这些实例不应被解释为限制性的。对材料和方法的修改对于本领域技术人员而言是显而易见的。本文使用的标准重组DNA和分子克隆技术是本领域熟知的(Ausubel等人,1987;Sambrook等人,1989)。
实例1
用于第1淀粉酶1盒的模板质粒的构建
本实例描述了用于整合淀粉酶1(SEQ ID NO:8)表达盒的第一(第1)拷贝的模板质粒pWS733(SEQ ID NO:7)的构建。例如,淀粉酶1表达盒的第1拷贝(第1淀粉酶1盒;lysA::[p2-modSacBss-淀粉酶1]lysA;SEQ ID NO:9)包含lysA基因座的上游(5′)同源臂(上游)(lysA.上游;SEQ ID NO:10),该上游同源臂可操作地连接到编码lysA ORF(SEQ ID NO:11)的DNA,该DNA可操作地连接到合成p2启动子(pro;SEQ ID NO:12),该启动子可操作地连接到编码枯草芽孢杆菌aprE 5′-UTR(SEQ ID NO:30)的DNA,该DNA可操作地连接到编码经修饰的地衣芽孢杆菌SacB信号序列(modSacBss;SEQ ID NO:2)的DNA,该DNA可操作地连接到编码淀粉酶1(淀粉酶1)的DNA,该DNA可操作地连接到地衣芽胞杆菌amyL转录终止子(SEQID NO:14),该转录终止子可操作地连接到lysA基因座的下游(3′)同源臂(下游)(lysA.下游;SEQ ID NO:15)。更特别地,第1拷贝淀粉酶1盒的经修饰的SacB信号序列(modSacBss;SEQ ID NO:2)(图1B),相对于天然SacB信号序列(SacBss;SEQ ID NO:1;图1A),包含在-3位置处将Thr(T)取代为Ala(A)以及在-2位置处将Phe(F)取代为Ser(S)(即,相对于信号肽酶切割位点;图1)。
按照制造商的说明书使用Q5 DNA聚合酶扩增DNA片段。按照制造商的说明书用Zymo清洁和浓缩(Zymo clean and concentrate)5柱纯化PCR产物。通过使用酵母缺口修复克隆方法(Joska等人,2014)将DNA片段组装到购自ATCC(77107TM)的质粒pRS426中,从而产生pWS733(SEQ ID NO:7)。
实例2
用于第2淀粉酶1盒的模板质粒的构建
本实例描述了用于整合淀粉酶1(SEQ ID NO:8)表达盒的第二(第2)拷贝的模板质粒pWS735(SEQ ID NO:18)的构建。淀粉酶1表达盒的第2拷贝(第2淀粉酶1盒;serA::[p3-modSacBss-淀粉酶1]serA;SEQ ID NO:19)包含serA基因座的上游(5′)同源臂(上游)(serA.上游;SEQ ID NO:20),该上游同源臂可操作地连接到serA ORF(SEQ ID NO:21),该serA ORF可操作地连接到合成p3启动子(pro;SEQ ID NO:22),该启动子可操作地连接到编码枯草芽孢杆菌aprE 5′UTR(SEQ ID NO:13)的DNA,该DNA可操作地连接到编码经修饰的地衣芽孢杆菌SacB信号序列(modSacBss;SEQ ID NO:2)的DNA,该DNA可操作地连接到编码淀粉酶1(SEQ ID NO:8)的DNA,该DNA可操作地连接到地衣芽胞杆菌amyL转录终止子(SEQ IDNO:14),该转录终止子可操作地连接到serA基因座的下游(3′)同源臂(下游)(serA.下游;SEQ ID NO:23)。
按照制造商的说明书使用Q5 DNA聚合酶扩增DNA片段。按照制造商的说明书用Zymo清洁和浓缩(Zymo clean and concentrate)5柱纯化PCR产物。通过使用酵母缺口修复克隆方法(Joska等人,2014)将DNA片段A-B-部分C1和部分C2组装到购自ATCC(77107TM)的质粒pRS426中,从而产生pWS735(SEQ ID NO:18)。
实例3
用modSacBss构建表达淀粉酶1的WS2806菌株
在本实例中,将前述实例中构建和描述的表达盒整合到示例性地衣芽孢杆菌宿主菌株中。更特别地,通过将第1和第2拷贝淀粉酶1盒整合到名为BF719的地衣芽孢杆菌亲本菌株中,构建了示例性地衣芽孢杆菌宿主(WS2806)。例如,如下所述,通过将第1淀粉酶1盒(淀粉酶1;SEQ ID NO:9)整合到BF719(ΔserAΔlysA)的lysA基因座中,然后将第2淀粉酶1盒(淀粉酶1;SEQ ID NO:19)整合到其serA基因座中,构建了重组地衣芽孢杆菌WS2806菌株。
用ws683(SEQ ID NO:16)和ws688(SEQ ID NO:17)引物对,通过PCR扩增从质粒模板pWS733(SEQ ID NO:7)产生了第1淀粉酶1盒(SEQ ID NO:9)整合片段。用ws709(SEQ IDNO:24)和ws714(SEQ ID NO:25)引物对,通过PCR扩增从质粒模板pWS735(SEQ ID NO:18)产生了第2淀粉酶1盒(淀粉酶1;SEQ ID NO:19)整合片段。
使用如PCT公开号WO 2019/040412中所述的方法,将淀粉酶1表达盒转化到BF719(ΔserAΔlysA)菌株中。简言之,通过在含有一百(100)ppm壮观霉素的L肉汤中于37℃下以250RPM摇动使菌株生长过夜,产生了BF719感受态细胞。第二天,在含有一百(100)ppm壮观霉素的新鲜L肉汤中,将培养物稀释至OD600为0.7。将这种新培养物在37℃、250RPM摇动下生长一(1)小时。将D-木糖添加到0.1%w·v-1。将培养物在37℃和250RPM摇动下再生长四(4)小时。将细胞在1700g下收获七(7)分钟,并用作用于转化的感受态细胞。
将一百(100)μl BF719感受态细胞与二十(20)μl第1淀粉酶1盒整合片段(lysA::[p2-modSacBss-淀粉酶1]lysA)混合。将细胞/DNA混合物在1200RPM、37℃下孵育一个半(1.5)小时。然后将混合物铺在含有八十八(88)ppm丝氨酸和一百(100)ppm壮观霉素的TSS琼脂板上。将接种的板在37℃下孵育四十八(48)小时。用ws775(SEQ ID NO:26)和ws776(SEQ ID NO:27)引物对,通过PCR扩增筛选转化的菌落。使用Sanger的方法以及ws775和ws776引物,对该PCR产物(一个1904bp片段)(SEQ ID NO:28)进行测序。将正确整合了该盒(lysA::[p2-modSacBss-淀粉酶1]lysA;SEQ ID NO:9)的菌落储存为菌株WS2804。
如上所述产生了WS2804感受态细胞。将一百(100)μl WS2804感受态细胞与二十(20)μl第2淀粉酶1盒(serA::[p3-modSacBss-淀粉酶1]serA)整合片段混合。将细胞/DNA混合物在1200RPM、37℃下孵育一个半(1.5)小时。然后将混合物铺在TSS琼脂板上。将接种的板在37℃下孵育四十八(48)小时。用1617(SEQ ID NO:29)和ws717(SEQ ID NO:30)引物对,通过PCR扩增筛选转化的菌落。使用Sanger的方法以及1617(SEQ ID NO:29)和ws717(SEQID NO:30)引物对,对该PCR产物(一个1864bp片段)(SEQ ID NO:31)进行测序。
将正确整合了第1淀粉酶1盒(lysA::[p2-modSacBss-淀粉酶1]lysA;SEQ ID NO:9)和第2淀粉酶1盒(serA::[p3-modSacBss-淀粉酶1]serA;SEQ ID NO:19)的菌落在L琼脂上传代,直到将菌落储存为菌株WS2806(serA::[p3-modSacBss-淀粉酶1]serA)lysA::[p2-modSacBss-淀粉酶1]lysA)。
为了测试经修饰的地衣芽孢杆菌SacB信号序列(modSacBss;SEQ ID NO:2)对淀粉酶1产生的相对性能,在BF719中通过在lysA基因座处整合第1淀粉酶1盒(lysA::[p2-modAmyLss-淀粉酶1]lysA;SEQ ID NO:32)和在serA基因座处整合第2淀粉酶1盒(serA::[p3-modAmyLss-淀粉酶1]serA;SEQ ID NO:33)来构建具有经修饰的地衣芽孢杆菌AmyL信号序列(modAmyLss;SEQ ID NO:4)的对照菌株。第1淀粉酶1盒(lysA::[p2-modAmyLss-淀粉酶1]lysA;SEQ ID NO:32)包含lysA基因座的上游同源臂(上游)(lysA.上游;SEQ ID NO:10),该上游同源臂可操作地连接到编码lysA(ORF;SEQ ID NO:11)的DNA序列,该DNA序列可操作地连接到合成p2启动子(pro;SEQ ID NO:12),该启动子可操作地连接到编码枯草芽孢杆菌aprE 5′-UTR(SEQ ID NO:13)的DNA,该DNA可操作地连接到编码经修饰的地衣芽孢杆菌AmyL信号序列(modAmyLss;SEQ ID NO:4)的DNA,该DNA可操作地连接到编码淀粉酶1的DNA,该DNA可操作地连接到地衣芽胞杆菌amyL转录终止子(SEQ ID NO:14),该转录终止子可操作地连接到lysA基因座的下游同源臂(下游)(lysA.下游;SEQ ID NO:15)。第2淀粉酶1盒(serA::[p3-modAmyLss-淀粉酶1]serA;SEQ ID NO:33)包含serA基因座的上游同源臂(上游)(serA.上游;SEQ ID NO:20),该上游同源臂可操作地连接到serA ORF(SEQ ID NO:21),该serA ORF可操作地连接到合成p3启动子(pro;SEQ ID NO:22),该启动子可操作地连接到编码经修饰的枯草芽孢杆菌aprE 5′-UTR(SEQ ID NO:13)的DNA,该DNA可操作地连接到编码经修饰的地衣芽孢杆菌AmyL信号序列(modAmyLss;SEQ ID NO:4)的DNA,该DNA可操作地连接到编码淀粉酶1(SEQ ID NO:8)的DNA,该DNA可操作地连接到地衣芽胞杆菌amyL转录终止子(SEQ ID NO:14),该转录终止子可操作地连接到serA基因座的下游同源臂(下游)(serA.下游;SEQ ID NO:23)。
例如,经修饰的AmyL信号序列(modAmyLss;SEQ ID NO:4),相对于天然AmyL信号序列(AmyLss;SEQ ID NO:3),包括在-2位置处将丙氨酸(A)取代为丝氨酸(S),相对于信号肽酶切割位点(例如,参见图2)。
实例4
经修饰的地衣芽孢杆菌SACB信号序列对淀粉酶1产生的影响
在本实例中,使用如PCT公开号WO 2018/156705和WO 2019/055261(各自通过引用并入本文)中所述的标准小规模条件,与含有两(2)个拷贝的具有经修饰的地衣芽孢杆菌AmyL信号序列(modAmyLss;SEQ ID NO:4和图2)的淀粉酶1表达盒的对照BF822菌株相比,测定含有两(2)个拷贝的具有经修饰的地衣芽孢杆菌SacB信号序列(modSacBss;SEQ ID NO:2和图1)的淀粉酶1表达盒的WS2806菌株的淀粉酶1产生。
使用Bradford或Ceralpha测定法对淀粉酶1报告蛋白的产生进行定量,其中与BF822(对照)菌株的产生相比,来自WS2806菌株的淀粉酶1产生的相对提高呈现在下表6中。
表6
modSacBss相比于modAmyLss信号序列对淀粉酶1产生的相对性能
菌株名称 信号序列(ss) SEQ ID NO 相对Amy1产生
WS2806 modSacBss 2 1.18
BF822 modAmyLss 4 1.00
因此,如表6所示,经修饰的地衣芽孢杆菌SacB信号序列(modSacBss)证明了WS2806菌株中淀粉酶1报告蛋白的产生相对于包含经修饰的地衣芽孢杆菌AmyL信号序列(modAmyLss)的地衣芽孢杆菌(对照)菌株BF822有所提高。
实例5
用于第1淀粉酶2盒的模板质粒的构建
本实例描述了用于整合淀粉酶2(SEQ ID NO:35)表达盒的第一(第1)拷贝的模板质粒pWS743(SEQ ID NO:34)的构建。例如,淀粉酶2表达盒的第1拷贝(第1淀粉酶2盒;lysA::[p3-mod-Bli03445ss-淀粉酶2]lysA;SEQ ID NO:36)包含lysA基因座的上游同源臂(上游)(lysA.上游;SEQ ID NO:10),该上游同源臂可操作地连接到lysA ORF(SEQ ID NO:11),该lysA ORF可操作地连接到合成p3启动子(pro;SEQ ID NO:22),该启动子可操作地连接到编码枯草芽孢杆菌aprE 5′-UTR(SEQ ID NO:13)的DNA,该DNA可操作地连接到编码经修饰的地衣芽孢杆菌Bli03445信号序列(modBli03445ss;SEQ ID NO:6)的DNA,该DNA可操作地连接到编码淀粉酶2的DNA,该DNA可操作地连接到地衣芽胞杆菌amyL转录终止子(SEQID NO:14),该转录终止子可操作地连接到lysA基因座的下游(3′)同源臂(下游)(lysA.下游;SEQ ID NO:15)。
更特别地,经修饰的地衣芽孢杆菌Bli03445信号序列(modBli03445ss;图3B),相对于天然地衣芽孢杆菌Bli03445信号序列(Bli03445ss;图3A),包括在起始密码子(-29位置)处将缬氨酸(V)取代为甲硫氨酸(M)以及在-2位置处将苯丙氨酸(F)取代为丝氨酸(S)(即,相对于成熟淀粉酶2蛋白的信号肽酶切割位点)。
按照制造商的说明书使用Q5 DNA聚合酶扩增DNA片段。按照制造商的说明书用Zymo清洁和浓缩(Zymo clean and concentrate)5柱纯化PCR产物。通过使用酵母缺口修复克隆方法(Joska等人,2014)将DNA片段A、B和C组装到购自ATCC(77107TM)的质粒pRS426中,从而产生pWS743(SEQ ID NO:34)。
实例6
用于第2淀粉酶2盒的模板质粒的构建
本实例描述了用于整合淀粉酶2(SEQ ID NO:35)表达盒的第二(第2)拷贝的模板质粒pWS745(SEQ ID NO:37)的构建。例如,淀粉酶2表达盒的第2拷贝(第2淀粉酶2盒;serA::[p1-modBli03445ss-淀粉酶2]serA;SEQ ID NO:38)包含serA基因座的(5′)上游同源臂(上游)(serA.上游;SEQ ID NO:20),该上游同源臂可操作地连接到serA ORF(SEQ IDNO:21),该serA ORF可操作地连接到合成p1启动子(pro;SEQ ID NO:39),该启动子可操作地连接到编码枯草芽孢杆菌aprE5′-UTR(SEQ ID NO:13)的DNA,该DNA可操作地连接到编码经修饰的地衣芽孢杆菌Bli03445信号序列(modBli03445ss;SEQ ID NO:6)的DNA,该DNA可操作地连接到编码淀粉酶2的DNA,该DNA可操作地连接到地衣芽胞杆菌amyL转录终止子(SEQ ID NO:14),该转录终止子可操作地连接到serA基因座的下游(3′)同源臂(下游)(serA.下游;SEQ ID NO:23)。
按照制造商的说明书使用Q5 DNA聚合酶扩增DNA片段。按照制造商的说明书用Zymo清洁和浓缩(Zymo clean and concentrate)5柱纯化PCR产物。通过使用酵母缺口修复克隆方法(Joska等人,2014)将DNA片段A、B和C组装到购自ATCC(77107TM)的质粒pRS426中,从而产生pWS745(SEQ ID NO:37)。
实例7
用modBli03445ss构建表达淀粉酶2的WS2835菌株
在本实例中,将实例6和7中构建和描述的表达盒整合到示例性地衣芽孢杆菌宿主菌株中。更特别地,通过将第1和第2拷贝淀粉酶2盒整合到名为BF719(ΔserAΔlysA)的地衣芽孢杆菌菌株中,构建了示例性地衣芽孢杆菌宿主(WS2835)。例如,如下所述,通过将第1淀粉酶2盒(淀粉酶2;SEQ ID NO:36)整合到BF719(ΔserAΔlysA)的lysA基因座中,然后将第2淀粉酶2盒(淀粉酶2;SEQ ID NO:38)整合到其serA基因座中,构建了重组地衣芽孢杆菌菌株(WS2835)。
用ws683(SEQ ID NO:16)和ws688(SEQ ID NO:17)引物对,通过PCR扩增从质粒模板pWS743(SEQ ID NO:34)产生了第1淀粉酶2盒(lysA::[p3-modBli03445ss-淀粉酶2]lysA;SEQ ID NO:36)整合片段。用ws709(SEQ ID NO:24)和ws714(SEQ ID NO:25)引物对,通过PCR扩增从质粒模板pWS745(SEQ ID NO:37)产生了第2淀粉酶2盒(serA::[p1-modBli03445ss-淀粉酶2]serA;SEQ ID NO:38)整合片段。
使用如PCT公开号WO 2019/040412中所述的方法,将淀粉酶2表达盒转化到BF613菌株中。简言之,通过在含有一百(100)ppm壮观霉素的L肉汤中于37℃下以250RPM摇动使菌株生长过夜,产生了BF613感受态细胞。第二天,在含有一百(100)ppm壮观霉素的新鲜L肉汤中,将培养物稀释至OD600为0.7。将这种新培养物在37℃、250RPM摇动下生长一(1)小时。将D-木糖添加到0.1%w·v-1。将培养物在37℃和250RPM摇动下再生长四(4)小时。将细胞在1700g下收获七(7)分钟,并用作用于转化的感受态细胞。
将一百(100)μl BF613感受态细胞与二十(20)μl第1盒(SEQ ID NO:36)整合片段混合。将细胞/DNA混合物在1200RPM、37℃下孵育一个半(1.5)小时。然后将混合物铺在含有八十八(88)ppm丝氨酸和一百(100)ppm壮观霉素的TSS琼脂板上。将接种的板在37℃下孵育四十八(48)小时。用ws775(SEQ ID NO:26)和ws776(SEQ ID NO:27)引物对,通过PCR扩增筛选转化的菌落。使用Sanger的方法以及表5中列出的ws775和ws776引物对,对该PCR产物(一个1905bp片段)(SEQ ID NO:40)进行测序。储存正确整合了第1淀粉酶2盒(SEQ ID NO:36)的菌落并命名为WS2834。
如上所述产生了WS2834感受态细胞。将一百(100)μl WS2834感受态细胞与二十(20)μl第2淀粉酶2盒(SEQ ID NO:38)整合片段混合。将细胞/DNA混合物在1200RPM、37℃下孵育一个半(1.5)小时。然后将混合物铺在TSS琼脂板上。将接种的板在37℃下孵育四十八(48)小时。用1617(SEQ ID NO:29)和ws717(SEQ ID NO:30)引物对,通过PCR扩增筛选转化菌落。使用Sanger的方法以及1617和ws717引物,对该PCR产物(一个1849bp片段)(SEQ IDNO:41)进行测序。将正确整合了第1淀粉酶2盒(SEQ ID NO:36)和第2淀粉酶2盒(SEQ IDNO:38)的菌落在L琼脂上传代,直到将菌落储存为菌株WS2835。
为了测试经修饰的地衣芽孢杆菌Bli03445信号序列(modBli03445ss;SEQ ID NO:6)对淀粉酶2产生的相对性能,在BF613(ΔserAΔlysA)中通过在lysA基因座处整合第1淀粉酶2盒(lysA::p3-modAmyLss-淀粉酶2lysA)和在serA基因座处整合第2淀粉酶2盒(serA::[p1-modAmyLss-淀粉酶2]serA)来构建具有经修饰的地衣芽孢杆菌AmyL信号序列(modAmyLss;SEQ ID NO:4)的对照菌株。第1淀粉酶2盒(SEQ ID NO:42)包含lysA基因座的上游同源臂(上游)(lysA.上游;SEQ ID NO:10),该上游同源臂可操作地连接到编码lysAORF(SEQ ID NO:11)的DNA序列,该DNA序列可操作地连接到合成p3启动子(pro;SEQ ID NO:22),该启动子可操作地连接到编码枯草芽孢杆菌aprE 5′-UTR(SEQ ID NO:13)的DNA,该DNA可操作地连接到编码经修饰的地衣芽孢杆菌AmyL信号序列(modAmyLss;SEQ ID NO:4)的DNA,该DNA可操作地连接到编码淀粉酶2的DNA,该DNA可操作地连接到地衣芽胞杆菌amyL转录终止子(SEQ ID NO:14),该转录终止子可操作地连接到lysA基因座的下游同源臂(下游)(lysA.下游;SEQ ID NO:15)。第2淀粉酶2盒(SEQ ID NO:43)包含serA基因座的上游同源臂(上游)(serA.上游;SEQ ID NO:20),该上游同源臂可操作地连接到serA ORF(SEQ IDNO:48),该serA ORF可操作地连接到合成p1启动子(pro;SEQ ID NO:39),该启动子可操作地连接到编码枯草芽孢杆菌aprE 5′-UTR(SEQ ID NO:13)的DNA,该DNA可操作地连接到编码经修饰的地衣芽孢杆菌AmyL信号序列(modAmyLss;SEQ ID NO:4)的DNA,该DNA可操作地连接到编码淀粉酶2的DNA,该DNA可操作地连接到地衣芽胞杆菌amyL转录终止子(SEQ IDNO:14),该转录终止子可操作地连接到serA基因座的下游同源臂(下游)(serA.下游;SEQID NO:23)。更特别地,如图2所示,经修饰的AmyL信号序列(modAmyLss;SEQ ID NO:4),相对于天然AmyL信号序列(AmyLss;SEQ ID NO:3),包括在-2位置处将丙氨酸(A)取代为丝氨酸(S)(即,相对于信号肽酶切割位点)。
实例8
经修饰的地衣芽孢杆菌BLI03445信号序列(BLI03445ss)对淀粉酶2产生的影响
在本实例中,使用如PCT公开号WO 2018/156705和WO 2019/055261(各自通过引用并入本文)中所述的标准小规模条件,与包含两(2)个拷贝的具有经修饰的地衣芽孢杆菌AmyL信号序列(modAmyLss;SEQ ID NO:4)的淀粉酶2表达盒的对照LDN573-8菌株相比,测定包含两(2)个拷贝的具有经修饰的地衣芽孢杆菌Bli03445信号序列(modBli03445ss;SEQID NO:6)的淀粉酶2表达盒的WS2835菌株的淀粉酶报告蛋白产生。使用Bradford或Ceralpha测定法对α-淀粉酶产生进行定量,其中与对照菌株(LDN573-8)相比,WS2835菌株的淀粉酶2产生的相对提高呈现在下表9中。
表9
modBli03445ss相比于modAmyLss对淀粉酶2产生的相对性能
菌株名称 信号序列(ss) SEQ ID NO 相对Amy2产生
WS2835 modBli03345ss 6 1.19
LDN573-8 modAmyLss 4 1.00
如表9所呈现,经修饰的地衣芽孢杆菌Bli03445信号序列(modBli03445ss)证明了WS2835菌株中淀粉酶2报告蛋白的产生,相对于包含经修饰的AmyL信号序列(modAmyLss)的地衣芽孢杆菌(对照)菌株LDN573-8显著提高。
参考文献
PCT公开号WO 2002/14490
PCT公开号WO 2003/08312
Ausubel et al.,“Current Protocols in Molecular Biology”,published byGreene Publishing Assoc.and Wiley-Interscience(1987).
Brode et al.,“Subtilisin BPN'variants:increased hydrolytic activityon surface-bound substrates via decreased surface activity”,Biochemistry,35(10):3162-3169,1996.
Caspers et al.,“Improvement of Sec-dependent secretion of aheterologous model protein in Bacillus subtilis by saturation mutagenesis ofthe N-domain of the AmyE signal peptide”,Appl.Microbiol.Biotechnol.,86(6):1877-1885,2010.
Earl et al.,“Ecology and genomics of Bacillus subtilis”,Trends inMicrobiology.,16(6):269-275,2008.
Ferrari et al.,"Genetics,"in Harwood et al.(ed.),Bacillus,PlenumPublishing Corp.,1989.
Joska et al.,J of Microbiol.Methods,2014,100:46-51.
Olempska-Beer et al.,“Food-processing enzymes from recombinantmicroorganisms--a review”’Regul.Toxicol.Pharmacol.,45(2):144-158,2006.
Raul et al.,“Production and partial purification of alpha amylasefrom Bacillus subtilis(MTCC 121)using solid state fermentation”,BiochemistryResearch International,2014.
Sambrook et al.,“Molecular Cloning:A Laboratory Manual”Cold SpringHarbor Laboratory:Cold Spring Harbor,N.Y.(1989),(2001)and(2012).
Van Dijl and Hecker,“Bacillus subtilis:from soil bacterium to super-secreting cell factory”,Microbial Cell Factories,12(3).2013.
Westers et al.,“Bacillus subtilis as cell factory for pharmaceuticalproteins:a biotechnological approach to optimize the host organism”,Biochimica et Biophysica Acta.,1694:299-310,2004.

Claims (24)

1.一种核酸,其编码包含SEQ ID NO:2的信号序列。
2.一种核酸,其编码包含SEQ ID NO:6的信号序列。
3.一种多核苷酸,其包含编码包含SEQ ID NO:2的信号序列的上游(5′)核酸,所述上游核酸可操作地连接到编码目的蛋白(POI)的下游(3′)核酸。
4.一种多核苷酸,其包含编码包含SEQ ID NO:6的信号序列的上游(5′)核酸,所述上游核酸可操作地连接到编码目的蛋白(POI)的下游(3′)核酸。
5.一种多核苷酸,其包含上游(5′)启动子,所述上游启动子可操作地连接到编码包含SEQ ID NO:2的信号序列的下游核酸,所述下游核酸可操作地连接到编码目的蛋白(POI)的下游(3′)核酸。
6.一种多核苷酸,其包含上游(5′)启动子序列,所述上游启动子序列可操作地连接到编码包含SEQ ID NO:6的信号序列的下游核酸,所述下游核酸可操作地连接到编码目的蛋白(POI)的下游(3′)核酸。
7.如权利要求3-6中任一项所述的多核苷酸,其进一步包含位于编码所述POI的核酸下游(3′)并与其可操作地连接的终止子序列。
8.如权利要求3-7中任一项所述的多核苷酸,其中编码所述POI的核酸编码酶。
9.一种重组芽孢杆菌属(Bacillus)细胞,其包含至少一种引入的如权利要求5-7中任一项所述的多核苷酸。
10.一种重组芽孢杆菌属细胞,其包含至少两种引入的如权利要求5-7中任一项所述的多核苷酸。
11.如权利要求9或权利要求10所述的重组芽孢杆菌属细胞,使其缺乏一种或多种天然(内源)基因的产生。
12.一种重组芽孢杆菌属细胞,其表达编码异源目的蛋白(POI)的引入的多核苷酸,其中所述多核苷酸包含编码包含SEQ ID NO:2的信号序列的上游(5′)核酸,所述上游核酸可操作地连接到编码所述POI的下游(3′)核酸。
13.一种重组芽孢杆菌属细胞,其表达至少两种编码异源目的蛋白(POI)的引入的多核苷酸,其中所述引入的多核苷酸包含编码包含SEQ ID NO:2的信号序列的、可操作地连接到编码所述POI的下游(3′)核酸的上游(5′)核酸。
14.一种重组芽孢杆菌属细胞,其表达编码异源目的蛋白(POI)的引入的多核苷酸,其中所述多核苷酸包含编码包含SEQ ID NO:6的信号序列的上游(5′)核酸,所述上游核酸可操作地连接到编码所述POI的下游(3′)核酸。
15.一种重组芽孢杆菌属细胞,其表达至少两种编码异源目的蛋白(POI)的引入的多核苷酸,其中所述引入的多核苷酸包含编码包含SEQ ID NO:6的信号序列的、可操作地连接到编码所述POI的下游(3′)核酸的上游(5′)核酸。
16.一种重组芽孢杆菌属细胞,其表达至少两种编码异源目的蛋白(POI)的引入的多核苷酸,其中所述第一和第二引入的多核苷酸分别包含编码包含SEQ ID NO:2的信号序列的、可操作地连接到编码所述POI的下游(3′)核酸的上游(5′)核酸,以及编码包含SEQ ID NO:6的信号序列的、可操作地连接到编码所述POI的下游(3′)核酸的上游(5′)核酸。
17.一种用于在芽孢杆菌属细胞中表达异源目的蛋白(POI)的方法,所述方法包括:(a)获得或构建包含引入的多核苷酸的芽孢杆菌属细胞,所述引入的多核苷酸包含上游(5′)启动子,所述上游启动子可操作地连接到编码包含SEQ ID NO:2的经修饰的SacB信号序列(modSacBss)的下游核酸,所述下游核酸可操作地连接到编码所述POI的下游(3′)核酸,以及(b)在适用于表达所述POI的条件下发酵所述芽孢杆菌属细胞。
18.如权利要求17所述的方法,其中当在相同条件下发酵时,所述芽孢杆菌属细胞相对于表达所述异源POI的对照芽孢杆菌属细胞表达增加量的相同POI,其中所述对照芽孢杆菌属细胞包含引入的多核苷酸,所述引入的多核苷酸包含相同的上游(5′)启动子序列,所述上游启动子序列可操作地连接到编码包含SEQ ID NO:1的天然SacB信号序列(SacBss)的下游核酸,所述下游核酸可操作地连接到编码相同POI的下游(3′)核酸。
19.如权利要求17所述的方法,其中当在相同条件下发酵时,所述芽孢杆菌属细胞相对于表达所述异源POI的对照芽孢杆菌属细胞表达增加量的相同POI,其中所述对照芽孢杆菌属细胞包含引入的多核苷酸,所述引入的多核苷酸包含相同的上游(5′)启动子,所述上游启动子可操作地连接到编码包含SEQ ID NO:4的经修饰的AmyL信号序列(modAmyLss)的下游核酸,所述下游核酸可操作地连接到编码相同POI的下游(3′)核酸。
20.如权利要求17所述的方法,其中当在适用于表达所述POI的条件下发酵时,所述芽孢杆菌属细胞将所述POI分泌到发酵肉汤中。
21.一种用于在芽孢杆菌属细胞中表达异源目的蛋白(POI)的方法,所述方法包括:(a)获得或构建包含引入的多核苷酸的芽孢杆菌属细胞,所述引入的多核苷酸包含上游(5′)启动子,所述上游启动子可操作地连接到编码包含SEQ ID NO:6的经修饰的Bli03445信号序列(modBli03445)的下游核酸,所述下游核酸可操作地连接到编码所述POI的下游(3′)核酸,以及(b)在适用于表达所述POI的条件下发酵所述芽孢杆菌属细胞。
22.如权利要求21所述的方法,其中当在相同条件下发酵时,所述芽孢杆菌属细胞相对于表达该异源POI的对照芽孢杆菌属细胞表达增加量的相同POI,其中所述对照芽孢杆菌属细胞包含引入的多核苷酸,所述引入的多核苷酸包含相同的上游(5′)启动子,所述上游启动子可操作地连接到编码包含SEQ ID NO:5的天然Bli03445信号序列(Bli03445)的下游核酸,所述下游核酸可操作地连接到编码相同POI的下游(3′)核酸。
23.如权利要求21所述的方法,其中当在相同条件下发酵时,所述芽孢杆菌属细胞相对于表达所述异源POI的对照芽孢杆菌属细胞表达增加量的相同POI,其中所述对照芽孢杆菌属细胞包含引入的多核苷酸,所述引入的多核苷酸包含相同的上游(5′)启动子,所述上游启动子可操作地连接到编码包含SEQ ID NO:4的经修饰的AmyL信号序列(modAmyLss)的下游核酸,所述下游核酸可操作地连接到编码相同POI的下游(3′)核酸。
24.如实施例21所述的方法,其中当在适用于表达所述POI的条件下发酵时,所述芽孢杆菌属细胞将所述POI分泌到发酵肉汤中。
CN202280054831.XA 2021-08-20 2022-08-19 用于增强芽孢杆菌属细胞中蛋白质产生的方法和组合物 Pending CN117836315A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163235476P 2021-08-20 2021-08-20
US63/235,476 2021-08-20
PCT/US2022/075208 WO2023023642A2 (en) 2021-08-20 2022-08-19 Methods and compositions for enhanced protein production in bacillus cells

Publications (1)

Publication Number Publication Date
CN117836315A true CN117836315A (zh) 2024-04-05

Family

ID=83447916

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280054831.XA Pending CN117836315A (zh) 2021-08-20 2022-08-19 用于增强芽孢杆菌属细胞中蛋白质产生的方法和组合物

Country Status (3)

Country Link
EP (1) EP4387982A2 (zh)
CN (1) CN117836315A (zh)
WO (1) WO2023023642A2 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023225459A2 (en) 2022-05-14 2023-11-23 Novozymes A/S Compositions and methods for preventing, treating, supressing and/or eliminating phytopathogenic infestations and infections

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1309677B2 (en) 2000-08-11 2012-04-11 Genencor International, Inc. Bacillus transformation, transformants and mutant libraries
DE10134423A1 (de) 2001-07-19 2003-02-06 Jagenberg Querschneider Gmbh Vorrichtung zum Stapeln von Bögen, insbesondere von geschuppt zugeförderten Papier- oder Kartonbögen auf Paletten
AU2003228393A1 (en) 2002-03-29 2003-10-13 Genencor International, Inc. Ehanced protein expression in bacillus
EP1497429B1 (en) * 2002-04-10 2008-07-02 Novozymes A/S Improved bacillus host cell
US7968691B2 (en) * 2006-08-23 2011-06-28 Danisco Us Inc. Pullulanase variants with increased productivity
EP2210898A1 (en) * 2006-11-29 2010-07-28 Novozymes Inc. Bacillus Licheniformis chromosome
CN101451116B (zh) * 2008-12-30 2010-09-08 北京中天诺亚体育科技有限公司 一种表达高温α-淀粉酶的基因工程菌株
US20130149771A1 (en) * 2010-08-24 2013-06-13 Novozymes A/S Heat-Stable Persephonella Carbonic Anhydrases and Their Use
DK2683817T3 (da) * 2011-05-10 2017-11-06 Danisco Us Inc Termostabile carbonanhydraser og fremgangsmåder til anvendelse deraf
DK3387124T3 (da) * 2015-12-09 2021-08-23 William Cuevas Kombinatoriske alfa-amylasevarianter
EP3585910B1 (en) 2017-02-24 2024-03-20 Danisco US Inc. Compositions and methods for increased protein production in bacillus licheniformis
CN110662836B (zh) * 2017-03-31 2024-04-12 丹尼斯科美国公司 α-淀粉酶组合变体
EP3655537A1 (en) * 2017-08-23 2020-05-27 Danisco US Inc. Methods and compositions for efficient genetic modifications of bacillus licheniformis strains
EP3682010A1 (en) * 2017-09-13 2020-07-22 Danisco US Inc. Modified 5'-untranslated region (utr) sequences for increased protein production in bacillus
CN111087476B (zh) * 2019-12-31 2021-08-17 天津科技大学 一种提高外源蛋白表达量的双信号肽及其构建方法与用途
JP2023524334A (ja) * 2020-01-15 2023-06-12 ダニスコ・ユーエス・インク バチルス・リケニフォルミス(bacillus licheniformis)における強化したタンパク質産生のための組成物及び方法

Also Published As

Publication number Publication date
WO2023023642A3 (en) 2023-07-20
EP4387982A2 (en) 2024-06-26
WO2023023642A2 (en) 2023-02-23

Similar Documents

Publication Publication Date Title
CN110520520B (zh) 用于增加地衣芽孢杆菌中蛋白质产生的组合物和方法
US11781147B2 (en) Promoter sequences and methods thereof for enhanced protein production in Bacillus cells
CN111094576A (zh) 用于增加芽胞杆菌属中蛋白质产生的经修饰的5′-非翻译区(utr)序列
US11414643B2 (en) Mutant and genetically modified Bacillus cells and methods thereof for increased protein production
US20230340442A1 (en) Compositions and methods for enhanced protein production in bacillus licheniformis
CN117836315A (zh) 用于增强芽孢杆菌属细胞中蛋白质产生的方法和组合物
US20220389372A1 (en) Compositions and methods for enhanced protein production in bacillus cells
US20220282234A1 (en) Compositions and methods for increased protein production in bacillus lichenformis
EP4294823A1 (en) Methods and compositions for producing proteins of interest in pigment deficient bacillus cells
WO2023091878A1 (en) Compositions and methods for enhanced protein production in bacillus cells
WO2022251109A1 (en) Compositions and methods for enhanced protein production in bacillus cells
WO2023192953A1 (en) Pro-region mutations enhancing protein production in gram-positive bacterial cells
KR20240099301A (ko) 바실러스 세포에서 단백질 생산을 향상시키기 위한 조성물 및 방법
WO2024091804A1 (en) Compositions and methods for enhanced protein production in bacillus cells
WO2024050503A1 (en) Novel promoter and 5'-untranslated region mutations enhancing protein production in gram-positive cells
WO2023137264A1 (en) Compositions and methods for enhanced protein production in gram‑positive bacterial cells

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication