CN110520520B - 用于增加地衣芽孢杆菌中蛋白质产生的组合物和方法 - Google Patents

用于增加地衣芽孢杆菌中蛋白质产生的组合物和方法 Download PDF

Info

Publication number
CN110520520B
CN110520520B CN201880024359.9A CN201880024359A CN110520520B CN 110520520 B CN110520520 B CN 110520520B CN 201880024359 A CN201880024359 A CN 201880024359A CN 110520520 B CN110520520 B CN 110520520B
Authority
CN
China
Prior art keywords
rghr2
protein
seq
gene
bacillus licheniformis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201880024359.9A
Other languages
English (en)
Other versions
CN110520520A (zh
Inventor
M·A·B·科尔克曼
S·D·多伊格
R·L·弗里希
H·贺
F·W·库普曼
C·莱夫朗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Danisco US Inc
Original Assignee
Danisco US Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Danisco US Inc filed Critical Danisco US Inc
Publication of CN110520520A publication Critical patent/CN110520520A/zh
Application granted granted Critical
Publication of CN110520520B publication Critical patent/CN110520520B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/75Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/32Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本公开总体上涉及用于获得具有增加的蛋白质产生能力的地衣芽孢杆菌细胞/菌株的组合物和方法。本公开的某些实施例涉及衍生自包含变体rghR2基因的亲本地衣芽孢杆菌细胞/菌株的遗传修饰的地衣芽孢杆菌细胞/菌株。

Description

用于增加地衣芽孢杆菌中蛋白质产生的组合物和方法
技术领域
本公开总体上涉及细菌学、微生物学、遗传学、分子生物学、酶学、工业蛋白质生产等领域。更特别地,本公开涉及用于获得具有增加的蛋白质产生能力的地衣芽孢杆菌(Bacillus licheniformis)细胞/菌株(例如,蛋白质产生宿主;细胞工厂)的组合物和方法。因此,本公开的某些实施例涉及衍生自亲本地衣芽孢杆菌细胞的经修饰的地衣芽孢杆菌细胞,所述亲本地衣芽孢杆菌细胞包含编码SEQ ID NO:4的RghR2蛋白质的染色体rghR2基因(变体),其中所述经修饰的细胞包含编码SEQ ID NO:2的RghR2蛋白质的rghR2基因的遗传修饰。
相关申请的交叉引用
本申请要求2017年2月24日提交的美国临时专利申请序列号62/463,268的优先权,将其通过引用以其整体结合在此。
序列表的引用
命名为“20180220_NB41203WOPCT_SequenceListing_ST25_Final.txt”的文本文件序列表的电子提交的内容创建于2018年2月13日,并且大小为178KB,将其通过引用以其整体结合在此。
背景技术
***如枯草芽孢杆菌(Bacillus subtilis)、地衣芽孢杆菌和解淀粉芽孢杆菌(Bacillus amyloliquefaciens)由于其优异的发酵特性和高产率(例如,高达25克/升培养物;Van Dijl和Hecker,2013年),经常被用作微生物工厂,用于产生工业相关蛋白质。例如,枯草芽孢杆菌因其产生食品、纺织品、洗衣、医疗器械清洁、制药工业等所必需的α-淀粉酶(Jensen等人,2000;Raul等人,2014)和蛋白酶(Brode等人,1996)而为人熟知(Westers等人,2004)。由于这些非致病性***产生完全不含毒性副产物(例如脂多糖;LPS,也称为内毒素)的蛋白质,因此它们已经获得了欧洲食品***的“安全资格认定”(QPS)状态,并且其许多产品获得了美国食品和药品管理局的“通常认为安全”(GRAS)状态(Olempska-Beer等人,2006;Earl等人,2008;Caspers等人,2010)。
因此,微生物宿主细胞中蛋白质(例如,酶、抗体、受体等)的产生在生物技术领域中是特别有意义的。同样,用于产生和分泌一种或多种目的蛋白的芽孢杆菌属(Bacillus)宿主细胞的优化具有高度相关性,特别是在如下工业生物技术环境中,其中当蛋白质以大的工业产量生产时所述蛋白质产率的微小改善具有重大意义。更特别地,地衣芽孢杆菌是具有高工业重要性的芽孢杆菌属物种宿主细胞,因此,对于构建新的和改善的地衣芽孢杆菌产生菌株,高度希望具有修饰和工程化地衣芽孢杆菌宿主细胞以获得增强的/增加的蛋白质表达/产生的能力。因此,本公开涉及对于获得和构建具有增加的蛋白质产生能力的地衣芽孢杆菌细胞(例如,蛋白质产生宿主细胞)的高度希望和未满足的需求。
发明内容
本公开总体上涉及用于获得具有增加的蛋白质产生能力的地衣芽孢杆菌细胞(例如,蛋白质产生宿主;细胞工厂)的组合物和方法。本公开的某些实施例涉及衍生自亲本地衣芽孢杆菌细胞的经修饰的地衣芽孢杆菌细胞,所述亲本地衣芽孢杆菌细胞包含编码与SEQ ID NO:4包含90%序列同一性的RghR2蛋白质的rghR2基因,其中所述经修饰的细胞包含编码与SEQ ID NO:2包含90%序列同一性的RghR2蛋白质的rghR2基因的遗传修饰,其中(相对于未经修饰的亲本细胞),所述经修饰的宿主细胞产生增加的量的目的蛋白。在某些实施例中,相对于与SEQ ID NO:2包含90%序列同一性的RghR2蛋白质,与SEQ ID NO:4包含90%序列同一性的RghR2蛋白质作为转录调控蛋白质基本上灭活。在其他实施例中,所述包含编码与SEQ ID NO:4包含90%序列同一性的RghR2蛋白质的rghR2基因的亲本细胞包含在rghR2基因(rghR2dup)中的一个18核苷酸重复,所述rghR2基因(rghR2dup)中的18核苷酸重复对应于与SEQ ID NO:4包含90%序列同一性的RghR2蛋白质的氨基酸位置38-43处的氨基酸AAAISR的重复,并且其中所述经修饰的细胞包含缺失rghR2基因(rghR2rest)中的18核苷酸重复的修饰,从而编码与SEQ ID NO:2包含90%序列同一性的RghR2蛋白质。在某些其他实施例中,所述编码与SEQ ID NO:4包含90%序列同一性的RghR2蛋白质的rghR2基因包含与SEQ ID NO:3具有至少90%序列同一性的核酸序列,并且包含编码在SEQ ID NO:4的RghR2蛋白质的氨基酸位置38-43处的氨基酸AAAISR的重复的18核苷酸重复。在其他实施例中,所述编码SEQ ID NO:2的RghR2蛋白质的rghR2基因包含与SEQ ID NO:1的rghR2基因包含90%序列同一性的核酸序列。在又另一个实施例中,相对于亲本细胞,目的蛋白的增加量是至少1.0%增加。在某些其他实施例中,进一步包含遗传修饰的经修饰的细胞,所述遗传修饰破坏、缺失、灭活或下调选自由以下组成的组的至少一个内源地衣芽孢杆菌基因:abrB1、rpmJ、rpIM、BLi00412、rapK、phrK、BLi00753、yfjT、BLi00828、yhdX、yhzC、terf2、zosA、abbA、speG、yppF、BLi02543、mntR、BLi02768、sspA、BLi03127、BLi03635、mrgA、BLi03644、yvzC、rghR1、spo0F、ywjG、ywq12、BLi04199、BLi04200、licT、bglH和bglP。在某些实施例中,经修饰的细胞包含遗传修饰,所述遗传修饰缺失、破坏或下调选自yvzC、Bli03644、AbrB1和abh(AbrB2)的内源地衣芽孢杆菌基因,或选自由yvzC、Bli03644、AbrB1和abh(AbrB2)组成的组的至少两个内源地衣芽孢杆菌基因,或选自由yvzC、Bli03644、AbrB1和abh(AbrB2)组成的组的至少三个内源地衣芽孢杆菌基因,或所有四个内源地衣芽孢杆菌基因yvzC、Bli03644、AbrB1和abh(AbrB2)。在另一个实施例中,增加量的目的蛋白是异源蛋白质。因此,在某些实施例中,经修饰的细胞包含编码异源目的蛋白的表达构建体。可以将编码异源目的蛋白的此类表达构建体在上述一种或多种遗传修饰之前引入(例如,转化入)亲本地衣芽孢杆菌细胞、在上述一种或多种遗传修饰期间引入(例如,转化入)经修饰的地衣芽孢杆菌(子代)细胞、或在进行上述一种或多种遗传修饰之后引入(例如,转化入)经修饰的地衣芽孢杆菌(子代)。在某些其他实施例中,目的蛋白选自由以下组成的组:乙酰酯酶、氨肽酶、淀粉酶、***糖酶、***呋喃糖苷酶、碳酸酐酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、凝乳酶、角质酶、脱氧核糖核酸酶、差向异构酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡聚糖酶、葡聚糖裂解酶、内切-β-葡聚糖酶、葡糖淀粉酶、葡萄糖氧化酶、α-葡糖苷酶、β-葡糖苷酶、葡萄糖醛酸酶、糖基水解酶、半纤维素酶、己糖氧化酶、水解酶、转化酶、异构酶、漆酶、脂肪酶、裂解酶、甘露糖苷酶、氧化酶、氧化还原酶、果胶酸裂解酶、果胶乙酰酯酶、果胶解聚酶、果胶甲酯酶、果胶分解酶、过水解酶、多元醇氧化酶、过氧化物酶、酚氧化酶、植酸酶、聚半乳糖醛酸酶、蛋白酶、肽酶、鼠李糖-半乳糖醛酸酶、核糖核酸酶、转移酶、转运蛋白质、转谷氨酰胺酶、木聚糖酶和己糖氧化酶。
在另一个实施例中,本公开涉及衍生自亲本地衣芽孢杆菌细胞的经修饰的地衣芽孢杆菌细胞,所述亲本地衣芽孢杆菌细胞包含编码SEQ ID NO:4的RghR2蛋白质的rghR2dup基因,其中所述经修饰的细胞包含编码SEQ ID NO:2的RghR2蛋白质的rghR2rest基因,其中相对于所述未经修饰的亲本细胞,所述经修饰的细胞产生增加的量的目的蛋白。
在某些其他实施例中,本公开涉及衍生自亲本地衣芽孢杆菌细胞的经修饰的地衣芽孢杆菌细胞,所述亲本地衣芽孢杆菌细胞包含编码与SEQ ID NO:4包含90%序列同一性的RghR2蛋白质的rghR2基因,其中所述经修饰的细胞包含引入其中的多核苷酸构建体,所述多核苷酸构建体包含5’启动子区,所述5’启动子区有效地连接到编码与SEQ ID NO:2包含90%序列同一性的RghR2蛋白质的核酸序列,其中相对于所述未经修饰的亲本细胞,所述经修饰的细胞产生增加的量的目的蛋白。在某些实施例中,相对于与SEQ ID NO:2包含90%序列同一性的RghR2蛋白质,与SEQ ID NO:4包含90%序列同一性的RghR2蛋白质作为转录调控蛋白质基本上灭活。在另一个实施例中,包含编码与SEQ ID NO:4包含90%序列同一性的RghR2蛋白质的rghR2基因的亲本细胞包含在rghR2基因中的18核苷酸重复,所述rghR2基因中的18核苷酸重复对应于与SEQ ID NO:4包含90%序列同一性的RghR2蛋白质的氨基酸位置38-43处氨基酸AAAISR的重复。在其他实施例中,经修饰的细胞进一步包含遗传修饰,所述遗传修饰缺失、破坏、灭活或下调编码与SEQ ID NO:4包含90%序列同一性的RghR2蛋白质的内源rghR2基因。在其他实施例中,编码与SEQ ID NO:2包含90%序列同一性的RghR2蛋白质的rghR2基因包含与SEQ ID NO:1具有至少90%序列同一性的核酸序列。在另一个实施例中,经修饰的细胞进一步包含遗传修饰,所述遗传修饰缺失、破坏或下调选自由以下组成的组的至少一个内源地衣芽孢杆菌基因:yvzC、Bli03644、AbrB1和abh(AbrB2)。在某些其他实施例中,包含5’启动子区的多核苷酸构建体包含在载体内,所述5’启动子区有效地连接到编码与SEQ ID NO:包含90%序列同一性的RghR2蛋白质的核酸序列。在某些实施例中,载体是质粒。在某些其他实施例中,将载体整合到地衣芽孢杆菌基因组。在另一个实施例中,在天然rghR2染色体基因座将载体整合到地衣芽孢杆菌基因组中,从而缺失或破坏编码与SEQ ID NO:4包含90%序列同一性的RghR2蛋白质的基因并因此***引入的包含5’启动子区的多核苷酸构建体,所述5’启动子区有效地连接到编码与SEQ ID NO:2包含90%序列同一性的RghR2蛋白质的核酸序列。在其他实施例中,增加量的目的蛋白是异源蛋白质。在另一个实施例中,经修饰的细胞包含编码异源目的蛋白的表达构建体。在某些实施例中,目的蛋白选自由以下组成的组:乙酰酯酶、氨肽酶、淀粉酶、***糖酶、***呋喃糖苷酶、碳酸酐酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、凝乳酶、角质酶、脱氧核糖核酸酶、差向异构酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡聚糖酶、葡聚糖裂解酶、内切-β-葡聚糖酶、葡糖淀粉酶、葡萄糖氧化酶、α-葡糖苷酶、β-葡糖苷酶、葡萄糖醛酸酶、糖基水解酶、半纤维素酶、己糖氧化酶、水解酶、转化酶、异构酶、漆酶、脂肪酶、裂解酶、甘露糖苷酶、氧化酶、氧化还原酶、果胶酸裂解酶、果胶乙酰酯酶、果胶解聚酶、果胶甲酯酶、果胶分解酶、过水解酶、多元醇氧化酶、过氧化物酶、酚氧化酶、植酸酶、聚半乳糖醛酸酶、蛋白酶、肽酶、鼠李糖-半乳糖醛酸酶、核糖核酸酶、转移酶、转运蛋白质、转谷氨酰胺酶、木聚糖酶和己糖氧化酶。在其他实施例中,相对于亲本宿主细胞,目的蛋白的增加量是至少1.0%增加。在另一个实施例中,经修饰的细胞进一步包含表达构建体,所述表达构建体包含等位基因glcT1(SEQID NO:144),所述等位基因glcT1编码变体GlcT蛋白质,所述变体GlcT蛋白质包含在变体GlcT蛋白质的氨基酸位置67处亮氨酸(L)至苯丙氨酸(F)取代。
在其他实施例中,本公开涉及衍生自亲本地衣芽孢杆菌细胞的经修饰的地衣芽孢杆菌细胞,所述经修饰的细胞包含遗传修饰,所述遗传修饰缺失、破坏或下调编码与SEQ IDNO:18包含90%序列同一性的YvzC蛋白质的内源地衣芽孢杆菌yvzC基因,其中相对于未经修饰的亲本细胞,所述经修饰的细胞产生增加的量的目的蛋白。
在其他实施例中,本公开涉及衍生自亲本地衣芽孢杆菌细胞的经修饰的地衣芽孢杆菌细胞,所述经修饰的细胞包含遗传修饰,所述遗传修饰缺失、破坏或下调编码与SEQ IDNO:20包含90%序列同一性的Bli03644蛋白质的内源地衣芽孢杆菌Bli03644基因,其中相对于未经修饰的亲本细胞,所述经修饰的细胞产生增加的量的目的蛋白。
在其他实施例中,本公开涉及衍生自亲本地衣芽孢杆菌细胞的经修饰的地衣芽孢杆菌细胞,所述经修饰的细胞包含遗传修饰,所述遗传修饰缺失、破坏或下调编码与SEQ IDNO:22包含90%序列同一性的AbrB1蛋白质的内源地衣芽孢杆菌AbrB1基因,其中相对于未经修饰的亲本细胞,所述经修饰的细胞产生增加的量的目的蛋白。
在其他实施例中,本公开涉及衍生自亲本地衣芽孢杆菌细胞的经修饰的地衣芽孢杆菌细胞,所述经修饰的细胞包含遗传修饰,所述遗传修饰缺失、破坏或下调编码与SEQ IDNO:24包含90%序列同一性的abh(AbrB2)蛋白质的内源地衣芽孢杆菌abh(AbrB2)基因,其中相对于未经修饰的亲本细胞,所述经修饰的细胞产生增加的量的目的蛋白。
在某些其他实施例中,本公开涉及衍生自亲本地衣芽孢杆菌细胞的经修饰的地衣芽孢杆菌细胞,所述亲本地衣芽孢杆菌细胞包含编码与SEQ ID NO:2包含90%序列同一性的RghR2蛋白质的rghR2基因,其中所述经修饰的细胞包含遗传修饰,所述遗传修饰缺失、破坏或下调选自由以下组成的组的至少一个内源地衣芽孢杆菌基因:yvzC、Bli03644、AbrB1和abh(AbrB2),其中相对于未经修饰的亲本细胞,所述经修饰的细胞产生增加的量的目的蛋白。在某些实施例中,编码与SEQ ID NO:2包含90%序列同一性的RghR2蛋白质的rghR2基因包含与SEQ ID NO:1具有至少90%序列同一性的核酸序列。在另一个实施例中,前述的经修饰的细胞进一步包含表达构建体,所述表达构建体包含等位基因glcT1(SEQ ID NO:144),所述等位基因glcT1编码变体GlcT蛋白质,所述变体GlcT蛋白质包含在变体GlcT蛋白质的氨基酸位置67处亮氨酸(L)至苯丙氨酸(F)取代。
在另一个实施例中,本公开涉及衍生自亲本地衣芽孢杆菌细胞的经修饰的地衣芽孢杆菌细胞,所述亲本地衣芽孢杆菌细胞包含编码与SEQ ID NO:4包含90%序列同一性的RghR2蛋白质的rghR2基因,其中所述经修饰的细胞包含遗传修饰,所述遗传修饰缺失、破坏或下调选自由以下组成的组的至少一个内源地衣芽孢杆菌基因:yvzC、Bli03644、AbrB1和abh(AbrB2),其中相对于未经修饰的亲本细胞,所述经修饰的细胞产生增加的量的目的蛋白。在某些实施例中,编码与SEQ ID NO:4包含90%序列同一性的RghR2蛋白质的rghR2基因包含与SEQ ID NO:3具有至少90%序列同一性的核酸序列。在其他实施例中,相对于与SEQID NO:2包含90%序列同一性的RghR2蛋白质,与SEQ ID NO:4包含90%序列同一性的RghR2蛋白质作为转录调控蛋白质基本上灭活。在其他实施例中,包含编码与SEQ ID NO:4包含90%序列同一性的RghR2蛋白质的rghR2基因的亲本细胞包含在rghR2基因中的18核苷酸重复,所述rghR2基因中的18核苷酸重复对应于与SEQ ID NO:4包含90%序列同一性的RghR2蛋白质的氨基酸位置38-43处氨基酸AAAISR的重复。在某些其他实施例中,目的蛋白的增加的表达是异源目的蛋白。
在某些其他实施例中,本公开涉及用于恢复亲本地衣芽孢杆菌细胞中基本上灭活的RghR2蛋白质的活性的方法,其中所述亲本细胞包含编码基本上灭活的RghR2蛋白质的rghR2基因,所述RghR2蛋白质与SEQ ID NO:4包含90%序列同一性,所述方法包括:(a)获得亲本地衣芽孢杆菌细胞,所述亲本地衣芽孢杆菌细胞包含编码与SEQ ID NO:4包含90%序列同一性的RghR2蛋白质的基因,其中编码与SEQ ID NO:4包含90%序列同一性的RghR2蛋白质的基因包含在rghR2基因中的18核苷酸重复,rghR2基因中的18核苷酸重复对应于SEQID NO:4的RghR2蛋白质的氨基酸位置38-43处氨基酸AAAISR的重复,以及(b)通过缺失rghR2基因中的18核苷酸重复来修饰步骤(a)所述的细胞以产生rghR2rest基因,其中所述rghR2rest基因由此编码与SEQ ID NO:2包含90%序列同一性的活性RghR2蛋白质。在方法的某些实施例中,步骤(b)的经修饰的细胞进一步包含编码异源目的蛋白的引入的多核苷酸表达构建体。在方法的另一个实施例中,步骤(b)的缺失rghR2基因中的18核苷酸重复包含通过选自以下的方法缺失核苷酸重复:同源重组、定向诱变、CRISPR-Cas9基因编辑、TALEN基因编辑、回归内切核酸酶基因编辑和ZFN基因编辑。在某些实施例中,编码与SEQ ID NO:4包含90%序列同一性的RghR2蛋白质的rghR2基因包含与SEQ ID NO:3包含90%序列同一性的核酸序列,其中缺失在SEQ ID NO:3的核苷酸111-129处的18核苷酸重复。在其他实施例中,步骤(b)的经修饰的细胞进一步包含遗传修饰,所述遗传修饰缺失、破坏或下调选自由以下组成的组的至少一个内源地衣芽孢杆菌基因:yvzC、Bli03644、AbrB1和abh(AbrB2)。在方法的某些实施例中,缺失至少一个内源地衣芽孢杆菌基因的遗传修饰是完全基因缺失或部分缺失。在某些实施例中,部分基因缺失包含缺失基因的操纵子、缺失基因的启动子、缺失基因的增强子、缺失基因的5’UTR、缺失基因的起始密码子、缺失基因的编码的核糖体结合位点(RBS)、缺失基因的3’UTR、缺失10%的基因的编码序列、缺失25%的基因的编码序列、缺失50%的基因的编码序列、缺失75%的基因的编码序列、或其任何组合。
在另一个实施例中,本公开涉及用于恢复亲本地衣芽孢杆菌细胞中基本上灭活的RghR2蛋白质的活性的方法,其中所述亲本细胞包含编码基本上灭活的RghR2蛋白质的rghR2基因,所述RghR2蛋白质与SEQ ID NO:4包含90%序列同一性,所述方法包括:(a)获得亲本地衣芽孢杆菌细胞,所述亲本地衣芽孢杆菌细胞包含编码与SEQ ID NO:4包含至少90%序列同一性的RghR2蛋白质的rghR2dup基因,其中编码SEQ ID NO:4的RghR2蛋白质的所述rghR2dup基因包含在rghR2基因中的18核苷酸重复,所述rghR2基因中的18核苷酸重复对应于SEQ ID NO:4的RghR2蛋白质的氨基酸位置38-43处氨基酸AAAISR的重复,(b)通过向步骤(a)所述的亲本细胞中引入多核苷酸构建体来修饰步骤(a)所述的亲本细胞,所述多核苷酸构建体包含5’启动子区,所述5’启动子区有效地连接到编码与SEQ ID NO:2包含90%序列同一性的RghR2蛋白质的rghR2rest核酸序列,以及(c)表达引入步骤(b)所述的经修饰的细胞中的多核苷酸构建体,所述多核苷酸构建体编码与SEQ ID NO:2包含90%序列同一性的活性RghR2蛋白质。在特别的实施例中,经修饰的细胞包含编码异源目的蛋白的引入的多核苷酸表达构建体。在另一个实施例中,经修饰的细胞包含遗传修饰,所述遗传修饰缺失、破坏或下调选自由以下组成的组的至少一个内源地衣芽孢杆菌基因:yvzC、Bli03644、AbrB1和abh(AbrB2)。在另一个实施例中,缺失至少一个内源地衣芽孢杆菌基因的遗传修饰是完全基因缺失或部分缺失。在某些实施例中,部分基因缺失包含缺失基因的操纵子、缺失基因的启动子、缺失基因的增强子、缺失基因的5’UTR、缺失基因的起始密码子、缺失基因的编码的核糖体结合位点(RBS)、缺失基因的3’UTR、缺失10%的基因的编码序列、缺失25%的基因的编码序列、缺失50%的基因的编码序列、缺失75%的基因的编码序列、或其任何组合。
在其他实施例中,本公开涉及用于增加地衣芽孢杆菌细胞中内源目的蛋白的产生的方法,所述方法包括:(a)获得亲本地衣芽孢杆菌细胞,所述亲本地衣芽孢杆菌细胞包含编码与SEQ ID NO:4包含至少90%序列同一性的RghR2蛋白质的基因,其中编码SEQ ID NO:4的RghR2蛋白质的基因包含在rghR2基因中的18核苷酸重复,所述rghR2基因中的18核苷酸重复对应于SEQ ID NO:4的RghR2蛋白质的氨基酸位置38-43处氨基酸AAAISR的重复,(b)通过缺失rghR2基因中的18核苷酸重复来修饰步骤(a)所述的细胞,其中所述rghR2基因由此编码与SEQ ID NO:2包含90%序列同一性的RghR2蛋白质,(c)在适于产生内源蛋白质的培养基中培养步骤(b)所述的经修饰的细胞,以及(d)从培养基或细胞裂解物中回收步骤(c)中产生的内源蛋白质,其中当将步骤(a)所述的细胞与步骤(b)所述的细胞在相同的条件下培养时,相对于步骤(a)中获得的所述亲本地衣芽孢杆菌细胞,步骤(b)所述的经修饰的地衣芽孢杆菌细胞产生增加量的内源蛋白质。在某些实施例中,编码与SEQ ID NO:4包含90%序列同一性的RghR2蛋白质的rghR2基因包含与SEQ ID NO:3包含90%序列同一性的核酸序列,其中缺失在SEQ ID NO:3的核苷酸111-129处的18核苷酸重复。在某些实施例中,缺失至少一个内源地衣芽孢杆菌基因的遗传修饰是完全基因缺失或部分基因缺失。在某些实施例中,部分基因缺失包含缺失基因的操纵子、缺失基因的启动子、缺失基因的增强子、缺失基因的5’UTR、缺失基因的起始密码子、缺失基因的编码的核糖体结合位点(RBS)、缺失基因的3’UTR、缺失10%的基因的编码序列、缺失25%的基因的编码序列、缺失50%的基因的编码序列、缺失75%的基因的编码序列、或其任何组合。
在又其他实施例中,本公开涉及用于增加地衣芽孢杆菌细胞中异源目的蛋白的产生的方法,所述方法包括:(a)获得亲本地衣芽孢杆菌细胞,所述亲本地衣芽孢杆菌细胞包含编码与SEQ ID NO:4包含至少90%序列同一性的RghR2蛋白质的基因,其中编码SEQ IDNO:4的RghR2蛋白质的基因包含在rghR2基因中的18核苷酸重复,所述rghR2基因中的18核苷酸重复对应于SEQ ID NO:4的RghR2蛋白质的氨基酸位置38-43处氨基酸AAAISR的重复,(b)通过缺失rghR2基因中的18核苷酸重复来修饰步骤(a)所述的细胞,其中所述rghR2基因由此编码与SEQ ID NO:2包含90%序列同一性的RghR2蛋白质,(c)向步骤(b)所述的经修饰的地衣芽孢杆菌细胞中引入编码异源蛋白质的表达构建体,(d)在适于产生异源蛋白质的培养基中培养步骤(c)所述的经修饰的细胞,以及(e)从培养基或细胞裂解物中回收步骤(d)中产生的异源蛋白质,其中当将步骤(a)所述的细胞与步骤(b)所述的细胞在相同的条件下培养时,相对于步骤(a)中获得的亲本地衣芽孢杆菌细胞,步骤(b)所述的经修饰的地衣芽孢杆菌细胞产生增加量的异源蛋白质,步骤(a)所述的细胞和步骤(b)所述的经修饰的地衣芽孢杆菌细胞包含编码异源蛋白质的相同的引入的表达构建体。在某些实施例中,编码与SEQ ID NO:4包含90%序列同一性的RghR2蛋白质的rghR2基因包含与SEQ ID NO:3包含90%序列同一性的核酸序列,其中缺失在SEQ ID NO:3的核苷酸111-129处的18核苷酸重复。
在某些其他实施例中,本公开涉及用于恢复亲本地衣芽孢杆菌细胞中基本上灭活的RghR2蛋白质的活性的方法,其中所述亲本细胞包含编码基本上灭活的RghR2蛋白质的rghR2基因,所述RghR2蛋白质与SEQ ID NO:4包含90%序列同一性,所述方法包括:(a)获得亲本地衣芽孢杆菌细胞,所述亲本地衣芽孢杆菌细胞包含编码与SEQ ID NO:4包含至少90%序列同一性的RghR2蛋白质的基因,其中编码SEQ ID NO:4的RghR2蛋白质的基因包含在rghR2基因中的18核苷酸重复,所述rghR2基因中的18核苷酸重复对应于在SEQ ID NO:4的RghR2蛋白质的氨基酸位置38-43处氨基酸AAAISR的重复,以及(b)通过以下修饰步骤(a)的亲本细胞,(i)缺失rghR2基因中的18核苷酸重复、或(ii)通过缺失、破坏、或下调rghR2基因、和(c)缺失、破坏、或下调选自由以下组成的组的至少一个内源地衣芽孢杆菌基因:yvzC、Bli03644、AbrB1和abh(AbrB2),其中相对于未经修饰的亲本细胞,所述经修饰的细胞产生增加的量的目的蛋白。
在其他实施例中,本公开涉及本文公开的方法产生的分离的(经修饰的)地衣芽孢杆菌细胞。
在其他实施例中,本公开涉及用于鉴定包含编码基本上灭活的RghR2蛋白质的变体rghR2基因的地衣芽孢杆菌菌株的方法,所述方法包括:(a)获得地衣芽孢杆菌菌株,并测序本文的rghR2基因,(b)比对和比较测序的rghR2基因与SEQ ID NO:1的天然rghR2基因,其中包含测序的rghR2基因的地衣芽孢杆菌菌株包含编码基本上灭活的RghR2蛋白质的变体rghR2基因,所述测序的rghR2基因在SEQ ID NO:1的rghR2基因的HTH结构域中包含一个或多个核苷酸的***、缺失、取代和/或重复。在某些实施例中,SEQ ID NO:2的天然rghR2蛋白质的HTH结构域包含在SEQ ID NO:2的氨基酸残基5-58内。在另一个实施例中,rghR2基因的HTH结构域中的一个或多个核苷酸的***在SEQ ID NO:1的核苷酸111与112之间。在另一个实施例中,包含编码基本上灭活的RghR2蛋白质的变体rghR2基因的地衣芽孢杆菌菌株包含存在于SEQ ID NO:4的RghR2变体蛋白质中的一个六氨基酸重复。
因此,本公开的某些实施例涉及衍生自亲本地衣芽孢杆菌细胞的经修饰的地衣芽孢杆菌细胞(即,子代细胞),其中所述经修饰的(子代)细胞能够表达/产生增加量的一种或多种目的蛋白,特别是工业相关的蛋白质(酶),如淀粉酶、蛋白酶、脂肪酶、酯酶等。
附图说明
图1显示了地衣芽孢杆菌DSM13菌株的RghR2蛋白质和地衣芽孢杆菌Bra7菌株的RghR2蛋白质的氨基酸序列比对。如图1所示,来自地衣芽孢杆菌分离株Bra7、Bra7衍生的分离株、T5、ATCC-6598、和ATCC-9789的RghR2蛋白质(例如,参见SEQ ID NO:4的全长变体RghR2蛋白质),每个包含氨基酸“Ala-Ala-Ala-Ile-Ser-Arg”的直接重复。例如,如图1所示,来自地衣芽孢杆菌分离株Bra7、Bra7衍生物、T5、ATCC-6598和ATCC-9789的变体RghR2蛋白质(SEQ ID NO:4)包含六(6)氨基酸重复“AAISR”,如以下***:Ala32-Ala33-Ala34-Ile35-Ser36-Arg37-Ala38-Ala39-Ala40-Ile41-Ser42-Arg43(SEQ ID NO:6)。相反,如图1所示,来自地衣芽孢杆菌分离株(如DSM13、ATCC-27811和DSM603)的天然RghR2蛋白质不包含SEQ ID NO:6中示出的重复的“Ala-Ala-Ala-Ile-Ser-Arg”序列(例如,参见SEQ ID NO:2的全长天然RghR2蛋白质)。
图2显示了质粒“pCZ105”,所述质粒包含各种限制性酶位点,其中的是HindIII和NotI,存在pE194温度敏感性复制子(Ts复制子)、卡那霉素编码序列(Kan)、卡那霉素启动子(pKan标记)、核糖体终止子序列(Term rrnB)、β-内酰胺酶(“Bla”)基因和I-Sce位点。
图3显示了工程化的“pCZ105 rghR2”质粒。此质粒包含pE194温度敏感性复制子(Ts复制子)、卡那霉素编码序列(Kan)、卡那霉素启动子(pKan标记)、核糖体终止子序列(Term rrnB)、I-Sce位点、十八个碱基对(18-bp)缺失的rghR2基因和rghR2侧翼区。
图4显示了质粒“pBLComK”的图谱。此质粒包括编码pBR322复制起点的DNA序列、粪肠球菌(Enterococcus faecalis)壮观霉素抗性(Specr)基因pc(也称为aad9)、用于在芽孢杆菌中复制的枯草芽孢杆菌(杆菌(natto))质粒pTA1060 rep基因、地衣芽孢杆菌comK基因(由枯草芽孢杆菌xylA启动子控制的)、和枯草芽孢杆菌xylR基因。
图5显示了条形图,所述条形图代表对照(亲本)地衣芽孢杆菌宿主细胞(即,包含18-bp rghR2重复(rghR2dup)的地衣芽孢杆菌细胞)和地衣芽孢杆菌克隆197(即,包含复原型rghR2基因(rghR2rest)的地衣芽孢杆菌子代细胞的缓释微量滴定板试验(参见,实例2)的结果。更特别地,如图5所示,浅灰色条代表对照的相对光密度(细胞密度),并且黑色条代表相对于对照的异源解凝胶多糖类芽孢杆菌(Peanibacillus curdlanolyticus)变体α-淀粉酶的相对生产滴度。
图6显示了与对照(亲本;rghR2dup)菌株相比,地衣芽孢杆菌rghR2rest菌株(即,子代细胞,克隆197)的特定的相对蛋白质产生(即,解凝胶多糖类芽孢杆菌(P.curdlanolyticus)α-淀粉酶)。
图7显示了相对于(亲本)对照宿主细胞,在包含破坏的BLi03644基因(ΔBLi03644)、破坏的abrB1基因(ΔabrB1)、破坏的yvzC基因(ΔyvzC)或破坏的abh基因(Δabh)的经修饰的地衣芽孢杆菌宿主细胞中表达的解凝胶多糖类芽孢杆菌α-淀粉酶(blackbars)的(蛋白质)产生。这些细胞培养物的OD600在图7中以灰色条表示。
图8显示了DSM13 rghR2基因中编码涉及DNA结合的残基的密码子(以粗体表示)。将在地衣芽孢杆菌菌株Bra7、T5、ATCC-9789和ATCC-6598的rghR2基因中重复的18-bp序列加框,并位于预测编码序列特异性DNA结合位点的区域。
图9显示了包含脂肪酶/酯酶活性的异源EC 3.1.1.3酶的产生。如在图9SDS-PAGE中显示,相对于包含具有18-bp重复的rghR2基因(rghR2dup)的地衣芽孢杆菌细胞,地衣芽孢杆菌rghR2rest细胞中包含脂肪酶/酯酶活性的异源EC 3.1.1.3酶的产生得到改善。
生物学序列简述
SEQ ID NO:1是编码SEQ ID NO:2的天然地衣芽孢杆菌RghR2蛋白质的核酸序列。
SEQ ID NO:2是由SEQ ID NO:1的核酸序列编码的天然地衣芽孢杆菌RghR2蛋白质的氨基酸序列。
SEQ ID NO:3是编码SEQ ID NO:4的变体地衣芽孢杆菌RghR2蛋白质的变体地衣芽孢杆菌核酸序列。更特别地,SEQ ID NO:3的变体核酸序列包含不存在于SEQ ID NO:1的核酸序列中的18碱基对(bp)核苷酸重复。
SEQ ID NO:4是由SEQ ID NO:3的核酸序列编码的变体RghR2蛋白质的氨基酸序列。更特别地,SEQ ID NO:4的变体RghR2蛋白质在氨基酸残基36-41(SEQ ID NO:4的)处包含一个六(6)氨基酸残基重复“Ala-Ala-Ala-Ile-Ser-Arg”,其中SEQ ID NO:2的天然RghR2蛋白质在氨基酸残基36-41处不包含“Ala-Ala-Ala-Ile-Ser-Arg”的六(6)氨基酸残基重复。
SEQ ID NO:5显示了天然地衣芽孢杆菌RghR2蛋白质(即,由SEQ ID NO:1编码的)的氨基酸残基30-35(Ala30-Ala31-Ala32-Ile33-Ser34-Arg35)。
SEQ ID NO:6显示了变体地衣芽孢杆菌RghR2蛋白质(由SEQ ID NO:3编码的)的氨基酸残基30-41(Ala30-Ala31-Ala32-Ile33-Ser34-Arg35-Ala36-Ala37-Ala38-Ile39-Ser40-Arg41),其包含在SEQ ID NO:4中氨基酸位置36-41处的SEQ ID NO:5的重复。因此,SEQ IDNO:3中示出的18-bp核苷酸重复编码Ala-Ala-Ala-Ile-Ser-Arg的6氨基酸重复,所述氨基酸重复在本文中表示为“Ala-Ala-Ala-Ile-Ser-Arg-Ala-Ala-Ala-Ile-Ser-Arg”(如SEQID NO:6中示出的)。
SEQ ID NO:7是引物369的核酸序列。
SEQ ID NO:8是引物378的核酸序列。
SEQ ID NO:9是引物379的核酸序列。
SEQ ID NO:10是引物380的核酸序列。
SEQ ID NO:11是引物381的核酸序列。
SEQ ID NO:12是引物384的核酸序列。
SEQ ID NO:13是引物752的核酸序列。
SEQ ID NO:14是引物753的核酸序列。
SEQ ID NO:15是编码SEQ ID NO:16的天然地衣芽孢杆菌RghR1蛋白质的核酸序列。
SEQ ID NO:16是由SEQ ID NO:15的核酸序列编码的天然地衣芽孢杆菌RghR1蛋白质的氨基酸序列。
SEQ ID NO:17是编码SEQ ID NO:18的地衣芽孢杆菌YvzC蛋白质的核酸序列。
SEQ ID NO:18是由SEQ ID NO:17的核酸序列编码的地衣芽孢杆菌YvzC蛋白质的氨基酸序列。
SEQ ID NO:19是编码SEQ ID NO:20的地衣芽孢杆菌Bli03644蛋白质的核酸序列。
SEQ ID NO:20是由SEQ ID NO:19的核酸序列编码的地衣芽孢杆菌Bli03644蛋白质的氨基酸序列。
SEQ ID NO:21是编码SEQ ID NO:22的地衣芽孢杆菌AbrB1蛋白质的核酸序列。
SEQ ID NO:22是由SEQ ID NO:21的核酸序列编码的地衣芽孢杆菌AbrB1蛋白质的氨基酸序列。
SEQ ID NO:23是编码SEQ ID NO:24的地衣芽孢杆菌Abh(AbrB2)蛋白质的核酸序列。
SEQ ID NO:24是由SEQ ID NO:23的核酸序列编码的地衣芽孢杆菌Abh(AbrB2)蛋白质的氨基酸序列。
SEQ ID NO:25是编码SEQ ID NO:26的地衣芽孢杆菌RpmJ蛋白质的核酸序列。
SEQ ID NO:26是由SEQ ID NO:25的核酸序列编码的地衣芽孢杆菌RpmJ蛋白质的氨基酸序列。
SEQ ID NO:27是编码SEQ ID NO:28的地衣芽孢杆菌RpIM蛋白质的核酸序列。
SEQ ID NO:28是由SEQ ID NO:27的核酸序列编码的地衣芽孢杆菌RpIM蛋白质的氨基酸序列。
SEQ ID NO:29是编码SEQ ID NO:30的地衣芽孢杆菌BLi00412蛋白质的核酸序列。
SEQ ID NO:30是由SEQ ID NO:29的核酸序列编码的地衣芽孢杆菌BLi00412蛋白质的氨基酸序列。
SEQ ID NO:31是编码SEQ ID NO:32的地衣芽孢杆菌RapK蛋白质的核酸序列。
SEQ ID NO:32是由SEQ ID NO:31的核酸序列编码的地衣芽孢杆菌RapK蛋白质的氨基酸序列。
SEQ ID NO:33是编码SEQ ID NO:34的地衣芽孢杆菌PhrK蛋白质的核酸序列。
SEQ ID NO:34是由SEQ ID NO:33的核酸序列编码的地衣芽孢杆菌PhrK蛋白质的氨基酸序列。
SEQ ID NO:35是编码SEQ ID NO:36的地衣芽孢杆菌BLi00753蛋白质的核酸序列。
SEQ ID NO:36是由SEQ ID NO:35的核酸序列编码的地衣芽孢杆菌BLi00753蛋白质的氨基酸序列。
SEQ ID NO:37是编码SEQ ID NO:38的地衣芽孢杆菌YfjT蛋白质的核酸序列。
SEQ ID NO:38是由SEQ ID NO:37的核酸序列编码的地衣芽孢杆菌YfjT蛋白质的氨基酸序列。
SEQ ID NO:39是编码SEQ ID NO:40的地衣芽孢杆菌BLi00828蛋白质的核酸序列。
SEQ ID NO:40是由SEQ ID NO:39的核酸序列编码的地衣芽孢杆菌BLi00828蛋白质的氨基酸序列。
SEQ ID NO:41是编码SEQ ID NO:42的地衣芽孢杆菌YhdX蛋白质的核酸序列。
SEQ ID NO:42是由SEQ ID NO:41的核酸序列编码的地衣芽孢杆菌YhdX蛋白质的氨基酸序列。
SEQ ID NO:43是编码SEQ ID NO:44的地衣芽孢杆菌YhzC蛋白质的核酸序列。
SEQ ID NO:44是由SEQ ID NO:43的核酸序列编码的地衣芽孢杆菌YhzC蛋白质的氨基酸序列。
SEQ ID NO:45是编码SEQ ID NO:46的地衣芽孢杆菌Terf2蛋白质的核酸序列。
SEQ ID NO:46是由SEQ ID NO:45的核酸序列编码的地衣芽孢杆菌Terf2蛋白质的氨基酸序列。
SEQ ID NO:47是编码SEQ ID NO:48的地衣芽孢杆菌ZosA蛋白质的核酸序列。
SEQ ID NO:48是由SEQ ID NO:47的核酸序列编码的地衣芽孢杆菌ZosA蛋白质的氨基酸序列。
SEQ ID NO:49是编码SEQ ID NO:50的地衣芽孢杆菌AbbA蛋白质的核酸序列。
SEQ ID NO:50是由SEQ ID NO:49的核酸序列编码的地衣芽孢杆菌AbbA蛋白质的氨基酸序列。
SEQ ID NO:51是编码SEQ ID NO:52的地衣芽孢杆菌SpeG蛋白质的核酸序列。
SEQ ID NO:52是由SEQ ID NO:51的核酸序列编码的地衣芽孢杆菌SpeG蛋白质的氨基酸序列。
SEQ ID NO:53是编码SEQ ID NO:54的地衣芽孢杆菌YppF蛋白质的核酸序列。
SEQ ID NO:54是由SEQ ID NO:53的核酸序列编码的地衣芽孢杆菌YppF蛋白质的氨基酸序列。
SEQ ID NO:55是编码SEQ ID NO:56的地衣芽孢杆菌BLi02543蛋白质的核酸序列。
SEQ ID NO:56是由SEQ ID NO:55的核酸序列编码的地衣芽孢杆菌BLi02543蛋白质的氨基酸序列。
SEQ ID NO:57是编码SEQ ID NO:58的地衣芽孢杆菌MntR蛋白质的核酸序列。
SEQ ID NO:58是由SEQ ID NO:57的核酸序列编码的地衣芽孢杆菌MntR蛋白质的氨基酸序列。
SEQ ID NO:59是编码SEQ ID NO:60的地衣芽孢杆菌BLi02768蛋白质的核酸序列。
SEQ ID NO:60是由SEQ ID NO:59的核酸序列编码的地衣芽孢杆菌BLi02768蛋白质的氨基酸序列。
SEQ ID NO:61是编码SEQ ID NO:62的地衣芽孢杆菌SspA蛋白质的核酸序列。
SEQ ID NO:62是由SEQ ID NO:61的核酸序列编码的地衣芽孢杆菌SspA蛋白质的氨基酸序列。
SEQ ID NO:63是编码SEQ ID NO:64的地衣芽孢杆菌BLi03127蛋白质的核酸序列。
SEQ ID NO:64是由SEQ ID NO:63的核酸序列编码的地衣芽孢杆菌BLi03127蛋白质的氨基酸序列。
SEQ ID NO:65是编码SEQ ID NO:66的地衣芽孢杆菌BLi03635蛋白质的核酸序列。
SEQ ID NO:66是由SEQ ID NO:65的核酸序列编码的地衣芽孢杆菌BLi03635蛋白质的氨基酸序列。
SEQ ID NO:67是编码SEQ ID NO:68的地衣芽孢杆菌MrgA蛋白质的核酸序列。
SEQ ID NO:68是由SEQ ID NO:67的核酸序列编码的地衣芽孢杆菌MrgA蛋白质的氨基酸序列。
SEQ ID NO:69是编码SEQ ID NO:70的地衣芽孢杆菌Spo0F蛋白质的核酸序列。
SEQ ID NO:70是由SEQ ID NO:69的核酸序列编码的地衣芽孢杆菌Spo0F蛋白质的氨基酸序列。
SEQ ID NO:71是编码SEQ ID NO:72的地衣芽孢杆菌YwjG蛋白质的核酸序列。
SEQ ID NO:72是由SEQ ID NO:71的核酸序列编码的地衣芽孢杆菌YwjG蛋白质的氨基酸序列。
SEQ ID NO:73是编码SEQ ID NO:74的地衣芽孢杆菌YwqI2蛋白质的核酸序列。
SEQ ID NO:74是由SEQ ID NO:73的核酸序列编码的地衣芽孢杆菌YwqI2蛋白质的氨基酸序列。
SEQ ID NO:75是编码SEQ ID NO:76的地衣芽孢杆菌BLi04199蛋白质的核酸序列。
SEQ ID NO:76是由SEQ ID NO:75的核酸序列编码的地衣芽孢杆菌BLi04199蛋白质的氨基酸序列。
SEQ ID NO:77是编码SEQ ID NO:78的地衣芽孢杆菌BLi04200蛋白质的核酸序列。
SEQ ID NO:78是由SEQ ID NO:77的核酸序列编码的地衣芽孢杆菌BLi04200蛋白质的氨基酸序列。
SEQ ID NO:79是编码SEQ ID NO:80的地衣芽孢杆菌LicT蛋白质的核酸序列。
SEQ ID NO:80是由SEQ ID NO:79的核酸序列编码的地衣芽孢杆菌LicT蛋白质的氨基酸序列。
SEQ ID NO:81是编码SEQ ID NO:82的地衣芽孢杆菌BglH蛋白质的核酸序列。
SEQ ID NO:82是由SEQ ID NO:81的核酸序列编码的地衣芽孢杆菌BglH蛋白质的氨基酸序列。
SEQ ID NO:83是编码SEQ ID NO:84的地衣芽孢杆菌BglP蛋白质的核酸序列。
SEQ ID NO:84是由SEQ ID NO:83的核酸序列编码的地衣芽孢杆菌BglP蛋白质的氨基酸序列。
SEQ ID NO:85是编码SEQ ID NO:86的地衣芽孢杆菌ComK蛋白质的核酸序列。
SEQ ID NO:86是由SEQ ID NO:85的核酸序列编码的地衣芽孢杆菌ComK蛋白质的氨基酸序列。
SEQ ID NO:87是地衣芽孢杆菌Bra7菌株18-bp重复的核苷酸序列。
SEQ ID NO:88是化脓链球菌(S.pyogenes)Cas9蛋白质的氨基酸序列。
SEQ ID NO:89是氨基酸球菌属物种(Acidominococcus sp.)Cpf1蛋白质的氨基酸序列。
SEQ ID NO:90是N.gregoryi Ago蛋白质的氨基酸序列。
SEQ ID NO:91是编码SEQ ID NO:88的化脓链球菌Cas9蛋白质的核酸序列。
SEQ ID NO:92是编码SEQ ID NO:88的化脓链球菌Cas9蛋白质的密码子优化的核酸序列。
SEQ ID NO:93是枯草芽孢杆菌aprE启动子的核酸序列。
SEQ ID NO:94是枯草芽孢杆菌xylA启动子的核酸序列。
SEQ ID NO:95是spac启动子核酸序列。
SEQ ID NO:96是Hyper-spank启动子核酸序列。
SEQ ID NO:97是枯草芽孢杆菌veg启动子的核酸序列。
SEQ ID NO:98是枯草芽孢杆菌nprE启动子的核酸序列。
SEQ ID NO:99是T5噬菌体N25启动子的核酸序列。
SEQ ID NO:100是枯草芽孢杆菌groE启动子的核酸序列。
SEQ ID NO:101是枯草芽孢杆菌AraA启动子的核酸序列。
SEQ ID NO:102是枯草芽孢杆菌AraA2启动子的核酸序列。
SEQ ID NO:103是λ噬菌体T0终止子的核酸序列。
SEQ ID NO:104是Cas9表达盒的核酸序列。
SEQ ID NO:105是地衣芽孢杆菌(Bra7)18-bp重复的核酸序列。
SEQ ID NO:106是17-bp VT的核酸序列。
SEQ ID NO:107是18-bp VT的核酸序列。
SEQ ID NO:108是19-bp VT的核酸序列。
SEQ ID NO:109是20-bp VT的核酸序列。
SEQ ID NO:110是编码Cas9核酸内切酶识别结构域的核酸序列。
SEQ ID NO:111是编码靶向18-bp重复的指导RNA(gRNA)的核酸序列。
SEQ ID NO:112是编码gRNA表达盒的核酸序列。
SEQ ID NO:113是位于18-bp重复的5’(上游)的500-bp核酸序列。
SEQ ID NO:114是位于18-bp重复的3’(下游)的500-bp核酸序列。
SEQ ID NO:115是编辑模板核酸序列的rghR2(18-bp重复)。
SEQ ID NO:116是包含rghR2基因的地衣芽孢杆菌(Bra7)核酸序列。
SEQ ID NO:117是针对rghR2基因座的正向引物序列。
SEQ ID NO:118是针对rghR2基因座的反向引物序列。
SEQ ID NO:119是包含编辑的rghR2基因座的核酸序列。
SEQ ID NO:120是rghR2测序引物。
SEQ ID NO:121是地衣芽孢杆菌yvc靶位点1核酸序列。
SEQ ID NO122是地衣芽孢杆菌yvc靶位点2核酸序列。
SEQ ID NO:123是地衣芽孢杆菌yvc靶位点3核酸序列。
SEQ ID NO:124是地衣芽孢杆菌yvc靶位点4核酸序列。
SEQ ID NO:125是地衣芽孢杆菌yvc靶位点5核酸序列。
SEQ ID NO:126是地衣芽孢杆菌yvc靶位点6核酸序列。
SEQ ID NO:127是地衣芽孢杆菌yvc靶位点7核酸序列。
SEQ ID NO:128是地衣芽孢杆菌yvc靶位点8核酸序列。
SEQ ID NO:129是地衣芽孢杆菌yvc靶位点9核酸序列。
SEQ ID NO:130是地衣芽孢杆菌yvc靶位点10核酸序列。
SEQ ID NO:131是地衣芽孢杆菌yvc靶位点11核酸序列。
SEQ ID NO:132是地衣芽孢杆菌yvc靶位点12核酸序列。
SEQ ID NO:133是地衣芽孢杆菌yvc靶位点13核酸序列。
SEQ ID NO:134是地衣芽孢杆菌yvc靶位点14核酸序列。
SEQ ID NO:135是地衣芽孢杆菌yvc靶位点15核酸序列。
SEQ ID NO:136是地衣芽孢杆菌yvc靶位点16核酸序列。
SEQ ID NO:137是地衣芽孢杆菌yvc靶位点17核酸序列。
SEQ ID NO:138是地衣芽孢杆菌yvc靶位点18核酸序列。
SEQ ID NO:139是地衣芽孢杆菌yvc靶位点19核酸序列。
SEQ ID NO:140是包含噬细胞菌属物种(Cytophaga sp.)变体#1α-淀粉酶表达盒的核酸序列。
SEQ ID NO:141是包含嗜热脂肪土芽孢杆菌(Geobacillus stearothermophilus)变体α-淀粉酶表达盒的核酸序列。
SEQ ID NO:142是包含假单胞菌属物种(Pseudomonas sp.)AM1变体α-淀粉酶表达盒的核酸序列。
SEQ ID NO:143是包含噬细胞菌属物种变体#2α-淀粉酶表达盒的核酸序列。
SEQ ID NO:144是包含等位基因glcT1(C199T)的合成的核酸序列。
具体实施方式
本公开总体上涉及用于获得具有增加的蛋白质产生能力的地衣芽孢杆菌细胞/菌株的组合物和方法。本公开的某些实施例涉及衍生自包含变体rghR2基因的亲本地衣芽孢杆菌细胞/菌株的遗传修饰的地衣芽孢杆菌细胞/菌株。因此,本公开的某些其他实施例涉及衍生自亲本地衣芽孢杆菌细胞的经修饰的地衣芽孢杆菌细胞,所述亲本地衣芽孢杆菌细胞包含编码SEQ ID NO:4的RghR2蛋白质的染色体rghR2基因(变体),其中所述经修饰的细胞包含编码SEQ ID NO:2的RghR2蛋白质的rghR2基因的遗传修饰。本公开的某些其他实施例涉及衍生自亲本地衣芽孢杆菌细胞的经修饰的地衣芽孢杆菌细胞,所述亲本地衣芽孢杆菌细胞包含编码与SEQ ID NO:4包含90%序列同一性的RghR2蛋白质的rghR2基因,其中所述经修饰的细胞包含编码与SEQ ID NO:2包含90%序列同一性的RghR2蛋白质的rghR2基因的遗传修饰,其中所述经修饰的宿主细胞产生增加量的目的蛋白(即,相对于未经修饰的亲本细胞)。
在其他实施例中,本公开涉及衍生自亲本地衣芽孢杆菌细胞的经修饰的地衣芽孢杆菌细胞,所述亲本地衣芽孢杆菌细胞包含编码与SEQ ID NO:4包含90%序列同一性的RghR2蛋白质的rghR2基因,其中所述经修饰的细胞包含引入其中的多核苷酸构建体,所述多核苷酸构建体包含5’启动子区,所述5’启动子区有效地连接到编码与SEQ ID NO:2包含90%序列同一性的RghR2蛋白质的核酸序列,其中所述经修饰的细胞产生增加量的目的蛋白(相对于未经修饰的亲本细胞)。
在其他实施例中,本公开涉及衍生自亲本地衣芽孢杆菌细胞的经修饰的地衣芽孢杆菌细胞,所述亲本地衣芽孢杆菌细胞包含编码与SEQ ID NO:2包含90%序列同一性的RghR2蛋白质的rghR2基因,其中所述经修饰的细胞包含遗传修饰,所述遗传修饰缺失、破坏、灭活或下调选自yvzC、Bli03644、AbrB1和abh(AbrB2)的至少一个内源地衣芽孢杆菌基因,其中所述经修饰的细胞产生增加量的目的蛋白(相对于未经修饰的亲本细胞)。
在其他实施例中,本公开涉及衍生自亲本地衣芽孢杆菌细胞的经修饰的地衣芽孢杆菌细胞,所述亲本地衣芽孢杆菌细胞包含编码与SEQ ID NO:4包含90%序列同一性的RghR2蛋白质的rghR2基因,其中所述经修饰的细胞包含遗传修饰,所述遗传修饰缺失、破坏、灭活或下调选自yvzC、Bli03644、AbrB1和abh(AbrB2)的至少一个内源地衣芽孢杆菌基因,其中所述经修饰的细胞产生增加量的目的蛋白(相对于未经修饰的亲本细胞)。
在某些其他实施例中,本公开涉及衍生自亲本地衣芽孢杆菌细胞的经修饰的地衣芽孢杆菌细胞,所述亲本地衣芽孢杆菌细胞包含编码与SEQ ID NO:4包含90%序列同一性的RghR2蛋白质的rghR2基因,其中所述经修饰的细胞包含遗传修饰,所述遗传修饰缺失rghR2基因中的18核苷酸(18-bp)重复。
在其他实施例中,本公开涉及衍生自亲本地衣芽孢杆菌细胞的经修饰的地衣芽孢杆菌细胞,所述亲本地衣芽孢杆菌细胞包含编码与SEQ ID NO:4包含90%序列同一性的RghR2蛋白质的rghR2基因,其中所述经修饰的细胞包含遗传修饰,所述遗传修饰缺失、破坏、灭活或下调rghR2基因。
在其他实施例中,本公开涉及衍生自亲本地衣芽孢杆菌细胞的经修饰的地衣芽孢杆菌细胞,其中所述经修饰的细胞包含遗传修饰,所述遗传修饰缺失、破坏、灭活或下调编码以下蛋白质的至少一个内源地衣芽孢杆菌基因:YvzC蛋白质(SEQ ID NO:18)、BLi03644蛋白质(SEQ ID NO:20)、AbrB1蛋白质(SEQ ID NO:22)和/或Abh(AbrB2)蛋白质(SEQ IDNO:24),其中所述经修饰的细胞产生增加量的目的蛋白(相对于未经修饰的亲本细胞)。
在其他实施例中,衍生自亲本地衣芽孢杆菌细胞的经修饰的地衣芽孢杆菌细胞包含SEQ ID NO:2的复原型rghR2基因和遗传修饰,所述遗传修饰缺失、破坏、灭活或下调编码以下蛋白质的至少一个内源地衣芽孢杆菌基因:YvzC蛋白质(SEQ ID NO:18)、BLi03644蛋白质(SEQ ID NO:20)、AbrB1蛋白质(SEQ ID NO:22)和/或Abh(AbrB2)蛋白质(SEQ ID NO:24),其中所述经修饰的细胞产生增加量的目的蛋白(相对于未经修饰的亲本细胞)。
在某些其他实施例中,衍生自亲本地衣芽孢杆菌细胞的经修饰的地衣芽孢杆菌细胞包含rghR2rest基因和核酸构建体(SEQ ID NO:143),所述核酸构建体包含等位基因glcT1(C199T),编码变体GlcT(转录抗终止)蛋白质,所述变体蛋白质在变体GlcT蛋白质的氨基酸位置67处包含亮氨酸(L)至苯丙氨酸(F)的取代(L67F)。
本公开的其他实施例涉及用于恢复亲本地衣芽孢杆菌细胞中灭活RghR2蛋白质的活性的方法。本公开的某些其他实施例涉及用于增加经修饰的地衣芽孢杆菌细胞中目的蛋白的产生的组合物和方法。在其他实施例中,本公开涉及通过本公开的方法修饰和产生的分离的地衣芽孢杆菌(子代)细胞。
I.定义
鉴于本公开的经修饰的地衣芽孢杆菌细胞及本文所述的其方法,定义了以下术语和短语。在此未定义的术语应当符合本领域中所使用的常规含义。
除非另有定义,本文使用的所有技术和科学术语具有与本发明组合物和方法所属领域的普通技术人员通常理解的相同含义。虽然类似于或等同于本文描述的那些的任何方法和材料也可以用于本发明组合物和方法的实践或测试中,但现在将对代表性示例方法和材料进行描述。在本文中引用的所有公开物和专利均通过引用以其整体结合在此。
进一步注意的是,权利要求书可以撰写以排除任何可选择的要素。因此,此陈述旨在作为使用与权利要求要素的叙述有关的排他性术语如“单独”、“仅”、“排除”、“不包括”等或使用“否定型”限定的前提基础(或其条件是)。
如将对于本领域技术人员显而易见的是,在阅读本公开时,本文描述和展示的单独实施例中的每一个具有离散的组分和特征,这些组分和特征可以在不偏离本文所述的本发明组合物和方法的范围或精神的情况下容易地与任何其他若干个实施例的任何一个的特征分离或组合。可以按照所叙述的事件的顺序或按照逻辑上可行的任何其他顺序来进行任何叙述的方法。
如本文所使用的,“天然地衣芽孢杆菌染色体rghR2基因”包含编码SEQ ID NO:2的RghR2蛋白质的核苷酸序列(例如,参见表1和图1)。
如本文所使用的,“变体-18-BP”地衣芽孢杆菌染色体rghR2基因包含编码SEQ IDNO:4的变体RghR2蛋白质的核苷酸序列(例如,参见表1和图1)。
如本文所使用的,包含编码SEQ ID NO:4的变体RghR2蛋白质的核苷酸序列的“变体-18-BP地衣芽孢杆菌染色体rghR2基因”可以缩写为“rghR2dup”,并且其变体RghR2蛋白质(包含六氨基酸重复“AAASIR”)可以缩写为“RghR2dup”。
如本文所使用的,“变体地衣芽孢杆菌染色体rghR2基因”包括编码变体RghR2蛋白质的任何地衣芽孢杆菌染色体rghR2基因,所述变体RghR2蛋白质在编码的RghR2蛋白质的螺旋-转角-螺旋(HTH)结构域中包含一个或多个核苷酸***、一个或多个核苷酸缺失、一个或多个核苷酸重复和/或一个或多个核苷酸取代,编码的RghR2蛋白质的HTH结构域中的所述一个或多个核苷酸***、核苷酸缺失、核苷酸重复和/或核苷酸取代使作为转录调控蛋白质的RghR2蛋白质基本上灭活。
如本文所定义的,SEQ ID NO:2的天然地衣芽孢杆菌RghR2蛋白质的“HTH结构域”包含在SEQ ID NO:2的氨基残基5-58内。
例如,在某些实施例中,本领域技术人员可以容易地筛选/测序针对SEQ ID NO:1的天然rghR2基因序列的rghR2基因,并且鉴定编码变体RghR2蛋白质的“变体地衣芽孢杆菌染色体rghR2基因”序列,所述变体RghR2蛋白质在编码的RghR2蛋白质的HTH结构域中包含突变(例如,核苷酸***、缺失、取代、重复等)。
因此,在某些实施例中,本公开涉及包含“变体地衣芽孢杆菌染色体rghR2基因”序列(即,编码在HTH结构域中包含突变的变体RghR2蛋白质)的亲本地衣芽孢杆菌细胞。在其他实施例中,本公开涉及衍生自亲本细胞地衣芽孢杆菌的经修饰的地衣芽孢杆菌细胞,所述经修饰的地衣芽孢杆菌细胞包含“变体地衣芽孢杆菌染色体rghR2基因”序列(即,编码在HTH结构域中包含突变的变体RghR2蛋白质),其中所述经修饰的细胞包含编码SEQ ID NO:2的天然RghR2蛋白质的复原型rghR2基因。
如本文所使用的,经修饰的地衣芽孢杆菌细胞衍生自亲本地衣芽孢杆菌细胞,所述经修饰的地衣芽孢杆菌细胞包含(i)“变体-18-BP地衣芽孢杆菌染色体rghR2基因”(SEQID NO:3)或(ii)“变体地衣芽孢杆菌染色体rghR2基因”(即,编码的RghR2蛋白质的HTH结构域中包含突变,所述HTH结构域包含在SEQ ID NO:2的氨基残基5-58中),其中经修饰的地衣芽孢杆菌细胞包含编码SEQ ID NO:2的天然RghR2蛋白质的复原型rghR2基因,“经修饰的细胞中的复原型rghR2基因”本文中可以缩写为“rghR2rest”并且其编码的天然蛋白质可以缩写为“RghR2rest”。
表1
RghR2天然和RghR2dup蛋白质序列
更特别地,如以上在表1中所示,本公开的“变体-18-BP地衣芽孢杆菌染色体rghR2基因”(SEQ ID NO:3)包含编码六(6)氨基酸的连续重复的18核苷酸(18-bp)重复,所述六氨基酸是“Ala-Ala-Ala-Ile-Ser-Arg”(下文中“AAAISR”),其中编码的变体RghR2蛋白质的一级(1°)氨基酸序列如SEQ ID NO:4所示(参见,参见表1和图1),包含如以下的这些六(6)氨基酸的线性(连续的)重复:“Ala-Ala-Ala-Ile-Ser-Arg-Ala-Ala-Ala-Ile-Ser-Arg”;下文中,“AAAISRAAAISR”(SEQ ID NO:6)。例如,RghR2dup蛋白质(SEQ ID NO:4)中存在的六氨基酸重复示于表1中,其中这140个氨基酸蛋白质的重复的氨基酸残基包含SEQ ID NO:4的位置A38至R43处的粗体文本氨基酸。
相反,本公开的“天然地衣芽孢杆菌染色体rghR2基因”(SEQ ID NO:1)不包含这一18核苷酸(18-bp)重复。因此,天然rghR2基因编码SEQ ID NO:2的天然RghR2蛋白质(其不包含连续重复“AAAISR”,如SEQ ID NO:6中所示)。例如,编码的天然RghR2蛋白质的一级(1°)氨基酸序列在表1中示出,其中“AAAISR”的六氨基酸重复不存在于此134个氨基酸蛋白质的位置38-43(SEQ ID NO:2)处。
如本文所定义的,地衣芽孢杆菌菌株Bra7(或Bra7菌株)是使用经典遗传学改善方法从野生型地衣芽孢杆菌亲本菌株发展/衍生的地衣芽孢杆菌宿主细胞。尽管本公开的某些实施例和说明涉及地衣芽孢杆菌菌株Bra7,但是本公开的组合物和方法不限于特定的芽孢杆菌属物种,或者本公开的组合物和方法不限于地衣芽孢杆菌宿主细胞的特定的菌株。
如本文所使用的,“菌株Bra7的地衣芽孢杆菌衍生物”特别地是指衍生自亲本地衣芽孢杆菌Bra7(菌株)宿主细胞的地衣芽孢杆菌(子代)细胞。更特别地,如本文所使用的,“菌株Bra7的地衣芽孢杆菌衍生物”是衍生自地衣芽孢杆菌菌株Bra7亲本的地衣芽孢杆菌宿主细胞,如国际PCT公开号WO 2008/024372中所述,所述地衣芽孢杆菌菌株Bra7亲本包含五个(5)基因缺失(Δcat、ΔamyL、Δspo、ΔaprL、ΔendoGluC)。
如本文所使用的,PCT公开号WO 2014/164834中公开了异源解凝胶多糖类芽孢杆菌变体α-淀粉酶(例如,参见,实例2和4),任选地本文中缩写为“PcuAmyl-v6”。
如本文所使用的,噬细胞菌属物种变体α-淀粉酶在本文中称为“噬细胞菌属物种α-淀粉酶变体#1”(例如参见,实例5),并且“噬细胞菌属物种α-淀粉酶变体#2”(例如参见,实例11和12)公开在国际PCT公开号WO 2014/164777;WO 2012/164800和WO 2014/164834中。
如本文所使用的,“变体嗜热脂肪土芽孢杆菌淀粉酶”(例如参见,实例5)是国际PCT公开号WO 2009/149130中公开的变体嗜热脂肪土芽孢杆菌(G.stearothermophilus)α-淀粉酶。
如本文所使用的,在本文中称为碱性α-淀粉酶“变体1”、碱性α-淀粉酶“变体2”、碱性α-淀粉酶“变体3”和碱性α-淀粉酶“变体4”的“变体碱性α-淀粉酶”(例如参见,实例9)是衍生自芽孢杆菌属物种(Bacillus sp.)号707的包含其改善的碱性性能/稳定性的变体α-淀粉酶,通常在国际PCT公开号WO 2008/153805和美国专利公开号US2014/0057324中公开。
如本文所使用的,假单胞菌属物种AM1(例如参见,实例8)的“G4淀粉酶(变体)”在国际PCT公开号WO 2010/133644中公开。
如本文所使用的,异源DNA/核酸序列“编码包含脂肪酶/酯酶活性的酶”(例如参见,实例10),此类DNA/核酸序列编码包含脂肪酶/酯酶活性的酶学委员会编号“EC3.1.1.3”酶”。
如本文所使用的,包含等位基因glcT1的地衣芽孢杆菌(子代)细胞(例如参见,实例12)(等位基因glcT1编码在变体GlcT蛋白质的氨基酸位置67处包含苯丙氨酸(F)(F67)的变体GlcT(转录抗终止)蛋白质)如于2018年1月03日提交的美国临时专利申请序列号US62/613,339中所述。
因此,在某些实施例中,“天然地衣芽孢杆菌染色体rghR2基因”包含编码与SEQ IDNO:2包含至少90%序列同一性的RghR2蛋白质的核苷酸序列。在其他实施例中,“天然地衣芽孢杆菌染色体rghR2基因”包含编码与SEQ ID NO:2包含至少90%序列同一性的RghR2蛋白质的核苷酸序列,其条件是与SEQ ID NO:2包含90%序列同一性的RghR2蛋白质作为地衣芽孢杆菌细胞中的转录调控蛋白质有活性。在某些其他实施例中,“天然地衣芽孢杆菌染色体rghR2基因”包含编码与SEQ ID NO:2包含至少90%序列同一性的RghR2蛋白质的核苷酸序列,其条件是与SEQ ID NO:2包含90%序列同一性的RghR2蛋白质不包含如SEQ ID NO:6中示出的氨基酸AAAISR的重复。
在某些实施例中,rghR2dup基因包含编码SEQ ID NO:4的RghR2蛋白质的核苷酸序列。在某些实施例中,rghR2dup基因包含编码与SEQ ID NO:4包含至少90%序列同一性的RghR2蛋白质的核苷酸序列。在某些实施例中,rghR2dup基因包含编码与SEQ ID NO:4包含至少90%序列同一性的RghR2蛋白质的核苷酸序列,其条件是与SEQ ID NO:4包含90%序列同一性的RghR2蛋白质作为地衣芽孢杆菌细胞中的转录调控蛋白质是基本上灭活的。在某些其他实施例中,rghR2dup基因包含编码与SEQ ID NO:4包含至少90%序列同一性的RghR2蛋白质的核苷酸序列,其条件是与SEQ ID NO:4包含90%序列同一性的RghR2蛋白质包含如SEQ ID NO:6中示出的氨基酸AAAISR的重复。
在其他实施例中,本公开的变体rghR2基因包含任何地衣芽孢杆菌rghR2基因(所述任何地衣芽孢杆菌rghR2基因在SEQ ID NO:1的核苷酸位置111与112之间的天然rghR2基因的核酸序列中包含至少一个、两个、三个、四个、五个、十个、十八个、二十个等核苷酸***、缺失、复制等),从而将天然rghR2基因转化变体rghR2基因(包含***天然rghR2基因的核酸序列中的至少一个、两个、三个、四个、五个、十个、十八个、二十个等核苷酸)。
因此,在其他实施例中,基本上灭活的RghR2蛋白质进一步包括变体RghR2蛋白质,所述变体RghR2蛋白质在RghR2蛋白质的氨基酸残基37与38之间包含至少一个、两个、三个、四个、五个、六个、七个等氨基酸***(即,参考SEQ ID NO:2的活性RghR2蛋白质序列),其中此类氨基酸***(即,残基37与38之间)使得RghR2蛋白质作为转录调控蛋白质基本上灭活。
因此,在某些实施例中,由变体rghR2基因编码的变体RghR2蛋白质在地衣芽孢杆菌细胞中基本上“作为转录调控蛋白质灭活”。
如本文所定义的,“SEQ ID NO:4的RghR2dup蛋白质,包含氨基酸AAAISR的6氨基酸重复”在地衣芽孢杆菌细胞中是基本上“作为转录调控蛋白质灭活”。
如本文所定义的,相对于SEQ ID NO:2的天然RghR2蛋白质,SEQ ID NO:2的编码的RghR2的“编码包含在HTH结构域中的突变的变体rghR2蛋白质的变体rghR2基因”在地衣芽孢杆菌细胞中基本上“作为转录调控蛋白质灭活”。
在某些实施例中,编码变体RghR2蛋白质(基本上“作为转录调控蛋白质灭活”)的rghR2基因通过在本领域技术人员已知的DNA结合测定中筛选变体RghR2蛋白质(相对于天然RghR2蛋白质;SEQ ID NO:2)确定。
例如,本文预期RghR2蛋白质(包含上文示出的HTH结构域的转录调控蛋白质)必须与DNA充分结合以发挥其转录调控活性。因此,通过比较天然RghR2蛋白质相对于一个或多个变体RghR2蛋白质(即,包含突变的HTH结构域)的DNA结合亲和力,变体RghR2蛋白质相对于天然RghR2蛋白质的减少的DNA结合亲和力作为此类变体RghR2蛋白质(其是基本上“作为转录调控蛋白质灭活”)的推论。例如,如本文所考虑的,相对于作为转录调控蛋白质是基本上活性的天然RghR2蛋白质,具有显着减少的DNA结合亲和力(或完全损失DNA结合)的变体RghR2蛋白质(即包含突变的HTH结构域)将具有显著减少的(或完全损失)转录调控蛋白质活性。
因此,在某些实施例中,本公开的变体rghR2基因包括任何地衣芽孢杆菌rghR2基因变体,所述地衣芽孢杆菌rghR2基因变体包含在rghR2基因的这些(DNA结合)区中的核苷酸的***、重复、缺失、非同义取代等,如图8所示。例如,本公开的图8显示了预测编码涉及DNA结合的RghR2蛋白质中的氨基酸残基的某些rghR2密码子(即,图8中的粗体文本核苷酸)。因此,在某些实施例中,本公开的变体rghR2基因是变体rghR2基因,所述变体rghR2基因包含rghR2基因的这些(DNA结合)区中的一个或多个核苷酸的***、重复、缺失、非同义取代等。更特别地,在某些实施例中,包含rghR2基因的DNA结合区中的核苷酸的***、重复、缺失、非同义取代等的变体rghR2基因编码基本上灭活的RghR2蛋白质。
短语基本上“作为转录调控蛋白质灭活”的RghR2蛋白质包括由变体rghR2基因编码的变体RghR2蛋白质,所述变体rghR2基因包含rghR2基因的这些(DNA结合)区中的一个或多个核苷酸的***、重复、缺失、非同义取代(等),其中编码的变体蛋白质作为转录调控蛋白质是基本上灭活的。
如本文所使用的,术语“等同位置”意指在与SEQ ID NO:4的RghR2多肽序列比对后的氨基酸残基位置,特别是从SEQ ID NO:4的氨基酸残基32至43。以上对于SEQ ID NO:4(即,SEQ ID NO:4的残基32至43)描述的十二个(12)连续氨基酸残基(即,等同位置)存在于SEQ ID NO:6的氨基酸序列中(“AAAISRAAAISR)。因此,在某些实施例中,可以通过将编码的RghR2蛋白质的氨基酸序列SEQ ID NO:6中示出的与重复氨基酸序列的等同位置进行比较来鉴定编码本公开的变体RghR2蛋白质的基因或ORF,其中SEQ ID NO:6重复序列的存在表明本公开的变体RghR2蛋白质。
术语“修饰”和“遗传修饰”互换地使用,并包括:(a)引入、取代、或去除基因(或其ORF)中的一个或多个核苷酸,或者引入、取代、或去除基因或其ORF的转录或翻译所需要的调控元件中的一个或多个核苷酸,(b)基因破坏,(c)基因转换,(d)基因缺失,(e)下调基因,(f)特异性诱变,和/或(g)随机诱变本文公开的任何一个或多个基因。例如,如本文所使用的遗传修饰包括但不限于选自由以下组成的组的一个或多个基因的修饰:rghR2、rghR1、abrB1、rpmJ、rpIM、BLi00412、rapK、phrK、BLi00753、yfjT、BLi00828、yhdX、yhzC、terf2、zosA、abbA、speG、yppF、BLi02543、mntR、BLi02768、sspA、BLi03127、BLi03635、mrgA、BLi03644、yvzC、spo0F、ywjG、ywq12、BLi04199、BLi04200、licT、bglH和bglP。
如本文所使用的,“基因的破坏”、“基因破坏”、“基因的灭活”和“基因灭活”互换地使用,并且广泛地是指基本上防止宿主细胞产生功能性基因产物的任何遗传修饰(例如,蛋白质)。基因破坏的示例性方法包括基因的任何部分的完全或部分(包括多肽编码序列、启动子、增强子或另外的调控元件)缺失、或其诱变,其中诱变涵盖取代、***、缺失、倒位、及其任何组合和变化,所述诱变破坏/灭活一个活多个靶基因并基本上减少或阻止功能基因产物(即蛋白质)的产生。
如本文所使用的,术语基因表达的“下调”和基因表达的“上调”包括导致基因的较低(下调)或较高(上调)表达的任何方法。例如,基因的下调可以通过RNA诱导的基因沉默、控制元件(如启动子、核糖体结合位点(RBS)/夏因-达尔加诺(Shine-Dalgarno)序列、非翻译区(UTR))的基因修饰、密码子变化等来实现。
如本文所使用的,短语“缺失18核苷酸重复”、或“缺失18-bp重复”或“通过缺失18核苷酸重复来修饰细胞”特别是指包含含有18核苷酸重复的变体rghR2基因(rghR2dup)的亲本芽孢杆菌属细胞的遗传修饰,其重复编码在变体RghR2蛋白质(RghR2dup;例如,参见SEQID NO:4,其中SEQ ID NO:4的位置32-37处的氨基酸“AAAISR”在SEQ ID NO:4的位置38-43处连续重复)中氨基酸“AAAISR”(SEQ ID NO:6)的重复。
因此,在某些实施例中,本公开的经修饰的芽孢杆菌属细胞衍生自亲本芽孢杆菌属细胞,所述亲本芽孢杆菌属细胞包含变体染色体rghR2基因(例如,rghR2dup;SEQ ID NO:3),所述变体染色体rghR2基因包含编码SEQ ID NO:6的“AAAISR”重复的序列的18核苷酸重复,其中所述经修饰的芽孢杆菌属细胞是通过“缺失18核苷酸重复”来修饰的,从而生成包含编码天然rghR2蛋白质的“恢复的”rghR2基因序列(rghR2rest;SEQ ID NO:1)的经修饰的芽孢杆菌属细胞。用于缺失亲本芽孢杆菌属细胞中18核苷酸重复的方法包括但不限于同源重组、CRSIPR-Cas9基因编辑、大范围核酸酶基因编辑、TALEN基因编辑、锌指核酸酶(ZFN)编辑等,这些方法进一步描述在以下部分IV中。因此,在某些实施例中,本公开涉及包含“恢复的”rghR2基因”的经修饰的芽孢杆菌属细胞。
如本文所使用的,“宿主细胞”是指具有作为新引入的DNA的宿主或表达载体的能力的细胞。在本公开的某些实施例中,宿主细胞是芽孢杆菌属物种或大肠杆菌(E.coli)细胞。
如本文所定义的,“亲本细胞”、“亲本宿主细胞”或“亲本地衣芽孢杆菌(宿主)细胞”可以互换地使用,并且是指“未经修饰的”亲本地衣芽孢杆菌细胞。例如,“亲本”细胞是指其中“亲本”细胞的基因组被改变(例如,经由引入亲本细胞中的一个或多个突变)以产生修饰的“子代”细胞的微生物的任何细胞或菌株。
如本文所定义的,“经修饰的细胞”、“经修饰的宿主细胞”或“经修饰的地衣芽孢杆菌(宿主)细胞”可以互换地使用并且是指包含至少一个遗传修饰的重组地衣芽孢杆菌(宿主)细胞,所述遗传修饰不存在于衍生出经修饰的地衣芽孢杆菌(子代)细胞的“亲本”地衣芽孢杆菌宿主细胞中。例如,在某些实施例中,本公开的“亲本地衣芽孢杆菌(宿主)细胞”包含SEQ ID NO:3的染色体rghR2基因(rghR2dup),所述染色体rghR2基因编码SEQ ID NO:4的变体RghR2蛋白质,并且本公开的“经修饰的”地衣芽孢杆菌宿主细胞(即,衍生自包含SEQID NO:3的染色体rghR2基因的亲本地衣芽孢杆菌宿主细胞)包含遗传修饰,所述遗传修饰缺失SEQ ID NO:3中的18核苷酸重复,从而生成包含天然rghR2基因(rghR2rest)的经修饰的(恢复的)地衣芽孢杆菌宿主细胞,所述天然rghR2基因编码SEQ ID NO:2的天然RghR2蛋白质。
在某些实施例中,“未经修饰的”地衣芽孢杆菌(亲本)细胞可以被称为“对照细胞”,特别是当与“经修饰的”的地衣芽孢杆菌(子代)细胞进行比较或相对于“经修饰的”的地衣芽孢杆菌(子代)细胞时。如本文所使用的,当将“未经修饰的”(亲本)细胞(即,对照细胞)中的目的蛋白(POI)的表达和/或产生与“经修饰的”(子代)细胞中的相同POI的表达和/产生相比较时,应该理解的是,在相同的条件下(例如,相同的条件如培养基、温度、pH等)生长/培养/发酵“经修饰的”和“未经修饰的”细胞。
如本文所使用的,“芽孢杆菌属”包括如本领域技术人员已知的“芽孢杆菌”属内的所有物种,包括但不限于:枯草芽孢杆菌、地衣芽孢杆菌、迟缓芽孢杆菌(B.lentus)、短芽孢杆菌(B.brevis)、嗜热脂肪芽孢杆菌(B.stearothermophilus)、嗜碱芽孢杆菌(B.alkalophilus)、解淀粉芽孢杆菌、克劳氏芽孢杆菌(B.clausii)、耐盐芽孢杆菌(B.halodurans)、巨大芽孢杆菌(B.megaterium)、凝结芽孢杆菌(B.coagulans)、环状芽孢杆菌(B.circulans)、灿烂芽孢杆菌(B.lautus)和苏云金芽孢杆菌(B.thuringiensis)。应认识到,芽孢杆菌属不断进行分类学重组。因此,该属旨在包括已重新分类的物种,包括但不限于:例如嗜热脂肪芽孢杆菌(现在称为“嗜热脂肪土芽孢杆菌”)的生物体。
如本文所定义的,术语“增加的表达”,“增强的表达”、“增加的POI表达”、“增加的产生”、“增加的POI产生”等是指“经修饰的”地衣芽孢杆菌(子代)细胞,其中“增加”总是相对(相对比)于表达/产生相同的POI的“未经修饰的”地衣芽孢杆菌(亲本)细胞而言的。
如本文所使用的,术语“表达”是指源自本公开的核酸分子的正义(mRNA)或反义RNA的转录和稳定积累。表达也可指将mRNA翻译成多肽。因此,术语“表达”包括涉及“多肽的生产”的任何步骤,这些步骤包括但不限于转录、转录后修饰、翻译、翻译后修饰、分泌等。
如本文所定义的,组合术语“表达/产生”(如在短语如“相对于(未经修饰的)亲本宿主细胞,经修饰的宿主细胞表达/产生增加量的目的蛋白”中使用的),术语(“表达/产生”)意指包括涉及在本公开的宿主细胞中表达和产生目的蛋白的任何步骤。
同样地,如本文所使用的,当在短语如“相对于(未经修饰的)亲本宿主细胞,经修饰的宿主细胞’表达/产生增加的量’的一种或多种目的蛋白”中使用时,“增加的量”特别是指在经修饰的宿主细胞中表达/产生的任何“增加的量”目的蛋白(POI),所述“增加的量”总是相对于表达/产生相同的POI的(未经修饰的)亲本地衣芽孢杆菌细胞,其中经修饰的和未经修饰的细胞在相同的条件(例如,相同的条件,如培养基、温度、pH等)下生长/培养/发酵。例如,增加量的POI可以是在本公开的经修饰的地衣芽孢杆菌细胞中表达的内源地衣芽孢杆菌POI或异源POI。
因此,如本文所使用的,“增加”蛋白质产生或“增加的”蛋白质产生意指产生的蛋白质(例如,目的蛋白)的量增加。蛋白质可以在宿主细胞内产生,或分泌(或转运)到培养基中。在某些实施例中,目的蛋白被产生(分泌)到培养基中。如与亲本宿主细胞相比,增加的蛋白质产生可以被检测为蛋白质或酶活性(例如像蛋白酶活性、淀粉酶活性、纤维素酶活性、半纤维素酶活性等)、或产生的总的细胞外蛋白质的更高的最大水平。
如本文所使用的,“核酸”是指核苷酸或多核苷酸序列、及其片段或部分,以及可能是双链或单链的基因组或合成来源的DNA、cDNA、和RNA,无论其代表正义或反义链。应该理解,由于遗传密码的简并性,许多核苷酸序列可以编码给定的蛋白质。
应该理解本文所述的多核苷酸(或核酸分子)包括“基因”、“载体”或“质粒”。
因此,术语“基因”是指编码氨基酸具体序列的多核苷酸,其包括所有或部分蛋白质编码序列,并且可以包括调控(非转录的)DNA序列,如启动子序列,该启动子序列决定例如基因在其下表达的条件。基因的转录区可以包括非翻译区(UTR)(所述非翻译区包括内含子、5’-非翻译区(UTR)、和3’-UTR),以及编码序列。
如本文所使用的,术语“编码序列”是指直接确定其(编码的)蛋白质产物氨基酸序列的核苷酸序列。编码序列的边界一般由通常以ATG起始密码子开始的可读框(在下文中称为“ORF”)确定的。编码序列通常包括DNA、cDNA和重组核苷酸序列。
如本文所定义的,术语“可读框”(下文称为“ORF”)意指包含不间断阅读框的核酸或核酸序列(无论是天然存在的、非天然存在的、或合成的),不间断阅读框由以下组成:(i)起始密码子,(ii)一系列代表氨基酸的两(2)个或更多个密码子,和(iii)终止密码子,该ORF以5’至3’方向阅读(或翻译)。
如本文所使用的术语“启动子”是指能够控制编码序列或功能性RNA表达的核酸序列。通常,编码序列位于启动子序列3’(下游)。启动子能以其整体来自天然基因,或者由来自自然界中发现的不同启动子的不同元件构成,或甚至包含合成的核酸区段。本领域技术人员应该理解,不同启动子可以在不同细胞类型中、或在不同发育阶段、或响应于不同环境条件或生理条件来指导基因表达。引起基因在大多数细胞类型中表达的启动子大多数时候通常被称为“组成型启动子”。进一步认识到,由于在大多数情况下还不能完全确定调控序列的确切边界,不同长度的DNA片段可具有相同的启动子活性。
如本文所使用的术语“有效地连接”是指核酸序列在单个核酸片段上的缔合,这样使得一个核酸片段的功能受到另一个影响。例如,当能够实现该编码序列的表达(即编码序列在启动子的转录控制下)时,启动子与该编码序列(例如ORF)有效地连接。编码序列可以在正义或反义方向上有效地连接到调控序列上。
当核酸置于与另一个核酸序列的功能关系时,所述核酸与另一个核酸序列“有效地连接”。例如,如果编码分泌性前导子(即信号肽)的DNA表达为参与多肽分泌的前蛋白质,那么所述编码分泌性前导子的DNA有效地连接到所述多肽的DNA;如果启动子或增强子影响编码序列的转录,那么所述启动子或增强子有效地连接到所述序列;或者如果核糖体结合位点被定位以便促进翻译,那么所述核糖体结合位点有效地连接到编码序列。通常,“有效地连接”意指被连接的DNA序列是连续的,并且在分泌性前导子的情况下,是连续的并且处于阅读相中。然而,增强子不必需是连续的。通过在方便的限制位点处连接来实现连接。如果这样的位点不存在,则按照常规实践使用这些合成的寡核苷酸衔接子或接头。
如本文所使用的,“控制与目的基因的蛋白质编码序列连接的目的基因(或其可读框)的表达的功能性启动子序列”是指控制芽孢杆菌属中编码序列的转录和翻译的启动子序列。例如,在某些实施例中,本公开涉及包含5’启动子(或5’启动子区、或串联5’启动子等)的多核苷酸,其中启动子区有效地连接到编码SEQ ID NO:2的RghR2蛋白质的核酸序列。因此,在某些实施例中,功能性启动子序列控制编码SEQ ID NO:2的RghR2蛋白质的rghR2基因的表达。在其他实施例中,功能性启动子序列控制编码目的蛋白的异源基因(或内源基因)在芽孢杆菌属细胞(更特别是地衣芽孢杆菌宿主细胞)中的表达。
如本文所定义的,“适合的调控序列”是指位于编码序列的上游(5’非编码序列)、内部或下游(3’非编码序列),并且影响相关编码序列的转录、RNA加工或稳定性、或者翻译的核苷酸序列。调控序列可以包括启动子、翻译前导序列、RNA加工位点、效应子结合位点和茎环结构。
如本文所定义的,术语“引入”,如短语中所使用的,如“向细菌细胞中引入”或“向地衣芽孢杆菌中引入”至少一种多核苷酸可读框(ORF)、或其基因、或其载体,包括本领域已知用于将多核苷酸引入细胞的方法,这些方法包括但不限于原生质体融合、自然或人工转化(例如,氯化钙、电穿孔)、转导、转染、缀合等(例如,参见Ferrari等人,1989)。
如本文所使用的,“转化的”或“转化”意指已经通过使用重组DNA技术转化的细胞。转化典型地通过将一个或多个核苷酸序列(例如,多核苷酸、ORF或基因)***细胞中而发生。所***的核苷酸序列可以是异源的核苷酸序列(即在待转化的细胞中不是天然存在的序列)。例如,在本公开的某些实施例中,通过向亲本细胞引入多核苷酸构建体来修饰(例如,转化)包含编码SEQ ID NO:4的变体RghR2蛋白质的变体rghR2基因的亲本地衣芽孢杆菌细胞(所述多核苷酸构建体包含有效地连接到编码SEQ ID NO:2的天然RghR2蛋白质的核酸序列的启动子),从而生成衍生自“未经修饰的”(亲本)细胞的经修饰的地衣芽孢杆菌(子代)宿主细胞。
如本文所使用的,“转化”是指将外源DNA引入宿主细胞中,使得DNA保持为染色体整合体或自我复制的染色体外载体。如本文所使用的,“转化DNA”、“转化序列”、和“DNA构建体”是指用于将序列引入宿主细胞或生物体的DNA。转化DNA是用于将序列引入宿主细胞或生物体的DNA。通过PCR或通过任何其他适合的技术可以在体外产生DNA。在一些实施例中,转化DNA包含输入序列,而在其他实施例中,其进一步包含同源盒侧翼的输入序列。在还另外的实施例中,转化DNA包含其他非同源序列,添加到末端(即,填充序列或侧翼)。末端可以闭合,这样使得转化DNA形成闭环,例如像,***载体中。
如本文所使用的,在将核酸序列引入细胞中的上下文中,术语“引入”是指适合于将核酸序列转移到细胞中的任何方法。此类用于引入的方法包括但不限于原生质体融合、转染、转化、缀合和转导(参见例如,Ferrari等人,1989)。
如本文所使用的,“输入序列”是指引入芽孢杆菌属染色体中的DNA序列。在一些实施例中,输入序列是DNA构建体的一部分。在其他实施例中,输入序列编码一种或多种目的蛋白。在一些实施例中,输入序列包含可以或可以不存在于待转化的细胞的基因组中的序列(即,它可以是同源或异源序列)。在一些实施例中,输入序列编码一种或多种目的蛋白、基因、和/或突变的或经修饰的基因。在可替代的实施例中,该输入序列编码功能性野生型基因或操纵子、功能性突变基因或操纵子、或非功能基因或操纵子。在一些实施例中,可以将非功能序列***基因中以破坏基因的功能。在另一个实施例中,输入序列包括选择性标记。在一个另外的实施例中,输入序列包括两个同源盒。
如本文所使用的,“同源盒”是指核酸序列,其与芽孢杆菌属染色体中的序列同源。更特别地,根据本发明,同源盒是上游或下游区,所述上游或下游区与被缺失、破坏、灭活的、下调等的基因或基因的一部分的直接侧翼编码区具有约80%与100%之间的序列同一性、约90%与100%之间的序列同一性、或约95%与100%之间的序列同一性。这些序列指导在芽孢杆菌属染色体中,DNA构建体被整合,并且指导哪一部分芽孢杆菌属染色体被输入序列替代。尽管不意味着限制本公开,但同源盒可包括约1碱基对(bp)至200千碱基(kb)。优选地,同源盒包括约1bp与10.0kb之间;1bp与5.0kb之间;1bp与2.5kb之间;1bp与1.0kb之间、和0.25kb与2.5kb之间。同源盒还可以包括约10.0kb、5.0kb、2.5kb、2.0kb、1.5kb、1.0kb、0.5kb、0.25kb和0.1kb。在一些实施例中,选择性标记的5’和3’端在同源盒侧翼,其中所述同源盒包含紧密位于基因的编码区侧翼的核酸序列。
在本公开的还其他实施例中,如通过DNA阵列分析(例如,如本文所述的转录组分析)确定的,在不适当时间基因活性的缺失、破坏、灭活或下调提供了增强的目的蛋白表达。如本文所使用的,“转录组分析”是指基因转录的分析。
如本文所使用的,术语“编码可选择性标记的核苷酸序列”是指核苷酸序列,所述核苷酸序列能够在宿主细胞中表达并且其中可选择性标记的表达赋予含有表达的基因的细胞在不存在对应的选择性试剂或缺乏必需营养素的情况下生长的能力。
如本文所使用的,术语“可选择性标记”和“选择性标记”是指能够在宿主细胞中表达的核酸(例如,基因),其允许容易地选择包含所述载体的那些宿主。这些可选择性标记的实例包括但不限于抗微生物剂。因此,术语“可选择性标记”是指提供宿主细胞已经摄取了感兴趣的输入DNA,或者已经发生了一些其他反应的指示。通常,可选择性标记是赋予宿主细胞抗微生物抗性或代谢优势的基因,以允许在转化期间将包含外源DNA的细胞与未接受任何外源序列的细胞区分开来。
“残留可选择性标记”是位于待转化微生物的染色体上的标记。残留可选择性标记编码与转化DNA构建体上的可选择性标记不同的基因。选择性标记是本领域技术人员所熟知的。如上所述,标记可以是抗微生物抗性标记(例如,ampR、phleoR、specR、kanR、eryR、tetR、cmpR和neoR(参见例如,Guerot-Fleury,1995;Palmeros等人,2000;和Trieu-Cuot等人,1983)。在一些实施例中,本发明提供氯霉素抗性基因(例如,存在于pC194上的基因,以及存在于地衣芽孢杆菌基因组中的抗性基因)。所述抗性基因在本发明中以及涉及染色体整合的盒和整合质粒的染色体扩增的实施例中特别有用(参见例如,Albertini和Galizzi,1985;Stahl和Ferrari,1984)。根据本发明有用的其他标记包括但不限于营养缺陷型标记,如丝氨酸、赖氨酸、色氨酸;和检测标记,如β-半乳糖苷酶。
如本文所定义的,宿主细胞“基因组”,细菌(宿主)细胞“基因组”或地衣芽孢杆菌(宿主)细胞“基因组”包括染色体基因和染色体外基因。
如本文所使用的,术语“质粒”、“载体”和“盒”意指染色体外元件,其通常携带典型地不是细胞的中心代谢的一部分的基因,并且通常处于环状双链DNA分子的形式。此类元件可以是来源于任何来源的单链或双链DNA或RNA的线性或环状自主复制序列、基因组整合序列、噬菌体或核苷酸序列,其中许多核苷酸序列已连接或重组到单一结构中,该单一结构能够将针对选定基因产物的启动子片段和DNA序列连同适当3’未翻译序列引入到细胞中。
如本文所使用的,“转化盒”是指包含基因(或其ORF),并且除了促进具体宿主细胞的转化的外源基因之外,还具有元件的特定载体。
如本文所使用的,术语“载体”是指可以在细胞中复制(传播)并且可以携带新基因或DNA片段到细胞中的任何核酸。因此,该术语是指设计用于在不同宿主细胞之间转移的核酸构建体。载体包括为“附加体”的病毒、噬菌体、前病毒、质粒、噬菌粒、转座子、和人造染色体如YAC(酵母人工染色体)、BAC(细菌人工染色体)、PLAC(植物人工染色体)等(即,其自主复制或可以整合到宿主生物体的染色体中)。
“表达载体”是指具有在细胞中并入并表达异源DNA的能力的载体。许多原核和真核表达载体可商购获得并且是本领域技术人员熟知的。适合的表达载体的选择是在本领域技术人员的知识范围内。
如本文所使用的,术语“表达盒”和“表达载体”是指重组或合成产生的具有允许特定核酸在靶细胞中转录的一系列特定核酸元件的核酸构建体(即,这些是载体或载体元件,如上所述)。重组表达盒可以整合在质粒、染色体、线粒体DNA、质体DNA、病毒或核酸片段中。典型地,表达载体的重组表达盒部分包括,除了其他序列之外,待转录的核酸序列和启动子。在一些实施例中,DNA构建体还包括一系列允许靶细胞中特定核酸转录的特定核酸元件。在某些实施例中,本公开的DNA构建体包含如本文所定义的选择性标记和灭活的染色体或基因或DNA区段。
如本文所使用的,“靶向载体”是载体,所述载体包括与所述靶向载体转化的宿主细胞的染色体中的区同源的多核苷酸序列并且可以驱动该区的同源重组。例如,靶向载体可用于通过同源重组将突变引入宿主细胞染色体中。在一些实施例中,靶向载体包含其他非同源序列,例如添加到末端(即,填充序列或侧翼序列)。末端可以闭合,这样使得靶向载体形成闭环,例如像,***载体中。例如,在某些实施例中,通过向亲本细胞中引入一个或多个“靶向载体”来修饰(例如,转化)包含编码SEQ ID NO:4的变体RghR2蛋白质的变体rghR2基因的亲本地衣芽孢杆菌(宿主)细胞,所述“靶向载体”被设计用于缺失内源地衣芽孢杆菌变体rghR2基因的18核苷酸重复,使得包含“恢复的”天然rghR2基因的经修饰的宿主细胞编码SEQ ID NO:2的天然RghR2蛋白质。选择和/或构建适合的载体(例如,用于缺失rghR2基因中的18核苷酸重复)完全在本领域技术人员的知识范围内。
如本文所使用的,术语“质粒”是指用作克隆载体的环状双链(ds)DNA构建体,并且其在许多细菌和一些真核生物中形成额外的染色体自复制遗传元件。在一些实施例中,质粒被合并入宿主细胞的基因组中。
如本文所使用的,术语“目的蛋白”或“POI”是指期望在经修饰的地衣芽孢杆菌(子代)宿主细胞中表达的目的多肽,其中所述POI优选地以增加的水平表达(即,相对于“未经修饰的”(亲本)细胞)。因此,如本文所使用的,POI可以是酶、底物结合蛋白质、表面活性蛋白质、结构蛋白质、受体蛋白质等。在某些实施例中,相对于亲本细胞,本公开的经修饰的细胞产生增加量的异源目的蛋白或内源目的蛋白。在特别地实施例中,由本公开的经修饰的细胞产生的目的蛋白的增加量是相对于亲本细胞,至少0.5%增加、至少1.0%增加、至少5.0%增加、或超过5.0%增加。
类似地,如本文所定义的,“目的基因”或“GOI”是指编码POI的核酸序列(例如,多核苷酸、基因或ORF)。编码“目的蛋白”的“目的基因”可以是天然存在的基因、突变的基因或合成的基因。
如本文所使用的,术语“多肽”和“蛋白质”可互换地使用,并且是指包含通过肽键连接的氨基酸残基的任何长度的聚合物。本文中使用,用于氨基酸残基的常规单(1)字母或三(3)字母代码。多肽可以是线性的或支化的,它可以包含经修饰的氨基酸,并且它可以被非氨基酸中断。术语多肽还涵盖已经天然地或通过干预被经修饰的氨基酸聚合物;例如,通过二硫键形成、糖基化、脂化、乙酰化、磷酸化或任何其他操作或修饰,如与标记组分偶联。该定义内还包括例如含有一种或多种氨基酸类似物(包括例如非天然氨基酸等)以及本领域已知的其他修饰的多肽。
在某些实施例中,本公开的基因编码商业上相关的工业目的蛋白,例如酶(例如乙酰酯酶、氨肽酶、淀粉酶、***糖酶、***呋喃糖苷酶、碳酸酐酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、凝乳酶、角质酶、脱氧核糖核酸酶、差向异构酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡聚糖酶、葡聚糖裂解酶、内切-β-葡聚糖酶、葡糖淀粉酶、葡萄糖氧化酶、α-葡糖苷酶、β-葡糖苷酶、葡萄糖醛酸酶、糖基水解酶、半纤维素酶、己糖氧化酶、水解酶、转化酶、异构酶、漆酶、脂肪酶、裂解酶、甘露糖苷酶、氧化酶、氧化还原酶、果胶酸裂解酶、果胶乙酰酯酶、果胶解聚酶、果胶甲酯酶、果胶分解酶、过水解酶、多元醇氧化酶、过氧化物酶、酚氧化酶、植酸酶、聚半乳糖醛酸酶、蛋白酶、肽酶、鼠李糖-半乳糖醛酸酶、核糖核酸酶、转移酶、转运蛋白质、转谷氨酰胺酶、木聚糖酶、己糖氧化酶、及其组合)。
如本文所使用的,“变体”多肽是指通过取代、添加或缺失一个或多个氨基酸,通常通过重组DNA技术衍生自亲本(或参考)多肽的多肽。变体多肽与亲本多肽可以相差小数量的氨基酸残基,并且可以通过它们与亲本(参比)多肽在一级氨基酸序列同源性/同一性的水平来定义。
优选地,变体多肽与亲本(参比)多肽序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%氨基酸序列同一性。如本文所使用的,“变体”多核苷酸是指编码变体多肽的多核苷酸,其中“变体多核苷酸”与亲本多核苷酸具有特定程度的序列同源性/同一性,或与亲本多核苷酸(或其补体)在严格的杂交条件下杂交。优选地,变体多核苷酸与亲本(参比)多核苷酸序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%核苷酸序列同一性。
如本文所使用的,“突变”是指核酸序列中的任何变化或改变。存在若干种类型的突变,包括点突变、缺失突变、沉默突变、框位移突变、剪接突变等。可以特异性地进行突变(例如,经由定点诱变)或随机地进行突变(例如,经由化学试剂、通过修复减去的细菌菌株)。
如本文所使用的,在多肽或其序列的上下文中,术语“取代”意指一个氨基酸被另一个氨基酸替代(即,取代)。
如本文所定义的,“内源基因”是指位于生物体基因组的其天然位置中的基因。
如本文所定义的,“异源”基因、“非内源”基因、或“外源”基因是指通常不在宿主生物体中被发现,但通过基因转移引入宿主生物体中的基因(或ORF)。如本文所使用的,术语一个或多个“外来”基因包含***非天然生物体中的天然基因(或ORF)和/或***天然或非天然生物体中的嵌合基因。
如本文所定义的,“异源”核酸构建体或“异源”核酸序列具有不是其被表达的细胞的天然的序列的一部分。
如本文所定义的,“异源控制序列”是指基因表达控制序列(例如,启动子或增强子),其本质上不起作用以调控(控制)目的基因的表达。通常,异源的核酸序列对于它们存在的细胞或部分基因组不是内源(天然)的,并且已经通过感染、转染、转化、显微注射、电穿孔等添加到细胞中。“异源的”核酸构建体可以包含与在天然宿主细胞中发现的控制序列/DNA编码(ORF)序列组合相同或不同的控制序列/DNA编码序列组合。
如本文所使用的,术语“信号序列”和“信号肽”是指可以参与蛋白质的成熟蛋白质或前体形式的分泌或定向转运的氨基酸残基序列。通常,信号序列位于前体或成熟蛋白质序列的N-末端。信号序列可以是内源的或外源的。成熟蛋白质中一般不存在信号序列。通常,在蛋白质转运后,信号序列通过信号肽酶从蛋白质切割。
术语“衍生的”涵盖术语“起源的”、“获得的”“可获得的”和“创建的”,并且通常表示一种指定的材料或组合物在另一种指定的材料或组合物中找到它的起源或具有可以参考另一种指定材料或组合物描述的特征。
如本文所使用的,术语“同源性”涉及同源多核苷酸或多肽。如果两个或更多个多核苷酸或两个或更多个多肽是同源的,则这意味着同源多核苷酸或多肽具有至少60%、更优选至少70%、甚至更优选至少85%、还更优选至少90%、更优选至少95%、并且最优选至少98%的“同一性的程度”。两个多核苷酸或多肽序列是否具有如本文所定义的同源程度足够高的同一性,可以通过使用本领域已知的计算机程序,例如GCG程序包(Program Manualfor the Wisconsin Package[威斯康星程序包手册],版本8,1994年8月,遗传学计算机集团(Genetics Computer Group),575科学驱动,麦迪逊,威斯康星州,美国53711)(Needleman和Wunsch,1970)中提供的“GAP”比对两个序列来适合地研究。使用GAP和以下设置进行DNA序列比较:空位产生罚分5.0和空位扩展罚分0.3。
如本文所使用的,术语“百分比(%)同一性”是指当使用序列比对程序进行比对时,编码多肽或多肽的氨基酸序列的核酸序列之间的核酸或氨基酸序列同一性的水平。
如本文所使用的,“比生产力”是在给定时间段内生产的蛋白质的总量/细胞/时间。
如本文所定义的,术语“纯化的”或“分离的”或“富集的”意指生物分子(例如,多肽或多核苷酸)通过将其与它在自然界中相关联的天然存在的成分中的一些或所有分离而被从其天然状态改变。这种分离或纯化可以通过本领域公认的分离技术如离子交换层析、亲和层析、疏水分离、透析、蛋白酶处理、硫酸铵沉淀或其他蛋白质盐沉淀、离心、尺寸排阻层析、过滤、微量过滤、凝胶电泳或梯度分离进行,以去除最终组合物中所不希望的全细胞、细胞碎片、杂质、外来蛋白质或酶。随后可以进一步向纯化或分离的生物分子组合物中添加成分,该成分提供了额外的益处,例如是活化剂、抗抑制剂、期望的离子、控制pH的化合物或其他酶或化学品。
如本文所使用的,术语“ComK多肽”定义为comK基因的产物;该基因是转录因子,在感受态发展之前作为最终的自动调控控制开关;涉及激活参与DNA结合和摄取以及重组的晚期感受态基因的表达(Liu和Zuber,1998,Hamoen等人,1998)。示例性ComK核酸和多肽序列分别在SEQ ID NO:85和SEQ ID NO:86中示出。
如本文所使用的,“同源基因”是指来自不同的、但通常相关的物种的基因对,这些基因彼此对应并且彼此相同或非常相似。该术语涵盖通过物种形成(即,新物种的发育)(例如,直系同源基因)分离的基因、以及通过遗传重复分离的基因(例如,旁系同源基因)。
如本文所使用的,“直系同源物”和“直系同源基因”是指通过物种形成从共同祖先基因(即,同源基因)演化的不同物种中的基因。通常,直系同源物在进化过程中保持相同的功能。直系同源物的鉴定可用于新测序基因组中基因功能的可靠预测。
如本文所使用的,“旁系同源物”和“旁系同源基因”是指与基因组内重复相关的基因。虽然直系同源物在进化过程中保持相同的功能,但旁系同源物发展新功能,即使一些功能通常与原始功能相关。旁系同源基因的实例包括但不限于编码胰蛋白酶、胰凝乳蛋白酶、弹性蛋白酶、和凝血酶的基因,上述酶都是丝氨酸蛋白酶并且在同一物种内一起发生。
如本文所使用的,“同源性”是指序列相似性或同一性,同一性优先。使用本领域已知的标准技术来确定这种同源性(参见,例如,Smith和Waterman,1981;Needleman和Wunsch,1970;Pearson和Lipman,1988;程序如在Wisconsin Genetics Software Package[威斯康星州遗传学软件包]中的GAP、BESTFIT、FASTA、和TFASTA(Genetics ComputerGroup,Madison,WI[遗传学计算机组,麦迪逊,威斯康星州])和Devereux等人,1984)。
如本文所使用的,“类似的序列”是其中基因的功能与衍生自地衣芽孢杆菌细胞的基因基本上相同的序列。另外,类似的基因与地衣芽孢杆菌细胞的序列包括至少60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性。类似的序列由已知的序列比对方法确定。通常使用的比对方法是BLAST,尽管存在也可用于比对序列的其他方法。
如本文所使用的,术语“杂交”是指通过碱基配对将核酸链与互补链连接的过程,如本领域已知的。如果两个序列在中至高严格杂交和洗涤条件下彼此特异性杂交,则认为核酸序列可与参考核酸序列“选择性杂交”。杂交条件是基于核酸结合复合物或探针的解链温度(Tm)。例如,“最大严格”典型地发生在约Tm -5℃(低于探针的Tm 5℃);“高严格”发生在低于Tm约5℃-10℃;“中等严格”发生在低于探针的Tm约10℃-20℃;并且“低严格”发生在低于Tm约20℃-25℃。在功能上,最大严格条件可以用于鉴定与杂交探针具有严格同一性或近乎严格同一性的序列;而中或低严格杂交可用于鉴定或检测多核苷酸序列同源物。中等和高严格杂交条件是本领域公知的。高严格条件的实例包括以下杂交:在约42℃下,在50%甲酰胺、5X SSC、5X登哈特溶液、0.5%SDS和100pg/ml变性载体DNA中进行,随后在室温(RT)下在2X SSC和0.5%SDS中洗涤两次,并在42℃下在另外的0.1X SSC和0.5%SDS下再洗涤两次。中严格条件的实例包括在37℃下在包含20%甲酰胺、5 x SSC(150mM NaCl、15mM柠檬酸三钠)、50mM磷酸钠(pH 7.6)、5 x登哈特溶液、10%葡聚糖硫酸盐和20mg/ml变性剪切的鲑鱼***DNA的溶液中过夜孵育,然后在约37℃-50℃下以1x SSC洗涤滤器来进行。如果需要,本领域技术人员知道如何调控温度、离子强度等以适应因素如探针长度等等。
如本文所使用的,“重组体”包括提及细胞或载体,其已经通过引入异源核酸序列而被修饰,或者所述细胞衍生自已如此修饰的细胞。因此,例如,重组细胞表达在细胞的天然形式(非重组)内相同形式的未发现的基因或表达以其他方式异常表达的、低表达的或根本不表达的天然基因(由于故意的人为干预)。“重组(recombination、recombining)”或产生“重组的(recombined)”核酸通常是两个或更多个核酸片段的组装,其中组装产生嵌合基因。
如本文所使用的,“侧翼序列”是指正在讨论的序列的上游或下游的任何序列(例如,针对基因A-B-C,基因B以A和C基因序列为侧翼)。在某些实施例中,输入序列每侧侧翼有同源盒。在另一个实施例中,输入序列和同源盒包括在每侧侧翼有填充序列的单元。在一些实施例中,侧翼序列仅存在于单侧(3’或5’),但在优选的实施例中,序列的每侧均有侧翼序列。每个同源盒的序列与芽孢杆菌属染色体中的序列同源。这些序列指导在芽孢杆菌属染色体中,新构建体被整合,并且部分芽孢杆菌属染色体将被输入序列替代。在其他实施例中,选择性标记的5’和3’端侧翼有包含灭活染色体区段的部分的多核苷酸序列。在一些实施例中,侧翼序列仅存在于单侧(3’或5’),而在其他实施例中,其存在于所侧翼序列的每侧。
如本文所使用的,术语“填充序列”是指侧翼同源盒(通常为载体序列)的任何额外的DNA。然而,所述术语涵盖任何非同源DNA序列。不受任何理论的限制,填充序列为细胞启动DNA摄取提供非关键的靶。
II.地衣芽孢杆菌RGHR1/RGHR2转录调控因子
枯草芽孢杆菌yvaN基因被鉴定为rapG、rapH(Hayashi等人,2006)和rapD(Ogura和Fujita,2007)的阻遏物,并且更名为rghR(rapG和rapH阻遏物)。rghR的下游存在基因yvaO(具有未知的功能),但是基于序列同源性编码HTH型(螺旋-转角-螺旋)转录调控因子。“RghR”与“YvaO”之间的氨基酸序列同一性是大约52%。枯草芽孢杆菌rghR的上游是基因yvzC和yvaM。yvzC基因还编码推定的HTH型转录调控因子,而yvaM的翻译产物是推定的水解酶。
更特别地,地衣芽孢杆菌编码枯草芽孢杆菌RghR/YvaO的两个同源物,其被命名为“RghR1”和“RghR2”。枯草芽孢杆菌(菌株168)“RghR”蛋白质与地衣芽孢杆菌(菌株DSM 13)“RghR1”蛋白质之间的氨基酸序列同一性是大约59%;并且枯草芽孢杆菌(菌株168)“RghR”与地衣芽孢杆菌(菌株DSM 13)“RghR2”之间的氨基酸序列同一性是大约57%。
地衣芽孢杆菌rghR1的上游是两个基因,yvzC(BLi03645;SEQ ID NO:17)和BLi03644(SEQ ID NO:19)转录调控因子。地衣芽孢杆菌YvzC是枯草芽孢杆菌YvzC的同源物。然而,Bli03644属于转录调控因子的AbrB家族,并且不是推定的水解酶YvaM的同源物。
更特别地,如下文实例部分中所呈现和讨论的,地衣芽孢杆菌(菌株DSM13=ATTC14580)含有编码推定的HTH型转录调控因子的基因(命名为rghR2(KEGG基因组T00200地衣芽孢杆菌DSM13基因ID编号BLi03647))。地衣芽孢杆菌(DSM13)的rghR2的核酸序列示于SEQID NO:1中,并且地衣芽孢杆菌(DSM13)的RghR2蛋白质的编码的氨基酸序列示于SEQ IDNO:2中。
例如,本公开的申请人测序了(1)地衣芽孢杆菌菌株Bra7的基因组、(2)菌株Bra7的地衣芽孢杆菌衍生物的基因组、(3)地衣芽孢杆菌菌株ATCC-9789的基因组(www.atcc.org/Products/All/9789.aspx)、和(4)地衣芽孢杆菌菌株ATCC-6598的基因组(www.atcc.org/en/Products/All/6598.aspx),其揭示了所有这些地衣芽孢杆菌菌株在rghR2基因中具有18核苷酸(18-bp)的重复(duplication)(即,重复(repeat))(例如,参见SEQ ID NO:3,其中核苷酸“GCCGCAGCCATTTCCAGA”以连续顺序重复两次,该核苷酸重复是SEQ ID NO:87中示出的),并且其中这18核苷酸序列编码氨基酸“AAAISR”(SEQ ID NO:5),使得SEQ ID NO:4的变体RghR2蛋白质包含“AAAISR”的重复(即,AAAISR-AAAISR;如SEQ IDNO:6中示出)。
因此,地衣芽孢杆菌Bra7菌株的RghR2蛋白质的氨基酸序列(SEQ ID NO:4)与地衣芽孢杆菌Bra7衍生物、地衣芽孢杆菌菌株ATCC-9789和地衣芽孢杆菌菌株ATCC-6598的RghR2的序列相同(如SEQ ID NO:4中所示)。
地衣芽孢杆菌Bra7菌株RghR2蛋白质的氨基酸序列(SEQ ID NO:4)与地衣芽孢杆菌DSM13菌株RghR2蛋白质氨基酸序列(SEQ ID NO:2)的比对示于图1中,表明SEQ ID NO:4中的重复(AAAISR)。序列“AAAISR”的***(重复)在螺旋-转角-螺旋(HTH)结构域中,并且在RghR2蛋白质的序列特异性DNA-结合位点附近(如图8所示)。
例如,SEQ ID NO:4的RghR2蛋白质(例如,由rghR2dup基因编码的)包含140个氨基酸残基、分子量为约16.1kDa、理论净电荷为+4.5且理论等电点(PI)为9.38(基于1°氨基酸序列的分子量、净电荷和PI计算),而SEQ ID NO:2的RghR2蛋白质(例如,由天然或rghR2rest基因编码的)包含134个氨基酸残基、分子量为约15.6kDa、理论净电荷为+3.5且理论等电点(PI)为8.85(基于1°氨基酸序列的分子量、净电荷和PI计算)。同样地,使用Pfam分析(版本31.0)评估RghR2蛋白质序列表明Rgh2蛋白质包含HTH家族_31的螺旋-转角-螺旋(HTH)结构域(HTH_31;clan-0123),所述HTH结构域包含在SEQ ID NO:2的RghR2蛋白质的氨基残基5-58中。例如,编码SEQ ID NO:4的变体RghR2蛋白质的地衣芽孢杆菌Bra7菌株的rghR2基因包含六氨基酸重复“AAAISR”的重复(图1),所述六氨基酸重复大约位于HTH结构域(氨基酸)序列的中间。
不希望受特定理论、机制或操作模式的束缚,本文预期SEQ ID NO:4中序列“AAAISR”的***(重复)显著影响或甚至完全消除RghR2蛋白质作为转录调控因子的功能。例如,作为转录调控因子,RghR2将直接和间接调控若干种其他基因的表达(例如,参见实例3)。因此,通过编码SEQ ID NO:6中示出的“AAAISR”氨基酸重复的这种18-bp核苷酸重复使RghR2灭活被认为影响细胞的生理学,因此可以影响如细胞生长和异源蛋白质生产的因素。更特别地,在实例2中通过去除(例如,缺失)产生各种异源酶的地衣芽孢杆菌衍生物的Bra7(菌株)细胞中的rghR2基因中的18-bp重复,进一步研究SEQ ID NO:3中存在的这种18-bp核苷酸重复的影响。更特别地,如图4所示,缺失rhgR2 18-bp重复显示培养时生物质的减少,而同时证明改善的淀粉酶产生效价(即,目的蛋白的增加的产生)。因此,如图5所示,rghR2恢复的(即,Δ18-bp重复)菌株中比生产力(酶产生/OD600)改善至少2倍。
III.地衣芽孢杆菌rghR2变体和rghR2恢复的细胞中上调和下调基因的转录分析
如实例3中示出的,地衣芽孢杆菌衍生物的Bra7菌株细胞(即,包含具有18-bp重复的rghR2;SEQ ID NO:3)和此菌株的rghR2恢复的变体(即,经由去除18-bp重复;SEQ ID NO:1)的转录组分析揭示若干个基因的转录受RghR2调控。例如,实例3、表2和表3分别指示在rghR2恢复的菌株(即,相对于包含18-bp重复的rghR2灭活菌株)中基因转录上调和下调了至少两倍。
更特别地,本文预期在rghR2恢复的地衣芽孢杆菌菌株(即,包含编码SEQ ID NO:2的RghR2蛋白质的rghR2基因)或rghR2灭活的地衣芽孢杆菌菌株(即,包含编码SEQ ID NO:4的RghR2蛋白质的rghR2基因)中缺失、破坏、灭活或下调一个或多个表3中的基因将对在这些经修饰的宿主细胞中的蛋白质产生具有积极的效果,类似于通过重新激活rghR2基因观察到的效果(即,经由去除/缺失rghR2基因中的18-bp重复)。因此,如实例4所示,探索了灭活(例如,缺失、破坏或下调)这些基因(即,Bli03644(SEQ ID NO:19);yvzC(SEQ ID NO:17);abrB1(SEQ ID NO:21)和abh(SEQ ID NO:23))的亚组对异源蛋白质产生的影响。例如,通过在产生异源α-淀粉酶的地衣芽孢杆菌Bra7衍生物中***抗生物素标记来灭活Bli03644、abrB1、yvzC和abh基因。因此,在四个单个敲除菌株(即,ΔBLi03644、ΔabrB1、ΔyvzC和Δabh)中确定淀粉酶产生,并且与作为对照的亲本菌株相比(如实例2所述)。更特别地,如图7所示,灭活Bli03644、abrB1、yvzC和abh导致改善的α-淀粉酶产生,而细胞生长(OD600)受影响更小(即,证明增加的比生产力,Qp)。
IV.分子生物学
如以上所示,本公开的某些实施例涉及衍生自亲本地衣芽孢杆菌细胞的经修饰的地衣芽孢杆菌细胞,所述亲本地衣芽孢杆菌细胞包含编码SEQ ID NO:4包含90%序列同一性的RghR2蛋白质的rghR2基因,其中所述经修饰的细胞包含编码与SEQ ID NO:2包含90%序列同一性的RghR2蛋白质的rghR2基因的遗传修饰。在其他实施例中,本公开涉及衍生自亲本地衣芽孢杆菌细胞的经修饰的地衣芽孢杆菌细胞,所述亲本地衣芽孢杆菌细胞包含编码SEQ ID NO:4的RghR2蛋白质的rghR2基因,其中所述经修饰的细胞包含编码SEQ ID NO:2的RghR2蛋白质的复原型rghR2基因。在另一个实施例中,本公开涉及衍生自亲本地衣芽孢杆菌细胞的经修饰的地衣芽孢杆菌细胞,所述亲本地衣芽孢杆菌细胞包含编码与SEQ IDNO:2包含90%序列同一性的RghR2蛋白质的rghR2基因、和遗传修饰,所述遗传修饰缺失、破坏、灭活或下调选自由以下组成的组的至少一个内源地衣芽孢杆菌基因:abrB1、rpmJ、rpIM、BLi00412、rapK、phrK、BLi00753、yfjT、BLi00828、yhdX、yhzC、terf2、zosA、abbA、speG、yppF、BLi02543、mntR、BLi02768、sspA、BLi03127、BLi03635、mrgA、BLi03644、yvzC、rghR1、spo0F、ywjG、ywq12、BLi04199、BLi04200、licT、bglH和bglP。在另一个实施例中,本公开涉及衍生自亲本地衣芽孢杆菌细胞的经修饰的地衣芽孢杆菌细胞,所述亲本地衣芽孢杆菌细胞包含编码与SEQ ID NO:4包含90%序列同一性的RghR2蛋白质的rghR2基因和遗传修饰,所述遗传修饰缺失、破坏、灭活或下调选自由以下组成的组的至少一个内源地衣芽孢杆菌基因:abrB1、rpmJ、rpIM、BLi00412、rapK、phrK、BLi00753、yfjT、BLi00828、yhdX、yhzC、terf2、zosA、abbA、speG、yppF、BLi02543、mntR、BLi02768、sspA、BLi03127、BLi03635、mrgA、BLi03644、yvzC、rghR1、spo0F、ywjG、ywq12、BLi04199、BLi04200、licT、bglH和bglP。其他实施例涉及遗传修饰,所述遗传修饰改变RghR2蛋白质的HTH结构域的编码序列。
因此,本公开的某些实施例提供了用于遗传修饰(改变)本公开的亲本地衣芽孢杆菌细胞以产生经修饰的(rghR2rest)细胞的组合物和方法,并且更特别地,经修饰的地衣芽孢杆菌(rghR2rest)细胞产生增加量的内源或异源目的蛋白(即,相对于(未经修饰的)亲本地衣芽孢杆菌细胞)。
因此,本公开的某些实施例涉及用于遗传修饰芽孢杆菌属细胞的方法,其中所述修饰包括但不限于(a)引入、取代、或去除基因(或其ORF)中的一个或多个核苷酸,或者引入、取代、或去除基因或其ORF的转录或翻译所需要的调控元件中的一个或多个核苷酸,(b)基因破坏,(c)基因转换,(d)基因缺失,(e)下调基因,(f)位点特异性诱变,和/或(g)随机诱变。例如,如本文所使用的遗传修饰包括但不限于选自由以下组成的组一个或多个基因的修饰:rghR1、rghR2、abrB1、rpmJ、rpIM、BLi00412、rapK、phrK、BLi00753、yfjT、BLi00828、yhdX、yhzC、terf2、zosA、abbA、speG、yppF、BLi02543、mntR、BLi02768、sspA、BLi03127、BLi03635、mrgA、BLi03644、yvzC、spo0F、ywjG、ywq12、BLi04199、BLi04200、licT、bglH和bglP。
在某些实施例中,通过使用本领域熟知的方法(例如,***、破坏、替换、或缺失)减少或消除上述基因的表达来构建本公开的经修饰的芽孢杆菌属细胞。待修饰或灭活的基因的部分可以是,例如,编码区或编码区表达所需的调控元件。
此类调控或控制序列的实例可以是启动子序列或其功能部分(即,足以影响核酸序列表达的部分)。用于修饰的其他控制序列包括但不限于前导序列、前肽序列、信号序列、转录终止子、转录激活子等。
在某些其他实施例中,通过基因缺失构建经修饰的芽孢杆菌属细胞以消除或减少本公开的至少一种前述基因的表达。基因缺失技术能够部分或完全去除一个或多个基因,从而消除它们的表达、或表达非功能性(或活性降低的)蛋白质产物。在此类方法中,一个或多个基因的缺失可以通过使用质粒进行同源重组来完成,所述质粒已构建成连续含有基因侧翼的5’和3’区。可以将连续的5’和3’区引入芽孢杆菌属细胞中,例如,在温度敏感的质粒(如pE194)上,在允许温度下与第二可选择性标记结合以允许质粒在细胞中建立。然后将细胞移至非允许温度,以选择在同源侧翼区之一处具有整合到染色体中的质粒的细胞。通过选择第二可选择性标记来实现质粒整合的选择。整合后,通过将细胞移至允许温度持续若干代而不进行选择来在刺激第二同源侧翼区的重组事件。将细胞铺板以获得单菌落,并检查菌落是否损失两种可选择性标记(参见例如,Perego,1993)。因此,本领域技术人员(例如,参考rghR1、rghR2、abrB1、rpmJ、rpIM、BLi00412、rapK、phrK、BLi00753、yfjT、BLi00828、yhdX、yhzC、terf2、zosA、abbA、speG、yppF、BLi02543、mntR、BLi02768、sspA、BLi03127、BLi03635、mrgA、BLi03644、yvzC、spo0F、ywjG、ywq12、BLi04199、BLi04200、licT、bglH和bglP基因(核酸)序列及其编码的蛋白质序列)可以容易地鉴定适合于完全或部分缺失的基因的编码序列和/或基因的非编码序列中的核苷酸区。
在其他实施例中,通过引入、取代、或去除基因或其转录或翻译所需的调控元件中的一个或多个核苷酸来构建本公开的经修饰的芽孢杆菌属细胞。例如,可以***或去除核苷酸,以便导致引入终止密码子的、去除起始密码子、或移码可读框。可以根据本领域已知的方法,通过定点诱变或PCR产生的诱变来完成这种修饰(例如参见,Botstein和Shortle,1985;Lo等人,1985;Higuchi等人,1988;Shimada,1996;Ho等人,1989;Horton等人,1989以及Sarkar和Sommer,1990)。因此,在某些实施例中,通过完全或部分缺失灭活本公开的基因。
在另一个实施例中,通过基因转换的过程构建经修饰的芽孢杆菌属细胞(例如,参见Iglesias和Trautner,1983)。例如,在基因转换方法中,对应于一个或多个基因的核酸序列在体外诱变以产生缺陷核酸序列,然后将所述核酸序列转化到亲本芽孢杆菌属细胞中以产生缺陷基因。通过同源重组,缺陷核酸序列替换内源基因。可能是需要的,缺陷基因或基因片段也编码可用于选择含有缺陷基因的转化体的标记。例如,可以将缺陷基因与可选择性标记结合引入非复制或温度敏感的质粒上。通过在不允许质粒复制的条件下选择标记来实现质粒整合的选择。选择导致基因替换的第二次重组事件是通过检查菌落损失可选择性标记和获得突变基因来实现的(Perego,1993)。可替代地,缺陷核酸序列可以含有基因的一个或多个核苷酸的***、取代、或缺失,如下所述。
在其他实施例中,通过建立的反义技术使用与基因的核酸序列互补的核苷酸序列来构建经修饰的芽孢杆菌属细胞(Parish和Stoker,1997)。更特别地,可以通过引入与基因的核酸序列互补的核苷酸序列来减少(下调)或消除芽孢杆菌属细胞的基因的表达,所述核苷酸序列可以在细胞中转录并且能够与细胞中产生的mRNA杂交。在允许互补的反义核苷酸序列与mRNA杂交的条件下,由此降低或消除了所翻译的蛋白质的量。此类反义方法包括但不限于RNA干扰(RNAi)、小干扰RNA(siRNA)、微小RNA(miRNA)、反义寡核苷酸等,所有这些都是本领域技术人员熟知的。
在其他实施例中,经由CRISPR-Cas9编辑产生/构建经修饰的芽孢杆菌属细胞。例如,通过核酸指导的核酸内切酶的方式,编码rghR1、rghR2、abrB1、rpmJ、rpIM、BLi00412、rapK、phrK、BLi00753、yfjT、BLi00828、yhdX、yhzC、terf2、zosA、abbA、speG、yppF、BLi02543、mntR、BLi02768、sspA、BLi03127、BLi03635、mrgA、BLi03644、yvzC、spo0F、ywjG、ywq12、BLi04199、BLi04200、licT、bglH和/或bglP的基因可以被破坏(或缺失或下调),所述方式通过将指导RNA(例如,Cas9)和Cpf1或指导DNA(例如,NgAgo)结合发现其靶DNA,这将核酸内切酶募集到DNA上的靶序列上,其中所述核酸内切酶可以在DNA中产生单链或双链断裂。这种靶向DNA断裂成为DNA修复的底物,并且可以与提供的编辑模板重组以破坏或缺失该基因。例如,编码核酸指导的核酸内切酶(出于此目的,来自化脓链球菌的Cas9)的基因或编码Cas9核酸酶的密码子优化的基因有效地连接到在芽孢杆菌属细胞中有活性的启动子和在芽孢杆菌属细胞中有活性的终止子,从而产生芽孢杆菌Cas9表达盒。同样地,本领域技术人员容易识别目的基因特有的一个或多个靶位点。例如,为了构造编码gRNA的DNA构建体-指向目的基因内的靶位点,可变的靶向结构域(VT)将包含靶位点的核苷酸,所述核苷酸为(PAM)前间区序列邻近基序(TGG)的5’,所述核苷酸与编码化脓链球菌Cas9的Cas9核酸内切酶识别结构域(CER)的DNA融合。组合编码VT结构域的DNA和编码CER结构域的DNA,从而产生编码gRNA的DNA。因此,通过将编码gRNA的DNA有效连接到在芽孢杆菌属细胞中有活性的启动子和在芽孢杆菌属细胞中有活性的终止子来产生gRNA的芽孢杆菌属的表达盒。
在某些实施例中,由内切核酸酶诱导的DNA断裂用输入序列修复/替换。例如,为了精确修复由上述Cas9表达盒和gRNA表达盒产生的DNA断裂,提供核苷酸编辑模板,使得细胞的DNA修复机器可以利用编辑模板。例如,靶基因的约500bp 5’可以与靶基因的约500bp 3’融合以产生编辑模板,所述模板由芽孢杆菌宿主的机器用于修复由RGEN产生的DNA断裂。
可以使用许多不同的方法(例如,原生质体融合、电穿孔、自然感受态或诱导感受态)将Cas9表达盒、gRNA表达盒、和编辑模板共同递送至丝状真菌细胞。通过用正向和反向引物扩增基因座,通过PCR扩增靶基因座来筛选转化的细胞。这些引物可以扩增野生型基因座或已经由RGEN编辑的经修饰基因座。然后使用测序引物对这些片段进行测序以鉴定编辑的菌落(例如,参见以下实例6和7)。
在又其他实施例中,使用本领域已知的方法(包括但不限于,化学诱变(参见例如,Hopwood,1970)和转座(参见例如,Youngman等人,1983)),通过随机或特异性诱变构建经修饰的芽孢杆菌属细胞。可以通过对亲本细胞进行诱变并筛选其中基因表达已经减少或消除的突变细胞来进行基因的修饰。诱变可以是特异性的或随机的,可以通过例如使用适合的物理或化学诱变剂进行、通过使用适合的寡核苷酸进行、或通过将所述DNA序列经受PCR产生的诱变来进行。此外,诱变可通过使用这些诱变方法的任意组合来进行。
适用于本发明目的的物理或化学诱变剂的实例包括紫外线(UV)照射、羟胺、N-甲基-N’-硝基-N-亚硝基胍(MNNG)、N-甲基-N’-亚硝基胍(NTG)、邻甲基羟胺、亚硝酸、乙基甲磺酸(EMS)、亚硫酸氢钠、甲酸和核苷酸类似物。当使用这些试剂时,通常通过如下方法来进行诱变:在适合的条件下在选择的诱变剂的存在下孵育待诱变的亲本细胞,并选择表现出基因表达降低或无基因表达的突变细胞。
在某些其他实施例中,经修饰的芽孢杆菌属细胞包含选自以下的内源基因的缺失:rghR1、rghR2、abrB1、rpmJ、rpIM、BLi00412、rapK、phrK、BLi00753、yfjT、BLi00828、yhdX、yhzC、terf2、zosA、abbA、speG、yppF、BLi02543、mntR、BLi02768、sspA、BLi03127、BLi03635、mrgA、BLi03644、yvzC、spo0F、ywjG、ywq12、BLi04199、BLi04200、licT、bglH和bglP。因此,在某些这些实施例中,如上所述构建经修饰的芽孢杆菌属细胞。
在其他实施例中,经修饰的芽孢杆菌属细胞包含选自以下的内源基因的破坏:rghR1、rghR2、abrB1、rpmJ、rpIM、BLi00412、rapK、phrK、BLi00753、yfjT、BLi00828、yhdX、yhzC、terf2、zosA、abbA、speG、yppF、BLi02543、mntR、BLi02768、sspA、BLi03127、BLi03635、mrgA、BLi03644、yvzC、spo0F、ywjG、ywq12、BLi04199、BLi04200、licT、bglH和bglP。在某些实施例中,本公开的多核苷酸破坏盒包含标记基因。
在其他实施例中,经修饰的芽孢杆菌属细胞包含选自以下的下调的内源基因:rghR1、rghR2、abrB1、rpmJ、rpIM、BLi00412、rapK、phrK、BLi00753、yfjT、BLi00828、yhdX、yhzC、terf2、zosA、abbA、speG、yppF、BLi02543、mntR、BLi02768、sspA、BLi03127、BLi03635、mrgA、BLi03644、yvzC、spo0F、ywjG、ywq12、BLi04199、BLi04200、licT、bglH和bglP。例如,在某些实施例中,下调上述一个或多个基因包含缺失或破坏基因的上游或下游调控元件。
国际PCT公开号WO 2003/083125公开了用于修饰芽孢杆菌属细胞的方法,如使用PCR融合来产生芽孢杆菌属缺失菌株和DNA构建体以绕过大肠杆菌。PCT公开号WO 2002/14490公开了用于修饰芽孢杆菌属细胞的方法,所述方法包括(1)构建和转化整合的质粒(pComK),(2)随机诱变编码序列、信号序列和前肽序列,(3)同源重组,(4)通过向转化DNA添加非同源侧翼增加转化效率,(5)优化双交叉整合,(6)定向诱变和(7)无标记缺失。
本领域技术人员充分意识到用于将多核苷酸序列引入细菌细胞(例如,大肠杆菌和芽孢杆菌属物种)中的适合方法(例如,Ferrari等人,1989;Saunders等人,1984;Hoch等人,1967;Mann等人,1986;Holubova,1985;Chang等人,1979;Vorobjeva等人,1980;Smith等人,1986;Fisher等人,1981和McDonald,1984)。实际上,包括原生质体转化和中板集合、转导、和原生质体融合在内的转化方法是已知的并且适合用于本公开。转化方法特别优选地是将本公开的DNA构建体引入宿主细胞。
除了通常使用的方法之外,在一些实施例中,直接转化宿主细胞(即,在引入宿主细胞之前,中间细胞不用于扩增或以其他方式处理DNA构建体)。将DNA构建体引入宿主细胞包括本领域已知的将DNA***宿主细胞而不***质粒或载体中的那些物理和化学方法。此类方法包括但不限于氯化钙沉淀、电穿孔、裸DNA、脂质体等。在另外的实施例中,DNA构建体与质粒一起共转化而不***该质粒。在另外的实施例中,通过本领域已知的方法,将选择性标记从经修饰的芽孢杆菌属菌株中缺失或基本上切除(例如,Stahl等人,1984和Palmeros等人,2000)。在一些实施例中,来自宿主染色体的载体的分辨离开染色体中的侧翼区域,同时去除了固有的染色体区域。
用于在芽孢杆菌属细胞中表达基因、其可读框(ORF)和/或其变体序列的启动子和启动子序列区通常是本领域技术人员已知的。通常选择本公开的启动子序列,使得它们在芽孢杆菌属细胞(例如,地衣芽孢杆菌细胞、枯草芽孢杆菌属细胞等)中起作用。某些示例性芽孢杆菌属启动子序列示于表6中。同样地,用于驱动芽孢杆菌属细胞中基因表达的启动子包括但不限于枯草芽孢杆菌碱性蛋白酶(aprE)启动子(Stahl等人,1984)、枯草芽孢杆菌的α-淀粉酶启动子(Yang等人,1983)、解淀粉芽孢杆菌的α-淀粉酶启动子(Tarkinen等人,1983)、来自枯草芽孢杆菌的中性蛋白酶(nprE)启动子(Yang等人,1984)、突变体aprE启动子(PCT公开号WO 2001/51643)或来自地衣芽孢杆菌或其他相关的芽孢杆菌属的任何其他启动子。在某些其他实施例中,启动子是美国专利公开号2014/0329309中公开的核糖体蛋白质启动子或核糖体RNA启动子(例如,rrnI启动子)。在PCT公开号WO 2003/089604中描述了用于在芽孢杆菌属细胞中筛选和产生具有一系列活性(启动子强度)的启动子文库的方法。
V.培养用于产生目的蛋白的经修饰的细胞
在其他实施例中,本公开提供了与未经修饰的(亲本)细胞相比(即,相对于,用于提高经修饰的芽孢杆菌属细胞的蛋白质生产力的方法。在某些实施例中,本公开内容针对产生目的蛋白(POI)的方法,这些方法包括发酵培养经修饰的细菌细胞,其中经修饰的细胞将POI分泌到培养基中。本领域熟知的发酵方法可用于发酵本公开的经修饰的和未经修饰的芽孢杆菌属细胞。
在一些实施例中,将细胞在分批或连续发酵条件下培养。经典的分批发酵是封闭的***,其中在发酵开始时设定培养基的组成,并且该组成在发酵期间不改变。在发酵开始时,用一种或多种所需生物体接种培养基。在这种方法中,允许发酵发生而不向***添加任何组分。通常,分批发酵符合关于添加碳源的“分批”的资格,并且经常对控制因素(例如pH和氧浓度)进行尝试。分批***的代谢物和生物质组成不断变化直到发酵停止时。在典型分批培养中,细胞可以通过静态停滞期进展到高生长对数期,最后进入生长速率减少或停止的稳定期。如果不经处理,处于稳定期的细胞最终死亡。通常,在对数期的细胞负责产物的大量生产。
标准分批***的适合的变体是“补料分批发酵”***。在典型的分批***的这种变化中,随着发酵的进展,将底物以增量添加。当分解代谢物抑制可能抑制细胞的代谢时并且在培养基中希望具有有限量的底物的情况下,补料分批***是有用的。在补料分批***中实际底物浓度的测量是困难的,并且因此基于可测量因素(例如pH、溶解的氧和废气(例如CO2)的分压)的变化对其进行估计。分批和补料分批发酵是常用的并且在本领域中是已知的。
连续发酵是开放的***,在该***中,将定义的发酵培养基连续添加到生物反应器中,同时去除等量的条件培养基以用于处理。连续发酵通常将培养物保持在恒定的高密度,其中细胞主要处于对数期生长。连续发酵允许对一种或多种影响细胞生长和/或产物浓度的因素进行调控。例如,在一个实施例中,将限制营养素(例如碳源或氮源)保持在固定的速率,并且允许调控所有其他参数。在其他***中,影响生长的许多因素可以不断改变,而通过培养基浊度测量的细胞浓度保持不变。连续***努力保持稳定态的生长条件。因此,由于转移培养基而引起的细胞损失应当与发酵中的细胞生长速率相平衡。调控用于连续发酵过程的营养素和生长因子的方法以及最大化产物形成速率的技术在工业微生物学领域中是熟知的。
因此,在某些实施例中,可以通过常规程序从培养基中回收由转化的(修饰的)宿主细胞产生的POI,所述常规程序包括通过离心或过滤从培养基中分离宿主细胞,或者如果需要,破坏细胞并从细胞部分和碎片中去除上清液。通常经过澄清后,上清液或滤液的蛋白质性组分通过盐(例如硫酸铵)沉淀。然后沉淀的蛋白质被溶解,并且可以通过各种色谱法进行纯化,例如离子交换色谱法、凝胶过滤。
VI.经修饰的(宿主)细胞产生的目的蛋白
本公开的目的蛋白(POI)可以是任何内源或异源蛋白质,并且它可以是这种POI的变体。蛋白质可以包含一个或多个二硫键,或者是其功能形式是单体或多聚体的蛋白质,即蛋白质具有四级结构并且由多个相同(同源的)或不相同的(异源的)亚基构成,其中POI或其变体POI优选是具有目的特性的POI。
例如,如以下实例中示出的,本公开的经修饰的(rghR2rest)芽孢杆菌属细胞产生增加量的异源POI(例如,实例2和5中示出的异源淀粉酶),同时显示当培养时生物质的减少。因此,在某些实施例中,本公开的经修饰的细胞表达内源POI、异源POI或其一种或多种的组合。例如,在某些实施例中,相对于其未经修饰的(亲本)细胞,本公开的经修饰的芽孢杆菌属细胞产生至少约0.1%更多、至少约0.5%更多、至少约1%更多、至少约5%更多、至少约6%更多、至少约7%更多、至少约8%更多、至少约9%更多、或至少约10%或更多的POI。
在某些实施例中,相对于(未经修饰的)亲本芽孢杆菌属细胞,本公开的经修饰的芽孢杆菌属细胞展示POI的增加的比生产力(Qp)。例如,比生产力(Qp)的检测是用于评估蛋白质生产的适合的方法。比生产力(Qp)可以使用以下公式确定:
“Qp=gP/gDCW·hr”
其中,“gP”是罐中产生的蛋白质的克数,“gDCW”是罐中的干细胞重量(DCW)的克数,并且“hr”是从接种时间开始的几小时内的发酵时间,其包括生产时间以及生长时间。
因此,在某些其他实施例中,相对于未经修饰的(亲本)细胞,本公开的经修饰的芽孢杆菌属细胞包含至少约0.1%、至少约1%、至少约5%、至少约6%、至少约7%、至少约8%、至少约9%、或至少约10%或更多的比生产力(Qp)增加。
在某些实施例中,POI或其变体POI选自由以下组成的组:乙酰酯酶、氨肽酶、淀粉酶、***糖酶、***呋喃糖苷酶、碳酸酐酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、凝乳酶、角质酶、脱氧核糖核酸酶、差向异构酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡聚糖酶、葡聚糖裂解酶、内切-β-葡聚糖酶、葡糖淀粉酶、葡萄糖氧化酶、α-葡糖苷酶、β-葡糖苷酶、葡萄糖醛酸酶、糖苷水解酶、半纤维素酶、己糖氧化酶、水解酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、裂解酶、甘露糖苷酶、氧化酶、氧化还原酶、果胶酸裂解酶、果胶乙酰酯酶、果胶解聚酶、果胶甲酯酶、果胶分解酶、过水解酶、多元醇氧化酶、过氧化物酶、酚氧化酶、植酸酶、聚半乳糖醛酸酶、蛋白酶、肽酶、鼠李糖-半乳糖醛酸酶、核糖核酸酶、转移酶、转运蛋白质、转谷氨酰胺酶、木聚糖酶、己糖氧化酶、及其组合。
因此,在某些实施例中,POI或其变体POI是选自酶学委员会编号(EC)编号EC 1、EC2、EC 3、EC 4、EC 5或EC 6的酶。
例如,在某些实施例中,POI是包括但不限于选自以下的EC 1(氧化还原酶)酶的氧化还原酶:EC 1.10.3.2(例如,漆酶)、EC 1.10.3.3(例如,L-抗坏血酸氧化酶)、EC 1.1.1.1(例如,醇脱氢酶)、EC 1.11.1.10(例如,氯化物过氧化物酶)、EC 1.11.1.17(例如,过氧化物酶)、EC 1.1.1.27(例如,L-乳酸脱氢酶)、EC 1.1.1.47(例如,葡萄糖1-脱氢酶)、EC1.1.3.X(例如,葡萄糖氧化酶)、EC 1.1.3.10(例如,吡喃糖氧化酶)、EC 1.13.11.X(例如,加双氧酶)、EC 1.13.11.12(例如,亚油酸13S-脂氧合酶(lineolate 13S-lipozygenase))、EC 1.1.3.13(例如,醇氧化酶)、EC 1.14.14.1(例如,单加氧酶)、EC 1.14.18.1(例如,单酚单加氧酶(monophenol monooxigenase))、EC 1.15.1.1(例如,超氧化物歧化酶)、EC1.1.5.9(先前,EC 1.1.99.10,例如,葡萄糖脱氢酶)、EC 1.1.99.18(例如,纤维二糖脱氢酶)、EC 1.1.99.29(例如,吡喃糖脱氢酶)、EC 1.2.1.X(例如,脂肪酸还原酶)、EC 1.2.1.10(例如,乙醛脱氢酶)、EC 1.5.3.X(例如,果糖基胺还原酶)、EC 1.8.1.X(例如,二硫还原酶)和EC 1.8.3.2(例如,硫醇氧化酶)。
在某些实施例中,POI是包括但不限于EC 2(转移酶)酶的转移酶,所述EC 2(转移酶)酶选自EC 2.3.2.13(例如,转谷氨酰胺酶)、EC 2.4.1.X(例如,己糖基转移酶)、EC2.4.1.40(例如,交替蔗糖酶(alternasucrase))、EC 2.4.1.18(例如,1,4α-葡聚糖分支酶)、EC 2.4.1.19(例如,环麦芽糖糊精葡聚糖转移酶)、EC 2.4.1.2(例如,糊精葡聚糖酶)、EC 2.4.1.20(例如,纤维二糖磷酸化酶)、EC 2.4.1.25(例如,4-α-葡聚糖转移酶)、EC2.4.1.333(例如,1,2-β-低聚葡糖磷酸转移酶)、EC 2.4.1.4(例如,淀粉蔗糖酶)、EC2.4.1.5(例如,葡聚糖蔗糖酶)、EC 2.4.1.69(例如,半乳糖苷2-α-L-岩藻糖基转移酶)、EC2.4.1.9(例如,菊粉蔗糖酶(inulosucrase))、EC 2.7.1.17(例如,木酮糖激酶)、EC2.7.7.89(原名EC 3.1.4.15,例如,[谷氨酰氨合成酶]-腺苷-L-酪氨酸磷酸化酶)、EC2.7.9.4(例如,α葡聚糖激酶)和EC 2.7.9.5(例如,磷酸葡聚糖激酶)。
在其他实施例中,POI是包括但不限于选自以下的EC 3(水解酶)酶的水解酶:EC3.1.X.X(例如,酯酶)、EC 3.1.1.1(例如,果胶酶)、EC 3.1.1.14(例如,叶绿素酶)、EC3.1.1.20(例如,丹宁酸酶)、EC 3.1.1.23(例如,甘油酯酰基水解酶)、EC 3.1.1.26(例如,半乳糖脂酶)、EC 3.1.1.32(例如,磷脂酶A1)、EC 3.1.1.4(例如,磷脂酶A2)、EC 3.1.1.6(例如,乙酰酯酶)、EC 3.1.1.72(例如,乙酰木聚糖酯酶)、EC 3.1.1.73(例如,阿魏酸酯酶)、EC 3.1.1.74(例如,角质酶)、EC 3.1.1.86(例如,多聚鼠李半乳糖醛酸乙酰酯酶)、EC3.1.1.87(例如,fumosin B1酯酶)、EC 3.1.26.5(例如,核糖核酸酶P)、EC 3.1.3.X(例如,磷酸单酯水解酶)、EC 3.1.30.1(例如,曲霉属核酸酶S1)、EC 3.1.30.2(例如,粘质沙雷氏菌(Serratia marcescens)核酸酶)、EC 3.1.3.1(例如,碱性磷酸酶)、EC 3.1.3.2(例如,酸性磷酸酶)、EC 3.1.3.8(例如,3-植酸酶)、EC 3.1.4.1(例如,磷酸二酯酶I)、EC 3.1.4.11(例如,磷酸肌醇磷脂酶C)、EC 3.1.4.3(例如,磷脂酶C)、EC 3.1.4.4(例如,磷脂酶D)、EC3.1.6.1(例如,芳基硫酸酯酶(arylsufatase))、EC 3.1.8.2(例如,二异丙基-氟磷酸酯酶)、EC 3.2.1.10(例如,寡聚-1,6-葡萄糖苷酶)、EC 3.2.1.101(例如,甘露聚糖内切-1,6-α-甘露糖苷酶)、EC 3.2.1.11(例如,α-1,6-葡聚糖-6-葡聚糖水解酶)、EC 3.2.1.131(例如,木聚糖α-1,2-葡糖醛酸糖苷酶)、EC 3.2.1.132(例如,壳聚糖N-乙酰氨基葡萄糖水解酶)、EC 3.2.1.139(例如,α-葡萄糖醛酸酶)、EC 3.2.1.14(例如,几丁质酶)、EC 3.2.1.151(例如,木葡聚糖-特异性内切-β-1,4-葡聚糖酶)、EC 3.2.1.155(例如,木葡聚糖-特异性内切-β-1,4-葡聚糖酶)、EC 3.2.1.164(例如,半乳糖内切-1,6-β-半乳糖苷酶)、EC 3.2.1.17(例如,溶解酵素)、EC 3.2.1.171(例如,鼠李半乳糖醛酸聚糖水解酶)、EC 3.2.1.174(例如,鼠李半乳糖醛酸聚糖鼠李水解酶)、EC 3.2.1.2(例如,β-淀粉酶)、EC 3.2.1.20(例如,α-葡萄糖苷酶)、EC 3.2.1.22(例如,α-半乳糖苷酶)、EC 3.2.1.25(例如,β-甘露糖苷酶)、EC 3.2.1.26(例如,β-呋喃果糖苷酶)、EC 3.2.1.37(例如,木聚糖1,4-β-木糖苷酶)、EC3.2.1.39(例如,葡聚糖内切-1,3-β-D-葡萄糖苷酶)、EC 3.2.1.40(例如,α-L-鼠李糖苷酶)、EC 3.2.1.51(例如,α-L-岩藻糖苷酶)、EC 3.2.1.52(例如,β-N-乙酰己糖胺酶)、EC3.2.1.55(例如,α-N-***呋喃糖酶)、EC 3.2.1.58(例如,葡聚糖1,3-β-葡萄糖苷酶)、EC3.2.1.59(例如,葡聚糖内切-1,3-α-葡萄糖苷酶)、EC 3.2.1.67(例如,半乳糖1,4-α-葡萄糖醛酸酶)、EC 3.2.1.68(例如,异淀粉酶)、EC 3.2.1.7(例如,1-β-D-果聚糖果聚糖水解酶)、EC 3.2.1.74(例如,葡聚糖1,4-β-葡萄糖苷酶)、EC 3.2.1.75(例如,葡聚糖内切-1,6-β-葡萄糖苷酶)、EC 3.2.1.77(例如,甘露聚糖1,2-(1,3)-α-甘露糖苷酶)、EC 3.2.1.80(例如,果聚糖β-果糖苷酶)、EC 3.2.1.82(例如,外切-聚-α-半乳糖醛酸酶)、EC 3.2.1.83(例如,κ-卡拉胶酶)、EC 3.2.1.89(例如,***半乳聚糖内切-1,4-β-半乳糖苷酶)、EC3.2.1.91(例如,纤维素1,4-β-纤维二糖糖苷)、EC 3.2.1.96(例如,甘露糖-糖蛋白内切-β-N-乙酰基氨基葡萄糖苷酶)、EC 3.2.1.99(例如,***聚糖内切-1,5-α-L-树胶醛醣(arabinan endo-1,5-alpha-L-arabinanase))、EC 3.4.X.X(例如,肽酶)、EC 3.4.11.X(例如,氨基肽酶)、EC 3.4.11.1(例如,亮氨酰氨基肽酶)、EC 3.4.11.18(例如,甲硫氨酰基氨基肽酶)、EC 3.4.13.9(例如,Xaa-Pro二肽酶)、EC 3.4.14.5(例如,二肽-肽酶IV)、EC3.4.16.X(例如,丝氨酸型羧基肽酶)、EC 3.4.16.5(例如,羧肽酶C)、EC 3.4.19.3(例如,焦谷氨酰-肽酶I)、EC 3.4.21.X(例如,丝氨酸肽链内切酶)、EC 3.4.21.1(例如,糜蛋白酶)、EC 3.4.21.19(例如,谷酰基内切肽酶)、EC 3.4.21.26(例如,脯氨酰寡聚肽酶)、EC3.4.21.4(例如,胰蛋白酶)、EC 3.4.21.5(例如,凝血酶)、EC 3.4.21.63(例如,水稻素(oryzin))、EC 3.4.21.65(例如,嗜热霉菌素(thermomycolin))、EC 3.4.21.80(例如,链霉菌素(streptogrisin)A)、EC 3.4.22.X(例如,半胱氨酸内肽酶)、EC 3.4.22.14(例如,猕猴桃蛋白酶)、EC 3.4.22.2(例如,木瓜蛋白酶)、EC 3.4.22.3(例如,无花果蛋白酶(ficain))、EC 3.4.22.32(例如,有树干蛋白酶(stem bromelain))、EC 3.4.22.33(例如,菠萝果蛋白酶(fruit bromelain))、EC 3.4.22.6(例如,木瓜凝乳蛋白酶)、EC 3.4.23.1(例如,胃蛋白酶A)、EC 3.4.23.2(例如,胃蛋白酶B)、EC 3.4.23.22(例如,壳室囊菌蛋白酶(endothiapepsin))、EC 3.4.23.23(例如,mucorpepsin)、EC 3.4.23.3(例如,胃亚蛋白酶(gastricsin))、EC 3.4.24.X(例如,金属内肽酶(metalloendopeptidase))、EC 3.4.24.39(例如,deuterolysin)、EC 3.4.24.40(例如,serralysin)、EC 3.5.1.1(例如,天冬酰胺酶)、EC 3.5.1.11(例如,青霉素酰胺酶)、EC 3.5.1.14(例如,N-酰基-脂肪族-L-氨基酸氨基水解酶)、EC 3.5.1.2(例如,L-谷氨酰胺氨基水解酶)、EC 3.5.1.28(例如,N-乙酰胞壁酸-L-丙氨酸酰胺酶)、EC 3.5.1.4(例如,酰胺酶)、EC 3.5.1.44(例如,蛋白-L-谷氨酰胺氨基水解酶)、EC 3.5.1.5(例如,脲酶)、EC 3.5.1.52(例如,肽-N(4)-(N-乙酰基-β-葡糖胺)天冬酰胺酰胺酶)、EC 3.5.1.81(例如,N-酰基-D-氨基-酸脱酰基酶)、EC 3.5.4.6(例如,AMP脱氨酶)和EC 3.5.5.1(例如,腈水解酶)。
在其他实施例中,POI是包括但不限于选自以下的EC 4(裂解酶)酶的裂解酶:EC4.1.2.10(例如,苯乙醇腈裂解酶)、EC 4.1.3.3(例如,N-乙酰神经氨酸裂解酶)、EC4.2.1.1(例如,碳酸脱水酶)、EC 4.2.2.-(例如,鼠李半乳糖醛酸聚糖裂解酶)、EC4.2.2.10(例如,果裂解酶)、EC 4.2.2.22(例如,果胶三糖-裂解酶)、EC 4.2.2.23(例如,鼠李半乳糖醛酸聚糖内切裂解酶)和EC 4.2.2.3(例如,甘露糖醛特异性海藻酸裂解酶)。
在某些其他实施例中,POI是包括但不限于选自以下的EC 5(异构酶)酶的异构酶:EC 5.1.3.3(例如,醛糖1-差向异构酶)、EC 5.1.3.30(例如,D-阿洛酮糖3-差向异构酶)、EC5.4.99.11(例如,异麦芽酮糖合酶)和EC 5.4.99.15(例如,(1→4)-α-D-葡聚糖1-α-D-葡萄糖基变位酶((1→4)-α-D-glucan 1-α-D-glucosylmutase))。
在又其他实施例中,POI是包括但不限于选自以下的EC 6(连接酶)酶的连接酶:EC6.2.1.12(例如,4-香豆酸:辅酶A连接酶)和EC 6.3.2.28(例如,L-氨基酸α-连接酶)9。
因此,在某些实施例中,产生工业蛋白酶的芽孢杆菌属宿主细胞提供特别优选的表达宿主。同样地,在某些其他实施例中,产生工业淀粉酶的芽孢杆菌属宿主细胞提供特别优选的表达宿主。
例如,存在两种一般类型的蛋白酶通常由芽孢杆菌属物种分泌,即中性(或“金属蛋白酶”)和碱性(或“丝氨酸”)蛋白酶。例如,芽孢杆菌枯草杆菌蛋白酶蛋白质(酶)是可用于在本公开中使用的示例性丝氨酸蛋白酶。已经鉴定并测序了多种枯草芽孢杆菌蛋白酶,例如枯草杆菌蛋白酶168、枯草杆菌蛋白酶BPN’、枯草杆菌蛋白酶Carlsberg、枯草杆菌蛋白酶DY、枯草杆菌蛋白酶147和枯草杆菌蛋白酶309(例如,WO 1989/06279和Stahl等人,1984)。在本公开的一些实施例中,经修饰的芽孢杆菌属细胞产生突变体(即,变体)蛋白酶。许多参考文献提供变体蛋白酶的实例,如PCT公开号WO 1999/20770;WO 1999/20726;WO1999/20769;WO 1989/06279;U.S.RE34,606;美国专利号4,914,031;4,980,288;5,208,158;5,310,675;5,336,611;5,399,283;5,441,882;5,482,849;5,631,217;5,665,587;5,700,676;5,741,694;5,858,757;5,880,080;6,197,567和6,218,165。因此,在某些实施例中,本公开的经修饰的芽孢杆菌属细胞包含编码蛋白酶的表达构建体。
在某些其他实施例中,本公开的经修饰的芽孢杆菌属细胞包含编码淀粉酶的表达构建体。多种淀粉酶及其变体是本领域技术人员已知的。例如,国际PCT公开号WO 2006/037484和WO 2006/037483描述了具有改善的溶剂稳定性的变体α-淀粉酶,公开号WO 1994/18314公开了氧化稳定的α-淀粉酶变体,公开号WO 1999/19467、WO 2000/29560和WO 2000/60059公开了Termamyl-样α-淀粉酶变体,公开号WO 2008/112459公开了衍生自芽孢杆菌属物种编号707的α-淀粉酶变体,公开号WO 1999/43794公开了麦芽生成的α-淀粉酶变体,公开号WO 1990/11352公开了超热稳定的(hyper-thermostable)α-淀粉酶变体,公开号WO2006/089107公开了具有颗粒淀粉水解活性的α-淀粉酶变体。
在其他实施例中,在本公开的经修饰细胞中表达和产生的POI或变体POI是肽、肽激素、生长因子、凝血因子、趋化因子、细胞因子、淋巴因子、抗体、受体、粘附分子、微生物抗原(例如,HBV表面抗原、HPV E7等)、其变体、其片段等。其他类型的目的蛋白(或其变体)可以是能够为食品或作物提供营养价值的蛋白质或变体。非限制性实例包括可以抑制抗营养因子形成的植物蛋白质和具有更理想的氨基酸组成的植物蛋白质(例如比非转基因植物具有更高的赖氨酸含量)。
本领域普通技术人员已知有用于检测和测量细胞内和细胞外所表达的蛋白质的活性的各种测定。特别地,对于蛋白酶,存在基于来自酪蛋白或血红蛋白的酸溶性肽的释放的测定,其作为280nm下的吸光度测量或使用Folin方法进行比色测定(例如Bergmeyer等人,1984)。其他测定涉及生色底物的溶解(参见例如,Ward,1983)。其他示例性测定包括琥珀酰-Ala-Ala-Pro-Phe-对-硝基苯胺测定(SAAPFpNA)和2,4,6-三硝基苯磺酸钠盐测定(TNBS测定)。本领域技术人员已知的许多另外的参考文献提供了适合的方法(参见例如,Wells等人,1983;Christianson等人,1994和Hsia等人,1999)。
国际PCT公开号WO 2014/164777公开了可用于本文所述淀粉酶活性的Ceralphaα-淀粉酶活性测定。
用于确定宿主细胞中目的蛋白的分泌水平并且检测所表达的蛋白质的手段包括使用对蛋白质具有特异性的多克隆或单克隆抗体的免疫测定。实例包括酶联免疫吸附测定(ELISA)、放射免疫测定(RIA)、荧光免疫测定(FIA)以及荧光激活细胞分选术(FACS)。
实例
根据以下实例可以进一步理解本发明的某些方面,所述实例不应被解释为限制性的。材料和方法的修改对本领域技术人员而言是显而易见的。
实例1
在地衣芽孢杆菌菌株的rghR2基因中的18-BP序列的重复
地衣芽孢杆菌菌株DSM13(ATTC 14580)含有称为rghR2(BLi03647)的基因,所述基因编码推定的HTH型转录调控因子。地衣芽孢杆菌DSM13的rghR2的核酸序列描绘在SEQ IDNO:1中,并且地衣芽孢杆菌DSM13的RghR2蛋白质的编码的氨基酸序列描绘在SEQ ID NO:2中。
测序(a)地衣芽孢杆菌菌株Bra7、(b)地衣芽孢杆菌Bra7衍生物、(c)地衣芽孢杆菌菌株ATCC-9789(www.atcc.org/Products/All/9789.aspx)和(d)地衣芽孢杆菌菌株ATCC-6598(www.atcc.org/en/Products/All/6598.asp)的基因组揭示所有这些地衣芽孢杆菌菌株具有在rghR2基因中的18个核苷酸的重复,其中所述18核苷酸重复在SEQ ID NO:3:GCCGCAGCCATTTCCAGA中呈现。
因此,(a)地衣芽孢杆菌Bra7菌株rghR2基因的核苷酸序列(SEQ ID NO:3)与(b)地衣芽孢杆菌Bra7衍生物的、(c)ATCC-9789的、和(d)ATCC-6598的rghR2基因的核苷酸序列(如SEQ ID NO:3所示)相同。同样地,地衣芽孢杆菌Bra7菌株的RghR2蛋白质的氨基酸序列(SEQ ID NO:5)与地衣芽孢杆菌Bra7衍生物、ATCC-9789的和ATCC-6598的RghR2的氨基酸序列(如SEQ ID NO:4所示)相同。
地衣芽孢杆菌Bra7菌株RghR2氨基酸序列(SEQ ID NO:4)与地衣芽孢杆菌DSM13菌株RghR2氨基酸序列(SEQ ID NO:2)的比对表明重复氨基酸(AAAISR)示于图1中。序列“AAAISR”的***在螺旋-转角-螺旋(HTH)结构域中,并且在序列特异性DNA-结合位点附近(如图8所示)。可以预期***对RghR2转录调节子的“功能”具有显著影响或甚至使其完全消除(即,基本上无活性的转录调节蛋白质)。例如,作为转录调控因子,RghR2将直接和间接调控若干种其他基因的表达。本文预期,RghR2的灭活(例如,通过编码SEQ ID NO:6中示出的“AAAISR”氨基酸重复的SEQ ID NO:5中示出的18-bp重复)影响细胞生理学,并且因此,可能会影响像生长及其异源蛋白质产生的因素。因此,通过去除产生各种异源酶的地衣芽孢杆菌Bra7衍生物细胞中rghR2基因中的18-bp重复对生长和异源蛋白质产生的影响做进一步研究。
实例2
去除rghR2中的18-BP重复及其对细胞生长和异源酶产生的影响
去除地衣芽孢杆菌Bra7衍生物菌株(和与菌株相关的或衍生自此宿主菌株)中的rghR2基因中的18-bp重复,对Bra7的基因组DNA进行了两次PCR扩增。使用引物378和379进行一次PCR扩增(表2),并使用引物380和381对Bra7的基因组DNA进行第二次PCR扩增(表2)。将两个片段凝胶纯化并使用引物378和381在融合PCR中使用以产生缺失18-bp重复的rghR2片段。使用Hin dIII和Not I消化此片段,并在凝胶纯化后连接到Hin dIII和Not I消化并凝胶纯化的温度敏感性整合质粒pCZ105(图2),产生质粒“pZC105_rghR2”(图3)。
表2
PCR引物
/>
将质粒pZC105_rghR2进行滚环扩增(GE医疗欧洲有限公司(GE HealthcareEurope GmbH),埃因霍温,荷兰)并转化进缺乏天然地衣芽孢杆菌淀粉酶(AmyL)基因但携带编码异源解凝胶多糖类芽孢杆菌变体α-淀粉酶的表达盒的地衣芽孢杆菌(Bra7衍生物)菌株中。因此,表达盒包含编码强启动子后面的解凝胶多糖类芽孢杆菌变体α-淀粉酶的基因,并整合在地衣芽孢杆菌基因组中。异源解凝胶多糖类芽孢杆菌变体α-淀粉酶的序列公开在PCT公开号WO 2014/164834(即,SEQ ID NO:35)中,特别地通过引用以其整体结合在此。
如先前在2016年10月27日提交的PCT国际申请号PCT/US2016/059078中所述,使用质粒pBLComK(图4)使细胞成为感受态细胞。将细胞铺板在含有30mg/l卡那霉素的Luria琼脂上并在37℃下培养过夜。将形成的菌落重新划线到新鲜的Luria琼脂上,并在37℃下培养过夜。挑取单菌落并在Luria肉汤中于42℃下培养过夜,同时振荡以促进基因组中的整合。随后,将细胞铺板在含有30mg/l卡那霉素的Luria琼脂上并在37℃下培养过夜。在使用引物369和384通过PCR验证基因组中的整合后,将正确的克隆在Luria肉汤中在37℃下培养过夜,随后铺板到Luria琼脂上。将单菌落重新划线到LB琼脂平板和含有30mg/l卡那霉素的LB琼脂平板上,并在37℃下培养过夜,以验证通过双交叉事件从基因组中去除载体部分。使用引物752和753(表2)对在卡那霉素存在下不能生长的菌落进行PCR,并对获得的片段进行测序。这证实了rghR2基因中18-bp重复的去除。
将经验证的克隆之一(克隆197)用于进一步研究。将在rghR2恢复的宿主(即,去除18-bp重复的rghR2rest)中表达解凝胶多糖类芽孢杆菌α-淀粉酶的克隆197和表达解凝胶多糖类芽孢杆菌α-淀粉酶的亲本对照菌株(即,包含具有18-bp重复的rghR2)接种在大豆胰蛋白胨肉汤(TSB)培养基中,并在37℃下伴随振荡培养过夜。使用葡萄糖缓释微量滴定板(srMTP;PS生物技术有限公司(PS Biotech GmbH),黑措根拉特(Herzogenrath),德国),在OD660为0.1的淀粉酶生产培养基中,从该预培养物接种主要培养物。将板在37℃下伴随振荡培养72小时。
72小时后,测量OD600(图5)并用50%丙二醇(西格玛奥德里奇公司(SigmaAldrich),兹韦恩德雷赫特(Zwijndrecht),荷兰)以1:1稀释100ul细胞,并在40℃下伴随振荡孵育1小时。孵育后,使用Ceralpha试剂(麦格酶公司(Megazyme),威克洛,爱尔兰)如麦格酶公司的说明书中所述,并且如PCT国际申请号PCT/US2016/059078中所公开,测量淀粉酶活性。
如图5所示,缺失rhgR2 18-bp重复显示培养时生物质的减少,而同时证明改善的淀粉酶产生效价。例如,图6显示了在rghR2恢复的菌株中,异源α-淀粉酶的比生产力(酶产生/OD600)改善了至少2倍。
实例3
RghR2调控的基因
Bra7产生菌株(即,包含具有18-bp重复的rghR2)和此菌株的rghR2恢复的(rghR2rest)变体(即,去除18-bp重复)的转录组分析揭示若干个基因的转录被RghR2调控(表3)。表4指示在rghR2恢复的菌株(即,相对于包含18-bp重复的rghR2灭活菌株)中基因转录下调了至少两倍。可以预期,在rghR2恢复的菌株和rghR2灭活的菌株(例如,经由18-bp***)中这些基因的(进一步)下调或这些基因的缺失对蛋白质产生具有正面影响。这将与通过去除18-bp重复重新激活rghR2所见的效果类似。因此,如以下实例4所述,探索了灭活这些基因(Bli03644、yvzC、abrB1、abh)的子集对异源蛋白质产生的影响。
表3
在rghR2恢复的菌株中基因上调了2倍或更多
/>
/>
来自KEGG基因组T00200的基因ID(地衣芽孢杆菌DSM 13=ATCC 14580)
表4
在rghR2恢复的菌株中基因下调了2倍或更多
/>
来自KEGG基因组T00200的基因ID(地衣芽孢杆菌DSM 13=ATCC 14580)
实例4
灭活RghR2调控的基因及其对异源蛋白质产生的影响
通过在产生异源α-淀粉酶(即,PCT公开号WO 2014/164834中公开的异源解凝胶多糖类芽孢杆菌α-淀粉酶)的Bra7菌株中***抗生物素标记来灭活Bli03644、abrB1、yvzC和abh基因,其中所述异源α-淀粉酶产生在四个单个敲除菌株(ΔBLi03644、ΔabrB1、ΔyvzC和Δabh)中确定并且与实例2中描述的亲本(对照)菌株相比。例如,如图7所示,灭活Bli03644、abrB1、yvzC和abh导致改善的异源α-淀粉酶产生,而细胞生长(OD600)受影响较小。
实例5
在包含rghR2rest的经修饰的细胞中淀粉酶的增强的产生
在本实例中,包含具有18-bp重复的rghR2基因(SEQ ID NO:3)的地衣芽孢杆菌细胞以及包含缺乏18-bp重复的rghR2基因(rghR2rest;SEQ ID NO:1)的地衣芽孢杆菌细胞两者均包含以下任一个的单拷贝:(a)整合到地衣芽孢杆菌基因组中的异源噬细胞菌属物种变体#1α-淀粉酶表达盒(SEQ ID NO:140),或(b)整合到地衣芽孢杆菌基因组中的变体嗜热脂肪土芽孢杆菌α-淀粉酶表达盒(SEQ ID NO:141),这两者接种自冷冻小瓶(1mL,20%甘油)(在10mL种子培养基(15g/L酵母提取物、5.5g/L右旋糖、3g/L磷酸钾、1g/L硫酸镁)中)。将培养物在38℃下在开口的100mL烧瓶中在310RPM下生长直至OD600为大约2。从每种培养物中将0.25mL转移至在100mL开口型烧瓶中的25mL的生产培养基(30g/L 2-(N-吗啉代)乙磺酸(MES)、具有硫酸铵不具有氨基酸的6.7g/L酵母氮源、不具有硫酸铵或氨基酸的1.7g/L酵母氮源、0.7g/L大豆胨、pH 6.8、与氢氧化铵),并添加两个14mm葡萄糖进料珠,并将烧瓶在38℃、310RPM下孵育84小时(定期更换蒸发水损失)。
84小时后,从每个烧瓶中取出样品并离心。将十分之一(0.1)mL上清液与0.9mL布拉福德试剂(Bradford reagent)混合。测量颜色作为595nm波长的吸光度,并与标准曲线比较以确定蛋白质浓度。将沉淀重新悬浮在丙二醇中,加热30分钟,并如上所述用布拉福德(Bradford)测定。通过两次测量的聚集体确定淀粉酶滴度,如表5所示。
表5
来自rghR2恢复的菌株的淀粉酶滴度
因此,如上文在表5中所示,包含rghR2rest等位基因的地衣芽孢杆菌菌株均显示至少10%的淀粉酶滴度改善,表明去除rghR2基因中天然存在的18-bp重复有利于产生多种异源淀粉酶分子。
实例6
CRISPR-Cas9编辑和缺失RghR2基因中的18核苷酸重复
在本实例中,编码核酸指导的核酸内切酶(例如,来自化脓链球菌的Cas9(SEQ IDNO:91))的基因或其密码子优化的基因(例如,SEQ ID NO:92的Cas9核酸酶)有效地连接到在地衣芽孢杆菌中有活性的启动子(例如参见,以下表6)和在地衣芽孢杆菌中有活性的终止子(例如,SEQ ID NO:103),从而产生地衣芽孢杆菌Cas9表达盒(SEQ ID NO:104)。
表6
在地衣芽孢杆菌中有活性的示例性启动子的列表
启动子名称 SEQ ID NO
aprEp 93
xylAp 94
spac 95
Hyper spank 96
Vegp 97
nprEp 98
N25启动子 99
groE启动子 100
AraAp 101
AraA2p 102
可以鉴定rghR2的18-bp重复等位基因的独特的靶位点(SEQ ID NO:105),使得缺乏18-bp重复的rghR2基因不含有靶位点。
同样地,为了构造编码靶向18-bp重复(SEQ ID NO:105)内的独特靶位点的指导RNA(gRNA)的DNA构建体,包含SEQ ID NO:106、SEQ ID NO:107、SEQ ID NO:108、或SEQ IDNO:109的靶位点核苷酸(所述核苷酸是前间区序列邻近基序(PAM)核苷酸“TGG”的上游(5’))的可变的靶向结构域(VT)与编码化脓链球菌Cas9的Cas9核酸内切酶识别结构域(CER,SEQ ID NO:110)的DNA融合。
将编码VT结构域的DNA与编码CER结构域的DNA组合(融合)产生编码gRNA的DNA(例如,编码靶向来自rghR2内的18-bp重复的靶位点(SEQ ID NO:105)的gRNA的DNA),以产生SEQ ID NO:111。
通过将编码gRNA的DNA(SEQ ID NO:111)有效地连接到在地衣芽孢杆菌中有活性的启动子(例如,表6)和在地衣芽孢杆菌中有活性的终止子(例如,SEQ ID NO:103)产生gRNA的地衣芽孢杆菌表达盒,这产生gRNA表达盒(spac-gRNA-t0 SEQ ID NO:112)。为了精确修复由Cas9表达盒(SEQ ID NO:104)和gRNA表达盒(SEQ ID NO:112)产生的DNA断裂,必须提供由细胞的DNA修复机器使用的编辑模板。例如,将18-bp重复的500bp上游(5’)(SEQID NO:113)与18-bp重复的500bp下游(3’)(SEQ ID NO:114)融合以产生编辑模板(SEQ IDNO:115),所述编辑模板可以由地衣芽孢杆菌宿主机器使用,以修复由RGEN产生的DNA断裂。
使用许多不同的方法(例如,原生质体融合、电穿孔、天然感受态或诱导感受态),将Cas9表达盒(SEQ ID NO:104)、gRNA表达盒(SEQ ID NO:112)和编辑模板(SEQ ID NO:115)共同递送至地衣芽孢杆菌细胞。通过用正向引物(SEQ ID NO:117)和反向引物(SEQ IDNO:118)扩增基因座,通过PCR扩增rghR2基因座(SEQ ID NO:116)筛选转化的细胞。这些引物扩增野生型基因座(SEQ ID NO:116)或已经由RGEN编辑的恢复的基因座(SEQ ID NO:119)。然后使用测序引物(SEQ ID NO:120)对这些片段进行测序以鉴定编辑的菌落。
因此,如此实例中所述,rghR2调节子中的任何基因能以类似的方式编辑以灭活、增强、下调或缺失该基因。
实例7
CRISPR-Cas9编辑和基因下调
本实例描述了经由CRSIPR-Cas9编辑调节(例如,下调)目的基因。调节基因表达水平的示例性方法是使用核苷酸指导的核酸内切酶核酸酶-缺陷变体(例如,Cas9 D10A/N863A或D10A/H840A)以增强或拮抗一个或多个靶基因的转录。这些Cas9变体对蛋白质序列中存在的所有核酸酶结构域无活性。因此,这些Cas9变体保留RNA指导的DNA结合活性,但当与同源靶位点结合时不能切割DNA的任一条链。
例如,核酸酶-缺陷Cas9蛋白质可以被表达为地衣芽孢杆菌表达盒(如实例6所述构建),并且当与地衣芽孢杆菌gRNA表达盒组合时,Cas9蛋白质针对细胞内特定的靶序列。Cas9(变体)蛋白质与特定的靶位点的结合可以阻断转录机器在细胞的DNA上的结合或移动,从而减少产生的基因产物的量。
另外,结合活性可以通过局部熔化区域中的DNA来增强转录,从而允许转录机器更容易地结合或延长基因,这将增加产生的基因产物的量。因此,使用此方法可以靶向rghR2调节子中的任何基因(或地衣芽孢杆菌细胞中的任何其他基因)用于基因表达的调节(上调或下调)。
例如,为了用核酸酶缺陷型Cas9蛋白靶向yvcZ基因,在yvcZ ORF内可以靶向的有19个独特靶位点(SEQ ID NO:121至139)。如实例6中所述,可以将这些靶序列制成gRNA表达盒。
核酸酶缺陷型Cas9表达盒(例如,如上文实例6中所述构建)与靶基因的gRNA表达盒的共同递送允许通过沉默或激活基因内的转录来改变(调节)基因剂量。通过同时递送多个gRNA表达盒,可能同时靶向和调节多个基因。通过使用本领域技术人员已知的方法(如RNAseq),在含有核酸酶缺陷型Cas9表达盒和一个或多个gRNA表达盒的细胞中容易地监测基因调节(上调或下调)。
实例8
在包含rghR2rest的经修饰的细胞中异源G4淀粉酶的增强的产生
在本实例中,包含具有18-bp重复的rghR2基因(SEQ ID NO:3)的地衣芽孢杆菌细胞和包含缺乏18-bp重复的rghR2基因(rghR2rest;SEQ ID NO:1)的地衣芽孢杆菌细胞均包含编码假单胞菌属物种AM1的异源G4淀粉酶(变体)的表达盒(SEQ ID NO:142)的单拷贝(例如,参见PCT公开号WO 2010/133644,特别地通过引用以其整体结合在此)。如实例2中所述培养两种菌株,并如所述用Ceralpha试剂测定48小时后取出的样品。相对于包含rghR2中的18-bp重复的菌株,rghR2rest菌株中的比生产力(G4淀粉酶产生/OD600)倍数差异示于表7中。
表7
来自rghR2rest细胞的G4淀粉酶的比生产力
因此,如以上表7中所示,相对于包含在rghR2基因中的18-bp重复的地衣芽孢杆菌细胞,地衣芽孢杆菌rghR2rest细胞中异源G4淀粉酶的比生产力(Qp)显著改善。
实例9
在包含rghR2rest的经修饰的细胞中碱性淀粉酶的增强的产生
在本实例中,包含具有18-bp重复的rghR2基因(SEQ ID NO:3)的地衣芽孢杆菌细胞以及包含rghR2rest基因(SEQ ID NO:1)的地衣芽孢杆菌细胞包含以下任一个的单拷贝:(1)整合到地衣芽孢杆菌基因组中的碱性α-淀粉酶变体1的表达盒、(2)整合到地衣芽孢杆菌基因组的碱性α-淀粉酶变体2的表达盒、(3)整合到地衣芽孢杆菌基因组中的碱性α-淀粉酶变体3的表达盒、或(4)整合到地衣芽孢杆菌基因组的碱性α-淀粉酶变体4的表达盒。将菌株在补料分批***中发酵,并且在发酵结束时,取样并使用如实例2中所述的麦格酶公司(Megazyme)的Ceralpha试剂测定α-淀粉酶活性。在rghR2中没有18-bp重复的菌株与在rghR2中有18-bp重复的菌株进行比较,其中淀粉酶产生的倍数差异示于表8中。
表8
在补料分批培养中来自rghR2rest菌株的碱性淀粉酶产生
因此,如以上表8中所示,相对于包含在rghR2基因中的18-bp重复的地衣芽孢杆菌细胞,地衣芽孢杆菌rghR2rest细胞的补料分批培养中的碱性淀粉酶的产生得到改善。
实例10
在包含rghR2rest的芽孢杆菌属细胞中增强的脂肪酶产生
在本实例中,包含具有18-bp重复的rghR2基因(SEQ ID NO:3)的地衣芽孢杆菌细胞和包含rghR2rest基因(SEQ ID NO:1)的地衣芽孢杆菌细胞两者均包含编码包含脂肪酶/酯酶活性的异源EC 3.1.1.3酶的表达盒的单拷贝。因此,如实例2中所述培养两种菌株,并根据供应商的说明对48小时后取出的等量样品进行SDS-PAGE(英杰公司(Invitrogen)4%-12%NuPAGE Bis-Tris凝胶,赛默飞世尔公司(ThermoFischer)的)。染色的SDS-PAGE蛋白质凝胶(图9)显示了由地衣芽孢杆菌rghR2rest菌株产生的EC 3.1.1.3酶(约28kDa)增加的水平(参见图9,泳道1)。因此,如图9所示,相对于包含具有18-bp重复的rghR2基因的地衣芽孢杆菌细胞,地衣芽孢杆菌rghR2rest细胞中异源脂肪酶/酯酶的产生得到改善。
实例11
在补料分批培养中rghR2rest菌株中α淀粉酶的增强的产生
在本实例中,包含具有18-bp重复的rghR2基因(SEQ ID NO:3)的地衣芽孢杆菌细胞和包含rghR2rest基因(SEQ ID NO:1)的地衣芽孢杆菌细胞两者均包含编码PCT公开号WO2014/164834中描述的异源噬细胞菌属物种变体#2α-淀粉酶的表达盒(SEQ ID NO:143)的单拷贝。两种菌株在标准补料分批发酵条件下生长。如实例2中所述,使用麦格酶公司(Megazyme)的Ceralpha试剂在整个发酵过程中监测淀粉酶活性。相对于包含在rghR2基因中的18-bp重复的地衣芽孢杆菌细胞,地衣芽孢杆菌rghR2rest细胞的比生产力中的倍数差异示于以下表9中。
表9
来自补料分批培养中rghR2rest菌株的异源淀粉酶产生
因此,如表9所示,相对于包含具有18-bp重复的rghR2基因的细胞,在包含rghR2rest基因的细胞中,地衣芽孢杆菌细胞产生异源噬细胞菌属物种变体#2α-淀粉酶的比生产力改善了10%。
实例12
在包含等位基因rghR2rest和glcT1的经修饰的地衣芽孢杆菌细胞增强的淀粉酶产生
在本实例中,将异源α-淀粉酶表达盒引入亲本和经修饰的地衣芽孢杆菌细胞BF62和BF169中。更特别地,将用异源α-淀粉酶表达盒转化的亲本地衣芽孢杆菌宿主命名为“BF134”。同样地,用异源α-淀粉酶表达盒转化的包含rghR2rest基因的地衣芽孢杆菌(子代)细胞“BF62”被命名为“BF165”,并且包含等位基因glcT1和rghr2rest基因的地衣芽孢杆菌(子代)细胞“BF169”被命名为“BF260”,如下表10中所示。
地衣芽孢杆菌等位基因glcT1编码变体GlcT(转录抗终止)蛋白质,所述蛋白质在变体GlcT蛋白质的氨基酸位置67处包含苯丙氨酸(F)(F67),如于2018年1月03日提交的美国临时专利申请序列号US62/613,339所述的,将其通过引用以其整体结合在此。
表10
地衣芽孢杆菌亲本/子代细胞修饰
因此,包含携带木糖诱导的comK表达盒的质粒的亲本和经修饰的地衣芽孢杆菌BF62和BF169细胞(表10)在含有一百(100)μg/ml壮观霉素二盐酸盐的125ml带挡板的烧瓶中于十五(15)ml的L肉汤(1%(w/v)胰蛋白胨、0.5%酵母提取物(w/v)、1%NaCl(w/v))中在37℃和250RPM下生长过夜。将过夜培养物在两百五十(250)ml挡板烧瓶中在含有一百(100)μg/ml壮观霉素二盐酸盐的25ml新鲜L肉汤中稀释至0.7(OD600单位)。将细胞在37℃(250RPM)下生长一(1)小时。将D-木糖添加至来自50%(w/v)原料的0.1%(w/v)。使细胞在37℃(250RPM)下再生长四(4)小时,并在1700x g下沉淀七(7)分钟。
使用用过的培养基将细胞重悬于四分之一(1/4)体积的原始培养物中。将一百(100)μl的浓缩的细胞与大约一(1)μg的表达盒混合,所述表达盒包含(以5’至3’方向)相同的5’catH同源臂、catH基因和spoVGrrnIp杂合启动子(有效地连接到野生-型枯草芽孢杆菌aprE5’-UTR(WT-5’-UTR)),其中所述WT-5’-UTR有效地连接到编码lat信号序列的DNA,随后连接到编码变体嗜热脂肪土芽孢杆菌α-淀粉酶的DNA(ORF)。将编码变体嗜热脂肪土芽孢杆菌α-淀粉酶的DNA(ORF)的3’端有效地连接到lat终止子,所述lat终止子有效地连接到3’catH同源臂。将转化反应在37℃、1000RPM下孵育大约九十(90)分钟。
将转化混合物铺板在填充有L-肉汤的培养皿上,所述L-肉汤含有用1.5%(w/v)琼脂固化的十(10)μg/ml氯霉素。将板在37℃下孵育两(2)天。将菌落在用含有用1.5%(w/v)琼脂固化的1%(w/v)不溶性玉米淀粉的L-肉汤满充的培养皿上进行条纹纯化。将平板在37℃下孵育二十四(24)小时直至形成菌落。通过清除菌落周围的不溶性淀粉(形成晕圈)来指示淀粉水解,并用于选择表达变体嗜热脂肪土芽孢杆菌α-淀粉酶蛋白质的转化体。使用标准技术以及正向和反向引物,将菌落PCR用于扩增来自菌落产生的晕圈的catH基因座。将包含表达盒的序列验证的地衣芽孢杆菌(子代)细胞储存并命名,如表10的第3列中所示。
因此,在小规模条件下评估包含α-淀粉酶表达盒的命名为BF165(即,rghr2rest)和BF260(即,rghr2rest+glcT1)的地衣芽孢杆菌菌株的α-淀粉酶产生。在含有1%(w·v-1)不溶性淀粉的L琼脂平板上对菌株进行条纹纯化,并在37℃下生长大约二十四(24)小时。将单个晕圈阳性菌落接种到15ml的胰蛋白酶大豆肉汤(1.7%(w·v-1)胰蛋白胨、0.3%(w·v-1)大豆胨、0.25%(w·v-1)葡萄糖、0.5%(w·v-1)氯化钠、0.25%(w·v-1)磷酸氢二钾)中并在37℃(250RPM)下生长6小时。随后,将0.025ml的此种子培养物接种到25ml的烧瓶生长培养基(4%(w·v-1)MES、0.1%(w·v-1)磷酸二氢钾、0.05%(w·v-1)氯化钠、0.03%(w·v-1)大豆胨,含有微量金属,pH 6.8,具有氢氧化铵)中。添加单个高葡萄糖释放进料珠(Kuhner公司)(进料速率57mg/L.hr)。使培养物在42℃(250RPM)下生长90小时。使用具有BSA标准的布拉福德(Bradford)方法确定总分泌的蛋白质生产。对于每种菌株,从至少两个独立***重复测量平均的相对α-淀粉酶生产显示在以下表11中。
表11
α-淀粉酶的小规模生产
因此,如表11所示,当与芽孢杆菌属宿主细胞BF165(包含rghR2rest和野生型glcT基因)相比(相对于)时,芽孢杆菌属BF260细胞(包含rghR2rest和等位基因glcT1)表明,相对α-淀粉酶生产的大约9%增加。因此,在某些实施例中,本公开的包含复原型rghR2基因(rghR2rest)的经修饰的地衣芽孢杆菌细胞进一步包含含有等位基因glcT1(SEQ ID NO:144)的核酸构建体,所述等位基因编码包含在变体GlcT蛋白质的氨基酸位置67处亮氨酸(L)向苯丙氨酸(F)取代的变体GlcT蛋白质。
参考文献
Albertini and Galizzi,Bacteriol.,162:1203-1211,1985.
Bergmeyer et al.,“Methods of Enzymatic Analysis”vol.5,Peptidases,Proteinases and their Inhibitors,Verlag Chemie,Weinheim,1984.
Botstein and Shortle,Science 229:4719,1985.
Brode et al.,“Subtilisin BPN’variants:increased hydrolytic activityon surface-bound substrates via decreased surface activity”,Biochemistry,35(10):3162-3169,1996.
Caspers et al.,“Improvement of Sec-dependent secretion of aheterologous model protein in Bacillus subtilis by saturation mutagenesis ofthe N-domain of the AmyE signal peptide”,Appl.Microbiol.Biotechnol.,86(6):1877-1885,2010.
Chang et al.,Mol.Gen.Genet.,168:11-115,1979.
Christianson et al.,Anal.Biochem.,223:119-129,1994.
Devereux et a/.,Nucl.Acid Res.,12:387-395,1984.
Earl et al.,“Ecology and genomics of Bacillus subtilis”,Trends inMicrobiology.,16(6):269-275,2008.
Ferrari et al.,“Genetics,”in Harwood et al.(ed.),Bacillus,PlenumPublishing Corp.,1989.
Fisher et.al.,Arch.Microbiol.,139:213-217,1981.
Guerot-Fleury,Gene,167:335-337,1995.
Hamoen et al.,“Controlling competence in Bacillus subtilis:sharedused of regulators”,Microbiology,149:9-17,2003.
Hamoen et al.,Genes Dev.12:1539-1550,1998.
Hampton et al.,Seroloαical Methods,A Laboratory Manual,APS Press,St.Paul,MN,1990.
Hardwood and Cutting(eds.)Molecular Biological Methods for Bacillus,John Wiley&Sons,1990.
Hayashi et al.,Mol.Microbiol.,59(6):1714-1729,2006
Higuchi et al.,Nucleic Acids Research 16:7351,1988.
Ho et al.,Gene 77:61,1989.
Hoch et al.,J.Bacteriol.,93:1925-1937,1967.
Holubova,Folia Microbiol.,30:97,1985.
Hopwood,The Isolation of Mutants in Methods in Microbiology(J.R.Norris and D.W.Ribbons,eds.)pp 363-433,Academic Press,New York,1970.
Horton et al.,Gene 77:61,1989.
Hsia et al.,Anal Biochem.,242:221-227,1999.
Iglesias and Trautner,Molecular General Genetics 189:73-76,1983.
Jensen et al.,“Cell-associated degradation affects the yield ofsecreted engineered and heterologous proteins in the Bacillus subtilisexpression system”Microbiology,146(Pt 10:2583-2594,2000.
Liu and Zuber,1998,
Lo et al.,Proceedings of the National Academy of Sciences USA 81:2285,1985.
Maddox et al.,J.Exp.Med.,158:1211,1983.
Mann et al.,Current Microbiol.,13:131-135,1986.
McDonald,J.Gen.Microbiol.,130:203,1984.
Needleman and Wunsch,J.Mol.Biol.,48:443,1970.
Ogura&Fujita,FEMS Microbiol Lett.,268(1):73-80.2007.
Olempska-Beer et al.,“Food-processing enzymes from recombinantmicroorganisms--a review”’Regul.Toxicol.Pharmacol.,45(2):144-158,2006.
Palmeros et al.,Gene 247:255-264,2000.
Parish and Stoker,FEMS Microbiology Letters 154:151-157,1997.
Pearson and Lipman,Proc.Natl.Acad.Sci.USA 85:2444,1988.
Perego,1993,In A.L.Sonneshein,J.A.Hoch,and R.Losick,editors,Bacillussubtilis and Other Gram-Positive Bacteria,Chapter 42,American Society ofMicrobiology,Washington,D.C.
Raul et al.,“Production and partial purification of alpha amylasefrom Bacillus subtilis(MTCC 121)using solid state fermentation”,BiochemistryResearch International,2014.
Sarkar and Sommer,BioTechniques 8:404,1990.
Saunders et al.,J.Bacteriol.,157:718-726,1984.
Shimada,Meth.Mol.Biol.57:157;1996
Smith and Waterman,Adv.Appl.Math.,2:482,1981.
Smith et al.,Appl.Env.Microbiol.,51:634 1986.
Stahl and Ferrari,J.Bacteriol.,158:411-418,1984.
Stahl et al,J.Bacteriol.,158:411-418,1984.
Tarkinen,et al,J.Biol.Chem.258:1007-1013,1983.
Trieu-Cuot et al.,Gene,23:331-341,1983.
Van Dijl and Hecker,“Bacillus subtilis:from soil bacterium to super-secreting cell factory”,Microbial Cell Factories,12(3).2013.
Vorobjeva et al.,FEMS Microbiol.Lett.,7:261-263,1980.
Ward,“Proteinases,”in Fogarty(ed.).,Microbial Enzymes andBiotechnology.Applied Science,London,pp 251-317,1983.
Wells et al.,Nucleic Acids Res.11:7911-7925,1983.
Westers et al.,“Bacillus subtilis as cell factory for pharmaceuticalproteins:a biotechnological approach to optimize the host organism”,Biochimica et Biophysica Acta.,1694:299-310,2004.
Yang et al,J.Bacteriol.,160:15-21,1984.
Yang et al.,Nucleic Acids Res.11:237-249,1983.
Youngman et al.,Proc.Natl.Acad.Sci.USA 80:2305-2309,1983.

Claims (7)

1.一种用于恢复亲本地衣芽孢杆菌细胞中灭活的RghR2蛋白质的活性的方法,其中所述亲本地衣芽孢杆菌细胞包含编码灭活的RghR2蛋白质的rghR2基因,所述方法包括:
(a)获得亲本地衣芽孢杆菌细胞,所述亲本地衣芽孢杆菌细胞包含编码灭活的RghR2蛋白质的基因,其中编码RghR2蛋白质的基因包含在所述rghR2基因中的18核苷酸重复,所述rghR2基因中的18核苷酸重复编码对应于SEQ ID NO:4所示的RghR2蛋白质的氨基酸位置38-43处氨基酸位置处的氨基酸AAAISR的重复,以及
(b)通过缺失所述rghR2基因中的18核苷酸重复以产生rghR2rest基因来修饰步骤(a)所述的细胞,其中所述rghR2rest基因由此编码活性RghR2蛋白质。
2.一种用于恢复亲本地衣芽孢杆菌细胞中灭活的RghR2蛋白质的活性的方法,其中所述亲本地衣芽孢杆菌细胞包含编码灭活的RghR2蛋白质的rghR2dup基因,所述方法包括:
(a)获得亲本地衣芽孢杆菌细胞,所述亲本地衣芽孢杆菌细胞包含编码RghR2蛋白质的rghR2dup基因,其中所述编码RghR2蛋白质的rghR2dup基因包含在所述rghR2基因中的18核苷酸重复,所述rghR2基因中的18核苷酸重复编码对应于SEQ ID NO:4所示的RghR2蛋白质的氨基酸位置38-43处氨基酸位置处的氨基酸AAAISR的重复,
(b)通过向步骤(a)所述的亲本地衣芽孢杆菌细胞中引入多核苷酸构建体来修饰步骤(a)所述的亲本地衣芽孢杆菌细胞,所述多核苷酸构建体包含5’启动子区,所述5’启动子区有效地连接到编码缺失了氨基酸AAAISR重复的RghR2蛋白质的rghR2rest核酸序列,以及
(c)表达引入步骤(b)中获得的细胞中的多核苷酸构建体,所述多核苷酸构建体编码活性RghR2蛋白质。
3.一种用于增加地衣芽孢杆菌细胞中内源目的蛋白的产生的方法,所述方法包括:
(a)获得亲本地衣芽孢杆菌细胞,所述亲本地衣芽孢杆菌细胞包含编码灭活的RghR2蛋白质的基因,其中编码RghR2蛋白质的基因包含在rghR2基因中的18核苷酸重复,所述rghR2基因中的18核苷酸重复编码对应于SEQ ID NO:4所示的RghR2蛋白质的氨基酸位置38-43处氨基酸位置处的氨基酸AAAISR的重复,
(b)通过缺失所述rghR2基因中的18核苷酸重复来修饰步骤(a)所述的细胞,其中所述rghR2基因由此编码活性RghR2蛋白质,
(c)在适于产生所述内源目的蛋白质的培养基中培养步骤(b)所述的经修饰的细胞,以及
(d)从所述培养基或细胞裂解物中回收步骤(c)中产生的内源目的蛋白质,
其中当将步骤(a)所述的细胞与步骤(b)所述的细胞在相同的条件下培养时,相对于步骤(a)中获得的所述亲本地衣芽孢杆菌细胞,步骤(b)所述的经修饰的地衣芽孢杆菌细胞产生增加量的内源目的蛋白质。
4.如权利要求3所述的方法,其中目的蛋白的所述增加的量是相对于所述亲本细胞的至少1.0%增加。
5.如权利要求1-3中任一项所述的方法,其中亲本细胞中的灭活的RghR2蛋白质由下述氨基酸序列组成:SEQ ID NO:4所示的氨基酸序列,或其中编码亲本细胞中的灭活的RghR2蛋白质的基因由下述核酸序列组成:SEQ ID NO:3所示的核酸序列。
6.如权利要求1-3中任一项所述的方法,其中经修饰的细胞中的编码活性RghR2蛋白质的rghR2基因由下述核酸序列组成:SEQ ID NO:1所示的核酸序列,或经修饰的细胞中的活性RghR2蛋白质由下述氨基酸序列组成:SEQ ID NO:2所示的氨基酸序列。
7.一种用于鉴定包含编码灭活的作为转录调节蛋白质的RghR2蛋白质的变体rghR2基因的地衣芽孢杆菌菌株的方法,所述方法包括:
(a)获得地衣芽孢杆菌菌株,并对其中的rghR2基因进行测序,
(b)比对和比较测序的rghR2基因与SEQ ID NO:1的天然rghR2基因,
其中包含测序的rghR2基因的地衣芽孢杆菌菌株包含编码灭活的RghR2蛋白质的变体rghR2基因,所述测序的rghR2基因包含在所述rghR2基因中的18核苷酸重复,所述rghR2基因中的18核苷酸重复编码对应于SEQ ID NO:4所示的RghR2蛋白质的氨基酸位置38-43处氨基酸位置处的氨基酸AAAISR的重复。
CN201880024359.9A 2017-02-24 2018-02-22 用于增加地衣芽孢杆菌中蛋白质产生的组合物和方法 Active CN110520520B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762463268P 2017-02-24 2017-02-24
US62/463,268 2017-02-24
PCT/US2018/019140 WO2018156705A1 (en) 2017-02-24 2018-02-22 Compositions and methods for increased protein production in bacillus licheniformis

Publications (2)

Publication Number Publication Date
CN110520520A CN110520520A (zh) 2019-11-29
CN110520520B true CN110520520B (zh) 2024-03-22

Family

ID=61563545

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880024359.9A Active CN110520520B (zh) 2017-02-24 2018-02-22 用于增加地衣芽孢杆菌中蛋白质产生的组合物和方法

Country Status (8)

Country Link
US (2) US11866713B2 (zh)
EP (2) EP4353828A3 (zh)
JP (1) JP7231228B2 (zh)
KR (1) KR102375732B1 (zh)
CN (1) CN110520520B (zh)
DK (1) DK3585910T3 (zh)
FI (1) FI3585910T3 (zh)
WO (1) WO2018156705A1 (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7280269B2 (ja) * 2018-01-03 2023-05-23 ダニスコ・ユーエス・インク タンパク質の産生増加のための変異及び遺伝子改変バチルス属(bacillus)細胞、並びにその方法
CN113366108A (zh) * 2018-11-28 2021-09-07 丹尼斯科美国公司 新颖启动子序列及其增强芽孢杆菌属细胞蛋白生产的方法
WO2020206202A1 (en) 2019-04-05 2020-10-08 Danisco Us Inc Methods for integrating a donor dna sequence into the genome of bacillus using linear recombinant dna constructs and compositions thereof
MX2021012157A (es) 2019-04-05 2022-01-06 Danisco Us Inc Métodos para la integración de polinucleótidos en el genoma de bacillus usando constructos de adn recombinante circular dual y composiciones de los mismos.
KR20220041928A (ko) * 2019-08-14 2022-04-01 다니스코 유에스 인크. 바실러스 리체니포르미스에서 단백질 생산을 증가시키기 위한 조성물 및 방법
CN112980755B (zh) * 2019-12-13 2023-05-12 中国科学院天津工业生物技术研究所 高效分泌异淀粉酶的基因工程菌
CN114945665A (zh) 2020-01-15 2022-08-26 丹尼斯科美国公司 用于增强地衣芽孢杆菌中蛋白产生的组合物和方法
GB202001211D0 (en) * 2020-01-29 2020-03-11 Imperial College Innovations Ltd Methods
US20230139192A1 (en) * 2020-03-04 2023-05-04 Basf Se Shuttle vector for expression in e. coli and bacilli
CN112062822B (zh) * 2020-09-24 2022-02-01 江南大学 一种碳分解代谢调控蛋白CcpA突变体I42A
CN112062821B (zh) * 2020-09-24 2022-02-01 江南大学 一种碳分解代谢调控蛋白CcpA突变体K31A
US20240101611A1 (en) 2021-02-22 2024-03-28 Danisco Us Inc. Methods and compositions for producing proteins of interest in pigment deficient bacillus cells
WO2022251109A1 (en) 2021-05-24 2022-12-01 Danisco Us Inc. Compositions and methods for enhanced protein production in bacillus cells
CN113430179B (zh) * 2021-06-28 2022-05-20 济宁医学院 具有越膜能力的、高稳定型的超氧化物歧化酶的制备方法
EP4387982A2 (en) 2021-08-20 2024-06-26 Danisco US Inc. Methods and compositions for enhanced protein production in bacillus cells
WO2023091878A1 (en) 2021-11-16 2023-05-25 Danisco Us Inc. Compositions and methods for enhanced protein production in bacillus cells
WO2023091631A2 (en) 2021-11-18 2023-05-25 Dansico Us Inc. High performance alphα-amylases for starch liquefaction
WO2024118881A1 (en) 2022-12-01 2024-06-06 Genencor International Bv Iterative muliplex genome engineering in microbial cells using a bidirectional selection marker system
WO2024118882A1 (en) 2022-12-01 2024-06-06 Genencor International Bv Iterative multiplex genome engineering in microbial cells using a selection marker swapping system
WO2024118876A1 (en) 2022-12-01 2024-06-06 Genencor International Bv Iterative multiplex genome engineering in microbial cells using a recombinant self-excisable selection marker system

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008066931A2 (en) * 2006-11-29 2008-06-05 Novozymes, Inc. Bacillus licheniformis chromosome

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4760025A (en) 1984-05-29 1988-07-26 Genencor, Inc. Modified enzymes and methods for making same
US5310675A (en) 1983-06-24 1994-05-10 Genencor, Inc. Procaryotic carbonyl hydrolases
US5763257A (en) 1984-05-29 1998-06-09 Genencor International, Inc. Modified subtilisins having amino acid alterations
EP0254735B2 (en) 1986-01-15 1998-06-17 Amgen Inc. METHOD FOR PRODUCTION OF THERMALLY STABLE AND pH STABLE SUBTILISIN ANALOGS
US4980288A (en) 1986-02-12 1990-12-25 Genex Corporation Subtilisin with increased thermal stability
US4914031A (en) 1987-04-10 1990-04-03 Amgen, Inc. Subtilisin analogs
DK6488D0 (da) 1988-01-07 1988-01-07 Novo Industri As Enzymer
PT89702B (pt) 1988-02-11 1994-04-29 Gist Brocades Nv Processo para a preparacao de novos enzimas proteoliticos e de detergentes que os contem
DE3909096A1 (de) 1989-03-20 1990-09-27 Garabed Antranikian Alpha-amylase
US5665587A (en) 1989-06-26 1997-09-09 Novo Nordisk A/S Modified subtilisins and detergent compositions containing same
DK97190D0 (da) 1990-04-19 1990-04-19 Novo Nordisk As Oxidationsstabile detergentenzymer
US5482849A (en) 1990-12-21 1996-01-09 Novo Nordisk A/S Subtilisin mutants
WO1992019729A1 (en) 1991-05-01 1992-11-12 Novo Nordisk A/S Stabilized enzymes and detergent compositions
JPH08506491A (ja) 1993-02-11 1996-07-16 ジェネンカー インターナショナル,インコーポレイティド 酸化安定性アルファ−アミラーゼ
DE4411223A1 (de) 1994-03-31 1995-10-05 Solvay Enzymes Gmbh & Co Kg Verwendung alkalischer Proteasen in gewerblichen Textilwaschverfahren
EP1023439B1 (en) 1997-10-13 2009-02-18 Novozymes A/S alpha-AMYLASE MUTANTS
MA25044A1 (fr) 1997-10-23 2000-10-01 Procter & Gamble Compositions de lavage contenant des variants de proteases multisubstituees.
EP1058724B1 (en) 1998-02-27 2010-12-01 Novozymes A/S Maltogenic alpha-amylase variants
US6835550B1 (en) 1998-04-15 2004-12-28 Genencor International, Inc. Mutant proteins having lower allergenic response in humans and methods for constructing, identifying and producing such proteins
US6197565B1 (en) 1998-11-16 2001-03-06 Novo-Nordisk A/S α-Amylase variants
BRPI0009362B8 (pt) 1999-03-30 2019-08-20 Novozymes As variante de uma alfa-amilase precursora, e, uso de uma variante de alfa-amilase
DE60029955D1 (de) * 1999-05-28 2006-09-21 Novozymes As Endo-beta-1,4-glukanasen
US6509185B1 (en) 2000-01-07 2003-01-21 Genencor International, Inc. Mutant aprE promotor
CA2418317A1 (en) 2000-08-11 2002-02-21 Genencor International, Inc. Bacillus transformation, transformants and mutant libraries
EP1355931A2 (en) * 2000-10-06 2003-10-29 Novozymes Biotech, Inc. Methods for monitoring multiple gene expression
DK1495128T3 (da) 2002-03-29 2014-08-11 Genencor Int Forstærket proteinekspression i Bacillus
CA2483006C (en) 2002-04-22 2013-10-29 Genencor International, Inc. Methods of creating modified promoters resulting in varying levels of gene expression
DE102004030938A1 (de) * 2004-06-26 2006-01-12 Henkel Kgaa Neue, Polyaminosäuren bildende oder abbauende Genprodukte von Bacillus licheniformis und darauf aufbauende verbesserte biotechnologische Produktionsverfahren
DE102004047776B4 (de) 2004-10-01 2018-05-09 Basf Se Gegen Di- und/oder Multimerisierung stabilisierte Alpha-Amylase-Varianten, Verfahren zu deren Herstellung sowie deren Verwendung
DE102004047777B4 (de) 2004-10-01 2018-05-09 Basf Se Alpha-Amylase-Varianten mit erhöhter Lösungsmittelstabilität, Verfahren zu deren Herstellung sowie deren Verwendung
ZA200706858B (en) 2005-02-18 2008-10-29 Genencor Int Polypeptides having alpha-amylase and granular starch hydrolyzing activity
US7968691B2 (en) 2006-08-23 2011-06-28 Danisco Us Inc. Pullulanase variants with increased productivity
WO2008112459A2 (en) 2007-03-09 2008-09-18 Danisco Us Inc., Genencor Division Alkaliphilic bacillus species a-amylase variants, compositions comprising a-amylase variants, and methods of use
RU2009149406A (ru) 2007-05-30 2011-07-10 ДАНИСКО ЮЭс, ИНК., ДЖЕНЕНКОР ДИВИЖН (US) Варианты альфа-амилазы с повышенными уровнями продукции в процессах ферментации
KR20100024395A (ko) 2007-05-30 2010-03-05 다니스코 유에스 인크. 바실러스 리케니포르미스 알파-아밀라아제의 개선된 변이체
ES2527645T3 (es) 2008-06-06 2015-01-27 Danisco Us Inc. Variantes de alfa-amilasa de Geobacillus stearothermophilus (AMYS) con propiedades mejoradas
CN102428176B (zh) 2009-05-19 2016-11-16 杜邦营养生物科学有限公司 淀粉酶多肽
JP5687566B2 (ja) 2011-06-01 2015-03-18 日東電工株式会社 防水通音部材
CN104053780A (zh) 2011-12-09 2014-09-17 丹尼斯科美国公司 用于在微生物中生产蛋白质的来自枯草芽孢杆菌的核糖体启动子
EP3336183B1 (en) 2013-03-11 2021-05-12 Danisco US Inc. Alpha-amylase conbinatorial variants

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008066931A2 (en) * 2006-11-29 2008-06-05 Novozymes, Inc. Bacillus licheniformis chromosome

Also Published As

Publication number Publication date
DK3585910T3 (da) 2024-06-17
JP7231228B2 (ja) 2023-03-01
US11866713B2 (en) 2024-01-09
CN110520520A (zh) 2019-11-29
WO2018156705A1 (en) 2018-08-30
EP4353828A3 (en) 2024-07-24
EP3585910A1 (en) 2020-01-01
EP4353828A2 (en) 2024-04-17
FI3585910T3 (fi) 2024-06-19
US20200056193A1 (en) 2020-02-20
JP2020508072A (ja) 2020-03-19
KR102375732B1 (ko) 2022-03-16
KR20190121331A (ko) 2019-10-25
US20240182914A1 (en) 2024-06-06
EP3585910B1 (en) 2024-03-20

Similar Documents

Publication Publication Date Title
CN110520520B (zh) 用于增加地衣芽孢杆菌中蛋白质产生的组合物和方法
US11781147B2 (en) Promoter sequences and methods thereof for enhanced protein production in Bacillus cells
JP7218985B2 (ja) バチルス属(Bacillus)におけるタンパク質産生の増加のための改変5’-非翻訳領域(UTR)配列
US20240102028A1 (en) Methods and compositions for efficient genetic modifications of bacillus licheniformis strains
CN111670244B (zh) 突变的和遗传修饰的芽孢杆菌属细胞及其用于增加蛋白质产生的方法
US20230340442A1 (en) Compositions and methods for enhanced protein production in bacillus licheniformis
CN117836315A (zh) 用于增强芽孢杆菌属细胞中蛋白质产生的方法和组合物
US20220389372A1 (en) Compositions and methods for enhanced protein production in bacillus cells
US20220282234A1 (en) Compositions and methods for increased protein production in bacillus lichenformis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant