CN116897160A - 在色素缺陷型芽孢杆菌属细胞中产生目的蛋白的方法和组合物 - Google Patents

在色素缺陷型芽孢杆菌属细胞中产生目的蛋白的方法和组合物 Download PDF

Info

Publication number
CN116897160A
CN116897160A CN202280015356.5A CN202280015356A CN116897160A CN 116897160 A CN116897160 A CN 116897160A CN 202280015356 A CN202280015356 A CN 202280015356A CN 116897160 A CN116897160 A CN 116897160A
Authority
CN
China
Prior art keywords
yvma
bacillus
cell
protein
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280015356.5A
Other languages
English (en)
Inventor
R·L·弗里希
I·哈卢姆
M·卡里莫夫
C·J·韦伯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Danisco US Inc
Original Assignee
Danisco US Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Danisco US Inc filed Critical Danisco US Inc
Publication of CN116897160A publication Critical patent/CN116897160A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/32Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/75Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/52Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from bacteria or Archaea
    • C12N9/54Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from bacteria or Archaea bacteria being Bacillus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/07Bacillus
    • C12R2001/125Bacillus subtilis ; Hay bacillus; Grass bacillus

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本公开的某些实施例涉及用于在色素缺陷型芽孢杆菌属细胞中产生目的蛋白的组合物和方法。某些其他实施例涉及用于获得色素缺陷型芽孢杆菌属细胞的组合物和方法。某些其他实施例涉及用于生长/培养/发酵色素缺陷型芽孢杆菌属细胞的组合物和方法。因此,某些其他实施例涉及用于产生、分离、回收等色素缺陷型目的蛋白的组合物和方法。

Description

在色素缺陷型芽孢杆菌属细胞中产生目的蛋白的方法和组 合物
相关申请的交叉引用
本申请要求2021年2月22日提交的美国临时申请号63/151,931的权益,该临时申请通过引用以其全文特此并入。
技术领域
本公开总体上涉及细菌学、微生物学、遗传学、分子生物学、酶学、工业蛋白质生产等领域。本公开的某些实施例涉及用于获得色素缺陷型芽孢杆菌属细胞的组合物和方法、用于生长/培养/发酵色素缺陷型芽孢杆菌属细胞的方法、用于在色素缺陷型芽孢杆菌属细胞中产生目的蛋白的方法等。
序列表的引用
命名为“NB41351-US-PSP_SequenceListing.txt”的文本文件序列表的电子提交的内容创建于2021年2月2日,并且大小为76KB,将其通过引用以其全文特此并入。
背景技术
***如枯草芽孢杆菌(Bacillus subtilis)、地衣芽孢杆菌(Bacilluslicheniformis)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)等由于其优异的发酵特性和高产率(例如,高达25克/升培养物;Van Dijl和Hecker,2013)经常被用作用于生产工业相关蛋白质的微生物工厂。例如,芽孢杆菌属宿主细胞(菌株)因其生产食品、纺织品、洗衣、医疗器械清洗、制药工业等所必需的淀粉酶(Jensen等人,2000;Raul等人,2014)和蛋白酶(Brode等人,1996)而被熟知(Westers等人,2004)。
然而,具有所期望性状如增加的蛋白质产生、提高的生长速率等的芽孢杆菌属宿主细胞不一定具有成功发酵、回收和纯化由这些细胞产生的蛋白质的最期望特征。例如,这些方法可能不是最佳的,因为红色素形成(即,普切明(pulcherrimin)),需要在目的蛋白的回收和纯化过程中除去,或者红色素可以与蛋白质共纯化。如本领域中通常所理解的,普切明是由普切明酸螯合铁离子而产生的微红色素。已经描述了通过枯草芽孢杆菌(Uffen和Canale-Parola,1972)和蜡状芽孢杆菌(Bacillus cereus)(MacDonald,1967)合成普切明酸。
尽管已经描述了用于减轻芽孢杆菌属发酵过程中红色素(普切明)形成的某些方法(PCT公开号WO 2004/011609),但这些方法对于芽孢杆菌属(宿主)菌株的其他所期望性状(如提高的体积生产率、提高的特定蛋白质产生、提高的总蛋白质产生、提高的生长速率、菌株适应性等)可能并不总是最佳的。如下文所述,本公开解决了本领域中对在红色素产生方面有缺陷的改良芽孢杆菌属宿主细胞(菌株)的某些持续需求。
发明内容
如本文一般性描述的,本公开的某些实施例涉及色素缺陷型芽孢杆菌属细胞。因此,本公开的某些实施例涉及用于获得色素缺陷型芽孢杆菌属细胞的组合物和方法,和/或用于生长/培养/发酵色素缺陷型芽孢杆菌属细胞的组合物和方法。本公开的其他实施例涉及用于在色素缺陷型芽孢杆菌属细胞中产生目的蛋白的组合物和方法。因此,某些其他实施例涉及用于产生、分离、回收等为色素缺陷型目的蛋白的组合物和方法。在其他实施例中,本公开涉及经由添加铝离子(例如,AlCl3)来减轻、减少或消除芽孢杆菌属发酵过程中红色素(普切明)的方法。
因此,本公开的某些实施例涉及遗传修饰的衍生自亲本芽孢杆菌属细胞的芽孢杆菌属细胞。例如,在某些实施例中,本公开涉及衍生自亲本芽孢杆菌属细胞的经修饰的芽孢杆菌属细胞,其中该经修饰的细胞包含引入的编码功能性YvmA蛋白的yvmA表达盒,其中当在相同条件下培养时,该经修饰的细胞相对于亲本细胞在红色素的产生方面有缺陷。
在某些其他实施例中,本公开涉及经修饰的芽孢杆菌属细胞,其衍生自包含编码功能性YvmA蛋白的yvmA基因的亲本芽孢杆菌属细胞。例如,在某些实施例中,本公开涉及衍生自包含编码功能性YvmA蛋白的yvmA基因的亲本芽孢杆菌属细胞的经修饰的芽孢杆菌属细胞,其中该经修饰的细胞包含用异源启动子(序列)替代yvmA基因的天然yvmA启动子(序列)的遗传修饰,该异源启动子(序列)能够相对于天然yvmA启动子增加yvmA基因的表达,其中当在相同条件下培养时,该经修饰的细胞相对于亲本细胞在红色素的产生方面有缺陷。
在某些实施例中,本公开的经修饰的芽孢杆菌属细胞(即,在红色素的产生方面有缺陷)表达并产生一种或多种目的蛋白。因此,某些其他实施例涉及由本公开的经修饰的芽孢杆菌属细胞产生的分离的目的蛋白(POI)。在其他实施例中,由本公开的经修饰的芽孢杆菌属细胞产生的分离的POI不包含可观察到的红色素。在某些实施例中,红色素被进一步定义为普切明。
某些其他实施例涉及用于生长/培养/发酵色素缺陷型芽孢杆菌属细胞的方法。例如,在某些实施例中,本公开涉及用于培养在红色素的产生方面有缺陷的芽孢杆菌属细胞的方法,该方法包括(a)通过在亲本芽孢杆菌属细胞中引入编码功能性YvmA蛋白的表达盒来修饰亲本芽孢杆菌属细胞,和(b)在合适的条件下培养该经修饰的细胞,其中当在相同条件下培养时,该经修饰的细胞相对于亲本细胞在红色素的产生方面有缺陷。
某些其他实施例涉及用于培养在红色素的产生方面有缺陷的芽孢杆菌属细胞的方法,该方法包括(a)获得包含编码功能性YvmA蛋白的yvmA基因的亲本芽孢杆菌属细胞,并用相对于天然yvmA启动子能够增加yvmA基因表达的异源启动子(序列)替代编码功能性YvmA蛋白的yvmA基因的天然yvmA启动子(序列),和(b)在合适的条件下培养该经修饰的细胞,其中当在相同条件下培养时,该经修饰的细胞相对于亲本细胞在红色素的产生方面有缺陷。
某些其他实施例涉及用于在色素缺陷型芽孢杆菌属细胞中产生目的蛋白(POI)的方法。例如,本公开的某些实施例涉及用于产生目的蛋白(POI)的方法,该方法包括(a)通过将编码功能性YvmA蛋白的表达盒引入亲本细胞中来修饰产生POI的亲本芽孢杆菌属细胞,和(b)在适合产生POI的条件下发酵该经修饰的细胞,其中当在相同条件下发酵时,该经修饰的细胞相对于亲本细胞在红色素的产生方面有缺陷。
某些其他实施例涉及用于产生目的蛋白(POI)的方法,该方法包括(a)获得包含编码功能性YvmA蛋白的yvmA基因的亲本芽孢杆菌属细胞并产生POI,(b)通过用相对于天然yvmA启动子能够增加yvmA基因表达的异源启动子(序列)替代yvmA基因的天然yvmA启动子(序列)来修饰该亲本细胞,以及(c)在适合产生POI的条件下发酵该经修饰的细胞,其中当在相同条件下发酵时,该经修饰的细胞相对于亲本细胞在红色素的产生方面有缺陷。
在某些实施例中,POI是内源蛋白和/或异源蛋白。在某些实施例中,该内源POI和/或异源POI是酶。在某些实施例中,该亲本芽孢杆菌属细胞包含引入的编码异源POI的表达盒。在其他实施例中,编码异源POI的表达盒被引入经修饰的芽孢杆菌属细胞中。因此,某些其他实施例涉及由经修饰的芽孢杆菌属细胞产生的分离的目的蛋白(POI)。在优选的实施例中,分离的POI不包含可观察到的红色素。在某些实施例中,红色素被进一步定义为普切明。
本公开的某些其他实施例涉及减轻芽孢杆菌属发酵肉汤中红色素颜色的组合物和方法,其包括在铝离子存在下发酵产生目的蛋白(POI)的芽孢杆菌属细胞。在某些优选的实施例中,铝离子以AlCl3或Al2(SO4)3的形式提供。
附图说明
图1显示了通过Cre-LOX***去除壮观霉素抗生素抗性标记后整合在spoIIIAE基因座处的yvmA过表达盒的示意图。例如,如图1所呈现,每个yvmA过表达盒包含与枯草芽孢杆菌yvmA ORF序列可操作地连接的上游(5′)异源启动子,其中测试的异源启动子(PsoVG、Phbs、PyvyD和PpstS)用箭头标记,并以从上到下递减的强度描绘(例如,参见图3A和图3B)。另外,如图1所呈现,来自spoVG 5′-UTR的Shine-Dalgarno序列(黑框)用于每个过表达盒,并保留了天然yvmA终止子(白框)。重组lox位点的下游位置用黑色对角影线标记(diagonalhatch marking)表示(图1)。
图2表明,在枯草芽孢杆菌宿主细胞(菌株)中yvmA的组成型过表达减少了红色/棕色发酵肉汤的颜色。例如,在37℃下在基于maltrin的培养基中生长二十四(24)、四十八(48)和七十二(72)小时的1x GG36菌株、1x GG36 PspoVG-yvmA菌株、1x GG36 Phbs-yvmA菌株、1x GG36 PyvyD-yvmA菌株和1x GG36 Ppts-yvmA菌株试管培养物的数字图像呈现在图2A中。另外,如图2B所示,对由于枯草芽孢杆菌产生菌株中yvmA的组成型过表达而导致的红色/棕色发酵肉汤颜色减少的定量证实了在图2A中观察到的定性结果。例如,图2A中所示的数字图像(其描绘了在37℃下在基于maltrin的培养基中生长二十四(24)、四十八(48)和七十二(72)小时的1x ADW菌株、1x GG36 PspoVG-yvmA菌株、1x GG36 Phbs-yvmA菌株、1xGG36 PyvyD-yvmA菌株和1x GG36Ppts-yvmA菌株试管培养物)的亮度呈现在图2B中,其中亮度(AU)使用Fiji软件进行定量,如Schindelin等人(2012)所述。
图3显示了枯草芽孢杆菌yvmA过表达菌株的普切明水平降低(例如,红色/棕色发酵肉汤颜色减少)与启动子强度正相关。例如,图3A显示了在七十二(72)小时发酵时yvmA过表达对与沉淀相关的普切明的影响(n=3),其中描绘普切明水平的直方图是针对在37℃下生长七十二(72)小时后的1x GG36、1x GG36 PspoVG-yvmA、1x GG36Phbs-yvmA、1x GG36PyvyD-yvmA和1x GG36 Ppts-yvmA菌株确定的。如图3A所呈现,启动子强度用浅色到深色的直方图阴影表示,其中浅色到深色阴影分别表示增加的启动子强度。图3B显示了在基于大豆的工业发酵期间,通过RNA-seq分析随时间推移定量的1x GG36PspoVG-yvmA、1x GG36Phbs-yvmA、1x GG36 PyvyD-yvmA和1x GG36Ppts-yvmA菌株的mRNA水平。
图4显示了Phbs-yvmA表达减少了红色/棕色发酵肉汤颜色和普切明水平,而不影响2拷贝GG36蛋白酶产生菌株背景中的生长速率或蛋白酶产生(图4A-图4C)。例如,图4A呈现了在确定培养基中生长的2x GG36(亲本)和2x GG36 Phbs-yvmA(经修饰的)菌株的生长曲线(n=3),其中生长由A600监测,图4B显示了在限定培养基中生长的2x GG36(亲本)和2xGG36 Phbs-yvmA(经修饰的)菌株的蛋白酶活性测定(n=3),并且图4C显示了在基于maltrin的培养基中生长并在六十七(67)小时后测定的2x GG36(亲本)和2x GG36 Phbs-yvmA(经修饰的)菌株的普切明定量测定(n=3)。
图5显示了yvmA基因的缺失增加了红色/棕色发酵肉汤的颜色(图5A)并增加了普切明产生(图5B)。例如,图5A显示了枯草芽孢杆菌菌株在37℃下在基于maltrin的培养基中生长/发酵四十八(48)小时的数字图像,其中这些菌株包括(从左至右)枯草芽孢杆菌1xGG36(亲本)菌株、包含缺失yvmA基因(ΔyvmA)的枯草芽孢杆菌1x GG36(经修饰的)菌株和过表达yvmA基因(PspoVG-yvmA)的枯草芽孢杆菌1x GG36(经修饰的)菌株。图5B呈现了显示在图5A中描述的枯草芽孢杆菌1x GG36、1x GG36ΔyvmA和1x GG36 PspoVG-yvmA菌株发酵四十八(48)小时后产生的普切明的定量结果(n=3)的直方图。
图6显示了向枯草芽孢杆菌发酵中预添加AlCl3减少了红色/棕色和普切明水平,并且不影响生长或蛋白酶产生(例如,参见图6A-6D)。例如,图6A显示了向1x GG36ΔyvmA枯草芽孢杆菌发酵中预添加AlCl3减少了可见的红色/棕色。如图6A所示,在0mM、1mM、2mM、5mM和10mM AlCl3存在下,在37℃下,在基于maltrin的培养基中生长五十(50)小时的1x GG36ΔyvmA细胞的试管培养二十(20)小时和五十(50)小时时拍摄的数字图像。图6B证明了向1xGG36ΔyvmA枯草芽孢杆菌发酵中预添加AlCl3增加了五十(50)小时时的亮度,并降低了发酵肉汤中的普切明水平。例如,添加0mM、1mM、2mM、5mM和10mM AlCl3的1x GG36ΔyvmA培养物在五十(50)小时后的亮度直方图显示在图6B中,左侧y轴,并且在五十(50)小时生长后在预添加0mM、1mM、2mM、5mM和10mM AlCl3的1x GG36ΔyvmA培养物的肉汤中可检测到的普切明显示在图6B中,右侧y轴。如图6C所示,AlCl3的预添加不影响枯草芽孢杆菌1x GG36ΔyvmA细胞的生长速率,这些细胞在0mM、1mM、2mM、5mM和10mM AlCl3存在下在37℃下在基于maltrin的培养基中生长五十(50)小时。如图6D所呈现,当在0mM、1mM、2mM、5mM和10mMAlCl3存在下在37℃下在基于maltrin的培养基中生长五十(50)小时时,1x GG36ΔyvmA细胞的蛋白酶产生(活性)不受影响,其中蛋白酶活性在二十(20)、二十六(26)和五十(50)小时时间点测量。
图7是四(4)个独立的2-L生物反应器发酵的LAB(L)图。
生物序列说明
SEQ ID NO:1是引物265的寡核苷酸序列。
SEQ ID NO:2是引物117的寡核苷酸序列。
SEQ ID NO:3是引物245的寡核苷酸序列。
SEQ ID NO:4是引物266的寡核苷酸d序列。
SEQ ID NO:5是引物247的寡核苷酸序列。
SEQ ID NO:6是引物55的寡核苷酸序列。
SEQ ID NO:7是引物124的寡核苷酸序列。
SEQ ID NO:8是引物401的寡核苷酸序列。
SEQ ID NO:9是引物298的寡核苷酸序列。
SEQ ID NO:10是引物307的寡核苷酸序列。
SEQ ID NO:11是引物305的寡核苷酸序列。
SEQ ID NO:12是引物308的寡核苷酸序列。
SEQ ID NO:13是引物131的寡核苷酸序列。
SEQ ID NO:14是引物129的寡核苷酸序列。
SEQ ID NO:15是引物299的寡核苷酸序列。
SEQ ID NO:16是引物306的寡核苷酸序列。
SEQ ID NO:17是引物302的寡核苷酸序列。
SEQ ID NO:18是PspoVG-yvmA表达盒。
SEQ ID NO:19是Phbs-yvmA表达盒。
SEQ ID NO:20是Pyvyd-yvmA表达盒。
SEQ ID NO:21是Ppts-yvmA表达盒。
SEQ ID NO:22是引物241的寡核苷酸序列。
SEQ ID NO:23是引物242的寡核苷酸序列。
SEQ ID NO:24是引物179的寡核苷酸序列。
SEQ ID NO:25是引物282的寡核苷酸序列。
SEQ ID NO:26是引物180的寡核苷酸序列。
SEQ ID NO:27是引物52的寡核苷酸序列。
SEQ ID NO:28是引物53的寡核苷酸序列。
SEQ ID NO:29是地衣芽孢杆菌(野生型)RghR2蛋白的氨基酸序列。
SEQ ID NO:30是枯草芽孢杆菌YvmA蛋白的氨基酸序列。
SEQ ID NO:31是包含地衣芽孢杆菌amyL基因座的多核苷酸序列。
SEQ ID NO:32是包含tet标记的多核苷酸序列。
SEQ ID NO:33是包含amyL::[Phbs-yvmA tetR]的合成多核苷酸序列。
SEQ ID NO:34是包含地衣芽孢杆菌上游(5′)amyL同源臂(HA)的多核苷酸序列。
SEQ ID NO:35是枯草芽孢杆菌hbs启动子(Phbs)的多核苷酸序列。
SEQ ID NO:36是枯草芽孢杆菌spoVG核糖体结合位点(rbs)的核酸序列。
SEQ ID NO:37是枯草芽孢杆菌yvmA基因(ORF)的多核苷酸序列。
SEQ ID NO:38是枯草芽孢杆菌yvmA终止子的多核苷酸序列。
SEQ ID NO:39是包含地衣芽孢杆菌下游(3′)amyL同源臂(HA)的多核苷酸序列。
SEQ ID NO:40是人工多核苷酸序列
SEQ ID NO:41是枯草芽孢杆菌spoVG启动子(PspoVG)的多核苷酸序列。
SEQ ID NO:42是引物1762的寡核苷酸序列。
SEQ ID NO:43是引物1763的寡核苷酸序列。
SEQ ID NO:44是amyL::[Phbs-yvmA tetR]PCR产物。
SEQ ID NO:45是amyL::[PspoVG-yvmA tetR]PCR产物。
SEQ ID NO:46是引物2377的寡核苷酸序列。
SEQ ID NO:47是引物2378的寡核苷酸序列。
SEQ ID NO:48是引物2379的寡核苷酸序列。
具体实施方式
如本文所述,本公开的某些实施例涉及用于获得色素缺陷型芽孢杆菌属细胞的组合物和方法。因此,某些实施例涉及用于生长(培养)色素缺陷型芽孢杆菌属细胞的组合物和方法。某些其他实施例涉及用于在此类色素缺陷型芽孢杆菌属细胞中表达/产生目的蛋白的组合物和方法。因此,某些其他实施例涉及用于产生、分离、回收等为色素缺陷型目的蛋白的组合物和方法。某些其他实施例涉及经由添加铝离子(例如,AlCl3)来减轻、减少或消除芽孢杆菌属发酵过程中红色素的组合物和方法。
I.定义
鉴于本文所述的亲本和/或经修饰的(突变型)芽孢杆菌属细胞和相关方法,定义了以下术语和短语。本文未定义的术语应当符合如本领域使用的其常规含义。
除非另外定义,否则本文使用的所有技术和科学术语都具有与本发明组合物和方法应用的领域的普通技术人员通常所理解的相同的含义。尽管在本发明组合物和方法的实践或测试中也可以使用与本文所述的那些方法和材料类似或等效的任何方法和材料,但现在描述代表性的说明性方法和材料。将本文引用的所有出版物和专利都通过引用以其全文而并入。
应进一步注意,可以撰写权利要求书以排除任何任选的要素。因此,此陈述旨在作为使用与权利要求要素的叙述有关的排他性术语如“单独”、“仅”、“排除”、“不包括”等或使用“否定型”限定的前提基础(或其条件)。
在阅读本公开后,如将对于本领域技术人员应显而易见的,本文描述和说明的单独实施例中的每一个具有离散的组分和特征,这些组分和特征可以在不偏离本文所述的本发明组合物和方法的范围或精神的情况下容易地与其他几个实施例中的任何一个的特征分离或组合。可以按照所叙述的事件的顺序或按照逻辑上可行的任何其他顺序来进行任何叙述的方法。
如本文使用的,“宿主细胞”是指具有作为新引入的DNA序列的宿主或表达媒介物的能力的细胞。因此,在本公开的某些实施例中,宿主细胞是例如芽孢杆菌属物种细胞或大肠杆菌细胞。
如本文使用的,“经修饰的细胞”是指包含至少一个遗传修饰的重组(宿主)细胞,该遗传修饰不存在于衍生出(获得)经修饰的细胞的“亲本”宿主细胞中。例如,在某些实施例中,“亲本”细胞被改变(例如,经由引入亲本细胞中的一个或多个遗传修饰)以产生由其衍生的“经修饰的”(子代(daughter))细胞。
在某些实施例中,亲本细胞可以被称为“对照细胞”,特别是当与“经修饰的”的芽孢杆菌属物种(子代)细胞进行比较或相对于“经修饰的”的芽孢杆菌属物种(子代)细胞时。
如本文使用的,当将“未经修饰的”(亲本)细胞(例如,对照细胞)中的目的蛋白(POI)的表达和/或产生与“经修饰的”(子代)细胞中的相同POI的表达和/产生相比较时,应该理解的是,在相同的条件(例如,相同的条件如培养基、温度、pH等)下生长/培养/发酵“经修饰的”和“未经修饰的”细胞。
如本文使用的,“芽孢杆菌属”或“芽孢杆菌属物种”细胞包括如本领域技术人员已知的“芽孢杆菌属”内的所有物种,包括但不限于枯草芽孢杆菌、地衣芽孢杆菌、缓慢芽孢杆菌(B.lentus)、短芽孢杆菌(B.brevis)、嗜热脂肪芽孢杆菌(B.stearothermophilus)、嗜碱芽孢杆菌(B.alkalophilus)、解淀粉芽孢杆菌(B.amyloliquefaciens)、克劳氏芽孢杆菌(B.clausii)、耐盐芽孢杆菌(B.halodurans)、巨大芽孢杆菌(B.megaterium)、凝结芽孢杆菌(B.coagulans)、环状芽孢杆菌(B.circulans)、灿烂芽孢杆菌(B.lautus)和苏云金芽孢杆菌(B.thuringiensis)。应认识到,芽孢杆菌属不断进行分类学重组。因此,该属旨在包括已重新分类的物种,包括但不限于诸如嗜热脂肪芽孢杆菌(其现在名为“嗜热脂肪土芽孢杆菌(Geobacillus stearothermophilus)”)等的生物体。
如本文使用的,术语“野生型”和“天然”可互换地使用,并且是指如在自然界中发现的基因、启动子、蛋白质、蛋白质混合物、细胞或菌株。
如本文使用的,枯草芽孢杆菌“yvmA基因”或其“可读框”(ORF)(下文为“yvmAORF”)编码功能性(天然)YvmA蛋白。例如,在某些实施例中,示例性枯草芽孢杆菌yvmA ORF编码功能性YvmA蛋白,其包含与SEQ ID NO:30的YvmA蛋白或其芽孢杆菌属物种YvmA同源物基本上相同的氨基酸序列。在其他实施例中,芽孢杆菌属物种yvmA ORF编码功能性YvmA蛋白,其与SEQ ID NO:30的YvmA蛋白或其芽孢杆菌属物种YvmA同源物具有至少85%的氨基酸序列同一性。在某些其他实施例中,芽孢杆菌属物种yvmA ORF序列与SEQ ID NO:37的yvmAORF序列或其芽孢杆菌属物种yvmA同源物包含至少约90%的核酸序列同一性。
如本文使用的,短语如“yvmA表达盒”、“yvmA基因表达盒”和“yvmA过表达盒”可以互换使用,并且是指本文所述的表达盒,其包含与编码功能性YvmA蛋白的下游(3′)ORF(核酸序列)可操作地连接的上游(5′)异源启动子序列(例如,参见图1)。
如本文使用的,命名为“PspoVG-yvmA”(SEQ ID NO:18)的yvmA表达盒包含与下游(3′)yvmA ORF(“yvmA”)可操作地连接的上游(5′)spoVG启动子核酸序列(“PspoVG”);例如,编码SEQ ID NO:30的YvmA蛋白,命名为“Phbs-yvmA”(SEQ ID NO:19)的盒包含与相同下游(3′)yvmA ORF可操作地连接的上游(5′)hbs启动子核酸序列(“Phbs”),命名为“Pyvyd-yvmA”(SEQ ID NO:20)的盒包含与相同下游(3′)yvmA ORF可操作地连接的上游(5′)yvyd启动子核酸序列(“Pyvyd”),并且命名为“Ppts-yvmA”(SEQ ID NO:21)的盒包含与相同下游(3′)yvmA ORF可操作地连接的上游(5′)pts启动子核酸序列(“Ppts”)(例如,参见图1)。如本文使用的,命名为“BF1175”和“BF1176”的地衣芽孢杆菌菌株是两种独立的地衣芽孢杆菌分离株,包含***amyL基因座中的“Phbs-yvmA tetR”盒(SEQ ID NO:33);并且命名为“BF1177”和“BF1178”的地衣芽孢杆菌菌株是两种独立的地衣芽孢杆菌分离株,包含***amyL基因座中的PspoVG-yvmA tetR盒(SEQ ID NO:40)。
如本文使用的,短语“GG36蛋白酶”是指衍生自迟缓芽孢杆菌(Bacillus lentus)的变体丝氨酸蛋白酶,如PCT公开号WO 2011/140316和WO 2012/151534中一般性描述的。
如本文使用的,命名为“1x GG36”的亲本(对照)枯草芽孢杆菌菌株包含编码单(1)个拷贝的GG36蛋白酶的表达盒。
如本文使用的,命名为“2x GG36”的枯草芽孢杆菌菌株包含编码两(2)个拷贝的GG36蛋白酶的两(2)个表达盒。更特别地,2x GG36菌株通常如本文实例4中所述构建,其中命名为1x GG36 Phbs-yvmA的经修饰的枯草芽孢杆菌菌株(即,包含单(1)个拷贝的编码GG36蛋白酶的基因)随后用编码相同GG36蛋白酶的第二(第2)表达盒转化。
如本文使用的,“天然地衣芽孢杆菌染色体rghR2基因”包含编码SEQ ID NO:29的RghR2蛋白的核苷酸序列,其中地衣芽孢杆菌rghR2基因已经在PCT公开号WO 2018/156705(通过引用以其全文并入本文)中有所描述。
如本文使用的,短语“在红色素的产生方面有缺陷”是指经修饰的(突变型)芽孢杆菌属细胞,其不产生可检测的红色素,或者替代地,当在相同条件下生长/培养/发酵时,与亲本芽孢杆菌属细胞相比,其产生至少约5%更少的红色素。在某些实施例中,当在相同条件下生长/培养/发酵时,与亲本芽孢杆菌属细胞相比,在红色素的产生方面有缺陷的芽孢杆菌属细胞产生至少约10%更少至约20%更少的红色素。由本公开的芽孢杆菌属细胞产生的红色素的水平可以使用本领域熟知的方法来测定,并且如下文实例部分中所述。
术语“修饰”和“遗传修饰”可互换地使用,并且包括:(a)引入、取代或去除基因(或其ORF)中的一个或多个核苷酸,或者引入、取代或去除基因或其ORF的转录或翻译所需的调控元件中的一个或多个核苷酸,(b)基因破坏,(c)基因转化,(d)基因缺失,(e)基因下调,(f)本文公开的任何一个或多个基因的特异性诱变和/或(g)随机诱变。
如本文使用的,“基因的破坏”、“基因破坏”、“基因的灭活”和“基因灭活”互换地使用,并且广泛地是指基本上防止宿主细胞产生功能性基因产物(例如,蛋白质)的任何遗传修饰。基因破坏的示例性方法包括基因的任何部分的完全或部分(包括多肽编码序列、启动子、增强子或另外的调控元件)缺失、或其诱变,其中诱变涵盖取代、***、缺失、倒位、及其任何组合和变化,所述诱变破坏/灭活一个活多个靶基因并基本上减少或阻止功能基因产物(即蛋白质)的产生。
如本文定义的,组合术语“表达/产生”(如在短语如“相对于亲本(宿主)细胞,经修饰的宿主细胞表达/产生增加量的目的蛋白”中使用的),术语(“表达/产生”)意指包括涉及在本公开的宿主细胞中表达和产生目的蛋白的任何步骤。
如本文使用的,“增加”蛋白质产生或“增加的”蛋白质产生意指产生的蛋白质(例如,内源POI和/或异源POI)的量增加。蛋白质可以在宿主细胞内产生,或分泌(或转运)到培养基中。在某些实施例中,目的蛋白被产生(被分泌)到培养基中。在某些优选的实施例中,在不存在红色/色素(普切明)的情况下,目的蛋白被产生(被分泌)到培养基中。与亲本宿主细胞相比,增加的蛋白质产生可以被检测为例如蛋白质或酶活性(例如像蛋白酶活性、淀粉酶活性、纤维素酶活性、半纤维素酶活性等)或者所产生的总细胞外蛋白的更高的最大水平。
如本文使用的,“核酸”是指核苷酸或多核苷酸序列及其片段或部分,以及基因组或合成起点的DNA、cDNA和RNA,其可能是双链或单链,无论代表正义或反义链。应理解,由于遗传密码的简并性,许多核苷酸序列可以编码给定的蛋白质。
应理解,本文所述的多核苷酸(或核酸分子)包括“基因”、“载体”和“质粒”。
因此,术语“基因”是指编码氨基酸的特定序列的多核苷酸,其包含所有或部分蛋白编码序列,并且可以包括调控(非转录的)DNA序列,如启动子序列,该启动子序列决定例如基因在其下表达的条件。基因的转录区可以包括非翻译区(UTR)(包括内含子、5'-非翻译区(UTR)和3'-UTR)以及编码序列。
如本文使用的,术语“编码序列”是指直接指定其(所编码的)蛋白质产物的氨基酸序列的核苷酸序列。编码序列的边界一般由通常以ATG起始密码子开始的可读框(在下文质,“ORF”)决定。编码序列典型地包括DNA、cDNA和重组核苷酸序列。
如本文使用的,术语“启动子”是指能够控制编码序列或功能性RNA表达的核酸序列。通常,编码序列位于启动子序列3'(下游)。启动子可以全部衍生自天然基因,或者由衍生自在自然界中发现的不同启动子的不同(异源)元件构成,或者甚至包含合成核酸片段。本领域技术人员应理解,不同启动子可以指导基因在不同细胞类型中、或在不同发育阶段、或响应于不同环境或生理条件而表达。使基因在大多数细胞类型中在大多数时间表达的启动子通常被称为“组成型启动子”。应进一步认识到,由于在大多数情况下,尚未完全界定调节序列的确切边界,因此不同长度的DNA片段可以具有相同启动子活性。
如本文使用的,术语“可操作地连接”是指核酸序列在单个核酸片段上的缔合,使得一者的功能受到另一者影响。例如,当能够实现该编码序列的表达(即,编码序列在启动子的转录控制下)时,启动子与该编码序列(例如ORF)可操作地连接。编码序列可以在正义或反义方向上可操作地连接到调控序列上。
当核酸被放置成与另一个核酸序列具有功能关系时,该核酸与另一个核酸序列“可操作地连接”。例如,如果编码分泌性前导序列(即,信号肽)的DNA被表达为参与多肽分泌的前蛋白,则该编码分泌性前导序列(即,信号肽)的DNA可操作地连接到该多肽的DNA;如果启动子或增强子影响编码序列的转录,则该启动子或增强子可操作地连接到该序列;或者如果核糖体结合位点被定位以便促进翻译,则该核糖体结合位点可操作地连接到编码序列。通常,“可操作地连接”意指被连接的DNA序列是连续的,并且在分泌性前导序列的情况下,是连续的并且处于阅读相中。然而,增强子不必是连续的。通过在方便的限制位点处连接来实现连接。如果此类位点不存在,则按照常规实践使用合成的寡核苷酸衔接子或接头。
如本文使用的,“控制与目的基因的蛋白质编码序列连接的目的基因(或其ORF)的表达的功能性启动子序列”是指控制宿主细胞(例如,芽孢杆菌属细胞)中编码序列的转录和翻译的启动子序列。例如,在某些实施例中,本公开涉及包含5′启动子(或5′启动子区、或串联5′启动子等)的多核苷酸,其中启动子区可操作地连接到编码本公开的蛋白质的核酸序列。因此,在某些实施例中,功能性启动子序列控制编码本文公开的蛋白质的基因的表达。在其他实施例中,功能性启动子序列控制编码目的蛋白的异源基因(或内源基因)在芽孢杆菌属细胞中的表达。
如本文定义的,“合适的调节序列”是指位于编码序列上游(5'非编码序列)、内部或下游(3'非编码序列),并且影响相关编码序列的转录、RNA加工或稳定性或者翻译的核苷酸序列。调节序列可以包括启动子、翻译前导序列、RNA加工位点、效应子结合位点和茎环结构。
如本文使用的,如短语如“向细菌细胞中引入”或“向芽孢杆菌属物种细胞中引入”至少一种多核苷酸可读框(ORF)、或其基因、或其载体中使用的,术语“引入”包括本领域已知的用于将多核苷酸引入细胞中的方法,这些方法包括但不限于原生质体融合、自然或人工转化(例如,氯化钙、电穿孔)、转导、转染、缀合等(例如,参见Ferrari等人,1989)。
如本文使用的,“转化的”或“转化”意指通过使用重组DNA技术转化的细胞。转化典型地通过将一个或多个核苷酸序列(例如,多核苷酸、ORF或基因)***细胞中而发生。***的核苷酸序列可以是异源核苷酸序列(即,在待转化的细胞中非天然存在的序列)。例如,在本公开的某些实施例中,通过向亲本细胞中引入多核苷酸构建体(其包含可操作地连接到编码目的蛋白的核酸序列的启动子)来修饰(例如,转化)亲本芽孢杆菌属细胞,从而产生衍生自亲本细胞的经修饰的芽孢杆菌属(子代)宿主细胞。
如本文使用的,“转化”是指将外源DNA引入宿主细胞中,使得DNA保持为染色体整合体或自我复制的染色体外载体。如本文使用的,“转化DNA”、“转化序列”和“DNA构建体”是指用于将序列引入宿主细胞或生物体中的DNA。转化DNA是用于将序列引入宿主细胞或生物体中的DNA。可以通过PCR或任何其他合适的技术在体外产生DNA。在一些实施例中,转化DNA包含输入序列,而在其他实施例中,它进一步包含侧翼为同源盒的输入序列。在又另一个实施例中,转化DNA包含添加到末端的其他非同源序列(即,填充序列或侧翼)。末端可以闭合,使得转化DNA形成闭环,例如像***载体中。
如本文使用的,“输入序列”是指引入芽孢杆菌属染色体中的DNA序列。在一些实施例中,输入序列是DNA构建体的一部分。在其他实施例中,输入序列编码一种或多种目的蛋白。在一些实施例中,输入序列包含可以已经或可以不存在于待转化的细胞的基因组中的序列(即,它可以是同源或异源序列)。在一些实施例中,输入序列编码一种或多种目的蛋白、基因和/或经突变的或经修饰的基因。在可替代的实施例中,输入序列编码功能性野生型基因或操纵子、功能性突变型基因或操纵子或者非功能性基因或操纵子。在一些实施例中,可以将非功能性序列***基因中以破坏基因的功能。在另一个实施例中,输入序列包括选择性标记。在进一步的实施例中,输入序列包括两个同源盒。
如本文使用的,“同源盒”是指与芽孢杆菌属染色体中的序列同源的核酸序列。更特别地,根据本发明,同源盒是上游或下游区,该上游或下游区与被缺失、破坏、灭活的、下调等的基因或基因的一部分的直接侧翼编码区具有约80%与100%之间的序列同一性、约90%与100%之间的序列同一性、或约95%与100%之间的序列同一性。这些序列指导在芽孢杆菌属染色体中DNA构建体的整合位置,并且指导芽孢杆菌属染色体的哪部分被输入序列替代。虽然不意在限制本公开,但同源盒可以包括约1个碱基对(bp)至200千碱基(kb)之间。优选地,同源盒包括约1bp与10.0kb之间;1bp与5.0kb之间;1bp与2.5kb之间;1bp与1.0kb之间;以及0.25kb与2.5kb之间。同源盒还可以包括约10.0kb、5.0kb、2.5kb、2.0kb、1.5kb、1.0kb、0.5kb、0.25kb和0.1kb。在一些实施例中,选择性标记的5'和3'端的侧翼为同源盒,其中同源盒包含紧密侧翼基因的编码区的核酸序列。
如本文使用的,术语“编码可选择性标记的核苷酸序列”是指核苷酸序列,所述核苷酸序列能够在宿主细胞中表达并且其中可选择性标记的表达赋予含有表达的基因的细胞在不存在对应的选择性试剂或缺乏必需营养素的情况下生长的能力。
如本文使用的,术语“可选择标记”和“选择性标记”是指能够在宿主细胞中表达的核酸(例如,基因),其允许容易地选择包含载体的那些宿主。此类可选择性标记的实例包括但不限于抗微生物剂。因此,术语“可选择标记”是指提供宿主细胞已经摄取了输入性目的DNA或者已经发生了一些其他反应的指示的基因。典型地,可选择性标记是赋予宿主细胞抗微生物抗性或代谢优势的基因,以允许在转化期间将含有外源DNA的细胞与未接受任何外源序列的细胞区分开来。
“驻留可选择性标记(residing selectable marker)”是位于待转化微生物的染色体上的标记。驻留可选择性标记编码与转化DNA构建体上的可选择性标记不同的基因。选择性标记是本领域技术人员熟知的。如上所指出,标记可以是抗微生物抗性标记(例如,ampR、phleoR、specR、kanR、eryR、tetR、cmpR和neoR(参见例如,Guerot-Fleury,1995;Palmeros等人,2000;和Trieu-Cuot等人,1983))。在一些实施例中,本公开提供氯霉素抗性基因(例如,存在于pC194上的基因,以及存在于芽孢杆菌属基因组中的抗性基因)。此抗性基因在本发明中以及涉及染色体整合的盒和整合质粒的染色体扩增的实施例中特别有用(参见例如,Albertini和Galizzi,1985;Stahl和Ferrari,1984)。根据本发明有用的其他标记包括但不限于营养缺陷型标记,如丝氨酸、赖氨酸、色氨酸;以及检测标记,如β-半乳糖苷酶或荧光蛋白。
如本文定义的,宿主细胞“基因组”、细菌(宿主)细胞“基因组”、或芽孢杆菌属(宿主)细胞“基因组”包括染色体基因和染色体外基因。
如本文使用的,术语“质粒”、“载体”和“盒”是指染色体外元件,其通常携带典型地不是细胞的中心代谢的一部分的基因,并且通常呈环状双链DNA分子的形式。此类元件可以是衍生自任何来源的单链或双链DNA或RNA的线性或环状自主复制序列、基因组整合序列、噬菌体或核苷酸序列,其中许多核苷酸序列已连接或重组到单一结构中,该单一结构能够将针对选定基因产物的启动子片段和DNA序列连同适当的3'未翻译序列引入细胞中。
如本文使用的,“转化盒”是指包含基因(或其ORF)并且除了外源基因之外还具有促进特定宿主细胞的转化的元件的特定载体。
如本文使用的,术语“载体”是指可以在细胞中复制(传播)并且可以携带新基因或DNA区段到细胞中的任何核酸。因此,该术语是指设计用于在不同宿主细胞之间转移的核酸构建体。载体包括作为“附加体”(即,其自主复制或可以整合到宿主生物体的染色体中)的病毒、噬菌体、前病毒、质粒、噬菌粒、转座子以及人工染色体(如YAC(酵母人工染色体)、BAC(细菌人工染色体)、PLAC(植物人工染色体))等。
“表达载体”是指能够在细胞中掺入和表达异源DNA的载体。许多原核和真核表达载体是可商购获得的,并且是本领域技术人员已知的。适当的表达载体的选择在本领域技术人员的知识范围内。
如本文使用的,术语“表达盒”和“表达载体”是指重组或合成生成的具有允许特定核酸在靶细胞中转录的一系列特定核酸元件(即,这些是载体或载体元件,如上所述)的核酸构建体。可以将重组表达盒掺入质粒、染色体、线粒体DNA、质体DNA、病毒或核酸片段中。典型地,表达载体的重组表达盒部分包括(除了其他序列之外)待转录的核酸序列和启动子。在一些实施例中,DNA构建体还包括一系列特定的核酸元件,其允许特定核酸在靶细胞中转录。在某些实施例中,本公开的DNA构建体包含选择性标记和如本文定义的失活染色体或基因或DNA片段。
如本文使用的,“靶向载体”是这样的载体,该载体包括与该靶向载体转化至其中的宿主细胞的染色体中的区同源的多核苷酸序列,并且该载体可以驱动在该区处的同源重组。例如,靶向载体可用于通过同源重组将突变引入宿主细胞的染色体中。在一些实施例中,靶向载体包含其他非同源序列,例如添加到末端(即,填充序列或侧翼序列)。在一些实施例中,靶向载体包括用来增加与染色体的同源重组的元件,包括但不限于RNA指导的核酸内切酶、DNA指导的核酸内切酶和重组酶。末端可以闭合,使得靶向载体形成闭环,诸如像***载体中。
如本文使用的,术语“质粒”是指用作克隆载体,并且在许多细菌和一些真核生物中形成染色体外自我复制遗传元件的环状双链(ds)DNA构建体。在一些实施例中,将质粒掺入宿主细胞的基因组中。
如本文使用的,术语“目的蛋白”或“POI”是指期望在芽孢杆菌属宿主细胞中表达的目的多肽。因此,如本文使用的,POI可以是酶、底物结合蛋白、表面活性蛋白、结构蛋白、受体蛋白等。在某些实施例中,相对于亲本细胞,本公开的经修饰的细胞产生增加量的异源POI或增加量的内源POI。在特定的实施例中,由本公开的经修饰的细胞产生的POI的增加量是相对于亲本细胞增加至少0.5%、增加至少1.0%、增加至少5.0%或增加超过5.0%。
如本文使用的,“目的基因”或“GOI”是指编码POI的核酸序列(例如,多核苷酸、基因或ORF)。编码“目的蛋白”的“目的基因”可以是天然存在的基因、经突变的基因或合成基因。
如本文使用的,术语“多肽”和“蛋白质”可互换地使用,并且是指包含通过肽键连接的氨基酸残基的任何长度的聚合物。在本文中使用氨基酸残基的常规单(1)字母或三(3)字母代码。多肽可以是线性的或支化的,它可以包含经修饰的氨基酸,并且它可以被非氨基酸中断。术语多肽还涵盖已经天然地或通过干预修饰例如,二硫键形成、糖基化、脂化、乙酰化、磷酸化或任何其他操作或修饰,诸如与标记组分缀合而修饰的氨基酸聚合物。该定义内还包括例如含有一种或多种氨基酸类似物(包括例如非天然氨基酸等)以及本领域已知的其他修饰的多肽。
在某些实施例中,本公开的基因编码商业上相关的工业目的蛋白,例如酶(例如,乙酰酯酶、氨肽酶、淀粉酶、***聚糖酶、***呋喃糖苷酶、碳酸酐酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、凝乳酶、角质酶、脱氧核糖核酸酶、差向异构酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡聚糖酶、葡聚糖裂解酶、内切-β-葡聚糖酶、葡糖淀粉酶、葡萄糖氧化酶、α-葡糖苷酶、β-葡糖苷酶、葡萄糖醛酸酶、糖基水解酶、半纤维素酶、己糖氧化酶、水解酶、转化酶、异构酶、漆酶、脂肪酶、裂解酶、甘露糖苷酶、氧化酶、氧化还原酶、果胶酸裂合酶、果胶乙酰酯酶、果胶解聚酶、果胶甲酯酶、果胶分解酶、过水解酶、多元醇氧化酶、过氧化物酶、酚氧化酶、植酸酶、聚半乳糖醛酸酶、蛋白酶、肽酶、鼠李糖-半乳糖醛酸酶、核糖核酸酶、转移酶、转运蛋白、转谷氨酰胺酶、木聚糖酶、己糖氧化酶、及其组合)。
如本文使用的,术语“等效位置”意指在与特定多肽序列比对后的氨基酸残基位置。
如本文使用的,“变体”多肽是指典型地通过重组DNA技术,通过取代、添加或缺失一个或多个氨基酸,衍生自亲本(或参考)多肽的多肽。变体多肽与亲本多肽可以相差小数量的氨基酸残基,并且可以通过它们与亲本(参考)多肽的一级氨基酸序列同源性/同一性的水平来定义。
优选地,变体多肽与亲本(参考)多肽序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或甚至至少99%氨基酸序列同一性。
如本文使用的,“变体”多核苷酸是指编码变体多肽的多核苷酸,其中“变体多核苷酸”与亲本多核苷酸具有指定程度的序列同源性/同一性,或者与亲本多核苷酸(或其互补序列)在严格杂交条件下杂交。优选地,变体多核苷酸与亲本(参考)多核苷酸序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或甚至至少99%核苷酸序列同一性。
如本文使用的,“突变”是指核酸序列中的任何变化或改变。存在几种类型的突变,包括点突变、缺失突变、沉默突变、移码突变、剪接突变等。突变可以特异性地(例如,经由定点诱变)或随机地(例如,经由化学试剂、通过修复减去(minus)细菌菌株传代)进行。
如本文使用的,在多肽或其序列的背景下,术语“取代”意指一个氨基酸被另一个氨基酸替代(即,取代)。
如本文使用的,“内源基因”是指位于生物体基因组的其天然位置中的基因。
如本文使用的,“异源”基因、“非内源”基因或“外源”基因是指通常不在宿主生物体中被发现,但通过基因转移引入宿主生物体中的基因(或ORF)。
如本文使用的,术语一个或多个“外源”基因包括***非天然生物体中的天然基因(或ORF)和/或***天然或非天然生物体中的嵌合基因。
如本文使用的,“异源”核酸构建体或“异源”核酸序列具有如下序列的一部分,该序列对于其被表达的细胞不是天然的。
如本文定义的,“异源控制序列”是指如下基因表达控制序列(例如,启动子或增强子),该基因表达控制序列本质上不起作用以调控(控制)目的基因的表达。通常,异源核酸序列对于它们存在的细胞或基因组的一部分而言不是内源(天然)的,并且已通过感染、转染、转化、显微注射、电穿孔等添加到细胞中。“异源”核酸构建体可以含有与在天然宿主细胞中发现的控制序列/DNA编码序列组合相同或不同的控制序列/DNA编码(ORF)序列组合。
如本文使用的,术语“信号序列”和“信号肽”是指可以参与成熟蛋白或蛋白质的前体形式的分泌或定向转运的氨基酸残基的序列。通常,信号序列位于前体或成熟蛋白序列的N-末端。信号序列可以是内源的或外源的。成熟蛋白中一般不存在信号序列。通常,在蛋白质转运后,信号序列通过信号肽酶从蛋白质切割。
术语“衍生的”涵盖术语“起源的”、“获得的”“可获得的”和“产生的”,并且通常指示一种指定的材料或组合物在另一种指定的材料或组合物中找到它的起源,或者具有可以参考另一种指定的材料或组合物描述的特征。
如本文使用的,术语“同源性”涉及同源多核苷酸或多肽。如果两个或更多个多核苷酸或者两个或更多个多肽是同源的,则这意味着同源多核苷酸或多肽具有至少50%或至少60%、更优选至少70%、甚至更优选至少80%-85%、仍更优选至少90%、更优选至少95%、且最优选至少98%的“同一性程度”。两个多核苷酸或多肽序列是否具有如本文定义的同源程度足够高的同一性,可以通过使用本领域已知的计算机程序比对两个序列来适当地研究,该计算机程序如GCG程序包中提供的“GAP”(威斯康星程序包手册(Program Manualfor the Wisconsin Package),第8版,1994年8月,遗传学计算机集团(Genetics ComputerGroup),科学大道575号(575Science Drive),麦迪逊,威斯康星州,美国53711)(Needleman和Wunsch,(1970))。使用具有以下设置的GAP进行DNA序列比较:GAP产生罚分5.0和GAP扩展罚分0.3。
如本文使用的,术语“百分比(%)同一性”是指当使用序列比对程序进行比对时,编码多肽的核酸序列或多肽的氨基酸序列之间的核酸或氨基酸序列同一性的水平。
如本文使用的,“比生产力”是在给定时间段内产生的蛋白质的总量/细胞/时间。
如本文使用的,术语“纯化的”、“分离的”或“富集的”意指生物分子(例如,多肽或多核苷酸)通过将其与它在自然界中相关联的天然存在的成分中的一些或所有分离而被从其天然状态改变。这样的分离或纯化可以通过本领域公认的分离技术如离子交换色谱法、亲和色谱法、疏水分离、透析、蛋白酶处理、硫酸铵沉淀或其他蛋白盐沉淀、离心、尺寸排阻色谱法、过滤、微量过滤、凝胶电泳或梯度分离完成,以去除最终组合物中所不希望的全细胞、细胞碎片、杂质、外来蛋白或酶。然后可以进一步向纯化的或分离的生物分子组合物中添加提供另外益处的成分,例如活化剂、抗抑制剂、期望的离子、控制pH的化合物或者其他酶或化学品。
如本文使用的,术语“ComK多肽”定义为comK基因的产物;一种转录因子,其在感受态发育前作为最终的自动调节控制开关;参与涉及DNA结合和摄取以及重组的晚期感受态基因表达的激活(Liu和Zuber,1998,Hamoen等人,1998)。
如本文使用的,“同源基因”是指来自不同的、但是通常相关的物种的基因对,这些基因彼此对应并且彼此相同或非常相似。该术语涵盖通过物种形成(即,新物种的发育)分离的基因(例如,直系同源基因)以及已通过遗传重复分离的基因(例如,旁系同源基因)。例如,在某些实施例中,本公开的yvmA基因(或其ORF)是枯草芽孢杆菌yvmA基因(SEQ ID NO:37)的同源物。在其他实施例中,本公开的yvmA基因(或其ORF)编码枯草芽孢杆菌YvmA蛋白(SEQ ID NO:30)的同源物。
如本文使用的,“直系同源物”和“直系同源基因”是指通过物种形成从共同祖先基因(即,同源基因)进化的不同物种中的基因。典型地,直系同源物在进化过程期间保持相同功能。直系同源物的鉴定可用于新测序基因组中基因功能的可靠预测。
如本文使用的,“旁系同源物”和“旁系同源基因”是指与基因组内重复相关的基因。虽然直系同源物在进化过程中保持相同功能,但旁系同源物进化出新功能,即使一些功能通常与原始功能相关。旁系同源基因的实例包括但不限于编码胰蛋白酶、胰凝乳蛋白酶、弹性蛋白酶和凝血酶的基因,上述酶都是丝氨酸蛋白酶并且在同一物种内一起出现。
如本文使用的,“同源性”是指序列相似性或同一性,同一性优先。这种同源性使用本领域已知的标准技术确定(参见例如,Smith和Waterman,1981;Needleman和Wunsch,1970;Pearson和Lipman,1988;威斯康星遗传学软件包(Wisconsin Genetics SoftwarePackage)(威斯康星州麦迪逊市的遗传学电脑集团(Genetics Computer Group,Madison,WI))中的程序,如GAP、BESTFIT、FASTA和TFASTA,以及Devereux等人,1984)。
如本文使用的,术语“杂交”是指通过碱基配对将核酸链与互补链连接的过程,如本领域已知的。如果两个序列在中至高严格杂交和洗涤条件下彼此特异性杂交,则认为核酸序列与参考核酸序列“可选择性杂交”。杂交条件是基于核酸结合复合物或探针的解链温度(Tm)。例如,“最大严格”典型地发生在约Tm -5℃(比探针的Tm低5°);“高严格”发生在低于Tm约5℃-10℃;“中等严格”发生在比探针的Tm低约10℃-20℃;并且“低严格”发生在低于Tm约20℃-25℃。在功能上,最大严格条件可以用于鉴定与杂交探针具有严格同一性或近乎严格同一性的序列;而中或低严格杂交可用于鉴定或检测多核苷酸序列同源物。中和高严格杂交条件是本领域熟知的。高严格条件的实例包括如下杂交:在约42℃下在50%甲酰胺、5XSSC、5X登哈特溶液(Denhardt's solution)、0.5% SDS和100pg/ml变性载剂DNA中进行,随后在室温(RT)下在2X SSC和0.5% SDS中洗涤两次,并且在42℃下在0.1X SSC和0.5% SDS中再洗涤两次。中等严格条件的实例包括在37℃下在包含20%甲酰胺、5x SSC(150mMNaCl、15mM柠檬酸三钠)、50mM磷酸钠(pH 7.6)、5x Denhardt溶液、10%硫酸葡聚糖和20mg/ml变性剪切的鲑鱼***DNA的溶液中过夜孵育,随后在约37-50℃下在1x SSC中洗涤过滤器。本领域技术人员知道如何根据需要调节温度、离子强度等,以适应如探针长度等的因素。
如本文使用的,“重组体”包括提及细胞或载体,其已经通过引入异源核酸序列而被修饰,或者所述细胞衍生自已如此修饰的细胞。因此,例如,重组细胞表达未在细胞的天然(非重组)形式内发现的相同形式的基因或表达以其他方式异常表达的、低表达的或根本不表达的天然基因(由于故意的人为干预)。“重组(recombination)”、“重组(recombining)”或产生“重组的(recombined)”核酸是两个或更多个核酸片段的组装,其中组装产生嵌合基因。
如本文使用的,“侧翼序列”是指正在讨论的序列的上游或下游的任何序列(例如,针对基因A-B-C,基因B以A和C基因序列为侧翼)。在某些实施例中,输入序列在每侧的侧翼为同源盒。在另一个实施例中,输入序列和同源盒包含在每侧的侧翼为填充序列的单元。在一些实施例中,侧翼序列仅存在于单侧(3'或5'),但是在优选的实施例中,它在被侧翼的序列的每侧。每个同源盒的序列与芽孢杆菌属染色体中的序列同源。这些序列指导在芽孢杆菌属染色体中,新构建体被整合,并且部分芽孢杆菌属染色体将被输入序列替代。在其他实施例中,选择性标记的5'和3'端的侧翼为包含灭活染色体区段的部分的多核苷酸序列。在一些实施例中,侧翼序列仅存在于单侧(3'或5'),而在其他实施例中,它存在于被侧翼的序列的每侧。在一些实施例中,同源盒直接在彼此侧翼,并且缺乏间插序列(例如,对于基因D-E-F,构建体为D-F),使得如果构建体在基因组内重组,则将从基因组中去除基因E。
II.红色素(普切明)
如上文一般性描述的,芽孢杆菌属细胞(菌株)经常被用作生产工业相关蛋白质(例如,淀粉酶、蛋白酶等)的微生物工厂,这些蛋白质是食品、纺织品、洗衣、医疗器械清洗、制药工业等所必需的。因此,具有所期望性状/表型(如增强的蛋白质产生、增强的生长速率、增强的适应性等)的芽孢杆菌属宿主菌株是用于产生目的蛋白的特别合适的宿主菌株。然而,如上文简述和下文所述,当发酵某些芽孢杆菌属菌株时,发酵肉汤形成(积累)不期望的红色素(称为普切明)。例如,当发酵芽孢杆菌属细胞以产生目的蛋白(POI)时,发酵肉汤中形成(存在)的任何红色素典型地需要昂贵的加工步骤(例如,在POI的回收和纯化过程中)以避免/减轻与POI共纯化的红色素。
如本领域中通常所理解的,普切明是由普切明酸螯合铁离子而产生的微红色素,其中在发酵肉汤(培养基)中形成的普切明是由两(2)个铁分子(Fe3+)与普切明酸螯合产生的。例如,通过某些芽孢杆菌属物种细胞合成普切明酸已经被描述(Uffen和Canale-Parola,1972;MacDonald,1967)。PCT公开号WO 2004/011609公开了通过删除此类枯草芽孢杆菌菌株中的cypX基因和/或yvmC基因来减轻枯草芽孢杆菌发酵中红色素的方法。最近,枯草芽孢杆菌YvmB(MarR样)蛋白被描述为控制yvmC-cypX(操纵子)表达的主要转录因子(Randazzo等人,2016)。如Randazzo等人(2016)所综述,在枯草芽孢杆菌细胞中,YvmC将leu-tRNA转化为环-L-亮氨酰-L-亮氨酰,并且随后将环-L-亮氨酰-L-亮氨酰催化为普切明酸由CypX进行,其中普切明酸由枯草芽孢杆菌通过未知机制分泌。另外,普切明形成和枯草芽孢杆菌生物膜生长停滞的作用已经被描述(Arnaouteli等人,2019)。
如本文和下文实例部分所述,申请人已经鉴定出了一种新的用于减轻、减少或消除在某些芽孢杆菌属发酵中观察到的红色素(普切明)的产生的方式。更特别地,如本文所举例说明的,申请人惊奇地发现过表达枯草芽孢杆菌yvmA基因的芽孢杆菌属细胞在普切明的产生方面特别缺乏,而具有yvmA基因缺失(ΔyvmA)的芽孢杆菌属细胞在发酵肉汤中产生增加水平的普切明。同样,如本文所举例说明的,申请人惊奇地观察到铝离子(例如,AlCl3)是减轻、减少或消除芽孢杆菌属发酵过程中红色素(普切明)形成的有效化学手段。
更特别地,如下文实例1中所述,申请人构建了某些yvmA(基因)过表达盒(例如,参见图1)以评估YvmA关于对发酵肉汤中普切明(红色素)形成的影响。例如,枯草芽孢杆菌yvmA基因是yvmB-yvmA操纵子的一部分,其与yvmC-cypX操纵子相邻。yvmA基因编码一种推定的转运蛋白,其具有类似于MFS(主要易化子超家族)类转运蛋白的基序,其中该类转运蛋白的一些成员在铁稳态中起作用(Pi和Helman,2017)。
如图1所示,构建的yvmA表达盒(实例1)包含与下游(3′)yvmA可读框(ORF)序列可操作地连接的上游(5′)异源启动子序列,例如PspoVG-yvmA(SEQ ID NO:18)、Phbs-yvmA(SEQ ID NO:19)、PyvyD-yvmA(SEQ ID NO:20)和PpstS-yvmA(SEQ ID NO:21)。另外,为了研究在表达/产生POI的芽孢杆菌属细胞中过表达yvmA的效果,申请人构建了产生蛋白酶并过表达yvmA的枯草芽孢杆菌细胞(实例2)。例如,如实例3中一般性描述的,在二十四(24)、四十八(48)、七十二(72)小时时拍摄培养物的数字图像,其中在整个发酵时间过程中,与亲本产(GG36)蛋白酶的枯草芽孢杆菌细胞相比,在过表达yvmA的产(GG36)蛋白酶的枯草芽孢杆菌细胞中容易观察到肉汤的红色/棕色减少(图2A)。如图2B所示,在相同的时间过程中,相比(相对)于亲本产(GG36)蛋白酶的细胞,yvmA过表达细胞的亮度增加也是显而易见的,进一步注意到可观察到的红色/棕色减少的程度与过表达yvmA的启动子的强度相关。例如,测试的最强启动子spoVG与来自测试的最弱启动子pstS的yvmA表达相比,减少了更多的红色/棕色(图2B)。此外,为了确定观察到的yvmA过表达细胞的红色/棕色肉汤颜色的减少是否是由于普切明的减少,申请人定量了七十二(72)小时后由亲本和经修饰的细胞产生的普切明的相对量,如图3A和图3B所示。
实例4进一步描述了表达两(2)个拷贝的示例性POI(2x GG36蛋白酶)和过表达yvmA(2x GG36 Phbs-yvmA)的枯草芽孢杆菌细胞的构建。如实例5中所述,申请人根据芽孢杆菌属两(2)个拷贝蛋白酶产生菌株(2x GG36 Phbs-yvmA)的生长速率评估了yvmA的过表达,其中菌株的生长速率经由在十八(18)、二十四(24)、四十(40)和九十(90)小时时采集的样品的光谱仪吸光度来监测。例如,如图4A所示,2x GG36和2x GG36 Phbs-yvmA细胞的生长速率没有显著差异,表明来自hbs启动子(Phbs)的yvmA过表达不会不利地影响表达两个拷贝的示例性POI(例如,碱性丝氨酸蛋白酶)的芽孢杆菌属(细胞)菌株的生长速率。如实例6中所述,申请人还评估了yvmA过表达对蛋白酶产生的影响(即,经由活性),结果证明yvmA过表达对蛋白酶产生没有显著的负面影响(图4B)。如实例7中所述地定量由实例4构建的芽孢杆菌属细胞(即,2x GG36和2x GG36 Phbs-yvyD)产生的普切明的量。例如,如图4C所示,2xGG36 Phbs-yvmA细胞产生的普切明明显少于2x GG36细胞,从而证明过表达yvmA使得此类芽孢杆菌属细胞(菌株)在红色素(普切明)的产生方面有缺陷。
为了进一步验证上述观察结果,并更好地理解YvmA蛋白功能,申请人破坏了yvmA基因座(ΔyvmA;实例8)。例如,如所述地使1x GG36和1x GG36 PspoVG-yvmA细胞(实例2)和1x GG36ΔyvmA细胞生长(实例8)。如图5A所示,在生长四十八(48)小时后,yvmA破坏的细胞(1x GG36ΔyvmA)的颜色比亲本细胞(1x GG36)和/或yvmA过表达细胞(1x GG36 PspoVG-yvmA)更明显地呈红色/棕色。另外,相对于亲本(1x GG36)细胞,yvmA过表达细胞(1x GG36PspoVG-yvmA)产生较少的红色/棕色肉汤颜色(图5A)。如图5B所示,普切明定量测定还证明,与亲本细胞(1x GG36)和/或yvmA过表达细胞(1x GG36PspoVG-yvmA)相比,yvmA破坏的细胞(1x GG36ΔyvmA)产生更多的普切明。
在某些其他实施例中,申请人已经考虑了在此类芽孢杆菌属发酵过程中控制/减轻红色素(普切明)形成的化学手段。更特别地,为了测试这一假设,将高产普切明的yvmA破坏的菌株(1x GG36ΔyvmA;实例8)与增加量的氯化铝(AlCl3)共发酵。例如,如图6A所呈现,在生长二十(20)小时后,发酵肉汤中红色/棕色的减少是可见的,其中五十(50)小时后红色/棕色的减少更明显。如图6B所示(参见;左轴),测定了这些培养物的相对亮度,其中亮度的增加与在五十(50)小时的时间点预加入到1x GG36ΔyvmA菌株发酵中的氯化铝[AlCl3]的浓度(正)相关。另外,在五十(50)小时的时间点取预添加氯化铝(AlCl3)的1x GG36ΔyvmA菌株的等分试样,其中测定了这些样品中普切明的相对量(图6B;右轴)。如图6C所描绘,向芽孢杆菌属发酵(例如,1x GG36ΔyvmA)中预添加氯化铝(AlCl3)不会影响芽孢杆菌属细胞的生长速率(实例10),并且如图6D所示,预添加至少十(10)mM AlCl3不会显著影响此类芽孢杆菌属细胞(菌株)生长/培养/发酵期间产生的POI的量。
在其他实施例中,申请人构建了表达枯草芽孢杆菌YvmA蛋白(SEQ ID NO:30)的地衣芽孢杆菌菌株。更特别地,如实例12中所述,构建地衣芽孢杆菌菌株以在异源启动子(hbs启动子、spoVG启动子)的控制下表达功能性枯草芽孢杆菌YvmA蛋白(SEQ ID NO:30)。例如,具有amyL::[Phbs-yvmA tetR](SEQ ID NO:33)的正确序列的两(2)个独立分离株被储存为菌株BF1175和BF1176;并且具有amyL::[PspoVG-yvmA tetR](SEQ ID NO:40)的正确序列的两(2)个独立分离株被储存为菌株BF1177和BF1178(实例12;表5)。通过从细胞的全肉汤培养物中提取普切明的钠盐(实例13),申请人进一步评估了由表达枯草芽孢杆菌YvmA蛋白的地衣芽孢杆菌细胞产生的普切明的量(实例12)。如实例13(表6)所述,在所有测试的情况下,来自两(2)种异源启动子(Phbs和PspoVG)中任一种的枯草芽孢杆菌YvmA蛋白在地衣芽孢杆菌中的表达将存在于细胞外的普切明的量减少了超过50%,这表明使用枯草芽孢杆菌YvmA蛋白(或其同源物)来减少、减轻或以其他方式消除普切明(红色素)的产生和/或形成可以用于产生该化合物的广谱细菌物种。通过在两(2)升生物反应器中发酵来进一步评估所构建和描述的枯草芽孢杆菌菌株(实例12)(实例13;图7和表7),以确定在以上实例中观察到的铝离子的红色/棕色减少益处是否在更具工业相关性的条件(例如,增加的生物反应器体积、更高的细胞密度等)下延伸至其他细菌细胞/菌株。另外,如下文实例中所述,预添加AlCl3或Al2(SO4)3不影响枯草芽孢杆菌细胞在2L生物反应器中发酵时的生长速率(实例15),预添加AlCl3或Al2(SO4)3也不影响在2L生物反应器中发酵的地衣芽孢杆菌菌株的蛋白质生产率(实例16)。
因此,如上文一般性描述的,表达枯草芽孢杆菌yvmA基因(ORF)的芽孢杆菌属细胞在红色素(普切明)的产生方面有缺陷,而yvmA被破坏的芽孢杆菌属细胞(ΔyvmA)在发酵肉汤中产生增加水平的红色素(普切明)。因此,在某些实施例中,本公开的yvmA基因(或其ORF)是编码功能性YvmA蛋白的枯草芽孢杆菌yvmA基因(SEQ ID NO:37)的同源物。例如,如上所简述,YvmA蛋白是转运蛋白的主要易化子超家族(MFS)的成员。如Pao等人(1998)中一般性描述的,MFS转运蛋白是一种单多肽二级载体,其响应于化学渗透离子梯度仅能够转运小分子溶质,其充当单向转运蛋白、同向转运蛋白或反向转运蛋白。另外,MFS蛋白含有十二(12)个跨膜(TM)区。因此,在某些实施例中,本公开涉及枯草芽孢杆菌yvmA基因的yvmA基因(ORF)同源物。因此,某些其他实施例涉及编码与SEQ ID NO:30的枯草芽孢杆菌YvmA蛋白具有基本的序列同一性的芽孢杆菌属YvmA蛋白(同源物)的yvmA基因(ORF)同源物。在某些其他实施例中,芽孢杆菌属YvmA蛋白(同源物)包含十二(12)个跨膜(TM)区(即,MFS转运蛋白的共同特征)。例如,在某些实施例中,yvmA基因(ORF)同源物编码芽孢杆菌属YvmA蛋白(同源物)(其包含与SEQ ID NO:30的枯草芽孢杆菌YvmA蛋白具有基本的序列同一性,并具有十二(12)个跨膜(TM)结构域)。
在某些其他实施例中,本公开涉及包含yvmA基因缺失或破坏的芽孢杆菌属细胞。更特别地,如本领域通常已知的,普切明的产生是一些真核生物和原核生物使用的技术,以通过环境铁(FeIII)的螯合来拮抗竞争性生物体的生长(Sipiczki,2020)。例如,普切明酸/普切明的产生由于其抗微生物特性而成为活跃的目的和研究领域(Li等人,2017)。因此,将产生普切明的生物体用于生物控制的概念是当前研究的领域(Pawlikowska等人,2019),其中已知来自梅奇酵母(Metschnikowia)属的酵母强烈拮抗来自链格孢属(Alternaria)、葡萄孢属(Botrytis)、镰孢属(Fusarium)、根霉属(Rhizopus)和轮枝孢属(Verticillum)的霉菌的生长。
因此,在某些实施例中,本公开涉及包含yvmA基因缺失或破坏的经修饰的芽孢杆菌属细胞,其中经修饰的细胞产生增加量的普切明酸/普切明。更特别地,如实例部分所述,具有yvmA缺失的经修饰的芽孢杆菌属物种细胞产生增加量的普切明,如在生长培养基中所检测的(例如,参见图5A和图5B)。如本文所考虑的,本公开的此类经修饰的芽孢杆菌属细胞特别适合用作生物控制剂。例如,如本领域技术人员所理解的,大多数芽孢杆菌属物种细胞获得了欧洲食品***(European Food Safety Authority)的“安全合理推定(QualifiedPresumption of Safety)”(QPS)状态,并且它们的许多产品获得了美国食品和药物管理局(US Food and Drug Administration)的“公认安全(Generally Recognized As Safe)”(GRAS)状态,使得此类芽孢杆菌属物种细胞(即,产生增加量的普切明酸/普切明)在此类生物控制应用中特别有用。因此,在某些实施例中,本公开涉及用于构建产生增加量的普切明酸/普切明的经修饰的芽孢杆菌属细胞的方法和组合物。因此,某些其他实施例涉及此类经修饰的芽孢杆菌属细胞(即,产生增加量的普切明酸/普切明)用于拮抗不期望的微生物生长的用途。其他实施例涉及包含增加量的通过培养/发酵本公开的经修饰的芽孢杆菌属细胞(即,包含缺失或破坏的yvmA基因)获得的普切明酸/普切明的培养/发酵培养基(肉汤)。其他实施例涉及生物控制组合物及其方法,其包含本公开的经修饰的芽孢杆菌属细胞(即,产生增加量的普切明酸/普切明)和/或通过在用于增加普切明酸/普切明产生的合适条件下培养/发酵本文所述的经修饰的芽孢杆菌属细胞获得的培养/发酵肉汤。
III.分子生物学
如上所述,本公开的某些实施例涉及经修饰的衍生自亲本芽孢杆菌属细胞的(突变型)芽孢杆菌属细胞。因此,某些实施例涉及用于遗传修饰亲本芽孢杆菌属细胞(菌株)以生成经修饰的芽孢杆菌属(子代)细胞的组合物和方法。
因此,某些实施例涉及用于遗传修饰芽孢杆菌属细胞的方法,该方法包括但不限于(a)在基因(或其ORF)中引入、取代、或去除一个或多个核苷酸,或者在基因(或其ORF)的转录或翻译所需的调控元件中引入、取代、或去除一个或多个核苷酸,(b)基因破坏,(c)基因转换,(d)基因缺失,(e)基因下调,(f)位点特异性诱变,和/或(g)随机诱变。
因此,在某些实施例中,通过使用本领域熟知的方法(例如,***、破坏、替代、或缺失)减少或消除上述基因的表达来构建本公开的经修饰的芽孢杆菌属细胞。待修饰或灭活的基因的部分可以是例如编码区或编码区表达所需的调控元件。
这样的调控或控制序列的实例可以是启动子序列或其功能部分(即,足以影响核酸序列的表达的部分)。用于修饰的其他控制序列包括但不限于前导序列、前肽序列、信号序列、转录终止子、转录活化子等。
在某些其他实施例中,通过基因缺失构建经修饰的芽孢杆菌属细胞以消除或减少本公开的至少一种前述基因的表达。基因缺失技术使得能够部分或完全去除一个或多个基因,从而消除它们的表达,或者表达非功能性(或活性降低的)蛋白质产物。在此类方法中,一个或多个基因的缺失可以通过使用已构建为连续含有侧翼于该基因的5'和3'区的质粒进行同源重组来完成。可以将连续的5'和3'区域引入芽孢杆菌属细胞中,例如,在温度敏感质粒(如pE194)上,在允许的温度下与第二个选择性标记缔合,以允许质粒在细胞中建立。然后将细胞转移到非许可温度,以选择质粒整合到染色体同源侧翼区之一的细胞。通过选择第二可选择性标记来实现质粒整合的选择。在整合后,通过将细胞移至允许温度持续几代而不进行选择来刺激第二同源侧翼区处的重组事件。将细胞铺板以获得单菌落,并且检查菌落是否丢失两种可选择性标记(参见例如,Perego,1993)。因此,本领域技术人员(例如,通过参考(核酸)序列和其所编码的蛋白质序列)可以容易地在适合于完全或部分缺失的基因的编码序列和/或基因的非编码序列中鉴定核苷酸区。
在其他实施例中,通过在基因或其转录或翻译所需的调控元件中引入、取代、或去除一个或多个核苷酸来构建本公开的经修饰的芽孢杆菌属细胞。例如,可以***或去除核苷酸,以便导致终止密码子的引入、起始密码子的去除或可读框的移码。此种修饰可以根据本领域已知的方法通过定点诱变或PCR产生的诱变来完成(例如,参见Botstein和Shortle,1985;Lo等人,1985;Higuchi等人,1988;Shimada,1996;Ho等人,1989;Horton等人,1989;以及Sarkar和Sommer,1990)。因此,在某些实施例中,通过完全或部分缺失使本公开的基因失活。
在另一实施例中,通过基因转换的过程构建经修饰的芽孢杆菌属细胞(例如,参见Iglesias和Trautner,1983)。例如,在基因转换方法中,对应于一个或多个基因的核酸序列在体外诱变以生产缺陷核酸序列,然后将该缺陷核酸序列转化到亲本芽孢杆菌属细胞中以产生缺陷基因。通过同源重组,缺陷核酸序列替代内源基因。可能期望的是,缺陷基因或基因片段也编码可以用于选择含有缺陷基因的转化体的标记。例如,可以将缺陷基因与可选择标记缔和引入非复制或温度敏感的质粒上。通过在不允许质粒复制的条件下选择标记来实现质粒整合的选择。通过检查菌落是否丢失可选择性标记和是否获得经突变的基因来实现导致基因替代的第二重组事件的选择(Perego,1993)。可替代地,缺陷核酸序列可以含有基因的一个或多个核苷酸的***、取代或缺失,如下文所述。
在其他实施例中,通过建立的反义技术使用与基因的核酸序列互补的核苷酸序列来构建经修饰的芽孢杆菌属细胞(Parish和Stoker,1997)。更特别地,可以通过引入与基因的核酸序列互补的核苷酸序列来减少(下调)或消除芽孢杆菌属细胞的基因的表达,该核苷酸序列可以在细胞中转录并且能够与细胞中产生的mRNA杂交。在允许互补反义核苷酸序列与mRNA杂交的条件下,翻译的蛋白质的量因此减少或消除。此类反义方法包括但不限于RNA干扰(RNAi)、小干扰RNA(siRNA)、微小RNA(miRNA)、反义寡核苷酸等,所有这些都是熟练技术人员熟知的。
在其他实施例中,经由CRISPR-Cas9编辑产生/构建经修饰的芽孢杆菌属细胞。例如,可以借助核酸指导的内切核酸酶破坏(或缺失或下调)基因,这些核酸指导的内切核酸酶通过结合指导RNA(例如,Cas9)和Cpfl或指导DNA(例如,NgAgo)发现其靶DNA,这将内切核酸酶募集到DNA上的靶序列上,其中内切核酸酶可以在DNA中产生单链或双链断裂。此靶向DNA断裂成为DNA修复的底物,并且可以与所提供的编辑模板重组以使基因破坏或缺失。例如,编码核酸指导的核酸内切酶(出于此目的,来自化脓链球菌的Cas9)的基因或编码Cas9核酸酶的密码子优化的基因可操作地连接到在芽孢杆菌属细胞中有活性的启动子和在芽孢杆菌属细胞中有活性的终止子,从而产生芽孢杆菌Cas9表达盒。同样,本领域技术人员容易地鉴定目的基因特有的一个或多个靶位点。例如,为了使用化脓链球菌Cas9构造编码gRNA的针对目的基因内的靶位点的DNA构建体,可变的靶向(VT)结构域将包含为(PAM)原间隔子邻近基序(NGG)5'的靶位点的核苷酸,该核苷酸与编码化脓链球菌Cas9的Cas9核酸内切酶识别结构域(CER)的DNA融合。将编码VT结构域的DNA和编码CER结构域的DNA组合,从而产生编码gRNA的DNA。因此,通过将编码gRNA的DNA有效地连接到在芽孢杆菌属细胞中有活性的启动子和在芽孢杆菌属细胞中有活性的终止子来产生gRNA的芽孢杆菌属表达盒。
在某些实施例中,将由内切核酸酶诱导的DNA断裂用输入序列修复/替代。例如,为了精确修复由上述Cas9表达盒和gRNA表达盒产生的DNA断裂,提供了核苷酸编辑模板,使得细胞的DNA修复机构可以利用编辑模板。例如,靶基因的约500-bp 5'可以与靶基因的约500-bp 3'融合以生成编辑模板,该模板由芽孢杆菌宿主的机器用于修复由RGEN生成的DNA断裂。
可以使用许多不同的方法将Cas9表达盒、gRNA表达盒和编辑模板共同递送至细胞。通过用正向和反向引物扩增基因座,通过PCR扩增靶基因座来筛选经转化的细胞。这些引物可以扩增野生型基因座或已由RGEN编辑的经修饰的基因座。
在又其他实施例中,使用本领域熟知的方法(包括但不限于化学诱变(参见例如,Hopwood,1970)和转座(参见例如,Youngman等人,1983)),通过随机或特异性诱变构建经修饰的芽孢杆菌属细胞。可以通过使亲本细胞经受诱变并且筛选基因表达已减少或消除的突变型细胞来进行基因的修饰。可以例如通过使用合适的物理或化学诱变剂、使用合适的寡核苷酸或使DNA序列经受PCR产生的诱变来进行可以是特异性的或随机的诱变。此外,诱变可以通过使用这些诱变方法的任何组合来进行。
适用于本发明目的的物理或化学诱变剂的实例包括紫外线(UV)照射、羟胺、N-甲基-N'-硝基-N-亚硝基胍(MNNG)、N-甲基-N'-亚硝基胍(NTG)、邻甲基羟胺、亚硝酸、甲烷磺酸乙酯(EMS)、亚硫酸氢钠、甲酸、和核苷酸类似物。当使用此类试剂时,典型地通过如下方式来进行诱变:在合适的条件下在选择的诱变剂的存在下孵育待诱变的亲本细胞,并且选择展现出基因的表达降低或无表达的突变型细胞。
国际PCT公开号WO 2003/083125公开了用于修饰芽孢杆菌属细胞的方法,如使用PCR融合来产生芽孢杆菌属缺失菌株和DNA构建体以绕过大肠杆菌。PCT公开号WO 2002/14490公开了用于修饰芽孢杆菌属细胞的方法,这些方法包括(1)构建和转化整合的质粒(pComK),(2)随机诱变编码序列、信号序列和前肽序列,(3)同源重组,(4)通过向转化DNA添加非同源侧翼提高转化效率,(5)优化双交叉整合,(6)定向诱变和(7)无标记缺失。
本领域技术人员熟知用于将多核苷酸序列引入细菌细胞(例如,大肠杆菌和芽孢杆菌属物种)中的合适方法(例如,Ferrari等人,1989;Saunders等人,1984;Hoch等人,1967;Mann等人,1986;Holubova,1985;Chang等人,1979;Vorobjeva等人,1980;Smith等人,1986;Fisher等人,1981;以及McDonald,1984)。实际上,包括原生质体转化和中板集合、转导和原生质体融合在内的诸如转化等的方法是已知的并且适合用于本公开。转化方法特别优选地用于将本公开的DNA构建体引入宿主细胞中。
除了通常使用的方法之外,在一些实施例中,直接转化宿主细胞(即,在引入宿主细胞中之前,中间细胞不用于扩增或以其他方式处理DNA构建体)。将DNA构建体引入宿主细胞中包括本领域已知的将DNA引入宿主细胞中而不***质粒或载体中的那些物理和化学方法。此类方法包括但不限于氯化钙沉淀、电穿孔、裸DNA、脂质体等。在另外的实施例中,将DNA构建体与质粒一起共转化而不***该质粒中。在进一步的实施例中,通过本领域已知的方法,将选择性标记从经修饰的芽孢杆菌属菌株中缺失或基本上切除(例如,Stahl等人,1984;Palmeros等人,2000)。在一些实施例中,载体从宿主染色体上分解下来,将侧翼区留在染色体上,而将固有的染色体区去除。
用于在芽孢杆菌属细胞中表达基因、其可读框(ORF)和/或其变体序列的启动子和启动子序列区通常是本领域技术人员已知的。通常选择本公开的启动子序列,使得它们在芽孢杆菌属细胞中起作用。某些示例性芽孢杆菌属启动子序列包括但不限于枯草芽孢杆菌碱性蛋白酶(aprE)启动子、枯草芽孢杆菌的α-淀粉酶启动子、解淀粉芽孢杆菌的α-淀粉酶启动子、来自枯草芽孢杆菌的中性蛋白酶(nprE)启动子、突变型aprE启动子(例如,PCT公开号WO 2001/51643)或来自芽孢杆菌属的任何其他启动子。在PCT公开号WO 2003/089604中描述了用于在芽孢杆菌属细胞中筛选和产生具有一系列活性(启动子强度)的启动子文库的方法。
IV.发酵用于产生目的蛋白的芽孢杆菌属细胞
如上文一般性描述的,某些实施例涉及用于构建和获得产生目的蛋白(POI)的芽孢杆菌属细胞(菌株)的组合物和方法。更特别地,某些实施例涉及用于在色素缺陷型芽孢杆菌属细胞中产生目的蛋白(POI)的组合物和方法。因此,其他实施例涉及由此类色素缺陷型芽孢杆菌属细胞产生的目的色素缺陷型蛋白。因此,某些实施例涉及通过在适合的培养基中生长/培养/发酵细胞,在芽孢杆菌属细胞中产生目的蛋白的方法。本领域熟知的发酵方法可以用于发酵本公开的亲本和经修饰的(子代)芽孢杆菌属细胞。
在一些实施例中,将细胞在分批或连续发酵条件下培养。经典的分批发酵是封闭的***,其中在发酵开始时设定培养基的组成,并且该组成在发酵期间不改变。在发酵开始时,将培养基用一种或多种期望生物体接种。在这种方法中,允许发酵发生而不向***中添加任何组分。典型地,分批发酵符合关于添加碳源的“分批”的资格,并且经常对控制因素(诸如,pH和氧浓度)进行尝试。分批***的代谢物和生物质组成不断变化直到发酵停止时。在典型分批培养中,细胞可以通过静态停滞期进展到高生长对数期,并且最后进入生长速率减小或停止的静止期。如果不经处理,处于静止期的细胞最终死亡。通常,处于对数期的细胞负责产物的大量产生。
标准分批***的合适变体是“补料分批”发酵***。在典型分批***的这种变体中,随着发酵的进展,以增量添加底物。当分解代谢物阻遏可能抑制细胞的代谢时并且在培养基中希望具有有限量的底物的情况下,补料分批***是有用的。在补料分批***中实际底物浓度的测量是困难的并且因此基于可测量因素(诸如pH、溶解氧和废气(诸如CO2)的分压)的变化对其进行估计。分批和补料分批发酵在本领域中是常用并且已知的。
连续发酵是开放的***,其中将确定的发酵培养基连续添加到生物反应器中,同时去除等量的条件培养基以用于处理。连续发酵通常将培养物保持在恒定的高密度,其中细胞主要处于对数期生长。连续发酵允许对影响细胞生长和/或产物浓度的一种或多种因素进行调节。例如,在一个实施例中,将限制营养素(诸如碳源或氮源)保持在固定的速率,并且允许调控所有其他参数。在其他***中,影响生长的许多因素可以不断改变,而通过培养基浊度测量的细胞浓度保持不变。连续***努力保持稳态生长条件。因此,由于转移培养基而引起的细胞损失应当与发酵中的细胞生长速率相平衡。调节用于连续发酵过程的营养素和生长因子的方法以及用于最大化产物形成速率的技术是工业微生物学领域中熟知的。
在某些实施例中,可以通过常规程序从培养基中回收由本公开的芽孢杆菌属细胞表达/产生的目的蛋白,这些常规程序包括通过离心或过滤从培养基中分离宿主细胞,或者如果需要,破坏细胞并从细胞部分和碎片中去除上清液。典型地,在澄清后,将上清液或滤液的蛋白质组分借助盐(例如,硫酸铵)沉淀。然后将沉淀出的蛋白质溶解,并且可以通过各种色谱程序(例如,离子交换色谱法、凝胶过滤)进行纯化。
V.目的蛋白
本公开的目的蛋白(POI)可以是任何内源蛋白或异源蛋白,并且其可以是此种POI的变体。蛋白质可以包含一个或多个二硫桥,或者是其功能形式是单体或多聚体的蛋白质,即蛋白质具有四级结构并且由多个相同(同源的)或不相同的(异源的)亚基构成,其中POI或其变体POI优选是具有目的特性的POI。
在某些优选的实施例中,经修饰的芽孢杆菌属细胞在红色素的产生方面有缺陷(如上所述),使得从其产生和分离的POI在红色素(普切明)方面有缺陷,即相对于其未修饰的(亲本)细胞而言。
在某些实施例中,可以评估POI相对于(未修饰的)亲本细胞的比生产力(Qp)。例如,比生产力(Qp)的检测是用于评价蛋白质产生的合适方法。比生产力(Qp)可以使用以下等式确定:
“Qp=gP/gDCW·hr”
其中,“gP”是罐中产生的蛋白质的克数;“gDCW”是罐中的干细胞重量(DCW)的克数;并且“hr”是从接种时间开始的以小时计的发酵时间,其包括生产时间以及生长时间。
在某些实施例中,POI或其变体POI选自由以下组成的组:乙酰酯酶、氨肽酶、淀粉酶、***聚糖酶、***呋喃糖苷酶、碳酸酐酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、凝乳酶、角质酶、脱氧核糖核酸酶、差向异构酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡聚糖酶、葡聚糖裂解酶、内切-β-葡聚糖酶、葡糖淀粉酶、葡萄糖氧化酶、α-葡糖苷酶、β-葡糖苷酶、葡萄糖醛酸酶、糖基水解酶、半纤维素酶、己糖氧化酶、水解酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、裂解酶、甘露糖苷酶、氧化酶、氧化还原酶、果胶酸裂合酶、果胶乙酰酯酶、果胶解聚酶、果胶甲酯酶、果胶分解酶、过水解酶、多元醇氧化酶、过氧化物酶、酚氧化酶、植酸酶、聚半乳糖醛酸酶、蛋白酶、肽酶、鼠李糖-半乳糖醛酸酶、核糖核酸酶、转移酶、转运蛋白、转谷氨酰胺酶、木聚糖酶、己糖氧化酶、及其组合。
因此,在某些实施例中,POI或其变体POI是选自酶学委员会(EC)编号EC 1、EC 2、EC 3、EC 4、EC 5或EC 6的酶。
在某些其他实施例中,本公开的经修饰的芽孢杆菌属细胞包含编码淀粉酶的表达构建体。多种淀粉酶及其变体是本领域技术人员已知的。例如,国际PCT公开号WO 2006/037484和WO 2006/037483描述了具有改善的溶剂稳定性的变体α-淀粉酶,PCT公开号WO1994/18314公开了氧化稳定的α-淀粉酶变体,PCT公开号WO 1999/19467、WO 2000/29560和WO 2000/60059公开了Termamyl-样α-淀粉酶变体,PCT公开号WO 2008/112459公开了衍生自芽孢杆菌属物种编号707的α-淀粉酶变体,PCT公开号WO 1999/43794公开了生麦芽的α-淀粉酶变体,PCT公开号WO 1990/11352公开了超热稳定的(hyper-thermostable)α-淀粉酶变体,PCT公开号WO 2006/089107公开了具有颗粒淀粉水解活性的α-淀粉酶变体等。
存在本领域普通技术人员已知的用于检测和测量细胞内和细胞外表达的蛋白质的活性的各种测定。
PCT公开号WO 2014/164777公开了可用于检测本文所述的淀粉酶活性的Ceralphaα-淀粉酶活性测定。
在某些其他实施例中,本公开的经修饰的芽孢杆菌属细胞包含编码蛋白酶的表达构建体。多种蛋白酶及其变体是本领域技术人员已知的。例如,合适的蛋白酶可以衍生自迟缓芽孢杆菌(PCT公开号WO 2011/140316和WO2012/151534)、地衣芽孢杆菌(PCT公开号WO2016/183509;美国公开号US2020/0123522)、吉氏芽孢杆菌(Bacillus gibsonii)(PCT公开号WO 2003/054185;WO 2015/089447;WO 2020/242858)、解淀粉芽孢杆菌(美国专利号5,972682)、克劳氏芽孢杆菌(WO 2010/056634)、土芽孢杆菌属(WO 2009/058303)、短小芽孢杆菌(Bacillus pumilus)(WO 2007/131656)、芽孢杆菌属物种TY-145蛋白酶(WO 2015/014803)等。
V.示例性实施例
本文公开的组合物和方法的非限制性实施例如下:
1.一种衍生自亲本芽孢杆菌属细胞的经修饰的芽孢杆菌属细胞,其中该经修饰的细胞包含引入的编码功能性YvmA蛋白的yvmA表达盒,其中当在相同条件下生长(培养)时,该经修饰的细胞相对于该亲本细胞在红色素的产生方面有缺陷。
2.一种衍生自包含编码功能性YvmA蛋白的yvmA基因的亲本芽孢杆菌属细胞的经修饰的芽孢杆菌属细胞,其中该经修饰的细胞包含用异源启动子(序列)替代该yvmA基因的天然启动子(序列)的遗传修饰,该异源启动子(序列)能够相对于该yvmA基因的天然启动子增加该yvmA基因的表达,其中当在相同条件下生长(培养)时,该经修饰的细胞相对于该亲本细胞在红色素的产生方面有缺陷。
3.如实施例1所述的芽孢杆菌属细胞,其中该引入的表达盒包含编码功能性YvmA蛋白的可读框(ORF)序列,该功能性YvmA蛋白与SEQ ID NO:30的枯草芽孢杆菌YvmA蛋白或其芽孢杆菌属物种YvmA同源物具有至少85%的序列同一性。
4.如实施例1所述的芽孢杆菌属细胞,其中该引入的表达盒包含ORF序列,该ORF序列与SEQ ID NO:37的枯草芽孢杆菌yvmA ORF或其芽孢杆菌属物种yvmA同源物具有至少90%的序列同一性,编码功能性YvmA蛋白。
5.如实施例1或实施例2所述的芽孢杆菌属细胞,其进一步包含突变、破坏、部分缺失或完全缺失选自由cypX、yvmC和yvmB组成的组的芽孢杆菌属基因的遗传修饰。
6.如实施例1或实施例2所述的芽孢杆菌属细胞,其选自由以下组成的组:枯草芽孢杆菌、地衣芽孢杆菌、缓慢芽孢杆菌、短芽孢杆菌、嗜热脂肪芽孢杆菌、嗜碱芽孢杆菌、解淀粉芽孢杆菌、克劳氏芽孢杆菌、耐盐芽孢杆菌、巨大芽孢杆菌、凝结芽孢杆菌、环状芽孢杆菌、灿烂芽孢杆菌和苏云金芽孢杆菌。
7.如实施例1或实施例2所述的芽孢杆菌属细胞,其中该功能性YvmA蛋白参与该红色素的产生。
8.如实施例1或实施例2所述的芽孢杆菌属细胞,其中该红色素是普切明。
9.如实施例1或实施例2所述的芽孢杆菌属细胞,其中该经修饰的细胞相对于该亲本细胞具有等效或增强的生长速率。
10.一种经修饰的芽孢杆菌属细胞,其衍生自产生目的蛋白(POI)的亲本芽孢杆菌属细胞,其中该经修饰的细胞包含引入的编码功能性YvmA蛋白的yvmA表达盒,其中当在相同条件下发酵(培养)时,该经修饰的细胞相对于该亲本细胞在红色素的产生方面有缺陷。
11.一种经修饰的芽孢杆菌属细胞,其衍生自产生目的蛋白(POI)并包含编码功能性YvmA蛋白的yvmA基因的亲本芽孢杆菌属细胞,其中该经修饰的细胞包含用异源启动子(序列)替代该yvmA基因的天然启动子(序列)的遗传修饰,该异源启动子(序列)能够相对于该yvmA基因的天然启动子(序列)增加该yvmA基因的表达,其中当在相同条件下发酵(培养)时,该经修饰的细胞相对于该亲本细胞在红色素的产生方面有缺陷。
12.如实施例10或实施例11所述的芽孢杆菌属细胞,其中该POI是内源POI或异源POI。
13.如实施例10或实施例11所述的芽孢杆菌属细胞,其中该POI是酶。
14.如实施例13所述的芽孢杆菌属细胞,其中该酶选自由以下组成的组:乙酰酯酶、氨肽酶、淀粉酶、***聚糖酶、***呋喃糖苷酶、碳酸酐酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、凝乳酶、角质酶、脱氧核糖核酸酶、差向异构酶、酯酶、聚酯酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡聚糖酶、葡聚糖裂解酶、内切-β-葡聚糖酶、葡糖淀粉酶、葡萄糖氧化酶、α-葡糖苷酶、β-葡糖苷酶、葡萄糖醛酸酶、糖基水解酶、半纤维素酶、己糖氧化酶、水解酶、转化酶、异构酶、漆酶、脂肪酶、裂解酶、甘露糖苷酶、氧化酶、氧化还原酶、果胶酸裂解酶、果胶乙酰酯酶、果胶解聚酶、果胶甲基酯酶、果胶分解酶、过水解酶、多元醇氧化酶、过氧化物酶、酚氧化酶、植酸酶、聚半乳糖醛酸酶、蛋白酶、肽酶、鼠李糖-半乳糖醛酸酶、核糖核酸酶、转移酶、转谷氨酰胺酶、木聚糖酶、己糖氧化酶、及其组合。
15.如实施例10所述的芽孢杆菌属细胞,其中该引入的表达盒包含编码功能性YvmA蛋白的可读框(ORF)序列,该功能性YvmA蛋白与SEQ ID NO:30的枯草芽孢杆菌YvmA蛋白或其芽孢杆菌属物种YvmA同源物具有至少85%的序列同一性。
16.如实施例10所述的芽孢杆菌属细胞,其中该引入的表达盒包含ORF序列,该ORF序列与SEQ ID NO:37的枯草芽孢杆菌yvmA ORF或其芽孢杆菌属物种yvmA同源物具有至少90%的序列同一性,编码功能性YvmA蛋白。
17.如实施例10或实施例11所述的芽孢杆菌属细胞,其进一步包含突变、破坏、部分缺失或完全缺失选自由cypX、yvmC和yvmB组成的组的芽孢杆菌属基因的遗传修饰。
18.如实施例10或实施例11所述的芽孢杆菌属细胞,其选自由以下组成的组:枯草芽孢杆菌、地衣芽孢杆菌、缓慢芽孢杆菌、短芽孢杆菌、嗜热脂肪芽孢杆菌、嗜碱芽孢杆菌、解淀粉芽孢杆菌、克劳氏芽孢杆菌、耐盐芽孢杆菌、巨大芽孢杆菌、凝结芽孢杆菌、环状芽孢杆菌、灿烂芽孢杆菌和苏云金芽孢杆菌。
19.如实施例10或实施例11所述的芽孢杆菌属细胞,其中该功能性YvmA蛋白参与该红色素的产生。
20.如实施例10或实施例11所述的芽孢杆菌属细胞,其中该红色素是普切明。
21.如实施例10或实施例11所述的芽孢杆菌属细胞,其中该经修饰的细胞相对于该亲本细胞具有等效或增强的生长速率。
22.如实施例10或实施例11所述的芽孢杆菌属细胞,其中该经修饰的细胞相对于该亲本细胞产生等效或增加量的该POI。
23.一种分离的目的蛋白(POI),其由如实施例10或实施例11所述的经修饰的芽孢杆菌属细胞产生。
24.如实施例23所述的分离的POI,其不包含可观察到的红色素。
25.一种用于生长(培养)在红色素的产生方面有缺陷的芽孢杆菌属细胞的方法,该方法包括(a)通过在亲本芽孢杆菌属细胞中引入编码功能性YvmA蛋白的表达盒来修饰亲本芽孢杆菌属细胞,和(b)在合适的条件下生长该经修饰的细胞,其中当在相同条件下生长时,该经修饰的细胞相对于该亲本细胞在红色素的产生方面有缺陷。
26.一种用于生长(培养)在红色素的产生方面有缺陷的芽孢杆菌属细胞的方法,该方法包括(a)获得包含编码功能性YvmA蛋白的yvmA基因的亲本芽孢杆菌属细胞,并用相对于该yvmA基因的天然启动子能够增加该yvmA基因表达的异源启动子(序列)替代该yvmA基因的天然启动子(序列),和(b)在合适的条件下生长该经修饰的细胞,其中当在相同条件下生长时,该经修饰的细胞相对于该亲本细胞在红色素的产生方面有缺陷。
27.一种用于产生内源目的蛋白(POI)的方法,该方法包括(a)获得产生内源POI的亲本芽孢杆菌属细胞,并通过在其中引入编码功能性YvmA蛋白的表达盒来修饰该细胞,和(b)在用于产生该POI的合适条件下发酵该经修饰的细胞,其中当在相同条件下发酵时,该经修饰的细胞相对于该亲本细胞在红色素的产生方面有缺陷。
28.一种用于产生内源目的蛋白(POI)的方法,该方法包括(a)获得产生内源POI并包含编码功能性YvmA蛋白的yvmA基因的亲本芽孢杆菌属细胞,以及通过用相对于yvmA基因的天然启动子能够增加yvmA基因表达的异源启动子(序列)替代yvmA基因的天然启动子(序列)来遗传修饰该细胞,和(b)在适合产生POI的条件下发酵该经修饰的细胞,其中当在相同条件下发酵时,该经修饰的细胞相对于亲本细胞在红色素的产生方面有缺陷。
29.一种用于产生异源目的蛋白(POI)的方法,该方法包括(a)通过在其中引入(i)编码异源POI的表达盒和(ii)编码功能性YvmA蛋白的表达盒来修饰包含编码功能性YvmA蛋白的yvmA基因的亲本芽孢杆菌属细胞,和(b)在适合产生POI的条件下发酵该经修饰的细胞,其中当在相同条件下发酵时,该经修饰的细胞相对于亲本细胞在红色素的产生方面有缺陷。
30.一种用于产生异源目的蛋白(POI)的方法,该方法包括(a)通过在其中引入编码POI的表达盒并且在其中用相对于yvmA基因的天然启动子能够增加yvmA基因表达的异源启动子(序列)替代yvmA基因的天然启动子(序列)来修饰包含编码功能性YvmA蛋白的yvmA基因的亲本芽孢杆菌属细胞,和(b)在适合产生POI的条件下发酵该经修饰的细胞,其中当在相同条件下发酵时,该经修饰的细胞相对于亲本细胞在红色素的产生方面有缺陷。
31.如实施例27-30中任一项所述的方法,其中该POI是酶。
32.如实施例31所述的方法,其中该酶选自由以下组成的组:乙酰酯酶、氨肽酶、淀粉酶、***聚糖酶、***呋喃糖苷酶、碳酸酐酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、凝乳酶、角质酶、脱氧核糖核酸酶、差向异构酶、酯酶、聚酯酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡聚糖酶、葡聚糖裂解酶、内切-β-葡聚糖酶、葡糖淀粉酶、葡萄糖氧化酶、α-葡糖苷酶、β-葡糖苷酶、葡萄糖醛酸酶、糖基水解酶、半纤维素酶、己糖氧化酶、水解酶、转化酶、异构酶、漆酶、脂肪酶、裂解酶、甘露糖苷酶、氧化酶、氧化还原酶、果胶酸裂解酶、果胶乙酰酯酶、果胶解聚酶、果胶甲基酯酶、果胶分解酶、过水解酶、多元醇氧化酶、过氧化物酶、酚氧化酶、植酸酶、聚半乳糖醛酸酶、蛋白酶、肽酶、鼠李糖-半乳糖醛酸酶、核糖核酸酶、转移酶、转谷氨酰胺酶、木聚糖酶、己糖氧化酶、及其组合。
33.如实施例25、27或29中任一项所述的方法,其中该引入的表达盒包含编码功能性YvmA蛋白的可读框(ORF)序列,该功能性YvmA蛋白与SEQ ID NO:30的枯草芽孢杆菌YvmA蛋白或其芽孢杆菌属物种YvmA同源物具有至少85%的序列同一性。
34.如实施例25、27或29中任一项所述的方法,其中该引入的表达盒包含ORF序列,该ORF序列与SEQ ID NO:37的枯草芽孢杆菌yvmA ORF或其芽孢杆菌属物种yvmA同源物具有至少90%的序列同一性,编码功能性YvmA蛋白。
35.如实施例25-30中任一项所述的方法,其中该经修饰的细胞进一步包含突变、破坏、部分缺失或完全缺失选自由cypX、yvmC和yvmB组成的组的芽孢杆菌属基因的遗传修饰。
36.如实施例25-30中任一项所述的方法,其中该芽孢杆菌属细胞选自由以下组成的组:枯草芽孢杆菌、地衣芽孢杆菌、缓慢芽孢杆菌、短芽孢杆菌、嗜热脂肪芽孢杆菌、嗜碱芽孢杆菌、解淀粉芽孢杆菌、克劳氏芽孢杆菌、耐盐芽孢杆菌、巨大芽孢杆菌、凝结芽孢杆菌、环状芽孢杆菌、灿烂芽孢杆菌和苏云金芽孢杆菌。
37.如实施例25-30中任一项所述的方法,其中该功能性YvmA蛋白参与该红色素的产生。
38.如实施例25-30中任一项所述的方法,其中该红色素是普切明。
39.如实施例25-30中任一项所述的方法,其中该经修饰的细胞相对于该亲本细胞具有等效或增强的生长速率。
40.如实施例25-30中任一项所述的方法,其中该经修饰的细胞相对于该亲本细胞产生等效或增加量的该POI。
41.一种分离的目的蛋白(POI),其通过如实施例25-30中任一项所述的方法产生。
42.如实施例41所述的分离的POI,其不包含可观察到的红色素。
43.一种减轻芽孢杆菌属发酵肉汤中红色素颜色的方法,该方法包括在铝离子存在下发酵产生目的蛋白的芽孢杆菌属细胞。
44.如实施例34所述的方法,其中铝离子以AlCl3或Al2(SO4)3的形式提供。
实例
根据以下实例可以进一步理解本发明的某些方面,这些实例不应被解释为限制性的。对材料和方法的修改对于本领域技术人员而言是显而易见的。
实例1
yvmA过表达整合盒的构建
本实例描述了yvmA(基因)过表达(整合)盒的构建(例如,参见图1)。更特别地,由NEBuilder(新英格兰生物实验室(New England Biolabs))经由PCR扩增的DNA片段的组装生成本文所述的yvmA过表达盒。例如,将整合盒片段设计成在spoIIIAE基因座处整合,其中spoIIIAE侧翼序列从枯草芽孢杆菌(例如,枯草芽孢杆菌菌株168,ATCC 23857)基因组DNA扩增。因此,如下表1一般性所述,用寡核苷酸引物265(SEQ ID NO:1)和117(SEQ ID NO:2)扩增上游(5′)spoIIIAE侧翼区,并且用寡核苷酸引物245(SEQ ID NO:3)和266(SEQ ID NO:4)扩增下游(3′)spoIIIAE侧翼区。
使用寡核苷酸引物247(表1;SEQ ID NO:5)和55(表1;SEQ ID NO:6)扩增侧翼为loxP位点的具有壮观霉素抗生素抗性标记(SpecR)的DNA片段。使用寡核苷酸引物124(表1;SEQ ID NO:7)和401(表1;SEQ ID NO:8)扩增spoVG启动子(PspoVG)区。包括邻近包含Shine-Dalgarno序列的spoVG可读框(ORF)的spoVG启动子区的三十六(36)个碱基对(bp),其邻近Phbs-yvmA(SEQ ID NO:19)、Pyvyd-yvmA(SEQ ID NO:20)和PpstS-yvmA(SEQ ID NO:21)整合盒的启动子区。如表1所呈现,使用下列寡核苷酸引物对扩增hbs启动子区(Phbs)和pstS启动子区(PpstS):hbs引物298(SEQ ID NO:9)和307(SEQ ID NO:10)和pstS引物305(SEQ ID NO:11)和308(SEQ ID NO:12)。用寡核苷酸引物131(SEQ ID NO:13)和129(SEQ IDNO:14)扩增来自枯草芽孢杆菌基因组DNA的yvmA ORF(SEQ ID NO:37)用于PspoVG-yvmA组装,且引物299(SEQ ID NO:15)和129(SEQ ID NO:14)用于Phbs-yvmA组装,并且引物306(SEQ ID NO:16)和129(SEQ ID NO:14)用于PpstS-yvmA组装。引物302(SEQ ID NO:17)和129(SEQ ID NO:14)用于yvyD启动子区和yvmA ORF的组装。按照制造商的指导用重叠的DNA片段进行NEBuilder组装,以生成完整的spoIIIAE::PspoVG-yvmA-lox-SpecR-lox、spoIIIAE::Phbs-yvmA-lox-SpecR-lox、spoIIIAE::PyvyD-yvmA-lox-SpecR-lox和spoIIIAE::PpstS-yvmA-lox-SpecR-lox整合盒,其中组装的整合盒的完整序列包括PspoVG-yvmA(SEQ ID NO:18)、Phbs-yvmA(SEQ ID NO:19)、PyvyD-yvmA(SEQ ID NO:20)和PpstS-yvmA(SEQ ID NO:21)。
表1
寡核苷酸引物
实例2
表达yvmA的枯草芽孢杆菌菌株的构建和传代
本实例总体上描述了表达单(1)个拷贝的编码示例性GG36蛋白酶的基因(1xGG36)的枯草芽孢杆菌细胞(菌株)及其经修饰的(子代)细胞的构建,这些细胞包含引入的过表达SEQ ID NO:37的枯草芽孢杆菌yvmA基因(ORF)的盒。例如,将约1-2μg的spoIIAE::PspoVG-yvmA-lox-SpecR-lox整合盒(SEQ ID NO:18)、spoIIAE::Phbs-yvmA-lox-SpecR-lox整合盒(SEQ ID NO:19)、spoIIAE::PyvyD-yvmA-lox-SpecR-lox整合盒(SEQ ID NO:20)和spoIIAE::PpstS-yvmA-lox-SpecR-lox整合盒(SEQ ID NO:21)分别转化到表达单(1)个拷贝(1x GG36)的GG36蛋白酶的comK(感受态)枯草芽孢杆菌亲本菌株中。更特别地,将转化的细胞铺在LB(1%胰蛋白胨、0.5%酵母提取物、1.0%氯化钠、1.5%琼脂)和一百(100)μg/ml壮观霉素上,其中通过用一百(100)mg/L壮观霉素在LB上重新划线来纯化壮观霉素抗性菌落。通过使用Q5高保真PCR聚合酶(NEB)和收获的基因组DNA作为模板,用下表2中列出的寡核苷酸引物241(SEQ ID NO:22)和242(SEQ ID NO:23)进行PCR扩增来证实spoIIIAE基因座处每个盒的整合,所述引物在整合事件之外结合。同样,通过使用寡核苷酸241(SEQ IDNO:22;表2)、179(SEQ ID NO:24;表2)、129(SEQ ID NO:14;表1)、282(SEQ ID NO:25;表2)、180(SEQ ID NO:26;表2)和242(SEQ ID NO:23;表2)的Sanger测序确认每个整合盒的正确序列。另外,通过表达Cre重组酶的质粒的转化去除壮观霉素抗生素抗性标记(lox-SpecR-lox)。在质粒丢失后,鉴定壮观霉素敏感菌落,并且用寡核苷酸引物241(SEQ ID NO:22)和242(SEQ ID NO:23)扩增整合盒。通过使用寡核苷酸180(SEQ ID NO:26)的序列分析,证实了每个yvmA表达菌株的lox位点的正确重组。
表2寡核苷酸引物
SEQ ID NO 引物 核苷酸序列
22 241 GCAAATAGGATAAACAACACGATGG
23 242 CGCCTATATTGCTGAATTCGGGG
24 179 GCGATATTTCTGAGCAGGTTAGC
25 282 ACTCCTGATCCAAACATGTAAGTAC
26 180 TGCCAACGGAAAGCTGCTGGG
27 52 CAGACGGATTTTCGACTTACATGAG
28 53 GGACTCTTCTTGTTTGTGATTAACG
实例3
yvmA过表达对枯草芽孢杆菌发酵肉汤颜色和普切明水平的影响
在本实例中,申请人评价了包含单(1)个拷贝的编码GG36蛋白酶的基因(1x GG36)的枯草芽孢杆菌细胞(菌株)中yvmA表达/过表达的效果。例如,用亲本枯草芽孢杆菌菌株(即,编码GG36蛋白酶的1x GG36菌株;例如,参见实例2)或由其衍生的经修饰的枯草芽孢杆菌(子代)菌株将五(5)ml基于maltrin的限定培养基接种至OD 0.02(A600),所述经修饰的子代菌株进一步包含引入的选自由PspoVG-yvmA盒(SEQ ID NO:18)、Phbs-yvmA盒(SEQ IDNO:19)、PyvyD-yvmA盒(SEQ ID NO:20)和PpstS-yvmA盒(SEQ ID NO:21)组成的组的yvmA表达盒,如图1中一般性所述。
更特别地,将接种的培养物在37℃下以250RPM摇动孵育三(3)个生物学重复,使用七十二(72)小时的孵育期。例如,在二十四(24)、四十八(48)、七十二(72)小时时对培养物拍摄数字图像(图2A)。如图2A所示,在整个发酵时间过程中,与亲本菌株(1x GG36)相比,在包含yvmA表达盒(即,PspoVG-yvmA,SEQ ID NO:18;Phbs-yvmA,SEQ ID NO:19;PyvyD-yvmA,SEQ ID NO:20和PpstS-yvmA,SEQ ID NO:21)的经修饰的枯草芽孢杆菌(子代)菌株中容易观察到肉汤的红色/棕色减少。同样,如图2B所呈现,在相同的时间过程中,相比(相对)于亲本菌株(1x GG36),yvmA表达菌株的亮度增加也是显而易见的。例如,使用Schindelin等人(2012)描述的开源图像处理包Fiji测量亮度。申请人进一步指出,可观察到的红色/棕色减少的程度与过表达yvmA的启动子的强度相关。例如,测试的最强启动子spoVG与来自测试的最弱启动子pstS的yvmA表达相比,减少了更多的红色/棕色,如图2B所示。
另外,为了确定观察到的yvmA过表达菌株的红色/棕色肉汤颜色的减少是否是由于普切明的减少,申请人定量了七十二(72)小时后由亲本和经修饰的(子代)菌株产生的普切明的相对量,(例如,参见图3A和图3B)。更特别地,普切明的定量基本上如Uffen和Canale-Parola(1972)中所述进行,并在本文中进一步描述。
普切明定量测定:(i)以14,000RPM从一(1)ml样品(20OD600)中沉淀细胞一(1)分钟,并丢弃上清液,(ii)将沉淀重悬于一(1)ml甲醇中;(iii)以14,000RPM沉淀细胞一(1)分钟并丢弃上清液,(iv)将沉淀重悬于一(1)ml甲醇中,(v)以14,000RPM沉淀细胞一(1)分钟并丢弃上清液,(vi)用一(1)ml水洗涤,(vii)将沉淀重悬于一(1)ml 2N NaOH中并在室温下孵育三十(30)分钟,(viii)以14,000RPM沉淀细胞两(2)分钟,(ix)保存两百(200)μl上清液,以及(x)测量410nm处的吸光度。
图3A和图3B显示了在七十二(72)小时时在亲本(1x GG36)菌株相对于经修饰的(子代)菌株(即,包含yvmA过表达盒)中产生的普切明的定量结果。更特别地,如图3A所呈现,yvmA表达的增加与可定量的普切明的总体减少相关。例如,如图3A所示,驱动yvmA表达的一系列启动子PspoVG、Phbs、PyvyD和PpstS按照启动子强度的顺序从左到右(X轴)呈现,使得PspoVG-yvmA盒包含这些系列中最强的启动子,而PpstS-yvmA盒包含这些系列中最弱的启动子。因此,类似于肉汤中可见红色/棕色的减少(图2),与此类yvmA过表达菌株相关的普切明的减少特别地与用于驱动yvmA表达的启动子的强度相关(图3),其中用于驱动yvmA表达的最强启动子(即,PspoVG)导致产生的普切明的量的最大减少(降低),而所使用的最弱启动子(即,PpstS)使普切明水平降低最少。基于前述内容,这些结果证明了yvmA的过表达是减少枯草芽孢杆菌发酵的红色/棕色的特别合适的方法,并且所产生的普切明的量与用于表达yvmA的启动子的强度正相关。
实例4
表达两个拷贝的目的蛋白和过表达yvmA的枯草芽孢杆菌菌株的生成
为了确定yvmA过表达在2x GG36枯草芽孢杆菌菌株中的影响,将编码GG36蛋白酶的基因的第二(第2)个拷贝引入如以上实例2中所述构建的1x GG36 Phbs-yvmA菌株中。通过PCR分析和序列验证证实了表达盒与第二个GG36拷贝的正确整合。将新菌株保存并命名为“2x GG36 Phbs-yvmA”。
实例5
yvmA过表达不影响表达两个拷贝的目的蛋白的枯草芽孢杆菌菌株的生长速率
在本实例中,申请人评估了yvmA的过表达对实例4中构建的枯草芽孢杆菌两(2)个拷贝GG36蛋白酶菌株(2x GG36 Phbs-yvmA)的生长速率的影响。例如,用包含两(2)个拷贝(2x GG36)的编码GG36蛋白酶的盒的对照枯草芽孢杆菌菌株和进一步包含整合的Phbs-yvmA表达盒的经修饰的(等基因)枯草芽孢杆菌菌株(2x GG36 Phbs-yvmA)菌株,将五(5)ml限定培养基接种至0.02A600。将对照(2x GG36)菌株的三(3)个生物学重复和经修饰的(2xGG36 Phbs-yvmA)菌株的三(3)个生物学重复在37℃下以250RPM摇动发酵九十(90)小时。通过在十八(18)、二十四(24)、四十(40)和九十(90)小时时采集的样品的A600光谱仪吸光度来监测菌株的生长速率。如图4A所呈现,光谱仪分析显示对照(2x GG36)和经修饰的(2xGG36 Phbs-yvmA)菌株的生长速率没有显著差异,表明来自hbs启动子(Phbs)的yvmA过表达不会不利地影响表达两个拷贝的示例性目的蛋白(POI)(例如,碱性丝氨酸蛋白酶)的枯草芽孢杆菌(细胞)菌株的生长速率。
实例6
yvmA过表达不影响表达两个拷贝的目的蛋白的枯草芽孢杆菌菌株的蛋白质产生
在本实例中,申请人评估了实例5中所述的两(2)个拷贝枯草芽孢杆菌菌株(即,2xGG36和2x GG36 Phbs-yvmA)中yvmA对蛋白酶产生的过表达。例如,在时间点十八(18)、二十四(24)、四十(40)和九十(90)小时从2x GG36对照和2x GG36 Phbs-yvmA(经修饰的)菌株中取出等分试样。如欧洲专利号EP0283075中一般性描述的,进行蛋白酶活性测定以确定来自hbs启动子(Phbs)的yvmA过表达对GG36蛋白酶产生的影响。如图4B所示,蛋白酶测定的结果证明yvmA过表达对蛋白酶产生没有显著的负面影响。
实例7
yvmA过表达减少了由表达两个拷贝的目的蛋白的枯草芽孢杆菌菌株产生的普切明
在本实例中,通过比较由2x GG36对照和2x GG36 Phbs-yvyD(经修饰的)菌株产生的普切明水平,确定了在两(2)个拷贝蛋白酶背景中yvmA过表达对普切明的产生的影响。例如,用对照2x GG36和2x GG36Phbs-yvmA(经修饰的)菌株将五(5)ml基于maltrin的培养基接种至OD 0.02(A600),其中在六十七(67)小时后使用上述普切明定量测定(参见,实例3)分析三(3)个生物学重复的普切明水平。更特别地,如图4C所呈现,枯草芽孢杆菌2x GG36Phbs-yvmA(经修饰的)菌株产生的普切明明显少于对照2x GG36菌株,从而证明了在此类枯草芽孢杆菌细胞中通过过表达yvmA减少了产生的普切明的量。
实例8
yvmA的缺失增加了普切明水平和观察到的红色发酵肉汤颜色
如前述实例中一般性描述的,异源yvmA表达显著降低了发酵肉汤中的普切明水平(和红色/棕色)。基于前述内容,申请人在本文中设想功能性YvmA蛋白充当/功能为普切明或构成普切明的分子之一(即,普切明酸和Fe3+)的转运蛋白。例如,如上文第II部分一般性描述的,YvmA蛋白具有十二(12)个预测的跨膜(TM)结构域和Karp等人(2017)描述的转运蛋白主要易化子超家族(MSF)成员的一级(1)氨基酸序列特征。因此,在本实例中,申请人破坏了yvmA基因座以更好地理解YvmA蛋白功能。更特别地,通过从BKE35090(ΔyvmA::ermtrpC2)(其购自芽孢杆菌遗传保藏中心(Bacillus Genetic Stock Center))收获的基因组DNA的全基因组转移,在1x GG36菌株背景中破坏了yvmA基因(ΔyvmA)。用寡核苷酸52和53通过PCR分析证实了缺失的存在(参见,上表2)。
因此,将如上所述构建的1x GG36亲本菌株(实例2)、1x GG36PspoVG-yvmA(经修饰的)菌株(实例2)和1x GG36ΔyvmA(经修饰的)菌株在基于maltrin的培养基中接种至A6000.02,并在37℃下以250RPM摇动生长。在四十八(48)小时后,yvmA破坏的菌株(1x GG36ΔyvmA)的颜色比亲本(1x GG36)菌株和/或yvmA过表达菌株(1x GG36PspoVG-yvmA)更明显地呈红色/棕色,如图5A所示。另外,yvmA过表达菌株(1x GG36 PspoVG-yvmA)比亲本(1xGG36)菌株产生更少的红色/棕色肉汤颜色(图5A)。同样,在二十四(24)小时后取发酵的等分试样,并且通过实例3中所述的普切明定量测定来确定产生的普切明的量。如图5B所呈现,普切明定量测定证明了yvmA破坏的菌株(1x GG36ΔyvmA)比亲本(1x GG36)菌株或yvmA过表达菌株(1x GG36PspoVG-yvmA)产生更多的普切明。基于前述内容,yvmA破坏的菌株(1xGG36ΔyvmA)的结果进一步表明,YvmA蛋白起普切明转运蛋白和/或普切明酸转运蛋白和/或Fe3+转运蛋白的作用。
实例9
向枯草芽孢杆菌发酵中预添加AlCl3减少了发酵肉汤中的红色和普切明水平
如通常所理解的,普切明通过三(3)个普切明酸分子与三价铁(Fe3+)的配位形成,例如,参见Uffen和Canale-Parola(1972)。在本实例中,申请人已经考虑了向芽孢杆菌属发酵中预添加氯化铝(AlCl3)是否可以减少、减轻或消除普切明的形成(例如,通过用Al3+离子部分或完全取代Fe3+离子)。为了测试这一假设,将上文实例8中描述的高产普切明的yvmA破坏的菌株(1x GG36ΔyvmA)与增加量的氯化铝(AlCl3)共发酵。因此,将1x GG36ΔyvmA细胞在基于麦芽糖糊精的培养基中接种至0.02A600,并且在0mM、1mM、2mM、5mM和10mM AlCl3(密苏里州的密理博西格玛公司(MilliporeSigma,MO))的存在下在37℃下以250RPM摇动生长五十(50)小时。
例如,如图6A所呈现,在生长二十(20)小时后,发酵肉汤中红色/棕色的减少是可见的。在五十(50)小时后,红色/棕色的减少更加明显,其中红色/棕色的减少与氯化铝(AlCl3)浓度的增加正相关。如图6B(左轴)所示,通过Fiji图像处理软件测定了这些培养物的相对亮度,其中亮度的增加与在五十(50)小时的时间点预加入到1x GG36ΔyvmA菌株发酵中的氯化铝[AlCl3]的浓度(正)相关。另外,在五十(50)小时的时间点取预添加氯化铝(AlCl3)的1x GG36ΔyvmA菌株的等分试样,如图6B(右轴)所呈现,其中使用实例3中所述的普切明定量测定确定了这些样品中普切明的相对量。例如,如图6B(右轴)所示,在1mM、2mM、5mM和10mM氯化铝(AlCl3)实验条件下检测到的普切明的量少于没有预添加氯化铝(AlCl3)的1x GG36ΔyvmA对照发酵。
实例10
向枯草芽孢杆菌发酵中预添加AlCl3不影响生长速率
在本实例中,申请人评估了预添加氯化铝(AlCl3)的yvmA破坏的菌株(1x GG36ΔyvmA;实例8)的发酵生长速率。更特别地,通过在二十(20)、二十六(26)和五十(50)小时所取等分试样的光谱仪分析来监测预添加氯化铝(AlCl3)的1x GG36ΔyvmA菌株的生长速率。如图6C所呈现,在五十(50)小时的发酵期过程中,与1mM、2mM、5mM和10mM氯化铝(AlCl3)共发酵的1x GG36ΔyvmA细胞的生长速率没有偏离对照1x GG36ΔyvmA发酵生长速率(即,没有AlCl3预添加)。这些结果证明了,预添加至少10mM氯化铝(AlCl3)不会显著影响表达/产生目的蛋白的枯草芽孢杆菌菌株的生长速率。
实例11
向枯草芽孢杆菌发酵中预添加AlCl3不影响目的蛋白的产生
本实例评估了在预添加氯化铝(AlCl3)的yvmA破坏的菌株(1x GG36ΔyvmA;实例8)发酵期间GG36蛋白酶的产生。更特别地,如欧洲专利号EP0283075中一般性描述的,通过在二十(20)、二十六(26)和五十(50)小时所取等分试样的蛋白酶测定来监测蛋白酶产生。如图6D所呈现,在五十(50)小时的发酵期过程中,由与1mM、2mM、5mM和10mM氯化铝(AlCl3)共发酵的yvmA破坏的细胞(1x GG36ΔyvmA)产生的蛋白酶活性的量没有偏离在没有氯化铝(AlCl3)预添加的情况下生长的yvmA破坏的对照(1x GG36ΔyvmA发酵)。这些结果证明了,预添加至少十(10)mM氯化铝(AlCl3)不会显著影响此类枯草芽孢杆菌(细胞)菌株生长/培养/发酵过程中产生的目的蛋白的量。
实例12
从异源启动子构建表达枯草芽孢杆菌yvmA的地衣芽孢杆菌菌株
在本实例中,构建了两(2)个含有编码野生型RghR2蛋白(SEQ ID NO:29)的基因的地衣芽孢杆菌菌株,使得这些菌株表达功能性枯草芽孢杆菌YvmA蛋白(SEQ ID NO:30)。更特别地,将这些盒***amyL基因座(SEQ ID NO:31)中并携带tetA选择性标记盒(SEQ IDNO:32)。
第一盒,amyL::[Phbs-yvmA tetR](SEQ ID NO:33)含有一个与来自枯草芽孢杆菌(SEQ ID NO:35)的hbs启动子(Phbs)连接的5′amyL同源臂(SEQ ID NO:34),该启动子与枯草芽孢杆菌spoVG基因(SEQ ID NO:36)的Shine-Dalgarno序列可操作地连接,该基因与编码枯草芽孢杆菌YvmA蛋白(SEQ ID NO:30)的(yvmA)DNA序列(SEQ ID NO:37)可操作地连接,该蛋白与枯草芽孢杆菌yvmA终止子(SEQ ID NO:38)可操作地连接,该终止子与编码连接到3′amyL同源臂(SEQ ID NO:39)的四环素抗性的tetA表达盒(SEQ ID NO:32)连接。
第二盒,amyL::[PspoVG-yvmA tetR](SEQ ID NO:40)含有一个与来自枯草芽孢杆菌(SEQ ID NO:41)的spoVG启动子(PspoVG)连接的5′amyL同源臂(SEQ ID NO:34),该启动子与枯草芽孢杆菌spoVG基因(SEQ ID NO:36)的Shine-Dalgarno序列可操作地连接,该基因与编码枯草芽孢杆菌YvmA蛋白(SEQ ID NO:30)的(yvmA)DNA序列(SEQ ID NO:37)可操作地连接,该蛋白与枯草芽孢杆菌yvmA终止子(SEQ ID NO:38)可操作地连接,该终止子与编码连接到3′amyL同源臂(SEQ ID NO:39)的四环素抗性的tetA表达盒(SEQ ID NO:32)连接。
使用先前在PCT公开号WO 2018/136459(通过引用以其全文并入本文)中描述的方案将amyL::[Phbs-yvmA tetR]和amyL::[PspoVG-yvmA tetR]盒整合到亲本地衣芽孢杆菌宿主中。在含有十(10)ppm四环素的L琼脂上选择细胞。为了分析转化体细胞,使用下表3中列出的引物扩增amyL基因座(SEQ ID NO:31)。
表3
用于盒验证的正向和反向引物
名称 序列 SEQ ID NO
1762 CGCTTCTTGAAAACGAGGTG 42
1763 GCTCATCCAAATCGATCCCA 43
通过使用下表4中列出的引物的Sanger方法,使用DNA测序验证了具有amyL::[Phbs-yvmA tetR](SEQ ID NO:44)或amyL::[PspoVG-yvmA tetR](SEQ ID NO:45)盒的正确PCR产物的菌落。
表4
用于盒验证的正向和反向引物
名称 序列 SEQ ID NO
2377 GCAGATGCTGCTGAAGAGAT 46
2378 GCTCCAGTTCTAGGAGGATT 47
2379 GGGTTAATGATACGCTTCCC 48
将具有amyL::[Phbs-yvmA tetR](SEQ ID NO:33)的正确序列的两个独立分离株储存为菌株BF1175和BF1176。将具有amyL::[PspoVG-yvmA tetR](SEQ ID NO:40)的正确序列的两个独立分离株储存为菌株BF1177和BF1178,如下表5所呈现。
表5构建的菌株
名称 盒(SEQ ID NO)
BF62 NA
BF1175 amyL::[Phbs-yvmA tetR] 5
BF1176 amyL::[Phbs-yvmA tetR] 5
BF1177 amyL::[PspoVG-yvmA tetR] 12
BF1178 amyL::[PspoVG-yvmA tetR] 12
实例13
由表达枯草芽孢杆菌yvmA的地衣芽孢杆菌菌株产生的普切明的测定
在本实例中,通过从细胞的全肉汤培养物中提取普切明的钠盐,评估了由表达枯草芽孢杆菌YvmA蛋白(SEQ ID NO:30)的地衣芽孢杆菌细胞产生的普切明的量。简而言之,使亲本菌株或携带两种不同枯草芽孢杆菌yvmA表达盒(表5)中任一种的菌株在如PCT公开号WO 2018/156705(通过引用以其全文并入本文)中所述的烧瓶条件下生长。在37℃和250RPM搅拌下生长一百(100)小时后,如下测定产生的普切明的量。以4000RPM将培养物沉淀十(10)分钟。将沉淀在100%甲醇中洗涤两次,并用ddH2O洗涤两次。将沉淀重悬于1ml 2NNaOH中,并在室温下孵育15分钟。通过以14000RPM离心两(2)分钟去除碎片。从碎片中取出上清液,并在405nm处测量上清液的吸光度,以量化普切明酸钠的相对量。下表6显示了吸光度和相对于亲本菌株的吸光度。
表6
普切明产生的定量
菌株 盒SEQ ID NO A405 相对于BF62
BF62 NA 0.30 1.0
BF1175 amyL::[Phbs-yvmA tetR] 5 0.09 0.30
BF1176 amyL::[Phbs-yvmA tetR] 5 0.13 0.43
BF1177 amyL::[PspoVG-yvmA tetR] 12 0.13 0.43
BF1178 amyL::[PspoVG-yvmA tetR] 12 0.12 0.40
如表6所指出,在所有测试的情况下,来自两(2)种异源启动子(Phbs和PspoVG)中任一种的枯草芽孢杆菌YvmA蛋白在地衣芽孢杆菌中的表达将存在于细胞外的普切明的量减少了超过50%,这表明使用枯草芽孢杆菌YvmA蛋白来减少普切明的存在可以用于产生该化合物的广谱物种。
实例14
向芽孢杆菌属发酵中预添加AlCl3或Al2(SO4)3使肉汤颜色变浅
在本实例中,使用芽孢杆菌发酵来评估/确定前述实例中描述的铝离子的(红色/棕色)颜色减少益处是否适用于工业相关条件(例如,高细胞密度、工业发酵过程等)。例如,在两(2)升生物反应器(发酵罐)中,将10mM AlCl3或5mM Al2(SO4)3(密苏里州的密理博西格玛公司)预先添加(预添加)到发酵培养基中,并且使蛋白酶生产发酵过程运行四十(40)小时。另外,使没有补充铝的两个其他生物反应器平行运行,以提供用于比较的基线。二十(20)小时和四十(40)小时全肉汤样品的LAB颜色测定表明,对于发酵结束时含有铝的情况,肉汤颜色明显更浅(即,更高的L值)(例如,参见下图7和表7)。
表7
普切明产生的定量
发酵 20小时后的L值 40小时后的L值
对照-1 48.31±0.67 58.28±0.30
对照-2 49.08±0.90 59.35±0.27
分批AlCl3 48.25±0.60 64.16±0.41
分批Al2(SO4)3 50.27±0.70 66.48±0.10
实例15
向芽孢杆菌属两升发酵中预添加AlCl3或Al2(SO4)3不影响生长速率
四个发酵罐之间的细胞质量和呼吸状态没有显著变化。如通过光谱仪分析所监测的细胞质量在8%的平均偏差内。如通过碳释放和氧摄取速率趋势所解释的呼吸状态非常相似,进一步表明10mM铝离子(无论是AlCl3还是Al2(SO4)3的形式)在这种工业发酵条件下对芽孢杆菌属生长没有影响。例如,在2L生物反应器中进行完全通气的补料分批发酵,其中控制温度和pH。通过调节空气流量和搅拌速率(将其初始速率分别设定为30slph和750rpm),将溶解氧控制在大于或等于50%的饱和度。在37℃和170rpm下,在250mL摇瓶中用3mL起始培养物接种每个生物反应器,该起始培养物从表达蛋白酶的枯草芽孢杆菌菌株的冷冻原种在补充有1%葡萄糖的30mL LB中生长,直到550nm处的光密度达到0.8-1.5。将在线气体分析用于监测发酵培养物的呼吸状态。定期收集全肉汤样品进行离线光密度、LAB颜色和活性蛋白酶定量。LAB颜色分析:如美国专利号6,303,354中所述,使用Hunter Lab比色计(LabScan XE,美国亨特立公司(HunterLab,USA))一式两份地分析全肉汤样品。目的输出是指示分析物亮度的L值,其中读数0指示黑色且读数100指示白色。
实例16
向芽孢杆菌属两升发酵中预添加AlCl3或Al2(SO4)3不影响蛋白酶产生
当与对照发酵相比时,蛋白酶产生不受铝预添加的影响。经由二十(20)小时和四十(40)小时发酵肉汤样品的活性测定来确定蛋白酶浓度。考虑到每个样品各自的分批和进料碳,还确定了总碳产量。所有四次发酵都成功地达到了适合秤的容量的滴度和产量。
活性蛋白酶定量:在pNA肽基测定中,如由蛋白酶活性引起的N-suc-AAPF-pNA的水解速率在可测量的黄色产生中是明显的,并且在分光光度计上405nm处是可测量的,如美国专利公开号US20200123522A1中一般性描述的。首先用100mM Tris pH 8.6溶液稀释标准品和样品,使得它们的浓度在测定的适当范围内。然后将样品添加到含有1mg/mL suc-AAPF-pNA的比色皿中,并且在室温下使用分光光度计以动力学模式在405nm下测定三(3)分钟。使用已知酶浓度的标准品生成与以mOD*min-1表示的水解速率和酶浓度相关的校准曲线,从而确定全肉汤样品的活性酶浓度。
参考文献
PCT公开号WO 1990/11352
PCT公开号WO 1994/18314
PCT公开号WO 1999/19467
PCT公开号WO 1999/43794
PCT公开号WO 2000/29560
PCT公开号WO 2000/60059
PCT公开号WO 2001/51643
PCT公开号WO 2002/14490
PCT公开号WO 2003/083125
PCT公开号WO 2003/089604
PCT公开号WO 2004/011609
PCT公开号WO 2006/037483
PCT公开号WO 2006/037484
PCT公开号WO 2006/089107
PCT公开号WO 2008/112459
PCT公开号WO 2011/140316
PCT公开号WO 2012/151534
PCT公开号WO 2014/164777
PCT公开号WO 2015/089447
PCT公开号WO 2016/183509
PCT公开号WO 2018/156705
PCT公开号WO 2020/242858
美国专利号5,972,682
美国专利号6,303,354
美国专利公开号US2020/0123522
Arnaouteli et al.,“Pulcherrimin formation controls growth arrest ofthe Bacillus subtilis biofilm”,PNAS,116(27):13553-13562,2019.
Botstein and Shortle,Science 229:4719,1985.
Brode et al.,“Subtilisin BPN'variants:increased hydrolytic activityon surface-bound substrates via decreased surface activity”,Biochemistry,35(10):3162-3169,1996.
Chang et al.,Mol.Gen.Genet.,168:11-115,1979.
Ferrari et al.,"Genetics,"in Harwood et al.(ed.),Bacillus,PlenumPublishing Corp.,1989.
Fisher et.al.,Arch.Microbiol.,139:213-217,1981.
Higuchi et al.,Nucleic Acids Research 16:7351,1988.
Ho et al.,Gene 77:61,1989.
Hoch et al.,J.Bacteriol.,93:1925 -1937,1967.
Holubova,Folia Microbiol.,30:97,1985.
Horton et al.,Gene 77:61,1989.
Iglesias and Trautner,Molecular General Genetics 189:73-76,1983.
Jensen et al.,“Cell-associated degradation affects the yield ofsecreted engineered and heterologous proteins in the Bacillus subtilisexpression system”Microbiology,146,Pt 10:2583-2594,2000.
Karp et al.,“The BioCyc collection of microbial genomes and metabolicpathways”,Briefings in Bioinformatics,2017.
Li et al.,“Identification and High-level Production of Pulcherriminin Bacillus licheniformis DW2”,Appl Biochem Biotechnol.,183(4):1323-1335,2017.
Lo et al.,Proceedings of the National Academy of Sciences USA 81:2285,1985.
MacDonald,“Biosynthesis of pulcherriminic acid”,Biochem.J.,96:533-538,1965.
MacDonald,“The isolation of pulcherriminic acid from Bacilluscereus”,Canadian Journal of Microbiology,13(1),1967.
Mann et al.,Current Microbiol.,13:131 -135,1986.
McDonald,J.Gen.Microbiol.,130:203,1984.
Pao et al.,“Major facilitator superfamily”,Microbiology and MolecularBiology Reviews,62(1):1-34,1998.
Pawlikowska et al.,“Biocontrol capability of local Metschnikowiasp.Isolates”,Antonie Van Leeuwenhoek,112(10):1425–1445,2019.
Perego,1993,In A.L.Sonneshein,J.A.Hoch,and R.Losick,editors,Bacillussubtilis and Other Gram-Positive Bacteria,Chapter 42,American Society ofMicrobiology,Washington,D.C.
Pi and Helmann,“Ferrous iron efflux systems in bacteria”,Metallomics,9(7):840-851,2017.
Randazzo et al,“The MarR-like protein PchR(YvmB)regulates expressionof genes involved in pulcherriminic acid biosynthesis and in the initiationof sporulation in Bacillus subtilis”,BMC Microbiology,16:190,2016.
Raul et al.,“Production and partial purification of alpha amylasefrom Bacillus subtilis(MTCC 121)using solid state fermentation”,BiochemistryResearch International,2014.
Sarkar and Sommer,BioTechniques 8:404,1990.
Saunders et al.,J.Bacteriol.,157:718-726,1984.
Schindelin et al.,“Fiji–an open source platform for biological imageanalysis”,Nat Methods.,9(7):10,2012.
Shimada,Meth.Mol.Biol.57:157;1996
Sipiczki M.,“Metschnikowia pulcherrima and Related Pulcherrimin-Producing Yeasts:Fuzzy Species Boundaries and Complex AntimicrobialAntagonism”Microorganisms,8(7):1029,2020.
Smith et al.,Appl.Env.Microbiol.,51:634 1986.
Uffen and Canale-Parola,“Synthesis of Pulcherriminic Acid by Bacillussubtilis”,Journal of Bacteriology 111:86-93,1972.
Van Dijl and Hecker,“Bacillus subtilis:from soil bacterium to super-secreting cell factory”,Microbial Cell Factories,12(3).2013.
Vorobjeva et al.,FEMS Microbiol.Lett.,7:261-263,1980.
Westers et al.,“Bacillus subtilis as cell factory for pharmaceuticalproteins:a biotechnological approach to optimize the host organism”,Biochimica et Biophysica Acta.,1694:299-310,2004.
序列表
<110> 美国丹尼斯科公司(DANISCO US INC)
<120> 在色素缺陷型芽孢杆菌属细胞中产生目的蛋白的方法和组合物
<130> NB41351-US-PSP
<160> 48
<170> PatentIn 3.5版
<210> 1
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 1
cgggcccgcc tcctagcgg 19
<210> 2
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 2
cgcttttggc ttcctcaggc g 21
<210> 3
<211> 102
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 3
taaacccttg catatgtcta gataacttcg tataatgtat gctatacgaa gttatgcggc 60
cgccatatgc atcctaggcc ccaagaggag cggaatgagc gc 102
<210> 4
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 4
ggccgtgctg atcatagcag g 21
<210> 5
<211> 104
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 5
cgccaatgtt ttcgccgcag aagcgcacga aacaaaaaaa gcaccacatg taaaaaagct 60
gcctttgcgg gcagcttttt tcgacggtat cttattgcgg atcc 104
<210> 6
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 6
ctagacatat gcaagggttt attgt 25
<210> 7
<211> 74
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 7
aggatgaaag aaggcagcag atacagctcc gcctgaggaa gccaaaagcg taagaaaagt 60
gattctggga gagc 74
<210> 8
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 8
agtagttcac caccttttcc ctatataaaa g 31
<210> 9
<211> 105
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 9
accgctcgtg ttcatcagga agaggataac aggatgaaag aaggcagcag atacagctcc 60
gcctgaggaa gccaaaagcg taaatccttg acgagcaagg gattg 105
<210> 10
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 10
atacattcag ttcgtttatt atcatttc 28
<210> 11
<211> 106
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 11
accgctcgtg ttcatcagga agaggataac aggatgaaag aaggcagcag atacagctcc 60
gcctgaggaa gccaaaagcg atattttgag ctgaaatcga agcagg 106
<210> 12
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 12
gtatagagta aaggttctat gtaaaaag 28
<210> 13
<211> 89
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 13
ttcagaaaaa atcgtggaat tgatacacta atgcttttat atagggaaaa ggtggtgaac 60
tactttggct catacaaaat caaaggcag 89
<210> 14
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 14
aaaaagctgc ccgcaaaggc ag 22
<210> 15
<211> 107
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 15
ttgctctcat ttttttctga gacaggttta gaatcagact gaactgtgaa gaaatgataa 60
taaacgaact gaatgtatcc taatgctttt atatagggaa aaggtgg 107
<210> 16
<211> 107
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 16
tatacaaaaa aacgcactga tttacaaaac cttaacattc ggttcaaacc ctttttacat 60
agaaccttta ctctatacgt taatgctttt atatagggaa aaggtgg 107
<210> 17
<211> 157
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 17
accgctcgtg ttcatcagga agaggataac aggatgaaag aaggcagcag atacagctcc 60
gcctgaggaa gccaaaagcg gatttatgtt tcagcaggaa ttgtaaaggg taaaagagaa 120
atagatacat taatgctttt atatagggaa aaggtgg 157
<210> 18
<211> 3578
<212> DNA
<213> 人工序列
<220>
<223> 表达盒
<400> 18
cgggcccgcc tcctagcggc tgaagaatcg cggctgccag cttataaata aaagcgaggg 60
aaagcacttt gattgccgga aatgccgcaa tacagatcaa aatagcgaca ccgagaatcc 120
ctaccgtatt tttcagcagt aaagaggcgc tgattactgt atctgttgcg tctgtaaaca 180
ttcggccaag cacaggaata aaatttccgg ttataaattt agccgtcctg agcgtaatgc 240
cgtctgtcac tgcagctgac gctccctgaa cagagatgac gccgagaaag atggtaagaa 300
aaacagccag tgctccgatg gcgatatttc tgagcaggtt agccagctgc gttactttgt 360
attgttcagt catcgtgctg acaatgctca gaatcgctga taaaaaaatc agcggcatga 420
cgatattctg aatcaagaga ccgctcgtgt tcatcaggaa gaggataaca ggatgaaaga 480
aggcagcaga tacagctccg cctgaggaag ccaaaagcgt aagaaaagtg attctgggag 540
agccgggatc acttttttat ttaccttatg cccgaaatga aagctttatg acctaattgt 600
gtaactatat cctatttttt caaaaaatat tttaaaaacg agcaggattt cagaaaaaat 660
cgtggaattg atacactaat gcttttatat agggaaaagg tggtgaacta ctttggctca 720
tacaaaatca aaggcagtat tgatcttata cactgtttgc ttcagtgcat tttttgcatc 780
tttaagccag aacatttatt cacctattct tccgatcatt aaagaatcat tccatgtttc 840
cacagctatg gtgaacctgt cagtctcagt ttttatgatt gtgacagcaa taatgcaaat 900
tatattagga gcgatcattg attttaaagg cgctcggatc gtcttgatta ccggtattct 960
ggcaacggca gcagccagca tcggctgtgc ggtgactact gactttacct tgtttctgat 1020
attcagaatg atacaggcag ccggttccgc agcactgcct cttattgctg ccacaacgat 1080
cggacagctg tttacaggaa atgaacgcgg gagtgcaatg ggaacgtatc aaatgctcct 1140
gtctgtcgca ccggctattg ctccagttct aggaggattc ataggcggag cagccggata 1200
cgaagggatt ttttggatac ttgcggccat ctctatcgtt ttgctggtga caaacagcat 1260
cacctttcct aaagattctc caactgaatc tatgcagcaa gccaaaggca atgtgttcgc 1320
tcattataaa tcaatattta caaatcgaac agggaacgtc attttgactt taagttttgt 1380
tctctttttc atttattttg cagtaattgt ctacctccca atattgctga cagagcatta 1440
ccatatagat gtgggtatag caggactgtt atatttgccg ctggcgctga gcacgattgc 1500
aggtacgttt ctgtttaaaa gaatacaggc aaaaatcggg ctgcacacct tgtttatcgg 1560
aagcaatgtg attgccgcct gcagcatcat tttatttgct gttacacatt ccgtttctct 1620
cgttctcatg gctctgacgc tggcactgtt tggcatctcg atgggggtta ttcctccctt 1680
gtactctaca atgattacta atgaatttga gcacaacaga gggagtgcaa tcggaatgtt 1740
taactttatc cgatatacag gcatggcagc aggtccgatg gtatctgcct acttgctcac 1800
aatgatgccg tctgccatgt cctttagcct cctaggcctt ggatttgccg cattgagctt 1860
ttgccttctt ccgccaatgt tttcgccgca gaagcgcacg aaacaaaaaa agcaccacat 1920
gtaaaaaagc tgcctttgcg ggcagctttt ttcgacggta tcttattgcg gatccataac 1980
ttcgtataat gtatgctata cgaagttatc tagataaaaa atttagaagc caatgaaatc 2040
tataaataaa ctaaattaag tttatttaat taacaactat ggatataaaa taggtactaa 2100
tcaaaatagt gaggaggata tatttgaata catacgaaca aattaataaa gtgaaaaaaa 2160
tacttcggaa acatttaaaa aataacctta ttggtactta catgtttgga tcaggagttg 2220
agagtggact aaaaccaaat agtgatcttg actttttagt cgtcgtatct gaaccattga 2280
cagatcaaag taaagaaata cttatacaaa aaattagacc tatttcaaaa aaaataggag 2340
ataaaagcaa cttacgatat attgaattaa caattattat tcagcaagaa atggtaccgt 2400
ggaatcatcc tcccaaacaa gaatttattt atggagaatg gttacaagag ctttatgaac 2460
aaggatacat tcctcagaag gaattaaatt cagatttaac cataatgctt taccaagcaa 2520
aacgaaaaaa taaaagaata tacggaaatt atgacttaga ggaattacta cctgatattc 2580
cattttctga tgtgagaaga gccattatgg attcgtcaga ggaattaata gataattatc 2640
aggatgatga aaccaactct atattaactt tatgccgtat gattttaact atggacacgg 2700
gtaaaatcat accaaaagat attgcgggaa atgcagtggc tgaatcttct ccattagaac 2760
atagggagag aattttgtta gcagttcgta gttatcttgg agagaatatt gaatggacta 2820
atgaaaatgt aaatttaact ataaactatt taaataacag attaaaaaaa ttataaaaaa 2880
attgaaaaaa tggtggaaac acttttttca atttttttgt tttattattt aatatttggg 2940
aaatattcat tctaattggt aatcagattt tagaaaacaa taaacccttg catatgtcta 3000
gataacttcg tataatgtat gctatacgaa gttatgcggc cgccatatgc atcctaggcc 3060
ccaagaggag cggaatgagc gccaggataa agctggtcat cgtctgaatc gcctcagttg 3120
catagttaat tgccacatga aagctattaa gcgcaaggat aatcagcacc atgtacacaa 3180
ttgagtaagc gaccttactg acggtgcttt gctgaaaagc attttgcaaa agctgcagaa 3240
tgacgcaaaa aatcgtgagc aaaatcaatg tgcccagcag ctttccgttg gcaagcactt 3300
catgaaacaa ataagaaaag agagctttca gccattcttg cggtgagaat gatttatcgc 3360
cattgataaa ctccattaag ctgccttttt ggctttccgg cagcagtccg ccgtattctg 3420
tcataatgtc attccaaaat tccccgatct tatctgtttc aagcgaggct gctgtccttt 3480
ccgctaattg ctcggctgtt tcagcatggt cttccgtttg ttctgcatta ccagctgctt 3540
gtacaatttc tgcacggcct gctatgatca gcacggcc 3578
<210> 19
<211> 3655
<212> DNA
<213> 人工序列
<220>
<223> 表达盒
<400> 19
cgggcccgcc tcctagcggc tgaagaatcg cggctgccag cttataaata aaagcgaggg 60
aaagcacttt gattgccgga aatgccgcaa tacagatcaa aatagcgaca ccgagaatcc 120
ctaccgtatt tttcagcagt aaagaggcgc tgattactgt atctgttgcg tctgtaaaca 180
ttcggccaag cacaggaata aaatttccgg ttataaattt agccgtcctg agcgtaatgc 240
cgtctgtcac tgcagctgac gctccctgaa cagagatgac gccgagaaag atggtaagaa 300
aaacagccag tgctccgatg gcgatatttc tgagcaggtt agccagctgc gttactttgt 360
attgttcagt catcgtgctg acaatgctca gaatcgctga taaaaaaatc agcggcatga 420
cgatattctg aatcaagaga ccgctcgtgt tcatcaggaa gaggataaca ggatgaaaga 480
aggcagcaga tacagctccg cctgaggaag ccaaaagcgt aaatccttga cgagcaaggg 540
attgacgctt taaaatgctt gatatggctt tttatatgtg ttactctaca tacagaaatt 600
cttcactttg ttggacaaac attcctcaga gtgcagtttt tcttaaaaag ccgtttaatt 660
gtctttctct tacttgctct catttttttc tgagacaggt ttagaatcag actgaactgt 720
gaagaaatga taataaacga actgaatgta tcctaatgct tttatatagg gaaaaggtgg 780
tgaactactt tggctcatac aaaatcaaag gcagtattga tcttatacac tgtttgcttc 840
agtgcatttt ttgcatcttt aagccagaac atttattcac ctattcttcc gatcattaaa 900
gaatcattcc atgtttccac agctatggtg aacctgtcag tctcagtttt tatgattgtg 960
acagcaataa tgcaaattat attaggagcg atcattgatt ttaaaggcgc tcggatcgtc 1020
ttgattaccg gtattctggc aacggcagca gccagcatcg gctgtgcggt gactactgac 1080
tttaccttgt ttctgatatt cagaatgata caggcagccg gttccgcagc actgcctctt 1140
attgctgcca caacgatcgg acagctgttt acaggaaatg aacgcgggag tgcaatggga 1200
acgtatcaaa tgctcctgtc tgtcgcaccg gctattgctc cagttctagg aggattcata 1260
ggcggagcag ccggatacga agggattttt tggatacttg cggccatctc tatcgttttg 1320
ctggtgacaa acagcatcac ctttcctaaa gattctccaa ctgaatctat gcagcaagcc 1380
aaaggcaatg tgttcgctca ttataaatca atatttacaa atcgaacagg gaacgtcatt 1440
ttgactttaa gttttgttct ctttttcatt tattttgcag taattgtcta cctcccaata 1500
ttgctgacag agcattacca tatagatgtg ggtatagcag gactgttata tttgccgctg 1560
gcgctgagca cgattgcagg tacgtttctg tttaaaagaa tacaggcaaa aatcgggctg 1620
cacaccttgt ttatcggaag caatgtgatt gccgcctgca gcatcatttt atttgctgtt 1680
acacattccg tttctctcgt tctcatggct ctgacgctgg cactgtttgg catctcgatg 1740
ggggttattc ctcccttgta ctctacaatg attactaatg aatttgagca caacagaggg 1800
agtgcaatcg gaatgtttaa ctttatccga tatacaggca tggcagcagg tccgatggta 1860
tctgcctact tgctcacaat gatgccgtct gccatgtcct ttagcctcct aggccttgga 1920
tttgccgcat tgagcttttg ccttcttccg ccaatgtttt cgccgcagaa gcgcacgaaa 1980
caaaaaaagc accacatgta aaaaagctgc ctttgcgggc agcttttttc gacggtatct 2040
tattgcggat ccataacttc gtataatgta tgctatacga agttatctag ataaaaaatt 2100
tagaagccaa tgaaatctat aaataaacta aattaagttt atttaattaa caactatgga 2160
tataaaatag gtactaatca aaatagtgag gaggatatat ttgaatacat acgaacaaat 2220
taataaagtg aaaaaaatac ttcggaaaca tttaaaaaat aaccttattg gtacttacat 2280
gtttggatca ggagttgaga gtggactaaa accaaatagt gatcttgact ttttagtcgt 2340
cgtatctgaa ccattgacag atcaaagtaa agaaatactt atacaaaaaa ttagacctat 2400
ttcaaaaaaa ataggagata aaagcaactt acgatatatt gaattaacaa ttattattca 2460
gcaagaaatg gtaccgtgga atcatcctcc caaacaagaa tttatttatg gagaatggtt 2520
acaagagctt tatgaacaag gatacattcc tcagaaggaa ttaaattcag atttaaccat 2580
aatgctttac caagcaaaac gaaaaaataa aagaatatac ggaaattatg acttagagga 2640
attactacct gatattccat tttctgatgt gagaagagcc attatggatt cgtcagagga 2700
attaatagat aattatcagg atgatgaaac caactctata ttaactttat gccgtatgat 2760
tttaactatg gacacgggta aaatcatacc aaaagatatt gcgggaaatg cagtggctga 2820
atcttctcca ttagaacata gggagagaat tttgttagca gttcgtagtt atcttggaga 2880
gaatattgaa tggactaatg aaaatgtaaa tttaactata aactatttaa ataacagatt 2940
aaaaaaatta taaaaaaatt gaaaaaatgg tggaaacact tttttcaatt tttttgtttt 3000
attatttaat atttgggaaa tattcattct aattggtaat cagattttag aaaacaataa 3060
acccttgcat atgtctagat aacttcgtat aatgtatgct atacgaagtt atgcggccgc 3120
catatgcatc ctaggcccca agaggagcgg aatgagcgcc aggataaagc tggtcatcgt 3180
ctgaatcgcc tcagttgcat agttaattgc cacatgaaag ctattaagcg caaggataat 3240
cagcaccatg tacacaattg agtaagcgac cttactgacg gtgctttgct gaaaagcatt 3300
ttgcaaaagc tgcagaatga cgcaaaaaat cgtgagcaaa atcaatgtgc ccagcagctt 3360
tccgttggca agcacttcat gaaacaaata agaaaagaga gctttcagcc attcttgcgg 3420
tgagaatgat ttatcgccat tgataaactc cattaagctg cctttttggc tttccggcag 3480
cagtccgccg tattctgtca taatgtcatt ccaaaattcc ccgatcttat ctgtttcaag 3540
cgaggctgct gtcctttccg ctaattgctc ggctgtttca gcatggtctt ccgtttgttc 3600
tgcattacca gctgcttgta caatttctgc acggcctgct atgatcagca cggcc 3655
<210> 20
<211> 3471
<212> DNA
<213> 人工序列
<220>
<223> 表达盒
<400> 20
cgggcccgcc tcctagcggc tgaagaatcg cggctgccag cttataaata aaagcgaggg 60
aaagcacttt gattgccgga aatgccgcaa tacagatcaa aatagcgaca ccgagaatcc 120
ctaccgtatt tttcagcagt aaagaggcgc tgattactgt atctgttgcg tctgtaaaca 180
ttcggccaag cacaggaata aaatttccgg ttataaattt agccgtcctg agcgtaatgc 240
cgtctgtcac tgcagctgac gctccctgaa cagagatgac gccgagaaag atggtaagaa 300
aaacagccag tgctccgatg gcgatatttc tgagcaggtt agccagctgc gttactttgt 360
attgttcagt catcgtgctg acaatgctca gaatcgctga taaaaaaatc agcggcatga 420
cgatattctg aatcaagaga ccgctcgtgt tcatcaggaa gaggataaca ggatgaaaga 480
aggcagcaga tacagctccg cctgaggaag ccaaaagcgg atttatgttt cagcaggaat 540
tgtaaagggt aaaagagaaa tagatacatt aatgctttta tatagggaaa aggtggtgaa 600
ctactttggc tcatacaaaa tcaaaggcag tattgatctt atacactgtt tgcttcagtg 660
cattttttgc atctttaagc cagaacattt attcacctat tcttccgatc attaaagaat 720
cattccatgt ttccacagct atggtgaacc tgtcagtctc agtttttatg attgtgacag 780
caataatgca aattatatta ggagcgatca ttgattttaa aggcgctcgg atcgtcttga 840
ttaccggtat tctggcaacg gcagcagcca gcatcggctg tgcggtgact actgacttta 900
ccttgtttct gatattcaga atgatacagg cagccggttc cgcagcactg cctcttattg 960
ctgccacaac gatcggacag ctgtttacag gaaatgaacg cgggagtgca atgggaacgt 1020
atcaaatgct cctgtctgtc gcaccggcta ttgctccagt tctaggagga ttcataggcg 1080
gagcagccgg atacgaaggg attttttgga tacttgcggc catctctatc gttttgctgg 1140
tgacaaacag catcaccttt cctaaagatt ctccaactga atctatgcag caagccaaag 1200
gcaatgtgtt cgctcattat aaatcaatat ttacaaatcg aacagggaac gtcattttga 1260
ctttaagttt tgttctcttt ttcatttatt ttgcagtaat tgtctacctc ccaatattgc 1320
tgacagagca ttaccatata gatgtgggta tagcaggact gttatatttg ccgctggcgc 1380
tgagcacgat tgcaggtacg tttctgttta aaagaataca ggcaaaaatc gggctgcaca 1440
ccttgtttat cggaagcaat gtgattgccg cctgcagcat cattttattt gctgttacac 1500
attccgtttc tctcgttctc atggctctga cgctggcact gtttggcatc tcgatggggg 1560
ttattcctcc cttgtactct acaatgatta ctaatgaatt tgagcacaac agagggagtg 1620
caatcggaat gtttaacttt atccgatata caggcatggc agcaggtccg atggtatctg 1680
cctacttgct cacaatgatg ccgtctgcca tgtcctttag cctcctaggc cttggatttg 1740
ccgcattgag cttttgcctt cttccgccaa tgttttcgcc gcagaagcgc acgaaacaaa 1800
aaaagcacca catgtaaaaa agctgccttt gcgggcagct tttttcgacg gtatcttatt 1860
gcggatccat aacttcgtat aatgtatgct atacgaagtt atctagataa aaaatttaga 1920
agccaatgaa atctataaat aaactaaatt aagtttattt aattaacaac tatggatata 1980
aaataggtac taatcaaaat agtgaggagg atatatttga atacatacga acaaattaat 2040
aaagtgaaaa aaatacttcg gaaacattta aaaaataacc ttattggtac ttacatgttt 2100
ggatcaggag ttgagagtgg actaaaacca aatagtgatc ttgacttttt agtcgtcgta 2160
tctgaaccat tgacagatca aagtaaagaa atacttatac aaaaaattag acctatttca 2220
aaaaaaatag gagataaaag caacttacga tatattgaat taacaattat tattcagcaa 2280
gaaatggtac cgtggaatca tcctcccaaa caagaattta tttatggaga atggttacaa 2340
gagctttatg aacaaggata cattcctcag aaggaattaa attcagattt aaccataatg 2400
ctttaccaag caaaacgaaa aaataaaaga atatacggaa attatgactt agaggaatta 2460
ctacctgata ttccattttc tgatgtgaga agagccatta tggattcgtc agaggaatta 2520
atagataatt atcaggatga tgaaaccaac tctatattaa ctttatgccg tatgatttta 2580
actatggaca cgggtaaaat cataccaaaa gatattgcgg gaaatgcagt ggctgaatct 2640
tctccattag aacataggga gagaattttg ttagcagttc gtagttatct tggagagaat 2700
attgaatgga ctaatgaaaa tgtaaattta actataaact atttaaataa cagattaaaa 2760
aaattataaa aaaattgaaa aaatggtgga aacacttttt tcaatttttt tgttttatta 2820
tttaatattt gggaaatatt cattctaatt ggtaatcaga ttttagaaaa caataaaccc 2880
ttgcatatgt ctagataact tcgtataatg tatgctatac gaagttatgc ggccgccata 2940
tgcatcctag gccccaagag gagcggaatg agcgccagga taaagctggt catcgtctga 3000
atcgcctcag ttgcatagtt aattgccaca tgaaagctat taagcgcaag gataatcagc 3060
accatgtaca caattgagta agcgacctta ctgacggtgc tttgctgaaa agcattttgc 3120
aaaagctgca gaatgacgca aaaaatcgtg agcaaaatca atgtgcccag cagctttccg 3180
ttggcaagca cttcatgaaa caaataagaa aagagagctt tcagccattc ttgcggtgag 3240
aatgatttat cgccattgat aaactccatt aagctgcctt tttggctttc cggcagcagt 3300
ccgccgtatt ctgtcataat gtcattccaa aattccccga tcttatctgt ttcaagcgag 3360
gctgctgtcc tttccgctaa ttgctcggct gtttcagcat ggtcttccgt ttgttctgca 3420
ttaccagctg cttgtacaat ttctgcacgg cctgctatga tcagcacggc c 3471
<210> 21
<211> 3637
<212> DNA
<213> 人工序列
<220>
<223> 表达盒
<400> 21
cgggcccgcc tcctagcggc tgaagaatcg cggctgccag cttataaata aaagcgaggg 60
aaagcacttt gattgccgga aatgccgcaa tacagatcaa aatagcgaca ccgagaatcc 120
ctaccgtatt tttcagcagt aaagaggcgc tgattactgt atctgttgcg tctgtaaaca 180
ttcggccaag cacaggaata aaatttccgg ttataaattt agccgtcctg agcgtaatgc 240
cgtctgtcac tgcagctgac gctccctgaa cagagatgac gccgagaaag atggtaagaa 300
aaacagccag tgctccgatg gcgatatttc tgagcaggtt agccagctgc gttactttgt 360
attgttcagt catcgtgctg acaatgctca gaatcgctga taaaaaaatc agcggcatga 420
cgatattctg aatcaagaga ccgctcgtgt tcatcaggaa gaggataaca ggatgaaaga 480
aggcagcaga tacagctccg cctgaggaag ccaaaagcga tattttgagc tgaaatcgaa 540
gcaggacaaa gaaggtactc agcaaaagaa taaagacaaa attgaagaaa atgcagaaaa 600
cacaacgtct tctgataact aaaaaaaaac gctcacatga tgtgggcgtt ttttttatac 660
aaaaaaacgc actgatttac aaaaccttaa cattcggttc aaaccctttt tacatagaac 720
ctttactcta tacgttaatg cttttatata gggaaaaggt ggtgaactac tttggctcat 780
acaaaatcaa aggcagtatt gatcttatac actgtttgct tcagtgcatt ttttgcatct 840
ttaagccaga acatttattc acctattctt ccgatcatta aagaatcatt ccatgtttcc 900
acagctatgg tgaacctgtc agtctcagtt tttatgattg tgacagcaat aatgcaaatt 960
atattaggag cgatcattga ttttaaaggc gctcggatcg tcttgattac cggtattctg 1020
gcaacggcag cagccagcat cggctgtgcg gtgactactg actttacctt gtttctgata 1080
ttcagaatga tacaggcagc cggttccgca gcactgcctc ttattgctgc cacaacgatc 1140
ggacagctgt ttacaggaaa tgaacgcggg agtgcaatgg gaacgtatca aatgctcctg 1200
tctgtcgcac cggctattgc tccagttcta ggaggattca taggcggagc agccggatac 1260
gaagggattt tttggatact tgcggccatc tctatcgttt tgctggtgac aaacagcatc 1320
acctttccta aagattctcc aactgaatct atgcagcaag ccaaaggcaa tgtgttcgct 1380
cattataaat caatatttac aaatcgaaca gggaacgtca ttttgacttt aagttttgtt 1440
ctctttttca tttattttgc agtaattgtc tacctcccaa tattgctgac agagcattac 1500
catatagatg tgggtatagc aggactgtta tatttgccgc tggcgctgag cacgattgca 1560
ggtacgtttc tgtttaaaag aatacaggca aaaatcgggc tgcacacctt gtttatcgga 1620
agcaatgtga ttgccgcctg cagcatcatt ttatttgctg ttacacattc cgtttctctc 1680
gttctcatgg ctctgacgct ggcactgttt ggcatctcga tgggggttat tcctcccttg 1740
tactctacaa tgattactaa tgaatttgag cacaacagag ggagtgcaat cggaatgttt 1800
aactttatcc gatatacagg catggcagca ggtccgatgg tatctgccta cttgctcaca 1860
atgatgccgt ctgccatgtc ctttagcctc ctaggccttg gatttgccgc attgagcttt 1920
tgccttcttc cgccaatgtt ttcgccgcag aagcgcacga aacaaaaaaa gcaccacatg 1980
taaaaaagct gcctttgcgg gcagcttttt tcgacggtat cttattgcgg atccataact 2040
tcgtataatg tatgctatac gaagttatct agataaaaaa tttagaagcc aatgaaatct 2100
ataaataaac taaattaagt ttatttaatt aacaactatg gatataaaat aggtactaat 2160
caaaatagtg aggaggatat atttgaatac atacgaacaa attaataaag tgaaaaaaat 2220
acttcggaaa catttaaaaa ataaccttat tggtacttac atgtttggat caggagttga 2280
gagtggacta aaaccaaata gtgatcttga ctttttagtc gtcgtatctg aaccattgac 2340
agatcaaagt aaagaaatac ttatacaaaa aattagacct atttcaaaaa aaataggaga 2400
taaaagcaac ttacgatata ttgaattaac aattattatt cagcaagaaa tggtaccgtg 2460
gaatcatcct cccaaacaag aatttattta tggagaatgg ttacaagagc tttatgaaca 2520
aggatacatt cctcagaagg aattaaattc agatttaacc ataatgcttt accaagcaaa 2580
acgaaaaaat aaaagaatat acggaaatta tgacttagag gaattactac ctgatattcc 2640
attttctgat gtgagaagag ccattatgga ttcgtcagag gaattaatag ataattatca 2700
ggatgatgaa accaactcta tattaacttt atgccgtatg attttaacta tggacacggg 2760
taaaatcata ccaaaagata ttgcgggaaa tgcagtggct gaatcttctc cattagaaca 2820
tagggagaga attttgttag cagttcgtag ttatcttgga gagaatattg aatggactaa 2880
tgaaaatgta aatttaacta taaactattt aaataacaga ttaaaaaaat tataaaaaaa 2940
ttgaaaaaat ggtggaaaca cttttttcaa tttttttgtt ttattattta atatttggga 3000
aatattcatt ctaattggta atcagatttt agaaaacaat aaacccttgc atatgtctag 3060
ataacttcgt ataatgtatg ctatacgaag ttatgcggcc gccatatgca tcctaggccc 3120
caagaggagc ggaatgagcg ccaggataaa gctggtcatc gtctgaatcg cctcagttgc 3180
atagttaatt gccacatgaa agctattaag cgcaaggata atcagcacca tgtacacaat 3240
tgagtaagcg accttactga cggtgctttg ctgaaaagca ttttgcaaaa gctgcagaat 3300
gacgcaaaaa atcgtgagca aaatcaatgt gcccagcagc tttccgttgg caagcacttc 3360
atgaaacaaa taagaaaaga gagctttcag ccattcttgc ggtgagaatg atttatcgcc 3420
attgataaac tccattaagc tgcctttttg gctttccggc agcagtccgc cgtattctgt 3480
cataatgtca ttccaaaatt ccccgatctt atctgtttca agcgaggctg ctgtcctttc 3540
cgctaattgc tcggctgttt cagcatggtc ttccgtttgt tctgcattac cagctgcttg 3600
tacaatttct gcacggcctg ctatgatcag cacggcc 3637
<210> 22
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 22
gcaaatagga taaacaacac gatgg 25
<210> 23
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 23
cgcctatatt gctgaattcg ggg 23
<210> 24
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 24
gcgatatttc tgagcaggtt agc 23
<210> 25
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 25
actcctgatc caaacatgta agtac 25
<210> 26
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 26
tgccaacgga aagctgctgg g 21
<210> 27
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 27
cagacggatt ttcgacttac atgag 25
<210> 28
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 28
ggactcttct tgtttgtgat taacg 25
<210> 29
<211> 132
<212> PRT
<213> 地衣芽孢杆菌(Bacillus licheniformis)
<400> 29
Met Thr Arg Phe Gly Glu Arg Leu Lys Glu Leu Arg Glu Gln Arg Ser
1 5 10 15
Leu Ser Val Asn Gln Leu Ala Met Tyr Ala Gly Val Ser Ala Ala Ala
20 25 30
Ile Ser Arg Ile Glu Asn Gly His Arg Gly Val Pro Lys Pro Ala Thr
35 40 45
Ile Arg Lys Leu Ala Glu Ala Leu Lys Met Pro Tyr Glu Gln Leu Met
50 55 60
Asp Ile Ala Gly Tyr Met Arg Ala Asp Glu Ile Arg Glu Gln Pro Arg
65 70 75 80
Gly Tyr Val Thr Met Gln Glu Ile Ala Ala Lys His Gly Val Glu Asp
85 90 95
Leu Trp Leu Phe Lys Pro Glu Lys Trp Asp Cys Leu Ser Arg Glu Asp
100 105 110
Leu Leu Asn Leu Glu Gln Tyr Phe His Phe Leu Val Asn Glu Ala Lys
115 120 125
Lys Arg Gln Ser
130
<210> 30
<211> 403
<212> PRT
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 30
Met Ala His Thr Lys Ser Lys Ala Val Leu Ile Leu Tyr Thr Val Cys
1 5 10 15
Phe Ser Ala Phe Phe Ala Ser Leu Ser Gln Asn Ile Tyr Ser Pro Ile
20 25 30
Leu Pro Ile Ile Lys Glu Ser Phe His Val Ser Thr Ala Met Val Asn
35 40 45
Leu Ser Val Ser Val Phe Met Ile Val Thr Ala Ile Met Gln Ile Ile
50 55 60
Leu Gly Ala Ile Ile Asp Phe Lys Gly Ala Arg Ile Val Leu Ile Thr
65 70 75 80
Gly Ile Leu Ala Thr Ala Ala Ala Ser Ile Gly Cys Ala Val Thr Thr
85 90 95
Asp Phe Thr Leu Phe Leu Ile Phe Arg Met Ile Gln Ala Ala Gly Ser
100 105 110
Ala Ala Leu Pro Leu Ile Ala Ala Thr Thr Ile Gly Gln Leu Phe Thr
115 120 125
Gly Asn Glu Arg Gly Ser Ala Met Gly Thr Tyr Gln Met Leu Leu Ser
130 135 140
Val Ala Pro Ala Ile Ala Pro Val Leu Gly Gly Phe Ile Gly Gly Ala
145 150 155 160
Ala Gly Tyr Glu Gly Ile Phe Trp Ile Leu Ala Ala Ile Ser Ile Val
165 170 175
Leu Leu Val Thr Asn Ser Ile Thr Phe Pro Lys Asp Ser Pro Thr Glu
180 185 190
Ser Met Gln Gln Ala Lys Gly Asn Val Phe Ala His Tyr Lys Ser Ile
195 200 205
Phe Thr Asn Arg Thr Gly Asn Val Ile Leu Thr Leu Ser Phe Val Leu
210 215 220
Phe Phe Ile Tyr Phe Ala Val Ile Val Tyr Leu Pro Ile Leu Leu Thr
225 230 235 240
Glu His Tyr His Ile Asp Val Gly Ile Ala Gly Leu Leu Tyr Leu Pro
245 250 255
Leu Ala Leu Ser Thr Ile Ala Gly Thr Phe Leu Phe Lys Arg Ile Gln
260 265 270
Ala Lys Ile Gly Leu His Thr Leu Phe Ile Gly Ser Asn Val Ile Ala
275 280 285
Ala Cys Ser Ile Ile Leu Phe Ala Val Thr His Ser Val Ser Leu Val
290 295 300
Leu Met Ala Leu Thr Leu Ala Leu Phe Gly Ile Ser Met Gly Val Ile
305 310 315 320
Pro Pro Leu Tyr Ser Thr Met Ile Thr Asn Glu Phe Glu His Asn Arg
325 330 335
Gly Ser Ala Ile Gly Met Phe Asn Phe Ile Arg Tyr Thr Gly Met Ala
340 345 350
Ala Gly Pro Met Val Ser Ala Tyr Leu Leu Thr Met Met Pro Ser Ala
355 360 365
Met Ser Phe Ser Leu Leu Gly Leu Gly Phe Ala Ala Leu Ser Phe Cys
370 375 380
Leu Leu Pro Pro Met Phe Ser Pro Gln Lys Arg Thr Lys Gln Lys Lys
385 390 395 400
His His Met
<210> 31
<211> 1566
<212> DNA
<213> 地衣芽孢杆菌(Bacillus licheniformis)
<400> 31
cgcttcttga aaacgaggtg gaattttatt ttgagaaaaa acaagccggt cttgaacagt 60
ttgtaaaaat aaaaaaagaa tgggtaaaag atattttaaa agaccgatat caggatatga 120
aaaagaatcg tcttcaggcc aaacctgatc aggagcctgt tccgcttccg aagcaagcga 180
aaattaatcc cgatgaaaaa gtgattgccc tcacatttga tgacggtccg aatcccgcta 240
caacgaataa aatattaaac gctttacaga agcatgaagg gcatgcgacc ttctttgtgc 300
ttggaagcag agcccaatat tatcccgaaa cgataaaacg gatgctgaag gaaggaaacg 360
aagtcggcaa ccattcctgg gaccatccgt tattgacaag gctgtcaaac gaaaaagcgt 420
atcaggagat taacgacacg caagaaatga tcgaaaaaat cagcggacac ctgcctgtac 480
acttgcgtcc tccatacggc gggatcaatg attccgtccg ctcgctttcc aatctgaagg 540
tttcattgtg ggatgttgat ccggaagatt ggaagtacaa aaataagcaa aagattgtca 600
atcatgtcat gagccatgcg ggagacggaa aaatcgtctt aatgcacgat atttatgcaa 660
cgtccgcaga tgctgctgaa gagattatta aaaagctgaa agcaaaaggc tatcaattgg 720
taactgtatc tcagcttgaa gaagtgaaga agcagagagg ctattgaata aatgagtaga 780
aagcgccata tcggcgcttt tcttttggaa gaaaatatag ggaaaatggt acttgttaaa 840
aattcggaat atttatacaa tatcatatgt ttcacattga aaggggagga gaatcatgaa 900
acaacaaaaa cggctttacg cccgattgct gacgctgtta ggatcccacg taaacggcgg 960
gtcggtttca atttatgttc aaagatagaa gagcaggctg acagtttgaa tcgcataggt 1020
aaggcgggga tgaaatggca acgttatctg atgtagcaaa gaaagcaaat gtgtcgaaaa 1080
tgacggtatc gcgggtgatc aatcatcctg agactgtgac ggatgaattg aaaaagcttg 1140
ttcattccgc aatgaaggag ctcaattata taccgaacta tgcagcaaga gcgctcgttc 1200
aaaacagaac acaggtcgtc aagctgctca tactggaaga aatggataca acagaacctt 1260
attatatgaa tctgttaacg ggaatcagcc gcgagctgga ccgtcatcat tatgctttgc 1320
agcttgtcac aaggaaatct ctcaatatcg gccagtgcga cggcattatt gcgacggggt 1380
tgagaaaagc cgattttgaa gggctcatca aggtttttga aaagcctgtc gttgtattcg 1440
ggcaaaatga aatgggctac gattttattg atgttaacaa tgaaaaagga acctatatgg 1500
caacacgtca cgtcattggt ctgggcgtcc gcaatgtcgt cttttttggg atcgatttgg 1560
atgagc 1566
<210> 32
<211> 1631
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 32
agttcaacaa acgggccata ttgttgtata agtgatgaaa tactgaattt aaaacttagt 60
ttatatgtgg taaaatgttt taatcaagtt taggaggaat taattatgaa gtgtaatgaa 120
tgtaacaggg ttcaattaaa agagggaagc gtatcattaa ccctataaac tacgtctgcc 180
ctcattattg gagggtgaaa tgtgaataca tcctattcac aatcgaattt acgacacaac 240
caaattttaa tttggctttg cattttatct ttttttagcg tattaaatga aatggttttg 300
aacgtctcat tacctgatat tgcaaatgat tttaataaac cacctgcgag tacaaactgg 360
gtgaacacag cctttatgtt aaccttttcc attggaacag ctgtatatgg aaagctatct 420
gatcaattag gcatcaaaag gttactccta tttggaatta taataaattg tttcgggtcg 480
gtaattgggt ttgttggcca ttctttcttt tccttactta ttatggctcg ttttattcaa 540
ggggctggtg cagctgcatt tccagcactc gtaatggttg tagttgcgcg ctatattcca 600
aaggaaaata ggggtaaagc atttggtctt attggatcga tagtagccat gggagaagga 660
gtcggtccag cgattggtgg aatgatagcc cattatattc attggtccta tcttctactc 720
attcctatga taacaattat cactgttccg tttcttatga aattattaaa gaaagaagta 780
aggataaaag gtcattttga tatcaaagga attatactaa tgtctgtagg cattgtattt 840
tttatgttgt ttacaacatc atatagcatt tcttttctta tcgttagcgt gctgtcattc 900
ctgatatttg taaaacatat caggaaagta acagatcctt ttgttgatcc cggattaggg 960
aaaaatatac cttttatgat tggagttctt tgtgggggaa ttatatttgg aacagtagca 1020
gggtttgtct ctatggttcc ttatatgatg aaagatgttc accagctaag tactgccgaa 1080
atcggaagtg taattatttt ccctggaaca atgagtgtca ttattttcgg ctacattggt 1140
gggatacttg ttgatagaag aggtccttta tacgtgttaa acatcggagt tacatttctt 1200
tctgttagct ttttaactgc ttcctttctt ttagaaacaa catcatggtt catgacaatt 1260
ataatcgtat ttgttttagg tgggctttcg ttcaccaaaa cagttatatc aacaattgtt 1320
tcaagtagct tgaaacagca ggaagctggt gctggaatga gtttgcttaa ctttaccagc 1380
tttttatcag agggaacagg tattgcaatt gtaggtggtt tattatccat acccttactt 1440
gatcaaaggt tgttacctat ggaagttgat cagtcaactt atctgtatag taatttgtta 1500
ttactttttt caggaatcat tgtcattagt tggctggtta ccttgaatgt atataaacat 1560
tctcaaaggg atttctaaat atgatgaaga aagaccattc caatcaggaa tggtcttttt 1620
ttatgcgcgg c 1631
<210> 33
<211> 7249
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 33
acacggagta ttacaaagac atcagttcgc tttcttttcc ggtattcagc gatttgaagg 60
aagaggatgc caagctggcc aacgatgcgg taaaacttca tttaaaaaat tcctataaag 120
aatttcaaaa aatcgttaat gatgccgaaa agaaggataa ggatgaagaa aacgtttatg 180
aaacgtccta caaagtcaaa tacaacgagg aaggcaaact gagcttttta atctatgact 240
atcagttctc cggcggtgcg cacggcatgt acaccgtaac atcctacaac tttgactttg 300
acaagcataa acaagtcgtg ctgactgacg tattaaacaa tcaggcgaaa atcgaaaagg 360
caaaaaacta tattttcagc tatatcaacg aacatccgga acagttttat tctgatctta 420
aaaagagcga tatccgtttg gatgaacata cggcattcta ttatacaagc agcggaattt 480
caattgtatt tcagcagtat gatatcgccc cgtatgcagc cggaaaccag gaaataaagc 540
ttccgtcgac gcttttatat tagccccggc attagatcta atatttgtaa tagaaacaga 600
gagagcaagt cgtgaaacag gagagtgagc agcgatgtct ggcaaaccat catttcgatg 660
ggttaaaatg ttgatttttt taacgatatt aataggtttg gcagggtact cttacaataa 720
agtgtcaagc aacagccaag agccccctca gccaaaaaaa gaccgcggac aatccggcct 780
cggcgtcgaa tccatggtca atgacagcaa acaagagagg tatgccatcc attatccggt 840
gtttcacata aaagaaatcg atgaacaaat aaaagattat gtgaatcaag aattggccgg 900
ttttaaagag gataacgcaa aggcccaggc tcaggatgaa gacgggcctt ttgaactgaa 960
cattaaatat aaggttgtct attatacaaa ggatacggcc agtgttgtgc tgaatcaata 1020
catagaggcc ggcggcgtat cgggtacaac atctgtcaag acgtttaacg ctgatttaaa 1080
gcagaaaaag ctgctgtccc ttcaagatct gtttgaagag aattcagatt ttctgaacag 1140
gatttcaagc attgcctatc aggaattgaa aaatcggaat ccgtctgctg acatggcttt 1200
attaaaagaa gggacgagcc ctcaggaaga acatttcagc cgctttgcgc ttcttgaaaa 1260
cgaggtggaa ttttattttg agaaaaaaca aaccggtctt gaacagtctg taaaaataaa 1320
aaaagaatgg gtaaaagata ttttaaaaga ccgatatcag gatatgaaaa agaatcgtct 1380
tcaggccaaa cctgatcagg agcctgttcc gcttccgaag caagcgaaaa ttaatcccga 1440
tgaaaaagtg attgccctca catttgatga cggtccgaat cccgctacaa cgaataaaat 1500
attaaacgct ttacagaagc atgaagggca tgcgaccttc tttgtgcttg gaagcagagc 1560
ccaatattat cccgaaacga taaaacggat gctgaaggaa ggaaacgaag tcggcaacca 1620
ttcctgggac catccgttat tgacaaggct gtcaaacgaa aaagcgtatc aggagattaa 1680
cgacacgcaa gaaatgatcg aaaaaatcag cggacacctg cctgtacact tgcgtcctcc 1740
atacggcggg atcaatgatt ccgtccgctc gctttccaat ctgaaggttt cattgtggga 1800
tgttgatccg gaagattgga agtacaaaaa taagcaaaag attgtcaatc atgtcatgag 1860
ccatgcggga gacggaaaaa tcgtcttaat gcacgatatt tatgcaacgt ccgcagatgc 1920
tgctgaagag attattaaaa agctgaaagc aaaaggctat caattggtaa ctgtatctca 1980
gcttgaagaa gtgaagaagc agagaggcta ttgaataaat gagtagaaag cgccatatcg 2040
gctaaatcct tgacgagcaa gggattgacg ctttaaaatg cttgatatgg ctttttatat 2100
gtgttactct acatacagaa attcttcact ttgttggaca aacattcctc agagtgcagt 2160
ttttcttaaa aagccgttta attgtctttc tcttacttgc tctcattttt ttctgagaca 2220
ggtttagaat cagactgaac tgtgaagaaa tgataataaa cgaactgaat gtatcctaat 2280
gcttttatat agggaaaagg tggtgaacta ctttggctca tacaaaatca aaggcagtat 2340
tgatcttata cactgtttgc ttcagtgcat tttttgcatc tttaagccag aacatttatt 2400
cacctattct tccgatcatt aaagaatcat tccatgtttc cacagctatg gtgaacctgt 2460
cagtctcagt ttttatgatt gtgacagcaa taatgcaaat tatattagga gcgatcattg 2520
attttaaagg cgctcggatc gtcttgatta ccggtattct ggcaacggca gcagccagca 2580
tcggctgtgc ggtgactact gactttacct tgtttctgat attcagaatg atacaggcag 2640
ccggttccgc agcactgcct cttattgctg ccacaacgat cggacagctg tttacaggaa 2700
atgaacgcgg gagtgcaatg ggaacgtatc aaatgctcct gtctgtcgca ccggctattg 2760
ctccagttct aggaggattc ataggcggag cagccggata cgaagggatt ttttggatac 2820
ttgcggccat ctctatcgtt ttgctggtga caaacagcat cacctttcct aaagattctc 2880
caactgaatc tatgcagcaa gccaaaggca atgtgttcgc tcattataaa tcaatattta 2940
caaatcgaac agggaacgtc attttgactt taagttttgt tctctttttc atttattttg 3000
cagtaattgt ctacctccca atattgctga cagagcatta ccatatagat gtgggtatag 3060
caggactgtt atatttgccg ctggcgctga gcacgattgc aggtacgttt ctgtttaaaa 3120
gaatacaggc aaaaatcggg ctgcacacct tgtttatcgg aagcaatgtg attgccgcct 3180
gcagcatcat tttatttgct gttacacatt ccgtttctct cgttctcatg gctctgacgc 3240
tggcactgtt tggcatctcg atgggggtta ttcctccctt gtactctaca atgattacta 3300
atgaatttga gcacaacaga gggagtgcaa tcggaatgtt taactttatc cgatatacag 3360
gcatggcagc aggtccgatg gtatctgcct acttgctcac aatgatgccg tctgccatgt 3420
cctttagcct cctaggcctt ggatttgccg cattgagctt ttgccttctt ccgccaatgt 3480
tttcgccgca gaagcgcacg aaacaaaaaa agcaccacat gtaaaaaagc tgcctttgcg 3540
ggcagctttt ttagttcaac aaacgggcca tattgttgta taagtgatga aatactgaat 3600
ttaaaactta gtttatatgt ggtaaaatgt tttaatcaag tttaggagga attaattatg 3660
aagtgtaatg aatgtaacag ggttcaatta aaagagggaa gcgtatcatt aaccctataa 3720
actacgtctg ccctcattat tggagggtga aatgtgaata catcctattc acaatcgaat 3780
ttacgacaca accaaatttt aatttggctt tgcattttat ctttttttag cgtattaaat 3840
gaaatggttt tgaacgtctc attacctgat attgcaaatg attttaataa accacctgcg 3900
agtacaaact gggtgaacac agcctttatg ttaacctttt ccattggaac agctgtatat 3960
ggaaagctat ctgatcaatt aggcatcaaa aggttactcc tatttggaat tataataaat 4020
tgtttcgggt cggtaattgg gtttgttggc cattctttct tttccttact tattatggct 4080
cgttttattc aaggggctgg tgcagctgca tttccagcac tcgtaatggt tgtagttgcg 4140
cgctatattc caaaggaaaa taggggtaaa gcatttggtc ttattggatc gatagtagcc 4200
atgggagaag gagtcggtcc agcgattggt ggaatgatag cccattatat tcattggtcc 4260
tatcttctac tcattcctat gataacaatt atcactgttc cgtttcttat gaaattatta 4320
aagaaagaag taaggataaa aggtcatttt gatatcaaag gaattatact aatgtctgta 4380
ggcattgtat tttttatgtt gtttacaaca tcatatagca tttcttttct tatcgttagc 4440
gtgctgtcat tcctgatatt tgtaaaacat atcaggaaag taacagatcc ttttgttgat 4500
cccggattag ggaaaaatat accttttatg attggagttc tttgtggggg aattatattt 4560
ggaacagtag cagggtttgt ctctatggtt ccttatatga tgaaagatgt tcaccagcta 4620
agtactgccg aaatcggaag tgtaattatt ttccctggaa caatgagtgt cattattttc 4680
ggctacattg gtgggatact tgttgataga agaggtcctt tatacgtgtt aaacatcgga 4740
gttacatttc tttctgttag ctttttaact gcttcctttc ttttagaaac aacatcatgg 4800
ttcatgacaa ttataatcgt atttgtttta ggtgggcttt cgttcaccaa aacagttata 4860
tcaacaattg tttcaagtag cttgaaacag caggaagctg gtgctggaat gagtttgctt 4920
aactttacca gctttttatc agagggaaca ggtattgcaa ttgtaggtgg tttattatcc 4980
atacccttac ttgatcaaag gttgttacct atggaagttg atcagtcaac ttatctgtat 5040
agtaatttgt tattactttt ttcaggaatc attgtcatta gttggctggt taccttgaat 5100
gtatataaac attctcaaag ggatttctaa atatgatgaa gaaagaccat tccaatcagg 5160
aatggtcttt ttttatgcgc ggcaaaataa ccaaaagccc gtcttataaa tttctttgat 5220
tacattttat aattaatttt aacaaagtgt catcagccct caggaaggac ttgctgacag 5280
tttgaatcgc ataggtaagg cggggatgaa atggcaacgt tatctgatgt agcaaagaaa 5340
gcaaatgtgt cgaaaatgac ggtatcgcgg gtgatcaatc atcctgagac tgtgacggat 5400
gaattgaaaa agcttgttca ttccgcaatg aaggagctca attatatacc gaactatgca 5460
gcaagagcgc tcgttcaaaa cagaacacag gtcgtcaagc tgctcatact ggaagaaatg 5520
gatacaacag aaccttatta tatgaatctg ttaacgggaa tcagccgcga gctggaccgt 5580
catcattatg ctttgcagct tgtcacaagg aaatctctca atatcggcca gtgcgacggc 5640
attattgcga cggggttgag aaaagccgat tttgaagggc tcatcaaggt ttttgaaaag 5700
cctgtcgttg tattcgggca aaatgaaatg ggctacgatt ttattgatgt taacaatgaa 5760
aaaggaacct atatggcaac acgtcacgtc attggtctgg gcgtccgcaa tgtcgtcttt 5820
tttgggatcg atttggatga gccctttgaa cgctcaaggg aaaaaggcta tcttcaggcg 5880
atggaaggca gtctgaaaaa agcagcgatt ttccggatgg aaaacagttc aaaaaaaagt 5940
gaagcacgcg cgcgggaagt gcttgcatcc tttgacgcac ctgcagcggt tgtttgcgct 6000
tcggaccgaa tcgcgctcgg ggttatccgc gcggtgcaat cgcttggtaa aagaattccg 6060
gaagatgtcg cggtcaccgg ctatgacggg gtgtttctcg accggatcgc ttcgcctcgc 6120
ctgacaaccg tcagacagcc tgttgttgaa atgggagagg cttgcgcgag aatcctgctg 6180
aaaaaaatca atgaagacgg agcgccgcaa ggcaatcaat tttttgagcc ggagcttatt 6240
gtccgcgaat cgactttgta gggtgtctca ttctgttacc gttaacaagc tgaaaatgat 6300
tgttcctgtt accgccgtca tgataatttc agaataaaag ccggtttatc acagccggac 6360
aaccaaaagg gggaaacatg atggaatatg cagcgataca tcatcagcct ttcagctctg 6420
atgcctattc ttacaatgga cggacattgc acatcaagat ccgtacaaaa aaggatgatg 6480
ccgaacacgt ccgcttggtt tggggcgatc cttacgaata caccggcggc acatggaaag 6540
cgaacgagct tgcgatggcg aaaattgccg caacaagcac ccatgattac tggtttgccg 6600
aagtggcgcc tccattcagg cgtctgcaat acggatttat cctgacaggc gctgatgatc 6660
gagacacttt ttacggaagc aatggtgcat gtccgtttgc cgggaaagcg gcggatatag 6720
gcaaacactg ttttaaattt ccgtttgttc atgaggcaga cacgtttgat gcacctgact 6780
gggtcaaatc aaccgtctgg tatcaaattt ttccggagcg ctttgccagc gggcgggaag 6840
atttgtctcc ggaaaacgct ttgccatggg gaagcaaaga tcctgaggcg cacgattttt 6900
tcggagggga tttgcagggg atcatggaca agctggacta tttggaagac ttgggggtag 6960
gcggaatcta tttgacgccg atctttgccg cgccttccaa ccataaatac gacacattgg 7020
actattgctc catcgatccg cattttggcg atgaggagct ctttcgcacg ctggtcagcc 7080
ggattcacga gcggggaatg aaaatcatgc ttgatgctgt ttttaaccac attggcagcg 7140
cttcgcaaga gtggcaggat gttgtcaaaa acggtgaaac gtcccgctat aaagactggt 7200
tccatattca ttctttccct gttaaagaag gcagctatga tacatttgc 7249
<210> 34
<211> 2042
<212> DNA
<213> 地衣芽孢杆菌(Bacillus licheniformis)
<400> 34
acacggagta ttacaaagac atcagttcgc tttcttttcc ggtattcagc gatttgaagg 60
aagaggatgc caagctggcc aacgatgcgg taaaacttca tttaaaaaat tcctataaag 120
aatttcaaaa aatcgttaat gatgccgaaa agaaggataa ggatgaagaa aacgtttatg 180
aaacgtccta caaagtcaaa tacaacgagg aaggcaaact gagcttttta atctatgact 240
atcagttctc cggcggtgcg cacggcatgt acaccgtaac atcctacaac tttgactttg 300
acaagcataa acaagtcgtg ctgactgacg tattaaacaa tcaggcgaaa atcgaaaagg 360
caaaaaacta tattttcagc tatatcaacg aacatccgga acagttttat tctgatctta 420
aaaagagcga tatccgtttg gatgaacata cggcattcta ttatacaagc agcggaattt 480
caattgtatt tcagcagtat gatatcgccc cgtatgcagc cggaaaccag gaaataaagc 540
ttccgtcgac gcttttatat tagccccggc attagatcta atatttgtaa tagaaacaga 600
gagagcaagt cgtgaaacag gagagtgagc agcgatgtct ggcaaaccat catttcgatg 660
ggttaaaatg ttgatttttt taacgatatt aataggtttg gcagggtact cttacaataa 720
agtgtcaagc aacagccaag agccccctca gccaaaaaaa gaccgcggac aatccggcct 780
cggcgtcgaa tccatggtca atgacagcaa acaagagagg tatgccatcc attatccggt 840
gtttcacata aaagaaatcg atgaacaaat aaaagattat gtgaatcaag aattggccgg 900
ttttaaagag gataacgcaa aggcccaggc tcaggatgaa gacgggcctt ttgaactgaa 960
cattaaatat aaggttgtct attatacaaa ggatacggcc agtgttgtgc tgaatcaata 1020
catagaggcc ggcggcgtat cgggtacaac atctgtcaag acgtttaacg ctgatttaaa 1080
gcagaaaaag ctgctgtccc ttcaagatct gtttgaagag aattcagatt ttctgaacag 1140
gatttcaagc attgcctatc aggaattgaa aaatcggaat ccgtctgctg acatggcttt 1200
attaaaagaa gggacgagcc ctcaggaaga acatttcagc cgctttgcgc ttcttgaaaa 1260
cgaggtggaa ttttattttg agaaaaaaca aaccggtctt gaacagtctg taaaaataaa 1320
aaaagaatgg gtaaaagata ttttaaaaga ccgatatcag gatatgaaaa agaatcgtct 1380
tcaggccaaa cctgatcagg agcctgttcc gcttccgaag caagcgaaaa ttaatcccga 1440
tgaaaaagtg attgccctca catttgatga cggtccgaat cccgctacaa cgaataaaat 1500
attaaacgct ttacagaagc atgaagggca tgcgaccttc tttgtgcttg gaagcagagc 1560
ccaatattat cccgaaacga taaaacggat gctgaaggaa ggaaacgaag tcggcaacca 1620
ttcctgggac catccgttat tgacaaggct gtcaaacgaa aaagcgtatc aggagattaa 1680
cgacacgcaa gaaatgatcg aaaaaatcag cggacacctg cctgtacact tgcgtcctcc 1740
atacggcggg atcaatgatt ccgtccgctc gctttccaat ctgaaggttt cattgtggga 1800
tgttgatccg gaagattgga agtacaaaaa taagcaaaag attgtcaatc atgtcatgag 1860
ccatgcggga gacggaaaaa tcgtcttaat gcacgatatt tatgcaacgt ccgcagatgc 1920
tgctgaagag attattaaaa agctgaaagc aaaaggctat caattggtaa ctgtatctca 1980
gcttgaagaa gtgaagaagc agagaggcta ttgaataaat gagtagaaag cgccatatcg 2040
gc 2042
<210> 35
<211> 257
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 35
ctaaatcctt gacgagcaag ggattgacgc tttaaaatgc ttgatatggc tttttatatg 60
tgttactcta catacagaaa ttcttcactt tgttggacaa acattcctca gagtgcagtt 120
tttcttaaaa agccgtttaa ttgtctttct cttacttgct ctcatttttt tctgagacag 180
gtttagaatc agactgaact gtgaagaaat gataataaac gaactgaatg tatcctaatg 240
cttttatata gggaaaa 257
<210> 36
<211> 14
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 36
ggtggtgaac tact 14
<210> 37
<211> 1212
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 37
ttggctcata caaaatcaaa ggcagtattg atcttataca ctgtttgctt cagtgcattt 60
tttgcatctt taagccagaa catttattca cctattcttc cgatcattaa agaatcattc 120
catgtttcca cagctatggt gaacctgtca gtctcagttt ttatgattgt gacagcaata 180
atgcaaatta tattaggagc gatcattgat tttaaaggcg ctcggatcgt cttgattacc 240
ggtattctgg caacggcagc agccagcatc ggctgtgcgg tgactactga ctttaccttg 300
tttctgatat tcagaatgat acaggcagcc ggttccgcag cactgcctct tattgctgcc 360
acaacgatcg gacagctgtt tacaggaaat gaacgcggga gtgcaatggg aacgtatcaa 420
atgctcctgt ctgtcgcacc ggctattgct ccagttctag gaggattcat aggcggagca 480
gccggatacg aagggatttt ttggatactt gcggccatct ctatcgtttt gctggtgaca 540
aacagcatca cctttcctaa agattctcca actgaatcta tgcagcaagc caaaggcaat 600
gtgttcgctc attataaatc aatatttaca aatcgaacag ggaacgtcat tttgacttta 660
agttttgttc tctttttcat ttattttgca gtaattgtct acctcccaat attgctgaca 720
gagcattacc atatagatgt gggtatagca ggactgttat atttgccgct ggcgctgagc 780
acgattgcag gtacgtttct gtttaaaaga atacaggcaa aaatcgggct gcacaccttg 840
tttatcggaa gcaatgtgat tgccgcctgc agcatcattt tatttgctgt tacacattcc 900
gtttctctcg ttctcatggc tctgacgctg gcactgtttg gcatctcgat gggggttatt 960
cctcccttgt actctacaat gattactaat gaatttgagc acaacagagg gagtgcaatc 1020
ggaatgttta actttatccg atatacaggc atggcagcag gtccgatggt atctgcctac 1080
ttgctcacaa tgatgccgtc tgccatgtcc tttagcctcc taggccttgg atttgccgca 1140
ttgagctttt gccttcttcc gccaatgttt tcgccgcaga agcgcacgaa acaaaaaaag 1200
caccacatgt aa 1212
<210> 38
<211> 48
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 38
atatgatgaa gaaagaccat tccaatcagg aatggtcttt ttttatgc 48
<210> 39
<211> 2053
<212> DNA
<213> 地衣芽孢杆菌(Bacillus licheniformis)
<400> 39
gcccgtctta taaatttctt tgattacatt ttataattaa ttttaacaaa gtgtcatcag 60
ccctcaggaa ggacttgctg acagtttgaa tcgcataggt aaggcgggga tgaaatggca 120
acgttatctg atgtagcaaa gaaagcaaat gtgtcgaaaa tgacggtatc gcgggtgatc 180
aatcatcctg agactgtgac ggatgaattg aaaaagcttg ttcattccgc aatgaaggag 240
ctcaattata taccgaacta tgcagcaaga gcgctcgttc aaaacagaac acaggtcgtc 300
aagctgctca tactggaaga aatggataca acagaacctt attatatgaa tctgttaacg 360
ggaatcagcc gcgagctgga ccgtcatcat tatgctttgc agcttgtcac aaggaaatct 420
ctcaatatcg gccagtgcga cggcattatt gcgacggggt tgagaaaagc cgattttgaa 480
gggctcatca aggtttttga aaagcctgtc gttgtattcg ggcaaaatga aatgggctac 540
gattttattg atgttaacaa tgaaaaagga acctatatgg caacacgtca cgtcattggt 600
ctgggcgtcc gcaatgtcgt cttttttggg atcgatttgg atgagccctt tgaacgctca 660
agggaaaaag gctatcttca ggcgatggaa ggcagtctga aaaaagcagc gattttccgg 720
atggaaaaca gttcaaaaaa aagtgaagca cgcgcgcggg aagtgcttgc atcctttgac 780
gcacctgcag cggttgtttg cgcttcggac cgaatcgcgc tcggggttat ccgcgcggtg 840
caatcgcttg gtaaaagaat tccggaagat gtcgcggtca ccggctatga cggggtgttt 900
ctcgaccgga tcgcttcgcc tcgcctgaca accgtcagac agcctgttgt tgaaatggga 960
gaggcttgcg cgagaatcct gctgaaaaaa atcaatgaag acggagcgcc gcaaggcaat 1020
caattttttg agccggagct tattgtccgc gaatcgactt tgtagggtgt ctcattctgt 1080
taccgttaac aagctgaaaa tgattgttcc tgttaccgcc gtcatgataa tttcagaata 1140
aaagccggtt tatcacagcc ggacaaccaa aagggggaaa catgatggaa tatgcagcga 1200
tacatcatca gcctttcagc tctgatgcct attcttacaa tggacggaca ttgcacatca 1260
agatccgtac aaaaaaggat gatgccgaac acgtccgctt ggtttggggc gatccttacg 1320
aatacaccgg cggcacatgg aaagcgaacg agcttgcgat ggcgaaaatt gccgcaacaa 1380
gcacccatga ttactggttt gccgaagtgg cgcctccatt caggcgtctg caatacggat 1440
ttatcctgac aggcgctgat gatcgagaca ctttttacgg aagcaatggt gcatgtccgt 1500
ttgccgggaa agcggcggat ataggcaaac actgttttaa atttccgttt gttcatgagg 1560
cagacacgtt tgatgcacct gactgggtca aatcaaccgt ctggtatcaa atttttccgg 1620
agcgctttgc cagcgggcgg gaagatttgt ctccggaaaa cgctttgcca tggggaagca 1680
aagatcctga ggcgcacgat tttttcggag gggatttgca ggggatcatg gacaagctgg 1740
actatttgga agacttgggg gtaggcggaa tctatttgac gccgatcttt gccgcgcctt 1800
ccaaccataa atacgacaca ttggactatt gctccatcga tccgcatttt ggcgatgagg 1860
agctctttcg cacgctggtc agccggattc acgagcgggg aatgaaaatc atgcttgatg 1920
ctgtttttaa ccacattggc agcgcttcgc aagagtggca ggatgttgtc aaaaacggtg 1980
aaacgtcccg ctataaagac tggttccata ttcattcttt ccctgttaaa gaaggcagct 2040
atgatacatt tgc 2053
<210> 40
<211> 7172
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 40
acacggagta ttacaaagac atcagttcgc tttcttttcc ggtattcagc gatttgaagg 60
aagaggatgc caagctggcc aacgatgcgg taaaacttca tttaaaaaat tcctataaag 120
aatttcaaaa aatcgttaat gatgccgaaa agaaggataa ggatgaagaa aacgtttatg 180
aaacgtccta caaagtcaaa tacaacgagg aaggcaaact gagcttttta atctatgact 240
atcagttctc cggcggtgcg cacggcatgt acaccgtaac atcctacaac tttgactttg 300
acaagcataa acaagtcgtg ctgactgacg tattaaacaa tcaggcgaaa atcgaaaagg 360
caaaaaacta tattttcagc tatatcaacg aacatccgga acagttttat tctgatctta 420
aaaagagcga tatccgtttg gatgaacata cggcattcta ttatacaagc agcggaattt 480
caattgtatt tcagcagtat gatatcgccc cgtatgcagc cggaaaccag gaaataaagc 540
ttccgtcgac gcttttatat tagccccggc attagatcta atatttgtaa tagaaacaga 600
gagagcaagt cgtgaaacag gagagtgagc agcgatgtct ggcaaaccat catttcgatg 660
ggttaaaatg ttgatttttt taacgatatt aataggtttg gcagggtact cttacaataa 720
agtgtcaagc aacagccaag agccccctca gccaaaaaaa gaccgcggac aatccggcct 780
cggcgtcgaa tccatggtca atgacagcaa acaagagagg tatgccatcc attatccggt 840
gtttcacata aaagaaatcg atgaacaaat aaaagattat gtgaatcaag aattggccgg 900
ttttaaagag gataacgcaa aggcccaggc tcaggatgaa gacgggcctt ttgaactgaa 960
cattaaatat aaggttgtct attatacaaa ggatacggcc agtgttgtgc tgaatcaata 1020
catagaggcc ggcggcgtat cgggtacaac atctgtcaag acgtttaacg ctgatttaaa 1080
gcagaaaaag ctgctgtccc ttcaagatct gtttgaagag aattcagatt ttctgaacag 1140
gatttcaagc attgcctatc aggaattgaa aaatcggaat ccgtctgctg acatggcttt 1200
attaaaagaa gggacgagcc ctcaggaaga acatttcagc cgctttgcgc ttcttgaaaa 1260
cgaggtggaa ttttattttg agaaaaaaca aaccggtctt gaacagtctg taaaaataaa 1320
aaaagaatgg gtaaaagata ttttaaaaga ccgatatcag gatatgaaaa agaatcgtct 1380
tcaggccaaa cctgatcagg agcctgttcc gcttccgaag caagcgaaaa ttaatcccga 1440
tgaaaaagtg attgccctca catttgatga cggtccgaat cccgctacaa cgaataaaat 1500
attaaacgct ttacagaagc atgaagggca tgcgaccttc tttgtgcttg gaagcagagc 1560
ccaatattat cccgaaacga taaaacggat gctgaaggaa ggaaacgaag tcggcaacca 1620
ttcctgggac catccgttat tgacaaggct gtcaaacgaa aaagcgtatc aggagattaa 1680
cgacacgcaa gaaatgatcg aaaaaatcag cggacacctg cctgtacact tgcgtcctcc 1740
atacggcggg atcaatgatt ccgtccgctc gctttccaat ctgaaggttt cattgtggga 1800
tgttgatccg gaagattgga agtacaaaaa taagcaaaag attgtcaatc atgtcatgag 1860
ccatgcggga gacggaaaaa tcgtcttaat gcacgatatt tatgcaacgt ccgcagatgc 1920
tgctgaagag attattaaaa agctgaaagc aaaaggctat caattggtaa ctgtatctca 1980
gcttgaagaa gtgaagaagc agagaggcta ttgaataaat gagtagaaag cgccatatcg 2040
gctaagaaaa gtgattctgg gagagccggg atcacttttt tatttacctt atgcccgaaa 2100
tgaaagcttt atgacctaat tgtgtaacta tatcctattt tttcaaaaaa tattttaaaa 2160
acgagcagga tttcagaaaa aatcgtggaa ttgatacact aatgctttta tatagggaaa 2220
aggtggtgaa ctactttggc tcatacaaaa tcaaaggcag tattgatctt atacactgtt 2280
tgcttcagtg cattttttgc atctttaagc cagaacattt attcacctat tcttccgatc 2340
attaaagaat cattccatgt ttccacagct atggtgaacc tgtcagtctc agtttttatg 2400
attgtgacag caataatgca aattatatta ggagcgatca ttgattttaa aggcgctcgg 2460
atcgtcttga ttaccggtat tctggcaacg gcagcagcca gcatcggctg tgcggtgact 2520
actgacttta ccttgtttct gatattcaga atgatacagg cagccggttc cgcagcactg 2580
cctcttattg ctgccacaac gatcggacag ctgtttacag gaaatgaacg cgggagtgca 2640
atgggaacgt atcaaatgct cctgtctgtc gcaccggcta ttgctccagt tctaggagga 2700
ttcataggcg gagcagccgg atacgaaggg attttttgga tacttgcggc catctctatc 2760
gttttgctgg tgacaaacag catcaccttt cctaaagatt ctccaactga atctatgcag 2820
caagccaaag gcaatgtgtt cgctcattat aaatcaatat ttacaaatcg aacagggaac 2880
gtcattttga ctttaagttt tgttctcttt ttcatttatt ttgcagtaat tgtctacctc 2940
ccaatattgc tgacagagca ttaccatata gatgtgggta tagcaggact gttatatttg 3000
ccgctggcgc tgagcacgat tgcaggtacg tttctgttta aaagaataca ggcaaaaatc 3060
gggctgcaca ccttgtttat cggaagcaat gtgattgccg cctgcagcat cattttattt 3120
gctgttacac attccgtttc tctcgttctc atggctctga cgctggcact gtttggcatc 3180
tcgatggggg ttattcctcc cttgtactct acaatgatta ctaatgaatt tgagcacaac 3240
agagggagtg caatcggaat gtttaacttt atccgatata caggcatggc agcaggtccg 3300
atggtatctg cctacttgct cacaatgatg ccgtctgcca tgtcctttag cctcctaggc 3360
cttggatttg ccgcattgag cttttgcctt cttccgccaa tgttttcgcc gcagaagcgc 3420
acgaaacaaa aaaagcacca catgtaaaaa agctgccttt gcgggcagct tttttagttc 3480
aacaaacggg ccatattgtt gtataagtga tgaaatactg aatttaaaac ttagtttata 3540
tgtggtaaaa tgttttaatc aagtttagga ggaattaatt atgaagtgta atgaatgtaa 3600
cagggttcaa ttaaaagagg gaagcgtatc attaacccta taaactacgt ctgccctcat 3660
tattggaggg tgaaatgtga atacatccta ttcacaatcg aatttacgac acaaccaaat 3720
tttaatttgg ctttgcattt tatctttttt tagcgtatta aatgaaatgg ttttgaacgt 3780
ctcattacct gatattgcaa atgattttaa taaaccacct gcgagtacaa actgggtgaa 3840
cacagccttt atgttaacct tttccattgg aacagctgta tatggaaagc tatctgatca 3900
attaggcatc aaaaggttac tcctatttgg aattataata aattgtttcg ggtcggtaat 3960
tgggtttgtt ggccattctt tcttttcctt acttattatg gctcgtttta ttcaaggggc 4020
tggtgcagct gcatttccag cactcgtaat ggttgtagtt gcgcgctata ttccaaagga 4080
aaataggggt aaagcatttg gtcttattgg atcgatagta gccatgggag aaggagtcgg 4140
tccagcgatt ggtggaatga tagcccatta tattcattgg tcctatcttc tactcattcc 4200
tatgataaca attatcactg ttccgtttct tatgaaatta ttaaagaaag aagtaaggat 4260
aaaaggtcat tttgatatca aaggaattat actaatgtct gtaggcattg tattttttat 4320
gttgtttaca acatcatata gcatttcttt tcttatcgtt agcgtgctgt cattcctgat 4380
atttgtaaaa catatcagga aagtaacaga tccttttgtt gatcccggat tagggaaaaa 4440
tatacctttt atgattggag ttctttgtgg gggaattata tttggaacag tagcagggtt 4500
tgtctctatg gttccttata tgatgaaaga tgttcaccag ctaagtactg ccgaaatcgg 4560
aagtgtaatt attttccctg gaacaatgag tgtcattatt ttcggctaca ttggtgggat 4620
acttgttgat agaagaggtc ctttatacgt gttaaacatc ggagttacat ttctttctgt 4680
tagcttttta actgcttcct ttcttttaga aacaacatca tggttcatga caattataat 4740
cgtatttgtt ttaggtgggc tttcgttcac caaaacagtt atatcaacaa ttgtttcaag 4800
tagcttgaaa cagcaggaag ctggtgctgg aatgagtttg cttaacttta ccagcttttt 4860
atcagaggga acaggtattg caattgtagg tggtttatta tccataccct tacttgatca 4920
aaggttgtta cctatggaag ttgatcagtc aacttatctg tatagtaatt tgttattact 4980
tttttcagga atcattgtca ttagttggct ggttaccttg aatgtatata aacattctca 5040
aagggatttc taaatatgat gaagaaagac cattccaatc aggaatggtc tttttttatg 5100
cgcggcaaaa taaccaaaag cccgtcttat aaatttcttt gattacattt tataattaat 5160
tttaacaaag tgtcatcagc cctcaggaag gacttgctga cagtttgaat cgcataggta 5220
aggcggggat gaaatggcaa cgttatctga tgtagcaaag aaagcaaatg tgtcgaaaat 5280
gacggtatcg cgggtgatca atcatcctga gactgtgacg gatgaattga aaaagcttgt 5340
tcattccgca atgaaggagc tcaattatat accgaactat gcagcaagag cgctcgttca 5400
aaacagaaca caggtcgtca agctgctcat actggaagaa atggatacaa cagaacctta 5460
ttatatgaat ctgttaacgg gaatcagccg cgagctggac cgtcatcatt atgctttgca 5520
gcttgtcaca aggaaatctc tcaatatcgg ccagtgcgac ggcattattg cgacggggtt 5580
gagaaaagcc gattttgaag ggctcatcaa ggtttttgaa aagcctgtcg ttgtattcgg 5640
gcaaaatgaa atgggctacg attttattga tgttaacaat gaaaaaggaa cctatatggc 5700
aacacgtcac gtcattggtc tgggcgtccg caatgtcgtc ttttttggga tcgatttgga 5760
tgagcccttt gaacgctcaa gggaaaaagg ctatcttcag gcgatggaag gcagtctgaa 5820
aaaagcagcg attttccgga tggaaaacag ttcaaaaaaa agtgaagcac gcgcgcggga 5880
agtgcttgca tcctttgacg cacctgcagc ggttgtttgc gcttcggacc gaatcgcgct 5940
cggggttatc cgcgcggtgc aatcgcttgg taaaagaatt ccggaagatg tcgcggtcac 6000
cggctatgac ggggtgtttc tcgaccggat cgcttcgcct cgcctgacaa ccgtcagaca 6060
gcctgttgtt gaaatgggag aggcttgcgc gagaatcctg ctgaaaaaaa tcaatgaaga 6120
cggagcgccg caaggcaatc aattttttga gccggagctt attgtccgcg aatcgacttt 6180
gtagggtgtc tcattctgtt accgttaaca agctgaaaat gattgttcct gttaccgccg 6240
tcatgataat ttcagaataa aagccggttt atcacagccg gacaaccaaa agggggaaac 6300
atgatggaat atgcagcgat acatcatcag cctttcagct ctgatgccta ttcttacaat 6360
ggacggacat tgcacatcaa gatccgtaca aaaaaggatg atgccgaaca cgtccgcttg 6420
gtttggggcg atccttacga atacaccggc ggcacatgga aagcgaacga gcttgcgatg 6480
gcgaaaattg ccgcaacaag cacccatgat tactggtttg ccgaagtggc gcctccattc 6540
aggcgtctgc aatacggatt tatcctgaca ggcgctgatg atcgagacac tttttacgga 6600
agcaatggtg catgtccgtt tgccgggaaa gcggcggata taggcaaaca ctgttttaaa 6660
tttccgtttg ttcatgaggc agacacgttt gatgcacctg actgggtcaa atcaaccgtc 6720
tggtatcaaa tttttccgga gcgctttgcc agcgggcggg aagatttgtc tccggaaaac 6780
gctttgccat ggggaagcaa agatcctgag gcgcacgatt ttttcggagg ggatttgcag 6840
gggatcatgg acaagctgga ctatttggaa gacttggggg taggcggaat ctatttgacg 6900
ccgatctttg ccgcgccttc caaccataaa tacgacacat tggactattg ctccatcgat 6960
ccgcattttg gcgatgagga gctctttcgc acgctggtca gccggattca cgagcgggga 7020
atgaaaatca tgcttgatgc tgtttttaac cacattggca gcgcttcgca agagtggcag 7080
gatgttgtca aaaacggtga aacgtcccgc tataaagact ggttccatat tcattctttc 7140
cctgttaaag aaggcagcta tgatacattt gc 7172
<210> 41
<211> 193
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 41
taagaaaagt gattctggga gagccgggat cactttttta tttaccttat gcccgaaatg 60
aaagctttat gacctaattg tgtaactata tcctattttt tcaaaaaata ttttaaaaac 120
gagcaggatt tcagaaaaaa tcgtggaatt gatacactaa tgcttttata tagggaaaag 180
gtggtgaact act 193
<210> 42
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 42
cgcttcttga aaacgaggtg 20
<210> 43
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 43
gctcatccaa atcgatccca 20
<210> 44
<211> 4595
<212> DNA
<213> 人工序列
<220>
<223> pcr产物
<400> 44
cgcttcttga aaacgaggtg gaattttatt ttgagaaaaa acaaaccggt cttgaacagt 60
ctgtaaaaat aaaaaaagaa tgggtaaaag atattttaaa agaccgatat caggatatga 120
aaaagaatcg tcttcaggcc aaacctgatc aggagcctgt tccgcttccg aagcaagcga 180
aaattaatcc cgatgaaaaa gtgattgccc tcacatttga tgacggtccg aatcccgcta 240
caacgaataa aatattaaac gctttacaga agcatgaagg gcatgcgacc ttctttgtgc 300
ttggaagcag agcccaatat tatcccgaaa cgataaaacg gatgctgaag gaaggaaacg 360
aagtcggcaa ccattcctgg gaccatccgt tattgacaag gctgtcaaac gaaaaagcgt 420
atcaggagat taacgacacg caagaaatga tcgaaaaaat cagcggacac ctgcctgtac 480
acttgcgtcc tccatacggc gggatcaatg attccgtccg ctcgctttcc aatctgaagg 540
tttcattgtg ggatgttgat ccggaagatt ggaagtacaa aaataagcaa aagattgtca 600
atcatgtcat gagccatgcg ggagacggaa aaatcgtctt aatgcacgat atttatgcaa 660
cgtccgcaga tgctgctgaa gagattatta aaaagctgaa agcaaaaggc tatcaattgg 720
taactgtatc tcagcttgaa gaagtgaaga agcagagagg ctattgaata aatgagtaga 780
aagcgccata tcggctaaat ccttgacgag caagggattg acgctttaaa atgcttgata 840
tggcttttta tatgtgttac tctacataca gaaattcttc actttgttgg acaaacattc 900
ctcagagtgc agtttttctt aaaaagccgt ttaattgtct ttctcttact tgctctcatt 960
tttttctgag acaggtttag aatcagactg aactgtgaag aaatgataat aaacgaactg 1020
aatgtatcct aatgctttta tatagggaaa aggtggtgaa ctactttggc tcatacaaaa 1080
tcaaaggcag tattgatctt atacactgtt tgcttcagtg cattttttgc atctttaagc 1140
cagaacattt attcacctat tcttccgatc attaaagaat cattccatgt ttccacagct 1200
atggtgaacc tgtcagtctc agtttttatg attgtgacag caataatgca aattatatta 1260
ggagcgatca ttgattttaa aggcgctcgg atcgtcttga ttaccggtat tctggcaacg 1320
gcagcagcca gcatcggctg tgcggtgact actgacttta ccttgtttct gatattcaga 1380
atgatacagg cagccggttc cgcagcactg cctcttattg ctgccacaac gatcggacag 1440
ctgtttacag gaaatgaacg cgggagtgca atgggaacgt atcaaatgct cctgtctgtc 1500
gcaccggcta ttgctccagt tctaggagga ttcataggcg gagcagccgg atacgaaggg 1560
attttttgga tacttgcggc catctctatc gttttgctgg tgacaaacag catcaccttt 1620
cctaaagatt ctccaactga atctatgcag caagccaaag gcaatgtgtt cgctcattat 1680
aaatcaatat ttacaaatcg aacagggaac gtcattttga ctttaagttt tgttctcttt 1740
ttcatttatt ttgcagtaat tgtctacctc ccaatattgc tgacagagca ttaccatata 1800
gatgtgggta tagcaggact gttatatttg ccgctggcgc tgagcacgat tgcaggtacg 1860
tttctgttta aaagaataca ggcaaaaatc gggctgcaca ccttgtttat cggaagcaat 1920
gtgattgccg cctgcagcat cattttattt gctgttacac attccgtttc tctcgttctc 1980
atggctctga cgctggcact gtttggcatc tcgatggggg ttattcctcc cttgtactct 2040
acaatgatta ctaatgaatt tgagcacaac agagggagtg caatcggaat gtttaacttt 2100
atccgatata caggcatggc agcaggtccg atggtatctg cctacttgct cacaatgatg 2160
ccgtctgcca tgtcctttag cctcctaggc cttggatttg ccgcattgag cttttgcctt 2220
cttccgccaa tgttttcgcc gcagaagcgc acgaaacaaa aaaagcacca catgtaaaaa 2280
agctgccttt gcgggcagct tttttagttc aacaaacggg ccatattgtt gtataagtga 2340
tgaaatactg aatttaaaac ttagtttata tgtggtaaaa tgttttaatc aagtttagga 2400
ggaattaatt atgaagtgta atgaatgtaa cagggttcaa ttaaaagagg gaagcgtatc 2460
attaacccta taaactacgt ctgccctcat tattggaggg tgaaatgtga atacatccta 2520
ttcacaatcg aatttacgac acaaccaaat tttaatttgg ctttgcattt tatctttttt 2580
tagcgtatta aatgaaatgg ttttgaacgt ctcattacct gatattgcaa atgattttaa 2640
taaaccacct gcgagtacaa actgggtgaa cacagccttt atgttaacct tttccattgg 2700
aacagctgta tatggaaagc tatctgatca attaggcatc aaaaggttac tcctatttgg 2760
aattataata aattgtttcg ggtcggtaat tgggtttgtt ggccattctt tcttttcctt 2820
acttattatg gctcgtttta ttcaaggggc tggtgcagct gcatttccag cactcgtaat 2880
ggttgtagtt gcgcgctata ttccaaagga aaataggggt aaagcatttg gtcttattgg 2940
atcgatagta gccatgggag aaggagtcgg tccagcgatt ggtggaatga tagcccatta 3000
tattcattgg tcctatcttc tactcattcc tatgataaca attatcactg ttccgtttct 3060
tatgaaatta ttaaagaaag aagtaaggat aaaaggtcat tttgatatca aaggaattat 3120
actaatgtct gtaggcattg tattttttat gttgtttaca acatcatata gcatttcttt 3180
tcttatcgtt agcgtgctgt cattcctgat atttgtaaaa catatcagga aagtaacaga 3240
tccttttgtt gatcccggat tagggaaaaa tatacctttt atgattggag ttctttgtgg 3300
gggaattata tttggaacag tagcagggtt tgtctctatg gttccttata tgatgaaaga 3360
tgttcaccag ctaagtactg ccgaaatcgg aagtgtaatt attttccctg gaacaatgag 3420
tgtcattatt ttcggctaca ttggtgggat acttgttgat agaagaggtc ctttatacgt 3480
gttaaacatc ggagttacat ttctttctgt tagcttttta actgcttcct ttcttttaga 3540
aacaacatca tggttcatga caattataat cgtatttgtt ttaggtgggc tttcgttcac 3600
caaaacagtt atatcaacaa ttgtttcaag tagcttgaaa cagcaggaag ctggtgctgg 3660
aatgagtttg cttaacttta ccagcttttt atcagaggga acaggtattg caattgtagg 3720
tggtttatta tccataccct tacttgatca aaggttgtta cctatggaag ttgatcagtc 3780
aacttatctg tatagtaatt tgttattact tttttcagga atcattgtca ttagttggct 3840
ggttaccttg aatgtatata aacattctca aagggatttc taaatatgat gaagaaagac 3900
cattccaatc aggaatggtc tttttttatg cgcggcaaaa taaccaaaag cccgtcttat 3960
aaatttcttt gattacattt tataattaat tttaacaaag tgtcatcagc cctcaggaag 4020
gacttgctga cagtttgaat cgcataggta aggcggggat gaaatggcaa cgttatctga 4080
tgtagcaaag aaagcaaatg tgtcgaaaat gacggtatcg cgggtgatca atcatcctga 4140
gactgtgacg gatgaattga aaaagcttgt tcattccgca atgaaggagc tcaattatat 4200
accgaactat gcagcaagag cgctcgttca aaacagaaca caggtcgtca agctgctcat 4260
actggaagaa atggatacaa cagaacctta ttatatgaat ctgttaacgg gaatcagccg 4320
cgagctggac cgtcatcatt atgctttgca gcttgtcaca aggaaatctc tcaatatcgg 4380
ccagtgcgac ggcattattg cgacggggtt gagaaaagcc gattttgaag ggctcatcaa 4440
ggtttttgaa aagcctgtcg ttgtattcgg gcaaaatgaa atgggctacg attttattga 4500
tgttaacaat gaaaaaggaa cctatatggc aacacgtcac gtcattggtc tgggcgtccg 4560
caatgtcgtc ttttttggga tcgatttgga tgagc 4595
<210> 45
<211> 4518
<212> DNA
<213> 人工序列
<220>
<223> pcr产物
<400> 45
cgcttcttga aaacgaggtg gaattttatt ttgagaaaaa acaaaccggt cttgaacagt 60
ctgtaaaaat aaaaaaagaa tgggtaaaag atattttaaa agaccgatat caggatatga 120
aaaagaatcg tcttcaggcc aaacctgatc aggagcctgt tccgcttccg aagcaagcga 180
aaattaatcc cgatgaaaaa gtgattgccc tcacatttga tgacggtccg aatcccgcta 240
caacgaataa aatattaaac gctttacaga agcatgaagg gcatgcgacc ttctttgtgc 300
ttggaagcag agcccaatat tatcccgaaa cgataaaacg gatgctgaag gaaggaaacg 360
aagtcggcaa ccattcctgg gaccatccgt tattgacaag gctgtcaaac gaaaaagcgt 420
atcaggagat taacgacacg caagaaatga tcgaaaaaat cagcggacac ctgcctgtac 480
acttgcgtcc tccatacggc gggatcaatg attccgtccg ctcgctttcc aatctgaagg 540
tttcattgtg ggatgttgat ccggaagatt ggaagtacaa aaataagcaa aagattgtca 600
atcatgtcat gagccatgcg ggagacggaa aaatcgtctt aatgcacgat atttatgcaa 660
cgtccgcaga tgctgctgaa gagattatta aaaagctgaa agcaaaaggc tatcaattgg 720
taactgtatc tcagcttgaa gaagtgaaga agcagagagg ctattgaata aatgagtaga 780
aagcgccata tcggctaaga aaagtgattc tgggagagcc gggatcactt ttttatttac 840
cttatgcccg aaatgaaagc tttatgacct aattgtgtaa ctatatccta ttttttcaaa 900
aaatatttta aaaacgagca ggatttcaga aaaaatcgtg gaattgatac actaatgctt 960
ttatataggg aaaaggtggt gaactacttt ggctcataca aaatcaaagg cagtattgat 1020
cttatacact gtttgcttca gtgcattttt tgcatcttta agccagaaca tttattcacc 1080
tattcttccg atcattaaag aatcattcca tgtttccaca gctatggtga acctgtcagt 1140
ctcagttttt atgattgtga cagcaataat gcaaattata ttaggagcga tcattgattt 1200
taaaggcgct cggatcgtct tgattaccgg tattctggca acggcagcag ccagcatcgg 1260
ctgtgcggtg actactgact ttaccttgtt tctgatattc agaatgatac aggcagccgg 1320
ttccgcagca ctgcctctta ttgctgccac aacgatcgga cagctgttta caggaaatga 1380
acgcgggagt gcaatgggaa cgtatcaaat gctcctgtct gtcgcaccgg ctattgctcc 1440
agttctagga ggattcatag gcggagcagc cggatacgaa gggatttttt ggatacttgc 1500
ggccatctct atcgttttgc tggtgacaaa cagcatcacc tttcctaaag attctccaac 1560
tgaatctatg cagcaagcca aaggcaatgt gttcgctcat tataaatcaa tatttacaaa 1620
tcgaacaggg aacgtcattt tgactttaag ttttgttctc tttttcattt attttgcagt 1680
aattgtctac ctcccaatat tgctgacaga gcattaccat atagatgtgg gtatagcagg 1740
actgttatat ttgccgctgg cgctgagcac gattgcaggt acgtttctgt ttaaaagaat 1800
acaggcaaaa atcgggctgc acaccttgtt tatcggaagc aatgtgattg ccgcctgcag 1860
catcatttta tttgctgtta cacattccgt ttctctcgtt ctcatggctc tgacgctggc 1920
actgtttggc atctcgatgg gggttattcc tcccttgtac tctacaatga ttactaatga 1980
atttgagcac aacagaggga gtgcaatcgg aatgtttaac tttatccgat atacaggcat 2040
ggcagcaggt ccgatggtat ctgcctactt gctcacaatg atgccgtctg ccatgtcctt 2100
tagcctccta ggccttggat ttgccgcatt gagcttttgc cttcttccgc caatgttttc 2160
gccgcagaag cgcacgaaac aaaaaaagca ccacatgtaa aaaagctgcc tttgcgggca 2220
gcttttttag ttcaacaaac gggccatatt gttgtataag tgatgaaata ctgaatttaa 2280
aacttagttt atatgtggta aaatgtttta atcaagttta ggaggaatta attatgaagt 2340
gtaatgaatg taacagggtt caattaaaag agggaagcgt atcattaacc ctataaacta 2400
cgtctgccct cattattgga gggtgaaatg tgaatacatc ctattcacaa tcgaatttac 2460
gacacaacca aattttaatt tggctttgca ttttatcttt ttttagcgta ttaaatgaaa 2520
tggttttgaa cgtctcatta cctgatattg caaatgattt taataaacca cctgcgagta 2580
caaactgggt gaacacagcc tttatgttaa ccttttccat tggaacagct gtatatggaa 2640
agctatctga tcaattaggc atcaaaaggt tactcctatt tggaattata ataaattgtt 2700
tcgggtcggt aattgggttt gttggccatt ctttcttttc cttacttatt atggctcgtt 2760
ttattcaagg ggctggtgca gctgcatttc cagcactcgt aatggttgta gttgcgcgct 2820
atattccaaa ggaaaatagg ggtaaagcat ttggtcttat tggatcgata gtagccatgg 2880
gagaaggagt cggtccagcg attggtggaa tgatagccca ttatattcat tggtcctatc 2940
ttctactcat tcctatgata acaattatca ctgttccgtt tcttatgaaa ttattaaaga 3000
aagaagtaag gataaaaggt cattttgata tcaaaggaat tatactaatg tctgtaggca 3060
ttgtattttt tatgttgttt acaacatcat atagcatttc ttttcttatc gttagcgtgc 3120
tgtcattcct gatatttgta aaacatatca ggaaagtaac agatcctttt gttgatcccg 3180
gattagggaa aaatatacct tttatgattg gagttctttg tgggggaatt atatttggaa 3240
cagtagcagg gtttgtctct atggttcctt atatgatgaa agatgttcac cagctaagta 3300
ctgccgaaat cggaagtgta attattttcc ctggaacaat gagtgtcatt attttcggct 3360
acattggtgg gatacttgtt gatagaagag gtcctttata cgtgttaaac atcggagtta 3420
catttctttc tgttagcttt ttaactgctt cctttctttt agaaacaaca tcatggttca 3480
tgacaattat aatcgtattt gttttaggtg ggctttcgtt caccaaaaca gttatatcaa 3540
caattgtttc aagtagcttg aaacagcagg aagctggtgc tggaatgagt ttgcttaact 3600
ttaccagctt tttatcagag ggaacaggta ttgcaattgt aggtggttta ttatccatac 3660
ccttacttga tcaaaggttg ttacctatgg aagttgatca gtcaacttat ctgtatagta 3720
atttgttatt acttttttca ggaatcattg tcattagttg gctggttacc ttgaatgtat 3780
ataaacattc tcaaagggat ttctaaatat gatgaagaaa gaccattcca atcaggaatg 3840
gtcttttttt atgcgcggca aaataaccaa aagcccgtct tataaatttc tttgattaca 3900
ttttataatt aattttaaca aagtgtcatc agccctcagg aaggacttgc tgacagtttg 3960
aatcgcatag gtaaggcggg gatgaaatgg caacgttatc tgatgtagca aagaaagcaa 4020
atgtgtcgaa aatgacggta tcgcgggtga tcaatcatcc tgagactgtg acggatgaat 4080
tgaaaaagct tgttcattcc gcaatgaagg agctcaatta tataccgaac tatgcagcaa 4140
gagcgctcgt tcaaaacaga acacaggtcg tcaagctgct catactggaa gaaatggata 4200
caacagaacc ttattatatg aatctgttaa cgggaatcag ccgcgagctg gaccgtcatc 4260
attatgcttt gcagcttgtc acaaggaaat ctctcaatat cggccagtgc gacggcatta 4320
ttgcgacggg gttgagaaaa gccgattttg aagggctcat caaggttttt gaaaagcctg 4380
tcgttgtatt cgggcaaaat gaaatgggct acgattttat tgatgttaac aatgaaaaag 4440
gaacctatat ggcaacacgt cacgtcattg gtctgggcgt ccgcaatgtc gtcttttttg 4500
ggatcgattt ggatgagc 4518
<210> 46
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 46
gcagatgctg ctgaagagat 20
<210> 47
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 47
gctccagttc taggaggatt 20
<210> 48
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 48
gggttaatga tacgcttccc 20

Claims (31)

1.一种衍生自亲本芽孢杆菌属细胞的经修饰的芽孢杆菌属细胞,其中所述经修饰的细胞包含引入的编码功能性YvmA蛋白的yvmA表达盒,其中当在相同条件下培养时,所述经修饰的细胞相对于所述亲本细胞在红色素的产生方面有缺陷。
2.一种衍生自亲本芽孢杆菌属细胞的经修饰的芽孢杆菌属细胞,所述亲本芽孢杆菌属细胞包含编码功能性YvmA蛋白的yvmA基因,其中所述经修饰的细胞包含用异源启动子替代所述yvmA基因的天然启动子的遗传修饰,所述异源启动子能够相对于所述yvmA基因的天然启动子增加所述yvmA基因的表达,其中当在相同条件下培养时,所述经修饰的细胞相对于所述亲本细胞在红色素的产生方面有缺陷。
3.如权利要求1所述的芽孢杆菌属细胞,其中所述引入的表达盒包含编码功能性YvmA蛋白的可读框(ORF)序列,所述功能性YvmA蛋白与SEQ ID NO:30的枯草芽孢杆菌YvmA蛋白或其芽孢杆菌属物种YvmA同源物具有至少85%的序列同一性。
4.如权利要求1所述的芽孢杆菌属细胞,其中所述引入的表达盒包含可读框(ORF)序列,所述序列与SEQ ID NO:37的枯草芽孢杆菌yvmA ORF或其芽孢杆菌属物种yvmA同源物具有至少90%的序列同一性,其编码功能性YvmA蛋白。
5.如权利要求2所述的芽孢杆菌属细胞,其中所述编码功能性YvmA蛋白的yvmA基因包含可读框(ORF)序列,所述序列与SEQ ID NO:30的枯草芽孢杆菌YvmA蛋白或其芽孢杆菌属物种YvmA同源物具有至少85%的序列同一性。
6.如权利要求2所述的芽孢杆菌属细胞,其中所述编码功能性YvmA蛋白的yvmA基因包含可读框(ORF)序列,所述序列与SEQ ID NO:37的枯草芽孢杆菌yvmA ORF或其芽孢杆菌属物种yvmA同源物具有至少90%的序列同一性,其编码功能性YvmA蛋白。
7.如权利要求1或权利要求2所述的芽孢杆菌属细胞,其中所述经修饰的细胞相对于所述亲本细胞具有等效或增强的生长速率。
8.一种经修饰的芽孢杆菌属细胞,其衍生自产生目的蛋白(POI)的亲本芽孢杆菌属细胞,其中所述经修饰的细胞包含引入的编码功能性YvmA蛋白的yvmA表达盒,其中当在相同条件下发酵时,所述经修饰的细胞相对于所述亲本细胞在红色素的产生方面有缺陷。
9.一种经修饰的芽孢杆菌属细胞,其衍生自产生目的蛋白(POI)并包含编码功能性YvmA蛋白的yvmA基因的亲本芽孢杆菌属细胞,其中所述经修饰的细胞包含用异源启动子替代所述yvmA基因的天然启动子的遗传修饰,所述异源启动子能够相对于所述yvmA基因的天然启动子增加所述yvmA基因的表达,其中当在相同条件下发酵时,所述经修饰的细胞相对于所述亲本细胞在红色素的产生方面有缺陷。
10.如权利要求8或权利要求9所述的芽孢杆菌属细胞,其中所述POI是内源POI或异源POI。
11.如权利要求8或权利要求9所述的芽孢杆菌属细胞,其中所述POI是酶。
12.如权利要求8所述的芽孢杆菌属细胞,其中所述引入的表达盒包含编码功能性YvmA蛋白的可读框(ORF)序列,所述功能性YvmA蛋白与SEQ ID NO:30的枯草芽孢杆菌YvmA蛋白或其芽孢杆菌属物种YvmA同源物具有至少85%的序列同一性。
13.如权利要求8所述的芽孢杆菌属细胞,其中所述引入的表达盒包含ORF序列,所述序列与SEQ ID NO:37的枯草芽孢杆菌yvmA ORF或其芽孢杆菌属物种yvmA同源物具有至少90%的序列同一性,其编码功能性YvmA蛋白。
14.如权利要求9所述的芽孢杆菌属细胞,其中所述编码功能性YvmA蛋白的yvmA基因包含可读框(ORF)序列,所述序列与SEQ ID NO:30的枯草芽孢杆菌YvmA蛋白或其芽孢杆菌属物种YvmA同源物具有至少85%的序列同一性。
15.如权利要求9所述的芽孢杆菌属细胞,其中所述编码功能性YvmA蛋白的yvmA基因包含可读框(ORF)序列,所述序列与SEQ ID NO:37的枯草芽孢杆菌yvmA ORF或其芽孢杆菌属物种yvmA同源物具有至少90%的序列同一性,其编码功能性YvmA蛋白。
16.如权利要求8或权利要求9所述的芽孢杆菌属细胞,其中所述经修饰的细胞相对于所述亲本细胞具有等效或增强的生长速率。
17.如权利要求8或权利要求9所述的芽孢杆菌属细胞,其中所述经修饰的细胞相对于所述亲本细胞产生等效或增加量的所述POI。
18.一种分离的目的蛋白(POI),其由如权利要求8或权利要求9所述的经修饰的芽孢杆菌属细胞产生。
19.如权利要求18所述的分离的POI,其不包含可观察到的红色素。
20.一种用于培养在红色素的产生方面有缺陷的芽孢杆菌属细胞的方法,所述方法包括:
(a)通过在亲本芽孢杆菌属细胞中引入编码功能性YvmA蛋白的表达盒来修饰所述亲本芽孢杆菌属细胞,和
(b)在合适的条件下培养所述经修饰的细胞,
其中当在相同条件下培养时,所述经修饰的细胞相对于所述亲本细胞在红色素的产生方面有缺陷。
21.一种用于培养在红色素的产生方面有缺陷的芽孢杆菌属细胞的方法,所述方法包括:
(a)获得包含编码功能性YvmA蛋白的yvmA基因的亲本芽孢杆菌属细胞,并用相对于所述yvmA基因的天然启动子能够增加所述yvmA基因表达的异源启动子替代所述yvmA基因的天然启动子,和
(b)在合适的条件下培养所述经修饰的细胞,
其中当在相同条件下培养时,所述经修饰的细胞相对于所述亲本细胞在红色素的产生方面有缺陷。
22.一种用于产生内源目的蛋白(POI)的方法,所述方法包括:
(a)通过在产生内源POI的亲本芽孢杆菌属细胞中引入编码功能性YvmA蛋白的表达盒来修饰所述细胞,和
(b)在适于产生所述POI的条件下发酵所述经修饰的细胞,
其中当在相同条件下发酵时,所述经修饰的细胞相对于所述亲本细胞在红色素的产生方面有缺陷。
23.一种用于产生内源目的蛋白(POI)的方法,所述方法包括:
(a)获得产生内源POI并包含编码功能性YvmA蛋白的yvmA基因的亲本芽孢杆菌属细胞,并通过用相对于所述yvmA基因的天然启动子能够增加所述yvmA基因表达的异源启动子替代所述yvmA基因的天然启动子来修饰所述细胞,和
(c)在适于产生所述POI的条件下发酵所述经修饰的细胞,
其中当在相同条件下发酵时,所述经修饰的细胞相对于所述亲本细胞在红色素的产生方面有缺陷。
24.一种用于产生异源目的蛋白(POI)的方法,所述方法包括:
(a)通过在亲本芽孢杆菌属细胞中引入(i)编码异源POI的表达盒和(ii)编码功能性YvmA蛋白的表达盒来修饰所述亲本芽孢杆菌属细胞,和
(b)在适于产生所述POI的条件下发酵所述经修饰的细胞,
其中当在相同条件下发酵时,所述经修饰的细胞相对于所述亲本细胞在红色素的产生方面有缺陷。
25.一种用于产生异源目的蛋白(POI)的方法,所述方法包括:
(a)获得包含编码功能性YvmA蛋白的yvmA基因的亲本芽孢杆菌属细胞,并通过(i)在所述细胞中引入编码异源POI的表达盒和(ii)用相对于所述yvmA基因的天然启动子能够增加所述yvmA基因表达的异源启动子替代所述yvmA基因的天然启动子来修饰所述细胞,和
(b)在适于产生所述POI的条件下发酵所述经修饰的细胞,
其中当在相同条件下发酵时,所述经修饰的细胞相对于所述亲本细胞在红色素的产生方面有缺陷。
26.如权利要求22-25中任一项所述的方法,其中所述POI是酶。
27.如权利要求20、22或24中任一项所述的方法,其中所述引入的表达盒包含编码功能性YvmA蛋白的可读框(ORF)序列,所述功能性YvmA蛋白与SEQ ID NO:30的枯草芽孢杆菌YvmA蛋白或其芽孢杆菌属物种YvmA同源物具有至少85%的序列同一性。
28.如权利要求20、22或24中任一项所述的方法,其中所述引入的表达盒包含ORF序列,所述序列与SEQ ID NO:37的枯草芽孢杆菌yvmA ORF或其芽孢杆菌属物种yvmA同源物具有至少90%的序列同一性,其编码功能性YvmA蛋白。
29.如权利要求20-25中任一项所述的方法,其中所述经修饰的细胞相对于衍生其的所述亲本细胞具有等效或增强的生长速率。
30.如权利要求22-25中任一项所述的方法,其中所述经修饰的细胞相对于衍生其的所述亲本细胞产生等效或增加量的所述POI。
31.一种分离的目的蛋白(POI),其通过如权利要求22-25中任一项所述的方法产生。
CN202280015356.5A 2021-02-22 2022-02-22 在色素缺陷型芽孢杆菌属细胞中产生目的蛋白的方法和组合物 Pending CN116897160A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163151931P 2021-02-22 2021-02-22
US63/151,931 2021-02-22
PCT/US2022/017339 WO2022178432A1 (en) 2021-02-22 2022-02-22 Methods and compositions for producing proteins of interest in pigment deficient bacillus cells

Publications (1)

Publication Number Publication Date
CN116897160A true CN116897160A (zh) 2023-10-17

Family

ID=81328469

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280015356.5A Pending CN116897160A (zh) 2021-02-22 2022-02-22 在色素缺陷型芽孢杆菌属细胞中产生目的蛋白的方法和组合物

Country Status (4)

Country Link
US (1) US20240101611A1 (zh)
EP (1) EP4294823A1 (zh)
CN (1) CN116897160A (zh)
WO (1) WO2022178432A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023137264A1 (en) * 2022-01-13 2023-07-20 Danisco Us Inc. Compositions and methods for enhanced protein production in gram‑positive bacterial cells

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5972682A (en) 1984-05-29 1999-10-26 Genencor International, Inc. Enzymatically active modified subtilisins
EP0283075B1 (en) 1987-02-27 1999-05-12 Genencor International, Inc. Molecular cloning and expression of genes encoding proteolytic enzymes
DE3909096A1 (de) 1989-03-20 1990-09-27 Garabed Antranikian Alpha-amylase
CA2155831C (en) 1993-02-11 2009-11-10 Richard L. Antrim Oxidatively stable alpha-amylase
US6190892B1 (en) 1995-11-20 2001-02-20 Genencor International, Inc. Microbial production of indigo
KR20010015754A (ko) 1997-10-13 2001-02-26 한센 핀 베네드, 안네 제헤르, 웨이콥 마리안느 α-아밀라제 변이체
CN103352033B (zh) 1998-02-27 2016-05-11 诺维信公司 麦芽α淀粉酶变体
US6197565B1 (en) 1998-11-16 2001-03-06 Novo-Nordisk A/S α-Amylase variants
DK1818396T3 (da) 1999-03-30 2014-08-11 Novozymes As Alpha-amylase varianter
US6509185B1 (en) 2000-01-07 2003-01-21 Genencor International, Inc. Mutant aprE promotor
CA2418317A1 (en) 2000-08-11 2002-02-21 Genencor International, Inc. Bacillus transformation, transformants and mutant libraries
DE10162727A1 (de) 2001-12-20 2003-07-10 Henkel Kgaa Neue Alkalische Protease aus Bacillus gibsonii (DSM 14391) und Wasch-und Reinigungsmittel enthaltend diese neue Alkalische Protease
US7811806B2 (en) * 2001-12-21 2010-10-12 Novozymes, Inc. Methods for producing hyaluronan in a recombinant host cell
EP2341070A3 (en) 2002-03-29 2011-10-19 Genencor International, Inc. Ehanced protein expression in bacillus
CA2483006C (en) 2002-04-22 2013-10-29 Genencor International, Inc. Methods of creating modified promoters resulting in varying levels of gene expression
AU2003254196A1 (en) 2002-07-26 2004-02-16 Novozymes Biotech, Inc. Methods for producing biological substances in pigment-deficient mutants of bacillus cells
DE102004047776B4 (de) 2004-10-01 2018-05-09 Basf Se Gegen Di- und/oder Multimerisierung stabilisierte Alpha-Amylase-Varianten, Verfahren zu deren Herstellung sowie deren Verwendung
DE102004047777B4 (de) 2004-10-01 2018-05-09 Basf Se Alpha-Amylase-Varianten mit erhöhter Lösungsmittelstabilität, Verfahren zu deren Herstellung sowie deren Verwendung
WO2006089107A1 (en) 2005-02-18 2006-08-24 Genencor International, Inc. Polypeptides having alpha-amylase and granular starch hydrolyzing activity
DE102006022224A1 (de) 2006-05-11 2007-11-15 Henkel Kgaa Subtilisin aus Bacillus pumilus und Wasch- und Reinigungsmittel enthaltend dieses neue Subtilisin
BRPI0808513A2 (pt) 2007-03-09 2014-08-19 Danisco Us Inc Genencor Div Variantes de alfa-amilase de espécies de bacillus alcalifílico, composições compreendendo variantes de alfa-amilase e métodos de uso
EP2205732A2 (en) 2007-11-01 2010-07-14 Danisco US Inc. Production of thermolysin and variants thereof and use in liquid detergents
MX2011004801A (es) 2008-11-11 2011-06-16 Danisco Inc Composiciones y metodos que comprenden una variante de subtilisina.
ES2694398T3 (es) 2010-05-06 2018-12-20 Danisco Us Inc. Composiciones y métodos que comprenden variantes de subtilisina
AR086281A1 (es) 2011-05-05 2013-12-04 Danisco Us Inc Composiciones y metodos que comprenden variantes de serina proteasas
CN110777132B (zh) 2013-03-11 2024-03-22 丹尼斯科美国公司 α-淀粉酶组合变体
US9926550B2 (en) 2013-07-29 2018-03-27 Novozymes A/S Protease variants and polynucleotides encoding same
WO2015089447A1 (en) 2013-12-13 2015-06-18 Danisco Us Inc. Serine proteases of the bacillus gibsonii-clade
US20180112204A1 (en) 2015-05-13 2018-04-26 Danisco Us Inc. AprL-CLADE PROTEASE VARIANTS AND USES THEREOF
WO2018136459A1 (en) 2017-01-23 2018-07-26 Danisco Us Inc. Methods and compositions for obtaining natural competence in bacillus host cells
JP7231228B2 (ja) 2017-02-24 2023-03-01 ダニスコ・ユーエス・インク バチルス・リケニフォルミスにおける増加したタンパク質産生のための組成物及び方法
WO2020242858A1 (en) 2019-05-24 2020-12-03 Danisco Us Inc Subtilisin variants and methods of use

Also Published As

Publication number Publication date
US20240101611A1 (en) 2024-03-28
EP4294823A1 (en) 2023-12-27
WO2022178432A1 (en) 2022-08-25

Similar Documents

Publication Publication Date Title
KR102375732B1 (ko) 바실러스 리체니포르미스에서 단백질 생산을 증가시키기 위한 조성물 및 방법
US11781147B2 (en) Promoter sequences and methods thereof for enhanced protein production in Bacillus cells
CN111094576A (zh) 用于增加芽胞杆菌属中蛋白质产生的经修饰的5′-非翻译区(utr)序列
EP3735478B1 (en) Mutant and genetically modified bacillus cells and methods thereof for increased protein production
WO2021146411A1 (en) Compositions and methods for enhanced protein production in bacillus licheniformis
CN116897160A (zh) 在色素缺陷型芽孢杆菌属细胞中产生目的蛋白的方法和组合物
WO2023023642A2 (en) Methods and compositions for enhanced protein production in bacillus cells
US20220282234A1 (en) Compositions and methods for increased protein production in bacillus lichenformis
US20220389372A1 (en) Compositions and methods for enhanced protein production in bacillus cells
WO2024040043A1 (en) Expression systems for phosphatases
WO2023192953A1 (en) Pro-region mutations enhancing protein production in gram-positive bacterial cells
WO2023091878A1 (en) Compositions and methods for enhanced protein production in bacillus cells
CN117769597A (zh) 用于增强芽孢杆菌属细胞中蛋白质产生的组合物和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination