CN115605496A - O-磷酸丝氨酸输出蛋白变体和利用其生产o-磷酸丝氨酸、半胱氨酸及其衍生物的方法 - Google Patents

O-磷酸丝氨酸输出蛋白变体和利用其生产o-磷酸丝氨酸、半胱氨酸及其衍生物的方法 Download PDF

Info

Publication number
CN115605496A
CN115605496A CN202180007420.0A CN202180007420A CN115605496A CN 115605496 A CN115605496 A CN 115605496A CN 202180007420 A CN202180007420 A CN 202180007420A CN 115605496 A CN115605496 A CN 115605496A
Authority
CN
China
Prior art keywords
amino acid
leu
ala
polypeptide
gly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180007420.0A
Other languages
English (en)
Inventor
朴慧珉
金昭延
沈熙陈
李珍南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CJ CheilJedang Corp
Original Assignee
CJ CheilJedang Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CJ CheilJedang Corp filed Critical CJ CheilJedang Corp
Publication of CN115605496A publication Critical patent/CN115605496A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/24Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
    • C07K14/245Escherichia (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1096Transferases (2.) transferring nitrogenous groups (2.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/04Alpha- or beta- amino acids
    • C12P13/06Alanine; Leucine; Isoleucine; Serine; Homoserine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/04Alpha- or beta- amino acids
    • C12P13/12Methionine; Cysteine; Cystine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/03Phosphoric monoester hydrolases (3.1.3)
    • C12Y301/03003Phosphoserine phosphatase (3.1.3.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/01095Phosphoglycerate dehydrogenase (1.1.1.95)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y205/00Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
    • C12Y205/01Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)
    • C12Y205/01065O-Phosphoserine sulfhydrylase (2.5.1.65)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y206/00Transferases transferring nitrogenous groups (2.6)
    • C12Y206/01Transaminases (2.6.1)
    • C12Y206/01052Phosphoserine transaminase (2.6.1.52)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本申请涉及O‑磷酸丝氨酸(OPS)输出蛋白变体,以及使用其生产O‑磷酸丝氨酸、半胱氨酸和半胱氨酸衍生物的方法。

Description

O-磷酸丝氨酸输出蛋白变体和利用其生产O-磷酸丝氨酸、半 胱氨酸及其衍生物的方法
技术领域
本申请涉及O-磷酸丝氨酸(OPS)输出蛋白变体,以及使用其生产O-磷酸丝氨酸、半胱氨酸、和半胱氨酸衍生物的方法。
背景技术
L-半胱氨酸,一种在所有活生物体的硫代谢中起重要作用的氨基酸,不仅用于合成生物蛋白质如毛发角蛋白、谷胱甘肽、生物素、甲硫氨酸和其它含硫代谢物,而且还用作辅酶A生物合成的前体。
使用本领域已知的微生物生产L-半胱氨酸的方法包括:1)利用微生物将D,L-2-氨基噻唑啉-4-羧酸(D,L-ATC)生物转化为L-半胱氨酸的方法,2)利用大肠杆菌(E.coli)通过直接发酵生产L-半胱氨酸的方法(US 5972663 A;Wada M和Takagi H,Appl.Microbiol.Biochem.,73:48–54,2006),和3)利用微生物通过发酵生产O-磷酸丝氨酸(下文的“OPS”),然后在O-磷酸丝氨酸硫化氢解酶(以下称为“OPSS”)的催化作用下通过使O-磷酸丝氨酸与硫化物(硫基团,sulfide)反应将O-磷酸丝氨酸转化为L-半胱氨酸的方法(US 8557549B2)。
具体地,为了通过方法3)以高产率生产半胱氨酸,应过量生产OPS前体。
发明内容
[技术问题]
本发明人通过以下完成本申请:确定能够将OPS生产菌株中生产的OPS顺利地输出到细胞外的输出因子的活性提高的变体,并证实OPS输出因所述变体而得到改善。
[技术方案]
本申请的一个目的是提供具有O-磷酸丝氨酸(OPS)输出活性的多肽。
本申请的另一个目的是提供编码本申请的多肽的多核苷酸。
本申请的再另一个目的是提供含有本申请的多核苷酸的载体。
本申请的再另一个目的是提供生产O-磷酸丝氨酸的微生物,所述微生物包含本申请的多肽、多核苷酸、和载体中的任意一种或多种。
本申请的再另一个目的是提供生产O-磷酸丝氨酸的方法,所述方法包括在培养基中培养本申请的生产O-磷酸丝氨酸的微生物。
本申请的再另一个目的是提供生产半胱氨酸或其衍生物的方法,所述方法包括:
a)通过在培养基中培养生产O-磷酸丝氨酸(OPS)的微生物来生产O-磷酸丝氨酸或含有其的培养基,所述微生物包含多肽、编码本申请的多肽的多核苷酸、和含有本申请的多核苷酸的载体中的任意一种或多种;和
b)在O-磷酸丝氨酸硫化氢解酶(OPSS)或表达其的微生物的存在下,使步骤a)中生产的O-磷酸丝氨酸或含有其的培养基与硫化物反应。
[有利效果]
当使用本申请的具有O-磷酸丝氨酸输出活性的多肽培养具有O-磷酸丝氨酸生产能力的微生物时,其可导致与使用现有的未修饰或变体蛋白相比高产率生产OPS。
具体实施方式
本申请将被详细描述。同时,本文公开的各个描述和实施方式可分别适用于其它描述和实施方式。也就是说,本文公开的各种要素的所有组合都落入本申请的范围。进一步,本申请的范围不受下述具体描述限制。
在本申请的一个方面中,为了实现上述目的,本申请提供了具有O-磷酸丝氨酸(OPS) 输出活性的多肽,所述多肽包括a)对应于SEQ ID NO:11的氨基酸序列中241的位置处的异亮氨酸(I)被苏氨酸(T)取代,对应于SEQ ID NO:11的氨基酸序列中246的位置处的天冬氨酸(D)被缬氨酸(V)取代,和对应于SEQ ID NO:11的氨基酸序列中330的位置处的缬氨酸(V)被异亮氨酸(I)取代,并且具有氨基酸序列,其中b)对应于88的位置处的氨基酸是苯丙氨酸,并且c)对应于207的位置处的氨基酸是赖氨酸(K)。
如本文所用,术语“O-磷酸丝氨酸”(以下称为“OPS”)是指作为许多蛋白质的构成组分的丝氨酸的磷酸酯。具体地,OPS是L-半胱氨酸的前体并且可通过在OPS硫化氢解酶(以下称为“OPSS”)的催化作用下与硫化物反应而转化为半胱氨酸,但不限于此(US8557549 B2)。
如本文所用,术语“具有OPS输出活性的多肽”是指具有将OPS输出到细胞外的活性的膜蛋白,并且该膜蛋白可源自大肠杆菌。在本申请中,具有OPS输出活性的多肽可以是YhhS主要促进因子超家族(major facilitator superfamily)(MFS)转运蛋白或其变体。具体地,本申请的多肽可以是与野生型YhhS MFS转运蛋白相比呈现提高的活性的YhhS MFS转运蛋白的变体,野生型YhhS MFS转运蛋白已被鉴定为是大肠杆菌中具有OPS输出活性的蛋白质,其中在过量OPS存在的条件下生长抑制被释放。
如本文所用,术语“变体”是指这样的该蛋白质:由于保守取代和/或修饰而具有至少一个不同于指定序列的氨基酸序列,使得该蛋白质的功能和性质保留。变体由于几个氨基酸的取代、缺失或添加而不同于确定的序列。这种变体总体上可以通过修饰蛋白质的上述氨基酸序列中的一个和评价修饰后的蛋白质的性质来鉴定。也就是说,变体的能力可相对于天然蛋白质增强、不变或减弱。进一步,一些变体可包括其中一个或多个部分如N端先导序列或跨膜结构域已被移除的变体。其它变体可包括其中一部分已被从成熟蛋白质的N端和/或C端移除的变体。术语“变体”可非限制地与诸如修饰型、修饰、修饰的蛋白质、修饰的多肽、突变体、突变蛋白、分歧体(divergent)、变体等术语互换使用,只要这些术语用于表示变异。就本申请而言,变体可以是与天然野生型或未修饰的蛋白质相比具有修饰的蛋白质的提高的活性的变体,但不限于此。
如本文所用,术语“保守取代”是指氨基酸被具有类似结构和/或化学性质的另一氨基酸取代。变体可具有例如至少一个保守取代,同时保留至少一种生物活性。这种氨基酸取代可总体上基于残基的极性、电荷、溶解性、疏水性、亲水性、和/或两亲性的相似性而发生。例如,在带电的氨基酸中,带正电的(碱性)氨基酸包括精氨酸、赖氨酸和组氨酸,并且带负电的(酸性)氨基酸包括谷氨酸和天冬氨酸;在不带电的氨基酸中,非极性氨基酸包括甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、甲硫氨酸、苯丙氨酸、色氨酸和脯氨酸;极性或亲水性氨基酸包括丝氨酸、苏氨酸、半胱氨酸、酪氨酸、天冬酰胺和谷氨酰胺;并且氨基酸中的芳族氨基酸包括苯丙氨酸、色氨酸和酪氨酸。
另外,变体可还包括对多肽的特性和二级结构具有最低限度影响的氨基酸的缺失或添加。例如,多肽可与蛋白质的N端处共翻译或翻译后涉及蛋白质转移的信号(或先导)序列缀合。进一步,多肽还可以与识别、纯化、或合成所述多肽的另一序列或连接体缀合。
具体地,本申请的具有OPS输出活性的多肽可以是这样的具有OPS输出活性的多肽:包括a)对应于SEQ ID NO:11的氨基酸序列中241的位置处的异亮氨酸(I)被苏氨酸(T)取代,对应于SEQ ID NO:11的氨基酸序列中246的位置处的天冬氨酸(D)被缬氨酸(V) 取代,和对应于SEQ ID NO:11的氨基酸序列中330的位置处的缬氨酸(V)被异亮氨酸 (I)取代,并且具有氨基酸序列,其中b)对应于88的位置处的氨基酸是苯丙氨酸,并且c)对应于207的位置处的氨基酸是赖氨酸(K),或这样的具有OPS输出活性的多肽:包括a)对应于SEQID NO:11的氨基酸序列中241的位置处的异亮氨酸(I)被苏氨酸(T) 取代,对应于SEQ IDNO:11的氨基酸序列中246的位置处的天冬氨酸(D)被缬氨酸(V) 取代,和对应于SEQ IDNO:11的氨基酸序列中330的位置处的缬氨酸(V)被异亮氨酸 (I)取代,并且具有氨基酸序列,其中b)对应于88的位置处的氨基酸是苯丙氨酸,并且c)对应于207的位置处的氨基酸是赖氨酸(K)。
本申请的具有OPS输出活性的多肽可以是这样的具有OPS输出活性的多肽:包括a)对应于SEQ ID NO:11的氨基酸序列中241的位置处的异亮氨酸(I)被苏氨酸(T)取代,对应于SEQ ID NO:11的氨基酸序列中246的位置处的天冬氨酸(D)被缬氨酸(V)取代,和对应于SEQ ID NO:11的氨基酸序列中330的位置处的缬氨酸(V)被异亮氨酸(I)取代,并且具有氨基酸序列,其中b)对应于88的位置处的氨基酸是苯丙氨酸,并且c)对应于207的位置处的氨基酸是赖氨酸(K),或这样的具有OPS输出活性的多肽:包括a) 对应于SEQ ID NO:11的氨基酸序列中241的位置处的异亮氨酸(I)被苏氨酸(T)取代,对应于SEQ ID NO:11的氨基酸序列中246的位置处的天冬氨酸(D)被缬氨酸(V)取代,和对应于SEQ ID NO:11的氨基酸序列中330的位置处的缬氨酸(V)被异亮氨酸(I)取代,并且由或主要由如下氨基酸序列组成组成:其中b)对应于88的位置处的氨基酸是苯丙氨酸,并且c)对应于207的位置处的氨基酸是赖氨酸(K)。
另外,本申请的具有OPS输出活性的多肽可非限制地包括任何这样的多肽:显示与SEQ ID NO:11或SEQ ID NO:1的氨基酸序列具有至少70%、80%、90%、95%、或99%或更高且小于100%的同一性的氨基酸序列,并且呈现与所述多肽的OPS输出能力基本上相同或对应的OPS输出能力,同时是这样的多肽,其包括a)对应于SEQ ID NO:11的氨基酸序列中241的位置处的异亮氨酸(I)被苏氨酸(T)取代,对应于SEQ ID NO:11的氨基酸序列中246的位置处的天冬氨酸(D)被缬氨酸(V)取代,和对应于SEQ ID NO:11 的氨基酸序列中330的位置处的缬氨酸(V)被异亮氨酸(I)取代,并且具有氨基酸序列,其中b)对应于88的位置处的氨基酸是苯丙氨酸,并且c)对应于207的位置处的氨基酸是赖氨酸(K)。进一步,显而易见的是,任何具有如下氨基酸序列的多肽变体也可以落入本申请的范围:其中在对应于SEQ IDNO:11的氨基酸序列的88、207、241、246和330 的氨基酸位置处,部分氨基酸序列被删除(缺失,deleted)、修饰、取代、或添加,只要其是氨基酸序列如具有这种同一性的序列一样实质上具有OPS输出活性的多肽。
具体地,本申请的具有OPS输出活性的多肽可以是具有SEQ ID NO:1的氨基酸序列的多肽。
在本申请中,具有SEQ ID NO:1的氨基酸序列的具有O-磷酸丝氨酸输出活性的多肽可以是包括SEQ ID NO:1的氨基酸序列的具有O-磷酸丝氨酸输出活性的多肽、由SEQ IDNO:1的氨基酸序列表示的具有O-磷酸丝氨酸输出活性的多肽、主要由SEQ ID NO:1的氨基酸序列组成的具有O-磷酸丝氨酸输出活性的多肽、或由SEQ ID NO:1的氨基酸序列组成的具有O-磷酸丝氨酸输出活性的多肽。此外,本申请的具有O-磷酸丝氨酸输出活性的多肽不排除在SEQ ID NO:1的氨基酸序列上游或下游的无意义序列添加。
在本申请中,SEQ ID NO:1可意为具有OPS输出活性的氨基酸序列。具体地,SEQ IDNO:1可以是构成YhhS MFS转运蛋白——一种呈现OPS输出活性的由yhhS基因编码的蛋白质——的变体的氨基酸序列。
YhhS MFS转运蛋白——一种呈现OPS输出活性的由yhhS基因编码的蛋白质——的氨基酸序列可从已知的数据库NCBI的GenBank获得。YhhS MFS转运蛋白的氨基酸序列可以是例如SEQ ID NO:11。另外,YhhS MFS转运蛋白的氨基酸序列可以是源自大肠杆菌(E.coli)的氨基酸序列,但不限于此。
在本申请的另一方面中,本申请提供了多核苷酸,其编码这样的具有O-磷酸丝氨酸输出活性的多肽:包括a)对应于SEQ ID NO:11的氨基酸序列中241的位置处的异亮氨酸(I)被苏氨酸(T)取代,对应于SEQ ID NO:11的氨基酸序列中246的位置处的天冬氨酸(D)被缬氨酸(V)取代,和对应于SEQ ID NO:11的氨基酸序列中330的位置处的缬氨酸(V)被异亮氨酸(I)取代,并且具有氨基酸序列,其中b)对应于88的位置处的氨基酸是苯丙氨酸,并且c)对应于207的位置处的氨基酸是赖氨酸(K),或具有SEQ ID NO: 1的氨基酸序列的具有O-磷酸丝氨酸输出活性的多肽。
SEQ ID NO:11、SEQ ID NO:1、O-磷酸丝氨酸、和具有O-磷酸丝氨酸输出活性的多肽与上文所述相同。
如本文所用,“多核苷酸”,即由长链中通过共价键连接的核苷酸单体构成的核苷酸多聚物,是具有至少一定长度的DNA或RNA链。
多核苷酸可非限制地包括编码本申请的具有OPS输出活性的多肽的任何多核苷酸。在本申请中,编码OPS输出蛋白的氨基酸序列的基因可以是yhhS基因。另外,所述基因可源自大肠杆菌(E.coli),但不限于此。
具体地,编码本申请的具有OPS输出活性的多肽的多核苷酸可以具有或包括编码由 SEQ ID NO:1表示的氨基酸序列的核苷酸序列。另外,编码本申请的具有OPS输出活性的多肽的多核苷酸可由或主要由编码SEQ ID NO:1表示的氨基酸序列的核苷酸序列组成。由于密码子简并性或考虑到待表达所述多肽的生物体中优选的密码子,本申请的多核苷酸可以在不改变多肽氨基酸序列的范围内在编码区中经历各种修饰。本申请的多核苷酸可包括或具有例如与SEQ ID NO:2的核苷酸序列具有至少80%、90%、95%、或99%或更高的同源性或同一性的核苷酸序列,但不限于此。在一个实施方式中,本申请的多核苷酸可由或主要由与SEQ ID NO:2的核苷酸序列具有至少80%、90%、95%、或99%或更高的同源性或同一性的核苷酸序列组成,但不限于此。
另外,本申请的多核苷酸可包括探针,其可由已知基因序列制备,非限制地例如可在严格条件下与与核苷酸序列的全部或部分互补的序列杂交以编码SEQ ID NO:1的氨基酸序列的任何序列。“严格条件”是指允许多核苷酸之间特异性杂交的条件。这样的条件被具体描述在文献中(参见J.Sambrook等,Molecular Cloning,A Laboratory Manual,第2版,Cold Spring Harbor Laboratory press,Cold Spring Harbor,New York,1989;F.M.Ausubel等, Current Protocols in Molecular Biology,John Wiley&Sons,Inc.,New York)。例如,严格条件可以包括使具有40%或更高,具体地90%或更高,更具体地95%或更高,再更具体地97%或更高,以及还再更具体地99%或更高的高同源性或同一性的基因彼此杂交,而同源性或同一性低于上述同源性或同一性的基因不彼此杂交的条件,或Southern杂交的洗涤条件,即在对应于60℃,1×SSC,0.1%SDS,具体地60℃,0.1×SSC,0.1%SDS,更具体地 68℃,0.1×SSC,0.1%SDS的盐浓度和温度下洗涤一次,具体地两次或三次。
杂交要求两个核酸含有互补序列,尽管根据杂交的严格性碱基之间错配是可能的。术语“互补”用于描述能够彼此杂交的核苷酸碱基之间的关系。例如,关于DNA,腺嘌呤(adenosine)与胸腺嘧啶互补,并且胞嘧啶与鸟嘌呤互补。因此,本申请的多核苷酸可包括分离的与整个序列互补的核苷酸片段以及与其基本上相似的核酸序列。
如本文所用,术语“同源性”或“同一性”是指两个给定氨基酸序列或核苷酸序列之间的相关度,并且可以以百分比表示。术语同源性和同一性通常可以彼此可互换地使用。
保守的多肽或多核苷酸序列的序列同源性或同一性可利用标准比对算法来确定,并且可与所用程序建立的默认空位罚分联用。基本上,预期同源的或同一的序列总体上在中度或高度严格的条件下与序列的全长的全部或至少约50%、50%、60%、70%、80%、或90%杂交。还考虑在杂交多核苷酸中含有简并密码子来代替密码子的多核苷酸。
任意两个多核苷酸序列是否具有同源性、相似性、或同一性都可例如通过已知的计算机算法如利用默认参数的“FASTA”程序确定(Pearson等,(1988)Proc.Natl.Acad.Sci.USA 85:2444)。可选地,其可通过以下确定:Needleman–Wunsch算法(Needleman和Wunsch, 1970,J.Mol.Biol.48:443–453)——利用EMBOSS包的Needleman程序进行(EMBOSS:The European Molecular Biology Open Software Suite,Rice等.,2000,Trends Genet.16:276–277) (5.0.0版本或更高版本)(GCG程序包(Devereux,J.,等,Nucleic Acids Research 12:387 (1984)),BLASTP,BLASTN,FASTA(Atschul,S.F.,等,JMOLEC BIOL 215:403(1990); Guide to Huge Computers,Martin J.Bishop,ed.,Academic Press,San Diego,1994,和 CARILLO等(1988)SIAM J Applied Math 48:1073)。例如,可利用National Center for Biotechnology Information(NCBI)的BLAST或ClustalW来确定同源性、相似性、或同一性。
多肽或多核苷酸的同源性、相似性、或同一性可通过比较序列信息来确定,例如利用 GAP计算机程序如Needleman等(1970),J Mol Biol.48:443,被公开于Smith和Waterman, Adv.Appl.Math(1981)2:482。总之,GAP程序将同源性、相似性、或同一性定义为通过将相似比对的符号(即核苷酸或氨基酸)的数量除以两个序列中较短者的符号总数而获得的值。GAP程序的默认参数可包括(1)一元比较矩阵(包含同一性数值1和非同一性数值0)和Gribskov等(1986),Nucl.Acids Res.14:6745的加权比较矩阵,如Schwartz与Dayhoff, eds.,Atlas of Protein Sequence and Structure,National BiomedicalResearch Foundation, pp.353–358(1979)中公开(或EDNAFULL替换矩阵(NCBI NUC4.4的EMBOSS版));(2) 每个空位3.0的罚分和每个空位中每个符号另外0.10的罚分(或10的空位开放罚分和0.5 的空位扩展罚分);和(3)末端空位无罚分。
此外,任意两个多核苷酸或多肽序列是否彼此具有同源性、相似性、或同一性可通过在所定义的严格条件下在Southern杂交实验中对序列进行比较来确定,并且所定义的适当的杂交条件在本领域技术人员的能力范围内,并且可以通过本领域技术人员公知的方法(例如,J.Sambrook等)来确定。
具体地,可利用杂交条件——包括在上述条件下于55℃的Tm值下的杂交步骤——来检测具有同源性或同一性的多核苷酸。进一步,Tm值可以是60℃、63℃或65℃,但不限于此,并且可以由本领域技术人员根据其目的进行适当调整。
适于杂交多核苷酸的严格性取决于多核苷酸的长度和互补程度,并且这些变量是本领域公知的(参见Sambrook等,同上,9.50–9.51,11.7–11.8)。
在本申请的再另一个方面中,本申请提供了载体,其含有:编码具有O-磷酸丝氨酸输出活性的多肽的多核苷酸,所述多肽包括a)对应于SEQ ID NO:11的氨基酸序列中241 的位置处的异亮氨酸(I)被苏氨酸(T)取代,对应于SEQ ID NO:11的氨基酸序列中246 的位置处的天冬氨酸(D)被缬氨酸(V)取代,和对应于SEQ ID NO:11的氨基酸序列中 330的位置处的缬氨酸(V)被异亮氨酸(I)取代,并且具有氨基酸序列,其中b)对应于88的位置处的氨基酸是苯丙氨酸,并且c)对应于207的位置处的氨基酸是赖氨酸(K);或编码具有SEQ ID NO:1的氨基酸序列的具有O-磷酸丝氨酸输出活性的多肽的多核苷酸。
SEQ ID NO:11、SEQ ID NO:1、O-磷酸丝氨酸、具有O-磷酸丝氨酸输出活性的多肽、和多核苷酸与上述相同。
如本文所用,术语“载体”是指这样的DNA构建物:含有编码目标多肽或蛋白质的多核苷酸的核苷酸序列,其被可操作地连接到合适的调控序列以能够在合适的宿主细胞中表达目标多肽或蛋白质。调控序列可包括能够启动转录的启动子、用于调控转录的任何操纵序列、编码合适的mRNA核糖体结合位点的序列、和用于调控转录和翻译的终止的序列。在转化到合适的宿主细胞中后,载体可独立于宿主基因组复制或发挥功能,或者可整合到其基因组中。
本申请中使用的载体没有具体限制,只要其能够在宿主细胞中复制,并且可以使用本领域已知的任意载体。常规使用的载体的实例可包括天然或重组质粒、黏粒、病毒和噬菌体。例如,作为噬菌体载体或黏粒载体,可以使用pWE15、M13、MBL3、MBL4、IXII、 ASHII、APII、t10、t11、Charon4A和Charon21A;并且作为质粒载体,可以使用基于pBR、 pUC、pBluescriptII、pGEM、pTZ、pCL、pSK、pSKH和pET的那些。具体地,可以使用 pCL、pSK、pSKH130、pDZ、pACYC177、pACYC184、pECCG117、pUC19、pBR322、 pMW118和pCC1BAC载体。
多核苷酸在染色体中的***可通过本领域已知的任何方法进行,例如通过同源重组,但方法不限于此。
载体可还包括选择标记以确认在染色体中的***。选择标记用于选择转化有载体的细胞,即用于确认目标核酸分子是否已被***,并且可以使用提供可选择表型如耐药性、营养缺陷型、细胞毒性剂耐性、或表面修饰蛋白的表达的标记。只有表达选择标记的细胞能在用选择剂处理的环境下存活或显示不同的表型,因此可以选择出转化的细胞。
如本文所用,术语“转化”是指将包括编码目标多肽或蛋白质的多核苷酸的载体引入宿主细胞中,使得该多核苷酸编码的多肽或蛋白质能够在宿主细胞中表达。只要转化的多核苷酸能够在宿主细胞中表达,转化的多核苷酸是被整合到宿主细胞的染色体中并位于其中还是位于染色体外无关紧要,并且两种情况都可以被包括在内。进一步,多核苷酸可包括编码目标多肽或蛋白质的DNA和RNA。
多核苷酸可以以任何形式被引入,只要其能够被引入宿主细胞中并在其中表达。例如,多核苷酸可以以表达盒的形式被引入宿主细胞中,表达盒是包括其自主表达所需的所有要素的基因构建物。表达盒通常可包括可操作地连接到多核苷酸的启动子、转录终止子、核糖体结合位点、或翻译终止子。表达盒可以是可自我复制的表达载体的形式。另外,多核苷酸可原样被引入宿主细胞中并且在宿主细胞中被可操作地连接到表达所需的序列,但不限于此。
另外,如本文所用,术语“可操作地连接”意为基因序列被功能性地连接至启动和介导编码本申请的目标多肽或蛋白质的多核苷酸的转录的启动子序列。
在本申请的又一方面中,本申请提供了生产O-磷酸丝氨酸的微生物,所述微生物包含以下中的任意一种或多种:具有O-磷酸丝氨酸(OPS)输出活性的多肽,所述多肽包括a)对应于SEQ ID NO:11的氨基酸序列中241的位置处的异亮氨酸(I)被苏氨酸(T)取代,对应于SEQ ID NO:11的氨基酸序列中246的位置处的天冬氨酸(D)被缬氨酸(V)取代,和对应于SEQ ID NO:11的氨基酸序列中330的位置处的缬氨酸(V)被异亮氨酸(I)取代,并且具有氨基酸序列,其中b)对应于88的位置处的氨基酸是苯丙氨酸,并且c)对应于207的位置处的氨基酸是赖氨酸(K),或具有SEQ ID NO:1的氨基酸序列的具有O- 磷酸丝氨酸输出活性的多肽、编码本申请的多肽的多核苷酸、和含有编码本申请的多肽的多核苷酸的载体。
SEQ ID NO:11、SEQ ID NO:1、O-磷酸丝氨酸、具有O-磷酸丝氨酸输出活性的多肽、多核苷酸、和载体与上述相同。
如本文所用,术语“生产OPS的微生物”是指具有天然弱的OPS生产能力的微生物,或通过对不具有OPS生产能力的母体菌株的天然或人工遗传修饰而被给予OPS生产能力的微生物。具体地,微生物可以是表达具有SEQ ID NO:1的氨基酸序列的多肽的微生物,但不限于此。在本申请中,“生产OPS的微生物”可与“具有OPS生产能力的微生物”、“生产OPS的菌株”和“生产OPS的株系”可互换地使用。
就本申请而言,在生产OPS的微生物的情况下,微生物可包括如下任意一种或多种:本申请的具有O-磷酸丝氨酸输出活性的多肽、编码本申请的多肽的多核苷酸、和含有本申请的多核苷酸的载体,从而增强由其表达的多肽的活性,并且因此与野生型或修饰前微生物相比OPS的产量可以提高。这是显著的,因为OPS的生产可以通过引入本申请的具有OPS输出活性的多肽并增强其活性来提高,而野生型微生物不能生产OPS或者即使其能生产OPS也只能生产痕量。也就是说,本申请的生产OPS的微生物可以是其中本申请的具有OPS输出活性的多肽的活性与其内源活性相比增强的微生物,但不限于此。
如本文所用,术语“与其内源活性相比增强”是指在与处于其天然状态下的微生物所具备的蛋白质活性相比时蛋白质活性增加。
如本文所用,术语“待表达/在表达”是指将目标多肽或蛋白质引入微生物中或目标多肽或蛋白质经修饰以将在微生物中表达时的状态。当目标多肽或蛋白质是存在于微生物中的多肽或蛋白质时,这可意为其活性与内源活性或修饰前活性相比增强的状态。
如本文所用,术语多肽或蛋白质的“活性增强”意为多肽或蛋白质的活性与其内源活性相比增强。如本文所用,术语“内源活性”是指,当微生物的特性因天然或人为因素引起的遗传修饰而改变时,转化前的母体菌株或未修饰的微生物所原始具有的具体多肽或蛋白质的活性,并且可以与“修饰前的活性”可互换地使用。多肽或蛋白质的活性与其内源活性相比“增强”或“增加”意为与转化前的母体菌株或未修饰的微生物所原始具有的具体多肽或蛋白质的活性相比活性增强。
“活性参加”可通过引入外源多肽或蛋白质或通过增强内源多肽或蛋白质的活性来实现,但具体地,其可通过增强内源多肽或蛋白质的活性来实现。多肽或蛋白质的活性是否增强可通过目标多肽或蛋白质的活性水平、表达水平、或从目标蛋白质输出的产物量的增加来确认。
在本申请中,活性增强的目标多肽或蛋白质,即目标多肽或蛋白质,可以是YhhSMFS 转运蛋白的变体,并且具体地,其可以是具有与野生型YhhS MFS转运蛋白相比增强的OPS输出活性的YhhS MFS转运蛋白的变体,但不限于此。
另外,在本申请中,从目标多肽或蛋白质输出的产物可以是O-磷酸丝氨酸,但不限于此。
多肽或蛋白质的活性增强可通过本领域公知的各种方法实现,并且可没有限制,只要目标多肽或蛋白质的活性能够与修饰前微生物相比增强。方法可包括基因工程(遗传改造, genetic engineering)或蛋白质工程,但不限于此。
利用基因工程增强多肽或蛋白质的活性的方法可例如通过以下实现:
1)增加编码多肽或蛋白质的基因或多核苷酸的细胞内拷贝数的方法;
2)用具有强活性的序列替换染色体上编码多肽或蛋白质的基因的表达调控序列的方法;
3)修饰多肽或蛋白质的起始密码子或5′-UTR的核苷酸序列的方法;
4)修饰染色体上的多核苷酸序列使得多肽或蛋白质的活性增强的方法;
5)引入具有多肽或蛋白质的活性的外源多核苷酸或该多核苷酸的密码子优化的修饰多核苷酸的方法;或
6)其组合,但不限于此。
利用蛋白质工程增强多肽或蛋白质的活性的方法可例如通过分析该多肽或蛋白质的三级结构以及选择和修饰暴露的位点,或对其进行化学修饰来实现,但不限于此。
增加编码多肽或蛋白质的基因的细胞内拷贝数的方法1)可以通过本领域已知的方法进行,例如,通过将载体引入宿主细胞中,所述载体可操作地连接到编码多肽或蛋白质的基因或多核苷酸,并且无论宿主细胞,能够复制和发挥作用。可选地,方法可通过引入载体进行,所述载体能够将基因或多核苷酸***宿主细胞的染色体中——该基因可操作地与所述载体连接,但不限于此。载体与上述相同。
用具有强活性的序列替换染色体上编码多肽或蛋白质的基因的表达调控序列的方法2) 可以通过本领域已知的方法进行,例如,通过核酸序列的缺失、***、非保守或保守取代、或其组合而引起对序列的修饰以进一步增强表达调控序列的活性,或通过用具有更强活性的核酸序列替换多核苷酸序列。表达调控序列可包括但不具体限于启动子、操纵序列、编码核糖体结合位点的序列、和调控转录和翻译的终止的序列。具体地,所述方法可包括连接强异源启动子代替原始启动子,但不限于此。
强启动子的实例可包括CJ7启动子(US 7662943 B2)、CJ1启动子(US 7662943B2)、 lac启动子、trp启动子、trc启动子、tac启动子、λ噬菌体PR启动子、PL启动子、和tet启动子,但不限于此。
修饰多肽或蛋白质起始密码子或5′-UTR的核苷酸序列的方法3)可以通过本领域已知的方法进行,例如,通过用具有比内源性起始密码子具有更高多肽或蛋白质表达率的另一个起始密码子取代多肽或蛋白质的内源性起始密码子,但不限于此。
修饰染色体上的多核苷酸序列使得多肽或蛋白质活性增强的方法4)可以通过本领域已知的方法进行,例如,通过核苷酸序列的缺失、***、非保守或保守取代、或其组合而引起对表达调控序列的修饰以进一步增强多核苷酸序列的活性,或通过用经修饰具有更强活性的多核苷酸序列替换多核苷酸序列。替换可具体地通过同源重组而将基因***染色体中来实现,但不限于此。
本文使用的载体可以还包括选择标记以确认在染色体中的***。选择标记与上述相同。
引入具有多肽或蛋白质活性的外源多核苷酸的方法5)可以通过本领域已知的方法进行,例如,通过将编码呈现与所述多肽或蛋白质相同或相似活性的多肽或蛋白质的外源多核苷酸或其密码子优化的修饰多核苷酸引入宿主细胞中。外源多核苷酸可以无论其来源或序列被无限制地使用,只要其呈现与所述多肽或蛋白质相同或相似的活性。另外,为了外源多核苷酸在宿主细胞中的转录和翻译优化,可以将其密码子优化并引入宿主细胞中。所述引入可以由本领域普通技术人员通过选择本领域已知的合适的转化方法进行,并且引入的多核苷酸在宿主细胞中的表达能够生产多肽或蛋白质,从而提高其活性。
最后,上述方法的组合6)可以通过组合应用方法1)至5)中的任意一种或多种进行。
这种多肽或蛋白质的活性增强可以是,基于野生型或修饰前微生物菌株中表达的多肽或蛋白质的活性或浓度,目标多肽或蛋白质的活性或浓度增加,或者可以是从目标多肽或蛋白质生产的产物量增加,但不限于此。如本文所用,术语“修饰前菌株”或“修饰前微生物”不排除含有微生物中可能天然发生的突变的菌株,并且其可以指代天然菌株本身或因天然或人为因素所导致的基因突变而改变特性的修饰前的菌株。“修饰前菌株”或“修饰前微生物”可与“非突变菌株”、“非修饰菌株”、“非突变微生物”、“非修饰微生物”、或“平台微生物 (platform microorganism)”可互换地使用。
在本申请中,平台微生物可以是:CA07-0012,一种已知的生产OPS的微生物,CA07-0022/pCL_Prmf-serA*(G336V)-serC(KCCM11103P(US 8557549 B2),一种内源性SerA(D-3-磷酸甘油酸脱氢酶)和SerC(3-磷酸丝氨酸氨基转移酶)的活性增强的菌株,以及CA07-0012(KCCM11121P(US 8557549 B2),或一种内源磷酸丝氨酸磷酸酶(SerB) 活性减弱的菌株,但不限于此。
本申请的微生物可以是通过用含有编码所述多肽的多核苷酸的载体转化而生产的重组微生物,但不限于此。
本申请的微生物不受其类型限制,只要其能够生产OPS,并且可以是任何原核微生物或真核微生物,具体地原核微生物。原核微生物可包括属于埃希氏菌属(the genusEscherichia)、欧文氏菌属(the genus Erwinia)、沙雷氏菌属(the genus Serratia)、普罗威登斯菌属(the genus Providencia)、棒状杆菌属(the genus Corynebacterium)、和短杆菌属 (the genus Brevibacterium)的微生物菌株,具体地属于埃希氏菌属的微生物,更具体地大肠杆菌,但不限于此。具体地,在属于埃希氏菌属的微生物的情况下,OPS和L-丝氨酸可以通过SerA、SerC和SerB(L-丝氨酸生物合成途径的酶)而生产(Ahmed Zahoor,Computational and structural biotechnology journal,Vol.3,2012年11月;WendischV.F.et al., Curr Opin Microbiol.2006年6月;9(3):268–74;Peters-Wendisch P.等,Appl Environ Microbiol. 2005年11月;71(11):7139–44.).
本申请的生产OPS的微生物可以是磷酸丝氨酸磷酸酶(SerB)的活性可与其内源活性相比被进一步减弱的微生物。
本申请的SerB具有将OPS转化为L-丝氨酸的活性,因此经修饰以减弱SerB活性的微生物具有在其中累积OPS的性质,并且因此可用于生产OPS。本申请的SerB可以是具有或包括由SEQ ID NO:3表示的氨基酸序列的蛋白质,或者可以是由或主要由SEQ ID NO: 3表示的氨基酸序列组成的蛋白质,但不限于此。另外,SerB可以具有或包括与由SEQ ID NO:3表示的氨基酸序列具有80%、90%、95%、或99%或更高序列同源性或同一性的氨基酸序列,只要其显示出SerB活性。此外,本申请的SerB可由或主要由与SEQ ID NO:3 表示的氨基酸序列具有80%、90%、95%、或99%或更高同源性或同一性的氨基酸序列组成,但不限于此。另外,编码SerB的多核苷酸可以具有或包括编码由SEQ ID NO:3表示的氨基酸序列的核苷酸序列。进一步,编码SerB的多核苷酸可由或主要由编码由SEQ ID NO:3表示的氨基酸序列的核苷酸序列组成。由于密码子简并性或考虑到将在其中表达 SerB蛋白的生物体中优选的密码子,本申请的编码SerB蛋白的多核苷酸可在不改变SerB 蛋白的氨基酸序列的范围内于编码区中经历各种修饰(改动,modification)。本申请的编码SerB的多核苷酸可具有或包括与SEQ ID NO:4的核苷酸序列具有80%、90%、95%、或99%或更高且小于100%同源性或同一性的核苷酸序列。另外,本申请的编码SerB的多核苷酸可由或主要由与SEQ IDNO:4的核苷酸序列具有80%、90%、95%、或99%或更高且小于100%同源性或同一性的核苷酸序列组成,但不限于此。
如本文所用,术语“活性与其内源活性相比减弱”意为,与未修饰菌株相比,天然野生型菌株、母体菌株、或目标蛋白质无所述酶或蛋白质的表达,或者即使在表达时也没有活性或者活性降低。具体地,所述降低是综合概念,包括以下情况:由于编码该蛋白质的基因的突变、表达调控序列的修饰、或部分或全部基因的缺失等而造成蛋白质活性与微生物原始具备的蛋白质活性相比降低的情况;由于编码该蛋白质的基因的表达被抑制或翻译被抑制而造成细胞内蛋白质活性的总体水平与天然菌株或修饰前菌株相比降低的情况;及其组合。
蛋白质活性的减弱可通过本领域公知的各种方法来实现。方法的实例可包括:修饰编码该蛋白质的基因序列使得蛋白质活性被去除或减弱的方法;修饰表达调控序列使得基因的表达减少的方法;使编码该蛋白质的基因的部分或全部缺失的方法;引入反义寡核苷酸 (例如,反义RNA)的方法,该反义寡核苷酸通过与染色体上的基因的转录物的互补结合而抑制从mRNA翻译成蛋白质;通过向Shine-Dalgarno(SD)序列在编码该蛋白质的基因的SD序列的前端人工地添加互补序列以形成二级结构而使核糖体附接不能的方法;和逆转录工程(reverse transcription engineering)(RTE)方法,其添加启动子从而在编码该蛋白质的基因的多核苷酸序列的开放阅读框(ORF)的3′端上逆向地转录;及其组合,但不具体限于此。
具体地,修饰染色体上的基因序列的方法可通过以下进行:经由缺失、***、非保守取代、保守取代、或其组合在所述序列中引起修饰以进一步减弱蛋白质的活性;或者用经修饰具有较弱活性的基因序列或经修饰完全没有活性的基因序列替换所述序列。
修饰表达调控序列的方法可通过以下进行:经由缺失、***、保守取代、非保守取代、或其组合在表达调控序列中引起修饰以进一步减弱表达调控序列的活性;或者用活性较弱的核酸序列来替换所述序列。表达调控序列可包括启动子、操纵序列、编码核糖体结合位点的序列、和用于调控转录和翻译的序列。
使编码蛋白质的基因的部分或全部缺失的方法可通过以下进行:利用在细菌中进行染色体***的载体,将在染色体内编码内源目标蛋白质的多核苷酸替换为具有部分缺失的核酸序列的多核苷酸或标记基因。例如,可以采用通过同源重组使基因缺失的方法。另外,如本文所用,术语“部分”,尽管可根据多核苷酸的种类而变化,但可以具体指代1至300个核苷酸,更具体地1至100个核苷酸,甚至更具体地1至50个核苷酸,但不具体限于此。
另外,修饰表达调控序列的方法可通过以下进行:经由缺失、***、保守取代、非保守取代、或其组合在表达调控序列中引起修饰以进一步减弱表达调控序列的活性;或者用活性较弱的核酸序列替换所述序列。表达调控序列可包括启动子、操纵序列、编码核糖体结合位点的序列、和用于调控转录和翻译的序列。
另外,修饰染色体上基因序列的方法可通过以下进行:经由缺失、***、保守取代、非保守取代、或其组合在序列中引起修饰以进一步减弱蛋白质的活性;或者用经修饰具有较弱活性的基因序列或经修饰完全没有活性的基因序列替换所述序列。
另外,本申请的生产OPS的微生物可是其中磷酸甘油酸脱氢酶(SerA)或磷酸丝氨酸氨基转移酶(SerC)的活性与其内源活性相比被进一步增强的微生物。
SerA是能够将3-磷酸甘油酸转化为3-磷酸羟基丙酮酸的蛋白质。SerC是能够将3-磷酸-羟基丙酮酸转化为OPS的蛋白质。因此,任何具有增强的SerA和/或SerC活性的微生物可有效地用作生产OPS的微生物。
SerA可以是具有或包括由SEQ ID NO:5或6表示的氨基酸序列的蛋白质,或者由或主要由SEQ ID NO:5或6表示的氨基酸序列组成的蛋白质,虽然其不限于此。由SEQ ID NO:5表示的氨基酸序列是野生型SerA的序列,而由SEQ ID NO:6表示的氨基酸序列是其中对丝氨酸的反馈抑制被释放的SerA变体的序列。另外,本申请的SerA可具有或包括与由 SEQ IDNO:5或6表示的氨基酸序列具有至少80%、90%、95%、或99%或更高且小于100%的同源性或同一性的氨基酸序列,只要其显示野生型SerA的活性或其中对丝氨酸的反馈抑制被释放的SerA变体的活性,但不限于此。此外,本申请的SerA可由或主要由与SEQ ID NO.5或6表示的氨基酸序列具有至少80%、90%、95%、或99%或更高且小于100%的同源性或同一性的氨基酸序列组成,只要其显示野生型SerA的活性或其中对丝氨酸的反馈抑制被释放的SerA变体的活性。其中对丝氨酸的反馈抑制被释放的SerA变体是指这样的蛋白质:其中对SerA编码基因引入修饰——通过***编码SerA的基因的核苷酸或取代编码野生型SerA的基因等,从而维持防止丝氨酸或甘氨酸的反馈抑制的活性,或增强其活性,并且那些丝氨酸反馈抑制被释放的变体已是公知的(Grant G.A.等,J.Biol.Chem., 39:5357–5361,1999;GrantG.A.等,Biochem.,39:7316–7319,2000;Grant G.A.等,J.Biol. Chem.,276:17844–17850,2001;Peters-Wendisch P.等,Appl.Microbiol.Biotechnol., 60:37–441,2002;US6258573 B1)。
另外,编码野生型SerA或其中对丝氨酸的反馈抑制被释放的SerA变体的多核苷酸序列可具有或包括编码由SEQ ID NO:5或6表示的任一氨基酸序列的核苷酸序列。进一步,编码野生型SerA或其中对丝氨酸的反馈抑制被释放的SerA变体的多核苷酸序列可由或主要由编码SEQ ID NO:5或SEQ ID NO:6表示的任一氨基酸序列的核苷酸序列组成,但不限于此。由于密码子简并性或考虑到其中将表达多肽的生物体中优选的密码子,编码野生型SerA或其中对丝氨酸的反馈抑制被释放的SerA变体的多核苷酸序列可以在不改变编码野生型SerA或其中对丝氨酸的反馈抑制被释放的SerA变体的多肽的氨基酸序列的范围内于编码区中经历各种修饰。例如,编码由SEQ ID NO:5表示的氨基酸序列的核苷酸序列可以是与SEQ ID NO:7的核苷酸序列具有至少80%、90%、95%、或99%或更高的同源性或同一性的核苷酸序列。另外,编码由SEQ ID NO:6表示的氨基酸序列的核苷酸序列可以是与SEQ IDNO:8的核苷酸序列具有至少80%、90%、95%、或99%或更高的同源性或同一性的核苷酸序列,但不限于此。
SerC可以是例如具有或包括由SEQ ID NO:9表示的氨基酸序列的蛋白质,或者由或主要由SEQ ID NO:9表示的氨基酸序列组成的蛋白质,但不限于此。另外,SerC可具有或包括与由SEQ ID NO:9表示的氨基酸序列具有至少80%、90%、95%、或99%或更高且小于100%的同源性或同一性的氨基酸序列,只要其显示SerC的活性。进一步,SerC可由或主要由与SEQ ID NO:9表示的氨基酸序列具有至少80%、90%、95%、或99%或更高且小于100%的同源性或同一性的氨基酸序列组成,只要其显示SerC的活性。
另外,编码SerC的多核苷酸可具有编码由SEQ ID NO:9表示的氨基酸序列的核苷酸序列。由于密码子简并性或考虑到其中将表达多肽的生物体中优选的密码子,多核苷酸可以在不改变多肽的氨基酸序列的范围内于编码区中经历各种修饰。编码SerC的多核苷酸可具有或包括例如与SEQ ID NO:10的核苷酸序列具有80%、90%、95%、或99%或更高的同源性或同一性的核苷酸序列,但不限于此。此外,编码SerC的多核苷酸可由或主要由与SEQID NO:10的核苷酸序列具有80%、90%、95%、或99%或更高的同源性或同一性的核苷酸序列组成,但不限于此。
如本文所用,术语“与其内源活性相比增强”和增强方法与上述相同。
另外,微生物可以是其中OPS引入细胞中或分解OPS的能力进一步减弱的微生物。
关于生产OPS的微生物的内容,除了上述内容外,US 8557549 B2中的公开内容也可用作本申请的参考。
在本申请的再另一个方面中,本申请提供了生产O-磷酸丝氨酸的方法,所述方法包括培养生产O-磷酸丝氨酸的微生物,所述微生物包含以下中的任意一种或多种:具有O-磷酸丝氨酸输出活性的多肽,所述多肽包括a)对应于SEQ ID NO:11的氨基酸序列中241 的位置处的异亮氨酸(I)被苏氨酸(T)取代,对应于SEQ ID NO:11的氨基酸序列中246 的位置处的天冬氨酸(D)被缬氨酸(V)取代,和对应于SEQ ID NO:11的氨基酸序列中 330的位置处的缬氨酸(V)被异亮氨酸(I)取代,并且具有氨基酸序列,其中b)对应于88的位置处的氨基酸是苯丙氨酸,并且c)对应于207的位置处的氨基酸是赖氨酸(K);或具有SEQ ID NO:1的氨基酸序列的具有O-磷酸丝氨酸输出活性的多肽、编码本申请的多肽的多核苷酸、和含有本申请的多核苷酸的载体。
SEQ ID NO:11、SEQ ID NO:1、O-磷酸丝氨酸、具有O-磷酸丝氨酸输出活性的多肽、多核苷酸、载体、和微生物与上述相同。
如本文所用,术语“培养”是指使微生物在适当控制的环境条件下生长。本申请的培养过程可在本领域已知的合适的培养基和培养条件下进行。这种培养过程可根据待选择的菌株容易地被本领域技术人员调节以供使用。具体地,培养可以是分批培养、连续培养、和补料-分批培养,但不限于此。
在培养具有与其内源活性相比降低的SerB活性的重组微生物时,培养基可进一步含有甘氨酸或丝氨酸——在引起重组微生物的丝氨酸需求时。甘氨酸可以以纯化的甘氨酸、含甘氨酸的酵母提取物、或胰蛋白胨的形式提供。培养基中所含的甘氨酸浓度总体上为0.1 g/L至10g/L,具体地0.5g/L至3g/L。另外,丝氨酸可以以纯化的丝氨酸、含丝氨酸的酵母提取物、或胰蛋白酶的形式提供。培养基中所含的丝氨酸浓度总体上为0.1g/L至5g/L,具体地0.1g/L至1g/L。
培养基中所含的碳源的实例可包括糖和碳水化合物,如葡萄糖、蔗糖、乳糖、果糖、麦芽糖、淀粉和纤维素;油和脂肪,如大豆油、葵花籽油、蓖麻油和椰子油等;脂肪酸,如棕榈酸、硬脂酸和亚油酸;醇,如甘油和乙醇等;和有机酸,如乙酸。这些碳源可单独使用或组合使用,但不限于此。
培养基中所含的氮源的实例可包括有机氮源,如蛋白胨、酵母提取物、肉汁、麦芽提取物、玉米浆和豆粉;无机氮源,如尿素、硫酸铵、氯化铵、磷酸铵、碳酸铵和硝酸铵。这些氮源可单独使用或组合使用,但不限于此。
培养基中所含的磷源的实例可包括磷酸二氢钾、磷酸氢二钾和对应的含钠盐,但不限于此。
另外,培养基可包含金属盐,如硫酸镁或硫酸铁,并且可进一步含有氨基酸、维生素和适当的前体。这些培养基或前体可以以分批培养或连续培养的形式被添加到培养物中,但不限于此。
培养物的pH可通过在培养过程中以适当的方式添加诸如氢氧化铵、氢氧化钾、氨、磷酸和硫酸的化合物来调节。另外,可在培养过程中利用消泡剂如脂肪酸聚二醇酯来防止气泡形成。进一步,可将氧气或含氧气体注入培养物以维持培养物的有氧条件;或者可注入氮气、氢气或二氧化碳以维持无氧或微氧条件,不注入气体。培养物的温度可在25℃至 40℃的范围内,具体30℃至35℃。培养可以持续,直到可实现所期望的材料的生产,具体地10小时至100小时,但不限于这些示例性实例。
本申请可还包括在本申请方法中在培养步骤前制备培养基的步骤,但不限于此。
本申请可还包括在本申请方法中在培养步骤后回收培养步骤中生产的OPS的步骤。可根据培养方法,例如分批培养、连续培养和补料-分批培养,通过利用本领域已知的适当方法进行分离和纯化,从培养物回收目标OPS,但不限于此。
在本申请的再另一方面中,本申请提供了生产半胱氨酸或其衍生物的方法,所述方法包括:
a)通过在培养基中培养生产O-磷酸丝氨酸(OPS)的微生物来生产O-磷酸丝氨酸或含有其的培养基,所述微生物包含以下中的任意一种或多种:具有O-磷酸丝氨酸输出活性的多肽,所述多肽包括a)对应于SEQ ID NO:11的氨基酸序列中241的位置处的异亮氨酸(I)被苏氨酸(T)取代,对应于SEQ ID NO:11的氨基酸序列中246的位置处的天冬氨酸(D)被缬氨酸(V)取代,和对应于SEQ ID NO:11的氨基酸序列中330的位置处的缬氨酸(V)被异亮氨酸(I)取代,并且具有氨基酸序列,其中b)对应于88的位置处的氨基酸是苯丙氨酸,并且c)对应于207的位置处的氨基酸是赖氨酸(K);或具有SEQ ID NO:1的氨基酸序列的具有O-磷酸丝氨酸输出活性的多肽、编码本申请的多肽的多核苷酸、和含有本申请的多核苷酸的载体;和
b)在O-磷酸丝氨酸硫化氢解酶(OPSS)或表达其的微生物的存在下,使步骤a)中生产的O-磷酸丝氨酸或含有其的培养基与硫化物反应。
SEQ ID NO:11、SEQ ID NO:1、O-磷酸丝氨酸、具有O-磷酸丝氨酸输出活性的多肽、多核苷酸、载体、和微生物与上述相同。
如本文所用,术语“衍生物”是指通过化学修饰任何化合物的部分而获得的相似化合物。该术语通常指代其中氢原子或具体原子基团被其他原子或原子基团取代的化合物。
如本文所用,术语“半胱氨酸衍生物”是指半胱氨酸中的氢原子或具体原子基团被其他原子或原子基团取代的化合物。例如,半胱氨酸衍生物可具有如下形式:其中半胱氨酸中的氨基(–NH2)的氮原子或硫醇基(–SH)的硫原子有其他原子或原子基团与其附接,并且半胱氨酸衍生物的实例可包括NAC(N-乙酰半胱氨酸)、SCMC(S-羧甲基半胱氨酸)、 Boc-Cys(Me)-OH、(R)-S-(2-氨基-2-羧乙基)-L-高半胱氨酸,(R)-2-氨基-3-磺基丙酸、D-2- 氨基-4-(乙基硫)丁酸、3-亚磺基-L-丙氨酸、Fmoc-Cys(Boc-甲基)-OH、硒基-L-胱氨酸、S-(2- 噻唑基)-L-半胱氨酸、S-(2-噻吩基)-L-半胱氨酸、S-(4-甲苯基)-L-半胱氨酸等,但不限于此。
只要半胱氨酸是根据本申请的方法生产的,向半胱氨酸衍生物的转化就能够容易地通过本领域公知的方法转化成各种半胱氨酸衍生物。
具体地,生产半胱氨酸衍生物的方法可还包括将步骤b)中生产的半胱氨酸转化为半胱氨酸衍生物。例如,半胱氨酸可通过与乙酰化剂的反应被合成为N-乙酰半胱氨酸(NAC),或者其可通过在碱性条件下与卤代乙酸的反应被合成为S-羧甲基半胱氨酸(SCMC),但不限于此。
这些半胱氨酸衍生物主要用作药物材料,用于镇咳剂、止咳剂(cough-relievingagents)、以及支气管炎、支气管哮喘、咽喉炎等的治疗剂,但不限于此。
如本文所用,术语“O-磷酸丝氨酸硫化氢解酶(OPSS)”是指催化OPS由硫醇基转化为半胱氨酸的反应的酶。该酶可能首次被发现于敏捷气热菌(Aeropyrum pernix)、结核分枝杆菌(Mycobacterium tuberculosis)、***垢分枝杆菌(Mycobacterium smegmatis)、和***毛滴虫(Trichomonas vaginalis)(Mino K.和Ishikawa K.,FEBS Letters,551:133–138,2003; Burns K.E.等,J.Am.Chem.Soc.,127:11602–11603,2005)。另外,OPSS可不仅包括野生型 OPSS蛋白,而且包括在编码OPSS的多核苷酸序列的部分中包括缺失、取代或添加的、显示等同于或高于野生型OPSS蛋白的生物活性的变异蛋白,并且可还包括在US8557549 B2和US 9127324 B2中公开的所有OPSS蛋白及其变体。
待用于本申请中的硫化物可以是提供的任何硫化物,不仅本领域常用的固体形式,而且液体或气体形式——由于pH、压力和溶解度的差异,并且因此可以转化为硫醇(SH)基团——以例如硫化物(硫基,sulfide)(S2-)或硫代硫酸根(thiosulfate)(S2O3 2-)的形式。具体地,硫化物可包括Na2S、NaSH、H2S、(NH4)2S和Na2S2O3——其可向OPS提供硫醇基,但不限于此。在反应中,单个硫醇基被提供给单个反应性OPS基团以产生单个半胱氨酸或其衍生物。在此反应中,硫化物具体地以,基于OPS的摩尔浓度,0.1至3摩尔当量,具体地1至2摩尔当量的量被添加,但不限于此。
进一步,本申请的方法可进一步包括回收在上述反应步骤中生产的半胱氨酸。具体地,可利用本领域已知的适当反应,通过从反应溶液分离和纯化,来回收期望的半胱氨酸。
在本申请的又另一方面中,本申请提供了以下多肽用于生产O-磷酸丝氨酸、半胱氨酸或半胱氨酸衍生物的用途:具有O-磷酸丝氨酸输出活性的多肽,该多肽包括a)对应于SEQ ID NO:11的氨基酸序列中241的位置处的异亮氨酸(I)被苏氨酸(T)取代,对应于SEQID NO:11的氨基酸序列中246的位置处的天冬氨酸(D)被缬氨酸(V)取代,和对应于 SEQ IDNO:11的氨基酸序列中330的位置处的缬氨酸(V)被异亮氨酸(I)取代,并且具有氨基酸序列,其中b)对应于88的位置处的氨基酸是苯丙氨酸,并且c)对应于207 的位置处的氨基酸是赖氨酸(K);或具有O-磷酸丝氨酸输出活性的具有SEQ ID NO:1的氨基酸序列的多肽。
在又另一方面中,本申请提供了以下用于将O-磷酸丝氨酸从微生物输出的用途:具有 O-磷酸丝氨酸输出活性的多肽,该多肽包括a)对应于SEQ ID NO:11的氨基酸序列中241 的位置处的异亮氨酸(I)被苏氨酸(T)取代,对应于SEQ ID NO:11的氨基酸序列中246的位置处的天冬氨酸(D)被缬氨酸(V)取代,和对应于SEQ ID NO:11的氨基酸序列中 330的位置处的缬氨酸(V)被异亮氨酸(I)取代,并且具有氨基酸序列,其中b)对应于88的位置处的氨基酸是苯丙氨酸,并且c)对应于207的位置处的氨基酸是赖氨酸(K);或具有O-磷酸丝氨酸输出活性的具有SEQ ID NO:1的氨基酸序列的多肽。
SEQ ID NO:11、SEQ ID NO:1、O-磷酸丝氨酸、半胱氨酸、半胱氨酸衍生物、和微生物与上述相同。
实施例
在下文中,将通过实施例详细描述本申请。然而,这些实施例仅仅是出于示例目的而给出的优选实施例,因此,本申请的范围并不意图限于这些实施例或被这些实施例的限制。同时,本申请技术领域或相似技术领域的技术人员可充分理解并容易地实施本文中未描述的技术特征。
实施例1:YhhS主要促进因子超家族(MFS)转运蛋白变体的制备
为了提高O-磷酸丝氨酸(以下称为“OPS”)输出体(exporter)的活性以提高生产OPS 的菌株中的OPS输出活性,制备了YhhS主要促进因子超家族(MFS)转运蛋白(SEQ IDNO:11)——一种OPS输出体蛋白——和yhhS(SEQ ID NO:12)——编码其的基因——的变体。下面描述详细过程。
首先,构建yhhS基因变体的文库。为此,基于大肠杆菌K12_W3110(ATCC27325) 的基因组DNA作为模板,利用基因特异性引物对(SEQ ID NO:13和14),进行随机诱变 PCR(JENA易错PCR)。如下进行PCR:在94℃下变性5分钟,之后在94℃下变性30 秒,在55℃下退火30秒,和在72℃下聚合1分钟,20个循环,然后在72℃下聚合5分钟。为了将由此制备的突变基因片段***带有rhtB启动子的pCL1920载体,首先构建 pCL_PrhtB载体。利用基因特异性引物对(SEQ ID NO:16和17)进行PCR,以固定rhtB 启动子(SEQ ID NO:15)。如下进行PCR:在94℃下变性5分钟,之后在94℃下变性30 秒,在55℃下退火30秒,并在72℃下聚合1分钟,30个循环,然后在72℃下聚合5分钟。将rhtB启动子片段***用SacI和SmaI切割的pCL1920载体(GenBank No.AB236930) 中以获得pCL_PrhtB。用SmaI和PstI切割pCL_PrhtB载体,然后利用In-fusion克隆试剂盒(Clontech Laboratories,Inc.)将突变基因片段克隆到其中。克隆在50℃下进行60分钟,从而构建pCL PrhtB yhhS基因变体的质粒文库。这里使用的引物序列在下表1中显示。
[表1]
Figure BDA0003707612420000171
通过高通量筛选(HTS)来筛选由此构建的重组质粒文库。具体地,用于筛选的平台菌株是CA07-0012(KCCM11121P,US 8557549 B2),其是内源磷酸丝氨酸磷酸酶(SerB) 活性在野生型大肠杆菌菌株W3110的基础上减弱的菌株。
随后,为了获得具有提高的OPS输出活性的变体,通过电穿孔将由此构建的 pCL_PrhtB-yhhS基因变体质粒文库转化到平台菌株CA07-0012中,然后在含有过量OPS 的培养基中培养,并选择生长抑制被释放的三个集落。然后,从三个选择的集落获得质粒,并通过测序技术进行分析。
由上,选择在过量OPS添加的条件下涉及生长抑制释放的三种yhhS基因变体,并获得优于yhhS M45(US 2019-0233859 A1)——一种OPS输出活性增加的现有yhhS基因变体——的变体,并命名为yhhS453。
在对yhhS453编码的多肽的氨基酸序列分析后,证实YhhS453具有SEQ ID NO:1的氨基酸序列。
实施例2:证实yhhS基因变体yhhS453的OPS输出活性
2-1.利用OPS生产菌株构建引入有yhhS453的菌株并评价OPS生产能力
通过本领域常用的电穿孔,将实施例1中鉴定的一种类型的质粒变体,质粒 pCL_PrhtB-yhhS453,转化到OPS生产菌株CA07-0012中。由此,构建 CA07-0012/pCL_PrhtB-yhhS453,引入有yhhS基因变体yhhS453的OPS生产菌株,并评价其OPS生产能力。
具体地,将各菌株铺开(plated out)在固体LB培养基上并在33℃培养箱中培养过夜。将在固体LB培养基中培养过夜的菌株接种到下表2所示的25mL滴度培养基中,然后在33℃培养箱中以200rpm的速率培养48小时。结果显示在下表3中。
[表2]
培养基组分 含量
葡萄糖 40g
KH<sub>2</sub>PO<sub>4</sub>(KP1) 6g
(NH<sub>4</sub>)<sub>2</sub>SO<sub>4</sub> 17g
MgSO<sub>4</sub>·7H<sub>2</sub>O 1g
MnSO<sub>4</sub>·4H<sub>2</sub>O 5mg
FeSO<sub>4</sub>·7H<sub>2</sub>O 10mg
L-甘氨酸 2.5g/L
酵母提取物 3g/L
CaCO<sub>3</sub> 30g/L
pH 6.8
[表3]
Figure BDA0003707612420000181
Figure BDA0003707612420000191
如表3所示,在引入有本申请的yhhS基因变体的菌株的情况下,证实与引入有野生型 yhhS基因的菌株相比,OPS产量增加。另外,还证实与yhhS M45(平台yhhS基因变体) 相比,OPS产量增加。具体地,yhhS453显示,OPS浓度与野生型yhhS相比增加82%,并且与平台yhhS基因变体yhhS M45相比增加35%。
CA07-0012/pCL_PrhtB-yhhS453被命名为大肠杆菌(Escherichia coli)CA07-0352,并且CA07-0352菌株于2020年5月14日按照布达佩斯条约被保藏在韩国微生物保藏中心 (Korean Culture Center of Microorganisms)(KCCM)(韩国,首尔),登录号为KCCM12720P。
2-2.利用SerA和SerC增强的菌株构建引入有yhhS453的菌株并评价OPS生产能力为了重证实yhhS453的活性,使用CA07-0022/pCL-Prmf-serA*(G336V)-serC (KCCM11103P,US 8557549 B2),其作为OPS生产能力提高的OPS生产菌株具有活性增强的D-3-磷酸甘油酸脱氢酶(SerA)和3-磷酸丝氨酸氨基转移酶(SerC)作为OPS生物合成途径。
将yhhS453克隆到pCL_Prmf-serA*(G336V)-serC载体的HindIII限制酶位点。首先,基于pCL_PrhtB-yhhS453为模板,用SEQ ID NO:18和19的引物对进行PCR,以获得yhhS453基因片段。如下进行PCR:在94℃下变性5分钟,之后30个循环的在94℃下变性30秒,在55℃下退火30秒,和在72℃下聚合1分钟,然后在72℃下聚合5分钟。利用infusion克隆试剂盒克隆通过PCR获得的yhhS453基因片段。克隆在50℃下进行60分钟,从而构建pCL_Prmf-serA*(G336V)-(RBS)serC_PrhtB-yhhS453变体质粒。作为对照,使用CA07-0022/pCL_Prmf-serA*(G336V)-(RBS)serC_PrhtB-yhhS M25和 CA07-0022/pCL_Prmf-serA*(G336V)-(RBS)serC_PrhtB-yhhS M45(US 2019-0233859 A1)。这里使用的引物序列在下表4中显示。
[表4]
Figure BDA0003707612420000192
通过本领域常用的电穿孔,将由此构建的各质粒转化到OPS生产菌株CA07-0012中。由此,构建引入有yhhS基因变体yhhS453的生产OPS的菌株, CA07-0022/pCL_Prmf-serA*(G336V)-(RBS)serC_PrhtB-yhhS453,并评价其OPS生产能力。
具体地,将各菌株铺开在固体LB培养基上,然后在33℃培养箱中培养过夜。将在固体LB培养基中培养过夜的菌株接种到上表1所示的25mL滴度培养基中,然后在33℃培养箱中以200rpm的速率培养48小时。结果显示在下表5中。
[表5]
Figure BDA0003707612420000201
如表5所示,当将本申请的yhhS453引入其中OPS生物合成途径基因增强的OPS生产菌株时,证实OPS产量可以被提高。此结果表明,本申请的yhhS453能够有效地用于 OPS生产。
CA07-0022/pCL_Prmf-serA*(G336V)-(RBS)serC_PrhtB-yhhS453被命名为大肠杆菌 (Escherichia coli)CA07-0353,并且CA07-0353菌株于2020年5月14日按照布达佩斯条约被保藏在韩国微生物保藏中心(KCCM)(韩国,首尔),登录号为KCCM12721P。
2-3.根据染色体上启动子强度构建引入有yhhS453的菌株并评价OPS生产能力
为了证实在染色体上引入yhhS453时是否提高OPS输出活性,用trc启动子取代微生物的自体启动子,并构建引入有本申请的yhhS453的菌株和对其OPS生产能力进行评价。具体地,利用pSKH130载体(SEQ ID NO:30)将trc启动子***大肠杆菌的染色体中。该载体含有PI蛋白(pir基因)依赖性R6K复制子、SacB(果聚糖蔗糖酶)基因和卡那霉素抗性基因。在利用该载体第一次杂交时利用R6K和卡那霉素获得期望的菌株后,从含蔗糖的培养基中去除抗生素以制备菌株。具体地,构建pSKH130_yhhS453载体,以用yhhS453 替换CA07-0022菌株中的自体yhhS。为了构建pSKH130-yhhS453,基于实施例1中获得的 pCL_PrhtB-yhhS453作为模板,用SEQ ID NO:20和21的引物对进行PCR,以获得yhhS453 基因片段。如下进行PCR:在94℃下变性5分钟,之后30个循环的在94℃下变性30秒,在55℃下退火30秒,和在72℃下聚合1分钟,然后在72℃下聚合5分钟。用经限制酶 EcoRV处理的pSKH130载体和in-fusion克隆试剂盒(Clontech Laboratories,Inc.)克隆扩增的基因片段,以获得pSK-yhhS453。通过电穿孔将获得的质粒转化到CA7-0022菌株中。在转化的菌株中,通过重组(杂交)来选择在含有卡那霉素的LB固体培养基中引入到染色体中的菌株,然后在含有蔗糖的培养基中通过二次重组(替换)从染色体切割质粒位点。二次重组完成后,对菌株利用SEQID NO:22和23的引物进行PCR和进行序列分析,以构建CA07-0022::yhhS453菌株。
构建PSKH130-Ptrc-yhhS453′以增强由此构建的CA07-0022::yhhS453菌株中yhhS453 的启动子。具体地,基于大肠杆菌野生型W3110菌株作为模板,用SEQ ID NO:24和25 的引物对进行PCR,以获得yhhSUP DNA片段。如下进行PCR:在94℃下变性5分钟,之后30个循环的在94℃下变性30秒,在55℃下退火30秒,和在72℃下聚合1分钟,然后在72℃下聚合5分钟。随后,基于pCL_Ptrc-gfp(US 2017-0247727 A1)作为模板,用 SEQ ID NO:26和27的引物对进行PCR,以获得Ptrc的DNA片段。如下进行PCR:在94℃下变性5分钟,之后30个循环的在94℃下变性30秒,在55℃下退火30秒,和在72℃下聚合1分钟,然后在72℃下聚合5分钟。进一步,基于pCL_PrhtB-yhhS453作为模板,用 SEQ ID NO:28和29的引物对进行PCR,以获得yhhS453片段。如下进行PCR:在94℃下变性5分钟,之后30个循环的在94℃下变性30秒,在55℃下退火30秒,和在72℃下聚合1分钟,然后在72℃下聚合5分钟。用经限制酶EcoRV和IST处理的pSKH130载体克隆扩增的基因片段,以获得pSKH_yhhSUP_Ptrc-yhhS453。通过电穿孔将获得的质粒转化到CA7-0022::yhhS453菌株中。在转化的菌株中,通过重组(杂交)来选择在含有卡那霉素的LB固体培养基中引入到染色体中的菌株,然后在含有蔗糖的培养基中通过二次重组 (替换)从染色体切割质粒位点。二次重组完成后,利用SEQ ID NO:22和23的引物对来证实菌株。所构建的菌株被命名为CA07-0022::Ptrc-yhhS453。这里使用的引物序列在下表 6中显示。
[表6]
Figure BDA0003707612420000211
作为对照组,使用以上述相同方式构建的CA07-0022::Ptrc-yhhS、CA07-0022::Ptrc-yhhS M25和CA07-0022::Ptrc-yhhS M45。用于PCR的引物的核苷酸序列与上述相同。通过本领域常用的电穿孔,通过引入serA和serC增强的载体pCL_Prmf-serA*(G336V)-(RBS)serC 来转化由此构建的菌株,以证实OPS生产能力。
将各菌株铺开在固体LB培养基上并在33℃培养箱中培养过夜。将在固体LB培养基中培养过夜的菌株接种到上表1所示的25mL滴度培养基中,然后在33℃培养箱中以200 rpm的速率培养48小时。结果显示在下表7中。
[表7]
Figure BDA0003707612420000221
如上表7所示,当通过增强染色体上的启动子来增加yhhS453的活性时,证实OPS产量与引入了野生型yhhS的菌株相比增加超过两倍,并且还证实OPS浓度与其它yhhS基因变体M45和M25相比显著增加。
本领域普通技术人员将认识到,本申请可以以其它具体形式来实施,而不脱离其精神或本质特征。所描述的实施方式在所有方面都仅被认为是示例性而非限制性的。因此,本申请的范围由所附权利要求而非前文描述指明。所有落入权利要求的等同意义和范围内的变化都被包含在本申请的范围内。
关于用于专利程序的微生物保藏的国际承认的布达佩斯条约国际形式
CJ第一制糖株式会社由本页底部确定的国际保藏
CJ CHEILJEDANG CENTER,330,机构依照第7.1条发布
DONGHO-RO,JUNG-GU,
首尔100-400,大韩民国
Figure BDA0003707612420000231
以上译文确认与原文内容没有区别。
2020年6月9日
关于用于专利程序的微生物保藏的国际承认的布达佩斯条约国际形式
CJ第一制糖株式会社由本页底部确定的国际保藏
CJ CHEILJEDANG CENTER,330,机构依照第7.1条发布
DONGHO-RO,JUNG-GU,
首尔100-400,大韩民国
Figure BDA0003707612420000241
以上译文确认与原文内容没有区别。
2020年6月9日。
<110> CJ第一制糖株式会社
<120> O-磷酸丝氨酸输出蛋白变体和利用其生产O-磷酸丝氨酸、半胱氨酸及其衍生物的方法
<130> OPA21198-PCT
<150> KR 10-2020-0069753
<151> 2020-06-09
<160> 30
<170> KoPatentIn 3.0
<210> 1
<211> 405
<212> PRT
<213> 人工序列
<220>
<223> yhhS453
<400> 1
Met Pro Glu Pro Val Ala Glu Pro Ala Leu Asn Gly Leu Arg Leu Asn
1 5 10 15
Leu Arg Ile Val Ser Ile Val Met Phe Asn Phe Ala Ser Tyr Leu Thr
20 25 30
Ile Gly Leu Pro Leu Ala Val Leu Pro Gly Tyr Val His Asp Val Met
35 40 45
Gly Phe Ser Ala Phe Trp Ala Gly Leu Val Ile Ser Leu Gln Tyr Phe
50 55 60
Ala Thr Leu Leu Ser Arg Pro His Ala Gly Arg Tyr Ala Asp Ser Leu
65 70 75 80
Gly Pro Lys Lys Ile Val Val Phe Gly Leu Cys Gly Cys Phe Leu Ser
85 90 95
Gly Leu Gly Tyr Leu Thr Ala Gly Leu Thr Ala Ser Leu Pro Val Ile
100 105 110
Ser Leu Leu Leu Leu Cys Leu Gly Arg Val Ile Leu Gly Ile Gly Gln
115 120 125
Ser Phe Ala Gly Thr Gly Ser Thr Leu Trp Gly Val Gly Val Val Gly
130 135 140
Ser Leu His Ile Gly Arg Val Ile Ser Trp Asn Gly Ile Val Thr Tyr
145 150 155 160
Gly Ala Met Ala Met Gly Ala Pro Leu Gly Val Val Phe Tyr His Trp
165 170 175
Gly Gly Leu Gln Ala Leu Ala Leu Ile Ile Met Gly Val Ala Leu Val
180 185 190
Ala Ile Leu Leu Ala Ile Pro Arg Pro Thr Val Lys Ala Ser Lys Gly
195 200 205
Lys Pro Leu Pro Phe Arg Ala Val Leu Gly Arg Val Trp Leu Tyr Gly
210 215 220
Met Ala Leu Ala Leu Ala Ser Ala Gly Phe Gly Val Ile Ala Thr Phe
225 230 235 240
Thr Thr Leu Phe Tyr Val Ala Lys Gly Trp Asp Gly Ala Ala Phe Ala
245 250 255
Leu Thr Leu Phe Ser Cys Ala Phe Val Gly Thr Arg Leu Leu Phe Pro
260 265 270
Asn Gly Ile Asn Arg Ile Gly Gly Leu Asn Val Ala Met Ile Cys Phe
275 280 285
Ser Val Glu Ile Ile Gly Leu Leu Leu Val Gly Val Ala Thr Met Pro
290 295 300
Trp Met Ala Lys Ile Gly Val Leu Leu Ala Gly Ala Gly Phe Ser Leu
305 310 315 320
Val Phe Pro Ala Leu Gly Val Val Ala Ile Lys Ala Val Pro Gln Gln
325 330 335
Asn Gln Gly Ala Ala Leu Ala Thr Tyr Thr Val Phe Met Asp Leu Ser
340 345 350
Leu Gly Val Thr Gly Pro Leu Ala Gly Leu Val Met Ser Trp Ala Gly
355 360 365
Val Pro Val Ile Tyr Leu Ala Ala Ala Gly Leu Val Ala Ile Ala Leu
370 375 380
Leu Leu Thr Trp Arg Leu Lys Lys Arg Pro Pro Glu His Val Pro Glu
385 390 395 400
Ala Ala Ser Ser Ser
405
<210> 2
<211> 1218
<212> DNA
<213> 人工序列
<220>
<223> yhhS453
<400> 2
atgcccgaac ccgtagccga acccgcgcta aacggattgc gcctgaattt gcgcattgtc 60
tctatagtca tgtttaactt cgccagctac ctcaccatcg ggttgccgct cgctgtatta 120
ccgggctatg tccatgatgt gatgggcttt agcgccttct gggcaggatt ggttatcagc 180
ctgcaatatt tcgccacctt gctgagccgc cctcatgccg gacgttacgc cgattcgctg 240
ggacccaaaa agattgtcgt cttcggttta tgcggctgct ttttgagcgg tctggggtat 300
ctgacggcag gattaaccgc cagtctgcct gtcatcagcc tgttattact ttgcctgggg 360
cgcgtcatcc ttgggattgg gcaaagtttt gccggaacgg gatcgaccct atggggcgtt 420
ggcgtggttg gctcgctgca tatcgggcgg gtgatttcgt ggaacggcat tgtcacttac 480
ggggcgatgg cgatgggtgc gccgttaggc gtcgtgtttt atcactgggg cggcttgcag 540
gcgttagcgt taatcattat gggcgtggcg ctggtggcca ttttgttggc gatcccgcgt 600
ccgacggtaa aagccagtaa aggcaaaccg ctgccgtttc gcgcggtgct tgggcgcgtc 660
tggctgtacg gtatggcgct ggcactggct tccgccggat ttggcgtcat cgccaccttt 720
accacgctgt tttatgtcgc taaaggttgg gacggtgcgg ctttcgcgct gacgctgttt 780
agctgtgcgt ttgtcggtac gcgtttgtta ttccctaacg gcattaaccg tatcggtggc 840
ttaaacgtag cgatgatttg ctttagcgtt gagataatcg gcctgctact ggttggcgtg 900
gcgactatgc cgtggatggc gaaaatcggc gtcttactgg cgggggccgg gttttcgctg 960
gtgttcccgg cattgggtgt agtggcgata aaagcggttc cgcagcaaaa tcagggggcg 1020
gcgctggcaa cttacaccgt atttatggat ttatcgcttg gcgtgactgg accactggct 1080
gggctggtga tgagctgggc gggcgtaccg gtgatttatc tggcggcggc gggactggtc 1140
gcaatcgcgt tattactgac gtggcgatta aaaaaacggc ctccggaaca cgtccctgag 1200
gccgcctcat catcttaa 1218
<210> 3
<211> 322
<212> PRT
<213> 人工序列
<220>
<223> serB
<400> 3
Met Pro Asn Ile Thr Trp Cys Asp Leu Pro Glu Asp Val Ser Leu Trp
1 5 10 15
Pro Gly Leu Pro Leu Ser Leu Ser Gly Asp Glu Val Met Pro Leu Asp
20 25 30
Tyr His Ala Gly Arg Ser Gly Trp Leu Leu Tyr Gly Arg Gly Leu Asp
35 40 45
Lys Gln Arg Leu Thr Gln Tyr Gln Ser Lys Leu Gly Ala Ala Met Val
50 55 60
Ile Val Ala Ala Trp Cys Val Glu Asp Tyr Gln Val Ile Arg Leu Ala
65 70 75 80
Gly Ser Leu Thr Ala Arg Ala Thr Arg Leu Ala His Glu Ala Gln Leu
85 90 95
Asp Val Ala Pro Leu Gly Lys Ile Pro His Leu Arg Thr Pro Gly Leu
100 105 110
Leu Val Met Asp Met Asp Ser Thr Ala Ile Gln Ile Glu Cys Ile Asp
115 120 125
Glu Ile Ala Lys Leu Ala Gly Thr Gly Glu Met Val Ala Glu Val Thr
130 135 140
Glu Arg Ala Met Arg Gly Glu Leu Asp Phe Thr Ala Ser Leu Arg Ser
145 150 155 160
Arg Val Ala Thr Leu Lys Gly Ala Asp Ala Asn Ile Leu Gln Gln Val
165 170 175
Arg Glu Asn Leu Pro Leu Met Pro Gly Leu Thr Gln Leu Val Leu Lys
180 185 190
Leu Glu Thr Leu Gly Trp Lys Val Ala Ile Ala Ser Gly Gly Phe Thr
195 200 205
Phe Phe Ala Glu Tyr Leu Arg Asp Lys Leu Arg Leu Thr Ala Val Val
210 215 220
Ala Asn Glu Leu Glu Ile Met Asp Gly Lys Phe Thr Gly Asn Val Ile
225 230 235 240
Gly Asp Ile Val Asp Ala Gln Tyr Lys Ala Lys Thr Leu Thr Arg Leu
245 250 255
Ala Gln Glu Tyr Glu Ile Pro Leu Ala Gln Thr Val Ala Ile Gly Asp
260 265 270
Gly Ala Asn Asp Leu Pro Met Ile Lys Ala Ala Gly Leu Gly Ile Ala
275 280 285
Tyr His Ala Lys Pro Lys Val Asn Glu Lys Ala Glu Val Thr Ile Arg
290 295 300
His Ala Asp Leu Met Gly Val Phe Cys Ile Leu Ser Gly Ser Leu Asn
305 310 315 320
Gln Lys
<210> 4
<211> 969
<212> DNA
<213> 人工序列
<220>
<223> serB
<400> 4
atgcctaaca ttacctggtg cgacctgcct gaagatgtct ctttatggcc gggtctgcct 60
ctttcattaa gtggtgatga agtgatgcca ctggattacc acgcaggtcg tagcggctgg 120
ctgctgtatg gtcgtgggct ggataaacaa cgtctgaccc aataccagag caaactgggt 180
gcggcgatgg tgattgttgc cgcctggtgc gtggaagatt atcaggtgat tcgtctggca 240
ggttcactca ccgcacgggc tacacgcctg gcccacgaag cgcagctgga tgtcgccccg 300
ctggggaaaa tcccgcacct gcgcacgccg ggtttgctgg tgatggatat ggactccacc 360
gccatccaga ttgaatgtat tgatgaaatt gccaaactgg ccggaacggg cgagatggtg 420
gcggaagtaa ccgaacgggc gatgcgcggc gaactcgatt ttaccgccag cctgcgcagc 480
cgtgtggcga cgctgaaagg cgctgacgcc aatattctgc aacaggtgcg tgaaaatctg 540
ccgctgatgc caggcttaac gcaactggtg ctcaagctgg aaacgctggg ctggaaagtg 600
gcgattgcct ccggcggctt tactttcttt gctgaatacc tgcgcgacaa gctgcgcctg 660
accgccgtgg tagccaatga actggagatc atggacggta aatttaccgg caatgtgatc 720
ggcgacatcg tagacgcgca gtacaaagcg aaaactctga ctcgcctcgc gcaggagtat 780
gaaatcccgc tggcgcagac cgtggcgatt ggcgatggag ccaatgacct gccgatgatc 840
aaagcggcag ggctggggat tgcctaccat gccaagccaa aagtgaatga aaaggcggaa 900
gtcaccatcc gtcacgctga cctgatgggg gtattctgca tcctctcagg cagcctgaat 960
cagaagtaa 969
<210> 5
<211> 410
<212> PRT
<213> 人工序列
<220>
<223> SerA野生型
<400> 5
Met Ala Lys Val Ser Leu Glu Lys Asp Lys Ile Lys Phe Leu Leu Val
1 5 10 15
Glu Gly Val His Gln Lys Ala Leu Glu Ser Leu Arg Ala Ala Gly Tyr
20 25 30
Thr Asn Ile Glu Phe His Lys Gly Ala Leu Asp Asp Glu Gln Leu Lys
35 40 45
Glu Ser Ile Arg Asp Ala His Phe Ile Gly Leu Arg Ser Arg Thr His
50 55 60
Leu Thr Glu Asp Val Ile Asn Ala Ala Glu Lys Leu Val Ala Ile Gly
65 70 75 80
Cys Phe Cys Ile Gly Thr Asn Gln Val Asp Leu Asp Ala Ala Ala Lys
85 90 95
Arg Gly Ile Pro Val Phe Asn Ala Pro Phe Ser Asn Thr Arg Ser Val
100 105 110
Ala Glu Leu Val Ile Gly Glu Leu Leu Leu Leu Leu Arg Gly Val Pro
115 120 125
Glu Ala Asn Ala Lys Ala His Arg Gly Val Trp Asn Lys Leu Ala Ala
130 135 140
Gly Ser Phe Glu Ala Arg Gly Lys Lys Leu Gly Ile Ile Gly Tyr Gly
145 150 155 160
His Ile Gly Thr Gln Leu Gly Ile Leu Ala Glu Ser Leu Gly Met Tyr
165 170 175
Val Tyr Phe Tyr Asp Ile Glu Asn Lys Leu Pro Leu Gly Asn Ala Thr
180 185 190
Gln Val Gln His Leu Ser Asp Leu Leu Asn Met Ser Asp Val Val Ser
195 200 205
Leu His Val Pro Glu Asn Pro Ser Thr Lys Asn Met Met Gly Ala Lys
210 215 220
Glu Ile Ser Leu Met Lys Pro Gly Ser Leu Leu Ile Asn Ala Ser Arg
225 230 235 240
Gly Thr Val Val Asp Ile Pro Ala Leu Cys Asp Ala Leu Ala Ser Lys
245 250 255
His Leu Ala Gly Ala Ala Ile Asp Val Phe Pro Thr Glu Pro Ala Thr
260 265 270
Asn Ser Asp Pro Phe Thr Ser Pro Leu Cys Glu Phe Asp Asn Val Leu
275 280 285
Leu Thr Pro His Ile Gly Gly Ser Thr Gln Glu Ala Gln Glu Asn Ile
290 295 300
Gly Leu Glu Val Ala Gly Lys Leu Ile Lys Tyr Ser Asp Asn Gly Ser
305 310 315 320
Thr Leu Ser Ala Val Asn Phe Pro Glu Val Ser Leu Pro Leu His Gly
325 330 335
Gly Arg Arg Leu Met His Ile His Glu Asn Arg Pro Gly Val Leu Thr
340 345 350
Ala Leu Asn Lys Ile Phe Ala Glu Gln Gly Val Asn Ile Ala Ala Gln
355 360 365
Tyr Leu Gln Thr Ser Ala Gln Met Gly Tyr Val Val Ile Asp Ile Glu
370 375 380
Ala Asp Glu Asp Val Ala Glu Lys Ala Leu Gln Ala Met Lys Ala Ile
385 390 395 400
Pro Gly Thr Ile Arg Ala Arg Leu Leu Tyr
405 410
<210> 6
<211> 410
<212> PRT
<213> 人工序列
<220>
<223> SerA突变型
<400> 6
Met Ala Lys Val Ser Leu Glu Lys Asp Lys Ile Lys Phe Leu Leu Val
1 5 10 15
Glu Gly Val His Gln Lys Ala Leu Glu Ser Leu Arg Ala Ala Gly Tyr
20 25 30
Thr Asn Ile Glu Phe His Lys Gly Ala Leu Asp Asp Glu Gln Leu Lys
35 40 45
Glu Ser Ile Arg Asp Ala His Phe Ile Gly Leu Arg Ser Arg Thr His
50 55 60
Leu Thr Glu Asp Val Ile Asn Ala Ala Glu Lys Leu Val Ala Ile Gly
65 70 75 80
Cys Phe Cys Ile Gly Thr Asn Gln Val Asp Leu Asp Ala Ala Ala Lys
85 90 95
Arg Gly Ile Pro Val Phe Asn Ala Pro Phe Ser Asn Thr Arg Ser Val
100 105 110
Ala Glu Leu Val Ile Gly Glu Leu Leu Leu Leu Leu Arg Gly Val Pro
115 120 125
Glu Ala Asn Ala Lys Ala His Arg Gly Val Trp Asn Lys Leu Ala Ala
130 135 140
Gly Ser Phe Glu Ala Arg Gly Lys Lys Leu Gly Ile Ile Gly Tyr Gly
145 150 155 160
His Ile Gly Thr Gln Leu Gly Ile Leu Ala Glu Ser Leu Gly Met Tyr
165 170 175
Val Tyr Phe Tyr Asp Ile Glu Asn Lys Leu Pro Leu Gly Asn Ala Thr
180 185 190
Gln Val Gln His Leu Ser Asp Leu Leu Asn Met Ser Asp Val Val Ser
195 200 205
Leu His Val Pro Glu Asn Pro Ser Thr Lys Asn Met Met Gly Ala Lys
210 215 220
Glu Ile Ser Leu Met Lys Pro Gly Ser Leu Leu Ile Asn Ala Ser Arg
225 230 235 240
Gly Thr Val Val Asp Ile Pro Ala Leu Cys Asp Ala Leu Ala Ser Lys
245 250 255
His Leu Ala Gly Ala Ala Ile Asp Val Phe Pro Thr Glu Pro Ala Thr
260 265 270
Asn Ser Asp Pro Phe Thr Ser Pro Leu Cys Glu Phe Asp Asn Val Leu
275 280 285
Leu Thr Pro His Ile Gly Gly Ser Thr Gln Glu Ala Gln Glu Asn Ile
290 295 300
Gly Leu Glu Val Ala Gly Lys Leu Ile Lys Tyr Ser Asp Asn Gly Ser
305 310 315 320
Thr Leu Ser Ala Val Asn Phe Pro Glu Val Ser Leu Pro Leu His Val
325 330 335
Gly Arg Arg Leu Met His Ile His Glu Asn Arg Pro Gly Val Leu Thr
340 345 350
Ala Leu Asn Lys Ile Phe Ala Glu Gln Gly Val Asn Ile Ala Ala Gln
355 360 365
Tyr Leu Gln Thr Ser Ala Gln Met Gly Tyr Val Val Ile Asp Ile Glu
370 375 380
Ala Asp Glu Asp Val Ala Glu Lys Ala Leu Gln Ala Met Lys Ala Ile
385 390 395 400
Pro Gly Thr Ile Arg Ala Arg Leu Leu Tyr
405 410
<210> 7
<211> 1233
<212> DNA
<213> 人工序列
<220>
<223> SerA野生型
<400> 7
atggcaaagg tatcgctgga gaaagacaag attaagtttc tgctggtaga aggcgtgcac 60
caaaaggcgc tggaaagcct tcgtgcagct ggttacacca acatcgaatt tcacaaaggc 120
gcgctggatg atgaacaatt aaaagaatcc atccgcgatg cccacttcat cggcctgcga 180
tcccgtaccc atctgactga agacgtgatc aacgccgcag aaaaactggt cgctattggc 240
tgtttctgta tcggaacaaa ccaggttgat ctggatgcgg cggcaaagcg cgggatcccg 300
gtatttaacg caccgttctc aaatacgcgc tctgttgcgg agctggtgat tggcgaactg 360
ctgctgctat tgcgcggcgt gccggaagcc aatgctaaag cgcaccgtgg cgtgtggaac 420
aaactggcgg cgggttcttt tgaagcgcgc ggcaaaaagc tgggtatcat cggctacggt 480
catattggta cgcaattggg cattctggct gaatcgctgg gaatgtatgt ttacttttat 540
gatattgaaa ataaactgcc gctgggcaac gccactcagg tacagcatct ttctgacctg 600
ctgaatatga gcgatgtggt gagtctgcat gtaccagaga atccgtccac caaaaatatg 660
atgggcgcga aagaaatttc actaatgaag cccggctcgc tgctgattaa tgcttcgcgc 720
ggtactgtgg tggatattcc ggcgctgtgt gatgcgctgg cgagcaaaca tctggcgggg 780
gcggcaatcg acgtattccc gacggaaccg gcgaccaata gcgatccatt tacctctccg 840
ctgtgtgaat tcgacaacgt ccttctgacg ccacacattg gcggttcgac tcaggaagcg 900
caggagaata tcggcctgga agttgcgggt aaattgatca agtattctga caatggctca 960
acgctctctg cggtgaactt cccggaagtc tcgctgccac tgcacggtgg gcgtcgtctg 1020
atgcacatcc acgaaaaccg tccgggcgtg ctaactgcgc tgaacaaaat cttcgccgag 1080
cagggcgtca acatcgccgc gcaatatctg caaacttccg cccagatggg ttatgtggtt 1140
attgatattg aagccgacga agacgttgcc gaaaaagcgc tgcaggcaat gaaagctatt 1200
ccgggtacca ttcgcgcccg tctgctgtac taa 1233
<210> 8
<211> 1233
<212> DNA
<213> 人工序列
<220>
<223> SerA突变型
<400> 8
atggcaaagg tatcgctgga gaaagacaag attaagtttc tgctggtaga aggcgtgcac 60
caaaaggcgc tggaaagcct tcgtgcagct ggttacacca acatcgaatt tcacaaaggc 120
gcgctggatg atgaacaatt aaaagaatcc atccgcgatg cccacttcat cggcctgcga 180
tcccgtaccc atctgactga agacgtgatc aacgccgcag aaaaactggt cgctattggc 240
tgtttctgta tcggaacaaa ccaggttgat ctggatgcgg cggcaaagcg cgggatcccg 300
gtatttaacg caccgttctc aaatacgcgc tctgttgcgg agctggtgat tggcgaactg 360
ctgctgctat tgcgcggcgt gccggaagcc aatgctaaag cgcaccgtgg cgtgtggaac 420
aaactggcgg cgggttcttt tgaagcgcgc ggcaaaaagc tgggtatcat cggctacggt 480
catattggta cgcaattggg cattctggct gaatcgctgg gaatgtatgt ttacttttat 540
gatattgaaa ataaactgcc gctgggcaac gccactcagg tacagcatct ttctgacctg 600
ctgaatatga gcgatgtggt gagtctgcat gtaccagaga atccgtccac caaaaatatg 660
atgggcgcga aagaaatttc actaatgaag cccggctcgc tgctgattaa tgcttcgcgc 720
ggtactgtgg tggatattcc ggcgctgtgt gatgcgctgg cgagcaaaca tctggcgggg 780
gcggcaatcg acgtattccc gacggaaccg gcgaccaata gcgatccatt tacctctccg 840
ctgtgtgaat tcgacaacgt ccttctgacg ccacacattg gcggttcgac tcaggaagcg 900
caggagaata tcggcctgga agttgcgggt aaattgatca agtattctga caatggctca 960
acgctctctg cggtgaactt cccggaagtc tcgctgccac tgcacgttgg gcgtcgtctg 1020
atgcacatcc acgaaaaccg tccgggcgtg ctaactgcgc tgaacaaaat cttcgccgag 1080
cagggcgtca acatcgccgc gcaatatctg caaacttccg cccagatggg ttatgtggtt 1140
attgatattg aagccgacga agacgttgcc gaaaaagcgc tgcaggcaat gaaagctatt 1200
ccgggtacca ttcgcgcccg tctgctgtac taa 1233
<210> 9
<211> 362
<212> PRT
<213> 人工序列
<220>
<223> SerC
<400> 9
Met Ala Gln Ile Phe Asn Phe Ser Ser Gly Pro Ala Met Leu Pro Ala
1 5 10 15
Glu Val Leu Lys Gln Ala Gln Gln Glu Leu Arg Asp Trp Asn Gly Leu
20 25 30
Gly Thr Ser Val Met Glu Val Ser His Arg Gly Lys Glu Phe Ile Gln
35 40 45
Val Ala Glu Glu Ala Glu Lys Asp Phe Arg Asp Leu Leu Asn Val Pro
50 55 60
Ser Asn Tyr Lys Val Leu Phe Cys His Gly Gly Gly Arg Gly Gln Phe
65 70 75 80
Ala Ala Val Pro Leu Asn Ile Leu Gly Asp Lys Thr Thr Ala Asp Tyr
85 90 95
Val Asp Ala Gly Tyr Trp Ala Ala Ser Ala Ile Lys Glu Ala Lys Lys
100 105 110
Tyr Cys Thr Pro Asn Val Phe Asp Ala Lys Val Thr Val Asp Gly Leu
115 120 125
Arg Ala Val Lys Pro Met Arg Glu Trp Gln Leu Ser Asp Asn Ala Ala
130 135 140
Tyr Met His Tyr Cys Pro Asn Glu Thr Ile Asp Gly Ile Ala Ile Asp
145 150 155 160
Glu Thr Pro Asp Phe Gly Ala Asp Val Val Val Ala Ala Asp Phe Ser
165 170 175
Ser Thr Ile Leu Ser Arg Pro Ile Asp Val Ser Arg Tyr Gly Val Ile
180 185 190
Tyr Ala Gly Ala Gln Lys Asn Ile Gly Pro Ala Gly Leu Thr Ile Val
195 200 205
Ile Val Arg Glu Asp Leu Leu Gly Lys Ala Asn Ile Ala Cys Pro Ser
210 215 220
Ile Leu Asp Tyr Ser Ile Leu Asn Asp Asn Gly Ser Met Phe Asn Thr
225 230 235 240
Pro Pro Thr Phe Ala Trp Tyr Leu Ser Gly Leu Val Phe Lys Trp Leu
245 250 255
Lys Ala Asn Gly Gly Val Ala Glu Met Asp Lys Ile Asn Gln Gln Lys
260 265 270
Ala Glu Leu Leu Tyr Gly Val Ile Asp Asn Ser Asp Phe Tyr Arg Asn
275 280 285
Asp Val Ala Lys Ala Asn Arg Ser Arg Met Asn Val Pro Phe Gln Leu
290 295 300
Ala Asp Ser Ala Leu Asp Lys Leu Phe Leu Glu Glu Ser Phe Ala Ala
305 310 315 320
Gly Leu His Ala Leu Lys Gly His Arg Val Val Gly Gly Met Arg Ala
325 330 335
Ser Ile Tyr Asn Ala Met Pro Leu Glu Gly Val Lys Ala Leu Thr Asp
340 345 350
Phe Met Val Glu Phe Glu Arg Arg His Gly
355 360
<210> 10
<211> 1089
<212> DNA
<213> 人工序列
<220>
<223> SerC
<400> 10
atggctcaaa tcttcaattt tagttctggt ccggcaatgc taccggcaga ggtgcttaaa 60
caggctcaac aggaactgcg cgactggaac ggtcttggta cgtcggtgat ggaagtgagt 120
caccgtggca aagagttcat tcaggttgca gaggaagccg agaaggattt tcgcgatctt 180
cttaatgtcc cctccaacta caaggtatta ttctgccatg gcggtggtcg cggtcagttt 240
gctgcggtac cgctgaatat tctcggtgat aaaaccaccg cagattatgt tgatgccggt 300
tactgggcgg caagtgccat taaagaagcg aaaaaatact gcacgcctaa tgtctttgac 360
gccaaagtga ctgttgatgg tctgcgcgcg gttaagccaa tgcgtgaatg gcaactctct 420
gataatgctg cttatatgca ttattgcccg aatgaaacca tcgatggtat cgccatcgac 480
gaaacgccag acttcggcgc agatgtggtg gtcgccgctg acttctcttc aaccattctt 540
tcccgtccga ttgacgtcag ccgttatggt gtaatttacg ctggcgcgca gaaaaatatc 600
ggcccggctg gcctgacaat cgtcatcgtt cgtgaagatt tgctgggcaa agcgaatatc 660
gcgtgtccgt cgattctgga ttattccatc ctcaacgata acggctccat gtttaacacg 720
ccgccgacat ttgcctggta tctatctggt ctggtcttta aatggctgaa agcgaacggc 780
ggtgtagctg aaatggataa aatcaatcag caaaaagcag aactgctata tggggtgatt 840
gataacagcg atttctaccg caatgacgtg gcgaaagcta accgttcgcg gatgaacgtg 900
ccgttccagt tggcggacag tgcgcttgac aaattgttcc ttgaagagtc ttttgctgct 960
ggccttcatg cactgaaagg tcaccgtgtg gtcggcggaa tgcgcgcttc tatttataac 1020
gccatgccgc tggaaggcgt taaagcgctg acagacttca tggttgagtt cgaacgccgt 1080
cacggttaa 1089
<210> 11
<211> 405
<212> PRT
<213> 人工序列
<220>
<223> yhhS MFS
<400> 11
Met Pro Glu Pro Val Ala Glu Pro Ala Leu Asn Gly Leu Arg Leu Asn
1 5 10 15
Leu Arg Ile Val Ser Ile Val Met Phe Asn Phe Ala Ser Tyr Leu Thr
20 25 30
Ile Gly Leu Pro Leu Ala Val Leu Pro Gly Tyr Val His Asp Val Met
35 40 45
Gly Phe Ser Ala Phe Trp Ala Gly Leu Val Ile Ser Leu Gln Tyr Phe
50 55 60
Ala Thr Leu Leu Ser Arg Pro His Ala Gly Arg Tyr Ala Asp Ser Leu
65 70 75 80
Gly Pro Lys Lys Ile Val Val Phe Gly Leu Cys Gly Cys Phe Leu Ser
85 90 95
Gly Leu Gly Tyr Leu Thr Ala Gly Leu Thr Ala Ser Leu Pro Val Ile
100 105 110
Ser Leu Leu Leu Leu Cys Leu Gly Arg Val Ile Leu Gly Ile Gly Gln
115 120 125
Ser Phe Ala Gly Thr Gly Ser Thr Leu Trp Gly Val Gly Val Val Gly
130 135 140
Ser Leu His Ile Gly Arg Val Ile Ser Trp Asn Gly Ile Val Thr Tyr
145 150 155 160
Gly Ala Met Ala Met Gly Ala Pro Leu Gly Val Val Phe Tyr His Trp
165 170 175
Gly Gly Leu Gln Ala Leu Ala Leu Ile Ile Met Gly Val Ala Leu Val
180 185 190
Ala Ile Leu Leu Ala Ile Pro Arg Pro Thr Val Lys Ala Ser Lys Gly
195 200 205
Lys Pro Leu Pro Phe Arg Ala Val Leu Gly Arg Val Trp Leu Tyr Gly
210 215 220
Met Ala Leu Ala Leu Ala Ser Ala Gly Phe Gly Val Ile Ala Thr Phe
225 230 235 240
Ile Thr Leu Phe Tyr Asp Ala Lys Gly Trp Asp Gly Ala Ala Phe Ala
245 250 255
Leu Thr Leu Phe Ser Cys Ala Phe Val Gly Thr Arg Leu Leu Phe Pro
260 265 270
Asn Gly Ile Asn Arg Ile Gly Gly Leu Asn Val Ala Met Ile Cys Phe
275 280 285
Ser Val Glu Ile Ile Gly Leu Leu Leu Val Gly Val Ala Thr Met Pro
290 295 300
Trp Met Ala Lys Ile Gly Val Leu Leu Ala Gly Ala Gly Phe Ser Leu
305 310 315 320
Val Phe Pro Ala Leu Gly Val Val Ala Val Lys Ala Val Pro Gln Gln
325 330 335
Asn Gln Gly Ala Ala Leu Ala Thr Tyr Thr Val Phe Met Asp Leu Ser
340 345 350
Leu Gly Val Thr Gly Pro Leu Ala Gly Leu Val Met Ser Trp Ala Gly
355 360 365
Val Pro Val Ile Tyr Leu Ala Ala Ala Gly Leu Val Ala Ile Ala Leu
370 375 380
Leu Leu Thr Trp Arg Leu Lys Lys Arg Pro Pro Glu His Val Pro Glu
385 390 395 400
Ala Ala Ser Ser Ser
405
<210> 12
<211> 1218
<212> DNA
<213> 人工序列
<220>
<223> yhhS
<400> 12
atgcccgaac ccgtagccga acccgcgcta aacggattgc gcctgaattt gcgcattgtc 60
tctatagtca tgtttaactt cgccagctac ctcaccatcg ggttgccgct cgctgtatta 120
ccgggctatg tccatgatgt gatgggcttt agcgccttct gggcaggatt ggttatcagc 180
ctgcaatatt tcgccacctt gctgagccgc cctcatgccg gacgttacgc cgattcgctg 240
ggacccaaaa agattgtcgt cttcggttta tgcggctgct ttttgagcgg tctggggtat 300
ctgacggcag gattaaccgc cagtctgcct gtcatcagcc tgttattact ttgcctgggg 360
cgcgtcatcc ttgggattgg gcaaagtttt gccggaacgg gatcgaccct atggggcgtt 420
ggcgtggttg gctcgctgca tatcgggcgg gtgatttcgt ggaacggcat tgtcacttac 480
ggggcgatgg cgatgggtgc gccgttaggc gtcgtgtttt atcactgggg cggcttgcag 540
gcgttagcgt taatcattat gggcgtggcg ctggtggcca ttttgttggc gatcccgcgt 600
ccgacggtaa aagccagtaa aggcaaaccg ctgccgtttc gcgcggtgct tgggcgcgtc 660
tggctgtacg gtatggcgct ggcactggct tccgccggat ttggcgtcat cgccaccttt 720
atcacgctgt tttatgacgc taaaggttgg gacggtgcgg ctttcgcgct gacgctgttt 780
agctgtgcgt ttgtcggtac gcgtttgtta ttccctaacg gcattaaccg tatcggtggc 840
ttaaacgtag cgatgatttg ctttagcgtt gagataatcg gcctgctact ggttggcgtg 900
gcgactatgc cgtggatggc gaaaatcggc gtcttactgg cgggggccgg gttttcgctg 960
gtgttcccgg cattgggtgt agtggcggta aaagcggttc cgcagcaaaa tcagggggcg 1020
gcgctggcaa cttacaccgt atttatggat ttatcgcttg gcgtgactgg accactggct 1080
gggctggtga tgagctgggc gggcgtaccg gtgatttatc tggcggcggc gggactggtc 1140
gcaatcgcgt tattactgac gtggcgatta aaaaaacggc ctccggaaca cgtccctgag 1200
gccgcctcat catcttaa 1218
<210> 13
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> pCL_PrhtB-yhhS文库_F
<400> 13
caccgggagc ccgggatgcc cgaacccgta gccga 35
<210> 14
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> pCL_PrhtB-yhhS文库_R
<400> 14
cttgcatgcc tgcagttaag atgatgaggc ggcct 35
<210> 15
<211> 341
<212> DNA
<213> 人工序列
<220>
<223> rhtB启动子
<400> 15
cgatggtcga tgattaagac atcaaacccc aaatggaaca ggtcataggc cagttccgca 60
tattttacgt agctctcaat acgccccggg cagatgacta ccacccggtc atggtgctgt 120
gcgcgaaaac ggacaaagcg caccggaatg tcatccacac cagtaaactc tgcttcatca 180
cgctgacgcc agaaatcagt cagcggtccc atggtaaaag cagcaaacgc gttttctctt 240
gtttcccagt ctttttgctg ctgaaacatc gggtaatctg cctcttaaac cacgtaaaat 300
cgtttttttt agcgtgcctg acacaacgct gcgacagtag c 341
<210> 16
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> pCL_PrhtB_F
<400> 16
cggggatcct ctagacgctt gctgcaactc tctca 35
<210> 17
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> pCL_PrhtB_R
<400> 17
tacgggttcg ggcatgatat ctttcctgtg tgaaa 35
<210> 18
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> pCL_Prmf-serA*(G336V)-(RBS)serC_PrhtB-yhhS453_F
<400> 18
cacggttaaa agcttcgatg gtcgatgatt aagac 35
<210> 19
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> pCL_Prmf-serA*(G336V)-(RBS)serC_PrhtB-yhhS453_R
<400> 19
gattacgcca agcttttaag atgatgaggc ggcct 35
<210> 20
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> pSK-yhhS453_F
<400> 20
caggaattcg atatcatgcc cgaacccgta gccga 35
<210> 21
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> pSK-yhhS453_R
<400> 21
gactagcgtg atatcttaag atgatgaggc ggcct 35
<210> 22
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> yhhS-out-F
<400> 22
atgtgaatct gtggattatt 20
<210> 23
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> yhhS-out-R
<400> 23
gttatggccg tttatcgaaa 20
<210> 24
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> W3110 yhhSUP_F
<400> 24
caggaattcg atatctcgct ccggcgacat atgca 35
<210> 25
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> W3110 yhhSUP_R
<400> 25
cagcaagcgg gtaccgagga tcaccacatt tttac 35
<210> 26
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> pCL_Ptrc-gfp_F
<400> 26
aatgtggtga tcctcggtac ccgcttgctg caact 35
<210> 27
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> pCL_Ptrc-gfp_R
<400> 27
tacgggttcg ggcatgatat ctttcctgtg tgaaa 35
<210> 28
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> pCL_PrhtB-yhhS453_F
<400> 28
cacaggaaag atatcatgcc cgaacccgta gccga 35
<210> 29
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> pCL_PrhtB-yhhS453_R
<400> 29
gactagcgtg atatcgcacc catcgccatc gcccc 35
<210> 30
<211> 4695
<212> DNA
<213> 人工序列
<220>
<223> pSKH130
<400> 30
tcgaggccgc gattaaattc caacatggat gctgatttat atgggtataa atgggctcgc 60
gataatgtcg ggcaatcagg tgcgacaatc tatcgattgt atgggaagcc cgatgcgcca 120
gagttgtttc tgaaacatgg caaaggtagc gttgccaatg atgttacaga tgagatggtc 180
agactaaact ggctgacgga atttatgcct cttccgacca tcaagcattt tatccgtact 240
cctgatgatg catggttact caccactgcg atccccggga aaacagcatt ccaggtatta 300
gaagaatatc ctgattcagg tgaaaatatt gttgatgcgc tggcagtgtt cctgcgccgg 360
ttgcattcga ttcctgtttg taattgtcct tttaacagcg atcgcgtatt tcgtctcgct 420
caggcgcaat cacgaatgaa taacggtttg gttgatgcga gtgattttga tgacgagcgt 480
aatggctggc ctgttgaaca agtctggaaa gaaatgcata agcttttgcc attctcaccg 540
gattcagtcg tcactcatgg tgatttctca cttgataacc ttatttttga cgaggggaaa 600
ttaataggtt gtattgatgt tggacgagtc ggaatcgcag accgatacca ggatcttgcc 660
atcctatgga actgcctcgg tgagttttct ccttcattac agaaacggct ttttcaaaaa 720
tatggtattg ataatcctga tatgaataaa ttgcagtttc atttgatgct cgatgagttt 780
ttctaatcag aattggttaa ttggttgtaa cactggcaga gcattacgct gacttgacgg 840
gacggcggct ttgttgaata aatcgaactt ttgctgagtt gaaggatcag atcacgcatc 900
ttcccgacaa cgcagaccgt tccgtggcaa agcaaaagtt caaaatcacc aactggtcca 960
cctacaacaa agctctcatc aaccgtggct ccctcacttt ctggctggat gatggggcga 1020
ttcaggcctg gtatgagtca gcaacacctt cttcacgagg cagacctcag cgctcaaaga 1080
tgcaggggta aaagctaacc gcatctttac cgacaaggca tccggcagtt caacagatcg 1140
ggaagggctg gatttgctga ggatgaaggt ggaggaaggt gatgtcattc tggtgaagaa 1200
gctcgaccgt cttggccgcg acaccgccga catgatccaa ctgataaaag agtttgatgc 1260
tcagggtgta gcggttcggt ttattgacga cgggatcagt accgacggtg atatggggca 1320
aatggtggtc accgcgcgta atacgactca ctatagggcg aattggagct ccaccgcggt 1380
ggcggccgct ctagacttta cggtatcgcc gctcccgatt cgcagcgcat cgccttctat 1440
cgccttcttg acgagttctt ctgagcggga ctctggggtt cgctagagga tcgatccttt 1500
ttaacccatc acatatacct gccgttcact attatttagt gaaatgagat attatgatat 1560
tttctgaatt gtgattaaaa aggcaacttt atgcccatgc aacagaaact ataaaaaata 1620
cagagaatga aaagaaacag atagattttt tagttcttta ggcccgtagt ctgcaaatcc 1680
ttttatgatt ttctatcaaa caaaagagga aaatagacca gttgcaatcc aaacgagagt 1740
ctaatagaat gaggtcgaaa agtaaatcgc gcgggtttgt tactgataaa gcaggcaaga 1800
cctaaaatgt gtaaagggca aagtgtatac tttggcgtca ccccttacat attttaggtc 1860
tttttttatt gtgcgtaact aacttgccat cttcaaacag gagggctgga agaagcagac 1920
cgctaacaca gtacataaaa aaggagacat gaacgatgaa catcaaaaag tttgcaaaac 1980
aagcaacagt attaaccttt actaccgcac tgctggcagg aggcgcaact caagcgtttg 2040
cgaaagaaac gaaccaaaag ccatataagg aaacatacgg catttcccat attacacgcc 2100
atgatatgct gcaaatccct gaacagcaaa aaaatgaaaa atatcaagtt cctgaattcg 2160
attcgtccac aattaaaaat atctcttctg caaaaggcct ggacgtttgg gacagctggc 2220
cattacaaaa cgctgacggc actgtcgcaa actatcacgg ctaccacatc gtctttgcat 2280
tagccggaga tcctaaaaat gcggatgaca catcgattta catgttctat caaaaagtcg 2340
gcgaaacttc tattgacagc tggaaaaacg ctggccgcgt ctttaaagac agcgacaaat 2400
tcgatgcaaa tgattctatc ctaaaagacc aaacacaaga atggtcaggt tcagccacat 2460
ttacatctga cggaaaaatc cgtttattct acactgattt ctccggtaaa cattacggca 2520
aacaaacact gacaactgca caagttaacg tatcagcatc agacagctct ttgaacatca 2580
acggtgtaga ggattataaa tcaatctttg acggtgacgg aaaaacgtat caaaatgtac 2640
agcagttcat cgatgaaggc aactacagct caggcgacaa ccatacgctg agagatcctc 2700
actacgtaga agataaaggc cacaaatact tagtatttga agcaaacact ggaactgaag 2760
atggctacca aggcgaagaa tctttattta acaaagcata ctatggcaaa agcacatcat 2820
tcttccgtca agaaagtcaa aaacttctgc aaagcgataa aaaacgcacg gctgagttag 2880
caaacggcgc tctcggtatg attgagctaa acgatgatta cacactgaaa aaagtgatga 2940
aaccgctgat tgcatctaac acagtaacag atgaaattga acgcgcgaac gtctttaaaa 3000
tgaacggcaa atggtacctg ttcactgact cccgcggatc aaaaatgacg attgacggca 3060
ttacgtctaa cgatatttac atgcttggtt atgtttctaa ttctttaact ggcccataca 3120
agccgctgaa caaaactggc cttgtgttaa aaatggatct tgatcctaac gatgtaacct 3180
ttacttactc acacttcgct gtacctcaag cgaaaggaaa caatgtcgtg attacaagct 3240
atatgacaaa cagaggattc tacgcagaca aacaatcaac gtttgcgcca agcttcctgc 3300
tgaacatcaa aggcaagaaa acatctgttg tcaaagacag catccttgaa caaggacaat 3360
taacagttaa caaataaaaa cgcaaaagaa aatgccgatg ggtaccgagc gaaatgaccg 3420
accaagcgac gcccaacctg ccatcggatc ccccgggctg caggaattcg atatcacgct 3480
agtcgaccta gctagcatat ggggagatct actagtaaag catgccaatt ggtattctat 3540
agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg tagccgcgtt 3600
ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag cagaccctat 3660
catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc tgagtttctg 3720
gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc atcgctagcc 3780
catggctaat tcccatgtca gccgttaagt gttcctgtgt cactcaaaat tgctttgaga 3840
ggctctaagg gcttctcagt gcgttacatc cctggcttgt tgtccacaac cgttaaacct 3900
taaaagcttt aaaagcctta tatattcttt tttttcttat aaaacttaaa accttagagg 3960
ctatttaagt tgctgattta tattaatttt attgttcaaa catgagagct tagtacgtga 4020
aacatgagag cttagtacgt tagccatgag agcttagtac gttagccatg agggtttagt 4080
tcgttaaaca tgagagctta gtacgttaaa catgagagct tagtacgtga aacatgagag 4140
cttagtacgt actatcaaca ggttgaactg ctgatcttca gatcctctac gccggacgca 4200
tcgtggccgg atcttgcggc cgcaaaaatt aaaaatgaag ttttaaatca atctaaagta 4260
tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca ccaataactg 4320
ccttaaaaaa actagcgctg aggtctgcct cgtgaagaag gtgttgctga ctcataccag 4380
gcctgaatcg ccccatcatc cagccagaaa gtgagggagc cacggttgat gagagctttg 4440
ttgtaggtgg accagttggt gattttgaac ttttgctttg ccacggaacg gtctgcgttg 4500
tcgggaagat gcgtgatctg atccttcaac tcagcaaaag ttcgatttat tcaacaaagc 4560
cacgttgtgt ctcaaaatct ctgatgttac attgcacaag ataaaaatat atcatcatga 4620
acaataaaac tgtctgctta cataaacagt aatacaaggg gtgttatgag ccatattcaa 4680
cgggaaacgt cttgc 4695
PCT/RO/134表
Figure QDA0003707612500000011
Figure QDA0003707612500000021

Claims (14)

1.具有O-磷酸丝氨酸(OPS)输出活性的多肽,所述多肽包括a)对应于SEQ ID NO:11的氨基酸序列中241的位置处的异亮氨酸(I)被苏氨酸(T)取代,对应于SEQ ID NO:11的氨基酸序列中246的位置处的天冬氨酸(D)被缬氨酸(V)取代,和对应于SEQ ID NO:11的氨基酸序列中330的位置处的缬氨酸(V)被异亮氨酸(I)取代,并且具有氨基酸序列:其中b)对应于88的位置处的氨基酸是苯丙氨酸,并且c)对应于207的位置处的氨基酸是赖氨酸(K)。
2.根据权利要求1所述的多肽,其中所述多肽包含SEQ ID NO:1和与其90%以上序列同一性的氨基酸序列。
3.多核苷酸,所述多核苷酸编码根据权利要求1所述的多肽。
4.生产O-磷酸丝氨酸的微生物,所述微生物包含根据权利要求1所述的多肽、编码所述多肽的多核苷酸、和含有所述多核苷酸的载体中的任意一种或多种。
5.根据权利要求4所述的微生物,其中磷酸丝氨酸磷酸酶(SerB)的活性与其内源活性相比被进一步减弱。
6.根据权利要求4所述的微生物,其中磷酸甘油酸脱氢酶(SerA)或磷酸丝氨酸氨基转移酶(SerC)的活性与其内源活性相比被进一步增强。
7.根据权利要求1所述的微生物,其中所述微生物是大肠杆菌(Escherichia coli)。
8.生产O-磷酸丝氨酸的方法,所述方法包括在培养基中培养生产O-磷酸丝氨酸的微生物,所述微生物包含根据权利要求1所述的多肽、编码所述多肽的多核苷酸、和含有所述多核苷酸的载体中的任意一种或多种。
9.根据权利要求8所述的方法,其中所述方法还包括回收培养的所述培养基或所述微生物中的O-磷酸丝氨酸。
10.生产半胱氨酸或其衍生物的方法,所述方法包括:
a)通过在培养基中培养生产O-磷酸丝氨酸的微生物来生产O-磷酸丝氨酸(OPS)或含有其的培养基,所述微生物包含根据权利要求1所述的多肽、编码所述多肽的多核苷酸、和含有所述多核苷酸的载体中的任意一种或多种;和
b)在O-磷酸丝氨酸硫化氢解酶(OPSS)或表达其的微生物的存在下,使步骤a)中生产的所述O-磷酸丝氨酸或含有其的培养基与硫化物反应。
11.根据权利要求10所述的方法,其中所述方法还包括将步骤b)中生产的半胱氨酸转化为半胱氨酸衍生物。
12.根据权利要求10所述的方法,其中所述硫化物是选自Na2S、NaSH、(NH4)2S、H2S、和Na2S2O3中的至少一种。
13.具有O-磷酸丝氨酸(OPS)输出活性的多肽或具有SEQ ID NO:1的氨基酸序列的多肽用于生产O-磷酸丝氨酸、半胱氨酸或半胱氨酸衍生物的用途,所述多肽包括a)对应于SEQID NO:11的氨基酸序列中241的位置处的异亮氨酸(I)被苏氨酸(T)取代,对应于SEQ IDNO:11的氨基酸序列中246的位置处的天冬氨酸(D)被缬氨酸(V)取代,和对应于SEQ ID NO:11的氨基酸序列中330的位置处的缬氨酸(V)被异亮氨酸(I)取代,并且具有氨基酸序列:其中b)对应于88的位置处的氨基酸是苯丙氨酸,并且c)对应于207的位置处的氨基酸是赖氨酸(K)。
14.具有O-磷酸丝氨酸(OPS)输出活性的多肽或具有SEQ ID NO:1的氨基酸序列的多肽用于从微生物释放O-磷酸丝氨酸的用途,所述多肽包括a)对应于SEQ ID NO:11的氨基酸序列中241的位置处的异亮氨酸(I)被苏氨酸(T)取代,对应于SEQ ID NO:11的氨基酸序列中246的位置处的天冬氨酸(D)被缬氨酸(V)取代,和对应于SEQ ID NO:11的氨基酸序列中330的位置处的缬氨酸(V)被异亮氨酸(I)取代,并且具有氨基酸序列:其中b)对应于88的位置处的氨基酸是苯丙氨酸,并且c)对应于207的位置处的氨基酸是赖氨酸(K)。
CN202180007420.0A 2020-06-09 2021-06-08 O-磷酸丝氨酸输出蛋白变体和利用其生产o-磷酸丝氨酸、半胱氨酸及其衍生物的方法 Pending CN115605496A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR20200069753 2020-06-09
KR10-2020-0069753 2020-06-09
PCT/KR2021/007172 WO2021251734A1 (ko) 2020-06-09 2021-06-08 O-포스포세린 배출 단백질 변이체 및 이를 이용한 o-포스포세린, 시스테인 및 이의 유도체의 생산방법

Publications (1)

Publication Number Publication Date
CN115605496A true CN115605496A (zh) 2023-01-13

Family

ID=78846380

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180007420.0A Pending CN115605496A (zh) 2020-06-09 2021-06-08 O-磷酸丝氨酸输出蛋白变体和利用其生产o-磷酸丝氨酸、半胱氨酸及其衍生物的方法

Country Status (12)

Country Link
US (1) US20230127940A1 (zh)
EP (1) EP4053147A4 (zh)
JP (1) JP7407941B2 (zh)
KR (1) KR20220062542A (zh)
CN (1) CN115605496A (zh)
AR (1) AR122565A1 (zh)
AU (1) AU2021288230B2 (zh)
BR (1) BR112022013303A2 (zh)
CA (1) CA3163410A1 (zh)
MX (1) MX2022008308A (zh)
WO (1) WO2021251734A1 (zh)
ZA (1) ZA202206111B (zh)

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19726083A1 (de) 1997-06-19 1998-12-24 Consortium Elektrochem Ind Mikroorganismen und Verfahren zur fermentativen Herstellung von L-Cystein, L-Cystin, N-Acetyl-Serin oder Thiazolidinderivaten
JP3997631B2 (ja) * 1998-01-12 2007-10-24 味の素株式会社 発酵法によるl−セリンの製造法
KR100620092B1 (ko) 2004-12-16 2006-09-08 씨제이 주식회사 코리네박테리움 속 세포로부터 유래된 신규한 프로모터서열, 그를 포함하는 발현 카세트 및 벡터, 상기 벡터를포함하는 숙주 세포 및 그를 이용하여 유전자를 발현하는방법
KR101381048B1 (ko) 2010-10-20 2014-04-14 씨제이제일제당 (주) O-포스포세린 생산 균주 및 이로부터 생산된 o-포스포세린으로부터 l-시스테인 또는 이의 유도체의 생산방법
KR101208267B1 (ko) 2010-10-20 2012-12-04 씨제이제일제당 (주) O-포스포세린 설피드릴라제 변이체
KR101525663B1 (ko) * 2013-05-10 2015-06-04 씨제이제일제당 (주) 신규 o-포스포세린 배출 단백질 및 이를 이용한 o-포스포세린의 생산방법
KR101547651B1 (ko) 2014-06-03 2015-08-26 씨제이제일제당 주식회사 O-숙시닐호모세린 또는 숙신산의 생산능을 갖는 미생물 및 이를 이용한 숙신산 또는 o-숙시닐호모세린의 생산 방법
KR101677328B1 (ko) * 2014-08-12 2016-11-18 씨제이제일제당 (주) O-포스포세린 생산 미생물 및 이를 이용한 o-포스포세린 또는 l-시스테인 생산 방법
KR101694632B1 (ko) * 2015-09-11 2017-01-10 씨제이제일제당 (주) 신규 o-포스포세린 배출 단백질 변이체 및 이를 이용한 o-포스포세린, 시스테인 및 이의 유도체의 생산방법

Also Published As

Publication number Publication date
CA3163410A1 (en) 2021-12-16
AU2021288230B2 (en) 2023-08-17
BR112022013303A2 (pt) 2022-12-20
JP7407941B2 (ja) 2024-01-04
ZA202206111B (en) 2023-09-27
MX2022008308A (es) 2022-08-08
KR20220062542A (ko) 2022-05-17
JP2023506054A (ja) 2023-02-14
EP4053147A1 (en) 2022-09-07
US20230127940A1 (en) 2023-04-27
WO2021251734A1 (ko) 2021-12-16
AU2021288230A1 (en) 2022-06-09
AR122565A1 (es) 2022-09-21
EP4053147A4 (en) 2023-01-25

Similar Documents

Publication Publication Date Title
JP7450712B2 (ja) 外来metZ遺伝子によりコードされるタンパク質が導入されたL-メチオニン生産微生物及びそれを用いたL-メチオニン生産方法
CN114729012A (zh) L-苏氨酸输出蛋白变体和使用其生产l-苏氨酸的方法
JP2024503049A (ja) GlxR蛋白質変異体またはこれを利用したスレオニン生産方法
CN115605496A (zh) O-磷酸丝氨酸输出蛋白变体和利用其生产o-磷酸丝氨酸、半胱氨酸及其衍生物的方法
RU2821317C1 (ru) Вариант белка, экспортирующего o-фосфосерин, и способ получения о-фосфосерина, цистеина и его производных с его использованием
TWI817193B (zh) 新穎o-磷絲胺酸輸出蛋白及使用其生產o-磷絲胺酸、半胱胺酸及其衍生物的方法
TWI809494B (zh) 新穎MdtH變異體及藉由使用其生產O-磷絲胺酸及半胱胺酸及半胱胺酸之衍生物的方法
TWI843130B (zh) Nadh:醌氧化還原酶的表現受調控的重組微生物及使用該微生物製備o-磷絲胺酸、半胱胺酸及其衍生物的方法
JP7293409B2 (ja) 含硫アミノ酸またはその誘導体の製造方法
EP4368632A1 (en) Novel yhhs variant and method for producing o-phosphoserine, cysteine, and derivate of cysteine using same
CN117897489A (zh) 控制nadh:醌氧化还原酶表达的重组微生物,以及通过使用重组微生物生产o-磷酸丝氨酸、半胱氨酸及其衍生物的方法
KR20230103229A (ko) O-포스포세린 생산 미생물 및 이를 이용한 o-포스포세린 또는 l-시스테인 생산 방법
EP4276177A1 (en) Novel citrate synthase variant and method for producing o-acetyl-l-homoserine or l-methionine using same
CN116867895A (zh) aroG醛缩酶变体及利用其生产支链氨基酸的方法
EP4342990A1 (en) Microorganism producing purine nucleotide, and purine nucleotide production method using same

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination