KR20210099599A - 퓨코실화 올리고당 lnfp-v의 합성 - Google Patents

퓨코실화 올리고당 lnfp-v의 합성 Download PDF

Info

Publication number
KR20210099599A
KR20210099599A KR1020217018944A KR20217018944A KR20210099599A KR 20210099599 A KR20210099599 A KR 20210099599A KR 1020217018944 A KR1020217018944 A KR 1020217018944A KR 20217018944 A KR20217018944 A KR 20217018944A KR 20210099599 A KR20210099599 A KR 20210099599A
Authority
KR
South Korea
Prior art keywords
acid sequence
leu
seq
microorganism
lys
Prior art date
Application number
KR1020217018944A
Other languages
English (en)
Inventor
마노스 파파다키스
마르짓 페데르센
Original Assignee
글리콤 에이/에스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 글리콤 에이/에스 filed Critical 글리콤 에이/에스
Publication of KR20210099599A publication Critical patent/KR20210099599A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/18Preparation of compounds containing saccharide radicals produced by the action of a glycosyl transferase, e.g. alpha-, beta- or gamma-cyclodextrins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/01146Beta-1,3-galactosyl-O-glycosyl-glycoprotein beta-1,3-N-acetylglucosaminyltransferase (2.4.1.146)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/011524-Galactosyl-N-acetylglucosaminide 3-alpha-L-fucosyltransferase (2.4.1.152)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2330/00Production
    • C12N2330/50Biochemical production, i.e. in a transformed host cell
    • C12N2330/51Specially adapted vectors

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

본 발명은 재조합 박테리아 세포를 사용한 LNFP-V의 생명공학적 생산 방법을 제공한다.

Description

퓨코실화 올리고당 LNFP-V의 합성
본 발명은 생명공학 기술 분야, 특히 유전자 변형 미생물, 구체적으로 E. coli를 사용한 재조합 퓨코실화 올리고당 LNFP-V의 미생물 생산 및 상기 유전자 변형 세포의 작제물에 관한 것이다.
최근, 포유류 모유에 포함된 올리고당을 포함하는 복합 탄수화물은 생물체에서 발생하는 수많은 생물학적 과정에서의 역할로 인해 이의 합성을 위한 상용화 노력이 크게 증가하고 있다. 인간 모유 올리고당 (HMO)은 영양 및 치료 산업에서 중요한 상업적 표적이 되고 있다. 200 종 이상의 HMO가 보고되어 있으며, 130 종 이상의 HMO 구조가 밝혀졌다 (Urashima et al.: Milk Oligosaccharides. Nova Biomedical Books, New York (2011); Chen Adv. Carbohydr. Chem. Biochem. 72, 113 (2015)). 더욱 단순한 구조의 HMO, 예를 들어 삼탄당 2'-퓨코실락토스(2'-fucosyllactose)의 합성 및 정제는 유전자 변형 미생물의 활용을 포함하는 생물 공학적 방법을 사용하여 산업적 규모에서 최근 여러 제조업체에 의해 달성되었지만, 복잡한 구조의 HMO에 대한 동일한 작업에는 여전히 어려움이 존재한다.
락토-N-퓨코펜타오스 V (Lacto-N-fucopentaose V, LNFP-V)는 1976에 인간 모유로부터 처음 단리된 중성의 오탄당(pentasaccharide)이다. 이의 구조는 α1,3-커플링으로 글루코스 잔기에 퓨코실화된 사탄당 락토-N-테트라오스 (LNT)로서 결정되었다 (Galβ1-3GlcNAcβ1-3Galβ1-4(Fucα1-3)Glc, Scheme 1; Ginsburg et al. Arch. Biochem. Biophys. 175, 565 (1976)).
Figure pct00001
반응식 1. LNFP-V의 구조
인간 모유 중 LNFP-V의 평균 농도는 0.18 g/l이다 (Erney et al. J. Pediatric Gastroenterol. Nutr. 30, 181 (2000)). 모유로부터 LNFP-V의 분리 및 단리는 낮은 농도로 인해 경제적이지 않은 것으로 보인다. 현재까지, LNFP-V의 효소적 또는 화학적 전체 합성은 보고된 바가 없다. 생명 공학적 방법과 관련하여, LNFP-V는 각각 β1,3-N-아세틸 글루코사미닐 트랜스퍼라제(β1,3-N-acetyl glucosaminyl transferase), β1,3-갈락토실 트랜스퍼라제(β1,3-galactosyl transferase) 및 α1,3/4-퓨코실 트랜스퍼라제(α1,3/4-fucosyl transferase)를 인코딩 및 발현하는 플라스미드 형태의(plasmid-borne) 이종 유전자 lgtA, galTKfucTIII 를 포함하는 재조합 E. coli 를 사용하여 락토스로부터 실험실 규모의 발효 공정에서 생산되었다 (M. Randriantsoa: Synth
Figure pct00002
se microbiologique des antig
Figure pct00003
nes glucidiques des groupes sanguins, Th
Figure pct00004
se soutenue
Figure pct00005
l' Universit
Figure pct00006
Joseph Fourier, Grenoble, 2008).
Bioorg. Med. Chem. 23, 6799 (2015) 및 WO 2016/008602의 저자는 각각, β1,3-N-아세틸 글루코사미닐 트랜스퍼라제, β1,3-갈락토실 트랜스퍼라제 및 α1,3/4-퓨코실 트랜스퍼라제를 인코딩 및 발현하는 유전자 lgtA, wbgOfucTIII를 포함하는 무-플라스미드 재조합 E. coli 를 개시하였으며, 이는 배양 시에, 특히, 육탄당 LNDFH-II를 생산할 수 있었지만, LNFP-V의 형성은 보고되지 않았다.
최근, LNFP-V는 클로스트리듐 디피실리균(Clostridium difficile)의 독소 A의 탄수화물 결합 도메인에 대해 결합 친화성을 나타내는 것으로 보고되었다 (Nguyen et al. J. Microbiol. Biotechnol. 26, 659 (2016)). C. 디피실리는 병원성 설사의 주요 원인으로 알려져 있다 (Kyne et al. Clin. Infect. Dis. 34, 346 (2002)).
그러므로, 안전하며 비용-효과적인 방법으로 충분한 양의 단리된 LNFP-V를 생산할 수 있는 방법이 필요하다.
본 발명은 재조합 박테리아 세포를 사용한 LNFP-V의 생명공학적 생산 방법을 제공한다.
따라서, 제1 양태에서, 본 발명은 β1,3-N-아세틸 글루코사미닐 트랜스퍼라제, β1,3-갈락토실 트랜스퍼라제 및 α1,3/4-퓨코실 트랜스퍼라제로 구성된 군으로부터 선택되는 3개의 기능적으로 활성인 이종 글리코실 트랜스퍼라제를 포함하는 유전자 변형 미생물 또는 세포, 바람직하게 박테리아 세포, 더욱 바람직하게 E. coli 세포에 관한 것이며, 여기서 α1,3/4-퓨코실 트랜스퍼라제는 H. pylorifucT 유전자, H. pylorifutA 유전자 및 이의 기능적 변이체/돌연변이체로 구성된 군으로부터 선택되는 핵산 서열에 의해 인코딩되며, 상기 이종 글리코실 트랜스퍼라제를 인코딩하는 핵산 서열은 미생물 또는 세포의 게놈으로 통합된다. 바람직하게, 재조합 미생물 또는 세포는 네이티브 β-갈락토시다제 유전자, 바람직하게 lacZ의 결실 또는 불활성화로 인해 세포 내 β-갈락토시다제 활성을 가지지 않는다.
본 발명의 제2 양태는 LNFP-V를 제조하는 방법에 관한 것이며, 상기 방법은 다음의 단계를 포함한다:
- 본 발명의 제1 양태에 기재된 유전자 변형 미생물 또는 세포를 제공하는 단계,
- 락토스의 존재 하에 상기 미생물 또는 세포를 배양하는 단계, 및
- 상기 미생물 또는 세포로부터, 배양 배지로부터 또는 둘 모두로부터 LNFP-V를 분리하는 단계.
본 발명의 제3 양태는 서열 번호 7을 특징으로 하는 아미노산 서열을 포함하거나, 또는 이로 구성된 단백질 (폴리펩타이드)에 관한 것이다. 서열 번호 7을 특징으로 하는 아미노산 서열을 포함하거나, 또는 이로 구성된 단백질 (폴리펩타이드)는 α1,3/4-퓨코실 트랜스퍼라제 활성을 가진다.
본 발명의 제4 양태는 LNFP-V의 생산에서 α1,3/4-퓨코실 트랜스퍼라제 활성을 가지는 폴리펩타이드의 용도에 관한 것이며, 상기 폴리펩타이드는 다음으로 구성된 군으로부터 선택된다:
- 서열 번호 1의 아미노산 서열과 적어도 90 %의 서열 상동성을 가지는 아미노산 서열을 포함하거나 또는 이로 구성된 폴리펩타이드, 및
- 서열 번호 3의 아미노산 서열과 적어도 90 %의 서열 상동성을 가지는 아미노산 서열을 포함하거나 또는 이로 구성된 폴리펩타이드.
본 발명은 첨부하는 도면을 참조하여 하기에서 더욱 상세히 설명될 것이며, 상기 도면은 US 6974687에 기재된 H. pylori β1,3-갈락토실 트랜스퍼라제 서열 (GenBank ID: BD182026)과 본 발명의 실시예에서 사용된 galTK에 의해 인코딩되는 GalTK β1,3-갈락토실 트랜스퍼라제의 서열의 정렬을 도시한다.
퓨코실화 락토-N-테트라오스 (LNT)의 효소 합성에서, 퓨코스(fucose)를 N-아세틸글루코사민(N-acetylglucosamine)에 부착하여, Lewis A 인간 항원을 운반하는 구조를 구축하는데 주로 관심이 집중되었다. [Bioorg. Med. Chem. 23, 6799 (2015)] 및 WO 2016/008602의 저자는 LNT를 합성할 수 있는 유전자 변형 E. coli를 작제하여 세포에 이종 α1,3/4-퓨코실 트랜스퍼라제를 도입하였다 (H. pylori 균주 DSM 6709로부터의 α1,3/4-퓨코실 트랜스퍼라제 fucTIII 유전자에 통합된 플라스미드 또는 게놈으로부터 발현 (Rabbani et al. Glycobiology 15, 1076 (2005)). 배양 시, 검출되고 특징 분석되는 주요 생성물은 이중 퓨코실화 LNT (락토-N-다이퓨코소헥사오스 II, LNDFH-II)이었으며, N-아세틸글루코사민에 제1 퓨코스 잔기 및 글루코스에 제2 퓨코스 모이어티를 보유한다. 검출된 생성물 가운데 모노퓨코실화 LNT는 식별되지 않았다.
다른 저자 (M. Randriantsoa: Synth
Figure pct00007
se microbiologique des antig
Figure pct00008
nes glucidiques des groupes sanguins, Th
Figure pct00009
se soutenue
Figure pct00010
l' Universit
Figure pct00011
Joseph Fourier, Grenoble, 2008)는 플라스미드로부터 상기 언급된 이종 β1,3-N-아세틸 글루코사미닐 트랜스퍼라제, 이종 β1,3-갈락토실 트랜스퍼라제 및 동일한 이종 α1,3/4-퓨코실 트랜스퍼라제를 발현하는 유전자 변형 E. coli 균주가 모노퓨코실화 락토-N-테트라오스 LNFP-V를 생성하여, LNT 및 LNDFH-II를 달성할 수 있음을 입증하였다.
놀랍게도, 본 발명자는 α1,3/4-퓨코실 트랜스퍼라제를 인코딩하는 선별된 이종 유전자를 도입함으로써 주요 대사 산물로서 다량의 LNFP-V를 생산하는 게놈 변형된 균주를 성공적으로 구축하였다.
따라서, 본 발명은 락토스로부터 LNFP-V를 생산할 수 있는 유전자 변형 미생물 또는 세포, 유리하게는 박테리아 세포, 바람직하게 E. coli에 관한 것이며, 상기 미생물은 다음을 포함한다:
- β1,3-N-아세틸 글루코사미닐 트랜스퍼라제 활성을 가지는 폴리펩타이드를 인코딩하는 게놈 통합된 이종 핵산 서열,
- β1,3-갈락토실 트랜스퍼라제 활성을 가지는 폴리펩타이드를 인코딩하는 게놈 통합된 이종 핵산 서열, 및
- α1,3/4-퓨코실 트랜스퍼라제 활성을 가지는 폴리펩타이드를 인코딩하는 게놈 통합된 이종 핵산 서열,
여기서 α1,3/4-퓨코실 트랜스퍼라제 활성을 가지는 폴리펩타이드는 다음으로 구성된 군으로부터 선택된다:
- 서열 번호 1의 아미노산 서열과 적어도 90 %의 서열 상동성을 가지는 아미노산 서열을 포함하거나 또는 이로 구성된 폴리펩타이드, 및
- 서열 번호 3의 아미노산 서열과 적어도 90 %의 서열 상동성을 가지는 아미노산 서열을 포함하거나 또는 이로 구성된 폴리펩타이드.
따라서, 락토스로부터 LNFP-V를 생산할 수 있는 본 명세서에 개시된 유전자 변형 미생물 또는 세포는 락토스로부터 LNFP-V의 합성에 적합하며 필수적인 단백질을 인코딩하는 3개의 이종 글리코실 트랜스퍼라제 유전자, 즉 β1,3-N-아세틸 글루코사미닐 트랜스퍼라제, β1,3-갈락토실 트랜스퍼라제 및 α1,3/4-퓨코실 트랜스퍼라제를 보유하고 발현하며, 상기 이종 글리코실 트랜스퍼라제 유전자는 미생물 또는 세포의 게놈으로 통합된다. 발현되는 이종 α1,3/4-퓨코실 트랜스퍼라제는 서열 번호 1 또는 서열 번호 3과 적어도 90% 동일한 아미노산 서열을 포함하거나, 또는 이로 구성된 폴리펩타이드이다.
특정 구체예에서, 발현되는 이종 α1,3/4-퓨코실 트랜스퍼라제는 서열 번호 1 또는 서열 번호 3과 동일하되, 이는 어느 경우든, 적어도 92 %, 적어도 94 %, 적어도 95 %, 적어도 96 %, 적어도 97 %, 적어도 98 % 또는 적어도 99 % 동일할 수 있는 폴리펩타이드를 포함하거나, 또는 이로 구성된다.
서열 번호 1의 폴리펩타이드는 H. pylori NCTC 11639의 네이티브 α1,3/4-퓨코실 트랜스퍼라제의 절단된 버전이며 (GenBank ID: AAB81031.1, Ge et al. J. Biol. Chem. 272, 21357 (1997), 하기 서열 번호 2 참조), 본 명세서에서 “절단형 FucT”로서 지칭된다. 절단형 FucT는 서열 번호 2를 특징으로 하는 전체 오리지널 단백질의 C-말단을 구성하는 37개의 아미노산이 결여되어 있다 (Ma et al. J. Biol. Chem. 281, 6385 (2006)). 절단형 FucT는 H. pylori NCTC 11639의 상응하는 절단된 fucT 유전자 (전체 fucT에 대해 GenBank ID: AF008596.1 참조)에 의해 인코딩된다.
하나의 구체예에서, 서열 번호 1의 아미노산 서열을 포함하는 폴리펩타이드는 전장으로 서열 번호 2를 특징으로 하는 H. pylori NCTC 11639의 α1,3/4-퓨코실 트랜스퍼라제 (GenBank ID: AAB81031.1, Ge et al. J. Biol. Chem. 272, 21357 (1997))이며, 본 명세서에서 FucT으로 지칭된다. FucT는 H. pylori NCTC 11639 (GenBank ID: AF008596.1)의 fucT 유전자에 의해 인코딩된다.
서열 번호 3의 폴리펩타이드는 H. pylori ATCC 26695 (GenBank ID: NP_207177.1)의 α1,3/4-퓨코실 트랜스퍼라제이며, 본 명세서에서 FutA로서 지칭된다. FutA는 H. pylori NCTC 26695futA 유전자에 의해 인코딩된다.
하나의 구체예에서, 발현되는 이종 α1,3/4-퓨코실 트랜스퍼라제는 서열 번호 4와 동일한 폴리펩타이드를 포함하거나 또는 바람직하게 이로 구성된다. 서열 번호 4에 따른 단백질은 기능적 변이체 of FutA의 기능적 변이체이며, 여기서 128 위치의 Ala (A)은 Asn (N)으로 치환되고 129 위치의 His (H)는 Glu (E)으로 치환되어 있다 (Choi et al. Biotechnol. Bioengin. 113, 1666 (2016)). 서열 번호 4에 따른 단백질은 본 명세서에서 FutA_mut로서 지칭되고, FutA_mut를 인코딩하는 핵산 서열은 본 명세서에서 futA_mut로서 지칭된다.
하나의 구체예에서, 발현되는 이종 α1,3/4-퓨코실 트랜스퍼라제는 서열 번호 7과 동일한 폴리펩타이드를 포함하거나 또는 바람직하게 이로 구성된다. 서열 번호 7에 따른 단백질은 FutA의 기능적 변이체이며 여기서 128 위치의 Ala (A)는 Asn (N)으로 치환되고, 129 위치의 His (H)는 Glu (E)으로 치환되고, 148 위치의 Asp (D)는 Gly (G)으로 치환되고, 221 위치의 Tyr (Y)는 Cys (C)으로 치환되어 있다. 서열 번호 7에 따른 단백질은 본 명세서에서 FutA_mut2로서 지칭되며, FutA_mut2를 인코딩하는 핵산 서열은 본 명세서에서 futA_mut2로서 지칭된다.
바람직한 구현예에서, 발현되는 이종 α1,3/4-퓨코실 트랜스퍼라제는 서열 번호 1, 서열 번호 2, 서열 번호 3, 서열 번호 4 또는 서열 번호 7과 동일한 폴리펩타이드를 포함하거나 바람직하게는 이로 구성된다.
상기 유전자 변형 미생물 또는 세포는, 바람직하게, 기능적 GDP-퓨코스 대사 경로, 및/또는 바람직하게 lacY 유전자에 의해 인코딩되는 락토스 퍼미아제에 의해 매개되는 활성 수송 메커니즘을 비롯한 락토스 도입 시스템을 포함한다.
본 발명의 맥락에서 용어 ”미생물” 또는 “세포”는 상이한 발현 수준으로, 염색체 (염색체형) 유전자 또는 플라스미드 통합 (플라스미드 형태) 유전자로서, 네이티브 또는 외래 유전자를 발현하도록 유전적으로 조작될 수 있는 생물학적 세포, 예를 들어, 박테리아 또는 효모 세포를 지칭한다.
용어 “숙주 세포”, “재조합 미생물 또는 세포” 또는 “유전자 변형 미생물 또는 세포”는 천연 존재의 (야생형) 변이체와 비교하여 이의 게놈에서 적어도 하나의 인공적인 변형을 포함하는 세포, 바람직하게 박테리아 세포를 지칭하도록 상호교환적으로 사용된다. 변형에 의해, 게놈 내로의 통합에 의해 또는 플라스미드를 통한 첨가에 의해 핵산 구축물이 세포에 첨가되거나, 또는 세포의 게놈으로부터 핵산 서열이 결실되거나 또는 변경된다. 어떤 경우든, 이와 같이 형질전환된 세포는 변형 전과 다른 유전자형을 가지므로 변형된 세포는 변형된 특징을 나타낸다. 바람직하게, 유전자 변형 세포는 이종 핵산 서열의 도입 또는 야생형 세포에서 발현되지 않는 효소를 인코딩하는 네이티브 핵산 서열의 변형으로 인해, 배양 또는 발효될 때 적어도 하나의 추가적인 또는 변경된 생물학적 반응을 수행할 수 있거나, 또는 유전자 변형 세포는 야생형 세포에서 발견되는 효소를 인코딩하는 핵산 서열의 결실, 첨가 또는 변형으로 인해 생물학적 반응을 수행할 수 없다. 유전자 변형 세포는 잘 알려진, 종래의 유전자 조작 기법으로 구축될 수 있다 (예를 들어, Green and Sambrook: Molecular Cloning: A laboratory Manual, 4th ed., Cold Spring Harbor Laboratory Press (2012); Current protocols in molecular biology (Ausubel et al. eds.), John Wiley and Sons (2010)).
둘 이상의 핵산 또는 아미노산 서열의 맥락에서 용어 “[특정] %의 서열 상동성”은 둘 이상 서열이 비교 창 또는 지정된 핵산 또는 아미노산 서열에 걸쳐 최대 유사성에 대해 비교 및 정렬될 때 주어진 백분율로 공통된 뉴클레오타이드 또는 아미노산 잔기를 가지는 것 (즉, 서열은 적어도 90 퍼센트 (%) 상동성을 가짐)을 의미한다. 핵산 또는 아미노산 서열의 상동성 백분율은 기본 파라미터를 통한 BLAST 2.0 서열 비교 알고리즘을 사용하여, 또는 수동 정렬 및 육안 검사를 통해 측정될 수 있다 (예를 들어, http://www.ncbi.nlm.nih.gov/BLAST/ 참조). 이러한 정의는 또한 테스트 서열의 보체 및 결실 및/또는 첨가를 가지는 서열, 뿐만 아니라 치환을 가지는 서열에도 적용된다. 상동성 백분율, 서열 유사성을 결정하고 정렬하기에 적합한 알고리즘의 예로는, BLAST 2.2.20+ 알고리즘이 있으며, 이는 Altschul et al. Nucl. Acids Res. 25, 3389 (1997)에 기재되어 있다. 본 발명의 핵산 및 단백질에 대한 서열 상동성 백분율을 결정하기 위해 BLAST 2.2.20+가 사용된다. BLAST 분석을 수행하는 소프트웨어는 미국 국립 생명공학 정보 센터 (http://www.ncbi.nlm.nih.gov/)를 통해 공개적으로 제공된다. 서열 정렬 알고리즘의 예로는 CLUSTAL Omega (http://www.ebi.ac.uk/Tools/msa/clustalo/), EMBOSS Needle (http://www.ebi.ac.uk/Tools/psa/emboss_needle/), MAFFT (http://mafft.cbrc.jp/alignment/server/) 또는 MUSCLE (http://www.ebi.ac.uk/Tools/msa/muscle/)가 있다.
바람직한 구현예에서, 본 발명의 유전자 변형 세포는 글리코실 트랜스퍼라제 활성을 가지는 단백질, 효소 또는 폴리펩타이드에 대한 코딩 서열을 포함하는 핵산 구축물을 포함하도록 형질전환 되었으며, 바람직하게 하나 이상의 구축물은 하나 이상의 이종 트랜스퍼라제(들)의 하나 이상의 코딩 핵산 서열(들), 바람직하게 β1,3-N-아세틸 글루코사미닐 트랜스퍼라제를 인코딩하는 적어도 하나의 서열, β1,3-갈락토실 트랜스퍼라제를 인코딩하는 적어도 하나의 서열 및 α1,3/4-퓨코실 트랜스퍼라제를 인코딩하는 적어도 하나의 서열을 포함하고, 상기 세포는 구축물에 포함된 코딩 핵산 서열을 발현할 수 있다.
본 발명의 유전자 변형 미생물 또는 세포는 박테리아 및 효모로 구성된 군으로부터 선택되며, 바람직하게 박테리아이다. 박테리아는 바람직하게 다음의 군으로부터 선택된다: 대장균(Escherichia coli), 바실루스 종(Bacillus spp.) (예를 들어, 바실루스 서브틸리스(Bacillus subtilis)), 캄필로박터 파일로리(Campylobacter pylori), 헬리코박터 파일로리(Helicobacter pylori), 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens), 스타필로코커스 아레우스(Staphylococcus aureus), 테르무스 아쿠아티쿠스(Thermophilus aquaticus), 아조리조비움 카우리노단(Azorhizobium caulinodans), 리조비움 레구미노사룸(Rhizobium leguminosarum), 나이세리아 고노로이에(Neisseria gonorrhoeae), 나이세리아 메닌지티디스(Neisseria meningitis), 락토바실루스 종(Lactobacillus spp.), 락토코커스 종(Lactococcus spp.), 엔테로코커스 종(Enterococcus spp.), 비피도박테리움 종(Bifidobacterium spp.), 스포로락토바실루스 종(Sporolactobacillus spp.), 마이크로모노스포라 종(Micromomospora spp.), 마이크로코커스 종(Micrococcus spp.), 로도코커스 종(Rhodococcus spp.), 슈도모나스(Pseudomonas); 그 중에서 E. coli가 바람직하다.
용어 “락토스로부터 LNFP-V를 생산할 수 있는 유전자 변형 미생물 또는 세포”는 상기 세포는 락토스인 이탄당으로부터 연속적인 글리코실화 단계를 통해 LNFP-V인 오탄당을 합성하는데 필수적인 효소 활성을 보유하는 것을 의미하며, 상기 합성에서 락토스는 제1 글리코실화 단계에서 삼탄당으로 글리코실화되고, 그 다음 제2 글리코실화 단계에서 상기 삼탄당은 사탄당으로 글리코실화되고, 마지막으로 제3 글리코실화 단계에서 상기 사탄당은 LNFP-V로 글리코실화된다. 글리코실화 단계는 각각의 글리코실 트랜스퍼라제에 의해 매개된다. 글리코실 트랜스퍼라제 매개 글리코실화에서, 문제의 글리코실 트랜스퍼라제는 적절한 공여체 분자의 단당을 (공여체 분자는 활성화된 단당 뉴클레오타이드임) 수용체 분자에 전달한다. 본 발명에 따른 필수적인 글리코실 트랜스퍼라제는 β1,3-N-아세틸 글루코사미닐 트랜스퍼라제, β1,3-갈락토실 트랜스퍼라제 및 α1,3/4-퓨코실 트랜스퍼라제이고; 상응하는 공여체는 각각, UDP-GlcNAc, UDP-Gal 및 GDP-Fuc이다.
세포에 의한 UDP-GlcNAc 및 UDP-Gal의 생산은 단순한 탄소 공급원, 예컨대 글리세롤, 프럭토스, 수크로스 또는 글루코스로부터 시작하는 단계적 반응 순서로 자연적인 새로운 생합성 경로에 관여하는효소의 작용 하에 발생한다 (단당 대사에 대한 검토는, 예를 들어 H. H. Freeze and A. D. Elbein: Chapter 4: Glycosylation precursors, in: Essentials of Glycobiology, 2nd edition (Eds. A. Varki et al.), Cold Spring Harbour Laboratory Press (2009)을 참조한다). 구체적으로, UDP-GlcNAc는, 네이티브 프로모터 하에서 발현되는 3 가지 유전자, glmS, glmMglmU에 의해 인코딩되는 효소에 의해 촉매화되는 3단계로 프럭토스-6-포스페이트로부터 새롭게 생산된다. 이와 유사하게, UDP-Gal는 네이티브 프로모터 하에서 또한 발현되는 3 가지 유전자, 또한 pgm, galU galE에 의해 인코딩되는 효소에 의해 촉매화되는 3단계로 글루코스-6-포스페이트로부터 새롭게 생산된다. GDP-Fuc 대사 경로는 하기를 참조한다. LNFP-V를 생산하는 특정 합성 서열에 따르면, 락토스는 N-아세틸글루코사미닐화되어 락토-N-트리오스 II (GlcNAcβ1-3Galβ1-4Glc)가 되고, 이는 이어서 갈락토실화되어 LNT (Galβ1-3GlcNAcβ1-3Galβ-4Glc)가 되고, 마지막으로 퓨코실화에 의해 LNFP-V가 된다. 그러나, 퓨코실화는 N-아세틸글루코사미닐화 단계 이전 또는 이후에 수행될 수 있다.
용어 “미생물 또는 세포의 게놈에 통합된 핵산 서열 [...]”은 상기 핵산 서열이, 그 전체가, 단독으로 또는 핵산 구축물에 포함되어, 바람직하게는 숙주 세포에 의해 인식되는 하나 이상의 대조군 서열(들)에 작동 가능하게 연결되어, 상기 미생물 또는 세포의 게놈 (유전자좌)의 특정 부위에 삽입되는 것을 의미한다.
용어 “β1,3-N-아세틸 글루코사미닐 트랜스퍼라제 활성을 가지는 폴리펩타이드를 인코딩하는 핵산 서열” 또는 “β1,3-갈락토실 트랜스퍼라제 활성을 가지는 폴리펩타이드를 인코딩하는 핵산 서열”은 각각 β1,3-N-아세틸 글루코사미닐 트랜스퍼라제 활성 또는 β1,3-갈락토실 트랜스퍼라제 활성을 가지는 폴리펩타이드를 발현하는 유전자, 이의 기능적 단편 또는 이의 코돈-최적화 버전을 의미한다.
본 발명의 맥락에서 용어 “유전자”는 코딩 핵산 서열에 관한 것이다. “기능적 단편” 또는 “유전자의 기능적 변이체”는 바람직하게, 예를 들어, 원래의 코딩 서열의 동일한 위치의 뉴클레오타이드와는 상이한 하나 이상의 뉴클레오타이드를 포함하여, 원래의 코딩 서열로부터 발현된 폴리펩타이드와 동일하거나 또는 유사한 기능적 특징(들)을 가지는 폴리펩타이드를 발현하는 코딩 서열의 단편 또는 변형된 코딩 서열을 의미한다.
용어 “핵산 구축물”은 표적 세포, 예를 들어 박테리아 세포 내로 이식되도록 의도된 인공적으로 구축된 핵산 세그먼트, 특히 DNA 서열을 의미한다. 본 발명의 맥락에서, 핵산 구축물은 본 발명의 코딩 DNA 서열을 포함하는 재조합 DNA 서열을 포함한다. 하나의 바람직한 구현예에서, 핵산 구축물은 본질적으로 함께 작동 가능하게 연결된 다음의 4가지 단리된 DNA 서열: 코딩 DNA 서열, 상기 코딩 DNA 서열의 전사를 개시할 수 있도록 코딩 DNA 서열에 연결된 프로모터 DNA 서열, 유전자의 상류에 위치한 5'-비번역 영역 (5'-UTR)의 DNA 단편, 즉, 개시 코돈 바로 위의 상류 및 프로모터 서열로부터 하류의 유전자 리더 DNA 서열을 포함한다. 본 발명의 DNA 구축물은 플라스미드 DNA/벡터 내에 삽입, 표적/숙주 세포 내로 이식 및 플라스미드- 또는 염색체-형태로서 발현될 수 있다. DNA 구축물은 선형 또는 원형일 수 있다. 숙주 박테리아 게놈 또는 발현 플라스미드에 통합된 선형 또는 원형 DNA 구축물은 본 명세서에서 “발현 카세트”, “발현 카트리지” 또는 “카트리지”로서 상호교환적으로 지칭된다. 바람직하게, 카트리지는 본질적으로 프로모터의 서열, 프로모터 하류의 5'-UTR DNA (리보솜 결합 부위 포함)를 포함하고, 관심의 생물학적 분자를 인코딩하는 코딩 DNA 서열에 작동 가능하게 연결된 선형 DNA 구축물이다. 구축물은 또한 추가적인 서열, 예컨대 전사 종결자 서열, 및 게놈 영역과 상동성이며 상동성 재조합을 가능하게 하는 두 말단 측면 영역을 포함할 수 있다. 또한, 카트리지는 하기 기재된 다른 서열을 포함할 수 있다. 이러한 카트리지는 기술 분야 내 잘 알려진 방법, 예를 들어 [Principles and techniques of biochemistry and molecular biology (Wilson and Walker, eds.), Cambridge University Press (2010)]에 기재된 표준 방법을 사용하여 제조될 수 있다. 선형 발현 카트리지를 사용하면 게놈 통합 부위가 카트리지의 측면 상동성 영역의 각각의 디자인에 의해 자유롭게 선택될 수 있다는 이점을 제공할 수 있다. 따라서, 선형 발현 카트리지의 통합은 게놈 영역과 관련하여 더 큰 가변성을 가능하게 한다. 선형 카트리지가 또한 구축하기 용이함에 따라, 이러한 카트리지는 본 발명의 구축물의 바람직한 구현예이다.
용어 “프로모터"는 작동 가능하게 연결된 유전자의 전사를 개시하기 위한 RNA 폴리머라제의 결합에 관여하는 핵산 서열을 의미하며, 여기서 상기 유전자는 코딩 DNA 서열 및 다른 (비-코딩) 서열, 예를 들어, 코딩 서열의 상류에 위치한 5'-비번역 영역 (5'-UTR)을 포함하며, 리보솜 결합 부위를 포함한다. 본 발명의 프로모터는 단리된 DNA 서열, 즉, 게놈 DNA의 통합되지 않은 DNA 단편이다. 본 발명의 프로모터의 뉴클레오타이드 서열은 유전자의 프로모터 영역, 예를 들어, E.coliglp 오페론 또는 lac 오페론의 프로모터 영역으로 간주되는 박테리아 게놈 DNA의 단편의 뉴클레오타이드 서열에 상응하거나, 적어도 80 % 상동성, 바람직하게 90-99.9 % 상동성을 가진다. “오페론”은 단일 프로모터의 제어하에 유전자 클러스터를 포함하는 게놈 DNA의 기능적 단위를 의미한다. “glp 오페론”은 박테리아의 글리세롤의 호흡기 대사에 관여하는 유전자 클러스터를 의미한다. “lac 오페론”은 락토스의 수송 및 대사에 관여하는 유전자 클러스터를 의미한다. 본 발명은 바람직한 구현예에서 E. coli의 4 가지 glp 오페론, 특히, glpFKX, glpABC, glpTQ, glpD를 지칭한다. 다른 바람직한 구현예에서, 본 발명은 유전자 Z,Y A를 포함하는 E. colilac 오페론을 지칭한다. 바람직하게, 본 발명의 DNA 구축물에 포함된 glp 오페론 프로모터 서열은 E. coli의 상응하는 glp 오페론의 프로모터 영역으로 간주되는 게놈 DNA의 단편의 뉴클레오타이드 서열에 상응하거나 또는 적어도 80 % 상동성, 바람직하게 90-99.9 % 상동성을 가지고; 특히, 본 발명의 glp오페론의 프로모터의 단리된 서열은 GenBank ID: EG10396 (glpFKX), EG10391 (glpABC), EG10394 (glpD), EG10401 (glpTQ)을 가지는 서열 상류의 게놈 서열의 단편에 상응하거나 상기와 동일한 백분율의 상동성을 가지며; 오페론 lacZYA의 프로모터의 단리된 서열은 GenBank ID: EG10527 (lacZ)을 가지는 서열 상류의 게놈 서열의 단편에 상응하거나 상기와 동일한 백분율의 상동성을 가진다. E. coli 게놈은 본 명세서에서 E coli K-12 MG1655 (GenBank ID:U00096.3)의 완전한 게놈 DNA 서열을 지칭한다.
본 발명에서 프로모터 서열은 여러 구조적 특징/요소, 예컨대 세포에서 RNA 폴리머라제에 결합하고 하류 (3 ′방향) 코딩 서열의 전사를 개시할 수 있는 조절 영역, 특정 전사 조절 단백질에 대한 전사 시작 부위 및 결합 부위를 포함할 수 있다. 조절 영역은 RNA 폴리머라제의 결합을 담당하는 단백질 결합 도메인 (컨센서스 서열) 예컨대 35 박스 및 10 박스 (프립나우 박스(Pribnow box))를 포함한다.
본 발명의 프로모터 서열은 바람직하게 적어도 90 개의 뉴클레오타이드, 더욱 바람직하게 100 내지 150 개의 뉴클레오타이드, 예를 들어, 110-120, 120-130, 130-140, 140-150 개, 또는 더욱 더 바람직하게 150 개 이상의 뉴클레오타이드, 예컨대 155-165, 165-175, 175-185, 185-195, 195-205, 205-215, 215-225, 225-235, 235-245, 245-255, 255-265 개를 포함한다. 일부 구현예에서, 프로모터 서열은 최대 500-1000 뉴클레오타이드 길이와 같이 훨씬 더 길 수 있다. 일부 바람직한 구현예에서, 프로모터의 단리된 서열은 glp 오페론의 서열이다.
본 발명은 또한 본 발명의 구축물에 포함되는 프로모터 DNA 서열의 변이체에 관한 것이다. 본 발명의 맥락에서 “변이체”는 관련 프로모터 DNA 서열의 뉴클레오타이드 서열에 70-99.9 % 유사성을 가지는 인공 핵산 서열을 의미한다. 비교된 핵산 서열의 유사성 백분율은 동일한 구조, 즉, 동일한 뉴클레오타이드 조성을 가지는 서열 부분을 나타낸다. 본 발명의 목적을 위해 서열 유사성 백분율은 기술 분야에 잘 알려진 임의의 방법 예를 들어, BLAST를 사용하여 결정될 수 있다. 용어 “변이체”의 범위는 본 명세서에 기재된 DNA 서열, mRNA 서열 및 합성 뉴클레오타이드 서열, 예를 들어, PCR 프라이머, 및 발명의 구축물의 핵산 서열에 관련이 있는 다른 올리고뉴클레오타이드에 상보적인 뉴클레오타이드 서열을 포함한다.
바람직한 구현예에서, 상기 기재된 glp 오페론의 프로모터 또는 이의 변이체는 이종 β1,3-N-아세틸 글루코사미닐 트랜스퍼라제, 이종 β1,3-갈락토실 트랜스퍼라제 및/또는 이종 α1,3/4-퓨코실 트랜스퍼라제에 작동 가능하게 연결된다. 더욱 바람직하게, glp 오페론의 프로모터는 glpF 프로모터 또는 이의 변이체이다.
또한, 바람직하게, LNFP-V의 합성에 필수적인 이종 β1,3-N-아세틸 글루코사미닐 트랜스퍼라제, 이종 β1,3-갈락토실 트랜스퍼라제 및 이종 α1,3/4-퓨코실 트랜스퍼라제가 glpF 프로모터 변이체 하에서 발현된다. 이와 관련하여, 발현 카세트가 구축되는데, 각각의 카세트는 각각 glpF 프로모터 변이체에 작동 가능하게 연결된 이종 β1,3-N-아세틸 글루코사미닐 트랜스퍼라제, 이종 β1,3-갈락토실 트랜스퍼라제 또는 이종 α1,3/4-퓨코실 트랜스퍼라제를 포함하며, 숙주 세포의 게놈에 삽입된다. glpF 프로모터 변이체는, 바람직하게, 서열 번호 5를 특징으로 하는 핵산 구축물이다.
용어 “미생물 또는 세포는 기능적 GDP-퓨코스 대사 경로를 포함한다”는 상기 세포 또는 미생물이 퓨코실화 단계에서 미생물 또는 세포 내에서 LNFP-V를 생산하기 위한 퓨코스 공여체로서 역할을 하는 GDP-퓨코스를 인 시츄로 생산할 수 있음을 의미한다. GDP-퓨코스 대사 경로는 신생 합성이거나 또는 회수 경로에 따라 일어난다. 신생 경로에서, GDP-L-퓨코스는 프럭토스-6-포스페이트 및 GTP으로부터, 다음의 5 가지 효소: 만노스-6-포스페이트 아이소머라제(isomerase), 포스포만노뮤타제(phosphomannomutase), 만노스-1-포스페이트 구아닐릴 트랜스퍼라제, GDP-만노스-4,6-디하이드라제(dehydratase) 및 GDP-퓨코스 신타제(synthase)의 연속적인 작용에 의해 생합성된다. E. coli에서, 이러한 5 가지 효소는 각각, 콜라닌산 유전자 클러스터 일부인 유전자 manA, manB, manC, gmdwcaG,에 의해 인코딩된다. 다른 박테리아 또는 효모 균주는 상기 언급된 효소 중 하나 이상을 가지지 않을 수 있으며; 신생 GDP-퓨코스 합성 경로에 본질적으로 존재하지 않는 임의의 효소는 플라스미드 발현 벡터의 유전자 또는 재조합 DNA 구축물로서, 또는 숙주 세포의 염색체에 통합된 외인성 유전자로서 제공될 수 있다. 또한, UDP-글루코스 지질 담체 트랜스퍼라제를 인코딩하는콜라닌산 클러스터의 wcaJ 유전자는 콜라닌산의 생산을 억제하여 GDP-퓨코스 생합성 플럭스가 LNFP-V의 합성으로 전환되도록 제거 또는 불활성화되어야 한다. 바람직하게, 상기 개시된 상동 콜라닌산 클러스터는 lac 프로모터 (Plac)의 제어 하에 있다. 또한, GDP-퓨코스 풀을 향상시키기 위해, 콜라닌산 오페론의 양성 조절자를 인코딩하는 유전자 rscA가 과발현될 수 있다 (예를 들어, Dumon et al. Glycoconj. J. 18, 465 (2001)를 참조). 또 다른 구체예에서, 유전자 변형 세포는 GDP-퓨코스 생산을 위해 회수된 퓨코스를 활용할 수 있다. 회수 경로에서, 퓨코스 퍼미아제의 도움으로 세포에 내재화된 외인성으로 첨가된 퓨코스는 퓨코스 키나제에 의해 인산화되고 퓨코스-1-포스페이트 구아닐릴 트랜스퍼라제에 의해 GDP-퓨코스로 전환된다. 이러한 절차에 관여하는 효소는 이종 또는 동종일 수 있다. 하나의 구체예에서, 퓨코스 키나제 및 퓨코스-1-포스페이트 구아닐릴 트랜스퍼라제는 이작용성 효소로 조합될 수 있다 (예를 들어, WO 2010/070104 참조).
용어 “락토스 퍼미아제에 의해 매개되는 활성 수송 메커니즘을 포함하는 락토스 도입 시스템”은 LNFP-V 제조에 필수적이며 배양물에 외인적으로 첨가된 락토스가 락토스에 대해 특이성을 가지는 수송체 단백질, 즉 락토스 퍼미아제를 포함하는 활성 수송의 도움으로 내재화되어, 유전자 변형 세포 또는 미생물이 이의 세포질에서 외인성 락토스를 수용하고 농축하는 것을 의미한다. 내재화는 기분 및 필수적인 기능에 영향을 미치거나 세포의 무결성을 파괴할 수 없다. 락토스를 세포 내로 수송하는 것으로 일반적으로 인식되어 널리 사용되는 퍼미아제는 LacY이지만 (예를 들어, WO 01/04341 참조), 락토스에 대한 특이성을 가지는 다른 퍼미아제가 또한 고려될 수 있다.
바람직한 구현예에서, 본 명세서에 개시된 락토스로부터 LNFP-V를 생산할 수 있는 유전자 변형 미생물 또는 세포는 α1,3/4-퓨코실 트랜스퍼라제 활성을 가지는 폴리펩타이드를 인코딩하는 이종 핵산 서열을 포함하며, 상기 폴리펩타이드는 서열 번호 1의 단백질 (Ma et al. J. Biol. Chem. 281, 6385 (2006)), 서열 번호 2의 단백질 (Gen Bank ID: AAB81031.1, Ge et al. J. Biol. Chem. 272, 21357 (1997)), 서열 번호 3의 단백질 (Gen Bank ID: NP_207177.1), 서열 번호 4의 단백질 (Choi at al. Biotechnol. Bioeng. 113, 1666 (2016)) 또는 서열 번호 7의 단백질로 구성된 군으로부터 선택된다.
바람직하게, 서열 번호 1의 아미노산 서열 또는 서열 번호 3을 가지는 아미노산 서열과 적어도 90 %의 서열 상동성을 가지는 아미노산을 포함하거나 또는 이로 구성된 폴리펩타이드를 인코딩하는 이종 핵산 서열, 유리하게는 서열 번호 1의 단백질 (“절단형” fucT), 서열 번호 2의 단백질 (fucT), 서열 번호 3의 단백질 (futA), 서열 번호 4의 단백질 (futA_mut) 또는 서열 번호 7의 단백질 (futA_mut2)을 인코딩하는 이종 핵산 서열은 본 발명의 발현 시스템에 대해 코돈-최적화된다.
바람직하게, 상기 개시된 유전자 변형 미생물 또는 세포는 락토스로부터 출발하는 생합성 경로에서 LNFP-V 또는 이의 중간체 (예를 들어 락토-N-트리오스 II 또는 LNT)를 가수분해 또는 분해시킬 수 없다. 마찬가지로, 하나의 구현예에서, 세포는 수용체 (락토스)를 분해하는 임의의 효소 활성, 예컨대 LacZ (β갈락토시다제) 활성을 가지지 않는다. 이것은 β갈락토시다제를 인코딩하는 lacZ의 결실 또는 불활성화에 의해 달성될 수 있다. 다른 구현예에서, 상기 개시된 유전자 변형 미생물 또는 세포는, 네이티브 lacZ가 결실 또는 비활성화됨에도 불구하고, 예를 들어, β갈락토시다제를 인코딩하는 이종 유전자를 혼입함으로써, 낮은 수준의 β갈락토시다제 활성을 가질 수 있다. 이와 관련하여, 외인성으로 첨가된 과량의 락토스는 발효 이후 완전히 가수분해될 수 있으며, 이에 따라 생산된 관심 올리고당의 단리 및 정제가 용이해진다. 이러한 솔루션은 예를 들어, WO 2012/112777에 개시되어 있다. 다른 구현예에서, 상기 개시된 유전자 변형 미생물 또는 세포는 유도성 프로모터, 예를 들어, 온도 유도성 프로모터에 작동 가능하게 연결된 β갈락토시다제 유전자를 포함하도록 추가적으로 변경될 수 있다. 이와 관련하여, β갈락토시다제는 낮은 온도, 예를 들어, LNFP-V를 생산하기 위해 미생물이 배양되는 온도에서는 발현되지 않지만, 배양의 마지막에 온도를 상승시키면 발현이 유도되어, 과량의 락토스가 가수분해될 수 있다. 이러한 솔루션은 예를 들어, WO 2015/036138에 개시되어 있다.
또한, 바람직하게, 유전자 변형 미생물 또는 세포의 게놈에 통합된, β1,3-N-아세틸 글루코사미닐 트랜스퍼라제 활성을 가지는 폴리펩타이드를 인코딩하는 핵산 서열은 나이세리아 메닌지티디스(Neisseria meningitidis)053442 (GenBank ID: CP000381)의 lgtA 유전자 또는 이의 코돈 최적화 버전이다. 바람직하게, lgtA 유전자의 코딩 서열 또는 이의 코돈 최적화 버전은 작동 가능하게 연결되어, 서열 번호 5를 특징으로 하는 glpF 프로모터 변이체 하에서 발현된다.
또한, 바람직하게, 유전자 변형 미생물 또는 세포의 게놈에 통합된, β1,3-갈락토실 트랜스퍼라제 활성을 가지는 폴리펩타이드를 인코딩하는 핵산 서열은 galTK으로 지칭되는 유전자, 이의 기능적 단편 또는 이의 코돈 최적화 버전이다. galTK는 β1,3-갈락토실 트랜스퍼라제를 인코딩하는 H. pylori 43504 유전자 (GenBank ID: BD182026, US 6974687)에 대해 상동이며, GalTK으로 지칭되는, 서열 번호 6를 특징으로 하는 단백질을 인코딩한다. US 6974687에서 개시된 β1,3-갈락토실 트랜스퍼라제와 본 명세서에 사용된 GalTK β1,3-갈락토실 트랜스퍼라제 (galTK에 의해 인코딩) 의 구조적 비교가 도 1에 도시된다.
본 발명에 따르면, 본 명세서에 기재된 유전자 변형 미생물 또는 세포, 및 바람직한 및 더욱 바람직한 구현예는 LNFP-V의 생합성에 충분한 양의 GDP-퓨코스를, 신생 또는 회수 경로로, 바람직하게는 신생 경로로 (상기 참조) 제공한다. 그러나, 필수적이며 충분한 GDP-퓨코스 수준을 제공함으로써 LNFP-V 생합성을 더욱 최적화하기 위해, 콜라닌산 유전자 클러스터의 추가적인 카피가 세포에 도입, 바람직하게는 세포의 게놈에 혼입될 수 있다.
본 명세서에 개시된 유전자 변형 미생물 또는 세포, 및 바람직한 및 더욱 바람직한 구현예는, 세포의 게놈에 통합된 이종 β1,3-N-아세틸 글루코사미닐 트랜스퍼라제, 이종 β1,3-갈락토실 트랜스퍼라제 및 이종 α1,3/4-퓨코실 트랜스퍼라제를 포함한다. 후자의 이종 유전자는 세포 대사가 방해받지 않고 원하는 올리고당을 생성할 수 있도록 숙주 세포의 임의의 유전자좌에 통합될 수 있다. 본 발명에 사용되거나 적합한 발현 시스템은 광범위한 가변성을 허용한다. 원칙적으로, 공지된 서열을 가진 임의의 유전자좌가 선택될 수 있되, 서열의 기능은 필요하지 않거나 또는, 필요한 경우, (예를 들어, 영양 요구의 경우) 보완될 수 있다. 본 발명의 목적에 적합한 많은 통합 유전자좌는 선행 기술에 개시되어 있다 (예를 들어, Francia et al. J. Bacteriol. 178, 894 (1996): Juhas et al. (2014) PLoS ONE 9, e111451 (2014); Juhas et al. (2015) Microbial Biothechnol. 8, 617 (2015); Sabi et al. Microbial. Cell Factories 12:60 (2013) 참조).
바람직하게, 통합의 게놈 부위는, 하나의 구현예에서, 당 대사 유전자의 오페론의 유전자좌, 예컨대 갈락토스, 자일로스, 리보스, 말토스 또는 퓨코스의 유전자좌이다.
본 발명에 따르면, 하나의 구현예에서, 유전자 변형 미생물 또는 세포, 및 상기 개시된 임의의 바람직한 구현예는, 더욱 바람직하게 glp 프로모터 (Pglp) 또는 이의 변이체의 제어 하에서, 예를 들어, PglpF, 특히 서열 번호 5에 따른 PglpF 변이체의 제어 하에서 β1,3-갈락토실 트랜스퍼라제 유전자, 바람직하게 galTK 또는 이의 코돈 최적화 버전의 오직 하나의 (단일) 카피를 포함한다.
본 발명에 따르면, 하나의 구현예에서, 유전자 변형 미생물 또는 세포, 및 상기 개시된 임의의 바람직한 구현예는, 더욱 바람직하게 glp 프로모터 (Pglp) 또는 이의 변이체의 제어 하에서, 예를 들어, PglpF, 특히 서열 번호 5에 따른 PglpF 변이체의 제어 하에서 β1,3-N-아세틸 글루코사미닐 트랜스퍼라제 유전자, 바람직하게 lgtA 유전자의 코딩 서열 또는 이의 코돈 최적화 버전의 오직 하나의 (단일) 카피를 포함한다.
하나의 구현예에서, 유전자 변형 미생물 또는 세포, 및 상기 개시된 임의의 바람직한 구현예는, β1,3-갈락토실 트랜스퍼라제 유전자, 바람직하게 galTK 또는 이의 코돈 최적화 버전, β1,3-N-아세틸 글루코사미닐 트랜스퍼라제 유전자, 바람직하게 lgtA 유전자의 코딩 서열 또는 이의 코돈 최적화 버전, 및 서열 번호 1 또는 서열 번호 3과 적어도 90 %의 아미노산 서열 상동성을 가지는 폴리펩타이드를 인코딩하는 α1,3/4-퓨코실 트랜스퍼라제 유전자, 바람직하게 “절단형” fucT, fucT, futA, futA_mut 또는 futA_mut2 각각의 오직 하나의 (단일) 카피를 포함한다. 더욱 바람직하게, 이러한 각각의 글리코실 트랜스퍼라제는 서열 번호 5에 따른 glpF 프로모터 변이체의 제어 하에 있다. 상이한 글리코실 트랜스퍼라제 유전자의 각각의 카피는 바람직하게 대안의 탄소 공급원의 활용과 관련된 유전자좌의 상이한 게놈 부위에 통합된다.
하나의 구체예에서, 유전자 변형 미생물 또는 세포, 및 상기 개시된 임의의 바람직한 구현예는, β1,3-갈락토실 트랜스퍼라제 유전자의 두 개의 카피, 바람직하게 galTK 또는 이의 코돈 최적화 버전을 포함하며, 상기 각각은 두 가지 상이한 게놈 부위에 통합되고, 서열 번호 1 또는 서열 번호 3과 적어도 90%의 아미노산 서열 상동성을 가지는 폴리펩타이드를 인코딩하는 α1,3/4-퓨코실 트랜스퍼라제 유전자, 바람직하게 “절단형” fucT, fucT, futA, futA_mut 또는 futA_mut2의 두 개의 카피, 상기 각각은 두 가지 상이한 게놈 부위에 통합된다. 더욱 바람직하게, 이러한 각각의 글리코실 트랜스퍼라제 코딩 서열은 PglpF 또는 또 다른 glp 프로모터 또는 이의 변이체, 예를 들어, PglpA 또는 PglpT의 제어 하에서, 바람직하게 서열 번호 5에 따른 glpF 프로모터 변이체의 제어 하에서 발현된다.
LNFP-V 생산에 필수적인 상기 기재된 3 종류의 상이한 이종 글리코실 트랜스퍼라제 유전자는 프로모터 서열에 작동 가능하게 연결된 글리코실 트랜스퍼라제 코딩 서열을 포함하는 DNA 구축물의 형태인 발현 카세트의 일부로서 숙주 세포의 게놈에 혼입된다. 프로모터는 특정 수준에서 작동 가능하게 연결된 유전자의 전사를 개시 및 유지할 수 있고 숙주 세포에 의해 인식되는 임의의 적합한 프로모터일 수 있다. 바람직하게, 프로모터는 탄소 공급원 유도성 프로모터이다. 바람직하게, 프로모터는 E. coli의 4 가지 glp 오페론, glpFKX, glpABC, glpTQ glpD 또는 이의 변이체 중 하나의 유전자의 전사를 자연적으로 조절하는 것이다.
하나의 구현예에서, 상기 개시된 유전자 변형 미생물 또는 세포, 및 바람직한 및 더욱 바람직한 구현예는, 바람직하게 glp 프로모터의 제어하에서, 더욱 바람직하게는 glpF 프로모터 또는 이의 변이체의 제어하에서, 더욱 더 바람직하게 서열 번호 5에 따른 glpF 프로모터 변이체의 제어하에서, fucT, futA, futA_mutfutA_mut2,으로 구성된 군으로부터 선택된 α1,3/4-퓨코실 트랜스퍼라제의 오직 단 하나 (단일) 카피를 포함한다.
상기 개시된 바와 같이, 본 발명에 따라 락토스로부터 LNFP-V 생산에 적합한 유전자 변형 미생물 또는 세포는, 하나의 구현예에서, GDP-퓨코스 신생 생합성 경로를 포함하여 세포 내에 GDP-퓨코스를 제공할 수 있다. GDP-퓨코스에 대한 신생 경로는, 숙주 세포의 네이티브 콜라닌산 유전자 클러스터, 바람직하게 manA, manB, manC, gmdwcaG를 포함하는 E. coli를 활용하며, 여기서 wcaJ가 삭제 또는 비활성화된다. 네이티브 콜라닌산 유전자 클러스터는 바람직하게 Plac 프로모터의 제어 하에 있다. 추가적인 구현예에서, 본 발명의 유전자 변형 미생물 또는 세포는, 네이티브 콜라닌산 유전자 클러스터 이외에도, GDP-퓨코스 생합성을 향상시키고 이에 따라 더욱 높은 수준의 GDP-퓨코스를 제공하기 위해 콜라닌산 유전자의 추가적인 카피를 포함할 수 있다. 콜라닌산 유전자 클러스터의 이러한 제2 카피는 바람직하게 게놈에 통합되고, 바람직하게 glp 프로모터의 제어 하에서, 더욱 바람직하게 glpF 프로모터 또는 이의 변이체 하에서, 더욱 더 바람직하게 서열 번호 5에 따른 glpF 프로모터 변이체의 제어 하에서 발현된다. 콜라닌산 유전자 클러스터의 제2 카피가 혼입되는 게놈 부위에 대해서는, 바람직하게 상기 개시된 바와 같은 세포의 당 대사 유전자의 유전자좌일 수 있다. 또 다른 구체예에서, 세포가 콜라닌산 유전자 클러스터의 추가적인 카피를 포함하는 경우, α1,3/4-퓨코실 트랜스퍼라제 유전자, 바람직하게 futA_mut 또는 futA_mut2, 더욱 바람직하게 futA_mut2의 오직 하나의 (단일) 게놈 카피가 존재한다.
본 발명의 제2 양태는 LNFP-V를 생산하는 방법에 관한 것이며, 상기 방법은 다음의 단계를 포함한다:
a) 본 발명의 제1 양태에 기재된 유전자 변형 미생물 또는 세포를 제공하는 단계,
b) 락토스의 존재 하에 상기 미생물 또는 세포를 배양하는 단계, 및
c) 상기 미생물 또는 세포로부터, 배양 배지로부터 또는 둘 모두로부터 LNFP-V를 분리하는 단계.
오당 LNFP-V는 본 발명의 제1 양태에 따른 유전자 변형 세포 또는 미생물을 락토스 및 하나 이상의 탄소계 기질을 포함하는 수성 배양 배지 또는 발효 배지에서 배양 또는 발효한 후 배양 배지로부터 분리하는 단계를 포함하는 공정에 의해 용이하게 수득될 수 있다. 용어 “배양 배지”는 유전자 변형 세포 외부의 발효기에서 발효 공정의 수성 환경을 의미한다.
상기 공정을 수행하면서, 유전자 변형 세포는 탄소계 기질 예컨대 글리세롤, 글루코스, 슈크로스, 글리코겐, 프럭토스, 말토스, 전분, 셀룰로스, 펙틴, 키틴, 등의 존재 하에 배양된다. 바람직하게, 세포는 글리세롤, 글루코스, 슈크로스 및/또는 프럭토스와 함께 배양된다.
상기 공정은 또한 초기에 외인성 락토스를 배양 배지로부터 유전자 변형 세포로 수송하는 것을 포함한다. 락토스는 배양 배지에 종래의 방식으로 외인적으로 첨가되며, 이로부터 세포로 수송된다. 락토스 활성 수송 메커니즘의 도움으로 내재화되며, 이에 의해 락토스는 lac 프로모터의 제어하에서 발현된 세포의 수송체 단백질 또는 락토스 퍼미아제 (LacY)의 영향을 받아 세포의 원형질막을 통해 확산된다.
일부 구현예에서, 상기 공정에서 사용되는 유전자 변형 세포는 세포 내 락토스, LNFP-V 및 LNFP-V 생합성 경로의 대사 중간체, 예를 들어 락토-N-트리오스 II 또는 LNT를 상당히 분해할 효소 활성을 가지지 않는다. 이와 관련하여, 락토스를 갈락토스 및 글루코스로 가수분해하는, 배양된 세포의 네이티브 β갈락토시다제 (E. colilacZ 유전자에 의해 인코딩)는 바람직하게 삭제 또는 비활성화된다 (LacZ- 유전자형). 본 발명의 제2 양태의 하나의 구체예에서, 단계 b)에서 첨가된 과량의 락토스는 발효 이후 제거 또는 분해되지 않으며, 선택적으로 하나 이상의 올리고당 부생성물, 예를 들어, 락토-N-트리오스 II, LNT, 3-FL 및/또는 LNDFH-II를 동반하는, 락토스 및 LNFP-V의 혼합물은 배양 배지로부터 분리 및 단리된다. 또 다른 구체예에서, 선택적으로 하나 이상의 올리고당 부생성물, 예를 들어, 락토-N-트리오스 II, LNT, 3-FL 및/또는 LNDFH-II를 동반하는 락토스 및 LNFP-V의 혼합물은, 상기와 같이 발효에 의해 생산되며, 선택적으로 하나 이상의 올리고당 부생성물, 예를 들어, 락토-N-트리오스 II, LNT, 3-FL 및/또는 LNDFH-II를 동반하는 LNFP-V는, 배양 배지, 및 선택적으로 과량의의 락토스로부터 분리 및 단리된다. 또 다른 구현예에서, 선택적으로 accompanied by 하나 이상의 올리고당 부생성물, 예를 들어, 락토-N-트리오스 II, LNT, 3-FL 및/또는 LNDFH-II를 동반하는 락토스 및 LNFP-V의 혼합물은 상기와 같은 발효에 이어서
i) 락토스를 단당으로 가수분해하는, 락토스 분해 효소, 예를 들어, 갈락토시다제를, 외인성으로 첨가하는 단계, 또는
ii) 발효 단계에서 첨가된 모든 락토스가 소모될 때까지 발효를 지속하는 단계,
실질적으로 락토스가 없는 브로스(broth)를 제공하는 단계에 의해 생산된다. 이와 관련하여, 옵션 ii)에서, 상기 개시된 LacZ- 유전자형의 유전자 변형 세포는 기능성 재조합 β갈락토시다제를 추가적으로 포함할 수 있다. 상기 기능성 갈락토시다제는 열 유도성인 외인성 lacZ 유전자에 의해 인코딩될 수 있다 (예를 들어, WO 2015/036138 참조). 발효 온도에서, 상기 기능성 β갈락토시다제는 세포에 의해 발현되지 않으며, 따라서 내재화된 락토스는 HMO가 생성되는 동안 세포에서 분해되지 않는다. 브로스에서 원하는 농도 또는 양의 LNFP-V에 도달하면, 고온에서 배양을 지속하여 이로 인해 기능성 β갈락토시다제가 발현되고 과량의 락토스가 분해된다. 택일적으로, 상기 개시된 LacZ- 유전자형의 유전자 변형 세포는 발효의 말기에 선택적으로 잔여 락토스를 제거하기 위해 낮지만 검출 가능한 수준의 활성의 재조합 β갈락토시다제를 포함할 수 있다 (예를 들어, WO 2012/112777 참조).
일반적으로, 이러한 공정은, 배양 배지에, 탄소계 기질 및 배양 배지의 초기 부피의 리터당 적어도 30, 최대 약 100 그램의 락토스를 제공하는 것을 포함한다. 바람직하게, 이러한 공정은 또한 28 내지 35 °C의 온도에서, 바람직하게 2 내지 5 일간 지속적인 교반 및 지속적인 통기로 수행된다. 배양 배지의 최종 부피는 배양 배지에 락토스 및 탄소계 기질을 제공하기 전 초기 부피의 3배 부피를 초과하지 않는 것이 바람직하다.
본 발명의 공정을 수행하는 구현예에 따르면, 유전자 변형 LacZ-Y+ E. coli 균주는 다음의 방식으로 배양된다:
(1) 배양 배지에 제공되는 탄소계 기질, 예컨대 글루코스 또는 슈크로스에 의해 보장되며, 바람직하게 글루코스가 모두 소비될 때까지, 바람직하게 적어도 12 시간, 예컨대 약 18 시간 또는 20-25 시간 동안 지속되는, 기하급수적인 세포 성장의 첫 번째 단계; 및
(2) 첫 번째 단계 이후 배양 배지에 바람직하게 지속적으로, 제공되는 탄소계 기질, 예컨대 글루코스, 슈크로스 또는 글리세롤, 및 락토스에 의해 제한되며, 탄소계 기질 및 바람직하게 대부분의 (예를 들어, 적어도 60 %) 락토스가 소비될 때까지, 바람직하게 적어도 35 시간, 예컨대 적어도 45 시간, 50 내지 70 시간, 또는 최대 약 130 시간 지속되는, 세포 성장의 두 번째 단계.
유전자 변형 세포의 배양 동안, LNFP-V 및 선택적으로 하나 이상의 올리고당 부생성물 예컨대 예를 들어, 락토-N-트리오스 II, LNT, 3-FL 및/또는 LNDFH-II는, 세포의 세포 내 및 세포외 기질 모두에 축적된다. 생성된 올리고당은 브로스로부터 단리 및/또는 표준 기법을 사용하여 서로 분리될 수 있다.
본 발명의 제3 양태는 서열 번호 7을 특징으로 하는 아미노산 서열을 포함하거나, 또는 이로 구성된 단백질 (폴리펩타이드)에 관한 것이다. 서열 번호 7을 특징으로 하는 아미노산 서열을 포함하거나, 또는 이로 구성된 단백질 (폴리펩타이드)는 α1,3/4-퓨코실 트랜스퍼라제 활성을 가지며, 실시예에 개시된 LNFP-V의 발효 생산에서 유리하게 사용될 수 있다.
본 발명의 제4 양태는 LNFP-V의 생산에서 α1,3/4-퓨코실 트랜스퍼라제 활성을 가지는 폴리펩타이드의 용도에 관한 것이며, 상기 폴리펩타이드는 다음으로 구성된 군으로부터 선택된다:
- 서열 번호 1의 아미노산 서열과 적어도 90 %의 서열 상동성을 가지는 아미노산 서열을 포함하거나 또는 이로 구성된 폴리펩타이드, 및
- 서열 번호 3의 아미노산 서열과 적어도 90 %의 서열 상동성을 가지는 아미노산 서열을 포함하거나 또는 이로 구성된 폴리펩타이드.
특정 구체예에서, α1,3/4-퓨코실 트랜스퍼라제는 서열 번호 1 또는 서열 번호 3과 동일하되, 이는 어느 경우든, 적어도 92 %, 적어도 94 %, 적어도 95 %, 적어도 96 %, 적어도 97 %, 적어도 98 % 또는 적어도 99 % 동일할 수 있는 폴리펩타이드를 포함하거나, 또는 이로 구성된다.
하나의 구체예에서, α1,3/4-퓨코실 트랜스퍼라제는 서열 번호 1 또는 서열 번호 2의 아미노산 서열을 포함하고, 바람직하게는 이로 구성된다.
하나의 구체예에서, α1,3/4-퓨코실 트랜스퍼라제는 서열 번호 3, 서열 번호 4 또는 서열 번호 7의 아미노산 서열을 포함하고, 바람직하게는 이로 구성된다.
바람직한 구체예에서, α1,3/4-퓨코실 트랜스퍼라제는 서열 번호 7과 동일한 폴리펩타이드를 포함하거나 또는 바람직하게 이로 구성된다.
하나의 구체예에서, α1,3/4-퓨코실 트랜스퍼라제 활성을 가지는 폴리펩타이드를 인코딩하는 핵산 서열은 락토스로부터 LNFP-V를 생산할 수 있는 미생물 또는 세포에 포함된다. 핵산 서열은 적절한 발현 플라스미드를 사용하여 또는 게놈 (염색체) 통합을 통해 미생물 또는 세포 내로 도입될 수 있다.
실시예
실시예에서, 사용된 모든 균주는 E. coli K12 DH1 (유전자형: F, - , gyrA96, recA1, relA1, endA1, thi-1, hsdR17, supE44, Deutsche Sammlung von Mikroorganismen und Zellkulturen (DSMZ)으로부터 수득, www.dsmz.de, reference DSM 4235)으로부터 by 유전자 lacZ, nanKETA, lacA, melA, wcaJ, mdoH를 파괴 (삭제)하고 gmd 유전자 상류에 Plac 프로모터를 삽입하여 구축한 E. coli 플랫폼 균주로부터 유래한다.
염색체 DNA에서 유전자 표적화는 표준 DNA 조작 기법, 예를 들어, [Warming et al. Nucleic Acids Res. 33, e36 (2005)]에 개시된 기법을 사용하여 수행되었다. 염색체 DNA에 유전자 카세트의 삽입은 [Herring et al. Gene 311, 153 (2003)]에 기재된 바와 같이 유전자 메꾸기(gene gorging)에 의해 수행되었다.
실시예에 개시된 균주는 4일 프로토콜을 사용하여 24개의 딥 웰 플레이트에서 스크리닝하였다. 처음 24 시간 동안, 세포를 높은 밀도로 성장시켰고, 다음 72 시간 동안 세포를 유전자 발현 및 생성물 형성을 유도할 수 있는 배지로 옮겼다. 구체적으로, 제1일 동안 새로운 접종물은 마그네슘 설페이트, 티아민 및 글루코스가 보충된 기본 최소 배지를 사용하여 준비되었다. 준비된 배양물을 접종하고 34 °C에서 700 rpm으로 진탕하고 24시간 후, 세포를 마그네슘 설페이트 및 티아민이 보충된 새로운 기본 최소 배지 (2 ml)에 옮기고, 여기에 20 % 글루코스 용액 (1 μl) 및 10 % 락토스 용액 (0.1 ml)의 초기 볼루스를 첨가한 다음, 탄소 공급원으로서 50 % 슈크로스 용액을 슈크로스 가수분해효소의 첨가와 함께 (인버타제, 0.1 g/l 용액의 4 μl) 세포에 제공하여 글루코스가 인버타제에 의한 슈크로스의 절단에 의해 성장을 위해 느린 속도로 제공되도록 하였다. 새로운 배지를 접종한 후, 세포를 72 시간 동안 28 °C에서 700 rpm으로 진탕하였다. 변성 및 후속 원심분리 후, 상청액을 HPLC로 분석하였다.
실시예 1
E. coli 플랫폼 균주 (상기 참조)를 다음과 같이 추가적으로 변형시켰다: LgtA에 대한 코돈 최적화된 lgtA 코딩 서열의 단일 카피를 당 대사에 관련된 유전자좌에서 E. coli 플랫폼 균주의 게놈 (염색체)에 통합하고 glpF 프로모터의 제어 하에서 발현시키고; 코돈 최적화된 galTK의 단일 카피를 당 대사에 관여하는 또 다른 유전자좌에서 E. coli 플랫폼 균주의 게놈에 통합하고 glpF 프로모터 제어 하에서 발현시키고; 콜라닌산 클러스터의 추가적인 카피를 대안의 탄소 공급원의 활용에 관여하는 제3 유전자좌에 통합하고 glpF 프로모터의 제어 하에서 발현시키고; lacI는 lac 오페론으로부터 제거하였다 (ΔlacI). 상기 균주에 기초하여, 당 대사를 할 수 있는 E. coli 플랫폼 균주 유전자좌 중 하나에 glpF 프로모터의 제어 하에서 α1,3/4-퓨코실 트랜스퍼라제를 인코딩하는 유전자의 단일 카피를 통합하여 균주 1-5를 구축하였다:
- 균주 1: 서열 번호 3의 단백질을 인코딩하는 코돈 최적화된 futA 서열
- 균주 2: 서열 번호 7의 단백질을 인코딩하는 코돈 최적화된 futA_mut2 서열
- 균주 3: 서열 번호 1의 단백질을 인코딩하는 코돈 최적화된 절단형 fucT 서열
- 균주 4: H. pylori DSM 6709, GenBank ID: AY450598.1으로부터 코돈 최적화된 fucTIII (Rabbani et al. Glycobiology 15, 1076 (2005))
- 균주 5: H. pylori UA948, GenBank ID: AF194963.2으로부터 코돈 최적화된 fucTa.
배양 후, 다음의 농도의 LNFP-V를 측정하였다 (세포 내 및 세포 외 농도 함께):
균주 1
futA
균주 2
futA_mut2
균주 3
절단형 fucT
균주 4
fucTIII
균주 5
fucTa
LNFP-V [nM] 1.86 1.18 1.46 0.47 0
상기 표에 도시된 바와 같이, 각각 FutA, FutA_mut2 및 절단형 FucT α1,3/4-퓨코실 트랜스퍼라제를 발현하는 균주 1-3은 이러한 구축물에서 선행 기술로부터 공지된 FucTIII 효소를 발현하는 참조 균주 4보다 훨씬 더 높은 LNFP-V 역가를 생성하였다 (각각, 300 %, 150 % 및 210 %). FucTa α1,3/4-퓨코실 트랜스퍼라제를 발현하는 참조 균주 5는 LNFP-V를 생산하지 않았다.
실시예 2
실시예 1에 개시된 균주 1에 기초하여, 균주 6은 당 활용 유전자좌에 통합된 코돈 최적화된 futA 유전자의 추가의 (제2) 카피를 포함하고 glpF 프로모터의 제어 하에서 발현하도록 생성하였다.
이와 유사하게, 실시예 1에 개시된 균주 3에 기초하여, 균주 7은 또 다른 당 활용 유전자좌에 통합된 코돈 최적화된 절단형 fucT 유전자의 추가의 (제2) 카피를 포함하고 glpF 프로모터의 제어 하에서 발현하도록 생성하였다.
균주 8을 생성하기 위해 E. coli 플랫폼 균주 (상기 참조)를 다음과 같이 추가적으로 변형시켰다: 코돈 최적화된 lgtA 코딩 서열의 단일 게놈 카피를 당 소비에 관여하는 유전자좌에 통합하여 glpF 프로모터의 제어 하에서 발현시키고; 코돈 최적화된 galTK의 단일 게놈 카피를 또 다른 당 대사 유전자좌에 통합하여 glpF 프로모터의 제어 하에서 발현시키고; 코돈 최적화된 futA_mut2의 단일 게놈 카피를 또 다른 대안의 탄소 공급원의 이용을 가능하게 하는 유전자좌에 통합하여 glpF 프로모터의 제어 하에서 발현 시키고; 콜라닌산 클러스터의 추가적인 카피를 제4 당 대사 유전자좌에 통합하여 glpF 프로모터의 제어 하에서 발현시키고; lacI를 lac 오페론으로부터 삭제하였다 (ΔlacI). 균주 8에 기초하여, 균주 9는 당 소비에 관여하는 유전자좌에 통합된 코돈 최적화된 futA_mut2 유전자의 추가의 (제2) 카피를 포함하고 glpF 프로모터의 제어 하에서 발현하도록 생성하였다.
배양 후, 다음의 LNFP-V의 상대적인 농도를 측정하였다 (세포 내 및 세포 외 농도 함께):
균주 1
(1x futA)
균주 6
(2x futA)
균주 8
(1x futA_mut2)
균주 9
(2x futA_mut2)
균주 3
(1x 절단형 fucT)
균주 7
(2x 절단형 fucT)
상대 LNFP-V 농도 100 % 104 % 100% 65 % 100 % 113 %
상기 표에 나타난 바와 같이, α1,3/4-퓨코실 트랜스퍼라제를 인코딩하는 futA 또는 절단형 fucT의 제2 카피의 혼입은 LNFP-V 역가를 매우 향상시키지는 않은 반면, futA_mut2의 제2 카피는 LNFP-V 역가에 부정적인 영향을 미쳤다. 결론적으로, α1,3/4-퓨코실 트랜스퍼라제 유전자의 단일 게놈 카피를 보유하는 균주가 바람직하다.
실시예 3
균주 10을 생성하기 위해 E. coli 플랫폼 균주 (상기 참조)를 다음과 같이 추가적으로 변형시켰다: 코돈 최적화된 lgtA 코딩 서열의 단일 게놈 카피를 당 대사 유전자좌에 통합시켜 glpF 프로모터의 제어 하에서 발현시키고; 코돈 최적화된 galTK의 단일 게놈 카피를 대안의 탄소 공급원 활용에 관여하는 또 다른 유전자좌에 통합시켜 glpF 프로모터의 제어 하에서 발현시키고; 코돈 최적화된 futA_mut2의 단일 게놈 카피를 당 소비와 관련된 제3 유전자좌에 통합시켜 glpF 프로모터의 제어 하에서 발현시키고; lacIgalK으로 대체함으로써 삭제하였다(lacI::galK).
균주 10에 기초하여, 균주 11-13를 다음과 같이 구축하였다:
- 균주 11: 콜라닌산 클러스터의 추가적인 카피를 당 활용 유전자좌에 통합시켜 glpF 프로모터의 제어하에서 발현시키고;
- 균주 12: 코돈 최적화된 futA_mut2 유전자의 추가적인 (제2) 카피를 또 다른 당 대사 유전자좌에 통합시켜 glpF 프로모터의 제어 하에서 발현시키고;
- 균주 13: 콜라닌산 클러스터의 추가적인 카피를 대안의 탄소 공급원의 활용에 관여하는 유전자좌에 통합시켜 glpF 프로모터의 제어 하에서 발현시키고, 코돈 최적화된 futA_mut2 유전자의 추가적인 (제2) 카피를 특정 당 소비를 또한 가능하게 하는 유전자좌에 통합시켜 glpF 프로모터의 제어 하에서 발현시켰다.
배양 후, 다음의 LNFP-V의 상대적인 농도를 측정하였다 (세포 내 및 세포 외 농도 함께):
균주 10
1x futA_mut2
균주 11
1x futA_mut2 + CA
균주 12
2x futA_mut2
균주 13
2x futA_mut2 + CA
상대 LNFP-V 농도 100 % 117 % 94 % 64 %
CA 유전자 클러스터의 추가적인 카피 및 단일 카피로부터 α1,3/4-퓨코실 트랜스퍼라제를 발현하는 세포는 (균주 11) 상기 추가적인 PglpF-유도된 CA 유전자 카피를 가지지 않는 유사한 세포보다 (균주 10) 더 높은 LNFP-V 농도 (~17 %까지)를 제공하였다. 분명히, futA_mut2 유전자의 제2 게놈 카피를 첨가해도 CA 유전자 카피 수와 관계 없이 관찰된 LNFP-V 역가를 개선하지 않는다.
실시예 4
실시예 2에 개시된 균주 8에 기초하여, 균주 14는 주어진 탄소 공급원의 대사에 관여하는 유전자좌에 통합된 코돈 최적화된 galTK 유전자의 추가의 (제2) 카피를 포함하고 glpF 프로모터의 제어 하에서 발현하도록 생성하였다.
이와 유사하게, 실시예 2에 개시된 균주 9에 기초하여, 균주 15는 E. coli 플랫폼 균주의 유전자좌에 통합된 코돈 최적화된 galTK 유전자의 추가의 (제2) 카피를 포함하고 glpF 프로모터의 제어 하에서 발현하도록 생성하였다.
배양 후, 다음의 LNFP-V의 상대적인 농도를 측정하였다 (세포 내 및 세포 외 농도 함께):
균주 8
1x futA_mut2 + 1x galTK
균주 14
1x futA_mut2 + 2x galTK
상대 LNFP-V 농도 100 % 99 %
균주 9
2x futA_mut2 + 1x galTK
균주 15
2x futA_mut2 + 2x galTK
상대 LNFP-V 농도 100 % 174 %
제2 β1,3-갈락토실 트랜스퍼라제 유전자 카피를 단일 카피 of α1,3/4-퓨코실 트랜스퍼라제 유전자의 단일 카피를 가지는 균주 8에 첨가하는 것은 최종 LNFP-V에 영향도 미치지 않았다. 그러나, 제2 β1,3-갈락토실 트랜스퍼라제 유전자 카피가 α1,3/4-퓨코실 트랜스퍼라제 유전자의 2 개의 카피를 포함하는 균주 9에 첨가될 경우 LNFP-V 역가가 현저하게 증가했다.
SEQUENCE LISTING <110> Glycom A/S <120> SYNTHESIS OF A FUCOSYLATED OLIGOSACCHARIDE <130> 134WO00 <160> 7 <150> DK201800952 <151> 2018-12-04 <170> BiSSAP 1.3.6 <210> 1 <211> 441 <212> PRT <213> Artificial Sequence <220> <223> Ma et al. J. Biol. Chem. 281, 6385 (2006) <400> 1 Met Phe Gln Pro Leu Leu Asp Ala Tyr Val Glu Ser Ala Ser Ile Glu 1 5 10 15 Lys Met Ala Ser Lys Ser Pro Pro Pro Leu Lys Ile Ala Val Ala Asn 20 25 30 Trp Trp Gly Asp Glu Glu Ile Lys Glu Phe Lys Asn Ser Val Leu Tyr 35 40 45 Phe Ile Leu Ser Gln Arg Tyr Thr Ile Thr Leu His Gln Asn Pro Asn 50 55 60 Glu Phe Ser Asp Leu Val Phe Gly Asn Pro Leu Gly Ser Ala Arg Lys 65 70 75 80 Ile Leu Ser Tyr Gln Asn Ala Lys Arg Val Phe Tyr Thr Gly Glu Asn 85 90 95 Glu Ser Pro Asn Phe Asn Leu Phe Asp Tyr Ala Ile Gly Phe Asp Glu 100 105 110 Leu Asp Phe Asn Asp Arg Tyr Leu Arg Met Pro Leu Tyr Tyr Asp Arg 115 120 125 Leu His His Lys Ala Glu Ser Val Asn Asp Thr Thr Ala Pro Tyr Lys 130 135 140 Leu Lys Asp Asn Ser Leu Tyr Ala Leu Lys Lys Pro Ser His Cys Phe 145 150 155 160 Lys Glu Lys His Pro Asn Leu Cys Ala Val Val Asn Asp Glu Ser Asp 165 170 175 Pro Leu Lys Arg Gly Phe Ala Ser Phe Val Ala Ser Asn Pro Asn Ala 180 185 190 Pro Ile Arg Asn Ala Phe Tyr Asp Ala Leu Asn Ser Ile Glu Pro Val 195 200 205 Thr Gly Gly Gly Ser Val Arg Asn Thr Leu Gly Tyr Asn Val Lys Asn 210 215 220 Lys Asn Glu Phe Leu Ser Gln Tyr Lys Phe Asn Leu Cys Phe Glu Asn 225 230 235 240 Thr Gln Gly Tyr Gly Tyr Val Thr Glu Lys Ile Ile Asp Ala Tyr Phe 245 250 255 Ser His Thr Ile Pro Ile Tyr Trp Gly Ser Pro Ser Val Ala Lys Asp 260 265 270 Phe Asn Pro Lys Ser Phe Val Asn Val His Asp Phe Lys Asn Phe Asp 275 280 285 Glu Ala Ile Asp Tyr Ile Lys Tyr Leu His Thr His Lys Asn Ala Tyr 290 295 300 Leu Asp Met Leu Tyr Glu Asn Pro Leu Asn Thr Leu Asp Gly Lys Ala 305 310 315 320 Tyr Phe Tyr Gln Asn Leu Ser Phe Lys Lys Ile Leu Ala Phe Phe Lys 325 330 335 Thr Ile Leu Glu Asn Asp Thr Ile Tyr His Asp Asn Pro Phe Ile Phe 340 345 350 Cys Arg Asp Leu Asn Glu Pro Leu Val Thr Ile Asp Asp Leu Arg Val 355 360 365 Asn Tyr Asp Asp Leu Arg Val Asn Tyr Asp Asp Leu Arg Ile Asn Tyr 370 375 380 Asp Asp Leu Arg Val Asn Tyr Asp Asp Leu Arg Ile Asn Tyr Asp Asp 385 390 395 400 Leu Arg Val Asn Tyr Asp Asp Leu Arg Val Asn Tyr Asp Asp Leu Arg 405 410 415 Ile Asn Tyr Asp Asp Leu Arg Val Asn Tyr Asp Asp Leu Arg Val Asn 420 425 430 Tyr Glu Arg Leu Leu Ser Lys Ala Thr <210> 2 <211> 478 <212> PRT <213> alpha1,3-fucosyltransferase [Helicobacter pylori NCTC 11639] <220> <223> GenBank ID: AAB81031.1 <400> 2 Met Phe Gln Pro Leu Leu Asp Ala Tyr Val Glu Ser Ala Ser Ile Glu 1 5 10 15 Lys Met Ala Ser Lys Ser Pro Pro Pro Leu Lys Ile Ala Val Ala Asn 20 25 30 Trp Trp Gly Asp Glu Glu Ile Lys Glu Phe Lys Asn Ser Val Leu Tyr 35 40 45 Phe Ile Leu Ser Gln Arg Tyr Thr Ile Thr Leu His Gln Asn Pro Asn 50 55 60 Glu Phe Ser Asp Leu Val Phe Gly Asn Pro Leu Gly Ser Ala Arg Lys 65 70 75 80 Ile Leu Ser Tyr Gln Asn Ala Lys Arg Val Phe Tyr Thr Gly Glu Asn 85 90 95 Glu Ser Pro Asn Phe Asn Leu Phe Asp Tyr Ala Ile Gly Phe Asp Glu 100 105 110 Leu Asp Phe Asn Asp Arg Tyr Leu Arg Met Pro Leu Tyr Tyr Asp Arg 115 120 125 Leu His His Lys Ala Glu Ser Val Asn Asp Thr Thr Ala Pro Tyr Lys 130 135 140 Leu Lys Asp Asn Ser Leu Tyr Ala Leu Lys Lys Pro Ser His Cys Phe 145 150 155 160 Lys Glu Lys His Pro Asn Leu Cys Ala Val Val Asn Asp Glu Ser Asp 165 170 175 Pro Leu Lys Arg Gly Phe Ala Ser Phe Val Ala Ser Asn Pro Asn Ala 180 185 190 Pro Ile Arg Asn Ala Phe Tyr Asp Ala Leu Asn Ser Ile Glu Pro Val 195 200 205 Thr Gly Gly Gly Ser Val Arg Asn Thr Leu Gly Tyr Asn Val Lys Asn 210 215 220 Lys Asn Glu Phe Leu Ser Gln Tyr Lys Phe Asn Leu Cys Phe Glu Asn 225 230 235 240 Thr Gln Gly Tyr Gly Tyr Val Thr Glu Lys Ile Ile Asp Ala Tyr Phe 245 250 255 Ser His Thr Ile Pro Ile Tyr Trp Gly Ser Pro Ser Val Ala Lys Asp 260 265 270 Phe Asn Pro Lys Ser Phe Val Asn Val His Asp Phe Lys Asn Phe Asp 275 280 285 Glu Ala Ile Asp Tyr Ile Lys Tyr Leu His Thr His Lys Asn Ala Tyr 290 295 300 Leu Asp Met Leu Tyr Glu Asn Pro Leu Asn Thr Leu Asp Gly Lys Ala 305 310 315 320 Tyr Phe Tyr Gln Asn Leu Ser Phe Lys Lys Ile Leu Ala Phe Phe Lys 325 330 335 Thr Ile Leu Glu Asn Asp Thr Ile Tyr His Asp Asn Pro Phe Ile Phe 340 345 350 Cys Arg Asp Leu Asn Glu Pro Leu Val Thr Ile Asp Asp Leu Arg Val 355 360 365 Asn Tyr Asp Asp Leu Arg Val Asn Tyr Asp Asp Leu Arg Ile Asn Tyr 370 375 380 Asp Asp Leu Arg Val Asn Tyr Asp Asp Leu Arg Ile Asn Tyr Asp Asp 385 390 395 400 Leu Arg Val Asn Tyr Asp Asp Leu Arg Val Asn Tyr Asp Asp Leu Arg 405 410 415 Ile Asn Tyr Asp Asp Leu Arg Val Asn Tyr Asp Asp Leu Arg Val Asn 420 425 430 Tyr Glu Arg Leu Leu Ser Lys Ala Thr Pro Leu Leu Glu Leu Ser Gln 435 440 445 Asn Thr Thr Ser Lys Ile Tyr Arg Lys Ala Tyr Gln Lys Ser Leu Pro 450 455 460 Leu Leu Arg Ala Ile Arg Arg Trp Val Lys Lys Leu Gly Leu 465 470 475 <210> 3 <211> 425 <212> PRT <213> fucosyltransferase [Helicobacter pylori 26695] <220> <223> GenBank ID: NP_207177.1 <400> 3 Met Phe Gln Pro Leu Leu Asp Ala Phe Ile Glu Ser Ala Ser Ile Glu 1 5 10 15 Lys Met Ala Ser Lys Ser Pro Pro Pro Pro Leu Lys Ile Ala Val Ala 20 25 30 Asn Trp Trp Gly Asp Glu Glu Ile Lys Glu Phe Lys Lys Ser Val Leu 35 40 45 Tyr Phe Ile Leu Ser Gln Arg Tyr Ala Ile Thr Leu His Gln Asn Pro 50 55 60 Asn Glu Phe Ser Asp Leu Val Phe Ser Asn Pro Leu Gly Ala Ala Arg 65 70 75 80 Lys Ile Leu Ser Tyr Gln Asn Thr Lys Arg Val Phe Tyr Thr Gly Glu 85 90 95 Asn Glu Ser Pro Asn Phe Asn Leu Phe Asp Tyr Ala Ile Gly Phe Asp 100 105 110 Glu Leu Asp Phe Asn Asp Arg Tyr Leu Arg Met Pro Leu Tyr Tyr Ala 115 120 125 His Leu His Tyr Lys Ala Glu Leu Val Asn Asp Thr Thr Ala Pro Tyr 130 135 140 Lys Leu Lys Asp Asn Ser Leu Tyr Ala Leu Lys Lys Pro Ser His His 145 150 155 160 Phe Lys Glu Asn His Pro Asn Leu Cys Ala Val Val Asn Asp Glu Ser 165 170 175 Asp Leu Leu Lys Arg Gly Phe Ala Ser Phe Val Ala Ser Asn Ala Asn 180 185 190 Ala Pro Met Arg Asn Ala Phe Tyr Asp Ala Leu Asn Ser Ile Glu Pro 195 200 205 Val Thr Gly Gly Gly Ser Val Arg Asn Thr Leu Gly Tyr Lys Val Gly 210 215 220 Asn Lys Ser Glu Phe Leu Ser Gln Tyr Lys Phe Asn Leu Cys Phe Glu 225 230 235 240 Asn Ser Gln Gly Tyr Gly Tyr Val Thr Glu Lys Ile Leu Asp Ala Tyr 245 250 255 Phe Ser His Thr Ile Pro Ile Tyr Trp Gly Ser Pro Ser Val Ala Lys 260 265 270 Asp Phe Asn Pro Lys Ser Phe Val Asn Val His Asp Phe Asn Asn Phe 275 280 285 Asp Glu Ala Ile Asp Tyr Ile Lys Tyr Leu His Thr His Pro Asn Ala 290 295 300 Tyr Leu Asp Met Leu Tyr Glu Asn Pro Leu Asn Thr Leu Asp Gly Lys 305 310 315 320 Ala Tyr Phe Tyr Gln Asp Leu Ser Phe Lys Lys Ile Leu Asp Phe Phe 325 330 335 Lys Thr Ile Leu Glu Asn Asp Thr Ile Tyr His Lys Phe Ser Thr Ser 340 345 350 Phe Met Trp Glu Tyr Asp Leu His Lys Pro Leu Val Ser Ile Asp Asp 355 360 365 Leu Arg Val Asn Tyr Asp Asp Leu Arg Val Asn Tyr Asp Arg Leu Leu 370 375 380 Gln Asn Ala Ser Pro Leu Leu Glu Leu Ser Gln Asn Thr Thr Phe Lys 385 390 395 400 Ile Tyr Arg Lys Ala Tyr Gln Lys Ser Leu Pro Leu Leu Arg Ala Val 405 410 415 Arg Lys Leu Val Lys Lys Leu Gly Leu 420 425 <210> 4 <211> 425 <212> PRT <213> Artificial Sequence <220> <223> Choi et al. Biotechnol. Bioengin. 113, 1666 (2016) <400> 4 Met Phe Gln Pro Leu Leu Asp Ala Phe Ile Glu Ser Ala Ser Ile Glu 1 5 10 15 Lys Met Ala Ser Lys Ser Pro Pro Pro Pro Leu Lys Ile Ala Val Ala 20 25 30 Asn Trp Trp Gly Asp Glu Glu Ile Lys Glu Phe Lys Lys Ser Val Leu 35 40 45 Tyr Phe Ile Leu Ser Gln Arg Tyr Ala Ile Thr Leu His Gln Asn Pro 50 55 60 Asn Glu Phe Ser Asp Leu Val Phe Ser Asn Pro Leu Gly Ala Ala Arg 65 70 75 80 Lys Ile Leu Ser Tyr Gln Asn Thr Lys Arg Val Phe Tyr Thr Gly Glu 85 90 95 Asn Glu Ser Pro Asn Phe Asn Leu Phe Asp Tyr Ala Ile Gly Phe Asp 100 105 110 Glu Leu Asp Phe Asn Asp Arg Tyr Leu Arg Met Pro Leu Tyr Tyr Asn 115 120 125 Glu Leu His Tyr Lys Ala Glu Leu Val Asn Asp Thr Thr Ala Pro Tyr 130 135 140 Lys Leu Lys Asp Asn Ser Leu Tyr Ala Leu Lys Lys Pro Ser His His 145 150 155 160 Phe Lys Glu Asn His Pro Asn Leu Cys Ala Val Val Asn Asp Glu Ser 165 170 175 Asp Leu Leu Lys Arg Gly Phe Ala Ser Phe Val Ala Ser Asn Ala Asn 180 185 190 Ala Pro Met Arg Asn Ala Phe Tyr Asp Ala Leu Asn Ser Ile Glu Pro 195 200 205 Val Thr Gly Gly Gly Ser Val Arg Asn Thr Leu Gly Tyr Lys Val Gly 210 215 220 Asn Lys Ser Glu Phe Leu Ser Gln Tyr Lys Phe Asn Leu Cys Phe Glu 225 230 235 240 Asn Ser Gln Gly Tyr Gly Tyr Val Thr Glu Lys Ile Leu Asp Ala Tyr 245 250 255 Phe Ser His Thr Ile Pro Ile Tyr Trp Gly Ser Pro Ser Val Ala Lys 260 265 270 Asp Phe Asn Pro Lys Ser Phe Val Asn Val His Asp Phe Asn Asn Phe 275 280 285 Asp Glu Ala Ile Asp Tyr Ile Lys Tyr Leu His Thr His Pro Asn Ala 290 295 300 Tyr Leu Asp Met Leu Tyr Glu Asn Pro Leu Asn Thr Leu Asp Gly Lys 305 310 315 320 Ala Tyr Phe Tyr Gln Asp Leu Ser Phe Lys Lys Ile Leu Asp Phe Phe 325 330 335 Lys Thr Ile Leu Glu Asn Asp Thr Ile Tyr His Lys Phe Ser Thr Ser 340 345 350 Phe Met Trp Glu Tyr Asp Leu His Lys Pro Leu Val Ser Ile Asp Asp 355 360 365 Leu Arg Val Asn Tyr Asp Asp Leu Arg Val Asn Tyr Asp Arg Leu Leu 370 375 380 Gln Asn Ala Ser Pro Leu Leu Glu Leu Ser Gln Asn Thr Thr Phe Lys 385 390 395 400 Ile Tyr Arg Lys Ala Tyr Gln Lys Ser Leu Pro Leu Leu Arg Ala Val 405 410 415 Arg Lys Leu Val Lys Lys Leu Gly Leu 420 425 <210> 5 <211> 300 <212> DNA <213> Artificial Sequence <220> <223> PglpF variant <400> 5 gcggcacgcc ttgcagatta cggtttgcca cacttttcat ccttctcctg gtgacataat 60 ccacatcaat cgaaaatgtt aataaatttg ttgcgcgaat gatctaacaa acatgcatca 120 tgtacaatca gatggaataa atggcgcgat aacgctcatt ttatgacgag gcacacacat 180 tttaagttcg atatttctcg tttttgctcg ttaacgataa gtttacagca tgcctacaag 240 catcgtggag gtccgtgact ttcacgcata caacaaacat taaccaagga ggaaacagct 300 <210> 6 <211> 439 <212> PRT <213> Artificial Sequence <220> <223> GalTK <400> 6 Met Ile Ser Val Tyr Ile Ile Ser Leu Lys Glu Ser Gln Arg Arg Leu 1 5 10 15 Asp Thr Glu Lys Leu Val Leu Glu Ser Asn Glu Lys Phe Lys Gly Arg 20 25 30 Cys Val Phe Gln Ile Phe Asp Ala Ile Ser Pro Lys His Glu Asp Phe 35 40 45 Glu Lys Phe Val Gln Glu Leu Tyr Asp Ser Ser Ser Leu Leu Lys Ser 50 55 60 Asp Trp Phe His Ser Asp Tyr Cys Tyr Gln Glu Leu Leu Pro Gln Glu 65 70 75 80 Phe Gly Cys Tyr Leu Ser His Tyr Leu Leu Trp Lys Glu Cys Val Lys 85 90 95 Leu Asn Gln Pro Val Val Ile Leu Glu Asp Asp Val Ala Leu Glu Ser 100 105 110 Asn Phe Met Gln Ala Leu Glu Asp Cys Leu Lys Ser Pro Phe Asp Phe 115 120 125 Val Arg Leu Tyr Gly His Tyr Trp Gly Gly His Lys Thr Asn Leu Cys 130 135 140 Ala Leu Pro Val Tyr Thr Glu Thr Glu Glu Ala Glu Ala Ser Ile Glu 145 150 155 160 Lys Thr Pro Ile Glu Asn Tyr Glu Val Thr Ser Pro Pro Pro Pro Asn 165 170 175 Pro Thr Arg Asp Thr Gln Gln Asp Phe Ile Thr Glu Thr Gln Gln Asp 180 185 190 Pro Lys Glu Leu Ser Glu Pro Cys Lys Ile Ala Pro Gln Lys Ile Ser 195 200 205 Phe Asn Gln Val Val Phe Lys Lys Ile Lys Arg Lys Leu Asn Arg Phe 210 215 220 Ile Gly Ser Ile Leu Ala Arg Thr Glu Val Tyr Lys Asn Ile Val Ala 225 230 235 240 Lys Tyr Asp Asp Leu Thr Thr Lys Tyr Asp Asp Leu Thr Thr Lys Tyr 245 250 255 Asp Asp Leu Thr Thr Lys Tyr Asp Asp Leu Thr Thr Lys Tyr Asp Asp 260 265 270 Leu Asn Lys Asn Ile Ala Glu Lys Tyr Asp Glu Leu Met Gly Lys Tyr 275 280 285 Glu Ser Leu Leu Ala Lys Glu Val Asn Ile Lys Glu Thr Phe Trp Glu 290 295 300 Ser Arg Ala Asp Ser Glu Lys Glu Ala Leu Phe Leu Asp His Phe Tyr 305 310 315 320 Leu Thr Ser Val Tyr Val Ala Thr Thr Ala Gly Tyr Tyr Leu Thr Pro 325 330 335 Lys Gly Ala Lys Thr Phe Ile Glu Ala Thr Glu Arg Phe Lys Ile Ile 340 345 350 Glu Pro Val Asp Met Phe Ile Asn Asn Pro Thr Tyr His Asp Ile Ala 355 360 365 Asn Phe Thr Tyr Val Pro Cys Pro Val Ser Leu Asn Lys His Ala Phe 370 375 380 Asn Ser Thr Ile Gln Asn Ala Lys Lys Pro Asp Ile Ser Leu Lys Pro 385 390 395 400 Pro Lys Lys Ser Tyr Phe Asp Asn Leu Phe Tyr His Lys Phe Asn Ala 405 410 415 Arg Lys Cys Leu Lys Ala Phe Asn Lys Tyr Ser Lys Gln Tyr Ala Pro 420 425 430 Leu Lys Thr Pro Lys Glu Val 435 <210> 7 <211> 425 <212> PRT <213> Artificial Sequence <220> <223> <400> 7 Met Phe Gln Pro Leu Leu Asp Ala Phe Ile Glu Ser Ala Ser Ile Glu 1 5 10 15 Lys Met Ala Ser Lys Ser Pro Pro Pro Pro Leu Lys Ile Ala Val Ala 20 25 30 Asn Trp Trp Gly Asp Glu Glu Ile Lys Glu Phe Lys Lys Ser Val Leu 35 40 45 Tyr Phe Ile Leu Ser Gln Arg Tyr Ala Ile Thr Leu His Gln Asn Pro 50 55 60 Asn Glu Phe Ser Asp Leu Val Phe Ser Asn Pro Leu Gly Ala Ala Arg 65 70 75 80 Lys Ile Leu Ser Tyr Gln Asn Thr Lys Arg Val Phe Tyr Thr Gly Glu 85 90 95 Asn Glu Ser Pro Asn Phe Asn Leu Phe Asp Tyr Ala Ile Gly Phe Asp 100 105 110 Glu Leu Asp Phe Asn Asp Arg Tyr Leu Arg Met Pro Leu Tyr Tyr Asn 115 120 125 Glu Leu His Tyr Lys Ala Glu Leu Val Asn Asp Thr Thr Ala Pro Tyr 130 135 140 Lys Leu Lys Gly Asn Ser Leu Tyr Ala Leu Lys Lys Pro Ser His His 145 150 155 160 Phe Lys Glu Asn His Pro Asn Leu Cys Ala Val Val Asn Asp Glu Ser 165 170 175 Asp Leu Leu Lys Arg Gly Phe Ala Ser Phe Val Ala Ser Asn Ala Asn 180 185 190 Ala Pro Met Arg Asn Ala Phe Tyr Asp Ala Leu Asn Ser Ile Glu Pro 195 200 205 Val Thr Gly Gly Gly Ser Val Arg Asn Thr Leu Gly Cys Lys Val Gly 210 215 220 Asn Lys Ser Glu Phe Leu Ser Gln Tyr Lys Phe Asn Leu Cys Phe Glu 225 230 235 240 Asn Ser Gln Gly Tyr Gly Tyr Val Thr Glu Lys Ile Leu Asp Ala Tyr 245 250 255 Phe Ser His Thr Ile Pro Ile Tyr Trp Gly Ser Pro Ser Val Ala Lys 260 265 270 Asp Phe Asn Pro Lys Ser Phe Val Asn Val His Asp Phe Asn Asn Phe 275 280 285 Asp Glu Ala Ile Asp Tyr Ile Lys Tyr Leu His Thr His Pro Asn Ala 290 295 300 Tyr Leu Asp Met Leu Tyr Glu Asn Pro Leu Asn Thr Leu Asp Gly Lys 305 310 315 320 Ala Tyr Phe Tyr Gln Asp Leu Ser Phe Lys Lys Ile Leu Asp Phe Phe 325 330 335 Lys Thr Ile Leu Glu Asn Asp Thr Ile Tyr His Lys Phe Ser Thr Ser 340 345 350 Phe Met Trp Glu Tyr Asp Leu His Lys Pro Leu Val Ser Ile Asp Asp 355 360 365 Leu Arg Val Asn Tyr Asp Asp Leu Arg Val Asn Tyr Asp Arg Leu Leu 370 375 380 Gln Asn Ala Ser Pro Leu Leu Glu Leu Ser Gln Asn Thr Thr Phe Lys 385 390 395 400 Ile Tyr Arg Lys Ala Tyr Gln Lys Ser Leu Pro Leu Leu Arg Ala Val 405 410 415 Arg Lys Leu Val Lys Lys Leu Gly Leu 420 425

Claims (20)

  1. 락토스로부터 LNFP-V를 생산할 수 있는 재조합 미생물, 바람직하게 박테리아 세포, 더욱 바람직하게는 E. coli로서,
    - β1,3-N-아세틸 글루코사미닐 트랜스퍼라제 활성을 가지는 폴리펩타이드를 인코딩하는 게놈 통합된 이종 핵산 서열,
    - β1,3-갈락토실 트랜스퍼라제 활성을 가지는 폴리펩타이드를 인코딩하는 게놈 통합된 이종 핵산 서열, 및
    - α1,3/4-퓨코실 트랜스퍼라제 활성을 가지는 폴리펩타이드를 인코딩하는 게놈 통합된 이종 핵산 서열
    을 포함하고,
    여기서 α1,3/4-퓨코실 트랜스퍼라제 활성을 가지는 폴리펩타이드는
    - 서열 번호 1의 아미노산 서열과 적어도 90 %의 서열 상동성을 가지는 아미노산 서열을 포함하거나 또는 이로 구성된 폴리펩타이드, 및
    - 서열 번호 3의 아미노산 서열과 적어도 90 %의 서열 상동성을 가지는 아미노산 서열을 포함하거나 또는 이로 구성된 폴리펩타이드
    으로부터 선택되는 것인 재조합 미생물.
  2. 제1항에 있어서 α1,3/4-퓨코실 트랜스퍼라제 활성을 가지는 폴리펩타이드는 다음으로 구성된 군으로부터 선택되는 것인 재조합 미생물:
    - 서열 번호 1을 특징으로 하는 아미노산 서열을 포함하고, 바람직하게는 이로 구성된 단백질,
    - 서열 번호 3을 특징으로 하는 아미노산 서열을 포함하고, 바람직하게는 이로 구성된 단백질,
    - 서열 번호 4를 특징으로 하는 아미노산 서열을 포함하고, 바람직하게는 이로 구성된 단백질, 및
    - 서열 번호 7을 특징으로 하는 아미노산 서열을 포함하고, 바람직하게는 이로 구성된 단백질.
  3. 제1항에 있어서, α1,3/4-퓨코실 트랜스퍼라제 활성을 가지는 폴리펩타이드는 서열 번호 7을 특징으로 하는 아미노산 서열을 포함하고, 바람직하게는 이로 구성된 단백질인 것인 미생물.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 기능성 GDP-퓨코스 생합성 경로를 포함하는 것인 미생물.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, β1,3-N-아세틸글루코사미닐 트랜스퍼라제는 나이세리아 메닌지티디스(Neisseria meningitidis) 053442lgtA 유전자 또는 이의 코돈 최적화 버전에 의해 인코딩되고, 및/또는 β1,3-갈락토실 트랜스퍼라제는 서열 번호 6을 특징으로 하는 단백질인 것인 미생물.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 이종 핵산 서열은 서열 번호 5에 따른 glp 프로모터 변이체의 제어 하에서 발현되는 것인 미생물.
  7. 제6항에 있어서, glp 프로모터는 서열 번호 5에 따른 glpF 또는 이의 변이체인 것인 미생물.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 각각의 이종 핵산 서열은 단일 카피로 미생물의 게놈에 통합되는 것인 미생물.
  9. 제1항 내지 제7항 중 어느 한 항에 있어서, α1,3/4-퓨코실 트랜스퍼라제 활성을 가지는 폴리펩타이드는 서열 번호 7을 특징으로 하는 아미노산 서열을 포함하고, 바람직하게는 이로 구성된 단백질이며, 이의 코딩 핵산 서열은 적어도 2개의 카피로 미생물의 게놈에 통합되고, 여기서 β1,3-갈락토실 트랜스퍼라제는 서열 번호 6을 특징으로 하는 단백질이며 이의 코딩 핵산 서열은 적어도 2개의 카피로 미생물의 게놈에 통합되는 것인 미생물.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 적어도 하나의, 바람직하게는 각각의, 이종 핵산 서열은 당 대사에 관련된 오페론의 부위에 통합되는 것인 미생물.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, GDP-퓨코스 생합성 경로는 lac 프로모터의 제어 하에서 발현되는 재조합 manA, manB, manC, gmdwcaG 유전자를 포함하는 것인 미생물.
  12. 제11항에 있어서, GDP-퓨코스 생합성 경로에 관여하는 유전자의 추가적인 카피는 glp 프로모터, 바람직하게 glpF 또는 서열 번호 5에 따른 이의 변이체의 제어 하에서 미생물의 게놈에 통합되는 것인 미생물.
  13. 제12항에 있어서, α1,3/4-퓨코실 트랜스퍼라제 활성을 가지는 폴리펩타이드는 서열 번호 7을 특징으로 하는 아미노산 서열을 포함하고, 바람직하게는 이로 구성된 단백질이고, 이의 코딩 핵산 서열은 단일 카피로 미생물의 게놈에 통합되는 것인 미생물.
  14. 다음의 단계를 포함하는, 재조합 미생물에서 LNFP-V를 생산하는 방법:
    a) 제1항 내지 제13항 중 어느 한 항의 유전자 변형 미생물을 제공하는 단계,
    b) 락토스의 존재 하에 상기 미생물을 배양하는 단계, 및
    c) 상기 미생물로부터, 배양 배지로부터 또는 둘 모두로부터 LNFP-V를 분리하는 단계.
  15. 서열 번호 7을 특징으로 하는 아미노산 서열을 포함하거나, 또는 이로 구성된 단백질.
  16. LNFP-V의 생산에서 α1,3/4-퓨코실 트랜스퍼라제 활성을 가지는 폴리펩타이드의 용도로서, 상기 폴리펩타이드는 다음으로 구성된 군으로부터 선택되는 것인 용도:
    - 서열 번호 1의 아미노산 서열과 적어도 90 %의 서열 상동성을 가지는 아미노산 서열을 포함하거나 또는 이로 구성된 폴리펩타이드, 및
    - 서열 번호 3의 아미노산 서열과 적어도 90 %의 서열 상동성을 가지는 아미노산 서열을 포함하거나 또는 이로 구성된 폴리펩타이드.
  17. 제16항에 있어서, α1,3/4-퓨코실 트랜스퍼라제 활성을 가지는 폴리펩타이드는 다음으로 구성된 군으로부터 선택되는 것인 용도:
    - 서열 번호 1을 특징으로 하는 아미노산 서열을 포함하고, 바람직하게는 이로 구성된 단백질,
    - 서열 번호 3을 특징으로 하는 아미노산 서열을 포함하고, 바람직하게는 이로 구성된 단백질,
    - 서열 번호 4를 특징으로 하는 아미노산 서열을 포함하고, 바람직하게는 이로 구성된 단백질, 및
    - 서열 번호 7을 특징으로 하는 아미노산 서열을 포함하고, 바람직하게는 이로 구성된 단백질.
  18. 제16항에 있어서, α1,3/4-퓨코실 트랜스퍼라제 활성을 가지는 폴리펩타이드는 서열 번호 7을 특징으로 하는 아미노산 서열을 포함하고, 바람직하게는 이로 구성된 단백질인 것인 용도.
  19. 제16항 내지 제18항 중 어느 한 항에 있어서, α1,3/4-퓨코실 트랜스퍼라제 활성을 가지는 폴리펩타이드를 인코딩하는 핵산 서열은 락토스로부터 LNFP-V를 생산할 수 있는 미생물, 바람직하게 박테리아 세포, 더욱 바람직하게 E. coli에 포함되는 것인 용도.
  20. 제19항에 있어서, 미생물은 제1항 내지 제13항 중 어느 한 항에 정의된 것인 미생물.
KR1020217018944A 2018-12-04 2019-12-04 퓨코실화 올리고당 lnfp-v의 합성 KR20210099599A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DKPA201800952 2018-12-04
DKPA201800952 2018-12-04
PCT/IB2019/060423 WO2020115671A1 (en) 2018-12-04 2019-12-04 Synthesis of the fucosylated oligosaccharide lnfp-v

Publications (1)

Publication Number Publication Date
KR20210099599A true KR20210099599A (ko) 2021-08-12

Family

ID=70973602

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217018944A KR20210099599A (ko) 2018-12-04 2019-12-04 퓨코실화 올리고당 lnfp-v의 합성

Country Status (7)

Country Link
US (1) US20220282262A1 (ko)
EP (1) EP3891291A4 (ko)
JP (1) JP2022517903A (ko)
KR (1) KR20210099599A (ko)
CN (1) CN113166789A (ko)
BR (1) BR112021010116A2 (ko)
WO (1) WO2020115671A1 (ko)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10731193B2 (en) 2014-06-27 2020-08-04 Glycom A/S Oligosaccharide production
US11926858B2 (en) 2014-06-27 2024-03-12 Glycom A/S Oligosaccharide production
WO2020255054A1 (en) * 2019-06-21 2020-12-24 Glycom A/S Nucleic acid construct comprising 5' utr stem-loop for in vitro and in vivo gene expression
CN115803443A (zh) 2020-07-13 2023-03-14 格礼卡姆股份公司 寡糖的制造
DK180952B1 (en) 2020-12-22 2022-08-10 Glycom As A dfl-producing strain
CN113832092B (zh) * 2021-10-20 2023-10-03 江南大学 一种提高乳酰-n-岩藻五糖产量的基因工程菌及其生产方法
WO2023099680A1 (en) 2021-12-01 2023-06-08 Dsm Ip Assets B.V. Cells with tri-, tetra- or pentasaccharide importers useful in oligosaccharide production
WO2023097604A1 (zh) * 2021-12-02 2023-06-08 岩唐生物科技(杭州)有限责任公司 分离的多肽及其应用
CN114369585B (zh) * 2022-02-06 2023-10-27 北京睿脉医药科技有限公司 重组幽门螺杆菌的岩藻糖基转移酶突变体及应用
DK202200588A1 (en) 2022-06-20 2024-02-23 Dsm Ip Assets Bv Mixture of fucosylated HMOs
WO2024003223A1 (en) 2022-06-29 2024-01-04 Inbiose N.V. Fucosylated saccharide for use in the prevention or treatment of parasitic disease
WO2024003222A1 (en) 2022-06-29 2024-01-04 Inbiose N.V. Fucosylated saccharide for use in the prevention or treatment of bacterial disease
WO2024013348A1 (en) 2022-07-15 2024-01-18 Dsm Ip Assets B.V. New fucosyltransferases for in vivo synthesis of complex fucosylated human milk oligosaccharides
WO2024017987A1 (en) 2022-07-20 2024-01-25 Inbiose N.V. Production of oligosaccharides in host cells
WO2024044761A2 (en) * 2022-08-25 2024-02-29 Glycosyn LLC β-1,3-GALACTOSYLTRANSFERASES FOR USE IN THE BIOSYNTHESIS OF OLIGOSACCHARIDES

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2796082B1 (fr) * 1999-07-07 2003-06-27 Centre Nat Rech Scient Procede de production d'oligosaccharides
CA2589422A1 (en) * 2004-10-14 2007-04-12 Recopharma Ab Compositions and methods for inhibiting h. pylori adhesion and infection
JP2016518825A (ja) * 2013-03-15 2016-06-30 グリコビア,インコーポレイテッド ポリシアル酸、血液型抗原および糖タンパク質の発現
ES2715010T3 (es) * 2014-03-31 2019-05-31 Jennewein Biotechnologie Gmbh Fermentación total de oligosacáridos
CN106536726A (zh) * 2014-07-14 2017-03-22 巴斯夫欧洲公司 LNT、LNnT和其岩藻糖基化衍生物的生物技术生产
EP3191499A4 (en) * 2014-09-09 2018-06-06 Glycosyn LLC Alpha (1,3) fucosyltransferases for use in the production of fucosylated oligosaccharides
WO2017101958A1 (en) * 2015-12-18 2017-06-22 Glycom A/S Fermentative production of oligosaccharides
EP3425052A1 (en) * 2017-07-07 2019-01-09 Jennewein Biotechnologie GmbH Fucosyltransferases and their use in producing fucosylated oligosaccharides
CN111727253A (zh) * 2017-12-21 2020-09-29 格礼卡姆股份公司 用于体外和体内基因表达的核酸构建体

Also Published As

Publication number Publication date
EP3891291A1 (en) 2021-10-13
EP3891291A4 (en) 2022-10-26
US20220282262A1 (en) 2022-09-08
JP2022517903A (ja) 2022-03-11
WO2020115671A1 (en) 2020-06-11
CN113166789A (zh) 2021-07-23
BR112021010116A2 (pt) 2021-08-31

Similar Documents

Publication Publication Date Title
KR20210099599A (ko) 퓨코실화 올리고당 lnfp-v의 합성
US20240200112A1 (en) Process for the Production of Fucosylated Oligosaccharides
US20230072639A1 (en) New major facilitator superfamily (mfs) protein (bad) in hmo production
US20230193335A1 (en) Hmo production
US20230109661A1 (en) Hmo production
JP2023511522A (ja) Hmoの産生
JP2022546825A (ja) バチルス属細胞におけるシアリル化オリゴ糖の生産
JP2024517696A (ja) 純粋なLNFP-Iのインビボ産生のためのα-1,2-フコシルトランスフェラーゼの同定
US20240102063A1 (en) New major facilitator superfamily (mfs) protein (fred) in production of sialylated hmos
JP2024516207A (ja) インベルターゼ/スクロースヒドロラーゼを発現する微生物株
US20230109937A1 (en) New major facilitator superfamily (mfs) protein (fred) in hmo production
JP7331278B1 (ja) 3’slのインビボ合成のための新規なシアリルトランスフェラーゼ
DK181497B1 (en) ENHANCING FORMATION OF THE HMOS LNT AND/OR LNnT BY MODIFYING LACTOSE IMPORT IN THE CELL
EA046260B1 (ru) Получение огм
CN117321071A (zh) 表达转化酶/蔗糖水解酶的微生物菌株
EA046241B1 (ru) Получение огм
CN117355613A (zh) 产生以lnfp-i和2’-fl作为主要化合物的hmo共混物分布的方法
EA046005B1 (ru) НОВЫЙ БЕЛОК СУПЕРСЕМЕЙСТВА ОСНОВНЫХ ПЕРЕНОСЧИКОВ (MFS) (Fred) В ПРОИЗВОДСТВЕ ОГМ
WO2022243315A1 (en) Methods of producing hmo blend profiles with lnfp-i and 2&#39;-fl, with lnfp-i as the predominant compound
WO2024110667A1 (en) Two-strain system for producing oligosaccharides