KR20240037346A - 2'-푸코실락토오스의 생체촉매 합성을 위한 특이적 알파-1,2-푸코실트랜스퍼라제 - Google Patents

2'-푸코실락토오스의 생체촉매 합성을 위한 특이적 알파-1,2-푸코실트랜스퍼라제 Download PDF

Info

Publication number
KR20240037346A
KR20240037346A KR1020247006871A KR20247006871A KR20240037346A KR 20240037346 A KR20240037346 A KR 20240037346A KR 1020247006871 A KR1020247006871 A KR 1020247006871A KR 20247006871 A KR20247006871 A KR 20247006871A KR 20240037346 A KR20240037346 A KR 20240037346A
Authority
KR
South Korea
Prior art keywords
leu
futc
seq
ile
lys
Prior art date
Application number
KR1020247006871A
Other languages
English (en)
Inventor
줄리아 마틴
카르스텐 본훼브디
Original Assignee
와커 헤미 아게
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 와커 헤미 아게 filed Critical 와커 헤미 아게
Publication of KR20240037346A publication Critical patent/KR20240037346A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/04Polysaccharides, i.e. compounds containing more than five saccharide radicals attached to each other by glycosidic bonds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/18Preparation of compounds containing saccharide radicals produced by the action of a glycosyl transferase, e.g. alpha-, beta- or gamma-cyclodextrins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/01069Galactoside 2-alpha-L-fucosyltransferase (2.4.1.69)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

본 발명은 효소로서, (i) 푸코실트랜스퍼라제의 N-말단 도메인 및 (ii) C-말단 도메인으로서 서열 번호 5의 적어도 아미노산 155-286 또는 이와 적어도 80% 동일한 아미노산 서열을 포함하는 융합 단백질이고, 푸코실트랜스퍼라제로서 기능하며, N-말단 도메인 및 C-말단 도메인이 두 개의 상이한 푸코실트랜스퍼라제로부터 유래되는 것을 특징으로 하는 효소에 관한 것이다. 본 발명은 또한 2'-푸코실락토오스의 제조 방법으로서, 반응 혼합물에서 글루코오스, 글리세롤, 수크로오스, 푸코오스 및 GDP-, ADP-, CDP-, 및 TDP-푸코오스로 이루어진 물질의 군으로부터 선택된 적어도 하나의 물질의 존재하에 락토오스를 상기 효소와 반응시키는 것을 특징으로 하는 방법에 관한 것이다.

Description

2'-푸코실락토오스의 생체촉매 합성을 위한 특이적 알파-1,2-푸코실트랜스퍼라제
본 발명은 효소로서, (i) 푸코실트랜스퍼라제의 N-말단 도메인을 포함하고 (ii) C-말단 도메인으로서 서열 번호 5의 적어도 아미노산 155-286 또는 이와 적어도 80% 동일한 아미노산 서열을 포함하는 융합 단백질이고, 푸코실트랜스퍼라제 활성을 가지며, N-말단 도메인 및 C-말단 도메인이 두 개의 상이한 푸코실트랜스퍼라제로부터 유래되는 것을 특징으로 하는 효소에 관한 것이다. 본 발명은 또한 반응 혼합물에서 글루코오스, 글리세롤, 수크로오스, 푸코오스, 및 GDP-, ADP-, CDP- 및 TDP-푸코오스로 이루어진 물질의 군으로부터 선택된 적어도 하나의 물질의 존재하에 락토오스를 상기 효소와 반응시키는 것을 특징으로 하는 2'-푸코실락토오스의 제조 방법에 관한 것이다.
지금까지 모유 올리고당, 줄여서 HMOs(복수) 또는 HMO(단수)라고 하는 약 200가지의 다양한 복합 올리고당이 모유에서 확인되었다. 높은 다양성은 단순하고 때로는 매우 복잡한 올리고당으로의 5가지 단당류 D-글루코오스, D-갈락토오스, N-아세틸-D-글루코사민, L-푸코오스, 및 N-아세틸뉴라민산의 다양한 조합으로부터 발생한다. HMO가 어떤 단당류로부터 형성되는지에 따라 푸코실화 중성, 비-푸코실화 중성, 및 시알릴화 산성 HMO가 구별된다(Petschacher and Nidetzky 2016, J. Biotechnol. 235, pp. 61-83).
모유의 다른 중요한 성분, 즉 락토오스와 같은 당, 지질, 및 단백질과 달리 HMO는 아기가 대사하지 않는다. 대신, 이들은 건강한 장내 마이크로바이옴의 발달, 전염병 예방, 및 건강한 면역계 발달에 중요한 역할을 한다. HMO는 HMO를 대사할 수 있는 양성 박테리아에게 HMO를 대사할 수 없는 병원균에 비해 성장 이점을 제공함으로써 이러한 효과를 달성한다. 또한, 병원균이 결합하는 상피 세포 상의 당 구조를 모방하여 병원균의 표면을 포화시켜 궁극적으로 배설을 유도함으로써 병원균이 장벽에 부착되는 것을 방지한다. 마지막으로, HMO는 장에서 흡수된 후 장 상피 세포와 면역 세포의 유전자 조절에 직접적인 영향을 미쳐 특히 사이토카인 발현을 통해 전신 항염증 효과를 나타낸다(Faijes et al. 2019, Biotechnology Advances 37, pp. 667-697; Petschacher 2018, Die Hebamme 31, pp. 409-414).
모유는 높은 HMO 함량과 복잡한 구성을 특징으로 한다. 일부 경우에 특정 HMO는 모유에서만 상당한 양으로 발생한다. 따라서, HMO는 다른 포유류에서도 검출되지만 매우 낮은 농도로만 발견된다. 따라서 언급된 유익한 특성을 달성하기 위해 모유 대체품에는 HMO가 보충된다. 또 다른 새로운 사용 분야는 성인을 위한 식이 보충제로서의 사용이다(Elison et al. 2016, Br. J. Nutr. 116, pp. 1356-1368).
모유에서 가장 흔한 HMO는 삼당류 2'-푸코실락토오스, 또는 줄여서 2'-FL이다(Deng et al. 2020, Syst. Microbiol. and Biomanuf. 1, pp. 1-14). 2'-FL은 단당류인 D-글루코오스, D-갈락토오스, 및 L-푸코오스로 이루어지며, D-갈락토오스는 β-1,4-글리코시드 결합에 의해 D-글루코오스에 공유 결합되고, α-1,2-글리코시드 결합에 의해 L-푸코오스에 공유 결합된다(Fuc-α1,2-Gal-β1,4-Glc).
필요한 선택적 결합 형성으로 인해 화학적 합성이 비경제적이기 때문에 효소 공정은 HMO, 예를 들어 2'-FL의 합성에 매력적인 옵션이다. 효소의 위치선택성과 입체선택성은 보호기를 사용하지 않고도 합성을 가능하게 하며, 이는 특히 더 복잡한 구조의 경우 경제적으로 유리하다.
푸코실화된 HMO의 효소 촉매 합성에서는 일반적으로 푸코실트랜스퍼라제가 사용된다. 후자는 글리코실트랜스퍼라제 효소 패밀리(GT; EC 2.4.)에 속하며 공여체(보통 구아노신 이인산 푸코오스, 또는 줄여서 GDP-푸코오스)로부터 수용체(올리고당, 당단백질/단백질 또는 당지질/지질일 수 있음)로 푸코오스 단위의 전달을 촉매한다. 푸코실트랜스퍼라제가 푸코오스를 전달하는 수용체의 반응기가 푸코실트랜스퍼라제의 클래스를 결정한다. α-1,2-, α-1,3/4- 및 α-1,6-푸코실트랜스퍼라제 사이에서 구별된다. 2'-FL의 효소적 합성은 α-1,2-푸코실트랜스퍼라제를 사용하는데, 이는 GDP-푸코오스의 푸코오스를 락토오스, 더 정확하게는 갈락토오스 단위의 2'-히드록실기로 전달하여 α-1,2-글리코시드 결합을 형성한다. 이러한 목적에 비특이적인 1,2-푸코실트랜스퍼라제를 사용하면 아래 반응식 (1)에 따라 2'-FL이 형성되고, 추가적으로 글루코오스 단위의 3'-히드록실 기도 비특이적 방식으로 푸코실화를 거치는 것이 가능하며, 그 결과 부산물인 2,3-디푸코실락토오스, 보다 정확하게는 Fuc-α1,2-Gal-β1,4-(Fuc-α1,3-)Glc가 형성된다.
(1) 락토오스 + GDP-푸코오스 → 2'-FL + 디푸코실락토오스
특이적 1,2-푸코실트랜스퍼라제의 경우, 2'-FL은 대조적으로 바람직하지 않은 부산물을 형성하지 않으면서 반응식 (2)에 따라 형성된다.
(2) 락토오스 + GDP-푸코오스 → 2'-FL
푸코실트랜스퍼라제는 글리코실트랜스퍼라제 클래스(EC 2.4.)에 속하지만 이 클래스의 효소 중 한 가지 예일 뿐이다. 일반적으로, 글리코실트랜스퍼라제는 공여체에서 수용체로 당 분자의 전달을 촉매한다. 다양한 GT 사이에서 서열 상동성은 낮지만 대부분의 GT는 GT-A와 GT-B라는 두 가지 구조적 수퍼패밀리 중 하나에 지정될 수 있다. 두 수퍼패밀리의 공통점은 효소가 링커 구조/서열에 의해 서로 연결된 두 개의 도메인으로 이루어진다는 것이다. 효소의 활성 중심은 여기서 두 도메인의 영역으로부터 형성되며 그 사이에 위치한다.
GT-A 패밀리의 효소는 각 경우에 α-나선으로 둘러싸인 β 주름 시트(로스만 폴드(Rossmann fold)로 알려짐)로 이루어진 N-말단 도메인을 가지고 있는데, 이 도메인이 공여체를 인식하는 한편, C-말단 도메인은 주로 혼합된 베타 주름 시트로 이루어지며 수용체를 결합한다.
대조적으로, GT-B 패밀리의 효소는 두 개의 로스만 폴드 형태의 폴딩된 구조를 가지고 있다. N-말단 도메인은 수용체 결합 부위를 형성하는 반면, C-말단 구조는 공여체의 결합을 담당한다. 아마도 광범위한 수용체 당에 비해 공여체 당의 변동성이 낮기 때문에 GT-B 패밀리의 다양한 글리코실트랜스퍼라제의 C-말단 도메인은 N-말단 도메인보다 더 고도로 보존되어 있다(Albesa- et al 2014, Glycobiology 24, pp. 108-124).
GT-B 패밀리와 같은 구조적 수퍼패밀리 내에서 보존된 폴딩으로 인해, 구조적 수퍼패밀리의 두 가지 다른 글리코실트랜스퍼라제 도메인을 서로 결합하는 것이 가능하다. 도메인 교환이라고도 알려진 서로 다른 기원의 유사하게 폴딩된 단백질 도메인의 교환은 효소 특성화 및 대사 공학에서 일반적으로 사용되는 방법이며 새로운 특성(예를 들어, 변경된 활성 또는 기질 특이성 등)을 갖는 하이브리드 효소의 생성을 가능하게 한다(Schmid et al. 2016, Front. Microbiol. 7, 182, pp. 1-7; Hansen et al. 2009, Phytochemistry 70, pp. 473-482; Park et al. 2009, Biotechnol. Bioeng. 102, pp. 988-994; Truman et al. 2009, Chem. Biol. 16, pp. 676-685). 그러나 글리코실트랜스퍼라제에 대한 이전 도메인 교환 실험에 대한 결과는 일관되지 않는다. 한편, 글리코실트랜스퍼라제의 수용체 또는 공여체 특이성은 상응하는 도메인의 교환에 의해 변경된(Truman et al. 2009, Chem. Biol. 16, pp. 676-685) 반면, C- 및 N-말단 도메인 모두 수용체에 대한 특이성에 영향을 미쳐 기질 특이성의 예측은 일반적으로 가능하지 않다(Hansen et al. 2009, Phytochemistry 70, pp. 473-482). 확실히 이는 이 효소 클래스의 활성 중심이 두 도메인이 서로 바로 옆에 위치함으로써 형성되어 결과적으로 3차원 구조의 작은 차이로 인해 비활성 효소가 되거나 적어도 결합 부위가 왜곡되기 때문이다. 그러므로 그러한 실험은 일반적으로 비활성이거나 원하는 특이성과 반응성을 갖지 않는 효소를 제공할 것으로 예상할 수 있다.
특이성과 활성 외에도, 단백질 안정성과 용해도가 푸코실트랜스퍼라제에서 중요한 역할을 한다. 예를 들어, 이. 콜라이(E. coli)에서 푸코실트랜스퍼라제의 발현에서는 봉입체의 형성(Lee et al. 2015, Microbiology and Biotechnology Letters 43, pp. 212-218) 및 낮은 단백질 안정성(Wang et al. 1999, Microbiology(Reading) 145, pp. 3245-3253)이 자주 관찰되었다. 따라서 푸코실트랜스퍼라제의 용해도/안정성 및 폴딩을 증가시키려는 반복적인 시도가 이루어졌다. 샤페론의 공동발현(Lee et al. 2015, Microbiology and Biotechnology Letters 43, pp. 212-218)뿐만 아니라, 푸코실트랜스퍼라제를 글루타티온-S-트랜스퍼라제(GST)와 같이 빠르게 폴딩하고 가용성이 높은 단백질과 번역 융합하는 옵션도 있다(Albermann et al. 2001, Carbohydr. Res. 334, pp. 97-103). 대안적으로, 음으로 하전된 아스파테이트 태그와 같은 하전된 아미노산을 추가함으로써 용해도를 증가시킬 수 있다(Chin et al. 2015, J. Biotechnol. 210, pp. 107-115). 또한, 다수의 상동성 단백질로부터 형성된 아미노산 공통 서열을 사용하여 단백질 안정성을 향상시키는 것을 목표로 하는 접근법도 있다(Porebski and Buckle 2016, Protein Eng. Des. Sel. 29, pp. 245-251). 이 접근법은 상동성 서열에 의해 나타나는 진화 정보를 고려하고 보존된 아미노산이 보존되지 않은 아미노산보다 안정성에 더 많이 기여한다는 가설에 기초한다(Steipe et al. 1994, J. Mol. Biol. 240, pp. 188-192).
산업적 구현 시점까지 다양한 α-1,2-푸코실트랜스퍼라제를 사용한 2'-FL의 합성은 이미 본원에 기재된 발명 이전에 입증되었다. 여기에는 특히 헬리코박터 파이롤리(Helicobacter pylori) UA802의 α-1,2푸코실트랜스퍼라제(futC, GenBank AF076779; EP1243674, Kyowa Hakko, 1990), 헬리코박터 무스텔라(Helicobacter mustelae) NCTC12198/ATCC43772의 α-1,2-푸코실트랜스퍼라제(futL, GenBank CBG40460.1; EP1426441, Kyowa Hakko, 2001), 혈청 그룹 O126의 이. 콜라이 유래 α-1,2-푸코실트랜스퍼라제(wbgL, Engels and Elling 2014, Glycobiology 24, pp. 170-178), 및 박테로이데스 프라길리스(Bacteroides fragilis)의 α-1,2-푸코실트랜스퍼라제(wcfB, Chin et al. 2017, J. Biotechnol. 257, pp. 192-198)가 포함된다. 2'-FL 생산을 위한 이. 콜라이 균주의 회분식 발효에서 2'-FL 수율과 관련하여 상기 효소를 비교할 때 가장 높은 수율은 H. 파이롤리 UA802의 futC에서 나타났으며, 따라서 이는 이 효소의 높은 활성에 대한 지침이 되었다(Huang et al. 2017, Metab. Eng. 41, pp. 23-38).
효소의 보다 정확한 특성화 및 최적화를 위해 일부 서열 변형도 이루어졌다. H. 파이롤리 UA802의 futC 분석에서는 두 개의 대체 시작 코돈(△aa 1-15, 즉 아미노산 M16으로 시작; 또는 △aa 1-46, 즉 아미노산 M47로 시작)을 사용하여 N-말단을 단축하면 활성의 완전한 손실을 초래한다는 것을 보였다(Wang et al. 1999, Microbiology (Reading) 145, pp. 3245-3253). 마찬가지로, 보존된 영역 aa 163-173의 상류, 더 정확하게는 futC 유전자의 aa 152의 하류에 내성 유전자를 삽입하면 H. 파이롤리 UA802에서 푸코실화된 Lewis Y 항원의 생산과 관련된 기능이 상실되었다(Wang et al. 1999, Mol. Microbiol. 31, 1265-1274). 이 실험은 푸코실트랜스퍼라제 활성에 전체 코딩 서열이 필요하며 아미노산 서열을 조금만 조작해도 효소가 완전히 불활성화될 수 있음을 보여주었다.
H. 파이롤리 UA802의 futC는 락토오스뿐만 아니라 모노푸코실화된 당을 또한 기질로 수용하기 때문에(Wang et al. 1999, Microbiology (Reading) 145, pp. 3245-3253) 2'-FL의 합성은 부산물인 디푸코실락토오스(DFL) 또는 락토디푸코테트라오스(LDFT), 보다 정확하게는 Fuc-α1,2-Gal-β1,4-(Fuc-α1,3-)Glc의 형성에 의한 글루코오스 단위의 3'-히드록실기의 추가적인 푸코실화의 결과로서 동반된다(Yu et al. 2018, Microb. Cell. Fact. 17, 101, pp. 1-10). 이는 H. 파이롤리 균주 26695의 α-1,2-푸코실트랜스퍼라제에 대해서도 입증되었다(Chin et al. 2017, J. Biotechnol. 257, pp. 192-198).
이러한 생산 배치에서 DFL 형성은 2'-FL 합성 효율에 이중으로 부정적인 영향을 미치는데, 이는 DFL로의 전환의 결과로 2'-FL이 손실될 뿐만 아니라 필요한 활성화된 푸코오스(GDP-푸코오스)도 소비되기 때문이다. 그러면 후자는 더 이상 2'-FL 합성에 사용할 수 없다. 또한, 형성된 DFL은 2'-FL과 DFL의 물리적, 화학적 특성이 매우 유사하기 때문에 발효 배양물을 순수한 2'-FL로 워크업하는 단계를 어렵게 만든다.
따라서 바람직한 실시양태에서는 락토오스 갈락토오스 단위의 2'-히드록실 기의 특이적 푸코실화를 위해 위치 및 기질 특이적 α-1,2-푸코실트랜스퍼라제를 사용하는 것이 바람직하다. 확인된 예는 H. 무스텔라 NCTC12198/ATCC43772의 α-1,2-푸코실트랜스퍼라제 futL이며, 이는 부산물 DFL의 합성의 상당한 감소와 함께 2'-FL을 특이적으로 형성한다(EP2877574, Glycosyn, 2015). H. 파이롤리 UA802의 futC와 비교하여 락토오스에 대한 기술된 높은 활성 및 특이성의 결과로서, 이는 마찬가지로 2'-FL 합성에 이미 사용되었다(EP1426441, Kyowa Hakko, 2001). 반면에, 동일한 배치 발효 조건하에서 2'-FL 수율에 관해 H. 파이롤리 UA1210과 유사한 futC와 futL을 직접 비교하여(Huang et al. 2017, Metab. Eng. 41, pp. 23-38) futL이 futC로 얻은 수율의 약 75%만을 달성함을 보였다.
CAZY 데이터베이스(www.cazy.org/GT11_bacteria.html)에서는 1,2-푸코실트랜스퍼라제 둘 모두, 즉 H. 파이롤리 UA802의 futC와 H. 무스텔라 NCTC12198/ATCC43772의 futL이 글리코실트랜스퍼라제 패밀리 11(GT-11)에 지정되어 있다(Ma et al. 2006, Glycobiology 16, pp. 158-184). 이전에 문헌(Breton et al. 2012, Curr. Opin. Struct. Biol. 22, pp. 540-549)에서는 GT-11 패밀리에 대해 그 안에 분류된 효소가 GT-B 폴딩을 나타낼 수 있으며 이는 계속 가정되어야 한다(Petschacher and Nidetzky 2016, J. Biotechnol. 235, pp. 61-83)고 예측되었지만, GT11 패밀리 구성원을 GT-B 또는 GT-A 폴드 패밀리에 명확하게 지정하는 것은 불가능하였으며(Schmid et al. 2016, Front. Microbiol. 7, 182, pp. 1-7). 이는 도메인 교환 실험에 대한 공여체/수용체 특이성의 정확한 예측을 또한 불가능하게 한다.
제시된 선행 기술에 따르면, GT-B 수퍼패밀리에 지정된 것으로 추정할 경우, 수용체 결합을 담당하고 따라서 부산물 DFL을 형성하지 않고 락토오스를 2'-FL로 푸코실화하는 역할을 하는 것은 H. 무스텔라 NCTC12198/ATCC43772의 특이적인(구체적인 정의는 반응식 2 참조) futL의 N-말단 도메인일 것으로 예상된다.
본 발명의 목적은 2'-FL의 워크업을 용이하게 하여 경제적인 산업 공정 확립을 가능하게 하기 위해서 2'-FL의 생체촉매 합성 효율을 증가시키는 것, 즉 2'-FL의 수율 증가를 달성하는 동시에 매우 유사한 부산물 DFL의 형성을 방지하는 것이었다.
상기 목적은 효소로서, (i) 푸코실트랜스퍼라제의 N-말단 도메인을 포함하고 (ii) C-말단으로서 서열 번호 5의 적어도 아미노산 155-286 또는 이와 적어도 80%, 바람직하게는 적어도 90%, 더 바람직하게는 적어도 95% 동일한 아미노산 서열을 포함하는 융합 단백질이고 푸코실트랜스퍼라제 활성을 가지며, N-말단 도메인 및 C-말단 도메인이 두 개의 상이한 푸코실트랜스퍼라제로부터 유래되는 것을 특징으로 하는 효소를 제공함으로써 달성되었다. 이 융합 단백질은 놀랍게도 α-1,2-푸코실트랜스퍼라제 futL의 기질 및 위치 특이성을 효소 futC의 잠재적으로 더 높은 활성과 결합하는 데 성공하였다. 이는 현재의 선행 기술로부터 예측할 수 없었는데, 그 이유는 그로부터 2'-FL이 DFL로 더 푸코실화되는 것을 방지하는 기질 락토오스의 융합 단백질에 대한 특이적 결합을 담당하는 것이 서열 번호 5의 N-말단 도메인이고 서열 번호 5의 C-말단 도메인이 아니라고 예상되었기 때문이다. 이에 따라 락토오스를 2'-푸코실락토오스로 특이적으로 푸코실화하는 경제적으로 효과적인 방법에 사용될 수 있는 효소가 제공된다.
본 발명의 융합 단백질은 N-말단 도메인(단백질 i)과 C-말단 도메인(단백질 ii)의 아미노산 서열의 융합체를 구성하며, 여기서 N-말단 도메인과 C-말단 도메인은 두 개의 상이한 푸코실트랜스퍼라제로부터 유래한다. 예로서 사용된 야생형 단백질 futL(헬리코박터 무스텔라 NCTC12198의 futL, 서열 번호 5) 또는 futC(예를 들어 H. 파이롤리 UA802의 futC, 서열 번호 3)는 청구범위에 포함되지 않는데, 그 이유는 두 가지 상이한 푸코실트랜스퍼라제로부터의 융합 단백질이 아니기 때문이다.
융합 단백질이라는 용어는 해당 아미노산 서열 및/또는 코딩 DNA 서열이 실험실에서 융합되어 자연에서는 발생하지 않는 것을 의미한다. 융합 단백질은 하이브리드 또는 하이브리드 효소라고도 한다. 예를 들어 이는 헬리코박터 파일로리 UA802의 futC 서열을 기반으로 하는 공통 서열 futC*로부터 유래된 α-1,2-푸코실트랜스퍼라제의 N-말단 도메인 및 헬리코박터 무스텔라 NCTC12198의 futL 서열의 C-말단 도메인으로 구성될 수 있다. 하이브리드 효소는 높은 활성과 특이성을 가지며 푸코오스만을 락토오스로 효율적으로 전달한다. 예를 들어 푸코오스를 수용체 락토오스의 갈락토오스 단위의 2'-히드록실기에 전달하지만 락토오스의 글루코오스 단위의 3'-히드록실기에는 전달하지 않는다. 이로써 원하지 않는 부산물인 디푸코실락토오스의 형성이 크게 감소되는 것이 중요하다. 이는 DFL을 제거하기 위한 힘든 정제 단계가 대부분 또는 완전히 생략될 수 있기 때문에 2'-푸코실락토오스의 단리를 훨씬 더 쉽고 경제적으로 더 효율적으로 만든다.
융합 단백질을 사용하는 또 다른 이점은 N-말단 및 C-말단 도메인의 선택을 통해 공여체와 수용체에 대한 수용을 다양화할 수 있으며 이를 통해 더 복잡한 HMO를 더 효율적으로 생산할 수도 있다는 것이다. 또한, futC의 활성과 같은 더 높은 효소 활성은 futL의 선택성과 같은 수용체 기질에 대한 더 나은 선택성과 결합될 수 있다.
아마도 futC의 더 높은 활성과 수용체 기질에 대한 futL의 더 나은 선택성을 결합하기 위해서, futC*의 N-말단 도메인(서열 번호 7의 aa 1-148)이 futL의 C-말단 도메인(서열 번호 5의 aa 142-286)과 융합되었거나 역조합으로 futL의 N-말단 도메인(서열 번호 5의 aa 1-143)이 futC*의 C-말단 도메인(서열 번호 7의 aa 151-300)과 융합되었다. 이를 위해, futL에 대해 코딩되는 플라스미드에서 futL 유전자(서열 번호 4)의 핵산 서열에서 염기 426-427을 (TA에서 CT로) 교환함으로써 ScaI-(AGTACT) 절단 부위를 두 효소 도메인 사이의 링커 서열에 도입하였고, 이 교환에 의해 아미노산 서열은 변하지 않고 유지된다. 이 절단 부위의 도입을 통해, 이 플라스미드 구축물을 이용하여, 말단을 (EcoRI/XbaI) 절단하거나 도메인 사이(ScaI)를 절단하는 적합한 제한 효소를 사용한 제한 분해에 의해, futL의 N-말단/C-말단 도메인을 다른 것, 예를 들어, futC*의 적절한 PCR 증폭 도메인과 교환하는 것이 가능하였다(실시예 2 참조). 낮은 복제본 발현 플라스미드 상의 futC*/futL(서열 번호 8) 또는 futL/futC*(서열 번호 10) 하이브리드에 대해 생성된 cd는 rcsA(서열 번호 18)에 대한 cd와 함께 최적화된 RBS를 갖는 오페론에 전사적으로 결합되었다.
본 발명의 효소는 푸코실트랜스퍼라제(FT) 활성을 갖는다. 즉, 이는 글리세롤, 수크로오스, 글루코오스 또는 푸코오스로부터 출발하여 형성될 수 있는 GDP-, ADP-, CDP- 또는 TDP-푸코오스, 바람직하게는 구아노신 이인산 푸코오스(GDP-푸코오스)와 같은 공여체로부터 바람직하게는 락토오스와 같은 올리고당, 또는 당단백질, 단백질, 당지질 또는 지질인 수용체로의 푸코오스 단위의 전달을 촉매한다.
푸코실트랜스퍼라제 활성을 검출하기 위해서, 이. 콜라이에 최적화된 코돈 사용빈도를 이용한 테스트 단백질의 cd를 적절한 올리고뉴클레오티드를 사용하여 PCR로 증폭시키고 첨부된 절단 부위를 통해 낮은 복제본 발현 플라스미드 pWC1와 같은 발현 플라스미드 내로 프로모터, 바람직하게는 유도성 프로모터의 하류에 클로닝한다(예를 들어 실시예 2, 도 1 참조).
적합한 프로모터는 당업자에게 공지된 모든 프로모터, 예컨대 구성적 프로모터, 예를 들어 GAPDH 프로모터, 또는 유도성 프로모터, 예를 들어 lac, tac, trc, T7, 람다 PL, ara, 큐메이트 또는 tet 프로모터 또는 그로부터 유래된 서열이다. 바람직하게는, 본 발명의 효소의 발현을 조절하는 프로모터는 유도성 프로모터이고, 더욱 바람직하게는 IPTG(이소프로필-β-D-티오갈락토피라노시드)에 의해 유도되는 프로모터이다.
숙주 세포가 이. 콜라이 세포인 경우, 신생 합성 경로(de novo pathway)에서 GDP-푸코오스의 세포 내 내인성 생성을 증가시키기 위해서, 최적화된 리보솜 결합 부위(RBS)를 갖는 GDP-푸코오스에 대한 신생 합성 경로의 이. 콜라이 내인성 전사 활성화인자 rcsA(서열 번호 18(DNA)/서열 번호 19(PRT))에 대한 cd가 최종 발현 플라스미드 내로 푸코실트랜스퍼라제의 각 cd의 하류에 폴리시스트로닉으로 삽입되는 것이 바람직하다.
GDP-푸코오스 또는 다른 활성화된 푸코오스(예를 들어, ADP-, GDP-, CDP- 또는 TDP-푸코오스)를 공여체로서 세포 내로 제공할 수 있는 미생물 균주, 예를 들어 바람직하게는 발현 플라스미드를 갖는 이. 콜라이 K12△wcaJ△lon△sulA-lac-mod(실시예 1 및 도 2 참조)와 같은 적절한 이. 콜라이 균주의 형질전환을 통해, 당업자는 발현된 푸코실트랜스퍼라제 futC(서열 번호 3), futC*(서열 번호 7), futL(서열 번호 5), futC*/futL 하이브리드(서열 번호 9) 또는 futL/futC* 하이브리드(서열 번호 11))만이 상이하고 따라서 FT 활성 분석에 사용될 수 있는 균주를 얻을 수 있다. 이를 위해, 세포 내에서 공여체를 제공할 수 있는 생성된 균주를 배양 배지에 글리세롤, 수크로오스, 글루코오스 또는 푸코오스와 같은 공여체 전구체, 이를 세포 내에서 GDP-푸코오스로 전환할 수 있는 균주, 및 락토오스와 같은 수용체의 존재하에 배양한다. 유도성 프로모터가 선택된 경우 cd는 구성적으로 또는 유도 후에 발현된다. 균주의 FT 활성을 입증하기 위해, 푸코실화 생성물 2'-FL의 농도를 HPLC로 측정한다. 이를 위해, 세포 밀도 OD600이 적어도 대략 160인 상응하는 세포 배양물로부터 1 ㎖ 분취량을 취하고 나서, 예를 들어 벤치 원심분리기에서 최대 속도로 5분 동안 원심분리하여 모든 고체 성분을 제거하고, 얻은 상등액의 생성물 함량을 예를 들어 실시예 4에 기재된 바와 같이 HPLC로 정량화한다(도 3 참조).
출발 서열로 사용되는 다양한 푸코실트랜스퍼라제에 대한 코딩 서열(cd)은 선행 기술 및 데이터베이스에 공지되어 있으며 선택적으로 이. 콜라이와 같은 숙주 유기체에 최적화된 코돈 사용빈도를 사용하여 합성적으로 생산되거나 적절한 올리고뉴클레오티드를 사용한 PCR을 통해 원래 유기체의 게놈으로부터 증폭될 수 있다.
코딩 서열(cd)이라고 지칭되는 것은 시작 코돈과 종료 코돈 사이에 위치하며 단백질의 아미노산 서열을 코딩하는 DNA 또는 RNA 영역이다.
cd는 비코딩 영역으로 둘러싸여 있다. 유전자라고 지칭되는 것은 생물학적 활성 RNA를 생산하기 위한 모든 정보를 담고 있는 DNA 부분이다. 따라서 유전자에는 전사에 의해 단일 가닥 RNA 사본이 생성되는 DNA 부분뿐만 아니라 이러한 복제 과정의 조절에 관여하는 추가적인 DNA 부분도 포함된다.
본 발명의 효소에 대한 cd의 발현을 조절하는 바람직한 발현 신호에는 적어도 하나의 프로모터, 전사 시작, 번역 시작, 리보솜 결합 부위, 및 종결자가 포함된다. 이들은 특히 바람직하게는 사용된 박테리아 균주, 특히 바람직하게는 이. 콜라이에서 기능적이다. 따라서 기능적 프로모터의 경우, 이 프로모터의 조절하에 있는 코딩 서열이 RNA로 전사되는 경우이다.
야생형(wt) cd라고 지칭되는 것은 진화를 통해 자연적으로 발생하는 cd의 형태이며 자연에서 발생하는 유기체의 야생형 게놈에 존재한다.
도메인 또는 폴딩 클래스는 단백질 내에서 안정적으로 폴딩된, 일반적으로 조밀한 3차 구조를 갖는 영역을 의미한다. 선행 기술에 상세히 기술되고 위에서 밝혀진 바와 같이, GT-A 또는 GT-B 폴드를 갖는 모든 GT는 링커 구조/서열에 의해 서로 연결된 N-말단 도메인과 C-말단 도메인으로 이루어지며, 활성 중심은 두 도메인의 영역으로부터 형성된다. 예를 들어 3Dee 데이터베이스(dundee.ac.uk)를 사용하여 단백질 도메인을 정의할 수 있다.
futL 및 futC라는 명칭은 각각 서열 번호 5 및/또는 서열 번호 3을 갖는 상응하는 야생형 푸코실트랜스퍼라제를 의미하며, 각각은 각각 N-말단 및 C-말단 도메인으로 이루어진다.
futC*라는 용어는 서열 번호 7을 갖는 futC로부터 유래된 서열을 의미한다. 이는 마찬가지로 두 개의 도메인, N-말단 도메인과 C-말단 도메인으로 이루어진다. futL, futC, 및 futC*는 융합 단백질이 아니다.
반면, N/C라는 명칭은 한 FT의 N-말단 도메인과 다른 FT의 C-말단 도메인을 포함하는 FT를 나타낸다. 따라서, 예를 들어 futC*/futL은 푸코실트랜스퍼라제 futC*의 N-말단 도메인(서열 번호 7의 적어도 아미노산 1-129 또는 적어도 80% 동일한 아미노산 서열)과 푸코실트랜스퍼라제 futL의 C-말단 도메인(서열 번호 5의 적어도 아미노산 155-286 또는 적어도 80% 동일한 아미노산 서열)을 포함한다. 유사하게, futL/futC*에서는 futL의 N-말단 도메인과 futC*의 C-말단 도메인이 융합되었다.
futC*/futL(△8aa) 및 futC*/futL(△15aa)은 futC*의 N-말단 도메인과 futL의 C-말단 도메인을 포함하며, 여기서 C-말단 도메인은 각각 8개 및 15개 아미노산만큼 단축되었다.
상동성 아미노산 서열은 적어도 80%, 바람직하게는 적어도 90%, 더 바람직하게는 적어도 95% 동일한 서열을 의미하는 것으로 이해되어야 하며, 상동성 서열에서의 각 변경은 하나 이상의 아미노산의 삽입, 추가, 결실, 및 치환으로부터 선택된다.
아미노산 서열의 동일성은 공개적으로 접근 가능한 웹페이지 http://blast.ncbi.nlm.nih.gov/의 "Protein blast" 프로그램에 의해 결정된다. 이 프로그램은 blastp 알고리즘을 사용한다. 다음 일반 매개변수가 두 개 이상의 단백질 서열 정렬을 위한 알고리즘 매개변수로 사용된다: 최대 표적 서열 = 100; 짧은 쿼리 = "짧은 입력 서열에 대한 매개변수 자동 조정"; 예상 임계값 = 10; 단어 크기 = 3; 쿼리 범위의 최대 일치 수 = 0. 기본 점수 매기기 매개변수는 매트릭스 = BLOSUM62; 갭 비용 = 존재: 11 확장: 1; 구성 조정 = "조건부 구성 점수 매트릭스 조정"이다. 상동성 서열의 식별을 위해 위의 매개변수는 "비중복 단백질 서열(nr)" 데이터베이스 검색에 사용되었으며, 유기체 헬리코박터 파일로리(분류 id: 210)의 서열은 > 80%의 상동성에서 높은 데이터 밀도로 인해 제외되었다.
α-1,2-, α-1,3/4- 및 α-1,6-푸코실트랜스퍼라제는 구별된다. 바람직하게는, 본 발명의 융합 단백질은 α-1,2-푸코실트랜스퍼라제 활성을 갖는 효소이다.
바람직하게는, 효소는 융합 단백질의 N-말단 및 C-말단 도메인의 아미노산 서열이 미생물 서열, 더욱 바람직하게는 그람 음성 박테리아의 서열, 특히 바람직하게는 헬리코박터속의 박테리아 균주의 서열 또는 이와 상동성 서열인 것을 특징으로 한다.
바람직한 실시양태에서, 효소는 융합 단백질의 N-말단 및 C-말단 도메인의 아미노산 서열이 글리코실트랜스퍼라제 패밀리 11(GT-11)의 서열인 것을 특징으로 한다.
더욱 바람직하게는, 효소는 융합 단백질의 N-말단 및 C-말단 도메인의 아미노산 서열이 헬리코박터 파일로리 또는 헬리코박터 무스텔라 종의 서열 또는 이와 상동성 서열인 것을 특징으로 한다. 특히 바람직하게는, 융합 단백질은 유기체 헬리코박터 무스텔라 NCTC12198/ATCC43772의 futL(서열 번호 5)로부터의 C-말단 도메인을 포함한다. 융합 단백질의 다른 N-말단 도메인은 바람직하게는 유기체 헬리코박터 파일로리 UA802의 futC(서열 번호 3)로부터 유래된다.
바람직한 실시양태에서, 효소는 N-말단 도메인이 서열 번호 7의 적어도 아미노산 1-129, 더 바람직하게는 적어도 아미노산 1-132, 특히 바람직하게는 적어도 아미노산 1-148, 또는 각 경우에 이와 적어도 80% 동일한 아미노산 서열을 포함하는 것을 특징으로 한다. 특히 바람직한 실시양태에서, 효소는 융합 단백질의 N-말단 도메인의 아미노산 서열이 서열 번호 7의 아미노산 1-129, 더 바람직하게는 이의 아미노산 1-132, 더욱더 바람직하게는 이의 아미노산 1-148, 또는 이와 적어도 80% 동일한 아미노산 서열인 것을 특징으로 한다.
바람직한 실시양태에서, 효소는 C-말단 도메인이 서열 번호 1의 적어도 아미노산 155-286, 더 바람직하게는 적어도 아미노산 149-286, 특히 바람직하게는 적어도 아미노산 142-286, 또는 이와 적어도 80% 동일한 아미노산 서열을 포함하는 것을 특징으로 한다. 특히 바람직하게는, 효소는 융합 단백질의 C-말단 도메인의 아미노산 서열이 서열 번호 5의 아미노산 155-286, 더 바람직하게는 이의 아미노산 149-286, 더욱더 바람직하게는 이의 아미노산 142-286, 또는 각 경우에 이와 적어도 80% 동일한 아미노산 서열을 포함하는 것을 특징으로 한다.
융합 단백질은 서열 번호 9, 서열 번호 13, 서열 번호 15 또는 이와 적어도 80% 동일한 아미노산 서열인 것이 바람직하다. 특히 바람직하게는, 융합 단백질은 서열 번호 9를 갖는 futC*/futL이다.
유도 및 65 g/l(회분 및 연속)의 총 락토오스 투입량으로부터 25℃에서 65시간 동안 발효한 후 2'-FL 수율은 futC와 futC* 모두 2'-FL과 DFL을 형성하였고, futC의 2'-FL 수율은 futC*에 대한 수율보다 70% 더 높은 것으로 나타났다(실시예 3, 표 1 참조). 문헌에 기술된 바와 같이 futL은 2'-FL만을 형성하였다. futL에 대한 2'-FL 수율은 futC*에 대한 수율을 125%, futC에 대한 수율을 32% 초과하였다.
융합 단백질의 발현에서 2'-FL 및 DFL의 수율 분석에서 놀랍게도 선행 기술과 달리 융합 단백질 futC*/futL이 락토오스와 GDP-푸코오스를 특히 2'-FL로 100% 전환시켰으나 변이체 futL/futC*는 그렇지 못한 것으로 나타났다. 또한, 표 1은 특정 융합 단백질 futC*/futL이 2'-FL 수율을 비특이적 futC에 비해 56%, futC*에 비해 165%, 특이적 futL에 비해 18% 증가시켰음을 보여준다. 이는 예측할 수 없었는데, 그 이유는 첫째로 아직까지 futC나 futL에 사용할 수 있는 3차원 구조가 없고 둘째로 N-말단 도메인이 수용체 기질 결합을 담당하는 GT-B 폴드를 가정하면 락토오스와 GDP-푸코오스만 특이적으로 2'-FL로 전환하는 것은 futC*/futL이 아닌, 락토오스 특이적 futL의 N-말단 도메인을 포함한 융합 단백질 futL/futC*일 것으로 예상되었기 때문이다. 또한, futL/futC*에 대한 2'-FL 수율은 futC*/futL에 비해 70% 감소하였다.
융합 단백질에 사용된 futC*(서열 번호 7)에 의한 수율이 futC(서열 번호 3)에 비해 41% 감소하였으므로, futC의 N 말단 도메인(서열 번호 3의 aa 1-148)은 이전에 기술된 바와 같이 궁극적으로 futL의 C-말단 도메인(서열 번호 5의 aa 142-286)과 융합되어 futC/futL(서열 번호 12(DNA)/서열 번호 13(PRT))을 제공하고 생성된 발현 플라스미드는 2'-FL 생산에 적합한 균주(이. 콜라이 K12△wcaJ△lon△sulA-lac-mod)의 형질전환에 사용되었다(실시예 1 및 2 참조). 최적화된 발효 조건(25℃ 대신 27℃, 65 g/l 락토오스 대신 86 g/l 락토오스)에서 futC*/futL 및 futC/futL에 대한 2'-FL 및 DFL 수율은 이 경우에도 DFL이 형성되지 않은 것으로 나타났다. 그러나 융합 단백질 futC/futL에 의한 2'-FL 수율은 융합 단백질 futC*/futL에 비해 15% 감소하였다(표 1).
그럼에도 불구하고, 두 경우 모두 futC* 및 futC의 N-말단 도메인과 futL의 C-말단 도메인의 융합은 매우 유사한 부산물 DFL의 형성 없이 2'-FL의 선택적 생산을 초래하였다.
또한, 하이브리드 효소 futC*/futL의 C 말단은 각각 8 aa(서열 번호 9의 aa 1-285) 및 15 aa(서열 번호 9의 aa 1-278) 단축되었고(실시예 2 참조) 이는 최적화 조건(유도 후 27℃, 락토오스 86 g/l)에서 65시간 동안 발효한 후 2'-FL 수율과 관련하여 마찬가지로 조사되었다. 8 aa 단축하면 2'-FL 수율이 8% 감소한 반면, 15 aa 단축하면 2'-FL 또는 DFL이 모두 검출되지 않았다(표 1). 이로써 융합 단백질 futC*/futL의 적어도 aa 1-285가 그의 활성을 담당함을 보여주었다.
또한, 본 발명은 반응 혼합물에서 글루코오스, 글리세롤, 수크로오스, 푸코오스 및 GDP-, ADP-, CDP- 및 TDP-푸코오스로 이루어진 물질의 군으로부터 선택된 적어도 하나의 물질의 존재하에 락토오스를 본 발명의 효소와 반응시키는 것을 특징으로 하는 2'-푸코실락토오스의 제조 방법을 제공한다. 세포 내에서 GDP-푸코오스로 전환되는 물질은 바람직하게는 글루코오스이다. 본 발명의 효소는 바람직하게는 서열 번호 9를 갖는 futC*/futL이다. 특히 바람직하게는, 효소는 futC*/futL이고, 세포 내에서 GDP-푸코오스로 전환되는 물질은 글루코오스이다. 본 발명의 방법에서, 락토오스는 디푸코실락토오스가 형성되지 않으면서 완전한 전환을 거칠 수 있다.
바람직하게는, 2'-푸코실락토오스의 제조 방법은 반응 혼합물로부터 2'-푸코실락토오스를 단리하는 것을 특징으로 한다. 2'-푸코실락토오스를 단리하려면 첫 번째 단계에서 원심분리 또는 여과를 통해 반응 혼합물로부터 고체 성분을 제거하는 것이 바람직하다. 후속 단계에서, 예를 들어 크로마토그래피 방법과 여과에 의해 후속적으로 추가 불순물을 분리하고 2'-푸코실락토오스를 증발시켜 얻을 수 있다.
바람직한 실시양태에서, 이 방법은 락토오스가 5%, 더 바람직하게는 2.5%, 특히 바람직하게는 1.5% 초과의 DFL이 형성되지 않으면서 완전한 전환을 거치는 것을 특징으로 한다. 특히 바람직한 실시양태에서, 락토오스는 DFL의 형성 없이 완전한 전환을 거친다. 따라서 본 발명의 방법은 2'-FL의 특이적 형성으로 인해 결정화 또는 나노여과 또는 효소적 워크업에 의해 DFL 또는 락토오스와 같은 다른 당을 제거할 필요를 없애 준다는 주요 이점을 갖는다. 따라서 2'-FL의 선택적 생산은 워크업을 훨씬 더 쉽게 만든다.
따라서 특히 바람직한 실시양태에서, 방법은 글루코오스, 락토오스 또는 디푸코실락토오스와 같은 다른 당을 제거하기 위한 결정화, 나노여과 및/또는 효소적 워크업 없이 2'-푸코실락토오스를 단리하는 것을 특징으로 한다.
바람직한 실시양태에서, 2'-푸코실락토오스의 제조 방법은 반응 혼합물이 본 발명의 효소를 재조합적으로 발현하는 미생물의 배양물인 것을 특징으로 한다.
미생물의 배양은 선행 기술에 공지되어 있으며, 예를 들어 실시예 3에 기술된 바와 같이 수행될 수 있다.
미생물 균주는 특히 바람직하게는 유전자 변형된 이. 콜라이 K12 균주이다. 마찬가지로, 본 발명의 재조합적으로 발현된 효소가 융합 단백질 futC*/futL 또는 이와 상동성인 아미노산 서열인 것이 바람직하다. 따라서 특히 바람직한 실시양태에서, 미생물 균주는 유전적으로 변형된 이. 콜라이 K12 균주이고, 본 발명의 재조합적으로 발현된 효소는 융합 단백질 futC*/futL, 더 바람직하게는 rcsA가 동시 발현되는 것이다.
반응 혼합물이 미생물 배양물인 경우, 배양 상등액으로부터 2'-푸코실락토오스를 단리하는 것이 바람직하다. 위에서 이미 기술한 바와 같이, 숙주 세포와 같은 고체 구성성분은 먼저 여과에 의해, 더 바람직하게는 원심분리에 의해 분리된다. 이어서 크로마토그래피를 통해 추가 불순물을 제거하고 농축을 통해 결정질 형태의 생성물을 얻을 수 있다.
위에서 이미 기술한 바와 같이, 이 방법은 바람직하게 5%, 더 바람직하게는 2.5%, 특히 바람직하게는 1.5% 초과의 DFL가 형성되지 않으면서 락토오스가 완전한 전환을 거친다는 점을 특징으로 한다. 특히 바람직한 실시양태에서, 락토오스는 DFL의 형성 없이 완전한 전환을 거친다. 특히 바람직하게는, 2'-푸코실락토오스는 배양 상등액으로부터 글루코오스, 락토오스 및 디푸코실락토오스와 같은 다른 당을 제거하기 위해 발효액의 결정화, 나노여과 및/또는 효소적 워크업 없이 배양 상등액으로부터 단리된다.
실시예 5는 락토오스의 완전한 전환을 통한 발효를 예시적으로 보여준다(또한, 도 4 참조).
2'-푸코실락토오스의 제조 방법은 융합 단백질에 하나의 도메인이 포함되어 있는 융합되지 않은 야생형 효소에 의한 것보다 융합 단백질에 의해 적어도 4%, 더 바람직하게는 적어도 10%, 특히 바람직하게는 적어도 25%, 더욱더 바람직하게는 적어도 50% 더 많은 2'-푸코실락토오스가 형성된다.
바람직한 실시양태에서, 2'-푸코실락토오스의 제조 방법은 반응에서 47 g/l 이상, 바람직하게는 53 g/l 이상, 더 바람직하게는 60 g/l 이상의 2'-푸코실락토오스가 형성된다.
바람직하게는, 2'-푸코실락토오스의 제조 방법은 반응에서 1 g/l 미만, 더 바람직하게는 0 g/l의 디푸코실락토오스가 형성되는 것을 특징으로 한다. 이는 DFL의 형성을 방지하는 것이 특히 바람직하다는 것을 의미하는데, 이 경우 DFL을 제거하기 위한 힘든 정제 단계가 생략될 수 있기 때문에 2'-푸코실락토오스의 단리가 훨씬 더 쉬워져 경제적으로 더 효율적이기 때문이다.
바람직한 실시양태에서, 2'-푸코실락토오스의 제조 방법은 효소의 발현이 유도되는 것을 특징으로 한다.
이 경우, 본 발명의 효소의 발현을 조절하는 프로모터는 유도성 프로모터이고, 더 바람직하게는 IPTG(이소프로필-β-D-티오갈락토피라노시드)에 의한 유도성 프로모터이다.
이 경우, 본 발명의 방법은 유도 순간까지 생성물의 합성이 시작되지 않는다는 장점이 있는데, 이는 높은 세포 밀도에 먼저 도달하여 수율을 증가시킨다는 것을 의미한다.
실시예 :
본 발명은 예시적인 실시양태를 참조하여 이하에서 더욱 상세하게 설명되며, 이에 제한되지 않는다.
중합효소 연쇄반응(PCR), 유전자 합성, DNA 단리 및 정제, 제한 효소 및 리가제에 의한 DNA 변형, 형질전환 등과 같이 사용된 모든 분자생물학적 방법은 문헌에 설명되어 있거나 각각의 제조업체에서 권장하는 당업자에게 공지된 방식으로 수행하였다.
실시예 1: 2 - 푸코실락토오스 생산을 위한 이. 콜라이 K12 기반 균주 개발
2'-FL과 같은 푸코실화 HMO의 세포 내 합성을 위해 이. 콜라이 K12에 기반한 균주를 개발하였다. 먼저, 운데카프레닐 포스페이트 글루코오스 포스포트랜스퍼라제 wcaJ에 대한 cd를 게놈으로부터 결실시켰다. 그런 다음 lon 프로테아제에 대한 cd를 제거하였다. β-갈락토시다제(lacZ)에 대한 cd와 β-갈락토시드 트랜스아세틸라제(lacA)에 대한 cd를 결실시키는 한편, β-갈락토시드 투과효소(lacY)에 대한 cd는 보존시켰다는 점에서 lac 오페론을 변형시켰다. 마지막으로, 세포 분열 억제제 sulA에 대한 cd를 결실시켰다.
Datsenko Wanner (2000, Proc . Natl . Acad . Sci . USA. 97: 6640 - 5)에 라 λ-재조합효소를 사용한 wcaJ, lon 및 sulA에 대한 cd의 결실
사용된 이. 콜라이 K12의 게놈으로부터 wcaJ의 결실을 위해, 올리고뉴클레오티드 wcaJ-del-fw(서열 번호 26) 및 wcaJ-del-rv(서열 번호 26) 및 매트릭스로서 시판되는 플라스미드 pKD3(Coli Genetic Stock Center, CGSC: 7631)를 사용한 중합효소 연쇄반응(PCR)을 먼저 이용하여 클로람페니콜 내성 카세트를 함유하고 측면에 wcaJ cd의 상류 및 하류 영역 각각 대략 50개 염기쌍이 위치한 선형 DNA 단편을 생성하였다.
또한, 이. 콜라이 균주를 시판되는 플라스미드 pKD46(CGSC: 7739)으로 형질전환시킨 후 Datsenko 및 Wanner의 설명에 따라 적격 세포를 생산하였다. 이들을 PCR에 의해 생성된 선형 DNA 단편으로 형질전환시켰다. 이. 콜라이 균주 K12의 염색체 내로 클로람페니콜 내성 카세트(cat = 클로람페니콜 아세틸트랜스퍼라제)의 통합에 대한 선별을 20 mg/l 클로람페니콜을 함유한 LB 한천 플레이트에서 수행하였다. 올리고뉴클레오티드 wcaJ-check-fw(서열 번호 28) 및 wcaJ-check-rv(서열 번호 29)와 매트릭스로서 클로람페니콜 내성 세포의 염색체 DNA를 사용한 PCR에 의해 염색체 내 올바른 위치에서의 통합을 확인하였다. 이 공정은 wcaJ cd가 클로람페니콜 내성 카세트로 대체된 이. 콜라이 세포를 제공하였다.
그런 다음 플라스미드 pKD46을 기술된 절차(Datsenko 및 Wanner)에 따라 세포로부터 다시 제거하였고, 이렇게 생성된 균주를 이. 콜라이 K12 wcaJ::cat로 명명하였다.
이. 콜라이 균주 K12 wcaJ::cat의 염색체로부터 클로람페니콜 내성 카세트의 제거를 FLP 재조합효소 cd를 코딩하는 플라스미드 pCP20(CGSC: 7629)을 사용하여 Datsenko 및 Wanner의 절차에 따라 수행하였다. 이 방법으로 최종적으로 얻은 클로람페니콜 민감성 wcaJ 결실 돌연변이체를 이. 콜라이 K12△wcaJ로 명명하였다.
이. 콜라이 균주 K12△wcaJ로부터 lon cd의 결실을 wcaJ cd의 결실을 위해 이전에 사용되었던 동일한 방법을 사용하여 수행하였다. 그러나 매트릭스로서 pKD3(CGSG: 7631)을 사용한 선형 DNA 단편의 생성에서는 올리고뉴클레오티드 lon-del-fw(서열 번호 30) 및 lon-del-rv(서열 번호 31)를 사용하였다.
lon cd 위치에서 이. 콜라이 균주 K12△wcaJ의 염색체 내로 클로람페니콜 내성 카세트의 통합을 올리고뉴클레오티드 lon-check-fw(서열 번호 32) 및 lon-check-rv(서열 번호 33) 및 클로람페니콜 내성 세포의 염색체 DNA를 사용한 PCR에 의해 확인하였다.
염색체로부터 클로람페니콜 내성 카세트의 제거를 Datsenko 및 Wanner에 의해 기술한 바와 같이 다시 수행하였다. 클로람페니콜 내성 카세트가 없고 wcaJ cd 및 lon cd의 게놈 결실을 특징으로 하는 생성된 균주를 이. 콜라이 K12△wcaJ△lon으로 명명하였다.
이. 콜라이 균주 K12△wcaJ△lon-lac-mod(아래 "lac 오페론의 변형" 섹션에 설명된 대로 생산됨)로부터 sulA cd의 결실을 wcaJ cd의 결실을 위해 이전에 사용되었던 동일한 방법을 사용하여 수행하였다. 그러나 카나마이신 내성 유전자를 함유하고 측면에 sulA의 게놈 cd의 상류 및 하류 영역 각각 50개의 상동 염기쌍이 위치한 선형 DNA 단편을 생성하기 위해, 올리고뉴클레오티드 sulA-del-fw(서열 번호 34) 및 sulA-del-rv(서열 번호 35) 및 매트릭스로서 pKD13(CGSC:7633 GenBank seq. AY048744)을 사용하였다.
sulA cd의 위치에서 이. 콜라이 균주 K12△wcaJ△lon-lac-mod의 염색체 내로 카나마이신 내성 카세트(kanR)의 통합에 대한 선별을 처음에 50 mg/l 카나마이신을 함유하는 LB 한천 플레이트에서 수행하였다. 그런 다음 올리고뉴클레오티드 sulA-check-fw(서열 번호 36) 및 sulA-check-rv(서열 번호 37)와 카나마이신 내성 세포의 염색체 DNA를 사용한 PCR을 통해 통합을 확인하였다.
염색체로부터 카나마이신 내성 카세트의 제거를 마찬가지로 Datsenko 및 Wanner의 절차에 따라 클로람페니콜 내성 카세트와 동일한 방식으로 수행하였다. 카나마이신 내성 카세트를 제거한 후 생성된 균주를 이. 콜라이 K12△wcaJ△lon△sulA-lac-mod로 명명하였다.
2'-FL 생산을 위해, 적절한 발현 플라스미드로 균주를 형질전환시켰다(실시예 2 참조).
문헌[Hamilton et al. 1989, J. Bacteriol . 171 ( 99: 4617 -4622)]의 플라스미드 통합 방법에 따른 lac 오페론의 변형.
프로모터, RBS, 및 시작 코돈과 또한 lacY cd를 갖는 오페론 구조가 보존되어 있는 lac 오페론 lacZYA로부터 lacZ 및 lacA의 병렬 결실을 위해, 문헌[Hamilton et al. (1989)]에 기술된 상동 재조합 방법을 사용하였다.
이를 중첩 올리고뉴클레오티드 및 매트릭스로서 wt 이. 콜라이 K12의 게놈 DNA를 사용한 복수의 PCR을 이용하여 수행하여 3개의 선형 DNA 단편(PCR1: lac-1-fw + lac-2-rv(서열 번호 38, 39), PCR2: lac-3-fw + lac-4-rv(서열 번호 40, 41), PCR3: lac-5-fw + lac-6-rv(서열 번호 42, 43))를 생성한 후, 이를 두 개의 추가 중합효소 연쇄 반응에 의해 중첩 영역을 기반으로 융합시켰다. 이를 위해, PCR1 및 PCR2로붜의 선형 DNA 단편을 프라이머 lac-1-fw(서열 번호 38) 및 lac-4-rv(서열 번호 41)를 사용하여 먼저 융합시킨 후(PCR4), 생성된 DNA 단편을 PCR3으로부터의 DNA 및 올리고뉴클레오티드 lac-7-fw(서열 번호 44) 및 lac-8-rv(서열 번호 45)와 연결하였다(PCR5). 최종 선형 DNA 단편은 lacA cd, lacY cd의 하류 515 bp 상동성 영역 및 lacZ 상류 535 bp 상동성 영역을 포함하였으며, 이 단편은 측면 각 말단에 BamHI 절단 부위가 위치하였다.
이렇게 얻은 DNA 단편을 온도 민감성 벡터 pMAK700(Hamilton et al., 1989, J. Bacteriol. 171 (99: 4617-4622))에 클로닝하기 위해, 벡터와 선형 단편을 모두 제한 효소 BamHI으로 처리하고 벡터 단편을 알칼리성 포스파타제(rAPid Alkaline Phosphatase, Roche)로 탈인산화시키고 겔 전기영동으로 정제한 후 결찰시켜 적격 Stellar 이. 콜라이 세포(Takara, 일본 시가현 소재)의 형질전환에 사용하였다. 플라스미드 함유 세포에 대한 선별을 플라스미드 코딩된 클로람페니콜 내성 유전자를 기반으로 클로람페니콜이 포함된 LB 한천에서 수행하였다. 플라스미드는 또한 플라스미드 복제가 30℃에서만 가능하고 42℃에서는 가능하지 않은 온도 민감성(ts) 복제 기점(ori)을 포함하므로 세포를 30℃에서 인큐베이션하였다.
lac 오페론을 변형시키기 위해 이. 콜라이 균주 K12△wcaJ△lon(상기 참조)을 벡터 pMAK700-lac-mod로 30℃에서 형질전환시켰다. 클로람페니콜 내성 클론을 30℃에서 클로람페니콜이 포함된 LB 배지에서 배양한 후, 배양물을 클로람페니콜이 포함된 LB 한천에 도말하고 42℃에서 밤새 인큐베이션하였다. 이로써 lacA 하류 및 lacZ 상류의 측면 상동성 영역의 결과로 전체 ts 플라스미드를 염색체에 통합하고 따라서 승온에서 클로람페니콜 내성도 발생할 수 있는 클론의 선별을 허용하였다. 이러한 클론을 단리하고 올리고머 pMAK-fw(서열 번호 46) 및 lac-9-rv(서열 번호 47) 또는 lac-10-fw(서열 번호 48) 및 pMAK-rv(서열 번호 49)를 사용한 대조 PCR을 통해 올바른 플라스미드 통합에 대해 확인하였다. 플라스미드의 한 프라이머(pMAK-fw/pMAK-rv)와 염색체의 다른 프라이머(lac-9-rv/lac-10-fw)는 상동성 부착을 거칠 수 있기 때문에 상응하는 선형 DNA 단편은 올바른 플라스미드 통합의 경우에만 형성되었다. 통합 균주를 이. 콜라이 K12△wcaJ△lon::pMAK700-lac-mod로 명명하였다.
게놈으로부터 플라스미드를 제거하려면 두 번째 재조합이 일어나야 했다. 이를 수행한 방법에 따라, 균주의 두 가지 게놈 변이체가 생성되었다. 첫 번째 경우에는 "in" 재조합과 동일한 방식으로 플라스미드를 재조합하여 다시 야생형을 생성하였다. 대안적으로, 변경된 유전자좌가 게놈에 남아있고 야생형 유전자좌를 갖는 플라스미드가 방출되도록 플라스미드를 재조합하였다. 게놈으로부터 플라스미드를 탈통합하기 위해 이. 콜라이 K12△wcaJ△lon::pMAK700-lac-mod를 클로람페니콜이 포함된 LB 배지에서 42℃에서 4시간 동안 인큐베이션한 다음 클로람페니콜이 없는 LB 배지에서 30℃에서 인큐베이션하고 여러 번 계대배양하였다. 이 과정으로 인해 일부 세포는 게놈으로부터 플라스미드를 "out" 재조합을 수행하고 선별 압력이 없어서 플라스미드를 손실할 수 있게 되었다.
개별 클론을 단리하기 위해, 배양액을 희석하여 LB 한천에 도말하고 30℃에서 인큐베이션하였다. 그 다음 클론에서 플라스미드가 손실되었는지 확인하기 위해, 클로람페니콜이 포함된 LB 한천에 획선도말하였다. 클로람페니콜 민감성 클론을 프라이머 lac-11-fw(서열 번호 50) 및 lac-12-rv(서열 번호 51)를 사용한 PCR과 서열분석을 통해 원하는 유전적 변형에 대해 최종적으로 확인하였다. 생성된 균주를 이. 콜라이 K12△wcaJ△lon-lac-mod로 명명하였다.
실시예 2: 2 - 푸코실락토오스의 발효적 생산을 위한 푸코실트랜스퍼라제 futC, futC * , futL , 하이브리드 및 단축된 변이체의 cd 클로닝
발현 벡터의 제조:
사용된 발현 벡터는 pWC1였다. 이는 낮은 복제본 플라스미드이다. pWC1은 pACYC 복제 기점을 기준으로 세포당 대략 10개 복사본을 갖는 세포에 존재한다. 플라스미드 맵은 [도 1]에 도시되어 있고 서열은 서열 번호 1에 개시되어 있으며, 통상적인 제한 효소(6-염기 인식 서열 포함)의 위치는 플라스미드 맵에 표시되어 있다.
이 플라스미드에서, 각 효소의 코딩 서열(cd)을 락토오스 및 IPTG 유도성 프로모터 ptac의 제어하에 위치시켰다. 벡터에는 EcoRI 및 XbaI 효소에 대한 제한 부위가 포함되어 있다. 이들 효소로 플라스미드를 처리하면 특히 4799 bp의 큰 단편이 형성된다. 이를 아가로스 겔 전기영동(QIAquick® Gel Extraction Kit, Quiagen)으로 단리하고 알칼리성 포스파타제(rAPid Alkaline Phosphatase, Roche)로 처리하여 재결찰을 방지하였다. 이 벡터 단편을 다양한 푸코실트랜스퍼라제를 클로닝하는 데 사용하였다.
futC , futC * , 및 futL에 대한 cd의 클로닝
이. 콜라이의 최적의 코돈 사용빈도를 위해 변형된 푸코실트랜스퍼라제 futC(서열 번호 2) 및 futC*(서열 번호 6)의 cd는 GeneArt(Thermo Fisher, 독일 레겐스부르크 소재)에서 합성하고 futL(서열 번호 4)는 Genewiz(독일 라이프치히 소재)에서 합성하였다. futC 및 futC*를 코딩하는 cd는 프라이머 쌍 futC/futC*-fw(서열 번호 20) 및 futC/futC*-rv(서열 번호 21)를 포함한 두 개의 별도 혼합물에서 표준 조건하에 PCR 증폭을 거치고, futL을 코딩하는 cd는 EcoRI 또는 XbaI 절단 부위의 도입에 사용되는 프라이머 쌍 futL-fw(서열 번호 22) 및 futL-rv(서열 번호 23)를 포함한 세 번째 혼합물에서 증폭시켰다. futC cd와 futC* cd의 실질적인 상동성으로 인해 이들 두 구축물 모두에 대해 하나의 프라이머 쌍(futC/futC*-fw 및 futC/futC*-rv)을 사용하는 것이 가능하였다.
이어서 상응하는 PCR 생성물을 마찬가지로 제한 효소 EcoRI 및 XbaI로 처리한 다음 각각 리가제 혼합물에서 농축된 탈인산화 벡터 단편과 결합시켰다. 그 후, 표준 방법을 사용하여 결찰 혼합물을 적격 Stellar 이. 콜라이 세포(Takara, 일본 시가현 소재)에 형질전환시켰다. 성공적으로 결찰된 플라스미드를 갖는 단일 콜로니를 테트라사이클린 내성에 의해 선별하였다. 이들 콜로니로부터의 일부 플라스미드를 제한 패턴 및 서열분석에 의해 분석하였다. 마지막으로, 생산 실험 또는 추가 클로닝을 위해 올바른 플라스미드를 사용하였다. 생성된 플라스미드는 pWC1-futC, pWC1-futC* 및 pWC1-futL이었다.
futL cd에 Sca I 제한 절단 부위의 도입:
먼저, 전체 futL 발현 플라스미드를 PCR로 증폭시켰다. 여기서 프라이머에는 futL의 cd(서열 번호 4)에 새로운 제한 절단 부위(ScaI)가 포함되었다. 목표는 아미노산 서열을 변경하지 않고 푸코실트랜스퍼라제의 두 효소 도메인 사이의 링커 서열에 제한 절단 부위를 도입하는 것이었다. 그런 다음 세 가지 제한 부위(EcoRI, ScaI 및 XbaI)에 의해 두 도메인을 임의의 원하는 대체 도메인으로 교환하는 것이 가능하였다. PCR 반응을 위해, 위에서 설명한 발현 벡터 pWC1-futL을 매트릭스로서 사용하였다. 사용된 프라이머는 futL-Sca-fw(서열 번호 52) 및 futL-Sca-rv(서열 번호 53)이었다.
PCR 반응이 끝나면 플라스미드 DNA를 크로마토그래피로 정제한 후 제한 효소 DpnI(10 unit, NEB)을 첨가하여 혼합물로부터 메틸화된 매트릭스 DNA를 제거하였다. DpnI 혼합물을 37℃에서 1시간 동안 인큐베이션하였다. 이어서 DNA의 크로마토그래피 정제(Macherey & Nagel: NucleoSpin® Gel 및 PCR Clean-up-Kit)를 수행하고 적격 Stellar 이. 콜라이 세포(Takara, 일본 시가현 소재)에 형질전환시켰다. 양성 클론에 대한 선별을 위에서 기술한 바와 같이 수행하였다. 벡터를 pWC1-futL(ScaI)로 명명하였다.
융합 단백질 futL / futC * , futC * / futL , 및 futC / futL의 cd 클로닝 :
하이브리드 효소의 클로닝을 위해, 플라스미드 pWC1-futL(ScaI)을 제한 효소 ScaI 및 XbaI로 처리하였다. 대략 5243 bp 벡터 백본 단편에는 futL cd(서열 번호 4)의 N-말단 부분이 포함되어 있다. 이 단편을 탈인산화시키고 아가로스 겔 전기영동에 의해 농축하였다.
이와 병행하여, 프라이머 C-futC*-fw 및 C-futC*-rv(서열 번호 54, 55)와 매트릭스로서 벡터 pWC-1-futC*를 사용하여 PCR을 수행하였다. PCR 생성물은 주로 futC*(서열 번호 6)의 C-말단 도메인으로 이루어졌다.
PCR 반응이 끝나면, DNA를 제한효소 ScaI과 XbaI로 처리하고 크로마토그래피로 정제한 후 플라스미드 단편과 함께 결찰 혼합물에 사용하였다. 그 후, 표준 방법을 사용하여 결찰 혼합물을 적격 Stellar 이. 콜라이 세포(Takara, 일본 시가현 소재)에 형질전환시켰다. 성공적으로 결찰된 플라스미드를 갖는 단일 콜로니를 테트라사이클린 내성에 의해 선별하였다. 이들 콜로니로부터의 일부 플라스미드를 제한 패턴 및 서열분석에 의해 분석하였다. 마지막으로, 생산 실험 또는 추가 클로닝을 위해 올바른 플라스미드를 사용하였다.
생성된 플라스미드를 pWC1-futL/futC*로 명명하였다.
유사하게, futC*/futL 하이브리드(서열 번호 8(DNA)/서열 번호 9(PRT))의 생성을 위해 벡터 pWC1-futL(ScaI)을 제한 효소 EcoRI 및 ScaI로 처리하여 준비하였다. 여기서 대략 5240 bp 벡터 단편에는 futL cd(서열 번호 4)의 C-말단 도메인이 포함되었다.
이전 하이브리드 클로닝과 유사하게, futC* cd(서열 번호 6)의 N-말단 도메인을 PCR로 증폭시켰다. 벡터 pWC1-futC*를 다시 주형으로 사용하였고 사용된 프라이머 쌍은 (N-futC*-fw(서열 번호 56) 및 N-futC*-rv(서열 번호 57)였다.
벡터 단편을 탈인산화 및 농축 후 제한 효소(EcoRI/ScaI)로 처리하고 마찬가지로 농축된 PCR 산물과 함께 결찰시켰으며, 이 혼합물을 표준 방법을 사용하여 적격 Stellar 이. 콜라이 세포(Takara, 일본 시가현 소재)에 형질전환시켰다. 원하는 하이브리드 플라스미드를 위에서 기술한 바와 같이 단리하였다. 생성된 플라스미드를 pWC1-futC*/futL로 명명하였다.
유사하게, 하이브리드 구축물 futC/futL(서열 번호 12(DNA)/서열 번호 13(PRT))을 벡터 pWC1-futL(ScaI)로부터 클로닝하였다.
위에서 기술한 바와 같이, futL cd의 C-말단 부분을 갖는 벡터 단편을 생성하였고, 아래에 기술한 바와 같이 PCR 생성물을 생성하였고, 두 개를 위에서 기술한 바와 같이 추가로 처리하고 결찰시켰다. PCR에 사용된 매트릭스는 futC에 대한 cd(서열 번호 2)를 포함하는 벡터 pWC1-futC였으며, 사용된 프라이머 쌍은 N-futC*-fw(서열 번호 56) 및 N-futC*-rv(서열 번호 57)였다.
생성된 플라스미드를 pWC1-futC/futL로 명명하였다.
rcsA를 갖는 푸코실트랜스퍼라제 발현 플라스미드의 클로닝
이. 콜라이에서 활성화된 푸코오스(GDP-푸코오스)의 신생 합성을 증가시키기 위해, 최적화된 Shine-Dalgarno 서열(AGGAGGU; SDS), 이어서 RcsA(서열 번호 18)에 대한 이. 콜라이 내인성 cd를 푸코실트랜스퍼라제가 있는 오페론에 각 푸코실트랜스퍼라제의 cd의 C-말단에 직접 클로닝하였다. 이를 위해, NheI 또는 XbaI 절단 부위를 도입하는 데 사용되었던 프라이머 rcsA-fw(서열 번호 24) 및 rcsA-rv(서열 번호 25)를 사용하여 rcsA로부터 cd를 증폭시켰다. 이. 콜라이 K12의 게놈 DNA를 매트릭스로서 사용하였다.
푸코실트랜스퍼라제 발현 벡터의 클로닝과 유사하게, 후자, 즉 pWC1-futL, pWC1-futC, pWC1-futC*, pWC1-futL/futC*, pWC1-futC*/futL, 및 pWC1-futC/futL을 각각 제한 효소 XbaI로 처리하고, 탈인산화하고, 아가로스 겔 전기영동에 의해 농축하였다. rcsA PCR 생성물을 제한 효소 NheI 및 XbaI로 처리하였다. 이어서 이를 DNA의 크로마토그래피 정제(Macherey & Nagel: NucleoSpin® Gel 및 PCR Clean-up-Kit)를 수행하였다. 결찰 혼합물의 경우, 각각의 농축된 탈인산화 벡터 단편을 농축된 PCR 생성물과 결합시켰다. 그 후, 표준 방법을 사용하여 결찰 혼합물을 적격Stellar 이. 콜라이 세포(Takara, 일본 시가현 소재)에 형질전환시켰다. 성공적으로 결찰된 플라스미드를 갖는 단일 콜로니를 테트라사이클린 내성에 의해 선별하였다. 이들 콜로니로부터의 일부 플라스미드를 제한 패턴 및 서열분석에 의해 분석하였다. 마지막으로, 올바른 플라스미드(pWC1-futC*-rcsA, pWC1-futC-rcsA, pWC1-futL-rcsA, pWC1-futC*/futL-rcsA, pWC1-futL/futC*-rcsA, pWC1-futC/futL-rcsA)을 생산 실험 또는 추가 클로닝에 사용하였다.
단축된 futC * / futL 변이체의 클로닝 :
8 aa 단축된 futC*/futL 변이체 futC*/futL(△8aa)의 클로닝을 위해, 별도의 PCR에서 pWC1-fuc*/futL을 기반으로 하는 futC*/futL 하이브리드(서열 번호 8)의 cd를 먼저 프라이머 futC*-short-fw(서열 번호 58) 및 futC*-short8-rv(서열 번호 59)를 사용하여 증폭시키고 pWC1-futC-rcsA를 기반으로 하는 rcsA(서열 번호 18)의 cd를 프라이머 rcsA-2-fw(서열 번호 60) 및 rcsA-2-rv(서열 번호 61)로 증폭시켰다. 말단 상동성 올리고뉴클레오티드 futC*-short8-rv(서열 번호 59) 및 rcsA-2-fw(서열 번호 60)를 사용하면 프라이머 futC*-short-fw(서열 번호 58) 및 rcsA-2-rv(서열 번호 61)를 사용한 추가 PCR에서 생성된 선형 DNA 단편을 융합시킬 수 있다. 최종 선형 DNA 단편에는 EcoRI 절단 부위, futC*/futL(△8aa)에 대한 cd(서열 번호 14), RBS, rcsA에 대한 cd 및 XbaI 절단 부위가 포함되었다.
futC*-short8-rv(서열 번호 59) 대신에 올리고뉴클레오티드 futC*-short15-rv(서열 번호 62) 및 rcsA-2-fw(서열 번호 60) 대신에 rcsA-3-fw(서열 번호 63)를 사용한 것을 제외하고는 동일한 방식으로 15 aa 단축된 futC*/futL 변이체 futC*/futL(△15aa)에 대한 선형 DNA 단편을 클로닝하였다. 최종 선형 DNA 단편에는 EcoRI 절단 부위, futC*/futL(△15aa)(서열 번호 16)에 대한 cd, RBS, rcsA에 대한 cd, 및 XbaI 절단 부위가 포함되었다.
마지막으로, 두 선형 DNA 단편 모두 EcoRI 및 XbaI로 처리한 다음 각각 농축된 탈인산화 벡터 단편(EcoRI 및 XbaI로 절단된 pWC1, 위 참조)과 결찰시키고 적격 Stellar 이. 콜라이 세포(Takara, 일본 시가현 소재)를 형질전환시켰다. 결찰된 플라스미드를 갖는 단일 콜로니를 도입된 테트라사이클린 내성을 기준으로 선별하였다. 푸코실트랜스퍼라제 활성을 입증하기 위해, 2'-FL 생산 실험에 사용하기 전에 플라스미드를 제한 패턴과 서열 분석으로 분석하였다. 플라스미드 pWC1-futC*/futL(△8aa)-rcsA 및 pWC1-futC*/futL(△15aa)-rcsA를 얻었다.
실시예 3: 1L 발효조에서 2- 푸코실락토오스 디푸코실락토오스의 발효 생산에 대한 다양한 푸코실락토오스 트랜스퍼라제의 영향
실시예 2의 각 생산 플라스미드(pWC1-futL-rcsA, pWC1-futC-rcsA, pWC1-futC*-rcsA, pWC1-futC/futL-rcsA, pWC1-futC*/futL-rcsA, pWC1-futL/futC*-rcsA, pWC1-futC*/futL(△8aa)-rcsA, pWC1-futC*/futL(△15aa)-rcsA)로 형질전환된 실시예 1의 생산 균주 이. 콜라이 K12△wcaJ△lon△sulA-lac-mod의 단일 클론을 이전에 도말해두었던 촘촘하게 덮인 LB 한천 플레이트로부터 접종 루프를 사용하여 300 ㎖ 배플 원추형 플라스크에 30 ㎖의 LB 배지(3% 펩톤, 0.5% 효모 추출물, 0.5% NaCl)에 접종하였다. 박테리아 진탕기(145 rpm, 30℃)에서 4.5-5시간 동안 인큐베이션한 후 OD600은 1.5 내지 3.0이었다(OD600은 600 nm에서 분광 광도계로 결정된 광학 밀도를 나타냄). Sartorius의 Biostat B-DCU 연구 발효기에서의 발효를 위해, 각 경우에 6-13 ㎖의 사전배양물을 발효기의 초기 충전 배지로 옮겼다. 접종 후 초기 부피는 약 1L였다.
발효 배지에는 다음 성분이 함유되었다: 1 g/l의 NaCl, 150 mg/l의 FeSO4·7H2O, 2 g/l의 시트르산삼나트륨 이수화물, 10 g/l의 KH2PO4, 5 g/l의 (NH4)2SO4, 1.5 g/l의 HighExpress II(Kerry), 1.0 g/l의 Amisoy(Kerry), 0.5 g/l의 Hy-Yeast 412(Kerry), 및 10 ㎖/ℓ의 미량 원소 용액(발효조에 H2O 중 이들 성분의 용액을 채우고 이를 121℃에서 20분 동안 고압 멸균하였음). 미량 원소 용액은 150 mg/l의 Na2MoO4·2H2O, 300 mg/l의 H3BO3, 200 mg/l의 CoCl2·6H2O, 250 mg/l의 CuSO4·5H2O, 1.6 g/l의 MnCl2·4H2O, 및 1.35 g/l의 ZnSO4·7H2O로 구성되었다. 25% NH4OH 용액을 펌핑하여 배지의 pH를 6.8로 조정하였다. 그 후 여기에 적절한 저장 용액으로부터 15 g/l의 글루코오스, 1,2 g/l의 MgSO4·7H2O, 225 mg/l의 CaCl2·2H2O, 5 mg/l의 비타민 B1, 및 20 mg/l의 테트라사이클린을 무균 조건하에서 첨가한 후 접종원을 진탕 플라스크에서 발효조로 옮겼다.
발효 동안, 배양물을 400-1500 rpm으로 교반하고 멸균 미생물 필터를 통해 공급되는 일정한 2 slpm의 공기로 공기를 공급하였다. 교반 속도를 조절하여 산소 분압을 50%로 유지하였고; 후기 지수 단계에서는 배양 용액 중 O2 분압에 대해 원하는 공칭 값 50%를 보장하기 위해 순수한 O2로 공급 공기를 32%의 O2 함량으로 농축해야 했다. 25% NH4OH 용액 또는 20% H3PO4 용액으로 자동 보정하여 pH를 6.8로 유지시켰다. 온도는 초기에 30℃였으며 유도 30분 전 30분에 걸쳐 30℃에서 25℃로 점차 감소시켰다. 그런 다음 발효가 끝날 때까지(65시간) 온도를 25℃로 유지시켰다. 소포제(Struktol J673, Schill & Seilnacher, H2O 중 10%(v/v))의 자동 제어 첨가로 과도한 거품 발생을 방지하였다.
두 개의 별도(멸균) 공급 용액을 통해 발효 단계에 따라 글루코오스와 락토오스를 첨가하였다. 글루코오스 함량은 YSI의 글루코오스 분석기를 사용하여 결정하였다. 접종의 첫 번째 단계에서는 처음에 충전된 배지의 글루코오스가 소비되었다. 발효 시작 대략 10시간 후 시작하는 두 번째 단계에서, 0 g/l의 글루코오스 농도에서, 배양물에 무제한의 글루코오스 공급을 제공하는 것을 목표로 하여, 첨가제(660.2 g/kg의 글루코오스 일수화물(Biesterfeld-Spezialchemie), 5 g/l의 저장 용액으로부터 2.5 g/kg의 비타민, 147 g/l 저장 용액으로부터 3.65 g/kg의 CaCl2·2H2O, 240 g/l 저장 용액으로부터 12.31 g/kg의 MgSO4·7H2O, 4.04 g/kg의 미량 원소 용액(상기 참조), 및 317.3 g/kg의 탈염수)와 함께 60%(w/w) 글루코오스 공급 용액을 배양물에 연속적으로 공급하였다. 연속 글루코오스 공급물의 완전한 소비를 특징으로 하는 제3 단계에서, 글루코오스 공급물의 연속 첨가는 접종 후 대략 18.5시간이었고, 발효가 끝날 때까지(65시간) 일정한 9.2 g/L/h로 감소시키고, 0.25 mM의 IPTG를 첨가하여 각각의 1,2-푸코실트랜스퍼라제 및 rcsA의 발현을 유도하였다. 이와 병행하여 세 번째 단계 시작 시, 20 g/l의 락토오스를 25% (w/w) 락토오스 용액(263 g/kg의 α-D-락토오스 일수화물(abcr)이 737 g/kg의 탈염된 H2O에 용해됨)으로부터 회분식으로 첨가한 후 발효가 끝날 때까지 4 g/l/h의 25%(w/w) 락토오스 용액으로 연속 공급을 유지시켰다. 따라서, 시작 부피 1L를 기준으로 총 65 g/l의 락토오스를 첨가하였다.
2'-FL의 발효적 생산을 위한 대안적인 혼합물(혼합물 2)에서는 온도를 유도 시작 30분 전에 30분에 걸쳐 점차적으로 27℃로 감소시키고 유도 시 30 g/l의 락토오스를 회분식으로 첨가하고 발효가 끝날 때까지 5 g/l/h의 25%(w/w) 락토오스 용액으로 연속 공급을 유지시켰다. 이는 초기 부피 1L를 기준으로 총 86 g/l의 락토오스에 해당한다.
65시간 후 배지의 2'-FL, 3'-FL, DFL 및 락토오스 함량을 실시예 4에 기술된 바와 같이 샘플의 무세포 상등액으로부터 크로마토그래피로 결정하였으며 표 1에 g/l로 요약한다.
실시예 4: 2 - 푸코실락토오스의 발효적 생산에 대한 HPLC 분석
배지 내 2'-FL, 3'-FL, DFL, 및 락토오스 함량의 크로마토그래피 측정을 위해, 1 ㎖의 배양액을 65시간 동안 발효시킨 후 벤치탑 원심분리기에서 13000 rpm으로 5분간 원심분리하고 투명한 상층액을 탈염수에 1:2 내지 1:5로 희석하였다. 그런 다음 희석액 300 ㎕를 0.2 ㎛ 주사기 필터를 사용하여 HPLC 저장 용기 내로 여과하였다.
분석물의 분리를 위해, TSKgel amide-80 컬럼(Tosoh Bioscience, 250 mm x 4.6 mm; 입자 크기 5 ㎛)과 해당 가드 컬럼(TSKgel Guardgel amide-80, Tosoh Bioscience, 15 mm x 3.2 mm)을 다음 모듈을 갖춘 Agilent 1200/1260 HPLC 시스템에 사용하였다: 바이너리 펌프, 탈기 장치, 자동 샘플러, 자동 온도 조절 컬럼 오븐, 1260 RI 검출기. 컬럼 오븐의 온도는 30℃였다. 사용된 용리액은 H2O(30%)와 아세토니트릴(70%)의 탈기 혼합물이었다. 컬럼을 평형화한 후, 준비된 샘플 10 ㎕를 15℃로 냉각된 자동 샘플러로부터 매번 주입하였다. 그런 다음 25분 동안 1 ㎖/min의 유속으로 등용매 용리를 수행하였다. 검출을 위해 Bruker Daltonics의 RI 검출기(온도 35℃)와 Q-TOF Impact II 질량 분석기를 사용하였다.
표준 용액의 체류 시간(2'-FL: 15.4분, 3'-FL: 17.3분, DFL: 22.3분, 락토오스: 12.2분)을 기준으로 피크를 분석물에 할당하였다. 각 희석율을 고려하여 표준에 대한 보정선을 사용하고 피크 면적을 통합하여 분석물의 농도(g/l)를 최종적으로 결정하였다.
실시예 5: 1L 발효기에서 디푸코실락토오스의 형성 없이 락토오스의 2'- 푸코실락토오스로의 완전한 푸코실화 .
실시예 3, 혼합물 2에서 이전에 기술된 바와 같이, futC*/futL과 상동성인 융합 단백질을 코딩하는 생산 플라스미드를 갖는 생산 균주 이. 콜라이 K12△wcaJ△lon△sulA-lac-mod를 형질전환시키고 발효시켰다. 실시예 3과 달리, 65시간 후에 락토오스 공급을 종료시킨 반면, 글루코오스의 연속 첨가는 유지시켰다. 88시간 후 발효를 종료시키고 이전과 마찬가지로 배양 상등액에 존재하는 당을 HPLC로 측정하였다. 0 g/l DFL 및 0 g/l 잔류 락토오스와 함께 67 g/l 2'-FL의 형성은 융합 단백질이 부산물 DFL 형성 없이 락토오스를 2'-FL로 완전히 전환할 수 있음을 보여주었으며, 이는 후속적인 워크업 중에 락토오스와 디푸코실락토오스를 제거하는 공정 단계가 필요하지 않음을 의미한다.
약어
aa: 아미노산(들)
△Zaa: Z개 아미노산의 결실, 여기서 Z는 결실된 아미노산 수를 나타냄
OD600: 600 nm 파장에서의 광학 밀도
RBS: 리보솜 결합 부위
FT: 푸코실트랜스퍼라제
GT: 글리코실트랜스퍼라제
nRIU: 나노 굴절률 단위
도면은 다음을 도시한다:
[도 1]: 발현 플라스미드 pWC1에 대한 벡터 맵
발현 벡터의 개별 요소의 개요. 사용된 효소 EcoRI 및 XbaI에 대한 제한 부위도 표시되어 있다.
[도 2]: 2 - 푸코실락토오스 생산을 위한 이. 콜라이 균주 K12.
(특이적) 1,2-푸코실트랜스퍼라제의 도움으로 2'-푸코실락토오스의 효소적 합성을 위해, 이. 콜라이 균주 K12를 수송체 lacY를 통해 기질 락토오스를 받아들이지만 대사할 수 없도록 유전적으로 변형시켰다. 이를 위해, lacA 및 lacZ에 대한 cd를 게놈으로부터 결실시켰다. 신생 합성 경로에서 글루코오스로부터 GDP-푸코오스의 세포 내 생산을 강화하기 위해, 이 특정한 신생 합성 경로의 유전자에 대한 전사 활성화인자인 rcsA의 단백질분해를 방지하기 위해 lon 프로테아제에 대한 cd를 게놈으로부터 결실시켰다. rcsA 수준은 플라스미드의 과발현을 통해 추가로 증가될 수 있다. wcaJ의 결실은 콜라닌산 합성을 위한 GDP-푸코오스의 소비를 방지하며, 그 결과 활성화된 푸코오스는 플라스미드 코딩된 1,2-푸코실트랜스퍼라제에 의해 내재화된 락토오스로 전달될 수 있고, 특이적 1,2-푸코실트랜스퍼라제의 발현은 2'-푸코실락토오스의 푸코실화를 통해 원하지 않는 부산물인 디푸코실락토오스(DFL)의 형성을 방지한다.
[도 3]: 2'-FL 및 DFL 합성의 HPLC 분석.
발효 후 상등액의 HPLC 분석은 FutC*/FutL, FutC 및 FutL을 사용하여 2'-FL 및 DFL(존재하는 경우)의 생성을 보여준다. 비교를 위해 2'-FL, 락토오스 및 DFL 표준의 크로마토그램이 제시되어 있다.
[도 4]: 락토오스가 완전히 소모된 2'-FL 합성에 대한 HPLC 분석.
발효 후 상등액의 HPLC 분석은 FutC*/FutL과 상동성인 효소를 사용하여 2'-FL 및 DFL(존재하는 경우)의 생성 및 또한 잔류 락토오스를 보여준다.
SEQUENCE LISTING <110> Wacker Chemie AG <120> SPECIFIC ALPHA-1,2-FUCOSYLTRANSFERASE FOR THE BIOCATALYTIC SYNTHESIS OF 2'-FUCOSYLLACTOSE <130> CO12011 <160> 63 <170> PatentIn version 3.5 <210> 1 <211> 4846 <212> DNA <213> E.coli <220> <221> pWC1 <222> (1)..(4846) <400> 1 ttgacaatta atcatcggct cgtataatgt gtggaattgt gagcggataa caatttcaca 60 caggaaacag aattctaagg aggaaattat gcagaattca attggtaccc gggagatcta 120 gaagcttggc tgttttggcg gatgagagaa gattttcagc ctgatacaga ttaaatcaga 180 acgcagaagc ggtctgataa aacagaattt gcctggcggc agtagcgcgg tggtcccacc 240 tgaccccatg ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg tggggtctcc 300 ccatgcgaga gtagggaact gccaggcatc aaataaaacg aaaggctcag tcgaaagact 360 gggcctttcg ttttatctgt tgtttgtcgg tgaacgctct cctgagtagg acaaatccgc 420 cgggagcgga tttgaacgtt gcgaagcaac ggcccggagg gtggcgggca ggacgcccgc 480 cataaactgc caggcatcaa attaagcaga aggccatcct gacggatggc ctttttgcgt 540 ttctacaaac tcttttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga 600 caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat 660 ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca 720 gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc 780 gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca 840 atgatgagca cttttgcggc cgcatatgag ctctccggaa gatctctcga ggtcgacgta 900 cgtgcccatg gatgcattta attaattcga agttaactta agcttgtaca ctagtaaagt 960 tctgctatgt ggcgcggtat tatcccgtgt tgacgccggg caagagcaac tcggtcgccg 1020 catacactat tctcagaatg acttggttga gtccatggcg gccgccttca tgtggcagga 1080 gaaaaaaggc tgcaccggtg cgtcagcaga atatgtgata caggatatat tccgcttcct 1140 cgctcactga ctcgctacgc tcggtcgttc gactgcggcg agcggaaatg gcttacgaac 1200 ggggcggaga tttcctggaa gatgccagga agatacttaa cagggaagtg agagggccgc 1260 ggcaaagccg tttttccata ggctccgccc ccctgacaag catcacgaaa tctgacgctc 1320 aaatcagtgg tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggcgg 1380 ctccctcgtg cgctctcctg ttcctgcctt tcggtttacc ggtgtcattc cgctgttatg 1440 gccgcgtttg tctcattcca cgcctgacac tcagttccgg gtaggcagtt cgctccaagc 1500 tggactgtat gcacgaaccc cccgttcagt ccgaccgctg cgccttatcc ggtaactatc 1560 gtcttgagtc caacccggaa agacatgcaa aagcaccact ggcagcagcc actggtaatt 1620 gatttagagg agttagtctt gaagtcatgc gccggttaag gctaaactga aaggacaagt 1680 tttggtgact gcgctcctcc aagccagtta cctcggttca aagagttggt agctcagaga 1740 accttcgaaa aaccgccctg caaggcggtt ttttcgtttt cagagcaaga gattacgcgc 1800 agaccaaaac gatctcaaga agatcatctt attaatcaga taaaatattt ctagctagat 1860 ttcagtgcaa tttatctctt caaatgtagc acctgaagtc agccccatac gatataagtt 1920 gtaattctca tgtttgacag cttatcatcg ataagctcca ggacccaacg ctgcccgaga 1980 tgcgccgcgt gcggctgctg gagatggcgg acgcgatgga tatgttctgc caagggttgg 2040 tttgcgcatt cacagttctc cgcaagaatt gattggctcc aattcttgga gtggtgaatc 2100 cgttagcgag gtgccgccgg cttccattca ggtcgaggtg gcccggctcc atgcaccgcg 2160 acgcaacgcg gggaggcaga caaggtatag ggcggcgcct acaatccatg ccaacccgtt 2220 ccatgtgctc gccgaggcgg cataaatcgc cgtgacgatc agcggtccaa tgatcgaagt 2280 taggctggta agagccgcga gcgatccttg aagctgtccc tgatggtcgt catctacctg 2340 cctggacagc atggcctgca acgcgggcat cccgatgccg ccggaagcga gaagaatcat 2400 aatggggaag gccatccagc ctcgcgtcgc gaacgccagc aagacgtagc ccagcgcgtc 2460 ggccgccatg ccggcgataa tggcctgctt ctcgccgaaa cgtttggtgg cgggaccagt 2520 gacgaaggct tgagcgaggg cgtgcaagat tccgaatacc gcaagcgaca ggccgatcat 2580 cgtcgcgctc cagcgaaagc ggtcctcgcc gaaaatgacc cagagcgctg ccggcacctg 2640 tcctacgagt tgcatgataa agaagacagt cataagtgcg gcgacgatag tcatgccccg 2700 cgcccaccgg aaggagctga ctgggttgaa ggctctcaag ggcatcggtc gacgctctcc 2760 cttatgcgac tcctgcatta ggaagcagcc cagtagtagg ttgaggccgt tgagcaccgc 2820 cgccgcaagg aatggtgcat gcaaggagat ggcgcccaac agtcccccgg ccacggggcc 2880 tgccaccata cccacgccga aacaagcgct catgagcccg aagtggcgag cccgatcttc 2940 cccatcggtg atgtcggcga tataggcgcc agcaaccgca cctgtggcgc cggtgatgcc 3000 ggccacgatg cgtccggcgt agaggatcca caggacgggt gtggtcgcca tgatcgcgta 3060 gtcgatagtg gctccaagta gcgaagcgag caggactggg cggcggccaa agcggtcgga 3120 cagtgctccg agaacgggtg cgcatagaaa ttgcatcaac gcatatagcg ctagcagcac 3180 gccatagtga ctggcgatgc tgtcggaatg gacgatatcc cgcaagaggc ccggcagtac 3240 cggcataacc aagcctatgc ctacagcatc cagggtgacg gtgccgagga tgacgatgag 3300 cgcattgtta gatttcatac acggtgcctg actgcgttag caatttaact gtgataaact 3360 accgcattaa agcttatcga tgataagctg tcaaacatgg caggcctccc ccagcttgca 3420 attcgcgcta acttacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc 3480 tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg 3540 ggcgccaggg tggtttttct tttcaccagt gagacgggca acagctgatt gcccttcacc 3600 gcctggccct gagagagttg cagcaagcgg tccacgctgg tttgccccag caggcgaaaa 3660 tcctgtttga tggtggttaa cggcgggata taacatgagc tgtcttcggt atcgtcgtat 3720 cccactaccg agatatccgc accaacgcgc agcccggact cggtaatggc gcgcattgcg 3780 cccagcgcca tctgatcgtt ggcaaccagc atcgcagtgg gaacgatgcc ctcattcagc 3840 atttgcatgg tttgttgaaa accggacatg gcactccagt cgccttcccg ttccgctatc 3900 ggctgaattt gattgcgagt gagatattta tgccagccag ccagacgcag acgcgccgag 3960 acagaactta atgggcccgc taacagcgcg atttgctggt gacccaatgc gaccagatgc 4020 tccacgccca gtcgcgtacc gtcttcatgg gagaaaataa tactgttgat gggtgtctgg 4080 tcagagacat caagaaataa cgccggaaca ttagtgcagg cagcttccac agcaatggca 4140 tcctggtcat ccagcggata gttaatgatc agcccactga cgcgttgcgc gagaagattg 4200 tgcaccgccg ctttacaggc ttcgacgccg cttcgttcta ccatcgacac caccacgctg 4260 gcacccagtt gatcggcgcg agatttaatc gccgcgacaa tttgcgacgg cgcgtgcagg 4320 gccagactgg aggtggcaac gccaatcagc aacgactgtt tgcccgccag ttgttgtgcc 4380 acgcggttgg gaatgtaatt cagctccgcc atcgccgctt ccactttttc ccgcgttttc 4440 gcagaaacgt ggctggcctg gttcaccacg cgggaaacgg tctgataaga gacaccggca 4500 tactctgcga catcgtataa cgttactggt ttcacattca ccaccctgaa ttgactctct 4560 tccgggcgct atcatgccat accgcgaaag gttttgcacc attcgatggt gtcaacgtaa 4620 atgcatgccg cttcgccttc gcgcgcgaat tgcaagctga tccgggctta tcgactgcac 4680 ggtgcaccaa tgcttctggc gtcaggcagc catcggaagc tgtggtatgg ctgtgcaggt 4740 cgtaaatcac tgcataattc gtgtcgctca aggcgcactc ccgttctgga taatgttttt 4800 tgcgccgaca tcataacggt tctggcaaat attctgaaat gagctg 4846 <210> 2 <211> 903 <212> DNA <213> Helicobacter pylori <220> <221> futC <222> (1)..(903) <400> 2 atggccttta aagttgttca gatttgtggt ggtctgggca atcagatgtt tcagtatgca 60 tttgcaaaaa gcctgcaaaa gcatctgaat acaccggttc tgctggatac caccagtttt 120 gattggagca atcgtaaaat gcagctggaa ctgtttccga ttgatctgcc gtatgcaaat 180 gccaaagaaa ttgccattgc caagatgcag catctgccga aactggttcg tgatgcactg 240 aaatacattg gttttgatcg tgtgagccaa gagatcgtgt ttgaatatga accgaaactg 300 ctgaaaccga gccgtctgac ctattttttc ggttattttc aagatccgcg ttactttgat 360 gcaattagca gcctgattaa acagaccttt acactgcctc cgcctccgga aaataacaaa 420 aacaacaaca aaaaagagga agaatatcag cgcaaactga gcctgattct ggcagcaaaa 480 aatagcgttt ttgtgcatat tcgtcgcggt gattatgttg gtattggttg tcagctgggt 540 atcgactatc agaaaaaagc actggaatat atggcaaaac gtgtgccgaa tatggaactt 600 tttgtttttt gcgaggacct gaaattcacc cagaatctgg atctgggtta tccgtttacc 660 gatatgacca cacgtgataa agaagaagag gcatattggg atatgctgct gatgcagagc 720 tgtaaacatg gtattattgc caacagcacc tatagttggt gggcagccta tctgatggaa 780 aatccggaaa aaatcattat cggtccgaaa cattggctgt ttggccatga aaacattctg 840 tgtaaagaat gggtgaaaat cgaaagccac tttgaagtga aaagccagaa atataacgcc 900 taa 903 <210> 3 <211> 300 <212> PRT <213> Helicobacter pylori <220> <221> FutC <222> (1)..(300) <400> 3 Met Ala Phe Lys Val Val Gln Ile Cys Gly Gly Leu Gly Asn Gln Met 1 5 10 15 Phe Gln Tyr Ala Phe Ala Lys Ser Leu Gln Lys His Leu Asn Thr Pro 20 25 30 Val Leu Leu Asp Thr Thr Ser Phe Asp Trp Ser Asn Arg Lys Met Gln 35 40 45 Leu Glu Leu Phe Pro Ile Asp Leu Pro Tyr Ala Asn Ala Lys Glu Ile 50 55 60 Ala Ile Ala Lys Met Gln His Leu Pro Lys Leu Val Arg Asp Ala Leu 65 70 75 80 Lys Tyr Ile Gly Phe Asp Arg Val Ser Gln Glu Ile Val Phe Glu Tyr 85 90 95 Glu Pro Lys Leu Leu Lys Pro Ser Arg Leu Thr Tyr Phe Phe Gly Tyr 100 105 110 Phe Gln Asp Pro Arg Tyr Phe Asp Ala Ile Ser Ser Leu Ile Lys Gln 115 120 125 Thr Phe Thr Leu Pro Pro Pro Pro Glu Asn Asn Lys Asn Asn Asn Lys 130 135 140 Lys Glu Glu Glu Tyr Gln Arg Lys Leu Ser Leu Ile Leu Ala Ala Lys 145 150 155 160 Asn Ser Val Phe Val His Ile Arg Arg Gly Asp Tyr Val Gly Ile Gly 165 170 175 Cys Gln Leu Gly Ile Asp Tyr Gln Lys Lys Ala Leu Glu Tyr Met Ala 180 185 190 Lys Arg Val Pro Asn Met Glu Leu Phe Val Phe Cys Glu Asp Leu Lys 195 200 205 Phe Thr Gln Asn Leu Asp Leu Gly Tyr Pro Phe Thr Asp Met Thr Thr 210 215 220 Arg Asp Lys Glu Glu Glu Ala Tyr Trp Asp Met Leu Leu Met Gln Ser 225 230 235 240 Cys Lys His Gly Ile Ile Ala Asn Ser Thr Tyr Ser Trp Trp Ala Ala 245 250 255 Tyr Leu Met Glu Asn Pro Glu Lys Ile Ile Ile Gly Pro Lys His Trp 260 265 270 Leu Phe Gly His Glu Asn Ile Leu Cys Lys Glu Trp Val Lys Ile Glu 275 280 285 Ser His Phe Glu Val Lys Ser Gln Lys Tyr Asn Ala 290 295 300 <210> 4 <211> 861 <212> DNA <213> Helicobacter mustelae <220> <221> futL <222> (1)..(861) <400> 4 atggatttta agatcgtgca agttcacggt ggtctgggca accagatgtt ccagtatgcc 60 ttcgccaagt ctttacaaac ccacttaaat attccggtgc tgctggatac cacttggttc 120 gattatggca accgcgaact gggtctgcat ctgttcccga ttgatttaca atgcgccagc 180 gcacagcaga tcgcagccgc acatatgcag aatctgccgc gcttagtgcg cggtgcatta 240 cgccgcatgg gtttaggtcg cgttagcaaa gaaatcgtgt ttgagtatat gcccgaactg 300 ttcgagccga gccgcattgc ctatttccac ggctacttcc aagatcctcg ctatttcgag 360 gacattagcc cgctgattaa gcagaccttt actttacctc atccgacaga gcacgcagag 420 cagtatagcc gtaaactgag ccagatttta gccgccaaga acagtgtgtt cgtgcacatt 480 cgtcgcggcg actatatgcg tttaggctgg caattagaca ttagctatca attacgcgct 540 attgcttaca tggccaagcg tgttcagaat ctggagctgt ttctgttctg cgaggattta 600 gagtttgtgc agaatttaga tttaggttat ccgttcgtgg acatgaccac acgcgatggt 660 gccgcccact gggacatgat gctgatgcag agctgcaaac atggcatcat caccaacagc 720 acctatagtt ggtgggccgc ctatttaatc aaaaatccgg agaagatcat catcggcccg 780 agccattgga tttacggcaa cgagaatatt ctgtgtaaag attgggttaa aattgaaagc 840 cagtttgaga ccaaaagtta a 861 <210> 5 <211> 286 <212> PRT <213> Helicobacter mustelae <220> <221> FutL <222> (1)..(286) <400> 5 Met Asp Phe Lys Ile Val Gln Val His Gly Gly Leu Gly Asn Gln Met 1 5 10 15 Phe Gln Tyr Ala Phe Ala Lys Ser Leu Gln Thr His Leu Asn Ile Pro 20 25 30 Val Leu Leu Asp Thr Thr Trp Phe Asp Tyr Gly Asn Arg Glu Leu Gly 35 40 45 Leu His Leu Phe Pro Ile Asp Leu Gln Cys Ala Ser Ala Gln Gln Ile 50 55 60 Ala Ala Ala His Met Gln Asn Leu Pro Arg Leu Val Arg Gly Ala Leu 65 70 75 80 Arg Arg Met Gly Leu Gly Arg Val Ser Lys Glu Ile Val Phe Glu Tyr 85 90 95 Met Pro Glu Leu Phe Glu Pro Ser Arg Ile Ala Tyr Phe His Gly Tyr 100 105 110 Phe Gln Asp Pro Arg Tyr Phe Glu Asp Ile Ser Pro Leu Ile Lys Gln 115 120 125 Thr Phe Thr Leu Pro His Pro Thr Glu His Ala Glu Gln Tyr Ser Arg 130 135 140 Lys Leu Ser Gln Ile Leu Ala Ala Lys Asn Ser Val Phe Val His Ile 145 150 155 160 Arg Arg Gly Asp Tyr Met Arg Leu Gly Trp Gln Leu Asp Ile Ser Tyr 165 170 175 Gln Leu Arg Ala Ile Ala Tyr Met Ala Lys Arg Val Gln Asn Leu Glu 180 185 190 Leu Phe Leu Phe Cys Glu Asp Leu Glu Phe Val Gln Asn Leu Asp Leu 195 200 205 Gly Tyr Pro Phe Val Asp Met Thr Thr Arg Asp Gly Ala Ala His Trp 210 215 220 Asp Met Met Leu Met Gln Ser Cys Lys His Gly Ile Ile Thr Asn Ser 225 230 235 240 Thr Tyr Ser Trp Trp Ala Ala Tyr Leu Ile Lys Asn Pro Glu Lys Ile 245 250 255 Ile Ile Gly Pro Ser His Trp Ile Tyr Gly Asn Glu Asn Ile Leu Cys 260 265 270 Lys Asp Trp Val Lys Ile Glu Ser Gln Phe Glu Thr Lys Ser 275 280 285 <210> 6 <211> 903 <212> DNA <213> artificial <220> <223> Konsensussequenz <220> <221> futC* <222> (1)..(903) <400> 6 atggccttta aagttgttca gatttgtggt ggtctgggca atcagatgtt tcagtatgca 60 tttgcaaaaa gcctgcaaaa gcatctgaat acaccggttc tgctggatat taccagcttt 120 gattggagca atcgtaaaat gcagctggaa ctgtttccga ttgatctgcc gtatgcaagc 180 gcaaaagaaa ttgccattgc aaagatgcag catctgccga aactggttcg tgatgcactg 240 aaatgtatgg gttttgatcg tgtgagccaa gaaatcgtgt ttgaatatga accgaaactg 300 ctgaaaccga gccgtctgac ctattttttc ggttattttc aagatccgcg ttacttcgat 360 gcaattagtc cgctgattaa acagaccttt acactgcctc cgcctccgga aaataacaaa 420 aacaacaaca aaaaagagga agagtaccac cgtaaactga gcctgattct ggcagcaaaa 480 aatagcgttt ttgtgcatat tcgtcgcggt gattatgttg gtattggttg tcagctgggt 540 atcgactatc agaaaaaagc actggaatat atggcaaaac gtgtgccgaa tatggaactt 600 tttgtttttt gtgaggacct ggaatttacc cagaatctgg atctgggcta tccgtttatg 660 gatatgacca cacgtgataa agaagaagag gcatattggg atatgctgct gatgcagagc 720 tgtcagcatg gtattattgc aaatagcacc tatagttggt gggcagccta tctgattaat 780 aacccggaaa aaatcatcat cggtccgaaa cattggctgt ttggccatga aaacattctg 840 tgtaaagaat gggtgaaaat cgaaagccac tttgaagtga aaagccagaa atataacgcc 900 taa 903 <210> 7 <211> 300 <212> PRT <213> artificial <220> <223> Konsensussequenz <220> <221> FutC* <222> (1)..(300) <400> 7 Met Ala Phe Lys Val Val Gln Ile Cys Gly Gly Leu Gly Asn Gln Met 1 5 10 15 Phe Gln Tyr Ala Phe Ala Lys Ser Leu Gln Lys His Leu Asn Thr Pro 20 25 30 Val Leu Leu Asp Ile Thr Ser Phe Asp Trp Ser Asn Arg Lys Met Gln 35 40 45 Leu Glu Leu Phe Pro Ile Asp Leu Pro Tyr Ala Ser Ala Lys Glu Ile 50 55 60 Ala Ile Ala Lys Met Gln His Leu Pro Lys Leu Val Arg Asp Ala Leu 65 70 75 80 Lys Cys Met Gly Phe Asp Arg Val Ser Gln Glu Ile Val Phe Glu Tyr 85 90 95 Glu Pro Lys Leu Leu Lys Pro Ser Arg Leu Thr Tyr Phe Phe Gly Tyr 100 105 110 Phe Gln Asp Pro Arg Tyr Phe Asp Ala Ile Ser Pro Leu Ile Lys Gln 115 120 125 Thr Phe Thr Leu Pro Pro Pro Pro Glu Asn Asn Lys Asn Asn Asn Lys 130 135 140 Lys Glu Glu Glu Tyr His Arg Lys Leu Ser Leu Ile Leu Ala Ala Lys 145 150 155 160 Asn Ser Val Phe Val His Ile Arg Arg Gly Asp Tyr Val Gly Ile Gly 165 170 175 Cys Gln Leu Gly Ile Asp Tyr Gln Lys Lys Ala Leu Glu Tyr Met Ala 180 185 190 Lys Arg Val Pro Asn Met Glu Leu Phe Val Phe Cys Glu Asp Leu Glu 195 200 205 Phe Thr Gln Asn Leu Asp Leu Gly Tyr Pro Phe Met Asp Met Thr Thr 210 215 220 Arg Asp Lys Glu Glu Glu Ala Tyr Trp Asp Met Leu Leu Met Gln Ser 225 230 235 240 Cys Gln His Gly Ile Ile Ala Asn Ser Thr Tyr Ser Trp Trp Ala Ala 245 250 255 Tyr Leu Ile Asn Asn Pro Glu Lys Ile Ile Ile Gly Pro Lys His Trp 260 265 270 Leu Phe Gly His Glu Asn Ile Leu Cys Lys Glu Trp Val Lys Ile Glu 275 280 285 Ser His Phe Glu Val Lys Ser Gln Lys Tyr Asn Ala 290 295 300 <210> 8 <211> 882 <212> DNA <213> artificial <220> <223> Hybridsequenz aus zwei Organismen <220> <221> futC*/futL-Hybrid <222> (1)..(882) <400> 8 atggccttta aagttgttca gatttgtggt ggtctgggca atcagatgtt tcagtatgca 60 tttgcaaaaa gcctgcaaaa gcatctgaat acaccggttc tgctggatat taccagcttt 120 gattggagca atcgtaaaat gcagctggaa ctgtttccga ttgatctgcc gtatgcaagc 180 gcaaaagaaa ttgccattgc aaagatgcag catctgccga aactggttcg tgatgcactg 240 aaatgtatgg gttttgatcg tgtgagccaa gaaatcgtgt ttgaatatga accgaaactg 300 ctgaaaccga gccgtctgac ctattttttc ggttattttc aagatccgcg ttacttcgat 360 gcaattagtc cgctgattaa acagaccttt acactgcctc cgcctccgga aaataacaaa 420 aacaacaaca aaaaagagga agagtactca cgtaaactga gccagatttt agccgccaag 480 aacagtgtgt tcgtgcacat tcgtcgcggc gactatatgc gtttaggctg gcaattagac 540 attagctatc aattacgcgc tattgcttac atggccaagc gtgttcagaa tctggagctg 600 tttctgttct gcgaggattt agagtttgtg cagaatttag atttaggtta tccgttcgtg 660 gacatgacca cacgcgatgg tgccgcccac tgggacatga tgctgatgca gagctgcaaa 720 catggcatca tcaccaacag cacctatagt tggtgggccg cctatttaat caaaaatccg 780 gagaagatca tcatcggccc gagccattgg atttacggca acgagaatat tctgtgtaaa 840 gattgggtta aaattgaaag ccagtttgag accaaaagtt aa 882 <210> 9 <211> 293 <212> PRT <213> artificial <220> <223> Hybridsequenz aus zwei Organismen <220> <221> FutC*/FutL-Hybrid <222> (1)..(293) <400> 9 Met Ala Phe Lys Val Val Gln Ile Cys Gly Gly Leu Gly Asn Gln Met 1 5 10 15 Phe Gln Tyr Ala Phe Ala Lys Ser Leu Gln Lys His Leu Asn Thr Pro 20 25 30 Val Leu Leu Asp Ile Thr Ser Phe Asp Trp Ser Asn Arg Lys Met Gln 35 40 45 Leu Glu Leu Phe Pro Ile Asp Leu Pro Tyr Ala Ser Ala Lys Glu Ile 50 55 60 Ala Ile Ala Lys Met Gln His Leu Pro Lys Leu Val Arg Asp Ala Leu 65 70 75 80 Lys Cys Met Gly Phe Asp Arg Val Ser Gln Glu Ile Val Phe Glu Tyr 85 90 95 Glu Pro Lys Leu Leu Lys Pro Ser Arg Leu Thr Tyr Phe Phe Gly Tyr 100 105 110 Phe Gln Asp Pro Arg Tyr Phe Asp Ala Ile Ser Pro Leu Ile Lys Gln 115 120 125 Thr Phe Thr Leu Pro Pro Pro Pro Glu Asn Asn Lys Asn Asn Asn Lys 130 135 140 Lys Glu Glu Glu Tyr Ser Arg Lys Leu Ser Gln Ile Leu Ala Ala Lys 145 150 155 160 Asn Ser Val Phe Val His Ile Arg Arg Gly Asp Tyr Met Arg Leu Gly 165 170 175 Trp Gln Leu Asp Ile Ser Tyr Gln Leu Arg Ala Ile Ala Tyr Met Ala 180 185 190 Lys Arg Val Gln Asn Leu Glu Leu Phe Leu Phe Cys Glu Asp Leu Glu 195 200 205 Phe Val Gln Asn Leu Asp Leu Gly Tyr Pro Phe Val Asp Met Thr Thr 210 215 220 Arg Asp Gly Ala Ala His Trp Asp Met Met Leu Met Gln Ser Cys Lys 225 230 235 240 His Gly Ile Ile Thr Asn Ser Thr Tyr Ser Trp Trp Ala Ala Tyr Leu 245 250 255 Ile Lys Asn Pro Glu Lys Ile Ile Ile Gly Pro Ser His Trp Ile Tyr 260 265 270 Gly Asn Glu Asn Ile Leu Cys Lys Asp Trp Val Lys Ile Glu Ser Gln 275 280 285 Phe Glu Thr Lys Ser 290 <210> 10 <211> 882 <212> DNA <213> artificial <220> <223> Hybridsequenz aus zwei Organismen <220> <221> futL/futC*-Hybrid <222> (1)..(882) <400> 10 atggatttta agatcgtgca agttcacggt ggtctgggca accagatgtt ccagtatgcc 60 ttcgccaagt ctttacaaac ccacttaaat attccggtgc tgctggatac cacttggttc 120 gattatggca accgcgaact gggtctgcat ctgttcccga ttgatttaca atgcgccagc 180 gcacagcaga tcgcagccgc acatatgcag aatctgccgc gcttagtgcg cggtgcatta 240 cgccgcatgg gtttaggtcg cgttagcaaa gaaatcgtgt ttgagtatat gcccgaactg 300 ttcgagccga gccgcattgc ctatttccac ggctacttcc aagatcctcg ctatttcgag 360 gacattagcc cgctgattaa gcagaccttt actttacctc atccgacaga gcacgcagag 420 cagtactcac gtaaactgag cctgattctg gcagcaaaaa atagcgtttt tgtgcatatt 480 cgtcgcggtg attatgttgg tattggttgt cagctgggta tcgactatca gaaaaaagca 540 ctggaatata tggcaaaacg tgtgccgaat atggaacttt ttgttttttg tgaggacctg 600 gaatttaccc agaatctgga tctgggctat ccgtttatgg atatgaccac acgtgataaa 660 gaagaagagg catattggga tatgctgctg atgcagagct gtcagcatgg tattattgca 720 aatagcacct atagttggtg ggcagcctat ctgattaata acccggaaaa aatcatcatc 780 ggtccgaaac attggctgtt tggccatgaa aacattctgt gtaaagaatg ggtgaaaatc 840 gaaagccact ttgaagtgaa aagccagaaa tataacgcct aa 882 <210> 11 <211> 293 <212> PRT <213> artificial <220> <223> Hybridsequenz aus zwei Organismen <220> <221> FutL/FutC*-Hybrid <222> (1)..(293) <400> 11 Met Asp Phe Lys Ile Val Gln Val His Gly Gly Leu Gly Asn Gln Met 1 5 10 15 Phe Gln Tyr Ala Phe Ala Lys Ser Leu Gln Thr His Leu Asn Ile Pro 20 25 30 Val Leu Leu Asp Thr Thr Trp Phe Asp Tyr Gly Asn Arg Glu Leu Gly 35 40 45 Leu His Leu Phe Pro Ile Asp Leu Gln Cys Ala Ser Ala Gln Gln Ile 50 55 60 Ala Ala Ala His Met Gln Asn Leu Pro Arg Leu Val Arg Gly Ala Leu 65 70 75 80 Arg Arg Met Gly Leu Gly Arg Val Ser Lys Glu Ile Val Phe Glu Tyr 85 90 95 Met Pro Glu Leu Phe Glu Pro Ser Arg Ile Ala Tyr Phe His Gly Tyr 100 105 110 Phe Gln Asp Pro Arg Tyr Phe Glu Asp Ile Ser Pro Leu Ile Lys Gln 115 120 125 Thr Phe Thr Leu Pro His Pro Thr Glu His Ala Glu Gln Tyr Ser Arg 130 135 140 Lys Leu Ser Leu Ile Leu Ala Ala Lys Asn Ser Val Phe Val His Ile 145 150 155 160 Arg Arg Gly Asp Tyr Val Gly Ile Gly Cys Gln Leu Gly Ile Asp Tyr 165 170 175 Gln Lys Lys Ala Leu Glu Tyr Met Ala Lys Arg Val Pro Asn Met Glu 180 185 190 Leu Phe Val Phe Cys Glu Asp Leu Glu Phe Thr Gln Asn Leu Asp Leu 195 200 205 Gly Tyr Pro Phe Met Asp Met Thr Thr Arg Asp Lys Glu Glu Glu Ala 210 215 220 Tyr Trp Asp Met Leu Leu Met Gln Ser Cys Gln His Gly Ile Ile Ala 225 230 235 240 Asn Ser Thr Tyr Ser Trp Trp Ala Ala Tyr Leu Ile Asn Asn Pro Glu 245 250 255 Lys Ile Ile Ile Gly Pro Lys His Trp Leu Phe Gly His Glu Asn Ile 260 265 270 Leu Cys Lys Glu Trp Val Lys Ile Glu Ser His Phe Glu Val Lys Ser 275 280 285 Gln Lys Tyr Asn Ala 290 <210> 12 <211> 882 <212> DNA <213> artificial <220> <223> Hybridsequenz aus zwei Organismen <220> <221> futC/futL-Hybrid <222> (1)..(882) <400> 12 atggccttta aagttgttca gatttgtggt ggtctgggca atcagatgtt tcagtatgca 60 tttgcaaaaa gcctgcaaaa gcatctgaat acaccggttc tgctggatac caccagtttt 120 gattggagca atcgtaaaat gcagctggaa ctgtttccga ttgatctgcc gtatgcaaat 180 gccaaagaaa ttgccattgc caagatgcag catctgccga aactggttcg tgatgcactg 240 aaatacattg gttttgatcg tgtgagccaa gagatcgtgt ttgaatatga accgaaactg 300 ctgaaaccga gccgtctgac ctattttttc ggttattttc aagatccgcg ttactttgat 360 gcaattagca gcctgattaa acagaccttt acactgcctc cgcctccgga aaataacaaa 420 aacaacaaca aaaaagagga agagtactca cgtaaactga gccagatttt agccgccaag 480 aacagtgtgt tcgtgcacat tcgtcgcggc gactatatgc gtttaggctg gcaattagac 540 attagctatc aattacgcgc tattgcttac atggccaagc gtgttcagaa tctggagctg 600 tttctgttct gcgaggattt agagtttgtg cagaatttag atttaggtta tccgttcgtg 660 gacatgacca cacgcgatgg tgccgcccac tgggacatga tgctgatgca gagctgcaaa 720 catggcatca tcaccaacag cacctatagt tggtgggccg cctatttaat caaaaatccg 780 gagaagatca tcatcggccc gagccattgg atttacggca acgagaatat tctgtgtaaa 840 gattgggtta aaattgaaag ccagtttgag accaaaagtt aa 882 <210> 13 <211> 293 <212> PRT <213> artificial <220> <223> Hybridsequenz aus zwei Organismen <220> <221> FutC/FutL-Hybrid <222> (1)..(293) <400> 13 Met Ala Phe Lys Val Val Gln Ile Cys Gly Gly Leu Gly Asn Gln Met 1 5 10 15 Phe Gln Tyr Ala Phe Ala Lys Ser Leu Gln Lys His Leu Asn Thr Pro 20 25 30 Val Leu Leu Asp Thr Thr Ser Phe Asp Trp Ser Asn Arg Lys Met Gln 35 40 45 Leu Glu Leu Phe Pro Ile Asp Leu Pro Tyr Ala Asn Ala Lys Glu Ile 50 55 60 Ala Ile Ala Lys Met Gln His Leu Pro Lys Leu Val Arg Asp Ala Leu 65 70 75 80 Lys Tyr Ile Gly Phe Asp Arg Val Ser Gln Glu Ile Val Phe Glu Tyr 85 90 95 Glu Pro Lys Leu Leu Lys Pro Ser Arg Leu Thr Tyr Phe Phe Gly Tyr 100 105 110 Phe Gln Asp Pro Arg Tyr Phe Asp Ala Ile Ser Ser Leu Ile Lys Gln 115 120 125 Thr Phe Thr Leu Pro Pro Pro Pro Glu Asn Asn Lys Asn Asn Asn Lys 130 135 140 Lys Glu Glu Glu Tyr Ser Arg Lys Leu Ser Gln Ile Leu Ala Ala Lys 145 150 155 160 Asn Ser Val Phe Val His Ile Arg Arg Gly Asp Tyr Met Arg Leu Gly 165 170 175 Trp Gln Leu Asp Ile Ser Tyr Gln Leu Arg Ala Ile Ala Tyr Met Ala 180 185 190 Lys Arg Val Gln Asn Leu Glu Leu Phe Leu Phe Cys Glu Asp Leu Glu 195 200 205 Phe Val Gln Asn Leu Asp Leu Gly Tyr Pro Phe Val Asp Met Thr Thr 210 215 220 Arg Asp Gly Ala Ala His Trp Asp Met Met Leu Met Gln Ser Cys Lys 225 230 235 240 His Gly Ile Ile Thr Asn Ser Thr Tyr Ser Trp Trp Ala Ala Tyr Leu 245 250 255 Ile Lys Asn Pro Glu Lys Ile Ile Ile Gly Pro Ser His Trp Ile Tyr 260 265 270 Gly Asn Glu Asn Ile Leu Cys Lys Asp Trp Val Lys Ile Glu Ser Gln 275 280 285 Phe Glu Thr Lys Ser 290 <210> 14 <211> 858 <212> DNA <213> artificial <220> <223> Hybridsequenz aus zwei Organismen <220> <221> futC*/futL-Delta8 <222> (1)..(858) <400> 14 atggccttta aagttgttca gatttgtggt ggtctgggca atcagatgtt tcagtatgca 60 tttgcaaaaa gcctgcaaaa gcatctgaat acaccggttc tgctggatat taccagcttt 120 gattggagca atcgtaaaat gcagctggaa ctgtttccga ttgatctgcc gtatgcaagc 180 gcaaaagaaa ttgccattgc aaagatgcag catctgccga aactggttcg tgatgcactg 240 aaatgtatgg gttttgatcg tgtgagccaa gaaatcgtgt ttgaatatga accgaaactg 300 ctgaaaccga gccgtctgac ctattttttc ggttattttc aagatccgcg ttacttcgat 360 gcaattagtc cgctgattaa acagaccttt acactgcctc cgcctccgga aaataacaaa 420 aacaacaaca aaaaagagga agagtactca cgtaaactga gccagatttt agccgccaag 480 aacagtgtgt tcgtgcacat tcgtcgcggc gactatatgc gtttaggctg gcaattagac 540 attagctatc aattacgcgc tattgcttac atggccaagc gtgttcagaa tctggagctg 600 tttctgttct gcgaggattt agagtttgtg cagaatttag atttaggtta tccgttcgtg 660 gacatgacca cacgcgatgg tgccgcccac tgggacatga tgctgatgca gagctgcaaa 720 catggcatca tcaccaacag cacctatagt tggtgggccg cctatttaat caaaaatccg 780 gagaagatca tcatcggccc gagccattgg atttacggca acgagaatat tctgtgtaaa 840 gattgggtta aaatttaa 858 <210> 15 <211> 285 <212> PRT <213> artificial <220> <223> Hybridsequenz aus zwei Organismen <220> <221> FutC*/FutL-Delta8 <222> (1)..(285) <400> 15 Met Ala Phe Lys Val Val Gln Ile Cys Gly Gly Leu Gly Asn Gln Met 1 5 10 15 Phe Gln Tyr Ala Phe Ala Lys Ser Leu Gln Lys His Leu Asn Thr Pro 20 25 30 Val Leu Leu Asp Ile Thr Ser Phe Asp Trp Ser Asn Arg Lys Met Gln 35 40 45 Leu Glu Leu Phe Pro Ile Asp Leu Pro Tyr Ala Ser Ala Lys Glu Ile 50 55 60 Ala Ile Ala Lys Met Gln His Leu Pro Lys Leu Val Arg Asp Ala Leu 65 70 75 80 Lys Cys Met Gly Phe Asp Arg Val Ser Gln Glu Ile Val Phe Glu Tyr 85 90 95 Glu Pro Lys Leu Leu Lys Pro Ser Arg Leu Thr Tyr Phe Phe Gly Tyr 100 105 110 Phe Gln Asp Pro Arg Tyr Phe Asp Ala Ile Ser Pro Leu Ile Lys Gln 115 120 125 Thr Phe Thr Leu Pro Pro Pro Pro Glu Asn Asn Lys Asn Asn Asn Lys 130 135 140 Lys Glu Glu Glu Tyr Ser Arg Lys Leu Ser Gln Ile Leu Ala Ala Lys 145 150 155 160 Asn Ser Val Phe Val His Ile Arg Arg Gly Asp Tyr Met Arg Leu Gly 165 170 175 Trp Gln Leu Asp Ile Ser Tyr Gln Leu Arg Ala Ile Ala Tyr Met Ala 180 185 190 Lys Arg Val Gln Asn Leu Glu Leu Phe Leu Phe Cys Glu Asp Leu Glu 195 200 205 Phe Val Gln Asn Leu Asp Leu Gly Tyr Pro Phe Val Asp Met Thr Thr 210 215 220 Arg Asp Gly Ala Ala His Trp Asp Met Met Leu Met Gln Ser Cys Lys 225 230 235 240 His Gly Ile Ile Thr Asn Ser Thr Tyr Ser Trp Trp Ala Ala Tyr Leu 245 250 255 Ile Lys Asn Pro Glu Lys Ile Ile Ile Gly Pro Ser His Trp Ile Tyr 260 265 270 Gly Asn Glu Asn Ile Leu Cys Lys Asp Trp Val Lys Ile 275 280 285 <210> 16 <211> 837 <212> DNA <213> artificial <220> <223> Hybridsequenz aus zwei Organismen <220> <221> futC*/futL-Delta15 <222> (1)..(837) <400> 16 atggccttta aagttgttca gatttgtggt ggtctgggca atcagatgtt tcagtatgca 60 tttgcaaaaa gcctgcaaaa gcatctgaat acaccggttc tgctggatat taccagcttt 120 gattggagca atcgtaaaat gcagctggaa ctgtttccga ttgatctgcc gtatgcaagc 180 gcaaaagaaa ttgccattgc aaagatgcag catctgccga aactggttcg tgatgcactg 240 aaatgtatgg gttttgatcg tgtgagccaa gaaatcgtgt ttgaatatga accgaaactg 300 ctgaaaccga gccgtctgac ctattttttc ggttattttc aagatccgcg ttacttcgat 360 gcaattagtc cgctgattaa acagaccttt acactgcctc cgcctccgga aaataacaaa 420 aacaacaaca aaaaagagga agagtactca cgtaaactga gccagatttt agccgccaag 480 aacagtgtgt tcgtgcacat tcgtcgcggc gactatatgc gtttaggctg gcaattagac 540 attagctatc aattacgcgc tattgcttac atggccaagc gtgttcagaa tctggagctg 600 tttctgttct gcgaggattt agagtttgtg cagaatttag atttaggtta tccgttcgtg 660 gacatgacca cacgcgatgg tgccgcccac tgggacatga tgctgatgca gagctgcaaa 720 catggcatca tcaccaacag cacctatagt tggtgggccg cctatttaat caaaaatccg 780 gagaagatca tcatcggccc gagccattgg atttacggca acgagaatat tctgtaa 837 <210> 17 <211> 278 <212> PRT <213> artificial <220> <223> Hybridsequenz aus zwei Organismen <220> <221> FutC*/FutL-Delta15 <222> (1)..(278) <400> 17 Met Ala Phe Lys Val Val Gln Ile Cys Gly Gly Leu Gly Asn Gln Met 1 5 10 15 Phe Gln Tyr Ala Phe Ala Lys Ser Leu Gln Lys His Leu Asn Thr Pro 20 25 30 Val Leu Leu Asp Ile Thr Ser Phe Asp Trp Ser Asn Arg Lys Met Gln 35 40 45 Leu Glu Leu Phe Pro Ile Asp Leu Pro Tyr Ala Ser Ala Lys Glu Ile 50 55 60 Ala Ile Ala Lys Met Gln His Leu Pro Lys Leu Val Arg Asp Ala Leu 65 70 75 80 Lys Cys Met Gly Phe Asp Arg Val Ser Gln Glu Ile Val Phe Glu Tyr 85 90 95 Glu Pro Lys Leu Leu Lys Pro Ser Arg Leu Thr Tyr Phe Phe Gly Tyr 100 105 110 Phe Gln Asp Pro Arg Tyr Phe Asp Ala Ile Ser Pro Leu Ile Lys Gln 115 120 125 Thr Phe Thr Leu Pro Pro Pro Pro Glu Asn Asn Lys Asn Asn Asn Lys 130 135 140 Lys Glu Glu Glu Tyr Ser Arg Lys Leu Ser Gln Ile Leu Ala Ala Lys 145 150 155 160 Asn Ser Val Phe Val His Ile Arg Arg Gly Asp Tyr Met Arg Leu Gly 165 170 175 Trp Gln Leu Asp Ile Ser Tyr Gln Leu Arg Ala Ile Ala Tyr Met Ala 180 185 190 Lys Arg Val Gln Asn Leu Glu Leu Phe Leu Phe Cys Glu Asp Leu Glu 195 200 205 Phe Val Gln Asn Leu Asp Leu Gly Tyr Pro Phe Val Asp Met Thr Thr 210 215 220 Arg Asp Gly Ala Ala His Trp Asp Met Met Leu Met Gln Ser Cys Lys 225 230 235 240 His Gly Ile Ile Thr Asn Ser Thr Tyr Ser Trp Trp Ala Ala Tyr Leu 245 250 255 Ile Lys Asn Pro Glu Lys Ile Ile Ile Gly Pro Ser His Trp Ile Tyr 260 265 270 Gly Asn Glu Asn Ile Leu 275 <210> 18 <211> 624 <212> DNA <213> E.coli <220> <221> rcsA <222> (1)..(624) <400> 18 atgtcaacga ttattatgga tttatgtagt tacacccgac taggtttaac cgggtatctg 60 ttgagtagag gggttaaaaa aagagaaatc aacgacattg aaaccgttga tgaccttgcc 120 atagcttgtg attcacagcg cccttcagtg gtgtttatta atgaggactg tttcatccac 180 gatgcttcta acagtcagcg tatcaagctc atcattaatc aacatcccaa tacgttattt 240 atcgttttta tggcaattgc caatgttcat tttgatgaat atctattggt cagaaaaaat 300 ttattgatca gttctaaatc gattaaaccg gaatctctcg acgatatcct tggcgatatt 360 ctgaaaaaag agacaacgat aacctcgttt ttaaatatgc cgacgttatc attgagccga 420 accgaatcga gtatgttgcg aatgtggatg gcaggtcagg gaaccattca aatctctgac 480 caaatgaata tcaaagccaa gaccgtttca tcgcataaag gtaatattaa acgtaagatc 540 aaaacgcata ataaacaggt tatctaccat gtcgtccgac tgacggataa tgtgactaat 600 ggtatttttg tcaacatgcg ctaa 624 <210> 19 <211> 207 <212> PRT <213> E.coli <220> <221> RcsA <222> (1)..(207) <400> 19 Met Ser Thr Ile Ile Met Asp Leu Cys Ser Tyr Thr Arg Leu Gly Leu 1 5 10 15 Thr Gly Tyr Leu Leu Ser Arg Gly Val Lys Lys Arg Glu Ile Asn Asp 20 25 30 Ile Glu Thr Val Asp Asp Leu Ala Ile Ala Cys Asp Ser Gln Arg Pro 35 40 45 Ser Val Val Phe Ile Asn Glu Asp Cys Phe Ile His Asp Ala Ser Asn 50 55 60 Ser Gln Arg Ile Lys Leu Ile Ile Asn Gln His Pro Asn Thr Leu Phe 65 70 75 80 Ile Val Phe Met Ala Ile Ala Asn Val His Phe Asp Glu Tyr Leu Leu 85 90 95 Val Arg Lys Asn Leu Leu Ile Ser Ser Lys Ser Ile Lys Pro Glu Ser 100 105 110 Leu Asp Asp Ile Leu Gly Asp Ile Leu Lys Lys Glu Thr Thr Ile Thr 115 120 125 Ser Phe Leu Asn Met Pro Thr Leu Ser Leu Ser Arg Thr Glu Ser Ser 130 135 140 Met Leu Arg Met Trp Met Ala Gly Gln Gly Thr Ile Gln Ile Ser Asp 145 150 155 160 Gln Met Asn Ile Lys Ala Lys Thr Val Ser Ser His Lys Gly Asn Ile 165 170 175 Lys Arg Lys Ile Lys Thr His Asn Lys Gln Val Ile Tyr His Val Val 180 185 190 Arg Leu Thr Asp Asn Val Thr Asn Gly Ile Phe Val Asn Met Arg 195 200 205 <210> 20 <211> 46 <212> DNA <213> artificial <220> <223> Primersequenz <220> <221> futC/futC*fw <222> (1)..(46) <400> 20 ccccgaattc taaggaggaa attatatggc ctttaaagtt gttcag 46 <210> 21 <211> 38 <212> DNA <213> artificial <220> <223> Primersequenz <220> <221> futC/futC*rv <222> (1)..(38) <400> 21 cccctctaga ttattaggcg ttatatttct ggcttttc 38 <210> 22 <211> 47 <212> DNA <213> artificial <220> <223> Primersequenz <220> <221> futLfw <222> (1)..(47) <400> 22 ccccgaattc taaggaggaa attatatgga ttttaagatc gtgcaag 47 <210> 23 <211> 36 <212> DNA <213> artificial <220> <223> Primersequenz <220> <221> futLrv <222> (1)..(36) <400> 23 cccctctaga ttattaactt ttggtctcaa actggc 36 <210> 24 <211> 50 <212> DNA <213> artificial <220> <223> Primersequenz <220> <221> rcsAfw <222> (1)..(50) <400> 24 ccccgctagc ccctgcaagg aggtagaatg tcaacgatta ttatggattt 50 <210> 25 <211> 36 <212> DNA <213> artificial <220> <223> Primersequenz <220> <221> rcsArv <222> (1)..(36) <400> 25 cccctctaga ttattagcgc atgttgacaa aaatac 36 <210> 26 <211> 70 <212> DNA <213> artificial <220> <223> Primersequenz <220> <221> wcaJ-del-fw <222> (1)..(70) <400> 26 caatcgccga ccacttcgcg ccgctgatgg ttttttcacg taagctcata atgggaatta 60 gccatggtcc 70 <210> 27 <211> 70 <212> DNA <213> artificial <220> <223> Primersequenz <220> <221> wcaJ-del-rv <222> (1)..(70) <400> 27 ggatcttccc ttaccccact gcgggtaagg ggctaataac aggaacaacg gtgtaggctg 60 gagctgcttc 70 <210> 28 <211> 17 <212> DNA <213> E.coli <220> <221> wcaJ-check-fw <222> (1)..(17) <400> 28 cgccgaccac ttcgcgc 17 <210> 29 <211> 19 <212> DNA <213> E.coli <220> <221> wcaJ-check-rv <222> (1)..(19) <400> 29 atgtgccgct gatggaagc 19 <210> 30 <211> 75 <212> DNA <213> artificial <220> <223> Primersequenz <220> <221> lon-del-fw <222> (1)..(75) <400> 30 cacagtcgtg tcatctgatt acctggcgga aattaaacta agagagagct ctatgatggg 60 aattagccat ggtcc 75 <210> 31 <211> 70 <212> DNA <213> artificial <220> <223> Primersequenz <220> <221> lon-del-rv <222> (1)..(70) <400> 31 ggatcttccc ttaccccact gcgggtaagg ggctaataac aggaacaacg gtgtaggctg 60 gagctgcttc 70 <210> 32 <211> 21 <212> DNA <213> E.coli <220> <221> lon-check-fw <222> (1)..(21) <400> 32 cgtacatgtt aatagatggc g 21 <210> 33 <211> 18 <212> DNA <213> E.coli <220> <221> lon-check-rv <222> (1)..(18) <400> 33 gccatctaac ttagcgag 18 <210> 34 <211> 70 <212> DNA <213> artificial <220> <223> Primersequenz <220> <221> sulA-del-fw <222> (1)..(70) <400> 34 atgtacactt caggctatgc acatcgttct tcgtcgttct catccgcagc gtgtaggctg 60 gagctgcttc 70 <210> 35 <211> 71 <212> DNA <213> artificial <220> <223> Primersequenz <220> <221> sulA-del-rv <222> (1)..(71) <400> 35 ttaatgatac aaattagagt gaatttttag cccggaaagt tgtctcgtgg tccgtcgacc 60 tgcagttcga a 71 <210> 36 <211> 18 <212> DNA <213> E.coli <220> <221> sulA-check-fw <222> (1)..(18) <400> 36 gccagtgcca ctgcaatc 18 <210> 37 <211> 18 <212> DNA <213> E.coli <220> <221> sulA-check-rv <222> (1)..(18) <400> 37 cgcaaacacc gtgtcgtc 18 <210> 38 <211> 47 <212> DNA <213> artificial <220> <223> Primersequenz <220> <221> lac-1-fw <222> (1)..(47) <400> 38 cgcttgggca agccgcagga tcctttgctg atgcctgcta tggctcg 47 <210> 39 <211> 34 <212> DNA <213> artificial <220> <223> Primersequenz <220> <221> lac-2-rv <222> (1)..(34) <400> 39 gaagtcgctt aaattataaa aattgcctga tacg 34 <210> 40 <211> 36 <212> DNA <213> artificial <220> <223> Primersequenz <220> <221> lac-3-fw <222> (1)..(36) <400> 40 ggcaattttt ataatttaag cgacttcatt cacctg 36 <210> 41 <211> 36 <212> DNA <213> artificial <220> <223> Primersequenz <220> <221> lac-4-rv <222> (1)..(36) <400> 41 caggaaacag ctatgtacta tttaaaaaac acaaac 36 <210> 42 <211> 40 <212> DNA <213> artificial <220> <223> Primersequenz <220> <221> lac-5-fw <222> (1)..(40) <400> 42 gttttttaaa tagtacatag ctgtttcctg tgtgaaattg 40 <210> 43 <211> 51 <212> DNA <213> artificial <220> <223> Primersequenz <220> <221> lac-6-rv <222> (1)..(51) <400> 43 cgggaaggcg actggagtgc catggatccg gttttcaaca aaccatgcaa a 51 <210> 44 <211> 20 <212> DNA <213> artificial <220> <223> Primersequenz <220> <221> lac-7-fw <222> (1)..(20) <400> 44 cgcaggatcc tttgctgatg 20 <210> 45 <211> 20 <212> DNA <213> artificial <220> <223> Primersequenz <220> <221> lac-8-rv <222> (1)..(20) <400> 45 ccatggatcc ggttttcaac 20 <210> 46 <211> 20 <212> DNA <213> artificial <220> <223> Primersequenz <220> <221> pMAK-fw <222> (1)..(20) <400> 46 tcactatggc gtgctgctag 20 <210> 47 <211> 18 <212> DNA <213> artificial <220> <223> Primersequenz <220> <221> lac-9-rv <222> (1)..(18) <400> 47 tcgcattggg tcaccagc 18 <210> 48 <211> 18 <212> DNA <213> artificial <220> <223> Primersequenz <220> <221> lac-10-fw <222> (1)..(18) <400> 48 gccagcctga ttgcctgg 18 <210> 49 <211> 20 <212> DNA <213> artificial <220> <223> Primersequenz <220> <221> pMAK-rv <222> (1)..(20) <400> 49 agatggcgcc caacagtccc 20 <210> 50 <211> 19 <212> DNA <213> E.coli <220> <221> lac-11-fw <222> (1)..(19) <400> 50 cggcgcaaac tgttaatgc 19 <210> 51 <211> 19 <212> DNA <213> E.coli <220> <221> lac-12-rv <222> (1)..(19) <400> 51 gcaaatgctg aatgagggc 19 <210> 52 <211> 32 <212> DNA <213> artificial <220> <223> Primersequenz <220> <221> futL-Scafw <222> (1)..(32) <400> 52 gcacgcagag cagtactcac gtaaactgag cc 32 <210> 53 <211> 32 <212> DNA <213> artificial <220> <223> Primersequenz <220> <221> futL-Scarv <222> (1)..(32) <400> 53 ggctcagttt acgtgagtac tgctctgcgt gc 32 <210> 54 <211> 26 <212> DNA <213> artificial <220> <223> Primersequenz <220> <221> C-futC*fw <222> (1)..(26) <400> 54 ccccgaattc taaggaggaa attata 26 <210> 55 <211> 32 <212> DNA <213> artificial <220> <223> Primersequenz <220> <221> C-futC*rv <222> (1)..(32) <400> 55 cgtgagtact cttcctcttt tttgttgttg tt 32 <210> 56 <211> 26 <212> DNA <213> artificial <220> <223> Primersequenz <220> <221> N-futC*fw <222> (1)..(26) <400> 56 ccccgaattc taaggaggaa attata 26 <210> 57 <211> 32 <212> DNA <213> artificial <220> <223> Primersequenz <220> <221> N-futC*rv <222> (1)..(32) <400> 57 cgtgagtact cttcctcttt tttgttgttg tt 32 <210> 58 <211> 25 <212> DNA <213> artificial <220> <223> Primersequenz <220> <221> futC*-short-fw <222> (1)..(25) <400> 58 cacaggaaac agaattctaa ggagg 25 <210> 59 <211> 34 <212> DNA <213> artificial <220> <223> Primersequenz <220> <221> futC*-short8-rv <222> (1)..(34) <400> 59 aattttaacc caatctttac acagaatatt ctcg 34 <210> 60 <211> 48 <212> DNA <213> artificial <220> <223> Primersequenz <220> <221> rcsA-2-fw <222> (1)..(48) <400> 60 ctgtgtaaag attgggttaa aatttaataa tctagcccct gcaaggag 48 <210> 61 <211> 26 <212> DNA <213> artificial <220> <223> Primersequenz <220> <221> rcsA-2-rv <222> (1)..(26) <400> 61 ccaagcttct agattattag cgcatg 26 <210> 62 <211> 26 <212> DNA <213> artificial <220> <223> Primersequenz <220> <221> futC*-short15-rv <222> (1)..(26) <400> 62 cagaatattc tcgttgccgt aaatcc 26 <210> 63 <211> 50 <212> DNA <213> artificial <220> <223> Primersequenz <220> <221> rcsA-3-fw <222> (1)..(50) <400> 63 ggatttacgg caacgagaat attctgtaat aatctagccc ctgcaaggag 50

Claims (15)

  1. 효소로서,
    (i) 푸코실트랜스퍼라제의 N-말단 도메인을 포함하고
    ii) C-말단 도메인으로서 서열 번호 5의 적어도 아미노산 155-286 또는 이와 적어도 80% 동일한 아미노산 서열을 포함하는
    융합 단백질이고,
    푸코실트랜스퍼라제 활성을 가지며,
    N-말단 도메인 및 C-말단 도메인이 두 개의 상이한 푸코실트랜스퍼라제로부터 유래되는 것을 특징으로 하는 효소.
  2. 제1항에 있어서, 융합 단백질의 N-말단 및 C-말단 도메인의 아미노산 서열이 미생물 서열 또는 이와 상동성 서열인 것을 특징으로 하는 효소.
  3. 제1항 또는 제2항에 있어서, 융합 단백질의 N-말단 및 C-말단 도메인의 아미노산 서열이 헬리코박터(Helicobacter)속의 서열 또는 이와 상동성 서열인 것을 특징으로 하는 효소.
  4. 제1항 내지 제3항 중 어느 하나의 항에 있어서, N-말단 도메인이 서열 번호 7의 적어도 아미노산 1-129 또는 이와 적어도 80% 동일한 아미노산 서열을 포함하는 것을 특징으로 하는 효소.
  5. 제1항 내지 제4항 중 어느 하나의 항에 있어서, 융합 단백질의 N-말단 도메인의 아미노산 서열이 서열 번호 7의 아미노산 1-148 또는 이와 적어도 80% 동일한 아미노산 서열인 것을 특징으로 하는 효소.
  6. 제1항 내지 제5항 중 어느 하나의 항에 있어서, C-말단 도메인이 서열 번호 5의 적어도 아미노산 155-286 또는 이와 적어도 80% 동일한 아미노산 서열을 포함하는 것을 특징으로 하는 효소.
  7. 제1항 내지 제6항 중 어느 하나의 항에 있어서, 융합 단백질의 C-말단 도메인의 아미노산 서열이 서열 번호 5의 아미노산 142-286 또는 이와 적어도 80% 동일한 아미노산 서열인 것을 특징으로 하는 효소.
  8. 제1항 내지 제7항 중 어느 하나의 항에 있어서, 융합 단백질이 서열 번호 9, 서열 번호 13, 서열 번호 15 또는 이와 적어도 80% 동일한 아미노산 서열인 것을 특징으로 하는 효소.
  9. 2'-푸코실락토오스의 제조 방법으로서, 반응 혼합물에서 글루코오스, 글리세롤, 수크로오스, 푸코오스, 및 GDP-, ADP-, CDP-, 및 TDP-푸코오스로 이루어진 물질의 군으로부터 선택된 적어도 하나의 물질의 존재하에 락토오스를 제1항 내지 제8항 중 하나 이상의 항의 적어도 하나의 효소와 반응시키는 것을 특징으로 하는 2'-푸코실락토오스의 제조 방법.
  10. 제9항에 있어서, 5% 초과의 DFL이 형성되지 않으면서 락토오스가 완전히 전환되는 것을 특징으로 하는 방법.
  11. 제9항 또는 제10항에 있어서, 반응 혼합물이, 효소를 재조합적으로 발현하는 미생물의 배양물인 것을 특징으로 하는 방법.
  12. 제11항에 있어서, 배양 상등액으로부터 2'-푸코실락토오스를 단리하는 것을 특징으로 하는 방법.
  13. 제9항 내지 제12항 중 어느 하나의 항에 있어서, 상기 융합 단백질에 의해, 하나의 도메인이 융합 단백질에 포함되어 있는 융합되지 않은 야생형 효소에 의한 것보다 적어도 4% 더 많은 2'-푸코실락토오스가 형성되는 것을 특징으로 하는 방법.
  14. 제9항 내지 제13항 중 어느 하나의 항에 있어서, 반응에서 적어도 47 g/l의 2'-푸코실락토오스가 형성되는 것을 특징으로 하는 방법.
  15. 제9항 내지 제14항 중 어느 하나의 항에 있어서, 반응에서 1 g/l 미만, 더 바람직하게는 0 g/l의 디푸코실락토오스가 형성되는 것을 특징으로 하는 방법.
KR1020247006871A 2021-08-05 2021-08-05 2'-푸코실락토오스의 생체촉매 합성을 위한 특이적 알파-1,2-푸코실트랜스퍼라제 KR20240037346A (ko)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2021/071957 WO2023011724A1 (de) 2021-08-05 2021-08-05 Spezifische alpha-1,2-fucosyltransferase für die biokatalytische synthese von 2'-fucosyllactose

Publications (1)

Publication Number Publication Date
KR20240037346A true KR20240037346A (ko) 2024-03-21

Family

ID=77564073

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020247006871A KR20240037346A (ko) 2021-08-05 2021-08-05 2'-푸코실락토오스의 생체촉매 합성을 위한 특이적 알파-1,2-푸코실트랜스퍼라제

Country Status (4)

Country Link
EP (1) EP4381056A1 (ko)
KR (1) KR20240037346A (ko)
CN (1) CN117957315A (ko)
WO (1) WO2023011724A1 (ko)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE60020737T2 (de) 1999-09-06 2006-03-16 Sixon Inc. Sic-einkristall und herstellungsverfahren dafür
JP4048173B2 (ja) 2001-08-24 2008-02-13 協和醗酵工業株式会社 α1,2−フコース転移酵素および該酵素をコードするDNA
EP1504023A4 (en) * 2002-05-03 2006-03-22 Neose Technologies Inc RECOMBINANT GLYCOSYL TRANSFERASE FUSION PROTEINS
US9029136B2 (en) * 2012-07-25 2015-05-12 Glycosyn LLC Alpha (1,2) fucosyltransferases suitable for use in the production of fucosylated oligosaccharides
BR112022011984A2 (pt) * 2019-12-17 2022-08-30 Inbiose Nv Enzimas alfa-1,2-fucosiltransferase de conversão de lactose

Also Published As

Publication number Publication date
WO2023011724A1 (de) 2023-02-09
CN117957315A (zh) 2024-04-30
EP4381056A1 (de) 2024-06-12

Similar Documents

Publication Publication Date Title
AU2017351657B2 (en) Improved process for the production of fucosylated oligosaccharides
AU2017385601B2 (en) In vivo synthesis of sialylated compounds
KR20200027496A (ko) 푸코실트랜스퍼라제 및 푸코실화된 올리고사카라이드의 제조에서 그의 용도
JP4567887B2 (ja) グルコサミンを製造するためのプロセス及び物質
JP6165872B2 (ja) 単糖類の製造方法
JP2022517903A (ja) フコシル化オリゴ糖の合成
KR20220114632A (ko) 숙주 세포에서 시알릴화 올리고당의 생산
KR20130101030A (ko) 변형된 미생물을 사용한 개선된 글리콜산 발효 생산
JP2022544267A (ja) 酵母でのオリゴ糖産生の改善
KR20240037346A (ko) 2&#39;-푸코실락토오스의 생체촉매 합성을 위한 특이적 알파-1,2-푸코실트랜스퍼라제
KR20220116504A (ko) 정밀 화학물의 제조에서 공시 수율, 탄소-전환-효율 및 탄소 기질 적응성의 증가
CN116802286A (zh) 一种产生dfl的菌株
KR20120095962A (ko) 강화된 수크로스 뮤타제 활성을 가지는 미생물
JPH09252789A (ja) アカルビオシルトランスフエラーゼの製造方法並びにアカルボース同族体のアカルボースへの転化に際し、そしてアカルボース同族体の調製のためのその使用方法
WO2023034973A1 (en) Methods of producing human milk oligosaccharides and compositions thereof
WO2024130899A1 (zh) 一种甲硫氨酸氨肽酶突变体、大肠杆菌工程菌及应用
KR101254401B1 (ko) 잔탄 생산능 및 생산성이 향상된 재조합 미생물 및 이를 이용하여 잔탄을 대량 생산하는 방법
NZ755558A (en) In vivo synthesis of sialylated compounds

Legal Events

Date Code Title Description
A201 Request for examination