KR102384271B1 - 신규 융합 단백질의 제조 및 이의 단백질 합성 향상에서의 응용 - Google Patents

신규 융합 단백질의 제조 및 이의 단백질 합성 향상에서의 응용 Download PDF

Info

Publication number
KR102384271B1
KR102384271B1 KR1020207006125A KR20207006125A KR102384271B1 KR 102384271 B1 KR102384271 B1 KR 102384271B1 KR 1020207006125 A KR1020207006125 A KR 1020207006125A KR 20207006125 A KR20207006125 A KR 20207006125A KR 102384271 B1 KR102384271 B1 KR 102384271B1
Authority
KR
South Korea
Prior art keywords
glu
lys
ala
protein
ser
Prior art date
Application number
KR1020207006125A
Other languages
English (en)
Other versions
KR20200033952A (ko
Inventor
민 구오
슈아일롱 리우
쉬에 유
Original Assignee
강마-헬스코드 (상하이) 바이오테크 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 강마-헬스코드 (상하이) 바이오테크 컴퍼니 리미티드 filed Critical 강마-헬스코드 (상하이) 바이오테크 컴퍼니 리미티드
Publication of KR20200033952A publication Critical patent/KR20200033952A/ko
Application granted granted Critical
Publication of KR102384271B1 publication Critical patent/KR102384271B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0069Oxidoreductases (1.) acting on single donors with incorporation of molecular oxygen, i.e. oxygenases (1.13)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • C07K14/39Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K7/00Peptides having 5 to 20 amino acids in a fully defined sequence; Derivatives thereof
    • C07K7/04Linear peptides containing only normal peptide links
    • C07K7/06Linear peptides containing only normal peptide links having 5 to 11 amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y113/00Oxidoreductases acting on single donors with incorporation of molecular oxygen (oxygenases) (1.13)
    • C12Y113/12Oxidoreductases acting on single donors with incorporation of molecular oxygen (oxygenases) (1.13) with incorporation of one atom of oxygen (internal monooxygenases or internal mixed function oxidases)(1.13.12)
    • C12Y113/12007Photinus-luciferin 4-monooxygenase (ATP-hydrolysing) (1.13.12.7), i.e. firefly-luciferase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y306/00Hydrolases acting on acid anhydrides (3.6)
    • C12Y306/04Hydrolases acting on acid anhydrides (3.6) acting on acid anhydrides; involved in cellular and subcellular movement (3.6.4)
    • C12Y306/04013RNA helicase (3.6.4.13)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Mycology (AREA)
  • Virology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

본 발명은, 융합 단백질 및 이의 제조 방법을 제공하고, 상기 융합 단백질은 체외 번역 효율을 향상시키고 융합 단백질 중의 eIF4 앞에 항시성 또는 유도적 프로모터(예를 들면, pKlPGKl)를 삽입함으로써, 체외 단백질의 합성 기능을 향상시킨다.

Description

신규 융합 단백질의 제조 및 이의 단백질 합성 향상에서의 응용
본 발명은 유전공학 분야에 관한 것이며, 구체적으로, 신규 융합 단백질의 제조 및 이의 단백질 합성 향상에서의 응용에 관한 것이다.
단백질은 세포의 중요한 분자로서, 세포의 거의 모든 기능의 실행에 참여한다. 단백질의 상이한 서열과 구조는 단백질의 상이한 기능을 결정한다. 세포내에서 단백질은 효소류로서 다양한 생화학반응에서의 촉매가 될 수 있으며, 신호 분자로서 생물체의 다양한 활동을 조화할 수 있으며, 생물 형태를 지지하고 에너지를 저장하며 분자를 운송할 수 있으며 생물체가 운동을 할 수 있도록 한다. 생물 의학 분야에서 단백질 항체는 표지 약물로서 암 등 질환을 치료하는 중요한 수단이다.
세포 내에서, 단백질 번역의 조절은 영양결핍 등 외부압력에 대한 대응, 세포발육과 세포분화 등 아주 많은 과정에서 중요한 역할을 발휘한다. 단백질 번역의 4개의 과정은 번역개시, 번역신장, 번역종결, 리보솜 재순환을 포함하는데, 여기서 번역개시는 조절을 가장 많이 받는 한개의 과정이다. 번역개시 단계에서 리보솜 소단위체(40S)는 (tRNA)i Met와 결합하고 번역 개시인자의 작용하에 mRNA 5' 말단부를 식별한다. 소단위체는 하류로 이동하고 개시 코돈(ATG) 위치에서 리보솜 대단위체(60S)와 결합하여 완전한 리보솜을 형성하고 번역신장 당계로 진입한다.
빠르게 분열되는 효모세포에서 단백질의 합성 속도는 약 13000개/초이다. 체내에서 단백질의 합성 속도는 리보솜 개수의 제한을 받는 바, 세포의 평균 리보솜 개수는 약 200000개이며 mRNA 분자의 개수는 약 15000개 내지 60000개 이다.
최근, 자주 실험하는 상업화 체외 단백질 발현 시스템은 대장균 추출물(E.coli extract, ECE), 토끼 망상적혈구 용해물(Rabbit reticulocyte Lysate, RRL), 밀배아 추출물(Wheat germ extract, WGE), 곤충 추출물(Insect cell extract, ICE)과 인간 시스템을 포함한다.
종래의 상업화 단백질 체외 합성 시스템에서, 원핵 시스템의 생산량은 0.5 ㎎/㎖까지 도달하고 비용은 약 10 RMB/㎍까지이다. 진핵 시스템에 있어서, CHO 시스템의 생산량은 0.7 ㎎/㎖까지 도달하며 비용은 약 20RMB/㎍까지이다. 따라서, 자연계에서는 세포내 또는 세포외의 인공 단백질 합성 시스템인지를 막론하고 전부 효율이 낮고 속도가 늦은 특징으로 인하여 단백질 합성의 응용을 크게 제한하고 있다.
따라서, 본 분야에 있어서, 효과적으로 체외 단백질 합성 효율을 향상시킬 수 있는 체외 단백질 합성 시스템을 개발하는 것이 시급하다.
본 발명의 목적은 체외 단백질 합성 효율을 효과적으로 향상시킬 수 있는 체외 단백질 합성 시스템을 제공하는 것이다.
본 발명의 제1 측면에서는 융합 단백질을 제공하고, 상기 융합 단백질은 식 Ia 또는 식 Ib 구조를 구비한다:
S-A-B-C (Ia)
S-C-B-A (Ib);
식에서,
A는 PabI 요소;
B는 없거나, 또는 링커 펩타이드;
C는 eIF4G 요소;
S는 임의의 시그널 펩타이드; 및
각 "-"는 펩타이드 결합이다.
다른 바람직한 예에서, 상기 식 Ia 또는 식 Ib는 N-말단으로 부터 C-말단으로의 구조이다.
다른 바람직한 예에서, 상기 요소 A는 야생형 및 돌연변이형 PabI 서열을 포함한다.
다른 바람직한 예에서, 상기 PabI는 효모에서 유래되는 PabI이다.
다른 바람직한 예에서, 요소 A는 서열번호 1로 표시되는 서열 또는 이의 활성 단편을 구비하거나, 또는 서열번호 1로 표시되는 아미노산 서열과 85% 이상의 상동성(바람직하게는, 상동성이 90% 이상; 더욱 바람직하게는 상동성이 95% 이상; 가장 바람직하게는 상동성이 97% 이상인바, 예를 들면 98% 이상, 99% 이상)을 가지며 서열번호 1에서 나타낸 서열과 동일한 활성을 구비하는 폴리 펩타이드를 구비한다.
다른 바람직한 예에서, 상기 요소 C는 야생형 및 돌연변이형의 eIF4G 서열을 포함한다.
다른 바람직한 예에서, 상기 eIF4G는 효모에서 유래되는 eIF4G이다.
다른 바람직한 예에서, 요소 C는 서열번호 2로 표시되는 서열 또는 이의 활성 단편을 구비하거나, 또는 서열번호 2로 표시되는 아미노산 서열과 85% 이상의 상동성(바람직하게는, 상동성이 90% 이상; 더욱 바람직하게는 상동성이 95% 이상; 가장 바람직하게는 상동성이 97% 이상인바, 예를 들면 98% 이상, 99% 이상)을 가지며 서열번호 2의 서열과 동일한 활성을 구비하는 폴리 펩타이드를 구비한다.
다른 바람직한 예에서, 상기 융합 단백질은 재조합 단백질이며, 보다 바람직하게는 효모가 발현한 재조합 단백질이다.
다른 바람직한 예에서, 상기 효모는 클루이베로마이세스, 사카로미세스 세레비지아에, 또는 이들의 조합으로부터 선택된다.
다른 바람직한 예에서, 상기 효모는 클루이베로마이세스 락티스, 클루이베로마이세스 막시아누스, 클루이베로마이세스 도브잔스키(Kluyveromyces dobzhanskii), 또는 이들의 조합으로 부터 선택된다.
다른 바람직한 예에서, 상기 요소 A는 효모의 PabI 단백질로 부터 유도된다.
다른 바람직한 예에서, 상기 요소 C는 효모의 eIF4G 단백질로 부터 유도된다.
다른 바람직한 예에서, 상기 펩타이드 링커의 길이는 0개 내지 50개의 아미노산이고, 보다 바람직하게는 10개 내지 40개의 아미노산이며, 더욱 바람직하게는 15개 내지 25개의 아미노산이다.
다른 바람직한 예에서, 상기 융합 단백질은 아래의 조합으로 부터 선택된다:
(A) 서열번호 3에서 나타낸 아미노산 서열을 구비하는 폴리 펩타이드;
(B) 서열번호 3에서 나타낸 아미노산 서열과 85% 이상의 상동성(바람직하게는, 상동성이 90% 이상; 더욱 바람직하게는 상동성이 95% 이상; 가장 바람직하게는 상동성이 97% 이상이며, 예를 들면 98% 이상, 99% 이상)을 구비하고, 외래 단백질 발현 효율을 향상시키는 기능 또는 활성하는 폴리 펩타이드;
(C) 서열번호 3으로 표시되는 임의의 아미노산 서열에서 1개 내지 15개(보다 바람직하게는 2개 내지 10개, 더욱 바람직하게는 3개 내지 8개)의 아미노산 잔기의 치환, 결실 또는 첨가를 거쳐 형성되며, 외래 단백질 발현 효율을 향상시키는 기능 또는 활성을 구비하는 유도 폴리 펩타이드.
다른 바람직한 예에서, 상기 융합 단백질의 아미노산 서열은 서열번호 3에서 나타낸 바와 같다.
다른 바람직한 예에서, 상기 융합 단백질은 아래의 군으로 부터 선택되는 일 종 또는 여러 종의 특성을 구비한다:
(a) 외래 단백질 발현 효율을 향상시키고;
(b) 체외 번역 효율을 향상시킨다.
다른 바람직한 예에서, 상기 외래 단백질은, 루시페린 단백질, 루시페라제(예를 들면 반딧불 루시페라제), 녹색 형광 단백질, 황색 형광 단백질, 아미노아실 tRNA 합성효소, 글리세르알데히드-3-인산디히드로게나아제, 카탈라제, 액틴, 항체의 가변영역, 루시페라제 돌연변이, α-아밀라제, 엔테로신 A, C형 간염 바이러스 E2 당단백질, 인슐린전구체, 인터페론α A, 인터루킨-1β, 라이소자임, 혈청 알부민, 단일 사슬 항체 단편(scFV), 트란스타이레틴, 티로시나제, 자일라나아제, 또는 이들의 조합으로 부터 선택된다.
본 발명의 제2 측면에서는 폴리뉴클레오티드를 제공하며, 상기 폴리뉴클레오티드는 본 발명의 제1 측면에 따른 융합 단백질을 코딩한다.
다른 바람직한 예에서, 폴리뉴클레오티드는 DNA 서열, RNA 서열로 이루어진 군으로 부터 선택된다.
다른 바람직한 예에서, DNA 서열은 게놈 서열, cDNA 서열로 이루어진 군으로 부터 선택된다.
다른 바람직한 예에서, 상기 폴리뉴클레오티드는 mRNA 또는 cDNA이며, 상기 폴리뉴클레오티드는 식 II가 나타낸 구조를 구비한다:
A1-C1 (식 II)
식에서,
A1은 상기 A요소의 뉴클레오티드 서열이고;
C1은 상기 C요소의 뉴클레오티드 서열이며;
"-"는 요소 A1과 요소 C1 사이의 연결 결합이다.
다른 바람직한 예에서, 상기 요소 A1은 서열번호 4로 표시되는 서열을 구비한다.
다른 바람직한 예에서, 상기 요소 C1은 서열번호 5로 표시되는 서열을 구비한다.
본 발명의 제3 측면에서는 벡터를 제공하며, 상기 벡터는 본 발명의 제2 측면에 따른 폴리뉴클레오티드를 포함한다.
본 발명의 제4 측면에서는 숙주세포를 제공하며, 상기 숙주세포는 본 발명의 제3 측면에 따른 벡터를 포함하거나, 또는 게놈에 본 발명의 제2 측면에 따른 폴리뉴클레오티드가 삽입(Integration)되어 있다.
다른 바람직한 예에서, 상기 숙주세포는 본 발명의 제3 측면에 따른 발현 벡터 또는 본 발명의 제2 측면에 따른 폴리뉴클레오티드를 삽입하고 상동 재조합을 통해 형성되므로, 게놈 또는 염색체 중에 본 발명의 제1 측면에 따른 융합 단백질의 코딩 서열이 삽입되어 있다.
다른 바람직한 예에서, 상기 숙주세포는 클루이베로마이세스, 사카로미세스 세레비지아에, 또는 이들의 조합으로 부터 선택된다.
다른 바람직한 예에서, 상기 숙주세포는 클루이베로마이세스 락티스, 클루이베로마이세스 막시아누스, 클루이베로마이세스 도브잔스키(Kluyveromyces dobzhanskii), 또는 이들의 조합으로 부터 선택된다.
다른 바람직한 예에서, 상기 숙주세포는 클루이베로마이세스 락티스이다.
본 발명의 제5 측면에서는 외래 단백질 발현에 사용되는 체외 단백질 합성 을 제공하며, 상기 반응 시스템은,
(i) (a) 효모세포 추출물; (b) 임의의 폴리 에틸렌 글리콜; (c) 임의의 외래 자당, (d) 물 또는 수성 용매에서 임의로 선택되는 용매를 포함하는 효모 체외 단백질 합성 시스템; 및
(ii) 본 발명의 제1 측면에 따른 융합 단백질; 을 포함한다.
다른 바람직한 예에서, 상기 반응 시스템은, (iii) 별도로 첨가된 eIF4G 단백질을 더 포함한다.
다른 바람직한 예에서, 상기 eIF4G 단백질은 항시성 또는 유도적 프로모터로 유도 발현된다.
다른 바람직한 예에서, 항시성 또는 유도적 프로모터는 효모에서 유래된다.
다른 바람직한 예에서, 상기 효모는 클루이베로마이세스, 사카로미세스 세레비지아에, 또는 이들의 조합으로 부터 선택된다.
다른 바람직한 예에서, 상기 항시성 또는 유도적 프로모터는, pScTEF1, pScPGK1, pKlTEF1, pKlPGK1, pScADH1, pScTPI1, pScTDH3, pKlADH1, pKlTPI1, pKlTDH3, 또는 이들의 조합으로 부터 선택된다.
본 발명의 제6 측면에서는 본 발명의 제1 측면에 따른 융합 단백질을 생산하는 방법을 제공하는 바,
(i) 발현하기 적합한 조건하에서, 본 발명의 제4 측면에 따른 숙주세포를 배양하여 본 발명의 제1 측면에 따른 융합 단백질을 발현시키는 단계; 및
(ii) 상기 융합 단백질을 분리시키는 단계; 를 포함한다.
본 발명의 제7 측면에서는 본 발명의 제1 측면에 따른 상기 융합 단백질의 용도를 제공하는 바, 외래 단백질의 발현 효율을 향상시키기 위한 외래 단백질을 발현하는 체외 단백질 합성 시스템을 제조하는데 사용된다.
다른 바람직한 예에서, 상기 반응 시스템은 별도의 eIF4G 단백질을 더 포함한다.
본 발명의 제8 측면에서는 본 발명의 제1 측면에 따는 융합 단백질의 용도를 제공하는 바, 체외 단백질 합성 시스템의 체외 단백질 합성 기능을 향상시키는 제제를 제조하는데 사용된다.
본 발명의 제9 측면에서는 발현하려는 목적 외래 단백질을 발현시키는 방법을 제공하는 바,
(i) 본 발명의 제1 측면에 따른 상기 융합 단백질을 함유하는 효모 체외 단백질 합성 시스템을 제공하는 단계; 및
(ii) 단백질을 발현하기 적합한 조건하에서, 상기 외래 단백질의 템플렛 존재하에 상기 효모 체외 단백질 합성 시스템을 배양하여 상기 외래 단백질을 발현하는 단계; 를 포함한다.
다른 바람직한 예에서, 상기 융합 단백질은 별도로 첨가된 것이다.
다른 바람직한 예에서, 상기 융합 단백질과 상기 효모 체외 단백질 합성 시스템 중의 기타 단백질은 동일한 효모의 추출물로 부터 유래된다.
다른 바람직한 예에서, 상기 방법은 비진단성과 비치료성이다.
다른 바람직한 예에서, 상기 단계 (ii)는, (iii) 외래 단백질 활성의 발현 활성 Q1을 검출하고, 단계 (ii)와 동일한 조건에서 야생 효모 균주를 배양하여 상기 외래 단백질의 활성 Q2를 검출하는 단계;를 더 포함한다. 여기서, 만약 Q1이 Q2보다 현저하게 높으면, 외래 단백질의 발현 효율이 현저하게 향상되었음을 표시한다.
다른 바람직한 예에서, 상기 "현저하게 높음"은 Q1/Q2≥2라는 것을 가리키며, 보다 바람직하게는 Q1/Q2≥3이며 더욱 바람직하게는 Q1/Q2≥4이다.
다른 바람직한 예에서, 상기 효모 체외 단백질 합성 시스템은 유전자 변형된 클루이베로마이세스 체외 단백질 합성 시스템이다(바람직하게 클루이베로마이세스 락티스 체외 단백질 합성 시스템).
다른 바람직한 예에서, 상기 외래 단백질의 코딩 서열은 원핵생물, 진핵생물로부터 유래된다.
다른 바람직한 예에서, 상기 외래 단백질의 코딩 서열은 동물, 식물, 병원체로부터 유래된다.
다른 바람직한 예에서, 상기 외래 단백질의 코딩 서열은 포유동물로부터 유래되며, 보다 바람직하게는 영장동물, 설치동물이며, 사람, 마우스, 랫트를 포함한다.
다른 바람직한 예에서, 상기의 외래 단백질의 코딩 서열은, 루시페린 단백질 또는 루시페라제(예를 들면 반딧불 루시페라제), 녹색 형광 단백질, 황색 형광 단백질, 아미노아실 tRNA 합성효소, 글리세르알데히드-3-인산디히드로게나아제, 카탈라제, 액틴, 항체의 가변영역의 외래 DNA, 루시페라제 돌연변이체의 DNA, 또는 이들의 조합에 대해 코딩한다.
다른 바람직한 예에서, 상기 외래 단백질은, 루시페린 단백질 또는 루시페라제(예를 들면 반딧불 루시페라제), 녹색 형광 단백질, 황색 형광 단백질, 아미노아실 tRNA 합성효소, 글리세르알데히드-3-인산디히드로게나아제, 카탈라제, 액틴, 항체의 가변영역, 루시페라제 돌연변이, α-아밀라제, 엔테로신 A(Enterocin A), C형 간염 바이러스 E2 당단백질, 인슐린전구체, 인터페론α A, 인터루킨-1β, 라이소자임, 혈청 알부민, 단일 사슬 항체 단편(scFV), 트란스타이레틴, 티로시나제, 자일라나아제, 또는 이들의 조합으로 부터 선택된다.
본 발명의 범위내에서, 본 발명의 상기 각 기술특징과 아래 문장(예를 들면 실시예)에서 구체적으로 서술되는 각 기술특징은 모두 서로 조합되어 새로운 기술방안 또는 더 바람직한 기술방안을 구성할 수 있다. 여기서는 편폭의 제한으로 반복하여 설명하지 않는다.
도 1은 pKM-CAS1.0-KleIF4G의 플라스미드 지도를 도시한다.
도 2는 pKM-pScTEF1-KleIF4G-DD의 플라스미드 지도를 도시한다.
도 3은 pKM-pScPGK1-KleIF4G-DD의 플라스미드 지도를 도시한다.
도 4는 pKM-pKlTEF1-KleIF4G-DD의 플라스미드 지도를 도시한다.
도 5는 pKM-pKlPGK1-KleIF4G-DD의 플라스미드 지도를 도시한다.
도 6은 pKM-CAS1.0-KlTDH3-1을 나타낸 플라스미드 지도를 도시한다.
도 7은 pKM-CAS1.0-KlTDH3-2의 플라스미드 지도를 도시한다.
도 8은 pKM-KlTDH3-1-F-KleIF4G-DD의 플라스미드 지도를 도시한다.
도 9는 pKM-KlTDH3-2-F-KleIF4G-DD의 플라스미드 지도를 도시한다.
도 10은 pKM-CAS1.0-KlPab1의 플라스미드 지도를 도시한다.
도 11은 pKM-KlPab1-KleIF4G-DD의 플라스미드 지도를 도시한다.
도 12는 변형 균주 체외 번역 활성을 나타낸 측정 개략도이며, 여기서는 형광 단백질의 강도 지시 시스템의 단백질 발현 기능을 이용한다.
광범위하고 깊은 연구를 거치고 대량의 선별과 탐색을 통해, 예상 밖으로 식 Ia 또는 식 Ib 구조를 구비하는 융합 단백질을 처음으로 발견하였고, 본 발명의 융합 단백질은 체외 번역 효율을 대폭 향상시킬 수 있다. 이외에, 본 발명은 eIF4G 앞에 항시성 또는 유도성 프로모터를 삽입함으로써 체외 단백질의 합성 기능을 현저하게 향상시킬 수 있다는 것을 더 발견하였다.
그리고, 본 발명자는 본 발명의 융합 단백질이 체외 번역 효율을 향상시킬 때, 본 발명의 융합 단백질의 요소 eIF4G의 발현량이 증가되지 않음을 발견하였다.
구체적으로, 본 발명의 융합 단백질을 함유하는 효모 체외 단백질 합성 시스템 중에서, 합성된 루시페라제 활성의 상대적 광단위값은 1.50Х109까지 달하고, eIF4G 앞에 항시성 또는 유도성 프로모터를 삽입하여 합성한 루시페라제 활성의 상대적 광단위값은 1.57Х109까지 달하며, 야생형 효모 균주(예를 들면, Y1140)로 합성한 루시페라제의 상대적 광단위값(4.11Х108)보다 훨씬 높다. 이를 기초로 하여 본 발명자는 본 발명을 완성하였다.
eIF4G 요소
진핵생물에서는, 여러가지 번역개시 인자가 단백질의 번역개시 과정에 참여한다(표 1). 여기서, eIF4F는 "캡구조"의 식별 및 하류 번역개시 인자와 리보솜의 모집을 책임진다. eIF4F는 eIF4E、eIF4G와 eIF4A 3개의 서브 유닛으로 조성된다. eIF4E는 "캡구조"와 특이적으로 결합함으로써 eIF4F를 mRNA 5' 말단 비 번역영역에 고정시킨다; eIF4A는 RNA 헬리케아제이고; eIF4G는 거의 모든 번역 과정에서의 스캐폴드 단백질(Scaffold protein)이며 여러가지 번역개시 인자와 서로 작용함으로써 하류 인자 모집 과정에서 중요한 역할을 한다.
표 1. 효모 중 번역개시 인자
번역개시 인자 서브유닛 유전자 단백질 길이(AA)
eIF1 SUI1 108
eIF1A TIF11 153
eIF2 α SUI2 304
β SUI3 285
γ GCD11 527
eIF2B α GCN3 305
β GCD7 381
γ GCD1 578
δ GCD2 651
ε GCD6 712
eIF3 a RPG1/TIF32 964
b PRT1 763
c NIP1 812
g TIF35 274
i TIF34 347
j HCR1 265
eIF4A TIF1 395
TIF2 395
eIF4B TIF3/STM1 436
eIF4E CDC33 213
eIF4G TIF4631 952
TIF4632 914
eIF5 TIF5 405
eIF5B FUN12 1002
본 발명에서, eIF4G 앞에 효모 유래(예를 들면, 사카로미세스 세레비지아에 (Saccharomyces cerevisiae), 클루이베로마이세스(Kluyveromyces) 등)의 항시성 또는 유도성 프로모터(예를 들면 pScTEF1, pScPGK1, pKlTEF1, pKlPGK1, pScADH1, pScTPI1, pScTDH3, pKlADH1, pKlTPI1, pKlTDH3 등)를 삽입함으로써, 체외 단백질의 합성 기능을 향상시킬 수 있다.
바람직한 실시형태에서, 상기 eIF4G의 뉴클레오티드 서열은 서열번호 5로 나타낸 바와 같고; 상기 eIF4G의 단백질 서열은 서열번호 2에서 나타낸 바와 같다.
ATGGGCGAACCTACATCCGATCAGCAACCAGCTGTTGAAGCTCCAGTTGTGCAGGAGGAGACAACCAGTTCTCCGCAAAAAAACAGTGGATATGTCAAGAATACTGCTGGAAGCGGTGCTCCTAGAAATGGGAAATATGATGGTAACAGGAAGAACTCTAGGCCTTATAACCAAAGAGGTAACAACAACAATAATAATGGTTCTTCCTCGAATAAGCACTATCAAAAGTATAACCAACCAGCGTACGGTGTTTCTGCGGGATACATTCCGAACTACGGCGTATCGGCAGAGTACAACCCTCTGTACTATAACCAGTACCAACAGCAGCAACAGCTGTACGCTGCTGCTTACCAGACTCCAATGAGCGGACAAGGTTATGTCCCCCCAGTAGTGTCTCCAGCTGCTGTTTCAGCTAAACCAGCGAAGGTTGAGATTACTAACAAGTCTGGTGAACACATAGATATTGCTTCCATTGCTCATCCACATACTCATTCTCATTCTCAATCTCATTCGCGTGCAGTTCCAGTAGTGTCGCCTCCAGCTAACGTTACCGTCGCTGCTGCTGTATCATCCTCTGTGTCTCCATCAGCTTCTCCAGCTGTCAAAGTACAGAGCCCTGCTGCTAATGGTAAGGAACAATCTCCAGCTAAGCCTGAAGAACCAAAGAAGGACACTTTAATTGTGAACGATTTCTTGGAACAAGTTAAAAGACGCAAGGCTGCTTTAGCTGCTAAGAAGGCTGTCGAAGAGAAGGGTCCTGAGGAACCGAAGGAATCTGTCGTTGGAACTGACACTGATGCAAGCGTTGATACTAAGACAGGGCCTACAGCCACTGAATCTGCCAAGTCTGAAGAAGCTCAATCAGAATCACAAGAAAAGACTAAGGAAGAGGCTCCAGCTGAGCCAAAACCATTGACTTTGGCCGAAAAATTGAGACTTAAGAGGATGGAAGCTGCAAAGCAAGCTTCTGCTAAGACCGAGGAACTAAAGACTGAAGAATCTAAGCCTGAAGAAACAAAGACCGAGGAGCTAAAGACTGAAGAATCTAAGCCTGAAGAAACAAAGACCGAGGAGCTAAAGACTGAAGAAACAAAGTCCGAGGAACTAAAGACTGAAGAACCTAAGGCGGAAGAATCAAAGGCGGAAGAACCAAAGCCTGAAGAACCAAAGACCGAGGAACCGACGACTGAACAACCAAAGTCAGATGAACCAAAGTCGGAAGAATCAAAAACTGAAGAGCCAAAAACCGAGGTATTAAAGACTGAAGAACCAAAATCGGAAGAATCAAAGCCTGCAGAACCAAAGACTGAAGAAACAGCAACTGAAGAAACAGCAACTGAAGCAAACGCCGAAGAAGGTGAACCGGCTCCTGCTGGTCCCGTTGAAACTCCTGCTGATGTTGAAACAAAACCTCGAGAAGAGGCTGAAGTTGAAGACGATGGAAAGATTACCATGACCGATTTCCTACAGAAGTTGAAAGAGGTTTCTCCAGTTGATGATATTTATTCCTTCCAATACCCAAGTGACATTACGCCTCCAAATGATAGATATAAAAAGACAAGCATTAAATATGCATACGGACCTGATTTCTTGTATCAGTTCAAAGAAAAGGTCGATGTTAAATACGATCCAGCGTGGATGGCTGAAATGACGAGTAAAATTGTCATCCCTCCTAAGAAGCCTGGTTCAAGCGGAAGAGGCGAAGATAGATTTAGTAAGGGTAAGGTTGGATCTCTAAGAAGTGAAGGCAGATCGGGTTCCAGGTCCAACTCGAAGAAGAAGTCAAAGAGGGATGATAGAAAATCTAATAGATCATACACTTCCAGAAAGGACCGTGAAAGATTCAGAGAGGAAGAAGTCGAAGAGCCAAAGGTTGAGGTTGCCCCATTGGTCCCAAGTGCTAATAGATGGGTTCCTAAATCTAAGATGAAGAAAACAGAAGTCAAGTTAGCTCCAGACGGAACAGAACTTTACGACGCGGAAGAAGCATCAAGAAAGATGAAGTCATTGCTGAATAAATTGACATTAGAAATGTTCGAACCTATTTCTGATGATATCATGAAGATCGCTAACCAATCTAGATGGGAAGAAAAGGGTGAGACTTTGAAGATTGTCATCCAACAAATTTTCAATAAGGCCTGCGATGAACCTCATTGGTCATCAATGTACGCGCAATTATGTGGTAAGGTCGTTAAAGACTTAGATGATAGCATTAAAGACTCAGAAACCCCAGATAAGACTGGTTCTCACTTGGTTTTGCATTACTTAGTCCAAAGATGTCAAACTGAATTCCAAACAGGATGGACTGATCAACTACCTACAAACGAAGACGGTACTCCTCTACAACCTGAAATGATGTCCGATGAATACTATAAGATGGCTGCCGCTAAGAGAAGAGGTTTGGGTTTGGTTCGTTTCATTGGTTTCTTGTACCGTTCGAACTTATTGACTTCCAGAATGGTCTTCTTCTGTTTCAAGAGACTAATGAAGGATATTCAAAACTCTCCTACTGAAGATACTCTAGAGTCTGTATGTGAACTTTTGGAAACAATTGGTGAACAGTTCGAAGGTGCTCGTATTCAAGTTACTGCAGAAGCTGTCATTGAGGGTTCAAGCTTGCTAGACACACTATTCGACCAAATAAAGAACGTGATCGAAAATGGTGACATCTCCAGCAGAATCAAGTTTAAGTTGATCGACATTGTCGAACTAAGAGAAAAGAGGAACTGGAATAGTAAAAATAAGAACGATGGTCCAAAGACCATTGCTCAAATTCACGAAGAAGAAGCCTTGAAGAGGGCTTTGGAGGAAAGAGAAAGAGAAAGAGATCGCCATGGGTCCAGAGGTGGTTCCAGACGTATGAATAGCGAGAGAAACTCTTCTAGAAGAGATTTCTCCTCTCATTCTCACAGTCACAATCAAAATAGAGACGGTTTCACTACTACCAGATCGTCATCAGTGAGATATTCTGAGCCAAAGAAGGAAGAACAAGCTCCAACTCCAACTAAATCTTCTGGTGGCGCTGCCAACATGTTTGATGCATTGATGGATGCCGAAGATGATTAA (서열번호 5)
MGEPTSDQQPAVEAPVVQEETTSSPQKNSGYVKNTAGSGAPRNGKYDGNRKNSRPYNQRGNNNNNNGSSSNKHYQKYNQPAYGVSAGYIPNYGVSAEYNPLYYNQYQQQQQLYAAAYQTPMSGQGYVPPVVSPAAVSAKPAKVEITNKSGEHIDIASIAHPHTHSHSQSHSRAVPVVSPPANVTVAAAVSSSVSPSASPAVKVQSPAANGKEQSPAKPEEPKKDTLIVNDFLEQVKRRKAALAAKKAVEEKGPEEPKESVVGTDTDASVDTKTGPTATESAKSEEAQSESQEKTKEEAPAEPKPLTLAEKLRLKRMEAAKQASAKTEELKTEESKPEETKTEELKTEESKPEETKTEELKTEETKSEELKTEEPKAEESKAEEPKPEEPKTEEPTTEQPKSDEPKSEESKTEEPKTEVLKTEEPKSEESKPAEPKTEETATEETATEANAEEGEPA
PAGPVETPADVETKPREEAEVEDDGKITMTDFLQKLKEVSPVDDIYSFQYPSDITPPNDRYKKTSIKYAYGPDFLYQFKEKVDVKYDPAWMAEMTSKIVIPPKKPGSSGRGEDRFSKGKVGSLRSEGRSGSRSNSKKKSKRDDRKSNRSYTSRKDRERFREEEVEEPKVEVAPLVPSANRWVPKSKMKKTEVKLAPDGTELYDAEEASRKMKSLLNKLTLEMFEPISDDIMKIANQSRWEEKGETLKIVIQQIFNKACDEPHWSSMYAQLCGKVVKDLDDSIKDSETPDKTGSHLVLHYLVQRCQTEFQTGWTDQLPTNEDGTPLQPEMMSDEYYKMAAAKRRGLGLVRFIGFLYRSNLLTSRMVFFCFKRLMKDIQNSPTEDTLESVCELLETIGEQFEGARIQVTAEAVIEGSSLLDTLFDQIKNVIENGDISSRIKFKLIDIVELREKRNWNSKNKNDGPKTIAQIHEEEALKRALEERERERDRHGSRGGSRRMNSERNSSRRDFSSHSHSHNQNRDGFTTTRSSSVRYSEPKKEEQAPTPTKSSGGAANMFDALMDAEDD(서열번호 2)
Pab1 요소(Pab1 단백질)
Pab1은 71 kDa의 RNA 결합 단백질이며, 4개의 RRM(RNA 인식모티프 1-4(RNA recognition motif 1-4)) 도메인과 1개의 MLLE 도메인으로 조성된다. 각 RRM 도메인 중에는 2개의 보존적 RNP 구조(RNP 1/2)를 포함하고 RNA와의 결합을 책임진다.
바람직한 실시형태에서, 상기 Pab1의 뉴클레오티드 서열은 서열번호 4로 나타낸 바와 같고; 상기 Pab1의 단백질 서열은 서열번호 1에서 나타낸 바와 같다.
ATGTCTGATATTACTGAAAAAACTGCTGAGCAATTGGAAAACTTGCAGATCAACGATGATCAGCAACCAGCTCAATCTGCCAGTGCTCCATCCACTTCTGCTTCTGAAAGCGAAGCTTCTTCTGTTTCTAAGGTTGAAAACAACAACGCTTCATTGTACGTTGGTGAATTGGATCCAAACATTACTGAAGCATTGTTGTACGATGTGTTTTCACCATTGGGTCCAATTTCCTCGATCCGTGTTTGTCGTGATGCCGTCACCAAGGCTTCGTTAGGTTACGCTTACGTTAACTATACTGATTACGAAGCTGGTAAGAAAGCTATTCAAGAATTGAACTATGCTGAAATCAACGGTAGACCATGTAGAATTATGTGGTCCGAACGTGACCCAGCTATCAGAAAGAAGGGTTCTGGTAACATTTTCATCAAGAACTTGCACCCAGCCATTGACAACAAGGCTTTGCATGAAACTTTCTCCACTTTCGGTGAAGTCTTGTCTTGTAAAGTTGCTTTAGATGAGAATGGAAACTCTAGAGGCTTCGGTTTCGTTCATTTCAAGGAAGAATCCGATGCTAAGGATGCTATTGAAGCCGTCAACGGTATGTTGATGAACGGTTTGGAAGTTTACGTTGCCATGCACGTTCCAAAGAAGGACCGTATCTCCAAGTTGGAAGAAGCCAAGGCTAACTTCACCAACATTTACGTCAAGAACATTGACGTTGAAACCACTGACGAAGAGTTCGAACAGTTGTTCTCCCAATACGGTGAAATTGTCTCTGCTGCTTTGGAAAAGGATGCTGAGGGTAAGCCAAAGGGTTTCGGTTTCGTTAACTTTGTTGACCACAACGCCGCTGCCAAGGCCGTTGAAGAGTTGAACGGTAAGGAATTCAAGTCTCAAGCTTTGTACGTTGGCAGAGCTCAAAAGAAGTACGAACGTGCTGAAGAATTGAAGAAACAATACGAACAATACCGTTTGGAAAAATTGGCTAAGTTCCAAGGTGTTAACTTGTTCATCAAGAACTTGGACGATTCCATCGATGACGAAAAATTGAAGGAAGAATTCGCCCCATACGGTACCATCACCTCTGCTAGAGTCATGAGAGACCAAGAGGGTAACTCTAAGGGTTTCGGTTTCGTTTGTTTCTCTTCTCCAGAAGAAGCTACCAAGGCTATGACCGAAAAGAACCAACAAATTGTTGCCGGTAAGCCATTGTACGTTGCCATTGCTCAAAGAAAGGATGTCAGAAGATCCCAATTGGCTCAACAAATTCAAGCCAGAAACCAAATCAGATTCCAACAACAGCAACAACAACAAGCTGCTGCCGCTGCTGCTGGTATGCCAGGCCAATACATGCCACAAATGTTCTATGGTGTTATGGCCCCAAGAGGTTTCCCAGGTCCAAACCCAGGTATGAACGGCCCAATGGGTGCCGGTATTCCAAAGAACGGTATGGTCCCACCACCACAACAATTTGCTGGTAGACCAAACGGTCCAATGTACCAAGGTATGCCACCTCAAAACCAATTCCCAAGACACCAACAACAACACTACATCCAACAACAAAAGCAAAGACAAGCCTTGGGTGAACAATTGTACAAGAAGGTCAGTGCCAAGATTGACGACGAAAACGCCGCTGGTAAGATCACCGGTATGATCTTGGATCTACCACCACAGCAAGTCATCCAATTGTTGGACAACGACGAACAATTTGAACAGCAATTCCAAGAAGCCTTAGCTGCTTACGAAAACTTCAAGAAGGAACAAGAAGCTCAAGCTTAA(서열번호 4)
MSDITEKTAEQLENLQINDDQQPAQSASAPSTSASESEASSVSKVENNNASLYVGELDPNITEALLYDVFSPLGPISSIRVCRDAVTKASLGYAYVNYTDYEAGKKAIQELNYAEINGRPCRIMWSERDPAIRKKGSGNIFIKNLHPAIDNKALHETFSTFGEVLSCKVALDENGNSRGFGFVHFKEESDAKDAIEAVNGMLMNGLEVYVAMHVPKKDRISKLEEAKANFTNIYVKNIDVETTDEEFEQLFSQYGEIVSAALEKDAEGKPKGFGFVNFVDHNAAAKAVEELNGKEFKSQALYVGRAQKKYERAEELKKQYEQYRLEKLAKFQGVNLFIKNLDDSIDDEKLKEEFAPYGTITSARVMRDQEGNSKGFGFVCFSSPEEATKAMTEKNQQIVAGKPLYVAIAQRKDVRRSQLAQQIQARNQIRFQQQQQQQAAAAAAGMPGQYMPQMFYGVMAPRGFPGPNPGMNGPMGAGIPKNGMVPPPQQFAGRPNGPMYQGMPPQNQFPRHQQQHYIQQQKQRQALGEQLYKKVSAKIDDENAAGKITGMILDLPPQQVIQLLDNDEQFEQQFQEALAAYENFKKEQEAQA(서열번호 1)
융합 단백질
본 발명에서 사용된 용어 "본 발명의 융합 단백질", "본 발명의 PabI-eIF4G 융합 단백질" 및 "PabI-eIF4G 융합 단백질"은 PabI 요소와 eIF4G 요소가 융합되어 형성된 융합 단백질을 가리키며 서로 대체하여 사용할 수 있다. 본 발명의 융합 단백질 중, PabI 요소와 eIF4G 요소는 연결 펩타이드(connecting peptide) 또는 플렉시블 링커(flexible linker)를 함유 또는 함유하지 않을 수 있다. 이외에 상기 융합 단백질은 개시하는 Met를 함유 또는 함유하지 않을 수 있으며; 시그널 펩타이드를 함유 또는 함유하지 않을 수 있으며, 태그 서열(Tag sequence)을 함유 또는 함유하지 않을 수 있다(예를 들면 6His 등).
바람직한 실시형태에서, 본 발명의 상기의 융합 단백질은 상기 식 Ia 또는 식 Ib 구조를 구비한다. 바람직하게는, 본 발명의 융합 단백질의 아미노산 서열은 서열번호 3에서 나타낸 바와 같다.
MSDITEKTAEQLENLQINDDQQPAQSASAPSTSASESEASSVSKVENNNASLYVGELDPNITEALLYDVFSPLGPISSIRVCRDAVTKASLGYAYVNYTDYEAGKKAIQELNYAEINGRPCRIMWSERDPAIRKKGSGNIFIKNLHPAIDNKALHETFSTFGEVLSCKVALDENGNSRGFGFVHFKEESDAKDAIEAVNGMLMNGLEVYVAMHVPKKDRISKLEEAKANFTNIYVKNIDVETTDEEFEQLFSQYGEIVSAALEKDAEGKPKGFGFVNFVDHNAAAKAVEELNGKEFKSQALYVGRAQKKYERAEELKKQYEQYRLEKLAKFQGVNLFIKNLDDSIDDEKLKEEFAPYGTITSARVMRDQEGNSKGFGFVCFSSPEEATKAMTEKNQQIVAGKPLYVAIAQRKDVRRSQLAQQIQARNQIRFQQQQQQQAAAAAAGMPGQYMPQMFYGVMAPRGFPGPNPGMNGPMGAGIPKNGMVPPPQQFAGRPNGPMYQGMPPQNQFPRHQQQHYIQQQKQRQALGEQLYKKVSAKIDDENAAGKITGMILDLPPQQVIQLLDNDEQFEQQFQEALAAYENFKKEQEAQAGGGGSGGGGSTQDEVQGPHAGKSTVGGGGSGEPTSDQQPAVEAPVVQEETTSSPQKNSGYVKNTAGSGAPRNGKYDGNRKNSRPYNQRGNNNNNNGSSSNKHYQKYNQPAYGVSAGYIPNYGVSAEYNPLYYNQYQQQQQLYAAAYQTPMSGQGYVPPVVSPAAVSAKPAKVEITNKSGEHIDIASIAHPHTHSHSQSHSRAVPVVSPPANVTVAAAVSSSVSPSASPAVKVQSPAANGKEQSPAKPEEPKKDTLIVNDFLEQVKRRKAALAAKKAVEEKGPEEPKESVVGTDTDASVDTKTGPTATESAKSEEAQSESQEKTKEEAPAEPKPLTLAEKLRLKRMEAAKQASAKTEELKTEESKPEETKTEELKTEESKPEETKTEELKTEETKSEELKTEEPKAEESKAEEPKPEEPKTEEPTTEQPKSDEPKSEESKTEEPKTEVLKTEEPKSEESKPAEPKTEETATEETATEANAEEGEPAPAGPVETPADVETKPREEAEVEDDGKITMTDFLQKLKEVSPVDDIYSFQYPSDITPPNDRYKKTSIKYAYGPDFLYQFKEKVDVKYDPAWMAEMTSKIVIPPKKPGSSGRGEDRFSKGKVGSLRSEGRSGSRSNSKKKSKRDDRKSNRSYTSRKDRERFREEEVEEPKVEVAPLVPSANRWVPKSKMKKTEVKLAPDGTELYDAEEASRKMKSLLNKLTLEMFEPISDDIMKIANQSRWEEKGETLKIVIQQIFNKACDEPHWSSMYAQLCGKVVKDLDDSIKDSETPDKTGSHLVLHYLVQRCQTEFQTGWTDQLPTNEDGTPLQPEMMSDEYYKMAAAKRRGLGLVRFIGFLYRSNLLTSRMVFFCFKRLMKDIQNSPTEDTLESVCELLETIGEQFEGARIQVTAEAVIEGSSLLDTLFDQIKNVIENGDISSRIKFKLIDIVELREKRNWNSKNKNDGPKTIAQIHEEEALKRALEERERERDRHGSRGGSRRMNSERNSSRRDFSSHSHSHNQNRDGFTTTRSSSVRYSEPKKEEQAPTPTKSSGGAANMFDALMDAEDD(서열번호 3)
본 발명에 있어서, 본 발명의 융합 단백질은 무세포 체외 단백질 합성 시스템(특히 효모 체외 단백질 합성 시스템)의 체외 단백질 합성 기능을 현저히 향상시킬 수 있다.
체외 단백질 합성 시스템
본 발명의 융합 단백질은 체외 단백질 합성 시스템의 단백질 합성 기능을 향상시키는데 사용될 수 있다.
전형적인 체외 단백질 합성 시스템은 효모 체외 단백질 합성 시스템이다.
효모(yeast)는 배양이 간단하고, 고효율적인 단백질 접힘, 및 번역 후 수식의 이점을 겸하여 구비한다. 여기서, 사카로미세스 세레비지아에(Saccharomyces cerevisiae)와 피치아 파스토리스(Pichia pastoris)는 복잡한 진핵 단백질과 막 단백질을 발현시키는 모델생물이며, 효모는 체외 번역 시스템을 제조하는 원료로 될 수도 있다.
클루이베로마이세스(Kluyveromyces)는 자낭포자 효모이며, 여기서, 클루이베로마이세스 막시아누스(Kluyveromyces marxianus)와 클루이베로마이세스 락티스(Kluyveromyces lactis)는 공업에서 광범위하게 사용되는 효모이다. 예를 들면, 클루이베로마이세스 락티스는 락트산을 유일한 탄소원과 에너지로 할 수 있는 효모이다. 다른 효모와 비교하면, 클루이베로마이세스 락티스는 많은 이점을 구비하는바, 예를 들면, 아주 강한 분비기능, 양호한 대규모적 발효 특성, 식품안전의 레벨, 및 동시에 구비되는 단백질 번역 후 수식 기능 등이며, 이는 약학적으로 허용가능한 단백질을 발현시키는 숙주 시스템으로서, 거대한 잠재력을 보여주었다.
본 발명에서, 효모 체외 단백질 합성 시스템에 대해 특별한 한정을 하지 않으나, 바람직한 체외 단백질 합성 시스템은 클루이베로마이세스 발현 시스템이다(더욱 바람직하게는, 클루이베로마이세스 락티스 발현 시스템).
본 발명에 있어서, 클루이베로마이세스(예를 들면 클루이베로마이세스 락티스)에 대해 특별한 한정을 하지 않으며, 단백질 합성 효율을 향상시킬 수 있는 임의의 클루이베로마이세스(예를 들면 클루이베로마이세스 락티스) 균주를 포함한다.
바람직한 실시형태에서, 본 발명의 효모 체외 단백질 합성 시스템은 유전자 변형 후의 클루이베로마이세스 락티스 발현 시스템이다.
바람직한 실시형태에서, 본 발명은 체외의 무세포 단백질 합성 시스템을 제공하며, 상기 합성 시스템은 아래와 같은 성분을 포함한다:
(a) 효모세포 추출물;
(b) 폴리 에틸렌 글리콜;
(c) 임의의 외래 자당; 과
(d) 임의의 용매, 상기 용매는 물 또는 수성 용매.
다른 바람직한 예에서, 상기 폴리 에틸렌 글리콜은 PEG3000, PEG8000, PEG6000, PEG3350, 또는 이들의 조합으로 부터 선택된다.
다른 바람직한 예에서, 상기 폴리 에틸렌 글리콜은 분자량(Da)이 200 내지 10000인 폴리 에틸렌 글리콜을 포함하며, 보다 바람직하게는, 분자량이 3000 내지 10000인 폴리 에틸렌 글리콜이다.
다른 바람직한 예에서, 상기 단백질 합성 시스템에서, 상기 단백질 합성 시스템의 총 부피를 기준으로 하면 조성분(a)의 농도(v/v)는 20% 내지 70%이며, 보다 바람직하게는 30% 내지 60%이고, 더욱 바람직하게는 40% 내지 50%이다.
다른 바람직한 예에서, 상기 단백질 합성 시스템에서, 조성분(b)의 농도(w/v, 예를 들면, g/ml)는 0.1% 내지 8%이며, 보다 바람직하게는 0.5% 내지 4%이고, 더욱 바람직하게는 1% 내지 2%이다.
다른 바람직한 예에서, 상기 단백질 합성 시스템에서, 상기 단백질 합성 시스템의 총 중량을 기준으로 하면 조성분(c)의 농도는 0.03 wt% 내지 40 wt%이며, 보다 바람직하게는 0.08 wt% 내지 10 wt%이고, 더욱 바람직하게는 0.1 wt% 내지 5 wt%이다.
특별히 바람직한 실시형태에서, 본 발명이 제공한 체외 단백질 합성 시스템은 효모세포 추출물, 4-하이드록시 에틸 피페라진 에탄 설폰산, 아세트산 칼륨, 아세트산 마그네슘, 아데노신 트리포스페이트(ATP), 구아노신 트리포스페이트(GTP), 시티딘 트리포스페이트(CTP), 티미딘 트리포스페이트(TTP), 아미노산 혼합물, 포스포 크레아틴, 디티오트레이톨(DTT), 크레아틴 포스포키나제, RNA효소 억제제, 루시페린, 루시페라제 DNA, RNA 폴리메라제를 포함한다.
본 발명에서, RNA 폴리메라제에 대해 특별한 한정이 없으며, 1종 또는 여러 종의 RNA 폴리메라제로부터 선택되며, 전형적인 RNA 폴리메라제는 T7 RNA 폴리메라제이다.
본 발명에서, 상기 효모세포 추출물의 체외 단백질 합성 시스템 중에서의 비율에 대해 특별히 한정하지 않는바, 일반적으로 체외 단백질 합성 시스템 중, 상기 효모세포 추출물은 시스템의 20% 내지 70%를 차지하며, 보다 바람직하게는 30% 내지 60%를 차지하고, 더욱 바람직하게는 40% 내지 50%를 차지한다.
본 발명에서, 상기 효모세포 추출물은 완전한 세포를 포함하지 않으며, 전형적인 효모세포 추출물은 단백질 번역에 이용되는 리보솜, 운반 RNA, 아미노아실 tRNA 합성효소, 단백질 합성에 필요한 개시인자와 연장인자 및 종결 방출인자를 포함한다. 이외에, 효모 추출물에는 일부분의 효모세포의 세포질에서 유래되는 기타 단백질을 포함하는데, 특히 가용성 단백질을 포함한다.
본 발명에서, 상기의 효모세포 추출물에 함유되는 단백질 함량은 20 ㎎/㎖ 내지 100 ㎎/㎖이며, 보다 바람직하게는 50 ㎎/㎖ 내지 100 ㎎/㎖이다. 상기의 단백질 함량을 측정하는 방법은 쿠마시 블루(Coomassie brilliant blue) 측정법이다.
본 발명에서, 상기 효모세포 추출물의 제조방법에 대해 한정하지 않으나, 바람직한 제조방법은 아래와 같은 단계를 포함한다:
(i) 효모세포를 제공하며;
(ii) 효모세포에 대해 세척처리하여 세척한 효모세포를 얻으며;
(iii) 세척한 효모세포에 대하여 세포 파쇄 처리를 수행하여 효모 조추출물을 얻으며;
(iv) 상기 효모 조추출물에 대하여 고액분리를 진행하여 액체부분을 획득하면 효모세포 추출물이다.
본 발명에서, 상기의 고액분리 방식에 대해서는 한정하지 않는바, 바람직한 방식은 원심분리이다.
바람직한 실시 형태에서, 상기 원심분리는 액체 상태에서 진행된다.
본 발명에서, 상기 원심분리 조건에 대해서는 특별히 한정하지 않는바, 바람직한 원심분리 조건은 5000g 내지 100000g이며, 보다 바람직하게는 8000g 내지 30000g이다.
본 발명에서, 상기 원심분리 시간에 대해서는 특별히 한정하지 않는바, 바람직하게 상기 원심분리 시간은 0.5분 내지 2시간이며, 보다 바람직하게는 20분 내지 50분이다.
본 발명에서, 상기 원심분리 온도에 대해서는 특별히 한정하지 않는바, 바람직하게는 1℃ 내지 10℃에서 진행되며, 보다 바람직하게는 2℃ 내지 6℃이다.
본 발명에서, 상기 세척 처리 방식에 대해서는 특별히 한정하지 않는바, 바람직한 세척 처리 방식은 세척액을 적용하여 pH가 7 내지 8인 조건에서 처리하는 것이며, 상기 세척액에 대해서에 대해서는 특별히 한정하지 않으며, 전형적인 상기 세척액은 4-하이드록시 에틸 피페라진 에탄 설폰산 칼륨, 아세트산 칼륨, 아세트산 마그네슘, 또는 이들의 조합으로부터 선택된다.
본 발명에서, 상기 세포 파쇄 처리 방식에 대해서는 특별히 한정하지 않는바, 바람직한 상기 세포 파쇄 처리는 고압 파쇄, 동결 해동(예를 들면 액체 질소의 저온) 파쇄를 포함한다.
상기 체외 단백질 합성 시스템에서의 뉴클레오시드 트리포스페이트 혼합물은 아데노신 트리포스페이트, 구아노신 트리포스페이트, 시티딘 트리포스페이트와 우라실 뉴클레오시드 트리포스페이트이다. 본 발명에서 각종 단일 뉴클레오티드의 농도에 대해서는 특별히 한정하지 않으며, 일반적으로 각 종류의 단일 뉴클레오티드의 농도는 0.5 mM 내지 5 mM이며, 보다 바람직하게는 1 mM 내지 2 mM이다.
상기 체외 단백질 합성 시스템 중의 아미노산 혼합물은 천연 또는 비천연 아미노산을 포함할 수 있으며, D형 또는 L형 아미노산을 포함할 수 있다. 대표적인 아미노산은 20종의 천연 아미노산을 포함하는바, 즉 글리신, 알라닌, 발린, 류신, 이소류신, 페닐알라닌, 프롤린, 트립토판, 세린, 티로신, 시스테인, 메티오닌, 아스파라긴, 글루타민, 트레오닌, 아스파르트산, 글루탐산, 리신, 아르기닌과 히스티딘을 포함하나, 이에 한정되지 않는다. 각 종류의 아미노산의 농도는 일반적으로 0.01 mM 내지 0.5 mM이며, 보다 바람직하게는 0.02 mM 내지 0.2 mM이며, 예를 들면, 0.05 mM, 0.06 mM, 0.07 mM, 0.08 mM이다.
바람직한 예에서, 상기 단백질 합성 시스템은 폴리 에틸렌 글리콜 또는 이의 유사체이다. 폴리 에틸렌 글리콜 또는 이의 유사체의 농도에 대해서는 특별히 한정하지 않는바, 일반적으로 상기 단백질 합성 시스템의 총 중량을 기준으로 폴리 에틸렌 글리콜 또는 이의 유사체의 농도(w/v)는 0.1% 내지 8%이며, 보다 바람직하게는 0.5% 내지 4%이고, 더욱 바람직하게는 1% 내지 2%이다. 대표적인 PEG의 예로는 PEG3000, PEG8000, PEG6000과 PEG3350을 포함하나, 이에 한정되지 않는다. 본 발명의 시스템은 다른 각종 분자량의 폴리 에틸렌 글리콜(예를 들면, PEG200, PEG400, PEG1500, PEG2000, PEG4000, PEG6000, PEG8000, PEG10000 등)를 포함할 수도 있다.
바람직한 예에서, 상기 체외 단백질 합성 시스템은 자당을 더 포함한다. 자당의 농도에 대해서는 특별히 한정하지 않는바, 일반적으로 상기 단백질 합성 시스템의 총 중량을 기준으로 자당의 농도는 0.03 wt% 내지 40 wt%이며, 보다 바람직하게는 0.08 wt% 내지 10 wt%이고, 더욱 바람직하게는 0.1 wt% 내지 5 wt%이다.
특별히 바람직한 체외 단백질 합성 시스템은 효모 추출물을 제외하고 아래의 조성분을 더 포함한다: 즉, 22 mM의 pH가 7.4인 4-하이드록시 에틸 피페라진 에탄 설폰산, 30 mM 내지 150 mM의 아세트산 칼륨, 1.0 mM 내지 5.0 mM의 아세트산 마그네슘, 1.5 mM 내지 4 mM의 뉴클레오시드 트리포스페이트 혼합물, 0.08 mM 내지 0.24 mM의 아미노산 혼합물, 25 mM의 포스포크레아틴, 1.7 mM의 디티오트레이톨, 0.27 mg/mL의 크레아틴 포스포키나제, 1% 내지 4%의 폴리 에틸렌 글리콜, 0.5% 내지 2%의 자당, 8 ng/㎕ 내지 20 ng/㎕의 반딧불 루시페라제(firefly luciferase)의 DNA, 0.027 ㎎/㎖ 내지 0.054 ㎎/㎖의 T7 RNA 폴리메라제를 포함한다.
바람직한 실시형태에서, 본 발명의 효모 체외 단백질 합성 시스템은, (a) 본 발명의 상기 융합 단백질, 즉 PabI-eIF4G 융합 단백질을 더 포함한다.
바람직한 실시형태에서, 본 발명의 효모 체외 단백질 합성 시스템은 eIF4G 단백질을 더 포함하는바, 여기서, eIF4G 단백질은 효모(예를 들면, 사카로미세스 세레비지아에, 클루이베로마이세스 등)로부터 유래되는 항시성 또는 유도적 프로모터(예를 들면, pScTEF1, pScPGK1, pKlTEF1, pKlPGK1, pScADH1, pScTPI1, pScTDH3, pKlADH1, pKlTPI1, pKlTDH3 등)를 통해 유도 발현된다.
본 발명에서, 본 발명 융합 단백질을 포함하는 효모 체외 단백질 합성 시스템은 체외 단백질의 합성 기능을 현저하게 향상시킨다. 이외에, 본 발명의 융합 단백질과 eIF4G 단백질을 병용한 효모 체외 단백질 합성 시스템은 더욱 높은 체외 단백질의 합성 기능을 구비한다.
본 발명인의 선출원 CN201710125619.9에는 일종의 바람직한 효모 체외 단백질 합성 시스템이 기재되어 있다. 본 발명에서, 해당 특허문헌은 인용하는 방식을 통해 전부 본 명세서에 포함된다. 해당 문헌에서의 효모 체외 단백질 합성 시스템은 본 발명의 상기 융합 단백질을 적용하지 않았다.
전형적으로, 본 발명의 효모 체외 단백질 합성 시스템은, (a)효모세포 추출물; (b)임의의 폴리 에틸렌 글리콜; (c)임의의 외래 자당; 과 (d)임의의 용매, 를 포함하며, 상기 용매는 물 또는 수성 용매; 및 (ii)본 발명의 상기의 융합 단백질이다.
다른 바람직한 예에서, 상기 무세포 단백질 합성 시스템은 아래의 군으로 부터 선택되는 1종 또는 여러 종의 조성분을 더 포함한다:
(e1) RNA 합성에 사용되는 기질;
(e2) 단백질 합성에 사용되는 기질;
(e3) 마스네슘 이온;
(e4) 칼륨 이온;
(e5) 완충제;
(e6) RNA 폴리메라제;
(e7) 에너지 재생 시스템.
다른 바람직한 예에서, 상기 단백질 합성 시스템 중, 조성분 (e1)의 농도는 0.1 mM 내지 5 mM이며, 보다 바람직하게는, 0.5 mM 내지 3 mM이며 더욱 바람직하게는 1 mM 내지 1.5 mM이다.
다른 바람직한 예어서, 상기 효모세포 추출물은 효모세포에 대한 수성 추출물이다.
다른 바람직한 예에서, 상기 효모세포 추출물은 효모 내원성의 긴 사슬 핵산 분자를 포함하지 않는다.
다른 바람직한 예에서, 상기 RNA 합성 기질은 뉴클레오시드 모노포스페이트, 뉴클레오시드 디포스페이트, 뉴클레이시드 트리포스페이트, 또는 이들의 조합을 포함한다.
다른 바람직한 예에서, 상기 합성 단백질의 기질은 1~20종의 천연 아미노산 및 비천연 아미노산을 포함한다.
다른 바람직한 예에서, 상기 마그네슘 이온은 마그네슘 이온원으로부터 유래되며, 상기 마그네슘 이온원은 아세트산 마그네슘, 글루탐산 마그네슘, 또는 이들의 조합으로부터 선택된다.
다른 바람직한 예에서, 상기 칼륨 이온은 칼륨 이온원으로부터 유래되며, 상기 칼륨 이온원은 아세트산 칼륨, 글루탐산 칼륨, 또는 이의 조합으로부터 선택된다.
다른 바람직한 예에서, 상기 에너지 재생 시스템은 아래의 군으로부터 선택된다: 즉, 포스포 크레아틴/크레아틴 포스포키나제 시스템, 당분해 경로 및 중간산물 에너지 시스템, 또는 이의 조합이다.
다른 바람직한 예에서, 상기 무세포 단백질 합성 시스템은, (f1) 인공합성된 tRNA를 더 포함한다.
다른 바람직한 예에서, 상기 완충제는, 4-하이드록시 에틸 피페라진 에탄 설폰산, 트리스(하이드록시메틸)아미노메탄, 또는 이의 조합으로부터 선택된다.
다른 바람직한 예에서, 상기 무세포 단백질 합성 시스템은, (gl) 외래의 단백질 합성을 안내하는 DNA 분자를 더 포함한다.
다른 바람직한 예에서, 상기 DNA 분자는 선형이다.
다른 바람직한 예에서, 상기 DNA 분자는 고리형이다.
다른 바람직한 예에서, 상기 DNA 분자는 외래 단백질을 코딩하는 서열을 구비한다.
다른 바람직한 예에서, 상기 외래 단백질을 코딩하는 서열은 게놈 서열, cDNA 서열을 포함한다.
다른 바람직한 예에서, 상기 외래 단백질을 코딩하는 서열은 프로모터 서열, 5' 비번역 서열, 3' 비번역 서열을 더 포함한다.
본 발명의 주요한 장점:
(a) 본 발명은 처음으로 유전자 변형 기술을 통해 고효율적인 세포 형질전환 플랫폼을 이용해 세포내 유전자에 대한 변형을 수행함으로써, 번역 시스템의 단백질 합성 효율을 향상시켰다.
(b) 본 발명은 처음으로 체외 단백질 합성 기능을 현저히 향상시킬 수 있는 융합 단백질을 발견하였다.
(c) 본 발명은 eIF4G 앞에 항시성 또는 유도적 프로모터(예를 들면, pScTEF1, pScPGK1, pKlTEF1, pKlPGK1, pScADH1, pScTPI1, pScTDH3, pKlADH1, pKlTPI1, pKlTDH3 등)를 삽입하면 체외 단백질의 합성 기능을 현저히 향상시킬 수 있다는 것을 처음으로 발견하였다.
(d) 본 발명은 CRISPR-Cas9 유전자 편집 기술을 통해 eIF4G를 변형시켜 체외 단백질의 합성 기능을 현저하게 향상시킬 수 있다.
(e) 본 발명은 본 발명의 융합 단백질이 체외 번역 시스템의 효율을 향상시킬 때, 본 발명의 융합 단백질의 요소 eIF4G의 발현양은 증가되지 않는다는 것을 처음으로 발견하였다.
실시예 1 유전자 변형을 통해 단백질 합성을 향상시키는 이론적 모델
본 발명은 CRISPR-Cas9 유전자 편집 기술을 통해, K. lactis 중의 번역개시 인자 eIF4G와 Pab1에 대해 최적화를 진행하여 무세포 체외 번역 시스템의 효율을 향상하도록 한다.
실시예 2 CRISPR-Cas9를 통해 번역개시 인자를 변형시켜 체외 번역 시스템 효율을 향상
2.1 CRISPR-Cas9 기술을 통해 번역개시 인자 KleIF4G 앞에 강한 프로모터를 첨가
2.1.1 KleIF4G 서열 검색 및 CRISPR gRNA 서열 확정
eIF4G는 번역개시 과정에서의 중요한 인자이다. 현재까지의 보고에 따르면, 유전자 편집 기술을 통해 내원성 eIF4G 발현을 최적화하여 체외 번역 활성을 향상시키는 사례는 없다. 본 발명은 실시예 1에서의 이론 모델에 근거하여 CRISPR-Cas9 유전자 편집 기술을 통해, 번역개시 인자 KleIF4G의 발현에 대하여 변형을 진행하여 무세포 체외 번역 시스템의 효율을 향상시킨다.
i. 사카로미세스 세레비지아에(S. cerevisiae) 효모 중 eIF4G 유전자 서열에 기반하는 경우, NCBI 데이터베이스에서 eIF4G 유전자로 BLAST 비교 분석을 진행하여 클루이베로마이세스 락티스 중 eIF4G 상동 유전자 서열을 확정하고 KleIF4G (염색체 A의 421863 ... 424928에 위치)로 명명한다. 여기에서는 이러한 유전자 꼬리 부분에 하나의 표지 DNA를 삽입하는 것을 예로 드나, 다른 표지 유전자 또는 삽입 위치, 서열도 모두 유사한 방법으로 조작할 수 있다.
ii. KleIF4G 유전자 개시 코돈에서, 근접한 PAM 서열(NGG)을 검색하여 gRNA 서열을 확정한다. gRNA을 선택하는 원칙은 아래와 같다: GC의 함량이 적당하고(본 발명의 표준은 GC 함량이 40% 내지 60%임); poly T 구조의 존재를 피하는 것이다. 최종적으로, 본 발명의 최적화된 KleIF4G gRNA 서열은 CGGTTTTTCAAAGCAGATAT (서열번호 6)이며 염색체 A의 424927 ... 424936위치에 위치한다.
2.1.2 CRISPR-Cas9이 매개하는 KleIF4G 앞에 강력한 프로모터가 삽입된 플라스미드 작제
KleIF4G의 과량 발현을 실현하기 위하여, 본 발명은 CRISPR-Cas9 기술을 통해 KleIF4G 앞에 pScTEF1, pScPGK1, pKlTEF1과 pKlPGK1 프로모터를 각각 삽입한다. 플라스미드 작제 및 형질전환 방법은 아래와 같다:
i. CRISPR 플라스미드 작제:
프라이머
PF1(CGGTTTTTCAAAGCAGATATGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCG(서열번호 7)), 프라이머 PR1(GCTCTAAAACATATCTGCTTTGAAAAACCGAAAGTCCCATTCGCCACCCG(서열번호 8))를 사용하고, pCAS 플라스미드를 템플렛으로 PCR 증폭을 진행한다. 증폭 산물 17 ㎕를 혼합하고, 1 ㎕ DpnI, 2 ㎕ 10X 소화완충액(digestion buffer)을 첨가하여 37℃에서 3시간 동안 반응시켰다. DpnI를 처리한 후의 산물 10 ㎕를 100 ㎕ DH5α 컴피턴트세포 중에 첨가하고 30분 동안 얼음 위에 놓으며, 다음 42℃에서 45초동안 열자극한 후, 1 ㎖ LB 액체배지를 첨가하고 37℃에서 1시간 동안 진탕배양시키고 Kan 저항성 LB 고체배지에 도포하여 배양하되 37℃에서 단일 클론이 자랄때까지 거꾸로 하여 배양한다. 5개의 단일 클론을 골라내어 LB 액체배지에서 진탕배양시키고, PCR 검측 양성 및 서열 측정을 진행하여 확인한 후, 플라스미드를 추출하여 보존하며, pKM-CAS1.0-KleIF4G로 명명한다(도 1 참조).
ii. 도너 DNA 플라스미드 작제 및 증폭
선형 도너 DNA의 보존과 증폭을 쉽게 하기 위하여, 본 발명은 우선 도너 DNA를 pMD18 플라스미드에 삽입시키고, 다음 PCR 증폭을 통해 선형 도너 DNA서열을 얻는다.
클루이베로마이세스 락티스 게놈 DNA를 탬플렛으로 하고, 프라이머 PF2 (GAGCTCGGTACCCGGGGATCCTCTAGAGATAATAAAATTTCAACCTTTAAGCCATTGAATTTTACCATTACG (서열번호 9))와 프라이머 PR2(GCCAAGCTTGCATGCCTGCAGGTCGAC GATCTTGTTAGTAATCTCAACCTTCGCTGG (서열번호 10))로 PCR 증폭을 진행하며; pMD18 플라스미드를 템플렛으로 하고, 프라이머 pMD18-F(ATCGTCGACCTGCAGGCATG (서열번호 11))와 pMD18-R(ATCTCTAGAGGATCCCCGGG (서열번호 12))로 PCR 증폭을 진행한다. 이차 증폭 산물을 각각 8.5 ㎕씩 혼합하고, 1 ㎕ DpnI, 2 ㎕ 10X 소화완충액(digestion buffer)을 첨가하여 37℃에서 3시간 동안 반응시켰다. DpnI를 처리한 후의 산물 10 ㎕를 100 ㎕ DH5α 컴피턴트세포 중에 첨가하고 30분 동안 얼음 위에 놓으며, 다음 42℃에서 45초동안 열자극한 후, 1 ㎖ LB 액체배지를 첨가하고 37℃에서 1시간 동안 진탕배양시키고 Amp 항성 LB 고체배지에 도포하여 배양하되 37℃에서 단일 클론이 자랄때까지 거꾸로 하여 배양한다. 5개의 단일 클론을 골라내어 LB 액체배지에서 진탕배양시키고, PCR 검측 양성 및 서열 측정을 진행하여 확인한 후, 플라스미드를 추출하여 보존하며, pKM-KleIF4G-DD로 명명한다.
pKM-KleIF4G-DD 플라스미드를 템플렛으로 하고, 프라이머 PF3 (ATGGGCGAACCTACATCCGATC (서열번호 13))와 프라이머 PR3 (ATCTGCTTTGAAAAACCGCTCTTTCTCTC (서열번호 14))로 PCR 증폭을 진행하며; 사카로미세스 세레비지아에(S. cerevisiae) 효모 게놈 DNA를 템플렛으로 하여 프라이머 PF4 (AGAGAGAAAGAGCGGTTTTTCAAAGCAGATCCACACACCATAGCTTCAAAATGTTTCTAC (서열번호 15))와 PR4 (TGGTTGCTGATCGGATGTAGGTTCGCCCATCTTAGATTAGATTGCTATGCTTTCTTTCTAATGAGC (서열번호 16))로 PCR 증폭을 진행하며(pScTEF1 프로모터 증폭); 사카로미세스 세레비지아에(S. CEREVISIAE) 효모 게놈 DNA를 템플렛으로 하여 프라이머 PF5 (AGAGAGAAAGAGCGGTTTTTCAAAGCAGATAGACGCGAATTTTTCGAAGAAGTACC (서열번호 17))와 PR5(AGCTTCAACAGCTGGTTGCTGATCGGATGTAGGTTCGCCCATTGTTTTATATTTGTTGTAAAAAGTAGATAATTACTTCCTTGATGATC (서열번호 18))로 PCR 증폭을 진행하며(pScPGK1 프로모터 증폭); 클루이베로마이세스 락티스 게놈 DNA를 탬플렛으로 하고 프라이머 PF6 (AGAGAGAAAGAGCGGTTTTTCAAAGCAGATGAGCCTGTCCAAGCAAATGCC (서열번호 19))와 PR6 (TGGTTGCTGATCGGATGTAGGTTCGCCCATTTTTAATGTTACTTCTCTTGCAGTTAGGGAAC(서열번호 20))으로 PCR증폭을 진행하며(pKlTEF1 프로모터 증폭); 클루이베로마이세스 락티스 게놈 DNA를 탬플렛으로 하고 프라이머 PF7 (AGAGAGAAAGAGCGGTTTTTCAAAGCAGATGTTCCTCATCACTAGAAGCCGAACTG (서열번호 21))와 PR7(AGCTTCAACAGCTGGTTGCTGATCGGATGTAGGTTCGCCCATTTTTATTAATTCTTGATCGATTTTTTTGTTATTTCTGAAGTAACTCT (서열번호 22))으로 PCR 증폭을 진행한다(pKlPGK1 프로모터 증폭). PF3/PR3증폭 산물을 각각 PF4/PR4、PF5/PR5、PF6/PR6 및 PF7/PR7 증폭 산물과 혼합하고 각각 pKM-pScTEF1-KleIF4G-DD, pKM-pScPGK1-KleIF4G-DD, pKM-pKlTEF1-KleIF4G-DD와 pKM-pKlPGK1-KleIF4G-DD(도 2, 도 3, 도 4, 도 5를 참조)를 작제한다. 구체적인 단계는 아래와 같다: 두 가지 PCR 산물을 각각 8.5 ㎕ 취하여 혼합하고, 1 ㎕ DpnI, 2 ㎕ 10X 소화완충액을 첨가하여 37℃에서 3시간 동안 반응시켰다. DpnI를 처리한 후의 산물 10 ㎕를 100 ㎕ DH5α 컴피턴트세포 중에 첨가하고 30분 동안 얼음 위에 놓으며, 다음 42℃에서 45초동안 열자극한 후, 1 ㎖ LB 액체배지를 첨가하고 37℃에서 1시간 동안 진탕배양시키고 Amp 항성 LB 고체배지에 도포하여 배양하되 37℃에서 단일 클론이 자랄때까지 거꾸로 하여 배양한다. 5개의 단일 클론을 골라내어 LB 액체배지에서 진탕배양시키고, PCR 검측 양성 및 서열 측정을 진행하여 확인한 후, 플라스미드를 추출하여 보존한다.
2.1.3 클루이베로마이세스 락티스 형질전환 및 양성 감정
i. 클루이베로마이세스 락티스 균액을 YPD 고체 배지에 획선하고 단일 클론을 골라내어 25 ㎖ 2Х YPD 액체배지 중에서 밤새 진탕배양시키고 2 ㎖ 균액을 취하여 계속하여 50 ㎖ 2ХYPD 액체배지 중에서 2시간 내지 8시간 진탕배양시킨다. 20℃에서 5분동안 원심분리(3000g)시켜 효모세포를 수집하고 500 ㎕ 무균수를 첨가하여 재현탁(resuspension)시키며 동일한 조건에서 원심분리하여 세포를 수집한다. 컴피턴트세포 용액(5% v/v글리세린, 10% v/v DMSO)을 조제하고 해당 효모세포를 500 ㎕ 해당 용액에 용해시킨다. 50 ㎕ 내지 1.5 ㎖ 원심분리관에 나누어 담고 -80℃에서 보존한다.
컴피턴트세포를 37℃ 조건에 놓고 15초 내지 30초 녹이고, 2분 동안 원심분리(13000g)하여 상청액을 제거한다. 아래와 같은 방식으로 형질전환 완충액을 조제한다: 즉, PEG3350(50% (w/v)) 260 ㎕, LiAc(1.0M) 36 ㎕, 캐리어 DNA(5.0 ㎎/㎖) 20 ㎕, Cas9/gRNA 플라스미드 15 ㎕, 도너 DNA 10 ㎕를 첨가하고, 최종 부피가 360 ㎕로 되게 무균수를 첨가한다. 열자극 후, 30초동안 원심분리(13000g)하여 상청액을 제거한다. 1 ㎖ YPD 액체배지를 첨가하여 2시간 내지 3시간 배양하고 200 ㎕를 취하여 YPD(200 ㎍/㎖ G418) 고체 배지에 도포하고 2일 내지 3일 배양하되 단일 클론이 나타날 때까지 배양한다.
ii. 형질전환한 후의 평판에서 클루이베로마이세스 락티스 10개 내지 20개 단일 클론을 골라내어 1 ㎖ YPD(200 ㎍/㎖ G418) 액체배지에서 밤새 진탕배양하고, 균액을 템플렛으로 하고, CRISPR Insertion check 프라이머 쌍을 이용하여, 대응되는 샘플에 대하여 PCR 검측을 진행한다. PCR 결과 양성 및 서열 측정을 거쳐 감정된 균주를 양성 균주로 확정한다.
2.2 CRISPR-Cas9기술을 통해 KleIF4G와 고발현 유전자를 융합
2.2.1 KlTDH3 서열 검색 및 CRISPR gRNA 서열 확정
사카로미세스 세레비지에(S. cerevisiae) 내에서 TDH3은 테트라머 형식으로 존재하며 당분해 경로 중의 촉매반응에 참여한다. 이의 프로모터 pTDH3은 유전자 공학에서 광범위하게 사용되는 일종의 지속성 강프로모터(strong promoter)이다. 클루이베로마이세스 락티스 중 KleIF4G의 충분한 발현을 실현하고 번역개시 기능을 수행할 때 국부적인 높은 농도를 형성하기 위하여, 본 발명에서는 KleIF4G 유전자를 클루이베로마이세스 락티스 TDH3 유전자 ORF 3'말단에 연결시켰다.
i. 사카로미세스 세레비지아에(S. cerevisiae) 효모 중 TDH3 유전자 서열을 기반하는 경우, NCBI 데이터베이스에서는 TDH3 유전자로 BLAST 비교 분석을 진행하여 클루이베로마이세스 락티스 중 TDH3 상동 유전자 서열을 확정한다. 비교를 통해 클루이베로마이세스 락티스 게놈 중에는 두 개의 TDH3 상동 유전자가 존재함을 발견하였고, 본 발명에서는 각각 KlTDH3-1(염색체 A의 1024297...1025292에 위치함)과 KlTDH3-2(염색체 F의 1960417...1961406에 위치함)로 명명한다. 여기서 이러한 유전자 꼬리 부분에 하나의 표지 DNA를 삽입하는 것을 예로 드나, 다른 표지 유전자 또는 삽입위치, 서열도 모두 유사한 방법으로 조작할 수 있다.
ii. KlTDH3 유전자 종결 코돈 부근에서 PAM 서열(NGG)을 검색하여 KlTDH3 gRNA 서열(KlTDH3-1: CTTGTTGCTAAGAACTAAAG(서열번호 23)은 염색체 A의 1024272...1024291위치에 위치하고, KlTDH3-2: CTCTGAAAGAGTTGTCGATT(서열번호 24)는 염색체 F의 1960378...1960397위치에 위치함)을 확정한다.
2.2.2. CRISPR-Cas9이 매개하는 KleIF4G이 KlTDH3위치로 삽입(Integration)된 플라스미드 작제
CRISPR 플라스미드 작제
i. KlTDH3-1에 대하여, 프라이머 PF8 (CTTGTTGCTAAGAACTAAAGGTTTTAGAGCTAGAAATAGCAAGTTAAAAT (서열번호 25)), PR8 (GCTCTAAAACCTTTAGTTCTTAGCAACAAGAAAGTCCCATTCGCCACCCG (서열번호 26))을 사용하고 pCAS 플라스미드를 템플렛으로 하여 PCR 증폭을 진행한다. 증폭 산물 17 ㎕를 혼합하고, 1 ㎕ DpnI, 2 ㎕ 10X 소화완충액을 첨가하여 37℃에서 3시간 동안 반응시켰다. DpnI를 처리한 후의 산물 10 ㎕를 100 ㎕ DH5α 컴피턴트세포 중에 첨가하고 30분 동안 얼음 위에 놓으며, 다음 42℃에서 45초 동안 열자극한 후, 1 ㎖ LB 액체배지를 첨가하고 37℃에서 1시간 동안 진탕배양시키고 Kan 항성 LB 고체배지에 도포하여 배양하되 37℃에서 단일 클론이 자랄때까지 거꾸로 하여 배양한다. 5개의 단일 클론을 골라내어 LB 액체배지에서 진탕배양시키고, PCR 검측 양성 및 서열 측정을 진행하여 확인한 후, 플라스미드를 추출하여 보존하며, pKM-CAS1.0-KlTDH3-1로 명명한다(도 6 참조).
ii. KlTDH3-2에 대하여, 프라이머 PF9 (CTCTGAAAGAGTTGTCGATTGTTTTAGAGCTAGAAATAGCAAGTTAAAAT (서열번호 27)), PR9 (GCTCTAAAACAATCGACAACTCTTTCAGAGAAAGTCCCATTCGCCACCCG (서열번호 28))을 사용하고 pCAS 플라스미드를 템플렛으로 하여 PCR 증폭을 진행한다. 증폭 산물 17 ㎕를 혼합하고, 1 ㎕ DpnI, 2 ㎕ 10X 소화완충액을 첨가하여 37℃에서 3시간 동안 반응시켰다. DpnI를 처리한 후의 산물 10 ㎕를 100 ㎕ DH5α 컴피턴트세포 중에 첨가하고 30분 동안 얼음 위에 놓으며, 다음 42℃에서 45초동안 열자극한 후, 1 ㎖ LB 액체배지를 첨가하고 37℃에서 1시간 동안 진탕배양시키고 Kan 항성 LB 고체배지에 도포하여 배양하되 37℃에서 단일 클론이 자랄 때까지 거꾸로 하여 배양한다. 5개의 단일 클론을 골라내어 LB 액체배지에서 진탕배양시키고, PCR 검측 양성 및 서열 측정을 진행하여 확인한 후, 플라스미드를 추출하여 보존하며, pKM-CAS1.0-KlTDH3-2로 명명한다(도 7 참조).
2.2.3 도너 DNA 플라스미드 작제 및 증폭
선형 도너 DNA의 보존과 증폭을 쉽게 하기 위하여, 본 발명은 우선 도너 DNA를 pMD18 프라이머 중에 삽입시키고, 다음 PCR증폭을 통해 선형 도너 DNA서열을 얻는다.
i. KlTDH3-1에 대하여, 클루이베로마이세스 락티스 게놈 DNA를 템플렛으로 하고 프라이머 PF10(GAGCTCGGTACCCGGGGATCCTCTAGAGATCATCCACTCCATCACCGCTACCCAA (서열번호 29))와 PR10 (GCCAAGCTTGCATGCCTGCAGGTCGACGATCAACGTCCCCATCTACAAGAGC (서열번호 30))로 PCR 증폭을 진행하며; pMD18 플라스미드를 템플렛으로 하고 프라이머 pMD18-F(ATCGTCGACCTGCAGGCATG (서열번호 31))와 pMD18-R(ATCTCTAGAGGATCCCCGGG (서열번호 32))로 KlTDH3-1에 대한 PCR 증폭을 진행한다. 이차 증폭 산물 각각 8.5 ㎕씩 혼합하고, 1 ㎕ DpnI, 2 ㎕ 10X 소화완충액(digestion buffer)을 첨가하여 37℃에서 3시간 동안 반응시켰다. DpnI를 처리한 후의 산물 10 ㎕를 100 ㎕ DH5α 컴피턴트세포 중에 첨가하고 30분 동안 얼음 위에 놓으며, 다음 42℃에서 45초동안 열자극한 후, 1 ㎖ LB 액체배지를 첨가하고 37℃에서 1시간 동안 진탕배양시키고 Amp 항성 LB 고체배지에 도포하여 배양하되 37℃에서 단일 클론이 자랄 때까지 거꾸로 하여 배양한다. 5개의 단일 클론을 골라내어 LB 액체배지에서 진탕배양시키고, PCR 검측 양성 및 서열 측정을 진행하여 확인한 후, 플라스미드를 추출하여 보존하며, pKM-KlTDH3-1-DD로 명명한다.
pKM-KlTDH3-1-DD를 템플렛으로 하고, 프라이머 PF11 (GATGCATTGATGGATGCCGAAGATGATTAAAGAGGTTGATGTAATTGATATTTTCCTGATAAAATTACTATTG (서열번호 33))와 PR11 (AGCTGGTTGCTGATCGGATGTAGGTTCGCCAGATCCACCTCCTTCCACGTTTGTTGGTCTTGATCCACCTCCACCGTTCTTAGCAACAAGTTCGACCAAATCG (서열번호 34))로 증폭하며; 클루이베로마이세스 락티스(K. lactis) 게놈 DNA를 템플렛으로 하고 프라이머 PF12 (GGCGAACCTACATCCGATCAGC (서열번호 35)) 와 PR12(TTAATCATCTTCGGCATCCATCAATGC (서열번호 36))로 증폭한다. 이차 증폭 산물을 각각 8.5 ㎕ 취하여 혼합하고, 1 ㎕ DpnI, 2 ㎕ 10X 소화완충액(digestion buffer)을 혼합하여 37℃에서 3시간 동안 반응시켰다. DpnI를 처리한 후의 산물 10 ㎕를 100 ㎕ DH5α 컴피턴트세포 중에 첨가하고 30분 동안 얼음 위에 놓으며, 다음 42℃에서 45초 동안 열자극한 후, 1 ㎖ LB 액체배지를 첨가하고 37℃에서 1시간 동안 진탕배양시키고 Amp 항성 LB 고체배지에 도포하여 배양하되 37℃에서 단일 클론이 자랄 때까지 거꾸로 하여 배양한다. 5개의 단일 클론을 골라내어 LB 액체배지에서 진탕배양시키고, PCR 검측 양성 및 서열 측정을 진행하여 확인한 후, 플라스미드를 추출하여 보존하며, pKM-KlTDH3-1-F-KleIF4G-DD로 명명한다(도 8 참조).
pKM-KlTDH3-1-F-KleIF4G-DD 플라스미드를 템플렛으로 하고, 프라이머 M13-F (GTAAAACGACGGCCAGT(서열번호 37))와 M13-R(CAGGAAACAGCTATGAC(서열번호 38))로 PCR 증폭을 진행하여 선형 도너 DNA를 얻는다.
ii. KlTDH3-2에 대하여, 클루이베로마이세스 락티스 게놈 DNA를 템플렛으로 하고 프라이머 PF13(GAGCTCGGTACCCGGGGATCCTCTAGAGATGAAGCTTTGATGACTACCGTTC(서열번호 39))와 PR13(GCCAAGCTTGCATGCCTGCAGGTCGACGATGTCTATTGTATCGGAAGAACTGTCA(서열번호 40))로 PCR 증폭을 진행하며; pMD18을 템플렛으로 하고 프라이머 pMD18-F(ATCGTCGACCTGCAGGCATG(서열번호 41))와 pMD18-R(ATCTCTAGAGGATCCCCGGG(서열번호 42))로 PCR 증폭을 진행한다. 이차 증폭 산물 각각 8.5 ㎕씩 혼합하고, 1 ㎕ DpnI, 2 ㎕ 10X 소화완충액(digestion buffer)을 첨가하여 37℃에서 3시간 동안 반응시켰다. DpnI를 처리한 후의 산물 10 ㎕를 100 ㎕ DH5α 컴피턴트세포 중에 첨가하고 30분 동안 얼음 위에 놓으며, 다음 42℃에서 45초 동안 열자극한 후, 1 ㎖ LB 액체배지를 첨가하고 37℃에서 1시간 동안 진탕배양시키고 Amp 항성 LB 고체배지에 도포하여 배양하되 37℃에서 단일 클론이 자랄때까지 거꾸로 하여 배양한다. 5개의 단일 클론을 골라내어 LB 액체배지에서 진탕배양시키고, PCR 검측 양성 및 서열 측정을 진행하여 확인한 후, 플라스미드를 추출하여 보존하며, pKM-KlTDH3-2-DD로 명명한다.
pKM-KlTDH3-2-DD를 템플렛으로 하고 프라이머 PF14 (GATGCATTGATGGATGCCGAAGATGATTAAATTACTCTTTTAAGTTAACGAACGCTTTTGATGAG(서열번호 43))와 PR14 (AGCTGGTTGCTGATCGGATGTAGGTTCGCCAGATCCACCTCCTTCCACGTTTGTTGGTCTTGATCCACCTCCACCAGCAACGTGCTCAACtAAgTCaACgACcCTTTCAGAGTAACCGTATTCGTTATCG(서열번호 44))로 증폭을 진향하며, 클루이베로마이세스 락티스 DNA를 템플렛으로 하고 프라이머 PF15 (GGCGAACCTACATCCGATCAGC(서열번호 45))와 PR15(TTAATCATCTTCGGCATCCATCAATGC(서열번호 46))로 증폭을 진행한다. 이차 증폭 산물 각각 8.5 ㎕씩 혼합하고, 1 ㎕ DpnI, 2 ㎕ 10X 소화완충액(digestion buffer)을 혼합하여 37℃에서 3시간 동안 반응시켰다. DpnI를 처리한 후의 산물 10 ㎕를 100 ㎕ DH5α 컴피턴트세포 중에 첨가하고 30분 동안 얼음 위에 놓으며, 다음 42℃에서 45초동안 열자극한 후, 1 ㎖ LB 액체배지를 첨가하고 37℃에서 1시간 동안 진탕배양시키고 Amp 항성 LB 고체배지에 도포하여 배양하되 37℃에서 단일 클론이 자랄 때까지 거꾸로 하여 배양한다. 5개의 단일 클론을 골라내어 LB 액체배지에서 진탕배양시키고, PCR 검측 양성 및 서열 측정을 진행하여 확인한 후, 플라스미드를 추출하여 보존하며, pKM-KlTDH3-2-F-KleIF4G-DD로 명명한다(도 9 참조).
pKM-KlTDH3-2-F-KleIF4G-DD 플라스미드를 템플렛으로 하고, 프라이머 M13-F (GTAAAACGACGGCCAGT(서열번호 47))와 M13-R(CAGGAAACAGCTATGAC(서열번호 48))로 증폭을 진행하여 선형 도너 DNA를 얻는다.
2.2.4 클루이베로마이세스 락티스 형질전환 및 양성 감정
i. 클루이베로마이세스 락티스 균액을 YPD 고체 배지에 획선하고 단일 클론을 골라내어 25 ㎖ 2Х YPD 액체배지 중에서 밤새 진탕배양시키고 2 ㎖ 균액을 취하여 계속하여 50 ㎖ 2Х YPD 액체배지 중에서 2시간 내지 8시간 진탕배양시킨다. 20℃에서 5분 동안 원심분리(3000g)시켜 효모세포를 수집하고 500 ㎕ 무균수를 첨가하여 재현탁시키며 동일한 조건에서 원심분리하여 세포를 수집한다. 컴피턴트세포 용액(5% v/v글리세린, 10% v/v DMSO)을 조제하고 해당 효모세포를 500 ㎕ 해당 용액에 용해시킨다. 50 ㎕ 내지 1.5 ㎖ 원심분리관에 나누어 담고 -80℃에서 보존한다.
컴피턴트세포를 37℃ 조건에 놓고 15초 내지 30초 녹이고 2분 동안 원심분리(13000g)하여 상청액을 제거한다. 아래와 같은 방식으로 형질전환 완충액을 조제한다: 즉, PEG3350(50% (w/v)) 260 ㎕, LiAc(1.0M) 36 ㎕, 캐리어 DNA(5.0mg/mL) 20 ㎕, Cas9/gRNA 플라스미드 15 ㎕, 도너 DNA 10 ㎕를 첨가하고, 최종 부피가 360 ㎕로 되게 무균수를 첨가한다. 열자극 후, 30초동안 원심분리(13000g)하여 상청액을 제거한다. 1 ㎖ YPD 액체배지를 첨가하여 2시간 내지 3시간 배양하고 200 ㎕를 취하여 YPD(200 ㎍/㎖ G418) 고체 배지에 도포하고 2일 내지 3일 배양하되 단일 클론이 나타날 때까지 배양한다.
ii. 형질전환한 후의 평판에서 클루이베로마이세스 락티스 10개 내지 20개 단일 클론을 골라내어 1 ㎖ YPD(200 ㎍/㎖ G418) 액체배지에서 밤새 진탕배양하고, 균액을 템플렛으로 하고, CRISPR Insertion check 프라이머 KlTDH3-1-CICF1 (KlTDH3-1 서열내 프라이머)(CTTCTACTGCTCCAATGTTCGTCGTT(서열번호 49))와 프라이머 KlTDH3-2-CICF1 (KlTDH3-2 서열내 프라이머)(TTAACGAAGACAAGTACAACGGTGA(서열번호 50))으로 각각 PCR을 진행하되, 이를 각각 KleIF4G-CICR2(KleIF4G 서열내 프라이머) (TTCTCTTCGACAGCCTTCTTAGCAG(서열번호 51))와 쌍으로 하여 PCR을 진행함으로써, KlTDH3-1과 KlTDH3-2 위치에 대한 KleIF4G 삽입에 대해 검측을 진행하며, PCR 결과 양성 및 서열 측정을 거쳐 감정된 균주를 양성 균주로 확정한다.
2.3 CRISPR-Cas9 기술을 통해 KleIF4G을 이의 상호작용 단백질과 융합
2.3.1 KlPab1 서열 검색 및 CRISPR gRNA 서열 확정
앞에서 언급한 바와 같이, Pab1 단백질과 eIF4G 단백질은 번역개시 과정에서 상호 작용이 존재한다. 본 발명은 CRISPR-Cas9 유전자 편집 기술을 통해 K1Pab1 및 KleIF4G를 융합시켜 양자 사이의 상호작용을 촉진하여 체외 번역 효율을 향상시킨다.
Pab1 서열에 기반하여 클루이베로마이세스 락티스 중 KlPab1 유전자 서열(염색체 C의 1553322... 1555100에 위치함)을 얻는다. KlPab1 유전자 종결 코돈 부근에서 PAM 서열(NGG)을 검색하고 gRNA 서열을 확정한다. gRNA 선택의 원칙은 아래와 같다: GC의 함량이 적당하고(본 발명의 표준은 GC함량이 40% 내지 60%임); poly T 구조의 존재를 피면하는 것이다. 최종적으로, 본 발명에서 확정한 KlPab1 gRNA 서열은 TGCTTACGAAAACTTCAAGA(서열번호 52)이며, 염색체 C의 1555058...1555077 위치에 위치한다.
2.3.2 CRISPR-Cas9이 매개하는 KleIF4G이 KlPab1 위치로 삽입(intergration)된 플라스미드 작제
i. CRISPR 플라스미드 작제
프라이머
PF16(TGCTTACGAAAACTTCAAGAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCG(서열번호 53)), PR16(GCTCTAAAACTCTTGAAGTTTTCGTAAGCAAAAGTCCCATTCGCCACCCG(서열번호 54))을 사용하고 pCAS 플라스미드를 템플렛으로 하여 PCR 증폭을 진행한다. 증폭 산물 17 ㎕를 혼합하고, 1 ㎕ DpnI, 2 ㎕ 10X 소화완충액(digestion buffer)을 첨가하여 37℃에서 3시간 동안 반응시켰다. DpnI 를 처리한 후의 산물 10 ㎕를 100 ㎕ DH5α 컴피턴트세포 중에 첨가하고 30분 동안 얼음 위에 놓으며, 다음 42℃에서 45초 동안 열자극한 후, 1 ㎖ LB 액체배지를 첨가하고 37℃에서 1시간 동안 진탕배양시키고 Kan 항성 LB 고체배지에 도포하여 배양하되 37℃에서 단일 클론이 자랄때까지 거꾸로 하여 배양한다. 5개의 단일 클론을 골라내어 LB 액체배지에서 진탕배양시키고, PCR 검측 양성 및 서열 측정을 진행하여 확인한 후, 플라스미드를 추출하여 보존하며, pKM-CAS1.0-KlPab1로 명명한다(도 10 참조).
ii. KlPab1-KleIF4G 도너 DNA 플라스미드 작제 및 증폭
선형 도너 DNA의 보존과 증폭을 쉽게 하기 위하여, 본 발명은 우선 도너 DNA를 pMD18 프라이머 중에 삽입시키고, 다음 PCR증폭을 통해 선형 도너 DNA 서열을 얻는다.
클루이베로마이세스 락티스 게놈 DNA를 탬플렛으로 하고, 프라이머 PF17 (GAGCTCGGTACCCGGGGATCCTCTAGAGATCCGGTAAGCCATTGTACGTTGCCAT(서열번호 55))와 PR17 (GCCAAGCTTGCATGCCTGCAGGTCGACGATCAGTATACCGTCCATGTTGATGACT(서열번호 56))로 PCR증폭을 진행하며; pMD18 플라스미드를 템플렛으로 하고 프라이머 pMD18-F (ATCGTCGACCTGCAGGCATG(서열번호 57))와 pMD18-R(ATCTCTAGAGGATCCCCGGG(서열번호 58))로 PCR 증폭을 진행한다. 이차 증폭 산물을 각각 8.5 ㎕씩 혼합하고, 1 ㎕ DpnI를 첨가하고 2 ㎕ 10X 소화완충액(digestion buffer)을 첨가하여 37℃에서 3시간 동안 반응시켰다. DpnI를 처리한 후의 산물 10 ㎕를 100 ㎕ DH5α 컴피턴트세포 중에 첨가하고 30분 동안 얼음 위에 놓으며, 다음 42℃에서 45초동안 열자극한 후, 1 ㎖ LB 액체배지를 첨가하고 37℃에서 1시간 동안 진탕배양시키고 Amp 항성 LB 고체배지에 도포하여 배양하되 37℃에서 단일 클론이 자랄때까지 거꾸로 하여 배양한다. 5개의 단일 클론을 골라내어 LB 액체배지에서 진탕배양시키고, PCR 검측 양성 및 서열 측정을 진행하여 확인한 후, 플라스미드를 추출하여 보존하며, pKM-KlPab1-DD로 명명한다.
pKM-KlPab1-DD를 템플렛으로 하고 프라이머 PF18 (GATGCATTGATGGATGCCGAAGATGATTAAACTTGATTTTTTGACCTTGATCTTCATCTTGTC(서열번호 59))와 PR18 (CTTGAACTTCATCTTGAGTTGAACCTCCACCTCCAGATCCACCTCCACCAGCTTGAGCTTCTTGTTCtTTtTTaAAaTTcTCGTAAGCAGCTAAGGCTTC(서열번호 60))로 PCR 증폭을 진행하며; 클루이베로마이세스 락티스 DNA를 템플렛으로 하여 프라이머 PF19 (GTGGAGGTTCAACTCAAGATGAAGTTCAAGGTCCACATGCTGGTAAGTCTACTGTTGGTGGAGGTGGATCTGGCGAACCTACATCCGATCAGC(서열번호 61))와 PR19 (TTAATCATCTTCGGCATCCATCAATGC(서열번호 62))로 PCR 증폭을 진행한다. 이차 증폭 산물을 각각 8.5 ㎕씩 혼합하고, 1 ㎕ DpnI, 2 ㎕ 10X 소화완충액을 혼합하여 37℃에서 3시간 동안 반응시켰다. DpnI를 처리한 후의 산물 10 ㎕를 100 ㎕ DH5α 컴피턴트세포 중에 첨가하고 30분 동안 얼음 위에 놓으며, 다음 42℃에서 45초 동안 열자극한 후, 1 ㎖ LB 액체배지를 첨가하고 37℃에서 1시간 동안 진탕배양시키고 Amp 항성 LB 고체배지에 도포하여 배양하되 37℃에서 단일 클론이 자랄때까지 거꾸로 하여 배양한다. 5개의 단일 클론을 골라내어 LB 액체배지에서 진탕배양시키고, PCR 검측 양성 및 서열 측정을 진행하여 확인한 후, 플라스미드를 추출하여 보존하며, pKM-KlPab1-KleIF4G-DD로 명명한다(도 11 참조).
pKM-KlPab1-KleIF4G-DD 플라스미드를 템플렛으로 하고 프라이머 M13-F(GTAAAACGACGGCCAGT(서열번호 63))와 M13-R(CAGGAAACAGCTATGAC(서열번호 64))로 증폭하여 선형 도너 DNA를 얻는다.
2.3.3 클루이베로마이세스 형질전환 및 양성 감정
i. 클루이베로마이세스 락티스 균액을 YPD 고체 배지에 획선하고 단일 클론을 골라내어 25 ㎖ 2Х YPD 액체배지 중에서 밤새 진탕배양시키고 2 ㎖ 균액을 취하여 계속하여 50 ㎖ 2Х YPD 액체배지 중에서 2시간 내지 8시간 진탕배양시킨다. 20℃에서 5분 동안 원심분리(3000g)시켜 효모세포를 수집하고 500 ㎕ 무균수를 첨가하여 재현탁시키며 동일한 조건에서 원심분리하여 세포를 수집한다. 컴피턴트세포 용액(5% v/v글리세린, 10% v/v DMSO)을 조제하고 해당 효모세포를 500 ㎕ 해당 용액에 용해시킨다. 50 ㎕ 내지 1.5 ㎖ 원심분리관에 나누어 담고 -80℃에서 보존한다.
컴피턴트세포를 37℃ 조건에 놓고 15초 내지 30초 녹이고, 2분 동안 원심분리(13000g)하여 상청액을 제거한다. 아래와 같은 방식으로 형질전환 완충액을 조제한다: 즉, PEG3350(50% (w/v)) 260 ㎕, LiAc(1.0M) 36 ㎕, 캐리어 DNA(5.0mg/mL) 20 ㎕, Cas9/gRNA 플라스미드 15 ㎕, 도너 DNA 10 ㎕를 첨가하고, 최종 부피가 360 ㎕로 되게 무균수를 첨가한다. 열자극 후, 30초 동안 원심분리(13000g)하여 상청액을 제거한다. 1 ㎖ YPD 액체배지를 첨가하여 2시간 내지 3시간 배양하고 200 ㎕를 취하여 YPD(200 ㎍/㎖ G418) 고체 배지에 도포하고 2일 내지 3일 배양하되 단일 클론이 나타날때가지 배양한다.
ii. 형질전환한 후의 평판에서 클루이베로마이세스 락티스 10개 내지 20개 단일 클론을 골라내어 1 ㎖ YPD(200 ㎍/㎖ G418) 액체배지에서 밤새 진탕배양하고, 균액을 템플렛으로 하고, 프라이머 KlPAB1-CICF1(KlPAB1 서열내 프라이머) (TCTCCAGAAGAAGCTACCAAGGCTA(서열번호 65))와 프라이머 KleIF4G-CICR2(KleIF4G 서열내 프라이머)(TTCTCTTCGACAGCCTTCTTAGCAG(서열번호 66))로 PCR 증폭을 진행하며; KlPAB1 위치에 대한 KleIF4G 삽입에 대하여 PCR 검측을 진행하며, PCR 결과 양성 및 서열 측정을 거쳐 감정된 균주를 양성 균주로 확정한다.
실시예 3 변형 균주 체외 번역 활성 측정
유전자 변형 후의 클루이베로마이세스 락티스 균주를 체외 단백질 합성 시스템으로 제조하고, 반딧불 루시페라제(Firefly Luciferase, Flue) 유전자 DNA 템플렛을 첨가하여 변형 균주의 단백질 번역 기능을 측정한다. 상기 반응 시스템을 25℃ 내지 30℃의 환경에 놓고 2시간 내지 6시간 정치 배양시킨다. 반응이 종료된 후, 같은 부피의 Fluc 기질 루시페린(luciferin)을 96-웰 플레이트 또는 384-웰 플레이트에 첨가하고, Envision 2120 다기능 마이크로플레이트리더(Perkin Elmer)에 놓고, Fluc 활성을 검측하되, 활성 단위로서 상대적 광단위값(Relative Light Unit, RLU)의 수치를 한다.
변형된 구조 중에서, KleIF4G 앞에 프로모터 pKlPGK1를 삽입한 구조 pKlPGK1::KleIF4G, 및 KleIF4G가 KlPab1 C 말단에 연결된 구조 KlPab1-KleIF4G는 모두 야생형 효모 균주 Y1140보다 더욱 강한 체외 단백질 합성 기능을 나타냈다. 이가 코딩 합성한 Fluc 단백질이 방출한 상대적 광단위값은 각각 1.57Х109와 1.50Х109에 달하였고, 야생형 효모균주 Y1140에서 합성된 Fluc 단백질의 상대적 광단위값은 단지 4.11Х108이다. 이는 KleIF4G의 변형은 효모 체외 단백질 합성 시스템의 단백질 합성 효율을 효과적으로 향상시킬 수 있음을 설명한다(도 12 참조).
구체적인 효과는 표 2와 같다.
NO. Data1 Data2 Data3 활성 희석 배수 최종활성(RLU)
pKlPGK1_KleIF4G 33216610 28584890 32598650 31466717 50 1.57Х 109
pKlTEF1_KleIF4G 6685609 10189150 8594529 8489763, 50 4.24Х 108
pScPGK1_KleIF4G 4130719 8605461 4555399 5763860 50 2.88Х 108
pScTEF1_KleIF4G 8230202 6415045 7578242 7407830 50 3.70Х 108
KlTDH3_1_KleIF4G 788821 751243 941381 827148.3 50 4.13Х 107
KlTDH3_2_KleIF4G 8676941 6496592 7904461 7692665 50 3.85Х 108
KlPAB1_KleIF4G 22155330 33507550 34075530 29912803 50 1.50Х 109
Y1140 10925600 6729764 6997436 8217600 50 4.11Х 108
NC 707 965
NC: 음성 대조(negative control)를 표시한다.
상기 실험 결과, 본 발명의 융합 단백질은 클루이베로마이세스 락티스의 KleIF4G 유전자에 대한 관련 변형을 통해 효모 체외 단백질 합성 시스템에 의한 단백질 생산 효율을 현저하게 향상시킬 수 있음을 보여준다.
본 발명에 언급된 모든 문헌은 각 문헌마다 참고로서 단독적으로 인용된 것과 같이 본 출원에 참고로서 인용된다. 본 발명의 상기 기재 내용을 이해한 후, 본 분야 당업자는 본 발명에 대하여 각종 변형 또는 수정을 진행할 수 있으며, 이러한 등가적 형태도 본 출원에 첨부된 청구범위에서 한정하는 범위에 속하는 것으로 이해해야 할 것이다.
<110> KANGMA (SHANGHAI) BIOTECH COR. LTD. <120> PREPARATION METHOD FOR NOVEL FUSION PROTEIN AND USE OF FUSION PROTEIN FOR IMPROVING PROTEIN SYNTHESIS <130> P2017-1340 <160> 66 <170> PatentIn version 3.5 <210> 1 <211> 592 <212> PRT <213> Kluyveromyces lactis <400> 1 Met Ser Asp Ile Thr Glu Lys Thr Ala Glu Gln Leu Glu Asn Leu Gln 1 5 10 15 Ile Asn Asp Asp Gln Gln Pro Ala Gln Ser Ala Ser Ala Pro Ser Thr 20 25 30 Ser Ala Ser Glu Ser Glu Ala Ser Ser Val Ser Lys Val Glu Asn Asn 35 40 45 Asn Ala Ser Leu Tyr Val Gly Glu Leu Asp Pro Asn Ile Thr Glu Ala 50 55 60 Leu Leu Tyr Asp Val Phe Ser Pro Leu Gly Pro Ile Ser Ser Ile Arg 65 70 75 80 Val Cys Arg Asp Ala Val Thr Lys Ala Ser Leu Gly Tyr Ala Tyr Val 85 90 95 Asn Tyr Thr Asp Tyr Glu Ala Gly Lys Lys Ala Ile Gln Glu Leu Asn 100 105 110 Tyr Ala Glu Ile Asn Gly Arg Pro Cys Arg Ile Met Trp Ser Glu Arg 115 120 125 Asp Pro Ala Ile Arg Lys Lys Gly Ser Gly Asn Ile Phe Ile Lys Asn 130 135 140 Leu His Pro Ala Ile Asp Asn Lys Ala Leu His Glu Thr Phe Ser Thr 145 150 155 160 Phe Gly Glu Val Leu Ser Cys Lys Val Ala Leu Asp Glu Asn Gly Asn 165 170 175 Ser Arg Gly Phe Gly Phe Val His Phe Lys Glu Glu Ser Asp Ala Lys 180 185 190 Asp Ala Ile Glu Ala Val Asn Gly Met Leu Met Asn Gly Leu Glu Val 195 200 205 Tyr Val Ala Met His Val Pro Lys Lys Asp Arg Ile Ser Lys Leu Glu 210 215 220 Glu Ala Lys Ala Asn Phe Thr Asn Ile Tyr Val Lys Asn Ile Asp Val 225 230 235 240 Glu Thr Thr Asp Glu Glu Phe Glu Gln Leu Phe Ser Gln Tyr Gly Glu 245 250 255 Ile Val Ser Ala Ala Leu Glu Lys Asp Ala Glu Gly Lys Pro Lys Gly 260 265 270 Phe Gly Phe Val Asn Phe Val Asp His Asn Ala Ala Ala Lys Ala Val 275 280 285 Glu Glu Leu Asn Gly Lys Glu Phe Lys Ser Gln Ala Leu Tyr Val Gly 290 295 300 Arg Ala Gln Lys Lys Tyr Glu Arg Ala Glu Glu Leu Lys Lys Gln Tyr 305 310 315 320 Glu Gln Tyr Arg Leu Glu Lys Leu Ala Lys Phe Gln Gly Val Asn Leu 325 330 335 Phe Ile Lys Asn Leu Asp Asp Ser Ile Asp Asp Glu Lys Leu Lys Glu 340 345 350 Glu Phe Ala Pro Tyr Gly Thr Ile Thr Ser Ala Arg Val Met Arg Asp 355 360 365 Gln Glu Gly Asn Ser Lys Gly Phe Gly Phe Val Cys Phe Ser Ser Pro 370 375 380 Glu Glu Ala Thr Lys Ala Met Thr Glu Lys Asn Gln Gln Ile Val Ala 385 390 395 400 Gly Lys Pro Leu Tyr Val Ala Ile Ala Gln Arg Lys Asp Val Arg Arg 405 410 415 Ser Gln Leu Ala Gln Gln Ile Gln Ala Arg Asn Gln Ile Arg Phe Gln 420 425 430 Gln Gln Gln Gln Gln Gln Ala Ala Ala Ala Ala Ala Gly Met Pro Gly 435 440 445 Gln Tyr Met Pro Gln Met Phe Tyr Gly Val Met Ala Pro Arg Gly Phe 450 455 460 Pro Gly Pro Asn Pro Gly Met Asn Gly Pro Met Gly Ala Gly Ile Pro 465 470 475 480 Lys Asn Gly Met Val Pro Pro Pro Gln Gln Phe Ala Gly Arg Pro Asn 485 490 495 Gly Pro Met Tyr Gln Gly Met Pro Pro Gln Asn Gln Phe Pro Arg His 500 505 510 Gln Gln Gln His Tyr Ile Gln Gln Gln Lys Gln Arg Gln Ala Leu Gly 515 520 525 Glu Gln Leu Tyr Lys Lys Val Ser Ala Lys Ile Asp Asp Glu Asn Ala 530 535 540 Ala Gly Lys Ile Thr Gly Met Ile Leu Asp Leu Pro Pro Gln Gln Val 545 550 555 560 Ile Gln Leu Leu Asp Asn Asp Glu Gln Phe Glu Gln Gln Phe Gln Glu 565 570 575 Ala Leu Ala Ala Tyr Glu Asn Phe Lys Lys Glu Gln Glu Ala Gln Ala 580 585 590 <210> 2 <211> 1021 <212> PRT <213> Kluyveromyces lactis <400> 2 Met Gly Glu Pro Thr Ser Asp Gln Gln Pro Ala Val Glu Ala Pro Val 1 5 10 15 Val Gln Glu Glu Thr Thr Ser Ser Pro Gln Lys Asn Ser Gly Tyr Val 20 25 30 Lys Asn Thr Ala Gly Ser Gly Ala Pro Arg Asn Gly Lys Tyr Asp Gly 35 40 45 Asn Arg Lys Asn Ser Arg Pro Tyr Asn Gln Arg Gly Asn Asn Asn Asn 50 55 60 Asn Asn Gly Ser Ser Ser Asn Lys His Tyr Gln Lys Tyr Asn Gln Pro 65 70 75 80 Ala Tyr Gly Val Ser Ala Gly Tyr Ile Pro Asn Tyr Gly Val Ser Ala 85 90 95 Glu Tyr Asn Pro Leu Tyr Tyr Asn Gln Tyr Gln Gln Gln Gln Gln Leu 100 105 110 Tyr Ala Ala Ala Tyr Gln Thr Pro Met Ser Gly Gln Gly Tyr Val Pro 115 120 125 Pro Val Val Ser Pro Ala Ala Val Ser Ala Lys Pro Ala Lys Val Glu 130 135 140 Ile Thr Asn Lys Ser Gly Glu His Ile Asp Ile Ala Ser Ile Ala His 145 150 155 160 Pro His Thr His Ser His Ser Gln Ser His Ser Arg Ala Val Pro Val 165 170 175 Val Ser Pro Pro Ala Asn Val Thr Val Ala Ala Ala Val Ser Ser Ser 180 185 190 Val Ser Pro Ser Ala Ser Pro Ala Val Lys Val Gln Ser Pro Ala Ala 195 200 205 Asn Gly Lys Glu Gln Ser Pro Ala Lys Pro Glu Glu Pro Lys Lys Asp 210 215 220 Thr Leu Ile Val Asn Asp Phe Leu Glu Gln Val Lys Arg Arg Lys Ala 225 230 235 240 Ala Leu Ala Ala Lys Lys Ala Val Glu Glu Lys Gly Pro Glu Glu Pro 245 250 255 Lys Glu Ser Val Val Gly Thr Asp Thr Asp Ala Ser Val Asp Thr Lys 260 265 270 Thr Gly Pro Thr Ala Thr Glu Ser Ala Lys Ser Glu Glu Ala Gln Ser 275 280 285 Glu Ser Gln Glu Lys Thr Lys Glu Glu Ala Pro Ala Glu Pro Lys Pro 290 295 300 Leu Thr Leu Ala Glu Lys Leu Arg Leu Lys Arg Met Glu Ala Ala Lys 305 310 315 320 Gln Ala Ser Ala Lys Thr Glu Glu Leu Lys Thr Glu Glu Ser Lys Pro 325 330 335 Glu Glu Thr Lys Thr Glu Glu Leu Lys Thr Glu Glu Ser Lys Pro Glu 340 345 350 Glu Thr Lys Thr Glu Glu Leu Lys Thr Glu Glu Thr Lys Ser Glu Glu 355 360 365 Leu Lys Thr Glu Glu Pro Lys Ala Glu Glu Ser Lys Ala Glu Glu Pro 370 375 380 Lys Pro Glu Glu Pro Lys Thr Glu Glu Pro Thr Thr Glu Gln Pro Lys 385 390 395 400 Ser Asp Glu Pro Lys Ser Glu Glu Ser Lys Thr Glu Glu Pro Lys Thr 405 410 415 Glu Val Leu Lys Thr Glu Glu Pro Lys Ser Glu Glu Ser Lys Pro Ala 420 425 430 Glu Pro Lys Thr Glu Glu Thr Ala Thr Glu Glu Thr Ala Thr Glu Ala 435 440 445 Asn Ala Glu Glu Gly Glu Pro Ala Pro Ala Gly Pro Val Glu Thr Pro 450 455 460 Ala Asp Val Glu Thr Lys Pro Arg Glu Glu Ala Glu Val Glu Asp Asp 465 470 475 480 Gly Lys Ile Thr Met Thr Asp Phe Leu Gln Lys Leu Lys Glu Val Ser 485 490 495 Pro Val Asp Asp Ile Tyr Ser Phe Gln Tyr Pro Ser Asp Ile Thr Pro 500 505 510 Pro Asn Asp Arg Tyr Lys Lys Thr Ser Ile Lys Tyr Ala Tyr Gly Pro 515 520 525 Asp Phe Leu Tyr Gln Phe Lys Glu Lys Val Asp Val Lys Tyr Asp Pro 530 535 540 Ala Trp Met Ala Glu Met Thr Ser Lys Ile Val Ile Pro Pro Lys Lys 545 550 555 560 Pro Gly Ser Ser Gly Arg Gly Glu Asp Arg Phe Ser Lys Gly Lys Val 565 570 575 Gly Ser Leu Arg Ser Glu Gly Arg Ser Gly Ser Arg Ser Asn Ser Lys 580 585 590 Lys Lys Ser Lys Arg Asp Asp Arg Lys Ser Asn Arg Ser Tyr Thr Ser 595 600 605 Arg Lys Asp Arg Glu Arg Phe Arg Glu Glu Glu Val Glu Glu Pro Lys 610 615 620 Val Glu Val Ala Pro Leu Val Pro Ser Ala Asn Arg Trp Val Pro Lys 625 630 635 640 Ser Lys Met Lys Lys Thr Glu Val Lys Leu Ala Pro Asp Gly Thr Glu 645 650 655 Leu Tyr Asp Ala Glu Glu Ala Ser Arg Lys Met Lys Ser Leu Leu Asn 660 665 670 Lys Leu Thr Leu Glu Met Phe Glu Pro Ile Ser Asp Asp Ile Met Lys 675 680 685 Ile Ala Asn Gln Ser Arg Trp Glu Glu Lys Gly Glu Thr Leu Lys Ile 690 695 700 Val Ile Gln Gln Ile Phe Asn Lys Ala Cys Asp Glu Pro His Trp Ser 705 710 715 720 Ser Met Tyr Ala Gln Leu Cys Gly Lys Val Val Lys Asp Leu Asp Asp 725 730 735 Ser Ile Lys Asp Ser Glu Thr Pro Asp Lys Thr Gly Ser His Leu Val 740 745 750 Leu His Tyr Leu Val Gln Arg Cys Gln Thr Glu Phe Gln Thr Gly Trp 755 760 765 Thr Asp Gln Leu Pro Thr Asn Glu Asp Gly Thr Pro Leu Gln Pro Glu 770 775 780 Met Met Ser Asp Glu Tyr Tyr Lys Met Ala Ala Ala Lys Arg Arg Gly 785 790 795 800 Leu Gly Leu Val Arg Phe Ile Gly Phe Leu Tyr Arg Ser Asn Leu Leu 805 810 815 Thr Ser Arg Met Val Phe Phe Cys Phe Lys Arg Leu Met Lys Asp Ile 820 825 830 Gln Asn Ser Pro Thr Glu Asp Thr Leu Glu Ser Val Cys Glu Leu Leu 835 840 845 Glu Thr Ile Gly Glu Gln Phe Glu Gly Ala Arg Ile Gln Val Thr Ala 850 855 860 Glu Ala Val Ile Glu Gly Ser Ser Leu Leu Asp Thr Leu Phe Asp Gln 865 870 875 880 Ile Lys Asn Val Ile Glu Asn Gly Asp Ile Ser Ser Arg Ile Lys Phe 885 890 895 Lys Leu Ile Asp Ile Val Glu Leu Arg Glu Lys Arg Asn Trp Asn Ser 900 905 910 Lys Asn Lys Asn Asp Gly Pro Lys Thr Ile Ala Gln Ile His Glu Glu 915 920 925 Glu Ala Leu Lys Arg Ala Leu Glu Glu Arg Glu Arg Glu Arg Asp Arg 930 935 940 His Gly Ser Arg Gly Gly Ser Arg Arg Met Asn Ser Glu Arg Asn Ser 945 950 955 960 Ser Arg Arg Asp Phe Ser Ser His Ser His Ser His Asn Gln Asn Arg 965 970 975 Asp Gly Phe Thr Thr Thr Arg Ser Ser Ser Val Arg Tyr Ser Glu Pro 980 985 990 Lys Lys Glu Glu Gln Ala Pro Thr Pro Thr Lys Ser Ser Gly Gly Ala 995 1000 1005 Ala Asn Met Phe Asp Ala Leu Met Asp Ala Glu Asp Asp 1010 1015 1020 <210> 3 <211> 1642 <212> PRT <213> Artificial sequence <400> 3 Met Ser Asp Ile Thr Glu Lys Thr Ala Glu Gln Leu Glu Asn Leu Gln 1 5 10 15 Ile Asn Asp Asp Gln Gln Pro Ala Gln Ser Ala Ser Ala Pro Ser Thr 20 25 30 Ser Ala Ser Glu Ser Glu Ala Ser Ser Val Ser Lys Val Glu Asn Asn 35 40 45 Asn Ala Ser Leu Tyr Val Gly Glu Leu Asp Pro Asn Ile Thr Glu Ala 50 55 60 Leu Leu Tyr Asp Val Phe Ser Pro Leu Gly Pro Ile Ser Ser Ile Arg 65 70 75 80 Val Cys Arg Asp Ala Val Thr Lys Ala Ser Leu Gly Tyr Ala Tyr Val 85 90 95 Asn Tyr Thr Asp Tyr Glu Ala Gly Lys Lys Ala Ile Gln Glu Leu Asn 100 105 110 Tyr Ala Glu Ile Asn Gly Arg Pro Cys Arg Ile Met Trp Ser Glu Arg 115 120 125 Asp Pro Ala Ile Arg Lys Lys Gly Ser Gly Asn Ile Phe Ile Lys Asn 130 135 140 Leu His Pro Ala Ile Asp Asn Lys Ala Leu His Glu Thr Phe Ser Thr 145 150 155 160 Phe Gly Glu Val Leu Ser Cys Lys Val Ala Leu Asp Glu Asn Gly Asn 165 170 175 Ser Arg Gly Phe Gly Phe Val His Phe Lys Glu Glu Ser Asp Ala Lys 180 185 190 Asp Ala Ile Glu Ala Val Asn Gly Met Leu Met Asn Gly Leu Glu Val 195 200 205 Tyr Val Ala Met His Val Pro Lys Lys Asp Arg Ile Ser Lys Leu Glu 210 215 220 Glu Ala Lys Ala Asn Phe Thr Asn Ile Tyr Val Lys Asn Ile Asp Val 225 230 235 240 Glu Thr Thr Asp Glu Glu Phe Glu Gln Leu Phe Ser Gln Tyr Gly Glu 245 250 255 Ile Val Ser Ala Ala Leu Glu Lys Asp Ala Glu Gly Lys Pro Lys Gly 260 265 270 Phe Gly Phe Val Asn Phe Val Asp His Asn Ala Ala Ala Lys Ala Val 275 280 285 Glu Glu Leu Asn Gly Lys Glu Phe Lys Ser Gln Ala Leu Tyr Val Gly 290 295 300 Arg Ala Gln Lys Lys Tyr Glu Arg Ala Glu Glu Leu Lys Lys Gln Tyr 305 310 315 320 Glu Gln Tyr Arg Leu Glu Lys Leu Ala Lys Phe Gln Gly Val Asn Leu 325 330 335 Phe Ile Lys Asn Leu Asp Asp Ser Ile Asp Asp Glu Lys Leu Lys Glu 340 345 350 Glu Phe Ala Pro Tyr Gly Thr Ile Thr Ser Ala Arg Val Met Arg Asp 355 360 365 Gln Glu Gly Asn Ser Lys Gly Phe Gly Phe Val Cys Phe Ser Ser Pro 370 375 380 Glu Glu Ala Thr Lys Ala Met Thr Glu Lys Asn Gln Gln Ile Val Ala 385 390 395 400 Gly Lys Pro Leu Tyr Val Ala Ile Ala Gln Arg Lys Asp Val Arg Arg 405 410 415 Ser Gln Leu Ala Gln Gln Ile Gln Ala Arg Asn Gln Ile Arg Phe Gln 420 425 430 Gln Gln Gln Gln Gln Gln Ala Ala Ala Ala Ala Ala Gly Met Pro Gly 435 440 445 Gln Tyr Met Pro Gln Met Phe Tyr Gly Val Met Ala Pro Arg Gly Phe 450 455 460 Pro Gly Pro Asn Pro Gly Met Asn Gly Pro Met Gly Ala Gly Ile Pro 465 470 475 480 Lys Asn Gly Met Val Pro Pro Pro Gln Gln Phe Ala Gly Arg Pro Asn 485 490 495 Gly Pro Met Tyr Gln Gly Met Pro Pro Gln Asn Gln Phe Pro Arg His 500 505 510 Gln Gln Gln His Tyr Ile Gln Gln Gln Lys Gln Arg Gln Ala Leu Gly 515 520 525 Glu Gln Leu Tyr Lys Lys Val Ser Ala Lys Ile Asp Asp Glu Asn Ala 530 535 540 Ala Gly Lys Ile Thr Gly Met Ile Leu Asp Leu Pro Pro Gln Gln Val 545 550 555 560 Ile Gln Leu Leu Asp Asn Asp Glu Gln Phe Glu Gln Gln Phe Gln Glu 565 570 575 Ala Leu Ala Ala Tyr Glu Asn Phe Lys Lys Glu Gln Glu Ala Gln Ala 580 585 590 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Thr Gln Asp Glu Val Gln 595 600 605 Gly Pro His Ala Gly Lys Ser Thr Val Gly Gly Gly Gly Ser Gly Glu 610 615 620 Pro Thr Ser Asp Gln Gln Pro Ala Val Glu Ala Pro Val Val Gln Glu 625 630 635 640 Glu Thr Thr Ser Ser Pro Gln Lys Asn Ser Gly Tyr Val Lys Asn Thr 645 650 655 Ala Gly Ser Gly Ala Pro Arg Asn Gly Lys Tyr Asp Gly Asn Arg Lys 660 665 670 Asn Ser Arg Pro Tyr Asn Gln Arg Gly Asn Asn Asn Asn Asn Asn Gly 675 680 685 Ser Ser Ser Asn Lys His Tyr Gln Lys Tyr Asn Gln Pro Ala Tyr Gly 690 695 700 Val Ser Ala Gly Tyr Ile Pro Asn Tyr Gly Val Ser Ala Glu Tyr Asn 705 710 715 720 Pro Leu Tyr Tyr Asn Gln Tyr Gln Gln Gln Gln Gln Leu Tyr Ala Ala 725 730 735 Ala Tyr Gln Thr Pro Met Ser Gly Gln Gly Tyr Val Pro Pro Val Val 740 745 750 Ser Pro Ala Ala Val Ser Ala Lys Pro Ala Lys Val Glu Ile Thr Asn 755 760 765 Lys Ser Gly Glu His Ile Asp Ile Ala Ser Ile Ala His Pro His Thr 770 775 780 His Ser His Ser Gln Ser His Ser Arg Ala Val Pro Val Val Ser Pro 785 790 795 800 Pro Ala Asn Val Thr Val Ala Ala Ala Val Ser Ser Ser Val Ser Pro 805 810 815 Ser Ala Ser Pro Ala Val Lys Val Gln Ser Pro Ala Ala Asn Gly Lys 820 825 830 Glu Gln Ser Pro Ala Lys Pro Glu Glu Pro Lys Lys Asp Thr Leu Ile 835 840 845 Val Asn Asp Phe Leu Glu Gln Val Lys Arg Arg Lys Ala Ala Leu Ala 850 855 860 Ala Lys Lys Ala Val Glu Glu Lys Gly Pro Glu Glu Pro Lys Glu Ser 865 870 875 880 Val Val Gly Thr Asp Thr Asp Ala Ser Val Asp Thr Lys Thr Gly Pro 885 890 895 Thr Ala Thr Glu Ser Ala Lys Ser Glu Glu Ala Gln Ser Glu Ser Gln 900 905 910 Glu Lys Thr Lys Glu Glu Ala Pro Ala Glu Pro Lys Pro Leu Thr Leu 915 920 925 Ala Glu Lys Leu Arg Leu Lys Arg Met Glu Ala Ala Lys Gln Ala Ser 930 935 940 Ala Lys Thr Glu Glu Leu Lys Thr Glu Glu Ser Lys Pro Glu Glu Thr 945 950 955 960 Lys Thr Glu Glu Leu Lys Thr Glu Glu Ser Lys Pro Glu Glu Thr Lys 965 970 975 Thr Glu Glu Leu Lys Thr Glu Glu Thr Lys Ser Glu Glu Leu Lys Thr 980 985 990 Glu Glu Pro Lys Ala Glu Glu Ser Lys Ala Glu Glu Pro Lys Pro Glu 995 1000 1005 Glu Pro Lys Thr Glu Glu Pro Thr Thr Glu Gln Pro Lys Ser Asp Glu 1010 1015 1020 Pro Lys Ser Glu Glu Ser Lys Thr Glu Glu Pro Lys Thr Glu Val Leu 1025 1030 1035 1040 Lys Thr Glu Glu Pro Lys Ser Glu Glu Ser Lys Pro Ala Glu Pro Lys 1045 1050 1055 Thr Glu Glu Thr Ala Thr Glu Glu Thr Ala Thr Glu Ala Asn Ala Glu 1060 1065 1070 Glu Gly Glu Pro Ala Pro Ala Gly Pro Val Glu Thr Pro Ala Asp Val 1075 1080 1085 Glu Thr Lys Pro Arg Glu Glu Ala Glu Val Glu Asp Asp Gly Lys Ile 1090 1095 1100 Thr Met Thr Asp Phe Leu Gln Lys Leu Lys Glu Val Ser Pro Val Asp 1105 1110 1115 1120 Asp Ile Tyr Ser Phe Gln Tyr Pro Ser Asp Ile Thr Pro Pro Asn Asp 1125 1130 1135 Arg Tyr Lys Lys Thr Ser Ile Lys Tyr Ala Tyr Gly Pro Asp Phe Leu 1140 1145 1150 Tyr Gln Phe Lys Glu Lys Val Asp Val Lys Tyr Asp Pro Ala Trp Met 1155 1160 1165 Ala Glu Met Thr Ser Lys Ile Val Ile Pro Pro Lys Lys Pro Gly Ser 1170 1175 1180 Ser Gly Arg Gly Glu Asp Arg Phe Ser Lys Gly Lys Val Gly Ser Leu 1185 1190 1195 1200 Arg Ser Glu Gly Arg Ser Gly Ser Arg Ser Asn Ser Lys Lys Lys Ser 1205 1210 1215 Lys Arg Asp Asp Arg Lys Ser Asn Arg Ser Tyr Thr Ser Arg Lys Asp 1220 1225 1230 Arg Glu Arg Phe Arg Glu Glu Glu Val Glu Glu Pro Lys Val Glu Val 1235 1240 1245 Ala Pro Leu Val Pro Ser Ala Asn Arg Trp Val Pro Lys Ser Lys Met 1250 1255 1260 Lys Lys Thr Glu Val Lys Leu Ala Pro Asp Gly Thr Glu Leu Tyr Asp 1265 1270 1275 1280 Ala Glu Glu Ala Ser Arg Lys Met Lys Ser Leu Leu Asn Lys Leu Thr 1285 1290 1295 Leu Glu Met Phe Glu Pro Ile Ser Asp Asp Ile Met Lys Ile Ala Asn 1300 1305 1310 Gln Ser Arg Trp Glu Glu Lys Gly Glu Thr Leu Lys Ile Val Ile Gln 1315 1320 1325 Gln Ile Phe Asn Lys Ala Cys Asp Glu Pro His Trp Ser Ser Met Tyr 1330 1335 1340 Ala Gln Leu Cys Gly Lys Val Val Lys Asp Leu Asp Asp Ser Ile Lys 1345 1350 1355 1360 Asp Ser Glu Thr Pro Asp Lys Thr Gly Ser His Leu Val Leu His Tyr 1365 1370 1375 Leu Val Gln Arg Cys Gln Thr Glu Phe Gln Thr Gly Trp Thr Asp Gln 1380 1385 1390 Leu Pro Thr Asn Glu Asp Gly Thr Pro Leu Gln Pro Glu Met Met Ser 1395 1400 1405 Asp Glu Tyr Tyr Lys Met Ala Ala Ala Lys Arg Arg Gly Leu Gly Leu 1410 1415 1420 Val Arg Phe Ile Gly Phe Leu Tyr Arg Ser Asn Leu Leu Thr Ser Arg 1425 1430 1435 1440 Met Val Phe Phe Cys Phe Lys Arg Leu Met Lys Asp Ile Gln Asn Ser 1445 1450 1455 Pro Thr Glu Asp Thr Leu Glu Ser Val Cys Glu Leu Leu Glu Thr Ile 1460 1465 1470 Gly Glu Gln Phe Glu Gly Ala Arg Ile Gln Val Thr Ala Glu Ala Val 1475 1480 1485 Ile Glu Gly Ser Ser Leu Leu Asp Thr Leu Phe Asp Gln Ile Lys Asn 1490 1495 1500 Val Ile Glu Asn Gly Asp Ile Ser Ser Arg Ile Lys Phe Lys Leu Ile 1505 1510 1515 1520 Asp Ile Val Glu Leu Arg Glu Lys Arg Asn Trp Asn Ser Lys Asn Lys 1525 1530 1535 Asn Asp Gly Pro Lys Thr Ile Ala Gln Ile His Glu Glu Glu Ala Leu 1540 1545 1550 Lys Arg Ala Leu Glu Glu Arg Glu Arg Glu Arg Asp Arg His Gly Ser 1555 1560 1565 Arg Gly Gly Ser Arg Arg Met Asn Ser Glu Arg Asn Ser Ser Arg Arg 1570 1575 1580 Asp Phe Ser Ser His Ser His Ser His Asn Gln Asn Arg Asp Gly Phe 1585 1590 1595 1600 Thr Thr Thr Arg Ser Ser Ser Val Arg Tyr Ser Glu Pro Lys Lys Glu 1605 1610 1615 Glu Gln Ala Pro Thr Pro Thr Lys Ser Ser Gly Gly Ala Ala Asn Met 1620 1625 1630 Phe Asp Ala Leu Met Asp Ala Glu Asp Asp 1635 1640 <210> 4 <211> 1779 <212> DNA <213> Kluyveromyces lactis <400> 4 atgtctgata ttactgaaaa aactgctgag caattggaaa acttgcagat caacgatgat 60 cagcaaccag ctcaatctgc cagtgctcca tccacttctg cttctgaaag cgaagcttct 120 tctgtttcta aggttgaaaa caacaacgct tcattgtacg ttggtgaatt ggatccaaac 180 attactgaag cattgttgta cgatgtgttt tcaccattgg gtccaatttc ctcgatccgt 240 gtttgtcgtg atgccgtcac caaggcttcg ttaggttacg cttacgttaa ctatactgat 300 tacgaagctg gtaagaaagc tattcaagaa ttgaactatg ctgaaatcaa cggtagacca 360 tgtagaatta tgtggtccga acgtgaccca gctatcagaa agaagggttc tggtaacatt 420 ttcatcaaga acttgcaccc agccattgac aacaaggctt tgcatgaaac tttctccact 480 ttcggtgaag tcttgtcttg taaagttgct ttagatgaga atggaaactc tagaggcttc 540 ggtttcgttc atttcaagga agaatccgat gctaaggatg ctattgaagc cgtcaacggt 600 atgttgatga acggtttgga agtttacgtt gccatgcacg ttccaaagaa ggaccgtatc 660 tccaagttgg aagaagccaa ggctaacttc accaacattt acgtcaagaa cattgacgtt 720 gaaaccactg acgaagagtt cgaacagttg ttctcccaat acggtgaaat tgtctctgct 780 gctttggaaa aggatgctga gggtaagcca aagggtttcg gtttcgttaa ctttgttgac 840 cacaacgccg ctgccaaggc cgttgaagag ttgaacggta aggaattcaa gtctcaagct 900 ttgtacgttg gcagagctca aaagaagtac gaacgtgctg aagaattgaa gaaacaatac 960 gaacaatacc gtttggaaaa attggctaag ttccaaggtg ttaacttgtt catcaagaac 1020 ttggacgatt ccatcgatga cgaaaaattg aaggaagaat tcgccccata cggtaccatc 1080 acctctgcta gagtcatgag agaccaagag ggtaactcta agggtttcgg tttcgtttgt 1140 ttctcttctc cagaagaagc taccaaggct atgaccgaaa agaaccaaca aattgttgcc 1200 ggtaagccat tgtacgttgc cattgctcaa agaaaggatg tcagaagatc ccaattggct 1260 caacaaattc aagccagaaa ccaaatcaga ttccaacaac agcaacaaca acaagctgct 1320 gccgctgctg ctggtatgcc aggccaatac atgccacaaa tgttctatgg tgttatggcc 1380 ccaagaggtt tcccaggtcc aaacccaggt atgaacggcc caatgggtgc cggtattcca 1440 aagaacggta tggtcccacc accacaacaa tttgctggta gaccaaacgg tccaatgtac 1500 caaggtatgc cacctcaaaa ccaattccca agacaccaac aacaacacta catccaacaa 1560 caaaagcaaa gacaagcctt gggtgaacaa ttgtacaaga aggtcagtgc caagattgac 1620 gacgaaaacg ccgctggtaa gatcaccggt atgatcttgg atctaccacc acagcaagtc 1680 atccaattgt tggacaacga cgaacaattt gaacagcaat tccaagaagc cttagctgct 1740 tacgaaaact tcaagaagga acaagaagct caagcttaa 1779 <210> 5 <211> 3066 <212> DNA <213> Kluyveromyces lactis <400> 5 atgggcgaac ctacatccga tcagcaacca gctgttgaag ctccagttgt gcaggaggag 60 acaaccagtt ctccgcaaaa aaacagtgga tatgtcaaga atactgctgg aagcggtgct 120 cctagaaatg ggaaatatga tggtaacagg aagaactcta ggccttataa ccaaagaggt 180 aacaacaaca ataataatgg ttcttcctcg aataagcact atcaaaagta taaccaacca 240 gcgtacggtg tttctgcggg atacattccg aactacggcg tatcggcaga gtacaaccct 300 ctgtactata accagtacca acagcagcaa cagctgtacg ctgctgctta ccagactcca 360 atgagcggac aaggttatgt ccccccagta gtgtctccag ctgctgtttc agctaaacca 420 gcgaaggttg agattactaa caagtctggt gaacacatag atattgcttc cattgctcat 480 ccacatactc attctcattc tcaatctcat tcgcgtgcag ttccagtagt gtcgcctcca 540 gctaacgtta ccgtcgctgc tgctgtatca tcctctgtgt ctccatcagc ttctccagct 600 gtcaaagtac agagccctgc tgctaatggt aaggaacaat ctccagctaa gcctgaagaa 660 ccaaagaagg acactttaat tgtgaacgat ttcttggaac aagttaaaag acgcaaggct 720 gctttagctg ctaagaaggc tgtcgaagag aagggtcctg aggaaccgaa ggaatctgtc 780 gttggaactg acactgatgc aagcgttgat actaagacag ggcctacagc cactgaatct 840 gccaagtctg aagaagctca atcagaatca caagaaaaga ctaaggaaga ggctccagct 900 gagccaaaac cattgacttt ggccgaaaaa ttgagactta agaggatgga agctgcaaag 960 caagcttctg ctaagaccga ggaactaaag actgaagaat ctaagcctga agaaacaaag 1020 accgaggagc taaagactga agaatctaag cctgaagaaa caaagaccga ggagctaaag 1080 actgaagaaa caaagtccga ggaactaaag actgaagaac ctaaggcgga agaatcaaag 1140 gcggaagaac caaagcctga agaaccaaag accgaggaac cgacgactga acaaccaaag 1200 tcagatgaac caaagtcgga agaatcaaaa actgaagagc caaaaaccga ggtattaaag 1260 actgaagaac caaaatcgga agaatcaaag cctgcagaac caaagactga agaaacagca 1320 actgaagaaa cagcaactga agcaaacgcc gaagaaggtg aaccggctcc tgctggtccc 1380 gttgaaactc ctgctgatgt tgaaacaaaa cctcgagaag aggctgaagt tgaagacgat 1440 ggaaagatta ccatgaccga tttcctacag aagttgaaag aggtttctcc agttgatgat 1500 atttattcct tccaataccc aagtgacatt acgcctccaa atgatagata taaaaagaca 1560 agcattaaat atgcatacgg acctgatttc ttgtatcagt tcaaagaaaa ggtcgatgtt 1620 aaatacgatc cagcgtggat ggctgaaatg acgagtaaaa ttgtcatccc tcctaagaag 1680 cctggttcaa gcggaagagg cgaagataga tttagtaagg gtaaggttgg atctctaaga 1740 agtgaaggca gatcgggttc caggtccaac tcgaagaaga agtcaaagag ggatgataga 1800 aaatctaata gatcatacac ttccagaaag gaccgtgaaa gattcagaga ggaagaagtc 1860 gaagagccaa aggttgaggt tgccccattg gtcccaagtg ctaatagatg ggttcctaaa 1920 tctaagatga agaaaacaga agtcaagtta gctccagacg gaacagaact ttacgacgcg 1980 gaagaagcat caagaaagat gaagtcattg ctgaataaat tgacattaga aatgttcgaa 2040 cctatttctg atgatatcat gaagatcgct aaccaatcta gatgggaaga aaagggtgag 2100 actttgaaga ttgtcatcca acaaattttc aataaggcct gcgatgaacc tcattggtca 2160 tcaatgtacg cgcaattatg tggtaaggtc gttaaagact tagatgatag cattaaagac 2220 tcagaaaccc cagataagac tggttctcac ttggttttgc attacttagt ccaaagatgt 2280 caaactgaat tccaaacagg atggactgat caactaccta caaacgaaga cggtactcct 2340 ctacaacctg aaatgatgtc cgatgaatac tataagatgg ctgccgctaa gagaagaggt 2400 ttgggtttgg ttcgtttcat tggtttcttg taccgttcga acttattgac ttccagaatg 2460 gtcttcttct gtttcaagag actaatgaag gatattcaaa actctcctac tgaagatact 2520 ctagagtctg tatgtgaact tttggaaaca attggtgaac agttcgaagg tgctcgtatt 2580 caagttactg cagaagctgt cattgagggt tcaagcttgc tagacacact attcgaccaa 2640 ataaagaacg tgatcgaaaa tggtgacatc tccagcagaa tcaagtttaa gttgatcgac 2700 attgtcgaac taagagaaaa gaggaactgg aatagtaaaa ataagaacga tggtccaaag 2760 accattgctc aaattcacga agaagaagcc ttgaagaggg ctttggagga aagagaaaga 2820 gaaagagatc gccatgggtc cagaggtggt tccagacgta tgaatagcga gagaaactct 2880 tctagaagag atttctcctc tcattctcac agtcacaatc aaaatagaga cggtttcact 2940 actaccagat cgtcatcagt gagatattct gagccaaaga aggaagaaca agctccaact 3000 ccaactaaat cttctggtgg cgctgccaac atgtttgatg cattgatgga tgccgaagat 3060 gattaa 3066 <210> 6 <211> 20 <212> DNA <213> Artificial sequence <400> 6 cggtttttca aagcagatat 20 <210> 7 <211> 62 <212> DNA <213> Artificial sequence <400> 7 cggtttttca aagcagatat gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cg 62 <210> 8 <211> 50 <212> DNA <213> Artificial sequence <400> 8 gctctaaaac atatctgctt tgaaaaaccg aaagtcccat tcgccacccg 50 <210> 9 <211> 72 <212> DNA <213> Artificial sequence <400> 9 gagctcggta cccggggatc ctctagagat aataaaattt caacctttaa gccattgaat 60 tttaccatta cg 72 <210> 10 <211> 57 <212> DNA <213> Artificial sequence <400> 10 gccaagcttg catgcctgca ggtcgacgat cttgttagta atctcaacct tcgctgg 57 <210> 11 <211> 20 <212> DNA <213> Artificial sequence <400> 11 atcgtcgacc tgcaggcatg 20 <210> 12 <211> 20 <212> DNA <213> Artificial sequence <400> 12 atctctagag gatccccggg 20 <210> 13 <211> 22 <212> DNA <213> Artificial sequence <400> 13 atgggcgaac ctacatccga tc 22 <210> 14 <211> 29 <212> DNA <213> Artificial sequence <400> 14 atctgctttg aaaaaccgct ctttctctc 29 <210> 15 <211> 60 <212> DNA <213> Artificial sequence <400> 15 agagagaaag agcggttttt caaagcagat ccacacacca tagcttcaaa atgtttctac 60 60 <210> 16 <211> 66 <212> DNA <213> Artificial sequence <400> 16 tggttgctga tcggatgtag gttcgcccat cttagattag attgctatgc tttctttcta 60 atgagc 66 <210> 17 <211> 56 <212> DNA <213> Artificial sequence <400> 17 agagagaaag agcggttttt caaagcagat agacgcgaat ttttcgaaga agtacc 56 <210> 18 <211> 89 <212> DNA <213> Artificial sequence <400> 18 agcttcaaca gctggttgct gatcggatgt aggttcgccc attgttttat atttgttgta 60 aaaagtagat aattacttcc ttgatgatc 89 <210> 19 <211> 51 <212> DNA <213> Artificial sequence <400> 19 agagagaaag agcggttttt caaagcagat gagcctgtcc aagcaaatgc c 51 <210> 20 <211> 62 <212> DNA <213> Artificial sequence <400> 20 tggttgctga tcggatgtag gttcgcccat ttttaatgtt acttctcttg cagttaggga 60 ac 62 <210> 21 <211> 56 <212> DNA <213> Artificial sequence <400> 21 agagagaaag agcggttttt caaagcagat gttcctcatc actagaagcc gaactg 56 <210> 22 <211> 89 <212> DNA <213> Artificial sequence <400> 22 agcttcaaca gctggttgct gatcggatgt aggttcgccc atttttatta attcttgatc 60 gatttttttg ttatttctga agtaactct 89 <210> 23 <211> 20 <212> DNA <213> Artificial sequence <400> 23 cttgttgcta agaactaaag 20 <210> 24 <211> 20 <212> DNA <213> Artificial sequence <400> 24 ctctgaaaga gttgtcgatt 20 <210> 25 <211> 50 <212> DNA <213> Artificial sequence <400> 25 cttgttgcta agaactaaag gttttagagc tagaaatagc aagttaaaat 50 <210> 26 <211> 50 <212> DNA <213> Artificial sequence <400> 26 gctctaaaac ctttagttct tagcaacaag aaagtcccat tcgccacccg 50 <210> 27 <211> 50 <212> DNA <213> Artificial sequence <400> 27 ctctgaaaga gttgtcgatt gttttagagc tagaaatagc aagttaaaat 50 <210> 28 <211> 50 <212> DNA <213> Artificial sequence <400> 28 gctctaaaac aatcgacaac tctttcagag aaagtcccat tcgccacccg 50 <210> 29 <211> 55 <212> DNA <213> Artificial sequence <400> 29 gagctcggta cccggggatc ctctagagat catccactcc atcaccgcta cccaa 55 <210> 30 <211> 52 <212> DNA <213> Artificial sequence <400> 30 gccaagcttg catgcctgca ggtcgacgat caacgtcccc atctacaaga gc 52 <210> 31 <211> 20 <212> DNA <213> Artificial sequence <400> 31 atcgtcgacc tgcaggcatg 20 <210> 32 <211> 20 <212> DNA <213> Artificial sequence <400> 32 atctctagag gatccccggg 20 <210> 33 <211> 73 <212> DNA <213> Artificial sequence <400> 33 gatgcattga tggatgccga agatgattaa agaggttgat gtaattgata ttttcctgat 60 aaaattacta ttg 73 <210> 34 <211> 103 <212> DNA <213> Artificial sequence <400> 34 agctggttgc tgatcggatg taggttcgcc agatccacct ccttccacgt ttgttggtct 60 tgatccacct ccaccgttct tagcaacaag ttcgaccaaa tcg 103 <210> 35 <211> 22 <212> DNA <213> Artificial sequence <400> 35 ggcgaaccta catccgatca gc 22 <210> 36 <211> 27 <212> DNA <213> Artificial sequence <400> 36 ttaatcatct tcggcatcca tcaatgc 27 <210> 37 <211> 17 <212> DNA <213> Artificial sequence <400> 37 gtaaaacgac ggccagt 17 <210> 38 <211> 17 <212> DNA <213> Artificial sequence <400> 38 caggaaacag ctatgac 17 <210> 39 <211> 52 <212> DNA <213> Artificial sequence <400> 39 gagctcggta cccggggatc ctctagagat gaagctttga tgactaccgt tc 52 <210> 40 <211> 55 <212> DNA <213> Artificial sequence <400> 40 gccaagcttg catgcctgca ggtcgacgat gtctattgta tcggaagaac tgtca 55 <210> 41 <211> 20 <212> DNA <213> Artificial sequence <400> 41 atcgtcgacc tgcaggcatg 20 <210> 42 <211> 20 <212> DNA <213> Artificial sequence <400> 42 atctctagag gatccccggg 20 <210> 43 <211> 65 <212> DNA <213> Artificial sequence <400> 43 gatgcattga tggatgccga agatgattaa attactcttt taagttaacg aacgcttttg 60 atgag 65 <210> 44 <211> 130 <212> DNA <213> Artificial sequence <400> 44 agctggttgc tgatcggatg taggttcgcc agatccacct ccttccacgt ttgttggtct 60 tgatccacct ccaccagcaa cgtgctcaac taagtcaacg accctttcag agtaaccgta 120 ttcgttatcg 130 <210> 45 <211> 22 <212> DNA <213> Artificial sequence <400> 45 ggcgaaccta catccgatca gc 22 <210> 46 <211> 27 <212> DNA <213> Artificial sequence <400> 46 ttaatcatct tcggcatcca tcaatgc 27 <210> 47 <211> 17 <212> DNA <213> Artificial sequence <400> 47 gtaaaacgac ggccagt 17 <210> 48 <211> 17 <212> DNA <213> Artificial sequence <400> 48 caggaaacag ctatgac 17 <210> 49 <211> 26 <212> DNA <213> Artificial sequence <400> 49 cttctactgc tccaatgttc gtcgtt 26 <210> 50 <211> 25 <212> DNA <213> Artificial sequence <400> 50 ttaacgaaga caagtacaac ggtga 25 <210> 51 <211> 25 <212> DNA <213> Artificial sequence <400> 51 ttctcttcga cagccttctt agcag 25 <210> 52 <211> 20 <212> DNA <213> Artificial sequence <400> 52 tgcttacgaa aacttcaaga 20 <210> 53 <211> 62 <212> DNA <213> Artificial sequence <400> 53 tgcttacgaa aacttcaaga gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cg 62 <210> 54 <211> 50 <212> DNA <213> Artificial sequence <400> 54 gctctaaaac tcttgaagtt ttcgtaagca aaagtcccat tcgccacccg 50 <210> 55 <211> 55 <212> DNA <213> Artificial sequence <400> 55 gagctcggta cccggggatc ctctagagat ccggtaagcc attgtacgtt gccat 55 <210> 56 <211> 55 <212> DNA <213> Artificial sequence <400> 56 gccaagcttg catgcctgca ggtcgacgat cagtataccg tccatgttga tgact 55 <210> 57 <211> 20 <212> DNA <213> Artificial sequence <400> 57 atcgtcgacc tgcaggcatg 20 <210> 58 <211> 20 <212> DNA <213> Artificial sequence <400> 58 atctctagag gatccccggg 20 <210> 59 <211> 63 <212> DNA <213> Artificial sequence <400> 59 gatgcattga tggatgccga agatgattaa acttgatttt ttgaccttga tcttcatctt 60 gtc 63 <210> 60 <211> 100 <212> DNA <213> Artificial sequence <400> 60 cttgaacttc atcttgagtt gaacctccac ctccagatcc acctccacca gcttgagctt 60 cttgttcttt tttaaaattc tcgtaagcag ctaaggcttc 100 <210> 61 <211> 93 <212> DNA <213> Artificial sequence <400> 61 gtggaggttc aactcaagat gaagttcaag gtccacatgc tggtaagtct actgttggtg 60 gaggtggatc tggcgaacct acatccgatc agc 93 <210> 62 <211> 27 <212> DNA <213> Artificial sequence <400> 62 ttaatcatct tcggcatcca tcaatgc 27 <210> 63 <211> 17 <212> DNA <213> Artificial sequence <400> 63 gtaaaacgac ggccagt 17 <210> 64 <211> 17 <212> DNA <213> Artificial sequence <400> 64 caggaaacag ctatgac 17 <210> 65 <211> 25 <212> DNA <213> Artificial sequence <400> 65 tctccagaag aagctaccaa ggcta 25 <210> 66 <211> 25 <212> DNA <213> Artificial sequence <400> 66 ttctcttcga cagccttctt agcag 25

Claims (15)

  1. 식 Ia 또는 식 Ib 구조를 구비하며:
    S-A-B-C (Ia)
    S-C-B-A (Ib);
    식에서,
    A는 효모에서 유래되는 PabI 단백질;
    B는 없거나, 또는 링커 펩타이드;
    C는 효모에서 유래되는 eIF4G 단백질;
    S는 임의의 시그널 펩타이드; 및
    각 "-"는 펩타이드 결합인 것을 특징으로 하는 융합 단백질.
  2. 제1항에 따른 융합 단백질을 코딩하는 것을 특징으로 하는 폴리뉴클레오티드.
  3. 제2항에 따른 폴리뉴클레오티드를 포함하는 벡터.
  4. 제3항에 따른 벡터를 포함하거나, 또는 게놈에 제2항에 따른 폴리뉴클레오티드가 삽입되어 있는 것을 특징으로 하는 분리된 숙주세포.
  5. 외래 단백질 발현에 사용되는 체외 단백질 합성 시스템에 있어서,
    상기 시스템은,
    (i) (a) 효모세포 추출물, (b) 임의의 폴리 에틸렌 글리콜, (c) 임의의 외래 자당, (d) 물 또는 수성 용매에서 임의로 선택되는 용매를 포함하는 효모 체외 단백질 합성 시스템; 및
    (ii) 제1항에 따른 융합 단백질; 을 포함하는 체외 단백질 합성 시스템.
  6. 제5항에 있어서,
    상기 시스템은, (iii) 별도로 첨가된 eIF4G 단백질; 을 더 포함하는 체외 단백질 합성 시스템.
  7. 제6항에 있어서,
    상기 eIF4G 단백질은 항시성 또는 유도적 프로모터로 유도 발현되는 것을 특징으로 하는 체외 단백질 합성 시스템.
  8. 제1항에 따른 상기 융합 단백질을 생산하는 방법에 있어서,
    (i) 발현하기 적합한 조건하에서, 숙주세포를 배양하여 제1항에 따른 융합 단백질을 발현시키는 단계로서,
    여기서, 상기 숙주세포는 벡터를 포함하고, 상기 벡터는 제1항에 따른 상기 융합 단백질을 코딩하는 폴리뉴클레오티드를 포함하고, 또는 상기 숙주세포의 게놈에 제1항에 따른 상기 융합 단백질을 코딩하는 폴리뉴클레오티드가 삽입되며; 및
    (ii) 상기 융합 단백질을 분리시키는 단계; 를 포함하는 융합 단백질을 생산하는 방법.
  9. 제1항에 따른 상기 융합 단백질을 포함하며, 체외 단백질 합성 시스템의 체외 단백질 합성 기능을 향상시키는 제제.
  10. 발현하려는 목적 외래 단백질의 발현 방법에 있어서,
    상기 방법은,
    (i) 제1항에 따른 상기 융합 단백질을 함유하는 효모 체외 단백질 합성 시스템을 제공하는 단계; 및
    (ii) 단백질을 발현하기 적합한 조건하에서, 상기 외래 단백질의 템플렛 존재하에 상기 효모 체외 단백질 합성 시스템을 배양하여 상기 외래 단백질을 발현하는 단계; 를 포함하는 발현하려는 목적 외래 단백질의 발현 방법.
  11. 제10항에 있어서,
    상기 융합 단백질은 별도로 첨가된 것을 특징으로 하는 목적 외래 단백질의 발현 방법.
  12. 제10항에 있어서,
    상기 단계 (ii)는,
    (iii) 외래 단백질 활성의 발현 활성 Q1을 검출하고, 상기 단계 (ii)와 동일한 조건에서 야생 효모 균주를 배양하여 상기 외래 단백질의 활성 Q2를 검출하는 단계; 를 더 포함하며,
    만약 Q1이 Q2보다 현저하게 높으면, 외래 단백질의 발현 효율이 현저하게 향상되었음을 나타내는 것을 특징으로 하는 목적 외래 단백질의 발현 방법.
  13. 제1항에 따른 융합 단백질을 포함하고, 외래 단백질의 발현 효율을 향상시키기 위한, 외래 단백질을 발현하는 체외 단백질 합성 시스템.
  14. 삭제
  15. 삭제
KR1020207006125A 2017-07-31 2017-12-13 신규 융합 단백질의 제조 및 이의 단백질 합성 향상에서의 응용 KR102384271B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201710642517.4A CN108690139B (zh) 2017-07-31 2017-07-31 新型融合蛋白的制备及其在提高蛋白质合成的应用
CN201710642517.4 2017-07-31
PCT/CN2017/115972 WO2019024379A1 (zh) 2017-07-31 2017-12-13 新型融合蛋白的制备及其在提高蛋白质合成的应用

Publications (2)

Publication Number Publication Date
KR20200033952A KR20200033952A (ko) 2020-03-30
KR102384271B1 true KR102384271B1 (ko) 2022-04-08

Family

ID=63843689

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020207006125A KR102384271B1 (ko) 2017-07-31 2017-12-13 신규 융합 단백질의 제조 및 이의 단백질 합성 향상에서의 응용

Country Status (6)

Country Link
US (1) US11946084B2 (ko)
EP (1) EP3663319A4 (ko)
JP (1) JP7246100B2 (ko)
KR (1) KR102384271B1 (ko)
CN (1) CN108690139B (ko)
WO (1) WO2019024379A1 (ko)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111118065A (zh) * 2018-10-31 2020-05-08 康码(上海)生物科技有限公司 一种真核生物的基因改造方法及其相应的基因工程细胞及应用
CN111378706B (zh) * 2018-12-27 2022-07-19 康码(上海)生物科技有限公司 通过Edc3基因敲除改变体外蛋白合成能力的方法及其应用
CN111378708B (zh) * 2018-12-28 2022-07-19 康码(上海)生物科技有限公司 一种体外无细胞蛋白合成体系及其应用
CN111718419B (zh) * 2019-03-20 2022-04-12 康码(上海)生物科技有限公司 含有rna结合蛋白的融合蛋白及其配合使用的表达载体
CN111484998B (zh) 2019-05-30 2023-04-21 康码(上海)生物科技有限公司 体外定量共表达多种蛋白的方法及其应用
CN112111042B (zh) 2019-06-21 2024-04-05 康码(上海)生物科技有限公司 一种生物磁性微球及其制备方法和使用方法
KR20220101738A (ko) 2019-11-30 2022-07-19 강마-헬스코드 (상하이) 바이오테크 컴퍼니 리미티드 생체자기 마이크로스피어 및 이의 제조 방법과 용도
CN116490517A (zh) 2020-09-30 2023-07-25 龙沙有限公司 过表达翻译因子的宿主细胞

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000053779A1 (en) 1999-03-08 2000-09-14 The European Molecular Biology Laboratory Translation regulation system and methods for use thereof
JP2002519023A (ja) 1998-06-29 2002-07-02 アヴェンティス・リサーチ・ウント・テクノロジーズ・ゲーエムベーハー・ウント・コー・カーゲー 3’−エキソヌクレアーゼ、その調製および使用

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9703406D0 (en) * 1997-02-19 1997-04-09 Chiron Spa Expression of heterologous proteins
US5985575A (en) 1998-05-20 1999-11-16 Wisconsin Alumni Research Foundation Tethered function assay for protein function
WO2008009727A1 (en) * 2006-07-21 2008-01-24 Centre National De La Recherche Scientifique (Cnrs) Positive cytomodulines to improve bioreactor productivity.
DE112010001805T5 (de) * 2009-04-29 2012-09-06 Basf Plant Science Company Gmbh Pflanzen mit gesteigerten Ertragsmerkmalen und Verfahren zu deren Herstellung
CN103060334B (zh) * 2013-01-28 2014-05-07 西南大学 家蚕PABP结合蛋白互作因子基因BmPaip1及其重组表达载体和应用
WO2014144583A2 (en) * 2013-03-15 2014-09-18 Northwestern University Methods for cell- free protein synthesis
US9822378B2 (en) * 2013-05-15 2017-11-21 Ribokine, Llc Intracellular translation of circular RNA
CN105624146B (zh) * 2015-05-28 2019-02-15 中国科学院微生物研究所 基于CRISPR/Cas9和酿酒酵母细胞内源的同源重组的分子克隆方法
CN106978349B (zh) * 2016-09-30 2018-06-22 康码(上海)生物科技有限公司 一种体外蛋白质合成的试剂盒及其制备方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002519023A (ja) 1998-06-29 2002-07-02 アヴェンティス・リサーチ・ウント・テクノロジーズ・ゲーエムベーハー・ウント・コー・カーゲー 3’−エキソヌクレアーゼ、その調製および使用
WO2000053779A1 (en) 1999-03-08 2000-09-14 The European Molecular Biology Laboratory Translation regulation system and methods for use thereof

Also Published As

Publication number Publication date
WO2019024379A1 (zh) 2019-02-07
KR20200033952A (ko) 2020-03-30
US11946084B2 (en) 2024-04-02
US20210189449A1 (en) 2021-06-24
JP2020528760A (ja) 2020-10-01
JP7246100B2 (ja) 2023-03-27
EP3663319A4 (en) 2021-04-14
CN108690139A (zh) 2018-10-23
EP3663319A1 (en) 2020-06-10
CN108690139B (zh) 2019-03-15

Similar Documents

Publication Publication Date Title
KR102384271B1 (ko) 신규 융합 단백질의 제조 및 이의 단백질 합성 향상에서의 응용
Kuchler et al. Saccharomyces cerevisiae STE6 gene product: a novel pathway for protein export in eukaryotic cells.
CN110093284B (zh) 一种在细胞中提高蛋白合成效率的方法
CN110845622B (zh) 不同结构域缺失融合蛋白的制备及其在提高蛋白质合成的应用
US20220290202A1 (en) Aminoacyl-trna synthetase efficiently introducing lysine derivatives
KR20140015137A (ko) 분비 효율이 개선된 재조합 단백질의 생산 방법
US20220170030A1 (en) Aminoacyl-trna synthetase for efficiently introducing lysine derivative in protein
CN109423496B (zh) 一种细胞中内源性表达rna聚合酶的核酸构建物
WO2018161374A1 (zh) 一种用于体外蛋白质合成的蛋白合成体系、试剂盒及其制备方法
KR102345759B1 (ko) 뉴클레아제 시스템의 녹-아웃에 의한 시험관 내 생합성 활성을 조절하기 위한 방법
JP2016537026A (ja) 活性なtertを産生するための新しい方法
CN113423836A (zh) 重组宿主细胞中碳源调节的蛋白的产生
CN110938649A (zh) 一种提高外源蛋白表达量的蛋白合成体系及其应用方法
WO2019170892A1 (en) Methods and compositions for lectin production
WO2019100431A1 (zh) 一种能够增强蛋白质合成效率的串联dna元件
US10287342B2 (en) Polypeptide for binding to complement protein C5A, and use of same
KR100915670B1 (ko) 야로위아 리폴리티카 유래의 신규 YlMPO1 유전자 및이의 파쇄 균주를 이용한 만노스 인산이 제거된 당단백질생산 방법
CN111778270B (zh) 通过整合发光报告基因反映体外无细胞蛋白表达水平的方法
CN111378706B (zh) 通过Edc3基因敲除改变体外蛋白合成能力的方法及其应用
WO2020182768A1 (en) Methods for bioactive lectin production with improved yield
CN112342248A (zh) 一种基因敲除改变体外蛋白合成能力的方法及其应用
CN111118065A (zh) 一种真核生物的基因改造方法及其相应的基因工程细胞及应用
RU2799794C2 (ru) АМИНОАЦИЛ-тРНК-СИНТЕТАЗА ДЛЯ ЭФФЕКТИВНОГО ВВЕДЕНИЯ ПРОИЗВОДНОГО ЛИЗИНА В БЕЛОК
KR102083170B1 (ko) 세포 투과 펩티드 및 아데노신 탈아미노화효소의 융합 단백질을 포함하는 중증복합면역결핍증 치료용 약학적 조성물
Keßler et al. Ser644 is important for catalytic activity but is not involved in cAMP-dependent phosphorylation of yeast 6-phosphofructo-2-kinase

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant