KR20160012153A - 투과효소 활성을 갖는 폴리펩타이드 - Google Patents

투과효소 활성을 갖는 폴리펩타이드 Download PDF

Info

Publication number
KR20160012153A
KR20160012153A KR1020157034443A KR20157034443A KR20160012153A KR 20160012153 A KR20160012153 A KR 20160012153A KR 1020157034443 A KR1020157034443 A KR 1020157034443A KR 20157034443 A KR20157034443 A KR 20157034443A KR 20160012153 A KR20160012153 A KR 20160012153A
Authority
KR
South Korea
Prior art keywords
xylose
seq
glucose
polypeptide
hxt11
Prior art date
Application number
KR1020157034443A
Other languages
English (en)
Inventor
파울 클라쎈
발 파울러스 페트루스 드
종 르네 마르셀 드
아르놀트 야코프 마티우 드리쎈
예로운 헤르번 니란트
현용 신
Original Assignee
디에스엠 아이피 어셋츠 비.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 디에스엠 아이피 어셋츠 비.브이. filed Critical 디에스엠 아이피 어셋츠 비.브이.
Publication of KR20160012153A publication Critical patent/KR20160012153A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • C07K14/39Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts
    • C07K14/395Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts from Saccharomyces
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/04Alpha- or beta- amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/02Oxygen as only ring hetero atoms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/02Monosaccharides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Mycology (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Biomedical Technology (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Immobilizing And Processing Of Enzymes And Microorganisms (AREA)

Abstract

본 발명은 서열번호 59의 339 또는 376번 위치에 상응하는 위치에 하나 이상의 치환을 갖는 폴리펩타이드에 관한 것이며, 여기에서 상기 폴리펩타이드는 주 촉진자 상과(MFS)의 구성원이다. 하나의 실시태양에서, 상기 치환은 376에 상응하는 위치에 있으며 상기 위치의 아미노산은 80 내지 138 Å3의 반데르 발스 부피 및 10 내지 100 ΔtR의 측쇄 소수성을 갖는 아미노산에 의해 치환된다.

Description

투과효소 활성을 갖는 폴리펩타이드{POLYPEPTIDES WITH PERMEASE ACTIVITY}
본 발명은 신규의 폴리펩타이드 및 상기 폴리펩타이드를 발현하는 재조합 유기체에 관한 것이다. 하나의 실시태양에서, 본 발명은 변경된 당 특이성 및/또는 당 수송 활성을 갖는 신규의 투과효소 폴리펩타이드에 관한 것이다.
효모 세포 및 다른 진핵생물의 원형질막은 복잡한 생체-막으로, 2개의 인지질층으로 이루어지며 그 안에 과잉의 단백질이 매몰되어 있다. 많은 분자들이 확산 또는 삼투에 의해서 또는 특별한 수송 시스템의 도움으로 상기 원형질막을 가로지를 수 있다.
수송 시스템은 양분과 이온의 흡수, 대사 산물 및 바람직하지 않거나 유해한 물질의 유출을 허용한다. 상이한 기전들이 존재한다. 1차 능동 수송체는 예를 들어 ATP 가수분해를 사용함으로써 용질 축적 또는 압출을 구동한다. 주 촉진자 상과(MFS) 수송체에 속하는 2차 담체는 화학-삼투 구배에 반응하여 하나 이상의 분자 종들의 상기 막을 가로지르는 수송을 촉진한다. 효모 사카로마이세스 세레비지아에(Saccharomyces cerevisiae)에서 186개의 MFS 단백질이 S288c 균주에서 동정되었다(문헌[Nelissen, 1997]).
상기와 같은 담체의 일례는 Hxt1 단백질로, 사카로마이세스 세레비지아에에서 헥소스 수송에 관련된다.
투과효소는 특정 분자(본 발명에서는 구체적으로 하나 이상의 당)의 수동 수송에 의한 세포 안팎으로의 확산을 촉진하는 다중통과 막관통 단백질의 한 부류인 막 수송 단백질이다. 대조적으로, 능동 수송체는 분자 막관통 수송을 ATP와 같은 에너지원 또는 유리한 이온 구배와 커플링시킨다.
투과효소, 촉진자, 수송체 또는 수송 단백질이란 용어들 또는 관련된 용어들은 모두 막을 가로질러 분자를 수송하는 기능을 나타내는 다수의 막 신장 도메인을 갖는 단백질들을 개시한다. 상기 수송은 상이한 기전들, 즉 단독수송(하나의 분자의 수송), 공동수송(2개의 상이한 분자의 같은 방향으로의 동시적인 공-수송), 역수송(2개 분자의 반대 방향으로의 동시적인 수송) 및 촉진된 확산에 의해 발생할 수 있다.
효모 중의 당 수송체과는 30 내지 40개의 구성원들(S288c 균주에서 34개 구성원(문헌[Nelissen, 1997]))로 이루어진다. 상기 당 수송체는 5개의 집단, 즉 헥소스 투과효소(HXT-유전자, GAL2), 다이사카라이드 투과효소, 마이오-이노시톨 투과효소, 당 수용체, 및 기질이 알려지지 않은 수송체의 최종 집단으로 나뉠 수 있다.
액체 수송 연료의 생산에 매력적인 대체 공급원료인 리그노셀룰로스 바이오매스는 다수의 상이한 당들로 이루어진다. 리그노셀룰로스의 헥소스 분획, 주로 글루코스는 원칙적으로 효모 사카로마이세스 세레비지아에의 비-재조합 버전에 의해 쉽게 발효될 수 있다. 그러나, 상기 유기체는 펜토스 당, 예를 들어 자일로스 및 아라비노스를 에탄올로 대사할 수 없다.
펜토스 당을 대사할 수 있는 유기체의 생성 방법은 당해 분야에 공지되어 있다. 예를 들어, WO/2009/109630에서, 발현 카세트의 제작 및 자일로스 아이소머라제의 발현에 의한 사카로마이세스 세레비지아에 세포의 펜토스 발효 세포로의 형질전환을 예시한다.
천연 펜토스-이용 유기체는 존재하지만, 충분히-개발된 유전자 도구 및/또는 낮은 생성물 내성은 결여되어 있으며, 이는 리그노셀룰로스 전환 과정에 대한 숙주로서의 그의 적합성을 제한한다.
결과적으로, 펜토스 발효를 가능하게 하기 위해서, 에탄올 산업에서 여전히 선택되는 유기체인 효모 사카로마이세스 세레비지아에에의 펜토스 전환 경로의 도입에 노력을 집중해 왔다.
과거 수년간 성취된 막대한 양의 진보에도 불구하고, 펜토스 당의 수송은 여전히 펜토스 대사에서 율속 단계(중 하나)인 것으로 간주된다.
사카로마이세스 세레비지아에에서 펜토스 수송은 헥소스 수송체(Hxt)과의 상이한 구성원들에 의해 매개된다. Hxt4, Hxt5, Hxt7 및 Gal2가 사카로마이세스 세레비지아에에서 주요 자일로스 수송체로서 개시되었으며(문헌[Hamacher et al, 2002]), Gal2도 또한 아라비노스 수송을 매개하는 것으로 공지되어 있다(문헌[Becker et al, 2003]). 그러나, 각각의 펜토스 당에 대한 친화성은 각각의 헥소스 당에 대한 경우보다 대략 10 내지 100배 더 낮다. 따라서 재조합 효모 세포에서 전용 자일로스 또는 아라비노스 수송체의 결여는 당 혼합물 중 헥소스 및 펜토스의 동시-이용 능력을 제한하며, 높은 펜토스 이화작용 유출을 방해한다. 결과적으로, 바이오매스 당의 전환은 2-단계로 간주될 수 있다: 첫 번째 단계에서, 헥소스(글루코스)의 비교적 빠른 전환이 발생하는 반면, 상기 헥소스가 배지로부터 고갈되었을 때 시작되는 두 번째 단계에서 펜토스 발효가 개시되나, 상기 헥소스 전환 속도에 비해 훨씬 더 느린 속도이다.
따라서, 대략적으로 동일한 수준으로 헥소스를 전환시키는 능력을 유지시키기 위해서, 펜토스-특이적인, 즉 글루코스 간섭이 없고(펜토스 특이성) 펜토스에 대한 친화성이 높은 당 수송체를 발현시키는 것, 즉 변하지 않는 수송체 전망이 오랫동안 필요했다.
상기 문제를 해결하는 한 가지 방법은, 펜토스 특이적이고 펜토스에 대해 (적당히) 높은 친화성을 갖는 이종 당(펜토스) 수송체를 선별하는 것이다. 그러나, 상기와 같은 노력은 지금까지 제한되게 성공하였다. 단지 몇 개만이 사카로마이세스 세레비지아에에서 발현시 펜토스 수송을 촉진할 수 있는 것으로 나타났으나, 이들 모두 상기에서 지적한 바와 같이 사카로마이세스 세레비지아에의 경우에서처럼, 자일로스보다 글루코스에 유리하다(문헌[Young et al, 2011] 및 상기 문헌 중 참고문헌들).
또 다른 접근법은 헥소스 수송체를 펜토스 수송체로 재가공(re-engineer)하는 것이다. 예를 들어 카사하라(Kasahara) 등(2000; 2009; 2010)에 의한 연구는 다수의 당 수송체들 중의 잔기가 천연 기질에 대한 기질 친화성의 결정에 핵심적인 역할을 함을 지적한다.
펜토스 당을 보다 효율적으로 수송할 수 있는 돌연변이 헥소스 수송체가 당해 분야에 공지되어 있다. 예를 들어, WO/2012/049173에서, 펜토스-발효 사카로마이세스 세레비지아에의 배양물로부터 돌연변이 헥소스 수송체 유전자의 단리가 개시되어 있다.
사카로마이세스 세레비지아에에서, 투과효소 GAL2는 갈락토스를 세포막을 가로질러 수송한다. 상기 효소는 또한 글루코스를 상기 막을 가로질러 수송하는 수송체로서 공지되어 있다.
본 발명의 목적은 변경된, 특히 개선된 당 특이성을 갖는 신규의 투과효소 폴리펩타이드를 제공하는 것이다. 본 발명의 또 다른 목적은 투과효소가 세포막을 가로질러 수송하는 분자의 개선된 흡수를 갖는 상기 투과효소 폴리펩타이드를 발현하는 재조합 균주를 제공하는 것이다. 또 다른 목적은 모 폴리펩타이드에 비해, C5 당, 특히 자일로스의 개선된 수송 능력을 갖는 투과효소 폴리펩타이드를 제공하는 것이다. 또 다른 목적은 모 폴리펩타이드에 비해, C6 당, 특히 글루코스에 대해 감소된 수송 활성을 갖는 투과효소 폴리펩타이드를 제공하는 것이다. 또 다른 목적은 자일로스의 개선된 수송 능력 또는 글루코스에 대한 감소된 수송 활성에 대해 이로운 효과를 갖는 다른 관련된 투과효소 폴리펩타이드에서의 돌연변이를 확인하는 방법을 제공하는 것이다.
이들 목적 중 하나 이상이 본 발명에 따라 획득된다. 본 발명에 따라, 서열번호 59의 339 또는 376번 위치에 상응하는 위치에 하나 이상의 치환을 갖는 폴리펩타이드를 제공하며, 여기에서 상기 폴리펩타이드는 주 촉진자 상과(MFS)의 구성원이다. 하나의 실시태양에서, 상기 치환은 376번에 상응하는 위치에 있으며 상기 위치의 아미노산은 80 내지 138 Å3의 반데르 발스 부피 및 10 내지 100 ΔtR의 측쇄 소수성을 갖는 아미노산에 의해 치환된다. 하나의 실시태양에서 상기 376번 위치의 아미노산은 85 내지 138 Å3의 반데르 발스 부피 및 10 내지 100 ΔtR의 측쇄 소수성을 갖는다.
아미노산에 대한 반데르 발스 부피(Å3) 값들을 본 발명에서 http://www.proteinsandproteomics.org/content/free/tables 1/table08.pdf에 개시된 바와 같이 사용한다. 상응하는 문헌은 문헌[N. J. Darby, Thomas E. Creighton, Protein Structure (1993) Oxford University Press]이다. 아미노산의 측쇄 소수성(ΔtR) 값들을 본 발명에서 http://onlinelibrary.wiley.com/doi/10.1002/psc.310010507/pdf에 개시된 바와 같이 사용한다. 이에 상응하는 참고문헌은 문헌[Monera, O.D. et al, Journal of Peptide science Vol. 1 , 319-329 (1995)]이다.
상기 돌연변이들 중 하나 이상을 갖는 본 발명에 따른 폴리펩타이드는 유리한 당 소비 및/또는 발효 산물 생산을 갖는다. 이는 하기에 보다 상세히 개시될 것이며 하기 실시예 1 내지 5에 의해 예시될 것이다.
도 1은 베르듀인(Verduyn)-유레아 + 15 gℓ-1 글루코스 + 20 gℓ-1 자일로스상의 헥소스 수송체 돌연변이 호기성 진탕 플라스크 배양의 결과를 도시한다. 배양 기간 동안의 (A) 600 ㎚ 파장에서의 광학 밀도 측정, (B) 글루코스 농도(gℓ-1), (C) 자일로스 농도.
도 2는 베르듀인-유레아 + 20 gℓ-1 자일로스상의 헥소스 수송체 돌연변이 호기성 진탕 플라스크 배양의 결과를 도시한다. (A) 600 ㎚ 파장에서의 광학 밀도 측정, (B) 자일로스 농도(gℓ-1).
도 3은 균주 YD01227에 대한 균주 제작 도표를 도시한다.
도 4는 베르듀인-유레아 + 100 gℓ-1 글루코스 + 20 gℓ-1 자일로스상의 4중 헥소스 키나제 돌연변이(col2) 및 기준 균주 RN1014의 호기성 진탕 플라스크 배양의 결과를 도시한다. 배양 기간 동안의 (A) 600 ㎚ 파장에서의 광학 밀도 측정, (B) 글루코스 농도(gℓ-1), (C) 자일로스 농도.
도 5는 글루코스-자일로스 혼합물상에서의 미세-웰 플레이트 배양의 결과를 도시한다. 각각 하기의 농도: (A) 60 + 20, (B) 100 + 20, (C) 15 + 5, 및 (D) 25 gℓ-1 + 5 gℓ-1의 글루코스 및 자일로스의 혼합물이 보충된 베르듀인-유레아상에서의, 기준 균주 RN1014, 및 동등한 유전자형을 갖는 4중 헥소키나제 돌연변이 YD01227 및 콜로니 2(Col2)의 생육 특성. 15분마다, OD600을 바이오스크린(Bioscreen) C 장치에 의해 자동적으로 측정하였다. 데이터 점들은 3회 중복 측정의 평균이다.
도 6은 플라스미드 지도 pRN993을 도시한다.
도 7은 글루코스 수송 활성 카운터 선별(GTAC 선별)에서 잔류 자일로스 및 글루코스 농도간의 관계(A), 또는 잔류 자일로스 농도 및 생육(OD600; B)을 도시한다(실시예를 참조하시오). 잔류 자일로스 농도(gℓ- 1)를 잔류 (A) 글루코스 농도(gℓ-1) 및 (B) 96시간째의 OD600에 대해 플롯팅하였다. (삽입물 B) 선형 회귀 분석은 OD600과 자일로스의 양호한 상관성을 도시한다. 각각의 데이터 점은 1 내지 3 회 중복물의 당 농도의 평균, 또는 상기 선별의 부분당 RN1001 대조용 균주 또는 배지 샘플의 수회 측정의 평균을 나타낸다.
도 8은 GTAC 선별에서 Gal2-N376-돌연변이 변체의 생육 및 자일로스 소비를 도시한다. (A) 24, 72 및 96시간의 시점들에서의 OD600 측정, 및 (B) 상기 GTAC 선별 동안 상기 Gal2-N376-돌연변이 변체, RN1001 대조용 균주 및 빈 샘플(YD10 배지만)에 대해 측정된 잔류 자일로스 농도(gℓ-1). 각 컬럼은 3개 형질전환체의 평균 OD600 또는 잔류 자일로스 농도를 나타내고; 오차 막대는 평균의 표준 오차를 나타낸다. 별표는 분명한 효과를 갖는 큰 소수성 측쇄를 갖는 아미노산을 가리킨다.
도 9는 TOP15 자일로스 수송 활성(XTA) 선별(실시예 참조)의 생육 프로파일을 도시한다. 상기 XTA 선별의 (A) 파트 A 및 (B) 파트 B로부터의 상기 TOP15 균주/변체에 대한 3개 샘플링 점들의 OD600 값. 각 컬럼은 3개 형질전환체의 평균 OD600를 나타내고; 오차 막대는 상기 평균의 표준 오차를 나타낸다.
도 10은 투과효소 단백질 서열의 정렬을 도시한다.
도 11은 아미노산 소수성(ΔtR)(X-축)에 대한 아미노산 반데르 발스 부피(Å3)(Y-축)의 플롯을 도시한다. 서열번호 59에서 376에 상응하는 위치에 유리한 아미노산(감소된 글루코스 수송 활성)은 짧은 줄무늬 선에 의해 한정된 영역내에 있고 339번 위치의 경우 긴 줄무늬 선에 의해 한정된 영역내에 있다. 본 발명에서 사용되는 반데르 발스 부피(Å3) 값들은 http://www.proteinsandproteomics.org/content/free/tables 1/table08.pdf에 개시되어 있다. 상응하는 문헌은 문헌[N. J. Darby, Thomas E. Creighton, Protein Structure (1993) Oxford University Press]이다. 아미노산의 소수성(ΔtR) 값들을 본 발명에서 http://onlinelibrary.wiley.com/doi/10.1002/psc.310010507/pdf에 개시된 바와 같이 사용한다. 이에 상응하는 참고문헌은 문헌[Monera, O.D. et al, Journal of Peptide science Vol. 1, 319-329 (1995)]이다.
도 12는 (A) 2% 자일로스가 보충된 베르듀인-유레아-his 상의 진화된 균주 RN1053-X2 및 야생형 균주 RN1053의 생육 곡선을 도시한다. 생육 곡선을 시간(h)에 대한 600 ㎚ 파장에서 측정된 광학 밀도(OD)의 단위(OD600)로서 나타내었다 (B) 상기 균주 RN1053-X2에서 HXT8 - HXT17의 발현 수준. 각 샘플에서 ACT1 수준에 대한 발현 수준을 표준화된 발현 배수 수준으로서 나타내었으며; 발현 수준을 특정한 HXT 유전자의 RN1053 mRNA 수준(RN1053 발현 수준을 1로 설정하였다)에 대해 표준화하였다.
도 13(A-B)는 RN1053-X2-빈(1053-X2) 및 RN1053-빈과 비교된 (A) HXT11 발현 수준 및 (B) HXT11 녹아웃 균주들(KO1 내지 6)의 생육을 도시한다. 생육을 600 ㎚ 파장에서 측정된 광학 밀도(OD)의 단위(OD600)로서 나타내었다.
도 13(C-D)는 (C) pRS313-P7T7의 플라스미드 지도, (D) 빈 벡터 대조군(1053-X)으로 형질전환된 RN1053-X2, 및 2% 자일로스가 보충된 베르듀인-유레아상의 pRS313-P7T7-역HXT11(iHXT1 내지 4)의 도입 후 4개 형질전환체의 생육을 도시한다. 생육을 600 ㎚ 파장에서 측정된 광학 밀도(OD)의 단위(OD600)로서 나타내었다.
도 14는 (A) 글루코스 및 자일로스(각각 2%)의 혼합물 또는 (B) 2% 자일로스가 보충된 베르듀인-유레아상의 RN1053-HXT11(Hxt11, 닫힌 다이아몬드), RN1053-HXT12(Hxt12, 열린 삼각형), RN1053-빈 벡터 대조군(1053; 삼각형), RN1041-빈 벡터 대조군(1041; 열린 사각형)의 생육 프로파일을 도시한다. 생육 곡선을 시간(h)에 대한 600 ㎚ 파장에서 측정된 광학 밀도(OD)의 단위(OD600)로서 나타내었다.
도 15는 증가하는 농도의 경쟁 글루코스(0 내지 500 mM)의 존재 또는 부재하의 RN1053-HXT11(HXT11), RN1053-HXT2(Hxt2), RN1053-빈(빈)에 대한 자일로스 흡수 연구를 도시한다.
도 16은 (A) 16시간째에 2% 자일로스상에서 키메릭 Hxt11p-GFP 단백질을 발현하는 RN1053의 생육(초기 세포 밀도는 OD 0.5이었다). (B) 글루코스 또는 자일로스가 보충된 베르듀인-유레아상에서 생육된 RN1053-HXT11 및 RN1041-HXT11의 형광 현미경검사를 도시한다.
도 17은 80 gℓ-1 글루코스 및 40 gℓ-1 자일로스가 보충된 베르듀인-유레아상의 (A) RN1041-빈 플라스미드 및 (B) RN1053-HXT11의 당 소비 및 에탄올 생산의 발효 프로파일을 도시한다.
도 18은 YD01227-GAL2(n=3), YD01227-HXT2(n=3), YD01227-HXT11(n=3) 형질전환체에 의한 96시간 GTAC-선별 후의 생육 프로파일(OD600)(A), 잔류 자일로스(B) 및 글루코스(C) 농도(gℓ- 1)를 도시한다. 배지 및 RN1001 샘플을 대조군으로서 첨가하였다.
도 19(A-B)는 15% 글루코스 및 1% 자일로스가 보충된 베르듀인-유레아 상의 (A) YD01227-빈, YD01227-HXT11 및 YD01227-mHXT11(N366D) 형질전환체(n=2), 및 (B) 2% 자일로스가 보충된 베르듀인-유레아상의 RN1053-형질전환체(n=3)의 진탕 플라스크 배양물의 생육 프로파일을 도시한다.
도 19(C-E)는 RN1053-HXT11 및 RN1053-mHXT11(N366D)에 의한 14C-방사성 표지된 당 흡수 프로파일을 도시한다. 증가하는 표지되지 않은 글루코스(0 내지 500 mM) 농도의 부재(D) 및 존재(E) 하의 (A) 14C-글루코스 흡수 및 14C-자일로스 흡수. 당 흡수를 분(min)당 효모의 nmol ㎎ 건조 중량(DW)으로서 나타내었다.
도 19(C-F)는 베르듀인-유레아 + 100 gℓ-1 글루코스 및 60 gℓ-1 자일로스상의 RN1041-빈(닫힌 다이아몬드; 1041-빈), RN1053-HXT11(닫힌 삼각형; 1053+HXT11), RN1053-mHXT11(N366D)(닫힌 사각형; 1053+epHXT11)의 발효 프로파일을 도시한다. (C) 시간(h)에 대한 생육 곡선(OD600 측정에 의해 나타냄). (D) 글루코스, (E) 자일로스 및 (F) 에탄올과 같은, 시간(h)에 대한 발효 브로쓰에서 측정된 구성성분들.
도 19(J-L)은 균주 RN1053-HXT11(J 및 L-회색 대시 선) 및 RN1053-mHXT11(N366D)(K 및 L-검은색 선)의 80 gℓ-1 글루코스 및 40 gℓ-1 자일로스가 보충된 베르듀인-유레아상의 발효 프로파일을 도시한다. (L) (J) 및 (K)에서 예시된 2개의 발효 프로파일을 모두 합한 도면.
도 20은 YD01227의 케모스탯 배양 동안(일수) 베르듀인-유레아-his 배지에서 글루코스/자일로스 비에 대한 도해를 도시한다.
도 21은 YD1227-evo(A) 및 YD01227-ori(B)와 함께 증가하는 글루코스 농도의 부재(닫힌 삼각형; 1+0) 또는 존재(3% 글루코스, 줄, 1+3; 6% 글루코스, 닫힌 원, 1+6; 10% 글루코스, 닫힌 다이아몬드, 1+10) 하에 1% 자일로스가 보충된 베르듀인-유레아-his 상의 진탕 플라스크 배양물의 생육 프로파일을 도시한다. (C) 증가하는 글루코스 농도(0 내지 500 nM)의 존재 또는 부재 하의 YD01227-ori(1227-ori, 닫힌 사각형) 또는 YD01227-evo(1227-evo, 닫힌 다이아몬드)의 14C-자일로스 흡수 연구.
도 22는 (A) 자일로스:글루코스 1:3(회색 막대) 및 1:10(검은색 막대) 비의 당 혼합물이 보충된 베르듀인-유레아-his 상의 YD01227-ori(흰색 막대), YD01227-evoB의 mRNA 발현 프로파일을 도시한다. 데이터를 표준화된 발현(ACT1 및 YD01227-ori(상기는 1로 설정되었다)에 대해)으로서 나타내었다.
도 22(B-D)는 자일로스(B) 및 글루코스(C)에 대한 흡수 실험을 도시한다. 흡수를 RN1053-Hxt3-6(다이아몬드), RN1053-N367I(삼각형) 및 1053-emp(사각형)에서 nmol/㎎.DW.min으로 측정하였다. (D) RN1053-Hxt3-6(다이아몬드) 및 RN1053-N367I 균주(사각형)에서 0, 50, 100, 200 및 500 mM 글루코스의 존재하의 50 mM 14C 자일로스의 흡수.
도 23은 Hxt36(A) 및 Hxt36-N367I(B)의 GFP 융합 단백질을 발현하는 균주 RN1053의 형광 상들을 도시한다. 상들을 니콘 이클립스(Nikon Eclipse)-Ti 현미경상에서 분석하였다. (C) 상기 두 균주 중의 GFP 형광의 총량(AU/OD600 단위).
도 24는 367번 위치에 모든 가능한 아미노산 치환들을 갖는 HXT36 수송체들을 발현하는 벡터들을 함유하는 YD01227 균주의 생육을 도시한다. 세포를 1% 자일로스 및 10% 자일로스상에서 생육시켰으며, 빈 벡터 pRS313-P7T7으로 형질전환된 YD01227을 대조군으로서 사용하였다.
도 25는 글루코스(패널 A) 및 자일로스(패널 B)에 대한 Km 및 Vmax를 측정하기 위한 흡수 실험을 도시한다. 흡수를 RN1053-HXT36 균주(다이아몬드), RN1053-HXT36-N367I 균주(사각형) 및 RN1053-HXT36-N367A 균주(삼각형)에서 nmol/㎎DW.min으로 측정하였다. 상기 RN1053-빈 균주의 흡수 수준을 상기 2개의 당 모두에 대해서, RN1053-HXT36, RN1053-HXT36-N367I 및 RN1053-HXT36-N367A 균주로부터 공제하였다.
도 26은 5 gℓ-1 D-글루코스 및 5 gℓ-1 D-자일로스상에서의 HXT36(A), HXT36-N367I(B) 및 HXT36-N367A(C)를 발현하는 RN1053 균주의 생육을 도시한다. 잔류 D-글루코스(다이아몬드), D-자일로스(사각형) 및 에탄올(원)을 g/ℓ로 측정하였다.
도 27은 HXT11-N366X 돌연변이체의 자일로스 특이성의 특성화를 도시한다. (A) 균주 YD01227에서 HXT11-N366X 돌연변이체의 최대 지수 생육률(1/h). 글루코스(B) 또는 자일로스(C)상에서의 RN1053에서 발현된 N366X 돌연변이체에 대한 최대 지수 생육률(1/h).
도 28은 2% 말토스상에서 생육된 HXT11 N366X 돌연변이체의 GFP 융합 단백질을 발현하는 균주 RN1053의 형광 상들을 도시한다. 도면의 좌측 상단의 문자는 각 Hxt11 변체의 366번 위치상의 아미노산을 나타낸다.
도 29는 (A) RN1053 HXT11-N366M, (B) RN1053 HXT11-N366T, (C) RN1001 및 (D) RN1053 HXT11-N366N의 자일로스(40 gℓ-1) 및 글루코스(71,8 gℓ-1)가 보충된 베르듀인-유레아상에서의 발효를 도시한다. 기호: 글루코스(◆), 자일로스(■), 에탄올(▲), 세포 밀도(●). (A), (B), (C) 및 (D)는 도 29의 패널들이다.
서열 목록의 간단한 설명
서열번호 1: 프라이머 5034-kanf
서열번호 2: 프라이머 5035-kanr
서열번호 3: 프라이머 5116-lf2
서열번호 4: 프라이머 5118-lr2
서열번호 5: 프라이머 5115-lfl
서열번호 6: 프라이머 5117-lr1
서열번호 7: pRN201; TOPO-BLUNT-loxP-kanMX-loxP
서열번호 8: pRN251; TOPO-BLUNT-loxP-hphMX-loxP
서열번호 9: pRN365; TOPO-BLUNT-loxP-natMX-loxP
서열번호 10: 프라이머 115-natf
서열번호 11: 프라이머 116-natr
서열번호 12: pRN447; TOPO-BLUNT-loxP-zeoMX-loxP
서열번호 13: 프라이머 28-H3f
서열번호 14: 프라이머 29-H3r
서열번호 15: pRN247 (TOPO-BLUNT-HIS3:loxPkanMXIoxP)
서열번호 16: 프라이머 201-Hx2uf
서열번호 17: 프라이머 202-Hx2ur
서열번호 18: 프라이머 203-Hx2df
서열번호 19: 프라이머 204-Hx2dr
서열번호 20: 프라이머 205-Hx3uf
서열번호 21: 프라이머 206-Hx3ur
서열번호 22: 프라이머 210-Hx4df
서열번호 23: 프라이머 211-Hx4dr
서열번호 24: 프라이머 212-Hx5uf
서열번호 25: 프라이머 213-Hx5ur
서열번호 26: 프라이머 229-Hx7df
서열번호 27: 프라이머 230-Hx7dr
서열번호 28: 프라이머 243-Gal2ufn
서열번호 29: 프라이머 244-Gal2urn
서열번호 30: 프라이머 233-Ga2df
서열번호 31: 프라이머 234-Ga2dr
서열번호 32: pRN485; TOPO-BLUNT-GAL2:loxPzeoMXIoxP
서열번호 33: pRN566; TOPO-BLUNT-HXT367:loxP-hphMX-loxP
서열번호 34: pRN569: TOPO-BLUNT-HXT514:loxP-natMX-loxP
서열번호 35: pRN635; TOPO-BLUNT-HXT2:loxP-kanMX-loxP
서열번호 36: 프라이머 281-Hx3inr2
서열번호 37: 프라이머 323-Hx7inr1
서열번호 38: 프라이머 Hx4inr2
서열번호 39: 프라이머 Hx5inf
서열번호 40: 프라이머 324-Ga2inf1
서열번호 41: 프라이머 325-Ga2inr1
서열번호 42: 프라이머 289-Hx2inf
서열번호 43: 프라이머 290-Hx2inr
서열번호 44: 프라이머 838-Glk1-psuc227f
서열번호 45: 프라이머 834-Hxk2-psuc227f
서열번호 46: 프라이머 645-pSUC227r
서열번호 47: 프라이머 839-Glk1-psuc225r
서열번호 48: 프라이머 835-Hxk2-psuc225r
서열번호 49: 프라이머 646-pSUC225f
서열번호 50: 프라이머 846-Hxk1_loxP_f
서열번호 51: 프라이머 847-Hxk1_loxP_r
서열번호 52: 프라이머 848-Gal1_loxP_f
서열번호 53: 프라이머 849-Gal1_loxP_r
서열번호 54: pRN774; TOPO-BLUNT-loxP-hphMX-loxP(반대 배향의 loxP 부위)
서열번호 55: pRN775; TOPO-BLUNT-loxP-natMX-loxP(반대 배향의 loxP 부위)
서열번호 56: WT - GAL2 DNA 서열
서열번호 57: pRN993; Xbal 부위(TCTAGA) 및 BssHII 부위(GCGCGC).
서열번호 58: pDB1250; 선별을 위한 WT-GAL2 발현 벡터; Xbal 부위(TCTAGA) 및 BssHII 부위(GCGCGC).
서열번호 59: WT Gal2p 아미노산 서열
서열번호 60: pRN187 (pSH65-유래된 CRE 재조합 발현 벡터)
서열번호 61: pRN486 (TOPO-BLUNT-his3::loxP-natMX-loxP)
서열번호 62: 프라이머 ActinF (실시간 PCR)
서열번호 63: 프라이머 ActinR (실시간 PCR)
서열번호 64: 프라이머 HXT1F (실시간 PCR)
서열번호 65: 프라이머 HXT1R (실시간 PCR)
서열번호 66: 프라이머 HXT2F (실시간 PCR)
서열번호 67: 프라이머 HXT2R (실시간 PCR)
서열번호 68: 프라이머 HXT3F (실시간 PCR)
서열번호 69: 프라이머 HXT3R (실시간 PCR)
서열번호 70: 프라이머 HXT4F (실시간 PCR)
서열번호 71: 프라이머 HXT4R (실시간 PCR)
서열번호 72: 프라이머 HXT5F (실시간 PCR)
서열번호 73: 프라이머 HXT5R (실시간 PCR)
서열번호 74: 프라이머 HXT7F (실시간 PCR)
서열번호 75: 프라이머 HXT7R (실시간 PCR)
서열번호 76: 프라이머 HXT8F (실시간 PCR)
서열번호 77: 프라이머 HXT8R (실시간 PCR)
서열번호 78: 프라이머 HXT9F (실시간 PCR)
서열번호 79: 프라이머 HXT9R (실시간 PCR)
서열번호 80: 프라이머 HXT10F (실시간 PCR)
서열번호 81: 프라이머 HXT10R (실시간 PCR)
서열번호 82: 프라이머 HXT11F (실시간 PCR)
서열번호 83: 프라이머 HXT11R (실시간 PCR)
서열번호 84: 프라이머 HXT12F (실시간 PCR)
서열번호 85: 프라이머 HXT12R (실시간 PCR)
서열번호 86: 프라이머 HXT13F (실시간 PCR)
서열번호 87: 프라이머 HXT13R (실시간 PCR)
서열번호 88: 프라이머 HXT14F (실시간 PCR)
서열번호 89: 프라이머 HXT14R (실시간 PCR)
서열번호 90: 프라이머 HXT15F (실시간 PCR)
서열번호 91: 프라이머 HXT15R (실시간 PCR)
서열번호 92: 프라이머 HXT16F (실시간 PCR)
서열번호 93: 프라이머 HXT16R (실시간 PCR)
서열번호 94: 프라이머 HXT17F (실시간 PCR)
서열번호 95: 프라이머 HXT17R (실시간 PCR)
서열번호 96: 프라이머 GAL2F (실시간 PCR)
서열번호 97: 프라이머 GAL2R (실시간 PCR)
서열번호 98: 프라이머 KOP11*(KO HXT11의 경우)
서열번호 99: 프라이머 KOT11*(KO HXT11의 경우)
서열번호 100: 프라이머 iHXT11F (역 HXT11)
서열번호 101: 프라이머 iHXT11R (역 HXT11)
서열번호 102: 프라이머 HXT11F (클로닝)
서열번호 103: 프라이머 HXT12F (클로닝)
서열번호 104: 프라이머 HXT11/12R (클로닝)
서열번호 105: 프라이머 HXT1 Xbal (클로닝)
서열번호 106: 프라이머 R HXT1 Cfr9i (클로닝)
서열번호 107: 프라이머 F HXT2 Xbai (클로닝)
서열번호 108: 프라이머 R HXT2 Cfr9i (클로닝)
서열번호 109: 프라이머 F HXT3 Xbal (클로닝)
서열번호 110: 프라이머 R HXT6 Cfr9i (클로닝)
서열번호 111: 프라이머 F HXT4 Xbal (클로닝)
서열번호 112: 프라이머 R HXT4RN Cfr9l (클로닝)
서열번호 113: 프라이머 F HXT5 Xbal (클로닝)
서열번호 114: 프라이머 R HXT5 Cfr9i (클로닝)
서열번호 115: 프라이머 F HXT7 Xbal (클로닝)
서열번호 116: 프라이머 R HXT7 Cfr9l (클로닝)
서열번호 117: 플라스미드 pRS313-P7T7
서열번호 118: 플라스미드 pRS313-P7t7-HXT11+GFP
서열번호 119: HXT11 ORF 사카로마이세스 세레비지아에의 DNA 서열
서열번호 120: HXT2 ORF 사카로마이세스 세레비지아에의 DNA 서열
서열번호 121: GAL2 ORF 사카로마이세스 세레비지아에의 DNA 서열
서열번호 122: HXT3-6 ORF 사카로마이세스 세레비지아에의 DNA 서열
서열번호 123: Hxt11p 아미노산 서열 사카로마이세스 세레비지아에
서열번호 124: Hxt2p 아미노산 서열 사카로마이세스 세레비지아에
서열번호 125: Gal2p 아미노산 서열 사카로마이세스 세레비지아에
서열번호 126: Hxt3-6 아미노산 서열 사카로마이세스 세레비지아에
서열번호 127: F HXT36 Bcui
서열번호 128: R HXT36367NNN
서열번호 129: F HXT36367NNN
서열번호 130: R HXT36 BamHi
서열번호 131: R HXT36 BamHI-정지
서열번호 132: F GFP BamHI
서열번호 133: R GFP Clal
서열번호 134: F HXT11 Xbal
서열번호 135: R HXT11 BamHI
서열번호 136: F HXT11 366NNN
서열번호 137: R HXT11 366NNN
서열번호 138: F HXT11 N366F
서열번호 139: R HXT11 N366F
서열번호 140: F HXT11 N366E
서열번호 141: R HXT11 N366E
서열번호 142: F HXT11 N366K
서열번호 143: R HXT11 N366K
서열번호 144: F HXT11 N366M
서열번호 145: R HXT11 N366M
서열번호 146: F HXT11 N366W
서열번호 147: R HXT11 N366W
서열번호 148: F HXT11 N366Y
서열번호 149: R HXT11 N366Y
본 명세서 및 첨부된 특허청구범위 전체를 통해, "포함하다" 및 "내포하다" 및 "포함하는" 및 "내포하는"과 같은 변형 단어들은 일체를 포함하는 것으로 해석되어야 한다. 즉, 이들 단어는 문맥상 허용되는 경우, 구체적으로 인용되지 않은 다른 요소들 또는 정수들의 가능한 포함을 전하고자 한다. 단수형 용어는 본 발명에서 상기 관사의 문법상 대상의 하나 또는 하나 초과(즉 하나 또는 하나 이상)를 지칭하기 위해 사용된다. 예로서, "요소"는 하나의 요소 또는 하나 초과의 요소를 의미할 수 있다.
본 발명은 투과효소 폴리펩타이드, 바람직하게는 헥소스 투과효소 폴리펩타이드, 보다 바람직하게는 효모 및 진균으로부터의 헥소스 투과효소 폴리펩타이드, 훨씬 더 바람직하게는 사카로마이세스 세레비지아에 Hxt 또는 Gal2 투과효소 폴리펩타이드에서, 상기 투과효소의 당 특이성을 변경시키도록 돌연변이시킬 수 있는 아미노산 위치들을 확인하는 방법에 관한 것이다.
본 발명은 서열번호 59의 339 또는 376번 위치에 상응하는 위치에 하나 이상의 치환을 갖는 폴리펩타이드에 관한 것이며, 여기에서 상기 폴리펩타이드는 주 촉진자 상과(MFS)의 구성원이다. 하나의 실시태양에서, 상기 치환은 376번에 상응하는 위치에 있으며 여기에서 상기 위치의 아미노산은 80 내지 138 Å3의 반데르 발스 부피 및 10 내지 100 ΔtR의 측쇄 소수성을 갖는 아미노산들(T, C, V, M, L, I, F)에 의해 치환된다.
하나의 실시태양에서, 상기 치환은 376번에 상응하는 위치에 있으며 여기에서 상기 위치의 아미노산은 80 내지 138 Å3의 반데르 발스 부피 및 40 내지 100 ΔtR의 측쇄 소수성을 갖는 아미노산(C, V, M, L, I, F)에 의해 치환된다.
하나의 실시태양에서, 상기 치환은 376번에 상응하는 위치에 있으며 여기에서 상기 위치의 아미노산은 90 내지 138 Å3의 반데르 발스 부피 및 10 내지 100 ΔtR의 측쇄 소수성을 갖는 아미노산(T, V, M, L, I, F)에 의해 치환된다.
하나의 실시태양에서, 상기 치환은 376번에 상응하는 위치에 있으며 여기에서 상기 위치의 아미노산은 100 내지 138 Å3의 반데르 발스 부피 및 60 내지 100 ΔtR의 측쇄 소수성을 갖는 아미노산(V, M, L, I, F)에 의해 치환된다.
하나의 실시태양에서, 상기 치환은 376번에 상응하는 위치에 있으며 여기에서 상기 위치의 아미노산은 100 내지 130 Å3의 반데르 발스 부피 및 60 내지 100 ΔtR의 측쇄 소수성을 갖는 아미노산(V, M, L, I)에 의해 치환된다.
하나의 실시태양에서, 상기 치환은 376번에 상응하는 위치에 있으며 여기에서 상기 위치의 아미노산은 120 내지 130 Å3의 반데르 발스 부피 및 60 내지 100 ΔtR의 측쇄 소수성을 갖는 아미노산(M, L, I)에 의해 치환된다.
하나의 실시태양에서, 상기 치환은 376번에 상응하는 위치에 있으며 여기에서 상기 위치의 아미노산은 120 내지 130 Å3의 반데르 발스 부피 및 80 내지 100 ΔtR의 측쇄 소수성을 갖는 아미노산(L, I)에 의해 치환된다.
하나의 실시태양에서, 상기 치환은 376번에 상응하는 위치에 있으며 여기에서 상기 위치의 아미노산은 100 내지 130 Å3의 반데르 발스 부피 및 60 내지 80 ΔtR의 측쇄 소수성을 갖는 아미노산(V, M)에 의해 치환된다.
하나의 실시태양에서, 상기 치환은 376번에 상응하는 위치에 있으며 여기에서 상기 위치의 아미노산은 100 내지 130 Å3의 반데르 발스 부피 및 60 내지 98 ΔtR의 측쇄 소수성을 갖는 아미노산(V, M, L)에 의해 치환된다.
하나의 실시태양에서, 상기 치환은 N376T, N376C, N376V, N376M, N376L, N376I, 또는 N376F이다.
하나의 실시태양에서, 폴리펩타이드는 339번에 상응하는 위치에서 치환을 가지며 여기에서 상기 위치의 아미노산은 -30 내지 10 ΔtR의 측쇄 소수성을 갖는 아미노산(G, S, N, Q, H, K, R)에 의해 치환된다.
하나의 실시태양에서, 폴리펩타이드는 339번에 상응하는 위치에서 치환을 가지며 여기에서 상기 위치의 아미노산은 -30 내지 10 ΔtR의 측쇄 소수성 및 60 내지 160 Å3의 반데르 발스 부피를 갖는 아미노산(S, N, Q, H, K, R)에 의해 치환된다.
하나의 실시태양에서, 폴리펩타이드는 339번에 상응하는 위치에서 치환을 가지며 여기에서 상기 위치의 아미노산은 -30 내지 10 ΔtR의 측쇄 소수성 및 80 내지 160 Å3의 반데르 발스 부피를 갖는 아미노산(N, Q, H, K, R)에 의해 치환된다.
하나의 실시태양에서, 폴리펩타이드는 339번에 상응하는 위치에서 치환을 가지며 여기에서 상기 위치의 아미노산은 -30 내지 10 ΔtR의 측쇄 소수성 및 100 내지 160 Å3의 반데르 발스 부피를 갖는 아미노산(Q, H, K, R)에 의해 치환된다.
하나의 실시태양에서, 폴리펩타이드는 339번에 상응하는 위치에서 치환을 가지며 여기에서 상기 위치의 아미노산은 -30 내지 0 ΔtR의 측쇄 소수성 및 100 내지 160 Å3의 반데르 발스 부피를 갖는 아미노산(Q, K, R)에 의해 치환된다.
하나의 실시태양에서, 폴리펩타이드는 339번에 상응하는 위치에서 치환을 가지며 여기에서 상기 위치의 아미노산은 -30 내지 0 ΔtR의 측쇄 소수성 및 120 내지 160 Å3의 반데르 발스 부피를 갖는 아미노산(K, R)에 의해 치환된다.
하나의 실시태양에서, 폴리펩타이드는 339번에 상응하는 위치에서 치환을 가지며 여기에서 상기 위치의 아미노산은 -30 내지 10 ΔtR의 측쇄 소수성 및 80 내지 120 Å3의 반데르 발스 부피를 갖는 아미노산(N, Q, H)에 의해 치환된다.
하나의 실시태양에서, 폴리펩타이드는 339번에 상응하는 위치에서 치환을 가지며 여기에서 상기 위치의 아미노산은 -30 내지 10 ΔtR의 측쇄 소수성 및 80 내지 120 Å3의 반데르 발스 부피를 갖는 아미노산(N, Q)에 의해 치환된다.
하나의 실시태양에서, 상기 치환은 M339G, M339S, M339N, M339Q, M339H, M339K, M339R, 또는 M339V이다.
하나의 실시태양에서 상기 폴리펩타이드는 339N/V 및/또는 376I/M/V에 상응하는 하나 이상의 아미노산을 갖는다.
상기 투과효소는 주 촉진자 상과(MFS)에 속한다. 이를 하기에서 정의한다. 세포 수송 시스템은 필수 영양소 및 이온의 흡수 및 대사 생성물 및 유해 물질의 배출을 허용한다. 또한, 수송 시스템은 세포와 환경과의 연통에 한 역할을 한다. 또한, 상기 시스템은 에너지-공급 분자, 예를 들어 ATP를 제공하거나 소비하는 세포 시스템의 필수 부분이다.
1차 능동 수송체에 의한 용질의 수송은 최초의 장소에서, 예를 들어 ATP 가수분해, 광자 흡수, 전자 흐름, 기질 데카복실화, 또는 메틸 이동으로부터 공급된 에너지에 의해 에너지-구동된다. 하전된 분자가 1차 세포 에너지원의 소비의 결과로서 한 방향으로 펌핑되는 경우, 전기화학 전위가 생성된다. 이어서 상기 생성된 화학삼투 구배는 2차 담체 구조(이는 단지 막을 통한 하나 이상의 분자의 수송을 촉진한다)를 통한 추가 분자의 수송을 구동하는데 사용될 수 있다.
지난 20년간 1차 및 2차 수송체의 다수의 앞서 공지되지 않은 단백질과의 존재는 게놈 전략의 출현 및 다수의 수행된 생화학 및 분자 유전학 연구의 사용에 의해 명료해졌다. 모든 살아있는 유기체 전체를 통해 단백질이 발견되는 2개의 주요 수송체 과는 ATP-결합 카세트(ABC) 상과 및 주 촉진자 상과(MFS)(또한 단독수송체-공동수송체-역수송체 과로서 공지됨)이다. ABC과 투과효소는 오직 ATP 가수분해를 통해서 에너지를 발생시킨 후에만 소분자 및 거대분자를 모두 수송할 수 있는 다수의 성분들로 이루어지는 1차 능동 수송체인 반면, 상기 MFS 수송체는 화학삼투 이온 구배에 반응하여 작은 용질의 수송을 촉진하는 2차 담체의 단일 폴리펩타이드로 이루어진다. ABC 상과 및 MFS 단백질은 미생물 게놈내에서 암호화된 용질 수송체의 거의 절반을 차지한다(문헌[Pao et al, 1998, Microbiol Mol Biol Rev.; 62 pp.1-34] 및 문헌[Saier et al, 1999, J Mol Microbiol Biotechnol, 1 pp.257-279]에 재고찰되어 있다).
적합한 투과효소 폴리펩타이드 서열은 하기의 모티프 중 하나 이상을 함유할 수 있다:
a) G-R-x(3)-G-x(3)-G-x(11)-E-x(5)-[LIVM]-R-G-x(12)-[GA];
b) R-x(14)-G-x(2)-Y-x(2)-[YF]-[YF]-[GSAL];
c) V-x(15)-[GNR]-[RH]-R-x(2)-[LM]-x(2)-[GA].
모티프(a)는 Gal2 중의 잔기 179-221에 상응하고; 모티프(b)는 Gal2 중의 잔기 330-353에 상응하며; 모티프(c)는 Gal2 중의 잔기 375-399에 상응한다.
하나의 실시태양에서 상기 폴리펩타이드는 모티프 G-R-x(3)-G-x(3)-G-x(11)-E-x(5)-[LIVM]-R-G-x(12)-[GA]를 포함한다.
특허청구된 방법은 결합된 당(당해 분야에서 제1-쉘 잔기라 칭한다)과 직접 상호작용하는 투과효소의 채널 중 아미노산 위치, 및 상기 제1 쉘 잔기와 상호작용하는 잔기(당해 분야에서 제2 쉘 잔기라 칭한다)를 확인하기 위해서 자일로스- 또는 글루코스-결합된 에스케리키아 콜라이 자일로스 투과효소 XylE(각각 PDB 데이터베이스, http://www.pdb.org에서 PDB 코드 4GBY & 4GBZ)의 공개된 결정 구조상에 상기 투과효소 폴리펩타이드 서열을 설계함을 포함한다. 상기와 같은 모델을 제작하기에 적합한 설계 소프트웨어는 YASARA, 프라임(Prime)(슈로딩거 인코포레이티드(Schrodinger Inc.) 또는 디폴트 설정을 사용하는 MODELLER이다. 한편으로, 투과효소 폴리펩타이드 서열 중 상기 당-특이성-변경 제1 및 제2 쉘 아미노산 위치를, 하기에 개시된 NEEDLE 프로토콜을 사용하여 상기 투과효소 서열과 Gal2 서열 서열번호 59와의 전체적인 짝 정렬에 의해 확인할 수 있다. 사카로마이세스 세레비지아에로부터의 Gal2 및 Hxt에 대한 예시적인 정렬을 도 10에 제공하며, 상기 도면은 상이한 효모 Hxt 중에서 상응하는 아미노산 위치를 확인하기 위해서 어떻게 정렬을 사용할 수 있는지를 도시한다. 따라서 본 발명에서 상기 아미노산 위치는 Gal2를 개시하는 서열번호 59 또는 다른 폴리펩타이드, 특히 다른 투과효소 폴리펩타이드 중의 상응하는 아미노산 위치를 지칭한다. 예를 들어 Hxt1에서 Gal2(서열번호 59) 중의 N376 위치의 상응하는 위치는 N370이고, Hxt2에서 N361, Hxt3에서 N367, Hxt4SC에서 N376, Hxt4RN에서 N376, Hxt5에서 N391, Hxt6/7에서 N370, Hxt8에서 N372, Hxt9에서 N366, Hxt10에서 N354, Hxt11에서 N366, Hxt12에서 N256, Hxt13에서 N363, Hxt14에서 N387, Hxt15에서 N366, Hxt16에서 N366 및 Hxt17에서 N363이다. 유사하게, Hxt1에서 Gal2(서열번호 9) 중의 N346의 상응하는 위치는 D340이고, Hxt2에서 N331, Hxt3에서 D337, Hxt4SC에서 D346, Hxt4RN에서 D346, Hxt5에서 D361, Hxt6/7에서 D340, Hxt8에서 D342, Hxt9에서 D336, Hxt10에서 C324, Hxt11에서 D336, Hxt12에서 D226, Hxt13에서 E333, Hxt14에서 I357, Hxt15에서 E336, Hxt16에서 E336 및 Hxt17에서 E333이다. 이는 다른 MFS 상과 수송체의 경우에도 유사하게 수행될 수 있으며, 따라서 서열번호 59 중의 위치들에 상응하는 이들 폴리펩타이드 중의 상응하는 위치들을 획득할 수 있다. 이는 실시예 6 내지 20의 데이터에 의해 지지된다.
당해 분야의 숙련가는 후속으로, 실시예 4 및 5에 개시된 바와 같이, 상기 투과효소 폴리펩타이드 중의 확인된 아미노산 위치를 모든 다른 19개 아미노산들로 돌연변이시키고, 상기 돌연변이 투과효소의 개선된 C5 당 흡수 및/또는 감소된 C6 당 흡수에 대해서 선별할 수 있다.
예를 들어, 서열번호 59의 N376에 상응하는 하나 이상의 위치에 상응하는 위치에 돌연변이를 갖는 폴리펩타이드의 경우, N376에 상응하는 위치들의 돌연변이들은 C, P, G, A, V, L, I, M, F, W, Y, H, S, T, N, Q, D, E, K, R에 의한 치환 또는 결실일 수 있다. X는 임의의 아미노산일 수 있으며, X(2)는 2개의 X를 의미한다.
본 발명에서, Gal2는 고-친화성 갈락토키나제-의존성 및 저-친화성 갈락토키나제-의존성 갈락토스 수송 과정 모두에 필요한 촉진된 확산 수송체이다. 상기는 주 촉진자 상과, 당 수송체(TC 2.A.1.1)과에 속한다. "투과효소 폴리펩타이드"는 또한 본 발명에서 "폴리펩타이드 투과효소" 또는 "폴리펩타이드"로서 표시된다. "투과효소 폴리펩타이드 폴리뉴클레오타이드"는 본 발명에서 상기 투과효소 폴리펩타이드를 암호화하는 폴리뉴클레오타이드이다.
본 발명의 하나의 실시태양에서, 상기 투과효소 폴리펩타이드는 서열번호 59와 35% 이상, 40% 이상, 45% 이상, 50% 이상, 60% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 99% 이상의 서열 일치성을 갖는다.
본 발명에서 돌연변이는 1문자 아미노산 및 이들 아미노산의 위치에 의해 나타낸다. 예를 들어 본 발명에서 A6은 서열번호 59 중의 어떤 위치의 아미노산(1문자 코드)을 가리키며, 여기에서는 단백질의 6번 위치의 A(알라닌)를 가리킨다. A6(L/N/Q/G/V/I/Y/S/E/K)는 어떤 위치에서의 아미노산의 돌연변이를 가리키며, 여기에서는 단백질의 6번 위치의 A(알라닌)가 L(류신), N(아스파라진), Q(글루타민), G(글리신), V(발린), I(아이소류신), Y(타이로신), S(세린), E(글루탐산) 및 K(리신) 중 어느 하나와 교환된다.
하나의 실시태양에서, 상기 폴리펩타이드는 자일로스 수송 활성을 갖는다.
하나의 실시태양에서, 상기 폴리펩타이드는 서열번호 59의 폴리펩타이드에 비해 감소된 글루코스 친화성을 갖는다.
본 발명의 투과효소 폴리펩타이드는 당 투과효소 활성 이외의 하나 이상의 또 다른 및/또는 추가적인 활성을 가질 수도 있다.
상기에 설명된 바와 같이, 본 발명의 투과효소 폴리펩타이드는 전형적으로 당 투과효소 활성을 가질 것이다. 그러나, 본 발명의 투과효소 폴리펩타이드는 상기 활성 외에 또는 상기 활성의 대안인 상기에 설명된 활성들 중 하나 이상을 가질 수도 있다.
폴리뉴클레오타이드 서열
본 발명에 개시된 바와 같은 투과효소 폴리펩타이드 및 그의 아미노산 서열에 대해서, 숙련가는 상기 투과효소 폴리펩타이드를 암호화하는 적합한 폴리뉴클레오타이드를 결정할 수 있다.
하나의 실시태양에서, 상기 폴리뉴클레오타이드는 서열번호 56과 35% 이상, 40% 이상, 45% 이상, 50% 이상, 60% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 99% 이상의 서열 일치성을 갖는 변형 폴리뉴클레오타이드이며 청구항 1 내지 11에 개시된 바와 같은 폴리펩타이드를 암호화한다.
따라서 본 발명은 상기 투과효소 폴리펩타이드를 암호화하는 유전자뿐만 아니라 그의 암호화 서열을 포함하는 폴리뉴클레오타이드 서열을 제공한다.
본 발명의 폴리뉴클레오타이드를 단리하거나 합성할 수 있다. 본 발명에서 상기 투과효소 폴리펩타이드 및 투과효소 폴리펩타이드 폴리뉴클레오타이드는 합성 폴리펩타이드, 각각 폴리뉴클레오타이드일 수 있다. 상기 합성 폴리뉴클레오타이드를 코돈 사용에, 바람직하게는 WO2006/077258 및/또는 PCT/EP2007/055943(이들은 본 발명에 참고로 인용된다)에 개시된 방법에 따라 최적화할 수 있다. PCT/EP2007/055943은 코돈-쌍 최적화를 다룬다.
상기 용어는 단일 가닥 또는 이중 가닥의 리보핵산(RNA) 또는 데옥시리보핵산(DNA) 분자인 폴리뉴클레오타이드 분자를 지칭한다. 폴리뉴클레오타이드는 단리된 형태로 존재하거나, 또는 재조합 핵산 분자 또는 벡터 중에 포함되거나, 또는 숙주 세포 중에 포함될 수 있다.
"폴리펩타이드"란 단어는 본 발명에서 7개 초과의 아미노산 잔기를 함유하는 쇄에 대해 사용된다. 본 발명에서 모든 올리고펩타이드 및 폴리펩타이드 식 또는 서열은 좌측에서 우측으로 및 아미노 말단에서 카복시 말단 방향으로 기입된다. 본 발명에 사용된 아미노산의 1-문자 코드는 당해 분야에 통상적으로 공지되어 있다.
"단리된" 폴리펩타이드 또는 단백질은 그의 고유 환경으로부터 제거된 폴리펩타이드 또는 단백질을 의도한다. 예를 들어, 숙주 세포에서 발현된 재조합에 의해 생성된 폴리펩타이드 및 단백질은 임의의 적합한 기법, 예를 들어 문헌[Smith and Johnson, Gene 67:31-40(1988)]에 개시된 단일-단계 정제 방법에 의해 실질적으로 정제된 고유 또는 재조합 폴리펩타이드이므로 본 발명의 목적을 위해 단리된 것으로 간주된다.
본 발명의 폴리뉴클레오타이드, 예를 들어 투과효소 폴리펩타이드를 암호화하는 폴리뉴클레오타이드를 표준 분자 생물학 기법 및 본 발명에 제공된 서열 정보를 사용하여 단리하거나 합성할 수 있다.
본 발명의 투과효소 폴리펩타이드를 암호화하는 폴리뉴클레오타이드를 표준 PCR 증폭 기법에 따라 주형 및 적합한 올리고뉴클레오타이드 프라이머로서 cDNA, mRNA 또는 한편으로, 게놈 DNA를 사용하여 증폭시킬 수 있다. 상기와 같이 증폭된 핵산을 적합한 벡터내로 클로닝하고 DNA 서열 분석에 의해 특성화할 수 있다.
형질전환
본 발명에 따른 폴리뉴클레오타이드를 적합한 숙주에서 발현시킬 수 있다. 따라서 본 발명은 형질전환된 숙주 세포에 관한 것이다. 하나의 실시태양에서, 상기 숙주 세포를 이전에 정의된 본 발명에 따른 폴리펩타이드를 암호화하는 폴리뉴클레오타이드를 포함하는 핵산 구축물로 형질전환시킬 수 있다. 따라서 표준 형질전환 기법을 사용할 수 있다.
하나의 실시태양에서 상기 형질전환된 숙주 세포는 청구항 1에 따른 폴리펩타이드를 암호화하거나 서열번호 59의 치환 F85Q/V, T89V, V187A/F, I218S, T219A, Q341S/A, N346V, T380A, F444L/V , T448A, T449F, T451G 또는 W455M을 갖는 폴리펩타이드를 암호화하는 이종 뉴클레오타이드를 포함하며, 그의 하나의 실시태양에서, 상기 숙주 세포는 사카로마이세스 세레비지아에이다.
하나의 실시태양에서 상기 형질전환된 숙주를 형질전환되지 않은 숙주 세포에 고유한 폴리펩타이드의 돌연변이체인 폴리펩타이드를 암호화하는 폴리뉴클레오타이드로 형질전환시킨다.
하나의 실시태양에서 상기 형질전환되지 않은 숙주 세포에 고유한 폴리펩타이드는 주 촉진자 상과(MFS) 수송체의 구성원이며, 하나의 실시태양에서 헥소스 수송체 폴리펩타이드이다.
하나의 실시태양에서 상기 형질전환되지 않은 숙주 세포에 고유한 폴리펩타이드는 Gal2, Hxt1 , Hxt2, Hxt3, Hxt4, Hxt5, Hxt6, Hxt7, Hxt8, Hxt9, Hxt10, Hxt11 , Hxt12, Hxt13, Hxt14, Hxt15, Hxt16 및 Hxt17로 이루어지는 군 중에서 선택된 수송체 폴리펩타이드이다.
하나의 실시태양에서, 본 발명의 폴리펩타이드는 주어진 위치 A(A는 서열번호 59의 폴리펩타이드 중의 임의의 특정한 위치일 수 있으며, 이때 X는 상기 X가 제2 MFS과 폴리펩타이드 중의 상응하는 위치 A에 고유한 경우 서열번호 59의 돌연변이이다)에서 아미노산 잔기 X(X는 임의의 아미노산일 수 있다)를 갖지 않는다.
하나의 실시태양에서, 상기 폴리펩타이드는 서열번호 59에서 M339S에 상응하는 아미노산 잔기 S를 갖지 않으며, HXT1 중의(즉 HXT1 중의 333S는 아니다), HXT2 중의(즉 HXT2 중의 324S는 아니다), HXT3 중의(즉 HXT3 중의 330S는 아니다), HXT4 중의(즉 HXT4 중의 339S는 아니다), HXT5 중의(즉 HXT5 중의 354S는 아니다), HXT6 또는 HXT7 중의(즉 HXT6 또는 HXT7 중의 333S는 아니다), HXT8 중의(즉 HXT8 중의 335S는 아니다), HXT9 중의(즉 HXT9 중의 329S는 아니다), HXT10 중의(즉 HXT10 중의 317S는 아니다) 또는 HXT11 중의(즉 HXT11 중의 329S는 아니다) 상응하는 위치에 아미노산 잔기 S를 갖지 않는다.
하나의 실시태양에서, 상기 폴리펩타이드는 돌연변이체 HXT3-6이며 HXT3-6 중에 하나 이상의 치환을 갖는다. 그의 하나의 실시태양에서, 상기 폴리펩타이드는 서열번호 126의 N367A/C/D/F/G/I/L/M/S/T/V에 상응하는 치환을 갖는다. 하나의 실시태양에서, 상기 폴리펩타이드는 서열번호 126의 N367A/I에 상응하는 치환을 갖는다. 하나의 실시태양에서, 상기 폴리펩타이드는 서열번호 126의 N367A에 상응하는 치환을 갖는다.
하나의 실시태양에서, 상기 폴리펩타이드는 돌연변이체 HXT11이며 HXT11 중에 하나 이상의 치환을 갖는다. 그의 하나의 실시태양에서, 상기 폴리펩타이드는 서열번호 123의 N366A/C/D/F/G/I/L/M/S/T/V에 상응하는 치환을 갖는다. 하나의 실시태양에서, 상기 폴리펩타이드는 돌연변이체 HXT11을 갖는다. 하나의 실시태양에서 상기 폴리펩타이드는 서열번호 123의 N366/F/I/L/M/T/V에 상응하는 치환을 갖는다. 하나의 실시태양에서, 상기 폴리펩타이드는 서열번호 123의 N366D/M/T에 상응하는 치환을 갖는다. 하나의 실시태양에서, 상기 폴리펩타이드는 서열번호 123의 N366M/T에 상응하는 치환을 갖는다. 하나의 실시태양에서, 상기 폴리펩타이드는 서열번호 123의 N366M/T 또는 N366T에 상응하는 치환을 갖는다.
동시-소비
하나의 실시태양에서 상기 형질전환된 숙주는 글루코스 및 하나 이상의 펜토스를 동시-소비할 수 있다. 상기 펜토스는 아라비노스 또는 자일로스일 수 있으며, 하나의 실시태양에서 상기 펜토스는 자일로스이다. 2개 기질의 동시-소비(또는 동시-발효)는 본 발명에서 2개의 상이한 탄소원(예를 들어 자일로스 및 글루코스)의 인식할 수 있는 수준의 동시적인 흡수 및 세포내 전환으로서 정의된다. 상기 탄소원은 동시에 생성물, 예를 들어 바이오매스, 에탄올, 글리세롤 등으로 전환된다.
세포의 동시-소비를 본 발명에서 정량분석하고 동시-소비 지수로서 나타낸다. 본 발명에서 상기 동시-소비 지수는 글루코스 및 자일로스에 대한 동시-소비 지수이며 1.0 g/ℓ 건조 효모 피치, 30 ℃ 온도에서 혐기성 배치 배양 발효에서 시간 단위당 소비된 당의 그램으로서 나타내는, 글루코스 흡수율(Qg) 및 자일로스 흡수율(Qx)의 절대 차이의 0 내지 24시간의 시간 간격에 걸친(0, 8, 12, 14, 16, 18, 20, 22 및 24시간째에 측정된) 합으로서 계산되며, 여기에서 상기 발효 배지는 상기 발효의 출발시 리터당 71.8 그램의 글루코스 및 리터당 40.0 그램의 자일로스를 함유한다. 실시예 16 내지 18을 참조하시오.
하나의 실시태양에서, 상기 형질전환된 숙주 세포의 동시-소비 지수는 27 g/h 이하, 25 g/h 이하, 23 g/h 이하, 20 g/h 이하, 18 g/h 이하, 16 g/h 이하, 14 g/h 이하, 또는 12 g/h 이하이다.
본 발명은 또한 앞서 개시된 바와 같은 폴리뉴클레오타이드를 포함하는 핵산 구축물, 예를 들어 벡터에 관한 것이다.
따라서 본 발명의 또 다른 태양은 투과효소 폴리펩타이드 단백질 또는 그의 기능성 등가물을 암호화하는 본 발명의 폴리뉴클레오타이드를 포함하는, 클로닝 및 발현 벡터를 포함한 벡터, 및 예를 들어 본 발명의 투과효소의 발현이 발생하는 조건하에서 적합한 숙주 세포에서 상기와 같은 벡터의 생육, 형질전환 또는 형질감염 방법에 관한 것이다. 본 발명에 사용되는 바와 같이, "벡터"란 용어는 관련된 또 다른 핵산을 수송할 수 있는 핵산 분자를 지칭한다.
본 발명의 폴리뉴클레오타이드를 재조합 복제성 벡터, 예를 들어 클로닝 또는 발현 벡터에 통합시킬 수 있다. 상기 벡터를 사용하여 적합한 숙주 세포에서 상기 핵산을 복제시킬 수 있다. 따라서 추가의 실시태양에서 본 발명은 본 발명의 폴리뉴클레오타이드를 복제성 벡터에 도입시키고, 상기 벡터를 적합한 숙주 세포에 도입시키고 상기 숙주 세포를 상기 벡터의 복제가 일어나는 조건하에서 생육시킴으로써 본 발명의 폴리뉴클레오타이드를 제조하는 방법을 제공한다. 상기 벡터를 상기 숙주 세포로부터 회수할 수도 있다. 적합한 숙주 세포를 하기에 개시한다.
당해 분야의 숙련가들은 상기 발현 벡터의 디자인이 형질전환시킬 숙주 세포의 선택, 목적하는 단백질의 발현 수준 등과 같은 인자에 따라 변할 수 있음을 알 것이다. 본 발명의 벡터, 예를 들어 발현 벡터를 숙주 세포에 도입시키고, 이에 의해 본 발명에 개시된 바와 같은 핵산에 의해 암호화된 단백질 또는 펩타이드를 생성시킬 수 있다. 본 발명의 벡터, 예를 들어 재조합 발현 벡터를 원핵생물 또는 진핵생물 세포에서 투과효소 폴리펩타이드 단백질의 발현을 위해 디자인할 수 있다.
예를 들어, 투과효소 폴리펩타이드를 세균 세포, 예를 들어 에스케리키아 콜라이, 곤충 세포(바큘로바이러스 발현 벡터 사용), 섬유상 진균, 효모 세포 또는 포유동물 세포에서 발현시킬 수 있다. 적합한 숙주 세포는 문헌[Goeddel, Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, CA (1990)]에 추가로 논의되어 있다. 적합한 숙주의 전형적인 예들은 본 발명에서 이후에 개시한다.
상술한 숙주 세포에 적합한 배양 배지 및 조건들은 당해 분야에 공지되어 있다.
대부분의 섬유상 진균 및 효모의 경우, 상기 벡터 또는 발현 구축물을 바람직하게는, 안정한 형질전환체를 수득하기 위해서 상기 숙주 세포의 게놈에 편입시킨다. 그러나, 몇몇 효모의 경우 안정하고 높은 수준의 발현을 위해 상기 발현 구축물을 통합시킬 수 있는 적합한 에피솜 벡터를 입수할 수 있으며, 이들의 예는 각각 사카로마이세스 및 클루이베로마이세스(Kluyveromyces)의 2 μ 및 pKD1 플라스미드로부터 유래된 벡터, 또는 AMA 서열(예를 들어 아스퍼질러스(Aspergillus)로부터의 AMA1)을 함유하는 벡터를 포함한다. 상기 발현 구축물을 숙주 세포 게놈내에 편입시키는 경우에, 상기 구축물을 상기 게놈 중의 무작위 자리(loci)에, 또는 동종 재조합을 사용하여 소정의 표적 자리(이 경우 상기 표적 자리는 바람직하게는 고도로 발현된 유전자를 포함한다)에 편입시킨다.
따라서, 본 발명에 유용한 발현 벡터는 염색체-, 에피솜- 및 바이러스-유래된 벡터, 예를 들어 세균 플라스미드, 박테리오파지, 효모 에피솜, 효모 염색체 요소, 바이러스, 예를 들어 바큘로바이러스, 파포바 바이러스, 우두 바이러스, 아데노바이러스, 계두 바이러스, 가성광견병바이러스 및 레트로바이러스로부터 유래된 벡터, 및 이들의 조합으로부터 유래된 벡터, 예를 들어 플라스미드와 박테리오파지 유전자 요소로부터 유래된 벡터, 예를 들어 코스미드 및 파지미드를 포함한다.
본 발명에 따른 폴리펩타이드를 상기 숙주 세포에서 배양 배지내로 분비시켜야 하는 경우, 상기 드노보 합성된 폴리펩타이드를 상기 숙주 세포의 분비 경로로 향하게 하기 위해서 적합한 신호 서열을 상기 폴리펩타이드에 가할 수 있다. 당해 분야의 숙련가는 특정한 숙주에 적합한 신호 서열을 선택하는 방법을 안다.
상기 벡터는 진핵생물 게놈 서열 또는 바이러스 게놈 서열에 상동성인 서열을 포함하는 RNA를 생성시키는 폴리뉴클레오타이드에 인접한 서열들을 추가로 포함할 수 있다. 이는 본 발명의 폴리뉴클레오타이드의 숙주 세포 게놈내로의 도입을 허용할 것이다.
편입형 클로닝 벡터는 상기 벡터가 편입되는 숙주 세포의 염색체(들) 중의 소정의 표적 자리에 또는 무작위로 편입될 수 있다.
상기 벡터 시스템은 단일 벡터, 예를 들어 단일 플라스미드, 또는 2개 이상의 벡터, 예를 들어 상기 숙주 세포의 게놈내로 도입되는 전체 DNA를 함께 함유하는 2개 이상의 플라스미드일 수 있다.
상기 벡터는 안티센스 방향으로 배향된 본 발명의 폴리뉴클레오타이드를 함유하여 안티센스 RNA의 생성을 제공할 수 있다.
벡터 DNA를 통상적인 형질전환 또는 형질감염 기법을 통해 원핵생물 또는 진핵생물 세포내에 도입시킬 수 있다. 본 발명에 사용되는 바와 같이, "형질전환" 및 "형질감염"이란 용어들은 외래 핵산(예를 들어 DNA)를 숙주 세포에 도입시키기 위한 다양한 당해분야-인정된 기법들, 예를 들어 칼슘 포스페이트 또는 칼슘 클로라이드 공-침전, DEAE-덱스트란-매개된 형질감염, 형질도입, 감염, 리포펙션, 양이온성 지질매개된 형질감염 또는 일렉트로포레이션을 지칭하고자 한다. 적합한 숙주 세포의 형질전환 또는 형질감염 방법들을 문헌[Sambrook, et al. (Molecular Cloning: A Laboratory Manual, 2nd, ed. Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989)], 문헌[Davis et al., Basic Methods in Molecular Biology (1986)] 및 다른 실험 매뉴얼들에서 찾을 수 있다.
앞서 나타낸 바와 같이, 본 발명은 청구항 1에 나타낸 돌연변이와 함께 서열번호 59에 따른 아미노산 서열을 갖는 단리된 폴리펩타이드를 제공한다.
본 발명에 따른 투과효소 폴리펩타이드를 당해 분야에 공지된 방법들에 의해서 재조합 세포 배양물로부터 회수하고 정제할 수 있다. 보다 바람직하게, 고성능 액체 크로마토그래피("HPLC")를 정제에 사용한다.
본 발명의 폴리펩타이드는 자연적으로 정제된 생성물, 화학 합성 과정의 생성물, 및 원핵생물 또는 진핵생물 숙주, 예를 들어 세균, 효모, 고등 식물, 곤충 및 포유동물 세포로부터 재조합 기법에 의해 생성된 생성물을 포함한다. 재조합 생성 과정에 사용된 숙주에 따라, 본 발명의 폴리펩타이드는 글리코실화되거나 글리코실화되지 않을 수도 있다. 또한, 본 발명의 폴리펩타이드는, 일부의 경우에 숙주-매개된 과정의 결과로서 초기 변형된 메티오닌 잔기를 또한 포함할 수 있다.
본 발명은 또한 본 발명에 따른 폴리펩타이드의 생물학적으로 활성인 단편을 특징으로 한다.
또한 본 발명의 폴리뉴클레오타이드 또는 벡터를 포함하는 숙주 세포를 제공한다. 상기 폴리뉴클레오타이드는 상기 숙주 세포의 게놈에 이종일 수 있다. 대개 상기 숙주 세포에 관하여 "이종"이란 용어는 상기 폴리뉴클레오타이드가 상기 숙주 세포의 게놈에서 천연으로 존재하지 않거나 또는 상기 폴리펩타이드가 상기 세포에 의해 천연으로 생성되지 않음을 의미한다.
또 다른 실시태양에서, 본 발명은 본 발명에 의해 포함되는 핵산을 함유하는 세포, 예를 들어 형질전환된 숙주 세포 또는 재조합 숙주 세포를 특징으로 한다. "형질전환된 세포" 또는 "재조합 세포"는 재조합 DNA 기법에 의해 본 발명에 따른 핵산이 도입된 세포(또는 그의 선조)이다. 원핵생물 및 진핵생물 세포 모두, 예를 들어 세균, 진균, 효모 등이 포함되며, 예를 들어 사카로마이세스, 예를 들어 사카로마이세스 세레비지아에를 포함하는 효모 세포가 특히 바람직하다.
삽입된 서열의 발현을 조절하거나, 유전자 생성물을 특정의 목적하는 방식으로 변형 및 처리하는 숙주 세포를 선택할 수 있다. 단백질 생성물의 상기와 같은 변형(예를 들어 글리코실화) 및 처리(예를 들어 절단)는 상기 단백질의 최적의 기능을 촉진할 수 있다.
다양한 숙주 세포들은 단백질 및 유전자 생성물의 번역-후 처리 및 변형에 대한 특징적이고 특이적인 기전들을 갖는다. 분자 생물학 및/또는 미생물학 분야의 숙련가들에게 친숙한 적합한 세포주 또는 숙주 시스템들을, 발현된 외래 단백질의 목적하는 및 올바른 변형 및 처리를 보장하도록 선택할 수 있다. 이를 위해서, 1차 전사물의 적합한 처리, 유전자 생성물의 글리코실화 및 인산화를 위한 세포 기구를 갖는 진핵생물 숙주 세포를 사용할 수 있다. 상기와 같은 숙주 세포는 당해 분야에 널리 공지되어 있다.
경우에 따라, 상술한 바와 같은 세포를 본 발명에 따른 폴리펩타이드의 제조에 사용할 수 있다. 상기와 같은 방법은 전형적으로 숙주 세포(예를 들어 상술한 바와 같은 발현 벡터로 형질전환되거나 형질감염된)를 상기 폴리펩타이드를 암호화하는 암호화 서열의 발현(상기 벡터에 의한)을 제공하는 조건하에서 배양하고, 상기 발현된 폴리펩타이드를 임의로 회수함을 포함한다. 본 발명의 폴리뉴클레오타이드를 재조합 복제성 벡터, 예를 들어 발현 벡터에 통합시킬 수 있다. 상기 벡터를 사용하여 상기 핵산을 적합한 숙주 세포에서 복제시킬 수 있다. 따라서 추가의 실시태양에서, 본 발명은 본 발명의 폴리뉴클레오타이드를 복제성 벡터에 도입시키고, 상기 벡터를 적합한 숙주 세포에 도입시키고, 상기 숙주 세포를 상기 벡터의 복제가 일어나는 조건하에서 생육시킴으로써 본 발명의 폴리뉴클레오타이드를 제조하는 방법을 제공한다. 상기 벡터를 상기 숙주 세포로부터 회수할 수도 있다.
상기 벡터를 상술한 바와 같은 적합한 숙주 세포내로 형질전환시키거나 형질감염시켜 본 발명의 폴리펩타이드의 발현을 제공할 수 있다. 이러한 과정은 상술한 바와 같은 발현 벡터로 형질전환된 숙주 세포를, 상기 폴리펩타이드를 암호화하는 암호화 서열의 벡터에 의한 발현을 제공하는 조건하에서 배양시킴을 포함할 수 있다.
본 발명에서 표준 단리, 하이브리드화, 형질전환 및 클로닝 기법들이 사용된다(예를 들어 문헌[Sambrook, J., Fritsh, E. F., and Maniatis, T. Molecular Cloning: A Laboratory Manual.2nd, ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989]에 개시된 바와 같은 기법들).
상동성 및 일치성
아미노산 또는 뉴클레오타이드 서열은 일정 수준의 유사성을 나타낼 때 상동성이라 말한다. 상동성인 2개의 서열은 공통의 진화 기원을 가리킨다. 2개의 상동성 서열이 밀접하게 관련되거나 또는 보다 멀리 관련되는 지의 여부는, 각각 높거나 낮은 "일치성 퍼센트" 또는 "유사성 퍼센트"에 의해 지시된다. 논쟁 중이긴 하지만, "일치성 퍼센트" 또는 "유사성 퍼센트", "상동성의 수준" 또는 "상동성 퍼센트"는 흔히 호환적으로 사용된다.
2개 서열간의 서열의 비교 및 일치성 퍼센트의 측정을 수학적 연산을 사용하여 수행할 수 있다. 숙련가는 다수의 상이한 컴퓨터 프로그램들을 2개 서열의 정렬 및 2개 서열간의 상동성 측정에 이용할 수 있음을 알 것이다(문헌[Kruskal, J. B. (1983) An overview of sequence comparison In D. Sankoff and J. B. Kruskal, (ed.), Time warps, string edits and macromolecules: the theory and practice of sequence comparison, pp. 1-44 Addison Wesley]). 2개 아미노산 서열간의 일치성 퍼센트를 2개 서열의 정렬에 대한 니들맨과 분취(Needleman and Wunsch) 연산을 사용하여 측정할 수 있다(문헌[Needleman, S. B. and Wunsch, C. D. (1970) J. Mol. Biol. 48, 443-453]). 상기 연산은 아미노산 서열뿐만 아니라 뉴클레오타이드 서열을 정렬시킨다. 상기 니들맨-분취 연산은 컴퓨터 프로그램 NEEDLE로 실행되었다. 본 발명의 목적을 위해서 EMBOSS 패키지로부터의 NEEDLE 프로그램을 사용하였다(버전 2.8.0 이상, EMBOSS: The European Molecular Biology Open Software Suite (2000) Rice, P. Longden, I. and Bleasby, A. Trends in Genetics 16, (6) pp276-277, http://emboss.bioinformatics.nl/). 단백질 서열의 경우, 치환 매트릭스를 위해서 EBLOSUM62가 사용된다. 뉴클레오타이드 서열의 경우, EDNAFULL이 사용된다. 다른 매트릭스들을 명시할 수 있다. 아미노산 서열의 정렬에 사용되는 임의의 매개변수들은 10의 끊김 벌점 및 0.5의 끊김 확장 벌점이다. 숙련가는 이러한 상이한 매개변수들 모두 약간의 상이한 결과를 제공할 것이나, 2개 서열의 전체 일치성 백분율은 상이한 연산을 사용할 때 그다지 변경되지 않음을 알 것이다.
전체적인 상동성 정의
상동성 또는 일치성은 임의의 끊김 또는 확장을 포함한 전체 정렬된 영역에 걸쳐 2개의 전체 서열간의 일치성 합치의 백분율이다. 상기 2개의 정렬된 서열간의 상동성 또는 일치성을 하기와 같이 계산한다: 상기 두 서열 중 일치하는 아미노산을 나타내는 정렬 중 상응하는 위치의 수를, 끊김을 포함한 상기 정렬의 전체 길이로 나눈다. 본 발명에서와 같이 정의된 일치성을 NEEDLE로부터 획득할 수 있으며 이를 "IDENTITY"로서 프로그램의 출력에 표지한다.
최장 일치성 정의
상기 2개의 정렬된 서열간의 상동성 또는 일치성을 하기와 같이 계산한다: 상기 두 서열 중 일치하는 아미노산을 나타내는 정렬 중 상응하는 위치의 수를, 상기 정렬 중 총 끊김 수의 공제 후에 상기 정렬의 전체 길이로 나눈다. 본 발명에서와 같이 정의된 일치성을 NOBRIEF 옵션을 사용하여 NEEDLE로부터 획득할 수 있으며 이를 "최장-일치성"으로서 프로그램의 출력에 표지한다.
본 발명에 개시된 본 발명의 다양한 실시태양들을 교차 조합할 수 있다.
당 조성물
본 발명에 따른 당 조성물은 글루코스, 아라비노스 및 자일로스를 포함한다. 상기 기준을 충족시키는 임의의 당 조성물을 본 발명에 사용할 수 있다. 상기 당 조성물 중의 임의의 당은 갈락토스 및 만노스이다. 바람직한 실시태양에서, 상기 당 조성물은 하나 이상의 리그노셀룰로스 물질의 가수분해산물이다. 본 발명에서 리그노셀룰로스는 바이오매스의 헤미셀룰로스 및 헤미셀룰로스 부분들을 포함한다. 또한 리그노셀룰로스는 바이오매스의 리그노셀룰로스 분획들을 포함한다. 적합한 리그노셀룰로스 물질을 하기의 목록에서 찾을 수 있다: 과수원 토엽, 수풀, 분쇄 폐기물, 도심 목재 폐기물, 도시 폐기물, 벌목 폐기물, 삼림 간벌, 단벌기 목재 작물, 산업 폐기물, 밀짚, 귀리짚, 볏짚, 보리짚, 호밀짚, 아마짚, 콩껍질, 왕겨, 옥수수 글루텐 사료, 귀리 껍질, 사탕수수, 옥수수대, 옥수수 줄기, 옥수수 속대, 옥수수 껍질, 스위치 그래스, 억새, 단수수, 캐놀라 줄기, 대두 줄기, 대초원 목초, 가마그래스, 강아지풀; 사탕무 펄프, 시트러스 열매 펄프, 종자 껍질, 셀룰로스 동물 폐기물, 잔디 부스러기, 목화, 해초, 나무, 연재, 경재, 포퓰러, 소나무, 관목, 목초, 밀, 밀짚, 사탕수수 버개스, 옥수수, 옥수수 껍질, 옥수수 기둥, 옥수수 속, 곡류의 습식 또는 건식 분쇄로부터의 속, 생성물 및 부산물로부터의 섬유, 도시 고형 폐기물, 폐지, 재활용 폐기물, 초본 물질, 농사 잔류물, 삼림 잔류물, 도시 고형 폐기물, 폐지, 펄프, 종이 분쇄 잔류물, 가지, 관목, 줄기, 옥수수, 옥수수 껍질, 에너지 작물, 삼림, 열매, 꽃, 곡류, 목초, 초본 작물, 잎, 껍질, 침상 잎, 통나무, 뿌리, 묘목, 관목, 스위치 그래스, 나무, 채소, 과일껍질, 덩굴, 사탕무 펄프, 밀 분쇄물, 귀리 껍질, 경재 또는 연재, 농사 과정으로부터 발생한 유기 폐물질, 삼림 목재 폐기물, 또는 이들 중 임의의 2개 이상의 조합.
리그노셀룰로스로부터 유래된 일부 적합한 당 조성물 및 그의 가수분해산물의 당 조성물의 개관을 표 1에 제공한다. 나열된 리그노셀룰로스는 옥수수 속, 옥수수 섬유, 왕겨, 멜론 껍질, 사탕무 펄프, 밀짚, 사탕수수 버개스, 목재, 목초 및 올리프 압착물을 포함한다.
[표 1]
리그노셀룰로스 물질로부터의 당 조성물의 개관
Gal = 갈락토스, Xyl = 자일로스, Ara = 아라비노스, Man = 만노스, Glu = 글루코스, Rham = 람노스. 갈락토스 백분율(% Gal) 및 문헌 출처를 제공한다.
Figure pct00001
표 1로부터, 상기 리그노셀룰로스 중에 다량의 당이 글루코스, 자일로스, 아라비노스 및 갈락토스의 형태로 존재함이 분명하다. 따라서 글루코스, 자일로스, 아라비노스 및 갈락토스의 발효 산물로의 전환은 경제적으로 대단히 중요하다. 또한 만노스가 일부 리그노셀룰로스 물질 중에, 대개는 앞서 언급된 당들보다 적은 양으로 존재한다. 따라서 유리하게는 만노스도 또한 상기 형질전환된 숙주 세포에 의해 전환된다.
형질전환된 숙주 세포
하나의 실시태양에서, 상기 형질전환된 숙주 세포는 자일로스 아이소머라제 유전자의 하나 이상의 사본 및/또는 자일로스 리덕타제 및/또는 자일리톨 데하이드로게나제의 하나 이상의 사본, 및 araA , araBaraD 유전자의 2 내지 10개의 사본을 포함할 수 있으며, 여기에서 이들 유전자는 세포 게놈내로 편입된다.
하나의 실시태양에서, 상기 형질전환된 숙주 세포는 유전자, 예를 들어 상기 자일로스 아이소머라제 유전자 및/또는 자일로스 리덕타제 및/또는 자일리톨 데하이드로게나제의 하나 이상의 사본, 및 araA , araBaraD 유전자의 2 내지 10개의 사본을 포함할 수 있으며, 상기 형질전환된 숙주 세포 게놈내로 편입된다.
상기 사본수는 숙련가에 의해 임의의 공지된 방법으로 측정될 수 있다. 실시예에 적합한 방법이 개시되어 있다.
하나의 실시태양에서, 상기 형질전환된 숙주 세포는 글루코스, 아라비노스, 자일로스 및 갈락토스를 발효시킬 수 있다.
하나의 실시태양에서, 상기 세포는 이용 가능한 90% 이상의 글루코스, 자일로스, 아라비노스, 갈락토스 및 만노스를 발효 산물로 전환시킬 수 있다. 하나의 실시태양에서, 세포는 이용 가능한 모든 글루코스, 자일로스, 아라비노스, 갈락토스 및 만노스의 91% 이상, 92% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상 또는 100%를 발효 산물로 전환시킬 수 있다.
본 발명의 하나의 실시태양에서 상기 형질전환된 숙주 세포는 하나 이상의 추가적인 당, 바람직하게는 C5 및/또는 C6 당, 예를 들어 만노스를 발효시킬 수 있다. 본 발명의 하나의 실시태양에서 상기 형질전환된 숙주 세포는 xylA-유전자, XYL1 유전자 및 XYL2 유전자 및/또는 XKS1-유전자 중 하나 이상을 포함하여 상기 형질전환된 숙주 세포가 자일로스를 발현하게 하고; 알도스 리덕타제(GRE3) 유전자의 결실; PPP-유전자 TAL1 , TKL1 , RPE1RKI1의 과발현을 허용하여 상기 세포에서 펜토스 포스페이트 경로를 통한 유출의 증가를 허용한다.
하나의 실시태양에서, 상기 형질전환된 숙주 세포는 산업용 세포, 보다 바람직하게는 산업용 효모이다. 산업용 세포 및 산업용 효모 세포는 하기와 같이 정의될 수 있다. 산업적인 공정에서 (효모) 세포의 살아있는 환경은 실험실에서의 경우와 현저하게 상이하다. 산업용 효모 세포는 상기 공정 동안 변할 수 있는 다수의 환경 조건하에서 잘 수행할 수 있어야 한다. 상기와 같은 변화는 사카로마이세스 세레비지아에의 세포 생육 및 에탄올 생산에 함께 잠재적인 영향을 미치는 영양 공급원, pH, 에탄올 농도, 온도, 산소 농도 등의 변화를 포함한다. 불리한 산업 조건하에서, 상기 환경 내성 균주는 확고한 생육 및 생산을 허용해야 한다. 산업용 효모 균주는 일반적으로 상기 균주가 사용되는 용도, 예를 들어 베이킹 산업, 양조 산업, 와인 제조 및 에탄올 산업에서 존재할 수 있는 환경 조건에서의 상기 변화에 대해 더 확고하다. 하나의 실시태양에서, 상기 산업용 형질전환된 숙주 세포를 산업용 숙주 세포를 토대로 제조하며, 여기에서 상기 제조는 본 발명에서 이후에 개시하는 바와 같이 수행된다. 산업용 효모(사카로마이세스 세레비지아에)의 예는 에탄올 레드(Red)(등록상표)(페르멘티스(Fermentis)) 페르미올(Fermiol)(등록상표)(DSM) 및 써모삭(Thermosacc)(등록상표)(랄레맨드(Lallemand))이다.
하나의 실시태양에서 상기 형질전환된 숙주 세포는 억제제 내성이다. 억제제 내성은 억제 화합물에 대한 내성이다. 리그노셀룰로스 중의 억제 화합물의 존재 및 수준은 공급원료의 변화, 전처리 방법 가수분해 공정에 따라 광범위하게 변할 수 있다. 억제제의 범주의 예는 카복실산, 퓨란 및/또는 페놀 화합물이다. 카복실산의 예는 락트산, 아세트산 또는 폼산이다. 퓨란의 예는 푸르푸랄 및 하이드록시-메틸푸르푸랄이다. 페놀 화합물의 예는 바닐린, 시링산, 페룰산 및 쿠마르산이다. 억제제의 전형적인 양은 카복실산의 경우: 공급원료, 전처리 및 가수분해 조건에 따라 리터당 수 그램, 리터당 20 그램 이하, 또는 그 이상이다. 퓨란의 경우: 공급원료, 전처리 및 가수분해 조건에 따라 리터당 수백 밀리그램 내지 리터당 수 그램이다.
페놀 화합물의 경우: 공급원료, 전처리 및 가수분해 조건에 따라 리터당 수십 밀리그램 내지 리터당 1 그램이다.
본 발명에 따른 형질전환된 숙주 세포는 억제제 내성일 수 있다, 즉 상기 세포는 상기 세포가 전형적으로 통상적인 전처리 및 가수분해 조건과 함께 있는 수준에서 통상적인 억제제를 견딜 수 있으며, 따라서 상기 형질전환된 숙주 세포는 광범위한 용도를 찾을 수 있다, 즉 상기 세포는 상이한 공급원료, 상이한 전처리 방법 및 상이한 가수분해 조건에 대해 높은 적응성을 갖는다.
하나의 실시태양에서, 상기 산업용 형질전환된 숙주 세포를 억제제 내성 숙주 세포를 토대로 제조하며, 여기에서 상기 제조를 본 발명에서 이후에 개시하는 바와 같이 수행한다. 억제제 내성 숙주 세포를, 문헌[Kadar et al, Appl. Biochem. Biotechnol. (2007), Vol. 136-140, 847-858](여기에서 억제제 내성 사카로마이세스 세레비지아에 균주 ATCC 26602가 선택되었다)에 예시된 바와 같은 억제제 함유 물질상에서 생육에 대해 선별함으로써 선택할 수 있다.
하나의 실시태양에서, 상기 형질전환된 숙주 세포는 마커가 없다. 본 발명에 사용되는 바와 같이, "마커"란 용어는 상기 마커를 함유하는 숙주 세포의 선택 또는 선별을 허용하는 특성 또는 표현형을 암호화하는 유전자를 지칭한다. 마커가 없음은 마커가 상기 형질전환된 숙주 세포 중에 필수적으로 존재하지 않음을 의미한다. 마커가 없음은 항생제 마커가 상기 형질전환된 숙주 세포의 제조에 사용되었고 그 후에 제거되는 경우 특히 유리하다. 마커의 제거를 임의의 적합한 종래 기술 기법, 예를 들어 세포내 재조합을 사용하여 수행할 수 있다. 적합한 마커 제거 방법은 실시예에 예시되어 있다.
형질전환된 숙주 세포는 식물 바이오매스, 셀룰로스, 헤미셀룰로스, 펙틴, 전분, 전분 유도체를 예를 들어 발효성 당으로 전환시킬 수 있다. 따라서, 형질전환된 숙주 세포는 하나 이상의 효소, 예를 들어 셀룰로스를 글루코스 단량체로, 및 헤미셀룰로스를 자일로스 및 아라비노스 단량체로 전환시키는데 필요한 셀룰라제(엔도셀룰라제 또는 엑소셀룰라제), 헤미셀룰라제(엔도- 또는 엑소-자일라나제 또는 아라비나제), 펙틴을 글루쿠론산 및 갈락튜론산으로 전환시킬 수 있는 펙티나제, 또는 전분을 글루코스 단량체로 전환시킬 수 있는 아밀라제를 발현할 수 있다.
상기 형질전환된 숙주 세포는 피루베이트를 목적하는 발효 산물, 예를 들어 에탄올, 부탄올, 락트산, 다이-터펜, 글리코실화된 다이-터펜, 3-하이드록시-프로피온산, 아크릴산, 아세트산, 숙신산, 시트르산, 퓨마르산, 말산, 이타콘산, 아미노산, 1,3-프로판-다이올, 에틸렌, 글리세롤, β-락탐 항생제 또는 세팔로스포린으로 전환시키기 위해 필요한 효소 활성을 추가로 포함할 수 있다.
하나의 실시태양에서, 상기 형질전환된 숙주 세포는 천연으로 알콜 발효, 바람직하게 혐기성 알콜 발효를 할 수 있는 세포이다. 형질전환된 숙주 세포는 바람직하게는 에탄올에 대한 높은 내성, 낮은 pH(즉 약 5, 약 4, 약 3 또는 약 2.5 미만의 pH에서 생육할 수 있는) 및 유기물에 대한 높은 내성 및/또는 승온에 대한 높은 내성을 갖는다.
형질전환된 숙주 세포의 상기 특성들 또는 활성들 중 어느 하나는 상기 세포 중에 천연으로 존재하거나 또는 유전자 변형에 의해 도입되거나 변형될 수 있다.
형질전환된 숙주 세포의 제조
하나의 실시태양에 따라, 상기 유전자들을, 숙주 세포에의
a) 강한 구성 프로모터의 조절하에서 유전자 araA , araBaraD로 이루어지는 클러스터;
b) 임의로 강한 구성 프로모터의 조절; 및 알도스 리덕타제 유전자의 결실하에서 PPP-유전자 TAL1, TKL1, RPE1RKI1으로 이루어지는 클러스터;
c) 강한 구성 프로모터의 조절하에서 xylA-유전자 및 XKS1-유전자로 이루어지는 클러스터;
d) 강한 구성 프로모터(게놈 내 다수의 자리에 통합하는 능력을 갖는다)의 조절하에서 xylA 유전자를 포함하는 구축물
의 도입 및 적응 진화에 의해 상기 숙주 세포에 도입시켜 형질전환된 숙주 세포를 생성시킬 수 있다. 상기 세포를 재조합 발현 기법을 사용하여 제조할 수 있다.
재조합 발현
상기 형질전환된 숙주 세포는 재조합 세포이다. 즉, 형질전환된 숙주 세포는 문제의 세포에 천연으로 존재하지 않는 뉴클레오타이드 서열을 포함하거나, 상기 서열로 형질전환되거나 또는 유전자 변형된다.
세포에서 효소의 재조합 발현뿐만 아니라 형질전환된 숙주 세포의 추가적인 유전자 변형을 위한 기법들이 당해 분야의 숙련가들에게 널리 공지되어 있다. 전형적으로 상기와 같은 기법들은 관련된 서열을 포함하는 핵산 구축물로 세포를 형질전환시킴을 포함한다. 상기와 같은 방법은 예를 들어 표준 안내서, 예를 들어 문헌[Sambrook and Russel (2001) "Molecular Cloning: A Laboratory Manual (3rd edition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press] 또는 문헌[F. Ausubel et al., eds., "Current protocols in molecular biology", Green Publishing and Wiley Interscience, New York (1987)]으로부터 공지되어 있다. 숙주 세포의 형질전환 및 유전자 변형 방법들은 예를 들어 EP-A-0635 574, WO 98/46772, WO 99/60102, WO 00/37671, WO90/14423, EP-A-0481008, EP-A-0635574 및 미국특허 제 6,265,186 호로부터 공지되어 있다.
전형적으로, 상기 핵산 구축물은 플라스미드, 예를 들어 저 사본 플라스미드 또는 고 사본 플라스미드일 수 있다. 본 발명에 따른 세포는 예를 들어 뉴클레오타이드 구축물의 다중 사본에 의해서 또는 효소 서열의 다중 사본을 갖는 구축물의 사용에 의해서, 상기 효소를 암호화하는 뉴클레오타이드 서열의 단일 또는 다중 사본을 포함할 수 있다.
상기 핵산 구축물을 에피솜에 의해 유지시킬 수 있으며 따라서 상기 구축물은 자율 복제용 서열, 예를 들어 자율 복제 서열을 포함한다. 적합한 에피솜 핵산 구축물은 예를 들어 효모 2μ 또는 pKD1 플라스미드(문헌[Gleer et al., 1991], 문헌[Biotechnology 9: 968-975]), 또는 AMA 플라스미드(문헌[Fierro et al., 1995], 문헌[Curr Genet. 29:482-489])를 기본으로 할 수 있다. 한편으로, 각각의 핵산 구축물을 상기 세포의 게놈내에 하나 이상의 사본 중에 편입시킬 수 있다. 상기 세포의 게놈내로의 편입은 비-상동성 재조합에 의해 무작위로 발생할 수 있으나, 바람직하게는 상기 핵산 구축물을 당해 분야에 널리 공지된 상동성 재조합에 의해 상기 세포의 게놈내에 편입시킬 수 있다(예를 들어 WO90/14423, EP-A-0481008, EP-A-0635 574 및 미국특허 제 6,265,186 호를 참조하시오).
대부분의 에피솜 또는 2μ 플라스미드는 효모에서 비교적 불안정하여, 각 세대 후 대략 10-2 이상의 세포에서 상실된다. 심지어 선택성 생육 조건하에서조차, 상기 세포의 단지 60% 내지 95%만이 상기 에피솜 플라스미드를 유지한다. 대부분의 에피솜 플라스미드의 사본수는 cir+ 숙주의 세포당 20 내지 100의 범위이다. 그러나, 상기 플라스미드는 상기 세포들 사이에 균등하게 분배되지 않으며, 집단에서 세포당 사본수의 높은 분산이 존재한다. 편입형 플라스미드에 의해 형질전환된 균주는 선택압의 부재하에서 조차 매우 안정성이다. 그러나, 플라스미드 상실이, 나란히 반복된 DNA간의 상동성 재조합에 의해 대략 10-3 내지 10-4 빈도로 발생할 수 있으며, 이는 상기 벡터 서열의 이탈(looping out)을 유도한다. 바람직하게는, 안정한 편입의 경우에 상기 벡터 디자인은 따라서, 상기 선택 마커 유전자의 상실(이는 또한 분자내, 상동성 재조합에 의해 발생한다)시 상기 편입된 구축물의 이탈이 더 이상 가능하지 않게 하는 것이다. 바람직하게 상기 유전자는 따라서 안정하게 편입된다. 안정한 편입은 본 발명에서 상기 편입된 구축물의 이탈이 더 이상 가능하지 않은 상기 게놈내로의 편입으로서 정의된다. 바람직하게 선택 마커는 존재하지 않는다. 전형적으로, 상기 효소 암호화 서열은 하나 이상의 핵산 서열에 작동적으로 연결되어, 상기 효소 서열의 전사 및/또는 번역을 제공하거나 지원할 수 있을 것이다.
"작동적으로 연결된"이란 용어는 개시된 성분들이 그들의 의도된 방식으로 기능하도록 하는 관계에 있는 병렬 배치를 지칭한다. 예를 들어, 프로모터 또는 인헨서는 암호화 서열에 작동적으로 연결되어 상기 프로모터 또는 인헨서가 암호화 서열의 전사에 영향을 미치게 한다.
본 발명에 사용되는 바와 같이, "프로모터"란 용어는 유전자의 전사 개시 부위의 전사 방향에 관하여 상류에 위치한, 하나 이상의 유전자의 전사를 조절하는 기능을 하고 DNA-의존성 RNA 폴리머라제에 대한 결합 부위, 전사 개시 부위 및 당해 분야의 숙련가에게 공지된 임의의 다른 DNA 서열의 존재에 의해 구조적으로 확인되는 핵산 단편을 지칭한다. "구성" 프로모터는 대부분의 환경 및 발생 조건하에서 활성인 프로모터이다. "유도" 프로모터는 환경 또는 발생 조절하에서 활성인 프로모터이다.
본 발명에 따른 효소를 암호화하는 뉴클레오타이드 서열의 발현을 성취하기 위해 사용될 수 있는 프로모터는 발현시키려는 효소를 암호화하는 뉴클레오타이드 서열에 대해 고유하지 않을 수 있다, 즉 프로모터는 상기 프로모터가 작동적으로 연결되는 뉴클레오타이드 서열(암호화 서열)에 이종이다. 그러나, 상기 프로모터는 상기 숙주 세포에 대해 상동성, 즉 내인성일 수 있다.
프로모터를 광범위하게 입수할 수 있으며 상기 프로모터는 숙련가에게 공지되어 있다. 상기와 같은 프로모터의 적합한 예는 당분해 유전자, 예를 들어 효모 또는 섬유상 진균으로부터의 포스포프럭토키나제(PFK), 트라이오스 포스페이트 아이소머라제(TPI), 글리세르알데하이드-3-포스페이트 데하이드로게나제(GPD, TDH3 또는 GAPDH), 피루베이트 키나제(PYK), 포스포글리세레이트 키나제(PGK) 프로모터를 포함하며; 효모로부터의 상기와 같은 프로모터에 대한 보다 상세한 내용은 WO 93/03159에서 찾을 수 있다. 다른 유용한 프로모터는 리보솜 단백질 암호화 유전자 프로모터, 락타제 유전자 프로모터(LAC4), 알콜 데하이드로게나제 프로모터(ADH1, ADH4 등), 및 에놀라제 프로모터(ENO)이다. 다른 프로모터(구성 및 유도 모두), 및 인헨서 또는 상류 활성화 서열은 당해 분야의 숙련가들에게 공지될 것이다. 본 발명의 숙주 세포에 사용되는 프로모터를 경우에 따라 그의 조절 특성에 영향을 미치도록 변형시킬 수 있다. 이와 관련하여 적합한 프로모터는 구성 및 유도 천연 프로모터뿐만 아니라 가공된(engineered) 프로모터를 포함하며, 이들은 당해 분야의 숙련가에게 널리 공지되어 있다. 진핵생물 숙주 세포에서 적합한 프로모터는 GAL7 , GAL10 , 또는 GAL1 , CYC1, HIS3 , ADH1 , PGL , PH05, GAPDH , ADC1 , TRP1 , URA3 , LEU2 , EN01, TPI1, 및 AOX1일 수 있다. 다른 적합한 프로모터는 PDC1 , GPD1 , PGK1 , TEF1 , TDH3을 포함한다.
형질전환된 숙주 세포에서, 상기 뉴클레오타이드 산 서열 암호화 효소의 3'-단부를 바람직하게는 전사 종결자 서열에 작동적으로 연결한다. 바람직하게 상기 종결자 서열은 선택된 숙주 세포, 예를 들어 선택된 효모 종에서 작동가능하다. 임의의 경우에 상기 종결자의 선택은 중요하지 않으며; 상기 종결자는 예를 들어 임의의 효모 유전자로부터의 것일 수 있지만, 종결자들은 때때로 비-효모, 진핵생물 유전자로부터의 것인 경우에도 작용할 수 있다. 대개 상기 효소를 암호화하는 뉴클레오타이드 서열은 종결자를 포함한다. 바람직하게는, 상기와 같은 종결자를 숙주 형질전환된 숙주 세포에서 넌센스 매개된 mRNA 붕괴를 방지하는 돌연변이와 병용한다(예를 들어 문헌[Shirley et al., 2002], 문헌[Genetics 161 :1465-1482]을 참조하시오).
상기 전사 종결 서열은 추가로 바람직하게 폴리아데닐화 신호를 포함한다.
임의로, 선택성 마커는 본 발명에 사용하기에 적합한 핵산 구축물 중에 존재할 수 있다. 본 발명에 사용되는 바와 같이, "마커"란 용어는 상기 마커를 함유하는 숙주 세포의 선택 또는 선별을 허용하는 특성 또는 표현형을 암호화하는 유전자를 지칭한다. 상기 마커 유전자는 항생제 내성 유전자일 수 있으며, 이때 적합한 항생제를 사용하여, 형질전환되지 않은 세포들 가운데에서 형질전환된 세포를 선택할 수 있다. 적합한 항생제 내성 마커의 예는 예를 들어 다이하이드로폴레이트 리덕타제, 하이그로마이신-B-포스포트랜스퍼라제, 3'-O-포스포트랜스퍼라제 II(가나마이신, 네오마이신 및 G418 내성)를 포함한다. 항생제 내성 마커는 배수체 숙주 세포의 형질전환에 가장 편리할 수 있다. 또한 비-항생제 내성 마커, 예를 들어 영양요구성 마커(URA3 , TRP1 , LEU2) 또는 스키조사카로마이세스 폼베 TPI 유전자(문헌[Russell P R, 1985, Gene 40: 125-130]에 개시됨)를 사용할 수 있다. 바람직한 실시태양에서 상기 핵산 구축물로 형질전환된 숙주 세포는 마커 유전자가 없다. 재조합 마커 유전자가 없는 미생물 숙주 세포의 제조 방법은 EP-A-O 635 574에 개시되어 있으며 양방향성 마커, 예를 들어 아스퍼질러스 니둘란스 amdS(아세트아미다제) 유전자 또는 효모 URA3LYS2 유전자의 사용을 기본으로 한다. 한편으로, 선별성 마커, 예를 들어 그린 형광 단백질, lacL, 루시페라제, 클로람페니콜 아세틸트랜스퍼라제, 베타-글루쿠로니다제를 본 발명의 핵산 구축물내에 통합시켜 형질전환된 세포의 선별을 허용할 수 있다.
본 발명에 사용하기에 적합한 핵산 구축물 중에 존재할 수 있는 임의의 추가의 요소는 비제한적으로 하나 이상의 리더 서열, 인헨서, 편입 인자, 및/또는 리포터 유전자, 인트론 서열, 동원체, 텔로머 및/또는 기질 부착(MAR) 서열을 포함한다. 본 발명의 핵산 구축물은 자율 복제를 위한 서열, 예를 들어 ARS 서열을 추가로 포함할 수 있다.
따라서 상기 재조합 과정은 공지된 재조합 기법으로 실행될 수 있다. 형질전환된 숙주 세포에서의 효소의 발현 및 과발현에 대한 다양한 수단들이 당해 분야의 숙련가들에게 공지되어 있다. 특히, 효소를, 숙주 세포에서 상기 효소를 암호화하는 유전자의 사본수를, 예를 들어 상기 숙주 세포의 게놈에 상기 유전자의 추가적인 사본을 편입시킴으로써, 에피솜 다중사본 발현 벡터로부터 상기 유전자를 발현시킴으로써, 또는 상기 유전자의 다중 사본을 포함하는 에피솜 발현 벡터를 도입시킴으로써 증가시켜 과발현시킬 수 있다.
한편으로, 본 발명의 숙주 세포에서 효소의 과발현은 과발현시키려는 상기 효소를 암호화하는 서열에 고유하지 않은 프로모터, 즉 작동적으로 연결된 상기 암호화 서열에 이종인 프로모터를 사용함으로써 성취될 수 있다. 상기 프로모터는 바람직하게는 작동적으로 연결된 상기 암호화 서열에 이종이지만, 상기 프로모터가 상기 숙주 세포에 상동성, 즉 내인성인 것이 또한 바람직하다. 바람직하게 상기 이종 프로모터는 상기 암호화 서열에 고유한 프로모터보다, 상기 암호화 서열을 포함하는 전사물의 보다 높은 정상상태 수준을 생성시킬 수 있다(또는 시간 단위당 보다 많은 전사물 분자, 즉 mRNA 분자를 생성시킬 수 있다). 이와 관련하여 적합한 프로모터는 구성 및 유도성 천연 프로모터뿐만 아니라 가공된 프로모터를 포함한다.
하나의 실시태양에서, 상기 형질전환된 숙주 세포는 마커가 없으며, 이는 영양요구성 또는 우성 마커, 특히 항생제 내성 마커가 상기 게놈 중에 또는 염색체-외에 존재함을 의미한다.
상기에 언급된 효소의 과발현에 사용되는 암호화 서열은 바람직하게는 상기 숙주에 상동성일 수 있다. 그러나, 상기 숙주에 이종인 암호화 서열을 사용할 수도 있다.
효소의 과발현은, 유전자 변형된 세포에서 상기 효소의 생성을 언급하는 경우, 상기 효소가 동일한 조건하에서 변형되지 않은 숙주 세포에 비해 더 높은 수준의 특이적인 효소 활성으로 생성됨을 의미한다. 대개 이는 상기 효소 활성 단백질(또는 다중-서브유닛 효소의 경우 단백질들)이 동일한 조건하에서 변형되지 않은 숙주 세포에 비해 더 많은 양으로, 또는 다소 더 높은 정상상태 수준으로 생성됨을 의미한다. 유사하게 이는 대개 상기 효소 활성 단백질을 암호화하는 mRNA가 동일한 조건하에서 변형되지 않은 숙주 세포에 비해 더 많은 양으로, 또는 다시 다소 더 높은 정상상태 수준으로 생성됨을 의미한다. 바람직하게 숙주에서, 과발현되는 효소는 상기 과별현을 야기하는 유전자 변형을 제외하고는 유전적으로 동일한 균주에 비해 적어도 약 1.1, 약 1.2, 약 1.5, 약 2, 약 5, 약 10 또는 약 20의 인자까지 과발현된다. 이러한 과발현 수준을 상기 효소 활성의 정상 상태 수준, 상기 효소 단백질의 정상 상태 수준뿐만 아니라 상기 효소를 암호화하는 전사물의 정상 상태 수준에 적용할 수 있음은 물론이다.
적응
적응은 집단이 그의 서식지 또는 서식지들에 양호하게 적합화(적응) 되는 진화 과정이다. 상기 과정은 여러 세대 내지 다수의 세대에 걸쳐 발생하며, 생물학의 기본적인 현상들 중 하나이다.
적응이란 용어는 또한 유기체의 생존에 특히 중요한 특징을 지칭한다. 상기와 같은 적응은 자연 선택에 의해 보다 성공적으로 번식하는 보다 양호하게 적합한 형태에 의해, 가변 집단에서 생성된다.
환경 조건의 변화는 자연 선택의 결과를 변경시켜, 새로운 조건하에서의 유기체의 적합성을 개선시키는 후속 적응의 선택성 이점에 영향을 미친다. 극단적인 환경 변화의 경우에, 이로운 적응의 외형 및 고착이 생존에 필수일 수 있다. 다수의 상이한 인자들, 예를 들어 영양분 유효성, 온도, 산소의 유효성 등이 적응 진화를 구동할 수 있다.
적합성
적응성(유기체가 살 수 있고 주어진 서식지 세트에서 번식할 수 있는 정도)과 적합성간에는 분명한 관계가 존재한다. 적합성은 자연 선택 비율의 평가 및 예견자이다. 자연 선택의 적용에 의해, 대체 표현형이 유전되는 경우, 상기 표현형의 상대적인 빈도는 시간에 따라 변할 것이다.
유전적 변화
자연 선택이 집단의 유전적 변이성에 대해서 작용하는 경우, 유전적 변화가 근원적인 기전이다. 이는 상기 집단이 그의 환경에 유전적으로 적응함을 의미한다. 유전적 변화는 가시적인 구조를 생성시키거나, 또는 유기체의 생리 활성을 변화된 서식지에 적합하게 하는 식으로 조절할 수 있다.
상기 변화는 서식지가 빈번히 변화할 때 발생할 수 있다. 따라서, 적응의 과정은 결코 최종적으로 완성되지 않고 이어진다. 이윽고, 환경이 점차적으로 변화하고, 종들이 그의 주변환경에 점점 더 양호하게 적합해지는 일이 발생할 수 있다. 다른 한편으로, 환경의 변화가 비교적 급속히 발생하고, 이어서 종들이 점점 덜 충분히 적응하게 되는 일이 발생할 수도 있다. 적응은 유전적 과정이며, 또한 집단이 서식지나 환경을 바꾸지 않을 때도 줄곧 어느 정도 진행한다.
적응 진화
상기 형질전환된 숙주 세포를 그의 제조에서 적응 진화시킬 수 있다. 형질전환된 숙주 세포를 목적하는 당, 바람직하게는 단독 탄소원으로서 상기 당 상에서 및 보다 바람직하게는 혐기성 조건하에서, 생육에 대해 자발적이거나 또는 유도된(예를 들어 방사선 또는 화학물질에 의해) 돌연변이체의 선택에 의해 당 이용에 적응시킬 수 있다. 돌연변이체의 선택을, 예를 들어 문헌[Kuyper et al., 2004, FEMS Yeast Res. 4: 655-664]에 개시된 바와 같이 배양물의 연속 이동을 포함하는 기법에 의해서 또는 케모스탯 배양물에서 선택압하에서 배양에 의해서 수행할 수 있다. 예를 들어 바람직한 숙주 세포에서, 돌연변이체의 선택에 의해 획득된 변형을 포함하여 상술한 유전적 변형들 중 하나 이상은 상기 숙주 세포에게 탄소원으로서, 바람직하게는 유일한 탄소원으로서 자일로스상에서 및 바람직하게는 혐기성 조건하에서 생육하는 능력을 부여한다. XI가 자일로스를 전환시키는 유전자로서 사용되는 경우, 바람직하게는 상기 세포는 필수적으로 자일리톨을 생산하지 않는다, 예를 들어 상기 생산된 자일리톨은 검출 한계 미만, 또는 예를 들어 몰 기준으로 소비된 탄소의 약 5, 약 2, 약 1, 약 0.5, 또는 약 0.3% 미만이다.
적응 진화는 또한 예를 들어 문헌[Wisselink H.W. et al, Applied and Environmental Microbiology Aug. 2007, p. 4881-4891]에 개시되어 있다.
적응 진화의 하나의 실시태양에서 상이한 배지에서, 예를 들어 상이한 조성(글루코스, 자일로스 및 아라비노스; 자일로스 및 아라비노스)을 갖는 3개의 배지에서 연속적인 생육의 반복된 주기와 함께 반복된 배치 배양으로 이루어지는 섭생을 적용한다. 문헌[Wisselink et al. (2009) Applied and Environmental Microbiology, Feb. 2009, p. 907-914]을 참조하시오.
효모 형질전환 및 유전적 안정성
효모 세포의 재조합 DNA에 의한 유전 공학, 즉 형질전환은 1978년에 최초로 가능하게 되었다(문헌[Beggs, 1978]; 문헌[Hinnen et al., 1978]). 효모에서 재조합 DNA 기술은 그 자체가 그때 이후로 확립되었다. 다수의 상이한 벡터 구축물들을 입수할 수 있다. 일반적으로, 상기 플라스미드 벡터(셔틀 벡터라 칭함)는 복제 기원 및 선택성 마커(종종 β락타마제 유전자, ampR)(이는 효모 세포내로의 형질전환에 앞서 에스케리키아 콜라이에서 번식되게 할 수 있다)로 이루어지는 에스케리키아 콜라이 벡터로부터 유래된 유전 물질을 함유한다. 추가로, 상기 셔틀 벡터는 효모에서의 선택을 위한 선택성 마커를 함유한다. 마커는 특정 아미노산 또는 뉴클레오타이드의 합성을 위한 효소를 암호화하는 유전자일 수 있으며, 따라서 상응하는 게놈 결실(또는 돌연변이)을 갖는 세포는 영양요구 또는 독립영양을 보완한다. 한편으로, 이들 벡터는 이종 우성 내성 마커를 함유하며, 상기 마커는 g418(제네티신), 하이그로마이신B 또는 플레오마이신과 같은 몇몇 항생제에 대한 내성을 재조합 효모 세포(즉 상기 DNA를 흡수하고 상기 마커 유전자를 발현하는 세포)에게 제공한다. 또한, 이들 벡터는 외래 DNA를 (결합된) 제한 부위(다중 클로닝 부위 또는 MCS)내로 클로닝되게 하는 상기 제한 부위의 서열을 함유할 수 있지만, 또 다른 방법들도 또한 존재한다.
전통적으로, 4가지 유형의 셔틀 벡터를 추가적인 유전 요소들의 부재 또는 존재에 의해 구분할 수 있다:
·제한에 의해 개방되고 선형화된 DNA가 효모 세포의 형질전환에 사용되는 경우, 상동성 재조합에 의해 마커 또는 또 다른 유전자의 자리에서 숙주 게놈내로 편입되는 편입형 플라스미드(YIp). 상기는 일반적으로 상기 게놈 중 상기 특정 부위에 삽입된 외래 DNA의 하나의 사본의 존재를 생성시킨다.
·효모 세포에서 자율 복제에 필요한 2 μ 플라스미드 DNA 서열 부분을 갖는 에피솜 플라스미드(YEp). 상기 형질전환된 플라스미드의 다중 사본이 상기 효모 세포에서 번식되고 에피솜으로서 유지된다.
·상기 형질전환된 플라스미드를 수백 배 번식시키는 효모 복제 기원(ARS, 자율적으로 복제된 서열)을 갖는 자율적으로 복제하는 플라스미드(YRp).
·ARS 서열 외에, 통상적으로 안정한 유사분열 분리를 보장하고 대개는 자기-복제된 플라스미드의 사본수를 단지 1로 감소시키는 동원체 서열(핵 염색체들 중 하나로부터 유래됨)을 갖는 CEN 플라스미드(YCp).
이들 플라스미드는 형질전환에 의해 상기 효모 세포내로 도입된다. 효모 세포의 형질전환을 다수의 상이한 기법들, 예를 들어 리튬 아세테이트에 의한 세포의 투과(문헌[Ito et al., 1983]) 및 일렉트로포레이션 방법에 의해 성취할 수 있다.
재조합 미생물의 상업적인 용도에서, 플라스미드 불안정성이 가장 중요한 문제이다. 불안정성은 상기 형질전환된 세포가 플라스미드에 대한 변화 또는 그의 상실로 인해 그의 가공된 성질을 상실하게 되는 성향이다. 이 문제는 문헌[Zhang et al., Plasmid stability in recombinant Saccharomyces cerevisiae. Biotechnology Advances, Vol. 14, No. 4, pp. 401-435, 1996]에 상세히 논의되어 있다. 편입형 플라스미드로 형질전환된 균주는 선택압의 부재하에서 조차 대단히 안정성이다(Sherman, F. http://dbb.urmc.rochester.edu/labs/sherman f/yeast/9.html 및 상기 중의 참고문헌들).
이종 DNA는 대개 염색체-외 플라스미드(YEp, YCp 및 YRp)의 형태로 유기체내에 도입된다. 불행하게도, 세균 및 효모 모두에 대해서, 특히 선택압이 연속적으로 적용되지 않는 경우, 새로운 특성을 유지할 수 없는 것으로 밝혀졌다. 이는 재조합 세포가 장기간 동안 생육할 때 상기 하이브리드 플라스미드의 분리 불안정성에 기인한다. 이는 집단 복합성 및 클론 변동성, 및 결국 세포의 대다수가 형질전환에 의해 도입된 성질들을 상실하는 세포 집단을 유도한다. 영양요구성 마커를 갖는 벡터를 사용하는 경우, 풍부 배지에서의 배양은 종종 상기 벡터의 빠른 상실을 도출하는데, 이는 상기 벡터가 오직 최소 배지에서 유지되기 때문이다. 한편으로 우성 항생제 내성 마커의 사용은 종종 생산 과정에 적합하지 않다. 상기 항생제의 사용은 등록 관점(미량의 항생제가 최종 생성물 중에서 끝날 가능성) 또는 경제적인 이유(산업적인 규모의 항생제 사용 비용)로부터 바람직하지 않을 수 있다.
벡터의 상실은 대규모 생산 상황에 문제를 도출한다. 대안의 DNA 도입 방법, 예를 들어 편입 플라스미드(YIp)의 사용이 효모에 대해 존재한다. 상기 DNA를 재조합에 의해 숙주 게놈내에 편입시켜 높은 안정성을 생성시킨다(문헌[Caunt, P. Stability of recombinant plasmids in yeast. Journal of Biotechnology 9(1988) 173 - 192]). 우리는 숙주 전이인자(transposon)를 사용하는 편입 방법이 양호한 대안임을 발견하였다. 하나의 실시태양에서 유전자를 상기 형질전환된 숙주 세포 게놈내에 편입시킬 수 있다. 다중 사본의 초기 도입(즉 적응 진화 전)을 상기 유전자의 도입을 도출하는 당해 분야에 공지된 임의의 방식으로 실행한다. 하나의 실시태양에서, 이를 상기 숙주 세포의 반복된 서열(전이인자)에 상동성인 부분을 갖는 벡터를 사용하여 수행할 수 있다. 상기 숙주 세포가 효모 세포인 경우, 적합한 반복 서열은 델타 서열로서 공지된 Ty 요소의 긴 말단 반복부(LTR)이다. Ty 요소는 Ty1 및 Ty2라 칭하는 2개의 다소 유사한 아과로 나뉜다. 이들 요소는 길이가 약 6 킬로염기(kb)이고 약 335 염기쌍 서열의 긴 말단 반복부(LTR)에 의해 경계가 정해진다(문헌[Boeke JD et al, The Saccharomyces cerevisiae Genome Contains Functional and Nonfunctional Copies of Transposon Ty1. Molecular and Cellular Biology, Apr. 1988, p. 1432-1442 Vol. 8, No. 4]). 충분히 서열분석된 사카로마이세스 세레비지아에 균주, S288c에서, 가장 풍부한 전이인자는 Ty1(31 사본) 및 Ty2(13 사본)이다(문헌[Gabriel A, Dapprich J, Kunkel M, Gresham D, Pratt SC, et al. (2006) Global mapping of transposon location. PLoS Genet 2(12): e212.doi:10.1371/journal.pgen.0020212]). 이들 전이인자는 2개의 중복된 개방 판독 프레임(ORF)으로 이루어지며, 이들은 각각 다수의 단백질들을 암호화한다. 상기 암호화 영역은 상기 언급된, 거의 일치하는 LTR에 의해 인접된다. 사카로마이세스 세레비지아에 중의 다른, 그러나 덜 풍부하고 더 독특한 Ty 요소들은 Ty3, Ty4 및 Ty5를 포함한다. 완전-길이 Ty 요소의 각 과의 경우, 상기 게놈을 통해 분산된 보다 많은 승수의 단독 LTR 요소들이 존재한다. 이들은 내부 단백질 암호화 영역의 일탈과 함께 완전-길이 요소의 LTR-LTR 재조합에 의해 발생하는 것으로 생각된다.
상기 Ty 역전이인자의 역전이 기전은 상기 게놈 전체를 통한 다중 사본의 편입에 활용되었다(문헌[Boeke et al., 1988; Jacobs et al., 1988]). 델타 서열로서 공지된, 상기 Ty 요소의 긴 말단 반복부(LTR)는 또한, 상기 반복부들이 Ty 결합된 또는 단독 부위인 약 150 내지 200 사본으로 존재하기 때문에, 상동성 재조합에 의한 편입에 양호한 표적이다(문헌[Boeke, 1989]; 문헌[Kingsman and Kingsman, 1988]). (문헌[Parekh R.N. (1996). An Integrating Vector for Tunable, High Copy, Stable Integration into the Dispersed Ty DELTA Sites of Saccharomyces cerevisiae. Biotechnol. Prog. 1996, 12, 16-21]). 적응 진화에 의해 상기 사본수가 변할 수 있다.
숙주 세포
상기 숙주 세포는 유용한 생성물의 생산에 적합한 임의의 숙주 세포일 수 있다. 숙주 세포는 임의의 적합한 세포, 예를 들어 원핵생물 세포, 예를 들어 세균 또는 진핵생물 세포일 수 있다. 전형적으로, 상기 세포는 진핵생물 세포, 예를 들어 효모 또는 섬유상 진균일 것이다.
효모는 본 발명에서 진핵 미생물로서 정의되며 단세포 형태로 우세하게 생육하는 아문 진균류의 모든 종을 포함한다(문헌[Alexopoulos, C. J., 1962, In : Introductory Mycology, John Wiley & Sons, Inc., New York]).
효모는 단세포 엽상체의 발아에 의해 생육하거나 또는 상기 유기체의 분열에 의해 생육할 수 있다. 형질전환된 숙주 세포로서 바람직한 효모는 사카로마이세스, 클루이베로마이세스, 칸디다(Candida), 피키아(Pichia), 스키조사카로마이세스(Schizosaccharomyces), 한세눌라(Hansenula), 클로엑케라(Kloeckera), 슈반니오마이세스(Schwanniomyces) 또는 야로위아(Yarrowia) 속에 속할 수 있다. 바람직하게 상기 효모는 혐기성 발효를 할 수 있는 것, 보다 바람직하게는 혐기성 알콜 발효를 할 수 있는 것이다.
섬유상 진균은 본 발명에서 아문 진균류의 모든 섬유상 형태를 포함하는 진핵 미생물로서 정의된다. 이들 진균은 키틴, 셀룰로스, 및 다른 복합 폴리사카라이드로 구성된 영양 균사체를 특징으로 한다. 본 발명의 세포로서 사용하기에 적합한 섬유상 진균은 효모와 형태학적, 생리학적 및 유전학적으로 다르다. 섬유상 진균 세포는, 대부분의 진균이 번식에 무균 조건을 필요로 하지 않으며 박테리오파지 감염에 민감하지 않기 때문에, 유리하게 사용될 수 있다. 섬유상 진균에 의한 영양 생육은 균사 신장에 의하며 대부분의 섬유상 진균의 탄소 이화작용은 절대 호기성이다. 숙주 세포로서 바람직한 섬유상 진균은 아스퍼질러스(Aspergillus), 트리코더마(Trichoderma), 휴미콜라(Humicola), 아크레모니우라(Acremoniurra), 푸사리움(Fusarium) 또는 페니실리움(Penicillium) 속에 속할 수 있다. 보다 바람직하게, 상기 섬유상 진균 세포는 아스퍼질러스 니거(Aspergillus niger), 아스퍼질러스 오리자에(Aspergillus oryzae), 페니실리움 크리소제눔(Penicillium chrysogenum) 또는 리조푸스 오리자에(Rhizopus oryzae) 세포일 수 있다.
하나의 실시태양에서 상기 숙주 세포는 효모일 수 있다.
바람직하게 상기 숙주는 산업용 숙주, 보다 바람직하게는 산업용 효모이다. 산업용 숙주 및 산업용 효모 세포를 하기와 같이 정의할 수 있다. 산업적인 공정에서 세포의 살아있는 환경은 실험실에서의 경우와 현저하게 상이하다. 산업용 효모 세포는 상기 공정 동안 변할 수 있는 다수의 환경 조건하에서 잘 수행할 수 있어야 한다. 상기와 같은 변화는 사카로마이세스 세레비지아에의 세포 생육 및 에탄올 생산에 함께 잠재적인 영향을 미치는 영양 공급원, pH, 에탄올 농도, 온도, 산소 농도 등의 변화를 포함한다. 불리한 산업 조건하에서, 상기 환경 내성 균주는 확고한 생육 및 생산을 허용해야 한다. 산업용 효모 균주는 일반적으로 상기 균주가 사용되는 용도, 예를 들어 베이킹 산업, 양조 산업, 와인 제조 및 에탄올 산업에서 존재할 수 있는 환경 조건에서의 상기 변화에 대해 더 확고하다. 산업용 효모(사카로마이세스 세레비지아에)의 예는 에탄올 레드(등록상표)(페르멘티스) 페르미올(등록상표)(DSM) 및 써모삭(등록상표)(랄레맨드)이다.
하나의 실시태양에서 상기 숙주는 억제제 내성이다. 억제제 내성 숙주 세포를 문헌[Kadar et al, Appl. Biochem. Biotechnol. (2007), Vol. 136-140, 847-858](여기에서 억제제 내성 사카로마이세스 균주 ATCC 26602가 선택되었다)에 예시된 바와 같은 억제제 함유 물질상에서 생육에 대해 선별함으로써 선택할 수 있다.
araA , araB araD 유전자
형질전환된 숙주 세포는 아라비노스를 사용할 수 있다. 따라서 형질전환된 숙주 세포는 L-아라비노스를 L-리뷸로스 및/또는 자일로스 5-포스페이트 및/또는 목적하는 발효 산물, 예를 들어 본 발명에서 언급된 것들 중 하나로 전환시킬 수 있다.
에탄올을 L-아라비노스로부터 생산할 수 있는 유기체, 예를 들어 사카로마이세스 세레비지아에를, 적합한 공급원으로부터 araA(L-아라비노스 아이소머라제), araB(L-리뷸로키나제) 및 araD(L-리뷸로스-5-P4-에피머라제) 유전자를 도입시키는 세포를 변형시킴으로써 생성시킬 수 있다. 상기와 같은 유전자를 아라비노스를 사용할 수 있는 정도로 형질전환된 숙주 세포에 도입시킬 수 있다. 상기와 같은 접근법은 WO2003/095627에 개시되어 있다. 락토바실러스 플란타룸(Lactobacillus plantarum)으로부터의 araA , araBaraD 유전자가 사용될 수 있으며 WO2008/041840에 개시되어 있다. 바실러스 서브틸리스로부터의 araA 유전자 및 에스케리키아 콜라이로부터의 araBaraD 유전자를 사용할 수 있으며 이들은 EP1499708에 개시되어 있다. 또 다른 실시태양에서, araA , araBaraD 유전자는 WO2009011591에 개시된 바와 같이 클라비박터(Clavibacter), 아르쓰로박터(Arthrobacter) 및/또는 그라멜라(Gramella) 속 중 하나 이상, 특히 클라비박터 미키가넨시스(Clavibacter michiganensis), 아르쓰로박터 아우레센스(Arthrobacter aurescens), 및/또는 그라멜라 포르세티이(Gramella forsetii) 중 하나 로부터 유래될 수 있다.
PPP-유전자
형질전환된 숙주 세포는 펜토스 포스페이트 경로의 유출을 증가시키는 하나 이상의 유전자 변형을 포함할 수 있다. 특히, 상기 유전자 변형(들)은 상기 펜토스 포스페이트 경로의 비-산화 부분을 통해 증가된 유출을 유도할 수 있다. 상기 펜토스 포스페이트 경로의 비-산화 부분의 증가된 유출을 야기하는 유전자 변형은, 본 발명에서 상기 증가된 유출을 야기하는 유전자 변형을 제외하고 일반적으로 동일한 균주에서의 유출에 비해 적어도 약 1.1, 약 1.2, 약 1.5, 약 2, 약 5, 약 10 또는 약 20의 인자까지 상기 유출을 증가시키는 변형을 의미하는 것으로 이해된다. 상기 펜토스 포스페이트 경로의 비-산화 부분의 유출을, 유일한 탄소원으로서 자일로스 상에서 상기 변형된 숙주를 생육시키고, 비(specific) 자일로스 소비율을 측정하고 상기 비 자일로스 소비율로부터 비 자일리톨 생산율(임의의 자일리톨이 생산되는 경우)을 공제함으로써 측정할 수 있다. 그러나, 상기 펜토스 포스페이트 경로의 비-산화 부분의 유출은 유일한 탄소원으로서 자일리톨상에서의 생육률, 바람직하게는 유일한 탄소원으로서 자일로스상에서의 혐기성 생육률에 비례한다. 유일한 탄소원으로서 자일로스상에서의 생육률(μmax)과 상기 펜토스 포스페이트 경로의 비-산화 부분의 유출간에 선형 관계가 존재한다. 상기 비 자일로스 소비율(Qs)은, 당에서의 바이오매스의 수율이 일정하기 때문에(주어진 세트의 조건하에서: 혐기성, 생육 배지, pH, 균주의 유전적 배경 등; 즉 Qs = μ/Yxs) 당에서의 바이오매스의 수율(Yxs)로 나눈 생육률(μ)과 동등하다. 따라서, 상기 펜토스 포스페이트 경로의 비-산화 부분의 증가된 유출을, 수송이 없다면(흡수가 제한적이다), 상기 조건하에서 최대 생육률의 증가로부터 추론할 수 있다.
상기 펜토스 포스페이트 경로의 유출을 증가시키는 하나 이상의 유전자 변형을 다양한 방식으로 숙주 세포에 도입시킬 수 있다. 상기 방식은 예를 들어 자일룰로스 키나제 및/또는 상기 비-산화 부분 펜토스 포스페이트 경로의 효소들 중 하나 이상의 보다 높은 정상 상태 활성 수준 및/또는 비특이적인 알도스 리덕타제 활성의 감소된 정상상태 수준을 성취함을 포함한다. 이러한 정상상태 활성 수준의 변화는 돌연변이체(자발적인 또는 화학물질 또는 방사선에 의해 유도된)의 선택, 및/또는 상기 효소를 암호화하는 유전자 또는 상기 유전자를 조절하는 인자의, 예를 들어 각각 과발현 또는 불활성화에 의한 재조합 DNA 기술에 의해 영향을 받을 수 있다.
바람직한 숙주 세포에서, 상기 유전자 변형은 상기 (비-산화 부분) 펜토스 포스페이트 경로의 하나 이상의 효소의 과발현을 포함한다. 바람직하게 상기 효소는 리뷸로스-5-포스페이트 아이소머라제, 리뷸로스-5-포스페이트 에피머라제, 트랜스케톨라제 및 트랜스알돌라제를 암호화하는 효소들로 이루어지는 군 중에서 선택된다. 상기 (비-산화 부분) 펜토스 포스페이트 경로의 효소들의 다양한 조합들을 과발현시킬 수 있다. 예를 들어, 과발현되는 효소는 적어도 리뷸로스-5-포스페이트 아이소머라제 및 리뷸로스-5-포스페이트 에피머라제 효소; 또는 적어도 리뷸로스-5-포스페이트 아이소머라제 및 트랜스케톨라제 효소; 또는 적어도 리뷸로스-5-포스페이트 아이소머라제 및 트랜스알돌라제 효소; 또는 적어도 리뷸로스-5-포스페이트 에피머라제 및 트랜스알돌라제 효소; 또는 적어도 리뷸로스-5-포스페이트 에피머라제, 트랜스케톨라제 및 트랜스알돌라제 효소; 또는 적어도 트랜스케톨라제 및 트랜스알돌라제 효소; 또는 적어도 리뷸로스-5-포스페이트 에피머라제, 트랜스케톨라제 및 트랜스알돌라제 효소; 또는 적어도 리뷸로스-5-포스페이트 아이소머라제, 리뷸로스-5-포스페이트 에피머라제 및 트랜스알돌라제 효소; 또는 적어도 리뷸로스-5-포스페이트 아이소머라제, 리뷸로스-5-포스페이트 에피머라제 및 트랜스케톨라제 효소일 수 있다. 본 발명의 하나의 실시태양에서 상기 리뷸로스-5-포스페이트 아이소머라제, 리뷸로스-5-포스페이트 에피머라제, 트랜스케톨라제 및 트랜스알돌라제 효소들은 각각 숙주 세포에서 과발현된다. 상기 유전자 변형이 적어도 상기 트랜스케톨라제 및 트랜스알돌라제 효소 모두의 과발현을 포함하는 숙주 세포가 보다 바람직하며 숙주 세포는 그 자체가 이미 자일로스상에서 혐기성 생육을 할 수 있다. 실제로, 일부 조건하에서 상기 트랜스케톨라제 및 트랜스알돌라제만을 이미 과발현하는 숙주 세포는 상기 4개의 효소, 즉 리뷸로스-5-포스페이트 아이소머라제, 리뷸로스-5-포스페이트 에피머라제, 트랜스케톨라제 및 트랜스알돌라제 모두를 과발현하는 숙주 세포와 동일한 자일로스상의 혐기성 생육률을 갖는다. 더욱이, 상기 리뷸로스-5-포스페이트 아이소머라제 및 리뷸로스-5-포스페이트 에피머라제 효소 모두를 과발현하는 숙주 세포는, 이들 효소 중 단지 하나의 과발현이 대사 불균형을 생성시킬 수 있기 때문에, 상기 아이소머라제만 또는 상기 에피머라제만 과발현하는 숙주 세포보다 바람직하다.
"리뷸로스 5-포스페이트 에피머라제"(EC5.1.3.1) 효소는 본 발명에서 D-자일룰로스-5-포스페이트의 D-리뷸로스 5-포스페이트로의 에피머화 및 이와 역을 촉진하는 효소로서 정의된다. 상기 효소는 또한 포스포리뷸로스 에피머라제; 에리쓰로즈-4-포스페이트 아이소머라제; 포스포케토펜토스 3-에피머라제; 자일룰로스 포스페이트 3-에피머라제; 포스포케토펜토스 에피머라제; 리뷸로스 5-포스페이트 3-에피머라제; D-리뷸로스 포스페이트-3-에피머라제; D-리뷸로스 5-포스페이트 에피머라제; D-리뷸로스-5-P 3-에피머라제; D-자일룰로스-5-포스페이트 3-에피머라제; 펜토스-5-포스페이트 3-에피머라제; 또는 D-리뷸로스-5-포스페이트 3-에피머라제로서 공지된다. 리뷸로스 5-포스페이트 에피머라제를 그의 아미노산 서열에 의해 추가로 정의할 수도 있다. 마찬가지로 리뷸로스 5-포스페이트 에피머라제를 상기 효소를 암호화하는 뉴클레오타이드 서열에 의해서뿐만 아니라 리뷸로스 5-포스페이트 에피머라제를 암호화하는 기준 뉴클레오타이드 서열에 하이브리드화하는 뉴클레오타이드 서열에 의해서 정의할 수 있다. 리뷸로스 5-포스페이트 에피머라제를 암호화하는 뉴클레오타이드 서열을 본 발명에서 RPE1으로서 표시한다.
"리뷸로스 5-포스페이트 아이소머라제"(EC 5.3.1.6) 효소는 본 발명에서 D-리뷸로스-5-포스페이트의 D-리뷸로스 5-포스페이트로의 직접적인 이성화 및 이와 역으로의 이성화를 촉진하는 효소로서 정의된다. 상기 효소는 또한 포스포펜토스아이소머라제; 포스포리보아이소머라제; 리보스 포스페이트 아이소머라제; 5-포스포리보스 아이소머라제; D-리보스 5-포스페이트 아이소머라제; D-리보스-5-포스페이트 케톨-아이소머라제; 또는 D-리보스-5-포스페이트 알도스-케토스-아이소머라제로서 공지된다. 리뷸로스 5-포스페이트 아이소머라제를 그의 아미노산 서열에 의해 추가로 정의할 수도 있다. 마찬가지로 리뷸로스 5-포스페이트 아이소머라제를 상기 효소를 암호화하는 뉴클레오타이드 서열에 의해서뿐만 아니라 리뷸로스 5-포스페이트 아이소머라제를 암호화하는 기준 뉴클레오타이드 서열에 하이브리드화하는 뉴클레오타이드 서열에 의해서 정의할 수 있다. 리뷸로스 5-포스페이트 아이소머라제를 암호화하는 뉴클레오타이드 서열을 본 발명에서 RKI1으로서 표시한다.
"트랜스케톨라제"(EC 2.2.1.1) 효소는 본 발명에서 반응: D-리보스 5-포스페이트 + D-자일룰로스 5-포스페이트 <-> 세도헵툴로스 7-포스페이트 + D-글리세르알데하이드 3-포스페이트 및 이와 역을 촉진하는 효소로서 정의된다. 상기 효소는 또한 글리콜알데하이드트랜스퍼라제 또는 세도헵툴로스-7-포스페이트:D-글리세르알데하이드-3-포스페이트 글리콜알데하이드트랜스퍼라제로서 공지된다. 트랜스케톨라제를 그의 아미노산에 의해 추가로 정의할 수도 있다. 마찬가지로 트랜스케톨라제를 상기 효소를 암호화하는 뉴클레오타이드 서열에 의해서뿐만 아니라 트랜스케톨라제를 암호화하는 기준 뉴클레오타이드 서열에 하이브리드화하는 뉴클레오타이드 서열에 의해서 정의할 수 있다. 트랜스케톨라제를 암호화하는 뉴클레오타이드 서열을 본 발명에서 TKL1으로서 표시한다.
"트랜스알돌라제"(EC 2.2.1.2) 효소는 본 발명에서 반응: 세도헵툴로스 7-포스페이트 + D-글리세르알데하이드 3-포스페이트 <-> D-에리쓰로스 4-포스페이트 + D-프럭토스 6-포스페이트 및 이와 역을 촉진하는 효소로서 정의된다. 상기 효소는 또한 다이하이드록시아세톤트랜스퍼라제; 다이하이드록시아세톤 신타제; 폼알데하이드 트랜스케톨라제; 또는 세도헵툴로스-7-포스페이트:D-글리세르알데하이드-3-포스페이트 글리세론트랜스퍼라제로서 공지된다. 트랜스알돌라제를 그의 아미노산 서열에 의해 추가로 정의할 수도 있다. 마찬가지로 트랜스알돌라제를 상기 효소를 암호화하는 뉴클레오타이드 서열에 의해서뿐만 아니라 트랜스알돌라제를 암호화하는 기준 뉴클레오타이드 서열에 하이브리드화하는 뉴클레오타이드 서열에 의해서 정의할 수 있다. 트랜스케톨라제를 암호화하는 뉴클레오타이드 서열을 본 발명에서 TAL1으로서 표시한다.
자일로스 아이소머라제 또는 자일로스 리덕타제 유전자
본 발명에 따라, 하나 이상의 자일로스 아이소머라제 유전자 및/또는 하나 이상의 자일로스 리덕타제 및 자일리톨 데하이드로게나제의 하나 이상의 사본을 숙주 세포의 게놈내로 도입시킨다. 이들 유전 요소의 존재는 상기 세포상에 이성화 또는 환원에 의해 자일로스를 전환시키는 능력을 부여한다.
하나의 실시태양에서, 상기 하나 이상의 자일로스 아이소머라제 유전자의 하나 이상의 사본을 상기 숙주 세포의 게놈내로 도입시킨다.
"자일로스 아이소머라제"(EC 5.3.1.5)는 본 발명에서 D-자일로스의 D-자일룰로스로의 직접적인 이성화 및/또는 이와 역을 촉진하는 효소로서 정의된다. 상기 효소는 또한 D-자일로스 케토아이소머라제로서 공지된다. 본 발명에서 자일로스 아이소머라제는 또한 D-글루코스와 D-프럭토스간의 전환을 촉진할 수 있다(따라서 상응하게 글루코스 아이소머라제로서 지칭할 수도 있다). 본 발명에서 자일로스 아이소머라제는 보조인자로서 2가 양이온, 예를 들어 마그네슘, 망간 또는 코발트를 필요로 할 수 있다.
상응하게, 상기와 같은 형질전환된 숙주 세포는 자일로스를 자일룰로스로 이성화할 수 있다. 자일로스를 자일룰로스로 이성화하는 능력은, 정의된 자일로스 아이소머라제를 암호화하는 뉴클레오타이드 서열을 포함하는 핵산 구축물에 의한 상기 숙주 세포의 형질전환에 의해서 상기 숙주 세포에 부여된다. 형질전환된 숙주 세포는 자일로스의 자일룰로스로의 직접적인 이성화에 의해 자일로스를 자일룰로스로 이성화한다.
자일로스 아이소머라제 활성의 단위(U)를 본 발명에서는 문헌[Kuyper et al., 2003, FEMS Yeast Res. 4: 69-78]에 개시된 바와 같은 조건하에서 분당 1 nmol의 자일룰로스를 생산하는 효소의 양으로서 정의할 수 있다.
상기 자일로스 아이소머라제 유전자는 다양한 기원, 예를 들어 WO2006/009434에 개시된 바와 같은 피로마이세스 스페시즈(Piromyces sp.)를 가질 수 있다. 다른 적합한 기원은 박테로이데스, 특히 PCT/EP2009/52623에 개시된 바와 같은 박테로이데스 유니포르미스(Bacteroides uniformis), 바실러스, 특히 PCT/EP2009/052625에 개시된 바와 같은 바실러스 스테아로써모필루스(Bacillus stearothermophilus)이다.
또 다른 실시태양에서, 하나 이상의 자일로스 리덕타제 및 자일리톨 데하이드로게나제 유전자의 하나 이상의 사본을 숙주 세포의 게놈내에 도입시킨다. 상기 실시태양에서, 자일로스의 전환을 각각 자일로스 리덕타제 및 자일리톨 데하이드로게나제에 의해 촉진되는 바와 같은, 자일리톨 중간체를 통한 자일로스의 자일룰로스로의 2 단계 전환으로 수행한다. 그의 하나의 실시태양에서 자일로스 리덕타제(XR), 자일리톨 데하이드로게나제(XDH) 및 자일로키나제(XK)를 과발현시킬 수 있으며, 임의로 NADPH 생산 효소를 암호화하는 유전자 중 하나 이상을 WO 2004085627에 개시된 바와 같이 상향 조절하고 NADH 소비 효소를 암호화하는 유전자 중 하나 이상을 상향 조절한다.
XKS1 유전자
형질전환된 숙주 세포는 특정한 자일룰로스 키나제 활성을 증가시키는 하나 이상의 유전자 변형을 포함할 수 있다. 바람직하게 상기 유전자 변형 또는 변형들은 예를 들어 자일룰로스 키나제를 암호화하는 뉴클레오타이드 서열의 과발현에 의해 자일룰로스 키나제의 과발현을 야기한다. 상기 자일룰로스 키나제를 암호화하는 유전자는 상기 숙주 세포에 내인성이거나 또는 상기 숙주 세포에 이종인 자일룰로스 키나제일 수 있다. 상기 숙주 세포에서 자일룰로스 키나제의 과발현에 사용되는 뉴클레오타이드 서열은 자일룰로스 키나제 활성을 갖는 폴리펩타이드를 암호화하는 뉴클레오타이드 서열이다.
"자일룰로스 키나제"(EC 2.7.1.17) 효소는 반응 ATP + D-자일룰로스 = ADP + D-자일룰로스 5-포스페이트를 촉진하는 효소로서 정의된다. 상기 효소는 또한 인산화 자일룰로키나제, D-자일룰로키나제 또는 ATP:D-자일룰로스 5-포스포트랜스퍼라제로서 공지된다. 본 발명의 자일룰로스 키나제를 그의 아미노산 서열에 의해 추가로 정의할 수도 있다. 마찬가지로 자일룰로스 키나제를, 상기 효소를 암호화하는 뉴클레오타이드 서열에 의해서뿐만 아니라 자일룰로스 키나제를 암호화하는 기준 뉴클레오타이드 서열에 하이브리드화하는 뉴클레오타이드 서열에 의해서 정의할 수 있다.
형질전환된 숙주 세포에서, 특이적인 자일룰로스 키나제 활성을 증가시키는 유전자 변형 또는 변형들을 상술한 바와 같이 펜토스 포스페이트 경로의 유출을 증가시키는 변형들 중 임의의 변형과 병행할 수도 있다. 이는 그러나 필수적인 것은 아니다.
따라서, 숙주 세포는 상기 특이적인 자일룰로스 키나제 활성을 증가시키는 유전자 변형 또는 변형들만을 포함할 수 있다. 본 발명의 숙주 세포에서 자일룰로스 키나제의 과발현을 성취하고 분석하기 위해 당해 분야에서 이용할 수 있는 다양한 수단들은 상기 펜토스 포스페이트 경로의 효소들에 대해 상술한 바와 동일하다. 바람직하게 본 발명의 숙주 세포에서 과발현시키려는 자일룰로스 키나제는, 상기 과발현을 야기하는 유전자 변형(들)을 제외하고는 유전적으로 동일한 균주에 비해, 적어도 약 1.1, 약 1.2, 약 1.5, 약 2, 약 5, 약 10 또는 약 20의 인자까지 과발현된다. 이러한 수준의 과발현을 상기 효소 활성의 정상상태 수준, 상기 효소 단백질의 정상상태 수준뿐만 아니라 상기 효소를 암호화하는 전사물의 정상상태 수준에 적용할 수 있다.
알도스 리덕타제 ( GRE3 ) 유전자 결실
XI가 자일로스를 전환시키는 유전자로서 사용되는 상기 실시태양에서, 알도스 리덕타제 활성을 감소시키는 것이 유리할 수 있다. 따라서 형질전환된 숙주 세포는 상기 숙주 세포에서 비특이적인 알도스 리덕타제 활성을 감소시키는 하나 이상의 유전자 변형을 포함할 수 있다. 바람직하게, 비특이적인 알도스 리덕타제 활성을, 비특이적인 알도스 리덕타제를 암호화하는 유전자의 발현을 감소시키거나 또는 불활성화시키는 하나 이상의 유전자 변형에 의해 상기 숙주 세포에서 감소시킨다. 바람직하게, 상기 유전자 변형(들)은 상기 숙주 세포에서 비특이적인 알도스 리덕타제를 암호화하는 유전자의 각각의 내인성 사본의 발현을 감소시키거나 불활성화시킨다(본 발명에서 GRE3 결실이라 칭한다). 형질전환된 숙주 세포는 이배체, 배수체 또는 이수체의 결과로서 비특이적인 알도스 리덕타제를 암호화하는 유전자의 다중 사본을 포함하고/하거나 상기 숙주 세포는 아미노산 서열이 상이하고 상이한 유전자에 의해 각각 암호화되는 알도스 리덕타제 활성을 갖는 다수의 상이한 (아이소)효소를 함유할 수 있다. 또한 상기와 같은 경우에서 바람직하게는 비특이적인 알도스 리덕타제를 암호화하는 각각의 유전자의 발현이 감소되거나 불활성화된다. 바람직하게, 상기 유전자를 상기 유전자의 적어도 일부의 결실에 의해 또는 상기 유전자의 파괴에 의해 불활성화시키며, 이때 이와 관련하여 유전자란 용어는 또한 상기 암호화 서열의 상류 또는 하류의 임의의 비-암호화 서열을 포함하며, 그의 (부분) 결실 또는 불활성화는 숙주 세포에서 비특이적인 알도스 리덕타제 활성의 발현의 감소를 생성시킨다.
숙주 세포에서 감소시켜야 하는 활성을 갖는 알도스 리덕타제를 암호화하는 뉴클레오타이드 서열은 알도스 리덕타제 활성을 갖는 폴리펩타이드를 암호화하는 뉴클레오타이드 서열이다.
따라서, 숙주 세포에서 비특이적인 알도스 리덕타제 활성을 감소시키는 유전자 변형 또는 변형들만을 포함하는 상기 숙주 세포가 본 발명에 특별히 포함된다.
"알도스 리덕타제"(EC 1.1.1.21) 효소는 본 발명에서 자일로스 또는 자일룰로스를 자일리톨로 환원시킬 수 있는 임의의 효소로서 정의된다. 본 발명과 관련하여, 알도스 리덕타제는 본 발명의 숙주 세포에 고유하고(내인성이고) 자일로스 또는 자일룰로스를 자일리톨로 환원시킬 수 있는 임의의 비특이적인 알도스 리덕타제일 수 있다. 비특이적인 알도스 리덕타제는 하기의 반응을 촉진한다:
알도스 + NAD(P)H + H+ ↔ 알디톨 + NAD(P)+
상기 효소는 광범위한 특이성을 가지며 또한 알도스 리덕타제; 폴리올 데하이드로게나제(NADP+); 알디톨:NADP 옥시도리덕타제; 알디톨:NADP+ 1-옥시도리덕타제; NADPH-알도펜토스 리덕타제; 또는 NADPH-알도스 리덕타제로서 공지된다.
상기와 같은 비특이적인 알도스 리덕타제의 특정한 예는, 사카로마이세스 세레비지아에에 내인성이고 GRE3 유전자에 의해 암호화되는 것이다(문헌[Traff et al., 2001 , Appl. Environ. Microbiol. 67: 5668-74]). 따라서, 본 발명의 알도스 리덕타제를 그의 아미노산 서열에 의해 추가로 정의할 수도 있다. 마찬가지로 알도스 리덕타제를 상기 효소를 암호화하는 뉴클레오타이드 서열에 의해서뿐만 아니라 알도스 리덕타제를 암호화하는 기준 뉴클레오타이드 서열에 하이브리드화하는 뉴클레오타이드 서열에 의해서 정의할 수 있다.
바이오제품 생산
수년에 걸쳐 사탕 작물로부터 바이오-에탄올의 생산을 위해 다양한 유기체들의 도입이 제안되었다. 그러나, 실제로, 모든 주요 바이오-에탄올 생산 공정들은 에탄올 생산자로서 사카로마이세스 속의 효모들을 계속해서 사용해 오고 있다. 이는 산업 공정에 대한 사카로마이세스 종의 많은 매력적인 특징들, 즉 높은 산-, 에탄올- 및 삼투-내성, 혐기성 생육 능력, 및 물론 그의 높은 알콜 발효 능력에 기인한다. 숙주 세포로서 바람직한 효모 종은 사카로마이세스 세레비지아에, 사카로마이세스 불데리(Saccharomyces bulderi), 사카로마이세스 바르네티(Saccharomyces barnetti), 사카로마이세스 엑시구우스(Saccharomyces exiguus), 사카로마이세스 유바룸(Saccharomyces uvarum), 사카로마이세스 디아스타티쿠스(Saccharomyces diastaticus), 클루이베로마이세스 락티스(Kluyveromyces lactis), 클루이베로마이세스 마르시아누스(Kluyveromyces marxianus) 또는 클루이베로마이세스 프라질리스(Kluyveromyces fragilis)를 포함한다.
형질전환된 숙주 세포는 에탄올의 생산에 적합한 세포일 수 있다. 그러나, 형질전환된 숙주 세포는 에탄올 외의 발효 산물의 생산에도 적합할 수 있다.
상기와 같은 비-에탄올 발효 산물은 원칙적으로 진핵 미생물, 예를 들어 효모 또는 섬유상 진균에 의해 생성될 수 있는 임의의 벌크 또는 정제 화학약품을 포함한다.
비-에탄올 발효 산물의 생산에 사용될 수 있는 형질전환된 숙주 세포는 감소된 알콜 데하이드로게나제 활성을 생성시키는 유전자 변형을 함유하는 숙주 세포이다.
하나의 실시태양에서 상기 형질전환된 숙주 세포를, 리그노셀룰로스로부터 기원하는 당을 에탄올로 전환시키는 공정에 사용할 수 있다.
리그노셀룰로스
잠재적인 재생 가능한 공급원료로서 간주될 수 있는 리그노셀룰로스는 일반적으로 폴리사카라이드 셀룰로스(글루칸) 및 헤미셀룰로스(자일란, 헤테로자일란 및 자일로글루칸)를 포함한다. 또한, 일부 헤미셀룰로스는 예를 들어 목재-유래된 공급원료 중에 글루코만난으로서 존재할 수 있다. 이들 폴리사카라이드의 용해성 당(단량체 및 다량체 모두, 예를 들어 글루코스, 셀로비오스, 자일로스, 아라비노스, 갈락토스, 프럭토스, 만노스, 람노스, 리보스, 갈락튜론산, 글루코론산 및 다른 헥소스 및 펜토스 포함)으로의 효소적 가수분해는 협력하여 작용하는 상이한 효소들의 작용하에서 일어난다.
또한, 펙틴 및 다른 펙틴 물질, 예를 들어 아라비난이 전형적으로 비-목재성 식물 조직으로부터의 세포벽의 건조 질량의 상당 부분을 구성할 수 있다(건조 질량의 대략 1/4 내지 1/2이 펙틴일 수 있다).
전처리
효소 처리 전에, 상기 리그노셀룰로스 물질을 전처리할 수 있다. 상기 전처리는 상기 리그노셀룰로스 물질을 산, 염기, 용매, 열, 퍼옥사이드, 오존, 기계적 절단, 연마, 분쇄 또는 고속 감압, 또는 이들 중 임의의 둘 이상의 조합에 노출시킴을 포함할 수 있다. 이러한 화학적 전처리는 종종, 예를 들어 1 내지 30분 동안 150 내지 220 ℃의 열-전처리와 병행된다.
효소적 가수분해
상기 전처리된 물질에 통상적으로는 효소적 가수분해를 가하여 본 발명에 따라 발효될 수 있는 당을 방출시킨다. 이를 통상적인 방법, 예를 들어 셀룰라제, 예를 들어 셀로비오하이드롤라제(들), 엔도글루카나제(들), 베타-글루코시다제(들) 및 임의로 다른 효소와의 접촉으로 실행할 수 있다. 상기 셀룰라제에 의한 전환을, 충분량의 당(들)을 방출시키는 반응 시간에서 주변 온도 또는 보다 높은 온도에서 실행할 수 있다. 상기 효소적 가수분해의 결과는 C5/C6 당을 포함하는 가수분해 산물(본 발명에서는 당 조성물로서 표시됨)이다.
발효
상기 발효 공정은 호기성 또는 혐기성 발효 공정일 수 있다. 혐기성 발효 공정을 본 발명에서 산소의 부재하에서 실행되는 발효 공정 또는 실질적으로 산소가 소비되지 않는, 바람직하게는 약 5, 약 2.5 또는 약 1 mmol/L/h 미만, 보다 바람직하게는 0 mmol/L/h가 소비되는(즉 산소 소비를 검출할 수 없는) 발효 공정으로서 정의하며, 여기에서 유기 분자는 전자 공여체 및 전자 수용체 모두로서 작용한다. 산소의 부재하에서, 당분해 및 바이오매스 형성에서 생성된 NADH는 산화적 인산화에 의해 산화될 수 없다. 이러한 문제를 해결하기 위해서, 다수의 미생물들이 피루베이트 또는 그의 유도체 중 하나를 전자 및 수소 수용체로서 사용하여 NAD+를 재생시킨다.
따라서, 바람직한 혐기성 발효 공정에서 피루베이트는 전자(및 수소 수용체)로서 사용되며 발효 산물, 예를 들어 에탄올, 부탄올, 락트산, 다이-터펜, 글리코실화된 다이-터펜, 3-하이드록시-프로피온산, 아크릴산, 아세트산, 숙신산, 시트르산, 말산, 퓨마르산, 아미노산, 1,3-프로판-다이올, 에틸렌, 글리세롤, β-락탐 항생제 및 세팔로스포린으로 환원된다.
상기 발효 공정을 바람직하게는 세포에 최적인 온도에서 실행한다. 따라서, 대부분의 효모 또는 진균 숙주 세포의 경우, 상기 발효 공정을 약 42 ℃ 미만, 바람직하게는 약 38 ℃ 미만인 온도에서 수행한다. 효모 또는 섬유상 진균 숙주 세포의 경우, 상기 발효 공정을 바람직하게는 약 35, 약 33, 약 30 또는 약 28 ℃ 미만의 온도 및 약 20, 약 22 또는 약 25 ℃ 초과의 온도에서 수행한다.
상기 공정에서 자일로스 및/또는 글루코스상의 에탄올 수율은 바람직하게는 적어도 약 50, 약 60, 약 70, 약 80, 약 90, 약 95 또는 약 98%이다. 상기 에탄올 수율을 본 발명에서 이론적인 최대 수율의 백분율로서 정의한다.
본 발명은 또한 발효 산물의 생성 공정에 관한 것이다.
본 발명에 따른 발효 공정은 호기성 및 혐기성 조건하에서 실행될 수 있다. 하나의 실시태양에서, 상기 공정을 미세-호기성 또는 산소 제한 조건하에서 수행한다.
혐기성 발효 공정을 본 발명에서는 산소의 부재하에서 실행되는 발효 공정 또는 실질적으로 산소가 소비되지 않는, 바람직하게는 약 5, 약 2.5 또는 약 1 mmol/L/h 미만이 소비되는 발효 공정으로서 정의하며, 여기에서 유기 분자는 전자 공여체 및 전자 수용체 모두로서 작용한다.
산소-제한 발효 공정은 상기 산소 소비가 기체에서 액체로의 산소 이동에 의해 제한되는 공정이다. 산소 제한 정도는 들어오는 기류의 양 및 조성뿐만 아니라 사용되는 발효 장비의 실제 혼합/물질 이동 성질에 의해 결정된다. 바람직하게, 산소-제한 조건하의 공정에서, 산소 소비율은 약 5.5 이상, 보다 바람직하게는 약 6 이상, 예를 들어 7 mmol/L/h 이상이다. 본 발명의 공정은 상기 발효 산물의 회수를 포함할 수도 있다.
바람직한 공정에서 상기 세포는 자일로스 및 글루코스를 모두 발효하며, 바람직하게는 이중영양적 생육을 방지하기 위한 글루코스 억제에 민감하지 않은 세포가 사용되는 경우, 동시에 발효한다. 탄소원으로서 자일로스(및 글루코스)의 공급원 외에, 상기 발효 배지는 상기 세포의 생육에 필요한 적합한 성분을 추가로 포함할 것이다. 효모와 같은 미생물의 생육을 위한 발효 배지의 조성은 당해 분야에 널리 공지되어 있다.
상기 발효 공정을 배치식, 유가식 또는 연속식으로 수행할 수 있다. 별도의 가수분해 및 발효(SHF) 공정 또는 동시적인 당화 및 발효 (SSF) 공정을 또한 적용할 수 있다. 이들 발효 공정 방식의 조합이 또한 최적의 생산성을 위해 가능할 수 있다. 이들 공정은 이후에 보다 상세히 개시된다.
SSF 방식
동시적인 당화 및 발효(SSF) 방식에 대해서, 액화/가수분해 또는 예비당화 단계를 위한 반응 시간은 목적하는 수율, 즉 셀룰로스에서 글루코스 전환 수율을 실현시키는 시간에 따라 변한다. 상기와 같은 수율은 바람직하게는 가능한 한 높으며, 바람직하게는 60% 이상, 65% 이상, 70% 이상, 75% 이상 80% 이상, 85% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 99% 이상, 심지어 99.5% 이상 또는 99.9% 이상이다.
본 발명에 따라 SHF 방식에서 매우 높은 당 농도 및 SSF 방식에서 매우 높은 생성물 농도(예를 들어 에탄올)가 실현된다. SHF 실시에서 상기 글루코스 농도는 25 g/L 이상, 30 g/L 이상, 35 g/L 이상, 40 g/L 이상, 45 g/L 이상, 50 g/L 이상, 55 g/L 이상, 60 g/L 이상, 65 g/L 이상, 70 g/L 이상 , 75 g/L 이상, 80 g/L 이상, 85 g/L 이상, 90 g/L 이상, 95 g/L 이상, 100 g/L 이상, 110 g/L 이상, 120g/L 이상이거나 또는 예를 들어 25 g/L 내지 250 g/L, 30 gl/L 내지 200 g/L, 40 g/L 내지 200 g/L, 50 g/L 내지 200 g/L, 60 g/L 내지 200 g/L, 70 g/L 내지 200 g/L, 80 g/L 내지 200 g/L, 90 g/L , 80 g/L 내지 200 g/L일 수 있다.
SSF 방식에서 생성물 농도
SSF 실시에서, 생성물 농도(g/L)는 생성되는 글루코스의 양에 따라 변하지만, 당이 상기 SSF에서 생성물로 전환되기 때문에 가시적이지 않으며, 생성물 농도는 이론적인 최대 수율(글루코스 그램당 생성물 gr의 Yps max)이 곱해진 근원적인 글루코스 농도와 관련될 수 있다.
발효 산물의 이론적인 최대 수율(글루코스 그램당 생성물 gr의 Yps max)은 생화학 교과서로부터 유도될 수 있다. 에탄올의 경우, 1몰의 글루코스(180 g)는 효모에서 통상적인 당분해 발효 경로에 따라 2몰의 에탄올(=2x46=92 gr 에탄올)을 제공한다. 상기 글루코스상의 에탄올의 이론적인 최대 수율은 따라서 92/180=0.511 gr 에탄올/gr 글루코스이다.
부탄올(MW 74 gr/몰) 또는 아이소부탄올의 경우, 상기 이론적인 최대 수율은 글루코스의 몰당 1몰의 부탄올이다. 따라서 (아이소)부탄올에 대한 Yps max는 74/180=0.411 gr (아이소)부탄올/gr 글루코스이다.
락트산의 경우 동종락트산 발효에 대한 발효 수율은 글루코스 몰당 2몰의 락트산(MW = 90 gr/몰)이다. 상기 화학량론에 따라, 상기 Yps max는 1 gr 락트산/gr 글루코스이다.
다른 발효 산물의 경우 유사한 결과가 이루어질 수 있다.
SSF 방식
SSF 실시에서 생성물 농도는 25 * Yps g/L /L 이상, 30 * Yps g/L 이상, 35g * Yps /L 이상, 40 * Yps g/L 이상, 45 * Yps g/L 이상, 50 * Yps g/L 이상, 55 * Yps g/L 이상, 60 * Yps g/L 이상, 65 * Yps g/L 이상, 70 * Yps g/L 이상 , 75 * Yps g/L 이상, 80 * Yps g/L 이상, 85 * Yps g/L 이상, 90 * Yps g/L 이상, 95 * Yps g/L 이상, 100 * Yps g/L 이상, 110 * Yps g/L 이상, 120g/L * Yps 이상이거나 또는 예를 들어 25 * Yps g/L 내지 250 * Yps g/L, 30 * Yps gl/L 내지 200 * Yps g/L, 40 * Yps g/L 내지 200 * Yps g/L, 50 * Yps g/L 내지 200 * Yps g/L, 60 * Yps g/L 내지 200 * Yps g/L, 70 * Yps g/L 내지 200 * Yps g/L, 80 * Yps g/L 내지 200 * Yps g/L, 90 * Yps g/L , 80 * Yps g/L 내지 200 * Yps g/L일 수 있다.
따라서, 본 발명은 발효 산물의 제조 방법을 제공하며, 상기 방법은
a. 본 발명에 개시된 바와 같은 방법을 사용하여 리그노셀룰로스를 분해시키고;
b. 상기 생성 물질을 발효시켜
발효 산물을 제조함을 포함한다.
발효 산물
본 발명의 발효 산물은 임의의 유용한 생성물일 수 있다. 하나의 실시태양에서, 상기는 에탄올, n-부탄올, 아이소부탄올, 락트산, 다이-터펜, 글리코실화된 다이-터펜, 3-하이드록시-프로피온산, 아크릴산, 아세트산, 숙신산, 시트르산, 퓨마르산, 말산, 이타콘산, 말산, 시트르산, 아디프산, 아미노산, 예를 들어 리신, 메티오닌, 트립토판, 쓰레오닌 및 아스파트산, 1,3-프로판-다이올, 에틸렌, 글리세롤, β-락탐 항생제 및 세팔로스포린, 비타민, 약제, 동물 사료 보충제, 전문 화학물질, 화학물질 공급원료, 플라스틱, 용매, 생물연료 및 생물기체를 포함한 연료, 또는 유기 중합체, 및 산업용 효소, 예를 들어 프로테아제, 셀룰라제, 아밀라제, 글루카나제, 락타제, 리파제, 라이아제, 옥시도리덕타제, 트랜스퍼라제 또는 자일라나제로 이루어지는 군 중에서 선택되는 생성물이다. 예를 들어 상기 발효 산물을 종래 기술 세포 제조 방법 및 발효 공정에 따라 본 발명에 따른 세포에 의해 생성시킬 수 있으나, 이들의 예는 본 발명에서 제한으로서 간주되지 않는다. n-부탄올을 WO2008121701 또는 WO2008086124에 개시된 바와 같이 세포에 의해 생성시킬 수 있고; 락트산을 US2011053231 또는 US2010137551에 개시된 바와 같이; 3-하이드록시-프로피온산을 WO2010010291에 개시된 바와 같이; 아크릴산을 WO2009153047에 개시된 바와 같이 생성시킬 수 있다.
발효 산물의 회수
상기 발효 산물의 회수를 위해서 기존의 기술들을 사용한다. 상이한 발효 산물들의 경우에 상이한 회수 공정들이 적합하다. 수성 혼합물로부터 에탄올을 회수하는 기존의 방법은 통상적으로 분별화 및 흡착 기법을 사용한다. 예를 들어, 수성 혼합물 중에 에탄올을 함유하는 발효 산물을 가공하여 풍부한 에탄올-함유 혼합물을 생성시키고 이어서 분별화(예를 들어 분별 증류 또는 다른 유사 기법들)를 가하는 공정에 여전히 맥주가 사용될 수 있다. 이어서, 최고 농도의 에탄올을 함유하는 분획을 흡착제에 통과시켜 상기 에탄올로부터 남은 물의 대부분(전부는 아니지만)을 제거할 수 있다.
하기의 실시예들은 본 발명을 예시한다:
실시예
방법
분자 생물학 기법 및 화학물질.
제한 효소 및 T4 DNA 리가제를 페르멘타스(Fermentas)로부터 획득하였다. 항생제 하이그로마이신(HG), 플레오마이신(플레오(phleo)) 및 제네티신(G418)을 인비보젠(Invivogen)으로부터 획득하였다. pYL16 및 누르세오트리신(누르(nour))을 베르너 바이오에이전츠(Werner Bioagents)로부터 획득하였다. 암피실린 및 가나마이신을 시그마 알드리치로부터 획득하였다.
PCR 증폭을 위해서, 퓨전(Phusion)(등록상표) 하이파이 DNA 폴리머라제(핀자임스(Finnzymes))를 사용하였다. PCR 단편을 TOPO(등록상표) TA 클로닝(등록상표) 키트 또는 제로 블런트(Zero Blunt)(등록상표) TOPO(등록상표) PCR 클로닝 키트(둘 다 라이프 테크놀로지스(Life Technologies)로부터)를 사용하여 서브-클로닝시켰다. 균주 제조에 사용된 올리고뉴클레오타이드는 시그마 알드리치로부터 구입하였다.
플라스미드를 증폭시키고 화학적으로 적격인 TOP10 세포(TOPO(등록상표) TA 클로닝(등록상표) 키트, 라이프 테크놀로지스)에서 제조사의 설명에 따라 유지시켰다. 플라스미드를 진제트(GeneJET)(상표) 플라스미드 미니프렙(Miniprep) 키트(페르멘타스)를 사용하여 에스케리키아 콜라이 미니 배양물로부터 단리시켰다. 게놈 DNA를 이스타(YeaStar)(상표) 게노믹 DNA 키트(자이모리써치(ZymoResearch))를 사용하여 제조사의 설명에 따라 효모로부터 단리하였다.
표준 분자 생물학 및 효모 유전학 기법을 문헌[Sambrook et al.(1989)] 및 문헌[Ausubel et al. (1995)]을 포함한 교과서에 따라 수행하였다.
균주 및 유지.
본 연구에 사용된 균주들(표 2)의 보관을 위해서, 진탕 플라스크 배양을 2% 글루코스(YPD), 2% 말토스(YPM) 또는 3% 자일로스(YPX)가 보충된, 10 gℓ-1 효모 추출물(옥소이드(Oxoid)) 및 20 gℓ-1 펩톤(BD 디프코(Difco))으로 이루어지는 풍부 배지(YP)에서 수행하였다. 배양물을 상기 배양물이 정지기에 도달할 때까지 궤도 진탕기에서 30 ℃에서 유지시켰다. 글리세롤을 30%(v/v)로 가한 후에, 진탕-플라스크 배양물로부터의 샘플을 -80 ℃에서 2 ㎖ 분액으로 보관하였다.
[표 2]
본 발명에 사용되거나 제조된 균주
Figure pct00002
진탕 플라스크 배양물에서 OD600 및 HPLC 분석.
진탕 플라스크 배양물을 배양 동안 규칙적으로 샘플링하였다. OD600 측정을 위해서, 배양물을 정확한 측정을 위해 적합하게 희석하고 광학 밀도를 퍼킨 엘머 분광광도계 λ2 장비에서 600 ㎚ 파장에서 측정하였다. 남은 샘플을 여과하여 효모로부터 배지를 분리시켰다.
상기 여액을 HPLC 분석을 위해 적합한 바이알에 삽입하였다. 상기 배지 중 글루코스, 자일로스, 글리세롤, 아세트산 및 에탄올의 농도를 시마츠(Shimadzu) HPLC 시스템을 사용하여 측정하였다. 상기 시스템에는 보호 컬럼(바이로 래드(Bio-Rad) H 카트리지, 바이오 래드) 및 애미넥스(Aminex) HPX-87H 컬럼(300 x 7.8 ㎜; 바이오 래드)을 갖는 컬럼 오븐 CTO-10A-vp 및 오토인젝터(Autoinjector) SIL-10AD-vp가 장착되어 있다. 용리는 80 ℃에서 5 mM H2SO4에 의해 0.6 ㎖/min으로 일어났다. 용출물을 굴절률 검출기 RID-10A(시마츠)를 사용하여 모니터하였다.
생육 곡선 프로파일링을 위한 마이크로웰 플레이트.
균주의 마이크로웰 배양을 위해서, 바이오스크린(Bioscreen) C(그로스 커브스 리미티드(Growth Curves Ltd.)를 사용하였다. 밤새 예비-배양물을 펠릿화하고, 순수로 세척하고, 접종을 위해 목적하는 OD600의 2배로 순수로 희석하였다. 배지를 목적하는 농도의 2배로 제조하였다. 벌집 웰플레이트의 한 웰에서, 150 ㎕ 배지를 150 ㎕ 세포 현탁액과 혼합하였다. 측정은 3회 중복 수행되었다. 상기 바이오스크린 C에 대한 설정을 30 ℃ 배양 T에서 유지시키고, 15분마다 측정하고, 연속 유형, 최대 진폭 및 통상 속도로 진탕시켰다. 진탕을 측정 5초 전에 정지하도록 설정하였다.
자동 형질전환 및 콜로니 피킹.
상기 모델 균주내로의 포화 돌연변이유발 라이브러리의 형질전환 발생을 위해서 진탕-플라스크 배양을, RN1053의 경우 YPM에서, 또는 YD01227의 경우 YPX에서 수행하였다(하기 참조). 효모 세포를 펠릿화하고, 후속으로 문헌[Schiestl and Gietz(1989)]에 근거한 자동 형질전환 프로토콜에 사용하였다. 형질전환 혼합물을, 2% 말토스(RN1053 형질전환) 또는 3% 자일로스(YD01227 형질전환)가 보충된, 효모 질소 염기(시그마 알드리치; 6.7 gℓ-1), 아가(BD 바이오사이언시즈; 15 gℓ- 1)로 이루어지는 선택 배지상에 도말하였다. 형질전환 플레이트를 30 ℃에서 배양하고, 콜로니 형성 후 콜로니를 자동화된 공정을 사용하여 재도말하여 콜로니를 상기 지칭된 선택 배지를 함유하는 96 웰 미세적정 플레이트(MTP)로 옮겼다. 형질전환체를 갖는 MTP를 분명한 생육이 관찰될 때까지 30 ℃에서 배양하였다.
NMR 분석.
샘플 중 글루코스, 자일로스, 글리세롤, 아세트산 및 에탄올의 정량분석을 위해서, 100 ㎕ 샘플을 적합한 바이알에 정확하게 옮긴다. 후속으로, D2O 중의 말레산(20 g/ℓ), EDTA(40 g/ℓ) 및 미량의 DSS(4,4-다이메틸-4-실라펜탄-1-설폰산), 및 450 ㎕ D2O를 함유하는 100 ㎕ 내부 표준 용액을 가한다.
1D 1H NMR 스펙트럼을 27 ℃의 온도에서 수 현탁액에 의한 펄스 프로그램(3 Hz에 상응하는 전력)을 사용하여, 저온-탐침이 장착된 브루커 어밴스(Bruker Avance) III 700 MHz상에 기록한다.
상기 분석물 농도를 하기의 신호(DSS에 대한 δ)를 근거로 계산한다:
· α-글루코스 피크(5.22 ppm에서) (d, 0.38 H, J = 4 Hz),
· α-자일로스 피크(5.18 ppm에서) (d, 0.37 H, J = 4 Hz),
· 글리세롤 피크(3.55 ppm에서) (dd, 2 H, J1,2 = 6 Hz 및 J1a,1b = 12 Hz)
· 아세트산 피크(1.91 ppm에서) (s, 3 H)
· 에탄올 피크(1.17 ppm에서) (t, 3 H, J = 7Hz)
· 표준에 대한 신호 사용자:
· 말레산 피크(6.05 ppm에서) (s, 2H)
실시예 1 - 헥소스 수송체 유전자 결실
결실 카세트 제작.
플라스미드 제작에 사용된 프라이머들을 표 3에 나타내며; 생성된 플라스미드들은 표 4에 나타낸다. 클로닝에 사용된 제한 부위 및 상기 플라스미드 주쇄로부터 결실 구축물의 방출에 사용된 부위에 대한 설계를 표 5에 나타낸다.
[표 3]
실시예들에 사용된 프라이머들(올리고뉴클레오타이드들)
Figure pct00003
Figure pct00004
Figure pct00005
[표 4]
균주 제작에 사용된 플라스미드들
Figure pct00006
[표 5]
클로닝 설계
Figure pct00007
상기 kanMX 마커를 프라이머 서열번호 1 및 2를 사용하여 플라스미드 pFA6-kanMX4(http://www-sequence.stanford.edu/group/yeast_deletion_project/kanmx4.txt)로부터 증폭시켰다. 후속으로, 상기 kanMx 마커를 프라이머 서열번호 3 및 4와 함께 PCR 증폭에 의해 loxP 플랭크 첨가를 통해 분배(floxing)하였다. 재-증폭을 프라이머 서열번호 5 및 6으로 수행하였다. 생성되는 loxP-kanMX-loxP 단편을 pCR-BLUNT에 클로닝하여 pRN201(서열번호 7)을 생성시켰다.
pRN251(서열번호 8)의 제작을 위해서, hphMX를 pGRE3:hphMX(문헌[Kuyper et al, 2005])로부터 단리하였다. hphMX의 부근에서 적합한 제한 부위로서 MluI 부위를 결실시키기 위해서, pGRE3:hphMX를 Eco32I로 절단하고 다시-연결시켰다. 후속으로, hphMX를 XhoI-MluI 단편으로서, SalI 및 MluI로 절단된 pRN201내에 클로닝시켜 kanMX를 치환시켰다.
pRN365(서열번호 9)의 제작을 위해서, 스트렙토마이세스 누르세이(Streptomyces noursei) nat1 유전자를 서열번호 10 및 11을 갖는 프라이머를 사용하여 pYL16(베르너 바이오에이전츠)으로부터 PCR-증폭시켰다. nat1 대신에 kanR을 치환하기 위해서, Acc65I-NcoI pRN201-단편과 함께 PscI-ScaI nat1 단편을, 이미 Acc65I 및 ScaI로 선형화시킨 pRN201내에 클로닝하였다.
pRN447(서열번호 12)의 제작을 위해서, pRN201을 PmlI로 절단하였다. 이는 2개의 단부를 제공하였다. 먼저, 스트렙토알로테이쿠스 힌두스타누스 블레(Streptoalloteichus hindustanus ble)(제오신 또는 플레오마이신 내성 유전자) ORF를 단리하고, 둘 째로 상기 PmlI-절단된 pRN201의 재-연결 후에 NcoI 부위를 결실시켰다. 후속으로, NcoI - PmlI 단편으로서 ble BamHI - NcoI 벡터 단편으로서 pRN201의 부분을 상기 재-연결된 pRN201(ble 누락)에 클로닝하고, BamHIScaI으로 절단시켜 pRN447을 생성시켰다.
HIS3 결실 구축물의 경우, 프라이머 서열번호 13 및 14를 사용하여 효모 게놈 DNA로부터 상기 HIS3 자리를 증폭시켰다. 상기 HIS3 플랭크를 절단시키고 이를 분배된 kanMX 마커에 연결시키기 위해 사용된 부위들을 표 5에 나타낸다. 상기 연결 생성물을 SacIApaI로 절단하고 SacIApaI로 절단된 pCR-BLUNT내에 클로닝하였다. 생성되는 플라스미드는 pRN247(서열번호 15)이다.
사카로마이세스 세레비지아에에서 8개의 주 헥소스 수송체(HXT1-7 GAL2)의 결실을 위해서, 4개의 결실 구축물을 생성시켰다(표 4 참조). 각각의 결실 구축물은 상이한 분배된 우성 내성 마커를 함유하였다. 각각의 HXT 유전자에 대해서 400 내지 700 bp 플랭크를, 주형으로서 RN1001 게놈 DNA를 사용하고 표 3에 나열된 프라이머들(서열번호 16-31)을 사용하여 증폭시켰다. 상류 플랭크, 우성 내성 마커 및 하류 마커를 표 5에 나열된 단편 및 클로닝 부위를 사용하여 연결시켰다. 상기 연결을 상기 상류 플랭크의 순방향 프라이머 및 상기 하류 플랭크의 역방향 프라이머를 사용하여 증폭시켰다(프라이머 조합 서열번호 16+19, 서열번호 20+27, 서열번호 24+23, 및 서열번호 28+31). 상기 융합된 PCR 단편들을 pCR-BLUNT내에 클로닝하여 pRN485, pRN566, pRN569, pRN635(각각 서열번호 32-35)를 획득하였다. 고 수율의 플라스미드 DNA를 획득하기 위해서, 상기 플라스미드들을 뉴클레오본드(NucleoBond)(등록상표) 엑스트라 미디 키트(Xtra Midi kit)(비오케(Bioke), 네덜란드 라이덴 소재)를 사용하여 50 ㎖ 에스케리키아 콜라이 배양물로부터 단리하였다. 효모에 대한 형질전환 전에, 결실 구축물을 표 5에 나열된 방출 제한 부위에 의한 절단에 의해 플라스미드 주쇄로부터 방출시켰다.
균주 제작.
자일로스-발효 균주 RN1001을 HIS3 자리에서 loxP - kanMX - loxP(pRN247; 서열번호 15로부터 방출된)의 삽입에 의해 히스티딘 영양요구성으로 만들었다. 후속으로, 상기 마커를 플라스미드 pRN187(갈락토스-유도성 cre 리콤비나제; 서열번호 60을 발현하는 pSH65로부터 유래된)의 일시적인 발현을 통해 제거하였다. pRN187의 도입을 플레오상에서 선택하였으며 CRE 리콤비나제 발현을 갈락토스가 보충된 YP-배지상에서 유도하였다. 생성되는 his3:loxP 균주를 RN1041이라 명명하였다. 상기 헥소스 수송체를 하기의 순서로 결실시켰다: 1) HXT3-HXT6-HXT7 클러스터, 2) HXT5-HXT1 -HXT4 클러스터, 3) GAL2, 4) HXT2. 상기 결실 구축물들을 표 5에 나열된 효소 조합들에 의한 절단에 의해 선형화하거나 또는 상기 플라스미드 주쇄로부터 방출시키고, 이들을 RN1041의 게놈에 편입시켰다. 모든 형질전환체를 20 g/L 말토스가 보충된 효모 추출물(10 g/L), 펩톤(20 g/L) 아가(15 g/L) 배지상에 도말하였다. 말토스를 상기 배지에 가하였는데, 그 이유는 상기 다이사카라이드의 흡수가 글루코스 수송 시스템보다는 또 다른 수송 시스템을 통해 진행하기 때문이다(문헌[Wieczorke et al., 1999]). HXT 유전자(들)(의 클러스터) 각각의 결실과 함께, 추가적인 마커를 하기의 순서로 삽입하였다: 1) hphMX, 2) natMX, 3) zeoMX, 4) kanMX. 각각 삽입된 추가적인 마커와 함께 각각의 항생제를 하기의 순서로 상기 배지에 추가로 보충하였다: 1) HG, 2) HG 및 누르, 3) HG, 누르 및 플레오, 4) HG, 누르, 플레오 및 G418. 4개 모두의 결실 구축물의 편입 후에, 단일 콜로니를 4개의 항생제 모두의 선택하에서 단리하였다. 정확한 편입을 게놈 DNA 단리물상에서의 PCR 분석에 의해 입증하였다. 상기 편입 부위 밖의 프라이머들을 사용하였다(서열번호 36+37, 서열번호 38+39, 서열번호 40+41, 서열번호 42+43 조합; 표 3에 나열된 서열들).
균주 특성화.
상기 (중간) 헥소스 수송체 균주를 특성화하기 위해서, 진탕 플라스크 배양을 수행하였다. 배양물을 OD600=0.1로 접종하였다. 생성 균주, RN1053(Δhxt1-7; gal2-돌연변이 RN1041; 정확한 유전자형에 대해서는 표 2를 참조하시오)은 60시간 후에 오직 글루코스상에서 서서히 생육하기 시작하는, 0.2 gℓ-1 히스티딘(시그마 알드리치; 베르듀인-유레아-his; 상기 히스티딘 영양요구성을 보충하기 위해서) 및 15 gℓ-1 글루코스 및 20 gℓ-1 자일로스가 보충된 베르듀인-유레아(질소원으로서 유레아를 사용하는 베르듀인에 따른 무기질 배지; 문헌[Luttik et al, 2001])상에서의 지연된 생육 패턴을 나타내었으며; 흥미롭게도, 글루코스가 상기 배지 중에 존재한 경우 자일로스도 또한 150시간 후에 완료되었고(도 1), 이는 은닉 헥소스 수송체 유전자(HXT8 -17) 중 하나 이상이 글루코스상에서 유도되었고 자일로스 수송을 촉진함을 암시한다(도 1). 그러나, 유일한 탄소원으로서 자일로스 상에서 RN1053은 상기 배양 기간 동안 베르듀인-유레아(+20 gℓ-1 %자일로스) 상에서 생육하지 않았으며(도 2), 이는 상기 균주를 추정의 자일로스 수송체 시험을 위한 모델 균주로서 사용할 수 없음을 암시한다. RN10153을 YPM상에서 추가로 유지시켰다.
실시예 2 - 헥소키나제 유전자 결실
결실 카세트 제작.
헥소키나제 유전자의 결실을 위해서 상기 헥소키나제 유전자 자리에 상동성인 60개의 뉴클레오타이드 인접 서열 및 분배된 우성 내성 마커 카세트에 상동성인 20개의 뉴클레오타이드로 구성된 올리고뉴클레오타이드를 디자인하였다(서열번호, 표 3). 상기 올리고뉴클레오타이드를 사용하여 결실 구축물을 증폭시켰다. 후속으로 PCR 산물을 컬럼 여과-정제하고(페르멘타스 진제트(Fermentas GenJet) 키트) 형질전환 실험에 사용하였다. 3가지 유형의 결실 카세트를 사용하였다: 먼저, GLK1HXK2 결실의 경우 2연 시스템을 사용하였다. 하나의 단편은 lox66 부위, KanMX, CRE의 상류 GAL1 프로모터, 및 하나의 유전자-특이적인 프라이머(GLK1의 경우 서열번호 44 및 HXK2의 경우 서열번호 45) 및 하나의 pSUC227-특이적인 프라이머(서열번호 46)를 갖는 pSUC227로부터 증폭된 CRE의 5'-부분(CRE1)으로 이루어졌고; 두 번째 단편은 CRE1상에 겹쳐진 CRE의 3'-부분(CRE2), 및 다시 하나의 유전자-특이적인 프라이머(GLK1의 경우 서열번호 47 및 HXK2의 경우 서열번호 48) 및 하나의 pSUC225-특이적인 프라이머(서열번호 49)를 갖는 pSUC225로부터 증폭된 lox71 부위로 이루어졌다. 상동성 재조합을 통해 상기 두 단편을 헥소키나제 자리에서 lox66-kanMX-CRE-lox71로서 편입한다(pSUC225 및 pSUC227 서열 및 PCT/EP2013/055047에 제공된 방법). 두 번째로, HXK1(프라이머 서열번호 50-51) 및 GAL1(프라이머 서열번호 52-53) 결실을 위해서, 분배된 우성 내성 마커(DRM)를 각각의 헥소키나제에 상동성인 인접 서열로 증폭시켜 상기 자리에서 상기 암호화 영역을 치환시켰으며; 상기 DRM 카세트의 PCR 증폭을 위한 주형으로서 각각 pRN774(loxP-hphMX-loxP; 서열번호 54) 및 pRN775(loxP-natMx-loxP; 서열번호 55)를 사용하였다. 세 번째로, HIS3 결실이 수송체 에피솜 플라스미드에 의한 상기 영양요구성 표현형의 보완을 허용하기 위해서, HIS3-상동성 플랭크를 갖는 유사한 구축물을 RN1041(RN1001-his3:loxP, 균주 RN1053 과 중의; 상기 실시예 1을 참조하시오)의 생성에 사용된 바와 같이 편입시켰다. 이 경우에 상기 구축물은 kanMX 대신에 우성 내성 마커로서 natMX를 가졌다(서열번호 61).
균주 제작.
헥소스 대사는 불가능하지만 헥소스 수송은 가능한 균주를 생성시키기 위해서, 헥소키나제 유전자 결실을 자일로스-발효 균주 RN1014(표 2; 결실 설계에 대해서 도 3)에서 수행하였다.
언급한 바와 같이, GLK1HXK2의 경우에, 붕괴 카세트는 2연성(bipartite)이었다. 상동성 재조합을 통해서 상기 두 단편은 상기 헥소키나제 자리에서 lox66-kanMX-CRE-lox71로서 편입된다. 상기 편입은 G418이 보충된 YPD상에서 선택되었다. HXK1GAL1에 대한 붕괴 카세트는 하나의 단편: 각각 loxP-natMX-loxP 또는 loxP-hphMX-loxP로 이루어졌다. RN1014를 정제된 PCR 산물로 형질전환시키고 상기 편입을 적합한 항생제상에서 선택하였다. 추가로, HIS3을 RN1053의 생성에 사용된 유사한 구축물(서열번호 61)로 붕괴시켰다. 이 경우에 natMX가 kanMX 대신에 선택 마커였다.
상기 유전자들을 하기의 순서로 결실시켰다: 1) GLK1, 2) HXK1, 3) GAL1, 4) HXK2 및 5) HIS3. GLK1HXK1의 결실 후에, 상기 두 마커를 모두 갈락토스-유도성 Cre-매개된 재조합에 의해 재순환시켰다. HXK2의 결실 후에 중간 균주를 자일로스-함유 풍부 배지(YPX)상에서 유지시켰다. HIS3의 결실 후에, 상기 편입된 hphMX 및 kanMX 마커들을 갈락토스-유도된 CRE 재조합에 의해 제거하였다. 상기 균주의 생육을 보장하기 위해서, 2% 자일로스를 YP 2% 갈락토스 + 누르세오트리신(YPGX)에 가하였다. 누르세오트리신상에서의 선택은 상기 HIS3 자리에서의 상기 natMX 마커의 유지를 보장하여 가능하게는 나중에 사용되는 선택 특성을 남긴다. 단일 콜로니 단리 후에, 상기 균주를 콜로니 PCR에 의해 그의 결실 및 델타 서열 프로파일에 대해 확인하고, YD01227이라 명명하였다.
균주 특성화.
베르듀인-유레아-his를 사용하는 호기성 진탕 플라스크 배양 실험에서, YD01227과 동일한 4중 헥소키나제 녹아웃(KO) 유전자형(col2)을 갖는 또 다른 콜로니를, 과잉의 글루코스(10%)의 부재 및 존재하에서 자일로스를 소비하는 그의 능력, 및 글루코스를 소비하는 그의 능력에 대해 예비-선별에서 특성화하였다(도 4). 배양물을 OD600=0.1에서 접종하였다. RN1014 및 4중 헥소키나제 KO 모두 자일로스상에서 생육하고 자일로스를 소비할 수 있다(데이터 도시 안 됨). 또한 예상한대로, 상기 4중 헥소키나제 KO는 글루코스상에서 생육하지도 글루코스를 소비하지도 않는 반면, RN1014는 상기 글루코스를 생육하고 소비한다(데이터 도시 안 됨). 더욱 또한, 상기 과잉의 글루코스(10%)는 96시간 이상 동안 자일로스상에서의 생육 및 소비를 방지하는 반면, RN1014는 자일로스를 사용한다(도 4).
바이오스크린 C 실험에서, YD01227 및 상기 언급된 col2를, 상이한 당 및 당 혼합물이 보충된 베르듀인-유레아-his상에서 생육에 대해 선별하였다. 배양물을 OD600=0.05에서 접종하였다. YD01227은 자일로스상에서 생육하였으나 글루코스, 말토스 또는 갈락토스상에서는 생육할 수 없었다(데이터 도시 안 됨). 상기 글루코스-자일로스 혼합물을 펜토스-특이적인 수송체에 대한 선별에 적합한 배지 조성의 선택을 지지하기 위해 선별하였다. 도 5에서 보이는 바와 같이, 5:1의 글루코스:자일로스의 비의 경우 균주 YD01227에 대해서 자일러스 상에서 최적의 생육 억제를 나타내었다. 이는 낮은 당부하(2.5:0.5)에 관하여, 둘 다 높은(10:2) 경우였다. YD01227을 저장 및 취급을 위해 YPX상에서 추가로 유지시켰다.
실시예 3. GAL2 포화 돌연변이유발 라이브러리 및 다른 구축물
야생형(WT) GAL2에 대한 합성 DNA 구축물을 진아트(GeneArt)(서열번호 56; 인비트로젠)에 주문하였으며 위치지정 돌연변이유발을 위한 주형으로서 사용하였다. 상기 합성 WT GAL2 DNA 구축물을 상기 합성 WT GAL2 구축물에 대한 또 다른 ORF를 교환하는 XbaI - BssHII 단편으로서 pRN993(서열번호 57)내에 클로닝하여 pDB1250(서열번호 58)을 생성시켰다. pDB1250은 pRS313을 기본으로 하는 효모 셔틀 벡터이며, 가장 현저한 특징으로서 합성적으로 제조된 GAL2 ORF 외에: 1) 히스티딘 영양요구성을 보완하기 위한 HIS3 발현 카세트, 2) 효모 세포에서 상기 발현 벡터의 1 내지 2개 사본(낮은 사본수)을 유지하기 위한 CEN.ARSH, 3) 중간 발현 수준의 하류 ORF를 생성시키는 절두된 HXT7 프로모터(-491 bp), 4) ADH1 종결자, 및 5) 클로닝 목적으로 에스케리키아 콜라이 TOP10 세포(상기 참조)에서 선택을 위한 암피실린 내성 유전자(ampr)를 갖는다(도 6). Gal2p 중의 30개 아미노산 위치상의 13개 이상의 비-야생형 아미노산 변화에 대한 포화 돌연변이유발 라이브러리를 인비트로젠 라이프 테크놀로지스에 주문하였다. ((http://www.invitrogen.com/site/us/en/home/Products-and-Services/Applications/Cloning/gene-synthesis/directed-evolution/GeneArt-Site-Saturation-Mutagenesis.html); 야생형 Gal2p 아미노산 서열(서열번호 59)에 대한 위치 및 아미노산 변화에 대해서 표 6을 참조하시오.
[표 6]
GAL2 단일 부위 포화 돌연변이유발 라이브러리
Figure pct00008
생성되는 구축물들을 진아트(인비트로젠, 독일 레겐스부르크 소재)에서 주문 클로닝에 의해 pDB1250(서열번호 ID58)에 삽입하였다.
실시예 4: 글루코스 수송 활성 역-선별
목적.
글루코스 수송 활성 카운터 (GTAC)-선별을 사용하여, 즉 숙주로서 헥소키나제-돌연변이 균주 YD01227을 형질전환시켜 GAL2 변체를 도입시키고 생성되는 형질전환체를 5배 더 높은 양의 글루코스의 존재하에서 자일로스상에서의 생육 및 자일로스 소비에 대해 배지상에서 선별하여, Gal2p 변체 중의 잉여 글루코스의 존재하에 상기 자일로스에 유리한(즉 자일로스 수송 능력을 다소 완전하게 유지하면서 글루코스보다 더 높은 자일로스에 대한 친화성, 글루코스 수송 능력의 감소 또는 보다 바람직하게는 완전한 제거) 돌연변이를 확인할 수 있다.
형질전환 및 콜로니 피킹.
YD01227을 총 497개의 구축물로 형질전환시켰으며, 상기 구축물들은 각각 GAL2 돌연변이체를 갖는다. 야생형 GAL2 서열을 갖는 하나의 구축물(pDB1250; 서열번호 58)을 대조군으로서 포함시켰다. 각각의 형질전환을 위해서, 3개의 콜로니(입수할 수 있는 경우)를 아가 배지 MTP에 재도말하여 형질전환체가 1450개에 달하였다. 상기 1450개의 형질전환체를 3 부분으로 선별하였다. 상기 선별의 각 부분에 대해서, 야생형 GAL2를 대조군으로서 포함시켰다.
예비 배양 및 선별.
예비-배양을 위해서, 형질전환체를 선택 아가 배지 MTP로부터, 3% 자일로스가 보충된 무기질 배지(질소원으로서 유레아를 갖는 베르듀인에 따른)로 이루어지는 액체 선택 배지를 함유하는 96 웰 절반-깊이웰 플레이트(96HDWP)로 자동 공정에 의해 옮겼다. 상기 96 HDWP를 30 ℃ 및 750 rpm에서 궤도 진탕기에서 3일의 예비-배양 동안 배양하였다. 후속으로, 각 웰에 대해서 20 ㎕의 배양물을, 하기의 농도: 10 gℓ-1 글루코스 및 2 gℓ-1 자일로스의 5:1 비의 글루코스:자일로스 당 혼합물이 보충된 2.5 ㎖ 베르듀인-유레아를 함유하는 24 깊은웰 플레이트(24 DWP)(YD10-배지)에 자동 공정에 의해 옮겼다. 각각의 3개의 샘플링 시점에 대해서 일련의 24DWP를 접종하였다. 각 24DWP상에, 플레이트 변화 효과를 가리키도록 하나의 RN1001 생육 대조군을 접종하였다. 24시간, 72시간 및 96시간 후에, 자동 샘플링 및 96HDWP로의 이동을 600 ㎚ 파장에서 자동화된 OD-측정을 위해 수행하였다.
96시간 후 최종 OD 측정 후에, 세포를 원심분리 후에 펠릿화하고 100 ㎕ 상등액을 배양후 배지 중의 잔류 구성성분의 유식-NMR 분석을 위해 자동 공정에 의해 수거하였다(방법 설명에 대해서 상기를 참조하시오). 각각의 구축물 및 각 시점에 대해서, 상이한 복제물들에 대해 측정된 잔류 글루코스 및 자일로스 농도를 평균하였다. 상기 선별의 상이한 부분들을 비교하기 위해서, 상대값을 하기 식에 따라, 상기 GTAC 선별의 특정 부분에서 측정된 야생형 잔류 자일로스 농도에 대한 차이를 기준으로 계산하였다:
RelXyl = {(잔류 자일로스Gal2 -야생형 - 잔류 자일로스Gal2 -돌연변이체)/잔류 자일로스Gal2-야생형} x 100%
결과.
RN1001은 글루코스 및 자일로스 모두의 완전한 소비를 나타낸 반면, 야생형 및 돌연변이유발 라이브러리 GAL2 구축물의 YD01227 형질전환체는 글루코스를 소비하지 않았고 일정 범위의 잔류 자일로스 농도를 나타내었으며, 이는 글루코스의 존재하에서 자일로스를 소비하는 이들의 능력을 나타낸다(도 7A). 도 7B에 도시된 바와 같이, 상기 자일로스 소비는 생육 측정치(OD600)와 높은 상관성(R2 = 0.93)을 나타내었다. 상기 선별을 호기성 조건하에서 수행하였고 에탄올 형성이 거의 보이지 않았으며(데이터 도시 안 됨) 생육은 자일로스 소비와 높은 상관성을 나타내었기 때문에, 잔류 자일로스 농도를, GAL2 변체를 야생형과 비교하기 위한 주요 매개변수로서 사용하였다. 96시간째에 자일로스 소비에 대한 모든 시험된 돌연변이 GAL2 변체 대 야생형 GAL2의 비교(평균 RelXyl)를 표 7에 나열한다. 자일로스 수송의 이점에 대해 글루코스 수송에 영향을 미치는 모든 돌연변이들은 RelXyl>0을 갖는다(표 7). 제2 라운드의 돌연변이유발을 표적화하는 TOP 위치들을 돌연변이당 그들의 평균 RelXyl 점수를 기준으로 분류하였으며; 특이적인 돌연변이들을 또한 RelXyl 점수에 근거한 선호를 기준으로 분류하였다.
[표 7]
GTAC 선별의 상대 OD600(RelOD600) 및 자일로스 소비(RelXyl). 야생형 GAL2 구축물 pDB1250을 0으로 설정하였다. RelOD600 값은 1 내지 3회 중복물의 평균이고 야생형에 대한 상대값이다.
Figure pct00009
Figure pct00010
Figure pct00011
Figure pct00012
Figure pct00013
Figure pct00014
Figure pct00015
Figure pct00016
Figure pct00017
Figure pct00018
Figure pct00019
Figure pct00020
Figure pct00021
[표 8]
GTAC 선별에서 확인된 Gal2p 위치 및 돌연변이를 선호를 기준으로 배열한다. SCORE TOP HIT는 야생형 Gal2p에 비해 가장 뚜렷한 개선을 제공하는 위치내의 아미노산 치환에 대한 RelXyl 점수이다. 이는 글루코스 친화성을 제거하는데 가장 영향을 미치는 돌연변이 및 Gal2p 중의 표적에 대한 상대적인 위치의 분류를 허용한다.
Figure pct00022
Figure pct00023
가장 현저한 돌연변이는 상기 야생형 아미노산 Asn을 큰 소수성 측쇄를 갖는 아미노산, 예를 들어 Phe, Ile, Leu, Met, Thr, 또는 Val로 교환했을 때 376번 위치에서 발견되었으며; 이들 변체는 뚜렷한 생육 및 거의 완전한 자일로스 소비를 촉진하였고 GTAC 선별에서 글루코스에 대한 수송 활성을 거의 촉진하지 않았다(도 8). 우리는 376번 위치의 유리한 아미노산들이 85 내지 138 Å3의 반데르 발스 부피 및 10 내지 100 ΔtR의 소수성을 갖거나, 또는 하나의 실시태양에서 100 내지 138 Å3의 반데르 발스 부피 및 10 내지 100 ΔtR의 소수성을 가짐을 발견하였다. 추가의 중요한 실시태양은 339번 위치에서의 특이적인 아미노산이며, 여기에서 우리는 감소된 글루코스 수송 활성과 함께 돌연변이체 중에 -30 내지 10 ΔtR의 소수성 결과를 갖는 아미노산을 발견하였다. 이를 도 11에 예시한다.
아미노산들에 대한 반데르 발스 부피(Å3)의 값들을 본 발명에서 http://www.proteinsandproteomics.org/content/free/tables 1/table08.pdf에 개시된 바와 같이 사용한다. 상응하는 문헌은 문헌[N. J. Darby, Thomas E. Creighton, Protein Structure (1993) Oxford University Press]이다. 아미노산의 측쇄 소수성(ΔtR) 값들을 본 발명에서 http://onlinelibrary.wiley.com/doi/10.1002/psc.310010507/pdf에 개시된 바와 같이 사용한다. 이에 상응하는 참고문헌은 문헌[Monera, O.D. et al, Journal of Peptide science Vol. 1, 319-329 (1995)]이다.
실시예 5: 자일로스 수송 활성 선별
목적.
자일로스 수송 활성 (XTA) 선별을 사용하여, 즉 숙주로서 헥소스 수송체-돌연변이 균주 RN1053을 사용하여 GAL2 변체를 도입시키고 생성되는 형질전환체를 낮은 자일로스(1 gℓ-1) 농도상에서의 생육에 대해 배지상에서 선별하여, Gal2p 변체 에서 자일로스 수송 활성을 증가시키는 돌연변이를 확인할 수 있다. 수송 활성은 하나보다 많은 매개변수, 예를 들어 상기 수송체의 친화성(미카엘리스 상수, 즉 Km에 의해 나타냄), 또는 상기 수송체의 속도(Vmax로서 나타냄)에 의해 정의될 수 있다. 또한, 돌연변이는 상기 수송체의 발현을 증가시키며, 따라서 상기 숙주 세포에서 자일로스 수송 활성을 개선시키는 것이 가능하다.
형질전환 및 콜로니 피킹.
RN1053을 총 468개의 구축물로 형질전환시켰으며, 상기 구축물들은 각각 GAL2 돌연변이체를 갖는다. 야생형 GAL2 서열을 갖는 하나의 구축물(서열번호 58)을 대조군으로서 포함시켰다. 각각의 형질전환을 위해서, 1 내지 3개의 콜로니를 아가 배지 MTP에 재도말하여 형질전환체가 1229개에 달하였다. 상기 1229개의 형질전환체를 2 부분으로 선별하였다. 상기 선별의 각 부분에 대해서, 야생형 GAL2를 대조군으로서 포함시켰다.
예비 배양 및 선별.
예비-배양을 위해서, 자동 형질전환 및 콜로니 피킹으로부터 생성된 형질전환체를 선택 아가 배지 MTP로부터, 각 웰 중에 2% 말토스가 보충된 250 ㎕ 베르듀인-유레아를 함유하는 96HDWP로 자동 공정에 의해 옮겼다. 30 ℃ 및 750 rpm에서 궤도 진탕기에서 3일의 예비-배양 후에, 5 ㎕의 배양물을 1 gℓ-1 자일로스가 보충된 250 ㎕ 베르듀인-유레아를 함유하는 3개의 상이한 96HDWP로 옮겼으며, 각각의 96 HDWP는 샘플링 점을 나타낸다. 각각의 플레이트(24 DWP 또는 96 HDWP)상에, 플레이트 대 플레이트 효과를 가리키도록 하나 이상의 RN1001 생육 대조군을 접종하였다. 24시간, 72시간 및 96시간 후에, 일련의 96HDWP를 600 ㎚에서 자동화된 OD-측정을 위해 수확하였다. 각각의 구축물 및 각 시점에 대해서, 상이한 복제물들에 대한 OD600 값을 평균하였다. 상기 선별의 상이한 부분들을 비교하기 위해서, 상대값을 하기 식에 따라, 상기 XTA 선별의 특정 부분에서 측정된 야생형 OD600 값에 대한 차이를 기준으로 계산하였다:
RelOD600 = {(OD600Gal2 -돌연변이체 - OD600Gal2 -야생형)/OD600Gal2 -야생형} x 100%
결과.
상기 XTA 선별의 두 부분 모두에서 RN1001은 야생형 Gal2p에 비해 생육 프로파일을 근거로 TOP15 위치의 부분이고; RN1001은 헥소스 수송체의 충분한 보완을 가지며 상기 XTA 선별의 두 부분 모두에서 TOP15 중의 RN1001의 존재는 효모 중의 하나 이상의 내인성 헥소스 수송체가, 보다 불량한 생육 프로파일을 나타낸 야생형 Gal2 RN1053-형질전환체와 대조적으로 높은 친화성 자일로스 흡수를 촉진함을 가리킨다. 상기 TOP15 중에 존재하는 단일 아미노산 변화를 갖는 돌연변이 변체는 야생형 Gal2p에 비해 자일로스에 대해 증가된 친화성을 나타내고 RN1001 생육 프로파일에 대해 개선되거나 또는 심지어 낮은 자일로스 농도상에서 유사하거나 개선된 생육 특성을 나타내었다. 흥미롭게도, 사카로마이세스 세레비지아에 헥소스 수송체 과의 아미노산 서열들을 정렬하는 경우, 상기 TOP15에서 발견된 Gal2p 돌연변이들 중 일부, 예를 들어 N346D 및 M339S가 각각 Hxt2(S324) 및 Hxt11(D336 및 S329)의 야생형 서열에서 발견된다. 96시간째에 생육에 대한 모든 시험된 돌연변이 GAL2 변체 대 야생형 GAL2의 비교(평균 RelOD600)를 표 8에 나열한다. RelOD600>0을 갖는 모든 돌연변이는 상기 자일로스 친화성에 대해 양의 효과를 갖는 것으로 제안된다.
[표 9]
XTA 선별에서 선별된 Gal2p 돌연변이체에 대한 평균 RelOD600 값.
야생형 GAL2 구축물 pDB1250을 0으로 설정하였다. RelOD600 값은 1 내지 3회 중복물의 평균이고 야생형에 대한 상대값이다.
Figure pct00024
Figure pct00025
Figure pct00026
Figure pct00027
Figure pct00028
Figure pct00029
Figure pct00030
Figure pct00031
Figure pct00032
Figure pct00033
Figure pct00034
Figure pct00035
[표 10]
XTA 선별에서 확인된 Gal2p 위치 및 돌연변이를 선호를 기준으로 배열한다. SCORE TOP HIT는 야생형 Gal2p에 비해 가장 뚜렷한 개선을 제공하는 위치내의 아미노산 치환에 대한 RelXyl 점수이다. 이는 자일로스 수송 활성을 증가시키는데 가장 영향을 미치는 돌연변이 및 Gal2p 중의 표적에 대한 상대적인 위치의 분류를 허용한다.
Figure pct00036
Figure pct00037
Figure pct00038
실시예 6 내지 15
방법
분자 생물학 기법 및 화학물질.
제한 효소 및 T4 DNA 리가제를 페르멘타스(피셔 사이언티픽(Fisher Scientific) 네덜란드 랜즈미어 소재)로부터 획득하였다. 연구에 사용된 프라이머들(서열번호 1-55)을 표 11에 나타낸다. 표준 분자 생물학 및 효모 유전학 기법들을 문헌[Sambrook et al., 2001; Molecular cloning : a laboratory manual, third edition, Cold Spring Harbor Press, Cold Spring Harbor, New York, NY, USA] 및 문헌[Ausubel et al., 1995; Current Protocols in Molecular Biology]을 포함한 교과서에 따라 수행하였다.
PCR 증폭 및 클로닝.
PCR 증폭을 위해서, HF 완충제를 갖는 퓨전(등록상표) 하이파이 PCR 마스터 믹스를 사용하였다(핀자임스; 피셔 사이언티픽, 네덜란드 랜즈미어 소재). 클로닝 및 서열분석에 사용된 프라이머들을 표 11에 나타낸다(서열번호 37-55). HXT2 , HXT3 -6 HXT11 PCR 단편들을 셔틀 벡터 pRS313에 기반한, 효모 발현 벡터 pRS313-P7T7(서열번호 56)내에 클로닝하였다(문헌[Sikorski & Hieter, 1989, A system of shuttle vectors and yeast host strains designed for efficient manipulation of DNA in Saccharomyces cerevisiae. Genetics, 122, pp. 19-27]). 구축물 pRS313-P7T7은 절두된 HXT7 프로모터(문헌[Hauf et al, 2000, Simultaneous genomic overexpression of seven glycolytic enzymes in the yeast Saccharomyces cerevisiae. Enzyme Microb Technol, 26:688-698]) 및 HXT7 종결자를 갖는다. 상기 프로모터와 종결자 사이에, 다수의 클로닝 부위(MCS)가 존재한다. 생성되는 PCR 단편들을 제한 효소 조합에 의해 절단하고(하기 실시예들에 추가로 나타낸 바와 같이) 표준 분자 생물학 기법에 의해 효모 발현 벡터내로 클로닝시켰다. HXT11을 또한 형광 현미경검사를 사용하여 GFP-태그된 Hxt11 단백질의 국소화 연구(실시예 5)를 위해 pRS313-P7T7-GFP내에 클로닝시켰다(서열번호 57을 생성시킨다). pDB1250은 상기 절두된 HXT7 프로모터와 ADH1 종결자 사이에 GAL2 ORF(서열번호 60)를 함유하였다(서열 pDB1250의 참고로 서열번호 58을 참조하시오). 플라스미드를 제조사의 설명에 따라 DH5α 세포에서 증폭시키고 유지시켰다. 플라스미드를 진일류트(GeneElute) 플라스미드 미니프렙 키트(시그마 알드리치, 네덜란드 쯔빈드레흐트 소재)를 사용하여 에스케리키아 콜라이 미니 배양물로부터 단리하였다. 상기 연구에 사용되고 생성된 유전자/단백질 서열 및 구축물을 표 12에 나열한다.
[표 11]
실시예들에 사용된 올리고뉴클레오타이드들
Figure pct00039
Figure pct00040
Figure pct00041
Figure pct00042
RNA 추출 및 cDNA 합성.
전체 RNA를 유리-비드 붕괴/트라이졸 추출 과정에 의해 지수기의 효모 세포로부터 단리하였다. 2 ㎖의 세포 배양물로부터의 효모 펠릿을 0.2 ㎖의 유리 비드(직경, 0.45 ㎜) 및 0.9 ㎖의 트라이졸, 125 ㎕ 클로로폼과 혼합하고, 패스트프렙(Fastprep) FP120(바이오-101, 써모 새번트(Thermo Savant), 미국 캘리포니아주 소재)에서 6의 속도로 45-초 파열에 의해 붕괴시켰다. 1 ㎍의 전체 RNA를 사용하여 아이스크립트(iScript) 키트(바이오 래드, 네덜란드 비넨달 소재)로 cDNA를 합성하였다.
실시간 PCR.
HXT1 - HXT17GAL2-특이적인 실시간 PCR을 각각 센시믹스(SensiMix) SYBR & 플루오레세인 키트(GC 바이오테크(Biotech), 네덜란드 알페난 덴 린 소재) 및 MyiQ iCYCLER 실시간 PCR 장비(바이오 래드, 네덜란드 비넨달 소재)를 사용하여 수행하였다. 각각 25-㎕ 반응물은 12.5 ㎕의 SYBR 그린 마스터 믹스, 4 ㎕의 cDNA, 0.5 ㎕의 각각의 프라이머(10 nM) 및 7.5 ㎕의 멸균 탈이온수를 함유하였다. 상기 PCR 조건은 95 ℃에서 10분에 이어서 39주기의 증폭(95 ℃에서 15초, 60 ℃에서 30초, 72 ℃에서 30초)이었다. 표 11에 나타낸 프라이머들을 사용하여 PCR 증폭에 의해 상기 cDNA 단편들을 증폭시켰다(서열번호 1-36).
실수유발 PCR.
실수유발 PCR 실험을 DNA Taq 폴리머라제(써모 피셔)에 의해 제공된 표시들에 따라, 5.5 mM MgCl2 및 0.15 mM MnCl2를 함유하는 100 ㎕의 PCR 혼합물 중의 10 ng의 주형을 사용하여 수행하였다.
균주 유지, 배양 및 진화 조작.
이들 연구에서 생성된 균주들을 표 13에 나열한다. 본 연구에 사용된 균주들(표 2)의 보관을 위해서, 진탕 플라스크 배양을 2% 글루코스(YPD), 2% 말토스(YPM; RN1053-유도체의 경우에) 또는 3% 자일로스(YPX; YD01227-유도체의 경우에)가 보충된, 10 gℓ-1 효모 추출물(옥소이드) 및 20 gℓ-1 펩톤(BD 디프코)으로 이루어지는 풍부 배지(YP)에서 수행하였다. 배양물을 상기 배양물이 정지 생육기에 도달할 때까지 궤도 진탕기에서 30 ℃에서 유지시켰다. 글리세롤을 30%(v/v)로 가한 후에, 진탕-플라스크 배양물로부터의 샘플을 -80 ℃에서 2 ㎖ 분액으로 보관하였다.
균주 특성화 및 진화 가공을 위해서, 배양을 목적하는 당(혼합물)이 보충된, pH 4.5의, 질소원으로서 유레아를 사용하는 베르듀인(베르듀인-유레아 문헌[Luttik et al, 2001, J Bacteriol, 182:501-517])에 따라 무기질 배지를 사용하여 수행하였다. 상기 모델 균주 RN1053 또는 YD01227의 배양에서, 베르듀인-유레아에 히스티딘 영양요구성을 위한 보완을 위해서 0.2 gℓ-1 히스티딘(시그마 알드리치; 베르듀인-유레아-his)이 보충되었다.
생육 및 당 소비 프로파일의 특성화를 위한 균주들의 배양을 벌집 웰 플레이트를 사용하는 진탕 플라스크, 바이오스크린 C 판독기(그로스 커브스 리미티드(Growth Curves Ltd), 써모 피셔 사이언티픽 BV로 표시됨, 네덜란드 브레다 소재)에서 수행하였다. 배양물을 30 ℃의 온도에서 유지시켰다. 구체적으로 진화 가공을 위해서, 케모스탯 배양물을 30 ℃의 온도에서 필요한 탄소원이 보충된 500 ㎖의 베르듀인-유레아-his가 충전된 3L 교반식 탱크 생물반응기(애플리콘(Applikon), 네덜란드 쉬담 소재)에서 생육시켰다. 출발 용존 산소(DO) 설정치는 5%였으며, 교반을 400 rpm에서 수행하였고, 출발 OD600은 0.2였다.
[표 12]
플라스미드 및 유전자/단백질 서열
Figure pct00043
Figure pct00044
[표 13]
본 발명에서 사용되거나 제조된 균주들
Figure pct00045
Figure pct00046
분석 방법.
세포 생육을 UV-가시 분광광도계(노바스펙(Novaspec) PLUS)를 사용하여 600 ㎚에서 광학 밀도(OD)에 의해 모니터하였다. 글루코스, 자일로스, 에탄올의 농도를 아미넥스(Aminex) HPX-87H 컬럼(바이오 래드) 및 굴절률 검출기(시마츠(Shimadzu), 일본 교토 소재)를 사용하는 고성능 액체 크로마토그래피(시마츠, 일본 교토 소재)에 의해 배양 상등액(4000 rpm에서 5분 동안 원심분리에 의해 세포 펠릿으로부터 분리된) 중에서 측정하였다. 상기 컬럼 및 검출기의 온도를 65 ℃에서 유지시켰다. 이동상은 0.55 ㎖/분의 유량의 0.005N H2SO4이었다.
당 흡수 측정.
방사성-표지된 자일로스의 흡수를 하기와 같이 측정하였다: 세포를 진탕 플라스크 중에서 2% 자일로스 및 0.05% 말토스가 보충된 베르듀인-유레아에서 24시간 동안 생육시키고 원심분리(3,000 rpm, 3분, 20 ℃)에 의해 수거하고, 세척하고 베르듀인-유레아에 재현탁시켰다. [14C]자일로스 또는 [14C]글루코스(CAMPRO 사이언티픽, 네덜란드 비넨달 소재) 모액을 상기 세포 현탁액에 가하였다. 상기 반응을, 5 ㎖의 0.1M 염화 리튬의 첨가에 의해, 자일로스의 경우 1분 후 및 글루코스의 경우 15초 후에 중지시키고 세포 현탁액을 여과하였다(0.45 ㎛ HV 멤브레인 필터, 밀리포어, 프랑스 소재). 상기 필터를 또 다른 5 ㎖의 염화 리튬으로 세척하고 유화제 섬광제 플러스(퍼킨 엘머, 미국 소재)에서 액체 섬광 카운터로 카운트하였다. YD01227-ori 및 YD01227-evo에 대한 흡수 실험을 0.5, 2, 6, 20, 40 mM 자일로스 또는 0.1, 0.4, 1.5, 6, 20, 80 mM 글루코스로 수행하였다. RN1053-HXT3-6 및 RN1053-mHXT3-6(N367I), RN1053-HXT11 및 RN1053-mHXT11(N366D)에 대한 글루코스 경쟁 연구를 [14C]자일로스 모액 및 표지되지 않은 글루코스로 수행하였다. 최종 자일로스 및 글루코스 농도는 각각 50 mM 및 50 내지 500 mM이었다.
형광 현미경검사.
플라스미드 pRS313-P7T7-HXT11-GFP(서열번호 57)를 균주 RN1053 및 RN1041로 형질전환시켰다. 새로운 콜로니들을 자일로스 또는 글루코스가 있는 최소 배지에 접종하였다. 지수 생육기(600 ㎚에서 10의 광학 밀도에서)에서 취한 새로운 액체 세포 배양물에 대해, 100x 오일 침지 대물렌즈, GFP에 대한 필터 세트, 및 니콘(Nikon) DS-5Mc 냉각된 카메라가 장착된 니콘 이클립스-Ti 현미경하에서 형광 현미경검사를 수행하였다. 우리는 샘플당 100개 이상의 세포를 통상적으로 검사하였으며, 각 실험을 3회 이상 반복하였다.
자동 형질전환 및 콜로니 피킹.
YD01227내로의 포화 돌연변이유발 라이브러리의 형질전환 발생을 위해서 진탕-플라스크 배양을, RN1053의 경우 YPM에서, 또는 YD01227의 경우 YPX에서 수행하였다(하기 참조). 효모 세포를 펠릿화하고, 이를 후속으로 문헌[Gietz,R.D. and Woods, R.A. 2006, Yeast transformation by the LiAc/SS Carrier DNA/PEG method. Methods Mol. Biol., 313:107-120]에 근거한 자동 형질전환 프로토콜에 사용하였다. 형질전환 혼합물을, 2% 말토스(RN1053 형질전환) 또는 3% 자일로스(YD01227 형질전환)가 보충된, 효모 질소 염기(시그마 알드리치; 6.7 gℓ-1), 아가(BD 바이오사이언시즈; 15 gℓ- 1)로 이루어지는 선택 배지상에 도말하였다. 형질전환 플레이트를 30 ℃에서 배양하고, 콜로니 형성 후 콜로니를 자동화된 공정을 사용하여 재도말하여 콜로니를 상기 지칭된 선택 배지를 함유하는 96 웰 미세적정 플레이트(MTP)로 옮겼다. 형질전환체를 갖는 MTP를 분명한 생육이 관찰될 때까지 30 ℃에서 배양하였다.
NMR 분석.
샘플 중 글루코스, 자일로스, 글리세롤, 아세트산 및 에탄올의 정량분석을 위해서, 100 ㎕ 샘플을 적합한 바이알에 정확하게 옮긴다. 후속으로, D2O 중의 말레산(20 g/ℓ), EDTA(40 g/ℓ) 및 미량의 DSS(4,4-다이메틸-4-실라펜탄-1-설폰산), 및 450 ㎕ D2O를 함유하는 100 ㎕ 내부 표준 용액을 가한다.
1D 1H NMR 스펙트럼을 27 ℃의 온도에서 수 현탁액에 의한 펄스 프로그램(3 Hz에 상응하는 전력)을 사용하여, 저온-탐침이 장착된 브루커 어밴스 III 700 MHz상에 기록한다.
상기 분석물 농도를 하기의 신호(DSS에 대한 δ)를 근거로 계산한다:
· α-글루코스 피크(5.22 ppm에서) (d, 0.38 H, J = 4 Hz),
· α-자일로스 피크(5.18 ppm에서) (d, 0.37 H, J = 4 Hz),
· 글리세롤 피크(3.55 ppm에서) (dd, 2 H, J1,2 = 6 Hz 및 J1a,1b = 12 Hz)
· 아세트산 피크(1.91 ppm에서) (s, 3 H)
· 에탄올 피크(1.17 ppm에서) (t, 3 H, J = 7Hz)
· 표준에 대한 신호 사용자:
· 말레산 피크(6.05 ppm에서) (s, 2H)
실시예 6
자일로스상에서 생육하는 능력을 회복한 진화된 자일로스 수송-음성 균주에서 사카로마이세스 세레비지아에 HXT11 상승된 발현
RN1053 케모스탯 배양물.
사카로마이세스 세레비지아에에서 자일로스의 흡수는 헥소스 수송체의 독특한 하위군에 의해 촉진된다(문헌[Hamacher et al, 2002, Characterization of the xylose-transporting properties of yeast hexose transporters and their influence on xylose utilization. Microbiology, 148: 2783-2788]). 우리는 주 헥소스 수송체 HXT1 - HXT7GAL2가 없는, 자일로스-발효 능력을 갖는 결실 돌연변이체(RN1053)를 제작하였다. 상기 결실의 결과로서, RN1053은 자일로스를 이용할 수 없다(실시예 1에 개시된 바와 같이). 사카로마이세스 세레비지아에는 8개의 주 유전자(HXT8-17)(이중에서 발현이 낮거나 무시할정도라기 보다는 공지된 것이 그다지 많지 않다) 보다 많은 HXT 유전자를 갖거나(문헌[Sedlak & Ho, 2004, Characterization of the effectiveness of hexose transporters for transporting xylose during glucose and xylose co-fermentation by a recombinant Saccharomyces yeast. Yeast, 21, pp. 671-684]), 또는 당 수송 이외의 생리학적 역할들에 관련되었다(문헌[Nourani et al 1997 Multiple-drug-resistance phenomenon in the yeast Saccharomyces cerevisiae: involvement of two hexose transporters. Mol Cell Biol, 17: 5453-5460]). 따라서, 우리는 상기 유전자들을 은닉 HXT 유전자라 칭한다. 은닉 HXT 자리에서 가능한 자발적인 돌연변이를 선택하여 자일로스에 대한 개선된 발현 또는 가능하게는 개선된 친화성을 생성시키고자 하였다. 그렇게 하기 위해서, 균주 RN1053을 0.05 h-1의 희석률로 혐기성의 자일로스-제한 케모스탯 배양물에서 생육시켰다. 상기 캐모스탯 배양에 의해 진화된 균주(RN1053-X2)들을 2% 자일로스 플레이트상에서 단리하였다. 단일 콜로니를, 원래 RN1053 균주와의 비교를 위해서 96시간 동안 호기성 진탕 플라스크에서 2% 자일로스가 보충된 베르듀인-유레아-his상에서 배양을 위해 선택하였다. 상기 RN1053-X2 및 RN1053 균주의 생육 곡선을 도 12A에 나타내었다. 상기 진화된 균주 RN1053-X2는 2% 자일로스상에서 생육할 수 있는 반면, 원래 균주 RN1053은 자일로스 배지상에서 생육하지 못했다. 이유는 상기 은닉 XHT-유전자들(XHT8 - HXT17) 중 하나 이상이 상기 자일로스의 흡수를 촉진하는 케모스탯 배양 동안 자일로스 배지상에서 상향조절된 것일 수 있다.
진화된 RN1053-X2의 발현 프로파일링.
상기 진화된 균주 RN1053-X2 및 원래 균주 RN1053에서 HXT8 - HXT17의 발현 패턴을 2% 자일로스 배지상에서 배치 배양 동안 비교하였다. HXT11HXT12의 전사 수준은 원래 균주 RN1053에 비해, 지수기의 시작으로부터 진화된 균주 RN1053-X2에서 8배까지 대단히 증가하고 3일째에 최대 수준에 도달하였다. 균주 RN1053에서 HXT11 및/또는 HXT12 수송체 유전자를 발현시킴으로써 자일로스 소비를 증대시키기 위한 돌연변이체의 진화에 케모스탯이 유효하였다. 그러나, 다른 HXT-유전자(즉 HXT8 - HXT10HXT13 - HXT17)의 발현 수준은 RN1053의 야생형에 비해, 자일로스 배지상에서 억제되었다.
자일로스 대사의 첫 번째 제한 단계는 원형질막을 가로지르는 그의 수송이다(문헌[(Kahar P, Taku K, Tanaka S, 2011. Enhancement of xylose uptake in 2-deoxyglucose tolerant mutant of Saccharomyces cerevisiae. J. Biosci. Bioeng. 111:557-63]). 사카로마이세스 세레비지아에의 HXT 수송체 유전자의 발현은 세포외 글루코스의 상이한 수준에 반응하여 조절되는 것으로 보고되었다(문헌[Ozcan & Johnston, 1999. Function and regulation of yeast hexose transporters. Microbiol. Mol. Biol. Rev. 63:554-569]). 가능하게는, 상기 프로모터 또는 조절 유전자에서의 돌연변이는 자일로스상의 캐모스탯 배양에서 진화된 RN1053-X2 균주에서의 은닉 HXT 유전자의 증대된 발현의 토대이다.
실시예 7
진화된 RN1053 중의 HXT11 녹아웃/녹다운은 자일로스상에서 생육하는 새로 획득된 능력을 없앤다
균주 RN1053-X2에서 HXT11의 녹아웃 및 침묵.
HXT11의 결실 구축물을 위해서, PHIS3-HIS3-THIS3 발현 카세트를 HXT11 자리에 편입을 위한 HXT11 인접 서열 및 발현 카세트의 증폭을 위한 HIS3 서열로 이루어지는 올리고뉴클레오타이드 KOP11(서열번호 98) 및 KOT11(서열번호 99)을 사용하여 플라스미드 주형 pRS313-P7T7(서열번호 117)로부터 증폭시켰다.
Hxt11p가 자일로스상에서 자발적인 생육에 기여하는 지의 여부를 측정하기 위해서, 우리는 HXT11의 결실시 HIS3 마커를 보완하는 1-단계 유전자 결실의 연속에 의해 상기 진화된 RN1053-X2에서 HXT11을 결실시켰다. HXT11 mRNA 수준은 녹아웃 구축물의 도입후 상당히 감소하였다(도 13a). HXT11이 상기 균주 RN1053-X2에서 붕괴되었을 때, 상기 균주는 자일로스 배지상에서 생육하는 그의 새롭게 획득된 능력을 상실하였다(도 13b). 또한, 녹아웃 균주의 상기 HXT11 발현 수준은 60%까지 감소하였다. 가장 그럴듯하게는, 또한 상기 RN1053-X2 균주에서 발현된 HXT12 전사물이 HXT11에 약 98% 상동성이므로, 여전히 HXT11 수준이 측정되었다(도 13a).
안티센스 RNA 기법은 미생물에서 표적 mRNA를 제거함으로써 표적 단백질의 번역 억제에 매우 유용하다. 번역 억제는 전령 RNA에 하이브리드화하는 안티센스 서열에 의해 촉진될 수 있다. 상기 안티센스 기전은 리보솜 간섭을 포함하며, 여기에서 상기 리보솜은 상기 mRNA의 뉴클레오타이드에 결합할 수 없다(문헌[Park et al 2001. Antisense-mediated inhibition of arginase [CAR1] gene expression in Saccharomyces cerevisiae. J. Biosci. Bioeng. 92:481 -484]). 상기 방법은 유전자 붕괴 방법보다 유전자 발현의 억제에 보다 편리하다. 역 HXT11(iHXT11)의 발현을 위해서, iHXT11을 프라이머 iHXT11F(서열번호 100) 및 iHXT11R(서열번호 101)을 사용하여 증폭시키고 pRS313-P7T7벡터(도 13c; 서열번호 117) 중의 절두된 HXT7 프로모터와 HXT7 종결자 사이에 BamHI - XbaI 단편을 역으로 클로닝시켰다. 상기 구축물을 RN1053-X2에 도입시켜 안티센스 HXT11 RNA를 발현시켰으며, 상기 RNA는 HXT11 mRNA의 단백질로의 번역을 방해한다. 상기 iHXT11은 상기 균주 RN1053-X2에서 과발현되었으며 상기 균주는 자일로스 배지상에서 생육하는 그의 능력을 상실하였다(도 13d).
이들 녹아웃/녹다운 실험은 상기 진화된 균주 RN1053-X2가 HXT11 발현의 증가 및 효모막상에서 Hxt11p의 있음직한 기능상 발현으로 인해 자일로스를 소비하기 시작하였음을 분명히 가리킨다.
실시예 8
RN1053에서 HXT11 과발현은 자일로스상에서의 생육을 복원시킨다
RN1053에서 HXT11HXT12의 과발현.
HXT11 또는 HXT12를 발현하는 균주가 자일로스상에서 생육할 수 있는지의 여부를 측정하기 위해서, HXT-유전자들을 둘 다, 8개의 주 헥소스 수송체(HXT1-HXT7GAL2)의 결실로 인해 자일로스상에서 생육할 수 없는 원래의 RN1053 균주에서 개별적으로 발현시켰다. 이들 실험을 위해서 RN1041-빈, RN1053-빈, RN1053-HXT11 및 RN1053-XHT12를 사용하였다(표 13 참조). RN1053-HXT11 및 RN1053 HXT12를 하기의 방식으로 제작하였다: HXT11HXT12 유전자에 대한 개방 판독 프레임을 프라이머 HXT11F(서열번호 102), HXT12F(서열번호 103) 및 HXT11/12R(서열번호 104)을 사용하여 야생형 RN1053의 cDNA로부터 PCR-증폭시키고; PCR 단편들을 서열분석하여 각 CEN.PK113-7D 유전자 서열(사카로마이세스 게놈 데이터베이스, www.yeastgenome.org; HXT11 서열 서열번호 119)에 100% 상동성임을 발견하였으며; 상기 PCR 단편을 제한 효소 XbaIBamHI을 사용하여 절단하고 효모 발현 벡터 pRS313-P7T7(서열번호 117; 도 13C; 표 12)에 클로닝시켰다. 상기 수송체의 HXT11HXT12 발현 구축물을 지츠(Gietz) 방법(문헌[Gietz and Woods 2006, Yeast transformation by the LiAc/SS Carrier DNA/PEG method. Methods Mol.Biol 313 pp. 107-120])에 따라 표준 효모 유전자 기법을 사용하여 RN1053으로 형질전환시켰다. 단일 콜로니로부터 단리된 형질전환체는 RN1053-HXT11 및 RN1053-HXT12를 생성시켰다. 상기 두 균주 모두 말토스 배지에 접종시킨 다음, 진탕 플라스크에서 2% 자일로스 및/또는 2% 글루코스를 함유하는 액체 배지에서 배양하였다. 오직 RN1053-HXT11 및 RN1041만이 48시간 이내에 분명한 생육을 나타낸 반면, RN1053-빈 및 RN1053-HXT12는 상기 기간 동안 좀처럼 어떠한 생육도 나타내지 않았다(도 14a). 상기 RN0153-HXT11의 생육은 보다 일찍 시작했으며 자일로스 배지에서 기준 균주 RN1041-빈(야생형 HXT 배경을 갖는다)의 경우보다 더 빠른 생육을 나타내었다(도 14b). 그러나, RN1053에서 HXT12 서열의 도입은 자일로스 배지상에서의 생육을 허용하지 않았다. 사카로마이세스 게놈 데이터베이스 기준 균주 S288C에서, HXT12는 프레임 이동 돌연변이(www.yeastgenome.org; ORFs YIL170W 및 YIL171W)로 인해 위유전자로 간주된다.
상기 실험은 RN1053-X2의 자일로스상에서의 자발적인 생육이 HXT11의 보다 높은 발현에 의해 야기되었고 상기 HXT11이, 발현되는 경우, 효율적인 자일로스 수송체임을 명백히 입증하였다.
실시예 9
Hxt11p는 Hxt2p보다 고유의 보다 높은 수준의 자일로스 특이성을 갖는 자일 로스 수송을 촉진한다
Hxt11p에 의한 자일로스 흡수.
HXT11이 글루코스의 부재 및 존재하에서 자일로스를 수송할 수 있는지의 여부를 측정하기 위해서, 방사성표지된 14C-자일로스를 사용하는 흡수 연구를 수행하였다. 상기 실험을 위해서, 균주 RN1053-빈, RN1053-HXT11 및 RN1053-HXT2를 사용하였다(표 13). HXT2는 그의 자일로스 수송 능력으로 알려져 있다(문헌[Saloheimo et al, 2007, Xylose transport studies with xylose-utilizing Saccharomyces cerevisiae strains expressing heterologous and homologous permeases. Appl Microbiol Biotechnol. 74:1041-1052]; 문헌[Sedlak and Ho, 2004, Characterization of the effectiveness of hexose transporters for transporting xylose during glucose and xylose co-fermentation by a recombinant Saccharomyces yeast. Yeast, 21:671-684]). RN1053-HXT11의 제작은 선행 실시예에 개시되어 있다. RN1053-HXT2를 하기의 방식으로 제작하였다: HXT2(서열번호 12)를 프라이머 F HXT2 XbaI(서열번호 107) 및 R HXT2 Cfr9I(서열번호 108)를 사용하여 RN1001 게놈(표 12)으로부터 PCR-증폭시켰다. 생성되는 PCR 단편을 서열-확인하고 XbaI - Cfr9I 단편으로서 pRS313-P7-T7(서열번호 117)내로 클로닝시켰다. RN1053을 생성된 구축물 pRS313-P7T7-HXT2(표 12 참조)로 형질전환시켜 RN1053-HXT2(표 13)라 명명되는 단일 콜로니로부터 유래된 형질전환체를 생성시켰다. Hxt11p가 균주 RN1053에서 자일로스 흡수를 증가시키는 지의 여부를 측정하기 위해서, 상기 수송체를 발현하는 세포에서 14C를 사용하여 자일로스 흡수를 측정하였다. 글루코스의 존재하에서, HXT11을 발현하는 균주는 글루코스의 존재하에서 HXT2를 발현하는 균주에 비해 50%까지 더 자일로스를 축적하였다(도 15). 또한, RN1053-HXT11의 자일로스 흡수는 RN1053-HXT2에 비해 4.5배까지 증가하였다(도 15). 상기 실험은 Hxt11p가 효모 원형질막을 가로질러 자일로스를 수송할 수 있음을 입증한다. 더욱 더, Hxt11p는 Hxt2p와 같은 효모 게놈내의 앞서 확인된 자일로스 수송체에 비해 글루코스에 의해 쉽게 경쟁될 수 없는 자일로스에 대한 고유의 보다 높은 특이성을 이용한다.
실시예 10
Hxt11p는 효모 원형질막에서 기능적으로 발현된다
RN1053에서 HXT11의 기능 발현.
면역블럿 분석에 의한 Hxt11p의 검출은 상기 단백질의 기능 발현을 완전하게 입증하지 못할 것이다. 헥소스 수송체 단백질의 기능 발현을 위해서, 상기 단백질은 원형질막 중에 존재해야 한다. Hxt11p의 발현 및 표적화를 모니터하기 위해서, 키메릭 Hxt11p-GFP 단백질을 가공하고 형광분석 및 형광 현미경검사에 의해 검사하였다. 상기 연구를 위해서 RN1053-HXT11-GFP, RN1041-HXT11-GFP, RN1053-HXT11 및 RN1053-빈을 사용하였다(표 13). 상기 HXT11-GFP 발현 균주를 제작하기 위해서, RN1053 및 RN1041을 상기 키메릭 Hxt11-GFP 단백질(pRS313-P7T7-HXT11-GFP; 서열번호 118; 표 12)을 갖는 발현 벡터로 형질전환시켰다. 상기 Hxt11p+GFP 융합 단백질은 기능성 헥소스 수송체이며; 2% 자일로스상에서 균주 RN1053에 대해 생육을 복원하였다(도 16a). 또한, RN1053-HXT11-GFP 및 RN1041-HXT11-GFP의 Hxt11p+GFP 형광은 자일로스 또는 글루코스 배지상에서 상기 원형질막에 국소화되었다(도 16b).
상기 실험은 Hxt11p-GFP가 자일로스 수송체로서 기능성이며 Hxt11p가 상기 원형질막에서 기능적으로 발현됨을 입증한다.
실시예 11
RN1053에서 HXT11 발현은 산업상 적합한 농도로 글루코스 자일로스의 보다 빠른 동시-발효를 촉진한다
글루코스-자일로스 혼합물에서 RN1053-HXT11의 발효 프로파일.
야생형 HXT 전망을 발현하는 균주에 비해 HXT 결실 배경(hxt1 -7, gal2)에서 HXT11을 기능적으로 발현하는 균주의 글루코스-자일로스 혼합물상에서의 발효 양상을 측정하기 위해서, 발효를 산업상 적합한 글루코스-자일로스 농도(각각 80 및 40 gℓ- 1)가 보충된 베르듀인-유레아상에서 수행하였다. 상기 발효를 위해서 RN1053-HXT11 및 RN1041-빈을 사용하였다(표 13 참조).
도 17a에 도시된 바와 같이, RN1041의 자일로스는 글루코스와 동시-발효되지 않았으며; 반면에 글루코스-자일로스 동시-발효의 정도가 도 17b에 도시된 바와 같이 균주 RN1053-HXT11에서 증대되었다. 더욱 또한, 자일로스 발효는 HXT11-RN1053에서 완전히 고갈된 반면, 40시간째에 RN1041 중에는 10 g/L의 자일로스가 여전히 남아있었으며; 또한, RN1053-HXT11의 자일로스 소비는 2% 잔류 글루코스에서 대단히 증가하였고, 에탄올 농도는 63.92 g/L에서부터 상기 발효의 끝에서 72.33 g/L까지 증가하였다(도 17ab).
본 실시예는, 상기 주 헥소스 수송체가 결실되었지만 HXT11을 발현하는 균주가 HXT11이 없는 야생형 헥소스 수송체 배경을 갖는 균주보다 더 빠른 자일로스 이용을 나타냄을 입증한다.
실시예 12
야생형 HXT11 발현은 글루코스 수송 역-활성 선별에서 자일로스상에서의 생육을 지지한다
목적.
글루코스 수송 활성 카운터 (GTAC)-선별을 사용하여, 즉 숙주로서 헥소키나제-돌연변이 균주 YD01227을 형질전환시켜 수송체를 도입시키고 생성되는 형질전환체를 5배 더 높은 양의 글루코스의 존재하에서 자일로스상에서의 생육 및 소비에 대해 배지상에서 선별하여, 자일로스 수송체가 잉여 글루코스의 존재하에서 자일로스를 수송하는 개선된 능력을 나타냄을 확인할 수 있다(즉 글루코스에 대해서보다 자일로스에 대해서 더 높은 친화성; 자일로스 수송 능력을 적어도 동일한 수준으로 유지하면서 글루코스 수송 능력의 감소 또는 보다 바람직하게는 완전한 제거).
형질전환 및 콜로니 피킹.
YD01227을 야생형 GAL2(pDB1250, EPA-29355); HXT2(pDB1162; 플라스미드 제작에 대해서 실시예 9를 참조하시오) 및 HXT11(pRS313-P7T7-HXT11, 제작에 대해서 실시예 8을 참조하시오) 구축물을 갖는 구축물로 형질전환시켰다. 각각의 형질전환을 위해서, 3개의 콜로니(입수할 수 있는 경우)를 YNB + 3% 자일로스 아가 배지 MTP에 자동 콜로니 피킹을 사용하여 재도말하고 가시적인 콜로니 생육을 상기 아가 구멍에서 볼 수 있을 때까지 30 ℃에서 생육시켰다.
예비 배양 및 선별.
예비-배양을 위해서, 형질전환체를 선택 아가 배지 MTP로부터, 3% 자일로스가 보충된 무기질 배지(질소원으로서 유레아를 갖는 베르듀인에 따른)로 이루어지는 액체 선택 배지를 함유하는 96 웰 절반-깊이웰 플레이트(96HDWP)로 자동 공정에 의해 옮겼다. 상기 96 웰 HDWP를 30 ℃ 및 750 rpm에서 궤도 진탕기에서 3일 동안 배양하였다(예비-배양). 후속으로, 각 샘플에 대해서 20 ㎕의 배양물을, 하기의 농도: 10 gℓ-1 글루코스 및 2 gℓ-1 자일로스의 5:1 비의 글루코스:자일로스 당 혼합물이 보충된 2.5 ㎖ 베르듀인-유레아를 함유하는 24 웰 깊은웰 플레이트(24 DWP)(YD10-배지)로 옮겼다. 각각의 3개의 샘플링 시점에 대해서 일련의 24DWP를 접종하였다. 각 24DWP상에, 상이한 24DWP간의 플레이트 변화 효과를 가리키도록 하나의 RN1001 생육 대조군을 접종하였다. 24시간, 72시간 및 96시간 후에, 자동 샘플링 및 96HDWP로의 이동을 600 ㎚ 파장에서 자동화된 OD-측정을 위해 수행하였다. 96시간 후 최종 OD 측정 후에, 세포를 원심분리 후에 펠릿화하고 100 ㎕ 상등액을 배양후 배지에서 잔류 당 및 에탄올 형성의 유식-NMR 분석을 위해 수거하였다(방법 설명에 대해서 상기를 참조하시오).
결과.
RN1001은 24시간 이후 생육을 나타내고(도 18a) 글루코스 및 자일로스 모두의 완전한 소비(도 18b, 18c)를 나타낸 반면, GAL2 , HXT2HXT11 구축물을 발현하는 YD01227 형질전환체는 헥소- 및 글루코키나제 활성의 결실로 인해 글루코스를 소비하지 않았다(도 18c). 후자의 균주들은 또한 시간에 따라 다양한 생육 프로파일(도 18a) 및 다양한 잔류 자일로스 농도를 나타내었으며, 이는 글루코스의 존재하에서 자일로스를 소비하는 그들의 개별적인 능력을 나타낸다(도 18b). 상기 HXT11 구축물을 발현하는 YD01227(YD01227-HXT11)은 72시간째에 분명한 생육, 및 상기 실험의 초기에 상기 배지 중에 존재하는 22.7±0.12 gℓ-1(n=43)로부터 96시간 후 상기 배지 중에 존재하는 4.83±1.26 gℓ-1(n=3)의 상당한 셀룰로스 소비를 나타내었으며; YD01227-GAL2 및 YD01227-HXT2는 좀처럼 어떠한 생육도 나타내지 않았고 YD01227-HXT11에 비해 자일로스를 그다지 많이 소비하지 않았으며, 이때 96시간 배양 후 상기 배지 중에 존재하는 자일로스는 각각 18.34±0.39 및 21.29±0.32 gℓ-1이었다(도 18b).
본 실시예는 HXT11이 글루코스의 존재하에서 상당한 바이오매스 형성 및 자일로스 소비를 지지함을 입증하며, 이는 상기 헥소키나제 돌연변이 YD01227에서 HXT11 발현이 당 수송에서 GAL2 또는 HXT2 발현(둘 다 사카로마이세스 세레비지아에 수송체 중에서 입증된 자일로스 수송체이다)에 의해 발휘되는 것보다 더 많은 자일로스-특이적인 성분을 가능하게 함을 암시한다(문헌[Saloheimo et al, 2007, Xylose transport studies with xylose-utilizing Saccharomyces cerevisiae strains expressing heterologous and homologous permeases. Appl Microbiol Biotechnol., 74:1041 -1052]; 문헌[Sedlak and Ho, 2004, Characterization of the effectiveness of hexose transporters for transporting xylose during glucose and xylose co-fermentation by a recombinant Saccharomyces yeast. Yeast 21:671-684]; 문헌[Hamacher et al, 2002, Characterization of the xylose-transporting properties of yeast hexose transporters and their influence on xylose utilization. Microbiology, 148:2783-2788]).
실시예 13
YD01227에서 선별된 HXT11 실수유발 라이브러리로부터 수득된 개선된 XHT11 돌연변이체
글루코스의 존재하에서 자일로스 흡수를 개선시키기 위해서, 실수유발 PCR을 수행하여 상기 YD01227 균주에서 글루코스의 존재하에 경쟁적인 자일로스 수송에 대해 선별된 Hxt11p의 변체를 암호화하는 HXT11 돌연변이 라이브러리를 생성시켰다(본 발명에서 표 3 참조). 상기 PCR 반응 혼합물 중의 Mn2+의 농도는 0.15 mM이었으며, 이를 프라이머 HXT11F(서열번호 41) 및 HXT11/12R(서열번호 43)를 사용하여 표준 실수유발 PCR 프로토콜에 따라 가하였다(문헌[Cirino,P.C et al. 2003. Generating mutant libraries using error-prone PCR. Methods Mol.Biol., 231, pp. 3-9]). 상기 라이브러리를 XbaI - BamHI 단편으로서 pRS313-P7T7내에 클로닝시켰다. 균주 YD01227을 HXT11-라이브러리로 형질전환시키고 3천개의 형질전환체를 시너지(Synergy) MX(바이오텍 인스트루먼츠 인코포레이티드(BioTek Instruments, Inc), 미국 소재)를 사용하여 96-웰 플레이트 포맷에서 1:15 비의 자일로스(1%) 및 글루코스(15%)가 보충된 베르듀인-유레아 배지상에서 선별하였다. 상기 3000개의 돌연변이체로부터, 선별 배지상에서 야생형 Hxt11p를 능가하는 8개의 돌연변이체를 수득하였다. 전형적인 클론을 도 19a에 도시하였다. 상기 플라스미드들을 문헌[Chowdhury, K. 1991 . One step 'miniprep' method for the isolation of plasmid DNA. Nucl. Acids Res 19, pp. 2792]에 따른 프로토콜을 사용하여 YD01227로부터 단리하고 재-서열분석하였다. 8개의 돌연변이체 모두, Hxt11(야생형 아미노산 서열 Hxt11p 서열번호 62) 중의 동일한 돌연변이를 함유하는 단백질로 번역되어 366번 위치에서 Asn(N)의 Asp(D)로의 아미노산 변화를 도출하는 돌연변이 서열을 갖는 플라스미드를 가짐을 발견하였다. 진탕 플라스크 실험에서 상기 N366D 돌연변이체(YD01227-mHXT11[N366D]; 표 13 참조)는 또한 도 19a에 도시된 바와 같이, YD01227-HXT11에 비해 상기 선별 배지에서 보다 빠른 생육을 나타내었다. pRS313-P7T7-mHXT11(N366D) 구축물을 RN1053으로 재-형질전환시켜 RN1053-mHXT11(N366D)를 생성시켰다. HXT11-N366D 돌연변이체를 발현하는 RN1053은, 유사한 생육 곡선이 관찰되기 때문에, 야생형 HXT11 유전자를 발현하는 RN1053에 비해, 2% 자일로스 배지상에서 자일로스 이용에 관하여 영향을 받지 않았다(도 19b).
Hxt11 및 N366D 돌연변이체를 갖는 균주 RN1053의 당 흡수.
자일로스 및 글루코스 수송 역학을, 수송체 Hxt11 및 mHxt11p-(N366D)를 발현하는 자일로스 이용 사카로마이세스 세레비지아에 균주 RN1053에서 측정하였다. 상기 측정된 자일로스 수송률을 글루코스 또는 자일로스 농도에 대해 플롯팅하였다. RN1053-mHXT11(N366D)의 글루코스에 대한 친화성은 RN1053-HXT11에 비해 2배까지 크게 감소한 반면, RN1053-mHXT11(N366D)의 자일로스에 대한 친화성도 또한 RN1053-HXT11에 비해 1.2배까지 약간 감소하였다(도 19c, 19d). 또한, 증가하는 농도의 글루코스의 존재하에서 N366D 돌연변이체를 발현하는 균주는 Hxt11을 발현하는 균주에 비해 자일로스를 75%까지 더 축적하였다(도 19e).
글루코스 존재하의 자일로스의 발효.
당 혼합물의 발효 실험은, RN1053-mHXT11(N366D)를 RN1053-HXT11 및 RN1041-빈과 비교함을 수행하였다.
도 19f, 19g, 19h 및 19i에 도시된 바와 같이, 100 g/L의 글루코스 및 60 g/L의 자일로스가 보충된 베르듀인-유레아상에서의 첫 번째 실험에서, 상기 발효 동안 글루코스 사용, 바이오매스 형성(OD600), 및 RN1053-mHXT11(N366D)의 에탄올 생산이 RN1041 및 RN1053-HXT11에 비해 지연되었다. RN1053-mHXT11(N366D)에 의한 글루코스 소비가 RN1053-HXT11에 비해 초기 지수기에서 크게 감소한 것으로 보인다(도 19g). 또한, RN1053-mHXT11(N366D)의 자일로스 소비는 감소되지 않았지만(도 19h), RN1053-mHXT11(N366D)의 세포 밀도는 RN1041, 및 RN1053-HXT11의 경우보다 더 낮았다(도 19f).
RN1053-mHXT11(N366D)을 RN1053-HXT11에 비교하는, 보다 낮은 당 농도(80 gℓ-1의 글루코스 및 40 gℓ-1의 자일로스)가 보충된 베르듀인-유레아상에서의 두 번째 발효 실험에서, 당 소비 프로파일의 분명한 차이가 관찰되었다(도 19j, 19k, 19l). 상기 글루코스 소비 프로파일이, 상기 글루코스가 급속히 감소하는 단계 동안 보다 빠른 글루코스 소비율을 나타낸 반면(0 내지 35시간; qgluc (RN1053- HXT11 ) 2.22 g/ℓ/h 대 qgluc(RN1053-mHXT11([N366D]) 2.04 g/ℓ/h, qgluc에서 8.5% 감소), 자일로스 소비율은 같은 시간창 동안 크게 증가하였다(qxyl (RN1053- HXT11 ) 0.23 g/ℓ/h 대 qxyl(RN1053-mHXT11([N366D]) 0.38 g/ℓ/h, qxyl에서 65% 기울기). 주로 자일로스가 발효되는 단계 동안(35 내지 73시간), 상기 자일로스 소비율은 거의 동일하였다(qxyl (RN1053- HXT11 ) 0.36 g/ℓ/h 대 qxyl (RN1053- mHXT11 ([ N366D ]) 0.37 g/ℓ/h). 최대 자일로스 소비율은 RN1053-XHT11(35시간째에 0.5 g/ℓ/h)의 경우보다 RN1053-mHXT11(N366D)(23시간째에 0.65 g/ℓ/h)에 대한 발효에서 더 높았으며 상기 소비율에 더 일찍 도달하였다. 상기 발효 실시의 끝에서(산업상 발효에 전형적인 72시간의 기간), 상기 RN1053-HXT11은 상기 자일로스의 51%를 소비한 반면 RN1053-mHXT11(N366D)는 63% 소비하였다. 상기 발효의 끝에서 측정된 에탄올 역가는 야생형 HXT11을 발현하는 RN1053의 경우보다 N366D 돌연변이체를 발현하는 RN1053의 경우 4.4% 더 높았다. 상기 발효내로의 당의 투입이 거의 동일한 것으로 고려할 때, 산업적으로 적합한 배치 발효에 전형적인 당 농도를 갖는 상기 글루코스-자일로스 혼합물로부터 더 높은 수율, 및 보다 구체적으로 상기 자일로스 분획으로부터 더 높은 수율이 획득되었음을 추측할 수 있었다.
상기 발효 실험은 야생형 기준 서열에 비해 상기 막상에서의 사카로마이세스 세레비지아에 헥소스 수송체 HXT11로부터 가공된 자일로스-특이적인 수송체 변체의 존재가 상기 글루코스 단계 동안 상기 자일로스 소비율을 증가시키며, 이때 상기 글루코스 소비율이 다소 감소되었고, 결국 보다 높은 에탄올 수율이 산업상 적합한 가수분해산물에 전형적인 글루코스-자일로스 혼합물상에서 획득되었음을 가리킨다.
실시예 14
진화된 헥소키나제 돌연변이체는 글루코스의 존재하에서 자일로스를 소비한다
균주 YD01227의 진화에 의한 가공.
진화에 의한 가공을 위해서, 균주 YD01227을 글루코스-자일로스 혼합물상에서의 진화 가공에 사용하여, 헥소스 수송에서의 자발적인 돌연변이체의 단리 또는 헥소스 수송의 발현 및/또는 활성의 조절을 목적으로 하는 글루코스 존재하에서의 자일로스 동화를 서서히 전개시켰다.
YD01227을 16시간 동안 2% 자일로스가 보충된 베르듀인-유레아-his가 있는 진탕 플라스크에 접종하였다. 상기 진화 가공의 출발시, YD01227을 1% 자일로스, 3% 글루코스를 함유하는 베르듀인-유레아-his 중에서 0.2의 OD600 및 5%의 DO 설정값으로 희석하였다. 이산화탄소 유출을 모니터하였다. 다양한 시점들에서, 샘플을 글루코스 및 자일로스 농도의 분석을 위해 취하였다. 균주 YD01227이 단독으로 자일로스상에서, 또는 글루코스와 자일로스 모두상에서 생육하는지의 여부를 측정하였다. 상기 진화 가공의 출발시 상기 글루코스 대 자일로스 비를, YD01227 생육을 상기 실험의 시작시에 여전히 허용하는 비(글루코스 3%, 자일로스 1%)로 낮게 유지시켰다. 그러나, 이는 단지 1% 자일로스상에서의 생육에 비해 현저하게 더 낮은 생육률이었다. 상기 설정에서, 상기 균주는 상기 자일로스를 소비하며 이는 더 높은 글루코스:자일로스 비를 유도하고, 따라서 생육률을 떨어뜨렸다. CO2 생산이 하락되었을 때, 추가의 자일로스(500 ㎖ 발효기 부피에 50% 자일로스 5 ㎖)를 가하여 생육을 유지시켰다. 5 내지 6일 후에 평균에 도달한 20의 OD600에서, 상기 배양물을, 생육률이 선행 주기에서 현저하게 개선된 경우, 보다 높은 글루코스 대 자일로스 비로 새로운 베르듀인-유레아-his로 희석하였다. 종합해서, 27일의 시간 틀에서, 상기 균주를 각각 1%Xyl/3%Glc(1:3), 1.5%Xyl/9%Glc(1:6), 1%Xyl/8%Glc(1:8), 1%Xyl/10%Glc(1:10) 및 0,57%Xyl/10%Glc(1 :15)로 5배 연속 희석하였다. 1% 자일로스 및 8% 글루코스의 접종 전에, DO에 대한 설정값을 보다 낮은 생육률을 유지시키기 위해서 0%(혐기성 생육)로 낮추었다. 도 20에서 YD01227의 캐모스탯 배양 동안(일수) 상기 베르듀인-유레아-his 배지에서 글루코스/자일로스 비에 대한 설계를 제공한다. 27일 후에 샘플들을, 상기 진화된 YD01227 균주 및 음성 대조군으로서 원래의 YD01227과 함께 도말된 1% 자일로스 및 10% 글루코스에서 취하였다. 원래의 YD01227이 단지 작은 콜로니를 나타낸 반면, 상기 진화된 YD01227 균주의 콜로니는 10 내지 15배 더 컸다.
글루코스 경쟁의 존재/부재하에서의 자일로스 생육 및 자일로스 흡수.
1% 자일로스 및 10% 글루코스 플레이트상에서 상기 진화된 YD01227 균주의 재-도말 후에, 3개의 콜로니(EvoA, EvoB 및 EvoC)를 각각 0%, 3%, 6% 및 10% 글루코스의 존재하에서 1% 자일로스상에서 진탕 플라스크에서 생육에 대해 분석하였다. YD01227 EvoB는 6% 및 10% 글루코스하에 자일로스상에서 최고의 생육률을 가졌으며 원래의 YD01227 균주와 비교되었다(도 21a, 21b). 원래의 YD01227 균주(도 21b에서 YD01227 ORI)에서, 상기 생육률은 이미 3% 글루코스에서 부분적으로 억제되고 6% 및 10% 글루코스에서 완전히 억제되지만, YD01227 EvoB 균주는 모든 글루코스 농도에서 생육률의 단지 약간의 억제를 나타내며 이는 첨가된 글루코스의 양과 관련이 없는 것처럼 보인다(도 21a). 동일한 2개의 균주를, 자일로스 흡수가 글루코스에 의해 억제되는 14C 자일로스(50 mM) 흡수 실험에 사용하였다(도 21c). 상기 두 균주 모두에서 글루코스의 첨가 없이 자일로스의 흡수는 동일하지만, 글루코스가 상기 두 균주 모두에 첨가되자마다 곧 상기 YD01227 EvoB 균주에서의 자일로스의 흡수는 원래의 YD01227 균주에서의 흡수만큼 억제되지 않았다. 1:10 비에서 원래의 YD01227 균주에서의 자일로스 흡수는 완전히 제거된 반면 상기 YD01227 EvoB 균주에서는 여전히 5 nmol/㎎DW.min이 흡수된다.
실시예 15
HXT3 -6 키메라에서 단일 뉴클레오타이드 다형성은 진화된 헥소키나제 돌연변이체 중의 글루코스의 존재하에서 자일로스 소비를 허용한다
진화된 YD01227 균주에서 HXT의 발현.
상기 진화된 YD01227 EvoB 및 원래 YD01227 균주에서 HXT1 -17GAL2의 발현 수준을 1% 자일로스 및 3% 글루코스를 함유하는 베르듀인-유레아-his상에서 배치 배양 동안 비교하였다(도 22a). 프라이머(서열번호 2-37)를 YD01227 및 진화된 유도체에서 HXT의 발현의 실시간 PCR 특성화에 사용하였다. 더욱 또한, 상기 YD01227 EvoB 균주에서의 발현 수준을 또한 1% 자일로스 및 10% 글루코스를 함유하는 베르듀인-유레아-his상에서 분석하였다. 절대 C(t) 값(데이터 도시 안 됨)은 HXT1-7 유전자가 중간 또는 고도로 발현된 유일한 HXT 유전자들이며 이중 HXT3-6 키메라(균주 계통 유전자내 및 유전자간 HXT3HXT6 서열의 특이적인 결실이 하나의 HXT36 키메릭 서열을 생성시킨다)가 최고의 발현 수준을 가짐을 보인다. 상기 분석된 당 수송체들 중 어느 것도 원래의 YD01227 균주에 비해 상기 YD01227 EvoB 균주에서 상향조절되지 않는다. YD01227 EvoB 1% 자일로스 및 10% 글루코스에서 상기 HXT1 유전자에서 나타난 상향조절은 상기 샘플 중의 높은 글루코스 농도에 의해 야기되며 이는 매우 널리 공지되어 있다(문헌[Ozcan & Johnston, 1995, Three different regulatory mechanisms enable yeast hexose transporter (HXT) genes to be induced by different levels of glucose. Mol Cell Biol 15, pp. 1564-1572]). 상기 높은 글루코스 농도는 또한 YD01227 EvoB에서 HXT2HXT7의 하향 조절을 유도한다. HXT1에서의 상향조절 및 HXT2HXT7에서의 하향 조절은 모두 문헌에 개시되어 있다(문헌[Boles & Hollenberger 1997, Kinetic characterization of individual hexose transporters of Saccharomyces cerevisiae and their relation to the triggering mechanisms of glucose repression , FEMS Microbiol Rev 21, pp. 85-111]).
고도로 발현된 HXT 유전자의 서열분석.
HXT1 -7은 프라이머 서열번호 49-60을 사용하여 1% 자일로스 및 3% 글루코스상에서 YD01227 EvoB 배양물로부터 단리된 cDNA로부터 증폭되었다. 상기 유전자로부터의 PCR 산물을 서열분석하였다. HXT1 , HXT2HXT4에서 돌연변이는 밝혀지지 않았으며, HXT5HXT7에서 하나의 침묵 돌연변이 및 키메라 HXT3 -6에서 367번 위치에서 아미노산 변화를 도출한 돌연변이(Asn에서 Ile; N3671)가 밝혀졌다. 상기 YD01227 균주 계통 중 어딘가에서, 유전자내 및 유전자간 서열이 결실된(HXT3 ORF, HXT3 종결자, HXT6 프로모터, HXT6 ORF의 3' 부분의 부분) HXT3HXT6의 이웃하는 자리 사이에서 결실이 발생하여, 인프레임이고 mRNA로서 발현되고 기능성 단백질로 번역될 수 있는 하나의 HXT36 키메릭 서열을 생성시켰다. 상기 번역된 키메릭 단백질 Hxt3-6p에서 첫 번째 438 아미노산은 CEN.PK Hxt3p 아미노산 서열과 일치하는 반면, C-말단을 향한 130개 아미노산은 CEN.PK에서 Hxt6p에 일치한다. HXT3-6-7 자리에서 게놈 재배열이 과거에, 예를 들어 저 글루코스 농도상에서 케모스탯 배양으로부터 생성되는 HXT6/7 키메릭 서열이 문헌에 보고되었으며, 상기 재배열은 상기 헥소스 수송체 클러스터 중의 서열들의 고도로 상동성인 신장부로 인한 상동성 재조합에 의해 야기되는 것으로 제안되어 있다(문헌[Brown et al 1998. Multiple duplications of yeast hexose transport genes in response to selection in a glucose-limited environment. Mol Biol Evol 15:931-942]). N367I 점 돌연변이가 글루코스에 대한 친화성에 기여하는 잔기들을 함유하는 것으로 공지된 막관통 도메인(TMD) 8 중에 위치한다(문헌[Kasahara & Kasahara, 2003. Transmembrane segments 1, 5, 7 and 8 are required for high-affinity glucose transport by S. cerevisiae Hxt2 transporter. Biochem J. 372:247-252], 본 특허 출원에 의해 재확인되었다).
실시예 16 내지 18
방법
실시예 16 및 17의 섹션에 언급되지 않은 방법들은 이미 실시예 6 내지 15의 섹션에 개시되었다. 실시예 16 및 17에 개시된 연구에 사용된 올리고뉴클레오타이드들을 표 14에 서술한다. HXT36 중 N367번 위치의 포화된 돌연변이유발을 프라이머쌍 F HXT36 Bcul(서열번호 127)/R HXT36 367NNN(서열번호 128) 및 F HXT36 367NNN(서열번호 129)/R HXT36 BamHI(서열번호 130)을 사용하여 HF 완충제를 갖는 퓨전(등록상표) 하이파이 PCR 마스터 믹스를 갖는 PCR을 사용하여 수행하였다. 1119 및 623 염기쌍의 단편을 후속으로 외부 프라이머 F HXT36 Bcul 및 R HXT36 BamHI을 사용하여 중복 PCR에 사용하고 BcuIBamHI을 사용하여 pRS313P7T7에 클로닝시켰다. 48개의 에스케리키아 콜라이의 서열분석은 N367S (tec), N367P (ccc), N367G (ggg), N367Y (tac), N367A (gcc), N367H (cac), N367R (agg), N367F (ttt), N367E (gag), 및 N367V (gtg)를 제공하였다. 367번 위치의 나머지 8개 아미노산을 증폭시키고, NNN이 tta (L), tgt (C), tgg (W), atg (M), act (T), aag (K), gat (D) 및 cag (Q)에 의해 치환된 특정한 프라이머들을 사용하여 중복 PCR에 의해 클로닝시켰다.
HXT36 및 HXT36-N367I 돌연변이체와의 카복실-말단 GFP 융합물을 프라이머 F HXT36 BcuI(서열번호 127) 및 R HXT36 BamHI-정지(서열번호 131)를 사용하여 퓨전(등록상표) 하이파이 PCR 마스터 믹스(HF 완충제)에 의해 상응하는 유전자를 증폭시켜 제조하였다. 상기 GFP 유전자 자체를 F GFP BamHI(서열번호 132) 및 R GFP ClaI(서열번호 133)으로 증폭시켰다. HXT36HXT36-N367I를 제한 효소 BcuI 및 BamHI으로 절단하고 GFP를 BamHIClaI로 절단하였다. HXT36 유전자를, BcuIClaI로 절단된 pRS313-P7T7에 GFP와 함께 2-단편 연결에 의해 별도로 연결시켰다.
실시예 18의 발효를 위해서, 균주들을 0.5% D-글루코스 및 0.5% D-자일로스를 함유하는 68 ㎖ 발효 배지로 테까지 충전된 50 ㎖ 쇼트(Schott) 병에서 중복하여 생육시키고 수욕에서 30 ℃에서 완전히 밀폐시켜 보관하였다. 자기 교반기에 의한 교반 속도는 200 rpm이었으며 상기 균주들을 대략 8.0의 출발 OD600으로 접종하였다. 규칙적인 간격으로 샘플을 OD600 측정 및 HPLC 분석을 위해 취하였다.
[표 14]
클로닝 및 서열분석에 사용된 올리고뉴클레오타이드들
Figure pct00047
실시예 16
HXT3 -6 N367I의 V max 감소는 GFP -표지화 연구에 의해 입증되는 바와 같이 돌연변이체의 감소된 발현의 결과가 아니다
상기 보다 낮은 Vmax가 발현의 감소에 기인하지 않음을 보증하기 위해서, GFP가 HXT36 및 HXT36-N367I 돌연변이체의 C-말단에 융합된 키메라를 제조하였다. 상기 두 융합물은 모두 RN1053 균주로 형질전환되었으며, 형광 영상화는 상기 단백질들이 원형질막에 걸쳐 균일하게 분포됨을 밝혔다(도 23A 및 23B). 동일한 수준의 GFP가 기록되었기 때문에, Hxt36p 및 Hxt36p-N367I는 유사한 정도로 발현된다(도 23C).
실시예 17
서열 간격의 조사를 위한 HXT3 -6 키메라 중의 아스파라진 -367 위치상의 포화 돌연변이유발은 증대된 자일로스 수송 능력을 갖는 증대된 수송체 중의 효능있는 잔기로서 알라닌을 밝혀낸다
N367번 위치(서열번호 59에서 N376번 위치에 상응함)의 서열 간격을 조사하기 위해서, 모든 아미노산 치환을 HXT36 유전자에 개별적으로 도입시켰다. 개별적인 HXT36-N367X 돌연변이체를 YD01227 헥소키나제 결실 균주로 형질전환시키고 1% D-자일로스 및 10% D-글루코스를 함유하는 최소 배지상에서 생육에 대해 시험하였다. 원래의 HXT36-N367I 돌연변이체를 갖는 형질전환체는 24시간 후에 0.56의 OD600를 나타낸 반면 HXT36 야생형은 상기 조건하에서 생육할 수 없었다(도 24). 가장 빨리 생육하는 형질전환체는 Hxt36p N367A 돌연변이체를 가졌으며, 거의 2의 OD600에 도달하였다. 또한 상기 HXT36 돌연변이체를 발현하는 형질전환체는, 10% D-글루코스의 존재하에서 D-자일로스상에서 생육할 수 있는 다른 비극성 지방족 아미노산 치환(글리신, 발린, 류신 및 메티오닌)을 갖는다. 다른 한편으로, 상기 페닐알라닌 및 히스티딘 돌연변이체는 감소된 생육률을 나타낸 반면 강한 극성 및 하전된 아미노산 치환은 생육을 지지하지 않았다(도 24). 이들 데이터는 상기 N367(Gal2p에서 N376 및 Hxt11p에서 N366에 상응함)이 글루코스 대 자일로스에 대한 Hxt36p의 특이성을 결정하는데 중요한 잔기임을 입증한다.
상기 Hxt36p N367A 및 N367I 돌연변이체를 추가로 분석하여 그들의 수송체 역학을 측정하였다. 여기에서, 상기 수송체들은 낮은 배경 글루코스 수송 활성이 구비된 균주 RN1053에서 발현되었다. HXT36에 의한 D-글루코스 흡수에 대한 Km 및 Vmax는 각각 약 6 mM 및 32 nmol/mgDW.min이었다(표 15 및 도 25). 현저하게, 상기 Hxt36p N367I 돌연변이체는 D-글루코스 흡수에서 완전히 결함되었으며, 반면 D-자일로스 흡수에 대한 친화성은 Hxt36p에 비해 2.7배 개선되었다(즉 108에서 40 mM)(표 15). 그러나, 상기 돌연변이는 또한 D-자일로스 흡수에 대한 Vmax에서 거의 3배 감소를 일으켰다.
또한 상기 Hxt36p-N367A 돌연변이체의 수송 활성을 검사하였으며, 이는 D-자일로스상에서의 가장 빠른 생육을 입증하였다. 상기 수송체는 매우 불량한 Km(171 mM 대 6 mM)을 갖지만 여전히 약간의 글루코스 흡수를 보였다. 상기 N367I 돌연변이체에 비해, 상기 N367A 돌연변이는 D-자일로스 흡수에 대해 각각 25 mM 및 15.3 nmol/mgDW.min의 Km 및 Vmax 값의 개선을 모두 야기하였다.
실시예 18
변경된 수송 특성을 갖는 가공된 사카로마이세스 세레비지아에에 의한 D- 글루코스 및 D- 자일로스의 동시-발효
D-글루코스 및 D-자일로스의 동시-발효를 조사하기 위해서, 야생형 Hxt36, Hxt36-N367I 및 Hxt36p-N367A를 갖는 RN1053 균주를 대략 8.0의 보다 높은 산업상 적합한 출발 OD600에서 5 gℓ-1 D-글루코스/5 gℓ-1 D-자일로스상에서 생육시켰다. 당 소비 및 에탄올 농도를 시간을 통해 추적하였다(도 26). 상기 Hxt36-N367I 수송체를 함유하는 균주는 D-자일로스상에서 생육하나, 심한 D-글루코스 흡수 결함으로 인해(도 26B), 단지 일부 배경 수준의 D-글루코스 소비를 보이며, 이는 어떠한 재-도입된 수송체도 없는 원래의 RN1053 균주의 경우와 유사하다(데이터 도시 안 됨). 상기 Hxt36-N367A 돌연변이체를 갖는 균주는 Hxt36 야생형 수송체를 함유하는 균주(도 26A)에 비해 개선된 D-글루코스 및 D-자일로스 동시-소비(도 26C)를 나타내었다. 더욱이, 또한 전체 당 소비는, 9시간의 발효 후에 야생형 Hxt36p-발현 RN1053(2.67 gL- 1)보다 더 높은 에탄올 농도(2.83 gL- 1)를 제공하는 상기 Hxt36p-N367A-발현 RN1053에 의한 글루코스 및 자일로스의 동시-소비로 인해 증가하였다.
[표 15]
균주 RN1053에서 발현된 Hxt36p 수송체에 의한 D-글루코스 및 D-자일로스 흡수에 대한 Km 및 Vmax
Figure pct00048
실시예 19 및 20
물질 및 방법
실시예 19 및 20의 섹션에 언급되지 않은 방법들은 이미 실시예 6 내지 18의 섹션에 개시되었다. 실시예 19 및 20에 개시된 연구에 사용된 올리고뉴클레오타이드들을 표 16에 서술한다.
N366X의 돌연변이유발.
HXT11 중의 N366번 위치의 포화된 돌연변이유발을 프라이머쌍 F HXT11 Xbal/R HXT11 366NNN 및 F HXT11 366NNN/R HXT11 BamHI를 사용하여 HF 완충제를 갖는 퓨전(등록상표) 하이파이 PCR 마스터 믹스로 PCR을 사용하여 수행하였다. 1113 내지 591 염기쌍의 단편을 후속으로 외부 프라이머 F HXT11 XbaI 및 R XHT11 BamHI를 사용하여 중복 PCR에 사용하고 XbaIBamHI를 사용하여 pRS313P7T7에 클로닝시켰다. 48개의 에스케리키아 콜라이 클론의 서열분석은 N367S (tct), N367P (cca), N367G (ggt), N367A (gcc), N367H (cac), N367R (cgc), N367L (ttg), N367C (tgt), N367T (acg), N367D (gat), N367Q (caa), 및 N367V (gtg)를 제공하였다. 366번 위치의 나머지 6개 아미노산을 증폭시키고, NNN이 ttt (F), gag (E), tgg (W), atg (M), aaa (K), 및 N367Y (tat)에 의해 치환된 특이적인 프라이머들을 사용하여 중복 PCR에 의해 상기 언급한 바와 같이 클로닝시켰다.
상기 포화 돌연변이유발 PCR에 의해 생성된 HXT11 변체 서열을 사용하여, HXT11 변체의 세포 국소화를 연구하기 위해 HXT11-N366x-GFP-융합 구축물을 실시예 10(p.96)에 대한 방법에 개시된 바와 유사하게(올리고뉴클레오타이드, 제한 부위 및 pRS313-P7T7-GFP 주쇄 벡터를 사용하여) 제조하였다.
발효 실험.
효모 배양물을 2% 말토스를 함유하는 무기질 배지에서 예비-배양하였다. 중간-지수기의 세포를 수확하고 멸균수로 2회 세척후 접종하였다. 발효 실험을 산소 제한 조건하에서 5의 초기 OD600으로 30 ℃에서 120 ㎖ 병 중에 7% 글루코스 및 4% 자일로스를 함유하는 무기질 배지 100 ㎖을 사용하여 수행하였다. 자기 교반기에 의한 교반 속도는 200 rpm이었다. 상기 병 발효 실험들을 모두 독립적으로 반복하였다.
[표 16]
사카로마이세스 세레비지아에 HXT11의 포화 돌연변이유발에 사용된 프라이머들
Figure pct00049
실시예 19
HXT11에서 N366 돌연변이는 글루코스의 존재하에서 자일로스 이용을 개선시킨다
Hxt11에서 N366D 돌연변이는 글루코스 수송 친화성의 감소로 인해 글루코스의 존재하에서 자일로스 흡수를 개선시켰다. 상기 위치의 중요성을 평가하기 위해서, N366을 다른 19개 아미노산들 각각으로 치환하여 일련의 N366X 돌연변이체를 생성시켰다. 상응하는 유전자들을 균주 YD01227에서 발현시키고 96-웰 플레이트를 사용하여 10% 글루코스의 존재하에서 1% 자일로스를 사용하는 그의 능력을 평가하였다. 여기에서, 다양한 돌연변이체들의 성능을 식별하기 위해서 10% 글루코스를 15% 대신에 사용하여 상기 분석의 감도를 증가시켰다. 10배 과잉의 글루코스의 존재하에 자일로스상에서의 생육률은 N366을 메티오닌(M) 또는 쓰레오닌(T) 잔기에 의해 치환시켰을 때 개선되었고(도 27A), 상기 N366D 치환보다 3배까지 더 높았다. 양으로 하전된 또는 벌키 소수성 측쇄를 갖는 아미노산들은 상기 선별 조건하에서 자일로스상에서의 생육을 지지하지 않았다. 상기 돌연변이체를 또한 글루코스상에서의 생육에 대해 시험하고 균주 RN1053에서 발현시켰다. 상기 N366M 및 N366T Hxt11 돌연변이체들은 글루코스상에서 또는 야생형 Hxt11에 비해 유사한 생육을 나타내었다(도 27B 및 27C). 또한, 모든 개별적인 돌연변이체의 발현 수준을 GFP-태그된 Hxt11 단백질을 사용하여 측정하였다(도 28). 상기 Hxt11-GFP 단백질을 모두 막상에서 고도로 발현되었으나, 단 상기 GFP-태그된 N366W 및 N366Y Hxt11 단백질들의 경우 시토솔 및 유사한 액포 국소화가 보이는 듯하다. 이는 상기 돌연변이체들에 의한 단백질-잘못접힘 및 상기 막에의 잘못된 표적화를 암시하며 자일로스 및 글루코스를 사용한 생육 실험에서 낮은 활성을 설명한다. 그러나, 야생형 및 N366M 및 N3656T Hxt11 돌연변이체 단백질은 상기 원형질막에 국소화되었다. 종합적으로, 이들 데이터는 N366이 자일로스 대 글루코스에 대한 Hxt11의 특이성을 결정함에 있어서 중요한 잔기임을 가리킨다.
Hxt11 및 N366T 및 N366M Hxt11 돌연변이체를 통한 자일로스 및 글루코스 수송 역학을, 사카로마이세스 세레비지아에 균주 RN1053을 사용하여 자일로스에서 발현된 유전자들에 대해 측정하였다. 야생형 Hxt11에 비해, N366T 및 N366M Hxt11에 의한 글루코스 수송에 대한 친화성이 각각 5배 및 4배까지 감소되었다. 대조적으로, 이들 돌연변이체에 의한 자일로스에 대한 친화성은 Hxt11에 비해 2배까지(표 17) 개선되었다. 상기 N366T Hxt11 돌연변이체에 의한 글루코스 흡수에 대한 Vmax는 야생형 Hxt11에 비해 약 40%까지 증가된 반면, N366M Hxt11 단백질의 경우 Vmax가 변하지 않았다. 중요하게는, 상기 돌연변이체들의 자일로스에 대한 Vmax는 Hxt11에 비해 그다지 변하지 않은 채로 있었다.
[표 17]
균주 RN1053에서 발현된 Hxt11 수송체에 의한 D-글루코스 및 D-자일로스 흡수에 대한 Km 및 Vmax
Figure pct00050
실시예 20
HXT11 변체를 발현하는 가공된 사카로마이세스 세레비지아에 균주에 의한 D-글루코스 및 D-자일로스의 동시-발효
자일로스 수송에 의한 간섭 없이 글루코스 수송에 대한 Hxt11 중의 N366 돌연변이의 현저한 효과로 인해, 상기 돌연변이체들을 산업상 조건하에서 자일로스 및 글루코스, 즉 각각 7% 글루코스 및 4% 자일로스를 동시-대사하는 그들의 능력에 대해 추가로 검사하였다. 여기에서, 상기 돌연변이체를 균주 RN1053에서 발현시키고, 생육을 내인성 수송체의 전체 보체를 함유하는 Hxt11 야생형 및 균주 RN1001과 비교하였다. 상기 두 돌연변이체는 RN1001 균주(도 29C) 및 RN1053 야생형 Hxt11(도 29D)와 대조적으로 글루코스 및 자일로스(도 29A 및 29B)의 거의 완벽한 공동-소비를 지지하였으며 자일로스의 지연된 소비를 나타내었다. 이들 데이터는 Hxt11의 N366 위치의 돌연변이유발이, 글루코스 및 자일로스의 균형잡힌 흡수를 매개하고 이에 의해 헥소스 및 펜토스 당의 동시-소비를 지지하는 돌연변이체를 제공함을 입증한다. 최선의 결과는 돌연변이 N366T HXT11의 경우에 획득되었다.
동시-소비
세포의 동시-소비를 본 발명에서 정량분석하고 동시-소비 지수로서 나타낸다. 본 발명에서 상기 동시-소비 지수는 글루코스 및 자일로스에 대한 동시-소비 지수이며 단위시간당 소비된 당의 그램으로서 나타낸, 상기 글루코스 흡수율(Qg) 및 자일로스 흡수율(Qx)의 절대 차이의 0 내지 24시간의 시간 간격(0, 8, 12, 14, 16, 18, 20, 22 및 24시간째에 측정되었다)에 걸친 합으로서 계산되었다. 상기 발효는 1.0 g/ℓ 효모 피치, 30 ℃ 온도에서 혐기성 배치 배양 발효였으며, 여기에서 상기 발효 배지는 상기 발효의 출발시 리터당 71.8 그램의 글루코스 및 리터당 40.0 그램의 자일로스를 함유한다. 동시-소비 지수에 대한 낮은 값은 높은 동시-소비를, 높은 값은 낮은 동시-소비를 가리킨다.
균주 RN1001, RN1053 HXT11, RN1053 HXT11(N366M) 및 RN1053 HXT11(N366T)에 대한 상기 발효 데이터 및 계산을 표 18에 제공한다.
[표 18]
균주 RN1001, RN1053 HXT11, RN1053 HXT11(N366M) 및 RN1053 HXT11(N366T)에 대한 발효 데이터 및 동시-발효 지수의 계산
Figure pct00051
Figure pct00052
상기 균주 RN1001, RN1053 HXT11, RN1053 HXT11(N366M) 및 RN1053 HXT11(N366T)의 동시-소비 지수를 표 18에서와 같이 측정하였다. 상기 동시-소비 지수에 대한 결과들의 요약을 표 19에 제공한다.
[표 19]
균주들의 동시-소비 지수
Figure pct00053
참고문헌
Figure pct00054
Figure pct00055
SEQUENCE LISTING <110> DSM IP Assets B.V. <120> POLYPEPTIDES WITH PERMEASE ACTIVITY <130> 29382-WO-PCT <140> PCT/EP2014/061632 <141> 2014-06-04 <150> EP13170644.2 <151> 2013-06-05 <150> EP13170646.7 <151> 2013-06-05 <150> EP13170648.3 <151> 2013-06-05 <150> EP13197988.2 <151> 2013-12-18 <150> EP14160772.1 <151> 2014-03-19 <150> EP14164270.2 <151> 2014-04-10 <160> 167 <170> BiSSAP 1.2 <210> 1 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..20 <223> /organism="Artificial Sequence" /note="primer 5034-kanf" /mol_type="unassigned DNA" <400> 1 aagcttgcct cgtccccgcc 20 <210> 2 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..20 <223> /organism="Artificial Sequence" /note="primer 5035-kanr" /mol_type="unassigned DNA" <400> 2 gtcgacactg gatggcggcg 20 <210> 3 <211> 60 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..60 <223> /organism="Artificial Sequence" /note="primer 5116-lf2" /mol_type="unassigned DNA" <400> 3 attctagtaa cggccgccag tgtgctggaa ttcgccctta agcttgcctc gtccccgccg 60 <210> 4 <211> 56 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..56 <223> /organism="Artificial Sequence" /note="primer 5118-lr2" /mol_type="unassigned DNA" <400> 4 catacattat acgaagttat gcgcgctcta gatatcgtcg acactggatg gcggcg 56 <210> 5 <211> 65 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..65 <223> /organism="Artificial Sequence" /note="primer 5115-lf1" /mol_type="unassigned DNA" <400> 5 atccggacgt acgtataact tcgtatagca tacattatac gaagttattc tagtaacggc 60 cgcca 65 <210> 6 <211> 60 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..60 <223> /organism="Artificial Sequence" /note="primer 5117-lr1" /mol_type="unassigned DNA" <400> 6 tcatgacgtc tcgaggccta taacttcgta tagcatacat tatacgaagt tatgcgcgct 60 <210> 7 <211> 5082 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..5082 <223> /organism="Artificial Sequence" /note="pRN201; TOPO-BLUNT-loxP-kanMX-loxP" /mol_type="unassigned DNA" <400> 7 agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc 60 acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc 120 tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa 180 ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac gccaagctat 240 ttaggtgaca ctatagaata ctcaagctat gcatcaagct tggtaccgag ctcggatcca 300 ctagtaacgg ccgccagtgt gctggaattc gcccttatcc ggacgtacgt ataacttcgt 360 atagcataca ttatacgaag ttattctagt aacggccgcc agtgtgctgg aattcgccct 420 taagcttgcc tcgtccccgc cgggtcaccc ggccagcgac atggaggccc agaataccct 480 ccttgacagt cttgacgtgc gcagctcagg ggcatgatgt gactgtcgcc cgtacattta 540 gcccatacat ccccatgtat aatcatttgc atccatacat tttgatggcc gcacggcgcg 600 aagcaaaaat tacggctcct cgctgcagac ctgcgagcag ggaaacgctc ccctcacaga 660 cgcgttgaat tgtccccacg ccgcgcccct gtagagaaat ataaaaggtt aggatttgcc 720 actgaggttc ttctttcata tacttccttt taaaatcttg ctaggataca gttctcacat 780 cacatccgaa cataaacaac catgggtaag gaaaagactc acgtttcgag gccgcgatta 840 aattccaaca tggatgctga tttatatggg tataaatggg ctcgcgataa tgtcgggcaa 900 tcaggtgcga caatctatcg attgtatggg aagcccgatg cgccagagtt gtttctgaaa 960 catggcaaag gtagcgttgc caatgatgtt acagatgaga tggtcagact aaactggctg 1020 acggaattta tgcctcttcc gaccatcaag cattttatcc gtactcctga tgatgcatgg 1080 ttactcacca ctgcgatccc cggcaaaaca gcattccagg tattagaaga atatcctgat 1140 tcaggtgaaa atattgttga tgcgctggca gtgttcctgc gccggttgca ttcgattcct 1200 gtttgtaatt gtccttttaa cagcgatcgc gtatttcgtc tcgctcaggc gcaatcacga 1260 atgaataacg gtttggttga tgcgagtgat tttgatgacg agcgtaatgg ctggcctgtt 1320 gaacaagtct ggaaagaaat gcataagctt ttgccattct caccggattc agtcgtcact 1380 catggtgatt tctcacttga taaccttatt tttgacgagg ggaaattaat aggttgtatt 1440 gatgttggac gagtcggaat cgcagaccga taccaggatc ttgccatcct atggaactgc 1500 ctcggtgagt tttctccttc attacagaaa cggctttttc aaaaatatgg tattgataat 1560 cctgatatga ataaattgca gtttcatttg atgctcgatg agtttttcta atcagtactg 1620 acaataaaaa gattcttgtt ttcaagaact tgtcatttgt atagtttttt tatattgtag 1680 ttgttctatt ttaatcaaat gttagcgtga tttatatttt ttttcgcctc gacatcatct 1740 gcccagatgc agttaagtgc gcagaaagta atatcatgcg tcaatcgtat gtgaatgctg 1800 gtcgctatac tgctgtcgat tcgatactaa cgccgccatc cagtgtcgac gatatctaga 1860 gcgcgcataa cttcgtataa tgtatgctat acgaagttat aggcctcgag acgtcatgaa 1920 agggcgaatt ctgagatatc catcacactg gcggccgctc gagcatgcat ctagagggcc 1980 caattcgccc tatagtgagt cgtattacaa ttcactggcc gtcgttttac aacgtcgtga 2040 ctgggaaaac cctggcgtta cccaacttaa tcgccttgca gcacatcccc ctttcgccag 2100 ctggcgtaat agcgaagagg cccgcaccga tcgcccttcc caacagttgc gcagcctata 2160 cgtacggcag tttaaggttt acacctataa aagagagagc cgttatcgtc tgtttgtgga 2220 tgtacagagt gatattattg acacgccggg gcgacggatg gtgatccccc tggccagtgc 2280 acgtctgctg tcagataaag tctcccgtga actttacccg gtggtgcata tcggggatga 2340 aagctggcgc atgatgacca ccgatatggc cagtgtgccg gtctccgtta tcggggaaga 2400 agtggctgat ctcagccacc gcgaaaatga catcaaaaac gccattaacc tgatgttctg 2460 gggaatataa atgtcaggca tgagattatc aaaaaggatc ttcacctaga tccttttcac 2520 gtagaaagcc agtccgcaga aacggtgctg accccggatg aatgtcagct actgggctat 2580 ctggacaagg gaaaacgcaa gcgcaaagag aaagcaggta gcttgcagtg ggcttacatg 2640 gcgatagcta gactgggcgg ttttatggac agcaagcgaa ccggaattgc cagctggggc 2700 gccctctggt aaggttggga agccctgcaa agtaaactgg atggctttct cgccgccaag 2760 gatctgatgg cgcaggggat caagctctga tcaagagaca ggatgaggat cgtttcgcat 2820 gattgaacaa gatggattgc acgcaggttc tccggccgct tgggtggaga ggctattcgg 2880 ctatgactgg gcacaacaga caatcggctg ctctgatgcc gccgtgttcc ggctgtcagc 2940 gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc ggtgccctga atgaactgca 3000 agacgaggca gcgcggctat cgtggctggc cacgacgggc gttccttgcg cagctgtgct 3060 cgacgttgtc actgaagcgg gaagggactg gctgctattg ggcgaagtgc cggggcagga 3120 tctcctgtca tctcaccttg ctcctgccga gaaagtatcc atcatggctg atgcaatgcg 3180 gcggctgcat acgcttgatc cggctacctg cccattcgac caccaagcga aacatcgcat 3240 cgagcgagca cgtactcgga tggaagccgg tcttgtcgat caggatgatc tggacgaaga 3300 gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc aaggcgagca tgcccgacgg 3360 cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg aatatcatgg tggaaaatgg 3420 ccgcttttct ggattcatcg actgtggccg gctgggtgtg gcggaccgct atcaggacat 3480 agcgttggct acccgtgata ttgctgaaga gcttggcggc gaatgggctg accgcttcct 3540 cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc gccttctatc gccttcttga 3600 cgagttcttc tgaattatta acgcttacaa tttcctgatg cggtattttc tccttacgca 3660 tctgtgcggt atttcacacc gcatacaggt ggcacttttc ggggaaatgt gcgcggaacc 3720 cctatttgtt tatttttcta aatacattca aatatgtatc cgctcatgag acaataaccc 3780 tgataaatgc ttcaataata gcacgtgagg agggccacca tggccaagtt gaccagtgcc 3840 gttccggtgc tcaccgcgcg cgacgtcgcc ggagcggtcg agttctggac cgaccggctc 3900 gggttctccc gggacttcgt ggaggacgac ttcgccggtg tggtccggga cgacgtgacc 3960 ctgttcatca gcgcggtcca ggaccaggtg gtgccggaca acaccctggc ctgggtgtgg 4020 gtgcgcggcc tggacgagct gtacgccgag tggtcggagg tcgtgtccac gaacttccgg 4080 gacgcctccg ggccggccat gaccgagatc ggcgagcagc cgtgggggcg ggagttcgcc 4140 ctgcgcgacc cggccggcaa ctgcgtgcac ttcgtggccg aggagcagga ctgacacgtg 4200 ctaaaacttc atttttaatt taaaaggatc taggtgaaga tcctttttga taatctcatg 4260 accaaaatcc cttaacgtga gttttcgttc cactgagcgt cagaccccgt agaaaagatc 4320 aaaggatctt cttgagatcc tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa 4380 ccaccgctac cagcggtggt ttgtttgccg gatcaagagc taccaactct ttttccgaag 4440 gtaactggct tcagcagagc gcagatacca aatactgtcc ttctagtgta gccgtagtta 4500 ggccaccact tcaagaactc tgtagcaccg cctacatacc tcgctctgct aatcctgtta 4560 ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg ggttggactc aagacgatag 4620 ttaccggata aggcgcagcg gtcgggctga acggggggtt cgtgcacaca gcccagcttg 4680 gagcgaacga cctacaccga actgagatac ctacagcgtg agctatgaga aagcgccacg 4740 cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg aacaggagag 4800 cgcacgaggg agcttccagg gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc 4860 cacctctgac ttgagcgtcg atttttgtga tgctcgtcag gggggcggag cctatggaaa 4920 aacgccagca acgcggcctt tttacggttc ctgggctttt gctggccttt tgctcacatg 4980 ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt tgagtgagct 5040 gataccgctc gccgcagccg aacgaccgag cgcagcgagt ca 5082 <210> 8 <211> 5352 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..5352 <223> /organism="Artificial Sequence" /note="pRN251; TOPO-BLUNT-loxP-hphMX-loxP" /mol_type="unassigned DNA" <400> 8 agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc 60 acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc 120 tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa 180 ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac gccaagctat 240 ttaggtgaca ctatagaata ctcaagctat gcatcaagct tggtaccgag ctcggatcca 300 ctagtaacgg ccgccagtgt gctggaattc gccctttcat gacgtctcga ggcctataac 360 ttcgtatagc atacattata cgaagttatg cgcgctctag atatcgtcga gcggccgcca 420 gtgtgatgga tatcatcgat gaattcgagc tcgttttcga cactggatgg cggcgttagt 480 atcgaatcga cagcagtata gcgaccagca ttcacatacg attgacgcat gatattactt 540 tctgcgcact taacttcgca tctgggcaga tgatgtcgag gcgaaaaaaa atataaatca 600 cgctaacatt tgattaaaat agaacaacta caatataaaa aaactataca aatgacaagt 660 tcttgaaaac aagaatcttt ttattgtcag tactgattat tcctttgccc tcggacgagt 720 gctggggcgt cggtttccac tatcggcgag tacttctaca cagccatcgg tccagacggc 780 cgcgcttctg cgggcgattt gtgtacgccc gacagtcccg gctccggatc ggacgattgc 840 gtcgcatcga ccctgcgccc aagctgcatc atcgaaattg ccgtcaacca agctctgata 900 gagttggtca agaccaatgc ggagcatata cgcccggagc cgcggcgatc ctgcaagctc 960 cggatgcctc cgctcgaagt agcgcgtctg ctgctccata caagccaacc acggcctcca 1020 gaagaagatg ttggcgacct cgtattggga atccccgaac atcgcctcgc tccagtcaat 1080 gaccgctgtt atgcggccat tgtccgtcag gacattgttg gagccgaaat ccgcgtgcac 1140 gaggtgccgg acttcggggc agtcctcggc ccaaagcatc agctcatcga gagcctgcgc 1200 gacggacgca ctgacggtgt cgtccatcac agtttgccag tgatacacat ggggatcagc 1260 aatcgcgcat atgaaatcac gccatgtagt gtattgaccg attccttgcg gtccgaatgg 1320 gccgaacccg ctcgtctggc taagatcggc cgcagcgatc gcatccatgg cctccgcgac 1380 cggctgcaga acagcgggca gttcggtttc aggcaggtct tgcaacgtga caccctgtgc 1440 acggcgggag atgcaatagg tcaggctctc gctgaattcc ccaatgtcaa gcacttccgg 1500 aatcgggagc gcggccgatg caaagtgccg ataaacataa cgatctttgt agaaaccatc 1560 ggcgcagcta tttacccgca ggacatatcc acgccctcct acatcgaagc tgaaagcacg 1620 agattcttcg ccctccgaga gctgcatcag gtcggagacg ctgtcgaact tttcgatcag 1680 aaacttctcg acagacgtcg cggtgagttc aggcttttta cccatggttg tttatgttcg 1740 gatgtgatgt gagaactgta tcctagcaag attttaaaag gaagtatatg aaagaagaac 1800 ctcagtggca aatcctaacc ttttatattt ctctacaggg gcgcggcgtg gggacaattc 1860 acgcgtctgt gaggggagcg tttccctgct cgcaggtctg cagcgaggag ccgtaatttt 1920 tgcttcgcgc cgtgcggcca tcaaaatgta tggatgcaaa tgattataca tggggatgta 1980 tgggctaaat gtacgggcga cagtcacatc atgcccctga gctgcgcacg tcaagactgt 2040 caaggagggt attctgggcc tccatgtcgc tggccgggtg acccggcggg gacgaggcaa 2100 gcttaagggc gaattccagc acactggcgg ccgttactag aataacttcg tataatgtat 2160 gctatacgaa gttatacgta cgtccggata agggcgaatt ctgagatatc catcacactg 2220 gcggccgctc gagcatgcat ctagagggcc caattcgccc tatagtgagt cgtattacaa 2280 ttcactggcc gtcgttttac aacgtcgtga ctgggaaaac cctggcgtta cccaacttaa 2340 tcgccttgca gcacatcccc ctttcgccag ctggcgtaat agcgaagagg cccgcaccga 2400 tcgcccttcc caacagttgc gcagcctata cgtacggcag tttaaggttt acacctataa 2460 aagagagagc cgttatcgtc tgtttgtgga tgtacagagt gatattattg acacgccggg 2520 gcgacggatg gtgatccccc tggccagtgc acgtctgctg tcagataaag tctcccgtga 2580 actttacccg gtggtgcata tcggggatga aagctggcgc atgatgacca ccgatatggc 2640 cagtgtgccg gtctccgtta tcggggaaga agtggctgat ctcagccacc gcgaaaatga 2700 catcaaaaac gccattaacc tgatgttctg gggaatataa atgtcaggca tgagattatc 2760 aaaaaggatc ttcacctaga tccttttcac gtagaaagcc agtccgcaga aacggtgctg 2820 accccggatg aatgtcagct actgggctat ctggacaagg gaaaacgcaa gcgcaaagag 2880 aaagcaggta gcttgcagtg ggcttacatg gcgatagcta gactgggcgg ttttatggac 2940 agcaagcgaa ccggaattgc cagctggggc gccctctggt aaggttggga agccctgcaa 3000 agtaaactgg atggctttct cgccgccaag gatctgatgg cgcaggggat caagctctga 3060 tcaagagaca ggatgaggat cgtttcgcat gattgaacaa gatggattgc acgcaggttc 3120 tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg 3180 ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac 3240 cgacctgtcc ggtgccctga atgaactgca agacgaggca gcgcggctat cgtggctggc 3300 cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg 3360 gctgctattg ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga 3420 gaaagtatcc atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg 3480 cccattcgac caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg 3540 tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt 3600 cgccaggctc aaggcgagca tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc 3660 ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg 3720 gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga 3780 gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc 3840 gcagcgcatc gccttctatc gccttcttga cgagttcttc tgaattatta acgcttacaa 3900 tttcctgatg cggtattttc tccttacgca tctgtgcggt atttcacacc gcatacaggt 3960 ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta aatacattca 4020 aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata gcacgtgagg 4080 agggccacca tggccaagtt gaccagtgcc gttccggtgc tcaccgcgcg cgacgtcgcc 4140 ggagcggtcg agttctggac cgaccggctc gggttctccc gggacttcgt ggaggacgac 4200 ttcgccggtg tggtccggga cgacgtgacc ctgttcatca gcgcggtcca ggaccaggtg 4260 gtgccggaca acaccctggc ctgggtgtgg gtgcgcggcc tggacgagct gtacgccgag 4320 tggtcggagg tcgtgtccac gaacttccgg gacgcctccg ggccggccat gaccgagatc 4380 ggcgagcagc cgtgggggcg ggagttcgcc ctgcgcgacc cggccggcaa ctgcgtgcac 4440 ttcgtggccg aggagcagga ctgacacgtg ctaaaacttc atttttaatt taaaaggatc 4500 taggtgaaga tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc 4560 cactgagcgt cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg 4620 cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg 4680 gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca 4740 aatactgtcc ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg 4800 cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg 4860 tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga 4920 acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac 4980 ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat 5040 ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc 5100 tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga 5160 tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc 5220 ctgggctttt gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg 5280 gataaccgta ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag 5340 cgcagcgagt ca 5352 <210> 9 <211> 4847 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..4847 <223> /organism="Artificial Sequence" /note="pRN365; TOPO-BLUNT-loxP-natMX-loxP" /mol_type="unassigned DNA" <400> 9 agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc 60 acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc 120 tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa 180 ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac gccaagctat 240 ttaggtgaca ctatagaata ctcaagctat gcatcaagct tggtaccgag ctcggatcca 300 ctagtaacgg ccgccagtgt gctggaattc gcccttatcc ggacgtacgt ataacttcgt 360 atagcataca ttatacgaag ttattctagt aacggccgcc agtgtgctgg aattcgccct 420 taagcttgcc tcgtccccgc cgggtcaccc ggccagcgac atggaggccc agaataccct 480 ccttgacagt cttgacgtgc gcagctcagg ggcatgatgt gactgtcgcc cgtacattta 540 gcccatacat ccccatgtat aatcatttgc atccatacat tttgatggcc gcacggcgcg 600 aagcaaaaat tacggctcct cgctgcagac ctgcgagcag ggaaacgctc ccctcacaga 660 cgcgttgaat tgtccccacg ccgcgcccct gtagagaaat ataaaaggtt aggatttgcc 720 actgaggttc ttctttcata tacttccttt taaaatcttg ctaggataca gttctcacat 780 cacatccgaa cataaacaac catgtaaaat gaccactctt gacgacacgg cttaccggta 840 ccgcaccagt gtcccggggg acgccgaggc catcgaggca ctggatgggt ccttcaccac 900 cgacaccgtc ttccgcgtca ccgccaccgg ggacggcttc accctgcggg aggtgccggt 960 ggacccgccc ctgaccaagg tgttccccga cgacgaatcg gacgacgaat cggacgccgg 1020 ggaggacggc gacccggact cccggacgtt cgtcgcgtac ggggacgacg gcgacctggc 1080 gggcttcgtg gtcgtctcgt actccggctg gaaccgccgg ctgaccgtcg aggacatcga 1140 ggtcgccccg gagcaccggg ggcacggggt cgggcgcgcg ttgatggggc tcgcgacgga 1200 gttcgcccgc gagcggggcg ccgggcacct ctggctggag gtcaccaacg tcaacgcacc 1260 ggcgatccac gcgtaccggc ggatggggtt caccctctgc ggcctggaca ccgccctgta 1320 cgacggcacc gcctcggacg gcgagcaggc gctctacatg agcatgccct gcccctagta 1380 ctgacaataa aaagattctt gttttcaaga acttgtcatt tgtatagttt ttttatattg 1440 tagttgttct attttaatca aatgttagcg tgatttatat tttttttcgc ctcgacatca 1500 tctgcccaga tgcgaagtta agtgcgcaga aagtaatatc atgcgtcaat cgtatgtgaa 1560 tgctggtcgc tatactgctg tcgattcgat actaacgccg ccatccagtg tcgacgatat 1620 ctagagcgcg cataacttcg tataatgtat gctatacgaa gttataggcc tcgagacgtc 1680 atgaaagggc gaattctgag atatccatca cactggcggc cgctcgagca tgcatctaga 1740 gggcccaatt cgccctatag tgagtcgtat tacaattcac tggccgtcgt tttacaacgt 1800 cgtgactggg aaaaccctgg cgttacccaa cttaatcgcc ttgcagcaca tccccctttc 1860 gccagctggc gtaatagcga agaggcccgc accgatcgcc cttcccaaca gttgcgcagc 1920 ctatacgtac ggcagtttaa ggtttacacc tataaaagag agagccgtta tcgtctgttt 1980 gtggatgtac agagtgatat tattgacacg ccggggcgac ggatggtgat ccccctggcc 2040 agtgcacgtc tgctgtcaga taaagtctcc cgtgaacttt acccggtggt gcatatcggg 2100 gatgaaagct ggcgcatgat gaccaccgat atggccagtg tgccggtctc cgttatcggg 2160 gaagaagtgg ctgatctcag ccaccgcgaa aatgacatca aaaacgccat taacctgatg 2220 ttctggggaa tataaatgtc aggcatgaga ttatcaaaaa ggatcttcac ctagatcctt 2280 ttcacgtaga aagccagtcc gcagaaacgg tgctgacccc ggatgaatgt cagctactgg 2340 gctatctgga caagggaaaa cgcaagcgca aagagaaagc aggtagcttg cagtgggctt 2400 acatggcgat agctagactg ggcggtttta tggacagcaa gcgaaccgga attgccagct 2460 ggggcgccct ctggtaaggt tgggaagccc tgcaaagtaa actggatggc tttctcgccg 2520 ccaaggatct gatggcgcag gggatcaagc tctgatcaag agacaggatg aggatcgttt 2580 cgcatgattg aacaagatgg attgcacgca ggttctccgg ccgcttgggt ggagaggcta 2640 ttcggctatg actgggcaca acagacaatc ggctgctctg atgccgccgt gttccggctg 2700 tcagcgcagg ggcgcccggt tctttttgtc aagaccgacc tgtccggtgc cctgaatgaa 2760 ctgcaagacg aggcagcgcg gctatcgtgg ctggccacga cgggcgttcc ttgcgcagct 2820 gtgctcgacg ttgtcactga agcgggaagg gactggctgc tattgggcga agtgccgggg 2880 caggatctcc tgtcatctca ccttgctcct gccgagaaag tatccatcat ggctgatgca 2940 atgcggcggc tgcatacgct tgatccggct acctgcccat tcgaccacca agcgaaacat 3000 cgcatcgagc gagcacgtac tcggatggaa gccggtcttg tcgatcagga tgatctggac 3060 gaagagcatc aggggctcgc gccagccgaa ctgttcgcca ggctcaaggc gagcatgccc 3120 gacggcgagg atctcgtcgt gacccatggc gatgcctgct tgccgaatat catggtggaa 3180 aatggccgct tttctggatt catcgactgt ggccggctgg gtgtggcgga ccgctatcag 3240 gacatagcgt tggctacccg tgatattgct gaagagcttg gcggcgaatg ggctgaccgc 3300 ttcctcgtgc tttacggtat cgccgctccc gattcgcagc gcatcgcctt ctatcgcctt 3360 cttgacgagt tcttctgaat tattaacgct tacaatttcc tgatgcggta ttttctcctt 3420 acgcatctgt gcggtatttc acaccgcata caggtggcac ttttcgggga aatgtgcgcg 3480 gaacccctat ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat 3540 aaccctgata aatgcttcaa taatagcacg tgaggagggc caccatggcc aagttgacca 3600 gtgccgttcc ggtgctcacc gcgcgcgacg tcgccggagc ggtcgagttc tggaccgacc 3660 ggctcgggtt ctcccgggac ttcgtggagg acgacttcgc cggtgtggtc cgggacgacg 3720 tgaccctgtt catcagcgcg gtccaggacc aggtggtgcc ggacaacacc ctggcctggg 3780 tgtgggtgcg cggcctggac gagctgtacg ccgagtggtc ggaggtcgtg tccacgaact 3840 tccgggacgc ctccgggccg gccatgaccg agatcggcga gcagccgtgg gggcgggagt 3900 tcgccctgcg cgacccggcc ggcaactgcg tgcacttcgt ggccgaggag caggactgac 3960 acgtgctaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 4020 tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 4080 agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 4140 aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 4200 cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt 4260 agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 4320 tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 4380 gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 4440 gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 4500 ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 4560 gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 4620 ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 4680 ggaaaaacgc cagcaacgcg gcctttttac ggttcctggg cttttgctgg ccttttgctc 4740 acatgttctt tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt 4800 gagctgatac cgctcgccgc agccgaacga ccgagcgcag cgagtca 4847 <210> 10 <211> 32 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..32 <223> /organism="Artificial Sequence" /note="primer 115-natf" /mol_type="unassigned DNA" <400> 10 acatgtaaaa tgaccactct tgacgacacg gc 32 <210> 11 <211> 25 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..25 <223> /organism="Artificial Sequence" /note="primer 116-natr" /mol_type="unassigned DNA" <400> 11 cagtactagg ggccagggca tgctc 25 <210> 12 <211> 4254 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..4254 <223> /organism="Artificial Sequence" /note="pRN447; TOPO-BLUNT-loxP-zeoMX-loxP" /mol_type="unassigned DNA" <400> 12 agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc 60 acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc 120 tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa 180 ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac gccaagctat 240 ttaggtgaca ctatagaata ctcaagctat gcatcaagct tggtaccgag ctcggatcca 300 ctagtaacgg ccgccagtgt gctggaattc gcccttatcc ggacgtacgt ataacttcgt 360 atagcataca ttatacgaag ttattctagt aacggccgcc agtgtgctgg aattcgccct 420 taagcttgcc tcgtccccgc cgggtcaccc ggccagcgac atggaggccc agaataccct 480 ccttgacagt cttgacgtgc gcagctcagg ggcatgatgt gactgtcgcc cgtacattta 540 gcccatacat ccccatgtat aatcatttgc atccatacat tttgatggcc gcacggcgcg 600 aagcaaaaat tacggctcct cgctgcagac ctgcgagcag ggaaacgctc ccctcacaga 660 cgcgttgaat tgtccccacg ccgcgcccct gtagagaaat ataaaaggtt aggatttgcc 720 actgaggttc ttctttcata tacttccttt taaaatcttg ctaggataca gttctcacat 780 cacatccgaa cataaacaac catggccaag ttgaccagtg ccgttccggt gctcaccgcg 840 cgcgacgtcg ccggagcggt cgagttctgg accgaccggc tcgggttctc ccgggacttc 900 gtggaggacg acttcgccgg tgtggtccgg gacgacgtga ccctgttcat cagcgcggtc 960 caggaccagg tggtgccgga caacaccctg gcctgggtgt gggtgcgcgg cctggacgag 1020 ctgtacgccg agtggtcgga ggtcgtgtcc acgaacttcc gggacgcctc cgggccggcc 1080 atgaccgaga tcggcgagca gccgtggggg cgggagttcg ccctgcgcga cccggccggc 1140 aactgcgtgc acttcgtggc cgaggagcag gactgacaca ctgacaataa aaagattctt 1200 gttttcaaga acttgtcatt tgtatagttt ttttatattg tagttgttct attttaatca 1260 aatgttagcg tgatttatat tttttttcgc ctcgacatca tctgcccaga tgcgaagtta 1320 agtgcgcaga aagtaatatc atgcgtcaat cgtatgtgaa tgctggtcgc tatactgctg 1380 tcgattcgat actaacgccg ccatccagtg tcgacgatat ctagagcgcg cataacttcg 1440 tataatgtat gctatacgaa gttataggcc tcgagacgtc atgaaagggc gaattctgag 1500 atatccatca cactggcggc cgctcgagca tgcatctaga gggcccaatt cgccctatag 1560 tgagtcgtat tacaattcac tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg 1620 cgttacccaa cttaatcgcc ttgcagcaca tccccctttc gccagctggc gtaatagcga 1680 agaggcccgc accgatcgcc cttcccaaca gttgcgcagc ctatacgtac ggcagtttaa 1740 ggtttacacc tataaaagag agagccgtta tcgtctgttt gtggatgtac agagtgatat 1800 tattgacacg ccggggcgac ggatggtgat ccccctggcc agtgcacgtc tgctgtcaga 1860 taaagtctcc cgtgaacttt acccggtggt gcatatcggg gatgaaagct ggcgcatgat 1920 gaccaccgat atggccagtg tgccggtctc cgttatcggg gaagaagtgg ctgatctcag 1980 ccaccgcgaa aatgacatca aaaacgccat taacctgatg ttctggggaa tataaatgtc 2040 aggcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttcacgtaga aagccagtcc 2100 gcagaaacgg tgctgacccc ggatgaatgt cagctactgg gctatctgga caagggaaaa 2160 cgcaagcgca aagagaaagc aggtagcttg cagtgggctt acatggcgat agctagactg 2220 ggcggtttta tggacagcaa gcgaaccgga attgccagct ggggcgccct ctggtaaggt 2280 tgggaagccc tgcaaagtaa actggatggc tttctcgccg ccaaggatct gatggcgcag 2340 gggatcaagc tctgatcaag agacaggatg aggatcgttt cgcatgattg aacaagatgg 2400 attgcacgca ggttctccgg ccgcttgggt ggagaggcta ttcggctatg actgggcaca 2460 acagacaatc ggctgctctg atgccgccgt gttccggctg tcagcgcagg ggcgcccggt 2520 tctttttgtc aagaccgacc tgtccggtgc cctgaatgaa ctgcaagacg aggcagcgcg 2580 gctatcgtgg ctggccacga cgggcgttcc ttgcgcagct gtgctcgacg ttgtcactga 2640 agcgggaagg gactggctgc tattgggcga agtgccgggg caggatctcc tgtcatctca 2700 ccttgctcct gccgagaaag tatccatcat ggctgatgca atgcggcggc tgcatacgct 2760 tgatccggct acctgcccat tcgaccacca agcgaaacat cgcatcgagc gagcacgtac 2820 tcggatggaa gccggtcttg tcgatcagga tgatctggac gaagagcatc aggggctcgc 2880 gccagccgaa ctgttcgcca ggctcaaggc gagcatgccc gacggcgagg atctcgtcgt 2940 gacccatggc gatgcctgct tgccgaatat catggtggaa aatggccgct tttctggatt 3000 catcgactgt ggccggctgg gtgtggcgga ccgctatcag gacatagcgt tggctacccg 3060 tgatattgct gaagagcttg gcggcgaatg ggctgaccgc ttcctcgtgc tttacggtat 3120 cgccgctccc gattcgcagc gcatcgcctt ctatcgcctt cttgacgagt tcttctgaat 3180 tattaacgct tacaatttcc tgatgcggta ttttctcctt acgcatctgt gcggtatttc 3240 acaccgcata caggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt 3300 ttctaaatac attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa 3360 taatagcacg tgctaaaact tcatttttaa tttaaaagga tctaggtgaa gatccttttt 3420 gataatctca tgaccaaaat cccttaacgt gagttttcgt tccactgagc gtcagacccc 3480 gtagaaaaga tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat ctgctgcttg 3540 caaacaaaaa aaccaccgct accagcggtg gtttgtttgc cggatcaaga gctaccaact 3600 ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt ccttctagtg 3660 tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata cctcgctctg 3720 ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgtgtcttac cgggttggac 3780 tcaagacgat agttaccgga taaggcgcag cggtcgggct gaacgggggg ttcgtgcaca 3840 cagcccagct tggagcgaac gacctacacc gaactgagat acctacagcg tgagctatga 3900 gaaagcgcca cgcttcccga agggagaaag gcggacaggt atccggtaag cggcagggtc 3960 ggaacaggag agcgcacgag ggagcttcca gggggaaacg cctggtatct ttatagtcct 4020 gtcgggtttc gccacctctg acttgagcgt cgatttttgt gatgctcgtc aggggggcgg 4080 agcctatgga aaaacgccag caacgcggcc tttttacggt tcctgggctt ttgctggcct 4140 tttgctcaca tgttctttcc tgcgttatcc cctgattctg tggataaccg tattaccgcc 4200 tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg agcgcagcga gtca 4254 <210> 13 <211> 45 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..45 <223> /organism="Artificial Sequence" /note="primer 28-H3f" /mol_type="unassigned DNA" <400> 13 tgtacatccg gaattctaga ttggtgagcg ctaggagtca ctgcc 45 <210> 14 <211> 32 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..32 <223> /organism="Artificial Sequence" /note="primer 29-H3r" /mol_type="unassigned DNA" <400> 14 ctcgagtatt tcacaccgca tatgatccgt cg 32 <210> 15 <211> 6000 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..6000 <223> /organism="Artificial Sequence" /note="pRN247 (TOPO- BLUNT-HIS3::loxPkanMXloxP)" /mol_type="unassigned DNA" <400> 15 ggccgccaga tcttccggat ggctcgagtt tttcagcaag atcgcgagta tttcacaccg 60 catatgatcc gtcgagttca agagaaaaaa aaagaaaaag caaaaagaaa aaaggaaagc 120 gcgcctcgtt cagaatgaca cgtatagaat gatgcattac cttgtcatct tcagtatcat 180 actgttcgta tacatactta ctgacattca taggtataca tatatacaca tgtatatata 240 tcgtatgctg cagctttaaa taatcggtgt cactacataa gaacaccttt ggtggaggga 300 acatcgttgg taccattggg cgaggtggct tctcttatgg caaccgcaag agccttgaac 360 gcactctcac tacggtgatg atcattcttg cctcgcagac aatcaacgtg gagggtaatt 420 ctgctagcct ctgcaaagct ttcaagaaaa tgcgggatca tctcgcaaga gagatctcct 480 actttctccc tttgcaaacc aagttcgaca actgcgtacg tataacttcg tatagcatac 540 attatacgaa gttattctag taacggccgc cagtgtgctg gaattcgccc ttaagcttgc 600 ctcgtccccg ccgggtcacc cggccagcga catggaggcc cagaataccc tccttgacag 660 tcttgacgtg cgcagctcag gggcatgatg tgactgtcgc ccgtacattt agcccataca 720 tccccatgta taatcatttg catccataca ttttgatggc cgcacggcgc gaagcaaaaa 780 ttacggctcc tcgctgcaga cctgcgagca gggaaacgct cccctcacag acgcgttgaa 840 ttgtccccac gccgcgcccc tgtagagaaa tataaaaggt taggatttgc cactgaggtt 900 cttctttcat atacttcctt ttaaaatctt gctaggatac agttctcaca tcacatccga 960 acataaacaa ccatgggtaa ggaaaagact cacgtttcga ggccgcgatt aaattccaac 1020 atggatgctg atttatatgg gtataaatgg gctcgcgata atgtcgggca atcaggtgcg 1080 acaatctatc gattgtatgg gaagcccgat gcgccagagt tgtttctgaa acatggcaaa 1140 ggtagcgttg ccaatgatgt tacagatgag atggtcagac taaactggct gacggaattt 1200 atgcctcttc cgaccatcaa gcattttatc cgtactcctg atgatgcatg gttactcacc 1260 actgcgatcc ccggcaaaac agcattccag gtattagaag aatatcctga ttcaggtgaa 1320 aatattgttg atgcgctggc agtgttcctg cgccggttgc attcgattcc tgtttgtaat 1380 tgtcctttta acagcgatcg cgtatttcgt ctcgctcagg cgcaatcacg aatgaataac 1440 ggtttggttg atgcgagtga ttttgatgac gagcgtaatg gctggcctgt tgaacaagtc 1500 tggaaagaaa tgcataagct tttgccattc tcaccggatt cagtcgtcac tcatggtgat 1560 ttctcacttg ataaccttat ttttgacgag gggaaattaa taggttgtat tgatgttgga 1620 cgagtcggaa tcgcagaccg ataccaggat cttgccatcc tatggaactg cctcggtgag 1680 ttttctcctt cattacagaa acggcttttt caaaaatatg gtattgataa tcctgatatg 1740 aataaattgc agtttcattt gatgctcgat gagtttttct aatcagtact gacaataaaa 1800 agattcttgt tttcaagaac ttgtcatttg tatagttttt ttatattgta gttgttctat 1860 tttaatcaaa tgttagcgtg atttatattt tttttcgcct cgacatcatc tgcccagatg 1920 cgaagttaag tgcgcagaaa gtaatatcat gcgtcaatcg tatgtgaatg ctggtcgcta 1980 tactgctgtc gattcgatac taacgccgcc atccagtgtc gacgatatct agagcgcgca 2040 taacttcgta taatgtatgc tatacgaagt tataggaaag agatcgcaat ctgaatcttg 2100 gtttcatttg taatacgctt tactagggct ttctgctctg tcatctttgc cttcgtttat 2160 cttgcctgct cattttttag tatattcttc gaagaaatca cattacttta tataatgtat 2220 aattcattat gtgataatgc caatcgctaa gaaaaaaaaa gagtcatccg ctaggtggaa 2280 aaaaaaaaat gaaaatcatt accgaggcat aaaaaaatat agagtgtact agaggaggcc 2340 aagagtaata gaaaaagaaa attgcgggaa aggactgtgt tatgacttcc ctgactaatg 2400 ccgtgttcaa acgatacctg gcagtgactc ctagcgctca ccaatctaga attccggatg 2460 tacaatcttt ctagaagatc tcctacaata ttctcagctg cttaagggcg aattctgaga 2520 tatccatcac actggcggcc gctcgagcat gcatctagag ggcccaattc gccctatagt 2580 gagtcgtatt acaattcact ggccgtcgtt ttacaacgtc gtgactggga aaaccctggc 2640 gttacccaac ttaatcgcct tgcagcacat ccccctttcg ccagctggcg taatagcgaa 2700 gaggcccgca ccgatcgccc ttcccaacag ttgcgcagcc tatacgtacg gcagtttaag 2760 gtttacacct ataaaagaga gagccgttat cgtctgtttg tggatgtaca gagtgatatt 2820 attgacacgc cggggcgacg gatggtgatc cccctggcca gtgcacgtct gctgtcagat 2880 aaagtctccc gtgaacttta cccggtggtg catatcgggg atgaaagctg gcgcatgatg 2940 accaccgata tggccagtgt gccggtctcc gttatcgggg aagaagtggc tgatctcagc 3000 caccgcgaaa atgacatcaa aaacgccatt aacctgatgt tctggggaat ataaatgtca 3060 ggcatgagat tatcaaaaag gatcttcacc tagatccttt tcacgtagaa agccagtccg 3120 cagaaacggt gctgaccccg gatgaatgtc agctactggg ctatctggac aagggaaaac 3180 gcaagcgcaa agagaaagca ggtagcttgc agtgggctta catggcgata gctagactgg 3240 gcggttttat ggacagcaag cgaaccggaa ttgccagctg gggcgccctc tggtaaggtt 3300 gggaagccct gcaaagtaaa ctggatggct ttctcgccgc caaggatctg atggcgcagg 3360 ggatcaagct ctgatcaaga gacaggatga ggatcgtttc gcatgattga acaagatgga 3420 ttgcacgcag gttctccggc cgcttgggtg gagaggctat tcggctatga ctgggcacaa 3480 cagacaatcg gctgctctga tgccgccgtg ttccggctgt cagcgcaggg gcgcccggtt 3540 ctttttgtca agaccgacct gtccggtgcc ctgaatgaac tgcaagacga ggcagcgcgg 3600 ctatcgtggc tggccacgac gggcgttcct tgcgcagctg tgctcgacgt tgtcactgaa 3660 gcgggaaggg actggctgct attgggcgaa gtgccggggc aggatctcct gtcatctcac 3720 cttgctcctg ccgagaaagt atccatcatg gctgatgcaa tgcggcggct gcatacgctt 3780 gatccggcta cctgcccatt cgaccaccaa gcgaaacatc gcatcgagcg agcacgtact 3840 cggatggaag ccggtcttgt cgatcaggat gatctggacg aagagcatca ggggctcgcg 3900 ccagccgaac tgttcgccag gctcaaggcg agcatgcccg acggcgagga tctcgtcgtg 3960 acccatggcg atgcctgctt gccgaatatc atggtggaaa atggccgctt ttctggattc 4020 atcgactgtg gccggctggg tgtggcggac cgctatcagg acatagcgtt ggctacccgt 4080 gatattgctg aagagcttgg cggcgaatgg gctgaccgct tcctcgtgct ttacggtatc 4140 gccgctcccg attcgcagcg catcgccttc tatcgccttc ttgacgagtt cttctgaatt 4200 attaacgctt acaatttcct gatgcggtat tttctcctta cgcatctgtg cggtatttca 4260 caccgcatac aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt 4320 tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat 4380 aatagcacgt gaggagggcc accatggcca agttgaccag tgccgttccg gtgctcaccg 4440 cgcgcgacgt cgccggagcg gtcgagttct ggaccgaccg gctcgggttc tcccgggact 4500 tcgtggagga cgacttcgcc ggtgtggtcc gggacgacgt gaccctgttc atcagcgcgg 4560 tccaggacca ggtggtgccg gacaacaccc tggcctgggt gtgggtgcgc ggcctggacg 4620 agctgtacgc cgagtggtcg gaggtcgtgt ccacgaactt ccgggacgcc tccgggccgg 4680 ccatgaccga gatcggcgag cagccgtggg ggcgggagtt cgccctgcgc gacccggccg 4740 gcaactgcgt gcacttcgtg gccgaggagc aggactgaca cgtgctaaaa cttcattttt 4800 aatttaaaag gatctaggtg aagatccttt ttgataatct catgaccaaa atcccttaac 4860 gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag 4920 atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg 4980 tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact ggcttcagca 5040 gagcgcagat accaaatact gtccttctag tgtagccgta gttaggccac cacttcaaga 5100 actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg gctgctgcca 5160 gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg gataaggcgc 5220 agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga acgacctaca 5280 ccgaactgag atacctacag cgtgagctat gagaaagcgc cacgcttccc gaagggagaa 5340 aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg agggagcttc 5400 cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc 5460 gtcgattttt gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg 5520 cctttttacg gttcctgggc ttttgctggc cttttgctca catgttcttt cctgcgttat 5580 cccctgattc tgtggataac cgtattaccg cctttgagtg agctgatacc gctcgccgca 5640 gccgaacgac cgagcgcagc gagtcaagcg cccaatacgc aaaccgcctc tccccgcgcg 5700 ttggccgatt cattaatgca gctggcacga caggtttccc gactggaaag cgggcagtga 5760 gcgcaacgca attaatgtga gttagctcac tcattaggca ccccaggctt tacactttat 5820 gcttccggct cgtatgttgt gtggaattgt gagcggataa caatttcaca caggaaacag 5880 ctatgaccat gattacgcca agctatttag gtgacactat agaatactca agctatgcat 5940 caagcttggt accgagctcg gatccactag taacggccgc cagtgtgctg gaattcgccc 6000 <210> 16 <211> 35 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..35 <223> /organism="Artificial Sequence" /note="primer 201-Hx2uf" /mol_type="unassigned DNA" <400> 16 gactagtacc ggtgttttca aaacctagca acccc 35 <210> 17 <211> 43 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..43 <223> /organism="Artificial Sequence" /note="primer 202-Hx2ur" /mol_type="unassigned DNA" <400> 17 cgtacgcgtc ttccggaagg gtaccatcag atttcatttg acc 43 <210> 18 <211> 40 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..40 <223> /organism="Artificial Sequence" /note="primer 203-Hx2df" /mol_type="unassigned DNA" <400> 18 gaagacactc gagacgtcct ttgtctgtga aaccaagggc 40 <210> 19 <211> 39 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..39 <223> /organism="Artificial Sequence" /note="primer 204-Hx2dr" /mol_type="unassigned DNA" <400> 19 gtcgacgggc ccttatgttg gtcttgttta gtatggccg 39 <210> 20 <211> 48 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..48 <223> /organism="Artificial Sequence" /note="primer 205-Hx3uf" /mol_type="unassigned DNA" <400> 20 aagcggccgc actagtaccg gtgaaacaac tcaataacga tgtgggac 48 <210> 21 <211> 38 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..38 <223> /organism="Artificial Sequence" /note="primer 206-Hx3urATCCGGACGTCTTCCTCAAGAAATCAGTTTGGGCGACG" /mol_type="unassigned DNA" <400> 21 atccggacgt cttcctcaag aaatcagttt gggcgacg 38 <210> 22 <211> 44 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..44 <223> /organism="Artificial Sequence" /note="primer 210-Hx4df" /mol_type="unassigned DNA" <400> 22 agaagacgct cgagacgtcc cttatgggaa gaaggtgttt tgcc 44 <210> 23 <211> 34 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..34 <223> /organism="Artificial Sequence" /note="primer 211-Hx4dr" /mol_type="unassigned DNA" <400> 23 atggatccta ggggttcttg cagagtaaac tgcg 34 <210> 24 <211> 46 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..46 <223> /organism="Artificial Sequence" /note="primer 212-Hx5uf" /mol_type="unassigned DNA" <400> 24 aagcggccgc actagtacat gtgaacttga aaacgctcat caaggc 46 <210> 25 <211> 43 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..43 <223> /organism="Artificial Sequence" /note="primer 213-Hx5ur" /mol_type="unassigned DNA" <400> 25 ttcgtacgcg tcttccggag taacatgaaa ccagagtacc acg 43 <210> 26 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..42 <223> /organism="Artificial Sequence" /note="primer 229-Hx7df" /mol_type="unassigned DNA" <400> 26 agaagaccct cgagacgtcc gacgctgaag aaatgactca cg 42 <210> 27 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..42 <223> /organism="Artificial Sequence" /note="primer 230-Hx7dr" /mol_type="unassigned DNA" <400> 27 agtcgacgga tccgtaattt ttcttctttt aagtgacggg cg 42 <210> 28 <211> 44 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..44 <223> /organism="Artificial Sequence" /note="primer 243-Gal2ufn" /mol_type="unassigned DNA" <400> 28 aagcggccgc actagtaccg gtgatctata ttcgaaaggg gcgg 44 <210> 29 <211> 43 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..43 <223> /organism="Artificial Sequence" /note="primer 244-Gal2urn" /mol_type="unassigned DNA" <400> 29 aacgtacgtc cggatcatta gaatactttt gagattgtgc gct 43 <210> 30 <211> 43 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..43 <223> /organism="Artificial Sequence" /note="primer 233-Ga2df" /mol_type="unassigned DNA" <400> 30 agaagaccct cgagacgtct taccttggaa atctgaaggc tgg 43 <210> 31 <211> 36 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..36 <223> /organism="Artificial Sequence" /note="primer 234-Ga2dr" /mol_type="unassigned DNA" <400> 31 gtggatccta ggtaaaacgg tacgagaaaa gctccg 36 <210> 32 <211> 5959 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..5959 <223> /organism="Artificial Sequence" /note="pRN485; TOPO-BLUNT-GAL2::loxPzeoMXloxP" /mol_type="unassigned DNA" <400> 32 agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc 60 acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc 120 tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa 180 ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac gccaagctat 240 ttaggtgaca ctatagaata ctcaagctat gcatcaagct tggtaccgag ctcggatcca 300 ctagtaacgg ccgccagtgt gctggaattc gcccttgtgg atcctaggaa tggatgatgg 360 taaaacggta cgagaaaagc tccgagacgt tgaattgaat attaataggt tgcaggttga 420 tataaaagaa ataaaggaaa tgcttgttac actgataaac aaatgactga aaaaagcaac 480 tcctggatcg ttcgaacatt ctcactccat taattgtatg ttagctcagg aattcaactg 540 gaagaaagtc caggcaagta cctgacttat tttctagagg accccccaga gataagtctg 600 gtgatgtggt cctttaataa tttcataggg acaattcatt ttgcgttttt aattttgctc 660 ggtgaacaaa ggatggcaga gcatgttatc gttttctttt ttttttcctg ttttagagaa 720 aaaggttata tatgtaataa tactctgata tatgtacaca aataataggt ttaggtaagg 780 aatttatata atcgtaagga tatcattgat aagggaaatt tttttttttt tttttcaaac 840 aaatactatg ataattaaaa tgaagaaaaa acgtcagtca tgaaaaatta agagagatga 900 tggagcgtct cacttcaaac gcattattct agcatggcct tgtaccacgg tttgtcgtca 960 tgttgtaaat cctctaaatc gtaattatta cctcttctgg atgaaggaat ccagccttca 1020 gatttccaag gtaagacgtc tcgaggccta taacttcgta tagcatacat tatacgaagt 1080 tatgcgcgct ctagatatcg tcgacactgg atggcggcgt tagtatcgaa tcgacagcag 1140 tatagcgacc agcattcaca tacgattgac gcatgatatt actttctgcg cacttaactt 1200 cgcatctggg cagatgatgt cgaggcgaaa aaaaatataa atcacgctaa catttgatta 1260 aaatagaaca actacaatat aaaaaaacta tacaaatgac aagttcttga aaacaagaat 1320 ctttttattg tcagtgtgtc agtcctgctc ctcggccacg aagtgcacgc agttgccggc 1380 cgggtcgcgc agggcgaact cccgccccca cggctgctcg ccgatctcgg tcatggccgg 1440 cccggaggcg tcccggaagt tcgtggacac gacctccgac cactcggcgt acagctcgtc 1500 caggccgcgc acccacaccc aggccagggt gttgtccggc accacctggt cctggaccgc 1560 gctgatgaac agggtcacgt cgtcccggac cacaccggcg aagtcgtcct ccacgaagtc 1620 ccgggagaac ccgagccggt cggtccagaa ctcgaccgct ccggcgacgt cgcgcgcggt 1680 gagcaccgga acggcactgg tcaacttggc catggttgtt tatgttcgga tgtgatgtga 1740 gaactgtatc ctagcaagat tttaaaagga agtatatgaa agaagaacct cagtggcaaa 1800 tcctaacctt ttatatttct ctacaggggc gcggcgtggg gacaattcaa cgcgtctgtg 1860 aggggagcgt ttccctgctc gcaggtctgc agcgaggagc cgtaattttt gcttcgcgcc 1920 gtgcggccat caaaatgtat ggatgcaaat gattatacat ggggatgtat gggctaaatg 1980 tacgggcgac agtcacatca tgcccctgag ctgcgcacgt caagactgtc aaggagggta 2040 ttctgggcct ccatgtcgct ggccgggtga cccggcgggg acgaggcaag cttaagggcg 2100 aattccagca cactggcggc cgttactaga ataacttcgt ataatgtatg ctatacgaag 2160 ttatacgtac gtccggatca ttagaatact tttgagattg tgcgcttaaa tgggaatctt 2220 tactgagtga agagatcacg tcttcaccag cttggggttg ctgtgaaaca acaggcatat 2280 tgttctcctc aactgccatt atgaaagaat tatttttttt attatgttaa tcttgtgttt 2340 acttaactat tactattctt gatgataatt gaataaggtg cataatgaag agcaattcac 2400 aacaccaaat tttcaatcca attactgatt gtttatatat gtctacaaaa cttatcctat 2460 ctccacattt tagcctgcga aatgtttgtt ttttgaacaa tagctctcca gaatgttgta 2520 taatttaaga atatgtgcac agttaacttt ctagcaggag tataatgcca tttgctcccc 2580 atcttgagat gggaagggct taactaatct cggttcggag tgatccgccc cgatactgcc 2640 ttctgcctta atatcgtcca aggcacatgg acccctgaac ggcgcagata tctccgcacg 2700 gacgaaagac cgccggtgcc ttcctgaggc aaccgcccct ttcgaatata gatcaccggt 2760 actagtgcgg ccgcttaagg gcgaattctg cagatatcca tcacactggc ggccgctcga 2820 gcatgcatct agagggccca attcgcccta tagtgagtcg tattacaatt cactggccgt 2880 cgttttacaa cgtcgtgact gggaaaaccc tggcgttacc caacttaatc gccttgcagc 2940 acatccccct ttcgccagct ggcgtaatag cgaagaggcc cgcaccgatc gcccttccca 3000 acagttgcgc agcctatacg tacggcagtt taaggtttac acctataaaa gagagagccg 3060 ttatcgtctg tttgtggatg tacagagtga tattattgac acgccggggc gacggatggt 3120 gatccccctg gccagtgcac gtctgctgtc agataaagtc tcccgtgaac tttacccggt 3180 ggtgcatatc ggggatgaaa gctggcgcat gatgaccacc gatatggcca gtgtgccggt 3240 ctccgttatc ggggaagaag tggctgatct cagccaccgc gaaaatgaca tcaaaaacgc 3300 cattaacctg atgttctggg gaatataaat gtcaggcatg agattatcaa aaaggatctt 3360 cacctagatc cttttcacgt agaaagccag tccgcagaaa cggtgctgac cccggatgaa 3420 tgtcagctac tgggctatct ggacaaggga aaacgcaagc gcaaagagaa agcaggtagc 3480 ttgcagtggg cttacatggc gatagctaga ctgggcggtt ttatggacag caagcgaacc 3540 ggaattgcca gctggggcgc cctctggtaa ggttgggaag ccctgcaaag taaactggat 3600 ggctttctcg ccgccaagga tctgatggcg caggggatca agctctgatc aagagacagg 3660 atgaggatcg tttcgcatga ttgaacaaga tggattgcac gcaggttctc cggccgcttg 3720 ggtggagagg ctattcggct atgactgggc acaacagaca atcggctgct ctgatgccgc 3780 cgtgttccgg ctgtcagcgc aggggcgccc ggttcttttt gtcaagaccg acctgtccgg 3840 tgccctgaat gaactgcaag acgaggcagc gcggctatcg tggctggcca cgacgggcgt 3900 tccttgcgca gctgtgctcg acgttgtcac tgaagcggga agggactggc tgctattggg 3960 cgaagtgccg gggcaggatc tcctgtcatc tcaccttgct cctgccgaga aagtatccat 4020 catggctgat gcaatgcggc ggctgcatac gcttgatccg gctacctgcc cattcgacca 4080 ccaagcgaaa catcgcatcg agcgagcacg tactcggatg gaagccggtc ttgtcgatca 4140 ggatgatctg gacgaagagc atcaggggct cgcgccagcc gaactgttcg ccaggctcaa 4200 ggcgagcatg cccgacggcg aggatctcgt cgtgacccat ggcgatgcct gcttgccgaa 4260 tatcatggtg gaaaatggcc gcttttctgg attcatcgac tgtggccggc tgggtgtggc 4320 ggaccgctat caggacatag cgttggctac ccgtgatatt gctgaagagc ttggcggcga 4380 atgggctgac cgcttcctcg tgctttacgg tatcgccgct cccgattcgc agcgcatcgc 4440 cttctatcgc cttcttgacg agttcttctg aattattaac gcttacaatt tcctgatgcg 4500 gtattttctc cttacgcatc tgtgcggtat ttcacaccgc atacaggtgg cacttttcgg 4560 ggaaatgtgc gcggaacccc tatttgttta tttttctaaa tacattcaaa tatgtatccg 4620 ctcatgagac aataaccctg ataaatgctt caataatagc acgtgaggag ggccaccatg 4680 gccaagttga ccagtgccgt tccggtgctc accgcgcgcg acgtcgccgg agcggtcgag 4740 ttctggaccg accggctcgg gttctcccgg gacttcgtgg aggacgactt cgccggtgtg 4800 gtccgggacg acgtgaccct gttcatcagc gcggtccagg accaggtggt gccggacaac 4860 accctggcct gggtgtgggt gcgcggcctg gacgagctgt acgccgagtg gtcggaggtc 4920 gtgtccacga acttccggga cgcctccggg ccggccatga ccgagatcgg cgagcagccg 4980 tgggggcggg agttcgccct gcgcgacccg gccggcaact gcgtgcactt cgtggccgag 5040 gagcaggact gacacgtgct aaaacttcat ttttaattta aaaggatcta ggtgaagatc 5100 ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca 5160 gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc 5220 tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta 5280 ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcctt 5340 ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc 5400 gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg 5460 ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg 5520 tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag 5580 ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc 5640 agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat 5700 agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg 5760 gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct gggcttttgc 5820 tggccttttg ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt 5880 accgcctttg agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca 5940 gtgagcgagg aagcggaag 5959 <210> 33 <211> 6384 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..6384 <223> /organism="Artificial Sequence" /note="pRN566; TOPO-BLUNT-HXT367::loxP-hphMX-loxP" /mol_type="unassigned DNA" <400> 33 agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc 60 acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc 120 tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa 180 ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac gccaagctat 240 ttaggtgaca ctatagaata ctcaagctat gcatcaagct tggtaccgag ctcggatcca 300 ctagtaccgg tgaaacaact caataacgat gtgggacatt gggggcccac tcaaaaaatc 360 tggggactat atccccagag aatttctcca gaagagaaga aaagtcaaag ttttttttcg 420 cttgggggtt gcatataaat acaggcgctg ttttatcttc agcatgaata ttccataatt 480 ttacttaata gcttttcata aataatagaa tcacaaacaa aatttacatc tgagttaaac 540 aatcatgaat tcaactccag atttaatatc tccacaaaag tcaagtgaga attcgaatgc 600 tgacctgcct tcgaatagct ctcaggtaat gaacatgcct gaagaaaaag gtgttcaaga 660 tgatttccaa gctgaggccg accaagtact taccaaccca aatacaggta aaggtgcata 720 tgtcactgtg tctatctgtt gtgttatggt tgccttcggt ggtttcgttt tcggttggga 780 tactggtacc atttctggtt tcgtcgccca aactgatttc ttgaggaaga cgtccggacg 840 tacgtataac ttcgtatagc atacattata cgaagttatt ctagtaacgg ccgccagtgt 900 gctggaattc gcccttaagc ttgcctcgtc cccgccgggt cacccggcca gcgacatgga 960 ggcccagaat accctccttg acagtcttga cgtgcgcagc tcaggggcat gatgtgactg 1020 tcgcccgtac atttagccca tacatcccca tgtataatca tttgcatcca tacattttga 1080 tggccgcacg gcgcgaagca aaaattacgg ctcctcgctg cagacctgcg agcagggaaa 1140 cgctcccctc acagacgcgt gaattgtccc cacgccgcgc ccctgtagag aaatataaaa 1200 ggttaggatt tgccactgag gttcttcttt catatacttc cttttaaaat cttgctagga 1260 tacagttctc acatcacatc cgaacataaa caaccatggg taaaaagcct gaactcaccg 1320 cgacgtctgt cgagaagttt ctgatcgaaa agttcgacag cgtctccgac ctgatgcagc 1380 tctcggaggg cgaagaatct cgtgctttca gcttcgatgt aggagggcgt ggatatgtcc 1440 tgcgggtaaa tagctgcgcc gatggtttct acaaagatcg ttatgtttat cggcactttg 1500 catcggccgc gctcccgatt ccggaagtgc ttgacattgg ggaattcagc gagagcctga 1560 cctattgcat ctcccgccgt gcacagggtg tcacgttgca agacctgcct gaaaccgaac 1620 tgcccgctgt tctgcagccg gtcgcggagg ccatggatgc gatcgctgcg gccgatctta 1680 gccagacgag cgggttcggc ccattcggac cgcaaggaat cggtcaatac actacatggc 1740 gtgatttcat atgcgcgatt gctgatcccc atgtgtatca ctggcaaact gtgatggacg 1800 acaccgtcag tgcgtccgtc gcgcaggctc tcgatgagct gatgctttgg gccgaggact 1860 gccccgaagt ccggcacctc gtgcacgcgg atttcggctc caacaatgtc ctgacggaca 1920 atggccgcat aacagcggtc attgactgga gcgaggcgat gttcggggat tcccaatacg 1980 aggtcgccaa catcttcttc tggaggccgt ggttggcttg tatggagcag cagacgcgct 2040 acttcgagcg gaggcatccg gagcttgcag gatcgccgcg gctccgggcg tatatgctcc 2100 gcattggtct tgaccaactc tatcagagct tggttgacgg caatttcgat gatgcagctt 2160 gggcgcaggg tcgatgcgac gcaatcgtcc gatccggagc cgggactgtc gggcgtacac 2220 aaatcgcccg cagaagcgcg gccgtctgga ccgatggctg tgtagaagta ctcgccgata 2280 gtggaaaccg acgccccagc actcgtccga gggcaaagga ataatcagta ctgacaataa 2340 aaagattctt gttttcaaga acttgtcatt tgtatagttt ttttatattg tagttgttct 2400 attttaatca aatgttagcg tgatttatat tttttttcgc ctcgacatca tctgcccaga 2460 tgcgaagtta agtgcgcaga aagtaatatc atgcgtcaat cgtatgtgaa tgctggtcgc 2520 tatactgctg tcgattcgat actaacgccg ccatccagtg tcgaaaacga gctcgaattc 2580 atcgatgata tccatcacac tggcggccgc tcgacgatat ctagagcgcg cataacttcg 2640 tataatgtat gctatacgaa gttataggcc tcgagacgtc cgacgctgaa gaaatgactc 2700 acgatgacaa gccattgtac aagagaatgt tcagcaccaa ataatttgcg aacactttta 2760 ttaattcatg atcacgctct aatttgtgca tttgaaatgt actctaattc taattttata 2820 tttttaatga tatcttgaaa agtaaatacg tttttaatat atacaaaata atacagttta 2880 attttcaagt ttttgatcat ttgttctcag aaagttgagt gggacggaga caaagaaact 2940 ttaaagagaa atgcaaagtg ggaagaagtc agttgtttac cgaccgcact gttattcaca 3000 aatattccaa ttttgcctgc agacccacgt ctacaaattt tggttagttt ggtaaatggt 3060 aaggatatag tagagccttt ttgaaatggg aaatatcttc tttttctgta tcccgcttca 3120 aaaagtgtct aatgagtcag ttatttcttt cttactcatc gcccgtcact taaaagaaga 3180 aaaattacgg atccgtcgac taagggcgaa ttctgcagat atccatcaca ctggcggccg 3240 ctcgagcatg catctagagg gcccaattcg ccctatagtg agtcgtatta caattcactg 3300 gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg ttacccaact taatcgcctt 3360 gcagcacatc cccctttcgc cagctggcgt aatagcgaag aggcccgcac cgatcgccct 3420 tcccaacagt tgcgcagcct atacgtacgg cagtttaagg tttacaccta taaaagagag 3480 agccgttatc gtctgtttgt ggatgtacag agtgatatta ttgacacgcc ggggcgacgg 3540 atggtgatcc ccctggccag tgcacgtctg ctgtcagata aagtctcccg tgaactttac 3600 ccggtggtgc atatcgggga tgaaagctgg cgcatgatga ccaccgatat ggccagtgtg 3660 ccggtctccg ttatcgggga agaagtggct gatctcagcc accgcgaaaa tgacatcaaa 3720 aacgccatta acctgatgtt ctggggaata taaatgtcag gcatgagatt atcaaaaagg 3780 atcttcacct agatcctttt cacgtagaaa gccagtccgc agaaacggtg ctgaccccgg 3840 atgaatgtca gctactgggc tatctggaca agggaaaacg caagcgcaaa gagaaagcag 3900 gtagcttgca gtgggcttac atggcgatag ctagactggg cggttttatg gacagcaagc 3960 gaaccggaat tgccagctgg ggcgccctct ggtaaggttg ggaagccctg caaagtaaac 4020 tggatggctt tctcgccgcc aaggatctga tggcgcaggg gatcaagctc tgatcaagag 4080 acaggatgag gatcgtttcg catgattgaa caagatggat tgcacgcagg ttctccggcc 4140 gcttgggtgg agaggctatt cggctatgac tgggcacaac agacaatcgg ctgctctgat 4200 gccgccgtgt tccggctgtc agcgcagggg cgcccggttc tttttgtcaa gaccgacctg 4260 tccggtgccc tgaatgaact gcaagacgag gcagcgcggc tatcgtggct ggccacgacg 4320 ggcgttcctt gcgcagctgt gctcgacgtt gtcactgaag cgggaaggga ctggctgcta 4380 ttgggcgaag tgccggggca ggatctcctg tcatctcacc ttgctcctgc cgagaaagta 4440 tccatcatgg ctgatgcaat gcggcggctg catacgcttg atccggctac ctgcccattc 4500 gaccaccaag cgaaacatcg catcgagcga gcacgtactc ggatggaagc cggtcttgtc 4560 gatcaggatg atctggacga agagcatcag gggctcgcgc cagccgaact gttcgccagg 4620 ctcaaggcga gcatgcccga cggcgaggat ctcgtcgtga cccatggcga tgcctgcttg 4680 ccgaatatca tggtggaaaa tggccgcttt tctggattca tcgactgtgg ccggctgggt 4740 gtggcggacc gctatcagga catagcgttg gctacccgtg atattgctga agagcttggc 4800 ggcgaatggg ctgaccgctt cctcgtgctt tacggtatcg ccgctcccga ttcgcagcgc 4860 atcgccttct atcgccttct tgacgagttc ttctgaatta ttaacgctta caatttcctg 4920 atgcggtatt ttctccttac gcatctgtgc ggtatttcac accgcataca ggtggcactt 4980 ttcggggaaa tgtgcgcgga acccctattt gtttattttt ctaaatacat tcaaatatgt 5040 atccgctcat gagacaataa ccctgataaa tgcttcaata atagcacgtg aggagggcca 5100 ccatggccaa gttgaccagt gccgttccgg tgctcaccgc gcgcgacgtc gccggagcgg 5160 tcgagttctg gaccgaccgg ctcgggttct cccgggactt cgtggaggac gacttcgccg 5220 gtgtggtccg ggacgacgtg accctgttca tcagcgcggt ccaggaccag gtggtgccgg 5280 acaacaccct ggcctgggtg tgggtgcgcg gcctggacga gctgtacgcc gagtggtcgg 5340 aggtcgtgtc cacgaacttc cgggacgcct ccgggccggc catgaccgag atcggcgagc 5400 agccgtgggg gcgggagttc gccctgcgcg acccggccgg caactgcgtg cacttcgtgg 5460 ccgaggagca ggactgacac gtgctaaaac ttcattttta atttaaaagg atctaggtga 5520 agatcctttt tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag 5580 cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa 5640 tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag 5700 agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg 5760 tccttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat 5820 acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta 5880 ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg 5940 gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc 6000 gtgagctatg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa 6060 gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc 6120 tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt 6180 caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctgggct 6240 tttgctggcc ttttgctcac atgttctttc ctgcgttatc ccctgattct gtggataacc 6300 gtattaccgc ctttgagtga gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg 6360 agtcagtgag cgaggaagcg gaag 6384 <210> 34 <211> 6073 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..6073 <223> /organism="Artificial Sequence" /note="pRN569: TOPO-BLUNT-HXT514::loxP-natMX-loxP" /mol_type="unassigned DNA" <400> 34 agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc 60 acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc 120 tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa 180 ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac gccaagctat 240 ttaggtgaca ctatagaata ctcaagctat gcatcaagct tggtaccgag ctcggatcca 300 ctagtaacgg ccgccagtgt gctggaattc gcccttatgg atcctagggg ttcttgcaga 360 gtaaactgcg attcttcaga taaactatcc cgaacatatt gacccacttt caggtaggtc 420 attcaaagct ttttgattga cggtagatca aagttgtgtt ctacgtattt acgtcttttt 480 tgtcgtattt attgatgacc ttttgccatc gttaagtgga gaattcggcc tattcctaac 540 ctcttccaga actttgaaac aaaaaacata attcaaaatt gtagtttgat aaagtattat 600 ctataaacta ttaaatcata aatatatatt tcatagagcg ttaaaaattg aagatcaaat 660 attattttta ttccttgaag gaagtctata ttatttaatt aactgaccta cttttttccg 720 aacatcttct tgtaaaatgg ttgatcatca tgcattagat catcagcgtt gtagtcagta 780 cctctcttgt ttggtggaac ccaagaaggt gatttccatg gcaaaacacc ttcttcccat 840 aagggacgtc tcgaggccta taacttcgta tagcatacat tatacgaagt tatgcgcgct 900 ctagatatcg tcgacactgg atggcggcgt tagtatcgaa tcgacagcag tatagcgacc 960 agcattcaca tacgattgac gcatgatatt actttctgcg cacttaactt cgcatctggg 1020 cagatgatgt cgaggcgaaa aaaaatataa atcacgctaa catttgatta aaatagaaca 1080 actacaatat aaaaaaacta tacaaatgac aagttcttga aaacaagaat ctttttattg 1140 tcagtactag gggcagggca tgctcatgta gagcgcctgc tcgccgtccg aggcggtgcc 1200 gtcgtacagg gcggtgtcca ggccgcagag ggtgaacccc atccgccggt acgcgtggat 1260 cgccggtgcg ttgacgttgg tgacctccag ccagaggtgc ccggcgcccc gctcgcgggc 1320 gaactccgtc gcgagcccca tcaacgcgcg cccgaccccg tgcccccggt gctccggggc 1380 gacctcgatg tcctcgacgg tcagccggcg gttccagccg gagtacgaga cgaccacgaa 1440 gcccgccagg tcgccgtcgt ccccgtacgc gacgaacgtc cgggagtccg ggtcgccgtc 1500 ctccccggcg tccgattcgt cgtccgattc gtcgtcgggg aacaccttgg tcaggggcgg 1560 gtccaccggc acctcccgca gggtgaagcc gtccccggtg gcggtgacgc ggaagacggt 1620 gtcggtggtg aaggacccat ccagtgcctc gatggcctcg gcgtcccccg ggacactggt 1680 gcggtaccgg taagccgtgt cgtcaagagt ggtcatttta catggttgtt tatgttcgga 1740 tgtgatgtga gaactgtatc ctagcaagat tttaaaagga agtatatgaa agaagaacct 1800 cagtggcaaa tcctaacctt ttatatttct ctacaggggc gcggcgtggg gacaattcaa 1860 cgcgtctgtg aggggagcgt ttccctgctc gcaggtctgc agcgaggagc cgtaattttt 1920 gcttcgcgcc gtgcggccat caaaatgtat ggatgcaaat gattatacat ggggatgtat 1980 gggctaaatg tacgggcgac agtcacatca tgcccctgag ctgcgcacgt caagactgtc 2040 aaggagggta ttctgggcct ccatgtcgct ggccgggtga cccggcgggg acgaggcaag 2100 cttaagggcg aattccagca cactggcggc cgttactaga ataacttcgt ataatgtatg 2160 ctatacgaag ttatacgtac gtccggagta acatgaaacc agagtaccac gcaactgctt 2220 aggcgacact tcagaaatta gcataggcgc caaaactgta ataccaccaa cgcccagtcc 2280 tgagatgatt cttccaatga aatattgata ccatttgtca atggaggcga tttggatgat 2340 gatcccaatt gagtaaatga cgacaacagt catcagacca atcttacgtc catacatatc 2400 accgagcttt gacaaaacta tacctccgat agcgcagccg atgttgaaaa tagaaaccat 2460 caaaccggtt ctgacatcgg aaagataggt agtcccgttt gcacgggtgc tgccaaatcg 2520 cctaatgaag tctgtttgcc tgacaaaacc agatatagta ccagtatccc acccaaacac 2580 gaacccacca aaagcaacca tcaaacagca gacggataca aatagtaaat ccgacttcga 2640 tttcttctct agttggttgt caacctcctt ctgaagctct tccagttcgt ctttgggagg 2700 gccttcatgg gaaatgtaac ttgagacggg tttagcttgt gccaaattat cgttgtaacc 2760 ggcggtacca ggagcagtcg agtttcctga cttctcgttg tatgagttag aatttgtgct 2820 cacagtagca gacccttcca aggggccttg atgagcgttt tcaagttcac atgtactagt 2880 gcggccgctt aagggcgaat tctgcagata tccatcacac tggcggccgc tcgagcatgc 2940 atctagaggg cccaattcgc cctatagtga gtcgtattac aattcactgg ccgtcgtttt 3000 acaacgtcgt gactgggaaa accctggcgt tacccaactt aatcgccttg cagcacatcc 3060 ccctttcgcc agctggcgta atagcgaaga ggcccgcacc gatcgccctt cccaacagtt 3120 gcgcagccta tacgtacggc agtttaaggt ttacacctat aaaagagaga gccgttatcg 3180 tctgtttgtg gatgtacaga gtgatattat tgacacgccg gggcgacgga tggtgatccc 3240 cctggccagt gcacgtctgc tgtcagataa agtctcccgt gaactttacc cggtggtgca 3300 tatcggggat gaaagctggc gcatgatgac caccgatatg gccagtgtgc cggtctccgt 3360 tatcggggaa gaagtggctg atctcagcca ccgcgaaaat gacatcaaaa acgccattaa 3420 cctgatgttc tggggaatat aaatgtcagg catgagatta tcaaaaagga tcttcaccta 3480 gatccttttc acgtagaaag ccagtccgca gaaacggtgc tgaccccgga tgaatgtcag 3540 ctactgggct atctggacaa gggaaaacgc aagcgcaaag agaaagcagg tagcttgcag 3600 tgggcttaca tggcgatagc tagactgggc ggttttatgg acagcaagcg aaccggaatt 3660 gccagctggg gcgccctctg gtaaggttgg gaagccctgc aaagtaaact ggatggcttt 3720 ctcgccgcca aggatctgat ggcgcagggg atcaagctct gatcaagaga caggatgagg 3780 atcgtttcgc atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga 3840 gaggctattc ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt 3900 ccggctgtca gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct 3960 gaatgaactg caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg 4020 cgcagctgtg ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt 4080 gccggggcag gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc 4140 tgatgcaatg cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc 4200 gaaacatcgc atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga 4260 tctggacgaa gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag 4320 catgcccgac ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat 4380 ggtggaaaat ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg 4440 ctatcaggac atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc 4500 tgaccgcttc ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta 4560 tcgccttctt gacgagttct tctgaattat taacgcttac aatttcctga tgcggtattt 4620 tctccttacg catctgtgcg gtatttcaca ccgcatacag gtggcacttt tcggggaaat 4680 gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg 4740 agacaataac cctgataaat gcttcaataa tagcacgtga ggagggccac catggccaag 4800 ttgaccagtg ccgttccggt gctcaccgcg cgcgacgtcg ccggagcggt cgagttctgg 4860 accgaccggc tcgggttctc ccgggacttc gtggaggacg acttcgccgg tgtggtccgg 4920 gacgacgtga ccctgttcat cagcgcggtc caggaccagg tggtgccgga caacaccctg 4980 gcctgggtgt gggtgcgcgg cctggacgag ctgtacgccg agtggtcgga ggtcgtgtcc 5040 acgaacttcc gggacgcctc cgggccggcc atgaccgaga tcggcgagca gccgtggggg 5100 cgggagttcg ccctgcgcga cccggccggc aactgcgtgc acttcgtggc cgaggagcag 5160 gactgacacg tgctaaaact tcatttttaa tttaaaagga tctaggtgaa gatccttttt 5220 gataatctca tgaccaaaat cccttaacgt gagttttcgt tccactgagc gtcagacccc 5280 gtagaaaaga tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat ctgctgcttg 5340 caaacaaaaa aaccaccgct accagcggtg gtttgtttgc cggatcaaga gctaccaact 5400 ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt ccttctagtg 5460 tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata cctcgctctg 5520 ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgtgtcttac cgggttggac 5580 tcaagacgat agttaccgga taaggcgcag cggtcgggct gaacgggggg ttcgtgcaca 5640 cagcccagct tggagcgaac gacctacacc gaactgagat acctacagcg tgagctatga 5700 gaaagcgcca cgcttcccga agggagaaag gcggacaggt atccggtaag cggcagggtc 5760 ggaacaggag agcgcacgag ggagcttcca gggggaaacg cctggtatct ttatagtcct 5820 gtcgggtttc gccacctctg acttgagcgt cgatttttgt gatgctcgtc aggggggcgg 5880 agcctatgga aaaacgccag caacgcggcc tttttacggt tcctgggctt ttgctggcct 5940 tttgctcaca tgttctttcc tgcgttatcc cctgattctg tggataaccg tattaccgcc 6000 tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg agcgcagcga gtcagtgagc 6060 gaggaagcgg aag 6073 <210> 35 <211> 6189 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..6189 <223> /organism="Artificial Sequence" /note="pRN635; TOPO-BLUNT-HXT2::loxP-kanMX-loxP" /mol_type="unassigned DNA" <400> 35 agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc 60 acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc 120 tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa 180 ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac gccaagctat 240 ttaggtgaca ctatagaata ctcaagctat gcatcaagct tggtaccgag ctcggatcca 300 ctagtaacgg ccgccagtgt gctggaattc gcccttgact agtaccggtg ttttcaaaac 360 ctagcaaccc ccaccaaact tgtcatcgtt cccggattca caaatgatat aaaaagcgat 420 tacaattcta cattctaacc agatttgaga tttcctcttt ctcaattcct cttatattag 480 attataagaa caacaaatta aattacaaaa agacttataa agcaacataa tgtctgaatt 540 cgctactagc cgcgttgaaa gtggctctca acaaacttct atccactcta ctccgatagt 600 gcagaaatta gagacggatg aatctcctat tcaaaccaaa tctgaataca ctaacgctga 660 actcccagca aagccaatcg ccgcatattg gactgttatc tgtttatgtc taatgattgc 720 atttggtggg tttgtctttg gttgggatac tggtaccatc tctggttttg ttaatcaaac 780 cgatttcaaa agaagatttg gtcaaatgaa atctgatggt accttccgga agacgcgtac 840 gtataacttc gtatagcata cattatacga agttattcta gtaacggccg ccagtgtgct 900 ggaattcgcc cttaagcttg cctcgtcccc gccgggtcac ccggccagcg acatggaggc 960 ccagaatacc ctccttgaca gtcttgacgt gcgcagctca ggggcatgat gtgactgtcg 1020 cccgtacatt tagcccatac atccccatgt ataatcattt gcatccatac attttgatgg 1080 ccgcacggcg cgaagcaaaa attacggctc ctcgctgcag acctgcgagc agggaaacgc 1140 tcccctcaca gacgcgttga attgtcccca cgccgcgccc ctgtagagaa atataaaagg 1200 ttaggatttg ccactgaggt tcttctttca tatacttcct tttaaaatct tgctaggata 1260 cagttctcac atcacatccg aacataaaca accatgggta aggaaaagac tcacgtttcg 1320 aggccgcgat taaattccaa catggatgct gatttatatg ggtataaatg ggctcgcgat 1380 aatgtcgggc aatcaggtgc gacaatctat cgattgtatg ggaagcccga tgcgccagag 1440 ttgtttctga aacatggcaa aggtagcgtt gccaatgatg ttacagatga gatggtcaga 1500 ctaaactggc tgacggaatt tatgcctctt ccgaccatca agcattttat ccgtactcct 1560 gatgatgcat ggttactcac cactgcgatc cccggcaaaa cagcattcca ggtattagaa 1620 gaatatcctg attcaggtga aaatattgtt gatgcgctgg cagtgttcct gcgccggttg 1680 cattcgattc ctgtttgtaa ttgtcctttt aacagcgatc gcgtatttcg tctcgctcag 1740 gcgcaatcac gaatgaataa cggtttggtt gatgcgagtg attttgatga cgagcgtaat 1800 ggctggcctg ttgaacaagt ctggaaagaa atgcataagc ttttgccatt ctcaccggat 1860 tcagtcgtca ctcatggtga tttctcactt gataacctta tttttgacga ggggaaatta 1920 ataggttgta ttgatgttgg acgagtcgga atcgcagacc gataccagga tcttgccatc 1980 ctatggaact gcctcggtga gttttctcct tcattacaga aacggctttt tcaaaaatat 2040 ggtattgata atcctgatat gaataaattg cagtttcatt tgatgctcga tgagtttttc 2100 taatcagtac tgacaataaa aagattcttg ttttcaagaa cttgtcattt gtatagtttt 2160 tttatattgt agttgttcta ttttaatcaa atgttagcgt gatttatatt ttttttcgcc 2220 tcgacatcat ctgcccagat gcgaagttaa gtgcgcagaa agtaatatca tgcgtcaatc 2280 gtatgtgaat gctggtcgct atactgctgt cgattcgata ctaacgccgc catccagtgt 2340 cgacgatatc tagagcgcgc ataacttcgt ataatgtatg ctatacgaag ttataggcct 2400 cgagacgtcc tttgtctgtg aaaccaaggg cttaacatta gaggaagtta atgaaatgta 2460 tgttgaaggt gtcaaaccat ggaaatctgg tagctggatc tcaaaagaaa aaagagtttc 2520 cgaggaataa gagattatac ttaaactagc actgattttt ttaaggctaa tggctactaa 2580 tactttaata gatgatcttc atactttttt atttaacgat ttttaatgat gtttttattt 2640 gtaccactca tttatctaga tttttttaat actgatcaaa tcttacggac tcgacgttaa 2700 aaagttccta catacgtctg gtacttgaaa cgctgcttcg aggtattgac actataagaa 2760 tacgatccaa atacttacac cgcatgtaaa aatatgccga caatatgaat acttgttgat 2820 gaatgatatt tgattttaat ccggcaattt acctccttta tataatccaa taattgttga 2880 taattagtgg ttaggttgca gtactaataa gaattaagac aaatattctt ctactatata 2940 aaaggtgcaa acaaaacaca cgccgatcgg ccatactaaa caagaccaac ataagggccc 3000 gtcgacaagg gcgaattctg cagatatcca tcacactggc ggccgctcga gcatgcatct 3060 agagggccca attcgcccta tagtgagtcg tattacaatt cactggccgt cgttttacaa 3120 cgtcgtgact gggaaaaccc tggcgttacc caacttaatc gccttgcagc acatccccct 3180 ttcgccagct ggcgtaatag cgaagaggcc cgcaccgatc gcccttccca acagttgcgc 3240 agcctatacg tacggcagtt taaggtttac acctataaaa gagagagccg ttatcgtctg 3300 tttgtggatg tacagagtga tattattgac acgccggggc gacggatggt gatccccctg 3360 gccagtgcac gtctgctgtc agataaagtc tcccgtgaac tttacccggt ggtgcatatc 3420 ggggatgaaa gctggcgcat gatgaccacc gatatggcca gtgtgccggt ctccgttatc 3480 ggggaagaag tggctgatct cagccaccgc gaaaatgaca tcaaaaacgc cattaacctg 3540 atgttctggg gaatataaat gtcaggcatg agattatcaa aaaggatctt cacctagatc 3600 cttttcacgt agaaagccag tccgcagaaa cggtgctgac cccggatgaa tgtcagctac 3660 tgggctatct ggacaaggga aaacgcaagc gcaaagagaa agcaggtagc ttgcagtggg 3720 cttacatggc gatagctaga ctgggcggtt ttatggacag caagcgaacc ggaattgcca 3780 gctggggcgc cctctggtaa ggttgggaag ccctgcaaag taaactggat ggctttctcg 3840 ccgccaagga tctgatggcg caggggatca agctctgatc aagagacagg atgaggatcg 3900 tttcgcatga ttgaacaaga tggattgcac gcaggttctc cggccgcttg ggtggagagg 3960 ctattcggct atgactgggc acaacagaca atcggctgct ctgatgccgc cgtgttccgg 4020 ctgtcagcgc aggggcgccc ggttcttttt gtcaagaccg acctgtccgg tgccctgaat 4080 gaactgcaag acgaggcagc gcggctatcg tggctggcca cgacgggcgt tccttgcgca 4140 gctgtgctcg acgttgtcac tgaagcggga agggactggc tgctattggg cgaagtgccg 4200 gggcaggatc tcctgtcatc tcaccttgct cctgccgaga aagtatccat catggctgat 4260 gcaatgcggc ggctgcatac gcttgatccg gctacctgcc cattcgacca ccaagcgaaa 4320 catcgcatcg agcgagcacg tactcggatg gaagccggtc ttgtcgatca ggatgatctg 4380 gacgaagagc atcaggggct cgcgccagcc gaactgttcg ccaggctcaa ggcgagcatg 4440 cccgacggcg aggatctcgt cgtgacccat ggcgatgcct gcttgccgaa tatcatggtg 4500 gaaaatggcc gcttttctgg attcatcgac tgtggccggc tgggtgtggc ggaccgctat 4560 caggacatag cgttggctac ccgtgatatt gctgaagagc ttggcggcga atgggctgac 4620 cgcttcctcg tgctttacgg tatcgccgct cccgattcgc agcgcatcgc cttctatcgc 4680 cttcttgacg agttcttctg aattattaac gcttacaatt tcctgatgcg gtattttctc 4740 cttacgcatc tgtgcggtat ttcacaccgc atacaggtgg cacttttcgg ggaaatgtgc 4800 gcggaacccc tatttgttta tttttctaaa tacattcaaa tatgtatccg ctcatgagac 4860 aataaccctg ataaatgctt caataatagc acgtgaggag ggccaccatg gccaagttga 4920 ccagtgccgt tccggtgctc accgcgcgcg acgtcgccgg agcggtcgag ttctggaccg 4980 accggctcgg gttctcccgg gacttcgtgg aggacgactt cgccggtgtg gtccgggacg 5040 acgtgaccct gttcatcagc gcggtccagg accaggtggt gccggacaac accctggcct 5100 gggtgtgggt gcgcggcctg gacgagctgt acgccgagtg gtcggaggtc gtgtccacga 5160 acttccggga cgcctccggg ccggccatga ccgagatcgg cgagcagccg tgggggcggg 5220 agttcgccct gcgcgacccg gccggcaact gcgtgcactt cgtggccgag gagcaggact 5280 gacacgtgct aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata 5340 atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag 5400 aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa 5460 caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt 5520 ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc 5580 cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa 5640 tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa 5700 gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc 5760 ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa 5820 gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa 5880 caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg 5940 ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc 6000 tatggaaaaa cgccagcaac gcggcctttt tacggttcct gggcttttgc tggccttttg 6060 ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg 6120 agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg 6180 aagcggaag 6189 <210> 36 <211> 24 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..24 <223> /organism="Artificial Sequence" /note="primer 281-Hx3inr2" /mol_type="unassigned DNA" <400> 36 gctcttttca cggagaaatt cggg 24 <210> 37 <211> 22 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..22 <223> /organism="Artificial Sequence" /note="primer 323-Hx7inr1" /mol_type="unassigned DNA" <400> 37 gatgagaatc cttggcaacc gc 22 <210> 38 <211> 25 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..25 <223> /organism="Artificial Sequence" /note="primer Hx4inr2" /mol_type="unassigned DNA" <400> 38 ccatactatt tgtcgactca agcgc 25 <210> 39 <211> 25 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..25 <223> /organism="Artificial Sequence" /note="primer Hx5inf" /mol_type="unassigned DNA" <400> 39 gggttaatta gttttagggg cacgg 25 <210> 40 <211> 24 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..24 <223> /organism="Artificial Sequence" /note="primer 324-Ga2inf1" /mol_type="unassigned DNA" <400> 40 tcaattcgga aagcttcctt ccgg 24 <210> 41 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..23 <223> /organism="Artificial Sequence" /note="primer 325-Ga2inr1" /mol_type="unassigned DNA" <400> 41 cagtgatagt ttggttcgag cgg 23 <210> 42 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..23 <223> /organism="Artificial Sequence" /note="primer 289-Hx2inf" /mol_type="unassigned DNA" <400> 42 tcttcgggaa ctagataggt ggc 23 <210> 43 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..23 <223> /organism="Artificial Sequence" /note="primer 290-Hx2inr" /mol_type="unassigned DNA" <400> 43 gaagtaatca gccacaatac gcc 23 <210> 44 <211> 73 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..73 <223> /organism="Artificial Sequence" /note="primer 838-Glk1-psuc227f" /mol_type="unassigned DNA" <400> 44 atgtcattcg acgacttaca caaagccact gagagagcgg tcatccaggc ccgtcgacct 60 cgagtaccgt tcg 73 <210> 45 <211> 73 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..73 <223> /organism="Artificial Sequence" /note="primer 834- Hxk2-psuc227f" /mol_type="unassigned DNA" <400> 45 gccagaaagg gttccatggc cgatgtgcca aaggaattga tgcaacaaat ccgtcgacct 60 cgagtaccgt tcg 73 <210> 46 <211> 21 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..21 <223> /organism="Artificial Sequence" /note="primer 645-pSUC227r" /mol_type="unassigned DNA" <400> 46 gcaatttcgg ctatacgtaa c 21 <210> 47 <211> 73 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..73 <223> /organism="Artificial Sequence" /note="primer 839-Glk1-psuc225r" /mol_type="unassigned DNA" <400> 47 caatcttcaa gtgcaccttc ctctcaccct cggcacccaa gggtgacaag ccggatccta 60 ccgttcgtat agc 73 <210> 48 <211> 73 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..73 <223> /organism="Artificial Sequence" /note="primer 835-Hxk2-psuc225r" /mol_type="unassigned DNA" <400> 48 gccagaaagg gttccatggc cgatgtgcca aaggaattga tgcaacaaat ccgtcgacct 60 cgagtaccgt tcg 73 <210> 49 <211> 21 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..21 <223> /organism="Artificial Sequence" /note="primer 646-pSUC225f" /mol_type="unassigned DNA" <400> 49 cgttcactca tggaaaatag c 21 <210> 50 <211> 72 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..72 <223> /organism="Artificial Sequence" /note="primer 846-Hxk1_loxP_f" /mol_type="unassigned DNA" <400> 50 atggttcatt taggtccaaa gaaaccacag gctagaaagg gttccatggc cggatccact 60 agcataactt cg 72 <210> 51 <211> 72 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..72 <223> /organism="Artificial Sequence" /note="primer 847-Hxk1_loxP_r" /mol_type="unassigned DNA" <400> 51 atggttcatt taggtccaaa gaaaccacag gctagaaagg gttccatggc cggatccact 60 agcataactt cg 72 <210> 52 <211> 72 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..72 <223> /organism="Artificial Sequence" /note="primer 848-Gal1_loxP_f" /mol_type="unassigned DNA" <400> 52 atgactaaat ctcattcaga agaagtgatt gtacctgagt tcaattctag cggatccact 60 agcataactt cg 72 <210> 53 <211> 70 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..70 <223> /organism="Artificial Sequence" /note="primer 849-Gal1_loxP_r" /mol_type="unassigned DNA" <400> 53 ttataattca tatagacagc tgcccaatgc tggtttagag acgatgatag ttgggccgcc 60 agtgtgatgg 70 <210> 54 <211> 5250 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..5250 <223> /organism="Artificial Sequence" /note="pRN774; TOPO-BLUNT-loxP-hphMX-loxP (loxP sites in opposite orientation) " /mol_type="unassigned DNA" <400> 54 gcttccggct cgtatgttgt gtggaattgt gagcggataa caatttcaca caggaaacag 60 ctatgaccat gattacgcca agctatttag gtgacactat agaatactca agctatgcat 120 caagcttggt accgagctcg gatccactag cataacttcg tataatgtat gctatacgaa 180 gttattctag taacggccgc cagtgtgctg gaattcgccc ttaagctttg cctcgtcccc 240 gccgggtcac ccggccagcg acatggaggc ccagaatacc ctccttgaca gtcttgacgt 300 gcgcagctca ggggcatgat gtgactgtcg cccgtacatt tagcccatac atccccatgt 360 ataatcattt gcatccatac attttgatgg ccgcacggcg cgaagcaaaa attacggctc 420 ctcgctgcag acctgcgagc agggaaacgc tcccctcaca gacgcgtgaa ttgtccccac 480 gccgcgcccc tgtagagaaa tataaaaggt taggatttgc cactgaggtt cttctttcat 540 atacttcctt ttaaaatctt gctaggatac agttctcaca tcacatccga acataaacaa 600 ccatgggtaa aaagcctgaa ctcaccgcga cgtctgtcga gaagtttctg atcgaaaagt 660 tcgacagcgt ctccgacctg atgcagctct cggagggcga agaatctcgt gctttcagct 720 tcgatgtagg agggcgtgga tatgtcctgc gggtaaatag ctgcgccgat ggtttctaca 780 aagatcgtta tgtttatcgg cactttgcat cggccgcgct cccgattccg gaagtgcttg 840 acattgggga attcagcgag agcctgacct attgcatctc ccgccgtgca cagggtgtca 900 cgttgcaaga cctgcctgaa accgaactgc ccgctgttct gcagccggtc gcggaggcca 960 tggatgcgat cgctgcggcc gatcttagcc agacgagcgg gttcggccca ttcggaccgc 1020 aaggaatcgg tcaatacact acatggcgtg atttcatatg cgcgattgct gatccccatg 1080 tgtatcactg gcaaactgtg atggacgaca ccgtcagtgc gtccgtcgcg caggctctcg 1140 atgagctgat gctttgggcc gaggactgcc ccgaagtccg gcacctcgtg cacgcggatt 1200 tcggctccaa caatgtcctg acggacaatg gccgcataac agcggtcatt gactggagcg 1260 aggcgatgtt cggggattcc caatacgagg tcgccaacat cttcttctgg aggccgtggt 1320 tggcttgtat ggagcagcag acgcgctact tcgagcggag gcatccggag cttgcaggat 1380 cgccgcggct ccgggcgtat atgctccgca ttggtcttga ccaactctat cagagcttgg 1440 ttgacggcaa tttcgatgat gcagcttggg cgcagggtcg atgcgacgca atcgtccgat 1500 ccggagccgg gactgtcggg cgtacacaaa tcgcccgcag aagcgcggcc gtctggaccg 1560 atggctgtgt agaagtactc gccgatagtg gaaaccgacg ccccagcact cgtccgaggg 1620 caaaggaata atcagtactg acaataaaaa gattcttgtt ttcaagaact tgtcatttgt 1680 atagtttttt tatattgtag ttgttctatt ttaatcaaat gttagcgtga tttatatttt 1740 ttttcgcctc gacatcatct gcccagatgc gaagttaagt gcgcagaaag taatatcatg 1800 cgtcaatcgt atgtgaatgc tggtcgctat actgctgtcg attcgatact aacgccgcca 1860 tccagtgtcg aaaacgagct cgaattcatc gatgatatcc atcacactgg cggccgctcg 1920 acgatatcta gagcgcgcat aacttcgtat aatgtatgct atacgaagtt ataggatcca 1980 tcacactggc ggcccaattc gccctatagt gagtcgtatt acaattcact ggccgtcgtt 2040 ttacaacgtc gtgactggga aaaccctggc gttacccaac ttaatcgcct tgcagcacat 2100 ccccctttcg ccagctggcg taatagcgaa gaggcccgca ccgatcgccc ttcccaacag 2160 ttgcgcagcc tatacgtacg gcagtttaag gtttacacct ataaaagaga gagccgttat 2220 cgtctgtttg tggatgtaca gagtgatatt attgacacgc cggggcgacg gatggtgatc 2280 cccctggcca gtgcacgtct gctgtcagat aaagtctccc gtgaacttta cccggtggtg 2340 catatcgggg atgaaagctg gcgcatgatg accaccgata tggccagtgt gccggtctcc 2400 gttatcgggg aagaagtggc tgatctcagc caccgcgaaa atgacatcaa aaacgccatt 2460 aacctgatgt tctggggaat ataaatgtca ggcatgagat tatcaaaaag gatcttcacc 2520 tagatccttt tcacgtagaa agccagtccg cagaaacggt gctgaccccg gatgaatgtc 2580 agctactggg ctatctggac aagggaaaac gcaagcgcaa agagaaagca ggtagcttgc 2640 agtgggctta catggcgata gctagactgg gcggttttat ggacagcaag cgaaccggaa 2700 ttgccagctg gggcgccctc tggtaaggtt gggaagccct gcaaagtaaa ctggatggct 2760 ttctcgccgc caaggatctg atggcgcagg ggatcaagct ctgatcaaga gacaggatga 2820 ggatcgtttc gcatgattga acaagatgga ttgcacgcag gttctccggc cgcttgggtg 2880 gagaggctat tcggctatga ctgggcacaa cagacaatcg gctgctctga tgccgccgtg 2940 ttccggctgt cagcgcaggg gcgcccggtt ctttttgtca agaccgacct gtccggtgcc 3000 ctgaatgaac tgcaagacga ggcagcgcgg ctatcgtggc tggccacgac gggcgttcct 3060 tgcgcagctg tgctcgacgt tgtcactgaa gcgggaaggg actggctgct attgggcgaa 3120 gtgccggggc aggatctcct gtcatctcac cttgctcctg ccgagaaagt atccatcatg 3180 gctgatgcaa tgcggcggct gcatacgctt gatccggcta cctgcccatt cgaccaccaa 3240 gcgaaacatc gcatcgagcg agcacgtact cggatggaag ccggtcttgt cgatcaggat 3300 gatctggacg aagagcatca ggggctcgcg ccagccgaac tgttcgccag gctcaaggcg 3360 agcatgcccg acggcgagga tctcgtcgtg acccatggcg atgcctgctt gccgaatatc 3420 atggtggaaa atggccgctt ttctggattc atcgactgtg gccggctggg tgtggcggac 3480 cgctatcagg acatagcgtt ggctacccgt gatattgctg aagagcttgg cggcgaatgg 3540 gctgaccgct tcctcgtgct ttacggtatc gccgctcccg attcgcagcg catcgccttc 3600 tatcgccttc ttgacgagtt cttctgaatt attaacgctt acaatttcct gatgcggtat 3660 tttctcctta cgcatctgtg cggtatttca caccgcatac aggtggcact tttcggggaa 3720 atgtgcgcgg aacccctatt tgtttatttt tctaaataca ttcaaatatg tatccgctca 3780 tgagacaata accctgataa atgcttcaat aatagcacgt gaggagggcc accatggcca 3840 agttgaccag tgccgttccg gtgctcaccg cgcgcgacgt cgccggagcg gtcgagttct 3900 ggaccgaccg gctcgggttc tcccgggact tcgtggagga cgacttcgcc ggtgtggtcc 3960 gggacgacgt gaccctgttc atcagcgcgg tccaggacca ggtggtgccg gacaacaccc 4020 tggcctgggt gtgggtgcgc ggcctggacg agctgtacgc cgagtggtcg gaggtcgtgt 4080 ccacgaactt ccgggacgcc tccgggccgg ccatgaccga gatcggcgag cagccgtggg 4140 ggcgggagtt cgccctgcgc gacccggccg gcaactgcgt gcacttcgtg gccgaggagc 4200 aggactgaca cgtgctaaaa cttcattttt aatttaaaag gatctaggtg aagatccttt 4260 ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga gcgtcagacc 4320 ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta atctgctgct 4380 tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa gagctaccaa 4440 ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact gtccttctag 4500 tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca tacctcgctc 4560 tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt accgggttgg 4620 actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca 4680 cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag cgtgagctat 4740 gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta agcggcaggg 4800 tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat ctttatagtc 4860 ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg tcaggggggc 4920 ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctgggc ttttgctggc 4980 cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac cgtattaccg 5040 cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc gagtcaagcg 5100 cccaatacgc aaaccgcctc tccccgcgcg ttggccgatt cattaatgca gctggcacga 5160 caggtttccc gactggaaag cgggcagtga gcgcaacgca attaatgtga gttagctcac 5220 tcattaggca ccccaggctt tacactttat 5250 <210> 55 <211> 4744 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..4744 <223> /organism="Artificial Sequence" /note="pRN775; TOPO-BLUNT-loxP-natMX-loxP (loxP sites in opposite orientation)" /mol_type="unassigned DNA" <400> 55 gcttccggct cgtatgttgt gtggaattgt gagcggataa caatttcaca caggaaacag 60 ctatgaccat gattacgcca agctatttag gtgacactat agaatactca agctatgcat 120 caagcttggt accgagctcg gatccactag cataacttcg tataatgtat gctatacgaa 180 gttattctag taacggccgc cagtgtgctg gaattcgccc ttaagcttgc ctcgtccccg 240 ccgggtcacc cggccagcga catggaggcc cagaataccc tccttgacag tcttgacgtg 300 cgcagctcag gggcatgatg tgactgtcgc ccgtacattt agcccataca tccccatgta 360 taatcatttg catccataca ttttgatggc cgcacggcgc gaagcaaaaa ttacggctcc 420 tcgctgcaga cctgcgagca gggaaacgct cccctcacag acgcgttgaa ttgtccccac 480 gccgcgcccc tgtagagaaa tataaaaggt taggatttgc cactgaggtt cttctttcat 540 atacttcctt ttaaaatctt gctaggatac agttctcaca tcacatccga acataaacaa 600 ccatgtaaaa tgaccactct tgacgacacg gcttaccggt accgcaccag tgtcccgggg 660 gacgccgagg ccatcgaggc actggatggg tccttcacca ccgacaccgt cttccgcgtc 720 accgccaccg gggacggctt caccctgcgg gaggtgccgg tggacccgcc cctgaccaag 780 gtgttccccg acgacgaatc ggacgacgaa tcggacgccg gggaggacgg cgacccggac 840 tcccggacgt tcgtcgcgta cggggacgac ggcgacctgg cgggcttcgt ggtcgtctcg 900 tactccggct ggaaccgccg gctgaccgtc gaggacatcg aggtcgcccc ggagcaccgg 960 gggcacgggg tcgggcgcgc gttgatgggg ctcgcgacgg agttcgcccg cgagcggggc 1020 gccgggcacc tctggctgga ggtcaccaac gtcaacgcac cggcgatcca cgcgtaccgg 1080 cggatggggt tcaccctctg cggcctggac accgccctgt acgacggcac cgcctcggac 1140 ggcgagcagg cgctctacat gagcatgccc tgcccctagt actgacaata aaaagattct 1200 tgttttcaag aacttgtcat ttgtatagtt tttttatatt gtagttgttc tattttaatc 1260 aaatgttagc gtgatttata ttttttttcg cctcgacatc atctgcccag atgcgaagtt 1320 aagtgcgcag aaagtaatat catgcgtcaa tcgtatgtga atgctggtcg ctatactgct 1380 gtcgattcga tactaacgcc gccatccagt gtcgacgata tctagagcgc gcataacttc 1440 gtataatgta tgctatacga agttatagga tccatcacac tggcggccca attcgcccta 1500 tagtgagtcg tattacaatt cactggccgt cgttttacaa cgtcgtgact gggaaaaccc 1560 tggcgttacc caacttaatc gccttgcagc acatccccct ttcgccagct ggcgtaatag 1620 cgaagaggcc cgcaccgatc gcccttccca acagttgcgc agcctatacg tacggcagtt 1680 taaggtttac acctataaaa gagagagccg ttatcgtctg tttgtggatg tacagagtga 1740 tattattgac acgccggggc gacggatggt gatccccctg gccagtgcac gtctgctgtc 1800 agataaagtc tcccgtgaac tttacccggt ggtgcatatc ggggatgaaa gctggcgcat 1860 gatgaccacc gatatggcca gtgtgccggt ctccgttatc ggggaagaag tggctgatct 1920 cagccaccgc gaaaatgaca tcaaaaacgc cattaacctg atgttctggg gaatataaat 1980 gtcaggcatg agattatcaa aaaggatctt cacctagatc cttttcacgt agaaagccag 2040 tccgcagaaa cggtgctgac cccggatgaa tgtcagctac tgggctatct ggacaaggga 2100 aaacgcaagc gcaaagagaa agcaggtagc ttgcagtggg cttacatggc gatagctaga 2160 ctgggcggtt ttatggacag caagcgaacc ggaattgcca gctggggcgc cctctggtaa 2220 ggttgggaag ccctgcaaag taaactggat ggctttctcg ccgccaagga tctgatggcg 2280 caggggatca agctctgatc aagagacagg atgaggatcg tttcgcatga ttgaacaaga 2340 tggattgcac gcaggttctc cggccgcttg ggtggagagg ctattcggct atgactgggc 2400 acaacagaca atcggctgct ctgatgccgc cgtgttccgg ctgtcagcgc aggggcgccc 2460 ggttcttttt gtcaagaccg acctgtccgg tgccctgaat gaactgcaag acgaggcagc 2520 gcggctatcg tggctggcca cgacgggcgt tccttgcgca gctgtgctcg acgttgtcac 2580 tgaagcggga agggactggc tgctattggg cgaagtgccg gggcaggatc tcctgtcatc 2640 tcaccttgct cctgccgaga aagtatccat catggctgat gcaatgcggc ggctgcatac 2700 gcttgatccg gctacctgcc cattcgacca ccaagcgaaa catcgcatcg agcgagcacg 2760 tactcggatg gaagccggtc ttgtcgatca ggatgatctg gacgaagagc atcaggggct 2820 cgcgccagcc gaactgttcg ccaggctcaa ggcgagcatg cccgacggcg aggatctcgt 2880 cgtgacccat ggcgatgcct gcttgccgaa tatcatggtg gaaaatggcc gcttttctgg 2940 attcatcgac tgtggccggc tgggtgtggc ggaccgctat caggacatag cgttggctac 3000 ccgtgatatt gctgaagagc ttggcggcga atgggctgac cgcttcctcg tgctttacgg 3060 tatcgccgct cccgattcgc agcgcatcgc cttctatcgc cttcttgacg agttcttctg 3120 aattattaac gcttacaatt tcctgatgcg gtattttctc cttacgcatc tgtgcggtat 3180 ttcacaccgc atacaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 3240 tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 3300 caataatagc acgtgaggag ggccaccatg gccaagttga ccagtgccgt tccggtgctc 3360 accgcgcgcg acgtcgccgg agcggtcgag ttctggaccg accggctcgg gttctcccgg 3420 gacttcgtgg aggacgactt cgccggtgtg gtccgggacg acgtgaccct gttcatcagc 3480 gcggtccagg accaggtggt gccggacaac accctggcct gggtgtgggt gcgcggcctg 3540 gacgagctgt acgccgagtg gtcggaggtc gtgtccacga acttccggga cgcctccggg 3600 ccggccatga ccgagatcgg cgagcagccg tgggggcggg agttcgccct gcgcgacccg 3660 gccggcaact gcgtgcactt cgtggccgag gagcaggact gacacgtgct aaaacttcat 3720 ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct 3780 taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct 3840 tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca 3900 gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc 3960 agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc 4020 aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct 4080 gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag 4140 gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc 4200 tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg 4260 agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag 4320 cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt 4380 gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac 4440 gcggcctttt tacggttcct gggcttttgc tggccttttg ctcacatgtt ctttcctgcg 4500 ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc 4560 cgcagccgaa cgaccgagcg cagcgagtca agcgcccaat acgcaaaccg cctctccccg 4620 cgcgttggcc gattcattaa tgcagctggc acgacaggtt tcccgactgg aaagcgggca 4680 gtgagcgcaa cgcaattaat gtgagttagc tcactcatta ggcaccccag gctttacact 4740 ttat 4744 <210> 56 <211> 1725 <212> DNA <213> Saccharomyces cerevisiae <220> <221> source <222> 1..1725 <223> /organism="Saccharomyces cerevisiae" /note="WT-GAL2 DNA sequence " /mol_type="unassigned DNA" <400> 56 atggcagttg aggagaacaa tatgcctgtt gtttcacagc aaccccaagc tggtgaagac 60 gtgatctctt cactcagtaa agattcccat ttaagcgcac aatctcaaaa gtattccaat 120 gatgaattga aagccggtga gtcagggcct gaaggctccc aaagtgttcc tatagagata 180 cccaagaagc ccatgtctga atatgttacc gtttccttgc tttgtttgtg tgttgccttc 240 ggcggcttca tgtttggctg ggataccggt actatttctg ggtttgttgt ccaaacagac 300 tttttgagaa ggtttggtat gaaacataag gatggtaccc actatttgtc aaacgtcaga 360 acaggtttaa tcgtcgccat tttcaatatt ggctgtgcct ttggtggtat tatactttcc 420 aaaggtggag atatgtatgg ccgtaaaaag ggtctttcga ttgtcgtctc ggtttatata 480 gttggtatta tcattcaaat tgcctctatc aacaagtggt accaatattt cattggtaga 540 atcatatctg gtttgggtgt cggcggcatc gccgtcttat gtcctatgtt gatctctgaa 600 attgctccaa agcacttgag aggcacacta gtttcttgtt atcagctgat gattactgca 660 ggtatctttt tgggctactg tactaattac ggtacaaaga gctattcgaa ctcagttcaa 720 tggagagttc cattagggct atgtttcgct tggtcattat ttatgattgg cgctttgacg 780 ttagttcctg aatccccacg ttatttatgt gaggtgaata aggtagaaga cgccaagctt 840 tccattgcta agtctaacaa ggtgtcacca gaggatcctg ccgtccaggc agagttagat 900 ctgatcatgg ccggtataga agctgaaaaa ctggctggca atgcgtcctg gggggaatta 960 ttttccacca agaccaaagt atttcaacgt ttgttgatgg gtgtatttgt tcaaatgttc 1020 caacaattaa ccggtaacaa ttattttttc tactacggta ccgttatttt caagtcagtt 1080 ggcctggatg attcctttga aacatccatt gtcattggtg tagtcaactt tgcctccact 1140 ttctttagtt tgtggactgt cgaaaacttg gggcgtcgta aatgtttact tttgggcgct 1200 gccactatga tggcttgtat ggtcatctac gcctctgttg gtgttaccag attatatcct 1260 cacggtaaaa gccagccatc ttctaaaggt gccggtaact gtatgattgt ctttacctgt 1320 ttttatattt tctgttatgc cacaacctgg gcgccagttg cctgggtcat cacagcagaa 1380 tcattcccac tgagagtcaa gtcgaaatgt atggcgttgg cctctgcttc caattgggta 1440 tgggggttct tgattgcatt tttcacccca ttcatcacat ctgccattaa cttctactac 1500 ggttatgtct tcatgggctg tttggttgcc atgttttttt atgtcttttt ctttgttcca 1560 gaaactaaag gcctatcgtt agaagaaatt caagaattat gggaagaagg tgttttacct 1620 tggaaatctg aaggctggat tccttcatcc agaagaggta ataattacga tttagaggat 1680 ttacaacatg acgacaaacc gtggtacaag gccatgctag aataa 1725 <210> 57 <211> 7392 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..7392 <223> /organism="Artificial Sequence" /note="pRN993 " /mol_type="unassigned DNA" <400> 57 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accataattc cgttttaaga gcttggtgag cgctaggagt cactgccagg tatcgtttga 240 acacggcatt agtcagggaa gtcataacac agtcctttcc cgcaattttc tttttctatt 300 actcttggcc tcctctagta cactctatat ttttttatgc ctcggtaatg attttcattt 360 ttttttttcc acctagcgga tgactctttt tttttcttag cgattggcat tatcacataa 420 tgaattatac attatataaa gtaatgtgat ttcttcgaag aatatactaa aaaatgagca 480 ggcaagataa acgaaggcaa agatgacaga gcagaaagcc ctagtaaagc gtattacaaa 540 tgaaaccaag attcagattg cgatctcttt aaagggtggt cccctagcga tagagcactc 600 gatcttccca gaaaaagagg cagaagcagt agcagaacag gccacacaat cgcaagtgat 660 taacgtccac acaggtatag ggtttctgga ccatatgata catgctctgg ccaagcattc 720 cggctggtcg ctaatcgttg agtgcattgg tgacttacac atagacgacc atcacaccac 780 tgaagactgc gggattgctc tcggtcaagc ttttaaagag gccctactgg cgcgtggagt 840 aaaaaggttt ggatcaggat ttgcgccttt ggatgaggca ctttccagag cggtggtaga 900 tctttcgaac aggccgtacg cagttgtcga acttggtttg caaagggaga aagtaggaga 960 tctctcttgc gagatgatcc cgcattttct tgaaagcttt gcagaggcta gcagaattac 1020 cctccacgtt gattgtctgc gaggcaagaa tgatcatcac cgtagtgaga gtgcgttcaa 1080 ggctcttgcg gttgccataa gagaagccac ctcgcccaat ggtaccaacg atgttccctc 1140 caccaaaggt gttcttatgt agtgacaccg attatttaaa gctgcagcat acgatatata 1200 tacatgtgta tatatgtata cctatgaatg tcagtaagta tgtatacgaa cagtatgata 1260 ctgaagatga caaggtaatg catcattcta tacgtgtcat tctgaacgag gcgcgatcgc 1320 gctttccttt tttctttttg ctttttcttt ttttttctct tgaactcgac ggatcatatg 1380 cggtgtgaaa taccgcacag atgcgtaagg agaaaatacc gcatcaggaa attgtaaacg 1440 ttaatatttt gttaaaattc gcgttaaatt tttgttaaat cagctcattt tttaaccaat 1500 aggccgaaat cggcaaaatc ccttataaat caaaagaata gaccgagata gggttgagtg 1560 ttgttccagt ttggaacaag agtccactat taaagaacgt ggactccaac gtcaaagggc 1620 gaaaaaccgt ctatcagggc gatggcccac tacgtgaacc atcaccctaa tcaagttttt 1680 tggggtcgag gtgccgtaaa gcactaaatc ggaaccctaa agggagcccc cgatttagag 1740 cttgacgggg aaagccggcg aacgtggcga gaaaggaagg gaagaaagcg aaggagcggg 1800 cgctagggcg ctggcaagtg tagcggtcac gctgcgcgta accaccacac ccgccgcgct 1860 taatgcgccg ctacagggcg cgtcgcgcca ttcgccattc aggctgcgca actgttggga 1920 agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaggggg gatgtgctgc 1980 aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta aaacgacggc 2040 cagtgaattg taatacgact cactataggg cgaattggag ctccaccgcg gtggcggccg 2100 cggctacttc tcgtaggaac aatttcgggc ccctgcgtgt tcttctgagg ttcatctttt 2160 acatttgctt ctgctggata attttcagag gcaacaagga aaaattagat ggcaaaaagt 2220 cgtctttcaa ggaaaaatcc ccaccatctt tcgagatccc ctgtaactta ttggcaactg 2280 aaagaatgaa aaggaggaaa atacaaaata tactagaact gaaaaaaaaa aagtataaat 2340 agagacgata tatgccaata cttcacaatg ttcgaatcta ttcttcattt gcagctattg 2400 taaaataata aaacatcaag aacaaacaag ctcaacttgt cttttctaag aacaaagaat 2460 aaacacaaaa acaaaaagtt tttttaattc tgcagatctc tagaaaatgg cagttgagga 2520 gaacaatatg cctgttgttt cacagcaacc ccaagctggt gaagacgtga tctcttcact 2580 cagtaaagat tcccatttaa gcgcacaatc tcaaaagtat tctaatgatg aattgaaagc 2640 cggtgagtca gggtctgaag gctcccaaag tgttcctata gagataccca agaagcccat 2700 gtctgaatat gttaccgttt ccttgctttg tttgtgtgtt gccttcggcg gcttcatgtt 2760 tggctgggat accggtacta tttctgggtt tgttgtccaa acagactttt tgagaaggtt 2820 tggtatgaaa cataaggatg gtacccacta tttgtcaaac gtcagaacag gtttaatcgt 2880 cgccattttc aatattggct gtgcctttgg tggtattata ctttccaaag gtggagatat 2940 gtatggccgt aaaaagggtc tttcgattgt cgtctcggtt tatatagttg gtattatcat 3000 tcaaattgcc tctatcaaca agtggtacca atatttcatt ggtagaatca tatctggttt 3060 gggtgtcggc ggcatcgccg tcttatgtcc tatgttgatc tctgaaattg ctccaaagca 3120 cttgagaggc acactagttt cttgttatca gctgatgatt actgcaggta tctttttggg 3180 ctactgtact aattacggta caaagagcta ttcgaactca gttcaatgga gagttccatt 3240 agggctatgt ttcgcttggt cattatttat gattggcgct ttgacgttag ttcctgaatc 3300 cccacgttat ttatgtgagg tgaataaggt agaagacgcc aagcgttcca ttgctaagtc 3360 taacaaggtg tcaccagagg atcctgccgt ccaggcagag ttagatctga tcatggccgg 3420 tatagaagct gaaaaactgg ctggcaatgc gtcctggggg gaattatttt ccaccaagac 3480 caaagtattt caacgtttgt tgatgggtgt gtttgttcaa atgttccaac aattaaccgg 3540 taacaattat tttttctact acggtaccgt tattttcaag tcagttggcc tggatgattc 3600 ctttgaaaca tccattgtca ttggtgtagt caactttgcc tccactttct ttagtttgtg 3660 gactgtcgaa aacttgggac atcgtaaatg tttacttttg ggcgctgcca ctatgatggc 3720 ttgtatggtc atctacgcct ctgttggtgt tactagatta tatcctcacg gtaaaagcca 3780 gccatcttct aaaggtgccg gtaactgtat gattgtcttt acctgttttt atattttctg 3840 ttatgccaca acctgggcgc cagttgcctg ggtcatcaca gcagaatcat tcccactgag 3900 agtcaagtcg aaatgtatgg cgttggcctc tgcttccaat tgggtatggg ggttcttgat 3960 tgcatttttc accccattca tcacatctgc cattaacttc tactacggtt atgtcttcat 4020 gggctgtttg gttgccatgt ttttttatgt ctttttcttt gttccagaaa ctaaaggcct 4080 atcgttagaa gaaattcaag aattatggga agaaggtgtt ttaccttgga aatctgaagg 4140 ctggattcct tcatccagaa gaggtaataa ttacgattta gaggatttac aacatgacga 4200 caaaccgtgg tacaaggcca tgctagaata agcttgcgcg cgaatttctt atgatttatg 4260 atttttatta ttaaataagt tataaaaaaa ataagtgtat acaaatttta aagtgactct 4320 taggttttaa aacgaaaatt cttattcttg agtaactctt tcctgtaggt caggttgctt 4380 tctcaggtat agcatgaggt cgctcttatt gaccacacct ctaccggcat gccgagcaaa 4440 tgcctgcaaa tcgctcccca tttcacccaa ttgtagatat gctaactcca gcaatgagtt 4500 gatgaatctc ggtgtgtatt ttatgtcctc agaggacaac acctgttgta atcgttcttc 4560 cacacgtacg aagcttatcg ataccgtcga gggggggccc ggtacccagc ttttgttccc 4620 tttagtgagg gttaattccg agcttggcgt aatcatggtc atagctgttt cctgtgtgaa 4680 attgttatcc gctcacaatt ccacacaaca taggagccgg aagcataaag tgtaaagcct 4740 ggggtgccta atgagtgagg taactcacat taattgcgtt gcgctcactg cccgctttcc 4800 agtcgggaaa cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg 4860 gtttgcgtat tgggcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc 4920 ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag 4980 gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa 5040 aggccgcgtt gctggcgttt ttccataggc tcggcccccc tgacgagcat cacaaaaatc 5100 gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag gcgttccccc 5160 ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg 5220 cctttctccc ttcgggaagc gtggcgcttt ctcaatgctc acgctgtagg tatctcagtt 5280 cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc 5340 gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc 5400 cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 5460 agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 5520 ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 5580 ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 5640 gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 5700 cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 5760 attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 5820 accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 5880 ttgcctgact gcccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 5940 gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 6000 agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 6060 ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 6120 ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 6180 gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtga aaaaaagcgg 6240 ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 6300 tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 6360 tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 6420 cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 6480 tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 6540 gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccacgt 6600 ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg 6660 gaaatgttga atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta 6720 ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc 6780 gcgcacattt ccccgaaaag tgccacctgg gtccttttca tcacgtgcta taaaaataat 6840 tataatttaa attttttaat ataaatatat aaattaaaaa tagaaagtaa aaaaagaaat 6900 taaagaaaaa atagtttttg ttttccgaag atgtaaaaga ctctaggggg atcgccaaca 6960 aatactacct tttatcttgc tcttcctgct ctcaggtatt aatgccgaat tgtttcatct 7020 tgtctgtgta gaagaccaca cacgaaaatc ctgtgatttt acattttact tatcgttaat 7080 cgaatgtata tctatttaat ctgcttttct tgtctaataa atatatatgt aaagtacgct 7140 ttttgttgaa attttttaaa cctttgttta tttttttttc ttcattccgt aactcttcta 7200 ccttctttat ttactttcta aaatccaaat acaaaacata aaaataaata aacacagagt 7260 aaattcccaa attattccat cattaaaaga tacgaggcgc gtgtaagtta caggcaagcg 7320 atccgtccta agaaaccatt attatcatga cattaaccta taaaaatagg cgtatcacga 7380 ggccctttcg tc 7392 <210> 58 <211> 7389 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..7389 <223> /organism="Artificial Sequence" /note="pDB1250; WT-GAL2 expression vector for screening" /mol_type="unassigned DNA" <400> 58 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accataattc cgttttaaga gcttggtgag cgctaggagt cactgccagg tatcgtttga 240 acacggcatt agtcagggaa gtcataacac agtcctttcc cgcaattttc tttttctatt 300 actcttggcc tcctctagta cactctatat ttttttatgc ctcggtaatg attttcattt 360 ttttttttcc acctagcgga tgactctttt tttttcttag cgattggcat tatcacataa 420 tgaattatac attatataaa gtaatgtgat ttcttcgaag aatatactaa aaaatgagca 480 ggcaagataa acgaaggcaa agatgacaga gcagaaagcc ctagtaaagc gtattacaaa 540 tgaaaccaag attcagattg cgatctcttt aaagggtggt cccctagcga tagagcactc 600 gatcttccca gaaaaagagg cagaagcagt agcagaacag gccacacaat cgcaagtgat 660 taacgtccac acaggtatag ggtttctgga ccatatgata catgctctgg ccaagcattc 720 cggctggtcg ctaatcgttg agtgcattgg tgacttacac atagacgacc atcacaccac 780 tgaagactgc gggattgctc tcggtcaagc ttttaaagag gccctactgg cgcgtggagt 840 aaaaaggttt ggatcaggat ttgcgccttt ggatgaggca ctttccagag cggtggtaga 900 tctttcgaac aggccgtacg cagttgtcga acttggtttg caaagggaga aagtaggaga 960 tctctcttgc gagatgatcc cgcattttct tgaaagcttt gcagaggcta gcagaattac 1020 cctccacgtt gattgtctgc gaggcaagaa tgatcatcac cgtagtgaga gtgcgttcaa 1080 ggctcttgcg gttgccataa gagaagccac ctcgcccaat ggtaccaacg atgttccctc 1140 caccaaaggt gttcttatgt agtgacaccg attatttaaa gctgcagcat acgatatata 1200 tacatgtgta tatatgtata cctatgaatg tcagtaagta tgtatacgaa cagtatgata 1260 ctgaagatga caaggtaatg catcattcta tacgtgtcat tctgaacgag gcgcgatcgc 1320 gctttccttt tttctttttg ctttttcttt ttttttctct tgaactcgac ggatcatatg 1380 cggtgtgaaa taccgcacag atgcgtaagg agaaaatacc gcatcaggaa attgtaaacg 1440 ttaatatttt gttaaaattc gcgttaaatt tttgttaaat cagctcattt tttaaccaat 1500 aggccgaaat cggcaaaatc ccttataaat caaaagaata gaccgagata gggttgagtg 1560 ttgttccagt ttggaacaag agtccactat taaagaacgt ggactccaac gtcaaagggc 1620 gaaaaaccgt ctatcagggc gatggcccac tacgtgaacc atcaccctaa tcaagttttt 1680 tggggtcgag gtgccgtaaa gcactaaatc ggaaccctaa agggagcccc cgatttagag 1740 cttgacgggg aaagccggcg aacgtggcga gaaaggaagg gaagaaagcg aaggagcggg 1800 cgctagggcg ctggcaagtg tagcggtcac gctgcgcgta accaccacac ccgccgcgct 1860 taatgcgccg ctacagggcg cgtcgcgcca ttcgccattc aggctgcgca actgttggga 1920 agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaggggg gatgtgctgc 1980 aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta aaacgacggc 2040 cagtgaattg taatacgact cactataggg cgaattggag ctccaccgcg gtggcggccg 2100 cggctacttc tcgtaggaac aatttcgggc ccctgcgtgt tcttctgagg ttcatctttt 2160 acatttgctt ctgctggata attttcagag gcaacaagga aaaattagat ggcaaaaagt 2220 cgtctttcaa ggaaaaatcc ccaccatctt tcgagatccc ctgtaactta ttggcaactg 2280 aaagaatgaa aaggaggaaa atacaaaata tactagaact gaaaaaaaaa aagtataaat 2340 agagacgata tatgccaata cttcacaatg ttcgaatcta ttcttcattt gcagctattg 2400 taaaataata aaacatcaag aacaaacaag ctcaacttgt cttttctaag aacaaagaat 2460 aaacacaaaa acaaaaagtt tttttaattc tgcagatctc tagaaaaatg gcagttgagg 2520 agaacaatat gcctgttgtt tcacagcaac cccaagctgg tgaagacgtg atctcttcac 2580 tcagtaaaga ttcccattta agcgcacaat ctcaaaagta ttccaatgat gaattgaaag 2640 ccggtgagtc agggcctgaa ggctcccaaa gtgttcctat agagataccc aagaagccca 2700 tgtctgaata tgttaccgtt tccttgcttt gtttgtgtgt tgccttcggc ggcttcatgt 2760 ttggctggga taccggtact atttctgggt ttgttgtcca aacagacttt ttgagaaggt 2820 ttggtatgaa acataaggat ggtacccact atttgtcaaa cgtcagaaca ggtttaatcg 2880 tcgccatttt caatattggc tgtgcctttg gtggtattat actttccaaa ggtggagata 2940 tgtatggccg taaaaagggt ctttcgattg tcgtctcggt ttatatagtt ggtattatca 3000 ttcaaattgc ctctatcaac aagtggtacc aatatttcat tggtagaatc atatctggtt 3060 tgggtgtcgg cggcatcgcc gtcttatgtc ctatgttgat ctctgaaatt gctccaaagc 3120 acttgagagg cacactagtt tcttgttatc agctgatgat tactgcaggt atctttttgg 3180 gctactgtac taattacggt acaaagagct attcgaactc agttcaatgg agagttccat 3240 tagggctatg tttcgcttgg tcattattta tgattggcgc tttgacgtta gttcctgaat 3300 ccccacgtta tttatgtgag gtgaataagg tagaagacgc caagctttcc attgctaagt 3360 ctaacaaggt gtcaccagag gatcctgccg tccaggcaga gttagatctg atcatggccg 3420 gtatagaagc tgaaaaactg gctggcaatg cgtcctgggg ggaattattt tccaccaaga 3480 ccaaagtatt tcaacgtttg ttgatgggtg tatttgttca aatgttccaa caattaaccg 3540 gtaacaatta ttttttctac tacggtaccg ttattttcaa gtcagttggc ctggatgatt 3600 cctttgaaac atccattgtc attggtgtag tcaactttgc ctccactttc tttagtttgt 3660 ggactgtcga aaacttgggg cgtcgtaaat gtttactttt gggcgctgcc actatgatgg 3720 cttgtatggt catctacgcc tctgttggtg ttaccagatt atatcctcac ggtaaaagcc 3780 agccatcttc taaaggtgcc ggtaactgta tgattgtctt tacctgtttt tatattttct 3840 gttatgccac aacctgggcg ccagttgcct gggtcatcac agcagaatca ttcccactga 3900 gagtcaagtc gaaatgtatg gcgttggcct ctgcttccaa ttgggtatgg gggttcttga 3960 ttgcattttt caccccattc atcacatctg ccattaactt ctactacggt tatgtcttca 4020 tgggctgttt ggttgccatg tttttttatg tctttttctt tgttccagaa actaaaggcc 4080 tatcgttaga agaaattcaa gaattatggg aagaaggtgt tttaccttgg aaatctgaag 4140 gctggattcc ttcatccaga agaggtaata attacgattt agaggattta caacatgacg 4200 acaaaccgtg gtacaaggcc atgctagaat aagcgcgcga atttcttatg atttatgatt 4260 tttattatta aataagttat aaaaaaaata agtgtataca aattttaaag tgactcttag 4320 gttttaaaac gaaaattctt attcttgagt aactctttcc tgtaggtcag gttgctttct 4380 caggtatagc atgaggtcgc tcttattgac cacacctcta ccggcatgcc gagcaaatgc 4440 ctgcaaatcg ctccccattt cacccaattg tagatatgct aactccagca atgagttgat 4500 gaatctcggt gtgtatttta tgtcctcaga ggacaacacc tgttgtaatc gttcttccac 4560 acgtacgaag cttatcgata ccgtcgaggg ggggcccggt acccagcttt tgttcccttt 4620 agtgagggtt aattccgagc ttggcgtaat catggtcata gctgtttcct gtgtgaaatt 4680 gttatccgct cacaattcca cacaacatag gagccggaag cataaagtgt aaagcctggg 4740 gtgcctaatg agtgaggtaa ctcacattaa ttgcgttgcg ctcactgccc gctttccagt 4800 cgggaaacct gtcgtgccag ctgcattaat gaatcggcca acgcgcgggg agaggcggtt 4860 tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc 4920 tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg 4980 ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg 5040 ccgcgttgct ggcgtttttc cataggctcg gcccccctga cgagcatcac aaaaatcgac 5100 gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg ttcccccctg 5160 gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct 5220 ttctcccttc gggaagcgtg gcgctttctc aatgctcacg ctgtaggtat ctcagttcgg 5280 tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct 5340 gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac 5400 tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt 5460 tcttgaagtg gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc 5520 tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca 5580 ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat 5640 ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac 5700 gttaagggat tttggtcatg agattatcaa aaaggatctt cacctagatc cttttaaatt 5760 aaaaatgaag ttttaaatca atctaaagta tatatgagta aacttggtct gacagttacc 5820 aatgcttaat cagtgaggca cctatctcag cgatctgtct atttcgttca tccatagttg 5880 cctgactgcc cgtcgtgtag ataactacga tacgggaggg cttaccatct ggccccagtg 5940 ctgcaatgat accgcgagac ccacgctcac cggctccaga tttatcagca ataaaccagc 6000 cagccggaag ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc atccagtcta 6060 ttaattgttg ccgggaagct agagtaagta gttcgccagt taatagtttg cgcaacgttg 6120 ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct tcattcagct 6180 ccggttccca acgatcaagg cgagttacat gatcccccat gttgtgaaaa aaagcggtta 6240 gctccttcgg tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg 6300 ttatggcagc actgcataat tctcttactg tcatgccatc cgtaagatgc ttttctgtga 6360 ctggtgagta ctcaaccaag tcattctgag aatagtgtat gcggcgaccg agttgctctt 6420 gcccggcgtc aatacgggat aataccgcgc cacatagcag aactttaaaa gtgctcatca 6480 ttggaaaacg ttcttcgggg cgaaaactct caaggatctt accgctgttg agatccagtt 6540 cgatgtaacc cactcgtgca cccaactgat cttcagcatc ttttactttc accacgtttc 6600 tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa 6660 atgttgaata ctcatactct tcctttttca atattattga agcatttatc agggttattg 6720 tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg 6780 cacatttccc cgaaaagtgc cacctgggtc cttttcatca cgtgctataa aaataattat 6840 aatttaaatt ttttaatata aatatataaa ttaaaaatag aaagtaaaaa aagaaattaa 6900 agaaaaaata gtttttgttt tccgaagatg taaaagactc tagggggatc gccaacaaat 6960 actacctttt atcttgctct tcctgctctc aggtattaat gccgaattgt ttcatcttgt 7020 ctgtgtagaa gaccacacac gaaaatcctg tgattttaca ttttacttat cgttaatcga 7080 atgtatatct atttaatctg cttttcttgt ctaataaata tatatgtaaa gtacgctttt 7140 tgttgaaatt ttttaaacct ttgtttattt ttttttcttc attccgtaac tcttctacct 7200 tctttattta ctttctaaaa tccaaataca aaacataaaa ataaataaac acagagtaaa 7260 ttcccaaatt attccatcat taaaagatac gaggcgcgtg taagttacag gcaagcgatc 7320 cgtcctaaga aaccattatt atcatgacat taacctataa aaataggcgt atcacgaggc 7380 cctttcgtc 7389 <210> 59 <211> 574 <212> PRT <213> Saccharomyces cerevisiae <220> <223> WT Gal2p amino acid sequence <400> 59 Met Ala Val Glu Glu Asn Asn Met Pro Val Val Ser Gln Gln Pro Gln 1 5 10 15 Ala Gly Glu Asp Val Ile Ser Ser Leu Ser Lys Asp Ser His Leu Ser 20 25 30 Ala Gln Ser Gln Lys Tyr Ser Asn Asp Glu Leu Lys Ala Gly Glu Ser 35 40 45 Gly Pro Glu Gly Ser Gln Ser Val Pro Ile Glu Ile Pro Lys Lys Pro 50 55 60 Met Ser Glu Tyr Val Thr Val Ser Leu Leu Cys Leu Cys Val Ala Phe 65 70 75 80 Gly Gly Phe Met Phe Gly Trp Asp Thr Gly Thr Ile Ser Gly Phe Val 85 90 95 Val Gln Thr Asp Phe Leu Arg Arg Phe Gly Met Lys His Lys Asp Gly 100 105 110 Thr His Tyr Leu Ser Asn Val Arg Thr Gly Leu Ile Val Ala Ile Phe 115 120 125 Asn Ile Gly Cys Ala Phe Gly Gly Ile Ile Leu Ser Lys Gly Gly Asp 130 135 140 Met Tyr Gly Arg Lys Lys Gly Leu Ser Ile Val Val Ser Val Tyr Ile 145 150 155 160 Val Gly Ile Ile Ile Gln Ile Ala Ser Ile Asn Lys Trp Tyr Gln Tyr 165 170 175 Phe Ile Gly Arg Ile Ile Ser Gly Leu Gly Val Gly Gly Ile Ala Val 180 185 190 Leu Cys Pro Met Leu Ile Ser Glu Ile Ala Pro Lys His Leu Arg Gly 195 200 205 Thr Leu Val Ser Cys Tyr Gln Leu Met Ile Thr Ala Gly Ile Phe Leu 210 215 220 Gly Tyr Cys Thr Asn Tyr Gly Thr Lys Ser Tyr Ser Asn Ser Val Gln 225 230 235 240 Trp Arg Val Pro Leu Gly Leu Cys Phe Ala Trp Ser Leu Phe Met Ile 245 250 255 Gly Ala Leu Thr Leu Val Pro Glu Ser Pro Arg Tyr Leu Cys Glu Val 260 265 270 Asn Lys Val Glu Asp Ala Lys Leu Ser Ile Ala Lys Ser Asn Lys Val 275 280 285 Ser Pro Glu Asp Pro Ala Val Gln Ala Glu Leu Asp Leu Ile Met Ala 290 295 300 Gly Ile Glu Ala Glu Lys Leu Ala Gly Asn Ala Ser Trp Gly Glu Leu 305 310 315 320 Phe Ser Thr Lys Thr Lys Val Phe Gln Arg Leu Leu Met Gly Val Phe 325 330 335 Val Gln Met Phe Gln Gln Leu Thr Gly Asn Asn Tyr Phe Phe Tyr Tyr 340 345 350 Gly Thr Val Ile Phe Lys Ser Val Gly Leu Asp Asp Ser Phe Glu Thr 355 360 365 Ser Ile Val Ile Gly Val Val Asn Phe Ala Ser Thr Phe Phe Ser Leu 370 375 380 Trp Thr Val Glu Asn Leu Gly Arg Arg Lys Cys Leu Leu Leu Gly Ala 385 390 395 400 Ala Thr Met Met Ala Cys Met Val Ile Tyr Ala Ser Val Gly Val Thr 405 410 415 Arg Leu Tyr Pro His Gly Lys Ser Gln Pro Ser Ser Lys Gly Ala Gly 420 425 430 Asn Cys Met Ile Val Phe Thr Cys Phe Tyr Ile Phe Cys Tyr Ala Thr 435 440 445 Thr Trp Ala Pro Val Ala Trp Val Ile Thr Ala Glu Ser Phe Pro Leu 450 455 460 Arg Val Lys Ser Lys Cys Met Ala Leu Ala Ser Ala Ser Asn Trp Val 465 470 475 480 Trp Gly Phe Leu Ile Ala Phe Phe Thr Pro Phe Ile Thr Ser Ala Ile 485 490 495 Asn Phe Tyr Tyr Gly Tyr Val Phe Met Gly Cys Leu Val Ala Met Phe 500 505 510 Phe Tyr Val Phe Phe Phe Val Pro Glu Thr Lys Gly Leu Ser Leu Glu 515 520 525 Glu Ile Gln Glu Leu Trp Glu Glu Gly Val Leu Pro Trp Lys Ser Glu 530 535 540 Gly Trp Ile Pro Ser Ser Arg Arg Gly Asn Asn Tyr Asp Leu Glu Asp 545 550 555 560 Leu Gln His Asp Asp Lys Pro Trp Tyr Lys Ala Met Leu Glu 565 570 <210> 60 <211> 9400 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..9400 <223> /organism="Artificial Sequence" /note="pRN187 (pSH65-derived CRE recombinase expressing vector)" /mol_type="unassigned DNA" <400> 60 cctctagagt cgacctgcag cttctcaatg atattcgaat acgctttgag gagatacagc 60 ctaatatccg acaaactgtt ttacagattt acgatcgtac ttgttaccca tcattgaatt 120 ttgaacatcc gaacctggga gttttccctg aaacagatag tatatttgaa cctgtataat 180 aatatatagt ctagcgcttt acggaagaca atgtatgtat ttcggttcct ggagaaacta 240 ttgcatctat tgcataggta atcttgcacg tcgcatcccc ggttcatttt ctgcgtttcc 300 atcttgcact tcaatagcat atctttgtta acgaagcatc tgtgcttcat tttgtagaac 360 aaaaatgcaa cgcgagagcg ctaatttttc aaacaaagaa tctgagctgc atttttacag 420 aacagaaatg caacgcgaaa gcgctatttt accaacgaag aatctgtgct tcatttttgt 480 aaaacaaaaa tgcaacgcga gagcgctaat ttttcaaaca aagaatctga gctgcatttt 540 tacagaacag aaatgcaacg cgagagcgct attttaccaa caaagaatct atacttcttt 600 tttgttctac aaaaatgcat cccgagagcg ctatttttct aacaaagcat cttagattac 660 tttttttctc ctttgtgcgc tctataatgc agtctcttga taactttttg cactgtaggt 720 ccgttaaggt tagaagaagg ctactttggt gtctattttc tcttccataa aaaaagcctg 780 actccacttc ccgcgtttac tgattactag cgaagctgcg ggtgcatttt ttcaagataa 840 aggcatcccc gattatattc tataccgatg tggattgcgc atactttgtg aacagaaagt 900 gatagcgttg atgattcttc attggtcaga aaattatgaa cggtttcttc tattttgtct 960 ctatatacta cgtataggaa atgtttacat tttcgtattg ttttcgattc actctatgaa 1020 tagttcttac tacaattttt ttgtctaaag agtaatacta gagataaaca taaaaaatgt 1080 agaggtcgag tttagatgca agttcaagga gcgaaaggtg gatgggtagg ttatataggg 1140 atatagcaca gagatatata gcaaagagat acttttgagc aatgtttgtg gaagcggtat 1200 tcgcaatatt ttagtagctc gttacagtcc ggtgcgtttt tggttttttg aaagtgcgtc 1260 ttcagagcgc ttttggtttt caaaagcgct ctgaagttcc tatactttct agagaatagg 1320 aacttcggaa taggaacttc aaagcgtttc cgaaaacgag cgcttccgaa aatgcaacgc 1380 gagctgcgca catacagctc actgttcacg tcgcacctat atctgcgtgt tgcctgtata 1440 tatatataca tgagaagaac ggcatagtgc gtgtttatgc ttaaatgcgt acttatatgc 1500 gtctatttat gtaggatgaa aggtagtcta gtacctcctg tgatattatc ccattccatg 1560 cggggtatcg tatgcttcct tcagcactac cctttagctg ttctatatgc tgccactcct 1620 caattggatt agtctcatcc ttcaatgcta tcatttcctt tgatattgga tcatatgcat 1680 agtaccgaga aactagtgcg aagtagtgat caggtattgc tgttatctga tgagtatacg 1740 ttgtcctggc cacggcagaa gcacgcttat cgctccaatt tcccacaaca ttagtcaact 1800 ccgttaggcc cttcattgaa agaaatgagg tcatcaaatg tcttccaatg tgagattttg 1860 ggccattttt tatagcaaag attgaataag gcgcattttt cttcaaagct ttattgtacg 1920 atctgactaa gttatctttt aataattggt attcctgttt attgcttgaa gaattgccgg 1980 tcctatttac tcgttttagg actggttcag aattcttgaa gacgaaaggg cctcgtgata 2040 cgcctatttt tataggttaa tgtcatgata ataatggttt cttagacgtc aggtggcact 2100 tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca ttcaaatatg 2160 tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa aaggaagagt 2220 atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt ttgccttcct 2280 gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca 2340 cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag ttttcgcccc 2400 gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc ggtattatcc 2460 cgtgttgacg ccgggcaaga gcaactcggt cgccgcatac actattctca gaatgacttg 2520 gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt aagagaatta 2580 tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct gacaacgatc 2640 ggaggaccga aggagctaac cgcttttttg cacaacatgg gggatcatgt aactcgcctt 2700 gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga caccacgatg 2760 cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact tactctagct 2820 tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc acttctgcgc 2880 tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga gcgtgggtct 2940 cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt agttatctac 3000 acgacgggga gtcaggcaac tatggatgaa cgaaatagac agatcgctga gataggtgcc 3060 tcactgatta agcattggta actgtcagac caagtttact catatatact ttagattgat 3120 ttaaaacttc atttttaatt taaaaggatc taggtgaaga tcctttttga taatctcatg 3180 accaaaatcc cttaacgtga gttttcgttc cactgagcgt cagaccccgt agaaaagatc 3240 aaaggatctt cttgagatcc tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa 3300 ccaccgctac cagcggtggt ttgtttgccg gatcaagagc taccaactct ttttccgaag 3360 gtaactggct tcagcagagc gcagatacca aatactgtcc ttctagtgta gccgtagtta 3420 ggccaccact tcaagaactc tgtagcaccg cctacatacc tcgctctgct aatcctgtta 3480 ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg ggttggactc aagacgatag 3540 ttaccggata aggcgcagcg gtcgggctga acggggggtt cgtgcacaca gcccagcttg 3600 gagcgaacga cctacaccga actgagatac ctacagcgtg agctatgaga aagcgccacg 3660 cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg aacaggagag 3720 cgcacgaggg agcttccagg gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc 3780 cacctctgac ttgagcgtcg atttttgtga tgctcgtcag gggggcggag cctatggaaa 3840 aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg 3900 ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt tgagtgagct 3960 gataccgctc gccgcagccg aacgaccgag cgcagcgagt cagtgagcga ggaagcggaa 4020 gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc cgattcatta atgcagctgg 4080 cacgacaggt ttcccgactg gaaagcgggc agtgagcgca acgcaattaa tgtgagttac 4140 ctcactcatt aggcacccca ggctttacac tttatgcttc cggctcctat gttgtgtgga 4200 attgtgagcg gataacaatt tcacacagga aacagctatg accatgatta cgccaagcgc 4260 gcaattaacc ctcactaaag ggaacaaaag ctggagctct agtacggatt agaagccgcc 4320 gagcgggtga cagccctccg aaggaagact ctcctccgtg cgtcctcgtc ttcaccggtc 4380 gcgttcctga aacgcagatg tgcctcgcgc cgcactgctc cgaacaataa agattctaca 4440 atactagctt ttatggttat gaagaggaaa aattggcagt aacctggccc cacaaacctt 4500 caaatgaacg aatcaaatta acaaccatag gatgataatg cgattagttt tttagcctta 4560 tttctggggt aattaatcag cgaagcgatg atttttgatc tattaacaga tatataaatg 4620 caaaaactgc ataaccactt taactaatac tttcaacatt ttcggtttgt attacttctt 4680 attcaaatgt aataaaagta tcaacaaaaa attgttaata tacctctata ctttaacgtc 4740 aaggagaaaa aaccccggat tctagaacta gtggatcccc cgggctgcag gaattcgata 4800 tcaagcttat cgataccgtc gaggggcaga gccgatcctg tacactttac ttaaaaccat 4860 tatctgagtg ttaaatgtcc aatttactga ccgtacacca aaatttgcct gcattaccgg 4920 tcgatgcaac gagtgatgag gttcgcaaga acctgatgga catgttcagg gatcgccagg 4980 cgttttctga gcatacctgg aaaatgcttc tgtccgtttg ccggtcgtgg gcggcatggt 5040 gcaagttgaa taaccggaaa tggtttcccg cagaacctga agatgttcgc gattatcttc 5100 tatatcttca ggcgcgcggt ctggcagtaa aaactatcca gcaacatttg ggccagctaa 5160 acatgcttca tcgtcggtcc gggctgccac gaccaagtga cagcaatgct gtttcactgg 5220 ttatgcggcg gatccgaaaa gaaaacgttg atgccggtga acgtgcaaaa caggctctag 5280 cgttcgaacg cactgatttc gaccaggttc gttcactcat ggaaaatagc gatcgctgcc 5340 aggatatacg taatctggca tttctgggga ttgcttataa caccctgtta cgtatagccg 5400 aaattgccag gatcagggtt aaagatatct cacgtactga cggtgggaga atgttaatcc 5460 atattggcag aacgaaaacg ctggttagca ccgcaggtgt agagaaggca cttagcctgg 5520 gggtaactaa actggtcgag cgatggattt ccgtctctgg tgtagctgat gatccgaata 5580 actacctgtt ttgccgggtc agaaaaaatg gtgttgccgc gccatctgcc accagccagc 5640 tatcaactcg cgccctggaa gggatttttg aagcaactca tcgattgatt tacggcgcta 5700 aggatgactc tggtcagaga tacctggcct ggtctggaca cagtgcccgt gtcggagccg 5760 cgcgagatat ggcccgcgct ggagtttcaa taccggagat catgcaagct ggtggctgga 5820 ccaatgtaaa tattgtcatg aactatatcc gtaccctgga tagtgaaaca ggggcaatgg 5880 tgcgcctgct ggaagatggc gattagccat taacgcgtaa atgattgcta taattatttg 5940 atatttatgg tgacatatga gaaaggattt caacatcgac ggaaaatatg tagtgctgtc 6000 tgtaagcact aatattcagt cgccagccgt cattgtcact gtaaagctga gcgatagaat 6060 gcctgatatt gactcaatat ccgttgcgtt tcctgtcaaa agtatgcgta gtgctgaaca 6120 tttcgtgatg aatgccaccg aggaagaagc acggcgcggt tttgcaaagt gatgtctgag 6180 tttggcgaac tcttgggtaa ggttggaatt gtcgacctcg agtcatgtaa ttagttatgt 6240 cacgcttaca ttcacgccct ccccccacat ccgctctaac cgaaaaggaa ggagttagac 6300 aacctgaagt ctaggtccct atttattttt ttatagttat gttagtatta agaacgttat 6360 ttatatttca aatttttctt ttttttctgt acagacgcgt gtacgcatgt aacattatac 6420 tgaaaacctt gcttgagaag gttttgggac gctcgaaggc tttaatttgc ggccggtacc 6480 taggaccggt ttatcattat caatactgcc atttcaaaga atacgtaaat aattaatagt 6540 agtgattttc ctaactttat ttagtcaaaa aattagcctt ttaattctgc tgtaacccgt 6600 acatgcccaa aatagggggc gggttacaca gaatatataa catcgtaggt gtctgggtga 6660 acagtttatt cctggcatcc actaaatata atggagcccg ctttttaagc tggcatccag 6720 aaaaaaaaag aatcccagca ccaaaatatt gttttcttca ccaaccatca gttcataggt 6780 ccattctctt agcgcaacta cagagaacag gggcacaaac aggcaaaaaa cgggcacaac 6840 ctcaatggag tgatgcaacc tgcctggagt aaatgatgac acaaggcaat tgacccacgc 6900 atgtatctat ctcattttct tacaccttct attaccttct gctctctctg atttggaaaa 6960 agctgaaaaa aaaggttgaa accagttccc tgaaattatt cccctacttg actaataagt 7020 atataaagac ggtaggtatt gattgtaatt ctgtaaatct atttcttaaa cttcttaaat 7080 tctactttta tagttagtct tttttttagt tttaaaacac caagaactta gtttcgaata 7140 aacacacata aagaattcaa aatggtttca aaaggtgaag aagataatat ggctattatt 7200 aaagaattta tgagatttaa agttcatatg gaaggttcag ttaatggtca tgaatttgaa 7260 attgaaggtg aaggtgaagg tagaccatat gaaggtactc aaactgctaa attgaaagtt 7320 actaaaggtg gtccattacc atttgcttgg gatattttgt caccacaatt tatgtatggt 7380 tcaaaagctt atgttaaaca tccagctgat attccagatt atttaaaatt gtcatttcca 7440 gaaggtttta aatgggaaag agttatgaat tttgaagatg gtggtgttgt tactgttact 7500 caagattcat cattacaaga tggtgaattt atttataaag ttaaattgag aggtactaat 7560 tttccatcag atggtccagt tatgcaaaaa aaaactatgg gttgggaagc ttcatcagaa 7620 agaatgtatc cagaagatgg tgctttaaaa ggtgaaatta aacaaagatt gaaattaaaa 7680 gatggtggtc attatgatgc tgaagttaaa actacttata aagctaaaaa accagttcaa 7740 ttaccaggtg cttataatgt taatattaaa ttggatatta cttcacataa tgaagattat 7800 actattgttg aacaatatga aagagctgaa ggtagacatt caactggtgg tatggatgaa 7860 ttatataaat aatctagaca aatcgctctt aaatatatac ctaaagaaca ttaaagctat 7920 attataagca aagatacgta aattttgctt atattattat acacatatca tatttctata 7980 tttttaagat ttggttatat aatgtacgta atgcaaagga aataaatttt atacattatt 8040 gaacagcgtc caagtaacta cattatgtgc actaatagtt tagcgtcgtg aagactttat 8100 tgtgtcgcga aaagtaaaaa ttttaaaaat tagagcacct tgaacttgcg aaaaaggttc 8160 tcatcaactg tttaaaagat ctgagctcgc ggccgcgata tcgctagctc gagcccacac 8220 accatagctt caaaatgttt ctactccttt tttactcttc cagattttct cggactccgc 8280 gcatcgccgt accacttcaa aacacccaag cacagcatac taaattttcc ctctttcttc 8340 ctctagggtg tcgttaatta cccgtactaa aggtttggaa aagaaaaaag agaccgcctc 8400 gtttcttttt cttcgtcgaa aaaggcaata aaaattttta tcacgtttct ttttcttgaa 8460 attttttttt ttagtttttt tctctttcag tgacctccat tgatatttaa gttaataaac 8520 ggtcttcaat ttctcaagtt tcagtttcat ttttcttgtt ctattacaac tttttttact 8580 tcttgttcat tagaaagaaa gcatagcaat ctaatctaag gggcggtgtt gacaattaat 8640 catcggcata gtatatcggc atagtataat acgacaaggt gaggaactaa accatggcca 8700 agttgaccag tgccgttccg gtgctcaccg cgcgcgacgt cgccggagcg gtcgagttct 8760 ggaccgaccg gctcgggttc tcccgggact tcgtggagga cgacttcgcc ggtgtggtcc 8820 gggacgacgt gaccctgttc atcagcgcgg tccaggacca ggtggtgccg gacaacaccc 8880 tggcctgggt gtgggtgcgc ggcctggacg agctgtacgc cgagtggtcg gaggtcgtgt 8940 ccacgaactt ccgggacgcc tccgggccgg ccatgaccga gatcggcgag cagccgtggg 9000 ggcgggagtt cgccctgcgc gacccggccg gcaactgcgt gcacttcgtg gccgaggagc 9060 aggactgaca cgtccgacgg cggcccacgg gtcccaggcc tcggagatcc gtcccccttt 9120 tcctttgtcg atatcatgta attagttatg tcacgcttac attcacgccc tccccccaca 9180 tccgctctaa ccgaaaagga aggagttaga caacctgaag tctaggtccc tatttatttt 9240 tttatagtta tgttagtatt aagaacgtta tttatatttc aaatttttct tttttttctg 9300 tacagacgcg tgtacgcatg taacattata ctgaaaacct tgcttgagaa ggttttggga 9360 cgctcgaagg ctttaatttg caagctgaat tcccggggat 9400 <210> 61 <211> 5763 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..5763 <223> /organism="Artificial Sequence" /note="pRN486 (TOPO-BLUNT-his3::loxP-natMX-loxP)" /mol_type="unassigned DNA" <400> 61 acttcgtata atgtatgcta tacgaagtta tacgtacgca gttgtcgaac ttggtttgca 60 aagggagaaa gtaggagatc tctcttgcga gatgatcccg cattttcttg aaagctttgc 120 agaggctagc agaattaccc tccacgttga ttgtctgcga ggcaagaatg atcatcaccg 180 tagtgagagt gcgttcaagg ctcttgcggt tgccataaga gaagccacct cgcccaatgg 240 taccaacgat gttccctcca ccaaaggtgt tcttatgtag tgacaccgat tatttaaagc 300 tgcagcatac gatatatata catgtgtata tatgtatacc tatgaatgtc agtaagtatg 360 tatacgaaca gtatgatact gaagatgaca aggtaatgca tcattctata cgtgtcattc 420 tgaacgaggc gcgctttcct tttttctttt tgctttttct ttttttttct cttgaactcg 480 acggatcata tgcggtgtga aatactcgag atcttgctga aaaactcgag ccatccggaa 540 gatctggctt aagggcgaat tctgagatat ccatcacact ggcggccgct cgagcatgca 600 tctagagggc ccaattcgcc ctatagtgag tcgtattaca attcactggc cgtcgtttta 660 caacgtcgtg actgggaaaa ccctggcgtt acccaactta atcgccttgc agcacatccc 720 cctttcgcca gctggcgtaa tagcgaagag gcccgcaccg atcgcccttc ccaacagttg 780 cgcagcctat acgtacggca gtttaaggtt tacacctata aaagagagag ccgttatcgt 840 ctgtttgtgg atgtacagag tgatattatt gacacgccgg ggcgacggat ggtgatcccc 900 ctggccagtg cacgtctgct gtcagataaa gtctcccgtg aactttaccc ggtggtgcat 960 atcggggatg aaagctggcg catgatgacc accgatatgg ccagtgtgcc ggtctccgtt 1020 atcggggaag aagtggctga tctcagccac cgcgaaaatg acatcaaaaa cgccattaac 1080 ctgatgttct ggggaatata aatgtcaggc atgagattat caaaaaggat cttcacctag 1140 atccttttca cgtagaaagc cagtccgcag aaacggtgct gaccccggat gaatgtcagc 1200 tactgggcta tctggacaag ggaaaacgca agcgcaaaga gaaagcaggt agcttgcagt 1260 gggcttacat ggcgatagct agactgggcg gttttatgga cagcaagcga accggaattg 1320 ccagctgggg cgccctctgg taaggttggg aagccctgca aagtaaactg gatggctttc 1380 tcgccgccaa ggatctgatg gcgcagggga tcaagctctg atcaagagac aggatgagga 1440 tcgtttcgca tgattgaaca agatggattg cacgcaggtt ctccggccgc ttgggtggag 1500 aggctattcg gctatgactg ggcacaacag acaatcggct gctctgatgc cgccgtgttc 1560 cggctgtcag cgcaggggcg cccggttctt tttgtcaaga ccgacctgtc cggtgccctg 1620 aatgaactgc aagacgaggc agcgcggcta tcgtggctgg ccacgacggg cgttccttgc 1680 gcagctgtgc tcgacgttgt cactgaagcg ggaagggact ggctgctatt gggcgaagtg 1740 ccggggcagg atctcctgtc atctcacctt gctcctgccg agaaagtatc catcatggct 1800 gatgcaatgc ggcggctgca tacgcttgat ccggctacct gcccattcga ccaccaagcg 1860 aaacatcgca tcgagcgagc acgtactcgg atggaagccg gtcttgtcga tcaggatgat 1920 ctggacgaag agcatcaggg gctcgcgcca gccgaactgt tcgccaggct caaggcgagc 1980 atgcccgacg gcgaggatct cgtcgtgacc catggcgatg cctgcttgcc gaatatcatg 2040 gtggaaaatg gccgcttttc tggattcatc gactgtggcc ggctgggtgt ggcggaccgc 2100 tatcaggaca tagcgttggc tacccgtgat attgctgaag agcttggcgg cgaatgggct 2160 gaccgcttcc tcgtgcttta cggtatcgcc gctcccgatt cgcagcgcat cgccttctat 2220 cgccttcttg acgagttctt ctgaattatt aacgcttaca atttcctgat gcggtatttt 2280 ctccttacgc atctgtgcgg tatttcacac cgcatacagg tggcactttt cggggaaatg 2340 tgcgcggaac ccctatttgt ttatttttct aaatacattc aaatatgtat ccgctcatga 2400 gacaataacc ctgataaatg cttcaataat agcacgtgag gagggccacc atggccaagt 2460 tgaccagtgc cgttccggtg ctcaccgcgc gcgacgtcgc cggagcggtc gagttctgga 2520 ccgaccggct cgggttctcc cgggacttcg tggaggacga cttcgccggt gtggtccggg 2580 acgacgtgac cctgttcatc agcgcggtcc aggaccaggt ggtgccggac aacaccctgg 2640 cctgggtgtg ggtgcgcggc ctggacgagc tgtacgccga gtggtcggag gtcgtgtcca 2700 cgaacttccg ggacgcctcc gggccggcca tgaccgagat cggcgagcag ccgtgggggc 2760 gggagttcgc cctgcgcgac ccggccggca actgcgtgca cttcgtggcc gaggagcagg 2820 actgacacgt gctaaaactt catttttaat ttaaaaggat ctaggtgaag atcctttttg 2880 ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg 2940 tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc 3000 aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc 3060 tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtc cttctagtgt 3120 agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc 3180 taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact 3240 caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac 3300 agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt gagctatgag 3360 aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg 3420 gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg 3480 tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga 3540 gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctgggcttt tgctggcctt 3600 ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct 3660 ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcaagcgccc 3720 aatacgcaaa ccgcctctcc ccgcgcgttg gccgattcat taatgcagct ggcacgacag 3780 gtttcccgac tggaaagcgg gcagtgagcg caacgcaatt aatgtgagtt agctcactca 3840 ttaggcaccc caggctttac actttatgct tccggctcgt atgttgtgtg gaattgtgag 3900 cggataacaa tttcacacag gaaacagcta tgaccatgat tacgccaagc tatttaggtg 3960 acactataga atactcaagc tatgcatcaa gcttggtacc gagctcggat ccactagtaa 4020 cggccgccag tgtgctggaa ttcgccccat ggcagctgag aatattgtag gagatcttct 4080 agaaagattg tacatccgga attctagatt ggtgagcgct aggagtcact gccaggtatc 4140 gtttgaacac ggcattagtc agggaagtca taacacagtc ctttcccgca attttctttt 4200 tctattactc ttggcctcct ctagtacact ctatattttt ttatgcctcg gtaatgattt 4260 tcattttttt ttttccacct agcggatgac tctttttttt tcttagcgat tggcattatc 4320 acataatgaa ttatacatta tataaagtaa tgtgatttct tcgaagaata tactaaaaaa 4380 tgagcaggca agataaacga aggcaaagat gacagagcag aaagccctag taaagcgtat 4440 tacaaatgaa accaagattc agattgcgat ctctttccta taacttcgta tagcatacat 4500 tatacgaagt tatgcgcgct ctagatatcg tcgacactgg atggcggcgt tagtatcgaa 4560 tcgacagcag tatagcgacc agcattcaca tacgattgac gcatgatatt actttctgcg 4620 cacttaactt cgcatctggg cagatgatgt cgaggcgaaa aaaaatataa atcacgctaa 4680 catttgatta aaatagaaca actacaatat aaaaaaacta tacaaatgac aagttcttga 4740 aaacaagaat ctttttattg tcagtactag gggcagggca tgctcatgta gagcgcctgc 4800 tcgccgtccg aggcggtgcc gtcgtacagg gcggtgtcca ggccgcagag ggtgaacccc 4860 atccgccggt acgcgtggat cgccggtgcg ttgacgttgg tgacctccag ccagaggtgc 4920 ccggcgcccc gctcgcgggc gaactccgtc gcgagcccca tcaacgcgcg cccgaccccg 4980 tgcccccggt gctccggggc gacctcgatg tcctcgacgg tcagccggcg gttccagccg 5040 gagtacgaga cgaccacgaa gcccgccagg tcgccgtcgt ccccgtacgc gacgaacgtc 5100 cgggagtccg ggtcgccgtc ctccccggcg tccgattcgt cgtccgattc gtcgtcgggg 5160 aacaccttgg tcaggggcgg gtccaccggc acctcccgca gggtgaagcc gtccccggtg 5220 gcggtgacgc ggaagacggt gtcggtggtg aaggacccat ccagtgcctc gatggcctcg 5280 gcgtcccccg ggacactggt gcggtaccgg taagccgtgt cgtcaagagt ggtcatttta 5340 catggttgtt tatgttcgga tgtgatgtga gaactgtatc ctagcaagat tttaaaagga 5400 agtatatgaa agaagaacct cagtggcaaa tcctaacctt ttatatttct ctacaggggc 5460 gcggcgtggg gacaattcaa cgcgtctgtg aggggagcgt ttccctgctc gcaggtctgc 5520 agcgaggagc cgtaattttt gcttcgcgcc gtgcggccat caaaatgtat ggatgcaaat 5580 gattatacat ggggatgtat gggctaaatg tacgggcgac agtcacatca tgcccctgag 5640 ctgcgcacgt caagactgtc aaggagggta ttctgggcct ccatgtcgct ggccgggtga 5700 cccggcgggg acgaggcaag cttaagggcg aattccagca cactggcggc cgttactaga 5760 ata 5763 <210> 62 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..23 <223> /organism="Artificial Sequence" /note="Primer ActinF (Real time PCR)" /mol_type="unassigned DNA" <400> 62 ggattctgag gttgctgctt tgg 23 <210> 63 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..23 <223> /organism="Artificial Sequence" /note="Primer ActinR (Real time PCR)" /mol_type="unassigned DNA" <400> 63 gagcttcatc accaacgtag gag 23 <210> 64 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..23 <223> /organism="Artificial Sequence" /note="Primer HXT1F (Real time PCR)" /mol_type="unassigned DNA" <400> 64 tgttctctgt acaccgttga ccg 23 <210> 65 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..23 <223> /organism="Artificial Sequence" /note="Primer HXT1R (Real time PCR)" /mol_type="unassigned DNA" <400> 65 agatcataca gttaccagca ccc 23 <210> 66 <211> 19 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..19 <223> /organism="Artificial Sequence" /note=" Primer HXT2F (Real time PCR)" /mol_type="unassigned DNA" <400> 66 cttcgcatcc actttcgtg 19 <210> 67 <211> 22 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..22 <223> /organism="Artificial Sequence" /note="Primer HXT2R (Real time PCR)" /mol_type="unassigned DNA" <400> 67 aatcatgacg ttaccggcag cc 22 <210> 68 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..23 <223> /organism="Artificial Sequence" /note="Primer HXT3F (Real time PCR)" /mol_type="unassigned DNA" <400> 68 gaagctagag ctgctggttc agc 23 <210> 69 <211> 24 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..24 <223> /organism="Artificial Sequence" /note="Primer HXT3R (Real time PCR)" /mol_type="unassigned DNA" <400> 69 acaacgacat aaggaattgg agcc 24 <210> 70 <211> 24 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..24 <223> /organism="Artificial Sequence" /note="Primer HXT4F (Real time PCR)" /mol_type="unassigned DNA" <400> 70 atggagagtt ccattaggtc tagg 24 <210> 71 <211> 24 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..24 <223> /organism="Artificial Sequence" /note="Primer HXT4R (Real time PCR)" /mol_type="unassigned DNA" <400> 71 atggagagtt ccattaggtc tagg 24 <210> 72 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..23 <223> /organism="Artificial Sequence" /note="Primer HXT5F (Real time PCR)" /mol_type="unassigned DNA" <400> 72 ttgctatgtc gtctatgcct ctg 23 <210> 73 <211> 22 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..22 <223> /organism="Artificial Sequence" /note="Primer HXT5R (Real time PCR)" /mol_type="unassigned DNA" <400> 73 agataaggac ataggcaacg gg 22 <210> 74 <211> 21 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..21 <223> /organism="Artificial Sequence" /note="Primer HXT7F (Real time PCR)" /mol_type="unassigned DNA" <400> 74 gggtgctgca tccatgactg c 21 <210> 75 <211> 24 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..24 <223> /organism="Artificial Sequence" /note="Primer HXT7R (Real time PCR)" /mol_type="unassigned DNA" <400> 75 acaacgacat aaggaattgg agcc 24 <210> 76 <211> 25 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..25 <223> /organism="Artificial Sequence" /note="Primer HXT8F ( (Real time PCR)" /mol_type="unassigned DNA" <400> 76 gtactactat cttcaaatct gtcgg 25 <210> 77 <211> 21 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..21 <223> /organism="Artificial Sequence" /note="Primer HXT8R (Real time PCR)" /mol_type="unassigned DNA" <400> 77 cttgtgacgc caacggaggc g 21 <210> 78 <211> 22 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..22 <223> /organism="Artificial Sequence" /note="Primer HXT9F (Real time PCR)" /mol_type="unassigned DNA" <400> 78 ccattgagag gtttggacgc cg 22 <210> 79 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..23 <223> /organism="Artificial Sequence" /note="Primer HXT9R (Real time PCR)" /mol_type="unassigned DNA" <400> 79 acacaatcat acagttaccg gcg 23 <210> 80 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..23 <223> /organism="Artificial Sequence" /note="Primer HXT10F (Real time PCR)" /mol_type="unassigned DNA" <400> 80 ggaatgcaag actctttcga gac 23 <210> 81 <211> 21 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..21 <223> /organism="Artificial Sequence" /note="Primer HXT10R (Real time PCR)" /mol_type="unassigned DNA" <400> 81 ctagtgacgc caacggtggc g 21 <210> 82 <211> 21 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..21 <223> /organism="Artificial Sequence" /note="Primer HXT11F (Real time PCR)" /mol_type="unassigned DNA" <400> 82 gccactcaat ggagagtcgg c 21 <210> 83 <211> 22 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..22 <223> /organism="Artificial Sequence" /note="Primer HXT11R (Real time PCR)" /mol_type="unassigned DNA" <400> 83 caactagcaa ggctggatcg tc 22 <210> 84 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..23 <223> /organism="Artificial Sequence" /note="Primer HXT12F (Real time PCR)" /mol_type="unassigned DNA" <400> 84 caccatcttc aaatctgtcg gtc 23 <210> 85 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..23 <223> /organism="Artificial Sequence" /note="Primer HXT12R (Real time PCR)" /mol_type="unassigned DNA" <400> 85 caatcataca gttaccggca ccc 23 <210> 86 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..20 <223> /organism="Artificial Sequence" /note="Primer HXT13F (Real time PCR)" /mol_type="unassigned DNA" <400> 86 ccctcatggc caggacggtc 20 <210> 87 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..23 <223> /organism="Artificial Sequence" /note="Primer HXT13R (Real time PCR)" /mol_type="unassigned DNA" <400> 87 ttgccataac cagttgcatg cag 23 <210> 88 <211> 24 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..24 <223> /organism="Artificial Sequence" /note="Primer HXT14F (Real time PCR)" /mol_type="unassigned DNA" <400> 88 gccttagtag tgtactgcat cggt 24 <210> 89 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..23 <223> /organism="Artificial Sequence" /note="Primer HXT14R (Real time PCR)" /mol_type="unassigned DNA" <400> 89 tgatacgtag ataccatgga gcc 23 <210> 90 <211> 21 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..21 <223> /organism="Artificial Sequence" /note="Primer HXT15F (Real time PCR)" /mol_type="unassigned DNA" <400> 90 gaggcctgtg tctccatcgc c 21 <210> 91 <211> 24 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..24 <223> /organism="Artificial Sequence" /note="Primer HXT15R (Real time PCR)" /mol_type="unassigned DNA" <400> 91 cacaagaata cctgtgatca aacg 24 <210> 92 <211> 24 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..24 <223> /organism="Artificial Sequence" /note="Primer HXT16F (Real time PCR)" /mol_type="unassigned DNA" <400> 92 caaggaagta tagtaatact gcgc 24 <210> 93 <211> 21 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..21 <223> /organism="Artificial Sequence" /note="Primer HXT16R (Real time PCR)" /mol_type="unassigned DNA" <400> 93 ttggcgatgg agacacaggc c 21 <210> 94 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..23 <223> /organism="Artificial Sequence" /note="Primer HXT17F (Real time PCR)" /mol_type="unassigned DNA" <400> 94 taacactgca caatggagag tcc 23 <210> 95 <211> 22 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..22 <223> /organism="Artificial Sequence" /note="Primer HXT17R (Real time PCR)" /mol_type="unassigned DNA" <400> 95 tgagtaccca tggatcctct gg 22 <210> 96 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..23 <223> /organism="Artificial Sequence" /note="Primer GAL2F (Real time PCR)" /mol_type="unassigned DNA" <400> 96 tcaatggaga gttccattag ggc 23 <210> 97 <211> 21 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..21 <223> /organism="Artificial Sequence" /note="Primer GAL2R (Real time PCR)" /mol_type="unassigned DNA" <400> 97 ctggacggca ggatcctctg g 21 <210> 98 <211> 82 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..82 <223> /organism="Artificial Sequence" /note="Primer KOP11* for KO HXT11" /mol_type="unassigned DNA" <400> 98 aataatcatt gcacaattta gttctaaacg cttttgttat tactcaatat ccgttttaag 60 agcttggtga gcgctaggag tc 82 <210> 99 <211> 101 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..101 <223> /organism="Artificial Sequence" /note="Primer KOT11* for KO HXT11" /mol_type="unassigned DNA" <400> 99 tcgtcaattt ttttttttgc ttttttacca atttaccgaa aactagaaga gagttcaaga 60 gaaaaaaaaa gaaaaagcaa aaagaaaaaa ggaaagcgcg c 101 <210> 100 <211> 39 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..39 <223> /organism="Artificial Sequence" /note="Primer iHXT11F (Inverse HXT11)" /mol_type="unassigned DNA" <400> 100 ggcctctaga tcagctggaa aagaacctct tgtaaattg 39 <210> 101 <211> 41 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..41 <223> /organism="Artificial Sequence" /note="Primer iHXT11R (Inverse HXT11)" /mol_type="unassigned DNA" <400> 101 gctaggatcc atgtcaggtg ttaataatac atccgcaaat g 41 <210> 102 <211> 36 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..36 <223> /organism="Artificial Sequence" /note="Primer HXT11F (Cloning)" /mol_type="unassigned DNA" <400> 102 ggcctctaga atgtcaggtg ttaataatac atccgc 36 <210> 103 <211> 37 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..37 <223> /organism="Artificial Sequence" /note="Primer HXT12F (Cloning)" /mol_type="unassigned DNA" <400> 103 ggcctctaga atgggtttga ttgtctcaat attcaac 37 <210> 104 <211> 39 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..39 <223> /organism="Artificial Sequence" /note="Primer HXT11/12R (Cloning)" /mol_type="unassigned DNA" <400> 104 cgatggatcc tcagctggaa aagaacctct tgtaaattg 39 <210> 105 <211> 36 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..36 <223> /organism="Artificial Sequence" /note="Primer HXT1 Xbal (Cloning)" /mol_type="unassigned DNA" <400> 105 gcattctaga atgaattcaa ctcccgatct aatatc 36 <210> 106 <211> 38 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..38 <223> /organism="Artificial Sequence" /note="Primer R HXT1 Cfr9i (Cloning)" /mol_type="unassigned DNA" <400> 106 tgcatcccgg gttatttcct gctaaacaaa ctcttgta 38 <210> 107 <211> 33 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..33 <223> /organism="Artificial Sequence" /note="Primer F HXT2 Xbai (Cloning)" /mol_type="unassigned DNA" <400> 107 gtcctctaga atgtctgaat tcgctactag ccg 33 <210> 108 <211> 40 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..40 <223> /organism="Artificial Sequence" /note="Primer R HXT2 Cfr9i (Cloning)" /mol_type="unassigned DNA" <400> 108 catcgcccgg gttattcctc ggaaactctt ttttcttttg 40 <210> 109 <211> 38 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..38 <223> /organism="Artificial Sequence" /note="Primer F HXT3 Xbal (Cloning)" /mol_type="unassigned DNA" <400> 109 gcattctaga atgaattcaa ctccagattt aatatctc 38 <210> 110 <211> 36 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..36 <223> /organism="Artificial Sequence" /note="Primer R HXT6 Cfr9i (Cloning)" /mol_type="unassigned DNA" <400> 110 catcgcccgg gttatttggt gctgaacatt ctcttg 36 <210> 111 <211> 35 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..35 <223> /organism="Artificial Sequence" /note="Primer F HXT4 Xbal (Cloning)" /mol_type="unassigned DNA" <400> 111 gtcctctaga atgtctgaag aagctgccta tcaag 35 <210> 112 <211> 38 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..38 <223> /organism="Artificial Sequence" /note="Primer R HXT4RN Cfr9l (Cloning)" /mol_type="unassigned DNA" <400> 112 tatcgcccgg gttaattaac tgacctactt ttttccga 38 <210> 113 <211> 35 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..35 <223> /organism="Artificial Sequence" /note="Primer F HXT5 Xbal (Cloning)" /mol_type="unassigned DNA" <400> 113 gtcctctaga atgtcggaac ttgaaaacgc tcatc 35 <210> 114 <211> 40 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..40 <223> /organism="Artificial Sequence" /note="Primer R HXT5 Cfr9i (Cloning)" /mol_type="unassigned DNA" <400> 114 gcatcccggg ttatttttct ttagtgaaca tccttttata 40 <210> 115 <211> 34 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..34 <223> /organism="Artificial Sequence" /note="Primer F HXT7 Xbal (Cloning)" /mol_type="unassigned DNA" <400> 115 gtcctctaga atgtcacaag acgctgctat tgca 34 <210> 116 <211> 36 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..36 <223> /organism="Artificial Sequence" /note="Primer R HXT7 Cfr9l (Cloning)" /mol_type="unassigned DNA" <400> 116 catcgcccgg gttatttggt gctgaacatt ctcttg 36 <210> 117 <211> 6338 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..6338 <223> /organism="Artificial Sequence" /note="Plasmid pRS313-P7T7" /mol_type="unassigned DNA" <400> 117 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accataattc cgttttaaga gcttggtgag cgctaggagt cactgccagg tatcgtttga 240 acacggcatt agtcagggaa gtcataacac agtcctttcc cgcaattttc tttttctatt 300 actcttggcc tcctctagta cactctatat ttttttatgc ctcggtaatg attttcattt 360 ttttttttcc acctagcgga tgactctttt tttttcttag cgattggcat tatcacataa 420 tgaattatac attatataaa gtaatgtgat ttcttcgaag aatatactaa aaaatgagca 480 ggcaagataa acgaaggcaa agatgacaga gcagaaagcc ctagtaaagc gtattacaaa 540 tgaaaccaag attcagattg cgatctcttt aaagggtggt cccctagcga tagagcactc 600 gatcttccca gaaaaagagg cagaagcagt agcagaacag gccacacaat cgcaagtgat 660 taacgtccac acaggtatag ggtttctgga ccatatgata catgctctgg ccaagcattc 720 cggctggtcg ctaatcgttg agtgcattgg tgacttacac atagacgacc atcacaccac 780 tgaagactgc gggattgctc tcggtcaagc ttttaaagag gccctactgg cgcgtggagt 840 aaaaaggttt ggatcaggat ttgcgccttt ggatgaggca ctttccagag cggtggtaga 900 tctttcgaac aggccgtacg cagttgtcga acttggtttg caaagggaga aagtaggaga 960 tctctcttgc gagatgatcc cgcattttct tgaaagcttt gcagaggcta gcagaattac 1020 cctccacgtt gattgtctgc gaggcaagaa tgatcatcac cgtagtgaga gtgcgttcaa 1080 ggctcttgcg gttgccataa gagaagccac ctcgcccaat ggtaccaacg atgttccctc 1140 caccaaaggt gttcttatgt agtgacaccg attatttaaa gctgcagcat acgatatata 1200 tacatgtgta tatatgtata cctatgaatg tcagtaagta tgtatacgaa cagtatgata 1260 ctgaagatga caaggtaatg catcattcta tacgtgtcat tctgaacgag gcgcgctttc 1320 cttttttctt tttgcttttt cttttttttt ctcttgaact cgacggatca tatgcggtgt 1380 gaaataccgc acagatgcgt aaggagaaaa taccgcatca ggaaattgta aacgttaata 1440 ttttgttaaa attcgcgtta aatttttgtt aaatcagctc attttttaac caataggccg 1500 aaatcggcaa aatcccttat aaatcaaaag aatagaccga gatagggttg agtgttgttc 1560 cagtttggaa caagagtcca ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa 1620 ccgtctatca gggcgatggc ccactacgtg aaccatcacc ctaatcaagt tttttggggt 1680 cgaggtgccg taaagcacta aatcggaacc ctaaagggag cccccgattt agagcttgac 1740 ggggaaagcc ggcgaacgtg gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta 1800 gggcgctggc aagtgtagcg gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg 1860 cgccgctaca gggcgcgtcg cgccattcgc cattcaggct gcgcaactgt tgggaagggc 1920 gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa ggggggatgt gctgcaaggc 1980 gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg acggccagtg 2040 aattgtaata cgactcacta tagggcgaat tggagctctc tcgtaggaac aatttcgggc 2100 ccctgcgtgt tcttctgagg ttcatctttt acatttgctt ctgctggata attttcagag 2160 gcaacaagga aaaattagat ggcaaaaagt cgtctttcaa ggaaaaatcc ccaccatctt 2220 tcgagatccc ctgtaactta ttggcaactg aaagaatgaa aaggaggaaa atacaaaata 2280 tactagaact gaaaaaaaaa aagtataaat agagacgata tatgccaata cttcacaatg 2340 ttcgaatcta ttcttcattt gcagctattg taaaataata aaacatcaag aacaaacaag 2400 ctcaacttgt cttttctaag aacaaagaat aaacacaaaa acaaaaagtt tttttaattt 2460 taatcaaaaa tctagaacta gtggatcccc cgggctgcag gaattcgata tcaagcttat 2520 cgattttgcg aacactttta ttaattcatg atcacgctct aatttgtgca tttgaaatgt 2580 actctaattc taattttata tttttaatga tatcttgaaa agtaaatacg tttttaatat 2640 atacaaaata atacagttta attttcaagt ttttgatcat ttgttctcag aaagttgagt 2700 gggacggaga caaagaaact ttaaagagaa atgcaaagtg ggaagaagtc agttgtttac 2760 cgaccgcact gttattcaca aatattccaa ttttgcctgc agacccacgt ctacaaattt 2820 tggttagttt ggtaaatggt aaggatatag tagagccttt ttgaaatggg aaatatcttc 2880 tttttctgta tcccgcttca aaaagtgtct aatgagtcag ttatttcttt cttactcatc 2940 gcccgtcact taaaagaaga aaaattactt tcatgatgcg aagcgaaaaa aatttttagc 3000 ttcaattttc acaatgcatc tatggagagg atattataag gttacgaaat aaattcttga 3060 gtgttgtaaa ttctgttaat caaagaaaaa gcaatagctc gtttttctac agaatggcta 3120 gcacagcaaa tatgatttct caactaaaga aactatctat cgcggaacct gcggttgcca 3180 aggattctca tcctgatgta aatatcgtgg atttgatgag aaattacatt tcacaagaat 3240 taagcaagat ttccggcgta gactcgtctc ttatttttcc agcattagaa tggacaaata 3300 ctatggagag aggcgatttg ttgattccta tcccaagatt gagaatcaaa ggtgccaatc 3360 caaaggattt ggcagtccaa tgggctgaaa aatttccatg tggagatttc ttggagaaag 3420 ttgaagcgaa tggcccgttc atccagtttt tcttcaaccc tcaattttta gcaaaacttg 3480 tcatcccaga tatcttaacc agaaaggagg attatggttc ttgcgtcgac ctcgaggggg 3540 ggcccggtac ccagcttttg ttccctttag tgagggttaa ttccgagctt ggcgtaatca 3600 tggtcatagc tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatagga 3660 gccggaagca taaagtgtaa agcctggggt gcctaatgag tgaggtaact cacattaatt 3720 gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga 3780 atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc 3840 actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg 3900 gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc 3960 cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctcggc 4020 ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 4080 ctataaagat accaggcgtt cccccctgga agctccctcg tgcgctctcc tgttccgacc 4140 ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcaa 4200 tgctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 4260 cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 4320 aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 4380 gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 4440 agaaggacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 4500 ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 4560 cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 4620 tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa 4680 aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata 4740 tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg 4800 atctgtctat ttcgttcatc catagttgcc tgactgcccg tcgtgtagat aactacgata 4860 cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg 4920 gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct 4980 gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt 5040 tcgccagtta atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc 5100 tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga 5160 tcccccatgt tgtgaaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt 5220 aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc 5280 atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa 5340 tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca 5400 catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca 5460 aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct 5520 tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc 5580 gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa 5640 tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt 5700 tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgggtcc 5760 ttttcatcac gtgctataaa aataattata atttaaattt tttaatataa atatataaat 5820 taaaaataga aagtaaaaaa agaaattaaa gaaaaaatag tttttgtttt ccgaagatgt 5880 aaaagactct agggggatcg ccaacaaata ctacctttta tcttgctctt cctgctctca 5940 ggtattaatg ccgaattgtt tcatcttgtc tgtgtagaag accacacacg aaaatcctgt 6000 gattttacat tttacttatc gttaatcgaa tgtatatcta tttaatctgc ttttcttgtc 6060 taataaatat atatgtaaag tacgcttttt gttgaaattt tttaaacctt tgtttatttt 6120 tttttcttca ttccgtaact cttctacctt ctttatttac tttctaaaat ccaaatacaa 6180 aacataaaaa taaataaaca cagagtaaat tcccaaatta ttccatcatt aaaagatacg 6240 aggcgcgtgt aagttacagg caagcgatcc gtcctaagaa accattatta tcatgacatt 6300 aacctataaa aataggcgta tcacgaggcc ctttcgtc 6338 <210> 118 <211> 8726 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..8726 <223> /organism="Artificial Sequence" /note="Plasmid pRS313-P7t7-HXT11+GFP" /mol_type="unassigned DNA" <400> 118 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accataattc cgttttaaga gcttggtgag cgctaggagt cactgccagg tatcgtttga 240 acacggcatt agtcagggaa gtcataacac agtcctttcc cgcaattttc tttttctatt 300 actcttggcc tcctctagta cactctatat ttttttatgc ctcggtaatg attttcattt 360 ttttttttcc acctagcgga tgactctttt tttttcttag cgattggcat tatcacataa 420 tgaattatac attatataaa gtaatgtgat ttcttcgaag aatatactaa aaaatgagca 480 ggcaagataa acgaaggcaa agatgacaga gcagaaagcc ctagtaaagc gtattacaaa 540 tgaaaccaag attcagattg cgatctcttt aaagggtggt cccctagcga tagagcactc 600 gatcttccca gaaaaagagg cagaagcagt agcagaacag gccacacaat cgcaagtgat 660 taacgtccac acaggtatag ggtttctgga ccatatgata catgctctgg ccaagcattc 720 cggctggtcg ctaatcgttg agtgcattgg tgacttacac atagacgacc atcacaccac 780 tgaagactgc gggattgctc tcggtcaagc ttttaaagag gccctactgg cgcgtggagt 840 aaaaaggttt ggatcaggat ttgcgccttt ggatgaggca ctttccagag cggtggtaga 900 tctttcgaac aggccgtacg cagttgtcga acttggtttg caaagggaga aagtaggaga 960 tctctcttgc gagatgatcc cgcattttct tgaaagcttt gcagaggcta gcagaattac 1020 cctccacgtt gattgtctgc gaggcaagaa tgatcatcac cgtagtgaga gtgcgttcaa 1080 ggctcttgcg gttgccataa gagaagccac ctcgcccaat ggtaccaacg atgttccctc 1140 caccaaaggt gttcttatgt agtgacaccg attatttaaa gctgcagcat acgatatata 1200 tacatgtgta tatatgtata cctatgaatg tcagtaagta tgtatacgaa cagtatgata 1260 ctgaagatga caaggtaatg catcattcta tacgtgtcat tctgaacgag gcgcgctttc 1320 cttttttctt tttgcttttt cttttttttt ctcttgaact cgacggatca tatgcggtgt 1380 gaaataccgc acagatgcgt aaggagaaaa taccgcatca ggaaattgta aacgttaata 1440 ttttgttaaa attcgcgtta aatttttgtt aaatcagctc attttttaac caataggccg 1500 aaatcggcaa aatcccttat aaatcaaaag aatagaccga gatagggttg agtgttgttc 1560 cagtttggaa caagagtcca ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa 1620 ccgtctatca gggcgatggc ccactacgtg aaccatcacc ctaatcaagt tttttggggt 1680 cgaggtgccg taaagcacta aatcggaacc ctaaagggag cccccgattt agagcttgac 1740 ggggaaagcc ggcgaacgtg gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta 1800 gggcgctggc aagtgtagcg gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg 1860 cgccgctaca gggcgcgtcg cgccattcgc cattcaggct gcgcaactgt tgggaagggc 1920 gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa ggggggatgt gctgcaaggc 1980 gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg acggccagtg 2040 aattgtaata cgactcacta tagggcgaat tggagctctc tcgtaggaac aatttcgggc 2100 ccctgcgtgt tcttctgagg ttcatctttt acatttgctt ctgctggata attttcagag 2160 gcaacaagga aaaattagat ggcaaaaagt cgtctttcaa ggaaaaatcc ccaccatctt 2220 tcgagatccc ctgtaactta ttggcaactg aaagaatgaa aaggaggaaa atacaaaata 2280 tactagaact gaaaaaaaaa aagtataaat agagacgata tatgccaata cttcacaatg 2340 ttcgaatcta ttcttcattt gcagctattg taaaataata aaacatcaag aacaaacaag 2400 ctcaacttgt cttttctaag aacaaagaat aaacacaaaa acaaaaagtt tttttaattt 2460 taatcaaaaa tctagaatgt caggtgttaa taatacatcc gcaaatgagt tatctactac 2520 catgtctaac tctaactcag cagtaggcgc tccctctgtt aagactgaac acggtgactc 2580 taaaaattcc cttaacctag atgccaatga gccacctatt gacttacctc aaaaacccct 2640 ctctgcgtat accaccgtcg caatcctgtg tttgatgatt gcatttggcg gcttcatctt 2700 tggttgggat accggtacca tttctggttt tgttaacctt tctgatttca tcagaaggtt 2760 cggtcaaaaa aatgacaagg gaacctacta cttatcgaaa gtaagaatgg gtttgatcgt 2820 ctcaatattc aacattggct gcgccatagg cggaattgtc ttgtcaaaag tcggtgatat 2880 atatggtcgt cgtattggat tgattacagt tactgccatt tacgttgtag gcatcctaat 2940 ccaaataact tccataaaca agtggtacca atacttcatt ggaagaatta tttctggcct 3000 aggagtggga ggcattgctg tcctttcccc aatgttgata tctgaagttg ctcccaaaca 3060 tatcagagga actctggtcc aattgtacca gctgatgggt acgatgggta tttttctagg 3120 atactgtacc aattacggta ccaagaacta tcacaacgcc actcaatgga gagtcggcct 3180 tggtctttgc tttgcctggg ctacattcat ggttagtgga atgatgtttg taccagaatc 3240 accacgttac ctgattgagg ttggtaaaga tgaggaagcg aaacgttcac tatcgaaatc 3300 caacaaagtc tcagttgacg atccagcctt gctagttgaa tatgacacta taaaggcagg 3360 aattgaactt gaaaagctgg caggtaacgc atcatggtct gaactactct ccactaaaac 3420 aaaggtcttt cagcgtgttc tcatgggagt gatgatccaa tcgctgcagc aattaaccgg 3480 tgacaactac ttcttttact acggtaccac catcttcaaa tctgtcggtc taaaggactc 3540 ctttcagact tcgatcatta tcggtgtggt taattttttc tcttcattca tagcggtata 3600 caccattgag aggtttggac gccgtacgtg tctattgtgg ggtgctgctt ctatgctatg 3660 ctgctttgct gtgtttgcct ccgtcggtgt gacaaagttg tggcctcaag gaagcagtca 3720 ccaagacatt acttctcagg gcgccggtaa ctgtatgatt gtgtttacta tgttcttcat 3780 tttttcgttc gccaccactt gggcaggcgg ctgttacgtt attgtctcag agacgtttcc 3840 tcttagggtc aaatcaagag gaatggcaat cgcaacagct gcaaactgga tgtggggttt 3900 cctgattagt ttctttaccc cattcattac cggggcaatc aacttttact acggttacgt 3960 attcttaggc tgtctggttt ttgcatactt ttatgtcttt ttctttgtcc cagaaacaaa 4020 aggcctgaca ctggaggagg tgaatactat gtggctggaa ggtgtgccag catggaaatc 4080 ggcctcatgg gtgccaccgg agagaagaac cgcagattac gatgctgatg caatagatca 4140 tgacaataga ccaatttaca agaggttctt ttccagctga cccgggatgg tgagcaaggg 4200 cgaggagctg ttcaccgggg tggtgcccat cctggtcgag ctggacggcg acgtaaacgg 4260 ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc acctacggca agctgaccct 4320 gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg cccaccctcg tgaccaccct 4380 gacctacggc gtgcagtgct tcagccgcta ccccgaccac atgaagcagc acgacttctt 4440 caagtccgcc atgcccgaag gctacgtcca ggagcgcacc atcttcttca aggacgacgg 4500 caactacaag acccgcgccg aggtgaagtt cgagggcgac accctggtga accgcatcga 4560 gctgaagggc atcgacttca aggaggacgg caacatcctg gggcacaagc tggagtacaa 4620 ctacaacagc cacaacgtct atatcatggc cgacaagcag aagaacggca tcaaggtgaa 4680 cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag ctcgccgacc actaccagca 4740 gaacaccccc atcggcgacg gccccgtgct gctgcccgac aaccactacc tgagcaccca 4800 gtccgccctg agcaaagatc ccaacgagaa gcgcgatcac atggtcctgc tggagttcgt 4860 gaccgccgcc gggatcactc tcggcatgga cgagctgtac aagtaaatcg attttgcgaa 4920 cacttttatt aattcatgat cacgctctaa tttgtgcatt tgaaatgtac tctaattcta 4980 attttatatt tttaatgata tcttgaaaag taaatacgtt tttaatatat acaaaataat 5040 acagtttaat tttcaagttt ttgatcattt gttctcagaa agttgagtgg gacggagaca 5100 aagaaacttt aaagagaaat gcaaagtggg aagaagtcag ttgtttaccg accgcactgt 5160 tattcacaaa tattccaatt ttgcctgcag acccacgtct acaaattttg gttagtttgg 5220 taaatggtaa ggatatagta gagccttttt gaaatgggaa atatcttctt tttctgtatc 5280 ccgcttcaaa aagtgtctaa tgagtcagtt atttctttct tactcatcgc ccgtcactta 5340 aaagaagaaa aattactttc atgatgcgaa gcgaaaaaaa tttttagctt caattttcac 5400 aatgcatcta tggagaggat attataaggt tacgaaataa attcttgagt gttgtaaatt 5460 ctgttaatca aagaaaaagc aatagctcgt ttttctacag aatggctagc acagcaaata 5520 tgatttctca actaaagaaa ctatctatcg cggaacctgc ggttgccaag gattctcatc 5580 ctgatgtaaa tatcgtggat ttgatgagaa attacatttc acaagaatta agcaagattt 5640 ccggcgtaga ctcgtctctt atttttccag cattagaatg gacaaatact atggagagag 5700 gcgatttgtt gattcctatc ccaagattga gaatcaaagg tgccaatcca aaggatttgg 5760 cagtccaatg ggctgaaaaa tttccatgtg gagatttctt ggagaaagtt gaagcgaatg 5820 gcccgttcat ccagtttttc ttcaaccctc aatttttagc aaaacttgtc atcccagata 5880 tcttaaccag aaaggaggat tatggttctt gcgtcgacct cgaggggggg cccggtaccc 5940 agcttttgtt ccctttagtg agggttaatt ccgagcttgg cgtaatcatg gtcatagctg 6000 tttcctgtgt gaaattgtta tccgctcaca attccacaca acataggagc cggaagcata 6060 aagtgtaaag cctggggtgc ctaatgagtg aggtaactca cattaattgc gttgcgctca 6120 ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc attaatgaat cggccaacgc 6180 gcggggagag gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg 6240 cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta 6300 tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc 6360 aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctcggccc ccctgacgag 6420 catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac 6480 caggcgttcc cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc 6540 ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcaatg ctcacgctgt 6600 aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc 6660 gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga 6720 cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta 6780 ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta 6840 tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga 6900 tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg 6960 cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag 7020 tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc 7080 tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact 7140 tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt 7200 cgttcatcca tagttgcctg actgcccgtc gtgtagataa ctacgatacg ggagggctta 7260 ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta 7320 tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc 7380 gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat 7440 agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt 7500 atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg 7560 tgaaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca 7620 gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta 7680 agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg 7740 cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact 7800 ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg 7860 ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt 7920 actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga 7980 ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc 8040 atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa 8100 caaatagggg ttccgcgcac atttccccga aaagtgccac ctgggtcctt ttcatcacgt 8160 gctataaaaa taattataat ttaaattttt taatataaat atataaatta aaaatagaaa 8220 gtaaaaaaag aaattaaaga aaaaatagtt tttgttttcc gaagatgtaa aagactctag 8280 ggggatcgcc aacaaatact accttttatc ttgctcttcc tgctctcagg tattaatgcc 8340 gaattgtttc atcttgtctg tgtagaagac cacacacgaa aatcctgtga ttttacattt 8400 tacttatcgt taatcgaatg tatatctatt taatctgctt ttcttgtcta ataaatatat 8460 atgtaaagta cgctttttgt tgaaattttt taaacctttg tttatttttt tttcttcatt 8520 ccgtaactct tctaccttct ttatttactt tctaaaatcc aaatacaaaa cataaaaata 8580 aataaacaca gagtaaattc ccaaattatt ccatcattaa aagatacgag gcgcgtgtaa 8640 gttacaggca agcgatccgt cctaagaaac cattattatc atgacattaa cctataaaaa 8700 taggcgtatc acgaggccct ttcgtc 8726 <210> 119 <211> 1704 <212> DNA <213> Saccharomyces cerevisiae <220> <221> source <222> 1..1704 <223> /organism="Saccharomyces cerevisiae" /note="HXT11 ORF RN1053" /mol_type="unassigned DNA" <400> 119 atgtcaggtg ttaataatac atccgcaaat gagttatcta ctaccatgtc taactctaac 60 tcagcagtag gcgctccctc tgttaagact gaacacggtg actctaaaaa ttcccttaac 120 ctagatgcca atgagccacc tattgactta cctcaaaaac ccctctctgc gtataccacc 180 gtcgcaatcc tgtgtttgat gattgcattt ggcggcttca tctttggttg ggataccggt 240 accatttctg gttttgttaa cctttctgat ttcatcagaa ggttcggtca aaaaaatgac 300 aagggaacct actacttatc gaaagtaaga atgggtttga tcgtctcaat attcaacatt 360 ggctgcgcca taggcggaat tgtcttgtca aaagtcggtg atatatatgg tcgtcgtatt 420 ggattgatta cagttactgc catttacgtt gtaggcatcc taatccaaat aacttccata 480 aacaagtggt accaatactt cattggaaga attatttctg gcctaggagt gggaggcatt 540 gctgtccttt ccccaatgtt gatatctgaa gttgctccca aacatatcag aggaactctg 600 gtccaattgt accagctgat gggtacgatg ggtatttttc taggatactg taccaattac 660 ggtaccaaga actatcacaa cgccactcaa tggagagtcg gccttggtct ttgctttgcc 720 tgggctacat tcatggttag tggaatgatg tttgtaccag aatcaccacg ttacctgatt 780 gaggttggta aagatgagga agcgaaacgt tcactatcga aatccaacaa agtctcagtt 840 gacgatccag ccttgctagt tgaatatgac actataaagg caggaattga acttgaaaag 900 ctggcaggta acgcatcatg gtctgaacta ctctccacta aaacaaaggt ctttcagcgt 960 gttctcatgg gagtgatgat ccaatcgctg cagcaattaa ccggtgacaa ctacttcttt 1020 tactacggta ccaccatctt caaatctgtc ggtctaaagg actcctttca gacttcgatc 1080 attatcggtg tggttaattt tttctcttca ttcatagcgg tatacaccat tgagaggttt 1140 ggacgccgta cgtgtctatt gtggggtgct gcttctatgc tatgctgctt tgctgtgttt 1200 gcctccgtcg gtgtgacaaa gttgtggcct caaggaagca gtcaccaaga cattacttct 1260 cagggcgccg gtaactgtat gattgtgttt actatgttct tcattttttc gttcgccacc 1320 acttgggcag gcggctgtta cgttattgtc tcagagacgt ttcctcttag ggtcaaatca 1380 agaggaatgg caatcgcaac agctgcaaac tggatgtggg gtttcctgat tagtttcttt 1440 accccattca ttaccggggc aatcaacttt tactacggtt acgtattctt aggctgtctg 1500 gtttttgcat acttttatgt ctttttcttt gtcccagaaa caaaaggcct gacactggag 1560 gaggtgaata ctatgtggct ggaaggtgtg ccagcatgga aatcggcctc atgggtgcca 1620 ccggagagaa gaaccgcaga ttacgatgct gatgcaatag atcatgacaa tagaccaatt 1680 tacaagaggt tcttttccag ctga 1704 <210> 120 <211> 1626 <212> DNA <213> Saccharomyces cerevisiae <220> <221> source <222> 1..1626 <223> /organism="Saccharomyces cerevisiae" /note="HXT2 ORF" /mol_type="unassigned DNA" <400> 120 atgtctgaat tcgctactag ccgcgttgaa agtggctctc aacaaacttc tatccactct 60 actccgatag tgcagaaatt agagacggat gaatctccta ttcaaaccaa atctgaatac 120 actaacgctg aactcccagc aaagccaatc gccgcatatt ggactgttat ctgtttatgt 180 ctaatgattg catttggtgg gtttgtcttt ggttgggata ctggtaccat ctctggtttt 240 gttaatcaaa ccgatttcaa aagaagattt ggtcaaatga aatctgatgg tacctattat 300 ctttcggacg tccggactgg tttgatcgtt ggtatcttca atattggttg tgcctttggt 360 gggttaacct taggacgtct gggtgatatg tatggacgta gaattggttt gatgtgcgtc 420 gttctggtat acatcgttgg tattgtgatt caaattgctt ctagtgacaa atggtaccaa 480 tatttcattg gtagaattat ctctggtatg ggtgtcggtg gtattgctgt cctatctcca 540 actttgattt ccgaaacagc accaaaacac attagaggta cctgtgtttc tttctatcag 600 ttaatgatca ctctaggtat tttcttaggt tactgtacca actatggtac taaagactac 660 tccaattcag ttcaatggag agtgcctttg ggtttgaact ttgccttcgc tattttcatg 720 atcgctggta tgctaatggt tccagaatct ccaagattct tagtcgaaaa aggcagatac 780 gaagacgcta aacgttcttt ggcaaaatct aacaaagtca ccattgaaga tccaagtatt 840 gttgctgaaa tggatacaat tatggccaac gttgaaactg aaagattagc cggtaacgct 900 tcttggggtg agttattctc caacaaaggt gctattttac ctcgtgtgat tatgggtatt 960 atgattcaat ccttacaaca attaactggt aacaattact tcttctatta tggtactact 1020 attttcaacg ccgtcggtat gaaagattct ttccaaactt ccatcgtttt aggtatagtc 1080 aacttcgcat ccactttcgt ggccttatac actgttgata aatttggtcg tcgtaagtgt 1140 ctattgggtg gttctgcttc catggccatt tgttttgtta tcttctctac tgtcggtgtc 1200 acaagcttat atccaaatgg taaagatcaa ccatcttcca aggctgccgg taacgtcatg 1260 attgtcttta cctgtttatt cattttcttc ttcgctatta gttgggcccc aattgcctac 1320 gttattgttg ccgaatccta tcctttgcgt gtcaaaaatc gtgctatggc tattgctgtt 1380 ggtgccaact ggatttgggg tttcttgatt ggtttcttca ctcccttcat tacaagtgca 1440 attggatttt catacgggta tgtcttcatg ggctgtttgg tattttcatt cttctacgtg 1500 tttttctttg tctgtgaaac caagggctta acattagagg aagttaatga aatgtatgtt 1560 gaaggtgtca aaccatggaa atctggtagc tggatctcaa aagaaaaaag agtttccgag 1620 gaataa 1626 <210> 121 <211> 1725 <212> DNA <213> Saccharomyces cerevisiae <220> <221> source <222> 1..1725 <223> /organism="Saccharomyces cerevisiae" /note="GAL2 ORF" /mol_type="unassigned DNA" <400> 121 atggcagttg aggagaacaa tatgcctgtt gtttcacagc aaccccaagc tggtgaagac 60 gtgatctctt cactcagtaa agattcccat ttaagcgcac aatctcaaaa gtattccaat 120 gatgaattga aagccggtga gtcagggcct gaaggctccc aaagtgttcc tatagagata 180 cccaagaagc ccatgtctga atatgttacc gtttccttgc tttgtttgtg tgttgccttc 240 ggcggcttca tgtttggctg ggataccggt actatttctg ggtttgttgt ccaaacagac 300 tttttgagaa ggtttggtat gaaacataag gatggtaccc actatttgtc aaacgtcaga 360 acaggtttaa tcgtcgccat tttcaatatt ggctgtgcct ttggtggtat tatactttcc 420 aaaggtggag atatgtatgg ccgtaaaaag ggtctttcga ttgtcgtctc ggtttatata 480 gttggtatta tcattcaaat tgcctctatc aacaagtggt accaatattt cattggtaga 540 atcatatctg gtttgggtgt cggcggcatc gccgtcttat gtcctatgtt gatctctgaa 600 attgctccaa agcacttgag aggcacacta gtttcttgtt atcagctgat gattactgca 660 ggtatctttt tgggctactg tactaattac ggtacaaaga gctattcgaa ctcagttcaa 720 tggagagttc cattagggct atgtttcgct tggtcattat ttatgattgg cgctttgacg 780 ttagttcctg aatccccacg ttatttatgt gaggtgaata aggtagaaga cgccaagctt 840 tccattgcta agtctaacaa ggtgtcacca gaggatcctg ccgtccaggc agagttagat 900 ctgatcatgg ccggtataga agctgaaaaa ctggctggca atgcgtcctg gggggaatta 960 ttttccacca agaccaaagt atttcaacgt ttgttgatgg gtgtatttgt tcaaatgttc 1020 caacaattaa ccggtaacaa ttattttttc tactacggta ccgttatttt caagtcagtt 1080 ggcctggatg attcctttga aacatccatt gtcattggtg tagtcaactt tgcctccact 1140 ttctttagtt tgtggactgt cgaaaacttg gggcgtcgta aatgtttact tttgggcgct 1200 gccactatga tggcttgtat ggtcatctac gcctctgttg gtgttaccag attatatcct 1260 cacggtaaaa gccagccatc ttctaaaggt gccggtaact gtatgattgt ctttacctgt 1320 ttttatattt tctgttatgc cacaacctgg gcgccagttg cctgggtcat cacagcagaa 1380 tcattcccac tgagagtcaa gtcgaaatgt atggcgttgg cctctgcttc caattgggta 1440 tgggggttct tgattgcatt tttcacccca ttcatcacat ctgccattaa cttctactac 1500 ggttatgtct tcatgggctg tttggttgcc atgttttttt atgtcttttt ctttgttcca 1560 gaaactaaag gcctatcgtt agaagaaatt caagaattat gggaagaagg tgttttacct 1620 tggaaatctg aaggctggat tccttcatcc agaagaggta ataattacga tttagaggat 1680 ttacaacatg acgacaaacc gtggtacaag gccatgctag aataa 1725 <210> 122 <211> 1704 <212> DNA <213> Saccharomyces cerevisiae <220> <221> source <222> 1..1704 <223> /organism="Saccharomyces cerevisiae" /note="HXT3-6 ORF" /mol_type="unassigned DNA" <400> 122 atgaattcaa ctccagattt aatatctcca caaaagtcaa gtgagaattc gaatgctgac 60 ctgccttcga atagctctca ggtaatgaac atgcctgaag aaaaaggtgt tcaagatgat 120 ttccaagctg aggccgacca agtacttacc aacccaaata caggtaaagg tgcatatgtc 180 actgtgtcta tctgttgtgt tatggttgcc ttcggtggtt tcgttttcgg ttgggatact 240 ggtaccattt ctggtttcgt cgcccaaact gatttcttga gaagattcgg tatgaagcat 300 aaagatggta gttattattt gtctaaggtt agaactggtt taattgtctc cattttcaac 360 attggttgtg ccattggtgg tattattttg gctaaattgg gtgatatgta cggtcgtaaa 420 atgggtttga ttgtcgttgt tgttatctac atcatcggta ttattattca aattgcatcc 480 atcaacaaat ggtaccaata tttcatcggt agaattattt ccggtttggg tgttggtggt 540 attgccgttt tatctcctat gttgatttct gaagtcgctc ctaaggaaat gagaggtact 600 ttagtctcct gttaccaact gatgattacc ttgggtattt tcttgggtta ctgtaccaac 660 ttcggtacta agaactactc caactctgtg caatggagag ttccattagg tttgtgtttt 720 gcctgggctt tgtttatgat cggtggtatg actttcgttc cagaatcccc acgttatttg 780 gttgaagctg gtcaaattga cgaagcaaga gcatctcttt ccaaagttaa caaggttgcc 840 ccagaccatc cattcattca acaagagttg gaagttattg aagctagtgt tgaagaagct 900 agagctgctg gttcagcatc atggggtgag ttgttcactg gtaagccggc catgtttaag 960 cgtactatga tgggtatcat gatccaatct ctacaacaat tgactggtga taactatttc 1020 ttctactatg gtactaccgt ttttaacgct gttggtatga gtgattcttt cgaaacttct 1080 attgttttcg gtgtcgtcaa cttcttctct acttgttgtt ctttgtacac tgtcgatcgt 1140 tttggacgtc gtaactgttt gttatatggt gccattggta tggtctgctg ttatgtagtt 1200 tacgcttctg ttggtgtcac cagactatgg ccaaatggtg aaggtaatgg ttcatccaag 1260 ggtgctggta actgtatgat tgtctttgcc tgtttctata ttttctgttt tgctactaca 1320 tgggctccaa ttccttatgt cgttgtttct gaaactttcc cattgagagt caagtctaag 1380 gctatgtcta ttgctacagc tgctaattgg ttgtggggtt tcttgattgg tttcttcact 1440 ccatttatta ctggtgctat taacttctac tacggttacg ttttcatggg ctgtttggtc 1500 ttcatgttct tctatgtttt gttagttgtt ccagaaacta agggtttgac tttggaagaa 1560 gtcaacacca tgtgggaaga aggtgttcta ccatggaagt ctgcctcatg ggttccacca 1620 tctagaagag gtgccaacta cgacgctgaa gaaatggctc acgatgataa gccattgtac 1680 aagagaatgt tcagcaccaa ataa 1704 <210> 123 <211> 567 <212> PRT <213> Saccharomyces cerevisiae <220> <223> Hxt11p <400> 123 Met Ser Gly Val Asn Asn Thr Ser Ala Asn Glu Leu Ser Thr Thr Met 1 5 10 15 Ser Asn Ser Asn Ser Ala Val Gly Ala Pro Ser Val Lys Thr Glu His 20 25 30 Gly Asp Ser Lys Asn Ser Leu Asn Leu Asp Ala Asn Glu Pro Pro Ile 35 40 45 Asp Leu Pro Gln Lys Pro Leu Ser Ala Tyr Thr Thr Val Ala Ile Leu 50 55 60 Cys Leu Met Ile Ala Phe Gly Gly Phe Ile Phe Gly Trp Asp Thr Gly 65 70 75 80 Thr Ile Ser Gly Phe Val Asn Leu Ser Asp Phe Ile Arg Arg Phe Gly 85 90 95 Gln Lys Asn Asp Lys Gly Thr Tyr Tyr Leu Ser Lys Val Arg Met Gly 100 105 110 Leu Ile Val Ser Ile Phe Asn Ile Gly Cys Ala Ile Gly Gly Ile Val 115 120 125 Leu Ser Lys Val Gly Asp Ile Tyr Gly Arg Arg Ile Gly Leu Ile Thr 130 135 140 Val Thr Ala Ile Tyr Val Val Gly Ile Leu Ile Gln Ile Thr Ser Ile 145 150 155 160 Asn Lys Trp Tyr Gln Tyr Phe Ile Gly Arg Ile Ile Ser Gly Leu Gly 165 170 175 Val Gly Gly Ile Ala Val Leu Ser Pro Met Leu Ile Ser Glu Val Ala 180 185 190 Pro Lys His Ile Arg Gly Thr Leu Val Gln Leu Tyr Gln Leu Met Gly 195 200 205 Thr Met Gly Ile Phe Leu Gly Tyr Cys Thr Asn Tyr Gly Thr Lys Asn 210 215 220 Tyr His Asn Ala Thr Gln Trp Arg Val Gly Leu Gly Leu Cys Phe Ala 225 230 235 240 Trp Ala Thr Phe Met Val Ser Gly Met Met Phe Val Pro Glu Ser Pro 245 250 255 Arg Tyr Leu Ile Glu Val Gly Lys Asp Glu Glu Ala Lys Arg Ser Leu 260 265 270 Ser Lys Ser Asn Lys Val Ser Val Asp Asp Pro Ala Leu Leu Val Glu 275 280 285 Tyr Asp Thr Ile Lys Ala Gly Ile Glu Leu Glu Lys Leu Ala Gly Asn 290 295 300 Ala Ser Trp Ser Glu Leu Leu Ser Thr Lys Thr Lys Val Phe Gln Arg 305 310 315 320 Val Leu Met Gly Val Met Ile Gln Ser Leu Gln Gln Leu Thr Gly Asp 325 330 335 Asn Tyr Phe Phe Tyr Tyr Gly Thr Thr Ile Phe Lys Ser Val Gly Leu 340 345 350 Lys Asp Ser Phe Gln Thr Ser Ile Ile Ile Gly Val Val Asn Phe Phe 355 360 365 Ser Ser Phe Ile Ala Val Tyr Thr Ile Glu Arg Phe Gly Arg Arg Thr 370 375 380 Cys Leu Leu Trp Gly Ala Ala Ser Met Leu Cys Cys Phe Ala Val Phe 385 390 395 400 Ala Ser Val Gly Val Thr Lys Leu Trp Pro Gln Gly Ser Ser His Gln 405 410 415 Asp Ile Thr Ser Gln Gly Ala Gly Asn Cys Met Ile Val Phe Thr Met 420 425 430 Phe Phe Ile Phe Ser Phe Ala Thr Thr Trp Ala Gly Gly Cys Tyr Val 435 440 445 Ile Val Ser Glu Thr Phe Pro Leu Arg Val Lys Ser Arg Gly Met Ala 450 455 460 Ile Ala Thr Ala Ala Asn Trp Met Trp Gly Phe Leu Ile Ser Phe Phe 465 470 475 480 Thr Pro Phe Ile Thr Gly Ala Ile Asn Phe Tyr Tyr Gly Tyr Val Phe 485 490 495 Leu Gly Cys Leu Val Phe Ala Tyr Phe Tyr Val Phe Phe Phe Val Pro 500 505 510 Glu Thr Lys Gly Leu Thr Leu Glu Glu Val Asn Thr Met Trp Leu Glu 515 520 525 Gly Val Pro Ala Trp Lys Ser Ala Ser Trp Val Pro Pro Glu Arg Arg 530 535 540 Thr Ala Asp Tyr Asp Ala Asp Ala Ile Asp His Asp Asn Arg Pro Ile 545 550 555 560 Tyr Lys Arg Phe Phe Ser Ser 565 <210> 124 <211> 541 <212> PRT <213> Saccharomyces cerevisiae <220> <223> Hxt2p <400> 124 Met Ser Glu Phe Ala Thr Ser Arg Val Glu Ser Gly Ser Gln Gln Thr 1 5 10 15 Ser Ile His Ser Thr Pro Ile Val Gln Lys Leu Glu Thr Asp Glu Ser 20 25 30 Pro Ile Gln Thr Lys Ser Glu Tyr Thr Asn Ala Glu Leu Pro Ala Lys 35 40 45 Pro Ile Ala Ala Tyr Trp Thr Val Ile Cys Leu Cys Leu Met Ile Ala 50 55 60 Phe Gly Gly Phe Val Phe Gly Trp Asp Thr Gly Thr Ile Ser Gly Phe 65 70 75 80 Val Asn Gln Thr Asp Phe Lys Arg Arg Phe Gly Gln Met Lys Ser Asp 85 90 95 Gly Thr Tyr Tyr Leu Ser Asp Val Arg Thr Gly Leu Ile Val Gly Ile 100 105 110 Phe Asn Ile Gly Cys Ala Phe Gly Gly Leu Thr Leu Gly Arg Leu Gly 115 120 125 Asp Met Tyr Gly Arg Arg Ile Gly Leu Met Cys Val Val Leu Val Tyr 130 135 140 Ile Val Gly Ile Val Ile Gln Ile Ala Ser Ser Asp Lys Trp Tyr Gln 145 150 155 160 Tyr Phe Ile Gly Arg Ile Ile Ser Gly Met Gly Val Gly Gly Ile Ala 165 170 175 Val Leu Ser Pro Thr Leu Ile Ser Glu Thr Ala Pro Lys His Ile Arg 180 185 190 Gly Thr Cys Val Ser Phe Tyr Gln Leu Met Ile Thr Leu Gly Ile Phe 195 200 205 Leu Gly Tyr Cys Thr Asn Tyr Gly Thr Lys Asp Tyr Ser Asn Ser Val 210 215 220 Gln Trp Arg Val Pro Leu Gly Leu Asn Phe Ala Phe Ala Ile Phe Met 225 230 235 240 Ile Ala Gly Met Leu Met Val Pro Glu Ser Pro Arg Phe Leu Val Glu 245 250 255 Lys Gly Arg Tyr Glu Asp Ala Lys Arg Ser Leu Ala Lys Ser Asn Lys 260 265 270 Val Thr Ile Glu Asp Pro Ser Ile Val Ala Glu Met Asp Thr Ile Met 275 280 285 Ala Asn Val Glu Thr Glu Arg Leu Ala Gly Asn Ala Ser Trp Gly Glu 290 295 300 Leu Phe Ser Asn Lys Gly Ala Ile Leu Pro Arg Val Ile Met Gly Ile 305 310 315 320 Met Ile Gln Ser Leu Gln Gln Leu Thr Gly Asn Asn Tyr Phe Phe Tyr 325 330 335 Tyr Gly Thr Thr Ile Phe Asn Ala Val Gly Met Lys Asp Ser Phe Gln 340 345 350 Thr Ser Ile Val Leu Gly Ile Val Asn Phe Ala Ser Thr Phe Val Ala 355 360 365 Leu Tyr Thr Val Asp Lys Phe Gly Arg Arg Lys Cys Leu Leu Gly Gly 370 375 380 Ser Ala Ser Met Ala Ile Cys Phe Val Ile Phe Ser Thr Val Gly Val 385 390 395 400 Thr Ser Leu Tyr Pro Asn Gly Lys Asp Gln Pro Ser Ser Lys Ala Ala 405 410 415 Gly Asn Val Met Ile Val Phe Thr Cys Leu Phe Ile Phe Phe Phe Ala 420 425 430 Ile Ser Trp Ala Pro Ile Ala Tyr Val Ile Val Ala Glu Ser Tyr Pro 435 440 445 Leu Arg Val Lys Asn Arg Ala Met Ala Ile Ala Val Gly Ala Asn Trp 450 455 460 Ile Trp Gly Phe Leu Ile Gly Phe Phe Thr Pro Phe Ile Thr Ser Ala 465 470 475 480 Ile Gly Phe Ser Tyr Gly Tyr Val Phe Met Gly Cys Leu Val Phe Ser 485 490 495 Phe Phe Tyr Val Phe Phe Phe Val Cys Glu Thr Lys Gly Leu Thr Leu 500 505 510 Glu Glu Val Asn Glu Met Tyr Val Glu Gly Val Lys Pro Trp Lys Ser 515 520 525 Gly Ser Trp Ile Ser Lys Glu Lys Arg Val Ser Glu Glu 530 535 540 <210> 125 <211> 574 <212> PRT <213> Saccharomyces cerevisiae <220> <223> Gal2p <400> 125 Met Ala Val Glu Glu Asn Asn Met Pro Val Val Ser Gln Gln Pro Gln 1 5 10 15 Ala Gly Glu Asp Val Ile Ser Ser Leu Ser Lys Asp Ser His Leu Ser 20 25 30 Ala Gln Ser Gln Lys Tyr Ser Asn Asp Glu Leu Lys Ala Gly Glu Ser 35 40 45 Gly Ser Glu Gly Ser Gln Ser Val Pro Ile Glu Ile Pro Lys Lys Pro 50 55 60 Met Ser Glu Tyr Val Thr Val Ser Leu Leu Cys Leu Cys Val Ala Phe 65 70 75 80 Gly Gly Phe Met Phe Gly Trp Asp Thr Gly Thr Ile Ser Gly Phe Val 85 90 95 Val Gln Thr Asp Phe Leu Arg Arg Phe Gly Met Lys His Lys Asp Gly 100 105 110 Thr His Tyr Leu Ser Asn Val Arg Thr Gly Leu Ile Val Ala Ile Phe 115 120 125 Asn Ile Gly Cys Ala Phe Gly Gly Ile Ile Leu Ser Lys Gly Gly Asp 130 135 140 Met Tyr Gly Arg Lys Lys Gly Leu Ser Ile Val Val Ser Val Tyr Ile 145 150 155 160 Val Gly Ile Ile Ile Gln Ile Ala Ser Ile Asn Lys Trp Tyr Gln Tyr 165 170 175 Phe Ile Gly Arg Ile Ile Ser Gly Leu Gly Val Gly Gly Ile Ala Val 180 185 190 Leu Cys Pro Met Leu Ile Ser Glu Ile Ala Pro Lys His Leu Arg Gly 195 200 205 Thr Leu Val Ser Cys Tyr Gln Leu Met Ile Thr Ala Gly Ile Phe Leu 210 215 220 Gly Tyr Cys Thr Asn Tyr Gly Thr Lys Ser Tyr Ser Asn Ser Val Gln 225 230 235 240 Trp Arg Val Pro Leu Gly Leu Cys Phe Ala Trp Ser Leu Phe Met Ile 245 250 255 Gly Ala Leu Thr Leu Val Pro Glu Ser Pro Arg Tyr Leu Cys Glu Val 260 265 270 Asn Lys Val Glu Asp Ala Lys Arg Ser Ile Ala Lys Ser Asn Lys Val 275 280 285 Ser Pro Glu Asp Pro Ala Val Gln Ala Glu Leu Asp Leu Ile Met Ala 290 295 300 Gly Ile Glu Ala Glu Lys Leu Ala Gly Asn Ala Ser Trp Gly Glu Leu 305 310 315 320 Phe Ser Thr Lys Thr Lys Val Phe Gln Arg Leu Leu Met Gly Val Phe 325 330 335 Val Gln Met Phe Gln Gln Leu Thr Gly Asn Asn Tyr Phe Phe Tyr Tyr 340 345 350 Gly Thr Val Ile Phe Lys Ser Val Gly Leu Asp Asp Ser Phe Glu Thr 355 360 365 Ser Ile Val Ile Gly Val Val Asn Phe Ala Ser Thr Phe Phe Ser Leu 370 375 380 Trp Thr Val Glu Asn Leu Gly His Arg Lys Cys Leu Leu Leu Gly Ala 385 390 395 400 Ala Thr Met Met Ala Cys Met Val Ile Tyr Ala Ser Val Gly Val Thr 405 410 415 Arg Leu Tyr Pro His Gly Lys Ser Gln Pro Ser Ser Lys Gly Ala Gly 420 425 430 Asn Cys Met Ile Val Phe Thr Cys Phe Tyr Ile Phe Cys Tyr Ala Thr 435 440 445 Thr Trp Ala Pro Val Ala Trp Val Ile Thr Ala Glu Ser Phe Pro Leu 450 455 460 Arg Val Lys Ser Lys Cys Met Ala Leu Ala Ser Ala Ser Asn Trp Val 465 470 475 480 Trp Gly Phe Leu Ile Ala Phe Phe Thr Pro Phe Ile Thr Ser Ala Ile 485 490 495 Asn Phe Tyr Tyr Gly Tyr Val Phe Met Gly Cys Leu Val Ala Met Phe 500 505 510 Phe Tyr Val Phe Phe Phe Val Pro Glu Thr Lys Gly Leu Ser Leu Glu 515 520 525 Glu Ile Gln Glu Leu Trp Glu Glu Gly Val Leu Pro Trp Lys Ser Glu 530 535 540 Gly Trp Ile Pro Ser Ser Arg Arg Gly Asn Asn Tyr Asp Leu Glu Asp 545 550 555 560 Leu Gln His Asp Asp Lys Pro Trp Tyr Lys Ala Met Leu Glu 565 570 <210> 126 <211> 508 <212> PRT <213> Saccharomyces cerevisiae <220> <223> Hxt3-6p <400> 126 Met Asn Ser Thr Pro Asp Leu Ile Ser Pro Gln Lys Ser Ser Glu Asn 1 5 10 15 Ser Asn Ala Asp Leu Pro Ser Asn Ser Ser Gln Val Met Asn Met Pro 20 25 30 Glu Glu Lys Gly Val Gln Asp Asp Phe Gln Ala Glu Ala Asp Gln Val 35 40 45 Leu Thr Asn Pro Asn Thr Gly Lys Gly Ala Tyr Val Thr Val Ser Ile 50 55 60 Cys Cys Val Met Val Ala Phe Gly Gly Phe Val Phe Gly Trp Asp Thr 65 70 75 80 Gly Thr Ile Ser Gly Phe Val Ala Gln Thr Asp Phe Leu Arg Arg Phe 85 90 95 Gly Met Lys His Lys Asp Gly Ser Tyr Tyr Leu Ser Lys Val Arg Thr 100 105 110 Gly Leu Ile Val Ser Ile Ile Asn Ile Gly Cys Ala Ile Gly Gly Ile 115 120 125 Ile Leu Ala Lys Leu Gly Asp Met Tyr Gly Arg Lys Met Gly Leu Ile 130 135 140 Val Val Val Val Ile Tyr Ile Ile Gly Ile Ile Ile Gln Ile Ala Ser 145 150 155 160 Ile Asn Lys Trp Tyr Gln Tyr Phe Ile Gly Arg Ile Ile Ser Gly Leu 165 170 175 Gly Val Gly Gly Ile Ala Val Leu Ser Pro Met Leu Ile Ser Glu Val 180 185 190 Ala Pro Lys Glu Met Arg Gly Thr Leu Val Ser Cys Tyr Gln Leu Met 195 200 205 Ile Thr Leu Gly Ile Phe Leu Gly Tyr Cys Thr Asn Phe Gly Thr Lys 210 215 220 Asn Tyr Ser Asn Ser Val Gln Trp Arg Val Pro Leu Gly Leu Cys Phe 225 230 235 240 Ala Trp Ala Leu Phe Met Ile Gly Gly Met Thr Phe Val Pro Glu Ser 245 250 255 Pro Arg Tyr Leu Val Glu Ala Gly Gln Ile Asp Glu Ala Arg Ala Ser 260 265 270 Leu Ser Lys Val Asn Lys Val Ala Pro Asp His Pro Phe Ile Gln Gln 275 280 285 Glu Leu Glu Val Ile Glu Ala Ser Val Glu Glu Ala Arg Ala Ala Gly 290 295 300 Ser Ala Ser Trp Gly Glu Leu Phe Thr Gly Lys Pro Ala Met Phe Lys 305 310 315 320 Arg Thr Met Met Gly Ile Met Ile Gln Ser Leu Gln Gln Leu Thr Gly 325 330 335 Asp Asn Tyr Phe Phe Tyr Tyr Gly Thr Thr Val Phe Asn Ala Val Gly 340 345 350 Met Ser Asp Ser Phe Glu Thr Ser Ile Val Phe Gly Val Val Asn Phe 355 360 365 Phe Ser Thr Cys Cys Ser Leu Tyr Thr Val Asp Arg Phe Gly Arg Arg 370 375 380 Asn Cys Leu Leu Tyr Gly Ala Ile Gly Met Val Cys Cys Tyr Val Val 385 390 395 400 Tyr Ala Ser Val Gly Val Thr Arg Leu Trp Pro Asn Gly Glu Gly Asn 405 410 415 Gly Ser Ser Lys Gly Ala Gly Asn Cys Met Ile Cys Phe Ala Cys Phe 420 425 430 Tyr Ile Phe Cys Phe Ala Thr Thr Trp Ala Pro Ile Ala Tyr Val Val 435 440 445 Ile Ser Glu Thr Phe Pro Leu Arg Val Lys Ser Lys Ala Met Ser Ile 450 455 460 Ala Thr Ala Ala Asn Trp Leu Trp Gly Phe Leu Ile Gly Phe Phe Thr 465 470 475 480 Pro Phe Ile Thr Gly Ala Ile Asn Phe Tyr Tyr Gly Tyr Val Phe Met 485 490 495 Gly Cys Gln Glu Gln Thr Ser Ser Thr Cys Leu Phe 500 505 <210> 127 <211> 38 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..38 <223> /organism="Artificial Sequence" /note="primer F HXT36 Bcui" /mol_type="unassigned DNA" <400> 127 gcatactagt atgaattcaa ctccagattt aatatctc 38 <210> 128 <211> 30 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..30 <223> /organism="Artificial Sequence" /note="primer R HXT36 367NNN" /mol_type="unassigned DNA" <400> 128 caacaagtag agaagaannn gacgacaccg 30 <210> 129 <211> 30 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..30 <223> /organism="Artificial Sequence" /note="primer F HXT36 367NNN" /mol_type="unassigned DNA" <400> 129 cggtgtcgtc nnnttcttct ctacttgttg 30 <210> 130 <211> 36 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..36 <223> /organism="Artificial Sequence" /note="primer R HXT36 BamHi" /mol_type="unassigned DNA" <400> 130 acgtggatcc ttatttggtg ctgaacattc tcttgt 36 <210> 131 <211> 35 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..35 <223> /organism="Artificial Sequence" /note="primer R HXT36 BamHI-stop" /mol_type="unassigned DNA" <400> 131 ccatggatcc tttggtgctg aacattctct tgtac 35 <210> 132 <211> 31 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..31 <223> /organism="Artificial Sequence" /note="primer F GFP BamHI" /mol_type="unassigned DNA" <400> 132 aaaggatcca tggtgagcaa gggcgaggag c 31 <210> 133 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..28 <223> /organism="Artificial Sequence" /note="primer R GFP ClaI" /mol_type="unassigned DNA" <400> 133 aaaatcgatt tacttgtaca gctcgtcc 28 <210> 134 <211> 36 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..36 <223> /organism="Artificial Sequence" /note="F HXT11 XbaI" /mol_type="unassigned DNA" <400> 134 ggcctctaga atgtcaggtg ttaataatac atccgc 36 <210> 135 <211> 39 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..39 <223> /organism="Artificial Sequence" /note="R HXT11 BamHI" /mol_type="unassigned DNA" <400> 135 cgatggatcc tcagctggaa aagaacctct tgtaaattg 39 <210> 136 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..28 <223> /organism="Artificial Sequence" /note="F HXT11 366NNN" /mol_type="unassigned DNA" <400> 136 cggtgtggtt nnntttttct cttcattc 28 <210> 137 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..28 <223> /organism="Artificial Sequence" /note="R HXT11 366NNN" /mol_type="unassigned DNA" <400> 137 gaatgaagag aaaaannnaa ccacaccg 28 <210> 138 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..28 <223> /organism="Artificial Sequence" /note="F HXT11 N366F" /mol_type="unassigned DNA" <400> 138 cggtgtggtt ttttttttct cttcattc 28 <210> 139 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..28 <223> /organism="Artificial Sequence" /note="R HXT11 N366F" /mol_type="unassigned DNA" <400> 139 gaatgaagag aaaaaaaaaa ccacaccg 28 <210> 140 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..28 <223> /organism="Artificial Sequence" /note="F HXT11 N366E" /mol_type="unassigned DNA" <400> 140 cggtgtggtt gagtttttct cttcattc 28 <210> 141 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..28 <223> /organism="Artificial Sequence" /note="R HXT11 N366E" /mol_type="unassigned DNA" <400> 141 gaatgaagag aaaaactcaa ccacaccg 28 <210> 142 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..28 <223> /organism="Artificial Sequence" /note="F HXT11 N366K" /mol_type="unassigned DNA" <400> 142 cggtgtggtt aaatttttct cttcattc 28 <210> 143 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..28 <223> /organism="Artificial Sequence" /note="R HXT11 N366K " /mol_type="unassigned DNA" <400> 143 gaatgaagag aaaaatttaa ccacaccg 28 <210> 144 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..28 <223> /organism="Artificial Sequence" /note="F HXT11 N366M" /mol_type="unassigned DNA" <400> 144 cggtgtggtt atgtttttct cttcattc 28 <210> 145 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..28 <223> /organism="Artificial Sequence" /note="R HXT11 N366M" /mol_type="unassigned DNA" <400> 145 gaatgaagag aaaaacataa ccacaccg 28 <210> 146 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..28 <223> /organism="Artificial Sequence" /note="F HXT11 N366W" /mol_type="unassigned DNA" <400> 146 cggtgtggtt tggtttttct cttcattc 28 <210> 147 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..28 <223> /organism="Artificial Sequence" /note="R HXT11 N366W" /mol_type="unassigned DNA" <400> 147 gaatgaagag aaaaaccaaa ccacaccg 28 <210> 148 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..28 <223> /organism="Artificial Sequence" /note="F HXT11 N366Y" /mol_type="unassigned DNA" <400> 148 cggtgtggtt tattttttct cttcattc 28 <210> 149 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..28 <223> /organism="Artificial Sequence" /note="R HXT11 N366Y" /mol_type="unassigned DNA" <400> 149 gaatgaagag aaaaaataaa ccacaccg 28 <210> 150 <211> 574 <212> PRT <213> Saccharomyces cerevisiae <220> <223> Gal2 (Fig. 10) <400> 150 Met Ala Val Glu Glu Asn Asn Met Pro Val Val Ser Gln Gln Pro Gln 1 5 10 15 Ala Gly Glu Asp Val Ile Ser Ser Leu Ser Lys Asp Ser His Leu Ser 20 25 30 Ala Gln Ser Gln Lys Tyr Ser Asn Asp Glu Leu Lys Ala Gly Glu Ser 35 40 45 Gly Ser Glu Gly Ser Gln Ser Val Pro Ile Glu Ile Pro Lys Lys Pro 50 55 60 Met Ser Glu Tyr Val Thr Val Ser Leu Leu Cys Leu Cys Val Ala Phe 65 70 75 80 Gly Gly Phe Met Phe Gly Trp Asp Thr Gly Thr Ile Ser Gly Phe Val 85 90 95 Val Gln Thr Asp Phe Leu Arg Arg Phe Gly Met Lys His Lys Asp Gly 100 105 110 Thr His Tyr Leu Ser Asn Val Arg Thr Gly Leu Ile Val Ala Ile Phe 115 120 125 Asn Ile Gly Cys Ala Phe Gly Gly Ile Ile Leu Ser Lys Gly Gly Asp 130 135 140 Met Tyr Gly Arg Lys Lys Gly Leu Ser Ile Val Val Ser Val Tyr Ile 145 150 155 160 Val Gly Ile Ile Ile Gln Ile Ala Ser Ile Asn Lys Trp Tyr Gln Tyr 165 170 175 Phe Ile Gly Arg Ile Ile Ser Gly Leu Gly Val Gly Gly Ile Ala Val 180 185 190 Leu Cys Pro Met Leu Ile Ser Glu Ile Ala Pro Lys His Leu Arg Gly 195 200 205 Thr Leu Val Ser Cys Tyr Gln Leu Met Ile Thr Ala Gly Ile Phe Leu 210 215 220 Gly Tyr Cys Thr Asn Tyr Gly Thr Lys Ser Tyr Ser Asn Ser Val Gln 225 230 235 240 Trp Arg Val Pro Leu Gly Leu Cys Phe Ala Trp Ser Leu Phe Met Ile 245 250 255 Gly Ala Leu Thr Leu Val Pro Glu Ser Pro Arg Tyr Leu Cys Glu Val 260 265 270 Asn Lys Val Glu Asp Ala Lys Arg Ser Ile Ala Lys Ser Asn Lys Val 275 280 285 Ser Pro Glu Asp Pro Ala Val Gln Ala Glu Leu Asp Leu Ile Met Ala 290 295 300 Gly Ile Glu Ala Glu Lys Leu Ala Gly Asn Ala Ser Trp Gly Glu Leu 305 310 315 320 Phe Ser Thr Lys Thr Lys Val Phe Gln Arg Leu Leu Met Gly Val Phe 325 330 335 Val Gln Met Phe Gln Gln Leu Thr Gly Asn Asn Tyr Phe Phe Tyr Tyr 340 345 350 Gly Thr Val Ile Phe Lys Ser Val Gly Leu Asp Asp Ser Phe Glu Thr 355 360 365 Ser Ile Val Ile Gly Val Val Asn Phe Ala Ser Thr Phe Phe Ser Leu 370 375 380 Trp Thr Val Glu Asn Leu Gly His Arg Lys Cys Leu Leu Leu Gly Ala 385 390 395 400 Ala Thr Met Met Ala Cys Met Val Ile Tyr Ala Ser Val Gly Val Thr 405 410 415 Arg Leu Tyr Pro His Gly Lys Ser Gln Pro Ser Ser Lys Gly Ala Gly 420 425 430 Asn Cys Met Ile Val Phe Thr Cys Phe Tyr Ile Phe Cys Tyr Ala Thr 435 440 445 Thr Trp Ala Pro Val Ala Trp Val Ile Thr Ala Glu Ser Phe Pro Leu 450 455 460 Arg Val Lys Ser Lys Cys Met Ala Leu Ala Ser Ala Ser Asn Trp Val 465 470 475 480 Trp Gly Phe Leu Ile Ala Phe Phe Thr Pro Phe Ile Thr Ser Ala Ile 485 490 495 Asn Phe Tyr Tyr Gly Tyr Val Phe Met Gly Cys Leu Val Ala Met Phe 500 505 510 Phe Tyr Val Phe Phe Phe Val Pro Glu Thr Lys Gly Leu Ser Leu Glu 515 520 525 Glu Ile Gln Glu Leu Trp Glu Glu Gly Val Leu Pro Trp Lys Ser Glu 530 535 540 Gly Trp Ile Pro Ser Ser Arg Arg Gly Asn Asn Tyr Asp Leu Glu Asp 545 550 555 560 Leu Gln His Asp Asp Lys Pro Trp Tyr Lys Ala Met Leu Glu 565 570 <210> 151 <211> 570 <212> PRT <213> Saccharomyces cerevisiae <220> <223> Hxt1 (Fig. 10) <400> 151 Met Asn Ser Thr Pro Asp Leu Ile Ser Pro Gln Lys Ser Asn Ser Ser 1 5 10 15 Asn Ser Tyr Glu Leu Glu Ser Gly Arg Ser Lys Ala Met Asn Thr Pro 20 25 30 Glu Gly Lys Asn Glu Ser Phe His Asp Asn Leu Ser Glu Ser Gln Val 35 40 45 Gln Pro Ala Val Ala Pro Pro Asn Thr Gly Lys Gly Val Tyr Val Thr 50 55 60 Val Ser Ile Cys Cys Val Met Val Ala Phe Gly Gly Phe Ile Phe Gly 65 70 75 80 Trp Asp Thr Gly Thr Ile Ser Gly Phe Val Ala Gln Thr Asp Phe Leu 85 90 95 Arg Arg Phe Gly Met Lys His His Asp Gly Ser His Tyr Leu Ser Lys 100 105 110 Val Arg Thr Gly Leu Ile Val Ser Ile Phe Asn Ile Gly Cys Ala Ile 115 120 125 Gly Gly Ile Val Leu Ala Lys Leu Gly Asp Met Tyr Gly Arg Arg Ile 130 135 140 Gly Leu Ile Val Val Val Val Ile Tyr Thr Ile Gly Ile Ile Ile Gln 145 150 155 160 Ile Ala Ser Ile Asn Lys Trp Tyr Gln Tyr Phe Ile Gly Arg Ile Ile 165 170 175 Ser Gly Leu Gly Val Gly Gly Ile Thr Val Leu Ser Pro Met Leu Ile 180 185 190 Ser Glu Val Ala Pro Ser Glu Met Arg Gly Thr Leu Val Ser Cys Tyr 195 200 205 Gln Val Met Ile Thr Leu Gly Ile Phe Leu Gly Tyr Cys Thr Asn Phe 210 215 220 Gly Thr Lys Asn Tyr Ser Asn Ser Val Gln Trp Arg Val Pro Leu Gly 225 230 235 240 Leu Cys Phe Ala Trp Ala Leu Phe Met Ile Gly Gly Met Met Phe Val 245 250 255 Pro Glu Ser Pro Arg Tyr Leu Val Glu Ala Gly Arg Ile Asp Glu Ala 260 265 270 Arg Ala Ser Leu Ala Lys Val Asn Lys Cys Pro Pro Asp His Pro Tyr 275 280 285 Ile Gln Tyr Glu Leu Glu Thr Ile Glu Ala Gly Val Glu Glu Met Arg 290 295 300 Ala Ala Gly Thr Ala Ser Trp Gly Glu Leu Phe Thr Gly Lys Pro Ala 305 310 315 320 Met Phe Gln Arg Thr Met Met Gly Ile Met Ile Gln Ser Leu Gln Gln 325 330 335 Leu Thr Gly Asp Asn Tyr Phe Phe Tyr Tyr Gly Thr Ile Val Phe Gln 340 345 350 Ala Val Gly Leu Ser Asp Ser Phe Glu Thr Ser Ile Val Phe Gly Val 355 360 365 Val Asn Phe Phe Ser Thr Cys Cys Ser Leu Tyr Thr Val Asp Arg Phe 370 375 380 Gly Arg Arg Asn Cys Leu Met Trp Gly Ala Val Gly Met Val Cys Cys 385 390 395 400 Tyr Val Val Tyr Ala Ser Val Gly Val Thr Arg Leu Trp Pro Asn Gly 405 410 415 Gln Asn Asn Gly Ser Ser Lys Gly Ala Gly Asn Cys Met Ile Cys Phe 420 425 430 Ala Cys Phe Tyr Ile Phe Cys Phe Ala Thr Thr Trp Ala Pro Ile Ala 435 440 445 Tyr Val Val Ile Ser Glu Cys Phe Pro Leu Arg Val Lys Ser Lys Cys 450 455 460 Met Ser Ile Ala Ser Ala Ala Asn Trp Ile Trp Gly Phe Leu Ile Ser 465 470 475 480 Phe Phe Thr Pro Phe Ile Thr Gly Ala Ile Asn Phe Tyr Tyr Gly Tyr 485 490 495 Val Phe Met Gly Cys Met Val Phe Ala Tyr Phe Tyr Val Phe Phe Phe 500 505 510 Val Pro Glu Thr Lys Gly Leu Ser Leu Glu Glu Val Asn Asp Met Tyr 515 520 525 Ala Glu Gly Val Leu Pro Trp Lys Ser Ala Ser Trp Val Pro Val Ser 530 535 540 Lys Arg Gly Ala Asp Tyr Asn Ala Asp Asp Leu Met His Asp Asp Gln 545 550 555 560 Pro Phe Tyr Lys Ser Leu Phe Ser Arg Lys 565 570 <210> 152 <211> 541 <212> PRT <213> Saccharomyces cerevisiae <220> <223> Hxt2 (Fig. 10) <400> 152 Met Ser Glu Phe Ala Thr Ser Arg Val Glu Ser Gly Ser Gln Gln Thr 1 5 10 15 Ser Ile His Ser Thr Pro Ile Val Gln Lys Leu Glu Thr Asp Glu Ser 20 25 30 Pro Ile Gln Thr Lys Ser Glu Tyr Thr Asn Ala Glu Leu Pro Ala Lys 35 40 45 Pro Ile Ala Ala Tyr Trp Thr Val Ile Cys Leu Cys Leu Met Ile Ala 50 55 60 Phe Gly Gly Phe Val Phe Gly Trp Asp Thr Gly Thr Ile Ser Gly Phe 65 70 75 80 Val Asn Gln Thr Asp Phe Lys Arg Arg Phe Gly Gln Met Lys Ser Asp 85 90 95 Gly Thr Tyr Tyr Leu Ser Asp Val Arg Thr Gly Leu Ile Val Gly Ile 100 105 110 Phe Asn Ile Gly Cys Ala Phe Gly Gly Leu Thr Leu Gly Arg Leu Gly 115 120 125 Asp Met Tyr Gly Arg Arg Ile Gly Leu Met Cys Val Val Leu Val Tyr 130 135 140 Ile Val Gly Ile Val Ile Gln Ile Ala Ser Ser Asp Lys Trp Tyr Gln 145 150 155 160 Tyr Phe Ile Gly Arg Ile Ile Ser Gly Met Gly Val Gly Gly Ile Ala 165 170 175 Val Leu Ser Pro Thr Leu Ile Ser Glu Thr Ala Pro Lys His Ile Arg 180 185 190 Gly Thr Cys Val Ser Phe Tyr Gln Leu Met Ile Thr Leu Gly Ile Phe 195 200 205 Leu Gly Tyr Cys Thr Asn Tyr Gly Thr Lys Asp Tyr Ser Asn Ser Val 210 215 220 Gln Trp Arg Val Pro Leu Gly Leu Asn Phe Ala Phe Ala Ile Phe Met 225 230 235 240 Ile Ala Gly Met Leu Met Val Pro Glu Ser Pro Arg Phe Leu Val Glu 245 250 255 Lys Gly Arg Tyr Glu Asp Ala Lys Arg Ser Leu Ala Lys Ser Asn Lys 260 265 270 Val Thr Ile Glu Asp Pro Ser Ile Val Ala Glu Met Asp Thr Ile Met 275 280 285 Ala Asn Val Glu Thr Glu Arg Leu Ala Gly Asn Ala Ser Trp Gly Glu 290 295 300 Leu Phe Ser Asn Lys Gly Ala Ile Leu Pro Arg Val Ile Met Gly Ile 305 310 315 320 Met Ile Gln Ser Leu Gln Gln Leu Thr Gly Asn Asn Tyr Phe Phe Tyr 325 330 335 Tyr Gly Thr Thr Ile Phe Asn Ala Val Gly Met Lys Asp Ser Phe Gln 340 345 350 Thr Ser Ile Val Leu Gly Ile Val Asn Phe Ala Ser Thr Phe Val Ala 355 360 365 Leu Tyr Thr Val Asp Lys Phe Gly Arg Arg Lys Cys Leu Leu Gly Gly 370 375 380 Ser Ala Ser Met Ala Ile Cys Phe Val Ile Phe Ser Thr Val Gly Val 385 390 395 400 Thr Ser Leu Tyr Pro Asn Gly Lys Asp Gln Pro Ser Ser Lys Ala Ala 405 410 415 Gly Asn Val Met Ile Val Phe Thr Cys Leu Phe Ile Phe Phe Phe Ala 420 425 430 Ile Ser Trp Ala Pro Ile Ala Tyr Val Ile Val Ala Glu Ser Tyr Pro 435 440 445 Leu Arg Val Lys Asn Arg Ala Met Ala Ile Ala Val Gly Ala Asn Trp 450 455 460 Ile Trp Gly Phe Leu Ile Gly Phe Phe Thr Pro Phe Ile Thr Ser Ala 465 470 475 480 Ile Gly Phe Ser Tyr Gly Tyr Val Phe Met Gly Cys Leu Val Phe Ser 485 490 495 Phe Phe Tyr Val Phe Phe Phe Val Cys Glu Thr Lys Gly Leu Thr Leu 500 505 510 Glu Glu Val Asn Glu Met Tyr Val Glu Gly Val Lys Pro Trp Lys Ser 515 520 525 Gly Ser Trp Ile Ser Lys Glu Lys Arg Val Ser Glu Glu 530 535 540 <210> 153 <211> 567 <212> PRT <213> Saccharomyces cerevisiae <220> <223> Hxt3 (Fig. 10) <400> 153 Met Asn Ser Thr Pro Asp Leu Ile Ser Pro Gln Lys Ser Ser Glu Asn 1 5 10 15 Ser Asn Ala Asp Leu Pro Ser Asn Ser Ser Gln Val Met Asn Met Pro 20 25 30 Glu Glu Lys Gly Val Gln Asp Asp Phe Gln Ala Glu Ala Asp Gln Val 35 40 45 Leu Thr Asn Pro Asn Thr Gly Lys Gly Ala Tyr Val Thr Val Ser Ile 50 55 60 Cys Cys Val Met Val Ala Phe Gly Gly Phe Val Phe Gly Trp Asp Thr 65 70 75 80 Gly Thr Ile Ser Gly Phe Val Ala Gln Thr Asp Phe Leu Arg Arg Phe 85 90 95 Gly Met Lys His Lys Asp Gly Ser Tyr Tyr Leu Ser Lys Val Arg Thr 100 105 110 Gly Leu Ile Val Ser Ile Phe Asn Ile Gly Cys Ala Ile Gly Gly Ile 115 120 125 Ile Leu Ala Lys Leu Gly Asp Met Tyr Gly Arg Lys Met Gly Leu Ile 130 135 140 Val Val Val Val Ile Tyr Ile Ile Gly Ile Ile Ile Gln Ile Ala Ser 145 150 155 160 Ile Asn Lys Trp Tyr Gln Tyr Phe Ile Gly Arg Ile Ile Ser Gly Leu 165 170 175 Gly Val Gly Gly Ile Ala Val Leu Ser Pro Met Leu Ile Ser Glu Val 180 185 190 Ala Pro Lys Glu Met Arg Gly Ala Leu Val Ser Cys Tyr Gln Leu Met 195 200 205 Val Thr Leu Gly Ile Phe Leu Gly Tyr Cys Thr Asn Phe Gly Thr Lys 210 215 220 Asn Tyr Ser Asn Ser Val Gln Trp Arg Val Pro Leu Gly Leu Cys Phe 225 230 235 240 Ala Trp Ala Leu Phe Met Ile Gly Gly Met Thr Phe Val Pro Glu Ser 245 250 255 Pro Arg Tyr Leu Val Glu Ala Gly Gln Ile Asp Glu Ala Arg Ala Ser 260 265 270 Leu Ser Lys Val Asn Lys Val Ala Pro Asp His Pro Phe Ile Gln Gln 275 280 285 Glu Leu Glu Val Ile Glu Ala Ser Val Glu Glu Ala Arg Ala Ala Gly 290 295 300 Ser Ala Ser Trp Gly Glu Leu Phe Thr Gly Lys Pro Ala Met Phe Lys 305 310 315 320 Arg Thr Met Ile Gly Ile Met Ile Gln Ser Leu Gln Gln Leu Thr Gly 325 330 335 Asp Asn Tyr Phe Phe Tyr Tyr Gly Thr Thr Val Phe Asn Ala Val Gly 340 345 350 Met Ser Asp Ser Phe Glu Thr Ser Ile Val Phe Gly Val Val Asn Phe 355 360 365 Phe Ser Thr Cys Cys Ser Leu Tyr Thr Val Asp Arg Phe Gly Arg Arg 370 375 380 Asn Cys Leu Met Trp Gly Ala Val Gly Met Val Cys Cys Tyr Val Val 385 390 395 400 Tyr Ala Ser Val Gly Val Thr Arg Leu Trp Pro Asn Gly Glu Gly Asn 405 410 415 Gly Ser Ser Lys Gly Ala Gly Asn Cys Met Ile Val Phe Ala Cys Phe 420 425 430 Tyr Ile Phe Cys Phe Ala Thr Thr Trp Ala Pro Ile Ala Tyr Val Val 435 440 445 Ile Ser Glu Thr Phe Pro Leu Arg Val Lys Ser Lys Ala Met Ser Ile 450 455 460 Ala Thr Ala Ala Asn Trp Leu Trp Gly Phe Leu Ile Gly Phe Phe Thr 465 470 475 480 Pro Phe Ile Thr Gly Ala Ile Asn Phe Tyr Tyr Gly Tyr Val Phe Met 485 490 495 Gly Cys Met Val Phe Ala Tyr Phe Tyr Val Phe Phe Phe Val Pro Glu 500 505 510 Thr Lys Gly Leu Thr Leu Glu Glu Val Asn Asp Met Tyr Ala Glu Gly 515 520 525 Val Leu Pro Trp Lys Ser Ala Ser Trp Val Pro Thr Ser Gln Arg Gly 530 535 540 Ala Asn Tyr Asp Ala Asp Ala Leu Met His Asp Asp Gln Pro Phe Tyr 545 550 555 560 Lys Lys Met Phe Gly Lys Lys 565 <210> 154 <211> 560 <212> PRT <213> Saccharomyces cerevisiae <220> <223> Hxt4SC (Fig. 10) <400> 154 Met Ser Glu Glu Ala Ala Tyr Gln Glu Asp Thr Ala Val Gln Asn Thr 1 5 10 15 Pro Ala Asp Ala Leu Ser Pro Val Glu Ser Asp Ser Asn Ser Ala Leu 20 25 30 Ser Thr Pro Ser Asn Lys Ala Glu Arg Asp Asp Met Lys Asp Phe Asp 35 40 45 Glu Asn His Glu Glu Ser Asn Asn Tyr Val Glu Ile Pro Lys Lys Pro 50 55 60 Ala Ser Ala Tyr Val Thr Val Ser Ile Cys Cys Leu Met Val Ala Phe 65 70 75 80 Gly Gly Phe Val Phe Gly Trp Asp Thr Gly Thr Ile Ser Gly Phe Val 85 90 95 Ala Gln Thr Asp Phe Ile Arg Arg Phe Gly Met Lys His His Asp Gly 100 105 110 Thr Tyr Tyr Leu Ser Lys Val Arg Thr Gly Leu Ile Val Ser Ile Phe 115 120 125 Asn Ile Gly Cys Ala Ile Gly Gly Ile Ile Leu Ala Lys Leu Gly Asp 130 135 140 Met Tyr Gly Arg Lys Met Gly Leu Ile Val Val Val Val Ile Tyr Ile 145 150 155 160 Ile Gly Ile Ile Ile Gln Ile Ala Ser Ile Asn Lys Trp Tyr Gln Tyr 165 170 175 Phe Ile Gly Arg Ile Ile Ser Gly Leu Gly Val Gly Gly Ile Ala Val 180 185 190 Leu Ser Pro Met Leu Ile Ser Glu Val Ser Pro Lys His Ile Arg Gly 195 200 205 Thr Leu Val Ser Cys Tyr Gln Leu Met Ile Thr Leu Gly Ile Phe Leu 210 215 220 Gly Tyr Cys Thr Asn Tyr Gly Thr Lys Thr Tyr Thr Asn Ser Val Gln 225 230 235 240 Trp Arg Val Pro Leu Gly Leu Gly Phe Ala Trp Ala Leu Phe Met Ile 245 250 255 Gly Gly Met Thr Phe Val Pro Glu Ser Pro Arg Tyr Leu Val Glu Val 260 265 270 Gly Lys Ile Glu Glu Ala Lys Arg Ser Ile Ala Leu Ser Asn Lys Val 275 280 285 Ser Ala Asp Asp Pro Ala Val Met Ala Glu Val Glu Val Val Gln Ala 290 295 300 Thr Val Glu Ala Glu Lys Leu Ala Gly Asn Ala Ser Trp Gly Glu Ile 305 310 315 320 Phe Ser Thr Lys Thr Lys Val Phe Gln Arg Leu Ile Met Gly Ala Met 325 330 335 Ile Gln Ser Leu Gln Gln Leu Thr Gly Asp Asn Tyr Phe Phe Tyr Tyr 340 345 350 Gly Thr Thr Val Phe Thr Ala Val Gly Leu Glu Asp Ser Phe Glu Thr 355 360 365 Ser Ile Val Leu Gly Ile Val Asn Phe Ala Ser Thr Phe Val Gly Ile 370 375 380 Phe Leu Val Glu Arg Tyr Gly Arg Arg Arg Cys Leu Leu Trp Gly Ala 385 390 395 400 Ala Ser Met Thr Ala Cys Met Val Val Phe Ala Ser Val Gly Val Thr 405 410 415 Arg Leu Trp Pro Asn Gly Lys Lys Asn Gly Ser Ser Lys Gly Ala Gly 420 425 430 Asn Cys Met Ile Val Phe Thr Cys Phe Tyr Leu Phe Cys Phe Ala Thr 435 440 445 Thr Trp Ala Pro Ile Pro Phe Val Val Asn Ser Glu Thr Phe Pro Leu 450 455 460 Arg Val Lys Ser Lys Cys Met Ala Ile Ala Gln Ala Cys Asn Trp Ile 465 470 475 480 Trp Gly Phe Leu Ile Gly Phe Phe Thr Pro Phe Ile Ser Gly Ala Ile 485 490 495 Asp Phe Tyr Tyr Gly Tyr Val Phe Met Gly Cys Leu Val Phe Ser Tyr 500 505 510 Phe Tyr Val Phe Phe Phe Val Pro Glu Thr Lys Gly Leu Thr Leu Glu 515 520 525 Glu Val Asn Thr Leu Trp Glu Glu Gly Val Leu Pro Trp Lys Ser Pro 530 535 540 Ser Trp Phe His Gln Thr Arg Glu Val Leu Thr Thr Thr Leu Met Ile 545 550 555 560 <210> 155 <211> 581 <212> PRT <213> Saccharomyces cerevisiae <220> <223> Hxt4RN (Fig. 10) <400> 155 Met Ser Glu Glu Ala Ala Tyr Gln Glu Asp Thr Ala Val Gln Asn Thr 1 5 10 15 Pro Ala Asp Ala Leu Ser Pro Val Glu Ser Asp Ser Asn Ser Ala Leu 20 25 30 Ser Thr Pro Ser Asn Lys Ala Glu Arg Asp Asp Met Lys Asp Phe Asp 35 40 45 Glu Asn His Glu Glu Ser Asn Asn Tyr Val Glu Ile Pro Lys Lys Pro 50 55 60 Ala Ser Ala Tyr Val Thr Val Ser Ile Cys Cys Leu Met Val Ala Phe 65 70 75 80 Gly Gly Phe Val Phe Gly Trp Asp Thr Gly Thr Ile Ser Gly Phe Val 85 90 95 Ala Gln Thr Asp Phe Ile Arg Arg Phe Gly Met Lys His His Asp Gly 100 105 110 Thr Tyr Tyr Leu Ser Lys Val Arg Thr Gly Leu Ile Val Ser Ile Ile 115 120 125 Asn Ile Gly Cys Ala Ile Gly Gly Ile Ile Leu Ser Lys Leu Gly Asp 130 135 140 Met Tyr Gly Arg Lys Met Gly Leu Ile Val Val Val Val Ile Tyr Ile 145 150 155 160 Ile Gly Ile Ile Ile Gln Ile Ala Ser Ile Asn Lys Trp Tyr Gln Tyr 165 170 175 Phe Ile Gly Arg Ile Ile Ser Gly Leu Gly Val Gly Gly Ile Ala Val 180 185 190 Leu Ser Pro Met Leu Ile Ser Glu Val Ser Pro Lys His Ile Arg Gly 195 200 205 Thr Leu Val Ser Cys Tyr Gln Leu Met Ile Thr Leu Gly Ile Phe Leu 210 215 220 Gly Tyr Cys Thr Asn Tyr Gly Thr Lys Thr Tyr Thr Asn Ser Val Gln 225 230 235 240 Trp Arg Val Pro Leu Gly Leu Gly Phe Ala Trp Ala Leu Phe Met Ile 245 250 255 Gly Gly Met Thr Leu Val Pro Glu Ser Pro Arg Tyr Leu Val Glu Val 260 265 270 Gly Lys Ile Glu Glu Ala Lys Arg Ser Ile Ala Leu Ser Asn Lys Val 275 280 285 Asn Ala Asp Asp Pro Ala Val Met Ala Glu Val Glu Val Val Gln Ala 290 295 300 Thr Val Glu Ala Glu Lys Leu Ala Gly Asn Ala Ser Trp Gly Glu Ile 305 310 315 320 Phe Ser Thr Lys Thr Lys Val Phe Gln Arg Leu Ile Met Gly Ala Met 325 330 335 Ile Gln Ser Leu Gln Gln Leu Thr Gly Asp Asn Tyr Phe Phe Tyr Tyr 340 345 350 Gly Thr Thr Val Phe Thr Ala Val Gly Leu Glu Asp Ser Phe Glu Thr 355 360 365 Ser Ile Val Leu Gly Ile Val Asn Phe Ala Ser Thr Phe Val Gly Ile 370 375 380 Phe Leu Val Glu Arg Tyr Gly Arg Arg Arg Cys Leu Leu Trp Gly Ala 385 390 395 400 Ala Ser Met Thr Ala Cys Met Val Val Phe Ala Ser Val Gly Val Thr 405 410 415 Arg Leu Trp Pro Asn Gly Lys Lys Asn Gly Ser Ser Lys Gly Ala Gly 420 425 430 Asn Cys Met Ile Val Phe Thr Cys Phe Tyr Leu Phe Cys Phe Ala Thr 435 440 445 Thr Trp Ala Pro Ile Pro Phe Val Val Asn Ser Glu Thr Phe Pro Leu 450 455 460 Arg Val Lys Ser Lys Cys Met Ala Ile Ala Gln Ala Cys Asn Trp Ile 465 470 475 480 Trp Gly Phe Leu Ile Gly Phe Phe Thr Pro Phe Ile Ser Gly Ala Ile 485 490 495 Asp Phe Tyr Tyr Gly Tyr Val Phe Met Gly Cys Leu Val Phe Ser Tyr 500 505 510 Phe Tyr Val Phe Phe Phe Val Pro Glu Thr Lys Gly Leu Thr Leu Glu 515 520 525 Glu Val Asn Thr Leu Trp Glu Glu Gly Val Leu Pro Trp Lys Ser Pro 530 535 540 Ser Trp Val Pro Pro Asn Lys Arg Gly Thr Asp Tyr Asn Ala Asp Asp 545 550 555 560 Leu Met His Asp Gly Ser Thr His Phe Thr Arg Arg Cys Ser Glu Lys 565 570 575 Ser Arg Ser Val Asn 580 <210> 156 <211> 592 <212> PRT <213> Saccharomyces cerevisiae <220> <223> Hxt5 (Fig. 10) <400> 156 Met Ser Glu Leu Glu Asn Ala His Gln Gly Pro Leu Glu Gly Ser Ala 1 5 10 15 Thr Val Ser Thr Asn Ser Asn Ser Tyr Asn Glu Lys Ser Gly Asn Ser 20 25 30 Thr Ala Pro Gly Thr Ala Gly Tyr Asn Asp Asn Leu Ala Gln Ala Lys 35 40 45 Pro Val Ser Ser Tyr Ile Ser His Glu Gly Pro Pro Lys Asp Glu Leu 50 55 60 Glu Glu Leu Gln Lys Glu Val Asp Lys Gln Leu Glu Lys Lys Ser Lys 65 70 75 80 Ser Asp Leu Leu Phe Val Ser Val Cys Cys Leu Met Val Ala Phe Gly 85 90 95 Gly Phe Val Phe Gly Trp Asp Thr Gly Thr Ile Ser Gly Phe Val Arg 100 105 110 Gln Thr Asp Phe Ile Arg Arg Phe Gly Ser Thr Arg Ala Asn Gly Thr 115 120 125 Thr Tyr Leu Ser Asp Val Arg Thr Gly Leu Met Val Ser Ile Phe Asn 130 135 140 Ile Gly Cys Ala Ile Gly Gly Ile Val Leu Ser Lys Leu Gly Asp Met 145 150 155 160 Tyr Gly Arg Lys Ile Gly Leu Met Thr Val Val Val Ile Tyr Ser Ile 165 170 175 Gly Ile Ile Ile Gln Ile Ala Ser Ile Asp Lys Trp Tyr Gln Tyr Phe 180 185 190 Ile Gly Arg Ile Ile Ser Gly Leu Gly Val Gly Gly Ile Thr Val Leu 195 200 205 Ala Pro Met Leu Ile Ser Glu Val Ser Pro Lys Gln Leu Arg Gly Thr 210 215 220 Leu Val Ser Cys Tyr Gln Leu Met Ile Thr Phe Gly Ile Phe Leu Gly 225 230 235 240 Tyr Cys Thr Asn Phe Gly Thr Lys Asn Tyr Ser Asn Ser Val Gln Trp 245 250 255 Arg Val Pro Leu Gly Leu Cys Phe Ala Trp Ser Ile Phe Met Ile Val 260 265 270 Gly Met Thr Phe Val Pro Glu Ser Pro Arg Tyr Leu Val Glu Val Gly 275 280 285 Lys Ile Glu Glu Ala Lys Arg Ser Leu Ala Arg Ala Asn Lys Thr Thr 290 295 300 Glu Asp Ser Pro Leu Val Thr Leu Glu Met Glu Asn Tyr Gln Ser Ser 305 310 315 320 Ile Glu Ala Glu Arg Leu Ala Gly Ser Ala Ser Trp Gly Glu Leu Val 325 330 335 Thr Gly Lys Pro Gln Met Phe Arg Arg Thr Leu Met Gly Met Met Ile 340 345 350 Gln Ser Leu Gln Gln Leu Thr Gly Asp Asn Tyr Phe Phe Tyr Tyr Gly 355 360 365 Thr Thr Ile Phe Gln Ala Val Gly Leu Glu Asp Ser Phe Glu Thr Ala 370 375 380 Ile Val Leu Gly Val Val Asn Phe Val Ser Thr Phe Phe Ser Leu Tyr 385 390 395 400 Thr Val Asp Arg Phe Gly Arg Arg Asn Cys Leu Leu Trp Gly Cys Val 405 410 415 Gly Met Ile Cys Cys Tyr Val Val Tyr Ala Ser Val Gly Val Thr Arg 420 425 430 Leu Trp Pro Asn Gly Gln Asp Gln Pro Ser Ser Lys Gly Ala Gly Asn 435 440 445 Cys Met Ile Val Phe Ala Cys Phe Tyr Ile Phe Cys Phe Ala Thr Thr 450 455 460 Trp Ala Pro Val Ala Tyr Val Leu Ile Ser Glu Ser Tyr Pro Leu Arg 465 470 475 480 Val Arg Gly Lys Ala Met Ser Ile Ala Ser Ala Cys Asn Trp Ile Trp 485 490 495 Gly Phe Leu Ile Ser Phe Phe Thr Pro Phe Ile Thr Ser Ala Ile Asn 500 505 510 Phe Tyr Tyr Gly Tyr Val Phe Met Gly Cys Met Val Phe Ala Tyr Phe 515 520 525 Tyr Val Phe Phe Phe Val Pro Glu Thr Lys Gly Leu Thr Leu Glu Glu 530 535 540 Val Asn Glu Met Tyr Glu Glu Asn Val Leu Pro Trp Lys Ser Thr Lys 545 550 555 560 Trp Ile Pro Pro Ser Arg Arg Thr Thr Asp Tyr Asp Leu Asp Ala Thr 565 570 575 Arg Asn Asp Pro Arg Pro Phe Tyr Lys Arg Met Phe Thr Lys Glu Lys 580 585 590 <210> 157 <211> 570 <212> PRT <213> Saccharomyces cerevisiae <220> <223> Hxt6/7 (Fig. 10) <400> 157 Met Ser Gln Asp Ala Ala Ile Ala Glu Gln Thr Pro Val Glu His Leu 1 5 10 15 Ser Ala Val Asp Ser Ala Ser His Ser Val Leu Ser Thr Pro Ser Asn 20 25 30 Lys Ala Glu Arg Asp Glu Ile Lys Ala Tyr Gly Glu Gly Glu Glu His 35 40 45 Glu Pro Val Val Glu Ile Pro Lys Arg Pro Ala Ser Ala Tyr Val Thr 50 55 60 Val Ser Ile Met Cys Ile Met Ile Ala Phe Gly Gly Phe Val Phe Gly 65 70 75 80 Trp Asp Thr Gly Thr Ile Ser Gly Phe Ile Asn Gln Thr Asp Phe Ile 85 90 95 Arg Arg Phe Gly Met Lys His Lys Asp Gly Thr Asn Tyr Leu Ser Lys 100 105 110 Val Arg Thr Gly Leu Ile Val Ser Ile Phe Asn Ile Gly Cys Ala Ile 115 120 125 Gly Gly Ile Ile Leu Ser Lys Leu Gly Asp Met Tyr Gly Arg Lys Val 130 135 140 Gly Leu Ile Val Val Val Val Ile Tyr Ile Ile Gly Ile Ile Ile Gln 145 150 155 160 Ile Ala Ser Ile Asn Lys Trp Tyr Gln Tyr Phe Ile Gly Arg Ile Ile 165 170 175 Ser Gly Leu Gly Val Gly Gly Ile Ala Val Leu Ser Pro Met Leu Ile 180 185 190 Ser Glu Val Ser Pro Lys His Leu Arg Gly Thr Leu Val Ser Cys Tyr 195 200 205 Gln Leu Met Ile Thr Ala Gly Ile Phe Leu Gly Tyr Cys Thr Asn Phe 210 215 220 Gly Thr Lys Asn Tyr Ser Asn Ser Val Gln Trp Arg Val Pro Leu Gly 225 230 235 240 Leu Cys Phe Ala Trp Ala Leu Phe Met Ile Gly Gly Met Thr Phe Val 245 250 255 Pro Glu Ser Pro Arg Tyr Leu Ala Glu Val Gly Lys Ile Glu Glu Ala 260 265 270 Lys Arg Ser Ile Ala Val Ser Asn Lys Val Ala Val Asp Asp Pro Ser 275 280 285 Val Leu Ala Glu Val Glu Ala Val Leu Ala Gly Val Glu Ala Glu Lys 290 295 300 Leu Ala Gly Asn Ala Ser Trp Gly Glu Leu Phe Ser Ser Lys Thr Lys 305 310 315 320 Val Leu Gln Arg Leu Ile Met Gly Ala Met Ile Gln Ser Leu Gln Gln 325 330 335 Leu Thr Gly Asp Asn Tyr Phe Phe Tyr Tyr Gly Thr Thr Ile Phe Lys 340 345 350 Ala Val Gly Leu Ser Asp Ser Phe Glu Thr Ser Ile Val Leu Gly Ile 355 360 365 Val Asn Phe Ala Ser Thr Phe Val Gly Ile Tyr Val Val Glu Arg Tyr 370 375 380 Gly Arg Arg Thr Cys Leu Leu Trp Gly Ala Ala Ser Met Thr Ala Cys 385 390 395 400 Met Val Val Tyr Ala Ser Val Gly Val Thr Arg Leu Trp Pro Asn Gly 405 410 415 Gln Asp Gln Pro Ser Ser Lys Gly Ala Gly Asn Cys Met Ile Val Phe 420 425 430 Ala Cys Phe Tyr Ile Phe Cys Phe Ala Thr Thr Trp Ala Pro Ile Pro 435 440 445 Tyr Val Val Val Ser Glu Thr Phe Pro Leu Arg Val Lys Ser Lys Ala 450 455 460 Met Ser Ile Ala Thr Ala Ala Asn Trp Leu Trp Gly Phe Leu Ile Gly 465 470 475 480 Phe Phe Thr Pro Phe Ile Thr Gly Ala Ile Asn Phe Tyr Tyr Gly Tyr 485 490 495 Val Phe Met Gly Cys Leu Val Phe Met Phe Phe Tyr Val Leu Leu Val 500 505 510 Val Pro Glu Thr Lys Gly Leu Thr Leu Glu Glu Val Asn Thr Met Trp 515 520 525 Glu Glu Gly Val Leu Pro Trp Lys Ser Ala Ser Trp Val Pro Pro Ser 530 535 540 Arg Arg Gly Ala Asn Tyr Asp Ala Glu Glu Met Thr His Asp Asp Lys 545 550 555 560 Pro Leu Tyr Lys Arg Met Phe Ser Thr Lys 565 570 <210> 158 <211> 569 <212> PRT <213> Saccharomyces cerevisiae <220> <223> Hxt8 (Fig. 10) <400> 158 Met Thr Asp Arg Lys Thr Asn Leu Pro Glu Glu Pro Ile Phe Glu Glu 1 5 10 15 Ala Glu Asp Asp Gly Cys Pro Ser Ile Glu Asn Ser Ser His Leu Ser 20 25 30 Val Pro Thr Val Glu Glu Asn Lys Asp Phe Ser Glu Tyr Asn Gly Glu 35 40 45 Glu Ala Glu Glu Val Val Val Pro Glu Lys Pro Ala Ser Ala Tyr Ala 50 55 60 Thr Val Ser Ile Met Cys Leu Cys Met Ala Phe Gly Gly Phe Met Ser 65 70 75 80 Gly Trp Asp Thr Gly Thr Ile Ser Gly Phe Val Asn Gln Thr Asp Phe 85 90 95 Leu Arg Arg Phe Gly Asn Tyr Ser His Ser Lys Asn Thr Tyr Tyr Leu 100 105 110 Ser Asn Val Arg Thr Gly Leu Ile Val Ser Ile Phe Asn Val Gly Ser 115 120 125 Ala Ile Gly Cys Leu Phe Leu Ser Lys Leu Gly Asp Ile Tyr Gly Arg 130 135 140 Cys Met Gly Leu Ile Ile Val Ile Val Val Tyr Met Val Gly Ile Val 145 150 155 160 Ile Gln Ile Ala Ser Ile Asp Lys Trp Tyr Gln Tyr Phe Ile Gly Arg 165 170 175 Ile Ile Ala Gly Ile Gly Ala Gly Ser Ile Ser Val Leu Ala Pro Met 180 185 190 Leu Ile Ser Glu Thr Ala Pro Lys His Ile Arg Gly Thr Leu Leu Ala 195 200 205 Cys Trp Gln Leu Met Val Thr Phe Ala Ile Phe Leu Gly Tyr Cys Thr 210 215 220 Asn Tyr Gly Thr Lys Thr Tyr Ser Asn Ser Val Gln Trp Arg Val Pro 225 230 235 240 Leu Gly Leu Cys Phe Ala Trp Ala Ile Ile Met Ile Gly Gly Met Thr 245 250 255 Phe Val Pro Glu Ser Pro Arg Phe Leu Val Gln Val Gly Lys Ile Glu 260 265 270 Gln Ala Lys Ala Ser Phe Ala Lys Ser Asn Lys Leu Ser Val Asp Asp 275 280 285 Pro Ala Val Val Ala Glu Ile Asp Leu Leu Val Ala Gly Val Glu Ala 290 295 300 Glu Glu Ala Met Gly Thr Ala Ser Trp Lys Glu Leu Phe Ser Arg Lys 305 310 315 320 Thr Lys Val Phe Gln Arg Leu Thr Met Thr Val Met Ile Asn Ser Leu 325 330 335 Gln Gln Leu Thr Gly Asp Asn Tyr Phe Phe Tyr Tyr Gly Thr Thr Ile 340 345 350 Phe Lys Ser Val Gly Met Asn Asp Ser Phe Glu Thr Ser Ile Val Leu 355 360 365 Gly Ile Val Asn Phe Ala Ser Cys Phe Phe Ser Leu Tyr Ser Val Asp 370 375 380 Lys Leu Gly Arg Arg Arg Cys Leu Leu Leu Gly Ala Ala Thr Met Thr 385 390 395 400 Ala Cys Met Val Ile Tyr Ala Ser Val Gly Val Thr Arg Leu Tyr Pro 405 410 415 Asn Gly Lys Ser Glu Pro Ser Ser Lys Gly Ala Gly Asn Cys Thr Ile 420 425 430 Val Phe Thr Cys Phe Tyr Ile Phe Cys Phe Ser Cys Thr Trp Gly Pro 435 440 445 Val Cys Tyr Val Ile Ile Ser Glu Thr Phe Pro Leu Arg Val Arg Ser 450 455 460 Lys Cys Met Ser Val Ala Thr Ala Ala Asn Leu Leu Trp Gly Phe Leu 465 470 475 480 Ile Gly Phe Phe Thr Pro Phe Ile Thr Ser Ala Ile Asn Phe Tyr Tyr 485 490 495 Gly Tyr Val Phe Met Gly Cys Leu Ala Phe Ser Tyr Phe Tyr Val Phe 500 505 510 Phe Phe Val Pro Glu Thr Lys Gly Leu Thr Leu Glu Glu Val Asp Glu 515 520 525 Met Trp Met Asp Gly Val Leu Pro Trp Lys Ser Glu Ser Trp Val Pro 530 535 540 Ala Ser Arg Arg Asp Gly Asp Tyr Asp Asn Glu Lys Leu Gln His Asp 545 550 555 560 Glu Lys Pro Phe Tyr Lys Arg Met Phe 565 <210> 159 <211> 567 <212> PRT <213> Saccharomyces cerevisiae <220> <223> Hxt9 (Fig. 10) <400> 159 Met Ser Gly Val Asn Asn Thr Ser Ala Asn Asp Leu Ser Thr Thr Glu 1 5 10 15 Ser Asn Ser Asn Ser Val Ala Asn Ala Pro Ser Val Lys Thr Glu His 20 25 30 Asn Asp Ser Lys Asn Ser Leu Asn Leu Asp Ala Thr Glu Pro Pro Ile 35 40 45 Asp Leu Pro Gln Lys Pro Leu Ser Ala Tyr Thr Thr Val Ala Ile Leu 50 55 60 Cys Leu Met Ile Ala Phe Gly Gly Phe Ile Phe Gly Trp Asp Thr Gly 65 70 75 80 Thr Ile Ser Gly Phe Val Asn Leu Ser Asp Phe Ile Arg Arg Phe Gly 85 90 95 Gln Lys Asn Asp Lys Gly Thr Tyr Tyr Leu Ser Lys Val Arg Met Gly 100 105 110 Leu Ile Val Ser Ile Phe Asn Ile Gly Cys Ala Ile Gly Gly Ile Val 115 120 125 Leu Ser Lys Val Gly Asp Ile Tyr Gly Arg Arg Ile Gly Leu Ile Thr 130 135 140 Val Thr Ala Ile Tyr Val Val Gly Ile Leu Ile Gln Ile Thr Ser Ile 145 150 155 160 Asn Lys Trp Tyr Gln Tyr Phe Ile Gly Arg Ile Ile Ser Gly Leu Gly 165 170 175 Val Gly Gly Ile Ala Val Leu Ser Pro Met Leu Ile Ser Glu Val Ala 180 185 190 Pro Lys Gln Ile Arg Gly Thr Leu Val Gln Leu Tyr Gln Leu Met Cys 195 200 205 Thr Met Gly Ile Phe Leu Gly Tyr Cys Thr Asn Tyr Gly Thr Lys Asn 210 215 220 Tyr His Asn Ala Thr Gln Trp Arg Val Gly Leu Gly Leu Cys Phe Ala 225 230 235 240 Trp Thr Thr Phe Met Val Ser Gly Met Met Phe Val Pro Glu Ser Pro 245 250 255 Arg Tyr Leu Ile Glu Val Gly Lys Asp Glu Glu Ala Lys Arg Ser Leu 260 265 270 Ser Lys Ser Asn Lys Val Ser Val Asp Asp Pro Ala Leu Leu Ala Glu 275 280 285 Tyr Asp Thr Ile Lys Ala Gly Ile Glu Leu Glu Lys Leu Ala Gly Asn 290 295 300 Ala Ser Trp Ser Glu Leu Leu Ser Thr Lys Thr Lys Val Phe Gln Arg 305 310 315 320 Val Leu Met Gly Val Met Ile Gln Ser Leu Gln Gln Leu Thr Gly Asp 325 330 335 Asn Tyr Phe Phe Tyr Tyr Gly Thr Thr Ile Phe Lys Ser Val Gly Leu 340 345 350 Lys Asp Ser Phe Gln Thr Ser Ile Ile Ile Gly Val Val Asn Phe Phe 355 360 365 Ser Ser Phe Ile Ala Val Tyr Thr Ile Glu Arg Phe Gly Arg Arg Thr 370 375 380 Cys Leu Leu Trp Gly Ala Ala Ser Met Leu Cys Cys Phe Ala Val Phe 385 390 395 400 Ala Ser Val Gly Val Thr Lys Leu Trp Pro Gln Gly Ser Ser His Gln 405 410 415 Asp Ile Thr Ser Gln Gly Ala Gly Asn Cys Met Ile Val Phe Thr Met 420 425 430 Phe Phe Ile Phe Ser Phe Ala Thr Thr Trp Ala Gly Gly Cys Tyr Val 435 440 445 Ile Val Ser Glu Thr Phe Pro Leu Arg Val Lys Ser Arg Gly Met Ala 450 455 460 Ile Ala Thr Ala Ala Asn Trp Met Trp Gly Phe Leu Ile Ser Phe Phe 465 470 475 480 Thr Pro Phe Ile Thr Gly Ala Ile Asn Phe Tyr Tyr Gly Tyr Val Phe 485 490 495 Leu Gly Cys Leu Val Phe Ala Tyr Phe Tyr Val Phe Phe Phe Val Pro 500 505 510 Glu Thr Lys Gly Leu Thr Leu Glu Glu Val Asn Thr Met Trp Leu Glu 515 520 525 Gly Val Pro Ala Trp Lys Ser Ala Ser Trp Val Pro Pro Glu Arg Arg 530 535 540 Thr Ala Asp Tyr Asp Ala Asp Ala Ile Asp His Asp Asp Arg Pro Ile 545 550 555 560 Tyr Lys Arg Phe Phe Ser Ser 565 <210> 160 <211> 546 <212> PRT <213> Saccharomyces cerevisiae <220> <223> Hxt10 (Fig. 10) <400> 160 Met Val Ser Ser Ser Val Ser Ile Leu Gly Thr Ser Ala Lys Ala Ser 1 5 10 15 Thr Ser Leu Ser Arg Lys Asp Glu Ile Lys Leu Thr Pro Glu Thr Arg 20 25 30 Glu Ala Ser Leu Asp Ile Pro Tyr Lys Pro Ile Ile Ala Tyr Trp Thr 35 40 45 Val Met Gly Leu Cys Leu Met Ile Ala Phe Gly Gly Phe Ile Phe Gly 50 55 60 Trp Asp Thr Gly Thr Ile Ser Gly Phe Ile Asn Gln Thr Asp Phe Lys 65 70 75 80 Arg Arg Phe Gly Glu Leu Gln Arg Asp Gly Ser Phe Gln Leu Ser Asp 85 90 95 Val Arg Thr Gly Leu Ile Val Gly Ile Phe Asn Ile Gly Cys Ala Leu 100 105 110 Gly Gly Leu Thr Leu Gly Arg Leu Gly Asp Ile Tyr Gly Arg Lys Ile 115 120 125 Gly Leu Met Cys Val Ile Leu Val Tyr Val Val Gly Ile Val Ile Gln 130 135 140 Ile Ala Ser Ser Asp Lys Trp Tyr Gln Tyr Phe Ile Gly Arg Ile Val 145 150 155 160 Ser Gly Met Gly Val Gly Gly Val Ala Val Leu Ser Pro Thr Leu Ile 165 170 175 Ser Glu Ile Ser Pro Lys His Leu Arg Gly Thr Cys Val Ser Phe Tyr 180 185 190 Gln Leu Met Ile Thr Leu Gly Ile Phe Leu Gly Tyr Cys Thr Asn Tyr 195 200 205 Gly Thr Lys Lys Tyr Ser Asn Ser Ile Gln Trp Arg Val Pro Leu Gly 210 215 220 Leu Cys Phe Ala Trp Ala Ile Phe Met Val Ile Gly Met Val Met Val 225 230 235 240 Pro Glu Ser Pro Arg Tyr Leu Val Glu Lys Gly Lys Tyr Glu Glu Ala 245 250 255 Arg Arg Ser Leu Ala Lys Ser Asn Lys Val Thr Val Thr Asp Pro Gly 260 265 270 Val Val Phe Glu Phe Asp Thr Ile Val Ala Asn Met Glu Leu Glu Arg 275 280 285 Ala Val Gly Asn Ala Ser Trp His Glu Leu Phe Ser Asn Lys Gly Ala 290 295 300 Ile Leu Pro Arg Val Ile Met Gly Ile Val Ile Gln Ser Leu Gln Gln 305 310 315 320 Leu Thr Gly Cys Asn Tyr Phe Phe Tyr Tyr Gly Thr Thr Ile Phe Asn 325 330 335 Ala Val Gly Met Gln Asp Ser Phe Glu Thr Ser Ile Val Leu Gly Ala 340 345 350 Val Asn Phe Ala Ser Thr Phe Val Ala Leu Tyr Ile Val Asp Lys Phe 355 360 365 Gly Arg Arg Lys Cys Leu Leu Trp Gly Ser Ala Ser Met Ala Ile Cys 370 375 380 Phe Val Ile Phe Ala Thr Val Gly Val Thr Arg Leu Trp Pro Gln Gly 385 390 395 400 Lys Asp Gln Pro Ser Ser Gln Ser Ala Gly Asn Val Met Ile Val Phe 405 410 415 Thr Cys Phe Phe Ile Phe Ser Phe Ala Ile Thr Trp Ala Pro Ile Ala 420 425 430 Tyr Val Ile Val Ala Glu Thr Tyr Pro Leu Arg Val Lys Asn Arg Ala 435 440 445 Met Ala Ile Ala Val Gly Ala Asn Trp Met Trp Gly Phe Leu Ile Gly 450 455 460 Phe Phe Thr Pro Phe Ile Thr Arg Ser Ile Gly Phe Ser Tyr Gly Tyr 465 470 475 480 Val Phe Met Gly Cys Leu Ile Phe Ser Tyr Phe Tyr Val Phe Phe Phe 485 490 495 Val Cys Glu Thr Lys Gly Leu Thr Leu Glu Glu Val Asn Glu Met Tyr 500 505 510 Glu Glu Arg Ile Lys Pro Trp Lys Ser Gly Gly Trp Ile Pro Ser Ser 515 520 525 Arg Arg Thr Pro Gln Pro Thr Ser Ser Thr Pro Leu Val Ile Val Asp 530 535 540 Ser Lys 545 <210> 161 <211> 567 <212> PRT <213> Saccharomyces cerevisiae <220> <223> Hxt11 (Fig. 10) <400> 161 Met Ser Gly Val Asn Asn Thr Ser Ala Asn Glu Leu Ser Thr Thr Met 1 5 10 15 Ser Asn Ser Asn Ser Ala Val Gly Ala Pro Ser Val Lys Thr Glu His 20 25 30 Gly Asp Ser Lys Asn Ser Leu Asn Leu Asp Ala Asn Glu Pro Pro Ile 35 40 45 Asp Leu Pro Gln Lys Pro Leu Ser Ala Tyr Thr Thr Val Ala Ile Leu 50 55 60 Cys Leu Met Ile Ala Phe Gly Gly Phe Ile Phe Gly Trp Asp Thr Gly 65 70 75 80 Thr Ile Ser Gly Phe Val Asn Leu Ser Asp Phe Ile Arg Arg Phe Gly 85 90 95 Gln Lys Asn Asp Lys Gly Thr Tyr Tyr Leu Ser Lys Val Arg Met Gly 100 105 110 Leu Ile Val Ser Ile Phe Asn Ile Gly Cys Ala Ile Gly Gly Ile Val 115 120 125 Leu Ser Lys Val Gly Asp Ile Tyr Gly Arg Arg Ile Gly Leu Ile Thr 130 135 140 Val Thr Ala Ile Tyr Val Val Gly Ile Leu Ile Gln Ile Thr Ser Ile 145 150 155 160 Asn Lys Trp Tyr Gln Tyr Phe Ile Gly Arg Ile Ile Ser Gly Leu Gly 165 170 175 Val Gly Gly Ile Ala Val Leu Ser Pro Met Leu Ile Ser Glu Val Ala 180 185 190 Pro Lys His Ile Arg Gly Thr Leu Val Gln Leu Tyr Gln Leu Met Gly 195 200 205 Thr Met Gly Ile Phe Leu Gly Tyr Cys Thr Asn Tyr Gly Thr Lys Asn 210 215 220 Tyr His Asn Ala Thr Gln Trp Arg Val Gly Leu Gly Leu Cys Phe Ala 225 230 235 240 Trp Ala Thr Phe Met Val Ser Gly Met Met Phe Val Pro Glu Ser Pro 245 250 255 Arg Tyr Leu Ile Glu Val Gly Lys Asp Glu Glu Ala Lys Arg Ser Leu 260 265 270 Ser Lys Ser Asn Lys Val Ser Val Asp Asp Pro Ala Leu Leu Val Glu 275 280 285 Tyr Asp Thr Ile Lys Ala Gly Ile Glu Leu Glu Lys Leu Ala Gly Asn 290 295 300 Ala Ser Trp Ser Glu Leu Leu Ser Thr Lys Thr Lys Val Phe Gln Arg 305 310 315 320 Val Leu Met Gly Val Met Ile Gln Ser Leu Gln Gln Leu Thr Gly Asp 325 330 335 Asn Tyr Phe Phe Tyr Tyr Gly Thr Thr Ile Phe Lys Ser Val Gly Leu 340 345 350 Lys Asp Ser Phe Gln Thr Ser Ile Ile Ile Gly Val Val Asn Phe Phe 355 360 365 Ser Ser Phe Ile Ala Val Tyr Thr Ile Glu Arg Phe Gly Arg Arg Thr 370 375 380 Cys Leu Leu Trp Gly Ala Ala Ser Met Leu Cys Cys Phe Ala Val Phe 385 390 395 400 Ala Ser Val Gly Val Thr Lys Leu Trp Pro Gln Gly Ser Ser His Gln 405 410 415 Asp Ile Thr Ser Gln Gly Ala Gly Asn Cys Met Ile Val Phe Thr Met 420 425 430 Phe Phe Ile Phe Ser Phe Ala Thr Thr Trp Ala Gly Gly Cys Tyr Val 435 440 445 Ile Val Ser Glu Thr Phe Pro Leu Arg Val Lys Ser Arg Gly Met Ala 450 455 460 Ile Ala Thr Ala Ala Asn Trp Met Trp Gly Phe Leu Ile Ser Phe Phe 465 470 475 480 Thr Pro Phe Ile Thr Gly Ala Ile Asn Phe Tyr Tyr Gly Tyr Val Phe 485 490 495 Leu Gly Cys Leu Val Phe Ala Tyr Phe Tyr Val Phe Phe Phe Val Pro 500 505 510 Glu Thr Lys Gly Leu Thr Leu Glu Glu Val Asn Thr Met Trp Leu Glu 515 520 525 Gly Val Pro Ala Trp Lys Ser Ala Ser Trp Val Pro Pro Glu Arg Arg 530 535 540 Thr Ala Asp Tyr Asp Ala Asp Ala Ile Asp His Asp Asn Arg Pro Ile 545 550 555 560 Tyr Lys Arg Phe Phe Ser Ser 565 <210> 162 <211> 457 <212> PRT <213> Saccharomyces cerevisiae <220> <223> Hxt12 (Fig. 10) <400> 162 Met Gly Leu Ile Val Ser Ile Phe Asn Ile Gly Cys Ala Ile Gly Gly 1 5 10 15 Ile Val Leu Ser Lys Val Gly Asp Ile Tyr Gly Arg Arg Ile Gly Leu 20 25 30 Ile Thr Val Thr Ala Ile Tyr Val Val Gly Ile Leu Ile Gln Ile Thr 35 40 45 Ser Ile Asn Lys Trp Tyr Gln Tyr Phe Ile Gly Arg Ile Ile Ser Gly 50 55 60 Ile Gly Val Gly Gly Ile Ala Val Leu Ser Pro Met Leu Ile Ser Glu 65 70 75 80 Val Ala Pro Lys His Ile Arg Gly Thr Leu Val Gln Leu Tyr Gln Leu 85 90 95 Met Gly Thr Met Gly Ile Phe Leu Gly Tyr Cys Thr Asn Tyr Gly Thr 100 105 110 Lys Asn Tyr His Asn Ala Thr Gln Trp Arg Val Gly Leu Gly Leu Cys 115 120 125 Phe Ala Trp Ala Thr Phe Met Val Ser Gly Met Met Phe Val Pro Glu 130 135 140 Ser Pro Arg Tyr Leu Ile Glu Val Gly Lys Asp Glu Glu Ala Lys His 145 150 155 160 Ser Leu Ser Lys Ser Asn Lys Val Ser Val Asp Asp Pro Ala Leu Leu 165 170 175 Ala Glu Tyr Asp Thr Ile Lys Ala Gly Ile Glu Ile Glu Lys Leu Ala 180 185 190 Gly Asn Ala Ser Trp Ser Glu Leu Leu Ser Thr Lys Thr Lys Val Phe 195 200 205 Gln Arg Val Leu Met Gly Val Ile Ile Gln Ser Leu Gln Gln Leu Thr 210 215 220 Gly Asp Asn Tyr Phe Phe Tyr Tyr Gly Thr Thr Ile Phe Lys Ser Val 225 230 235 240 Gly Leu Lys Asp Ser Phe Gln Thr Ser Ile Ile Ile Gly Val Val Asn 245 250 255 Phe Phe Ser Ser Phe Ile Ala Val Tyr Thr Ile Glu Arg Phe Gly Arg 260 265 270 Arg Thr Cys Leu Leu Trp Gly Ala Ala Ser Met Leu Cys Cys Phe Ala 275 280 285 Val Phe Ala Ser Val Gly Val Thr Lys Leu Trp Pro Gln Gly Ser Ser 290 295 300 His Gln Asp Ile Thr Ser Gln Gly Ala Gly Asn Cys Met Ile Val Phe 305 310 315 320 Thr Met Phe Phe Ile Phe Ser Phe Ala Thr Thr Trp Ala Gly Gly Cys 325 330 335 Phe Val Ile Val Ser Glu Thr Phe Pro Leu Arg Ala Lys Ser Arg Gly 340 345 350 Met Ala Ile Ala Thr Ala Ala Asn Trp Met Trp Gly Phe Leu Ile Ser 355 360 365 Phe Phe Thr Pro Phe Ile Thr Gly Ala Ile Asn Phe Tyr Tyr Gly Tyr 370 375 380 Val Phe Leu Gly Cys Leu Val Phe Ala Tyr Phe Tyr Val Phe Phe Phe 385 390 395 400 Val Pro Glu Thr Lys Gly Leu Thr Leu Glu Glu Val Asn Thr Met Trp 405 410 415 Leu Glu Gly Val Pro Ala Trp Lys Ser Ala Ser Trp Val Pro Pro Glu 420 425 430 Arg Arg Thr Ala Asp Tyr Asp Ala Asp Ala Ile Asp His Asp Asn Arg 435 440 445 Pro Ile Tyr Lys Arg Phe Phe Ser Ser 450 455 <210> 163 <211> 564 <212> PRT <213> Saccharomyces cerevisiae <220> <223> Hxt13 (Fig. 10) <400> 163 Met Ser Ser Ala Gln Ser Ser Ile Asp Ser Asp Gly Asp Val Arg Asp 1 5 10 15 Ala Asp Ile His Val Ala Pro Pro Val Glu Lys Glu Trp Ser Asp Gly 20 25 30 Phe Asp Asp Asn Glu Val Ile Asn Gly Asp Asn Val Glu Pro Pro Lys 35 40 45 Arg Gly Leu Ile Gly Tyr Leu Val Ile Tyr Leu Leu Cys Tyr Pro Ile 50 55 60 Ser Phe Gly Gly Phe Leu Pro Gly Trp Asp Ser Gly Ile Thr Ala Gly 65 70 75 80 Phe Ile Asn Met Asp Asn Phe Lys Met Asn Phe Gly Ser Tyr Lys His 85 90 95 Ser Thr Gly Glu Tyr Tyr Leu Ser Asn Val Arg Met Gly Leu Leu Val 100 105 110 Ala Met Phe Ser Ile Gly Cys Ala Ile Gly Gly Leu Ile Phe Ala Arg 115 120 125 Leu Ala Asp Thr Leu Gly Arg Arg Leu Ala Ile Val Ile Val Val Leu 130 135 140 Val Tyr Met Val Gly Ala Ile Ile Gln Ile Ser Ser Asn His Lys Trp 145 150 155 160 Tyr Gln Tyr Phe Val Gly Lys Ile Ile Tyr Gly Leu Gly Ala Gly Gly 165 170 175 Cys Ser Val Leu Cys Pro Met Leu Leu Ser Glu Ile Ala Pro Thr Asp 180 185 190 Leu Arg Gly Gly Leu Val Ser Leu Tyr Gln Leu Asn Met Thr Phe Gly 195 200 205 Ile Phe Leu Gly Tyr Cys Ser Val Tyr Gly Thr Arg Lys Tyr Asp Asn 210 215 220 Thr Ala Gln Trp Arg Val Pro Leu Gly Leu Cys Phe Leu Trp Ala Leu 225 230 235 240 Ile Ile Ile Ile Gly Met Leu Leu Val Pro Glu Ser Pro Arg Tyr Leu 245 250 255 Ile Glu Cys Glu Arg His Glu Glu Ala Arg Ala Ser Ile Ala Lys Ile 260 265 270 Asn Lys Val Ser Pro Glu Asp Pro Trp Val Leu Lys Gln Ala Asp Glu 275 280 285 Ile Asn Ala Gly Val Leu Ala Gln Arg Glu Leu Gly Glu Ala Ser Trp 290 295 300 Lys Glu Leu Phe Ser Val Lys Thr Lys Val Leu Gln Arg Leu Ile Thr 305 310 315 320 Gly Ile Leu Val Gln Thr Phe Leu Gln Leu Thr Gly Glu Asn Tyr Phe 325 330 335 Phe Phe Tyr Gly Thr Thr Ile Phe Lys Ser Val Gly Leu Thr Asp Gly 340 345 350 Phe Glu Thr Ser Ile Val Leu Gly Thr Val Asn Phe Phe Ser Thr Ile 355 360 365 Ile Ala Val Met Val Val Asp Lys Ile Gly Arg Arg Lys Cys Leu Leu 370 375 380 Phe Gly Ala Ala Gly Met Met Ala Cys Met Val Ile Phe Ala Ser Ile 385 390 395 400 Gly Val Lys Cys Leu Tyr Pro His Gly Gln Asp Gly Pro Ser Ser Lys 405 410 415 Gly Ala Gly Asn Ala Met Ile Val Phe Thr Cys Phe Tyr Ile Phe Cys 420 425 430 Phe Ala Thr Thr Trp Ala Pro Val Ala Tyr Ile Val Val Ala Glu Ser 435 440 445 Phe Pro Ser Lys Val Lys Ser Arg Ala Met Ser Ile Ser Thr Ala Cys 450 455 460 Asn Trp Leu Trp Gln Phe Leu Ile Gly Phe Phe Thr Pro Phe Ile Thr 465 470 475 480 Gly Ser Ile His Phe Tyr Tyr Gly Tyr Val Phe Val Gly Cys Leu Val 485 490 495 Ala Met Phe Leu Tyr Val Phe Phe Phe Leu Pro Glu Thr Ile Gly Leu 500 505 510 Ser Leu Glu Glu Ile Gln Leu Leu Tyr Glu Glu Gly Ile Lys Pro Trp 515 520 525 Lys Ser Ala Ser Trp Val Pro Pro Ser Arg Arg Gly Ile Ser Ser Glu 530 535 540 Glu Ser Lys Thr Glu Lys Lys Asp Trp Lys Lys Phe Leu Lys Phe Ser 545 550 555 560 Lys Asn Ser Asp <210> 164 <211> 540 <212> PRT <213> Saccharomyces cerevisiae <220> <223> Hxt14 (Fig. 10) <400> 164 Met Thr Ala Gln Ile Pro Tyr Gln His Ser Ser Gly Tyr Ile Ser His 1 5 10 15 Phe His Asn Asn Glu Leu Asp Ala Gly Arg Gly Arg Asp Tyr Asn Val 20 25 30 Thr Ile Lys Tyr Leu Asp Asp Lys Glu Glu Asn Ile Glu Gly Gln Ala 35 40 45 Ala Lys Ile Ser His Asn Ala Ser Leu His Ile Pro Val Leu Leu Cys 50 55 60 Leu Val Ile Ser Leu Gly Gly Phe Ile Phe Gly Trp Asp Ile Gly Thr 65 70 75 80 Ile Gly Gly Met Thr Asn Met Val Ser Phe Gln Glu Lys Phe Gly Thr 85 90 95 Thr Asn Ile Ile His Asp Asp Glu Thr Ile Phe Val Ser Thr Lys Lys 100 105 110 Leu Thr Asp Leu Gln Ile Gly Leu Ile Ile Ser Ile Phe Asn Ile Ser 115 120 125 Cys Gly Val Gly Ala Leu Thr Leu Ser Lys Ile Gly Asp Trp Ile Gly 130 135 140 Arg Lys Gly Gly Ile Trp Phe Ala Leu Val Val Tyr Cys Ile Gly Ile 145 150 155 160 Thr Ile Gln Ile Leu Ser Tyr Gly Arg Trp Tyr Phe Leu Thr Leu Gly 165 170 175 Arg Ala Val Thr Gly Ile Gly Val Gly Val Thr Thr Val Leu Val Pro 180 185 190 Met Phe Leu Ser Glu Asn Ser Pro Leu Lys Ile Arg Gly Ser Met Val 195 200 205 Ser Thr Tyr Gln Leu Ile Val Thr Phe Gly Ile Leu Met Gly Asn Ile 210 215 220 Leu Asn Phe Ile Cys Glu Arg Cys Tyr Lys Asp Pro Thr Gln Asn Ile 225 230 235 240 Ala Trp Gln Leu Pro Leu Phe Leu Gly Tyr Ile Trp Ala Ile Ile Ile 245 250 255 Gly Met Ser Leu Val Tyr Val Pro Glu Ser Pro Gln Tyr Leu Ala Lys 260 265 270 Ile Lys Asn Asp Val Pro Ser Ala Lys Tyr Ser Phe Ala Arg Met Asn 275 280 285 Gly Ile Pro Ala Thr Asp Ser Met Val Ile Glu Phe Ile Asp Asp Leu 290 295 300 Leu Glu Asn Asn Tyr Asn Asn Glu Glu Thr Asn Asn Glu Ser Lys Lys 305 310 315 320 Gln Ser Leu Val Lys Arg Asn Thr Phe Glu Phe Ile Met Gly Lys Pro 325 330 335 Lys Leu Trp Leu Arg Leu Ile Ile Gly Met Met Ile Met Ala Phe Gln 340 345 350 Gln Leu Ser Gly Ile Asn Tyr Phe Phe Tyr Tyr Gly Thr Ser Val Phe 355 360 365 Lys Gly Val Gly Ile Lys Asp Pro Tyr Ile Thr Ser Ile Ile Leu Ser 370 375 380 Ser Val Asn Phe Leu Ser Thr Ile Leu Gly Ile Tyr Tyr Val Glu Lys 385 390 395 400 Trp Gly His Lys Thr Cys Leu Leu Tyr Gly Ser Thr Asn Leu Leu Phe 405 410 415 Tyr Met Met Thr Tyr Ala Thr Val Gly Thr Phe Gly Arg Glu Thr Asp 420 425 430 Phe Ser Asn Ile Val Leu Ile Ile Val Thr Cys Cys Phe Ile Phe Trp 435 440 445 Phe Ala Ile Thr Leu Gly Pro Val Thr Phe Val Leu Val Ser Glu Leu 450 455 460 Phe Pro Leu Arg Thr Arg Ala Ile Ser Met Ala Ile Cys Thr Phe Ile 465 470 475 480 Asn Trp Met Phe Asn Phe Leu Ile Ser Leu Leu Thr Pro Met Ile Val 485 490 495 Ser Lys Ile Asp Phe Lys Leu Gly Tyr Ile Phe Ala Ala Cys Leu Leu 500 505 510 Ala Leu Ile Ile Phe Ser Trp Ile Leu Val Pro Glu Thr Arg Lys Lys 515 520 525 Asn Glu Gln Glu Ile Asn Lys Ile Phe Glu Pro Glu 530 535 540 <210> 165 <211> 567 <212> PRT <213> Saccharomyces cerevisiae <220> <223> Hxt15 (Fig. 10) <400> 165 Met Ala Ser Glu Gln Ser Ser Pro Glu Ile Asn Ala Asp Asn Leu Asn 1 5 10 15 Ser Ser Ala Ala Asp Val His Val Gln Pro Pro Gly Glu Lys Glu Trp 20 25 30 Ser Asp Gly Phe Tyr Asp Lys Glu Val Ile Asn Gly Asn Thr Pro Asp 35 40 45 Ala Pro Lys Arg Gly Phe Leu Gly Tyr Leu Ile Ile Tyr Leu Leu Cys 50 55 60 Tyr Pro Val Ser Phe Gly Gly Phe Leu Pro Gly Trp Asp Ser Gly Ile 65 70 75 80 Thr Ala Gly Phe Ile Asn Met Asp Asn Phe Lys Met Asn Phe Gly Ser 85 90 95 Tyr Lys His Ser Thr Gly Glu Tyr Tyr Leu Ser Asn Val Arg Met Gly 100 105 110 Leu Leu Val Ala Met Phe Ser Val Gly Cys Ser Ile Gly Gly Val Ala 115 120 125 Phe Ala Arg Leu Ala Asp Thr Leu Gly Arg Arg Leu Ala Ile Val Ile 130 135 140 Val Val Leu Val Tyr Met Val Gly Ala Ile Ile Gln Ile Ser Ser Asn 145 150 155 160 His Lys Trp Tyr Gln Tyr Phe Val Gly Lys Ile Ile Tyr Gly Leu Gly 165 170 175 Ala Gly Gly Cys Ser Val Leu Cys Pro Met Leu Leu Ser Glu Ile Ala 180 185 190 Pro Thr Asp Leu Arg Gly Gly Leu Val Ser Leu Tyr Gln Leu Asn Met 195 200 205 Thr Phe Gly Ile Phe Leu Gly Tyr Cys Ser Val Tyr Gly Thr Arg Lys 210 215 220 Tyr Ser Asn Thr Ala Gln Trp Arg Ile Pro Val Gly Leu Cys Phe Leu 225 230 235 240 Trp Ala Leu Ile Ile Ile Val Gly Met Leu Leu Val Pro Glu Ser Pro 245 250 255 Arg Tyr Leu Ile Glu Cys Glu Arg His Glu Glu Ala Cys Val Ser Ile 260 265 270 Ala Lys Ile Asn Lys Val Ser Pro Glu Asp Pro Trp Val Leu Lys Gln 275 280 285 Ala Asp Glu Ile Asn Ala Gly Val Leu Ala Gln Arg Glu Leu Gly Glu 290 295 300 Ala Ser Trp Lys Glu Leu Phe Ser Val Lys Thr Lys Val Leu Gln Arg 305 310 315 320 Leu Ile Thr Gly Ile Leu Val Gln Thr Phe Leu Gln Leu Thr Gly Glu 325 330 335 Asn Tyr Phe Phe Phe Tyr Gly Thr Thr Ile Phe Lys Ser Val Gly Leu 340 345 350 Thr Asp Gly Phe Glu Thr Ser Ile Val Leu Gly Thr Val Asn Phe Phe 355 360 365 Ser Thr Ile Ile Ala Val Met Val Val Asp Lys Ile Gly Arg Arg Lys 370 375 380 Cys Leu Leu Phe Gly Ala Ala Ser Met Met Ala Cys Met Val Ile Phe 385 390 395 400 Ala Ser Ile Gly Val Lys Cys Leu Tyr Pro His Gly Gln Asp Gly Pro 405 410 415 Ser Ser Lys Gly Ala Gly Asn Ala Met Ile Val Phe Thr Cys Phe Tyr 420 425 430 Ile Phe Cys Phe Ala Thr Thr Trp Ala Pro Val Ala Tyr Ile Val Val 435 440 445 Ala Glu Ser Phe Pro Ser Lys Val Lys Ser Lys Ala Met Ser Ile Ser 450 455 460 Thr Ala Phe Asn Trp Leu Trp Gln Phe Leu Ile Gly Phe Phe Thr Pro 465 470 475 480 Phe Ile Thr Gly Ser Ile His Phe Tyr Tyr Gly Tyr Val Phe Val Gly 485 490 495 Cys Leu Val Ala Met Phe Leu Tyr Val Phe Phe Phe Leu Pro Glu Thr 500 505 510 Ile Gly Leu Ser Leu Glu Glu Ile Gln Leu Leu Tyr Glu Glu Gly Ile 515 520 525 Lys Pro Trp Lys Ser Ala Ser Trp Val Pro Pro Ser Arg Arg Gly Ala 530 535 540 Ser Ser Arg Glu Thr Glu Ala Lys Lys Lys Ser Trp Lys Glu Val Leu 545 550 555 560 Lys Phe Pro Lys Ser Phe Asn 565 <210> 166 <211> 567 <212> PRT <213> Saccharomyces cerevisiae <220> <223> Hxt16 (Fig. 10) <400> 166 Met Ala Ser Glu Gln Ser Ser Pro Glu Ile Asn Ala Asp Asn Leu Asn 1 5 10 15 Ser Ser Ala Ala Asp Val His Val Gln Pro Pro Gly Glu Lys Glu Trp 20 25 30 Ser Asp Gly Phe Tyr Asp Lys Glu Val Ile Asn Gly Asn Thr Pro Asp 35 40 45 Ala Pro Lys Arg Gly Phe Leu Gly Tyr Leu Ile Ile Tyr Leu Leu Cys 50 55 60 Tyr Pro Val Ser Phe Gly Gly Phe Leu Pro Gly Trp Asp Ser Gly Ile 65 70 75 80 Thr Ala Gly Phe Ile Asn Met Asp Asn Phe Lys Met Asn Phe Gly Ser 85 90 95 Tyr Lys His Ser Thr Gly Glu Tyr Tyr Leu Ser Asn Val Arg Met Gly 100 105 110 Leu Leu Val Ala Met Phe Ser Val Gly Cys Ser Ile Gly Gly Val Ala 115 120 125 Phe Ala Arg Leu Ala Asp Thr Leu Gly Arg Arg Leu Ala Ile Val Ile 130 135 140 Val Val Leu Val Tyr Met Val Gly Ala Ile Ile Gln Ile Ser Ser Asn 145 150 155 160 His Lys Trp Tyr Gln Tyr Phe Val Gly Lys Ile Ile Tyr Gly Leu Gly 165 170 175 Ala Gly Gly Cys Ser Val Leu Cys Pro Met Leu Leu Ser Glu Ile Ala 180 185 190 Pro Thr Asp Leu Arg Gly Gly Leu Val Ser Leu Tyr Gln Leu Asn Met 195 200 205 Thr Phe Gly Ile Phe Leu Gly Tyr Cys Ser Val Tyr Gly Thr Arg Lys 210 215 220 Tyr Ser Asn Thr Ala Gln Trp Arg Ile Pro Val Gly Leu Cys Phe Leu 225 230 235 240 Trp Ala Leu Ile Ile Ile Val Gly Met Leu Leu Val Pro Glu Ser Pro 245 250 255 Arg Tyr Leu Ile Glu Cys Glu Arg His Glu Glu Ala Cys Val Ser Ile 260 265 270 Ala Lys Ile Asp Lys Val Ser Pro Glu Asp Pro Trp Val Leu Lys Gln 275 280 285 Ala Asp Glu Ile Asn Ala Gly Val Leu Ala Gln Arg Glu Leu Gly Glu 290 295 300 Ala Ser Trp Lys Glu Leu Phe Ser Val Lys Thr Lys Val Leu Gln Arg 305 310 315 320 Leu Ile Thr Gly Ile Leu Val Gln Thr Phe Leu Gln Leu Thr Gly Glu 325 330 335 Asn Tyr Phe Phe Phe Tyr Gly Thr Thr Ile Phe Lys Ser Val Gly Leu 340 345 350 Thr Asp Gly Phe Glu Thr Ser Ile Val Leu Gly Thr Val Asn Phe Phe 355 360 365 Ser Thr Ile Ile Ala Val Met Val Val Asp Lys Ile Gly Arg Arg Lys 370 375 380 Cys Leu Leu Phe Gly Ala Ala Ser Met Met Ala Cys Met Val Ile Phe 385 390 395 400 Ala Ser Ile Gly Val Lys Cys Leu Tyr Pro His Gly Gln Asp Gly Pro 405 410 415 Ser Ser Lys Gly Ala Gly Asn Ala Met Ile Val Phe Thr Cys Phe Tyr 420 425 430 Ile Phe Cys Phe Ala Thr Thr Trp Ala Pro Val Ala Tyr Ile Val Val 435 440 445 Ala Glu Ser Phe Pro Ser Lys Val Lys Ser Lys Ala Met Ser Ile Ser 450 455 460 Thr Ala Phe Asn Trp Leu Trp Gln Phe Leu Ile Gly Phe Phe Thr Pro 465 470 475 480 Phe Ile Thr Gly Ser Ile His Phe Tyr Tyr Gly Tyr Val Phe Val Gly 485 490 495 Cys Leu Val Ala Met Phe Leu Tyr Val Phe Phe Phe Leu Pro Glu Thr 500 505 510 Ile Gly Leu Ser Leu Glu Glu Thr Gln Leu Leu Tyr Glu Glu Gly Ile 515 520 525 Lys Pro Trp Lys Ser Ala Ser Trp Val Pro Pro Ser Arg Arg Gly Ala 530 535 540 Ser Ser Arg Glu Thr Glu Ala Lys Lys Lys Ser Trp Lys Glu Val Leu 545 550 555 560 Lys Phe Pro Lys Ser Phe Asn 565 <210> 167 <211> 564 <212> PRT <213> Saccharomyces cerevisiae <220> <223> Hxt17 (Fig. 10) <400> 167 Met Gln Ser Ser Thr Glu Ser Asp Arg Asp Ile Gln Asp Gly Pro Asp 1 5 10 15 Ala Asp Ile His Val Ala Pro Pro Val Glu Lys Glu Trp Ser Asp Gly 20 25 30 Phe Asp Asp Asn Glu Val Ile Asn Gly Asp Asn Val Glu Pro Pro Lys 35 40 45 Arg Gly Leu Ile Gly Tyr Leu Val Ile Tyr Leu Leu Cys Tyr Pro Ile 50 55 60 Ser Phe Gly Gly Phe Leu Pro Gly Trp Asp Ser Gly Ile Thr Ala Gly 65 70 75 80 Phe Ile Asn Met Asp Asn Phe Lys Met Asn Phe Gly Ser Tyr Lys His 85 90 95 Ser Thr Gly Glu Tyr Tyr Leu Ser Asn Val Arg Met Gly Leu Leu Val 100 105 110 Ala Met Phe Ser Ile Gly Cys Ala Ile Gly Gly Leu Ile Phe Ala Arg 115 120 125 Leu Ala Asp Thr Leu Gly Arg Arg Leu Ala Ile Val Ile Val Val Leu 130 135 140 Val Tyr Met Val Gly Ala Ile Ile Gln Ile Ser Ser Asn His Lys Trp 145 150 155 160 Tyr Gln Tyr Phe Val Gly Lys Ile Ile Tyr Gly Leu Gly Ala Gly Gly 165 170 175 Cys Ser Val Leu Cys Pro Met Leu Leu Ser Glu Ile Ala Pro Thr Asp 180 185 190 Leu Arg Gly Gly Leu Val Ser Leu Tyr Gln Leu Asn Met Thr Phe Gly 195 200 205 Ile Phe Leu Gly Tyr Cys Ser Val Tyr Gly Thr Arg Lys Tyr Asp Asn 210 215 220 Thr Ala Gln Trp Arg Val Pro Leu Gly Leu Cys Phe Leu Trp Thr Leu 225 230 235 240 Ile Ile Ile Ile Gly Met Leu Leu Val Pro Glu Ser Pro Arg Tyr Leu 245 250 255 Ile Glu Cys Glu Arg His Glu Glu Ala Arg Ala Ser Ile Ala Lys Ile 260 265 270 Asn Lys Val Ser Pro Glu Asp Pro Trp Val Leu Lys Gln Ala Asp Glu 275 280 285 Ile Asn Ala Gly Val Leu Ala Gln Arg Glu Leu Gly Glu Ala Ser Trp 290 295 300 Lys Glu Leu Phe Ser Val Lys Thr Lys Val Leu Gln Arg Leu Ile Thr 305 310 315 320 Gly Ile Leu Val Gln Thr Phe Leu Gln Leu Thr Gly Glu Asn Tyr Phe 325 330 335 Phe Phe Tyr Gly Thr Thr Ile Phe Lys Ser Val Gly Leu Thr Asp Gly 340 345 350 Phe Glu Thr Ser Ile Val Leu Gly Thr Val Asn Phe Phe Ser Thr Ile 355 360 365 Ile Ala Val Met Val Val Asp Lys Ile Gly Arg Arg Lys Cys Leu Leu 370 375 380 Phe Gly Ala Ala Gly Met Met Ala Cys Met Val Ile Phe Ala Ser Ile 385 390 395 400 Gly Val Lys Cys Leu Tyr Pro His Gly Gln Asp Gly Pro Ser Ser Lys 405 410 415 Gly Ala Gly Asn Ala Met Ile Val Phe Thr Cys Phe Tyr Ile Phe Cys 420 425 430 Phe Ala Thr Thr Trp Ala Pro Val Ala Tyr Ile Val Val Ala Glu Ser 435 440 445 Phe Pro Ser Lys Val Lys Ser Arg Ala Met Ser Ile Ser Thr Ala Cys 450 455 460 Asn Trp Leu Trp Gln Phe Leu Ile Gly Phe Phe Thr Pro Phe Ile Thr 465 470 475 480 Gly Ser Ile His Phe Tyr Tyr Gly Tyr Val Phe Val Gly Cys Leu Val 485 490 495 Ala Met Phe Leu Tyr Val Phe Phe Phe Leu Pro Glu Thr Ile Gly Leu 500 505 510 Ser Leu Glu Glu Ile Gln Leu Leu Tyr Glu Glu Gly Ile Lys Pro Trp 515 520 525 Lys Ser Ala Ser Trp Val Pro Pro Ser Arg Arg Gly Ile Pro Ser Glu 530 535 540 Glu Ser Lys Thr Glu Lys Lys Asp Trp Lys Lys Phe Leu Lys Phe Ser 545 550 555 560 Lys Gly Ser Asp

Claims (30)

  1. 서열번호 59의 339 또는 376번 위치에 상응하는 위치에 하나 이상의 치환을 갖는 폴리펩타이드로, 주 촉진자 상과(MFS)의 구성원인 폴리펩타이드.
  2. 제 1 항에 있어서,
    치환이 376번에 상응하는 위치에 있고 상기 위치의 아미노산이 80 내지 138 Å3의 반데르 발스 부피 및 10 내지 100 ΔtR의 측쇄 소수성을 갖는 아미노산에 의해 치환되는 폴리펩타이드.
  3. 제 1 항에 있어서,
    치환이 339번에 상응하는 위치에 있고 상기 위치의 아미노산이 -30 내지 10 ΔtR의 측쇄 소수성을 갖는 아미노산에 의해 치환되는 폴리펩타이드.
  4. 제 1 항 내지 제 3 항 중 어느 한 항에 있어서,
    339N/V 또는 376I/M/V에 상응하는 하나 이상의 아미노산을 갖는 폴리펩타이드.
  5. 제 1 항에 있어서,
    서열번호 59의 폴리펩타이드에 비해 감소된 글루코스 수송 활성을 갖는 폴리펩타이드.
  6. 제 2 항에 있어서,
    서열번호 59의 폴리펩타이드에 비해 개선된 자일로스 수송 활성을 갖는 폴리펩타이드.
  7. 제 1 항 내지 제 3 항 중 어느 한 항에 있어서,
    서열번호 59를 갖는 폴리펩타이드에 비해 증가된 감소된 글루코스 수송 활성 및 개선된 자일로스 수송 활성을 갖는 폴리펩타이드.
  8. 제 1 항 내지 제 7 항 중 어느 한 항에 있어서,
    하기의 아미노산 모티프:
    a) G-R-x(3)-G-x(3)-G-x(11)-E-x(5)-[LIVM]-R-G-x(12)-[GA];
    b) R-x(14)-G-x(2)-Y-x(2)-[YF]-[YF]-[GSAL]; 및/또는
    c) V-x(15)-[GNR]-[RH]-R-x(2)-[LM]-x(2)-[GA]
    중 하나 이상을 함유하는 서열들을 포함하고, (a) 내지 (c)의 단편들이 서열번호 59의 위치들에 상응하는 폴리펩타이드.
  9. 제 1 항 내지 제 8 항 중 어느 한 항에 있어서,
    모티프 G-R-x(3)-G-x(3)-G-x(11)-E-x(5)-[LIVM]-R-G-x(12)-[GA]를 포함하는 폴리펩타이드.
  10. 제 1 항 내지 제 9 항 중 어느 한 항에 따른 폴리펩타이드를 암호화하는, 서열번호 56과 50% 이상의 일치성을 갖는 폴리뉴클레오타이드.
  11. 제 10 항의 폴리뉴클레오타이드를 포함하는 핵산 구축물.
  12. 제 11 항의 핵산 구축물로 형질전환된 숙주 세포.
  13. 제 12 항에 있어서,
    진핵생물인 형질전환된 숙주 세포.
  14. 제 13 항에 있어서,
    효모인 형질전환된 숙주 세포.
  15. 제 14 항에 있어서,
    사카로마이세스(Saccharomyces) 속, 특히 사카로마이세스 세레비지아에(Saccharomyces cerevisiae) 종에 속하는 형질전환된 숙주 세포.
  16. 제 1 항 내지 제 9 항 중 어느 한 항에 따른 폴리펩타이드를 암호화하거나 서열번호 59의 치환 M339S 또는 N376C를 갖는 폴리펩타이드를 암호화하는 이종 뉴클레오타이드를 포함하는 형질전환된 숙주 세포.
  17. 제 16 항에 있어서,
    폴리뉴클레오타이드가, 형질전환되지 않은 숙주 세포에 고유한 폴리펩타이드의 돌연변이체인 폴리펩타이드를 암호화하는 형질전환된 숙주 세포.
  18. 제 16 항 또는 제 17 항에 있어서,
    형질전환되지 않은 숙주 세포에 고유한 폴리펩타이드가 주 촉진자 상과(MFS)의 구성원인 형질전환된 숙주 세포.
  19. 제 17 항 또는 제 18 항에 있어서,
    형질전환되지 않은 숙주 세포에 고유한 폴리펩타이드가 헥소스 수송체 폴리펩타이드인 형질전환된 숙주 세포.
  20. 제 17 항 내지 제 19 항 중 어느 한 항에 있어서,
    형질전환되지 않은 숙주 세포에 고유한 폴리펩타이드가 헥소스 수송체 폴리펩타이드인 형질전환된 숙주 세포.
  21. 제 20 항에 있어서,
    형질전환되지 않은 숙주 세포에 고유한 폴리펩타이드가 Gal2, Hxt1, Hxt2, Hxt3, Hxt4, Hxt5, Hxt6, Hxt7, Hxt8, Hxt9, Hxt10, Hxt11, Hxt12, Hxt13, Hxt14, Hxt15, Hxt16an Hxt17로 이루어지는 군 중에서 선택된 수송체 폴리펩타이드인 형질전환된 숙주 세포.
  22. GATC 프로토콜이 가해졌을 때, 글루코스가 자일로스 및 글루코스를 포함하는 배지 중에 여전히 존재하는 동안 상기 배지로부터 자일로스를 소비하는 형질전환된 숙주 세포.
  23. 제 22 항에 있어서,
    GATC 프로토콜이 가해졌을 때, 글루코스를 소비하는 것보다 더 빨리 자일로스를 소비하는 형질전환된 숙주 세포.
  24. 자일로스 수송체로서, 서열변호 59의 N376T에 상응하는 치환을 갖는 폴리펩타이드의 용도로, 상기 폴리펩타이드가 주 촉진자 상과(MFS)의 구성원인 용도.
  25. 제 22 항에 있어서,
    폴리펩타이드가 진핵생물 세포에서 발현되고 상기 진핵생물 세포가 글루코스의 존재하에서 자일로스를 발효하는데 사용되는 용도.
  26. 리그노-셀룰로스 또는 헤미-셀룰로스 물질의 분해 방법으로, 리그노-셀룰로스 또는 헤미-셀룰로스 물질을 효소 조성물과 접촉시키고, 하나 이상의 당이 생성되고, 상기 생성된 당을 발효시켜 발효 산물을 제공하고, 상기 발효를 제 12 항 내지 제 23 항 중 어느 한 항에 따른 형질전환된 숙주 세포로 수행하는 방법.
  27. 제 26 항에 있어서,
    생성된 당이 자일로스 및 글루코스를 포함하고 세포가 자일로스 및 글루코스를 동시-발효하는 방법.
  28. 제 27 항에 있어서,
    발효 산물이 에탄올, 부탄올, 락트산, 플라스틱, 유기산, 용매, 동물 사료 보충물, 약제, 비타민, 아미노산, 효소 및 화학물질 공급원료 중 하나 이상인 방법.
  29. 리그노-셀룰로스 또는 헤미-셀룰로스 물질의 분해 방법으로, 리그노-셀룰로스 또는 헤미-셀룰로스 물질을 효소 조성물과 접촉시키고, 하나 이상의 당이 생성되고, 상기 생성된 당을 발효시켜 발효 산물을 제공하고, 상기 발효를 제 12 항 내지 제 23 항 중 어느 한 항에 따른 형질전환된 숙주 세포로 수행하는 방법.
  30. 제 29 항에 있어서,
    발효 산물이 에탄올, 부탄올, 락트산, 다이-터펜, 글리코실화된 다이-터펜, 플라스틱, 유기산, 용매, 동물 사료 보충물, 약제, 비타민, 아미노산, 효소 및 화학물질 공급원료 중 하나 이상인 방법.
KR1020157034443A 2013-06-05 2014-06-04 투과효소 활성을 갖는 폴리펩타이드 KR20160012153A (ko)

Applications Claiming Priority (13)

Application Number Priority Date Filing Date Title
EP13170646.7 2013-06-05
EP13170646 2013-06-05
EP13170648.3 2013-06-05
EP13170648 2013-06-05
EP13170644.2 2013-06-05
EP13170644 2013-06-05
EP13197988.2 2013-12-18
EP13197988 2013-12-18
EP14160772 2014-03-19
EP14160772.1 2014-03-19
EP14164270.2 2014-04-10
EP14164270 2014-04-10
PCT/EP2014/061632 WO2014195376A2 (en) 2013-06-05 2014-06-04 Polypeptides with permease activity

Publications (1)

Publication Number Publication Date
KR20160012153A true KR20160012153A (ko) 2016-02-02

Family

ID=50884408

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020157034443A KR20160012153A (ko) 2013-06-05 2014-06-04 투과효소 활성을 갖는 폴리펩타이드

Country Status (10)

Country Link
US (1) US10000537B2 (ko)
EP (1) EP3004146B1 (ko)
KR (1) KR20160012153A (ko)
CN (1) CN105263955B (ko)
BR (1) BR112015030371B1 (ko)
DK (1) DK3004146T3 (ko)
ES (1) ES2663480T3 (ko)
MY (1) MY178931A (ko)
PL (1) PL3004146T3 (ko)
WO (3) WO2014195376A2 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112020007140A2 (pt) 2017-11-14 2020-09-29 Dsm Ip Assets B.V. polipeptídeos com especificidade de transporte de arabinose melhorada
CN109097375A (zh) * 2018-08-08 2018-12-28 淮阴师范学院 通过表达木糖转运蛋白来提高乳酸乳球菌利用木糖发酵乳酸效率的方法
JP2022515041A (ja) 2018-12-31 2022-02-17 ディーエスエム アイピー アセッツ ビー.ブイ. 新規なアセチルトランスフェラーゼ
BR112022007870A2 (pt) 2019-11-08 2022-07-12 Dsm Ip Assets Bv Processo para produzir etanol

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009109630A1 (en) 2008-03-07 2009-09-11 Dsm Ip Assets B.V. A pentose sugar fermenting cell
CA2775893A1 (en) * 2009-09-29 2011-04-07 Butamax(Tm) Advanced Biofuels Llc Improved yeast production host cells
CN103189505A (zh) * 2010-10-13 2013-07-03 帝斯曼知识产权资产管理有限公司 具有通透酶活性的多肽

Also Published As

Publication number Publication date
WO2014195378A1 (en) 2014-12-11
EP3004146B1 (en) 2017-12-20
US20160122400A1 (en) 2016-05-05
MY178931A (en) 2020-10-23
WO2014195377A2 (en) 2014-12-11
WO2014195376A3 (en) 2015-04-09
CN105263955A (zh) 2016-01-20
DK3004146T3 (en) 2018-04-03
WO2014195377A3 (en) 2015-02-19
ES2663480T3 (es) 2018-04-12
BR112015030371B1 (pt) 2023-04-25
US10000537B2 (en) 2018-06-19
PL3004146T3 (pl) 2018-06-29
CN105263955B (zh) 2020-08-04
WO2014195376A2 (en) 2014-12-11
EP3004146A2 (en) 2016-04-13
BR112015030371A2 (pt) 2017-08-29

Similar Documents

Publication Publication Date Title
CA2834053C (en) Yeast strains engineered to produce ethanol from glycerol
CN101939434B (zh) 用于在大豆中提高种子贮藏油脂的生成和改变脂肪酸谱的来自解脂耶氏酵母的dgat基因
KR20210149060A (ko) Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합
AU2016203445B2 (en) Integration of a polynucleotide encoding a polypeptide that catalyzes pyruvate to acetolactate conversion
KR20100037031A (ko) 유전자 녹아웃 중온성 및 호열성 생물체, 및 이의 사용 방법
KR20140092759A (ko) 숙주 세포 및 아이소부탄올의 제조 방법
CN101365788B (zh) Δ-9延伸酶及其在制备多不饱和脂肪酸中的用途
DK2785849T3 (en) Yeast strains modified to produce ethanol from acetic acid and glycerol
KR101982360B1 (ko) 콤팩트 tale-뉴클레아제의 발생 방법 및 이의 용도
KR20140099224A (ko) 케토-아이소발레레이트 데카르복실라제 효소 및 이의 이용 방법
DK2670846T3 (en) METHODS FOR THE DEVELOPMENT OF TERPEN SYNTHASE VARIETIES
DK3108014T3 (en) Methods and systems for rapid detection of microorganisms using recombinant bacteriophage
KR20140113997A (ko) 부탄올 생성을 위한 유전자 스위치
KR20130032897A (ko) 알코올 발효 시의 알코올 에스테르의 생성 및 원위치에서의 생성물 제거
IL236992A (en) Genetically modified cyanobacteria that produce ethanol
US20040003420A1 (en) Modified recombinase
CN108138121B (zh) 用微生物高水平生产长链二羧酸
BRPI0806354A2 (pt) plantas oleaginosas transgências, sementes, óleos, produtos alimentìcios ou análogos a alimento, produtos alimentìcios medicinais ou análogos alimentìcios medicinais, produtos farmacêuticos, bebidas fórmulas para bebês, suplementos nutricionais, rações para animais domésticos, alimentos para aquacultura, rações animais, produtos de sementes inteiras, produtos de óleos misturados, produtos, subprodutos e subprodutos parcialmente processados
KR20140146616A (ko) 부타놀로겐용 배지의 아세테이트 보충물
KR20100118973A (ko) 이소프렌을 생성하기 위한 조성물 및 방법
KR20110122672A (ko) 이소프렌 및 공-산물을 제조하는 방법
KR20150014953A (ko) 케톨-산 리덕토아이소머라아제 효소 및 사용 방법
KR20130117753A (ko) 포스포케톨라아제를 포함하는 재조합 숙주 세포
KR20120099509A (ko) 재조합 숙주 세포에서 육탄당 키나아제의 발현
KR20210080375A (ko) 암 면역요법을 위한 재조합 폭스바이러스

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid