KR20140146616A - 부타놀로겐용 배지의 아세테이트 보충물 - Google Patents
부타놀로겐용 배지의 아세테이트 보충물 Download PDFInfo
- Publication number
- KR20140146616A KR20140146616A KR1020147029367A KR20147029367A KR20140146616A KR 20140146616 A KR20140146616 A KR 20140146616A KR 1020147029367 A KR1020147029367 A KR 1020147029367A KR 20147029367 A KR20147029367 A KR 20147029367A KR 20140146616 A KR20140146616 A KR 20140146616A
- Authority
- KR
- South Korea
- Prior art keywords
- butanol
- gly
- ala
- leu
- seq
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/16—Butanols
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/20—Bacteria; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y101/00—Oxidoreductases acting on the CH-OH group of donors (1.1)
- C12Y101/01—Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
- C12Y101/01008—Glycerol-3-phosphate dehydrogenase (NAD+) (1.1.1.8)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y101/00—Oxidoreductases acting on the CH-OH group of donors (1.1)
- C12Y101/01—Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
- C12Y101/01086—Ketol-acid reductoisomerase (1.1.1.86)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y102/00—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
- C12Y102/01—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with NAD+ or NADP+ as acceptor (1.2.1)
- C12Y102/01005—Aldehyde dehydrogenase [NAD(P)+] (1.2.1.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y401/00—Carbon-carbon lyases (4.1)
- C12Y401/01—Carboxy-lyases (4.1.1)
- C12Y401/01001—Pyruvate decarboxylase (4.1.1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y402/00—Carbon-oxygen lyases (4.2)
- C12Y402/01—Hydro-lyases (4.2.1)
- C12Y402/01009—Dihydroxy-acid dehydratase (4.2.1.9), i.e. acetohydroxyacid dehydratase
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E50/00—Technologies for the production of fuel of non-fossil origin
- Y02E50/10—Biofuels, e.g. bio-diesel
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Genetics & Genomics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Tropical Medicine & Parasitology (AREA)
- Virology (AREA)
- Biomedical Technology (AREA)
- Medicinal Chemistry (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
본 발명은 산업용 미생물학 및 알코올 생산 분야에 관한 것이다. 더욱 구체적으로, 본 발명은 조작된 부탄올 경로 및 발효 동안 부산물 생산에 대한 경로에서 유전자의 파괴된 활성을 포함하는 재조합 미생물이 아세테이트 함유 발효 배지 중에서 배양되는 경우, 그 미생물에 의한 부탄올 이성질체의 개선된 생산에 관한 것이다. 실시양태에서, 재조합 미생물은, C2 보충물로서 아세테이트를 함유하는 발효 배지 중에서 증가된 성장 속도를 갖는다.
Description
본 발명은 산업용 미생물학 및 알코올 생산 분야에 관한 것이다. 더욱 구체적으로, 본 발명은 조작된(engineered) 부탄올 경로를 포함하는 재조합 미생물이 아세테이트 함유 발효 배지 중에서 배양되는 경우, 그 미생물에 의한 부탄올 이성질체의 발효 생산에서의 개선에 관한 것이다.
관련-출원과의 상호 참조
본 출원은 35 U.S.C. § 119(e)에 의거하여, 2012년 3월 23일 출원된, 미국 가출원 일련번호 제 61/615,174호에 대한 우선권을 주장하며, 그 전체가 본 명세서에 참고로 포함된다.
EFS-웹을 통하여 전자 제출된 서열 목록의 언급
전자 제출된 서열 목록의 내용(20120315_CL5681USNP_SEQLIST_ST25; 크기: 294,486; 생성일: 2013년 3월 14일)은 본 명세서와 함께 제출되며, 그 전체가 본 명세서에 참고로 포함된다.
부탄올은 다양한 적용을 갖는 중요한 산업적 화학물질이며, 이러한 적용에서 연료 또는 연료 첨가제로서의 그의 잠재력은 특히 중요하다. 부탄올은 표준 내연기관(internal combustion engine)에서 연소시, CO2만을 생산하고 SOx 또는 NOx는 거의 생산하지 않거나 또는 전혀 생산하지 않기 때문에, 연료 또는 연료 첨가제로서 선호된다. 부탄올은 4-탄소 알코올이지만, 가솔린의 에너지 함량과 유사한 에너지 함량을 가지며, 어떤 화석 연료와도 배합될 수 있다. 추가로, 부탄올은 지금까지 가장 바람직한 연료 첨가제인 에탄올보다 덜 부식성이다.
부탄올은 연료 전지 산업에서 수소 분포 문제에 영향을 미치는 잠재력도 갖는다. 연료 전지는 오늘날 수소 수송 및 유통과 연관된 안정성 염려에 의해 골치가 되고 있다. 그러나, 부탄올은 그의 수소 함량에 대하여 쉽게 개량될 수 있고, 연료 전지 또는 차량 중 어느 하나에서 요구되는 순도로 기존 주유소를 통해 유통될 수 있다. 부탄올은 또한 플라스틱 산업에서 공급원료 (feedstock) 화학물질로서, 그리고 식품 및 향료 산업에서 식품 등급의 추출제로서 유용하다. 매해, 45억 내지 54억 ㎏ (100억 내지 120억 파운드)의 부탄올이 석유화학적 수단에 의해 생산되며, 이러한 원자재 화학 물질에 대한 요구는 미래에도 아마 증가할 것이다.
아이소부탄올의 화학적 합성 방법, 예컨대 옥소 합성, 일산화탄소의 촉매적 수소화 (Ullmann's Encyclopedia of Industrial Chemistry, 6th edition, Wiley-VCH Verlag GmbH and Co., Weinheim, Germany, Vol. 5, pp. 716-719 (2003)) 및 메탄올의 n-프로판올과의 게르베 (Guerbet) 축합 (Carlini et al., J. Molec. Catal. A. Chem., 220:215-220 (2004))이 알려져 있다. 이들 공정은 석유화학물질 유래의 출발 물질을 사용하며, 일반적으로 비용이 많이 들고, 친환경적이지 않다. 식물-유래의 원료로부터의 아이소부탄올의 생산은 화석 연료의 사용을 최소화시킬 수 있을 것이다.
아이소부탄올은 효모 발효의 부산물로서 생물학적으로 극미량으로 생산된다. 이는 효모에 의한 아미노산의 불완전 대사의 결과로서 형성되는 "퓨젤유 (fusel oil)"의 미량 성분이다. 아이소부탄올은 L-발린의 이화작용으로부터 특이적으로 생성된다. L-발린의 아민 기가 질소 공급원으로서 수확된 후에, 생성된 α-케토산은 소위 에를리히 경로(Ehrlich pathway)의 효소들에 의해 탈카르복실화되고 환원되어 아이소부탄올이 된다 (Dickinson et al., J. Biol. Chem. 273:25752-25756, 1998) ("Dickinson"). 외생의 L-발린의 발효 배지에의 첨가는 아이소부탄올의 산출을 증가시키며, 이는 Dickinson에 의하여 설명된 바와 같고, 여기에서 3 g/L의 아이소부탄올의 산출은 발효 배양액 중 20 g/L 농도의 L-발린을 제공함에 의해 수득된다는 것이 보고되었다. 그러나, 공급원료로서 발린의 이용은 산업적 규모의 아이소부탄올 생산에서는 비용이 높아 엄두를 낼 수 없다.
당으로부터 직접적으로, 아이소부탄올을 포함하는, 부탄올 생산을 위해 조작된 생합성 경로를 발현하는 미생물은 이전에 예를 들어, 미국 특허 제 7,851,188호 및 제 7,993,889호에 기재되었다. 그러한 부타놀로겐(butanologen)은 부탄올 이성질체의 산출을 최대화하기 위하여 발효 동안 부산물의 형성에 관련된 특정 유전자들의 파괴를 추가로 포함할 수 있다. 부산물 형성에 관련된 유전자에는 에탄올 형성 (미국 특허출원 공개 번호 제 20090305363호 참조) 및 아이소부티르산 형성에 필요한 유전자가 포함된다. (PCT 국제 출원 공개 번호. 제 WO2012/129555호 참조). 에탄올 형성에 필요한 유전자 (예로서, PDC 유전자)가 파괴된 미생물은 적절한 성장을 위한 외생의 C2 보충물을 필요로 한다. 이러한 C2 보충물에 대한 필요는 대개 배양 배지에 소량의 에탄올을 첨가함으로써 충족된다. 예로서, 본 명세서에 참고로서 통합된, 미국 특허 출원 공개 번호 제 20090305363호는 PDC 넉아웃 (knockout) 효모 균주를 기재하고 있는데, 이는 탄소 공급원으로서 2% 글루코스 함유 배지 중에서는 성장할 수 없지만, 소량의 에탄올로 보충된 글루코스 함유 배지에서는 매우 잘 성장하는 것으로 발견되었다.
이러한 상황하에서, PDC 유전자 파괴에 더하여 아이소부티르산 생산에 필요한 유전자의 파괴를 갖는 부타놀로겐 (예로서, ALD6)은, 에탄올이 C2 보충물로서 사용되는 경우에도, 성장하여 부탄올을 생산하는 변경된 능력을 가질 수 있다. 예로서 감소된 C2 의존성을 위해 균주를 조작함에 의한 그러한 도전에 대한 시도들이 설명되어 왔으나 (예로서, 미국 출원 공개 번호 제 20120156735호 참조), 그러한 전략을 대체 또는 보충하기 위한 대안적 또는 보충적 방법들은 본 기술분야에서의 진보를 나타내는 것일 것이다.
본 명세서에서는 하기 단계들을 포함하는 부탄올 생산 방법이 제공된다:
a. i. 조작된 부탄올 생합성 경로
를 포함하는 재조합 숙주 세포를 제공하는 단계; 및
b. a)의 숙주 세포를,
i. 발효가능한 탄소 기질; 및
ii. 아세테이트
를 포함하는 발효 배지와 접촉시키는 단계를 포함하는 방법으로서, 상기 재조합 숙주 세포는 피루베이트 탈카르복실화효소 (PDC) 활성, 및 선택적으로 알데하이드 탈수소효소 활성이 감소 또는 제거되도록 조작되었으며; 이에 의하여 부탄올은 조작된 부탄올 생합성 경로를 통하여 발효가능한 탄소 기질로부터 직접 생산된다. 실시양태에서, 아세테이트가 발효 배지에 첨가된다. 실시양태에서, 아세테이트는 숙주 세포의 성장에 대해 충분한 양으로 존재한다. 실시양태에서, 아세테이트는 개선된 부탄올 생산에 대해 충분한 양으로 존재한다. 실시양태에서, 아세테이트가 발효 배지에 첨가된다. 실시양태에서, 아세테이트는 재생가능한 공급원료 공급원으로부터의 것이다.
본 발명의 한 실시양태는 하기 단계들을 포함하는 부탄올의 생산 방법에 관한 것이다:
a. i. 조작된 부탄올 생합성 경로
를 포함하는 재조합 숙주 세포를 제공하는 단계; 및
b. a)의 숙주 세포를,
i. 발효가능한 탄소 기질; 및
ii. a)의 숙주 세포의 성장 및 부탄올 생산에 대해 충분한 양의, C2 1보충물로서, 아세테이트와 접촉시키는 단계로, 여기에서 아세테이트는 발효 배지에 첨가되고;
상기 재조합 숙주 세포는 피루베이트 탈카르복실화효소 (PDC) 활성, 및 알데하이드 탈수소효소 활성이 감소 또는 제거되도록 조작되었으며; 이에 의하여 부탄올은 조작된 부탄올 생합성 경로를 통하여 발효가능한 탄소 기질로부터 직접 생산된다.
본 발명의 한 실시양태는 하기 기질에서 생성물로의 전환을 포함하는 아이소부탄올의 제조 방법에 관한 것이다:
a) 피루베이트에서 아세토락테이트 (경로 단계 a);
b) a)로부터의 아세토락테이트에서 2,3-다이하이드록시아이소발레레이트 (경로 단계 b);
c) b)로부터의 2,3-다이하이드록시아이소발레레이트에서 α-케토아이소발레레이트 (경로 단계 c);
d) c)로부터의 α-케토아이소발레레이트에서 아이소부티르알데하이드 (경로 단계 d); 및
e) d)로부터의 아이소부티르알데하이드에서 아이소부탄올 (경로 단계 e);
여기에서
i) 단계 a)의 기질에서 생성물로의 전환은 아세토락테이트 신타제 (synthase) 효소에 의하여 수행되고;
ii) 단계 b)의 기질에서 생성물로의 전환은 아세토하이드록시산 이성질화환원 효소 (isomeroreductase enzyme)에 의하여 수행되고;
iii) 단계 c)의 기질에서 생성물로의 전환은 다이하이드록시산 탈수효소에 의하여 수행되고;
iv) 단계 d)의 기질에서 생성물로의 전환은 α-케토산 탈카르복실화효소에 의하여 수행되고;
v) 단계 e)의 기질에서 생성물로의 전환은 알코올 탈수소효소에 의하여 수행되고;
이에 의하여 아이소부탄올은 조작된 생합성 경로를 통해 피루베이트로부터 직접 생산된다.
본 발명의 한 실시양태는 하기 기질에서 생성물로의 전환을 포함하는 아이소부탄올의 제조 방법에 관한 것이다:
a) 피루베이트에서 아세토락테이트 (경로 단계 a);
b) a)로부터의 아세토락테이트에서 2,3-다이하이드록시아이소발레레이트 (경로 단계 b);
c) b)로부터의 2,3-다이하이드록시아이소발레레이트에서 α-케토아이소발레레이트 (경로 단계 c);
d) c)로부터의 α-케토아이소발레레이트에서 아이소부티릴-CoA (경로 단계 f);
e) d)로부터의 아이소부티릴-CoA에서 아이소부티르알데하이드 (경로 단계 g); 및
f) e)로부터의 아이소부티르알데하이드에서 아이소부탄올 (경로 단계 e);
여기에서
i) 단계 a)의 기질에서 생성물로의 전환은 아세토락테이트 신타제 효소에 의하여 수행되고;
ii) 단계 b)의 기질에서 생성물로의 전환은 아세토하이드록시산 이성질화환원 효소에 의하여 수행되고;
iii) 단계 c)의 기질에서 생성물로의 전환은 다이하이드록시산 탈수효소에 의하여 수행되고;
iv) 단계 d)의 기질에서 생성물로의 전환은 분지쇄 케토산 탈수소효소에 의하여 수행되고;
v) 단계 e)의 기질에서 생성물로의 전환은 아세틸화 알데하이드탈수소효소에 의하여 수행되고;
vi) 단계 f)의 기질에서 생성물로의 전환은 알코올 탈수소효소에 의하여 수행되고;
이에 의하여 아이소부탄올은 조작된 생합성 경로를 통해 피루베이트로부터 직접 생산된다.
본 발명의 한 실시양태는 하기를 포함하는 조성물에 관한 것이다:
a) i) 조작된 부탄올 생합성 경로
를 포함하는 재조합 숙주 세포; 및
b) i) 발효가능한 탄소 기질; 및
ii) a)의 숙주 세포의 성장 및 부탄올 생산에 대해 충분한 양의 아세테이트
를 포함하는 발효 배지,
여기에서 상기 재조합 숙주 세포는 피루베이트 탈카르복실화효소 (PDC) 활성 및 알데하이드 탈수소효소 활성이 감소 또는 제거되도록 조작되었다.
실시양태에서, 아세테이트가 발효 배지에 첨가된다. 실시양태에서, 아세테이트는 재생가능한 공급원료 공급원으로부터의 것이다. 실시양태에서, 아세테이트 및 탄소 기질은 모두 재생가능한 공급원료 공급원으로부터의 것이다.
본 발명의 한 실시양태는 조성물에 관한 것으로, 여기에서 발효 배지는 부탄올을 더 포함한다.
본 발명의 한 실시양태는, 조작된 부탄올 생합성 경로를 통하여 발효가능한 탄소 기질로부터 부탄올이 직접 생산되는 조건하에서, 상기 조성물을 유지하는 것을 포함하는 부탄올의 생산 방법에 관한 것이다.
본 발명의 한 실시양태는 본 명세서에 개시된 방법으로부터 생산된 부탄올에 관한 것이다.
일부 실시양태에서, 피루베이트 탈카르복실화효소 활성을 갖는 폴리펩타이드는 PDC1, PDC5, PDC6 또는 이의 조합이다. 일부 실시양태에서, 알데하이드 탈수소효소 활성을 갖는 폴리펩타이드는 ALD2, ALD3, ALD4, ALD5, ALD6 또는 이의 조합이다.
일부 실시양태에서, 숙주 세포는 그의 성장을 위해, 외생의 2-탄소 기질 보충물에 대해 감소된 또는 제거된 필요를 포함하도록 조작 또는 발달된다 (evolved).
일부 실시양태에서, 숙주 세포는 포스포케톨라제 활성을 갖는 폴리펩타이드를 암호화하는 이종성 폴리뉴클레오타이드, 포스포트랜스아세틸라제 활성을 갖는 폴리펩타이드를 암호화하는 이종성 폴리뉴클레오타이드, 또는 이들 모두를 포함한다.
일부 실시양태에서, 재조합 숙주 세포는 박테리아 또는 효모이다.
일부 실시양태에서, 재조합 숙주 세포는 아이소부탄올 생산을 위한 조건에 투입되는 전세포 (whole cell) 촉매이다.
일부 실시양태에서, 생산되는 부탄올은 아이소부탄올이다. 일부 실시양태에서, 생산되는 부탄올은 1-부탄올이다.
일부 실시양태에서, 방법은 부탄올의 회수를 더 포함한다. 일부 실시양태에서, 회수는 증류, 액체-액체 추출, 흡착, 경사 분리 (decantation), 투과증발 (pervaporation) 또는 이의 조합에 의한다. 일부 실시양태에서, 방법은 발효 배지로부터 고형분의 제거도 포함한다. 일부 실시양태에서, 제거 단계는 회수 단계 전에 일어난다. 일부 실시양태에서, 제거는 원심분리, 여과 또는 경사 분리에 의한다.
<도 1>
도 1은 상이한 아이소부탄올 생합성 경로를 묘사한다. "a", "b", "c", "d", "e", "f" 및 "g"로 표시된 단계들은 하기 기재된 기질에서 생성물로의 전환을 나타낸다. 단계 "a"는, 예로서 아세토락테이트 신타제에 의해 촉매작용될 수 있다. 단계 "b"는, 예로서 아세토하이드록시산 환원이성질화효소에 의해 촉매작용될 수 있다. 단계 "c"는, 예로서 다이하드록시산 탈수효소에 의해 촉매작용될 수 있다. 단계 "d"는, 예로서 분지쇄 케토산 탈카르복실화효소에 의해 촉매작용될 수 있다. 단계 "e"는, 예로서 분지쇄 알코올 탈수소효소에 의해 촉매작용될 수 있다. 단계 "f"는, 예로서 분지쇄 케토산 탈수소효소에 의해 촉매작용될 수 있다. 단계 "g"는, 예로서 아세틸화 알데하이드탈수소효소에 의해 촉매작용될 수 있다.
<도 2>
도 2는 1-부탄올 생합성 경로를 묘사한다. "a", "b", "c", "d", "e", 및 "f" 로 표시된 단계들은 하기 기재된 기질에서 생성물로의 전환을 나타낸다. 단계 "a"는, 예로서 아세틸-CoA 아세틸 전이효소에 의해 촉매작용될 수 있다. 단계 "b"는, 예로서 3-하이드록시부티릴-CoA 탈수소효소에 의해 촉매작용될 수 있다. 단계 "c"는, 예로서 크로토나제 (crotonase)에 의해 촉매작용될 수 있다. 단계 "d"는, 예로서 부티릴-CoA 탈수소효소에 의해 촉매작용될 수 있다. 단계 "e"는, 예로서 부티르알데하이드 탈수소효소에 의해 촉매작용될 수 있다. 단계 "f"는, 예로서 부탄올 탈수소효소에 의해 촉매작용될 수 있다.
도 1은 상이한 아이소부탄올 생합성 경로를 묘사한다. "a", "b", "c", "d", "e", "f" 및 "g"로 표시된 단계들은 하기 기재된 기질에서 생성물로의 전환을 나타낸다. 단계 "a"는, 예로서 아세토락테이트 신타제에 의해 촉매작용될 수 있다. 단계 "b"는, 예로서 아세토하이드록시산 환원이성질화효소에 의해 촉매작용될 수 있다. 단계 "c"는, 예로서 다이하드록시산 탈수효소에 의해 촉매작용될 수 있다. 단계 "d"는, 예로서 분지쇄 케토산 탈카르복실화효소에 의해 촉매작용될 수 있다. 단계 "e"는, 예로서 분지쇄 알코올 탈수소효소에 의해 촉매작용될 수 있다. 단계 "f"는, 예로서 분지쇄 케토산 탈수소효소에 의해 촉매작용될 수 있다. 단계 "g"는, 예로서 아세틸화 알데하이드탈수소효소에 의해 촉매작용될 수 있다.
<도 2>
도 2는 1-부탄올 생합성 경로를 묘사한다. "a", "b", "c", "d", "e", 및 "f" 로 표시된 단계들은 하기 기재된 기질에서 생성물로의 전환을 나타낸다. 단계 "a"는, 예로서 아세틸-CoA 아세틸 전이효소에 의해 촉매작용될 수 있다. 단계 "b"는, 예로서 3-하이드록시부티릴-CoA 탈수소효소에 의해 촉매작용될 수 있다. 단계 "c"는, 예로서 크로토나제 (crotonase)에 의해 촉매작용될 수 있다. 단계 "d"는, 예로서 부티릴-CoA 탈수소효소에 의해 촉매작용될 수 있다. 단계 "e"는, 예로서 부티르알데하이드 탈수소효소에 의해 촉매작용될 수 있다. 단계 "f"는, 예로서 부탄올 탈수소효소에 의해 촉매작용될 수 있다.
학술지 논문 또는 요약, 공개된 또는 대응 미국 또는 외국 특허출원, 특허된 또는 외국 특허, 또는 임의의 기타 문헌을 포함하여, 본 명세서에서 인용된 모든 문헌들은 각각 본 명세서에 참고로서 그 전체로서 통합되며, 이는 그 인용된 문헌에 제시된 모든 데이터, 표, 도면 및 본문을 포함한다.
본 기술분야의 당업자는, 단지 통상의 실험을 이용하여, 본 명세서에 기재된 본 발명의 특정 실시양태들에 대한 많은 균등물들을 인식 또는 확인할 수 있을 것이다. 이러한 균등물은 특허청구범위에 의해 포괄되는 것으로 의도된다.
본 명세서는, 조작된 부탄올 생합성 경로를 발현하고 발효 공정 동안 부산물 형성에 관련된 유전자들 중 하나 이상의 파괴를 갖는 재조합 미생물을 이용하는 부탄올 이성질체의 발효 생산 방법으로, 여기에서 아세테이트가 발효 배지에 첨가되는 방법이 제공된다.
본 명세서에 개시된 바와 같이, 본 출원인은, PDC 유전자 결실 (및 선택적으로 ALD6 유전자 결실)을 갖는 부타놀로겐이 그들이 외생의 C2 보충물로서 아세테이트를 갖는 발효 배지 내에서 배양되는 경우 개선된 성장 속도 또는 부탄올 이성질체 생산을 갖는다는 것을 발견하였다. 아세테이트는 에탄올보다 덜 비싸기 때문에, C2 보충물로서 아세테이트의 이용은 부탄올 이성질체의 생산비를 감소시킨다.
실시양태에서, PDC-KO 표현형을 갖는 숙주 세포는, 그의 성장을 위하여 외생의 2-탄소 기질 보충물에 대하여 감소된 또는 제거된 필요를 가질 수 있다. 예로서, PDC-KO 표현형을 갖는 숙주 세포는, 성장을 위해 C2 보충물에 대하여 감소된 또는 제거된 필요를 갖도록 조작 (예로서, 이에 제한되지는 않지만, 포스포케톨라제 활성을 갖는 폴리펩타이드를 암호화하는 이종성 폴리뉴클레오타이드 및/또는 포스포트랜스아세틸라제 활성을 갖는 폴리펩타이드를 암호화하는 이종성 폴리뉴클레오타이드를 포함하도록) 또는 발달될 수 있다. 그러한 실시양태에서는 적어도 이론상으로, 아세테이트가 C2 영양요구성을 만족시키는데 절대적으로 요구되지 않을 수 있지만, 실시예에서 예증되는 바와 같이, 본 명세서에서 제공되는 방법은 그러한 숙주 세포를 이용하여 부탄올 생산에서 개선을 제공할 수 있다.
달리 정의되지 않으면, 본 명세서에서 사용된 모든 기술 및 과학 용어는 당업자가 일반적으로 이해하는 것과 동일한 의미를 갖는다. 상충될 경우, 정의를 포함한 본 명세서가 좌우할 것이다. 또한, 문맥에 의해 다르게 요구되지 않는 한, 단수의 용어는 복수를 포함할 것이며, 복수의 용어는 단수를 포함할 것이다. 본 명세서에 언급된 모든 공개문헌, 특허 및 기타 참조문헌은 그 전체가 모든 목적을 위해 참조로 포함된다.
본 명세서에 개시된 것과 유사하거나 또는 균등한 방법 및 재료가 본 발명의 실시 또는 시험에서 사용될 수 있지만, 적합한 방법 및 재료는 하기에 개시되어 있다. 재료, 방법 및 실시예는 단지 예시적인 것이며 제한하고자 하는 것은 아니다. 본 발명의 다른 특징 및 이점은 발명을 실시하기 위한 구체적인 내용 및 특허청구범위로부터 명백해질 것이다. 본 발명을 추가로 정의하기 위하여, 하기의 용어 및 정의가 본 명세서에 제공된다.
본 명세서에 사용되는 바와 같이, 용어 "구성하다," "구성하는," "포함하다," "포함하는," "갖다," "갖는," "함유하다," "함유하는" 또는 이의 임의의 다른 변형은 임의의 다른 정수 또는 정수의 그룹의 배제가 아닌, 언급된 정수 또는 정수의 그룹의 포함을 암시하는 것으로 이해될 것이다. 예로서, 요소들의 목록을 포함하는 조성물, 혼합물, 공정, 방법, 용품, 또는 장치는 반드시 그러한 요소만으로 제한되지는 않고, 명시적으로 열거되지 않거나 또는 그러한 조성물, 혼합물, 공정, 방법, 용품, 또는 장치에 내재한 다른 요소를 포함할 수도 있다. 더욱이, 명백히 반대로 언급되지 않는한, "또는"은 포괄적인 "또는"을 말하는 것이지, 배타적인 "또는"을 지칭하는 것은 아니다. 예로서, 조건 A 또는 B는 하기 중 어느 하나에 의해 충족된다: A는 참 (또는 존재함)이고 B는 거짓 (또는 존재하지 않음), A는 거짓 (또는 존재하지 않음)이고 B는 참 (또는 존재함), A 및 B 둘 모두가 참 (또는 존재함).
본 명세서에 사용되는 바와 같이, 명세서 및 특허청구범위 전체에 걸쳐 사용되는 용어 "이루어지다", 또는 "이루어진다" 또는 "이루어지는"과 같은 변형은, 임의의 기재된 정수 또는 정수의 그룹의 포함을 나타내지만, 추가의 정수 또는 정수의 그룹이 특정 방법, 구조 또는 조성물에 첨가될 수 없음을 나타낸다.
본 명세서에 사용되는 바와 같이, 명세서 및 특허청구범위 전체에 걸쳐 사용되는 용어 "본질적으로 이루어지다", 또는 "본질적으로 이루어진다" 또는 "본질적으로 이루어지는"과 같은 변형은 임의의 기재된 정수 또는 정수의 그룹의 포함, 및 특정 방법, 구조 또는 조성물의 기본 또는 신규 특성을 실질적으로 변화시키지 않는 임의의 기재된 정수 또는 정수의 군의 선택적 포함을 나타낸다. 문헌[M.P.E.P. § 2111.03]을 참조한다.
또한, 본 발명의 요소 또는 성분 앞의 "하나의"("a" 및 "an")는, 요소 또는 성분의 경우의 수, 즉, 출현의 수에 관해서는 비제한적인 것으로 의도된다. 따라서, "하나의"는 하나 또는 적어도 하나를 포함하는 것으로 해석되어야 하며, 요소 또는 성분의 단수형 단어는 그 수가 명백하게 단수를 의미하는 것이 아니라면, 복수도 포함한다.
본 명세서에서 사용되는 바와 같은 용어 "발명" 또는 "본 발명"은 비제한적인 용어이며, 특정 발명의 임의의 단일의 실시양태를 언급하는 것으로 의도되지 않고, 출원서에 기재된 바와 같은 모든 가능한 실시양태들을 포함한다.
본 명세서에 사용되는 바와 같이, 본 발명의 성분 또는 반응물의 양 또는 본 명세서에 기재된 반응 조건을 한정하는 용어 "약"은, 예를 들어, 현실에서 농축물 또는 용액을 제조하는데 사용되는 전형적인 측정 및 액체 취급 과정을 통하여; 이들 과정에서의 우발적인 오차를 통하여; 조성물을 제조하거나 또는 방법을 실시하기 위해 이용되는 성분의 제조, 공급원 또는 순도에서의 차이를 통하여; 등으로 일어날 수 있는 수치적 양의 변동을 말한다. 용어 "약"은 또한 특정 초기 혼합물로부터 유발되는 조성물에 대한 상이한 평형 조건으로 인해 달라지는 양을 포함한다. 용어 "약"에 의한 수식 여부를 불문하고, 특허청구범위는 분량의 균등물을 포함한다. 한 실시양태에서, 용어 "약"은 보고된 수치 값의 10% 이내, 및 보고된 수치 값의 5% 이내를 종종 의미한다.
일부 경우에, 본 명세서에 사용되는 바와 같은 "바이오매스(biomass)"는, 발효 생성물-생산 미생물의 세포 바이오매스를 지칭하며, 이는 전형적으로 g/L의 건조 세포 중량 (dcw) 단위로 제공된다.
용어 "발효 생성물"로는, 이에 제한되지는 않지만 1-부탄올, 아이소부탄올 등을 포함하는 관심 대상의 임의의 원하는 생성물이 포함된다.
용어 "부탄올 이성질체" 또는 "부탄올"은 1-부탄올, 아이소부탄올 또는 그 혼합물을 지칭한다. 아이소부탄올은 2-메틸-1-프로판올로도 공지되어 있다.
본 명세서에서 사용되는 바와 같은 용어 "부탄올 생합성 경로"는 1-부탄올 또는 아이소부탄올을 생산하는 효소 경로를 지칭한다. 예로서, 부탄올 생합성 경로는 미국 특허 제 7,993,889호에 개시되어 있으며, 이는 참고로서 본 명세서에 포함된다.
용어 "아이소부탄올 생합성 경로"는 아이소부탄올을 생산하는 효소적 경로를 말한다. 때때로 "아이소부탄올 생합성 경로"는 "아이소부탄올 생산 경로"와 동의어로 사용된다.
본 명세서에서 사용되는 용어 "1-부탄올 생합성 경로"는 1-부탄올을 생산하는 효소 경로를 지칭한다.
"재조합 숙주 세포"는 생합성 생산 경로를 발현하도록 유전적으로 조작된 숙주 세포로서 정의되며, 여기에서 숙주 세포는 변경되지 않은 숙주 세포에 비하여 생합성 생성물을 더욱 많은 양으로 생산하거나, 또는 변경되지 않은 숙주 세포에 의해서는 일반적으로 생산되지 않는 생합성 생성물을 생산한다.
부탄올 생합성 경로에 적용되는 바와 같은 용어 "조작된"은, 조작된 부탄올 생합성 경로를 통하여 피루베이트로부터의 탄소 흐름이 최대화되어, 발효가능한 탄소 기질로부터 증가된 양의 부탄올이 직접적으로 생산되도록 조종된 (manipulated) 부탄올 생합성 경로를 지칭한다. 그러한 조작에는, 이종성 폴리뉴클레오타이드 또는 폴리펩타이드의 발현, 내생의 폴리뉴클레오타이드 또는 폴리펩타이드의 과발현, 사이토졸(cytosol)에 천연적으로 국지화되지는 않는 단백질의 사이토졸 국지화(localization), 증가된 보조인자 이용성, 경쟁적 경로의 감소된 활성 등이 포함된다.
용어 "발효가능한 탄소 기질"은 본 명세서에 개시된 것들과 같은 미생물에 의해 대사될 수 있는 탄소 공급원을 지칭한다. 적합한 발효가능한 탄소 기질에는, 이에 제한되지는 않지만, 글루코스, 프룩토스, 아라비노스 또는 자일로스와 같은 단당류; 락토스 또는 수크로스와 같은 올리고당류; 전분, 셀룰로스, 리그노셀룰로스 또는 헤미셀룰로스와 같은 다당류를 포함하는 당류; 1-탄소 기질, 지방산; 및 이들의 조합이 포함된다.
본 명세서에서 사용되는 바와 같은, "발효 배지"는 물, 발효가능한 탄소 기질, 용해된 고형분, 발효 생성물 및 발효 용기 내에서 담긴 재료의 다른 모든 구성성분의 혼합물을 의미하며, 여기에서 발효 생성물은, 존재하는 미생물에 의하여, 발효가능한 탄소 기질에서 발효 생성물, 물 및 이산화탄소 (CO2)로의 반응에 의하여 제조되고 있다. 때때로, 본 명세서에서 사용되는 바와 같은, 용어 "발효 배양액" 및 "발효 혼합물"은 "발효 배지"와 동의어로 사용될 수 있다.
본 명세서에 사용되는 바와 같은, 용어 "호기성 조건"은 산소 존재 하에서의 성장 조건을 의미한다.
본 명세서에서 사용되는 바와 같은, 용어 "미세호기성 조건"은 낮은 수준의 용해된 산소를 갖는 성장 조건을 의미한다. 예로서, 산소 수준은 약 1% 미만의 공기-포화일 수 있다.
본 명세서에 사용되는 바와 같은, 용어 "혐기성 조건"은 산소 부재 하에서의 성장 조건을 의미한다.
용어 "탄소 기질"은 본 명세서에 개시된 재조합 숙주 세포에 의하여 대사될 수 있는 탄소 공급원을 지칭한다. 탄소 기질의 비제한적인 예는 본 명세서에서 제공되며, 이에 제한되지는 않지만, 단당류, 올리고당류, 다당류, 에탄올, 락테이트, 석시네이트, 글리세롤, 이산화탄소, 아세테이트, 메탄올, 글루코스, 프룩토스, 수크로스, 자일로스, 아라비노스, 덱스트로스 및 그 혼합물이 포함된다.
용어 "C2 보충물"은, 2 개의 탄소 원자를 갖는 탄소 공급원을 지칭하며, 발효 배지에 첨가된 경우, C2 보충물은 발효 공정 동안 부산물의 생성에 관련된 단백질의 활성의 파괴를 갖는 부타놀로겐의 성장 및/또는 부탄올 생산을 증가시킨다. C2 보충물의 비제한적인 예로는 아세테이트 및 에탄올이 포함된다.
본 명세서에서 사용된 것과 같은, 용어 "부타놀로겐"은 부탄올 이성질체를 생산할 수 있는 미생물을 지칭한다. 그러한 미생물은 전형적으로, 조작된 부탄올 생합성 경로를 포함하는 재조합 미생물이다. 본 명세서에서 사용되는 것과 같은, 용어 "아이소부타놀로겐"은 아이소부탄올 이성질체를 생산할 수 있는 미생물을 지칭한다. 그러한 미생물은 전형적으로, 조작된 아이소부탄올 생합성 경로를 포함하는 재조합 미생물이다.
본 명세서에서 사용되는 것과 같은, 용어 "PDC 넉-아웃"은, PDC 활성이 제거 또는 감소되도록, PDC 활성을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 또는 유전자에서, 또는 PDC1, PDC5 또는 PDC6 활성을 갖는 내생의 폴리펩타이드에서, 또는 이의 임의의 조합에서 파괴, 결실, 돌연변이, 및/또는 치환을 포함하는 숙주 세포를 지칭한다.
본 명세서에서 사용되는 것과 같은, 용어 "ALD 넉-아웃"은, ALD 활성이 제거 또는 감소되도록, 알데하이드 탈수소효소 활성을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 또는 유전자에서, 또는 ALD2, ALD3, ALD4, ALD5 또는 ALD6 활성을 갖는 내생의 폴리펩타이드에서 또는 이의 임의의 조합에서 파괴, 결실, 돌연변이, 및/또는 치환을 포함하는 숙주 세포를 지칭한다.
본 명세서에서 사용되는 것과 같은, 용어 "개선된 부탄올 생산"은, 이에 제한되지는 않지만, 수율, 유효 속도, 유효 적정농도 (effective titer) 또는 비 생산성 (specific productivity) 중 하나 이상에서의 증가, 또는 예로서 아이소부티르산과 같은 하나 이상의 부산물의 수율에서의 감소를 포함하는, 부탄올 생산 변수에서의 개선을 지칭한다. 아세테이트와 관련된 증가 또는 감소는 아세테이트 부재 하의 적절한 대조구 방법에 관하여 결정된다.
본 명세서에서 사용되는 것과 같은, 용어 "수율"은, g/g 단위의, 탄소 공급원의 양 당 생성물의 양을 지칭한다. 수율은 탄소 공급원으로서 글루코스에 대해 예시될 수 있다. 달리 나타내지 않는 한, 수율은 이론적 수율의 퍼센트로서 표시되는 것으로 이해된다. 미생물 또는 대사 경로를 참고하여, "이론적 수율"은 생성물을 제조하기 위해 사용된 대사 경로의 화학양론에 의해 좌우되는 바와 같은 기질의 총 양 당 생성될 수 있는 생성물의 최대 양으로서 정의된다. 예로서, 글루코스에서 아이소프로판올로의 하나의 전형적인 전환에 대한 이론적 수율은 0.33 g/g이다. 이와 같이, 글루코스로부터 아이소프로판올의 수율 0.297 g/g은 90%의 이론 또는 90% 이론적 수율로서 표시될 것이다. 본 발명의 개시내용에서, 수율은 탄소 공급원으로서 글루코스에 대하여 예시되지만, 본 발명은 다른 탄소 공급원에 적용될 수 있으며, 그 수율은 사용된 탄소 공급원에 따라 달라질 수 있는 것으로 이해된다. 당업자는 각종 탄소 공급원에 따라 수율을 계산할 수 있다.
본 명세서에서 사용되는 것과 같은, 용어 "유효 글루코스"는 발효 배지 1리터 당 발효에 의해 생산되는 부탄올 이성질체의 총 양을 지칭한다. 부탄올 이성질체의 총 양은: (i) 발효 배지 중 부탄올의 양; (ii) 유기 추출제로부터 회수된 부탄올 이성질체의 양; 및 (iii) 가스 스트리핑 (stripping)이 이용될 경우, 가스 상으로부터 회수되는 부탄올 이성질체의 양을 포함한다.
본 명세서에서 사용되는 것과 같은, 용어 "유효 속도"는 발효 시간 당 발효 배지 1리터 당 발효에 의해 생산되는 부탄올 이성질체의 총 양을 지칭한다.
본 명세서에서 사용되는 것과 같은, 용어 "비 생산성"은 단위 시간 당 세포의 건조 세포 중량 1g 당 생산된 부탄올 이성질체의 g을 지칭한다.
본 명세서에서 사용되는 것과 같은, 용어 "성장 속도"는 미생물이 배양 배지 중에서 성장하는 속도를 지칭한다. 재조합 미생물의 성장 속도는 예로서, 600 나노미터에서 광학 밀도를 측정함으로써 모니터링될 수 있다. 배가 시간(doubling time)은 성장 곡선의 로그 부분으로부터 계산되고, 성장 속도의 척도로서 사용될 수 있다.
본 발명에서의 이용을 위한 폴리펩타이드 및 폴리뉴클레오타이드
본 명세서에서 사용되는 용어 "폴리펩타이드"는 단수의 "폴리펩타이드" 뿐만 아니라 복수의 "폴리펩타이드들"을 포함하고자 하는 것이며, 아미드 결합 (펩타이드 결합으로도 알려져 있음)에 의해 선형적으로 연결된 단량체 (아미노산)로 구성된 분자를 지칭한다. 용어 "폴리펩타이드"는 둘 이상의 아미노산의 임의의 사슬 또는 사슬들을 지칭하며, 특정 길이의 생성물을 지칭하는 것은 아니다. 따라서, 펩타이드, 다이펩타이드, 트라이펩타이드, 올리고펩타이드, "단백질", "아미노산 사슬" 또는 둘 이상의 아미노산의 사슬 또는 사슬들을 지칭하는데 사용된 임의의 다른 용어는, "폴리펩타이드"의 정의 내에 포함되는 것이며, 이들 용어 대신 또는 이들 용어 중 임의의 것과 상호교환가능하게 "폴리펩타이드"라는 용어가 사용될 수 있다. 폴리펩타이드는 천연의 생물학적 공급원으로부터 유래될 수 있거나, 또는 재조합 기술에 의해 생산될 수 있으나, 반드시 지정된 핵산 서열로부터 번역되지는 않는다. 이는 화학적 합성에 의한 것을 포함하는 임의의 방식으로 생성될 수 있다. 본 발명에서 사용된 폴리펩타이드는 전장 폴리펩타이드 및 그의 단편을 포함한다.
"분리된" 폴리펩타이드, 또는 그의 단편, 변이체 또는 유도체는 그의 천연 환경에서는 존재하지 않는 폴리펩타이드를 의도한다. 특정 정제 수준은 필요하지 않다. 예로서, 분리된 폴리펩타이드는 그의 고유 또는 천연 환경으로부터 제거될 수 있다. 숙주 세포에서 발현되는 재조합적으로 생산된 폴리펩타이드 및 단백질은, 임의의 적합한 기술에 의하여 분리, 분획화, 또는 부분적으로 또는 실질적으로 정제된 천연 또는 재조합 폴리펩타이드와 같이, 본 발명의 목적을 위해 분리된 것으로 여겨진다.
본 발명에서의 이용에 적합한 폴리펩타이드 및 기타 효소, 및 그의 단편은 폴리뉴클레오타이드에 의하여 암호화된다. 용어 "폴리뉴클레오타이드"는 단일 핵산 뿐만 아니라 복수의 핵산도 포괄하는 것으로 의도되며, 분리된 핵산 분자 또는 구축물, 예로서 메신저 RNA (mRNA), 바이러스-유래 RNA, 또는 플라스미드 DNA (pDNA)를 지칭한다. 폴리뉴클레오타이드는 통상의 인산다이에스테르 결합 또는 통상적이지 않은 결합 (예로서, 펩타이드 핵산 (PNA)에서 발견되는 것과 같은, 아미드 결합)을 포함할 수 있다. 용어 "핵산"은 폴리뉴클레오타이드 중에 존재하는, 임의의 하나 이상의 핵산 절편, 예로서 DNA 또는 RNA 단편을 지칭한다. 본 발명에 따른 폴리뉴클레오타이드는 합성으로 생산된 이러한 분자를 더 포함한다. 본 발명의 폴리뉴클레오타이드는 숙주 세포에 대하여 천연 또는 이종성일 수 있다. 추가적으로, 폴리뉴클레오타이드 또는 핵산은, 프로모터, 리보솜 결합 자리, 또는 전사 종결자와 같은, 조절 성분일 수 있거나 또는 조절 성분을 포함할 수 있다.
특정 실시양태에서, 폴리뉴클레오타이드 또는 핵산은 DNA이다. DNA의 경우에서, 폴리펩타이드를 암호화하는, 핵산을 포함하는 폴리뉴클레오타이드는 정상적으로는 하나 이상의 코딩 영역과 작동적으로 연합된(operably associated) 프로모터 및/또는 기타 전사 또는 번역 제어 성분을 포함할 수 있다. 작동적 연합은, 유전자 생성물, 예로서 폴리펩타이드에 대한 코딩 영역이, 조절 서열(들)의 영향 또는 제어 하에서 유전자 생성물의 발현을 위치시키도록 하는 방식으로, 하나 이상의 조절 서열과 연관되는 경우이다. 2개의 DNA 단편 (예컨대, 폴리펩타이드 코딩 영역 및 그와 연관된 프로모터)은, 프로모터 기능의 유도가 원하는 유전자 생성물을 암호화하는 mRNA의 전사를 결과로서 생성하는 경우, 그리고 두 DNA 단편간의 연결의 성질이, 발현 조절 서열이 유전자 생성물의 발현을 지시하는 능력을 간섭하지 않거나 또는 DNA 주형의 전사되는 능력을 간섭하지 않는 경우, "작동적으로 연합된" 것이다. 따라서, 프로모터 영역은, 프로모터가 핵산의 전사를 실현할 수 있다면, 폴리펩타이드를 암호화하는 핵산과 작동적으로 연합된 것일 것이다. 프로모터 외에, 기타 전사 제어 성분, 예로서 인핸서(enhancer), 오퍼레이터(operator), 리프레서(repressor) 및 전사 종결 신호가 폴리뉴클레오타이드와 작동적으로 연합될 수 있다. 적합한 프로모터 및 기타 전사 제어 영역은 본 명세서에 개시된다.
폴리뉴클레오타이드 서열은 "분리된" 것으로서 지칭될 수 있으며, 여기에서 이는 그의 천연 환경으로부터 제거된 것이다. 예로서, 벡터 내에 포함된 효소 활성 (예로서, 기질을 자일룰로스로 전환하는 능력)을 갖는 폴리펩타이드 또는 폴리펩타이드 단편을 암호화하는 이종성 폴리뉴클레오타이드는 본 발명의 목적을 위하여 분리된 것으로 여겨진다. 분리된 폴리뉴클레오타이드의 추가의 예는 이종성 숙주 세포에 유지된 재조합 폴리뉴클레오타이드 또는 용액 중의 정제된 (부분적으로 또는 실질적으로) 폴리뉴클레오타이드를 포함한다. 본 발명에 따른 분리된 폴리뉴클레오타이드 또는 핵산은 합성으로 생성된 이러한 분자를 더 포함한다. DNA의 중합체 형태인 분리된 폴리뉴클레오타이드 단편은 cDNA, 게놈 DNA, 또는 합성 DNA 중 하나 이상의 절편으로 구성될 수 있다.
용어 "유전자"는, 선택적으로 코딩 서열에 앞서는 조절 서열(5' 비코딩 서열) 및 코딩 서열에 뒤따르는 조절 서열(3' 비코딩 서열)을 포함하는, 특정 단백질로 발현될 수 있는 핵산 단편을 말한다.
본 명세서에서 사용되는 것과 같은 "코딩 영역" 또는 "ORF"는, 아미노산으로 번역되는 코돈으로 이루어진 핵산의 부분이다. "종결 코돈" (TAG, TGA, 또는 TAA)은 아미노산으로 번역되지는 않으나, 존재하는 경우 코딩 영역의 일부로서 여겨질 수 있지만, 임의의 플랭킹(flanking) 서열, 예로서 프로모터, 리보솜 결합 자리, 전사 종결자, 인트론, 5' 및 3' 비-번역 영역 등은 코딩 영역의 일부가 아니다. "적합한 조절 서열"은 코딩 서열의 업스트림 (5' 비-코딩 서열), 이의 내부, 또는 이의 다운스트림 (3' 비-코딩 서열)에 위치하고, 전사, RNA 가공 또는 안정성 또는 연관된 코딩 서열의 번역에 영향을 미치는 뉴클레오타이드 서열을 지칭한다. 조절 서열은 프로모터, 번역 리더 서열 (translation leader sequence), 인트론, 폴리아데닐화 인식 서열, RNA 가공 자리, 이펙터 (effector) 결합 자리 및 스템-루프 구조 (stem-loop structure)를 포함할 수 있다.
각종 번역 제어 성분은 당업자에게 알려져 있다. 이들에는, 이에 제한되지 않지만, 리보솜 결합 자리, 번역 개시 및 종결 코돈, 및 바이러스 시스템으로부터 유래된 성분들 (특히, 내부 리보솜 도입 자리 또는 IRES)이 포함된다. 다른 실시양태에서, 본 발명의 폴리뉴클레오타이드는 RNA, 예로서 메신저 RNA (mRNA)의 형태이다. 본 발명의 RNA는 단일 가닥 또는 이중 가닥일 수 있다.
본 명세서에서 사용되는 것과 같은, 용어 "형질전환"은 유전적으로 안정적인 유전성을 결과로서 야기하는, 숙주 생물체의 게놈 내로의 핵산 단편의 전달을 지칭한다. 형질전환된 핵산 단편을 포함하는 숙주 생물체는 "재조합" 또는 "형질전환된" 생물체로서 지칭된다.
용어 "플라스미드," "벡터," 및 "카세트"는 세포의 중심 대사의 일부가 아닌 유전자를 종종 운반하며, 대개 원형의 이중 가닥 DNA 단편의 형태인 염색체 외의 성분 (extra chromosomal)을 지칭한다. 이러한 요소는 임의의 공급원으로부터 유래되는 자체적으로 복제하는 서열, 게놈 통합 서열, 파지 또는 뉴클레오타이드 서열, 선형 또는 환형의 단일- 또는 이중-가닥 DNA 또는 RNA일 수 있으며, 여기에서, 다수의 뉴클레오타이드 서열은 적절한 3' 미번역 서열과 함께, 프로모터 단편 및 선택된 유전자 생성물에 대한 DNA 서열을 세포 내로 도입할 수 있는 독특한 구축물로 결합되거나 재조합된다. "형질전환 카세트"는 외래 유전자를 함유하고, 그 외래 유전자에 더하여 특정 숙주 세포의 형질전환을 용이하게 하는 요소들을 갖는 특정 벡터를 말한다. "발현 카세트"는 외래 유전자를 함유하며, 외래 유전자에 더하여 외래 숙주에서 그 유전자의 발현이 향상되게 하는 요소를 갖는 특정 벡터를 지칭한다.
본 명세서에 사용되는 바와 같이, "천연"은 존재하는 경우, 그 자신의 조절 서열을 포함하는, 자연에서 발견되는, 폴리뉴클레오타이드, 유전자 또는 폴리펩타이드의 형태를 지칭한다.
폴리뉴클레오타이드, 유전자 또는 폴리펩타이드에 관하여 사용하는 경우, 용어 "내생"은 생물체의 게놈 내의 그의 천연의 위치 내의 천연의 폴리뉴클레오타이드 또는 유전자를 지칭하거나, 천연 폴리펩타이드의 경우 게놈 내의 이러한 위치로부터 전사 및 번역된다.
폴리뉴클레오타이드, 유전자 또는 폴리펩타이드에 관하여 사용되는 경우, 용어 "이종성"은 숙주 생물 내에서 보통 관찰되지 않는 폴리뉴클레오타이드, 유전자 또는 폴리펩타이드를 지칭한다. 또한, "이종성"은 상응하는 천연 유전자와 상이한 형태로, 예로서, 생물체의 게놈 내의 그의 천연의 위치에 있지 않게, 공급원 생물체 내에 재도입되는 천연의 코딩 영역 또는 그의 부분을 포함한다. 이종성 폴리뉴클레오타이드 또는 유전자는 예로서, 유전자 전달에 의하여 숙주 생물체 내로 도입될 수 있다. 이종성 유전자는 천연의 숙주 내로 재도입되는 비-천연 조절 영역을 갖는 천연 코딩 영역을 포함할 수 있다. "트랜스유전자 (transgene)"는 형질전환 과정에 의해 게놈 내로 도입된 유전자이다.
"조절 서열"은 코딩 서열의 업스트림 (5' 비-코딩 서열), 그의 내부 또는 그의 다운스트림 (3' 비-코딩 서열)에 위치하고, 연관된 코딩 서열의 전사, RNA 가공 또는 안정성 또는 번역에 영향을 미치는 뉴클레오타이드 서열을 지칭한다. 조절 서열은 프로모터, 인핸서, 오퍼레이터, 리프레서, 전사 종결 신호, 번역 리더 서열, 인트론, 폴리아데닐화 인식 서열, RNA 가공 자리, 이펙터 결합 자리 및 스템-루프 구조를 포함할 수 있다.
용어 "프로모터"는 코딩 서열 또는 작용성 RNA의 발현을 조절할 수 있는 핵산 서열을 지칭한다. 일반적으로, 코딩 서열은 프로모터 서열에 대해 3'에 위치한다. 프로모터는, 천연 유전자로부터 그 전체가 유래될 수도 있거나, 자연에서 발견되는 상이한 프로모터로부터 유래된 상이한 요소로 구성될 수도 있거나, 또는 심지어는 합성 핵산 절편을 포함할 수도 있다. 상이한 프로모터는 상이한 조직 또는 세포 유형에서, 또는 상이한 발생 단계에서, 또는 상이한 환경적 또는 생리학적 조건에 반응하여 유전자의 발현을 지시할 수 있음을 당업자는 이해할 것이다. 대부분의 경우에 대부분의 세포 유형에서 유전자의 발현을 유발하는 프로모터를 통상적으로 "구조성(constitutive) 프로모터"라고 지칭한다. 한면, "유도성 프로모터"는 프로모터가 프로모터-특이적 신호 또는 분자에 의하여 유도되거나 켜지는 경우 유전자가 발현되게 한다. 대부분의 경우에 조절 서열의 정확한 경계는 완전하게 규정되지 않은 것이므로, 상이한 길이의 DNA 단편이 동일한 프로모터 활성을 가질 수 있다는 것이 더욱 인식된다. 예로서, "FBA1 프로모터"는 FBA1 유전자의 프로모터 영역으로부터 유래된 단편을 지칭하는데 사용될 수 있다는 것이 이해될 것이다.
본 명세서에 사용되는 바와 같이, 용어 "종결자 (terminator)"는 코딩 서열의 하류에 위치하는 DNA 서열을 지칭한다. 이는 폴리아데닐화 인식 서열 및 mRNA 프로세싱 또는 유전자 발현에 영향을 미칠 수 있는 조절 신호를 암호화하는 다른 서열을 포함한다. 폴리아데닐화 신호는 대개 mRNA 전구체의 3' 말단에 폴리아데닐산 트랙트(tract)를 부가하는 데에 영향을 미치는 것에 의해 특징된다. 3' 영역은 전사, RNA 프로세싱 또는 안정성, 또는 관련 코딩 서열의 번역에 영향을 미칠 수 있다. 대부분의 경우에 조절 서열들의 정확한 경계는 완전히 정의된 것은 아니기 때문에, 상이한 길이의 DNA 단편들이 동일한 종결자 활성을 가질 수 있는 것으로 인식된다. 예로서, "CYC1 종결자"는 CYC1 유전자의 종결자 영역으로부터 유래된 단편을 지칭하는데 사용될 수 있음이 이해될 것이다.
용어 "작동적으로 연결된"은, 하나의 기능이 다른 하나에 의해 영향을 받도록 단일 핵산 단편상에서 핵산 서열들이 연합됨을 지칭한다. 예로서, 프로모터가 코딩 서열의 발현에 영향을 미칠 수 있는 경우에, 프로모터는 그 코딩 서열에 작동적으로 연결된 것이다 (즉, 코딩 서열은 프로모터의 전사 제어 하에 있다). 코딩 서열은 센스 또는 안티센스 배향으로 조절 서열에 작동가능하게 연결될 수 있다.
본 명세서에서 사용된 용어 "발현"은, 본 발명의 핵산 단편으로부터 유래된 센스(mRNA) 또는 안티센스 RNA의 전사 및 안정한 축적을 지칭한다. 또한, 발현은 mRNA의 폴리펩타이드로의 번역을 지칭할 수 있다.
본 명세서에서 사용된 표준 재조합 DNA 및 분자 클로닝 기술은 당 업계에서 공지되며, Sambrook 등 (Sambrook, Fritsch, and Maniatis, Molecular Cloning: A Laboratory Manual, Second Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989) (이후, "Maniatis"로 지칭); 및 Silhavy 등 (Silhavy et al., Experiments with Gene Fusions, Cold Spring Harbor Laboratory Press Cold Spring Harbor, NY, 1984); 및 Ausubel, F. M. 등 (Ausubel et al., Current Protocols in Molecular Biology, Greene Publishing Assoc. 및 Wiley-Interscience 출판, 1987)에 기재되어 있다.
부탄올 생합성 경로
탄수화물 이용 미생물은 엠덴-마이어호프-파르나스 (Embden-Meyerhof-Parnas: EMP) 경로, 엔트너-도우도르프 (Entner-Doudoroff) 경로 및 펜토오스 인산 회로를, 중심 대사 경로로서 이용하여 성장 및 유지를 위한 에너지 및 세포 전구체를 제공한다. 이들 경로는 중간체 글리세르알데하이드-3-인산을 공통으로 가지며, 최종적으로는, 직접적으로 또는 EMP 경로와 조합하여 피루베이트가 형성된다. 그 후, 피루베이트는 다양한 수단을 통하여 아세틸-조효소 A (아세틸-CoA)로 변형된다. 아세틸-CoA는, 예로서 지방산, 아미노산 및 2차 대사산물의 생성에서 주요 중간체로서 제공된다. 피루베이트로의 당 전환의 조합된 반응은 에너지 (예로서, 아데노신-5'-삼인산, ATP) 및 환원 균등물 (예로서, 환원된 니코틴아미드 아데노신 다이뉴클레오타이드, NADH, 및 환원된 니코틴아미드 아데닌 다이뉴클레오타이드 인산, NADPH)을 생산한다. NADH 및 NADPH는 그의 산화된 형태 (각각, NAD+ 및 NADP+)로 재활용되어야만 한다. 무기 전자 수용체 (예로서, O2, NO3 - 및 SO4 2-)의 존재 하에, 환원 균등물은 에너지 풀을 증강시키는데 사용될 수 있으며; 대안적으로, 환원된 탄소 생성물이 형성될 수 있다.
본 발명에 사용될 수 있는 발효가능한 탄소 공급원으로부터의 부탄올 이성질체의 생산을 위한 조작된 생합성 경로는, 예로서, 본 명세서에 참고문헌으로 통합된, 미국 특허 제 7,851,188호 및 제 7,993,889호에 기재되어 있다. 한 실시양태에서, 조작된 부탄올 생합성 경로는 아이소부탄올 생합성 경로로, 이는 하기 기질에서 생성물로의 전환을 포함한다:
a) 예로서, 아세토락테이트 신타제에 의해 촉매작용될 수 있는, 피루베이트에서 아세토락테이트로의 전환;
b) 예로서, 아세토하이드록시산 이성질화환원효소에 의하여 촉매작용될 수 있는, 아세토락테이트에서 2,3-다이하이드록시아이소발레레이트로의 전환;
c) 예로서, 다이하드록시산 탈수효소에 의하여 촉매작용될 수 있는, 2,3-다이하이드록시아이소발레레이트에서 α-케토아이소발레레이트로의 전환;
d) 예로서, α-케토산 탈카르복실화효소에 의하여 촉매작용될 수 있는, α-케토아이소발레레이트에서 아이소부티르알데하이드로의 전환; 및
e) 예로서, 알코올 탈수소효소에 의하여 촉매작용될 수 있는, 아이소부티르알데하이드에서 아이소부탄올로의 전환.
다른 실시양태에서, 아이소부탄올 생합성 경로는 하기의 기질에서 생성물로의 전환을 포함한다:
a) 예로서, 아세토락테이트 신타제에 의해 촉매작용될 수 있는, 피루베이트에서 아세토락테이트로의 전환;
b) 예로서, 아세토하이드록시산 이성질화환원효소에 의하여 촉매작용될 수 있는, 아세토락테이트에서 2,3-다이하이드록시아이소발레레이트로의 전환;
c) 예로서, 다이하드록시산 탈수효소에의하여 촉매작용될 수 있는, 2,3-다이하이드록시아이소발레레이트에서 α-케토아이소발레레이트로의 전환;
d) 예로서, 분지쇄 케토산 탈수소효소에 의해 촉매작용될 수 있는, α-케토아이소발레레이트에서 아이소부티릴-CoA로의 전환;
e) 예로서, 아실화 알데하이드 탈수소효소에 의해 촉매작용될 수 있는, 아이소부티릴-CoA에서 아이소부티르알데하이드로의 전환; 및
f) 예로서, 알코올 탈수소효소에 의하여 촉매작용될 수 있는, 아이소부티르알데하이드에서 아이소부탄올로의 전환.
사용될 수 있는 1-부탄올의 생산을 위한 조작된 생합성 경로는, 본 명세서에서 참고로 통합된, 미국 출원 공개 번호 제 20080182308호에 기재된 것들이 포함된다. 한 실시양태에서, 1-부탄올 생합성 경로는 하기의 기질에서 생성물로의 전환을 포함한다:
a) 예로서, 아세틸-CoA 아세틸 전이효소에 의하여 촉매작용될 수 있는, 아세틸-CoA에서 아세토아세틸-CoA로의 전환;
b) 예로서, 3-하이드록시부티릴-CoA 탈수소효소에 의해 촉매작용될 수 있는, 아세토아세틸-CoA에서 3-하이드록시부티릴-CoA로의 전환;
c) 예로서, 크로토나제에 의해 촉매작용될 수 있는, 3-하이드록시부티릴-CoA에서 크로토닐-CoA로의 전환;
d) 예로서, 부티릴-CoA 탈수소효소에 의해 촉매작용될 수 있는, 크로토닐-CoA에서 부티릴-CoA로의 전환;
e) 예로서, 부티르알데하이드 탈수소효소에 의해 촉매작용될 수 있는, 부티릴-CoA에서 부티르알데하이드로의 전환; 및
f) 예로서, 부탄올 탈수소효소에 의해 촉매작용될 수 있는, 부티르알데하이드에서 1-부탄올로의 전환.
한 실시양태에서, 본 발명은 부탄올 생산을 위한 표준 석유화학 공정과 관련된 부정적인 환경적 영향은 피하면서, 식물 유래의 탄소 공급원으로부터 부탄올을 생산한다. 한 실시양태에서, 본 발명은 조작된 부탄올 생합성 경로를 포함하는 재조합 산업 숙주 세포를 이용하는 부탄올의 생산 방법을 제공한다.
일부 실시양태에서, 부탄올 생합성 경로는, 숙주 세포에 대하여 이종성인, 1 이상의 폴리뉴클레오타이드, 2 이상의 폴리뉴클레오타이드, 3 이상의 폴리뉴클레오타이드, 또는 4 이상의 폴리뉴클레오타이드를 포함한다. 일부 실시양태에서, 재조합 숙주 세포 내에서 부탄올 생합성 경로 중 각각의 기질에서의 생성물로의 전환은 이종성 폴리펩타이드에 의하여 촉매작용된다. 실시양태들에서, 아세토락테이트에서 2,3-다이하이드록시아이소발레레이트로의 기질에서 생성물로의 전환을 촉매작용하는 폴리펩타이드 및/또는 아이소부티르알데하이드에서 아이소부탄올로의 기질에서 생성물로의 전환을 촉매작용시키는 폴리펩타이드는 NADH를 보조인자로 사용할 수 있다.
일부 실시양태에서, 부타놀로겐의 조작된 부탄올 경로는 하기 효소 협회 번호(Enzyme Commission Numbers)를 갖는 효소들의 그룹으로부터 선택된 하나 이상의 폴리펩타이드를 포함한다 : EC 2.2.1.6, EC 1.1.1.86, EC 4.2.1.9, EC 4.1.1.72, EC 1.1.1.1, EC 1.1.1.265, EC 1.1.1.2, EC 1.2.4.4, EC 1.3.99.2, EC 1.2.1.10, EC 2.3.1.9, EC 2.3.1.16, EC 1.1.1.35, EC 1.1.1.157, EC 1.1.1.36, EC 4.2.1.17, EC 4.2.1.55, EC 1.3.1.44, EC 1.3.1.38, 및 EC 1.2.1.57.
일부 실시양태에서, 부타놀로겐의 조작된 부탄올 경로는 하기 효소들의 그룹으로부터 선택된 하나 이상의 폴리펩타이드를 포함한다: 아세토락테이트 신타제, 아세토하이드록시산 이성질화환원효소, 다이하드록시산 탈수효소, 분지쇄 알파-케토산 탈카르복실화효소, 분지쇄 알코올 탈수소효소, 아실화 알데하이드 탈수소효소, 분지쇄 케토산 탈수소효소, 부티릴-CoA 탈수소효소, 부티르알데하이드 탈수소효소, 아세틸-CoA 아세틸 전이효소, 3-하이드록시부티릴-CoA 탈수소효소, 크로토나제, 부티릴-CoA 탈수소효소, 부탄올 탈수소효소, 및 부티르알데하이드 탈수소효소.
용어 "아세토하이드록시산 신타제," "아세토락테이트 신타제" 및 "아세토락테이트 신테타제 (synthetase)" ("ALS"로 약기)는, 아세토락테이트 신타제의 생물학적 기능을 갖는 임의의 폴리펩타이드를 지칭하기 위하여 본 명세서에서 상호교환적으로 사용된다. 이러한 폴리펩타이드는 피루베이트에서 아세토락테이트 및 CO2로의 전환을 촉매작용하는 폴리펩타이드를 포함한다. 예시적인 아세토락테이트 신타제는 EC 번호 2.2.1.6 (Enzyme Nomenclature 1992, Academic Press, San Diego)으로 공지되어 있다. 이들 변형되지 않은 효소는, 이에 제한되지는 않지만, 바실러스 서브틸리스 (Bacillus subtilis) (각각 GenBank 번호: CAB15618 및 Z99122, NCBI (국립생물공학정보센터(National Center for Biotechnology Information)) 아미노산 서열, NCBI 뉴클레오타이드 서열), 클렙시엘라 뉴모니에 (Klebsiella pneumoniae) (GenBank 번호: AAA25079 및 M73842), 및 락토코커스 락티스 (Lactococcus lactis) (GenBank 번호: AAA25161 및 L16975)를 포함하여, 다수의 공급원으로부터 입수가능하다.
용어 "케톨-산 환원이성질화효소" ("KARI"),"아세토하이드록시산 이성질화환원효소" 및 "아세토하이드록시산 환원이성질화효소"는 상호교환가능하게 사용될 것이며, 케톨-산 환원이성질화효소의 생물학적 기능을 갖는 임의의 폴리펩타이드를 지칭한다. 이러한 폴리펩타이드로는 (S)-아세토락테이트에서 2,3-다이하이드록시아이소발레레이트의 반응을 촉매작용할 수 있는 폴리펩타이드가 포함된다. 예시적인 KARI 효소는 EC 번호 EC 1.1.1.86 (Enzyme Nomenclature 1992, Academic Press, San Diego)으로서 분류될 수 있으며, 이에 제한되지는 않지만 에스케리키아 콜라이 (Escherichia coli) (서열번호 1) (GenBank 번호: NP_418222 및 NC_000913), 사카로마이세스 세레비시에 (Saccharomyces cerevisiae) (GenBank 번호: NP_013459 및 NC_001144), 메타노코커스 마리팔루디스 (Methanococcus maripaludis) (GenBank 번호: CAF30210 및 BX957220), 슈도모나스 플루오레센스 (Pseudomonas fluorescens) (서열번호 2) 및 바실러스 서브틸리스 (GenBank 번호: CAB14789 및 Z99118)를 포함하는 막대한 미생물들의 모음으로부터 입수가능하다. KARI는 아나에로스티페스 칵캐 (Anaerostipes caccae) KARI 변이체 "K9G9" (서열번호 132), "K9D3" (서열번호 133), "K9JBP4P" (서열번호 130), 및 "K9SB2-SH" (서열번호 126)를 포함한다. 케톨-산 환원이성질화효소 (KARI)는 미국 특허 제 7,910,342호 및 제 8,129,162호; 미국 특허 출원 공개 번호 제 20100197519호; 및 국제 출원 공개 번호 제 WO/2011/041415호에 기재되어 있으며, 이들은 본 명세서에 참고로서 통합된다. 거기 개시된 예시적인 KARI는 락토코커스 락티스, 비브리오 콜레라 (Vibrio cholera), 슈도모나스 아에루기노사 (Pseudomonas aeruginosa) PAO1 및 슈도모나스 플루오레센스 PF5 돌연변이체로부터의 것들이다. 일부 실시양태에서, KARI는 NADH를 보조인자로서 이용한다. 일부 실시양태에서, KARI는 NADPH를 보조인자로서 이용한다. PCT 특허 출원 공개 번호 제 WO2012/129555호는 본 발명에 유용한 KARI 돌연변이체를 추가로 기재하며, 이는 본 명세서에 참고문헌으로 통합된다.
용어 "아세토하이드록시산 탈수효소" 및 "다이하드록시산 탈수효소" ("DHAD")는 다이하드록시산 탈수효소의 생물학적 기능을 갖는 임의의 폴리펩타이드를 지칭한다. 이러한 폴리펩타이드에는 2,3-다이하이드록시아이소발레레이트에서 α-케토아이소발레레이트로의 전환을 촉매작용하는 폴리펩타이드가 포함된다. 예시적인 다이하이드록시산 탈수효소는 EC 번호 4.2.1.9로 알려져 있다. 이러한 효소는, 이에 제한되지는 않지만, E. 콜라이 (GenBank 번호: YP_026248 및 NC_000913), S. 세레비시에 (GenBank 번호: NP_012550 및 NC_001142), M. 마리팔루디스 (GenBank 번호: CAF29874 및 BX957219), B. 서브틸리스 (GenBank 번호: CAB14105 및 Z99115), 락토코커스 락티스 (서열번호 3), 스트렙토코커스 뮤탄스 (Streptococcus mutans) (서열번호 4) 및 N. 크라사 (N. crassa)를 포함하는 막대한 미생물들의 모음으로부터 입수가능하다. 미국 특허 공개 번호 제 20100081154 A1호 및 미국 특허 제 7,993,889호는, 본 명세서에 참고문헌으로 통합되며, 다이하드록시산 탈수효소 (DHAD)를 기재하고 있으며, 이는 스트렙토코커스 뮤탄스로부터의 DHAD (서열번호 131)를 포함한다. 적합한 DHAD는 "L2V4"와 같은 스트렙토코커스 뮤탄스의 변이체도 포함한다 (서열번호 134).
용어 "분지쇄 α-케토산 탈카르복실화효소" 또는 "α-케토산 탈카르복실화효소" 또는 "α-케토아이소발레레이트 탈카르복실화효소" 또는 "2-케토아이소발레레이트 탈카르복실화효소" ("KIVD")는 2-케토아이소발레레이트 탈카르복실화효소의 생물학적 기능을 갖는 임의의 폴리펩타이드를 지칭한다. 이러한 폴리펩타이드는 α-케토아이소발레레이트에서 아이소부티르알데하이드 및 CO2로의 전환을 촉매작용하는 폴리펩타이드를 포함한다. 예시적인 분지쇄 α-케토산 탈카르복실화효소는 EC 번호 4.1.1.72로 알려져 있으며, 이에 제한되지는 않지만, 락토코커스 락티스 (GenBank 번호: AAS49166, AY548760, CAG34226 및 AJ746364), 살모넬라 티피무리움 (Salmonella typhimurium) (GenBank 번호: NP_461346 및 NC_003197), 클로스트리듐 아세토부틸리쿰 (GenBank 번호: NP_149189 및 NC_001988), 매크로코커스 카세올리티쿠스 (Macrococcus caseolyticus) (서열번호 5), 및 리스테리아 그라이이 (Listeria Grayi) (서열번호 6)를 포함하는 다수의 공급원으로부터 입수가능하다.
용어 "분지쇄 알코올 탈수소효소" 또는 "알코올 탈수소효소" ("ADH")는 알코올 탈수소효소의 생물학적 기능을 갖는 임의의 폴리펩타이드를 지칭한다. 이러한 폴리펩타이드는 아이소부티르알데하이드의 아이소부탄올로의 전환을 촉매작용하는 폴리펩타이드를 포함한다. 예시적인 분지쇄 알코올 탈수소효소는 EC 번호 1.1.1.265로 알려져 있으나, 또한 다른 알코올 탈수소효소 (구체적으로, EC 1.1.1.1 또는 1.1.1.2) 하에 분류될 수도 있다. 알코올 탈수소효소는 NADPH 또는 NADH를 보조인자로서 사용할 수 있다. 이러한 효소는, 이에 제한되지는 않지만, S. 세레비시에 (GenBank 번호: NP_010656, NC_001136, NP_014051 및 NC_001145), E. 콜라이 (GenBank 번호: NP_417484 및 NC_000913), C. 아세토부틸리쿰 (GenBank 번호: NP_349892, NC_003030, NP_349891 및 NC_003030), B. 인디카 (서열번호 7) 및 A. 자일로족시단스 (A. xylosoxidans) (서열번호 8)를 포함하는 다수의 공급원으로부터 입수가능하다. 미국 특허 공개 번호 제 20090269823 A1호는, 본 명세서에 참고문헌으로서 통합되며, 아크로모박터(Achromobacter) 자일록시단스로부터의 알코올 탈수소효소 (ADH)인, SadB를 기재하고 있다. 알코올 탈수소효소는 말의 간 ADH 및 베이제린키아 (Beijerinkia) 인디카 ADH도 포함한다 (이는 본 명세서에 참고문헌으로서 통합된, 미국 특허 출원 공개 번호 제 20110269199호에 기재된 바와 같음).
용어 "부탄올 탈수소효소"는 부탄올 탈수소효소의 생물학적 기능을 갖는 임의의 폴리펩타이드를 지칭한다. 이러한 폴리펩타이드는 아이소부티르알데하이드에서 아이소부탄올로의 전환 또는 2-부타논에서 2-부탄올로의 전환을 촉매하는 폴리펩타이드를 포함한다. 부탄올 탈수소효소는 광범위한 알코올 탈수소효소 패밀리의 서브셋 (subset)이다. 부탄올 탈수소효소는 NADH 또는 NADPH 의존성일 수 있다. NADH 의존성 효소는 EC 1.1.1.1로서 알려져 있으며, 예로서 로도코커스 루버 (Rhodococcus ruber) (GenBank 번호: CAD36475 및 AJ491307)로부터 입수가능하다. NADPH 의존성 효소는 EC 1.1.1.2로서 알려져 있으며, 예로서 파이로코커스 푸리오서스 (Pyrococcus furiosus) (GenBank 번호: AAC25556 및 AF013169)로부터 입수가능하다. 추가적으로, 부탄올 탈수소효소는 에스케리키아 콜라이(GenBank 번호: NP_417484 및 NC_000913)로부터 입수가능하고, 사이클로헥산올 탈수소효소는 아시네토박터 종 (Acinetobacter sp.) (GenBank 번호: AAG10026 및 AF282240)으로부터 입수가능하다. 또한, 용어 "부탄올 탈수소효소"는 NADH 또는 NADPH 중 어느 하나를 보조인자로 사용하여 부티르알데하이드에서 1-부탄올로의 전환을 촉매작용하는 효소를 말한다. 부탄올 탈수소효소는 예로서, C. 아세토부틸리쿰 (GenBank 번호: NP_149325 및 NC_001988 (주: 이 효소는 알데하이드 및 알코올 탈수소효소 활성을 모두 갖는다), NP_349891, NC_003030, NP_349892 및 NC_003030) 및 E. 콜라이 (GenBank 번호: NP_417484 및 NC_000913)로부터 입수가능하다.
용어 "분지쇄 케토산 탈수소효소"는 분지쇄 케토산 탈수소효소의 생물학적 기능을 갖는 임의의 폴리펩타이드를 지칭한다. 이러한 폴리펩타이드는, 전형적으로 NAD+ (니코틴아미드 아데닌 다이뉴클레오타이드)를 전자 수용체로서 이용하여, α-케토아이소발레레이트에서 아이소부티릴-CoA (아이소부티릴-조효소A)로의 전환을 촉매작용하는 폴리펩타이드를 포함한다. 예시적인 분지쇄 케토산 탈수소효소는 EC 번호 1.2.4.4로 공지되어 있다. 이러한 분지쇄 케토산 탈수소효소는 4개의 서브유닛으로 구성되며, 모든 서브유닛으로부터의 서열은, 이에 제한되지는 않지만, B. 서브틸리스 (GenBank 번호: CAB14336, Z99116, CAB14335, Z99116, CAB14334, Z99116, CAB14337 및 Z99116) 및 슈도모나스 푸티다 (GenBank 번호: AAA65614, M57613, AAA65615, M57613, AAA65617, M57613, AAA65618 및 M57613)을 포함하는 막대한 미생물의 모음으로부터 입수가능하다.
용어 "아실화 알데하이드 탈수소효소"는 아실화 알데하이드 탈수소효소의 생물학적 기능을 갖는 임의의 폴리펩타이드를 지칭한다. 이러한 폴리펩타이드는, 전형적으로 NADH 또는 NADPH를 전자 수용체로서 이용하여, 아이소부티릴-CoA에서 아이소부티르알데하이드로의 전환을 촉매작용하는 폴리펩타이드를 포함한다. 예시적인 아실화 알데하이드 탈수소효소는 EC 번호 1.2.1.10 및 1.2.1.57로 알려져 있다. 이러한 효소는, 이에 제한되지는 않지만, 클로스트리듐 베이제린키이 (Clostridium beijerinckii) (GenBank 번호: AAD31841 및 AF157306), C. 아세토부틸리쿰 (GenBank 번호: NP_149325, NC_001988, NP_149199 및 NC_001988), P. 푸티다 (P. putida) (GenBank 번호: AAA89106 및 U13232), 및 테르무스 써모필러스 (Thermus thermophilus) (GenBank 번호: YP_145486 및 NC_006461)를 포함하는 다수의 공급원으로부터 입수가능하다.
용어 "아세틸-CoA 아세틸전이효소"는 아세틸-CoA 아세틸전이효소의 생물학적 기능을 갖는 임의의 폴리펩타이드를 지칭한다. 이러한 폴리펩타이드는 두 분자의 아세틸-CoA에서 아세토아세틸-CoA 및 조효소 A (CoA)로의 전환을 촉매작용하는 폴리펩타이드를 포함한다. 아세틸-CoA 아세틸전이효소의 예에는 단쇄 아실-CoA 및 아세틸-CoA에 대한 기질 선호 (순방향에서의 반응)가 있는 아세틸-CoA 아세틸전이효소가 있으며, E.C. 2.3.1.9 [Enzyme Nomenclature 1992, Academic Press, San Diego]로 분류되지만; 보다 광범위한 기질 범위를 갖는 효소 (E.C. 2.3.1.16)도 또한 작용성일 것이다. 아세틸-CoA 아세틸전이효소는 다수의 공급원, 예로서 에스케리키아 콜라이(GenBank 번호: NP_416728 및 NC_000913), 클로스트리듐 아세토부틸리쿰 (Clostridium acetobutylicum) (GenBank 번호: NP_349476.1, NC_003030, NP_149242 및 NC_001988), 바실러스 서브틸리스 (GenBank 번호: NP_390297 및 NC_000964), 및 사카마이세스 세레비시에 (GenBank 번호: NP_015297 및 NC_001148)로부터 입수가능하다.
용어 "3-하이드록시부티릴-CoA 탈수소효소"는 3-하이드록시부티릴-CoA 탈수소효소의 생물학적 기능을 갖는 임의의 폴리펩타이드를 지칭한다. 이러한 폴리펩타이드는 아세토아세틸-CoA에서 3-하이드록시부티릴-CoA로의 전환을 촉매작용하는 폴리펩타이드를 포함한다. 예시적인 3-하이드록시부티릴-CoA 탈수소효소는 (S)-3-하이드록시부티릴-CoA 또는 (R)-3-하이드록시부티릴-CoA에 대한 기질 선호성을 갖고, 환원된 니코틴아미드 아데닌 다이뉴클레오타이드 (NADH)-의존성일 수 있다. 예들은 각각 E.C. 1.1.1.35 및 E.C. 1.1.1.30으로 분류될 수 있다. 추가로, 3-하이드록시부티릴-CoA 탈수소효소는 (S)-3-하이드록시부티릴-CoA 또는 (R)-3-하이드록시부티릴-CoA에 대한 기질 선호성을 갖고, 환원형 니코틴아미드 아데닌 다이뉴클레오타이드 포스페이트 (NADPH)-의존성일 수 있으며, 각각 E.C. 1.1.1.157 및 E.C. 1.1.1.36으로 분류된다. 3-하이드록시부티릴-CoA 탈수소효소는 다수의 공급원, 예로서, C. 아세토부틸리쿰 (GenBank 번호: NP_349314 및 NC_003030), B. 서브틸리스 (GenBank 번호: AAB09614 및 U29084), 랄스토니아 유트로파 (Ralstonia eutropha) (GenBank 번호: YP_294481 및 NC_007347), 및 알칼리제네스 유트로푸스 (Alcaligenes eutrophus) (GenBank 번호: AAA21973 및 J04987)로부터 입수가능하다.
용어 "크로토나제"는 크로토나제의 생물학적 기능을 갖는 임의의 폴리펩타이드를 지칭한다. 이러한 폴리펩타이드는 3-하이드록시부티릴-CoA에서 크로토닐-CoA 및 H2O로의 전환을 촉매작용하는 폴리펩타이드를 포함한다. 크로토나제의 예는 (S)-3-하이드록시부티릴-CoA 또는 (R)-3-하이드록시부티릴-CoA에 대한 기질 선호를 가질 수 있으며, 각각 E.C. 4.2.1.17 및 E.C. 4.2.1.55로 분류될 수 있다. 크로토나제는 다수의 공급원, 예로서, E. 콜라이 (GenBank 번호: NP_415911 및 NC_000913), C. 아세토부틸리쿰 (GenBank 번호: NP_349318 및 NC_003030), B. 서브틸리스 (GenBank 번호: CAB13705 및 Z99113), 및 에어로모나스 카비에 (Aeromonas caviae) (GenBank 번호: BAA21816 및 D88825)로부터 입수가능하다.
용어 "부티릴-CoA 탈수소효소"는 부티릴-CoA 탈수소효소의 생물학적 기능을 갖는 임의의 폴리펩타이드를 지칭한다. 이러한 폴리펩타이드는 크로토닐-CoA에서 부티릴-CoA로의 전환을 촉매작용하는 폴리펩타이드를 포함한다. 예시적인 부티릴-CoA 탈수소효소는 NADH-의존성, NADPH-의존성 또는 플라빈-의존성일 수 있으며, 각각 E.C. 1.3.1.44, E.C. 1.3.1.38 및 E.C. 1.3.99.2로 분류될 수 있다. 부티릴-CoA 탈수소효소는 다수의 공급원, 예로서, C. 아세토부틸리쿰 (GenBank 번호: NP_347102 및 NC_ 003030), 유글레나 그라실리스 (Euglena gracilis) (GenBank 번호: Q5EU90 및 AY741582), 스트렙토마이세스 콜리누스 (Streptomyces collinus) (GenBank 번호: AAA92890 및 U37135), 및 스트렙토마이세스 코엘리컬러 (Streptomyces coelicolor) (GenBank 번호: CAA22721 및 AL939127)로부터 입수가능하다.
용어 "부티르알데하이드 탈수소효소"는 부티르알데하이드 탈수소효소의 생물학적 기능을 갖는 임의의 폴리펩타이드를 지칭한다. 이러한 폴리펩타이드는, NADH 또는 NADPH를 보조인자로서 이용하여, 부티릴-CoA에서 부티르알데하이드로의 전환을 촉매작용하는 폴리펩타이드를 포함한다. NADH에 대하여 선호성을 갖는 부티르알데하이드 탈수소효소는 E.C. 1.2.1.57로 공지되어 있으며, 예로서, 클로스트리듐 베이제린키이 (GenBank 번호: AAD31841 및 AF157306) 및 C. 아세토부틸리쿰 (GenBank 번호: NP_149325 및 NC_001988)으로부터 입수가능하다.
숙주 세포
부탄올 생산을 위한 숙주 세포는 세균 및 효모로부터 선택될 수 있다. 실시양태에서, 적합한 숙주 세포로는 유전적 변형 및 재조합 유전자 발현에 유용한 임의의 세균 또는 효모 새포가 포함된다. 적합한 미생물 숙주의 선택 기준은 하기를 포함한다: 생산되는 부탄올 이성질체에 대한 고유 내성, 높은 글루코스 이용 속도, 유전자 조작을 위한 유전학적 도구의 이용가능성, 및 안정한 염색체 변경을 생성하는 능력.
숙주를 유전적으로 변형시키는 능력은 임의의 재조합 미생물의 제조에 필수적이다. 유전자 전달 기술의 양식은 엘렉트로포레이션 (electroporation), 접합, 형질도입 또는 자연적 형질전환에 의한 것일 수 있다. 광범위한 숙주 접합성 플라스미드 및 약물 내성 마커가 이용가능하다. 클로닝 벡터는, 숙주에서 기능할 수 있는 항생제 내성 마커의 성질에 기초하여 숙주 생물에 맞춰 조절된다.
또한, 미생물 숙주는 다양한 유전자를 결실시킴으로써 탄소 흐름에 대한 경쟁 경로를 비활성화시키기 위하여 조작되어야 한다. 이는, 직접적인 비활성화를 위한 트랜스포손 (transposon) 또는 염색체 통합 벡터의 이용가능성을 필요로 한다. 추가적으로, 생산 숙주는 고유 부탄올 내성을 개선시키는 돌연변이가 수득될 수 있도록 화학적 돌연변이유발될 수 있어야만 한다.
부탄올 이성질체의 생산에 사용된 미생물 숙주 세포는, 부탄올 이성질체의 수율이 부탄올 이성질체의 독성에 의하여 제한되지 않도록 생산되는 부탄올 이성질체에 대하여 내성인 것이 바람직하다. 한 실시양태에서, 아이소부탄올 생산에 사용된 숙주는 아이소부탄올에 대하여 내성이다. 아이소부탄올에 대한 내성을 갖는 적합한 숙주 균주는 미국 특허 제 7,993,889호 (본 명세서에 참고문헌으로 통합됨)에서 기재된 것과 같은 균주의 고유 내성에 기초한 스크리닝 방법에 의하여 동정될 수 있다.
아이소부탄올 생산을 위한 미생물 숙주는, 단당류, 올리고당 및 다당류를 포함하는 탄수화물도 높은 속도로 이용하여야만 한다. 대부분의 미생물은 탄수화물을 이용할 수 있다. 그러나, 특정 환경적 미생물은 탄수화물을 고효율로 이용할 수 없으며, 따라서 적합한 숙주가 될 수 없다.
상기 기재된 기준에 의거하여, 부탄올 생산에 적합한 미생물 숙주로는, 이에 제한되지는 않지만, 클로스트리듐, 자이모모나스 (Zymomonas), 에스케리키아, 살모넬라, 로도코커스, 슈도모나스, 바실러스, 락토바실러스, 엔테로코커스, 알칼리제네스, 클렙시엘라, 파에니바실러스 (Paenibacillus), 아트로박터 (Arthrobacter), 코리네박테리움 (Corynebacterium), 브레비박테리움 (Brevibacterium), 피키아 (Pichia), 칸디다 (Candida), 한세눌라 (Hansenula), 스키조사카로마이세스 (Schizosaccharomyces), 이사첸키아 (Issatchenkia), 클루이베로마이세스 (Kluyveromyces), 야로이야 (Yarrowia), 피키아, 칸디다, 한세눌라 및 사카로마이세스 속의 원들이 포함된다. 바람직한 숙주로는 에스케리키아 콜라이, 알칼리제네스 유트로푸스, 바실러스 리체니포르미스 (Bacillus licheniformis), 파에니바실러스 마세란스 (Paenibacillus macerans), 로도코커스 에리쓰로폴리스 (Rhodococcus erythropolis), 슈도모나스 푸티다, 락토바실러스 플란타룸 (Lactobacillus plantarum), 엔테로코커스 패슘 (Enterococcus faecium), 엔테로코커스 갈리나리움 (Enterococcus gallinarium), 엔테로코커스 파에칼리스 (Enterococcus faecalis), 바실러스 서브틸리스, 스키조사카로마이세스 품베 (Schizosaccharomyces pombe), 클루이베로마이세스 락티스, 클루이베로마이세스 써모톨레란스 (Kluyveromyces thermotolerans), 클루이베로마이세스 마르시아누스 (Kluyveromyces marxianus), 칸디다 글라브라타 (Candida glabrata), 칸디다 알비칸스 (Candida albicans), 피키아 스티피티스 (Pichia stipitis), 야로이야 리폴리티카 (Yarrowia lipolytica), E. 콜라이, L. 플란타룸 및 사카로마이세스 세레베시에가 포함된다. 일부 실시양태에서, 숙주 세포는 사카로마이세스 세레비시에이다. S. 세레비시에 효모는 본 기술분야에 알려져 있으며, 이에 제한되지는 않지만, 미국 균주보존협회 (American Type Culture Collection) (Rockville, MD 소재); Centraalbureau voor Schimmelcultures (CBS) 진균류 생물다양성 센터 (Fungal Biodiversity Centre); LeSaffre; Gert Strand AB; Ferm Solutions; North American Bioproducts; Martrex 및 Lallemand와 같은 다양한 공급원들로부터 입수가능하다 사카로마이세스 세레비시에는, 이에 제한되지는 않지만, BY4741, CEN.PK 113-7D, Ethanol Redㄾ 효모, Ferm Pro™ 효모, Bio-Fermㄾ XR 효모, 게르트 스트랜드 프레스티지 배치 터보 (Gert Strand Prestige Batch Turbo) 알코올 효모, 게르트 스트랜드 포트 디스틸러스 (Gert Strand Pot Distillers) 효모, 게르트 스트랜드 디스틸러스 터보 (Gert Strand Distillers Turbo) 효모, FerMax™ Green 효모, FerMax™ Gold 효모, Thermosaccㄾ 효모, BG-1, PE-2, CAT-1, CBS7959, CBS7960 및 CBS7961을 포함한다.
부탄올 생산을 위한 숙주 세포
발효가능한 탄소 기질의 부탄올 이성질체로의 전환을 위한 효소 경로를 암호화하는데 필요한 유전자를 함유하는 재조합 미생물은 당 분야에 공지된 기술을 이용하여 구축될 수 있다. 본 발명에서, 부탄올 생합성 경로들 중 하나의 효소, 예로서, 아세토락테이트 신타제, 아세토하이드록시산 이성질화환원효소, 다이하드록시산 탈수효소, 분지쇄 α-케토산 탈카르복실화효소, 및 분지쇄 알코올 탈수소효소를 암호화하는 유전자는, 각종 공급원으로부터 분리될 수 있으며, 예로서 미국 특허 제 7,993,889호에 설명된 바와 같다.
일단, 관련된 경로의 유전자가 동정 및 분리되면, 부탄올 생합성 경로의 관련 효소는 숙주 세포 내로 도입될 수 있거나 또는 예를 들어, 미국특허 제 7,993,889호에 설명된 바와 같이 조작되어 부타놀로겐을 생산한다. 생성된 부타놀로겐은 조작된 부탄올 생합성 경로를 포함한다. 일부 실시양태에서, 부타놀로겐은 아이소부타놀로겐으로, 이는 조작된 아이소부탄올 생합성 경로를 포함한다.
일부 실시양태에서, 부타놀로겐은 효모이다. 일부 실시양태에서, 부타놀로겐은 세균이다. 일부 실시양태에서, 부타놀로겐은 사카로마이세스 세레비시에이다.
일부 실시양태에서, 조작된 부타놀로겐은 하기 효소 협회 번호를 갖는 효소들의 그룹으로부터 선택된 하나 이상의 폴리펩타이드를 함유한다: EC 2.2.1.6, EC 1.1.1.86, EC 4.2.1.9, EC 4.1.1.72, EC 1.1.1.1, EC 1.1.1.265, EC 1.1.1.2, EC 1.2.4.4, EC 1.3.99.2, EC 1.2.1.10, EC 2.3.1.9, EC 2.3.1.16, EC 1.1.1.35, EC 1.1.1.157, EC 1.1.1.36, EC 4.2.1.17, EC 4.2.1.55, EC 1.3.1.44, EC 1.3.1.38, 및 EC 1.2.1.57.
일부 실시양태에서, 조작된 아이소부타놀로겐은 아세토락테이트 신타제, 아세토하이드록시산 이성질화환원효소, 다이하드록시산 탈수효소, 분지쇄 알파-케토산 탈카르복실화효소, 분지쇄 알코올 탈수소효소, 아실화 알데하이드 탈수소효소, 분지쇄 케토산 탈수소효소, 부티릴-CoA 탈수소효소, 부티르알데하이드 탈수소효소, 아세틸-CoA 아세틸전이효소, 3-하이드록시부티릴-CoA 탈수소효소, 크로토나제, 부티릴-CoA 탈수소효소, 부탄올 탈수소효소, 및 부티르알데하이드 탈수소효소로부터 선택되는 하나 이상의 폴리펩타이드를 함유한다.
일부 실시양태에서, 일반적으로 미토콘드리아에 국지화되는 부탄올 생합성 경로의 효소들은 미토콘드리아에 국지화되지 않는다. 일부 실시양태에서, 조작된 부탄올 생합성 경로의 효소는 사이토졸에 국지화된다. 일부 실시양태에서, 생합성 경로의 효소는 미토콘드리아 타겟팅(targeting) 서열을 제거함으로써 사이토졸에 국지화된다. 일부 실시양태에서, 미토콘드리아 타겟팅은, 예로서, 본 명세서에 참고문헌으로 통합된, 미국특허 제 7,993,889호에 기재된 바와 같이, 신규 개시 코돈을 생성함으로써 제거된다. 일부 실시양태에서, 사이토졸에 국지화된 생합성 경로의 효소는 DHAD이다. 일부 실시양태에서, 사이토졸에 국지화된 생합성 경로로부터의 효소는 KARI이다.
일부 실시양태에서, 조작된 부탄올 생합성 경로의 효소는, 보조인자로서 NADH 또는 NADPH를 사용할 수 있으며, 여기에서 NADH 또는 NADPH는 전자 공여체로서 작용한다. 일부 실시양태에서, 부탄올 생합성 경로의 하나 이상의 효소는 NADH를 전자 공여체로서 사용한다. 일부 실시양태에서, 부탄올 생합성 경로의 하나 이상의 효소는 NADPH를 전자 공여체로서 사용한다.
부타놀로겐의 부가적인 변형
본 명세서에서 제공되는 바와 같은, 부타놀로겐은 하나 이상의 부가적인 변형을 더 포함할 수 있다. 이러한 변형은, 예로서 조작된 부탄올 생합성 경로를 통한 부탄올 이성질체의 발효 생산 동안 부산물의 생산에 관련된 유전자들의 활성의 파괴를 포함할 수 있다. 부탄올 이성질체의 발효 생산 동안 부산물의 생산에 관련된 유전자들의 활성의 파괴는 탄소 흐름에 대한 경쟁 경로로부터의 수율 손실을 감소시키고, 부탄올 생산을 증가시킨다. 일부 실시양태에서, 이러한 변형은 피루베이트 탈카르복실화효소, 알데하이드 탈수소효소 또는 이들 모두의 작용의 파괴를 포함한다.
용어 "피루베이트 탈카르복실화효소"는 피루베이트 탈카르복실화효소의 생물학적 기능을 갖는 임의의 폴리펩타이드를 지칭한다. 이러한 폴리펩타이드는 피루브산에서 아세트알데하이드 및 이산화탄소로의 탈카르복실화를 촉매작용하는 폴리펩타이드를 포함한다. 피루베이트 탈카르복실화효소는 EC 번호 4.1.1.1로 알려져 있다. 이러한 폴리펩타이드는 당 기술분야에서 공지된 방법에 의하여 결정될 수 있으며, PCT 특허 출원 공개 번호 제 WO2012/129555호에 개시되어 있다. 이들 효소는 사카로마이세스 세레비시에 (GenBank 번호: CAA97575, CAA97705 및 CAA97091)를 포함하는 다수의 효모에서 발견된다. PDC의 부가적인 예들이, 본 명세서에 참고문헌으로 통합된, 미국 특허 출원 공개 번호 제 2009035363호에 제공되어 있다.
일부 실시양태에서, 본 명세서에 개시된 부타놀로겐은 피루베이트 탈카르복실화효소 활성을 갖는 폴리펩타이드를 암호화하는 내생의 폴리뉴클레오타이드 및/또는 유전자, 및/또는 피루베이트 탈카르복실화효소 활성을 갖는 내생의 폴리펩타이드의 변형 또는 파괴를 포함할 수 있다. 일부 실시양태에서, 본 명세서에서 개시된 부타놀로겐은, PDC 활성을 갖는 폴리펩타이드를 암호화하는 내생의 폴리뉴클레오타이드 또는 유전자에서, 또는 PDC 활성을 갖는 내생의 폴리펩타이드에서의 결실, 돌연변이 및/또는 치환을 포함할 수 있다. 이러한 변형, 파괴, 결실, 돌연변이 및/또는 치환은 감소되거나 제거된 PDC 활성을 결과로서 생성할 수 있고, 예로서 PDC 넉아웃 (PDC-KO) 표현형을 결과로서 생성할 수 있다.
효모 내의 내생의 피루베이트 탈카르복실화효소는 피루베이트를 아세트알데하이드로 전환시키고, 그 후 이는 에탄올로 또는 아세테이트를 거쳐 아세틸-CoA로 전환된다. 효모는 피루베이트 탈카르복실화효소를 암호화하는 하나 이상의 유전자들을 가질 수 있다. 예로서, 사카로마이세스 내에는 PDC1, PCD5 및/또는 PDC6 유전자에 의하여 암호화되는 피루베이트 탈카르복실화효소의 3 개의 동종효소 (isozyme)가 있는 한편, 칸디다 글라브라타, 스키조사카로마이세스 품베 및 클루이베로마이세스 락티스 내에는 피루베이트 탈카르복실화효소를 암호화하는 하나의 유전자가 있다. 일부 실시양태에서, 본 발명의 효모 세포에는, 하나 이상의 PDC 유전자가 비활성화된다. 사용된 효모 세포가 하나 초과의 발현된 (활성) PDC 유전자를 갖는다면, 활성 PDC 유전자 각각은 변형되거나 또는 비활성화되어 이에 따라 pdc- 세포를 생산할 수 있다. 예로서, S. 세레비시에에서 PDC1, PDC5 및 PDC6 유전자는 변형 또는 비활성화될 수 있다. PDC 유전자가 사용되는 발효 조건 하에서 활성이 아니라면, 그러한 유전자는 변형 또는 비활성화될 필요가 없다. 일부 실시양태에서, 결실된 또는 하향조절된 피루베이트 탈카르복실화효소는, PDC1, PDC5, PDC6 및 이의 조합으로 이루어지는 군으로부터 선택된다. 미국 특허 공개 번호 제 20090305363호 및 PCT 특허 출원 공개 번호 제 WO2012/129555호 (본 명세서에 참고문헌으로 통합됨)는 내생의 피루베이트 탈카르복실화효소에서의 변형을 추가로 기재하며, 이는 본 명세서에서 참고문헌으로 통합된다. 미국 특허 공개 번호 제 20090305363호 (본 명세서에 참고문헌으로 통합됨)는 사이토졸-국지화된 아세토락테이트 신타제의 발현 및 피루베이트 탈카르복실화효소 활성의 실질적인 제거를 위해 효모를 조작함으로써 피루베이트에서 아세토락테이트로의 증가된 전환을 개시한다. 감소된 효소 활성을 갖는 효모는 다양한 방법을 이용하여 동정될 수 있다. 예로서, 감소된 피루베이트 탈카르복실화효소 활성을 갖는 효모는, 예로서 기체 크로마토그래피를 통한 에탄올 형성을 측정하는 것을 포함하는 일반적인 방법을 이용하여 동정될 수 있다.
다른 타겟 유전자, 예컨대 피루베이트 탈카르복실화효소에 대하여 적어도 약 70-75%, 적어도 약 75-85%, 적어도 약 80-85%, 적어도 약 85%-90%, 적어도 약 90%-95%, 또는 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%의 서열 상동성을 갖는 피루베이트 탈카르복실화효소 단백질을 암호화하는 것들은, 당업자에게 공지된 문헌 및 생물정보학 데이터베이스에서 확인될 수 있다. 변형된 또는 결실된 피루베이트 탈카르복실화효소를 갖는 부타놀로겐의 동정 방법과 함께, 피루베이트 탈카르복실화효소 활성의 파괴 방법은 미국 특허 출원 공개 번호 제 20090305363호 및 PCT 특허 출원 공개 번호 제 WO2012/129555호에 상세히 기재되어 있다.
일부 실시양태에서, 부타놀로겐은 글리세롤-3-인산 탈수소효소 활성을 감소시키는 변형 및/또는 PDC 활성을 갖는 폴리펩타이드를 암호화하는 하나 이상의 유전자의 파괴 또는 PDC 유전자 발현을 제어하는 조절 성분을 암호화하는 하나 이상의 유전자에서의 파괴 [이는 미국 특허 출원 공개 번호 제 20090305363호 및 PCT 특허 출원 공개 번호 제 WO2012/129555호에 기재된 바와 같음]를 포함하며, 상기 변형은 엔트너-도우도르프 경로를 통하여 증가된 탄소 흐름을 제공할 수 있거나, 또는 균등물 수지 (balance)의 감소를 제공할 수 있으며, 이는 미국 특허 출원 공개 번호 제 20100120105호에 기재된 바와 같다 (본 명세서에 참고문헌으로 통합됨). 비활성화된 내생의 PDC 유전자를 갖고, 그리고 글루코스 억제가 감소된 경우 개선된 성장 및 생성물 수율을 갖는 조작된 생합성 경로를 갖는 효모 세포가 미국 특허 출원 공개 번호 제 20110124060호에 기재되어 있으며, 이는 본 명세서에 참고문헌으로 통합된다.
용어 "알데하이드 탈수소효소"는 알데하이드 탈수소효소의 생물학적 기능을 갖는 임의의 폴리펩타이드를 지칭한다. 이러한 폴리펩타이드는, 알데하이드의 산화 (탈수소화)를 촉매작용하는 폴리펩타이드를 포함한다 (Wang et al., J. Bacteriol. 180:822-30, 1998; Navarro-Avino et al., Yeast 15:829-42, 1999; 및 Saint-Prix et al., Microbiology 150:2209-20, 2004 참조). 이러한 폴리펩타이드는 아이소부티르알데하이드의 아이소부티르산으로의 전환을 촉매작용하는 폴리펩타이드를 포함한다. 이러한 폴리펩타이드는 EC 번호 1.2.1.3, EC 1.2.1.4 또는 1.2.1.5.에 대응되는 폴리펩타이드도 포함한다. 이러한 폴리펩타이드는 당 업계에서 공지된 방법에 의하여 결정될 수 있으며, PCT 특허출원 공개 번호 제 WO2012/129555호에 개시되어 있다.
일부 실시양태에서, 부타놀로겐은 알데하이드 탈수소효소 (ALD) 및/또는 알데하이드 산화제 활성을 갖는 폴리펩타이드를 암호화하는 내생의 폴리뉴클레오타이드 또는 유전자 중의 결실, 돌연변이 및/또는 치환, 또는 알데하이드 탈수소효소 (ALD) 및/또는 알데하이드 산화제 활성을 갖는 내생의 폴리펩타이드 중의 결실, 돌연변이 및/또는 치환을 포함할 수 있다. 일부 실시양태에서, 본 발명의 재조합 숙주 세포는 S. 세레비시에이고, 알데하이드 탈수소효소 활성을 갖는 폴리펩타이드는 ALD2, ALD3, ALD4, ALD5, ALD6, 또는 이의 조합일 수 있다. 일부 실시양태에서, 재조합 숙주 세포는 클루이베로마이세스 락티스 (Kluyveromyces lactis)이고, 알데하이드 탈수소효소 활성을 갖는 폴리펩타이드는 KLLA0F00440, KLLA0E23057, KLLA0D10021, KLLA0D09999G, 또는 이의 조합일 수 있다. 다른 실시양태들에서, 재조합 숙주 세포는 피키아 스티피티스이고, 알데하이드 탈수소효소 활성을 갖는 폴리펩타이드는 ALD2, ALD3, ALD4, ALD5, ALD7, 또는 이의 조합일 수 있다. 다른 실시양태들에서, 재조합 숙주 세포는 락토바실러스 플란타룸일 수 있으며, 알데하이드 탈수소효소 활성을 갖는 폴리펩타이드는 AldH일 수 있다. 다른 실시양태들에서, 재조합 숙주 세포는 E. 콜라이일 수 있으며, 알데하이드 탈수소효소 활성을 갖는 폴리펩타이드는 aldA, aldB, aldH 또는 이의 조합일 수 있다.
일부 실시양태에서, 알데하이드 탈수소효소 활성을 갖는 폴리펩타이드는 사카로마이세스 세레비시에 또는 그의 동족체 내 ALD6이다. 이러한 변형, 파괴, 결실, 돌연변이 및/또는 치환은, 감소되거나 제거된 ALD 활성을 일으켜, 예로서 ALD6 넉-아웃 (ALD6-KO) 표현형을 결과로서 생성한다. 재조합 숙주 세포 내에서 변형 또는 비활성화를 위해 타겟팅될 수 있는 알데하이드 탈수소효소 폴리뉴클레오타이드, 유전자 및 폴리펩타이드의 예가 PCT 국제 특허 출원 공개 번호 제 WO2012/129555호에 추가로 상세히 제공된다.
특정 알데하이드 탈수소효소의 파괴는, 예로서 알데하이드 탈수소효소 유전자에 대하여 내부 및 외부의 프라이머를 사용하는 PCR 스크리닝으로, 또는 알데하이드 탈수소효소 유전자 서열에 대해 설계된 프로브를 이용하는 서던 블롯 (Southern blot)에 의하여 확인될 수 있다 대안적으로, 아이소부티르산의 감소된 형성을 위하여 아이소부티르알데하이드에 노출된 균주를 스크리닝하기 위하여 기체 크로마토그래피-질량 분광법 또는 액체 크로마토그래피를 이용할 수 있다. 예로서, 감소된 아이소부티르산 형성을 갖는 균주에 대한 스크리닝 방법은: a) 알데하이드 탈수소효소 활성을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드에서의 변형 및/또는 알데하이드 산화효소 활성을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드에서의 변형을 포함하는 균주를 제공하는 단계; b) 세포를 아이소부티르알데하이드와 접촉시키는 단계; 및 c) 아이소부티르산 형성을 측정하는 단계를 포함할 수 있고, 여기에서, 아이소부티르산 형성은 변형되지 않은 대조 균주와 비교시 감소된다. 일부 실시양태에서, 상기 측정은 기체 크로마토그래피-질량 분광법을 이용하여 실시된다. 알데하이드 탈수소효소에 대한 폴리뉴클레오타이드, 유전자 또는 폴리펩타이드의 결실, 돌연변이 및/또는 치환 방법 및 알데하이드 탈수소효소 활성의 파괴를 동정하는 방법은, 예로서 PCT 특허 출원 공개 번호 제 WO2012/129555호에 상세히 개시되어 있다.
다른 타겟 유전자, 예컨대 알데하이드 탈수소효소에 대해 적어도 약 70-75%, 적어도 약 75-85%, 적어도 약 80-85%, 적어도 약 85%-90%, 적어도 약 90%-95%, 또는 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 상동성을 갖는 알데하이드 탈수소효소 단백질을 암호화하는 것들은, 당업자에게 공지된 문헌 및 생물정보학 데이터베이스에서 확인될 수 있다.
일부 실시양태에서, 본 명세서에서 기재된 부타놀로겐은 감소된 또는 제거된 알데하이드 탈수소효소 및/또는 알데하이드 산화효소 활성을 포함할 수 있으며, 이는 PCT 특허 출원 공개 번호 제 WO2012/129555호에 기재된 바와 같다. 일부 실시양태에서, 감소된 또는 제거된 알데하이드 탈수소효소 활성을 갖는 부타놀로겐은 조작된 생합성 경로를 통하여, 감소된 또는 제거된 알데하이드 탈수소효소 활성을 포함하지 않는 부타놀로겐에 의하여 생산된 동일한 이성질체의 수율 또는 양보다 더욱 높은 수율 또는 양으로 부탄올 이성질체를 생산할 수 있다.
일부 실시양태에서, 본 명세서에서 기재된 바와 같은 부타놀로겐은, 부탄올 이성질체의 발효 생산 동안 부산물 생산에 대한 경로에 관련된 폴리펩타이드를 암호화하는 내생의 폴리뉴클레오타이드 또는 유전자에서 결실, 돌연변이 및/또는 치환을 포함할 수 있다. 일부 실시양태에서, 부타놀로겐은, 부탄올 이성질체의 발효 생산 동안 부산물의 생산에 대한 경로에 관련된 내생의 폴리펩타이드에서 하나 이상의 결실, 돌연변이, 및/또는 치환을 포함할 수 있다. 일부 실시양태에서, 이들 변형은 FRA2 (철 리프레서 단백질), CCC1 (추정적 액포 Fe2+/Mn2+ 운반체) 또는 GPD2 (글리세롤-2-인산 탈수소효소)를 암호화하는 유전자 또는 폴리뉴클레오타이드, 또는 FRA2, CCC1 또는 GPD2 활성을 갖는 폴리펩타이드 또는 이의 조합에 있다.
다른 실시양태에서, 변형은 피루베이트-이용 생합성 경로에서의 단계를 촉매작용하는 폴리펩타이드를 암호화하는 하나 이상의 폴리뉴클레오타이드의 통합을 포함한다. 다른 변형에는 아세토락테이트 환원효소 활성을 갖는 폴리펩타이드를 암호화하는 내생의 폴리뉴클레오타이드에서의 적어도 하나의 결실, 돌연변이 및/또는 치환을 포함한다. 실시양태에서, 아세토락테이트 환원효소 활성을 갖는 폴리펩타이드는 YMR226C의 사카로마이세스 세레비시에 또는 그의 동족체이다.
실시양태에서, 숙주 세포는 포스포케톨라제 활성을 갖는 폴리펩타이드를 암호화하는 이종성 폴리뉴클레오타이드 및/또는 포스포트랜스아세틸라제 활성을 갖는 폴리펩타이드를 암호화하는 이종성 폴리뉴클레오타이드, 예로서 서열번호 262 및 263의 서열에 의해 코딩되는, 그리고 PCT 출원 공개 번호 제 WO 2011/159853호에 기재된 바와 같은 것들을 포함할 수 있다. 거기에 기재된 바와 같이, 이렇게 변경된 PDC-KO 세포들은, PDC-KO 세포들에 비해 그의 성장을 위하여, 외생의 2-탄소 기질 보충물에 대해 감소된 또는 제거된 필요를 나타낸다. 따라서, 그리고 실시예에서 예증된 바와 같이, 본 명세서에서 제공된 방법은 피루베이트 탈카르복실화효소 (PDC) 활성을 감소 또는 제거하도록 조작되고, 그의 성장을 위하여, 외생의 2-탄소 기질 보충물에 대해 감소된 또는 제거된 필요를 포함하는 재조합 숙주 세포에 장점을 제공한다.
발효 배지
본 발명에서 발효 배지는 적합한 발효가능한 탄소 기질을 함유해야 한다. 적합한 발효가능한 탄소 기질에는, 이에 제한되지는 않지만, 글루코스, 프룩토스, 자일로스 또는 아라비노스와 같은 단당류; 락토스, 말토스, 갈락토스, 또는 수크로스와 같은 올리고당류; 전분 또는 셀룰로스와 같은 다당류; 또는 이의 조합이 포함될 수 있다. 적합한 발효가능한 탄소 기질은 치즈 유청막 투과액 (cheese whey permeate), 옥수수 침지액, 사탕무우 당밀 및 보리 맥아와 같은 재생가능한 공급원료로부터의 미정제된 혼합물을 포함할 수 있다. 부가적으로, 발효가능한 탄소 기질은 이산화탄소와 같은 1원자 탄소 기질, 또는 주요 생화학적 중간체로의 대사적 전환이 예증된 메탄올일 수도 있다. 하나 및 두 개의 발효가능한 탄소 기질에 부가하여, 메틸로트로픽 (methylotrophic) 생물체는, 메틸아민, 글루코사민 및 각종 아미노산과 같은 수많은 다른 함탄소 화합물들을 대사 활성에 이용하는 것으로도 알려져 있다. 예로서, 메틸로트로픽 효모는 메틸아민으로부터의 탄소를 이용하여 트레할로스 또는 글리세롤을 형성하는 것으로 공지되어 있다 (Bellion et al., Microb. Growth C1 Compd., [Int. Symp.], 7th ed., 415-32. Editor (s): Murrell, J. Collin; Kelly, Don P. Publisher: Intercept, Andover, UK (1993)). 유사하게, 다양한 종의 칸디다는 알라닌 또는 올레산을 대사작용한다 (Sulter et al., Arch. Microbiol., 153:485-489 (1990)). 그러므로, 본 발명에 이용되는 탄소 공급원은 광범위한 탄소 함유 기질을 포괄할 수 있으며, 생물체의 선택에 의해서만 제한되는 것으로 생각된다. 다른 탄소 기질은 에탄올, 락테이트, 석시네이트 또는 글리세롤을 포함할 수 있다.
상기 언급된 발효가능한 탄소 기질 및 이의 혼합물은 모두가 본 발명에 적합한 것으로 고려되지만, 바람직한 발효가능한 탄소 기질은 글루코스, 프룩토스 및 수크로스, 또는 자일로스 및 아라비노스와 같은 C5 당과 이들의 혼합물이다. 수크로스는 재생가능한 당 공급원, 이를 테면 사탕수수, 사탕무, 카사바 (cassava), 단수수 (sweet sorghum) 및 이들의 혼합물로부터 유래될 수 있다. 글루코스 및 덱스트로스는 옥수수, 밀, 호밀, 보리, 귀리 및 이들의 혼합물과 같은 곡물을 비롯한 전분계의 공급원료의 당화를 통하여 재생가능한 곡물 공급원으로부터 유래될 수 있다. 부가적으로, 발효가능한 당은 예로서 본 명세서에 참고문헌으로 통합된 미국 특허 번호 제 7,932,063호에 기재된 바와 같이, 전처리 및 당화 공정을 통하여, 재생가능한 셀룰로오스 또는 리그노셀룰로오스계 바이오매스로부터 유래될 수 있다. 바이오매스는 셀룰로오스를 포함하는 재료, 및 선택적으로 헤미셀룰로오스, 리그닌, 전분, 올리고당류 및/또는 단당류를 추가로 포함하는 재료를 포함한다. 바이오매스는 또한 단백질 및/또는 지질과 같은 추가의 성분을 포함할 수 있다. 바이오매스는 단일의 공급원으로부터 유래할 수 있거나, 바이오매스는 1가지 초과의 공급원으로부터 유래된 혼합물을 포함할 수 있으며; 예로서, 바이오매스는 옥수수 속대 및 옥수수 대의 혼합물, 또는 풀과 잎의 혼합물을 포함할 수 있다. 바이오매스는 바이오에너지 작물, 농업 잔류물, 도시 고형 폐기물 (municipal solid waste), 산업 고형 폐기물, 제지 제조로부터의 슬러지, 정원 폐기물 (yard waste), 나무 및 삼림지 폐기물을 포함하나 이에 제한되는 것은 아니다. 바이오매스의 예는, 옥수수 낟알, 옥수수 속대, 옥수수 잔류물, 이를 테면 옥수수 껍질, 옥수수 대, 풀, 밀, 밀짚, 보리, 보릿짚, 건초, 볏짚, 스위치그래스 (switchgrass), 폐지, 사탕수수 버개스 (bagasse), 수수, 콩, 낟알의 제분으로부터 수득된 성분, 나무, 가지, 뿌리, 잎, 나뭇조각, 톱밥, 관목 및 떨기나무, 야채, 과실, 꽃, 동물 퇴비 및 이들의 혼합물을 포함하나 이에 제한되는 것은 아니다.
일부 실시양태에서, 발효가능한 탄소 기질은 옥수수로부터 유래된 글루코스이다. 일부 실시양태에서, 발효가능한 탄소 기질은 밀로부터 유래된 글루코스이다. 일부 실시양태에서, 발효가능한 탄소 기질은 사탕수수로부터 유래된 수크로스이다. 일부 실시양태에서, 발효가능한 탄소 기질은 자일로스이다.
적절한 탄소 공급원에 추가하여, 발효 배지는 적합한 무기물, 염, 보조인자, 완충액, 및 배양물의 성장 및 아이소부탄올 생산에 필요한 효소 경로의 촉진에 적합한, 당업자에게 알려진 기타 성분들을 함유해야 한다.
일부 실시양태에서, 본 발명에서 발효 배지는 외생의 C2 공급원으로서 아세테이트를 함유하고, 이는 보충물로서 발효 배지에, 재조합 숙주 세포의 성장에 대해 충분한 양으로 첨가된다. 일부 실시양태에서, 아세테이트는 개선된 부탄올 생산에 대해 충분한 양으로 발효 배지에 첨가된다. 일부 실시양태에서, 아세테이트는 약 0.1mM 내지 약 50mM의 범위 내에서 발효 배지에 첨가된다. 일부 실시양태에서, 발효 배지에 첨가된 아세테이트는 0.1mM, 0.2mM, 0.4mM, 0.5mM, 0.6mM, 0.7 mM, 0.8mM, 0.9mM, 1.0mM, 1.1mM, 1.2mM, 1.3mM, 1.4mM, 1.5mM, 1.6mM, 1.7mM, 1.8mM, 1.9mM, 2.0mM, 5mM, 10mM, 15mM, 20mM, 25mM, 30mM, 35mM, 40mM, 45mM 또는 50mM이다. 일부 실시양태에서, 발효 배지 내에서 당 대 C2 보충물의 비는 95:5, 90:10, 85:15, 80:20, 75:25 또는 70:30이다. 일부 실시양태에서, 아세테이트는 성장기, 생산기, 또는 이들 모두에 첨가된다.
일부 실시양태에서, 발효 배지는 부탄올을 추가로 함유할 수 있다. 일부 실시양태에서, 부탄올은 약 0.01mM 내지 약 500mM의 범위이다. 일부 실시양태에서, 부탄올은 0.01mM, 1.0mM, 10mM, 15mM, 20mM, 25mM, 30mM, 35mM, 40mM, 45mM, 50mM, 55mM, 60mM, 65mM, 70mM, 75mM, 80mM, 85mM, 90mM, 95mM, 100mM, 110mM, 120mM, 130mM, 140mM, 150mM, 160mM, 170mM, 180mM, 190mM, 200mM, 210mM, 220mM, 230mM, 240mM, 250mM, 260mM, 270mM, 280mM, 290mM, 300mM, 310mM, 320mM, 330mM, 340mM, 350mM, 360mM, 370mM, 380mM, 390mM, 400mM, 410mM, 420mM, 430mM, 440mM, 450mM, 460mM, 470mM, 480mM, 490mM 또는 500mM이다. 일부 실시양태에서, 발효 배지 내 존재하는 부탄올은, 약 0.01% 내지 약 100%의 이론적 수율의 부탄올이다. 일부 실시양태에서, 발효 배지 내 존재하는 부탄올은 0.01%, 0.5%, 1%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 또는 100%의 이론적 수율의 부탄올이다.
일부 실시양태에서, 개선된 부탄올 생산은 증가된 수율, 유효 속도, 유효 적정 농도, 또는 비 생산성으로서 나타난다. 실시양태에서, 수율, 유효 속도, 유효 적정 농도 또는 비 생산성 중 하나 이상은, 약 3% 이상, 약 5% 이상, 또는 약 10% 이상 증가된다.
일부 실시양태에서, 증가된 부탄올 생산은 감소된 부산물 수율로서 나타난다. 실시양태에서, 부산물의 수율은 약 3% 이상, 약 5% 이상, 약 10% 이상, 약 20% 이상, 약 30% 이상, 약 40% 이상, 약 50% 이상, 또는 약 70% 이상 감소된다. 실시양태에서, 부산물은 아이소부티르산이다.
발효 조건
전형적으로, 세포는 적절한 배지에서 약 20℃ 내지 약 40℃ 범위의 온도에서 성장시킨다. 일부 실시양태에서, 세포는 20℃, 22℃, 25℃, 27℃, 30℃, 32℃, 35℃, 37℃ 또는 40℃의 온도에서 성장된다. 본 발명에서 적합한 성장 배지는 일반적인 상업적으로 제조된 배지, 예컨대 루리아 베르타니 (Luria Bertani: LB) 배양액, 사브로드 덱스트로스 (Sabouraud Dextrose: SD) 배양액, 효모 배지 (YM) 배양액, 또는 효모 질소 베이스, 황산암모늄 및 덱스트로스 (탄소/에너지 공급원으로서)를 포함하는 배양액 또는 대부분의 사카로마이세스 세레비시에 균주를 성장시키는데 최적의 비율의 펩톤, 효모 추출물 및 덱스트로스의 배합물인, YPD 배지를 포함한다. 다른 규정된 또는 합성 성장 배지가 또한 사용될 수도 있으며, 특정 미생물의 성장에 적절한 배지는 미생물학 또는 발효 과학 분야의 당업자가 알고 있을 것이다. 예로서 사이클릭 아데노신 2',3'-1인산과 같이 직접적으로 또는 간접적으로 이화대사물 억제를 조정하는 것으로 공지된 제제의 사용이 발효 배지 내에 도입될 수도 있다.
발효에 적합한 pH 범위는 약 pH 3.0 내지 약 pH 9.0이다. 한 실시양태에서, 약 pH 4.0 내지 약 pH 8.0이 초기 조건을 위해 사용된다. 또다른 실시양태에서, 약 pH 3.5 내지 약 pH 9.0이 초기 조건을 위해 사용된다. 한 실시양태에서, 약 pH 4.5 내지 약 pH 6.5가 초기 조건을 위해 사용된다. 한 실시양태에서, 약 pH 5.0 내지 약 pH 8.0이 초기 조건을 위해 사용된다. 효모 발효에 적합한 pH 범위는 전형적으로 약 pH 3.0 내지 약 pH 9.0이다. 기타 미생물의 발효에 적합한 pH 범위는 약 pH 3.0 내지 약 pH 7.5이다.
일부 실시양태에서, 재조합 미생물과 발효 배지의 접촉은 혐기성 또는 미세호기성 조건 하에서 수행된다.
일부 실시양태에서, 부탄올은 하기 성장기 중 하나 이상에서 생산된다: 고성장 대수기 (log phase), 온건한 정적 유도기 (static lag phase), 정체기 (stationary phase), 정상상태 (steady state) 성장기, 및 이의 조합.
산업적 배치 (Batch) 및 연속 발효
일부 실시양태에서, 부탄올 이성질체는 배치 또는 연속 발효를 이용하여 생산될 수 있다. 부탄올 이성잘체, 예컨대 아이소부탄올은 발효의 배치 방법을 이용하여 생산될 수 있다. 고전적인 배치 발효는 배지의 조성이 발효 시작시에 정해지며, 발효 중에 인공적으로 변경되지 않는 폐쇄 시스템이다. 따라서, 발효의 시작시에 배지에 원하는 생물체(들)가 접종되며, 상기 시스템에 어떠한 것도 첨가하지 않고서 발효가 발생하게 한다. 그러나, 전형적으로 "배치" 발효는 탄소 공급원의 첨가와 관련하여 배치식이며, pH 및 산소 농도와 같은 조절 인자에 대한 시도가 종종 이루어진다. 배치 시스템에서, 이 시스템의 대사산물 및 바이오매스 조성물은 발효가 중단되는 시점까지 끊임없이 변화한다. 배치 배양 내에서 세포는 정적 유도기를 통하여 고성장 대수기로, 그리고 마지막으로 성장 속도가 감소되거나 정지되는 정체기로 조정된다. 미처리될 경우, 정체기의 세포는 결국 사멸할 것이다. 대수기의 세포는 일반적으로 최종 생성물 또는 중간체의 대량 생산에 책임이 있다.
표준 배치식 시스템의 한 변형은 유가식(Fed-Batch) 시스템이다. 유가식 발효 공정도 본 발명에 적합하며, 이는 발효가 진행됨에 따라 기질이 증분식으로 첨가된다는 것을 제외하고는 전형적인 배치 시스템을 포함한다. 유가식 시스템은 이화 대사산물 억제가 세포의 대사 작용을 저해하는 경향이 있을 때 그리고 배지 중에 제한된 양의 기질이 있는 것이 바람직한 경우 유용하다. 유가식 시스템 중 실제 기질 농도의 측정은 어려우며, 따라서 pH, 용존 산소 및 CO2와 같은 폐가스의 분압과 같은 측정가능한 인자의 변화를 기반으로 하여 추정된다. 배치 및 유가식 발효는 본 기술분야에서 통상적이며 공지이며, 그 예는 [Thomas D. Brock in Biotechnology: A Textbook of Industrial Microbiology, Second Edition Sinauer Associates, Inc., Sunderland, MA. (1989) ("Brock")], 또는 [Deshpande, Mukund V., Appl. Biochem. Biotechnol., 36:227, (1992)]에서 찾을 수 있으며, 이들은 본 명세서에 참고문헌으로 통합된다.
부탄올 이성질체, 예컨대 아이소부탄올은 연속 발효 방법을 이용하여 생산될 수도 있다. 연속식 발효는 정의된 발효 배지가 연속적으로 생물 반응기에 첨가되고, 동일한 양의 조건화된 배지가 가공을 위하여 동시에 제거되는 개방 시스템이다. 연속 발효는 일반적으로, 세포가 주로 대수기 성장에 있는 경우 일정한 고밀도로 배양물을 유지시킨다. 연속식 발효는 세포 성장 또는 최종 생성물 농도에 영향을 주는 하나의 인자 또는 임의의 수의 인자의 조정을 허용한다. 예로서, 한 방법은 제한 영양소, 예로서 탄소 공급원 또는 질소의 수준을 고정된 비율로 유지하고 모든 다른 변수는 조정되게 할 것이다. 다른 시스템에서, 성장에 영향을 미치는 많은 인자는 계속하여 변경될 수 있는 반면, 배지 탁도에 의해 측정되는 세포 농도는 일정하게 유지된다. 연속식 시스템은 정상 상태 성장 조건을 유지하도록 노력하며, 따라서 배출되는 배지로 인한 세포 손실은 발효에서의 세포 성장 속도와 균형이 맞추어져야 한다. 연속식 발효 방법에 있어서 영양소 및 성장 인자를 조정하는 방법 뿐만 아니라, 생성물 형성 속도를 최대화하는 기술도 산업 미생물학 분야에서 주지되어 있으며, 다양한 방법이 상기 Brock의 문헌에 상술되어 있다.
아이소부탄올을 포함하여, 부탄올의 생산은 배치식, 유가식 또는 연속식 공정을 사용하여 실시될 수 있으며, 발효의 임의의 공지된 방식이 적합할 것임이 고려된다. 부가적으로, 세포는 전세포 촉매로서 기질 상에 고정되어, 아이소부탄올 생산을 위한 발효 조건에 처해질 수 있는 것으로 생각된다.
발효 배지로부터의 부탄올 분리 방법 (회수)
바이오생산된 부탄올 이성질체는 본 기술분야에서 알려진 방법을 이용하여 발효 배지로부터 회수될 수 있다. 예로서, [Durre, Appl. Microbiol. Biotechnol. 49:639-648 (1998), Groot et al., Process. Biochem. 27:61-75 (1992)], 및 그에 기재된 참고문헌 참조. 예로서, 부탄올은 증류, 액체-액체 추출, 또는 막-기재 분리와 같은 방법을 이용하는 효소 배지로부터 분리될 수 있다. 본 명세서에 참고문헌으로 통합된, 미국 특허 공개 번호 제 20090305370호, 제 20110312043호 및 제 20110312044호는, 발효 배양액을 물과 혼화성인 추출용매와 접촉시켜 수상 및 유기상을 포함하는 2상 혼합물을 형성하는 단계를 포함하는, 액체-액체 추출을 기재하고 있다.
현장 생성물 제거 (ISPR)는 발효 배양액으로부터 부탄올을 제거하는데 사용될 수도 있다. 일부 실시양태에서, ISPR은 액체-액체 추출을 포함한다. 전형적으로, 추출용매는 포화된, 단일-포화된, 다중-포화된 (및 그의 혼합물) C12 내지 C22 지방 알코올, C12 내지 C22 지방 알코올, C12 내지 C22 지방산의 에스테르, C12 내지 C22 지방 알데하이드, C12 내지 C22 지방 아미드, 트라이글리세라이드, 및 그의 혼합물로 이루어지는 군으로부터 선택된 유기 추출용매일 수 있으며, 이는 발효 배양액에 접촉되어 수성상 및 유기상을 포함하는 2-상 혼합물을 형성한다. 추출용매는 또한 포화된, 단일-불포화된, 다중-불포화된 (및 그의 혼합물) C4 내지 C22 지방 알코올, C4 내지 C28 지방산, C4 내지 C28 지방산의 에스테르, C4 내지 C22 지방 알데하이드, C4 내지 C22 지방 아미드, 및 그의 혼합물로 이루어지는 군으로부터 선택된 유기 추출용매일 수 있으며, 이는 발효 배양액에 접촉되어 수성상 및 유기상을 포함하는 2-상 혼합물을 형성한다. 슬러리로부터의 유리 지방산은 ISPR 추출용매로서 제공될 수도 있다. ISPR 추출용매 (FFA)는 발효 배양액에 접촉되어 수성상 및 유기상을 포함하는 2-상 혼합물을 형성한다. 발효 배양액에 존재하는 생성물 알코올은 우선적으로는 유기 상으로 분할되어 알코올-함유 유기 상을 형성한다.
부탄올 이성질체는 물과 함께 비등점이 낮은 공비 혼합물을 형성하기 때문에, 증류는 혼합물을 그의 공비 조성까지 분리하는데만 사용될 수 있다. 증류는 공비점 부근의 분리를 수득하기 위하여 다른 분리 방법과 조합될 수 있다. 부탄올의 분리 및 정제를 위하여 증류와 조합하여 사용할 수 있는 방법은 경사 분리, 액체-액체 추출, 흡착 및 막-기재의 기술을 포함하지만, 이에 제한되지 않는다. 추가적으로, 부탄올 이성질체는 분리용 매제(entrainer)를 사용하는 공비성 증류를 사용하여 분리될 수 있다 (예로서, [Doherty and Malone, Conceptual Design of Distillation Systems, McGraw Hill, New York (2001)] 참조).
부탄올 분리 및 정제를 위하여 증류가 경사 분리와 조합되어 사용된 경우, 부탄올을 함유하는 발효 배양액은 공비 조성물에 가깝게 증류된다. 그 후, 공비 혼합물을 응축시키고, 경사 분리에 의해 발효 배지로부터 부탄올을 분리한다. 경사 분리된 수성상은 제1 증류 컬럼에 환류되어 돌아갈 수 있다. 부탄올이 풍부한 경사 분리된 유기상을 제2 증류 컬럼에서 증류에 의해 추가로 정제할 수 있다.
증류가 액체-액체 추출과 조합되어 사용되는 경우, 부탄올은 적합한 용매를 이용하여 액체-액체 추출을 이용하여 발효 배양액으로부터 추출된다. 그 후에 부탄올-함유 유기상을 증류하여 용매로부터 부탄올을 분리한다.
증류를 흡착과 조합하여 사용하는 경우,부탄올을 함유하는 발효 배양액을 공비 조성 부근까지 증류한 후, 잔류하는 물은 분자체와 같은 흡착제를 사용하여 제거한다 ([Aden et al., Lignocellulosic Biomass to Ethanol Process Design and Economics Utilizing Co-Current Dilute Acid Prehydrolysis and Enzymatic Hydrolysis for Corn Stover, Report NREL/TP-510-32438, National renewable Energy Laboratory, June 2002]).
증류를 투과증발과 조합하여 사용하는 경우, 부탄올을 함유하는 발효 배양액을 공비 조성 부근까지 증류한 후, 잔류하는 물은 친수성 막을 통하여 투과증발에 의해 제거된다 ([Guo et al., J. Membr. Sci., 245:199-210 (2004)]).
임의의 상에서의 부탄올 적정농도는, 고속 액체 크로마토그래피 (HPLC) 또는 기체 크로마토그래피를 통한 것과 같은, 본 기술분야에서 알려져 있는 방법에 의하여 결정될 수 있으며, 이는 예로서, 본 명세서에 참고문헌으로 통합된 미국 특허 출원 공개 번호 제 US20090305370호에 기재된 바와 같다.
고형분 제거 방법
발효가능한 탄소 기질의 발효 후, 발효 배지 중에 잔류하는 건조 고체 잔류물 (또는 고형분)은, 본 기술분야에 알려진 방법을 이용하여 제거될 수 있다. 이들 고형분은 단백질, 섬유 및 오일로 구성되며, 이는 다음 세가지 유형일 수 있다: 건고형 주정박 (Distiller's Dried Grains: DDG), 건주정박즙 (Distiller's Dried Solubles: DDS), 및 주정박 (Distiller's Dried Grains with Solubles: DDGS). 이들 고형분 중, 오직 DDGS만이 동물 사료 산업에서 이용될 수 있다. DDGS는 높은 영양가를 가지며, 따라서 동물 사료로서 적합하다.
고형분은 원심분리, 여과, 경사 분리 등에 의해 발효 배지로부터 제거될 수 있다. 고형분의 제거 후, 부탄올은 증류, 공비 증류, 액체-액체 추출, 흡착, 가스 스트리핑, 막 증발, 또는 투과증발과 같은 방법을 이용하여 발효 배지로부터 분리될 수 있다.
실시예
본 발명은 하기 실시예에서 추가로 정의된다. 이들 실시예는 본 발명의 바람직한 실시 양태를 나타내는 한편, 단지 예시로 주어짐을 이해해야 한다. 상기 토의 및 이들 실시예로부터, 당업자는 본 발명의 필수적인 특징을 확인할 수 있고, 그의 취지 및 범주를 벗어나지 않으면서, 본 발명의 다양한 변화 및 변형을 만들어서 본 발명이 다양한 용도와 조건에 적합하도록 할 수 있다.
일반 방법
박테리아 배양물의 유지 및 성장에 적합한 재료 및 방법은 당업계에 주지되어 있다. 하기 실시예에서의 이용에 적합한 기술은 [Manual of Method for General Bactreiology (Phillipp et al., eds., American Society for Microbiology, Washington, DC., (1994))] 또는 [Brock, Biotechnology: A Textbook of Industrial Microbiology, Second Edition, Sinauer Associates, Inc., Sunderland, MA (1989)]에 정리된 바와 같이 찾을 수 있다. 세균 세포의 성장 및 유지에 사용된 모든 시약, 제한 효소 및 재료는, 달리 특정되지 않는 한, Sigma-Aldrich Chemicals (St. Louis, MO), BD Diagnostic Systems (Sparks, MD), Invitrogen (Carlsbad, CA), HiMedia (Mumbai, India), SD Fine chemicals (India), 또는 Takara Bio Inc. (Shiga, Japan)으로부터 수득하였다.
배양 배지 중 아이소부탄올 농도의 결정 방법
배양 배지 내 아이소부탄올의 농도는 본 기술 분야에서 알려진 다수의 방법에 의해 결정될 수 있다. 예로서, 특정 고속 액체 크로마토그래피 (HPLC) 방법은 Shodex SH-G 가드(guard) 컬럼이 있는 Shodex SH-1011 컬럼을 이용하였으며, 이들 모두는 Waters Corporation (Milford, Mass.)으로부터 구매하였고, 굴절률 (RI) 검출을 이용하였다. 0.01M H2SO4를 이동상으로 사용하여, 50℃의 컬럼 온도 및 0.5 mL/분의 유속으로 크로마토그래피 분리를 달성하였다. 아이소부탄올은 사용된 조건 하에서 체류시간이 46.6 min이었다. 대안적으로, 기체 크로마토그래피(GC) 방법이 이용가능하다. 예로서, 특정 GC 방법은 HP-INNOWax 컬럼 (30 m × 0.53 mm 내경, 1 μm 필름 두께, Agilent Technologies (Wilmington, Del.))을 불꽃 이온화 검출기 (FID)와 함께 이용하였다. 운반 기체는 일정 헤드 압력 (head pressure)으로, 150℃에서 측정하여 4.5 mL/분의 유속의 헬륨이었으며; 주입기 스플릿 (injector split)은 200℃에서 1:25였고; 오븐 온도는 1 분 동안 45℃, 10℃/분으로 45 내지 220℃, 및 5분 동안 220℃였으며; FID 검출은 240℃에서 26 mL/분 헬륨 보충 기체를 이용하였다. 아이소부탄올의 체류시간은 4.5 분이었다.
약어의 의미는 다음과 같다: "sec"는 초(들)를 의미하고, "min"은 분(들)을 의미하고, "h"은 시간(들)을 의미하고, "nm"은 나노미터를 의미하고, "uL"은 마이크로리터(들)를 의미하고, "mL"은 밀리리터(들)를 의미하고, "mg/mL"은 밀리리터 당 밀리그램을 의미하고, "L"은 리터(들)를 의미하고, "nm"은 나노미터를 의미하고, "mM"은 밀리몰을 의미하고, "M"은 몰을 의미하고, "mmol"은 밀리몰(들)을 의미하고, "μmole"은 마이크로몰(들), "㎏"은 킬로그램을 의미하고, "g"는 그램(들)을 의미하고, "㎍"은 마이크로그램(들)을 의미하고, "ng"은 나노그램(들)을 의미하고, "PCR"은 중합효소연쇄반응을 의미하고, "OD"는 광학 밀도를 의미하고, "OD600"은 파장 600 nm에서 측정된 광학 밀도를 의미하고, "kDa"는 킬로달튼을 의미하고, "g"는 중력 상수를 의미할 수도 있고, "bp"는 염기쌍(들)을 의미하고, "kbp"는 킬로염기쌍(들)을 의미하고, "kb"는 킬로베이스를 의미하고, "%"는 퍼센트를 의미하고, "% w/v"는 중량/부피 퍼센트를 의미하고, "% v/v"는 부피/부피 퍼센트를 의미하고, "HPLC"는 고속 액체 크로마토그래피를 의미하고, "g/L"는 리터 당 그램을 의미하고, "㎍/L"은 리터 당 마이크로그램을 의미하고, "ng/μL"은 마이크로리터 당 나노그램을 의미하고, "pmol/μL"은 마이크로리터 당 피코몰을 의미하고, "RPM"은 분 당 회전수를 의미하고, "μmol/min/mg"은 밀리그램 당 분 당 마이크로몰을 의미하고, "w/v"는 부피 당 중량을 의미하고, "v/v"는 부피 당 부피를 의미한다.
미생물 균주는, 달리 나타내지 않는 한, 미국 균주보존협회 (ATCC) (Manassas, Va. 소재)로부터 수득하였다.
하기 실시예들에 사용된 특정 올리고뉴클레오타이드 프라이머를 표 1에 제공하였다. 모든 올리고뉴클레오타이드 프라이머는 Sigma-Genosys (Woodlands, Tex. 소재) 또는 Integrated DNA Technologies (IDT) (Coralville, Iowa 소재)에 의하여 합성된 것이다.
실시예에서 사용된 균주의 구축
PNY2068의 구축
사카로마이세스 세레비시에 균주 PNY0827는 추가의 유전적 조작을 위해 숙주 세포로서 사용된다. PNY0827은 사카로마이세스 세레비시에로부터 유래된 균주를 지칭하며, 이는 부타페스트 조약 하에 2011년 9월 22일, 미국 균주보존협회의 특허 기탁소 (ATCC, 10801 University Boulevard, Manassas, VA 20110-2209)에 기탁되었으며, 특허 기탁 번호는 PTA-12105이다.
URA3의 결실 및 반수체로의 포자형성
내생의 URA3 코딩 영역을 결실시키기 위하여, 생체 내 상동성 재조합 및 이후 KANMX4 마커의 제거를 가능하게 하는 loxP 자리에 플랭킹되는 PTEF1-kanMX4-TEF1t 카세트를 함유하는, pLA54 (서열번호 9)로부터 결실 카세트를 PCR-증폭시켰다. PCR은, Phusion High Fidelity PCR Master Mix (New England BioLabs; Ipswich, MA) 및 프라이머 BK505 (서열번호 10) 및 BK506 (서열번호 11)을 이용하여 수행하였다. 각 프라이머의 URA3 부분을 URA3 ATG의 5' 영역 180bp 업스트림 및 코딩 영역의 3' 영역 78bp 다운스트림으로부터 유도하여, kanMX4 카세트의 통합이 URA3 코딩 영역을 대체하도록 하는 결과를 생성하도록 하였다. PCR 생성물을, 표준 유전학적 기술을 이용하여 (Methods in Yeast Genetics, 2005, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, pp. 201-202) PNY0827로 형질전환시키고, 형질전환체를 30℃에서 2% 글루코스 및 100 ㎍/ml 제네티신 (Geneticin)으로 보충한 YEP 배지 상에서 선발하였다. 형질전환체를 프라이머 LA468 (서열번호 12) 및 LA492 (서열번호 13)를 이용하여 콜로니 PCR에 의해 스크리닝하여 통합 카세트의 존재를 확인하였다. 이형접합성 이배체 NYLA98가 수득되었으며, 이의 유전형은 MATa/α URA3/ura3::loxP-kanMX4-loxP이었다. 반수체를 수득하기 위하여, NYLA98를 표준 방법(, , . Factors which affect the frequency of sporulation and tetrad formation in Saccharomyces cerevisiae baker's yeast. Appl Environ Microbiol. 1995 PMID: 7574601)을 이용하여 포자생성시켰다. 4분체 (tetrad)를 미세조작기를 이용하여 분할하고, 2% 글루코스로 보충된 풍부 YPE 배지 상에서 성장시켰다. 4개의 생육성 포자를 함유하는 4분체를 2% 글루코스로 보충된 우라실 결여된 합성 완전 배지 상에 패치하고(patched), AK109-1 (서열번호 14), AK109-2 (서열번호 15), 및 AK109-3 (서열번호 16) 프라이머를 이용하여 다중형 콜로니 PCR에 의하여 접합형을 확인하였다. 생성된 동정된 반수체 균주는 유전형이 MATα ura3Δ::loxP-kanMX4-loxP인 NYLA103, 및 유전형이 MATa ura3Δ::loxP-kanMX4-loxP인 NYLA106으로 명명되었다.
His3의 결실
내생의 HIS3 코딩 영역을 결실시키기 위하여, 스카리스 (scarless) 결실 카세트를 이용하였다. 스카리스 HIS3 결실을 위하여 PCR 카세트용 4개의 단편을, Phusion High Fidelity PCR Master Mix (New England BioLabs; Ipswich, MA 소재)를 사용하여, 그리고 Gentra Puregene Yeast/Bact 키트 (Qiagen; Valencia, CA 소재)로 제조된 주형으로서의 CEN.PK 113-7D 게놈 DNA를 사용하여 증폭시켰다. HIS3 단편 A를, 프라이머 oBP452 (서열번호 17) 및 HIS3 단편 B의 5' 말단에 대하여 상동성을 갖는 5' 테일 (tail)을 함유하는 프라이머 oBP453 (서열번호 18)을 이용하여 증폭시켰다. HIS3 단편 B를, HIS3 단편 A의 3' 말단에 대하여 상동성을 갖는 5' 테일을 함유하는 프라이머 oBP454 (서열번호 19) 및 HIS3 단편 U의 5' 말단에 대하여 상동성을 갖는 5' 테일을 함유하는 프라이머 oBP455 (서열번호 20)를 이용하여 증폭시켰다. HIS3 단편 U를, HIS3 단편 B의 3' 말단에 대하여 상동성을 갖는 5' 테일을 함유하는 프라이머 oBP456 (서열번호 21) 및 HIS3 단편 C의 5' 말단에 대하여 상동성을 갖는 5' 테일을 함유하는 프라이머 oBP457 (서열번호 22)을 이용하여 증폭시켰다. HIS3 단편 C를, HIS3 단편 U의 3' 말단에 대하여 상동성을 갖는 5' 테일을 함유하는 프라이머 oBP458 (서열번호 23), 및 프라이머 oBP459 (서열번호 24)를 이용하여 증폭시켰다. PCR 생성물을 PCR 정제 키트 (Qiagene)를 사용하여 정제하였다. HIS3 단편 AB를, HIS3 단편 A 및 HIS3 단편 B를 혼합하고, 프라이머 oBP452 (서열번호 17) 및 oBP455 (서열번호 20)를 이용하여 증폭시켜 오버래핑(overlapping) PCR에 의하여 생성하였다. HIS3 단편 UC를, HIS3 단편 U 및 HIS3 단편 C를 혼합하고, 프라이머 oBP456 (서열번호 21) 및 oBP459 (서열번호 24)를 이용하여 증폭시켜 오버래핑 PCR에 의하여 생성하였다. 생성된 PCR 생성물을 아가로스 겔에 이어서 겔 추출 키트 (Gel Extraction kit) (Qiagene) 상에서 정제하였다. HIS3 ABUC 카세트를, HIS3 단편 AB 및 HIS3 단편 UC를 혼합하고, 프라이머 oBP452 (서열번호 17) 및 oBP459 (서열번호 24)를 이용하여 증폭시켜 오버래핑 PCR에 의하여 생성하였다. PCR 생성물을 PCR 정제 키트 (Qiagene)로 정제하였다. NYLA106의 수용 세포(competent cell)를 HIS3 ABUC PCR 카세트를 이용하여 형질전환하였으며, 30℃에서 우라실이 결여되고 2% 글루코스로 보충된 합성 완전 배지 상에 도말하였다. 형질전환체를, 정확한 통합을 입증하기 위해 30℃에서 히스티딘이 결여되고 2% 글루코스로 보충된 합성 완전 배지 상에서 복제 도말함에 의하여 스크리닝하였다. 게놈 DNA 준비물 (preps)을 제조하여, 5' 말단에 대하여 프라이머 oBP460 (서열번호 25) 및 LA135 (서열번호 26)을 이용하고, 3' 말단에 대하여 프라이머 oBP461 (서열번호 27) 및 LA92 (서열번호 28)를 이용하는 PCR에 의하여 통합을 입증하였다. URA3 마커는, 표준 프로토콜에 따라 30℃에서 2% 글루코스 및 5-FOA로 보충된 합성 완전 배지 상에 도말함으로써 재활용하였다. 5-FOA 플레이트로부터의 콜로니를 SD -URA 배지에 패치하여 성장의 부재를 입증하여 마커 제거를 확인하였다. PNY2003로 명명된, 생성된 동정된 균주의 유전형은 MATa ura3Δ::loxP-kanMX4-loxP his3Δ이었다.
PDC1의 결실
내생의 PDC1 코딩 영역을 결실시키기 위하여, 생체 내 상동성 재조합 및 이후 URA3 마커의 제거를 가능하게 하는 축퇴 loxP 자리에 의해 플랭킹되는 URA3 마커를 포함하는 pLA59 (서열번호 29)로부터 결실 카세트를 PCR-증폭시켰다. PCR은, Phusion High Fidelity PCR Master Mix (New England BioLabs; Ipswich, MA 소재) 및 프라이머 LA678 (서열번호 30) 및 LA679 (서열번호 31)를 이용하여 수행하였다. 각 프라이머의 PDC1 부분은 PDC1 개시 코돈의 5' 영역 50bp 다운스트림 및 종결 코돈의 3' 영역 50bp 업스트림으로부터 유도되었으며, URA3 카세트의 통합이 PDC1 코딩 영역을 대체하는 결과를 생성하지만, 코딩 영역의 첫번째 50bp 및 코딩 영역의 최종 50bp는 남도록 하였다. PCR 생성물을 표준 유전학적 기술을 사용하여 PNY2003으로 형질전환시키고, 형질전환체를 30℃에서, 우라실이 결여되고 2% 글루코스로 보충된 합성 완전 배지 상에서 선발하였다. 형질전환체를, 정확한 통합을 입증하기 위해 5' 코딩 영역에 대하여 외부의, 프라이머 LA337 (서열번호 32) 및 URA3에 대한 내부 프라이머인 LA135 (서열번호 26)를 이용하여 콜로니 PCR에 의하여 스크리닝하였다. 양성 형질전환체는 그 후 LA692 (서열번호 33) 및 PDC1 코딩 영역에 대해 내부의 LA693 (서열번호 34) 프라이머를 이용하여 콜로니 PCR에 의하여 스크리닝되었다. URA3 마커는 GAL1 프로모터 하에 CRE 재조합효소를 함유하는 pLA34 (서열번호 35)를 이용하여 형질전환함으로써 재활용시키고, 30℃에서 히스티딘을 결여하고, 2% 글루코스로 보충된 합성 완전 배지 상에 도말하였다. 형질전환체를 0.5% 갈락토스로 보충된 강화 배지(rich medium) 상에 도말하여 재조합효소를 유도하였다. 우라실을 결여하고 2% 글루코스로 보충된 합성 완전 배지에 콜로니를 패치하여 성장의 부재를 입증하여 마커 제거를 확인하였다. PNY2008로 명명된, 생성된 동정된 균주의 유전형은 MATa ura3Δ::loxP-kanMX4-loxP his3Δ pdc1Δ::loxP71/66이었다.
PDC5의 결실
내생의 PDC5 코딩 영역을 결실시키기 위하여, 결실 카세트를 생체 내 상동성 재조합 및 이후 URA3 마커의 제거를 가능하게 하는 축퇴 loxP 자리에 의해 플랭킹되는 URA3 마커를 함유하는 pLA59 (서열번호 29)로부터 PCR-증폭시켰다. PCR은, Phusion High Fidelity PCR Master Mix (New England BioLabs; Ipswich, MA) 및 프라이머 LA722 (서열번호 36) 및 LA733 (서열번호 37)을 이용하여 수행되었다. 각 프라이머의 PDC5 부분을 PDC5 개시 코돈의 5' 영역 50bp 업스트림 및 종결 코돈의 3' 영역 50bp 다운스트림으로부터 유도하여, URA3 카세트의 통합이 전체 PDC5 코딩 영역을 대체하는 결과를 생성시켰다. 표준 유전학적 기술을 이용하여 PCR 생성물을 PNY2008로 형질전환시키고, 형질전환체를 30℃에서 우라실을 결여하고 1% 에탄올로 보충된 합성 완전 배지 상에서 선발하였다. 형질전환체를, 정확한 통합을 입증하기 위해 5' 코딩 영역에 대하여 외부의 LA453 (서열번호 38), 및 URA3에 대하여 내부의 프라이머인 LA135 (서열번호 26) 프라이머를 이용하여 콜로니 PCR에 의하여 스크리닝하였다. 양성 형질전환체를 그 후 프라이머 LA694 (서열번호 39) 및 PDC5 코딩 영역에 대하여 내부의 LA695 (서열번호 40)를 이용하여 콜로니 PCR에 의하여 스크리닝하였다. URA3 마커는 GAL1 프로모터 하에 CRE 재조합효소를 함유하는 pLA34 (서열번호 35)를 이용하여 형질전환함으로써 재활용되었고, 30℃에서 히스티딘을 결여하고, 1% 에탄올로 보충된 합성 완전 배지 상에 도말되었다. 형질전환체를 1% 에탄올 및 0.5% 갈락토스로 보충된 풍부 YEP 배지 상에 도말하여 재조합효소를 유도하였다. 우라실을 결여하고 1% 에탄올로 보충된 합성 완전 배지에 콜로니를 패치하여 성장의 부재를 입증하여 마커 제거를 확인하였다. PNY2009로 명명된, 생성된 동정된 균주의 유전형은 MATa ura3Δ::loxP-kanMX4-loxP his3Δ pdc1Δ::loxP71/66 pdc5Δ::loxP71/66이었다.
FRA2의 결실
FRA2 결실을 설계하여, 코딩 서열의 3' 말단으로부터 250개 뉴클레오타이드를 결실시키고, 온전한 FRA2 코딩 서열의 처음 113개 뉴클레오타이드를 남겼다. 인-프레임 종결 코돈은 결실의 7개 뉴클레오타이드 다운스트림에 나타났다. 스카리스 FRA2 결실을 위한 PCR 카세트에 대한 4개의 단편을 Phusion High Fidelity PCR Master Mix (New England BioLabs사, Ipswich, MA 소재)를 사용하여, 그리고 Gentra Puregene Yeast/Bact 키트 (Qiagen사, Valencia, CA 소재)로 제조된 주형으로서의 CEN.PK 113-7D 게놈 DNA를 사용하여 증폭시켰다. FRA2 단편 A를, 프라이머 oBP594 (서열번호 41) 및 FRA2 단편 B의 5' 말단에 대하여 상동성을 갖는 5' 테일을 함유하는 프라이머 oBP595 (서열번호 42)를 이용하여 증폭시켰다. FRA2 단편 B를, FRA2 단편 A의 3' 말단에 대하여 상동성을 갖는 5" 테일을 함유하는 프라이머 oBP596 (서열번호 43), 및 FRA2 단편 U의 5' 말단에 대하여 상동성을 갖는 5' 테일을 함유하는 프라이머 oBP597 (서열번호 44)를 이용하여 증폭시켰다. FRA2 단편 U를, FRA2 단편 B의 3' 말단에 대하여 상동성을 갖는 5' 말단을 함유하는 프라이머 oBP598 (서열번호 45), 및 FRA2 단편 C의 5' 말단에 대하여 상동성을 갖는 5' 테일을 함유하는 프라이머 oBP599 (서열번호 46)로 증폭시켰다. FRA2 단편 C를, FRA2 단편 U의 3' 말단에 대하여 상동성을 갖는 5' 테일을 함유하는 프라이머 oBP600 (서열번호 47) 및 프라이머 oBP601 (서열번호 48)을 이용하여 증폭시켰다. PCR 생성물을 PCR 정제 키트 (Qiagen)를 사용하여 정제하였다. FRA2 단편 AB를, FRA2 단편 A 및 FRA2 단편 B를 혼합하고, 프라이머 oBP594 (서열번호 41) 및 oBP597 (서열번호 44)을 이용하여 증폭시켜 오버래핑 PCR에 의해 생성하였다. FRA2 단편 UC를 FRA2 단편 U 및 FRA2 단편 C를 혼합하고, 프라이머 oBP598 (서열번호 45) 및 oBP601 (서열번호 48)을 이용하여 증폭시켜 오버래핑 PCR에 의해 생성하였다. 생성된 PCR 생성물을 아가로스 겔에 이어서 겔 추출 키트 (Gel Extraction kit) (Qiagen)에서 정제하였다. FRA2 ABUC 카세트를, FRA2 단편 AB 및 FRA2 단편 UC를 혼합하고, 프라이머 oBP594 (서열번호 41) 및 oBP601 (서열번호 48)을 이용하여 증폭시켜, 오버래핑 PCR에 의하여 생성하였다. PCR 생성물을 PCR 정제 키트 (Qiagen)로 정제하였다.
내생의 FRA2 코딩 영역을 결실시키기 위하여, 상기 수득된 스카리스 결실 카세트를, 표준 기술을 이용하여 PNY2009로 형질전환시키고 우라실을 결여하고 1% 에탄올로 보충된 합성 완전 배지 상에 도말하였다. 게놈 DNA 준비물을 제조하여, 5' 말단에 대하여 프라이머 oBP602 (서열번호 49) 및 LA135 (서열번호 26), 및 전체 유전자좌를 증폭시키기 위하여 프라이머 oBP602 (서열번호 49) 및 oBP603 (서열번호 50) 을 이용하여 PCR에 의하여 통합을 입증하였다. URA3 마커는, 30℃에서 표준 프로토콜에 따라, 1% 에탄올 및 5-FOA (5-플루오로오로트산)으로 보충된 합성 완전 배지 상에 도말함으로써 재활용시켰다. 우라실을 결여하고 1% 에탄올로 보충된 합성 완전 배지 상에 5-FOA 플레이트로부터의 콜로니를 패치하여 성장의 부재를 입증하여 마커 제거를 확인하였다. 생성된 동정된 균주, PNY2037의 유전형은 MATa ura3Δ::loxP-kanMX4-loxP his3Δ pdc1Δ::loxP71/66 pdc5Δ::loxP71/66 fra2Δ이었다.
2 미크론 플라스미드의 추가
loxP71-URA3-loxP66 마커를 Phusion DNA 중합효소 (New England BioLabs; Ipswich, MA)를 사용하여 pLA59 (서열번호 29)로부터 PCR-증폭시키고, LA811x817 (서열번호 51, 52) 및 LA812x818 (서열번호 53, 54) 2-미크론 플라스미드 단편과 함께 30℃에서 SE -URA 플레이트 상에서 균주 PNY2037로 형질전환시켰다. 생성된 균주 PNY2037 2μ::loxP71-URA3-loxP66는 pLA34 (pRS423::cre) (pLA34로도 명명됨) (서열번호 35)를 이용하여 형질전환되었으며, 30℃에서 SE -HIS -URA 플레이트 상에서 선발되었다. 형질전환체를 YP-1% 갈락토스 플레이트 상에 패치하고, 30℃에서 48시간 동안 성장시켜 Cre 재조합효소 발현을 유도하도록 하였다. 각각의 콜로니를 그 후 SE -URA, SE -HIS, 및 YPE 플레이트에 패치시켜 URA3 마커의 제거를 확인하였다. 결과로서 동정된 균주, PNY2050의 유전형은 MATa ura3Δ::loxP-kanMX4-loxP, his3Δ pdc1Δ::loxP71/66 pdc5Δ::loxP71/66 fra2Δ 2-미크론이었다.
GPD2의 결실
내생의 GPD2 코딩 영역을 결실시키기 위하여, 결실 카세트를 생체 내 상동성 재조합 및 이후 URA3 마커의 제거를 가능하게 하는 축퇴 loxP 자리에 의해 플랭킹되는 URA3 마커를 함유하는 pLA59 (서열번호 29)로부터 PCR-증폭시켰다. PCR은, Phusion High Fidelity PCR Master Mix (New England BioLabs; Ipswich, MA) 및 LA512 (서열번호 55) 및 LA513 (서열번호 56) 프라이머를 이용하여 수행하였다. 각 프라이머의 GPD2 부분을, GPD2 출발 코돈의 5' 영역 50bp 업스트림 및 종결 코돈의 3' 영역 50bp 다운스트림으로부터 유도하여, URA3 카세트의 통합이 전체 GPD2 코딩 영역을 대체하도록 하는 결과를 생성하도록 하였다. 표준 유전학적 기술을 이용하여 PCR 생성물을 PNY2050로 형질전환시키고, 형질전환체를 30℃에서, 우라실을 결여하고 1% 에탄올로 보충된 합성 완전 배지 상에서 선발하였다. 형질전환체를, 정확한 통합을 입증하기 위해 5'코딩 영역에 대하여 외부의 프라이머 LA516 (서열번호 57), 및 URA3에 대하여 내부의 LA135 (서열번호 26)을 이용하여 콜로니 PCR에 의하여 스크리닝하였다. 양성 형질전환체는 그 후 LA514 (서열번호 58) 및 GPD2 코딩 영역에 대하여 내부의 LA515 (서열번호 59) 프라이머를 이용하여 콜로니 PCR에 의하여 스크리닝하였다. URA3 마커는 GAL1 프로모터 하에 CRE 재조합효소를 함유하는 pLA34 (서열번호 35)를 이용하여 형질전환함으로써 재활용시키고, 30℃에서 히스티딘을 결여하고 1% 에탄올로 보충된 합성 완전 배지 상에 도말하였다. 형질전환체를 1% 에탄올 및 0.5% 갈락토스로 보충된 강화 배지 상에 도말하여 재조합효소를 유도하였다. 우라실을 결여하고 1% 에탄올로 보충된 합성 완전 배지에 콜로니를 패치하여 성장의 부재를 입증하여 마커 제거를 확인하였다. 생성된 동정된 균주, PNY2056의 유전형은 MATa ura3Δ::loxP-kanMX4-loxP his3Δ pdc1Δ::loxP71/66 pdc5Δ::loxP71/66 fra2Δ 2-micron gpd2Δ이었다.
YMR226의 결실 및 AlsS의 통합
내생의 YMR226C 코딩 영역을 결실시키기 위하여, 통합 카세트를, FBA1 프로모터 및 CYC1 종결자를 갖는 바실러스 서브틸리스 종으로부터의 아세토락테이트 신타제 유전자, 및 생체 내 상동성 재조합 및 이후 URA3 마커의 제거를 가능하게 하는 축퇴 loxP 자리에 의해 플랭킹되는 URA3 마커를 함유하는 pLA71 (서열번호 60)로부터 PCR-증폭시켰다. Kapa Biosystems (Woburn, MA 소재)로부터의 KAPA HiFi 및 LA829 (서열번호 61) 및 LA834 (서열번호 62) 프라이머를 이용하여 PCR을 수행하였다. 각 프라이머의 YMR226C 부분은 코딩 서열의 처음 60bp 및 종결 코돈의 409bp 업스트림인 65bp로부터 유도되었다. 표준 유전학적 기술을 이용하여 PCR 생성물을 PNY2056으로 형질전환시키고, 형질전환체를 30℃에서 우라실을 결여하고 1% 에탄올로 보충된 합성 완전 배지 상에서 선발하였다. 형질전환체를, 정확한 통합을 입증하기 위해 5' 코딩 영역에 대하여 외부의 N1257 (서열번호 63) 및 FBA1 프로모터에 대하여 내부의 LA740 (서열번호 69) 프라이머를 이용하여 콜로니 PCR에 의하여 스크리닝하였다. 양성 형질전환체는 그 후 N1257 (서열번호 63) 및 YMR226C 코딩 영역에 대하여 내부의 LA830 (서열번호 64) 프라이머, 및 3' 코딩 영역에 대하여 외부의 LA830 (서열번호 64) 및 URA3 마커에 대하여 내부의 LA92 (서열번호 28) 프라이머를 이용하여 콜로니 PCR에 의하여 스크리닝되었다. URA3 마커는 GAL1 프로모터 하에 CRE 재조합효소를 함유하는 pLA34 (서열번호 35)를 이용하여 형질전환함으로써 재활용시키고, 30℃에서 히스티딘을 결여하고 1% 에탄올로 보충된 합성 완전 배지 상에 도말되었다. 형질전환체를 1% 에탄올 및 0.5% 갈락토스로 보충된 강화 배지 상에 도말하여 재조합효소를 유도하였다. 우라실을 결여하고 1% 에탄올로 보충된 합성 완전 배지에 콜로니를 패치하여 성장의 부재를 입증하여 마커 제거를 확인하였다. 생성된 동정된 균주 PNY2061의 유전형은 MATa ura3Δ::loxP-kanMX4-loxP his3Δ pdc1Δ::loxP71/66 pdc5Δ::loxP71/66 fra2Δ 2-micron gpd2Δ ymr226cΔ::PFBA1-alsS_Bs-CYC1t-loxP71/66 이었다.
ALD6의 결실 및 KivD의 통합
내생의 ALD6 코딩 영역을 결실시키기 위하여, 통합 카세트를, 혼성 FBA1 프로모터 및 TDH3 종결자를 갖는 리스테리아 그라이이 종으로부터의 kivD 유전자, 및 생체 내 상동성 재조합 및 이후 URA3 마커의 제거를 가능하게 하는 축퇴 loxP 자리에 의해 플랭킹되는 URA3 마커를 함유하는 pLA78 (서열번호 65)로부터 PCR-증폭시켰다. Kapa Biosystems (Woburn, MA 소재)로부터의 KAPA HiFi 및 LA850 (서열번호 66) 및 LA851 (서열번호 67) 프라이머를 이용하여 PCR을 수행하였다. 각 프라이머의 ALD6 부분은 코딩 서열의 처음 65bp 및 코딩 영역의 마지막 63bp로부터 유도되었다. 표준 유전학적 기술을 이용하여 PCR 생성물을 PNY2061로 형질전환시키고, 형질전환체를 30℃에서 우라실을 결여하고 1% 에탄올로 보충된 합성 완전 배지 상에서 선발하였다. 형질전환체를, 정확한 통합을 입증하기 위해 5' 코딩 영역에 대하여 외부의 N1262 (서열번호 68), 및 FBA1 프로모터에 대하여 내부의 LA740 (서열번호 69) 프라이머를 이용하여 콜로니 PCR에 의하여 스크리닝하였다. 양성 형질전환체는 그 후 3' 코딩 영역에 대하여 외부의 N1263 (서열번호 70), 및 URA3 마커에 대하여 내부의 LA92 (서열번호 28) 프라이머를 이용하여 콜로니 PCR에 의하여 스크리닝되었다. URA3 마커는 GAL1 프로모터 하에 CRE 재조합효소를 함유하는 pLA34 (서열번호 35)를 이용하여 형질전환함으로써 재활용시키고, 30℃에서 히스티딘을 결여하고 1% 에탄올로 보충된 합성 완전 배지 상에 도말하였다. 형질전환체를 1% 에탄올 및 0.5% 갈락토스로 보충된 강화 배지 상에 도말하여 재조합효소를 유도하였다. 우라실을 결여하고 1% 에탄올로 보충된 합성 완전 배지에 콜로니를 패치하여 성장의 부재를 입증하여 마커 제거를 확인하였다. 생성된 동정된 균주, PNY2065의 유전형은 MATa ura3Δ::loxP-kanMX4-loxP his3Δ pdc1Δ::loxP71/66 pdc5Δ::loxP71/66 fra2Δ 2-미크론 gpd2Δ ymr226cΔ::PFBA1-alsS_Bs-CYC1t-loxP71/66 ald6Δ::(UAS)PGK1-PFBA1-kivD_Lg-TDH3t-loxP71이었다.
ADH1의 결실 및 ADH의 통합
ADH1은 사카로마이세스 세레비시에에 존재하는 내생의 알코올 탈수소효소이다. 하기 기재된 바와 같이, 내생의 ADH1을 베이제린키이 인디카로부터의 알코올 탈수소효소 (ADH)로 대체시켰다.
내생의 ADH1 코딩 영역을 결실시키기 위하여, 통합 카세트를, ILV5 프로모터 및 ADH1 종결자를 갖는 베이제린키이 인디카 종으로부터의 알코올 탈수소효소 및 생체 내 상동성 재조합 및 이후 URA3 마커의 제거를 가능하게 하는 축퇴 loxP 자리에 의해 플랭킹되는 URA3 마커를 함유하는 pLA65 (서열번호 71)로부터 PCR-증폭시켰다. Kapa Biosystems (Woburn, MA 소재)로부터의 KAPA HiFi 및 LA855 (서열번호 72) 및 LA856 (서열번호 73) 프라이머를 이용하여 PCR을 수행하였다. 각 프라이머의 ADH1 부분은 ADH1의 개시 코돈의 5' 영역 50bp 업스트림 및 코딩 영역의 마지막 50bp로부터 유도되었다. 표준 유전학적 기술을 이용하여 PCR 생성물을 PNY2065로 형질전환시키고, 형질전환체를 30℃에서 우라실을 결여하고 1% 에탄올로 보충된 합성 완전 배지 상에서 선발하였다. 형질전환체를, 정확한 통합을 입증하기 위해 5' 코딩 영역에 대하여 외부의 LA414 (서열번호 74), 및 ILV5 프로모터에 대하여 내부의 LA749 (서열번호 75) 프라이머를 이용하여 콜로니 PCR에 의하여 스크리닝하였다. 양성 형질전환체는 그 후 3' 코딩 영역에 대하여 외부의 프라이머 LA413 (서열번호 76), 및 URA3 마커에 대하여 내부의 LA92 (서열번호 28)를 이용하여 콜로니 PCR에 의하여 스크리닝되었다. URA3 마커는 GAL1 프로모터 하에 CRE 재조합효소를 함유하는 pLA34 (서열번호 35)를 이용하여 형질전환함으로써 재활용시키고, 30℃에서 히스티딘을 결여하고 1% 에탄올로 보충된 합성 완전 배지 상에 도말되었다. 형질전환체를 1% 에탄올 및 0.5% 갈락토스로 보충된 강화 배지 상에 도말하여 재조합효소를 유도하였다. 우라실을 결여하고 1% 에탄올로 보충된 합성 완전 배지에 콜로니를 패치하여 성장의 부재를 입증하여 마커 제거를 확인하였다. PNY2066로 명명된, 생성된 동정된 균주의 유전형은 MATa ura3Δ::loxP-kanMX4-loxP his3Δ pdc1Δ::loxP71/66 pdc5Δ::loxP71/66 fra2Δ 2-미크론 gpd2Δ ymr226cΔ::PFBA1-alsS_Bs-CYC1t-loxP71/66 ald6Δ::(UAS)PGK1-PFBA1-kivD_Lg-TDH3t-loxP71/66 adh1Δ::PILV5-ADH_Bi(y)-ADH1t-loxP71/66이었다.
ADH의 pdc1Δ 유전자 좌 내로의 통합
pdc1Δ 영역에서 ADH의 추가 복제물을 통합하기 위하여, 통합 카세트를 ADH1 종결자를 갖는 베이제린키이 인디카 종으로부터의 알코올 탈수소효소, 및 생체 내 상동성 재조합 및 이후 URA3 마커의 제거를 가능하게 하는 축퇴 loxP 자리에 의해 플랭킹되는 URA3 마커를 함유하는 pLA65 (서열번호 71)로부터 PCR-증폭시켰다. Kapa Biosystems (Woburn, MA 소재)로부터의 KAPA HiFi 및 LA860 (서열번호 77) 및 LA679 (서열번호 31) 프라이머를 이용하여 PCR을 수행하였다. 각 프라이머의 PDC1 부분은 PDC1 출발 코돈의 5' 영역 60bp 업스트림 및 종결 코돈의 103bp 업스트림인 50bp로부터 유도되었다. 내생의 PDC1 프로모터를 사용하였다. 표준 유전학적 기술을 이용하여 PCR 생성물을 PNY2066으로 형질전환시키고, 형질전환체를 30℃에서 우라실을 결여하고 1% 에탄올로 보충된 합성 완전 배지 상에서 선발하였다. 형질전환체를, 정확한 통합을 입증하기 위해 5' 코딩 영역에 대하여 외부의 LA337 (서열번호 32), 및 BiADH 유전자에 대하여 내부의 N1093 (서열번호 78) 프라이머를 이용하여 콜로니 PCR에 의하여 스크리닝하였다. 양성 형질전환체를 그 후 3' 코딩 영역에 대하여 외부의 LA681 (서열번호 79), 및 URA3 마커에 대하여 내부의 LA92 (서열번호 28) 프라이머를 이용하여 콜로니 PCR에 의하여 스크리닝하였다. URA3 마커는 GAL1 프로모터 하에 CRE 재조합효소를 함유하는 pLA34 (서열번호 35)를 이용하여 형질전환함으로써 재활용시키고, 30℃에서 히스티딘을 결여하고 1% 에탄올로 보충된 합성 완전 배지 상에 도말되었다. 형질전환체를 1% 에탄올 및 0.5% 갈락토스로 보충된 강화 배지 상에 도말하여 재조합효소를 유도하였다. 우라실을 결여하고 1% 에탄올로 보충된 합성 완전 배지에 콜로니를 패치하여 성장의 부재를 입증하여 마커 제거를 확인하였다. PNY2068로 명명된, 생성된 동정된 균주의 유전형은 MATa ura3Δ::loxP-kanMX4-loxP his3Δ pdc1Δ::loxP71/66 pdc5Δ::loxP71/66 fra2Δ 2-미크론 gpd2Δ ymr226cΔ::PFBA1-alsS_Bs-CYC1t-loxP71/66 ald6Δ::(UAS)PGK1-PFBA1-kivD_Lg-TDH3t-loxP71/66 adh1Δ::PILV5-ADH_Bi(y)-ADH1t-loxP71/66 pdc1Δ::PPDC1-ADH_Bi(y)-ADH1t-loxP71/66이었다.
아이소부타놀로겐 균주 PNY2270의 구축
2 개의 플라스미드, pHR81-ILV5p-K9SB2 (서열번호 80) 및 pYZ067DkivDDhADH (서열번호 81)을 이용한 세포의 형질전환에 의하여 균주 PNY2068 (상기 기재됨)로부터 균주 PNY2270을 생성하였다. 플라스미드를 리튬 아세테이트 형질전환 방법에 의하여 도입시키고 ([Methods in Yeast Genetics, 2005, p. 113]), 형질전환체를 히스티딘과 우라실을 빼고 1% 에탄올을 탄소 공급원으로서 갖는 합성 완전 배지 상에서 선발하였다. 형질전환체를 그 후, 히스티딘과 우라실을 빼고 2% 글루코스를 탄소 공급원으로서 갖고, 에탄올 (0.05%) 또는 아세테이트 (2 mM)를 C2 보충물로서 갖는 합성 완전 배지를 함유하는 플레이트로 이동시켰다.
pHR81-ILV5p-K9SB2 (서열번호 80)는 pHR81 플라스미드 골격 내에서 ILV5 프로모터 및 ILV5 종결자에 의하여 유도된 A. 칵캐 K9SB2 KARI 유전자를 함유한다. pYZ067DkivDDhADH (서열번호 81)는 pRS423 플라스미드 골격 내에서 FBA1 프로모터 및 FBA1 종결자에 의하여 유도된 S. 뮤탄스 ilvD 유전자를 함유한다.
아이소부타놀로겐 균주 PNY2092의 구축
유전형 MATa ura3Δ::loxP-kanMX4-loxP his3Δ pdc1Δ::loxP71/66 pdc5Δ::loxP71/66 fra2Δ 2-미크론 gpd2Δ ymr226cΔ::PFBA1-alsS_Bs-CYC1t-loxP71/66을 갖는 기본 균주 PNY2061 (상기 기재됨)을, 플라스미드: pHR81-ILV5p-R8B2y2 (서열번호 82) 및 pLA84 (서열번호 83)를 이용하여 플라스미드 형질전환시킴으로써 균주 PNY2092를 구축하였다.
pHR81-ILV5p-R8B2y2 (서열번호 82)는 pHR81 플라스미드 골격 내에서 ILV5 프로모터 및 ILV5 종결자에 의하여 유도된 P. 플루오레센스 R8B2 KARI (효모에 대하여 코돈-최적화됨)를 함유한다. pLA84 (서열번호 83)는 FBA1 프로모터 및 FBA1 종결자에 의하여 유도된 S. 뮤탄스로부터의 IlvD, GPM1 프로모터 및 ADH1 종결자에 의하여 유도된 B. 인디카로부터의 ADH 및 pRS423 플라스미드 골격 내에서 TDH3 프로모터 및 TDH3 종결자에 의해 유도된 L. 그라이이로부터의 KivD를 함유한다.
아이소부타놀로겐 균주 PNY2118, PNY2120 및 PNY2318의 구축
PNY2050으로부터의 PNY2115의 구축
PNY2050으로부터의 PNY2115 [MATa ura3Δ::loxP his3Δ pdc5Δ::loxP66/71 fra2Δ 2-미크론 플라스미드 (CEN.PK2) pdc1Δ::P[PDC1]-ALS|alsS_Bs-CYC1t-loxP71/66 pdc6Δ::(UAS)PGK1-P[FBA1]-KIVD|Lg(y)-TDH3t-loxP71/66 adh1Δ::P[ADH1]-ADH|Bi(y)-ADHt-loxP71/66 fra2Δ::P[ILV5]-ADH|Bi(y)-ADHt-loxP71/66 gpd2Δ::loxP71/66]의 구축은 하기와 같았다.
Pdc1Δ::P[PDC1]-ALS|alsS_Bs-CYC1t-loxP71/66
alsS를 내생의 PDC1 프로모터를 이용하여 PNY2050의 pdc1Δ::loxP66/71 유전자좌 내로 통합시키기 위하여, 통합 카세트를, FBA1 프로모터 및 CYC1 종결자를 갖는 바실러스 서브틸리스 종으로부터의 아세토락테이트 신타제 유전자, 및 생체 내 상동성 재조합 및 이후 URA3 마커의 제거를 가능하게 하는 축퇴 loxP 자리에 의하여 플랭킹되는 URA3 마커를 함유하는 pLA71 (서열번호 60)로부터 PCR-증폭시켰다. KAPA HiFi 및 프라이머 895 (서열번호 84) 및 679 (서열번호 31)를 이용하여 PCR을 수행하였다. 각 프라이머의 PDC1 부분은 코딩 서열의 업스트림의 60bp 및 종결 코돈의 53bp 업스트림인 50bp로부터 유도되었다. 표준 유전학적 기술을 이용하여 PCR 생성물을 PNY2050으로 형질전환하였으며, 형질전환체를 30℃에서 우라실을 결여하고 1% 에탄올로 보충된 합성 완전 배지 상에서 선발하였다. 형질전환체를, 정확한 통합을 입증하기 위해 3' 코딩 영역에 대하여 외부의 681 (서열번호 79), 및 URA3 유전자에 대하여 내부의 LA92 (서열번호 28) 프라이머를 이용하여 콜로니 PCR에 의하여 스크리닝하였다. 양성 형질전환체를 그 후 게놈 DNA에 대하여 준비하고, 프라이머 N245 (서열번호 85) 및 N246 (서열번호 86)을 이용하여 PCR에 의하여 스크리닝하였다. URA3 마커는 GAL1 프로모터 하에 CRE 재조합효소를 함유하는 pLA34 (서열번호 35)를 이용하여 형질전환함으로써 재활용시키고, 30℃에서 히스티딘을 결여하고 1% 에탄올로 보충된 합성 완전 배지 상에 도말되었다. 형질전환체를 1% 에탄올 및 0/5% 갈락토스로 보충된 풍부 배지 상에 도말하여 재조합효소를 유도하였다. 우라실을 결여하고 1% 에탄올로 보충된 합성 완전 배지에 콜로니를 패치하여 성장의 부재를 확인하여 마커 제거를 확인하였다. PNY2090으로 명명된, 생성된 동정된 균주의 유전형은 MATa ura3Δ::loxP, his3Δ, pdc1Δ::loxP71/66, pdc5Δ::loxP71/66 fra2Δ 2-미크론 pdc1Δ::P[PDC1]-ALS|alsS_Bs-CYC1t-loxP71/66이었다.
Pdc6Δ::(UAS)PGK1-P[FBA1]-KIVD|Lg(y)-TDH3t-loxP71/66
내생의 PDC6 코딩 영역을 결실시키기 위하여, 통합 카세트를 혼성 FBA1 프로모터 및 TDH3 종결자를 갖는 리스테리아 그라이이 종으로부터의 kivD 유전자, 및 생체 내 상동성 재조합 및 이후 URA3 마커의 제거를 가능하게 하는 축퇴 loxP 자리에 의하여 플랭킹되는 URA3 마커를 함유하는 pLA78 (서열번호 65)로부터 PCR-증폭시켰다. KAPA HiFi 및 프라이머 896 (서열번호 87) 및 897 (서열번호 88)을 이용하여 PCR을 수행하였다. 각 프라이머의 PDC6 부분을 코딩 서열의 60p 업스트림 및 코딩 영역의 59bp 다운스트림으로부터 유도하였다. 표준 유전학적 기술을 이용하여 PCR 생성물을 PNY2090으로 형질전환하였으며, 형질전환체를 30℃에서 우라실을 결여하고 1% 에탄올로 보충된 합성 완전 배지 상에서 선발하였다. 형질전환체를, 정확한 통합을 입증하기 위해, PDC6 유전자에 대해 내부의 프라이머인, 365 (서열번호 89) 및 366 (서열번호 90) 프라이머를 이용하여 콜로니 PCR에 의하여 스크리닝하였다. 생성물이 없는 형질전환체를 그 후 유전자의 5' 말단에 대하여 외부의 N638 (서열번호 91), 및 FBA1 프로모터에 대하여 내부의 740 (서열번호 69)을 이용하여 콜로니 PCR에 의하여 스크리닝하였다. 양성 형질전환체를 그 후 게놈 DNA에 대하여 준비하고, PDC6 코딩 서열에 대하여 2 개의 외부의 프라이머를 이용하여 PCR에 의해 스크리닝하였다. PDC6 야생형 형질전환체는 2130bp 생성물을 산출할 수 있으나, 양성의 통합체는 4720bp 생성물을 산출할 수 있을 것이다. URA3 마커는 GAL1 프로모터 하에서 CRE 재조합효소를 함유하는 pLA34를 이용하여 형질전환함으로써 재활용시키고, 30℃에서 히스티딘을 결여하고 1% 에탄올로 보충된 합성 완전 배지 상에 도말되었다. 형질전환체를 1% 에탄올 및 0.5% 갈락토스로 보충된 풍부 배지 상에 도말하여 재조합효소를 유도하였다. 우라실을 결여하고 1% 에탄올로 보충된 합성 완전 배지에 콜로니를 패치하여 성장의 부재를 입증하여 마커 제거를 확인하였다. 생성된 동정된 균주는 PNY2093로 명명되며, 그의 유전형 MATa ura3Δ::loxP his3Δ pdc5Δ::loxP71/66 fra2Δ 2-미크론 pdc1Δ::P[PDC1]-ALS|alsS_Bs-CYC1t-loxP71/66 pdc6Δ::(UAS)PGK1-P[FBA1]-KIVD|Lg(y)-TDH3t-loxP71/66을 갖는다.
Adh1Δ::P[ADH1]-ADH|Bi(y)-ADHt-loxP71/66
내생의 ADH1 코딩 영역을 결실시키고, 내생의 ADH1 프로모터를 이용하여 BiADH를 통합시키기 위하여, 통합 카세트를 ILV5 프로모터 및 ADH1 종결자를 갖는 베이제린키이 종으로부터의 알코올 탈수소효소 및 생체 내 상동성 재조합 및 이후 URA3 마커의 제거를 가능하게 하는 축퇴 loxP 자리에 의해 플랭킹되는 URA3 마커를 함유하는 pLA65 (서열번호 71)로부터 PCR-증폭시켰다. KAPA HiFi 및 856 (서열번호 73) 및 857 (서열번호 110) 프라이머를 이용하여 PCR을 수행하였다. 각 프라이머의 ADH1 부분은 ADH1 출발 코돈의 5' 영역 50 bp 업스트림 및 코딩 영역의 마지막 50 bp로부터 유도되었다. 표준 유전학적 기술을 이용하여 PCR 생성물을 PNY2093으로 형질전환하였으며, 형질전환체를 30℃에서 우라실을 결여하고 1% 에탄올로 보충된 합성 완전 배지 상에서 선발하였다. 형질전환체를, 정확한 통합을 입증하기 위해 5' 코딩 영역의 외부의 프라이머 BK415 (서열번호 92), 및 BiADH 유전자에 대하여 내부의 N1092 (서열번호 93)를 이용하여 콜로니 PCR에 의하여 스크리닝하였다. 양성 형질전환체는 그 후 3' 코딩 영역에 대하여 외부의 413 (서열번호 76), 및 URA3 마커에 대하여 내부의 92 (서열번호 28) 프라이머를 이용하여 콜로니 PCR에 의하여 스크리닝되었다. URA3 마커는 GAL1 프로모터 하에 CRE 재조합효소를 함유하는 pLA34 (서열번호 35)를 이용하여 형질전환함으로써 재활용시키고, 30℃에서 히스티딘을 결여하고 1% 에탄올로 보충된 합성 완전 배지 상에 도말되었다. 형질전환체를 1% 에탄올 및 0.5% 갈락토스로 보충된 풍부 배지 상에 도말하여 재조합효소를 유도하였다. 우라실을 결여하고 1% 에탄올로 보충된 합성 완전 배지에 콜로니를 패치하여 성장의 부재를 입증하여 마커 제거를 확인하였다. PNY2101로 명명된, 생성된 동정된 균주의 유전형은 MATa ura3Δ::loxP his3Δ pdc5Δ::loxP71/66 fra2Δ 2-미크론 pdc1Δ::P[PDC1]-ALS|alsS_Bs-CYC1t-loxP71/66 pdc6Δ::(UAS)PGK1-P[FBA1]-KIVD|Lg(y)-TDH3t-loxP71/66 adh1Δ::P[ADH1]-ADH|Bi(y)-ADHt-loxP71/66이었다.
Fra2Δ::P[ILV5]-ADH|Bi(y)-ADHt-loxP71/66
BiADH를 PNY2101의 fra2Δ 유전자좌 내로 통합시키기 위하여,통합 카세트를, ILV5 프로모터 및 ADH1 종결자를 갖는 베이제린키이 인디카 종으로부터의 알코올 탈수소효소 및 생체 내 상동성 재조합 및 이후 URA3 마커의 제거를 가능하게 하는 축퇴 loxP 자리에 의해 플랭킹되는 URA3 마커를 함유하는 pLA65 (서열번호 71)로부터 PCR-증폭시켰다. KAPA HiFi 및 906 (서열번호 94) 및 907 (서열번호 95) 프라이머를 이용하여 PCR을 수행하였다. 각 프라이머의 FRA2 부분은 ATG에서 출발하는 코딩 서열의 처음 60bp 및 종결 코돈의 56bp 다운스트림으로부터 유도되었다. 표준 유전학적 기술을 이용하여 PCR 생산물을 PNY2101로 형질전환하였으며, 형질전환체를 30℃에서 우라실을 결여하고 1% 에탄올로 보충된 완전 배지 상에서 선발하였다. 형질전환체를, 정확한 통합을 입증하기 위해 5' 코딩 영역에 대하여 외부의 667 (서열번호 96), 및 ILV5 프로모터에 대하여 내부의 749 (서열번호 75) 프라이머를 이용하여 콜로니 PCR에 의하여 스크리닝하였다. URA3 마커는 GAL1 프로모터 하에 CRE 재조합효소를 함유하는 pLA34 (서열번호 35)를 이용하여 형질전환함으로써 재활용시키고, 30℃에서 히스티딘을 결여하고 1% 에탄올로 보충된 합성 완전 배지 상에 도말되었다. 형질전환체를 1% 에탄올 및 0.5% 갈락토스로 보충된 풍부 배지 상에 도말하여 재조합효소를 유도하였다. 우라실을 결여하고 1% 에탄올로 보충된 합성 완전 배지에 콜로니를 패치하여 성장의 부재를 확인하여 마커 제거를 확인하였다. PNY2110로 명명된, 생성된 동정된 균주의 유전형은 MATa ura3Δ::loxP his3Δ pdc5Δ::loxP66/71 2-미크론 pdc1Δ::P[PDC1]-ALS|alsS_Bs-CYC1t-loxP71/66 pdc6Δ::(UAS)PGK1-P[FBA1]-KIVD|Lg(y)-TDH3t-loxP71/66 adh1Δ::P[ADH1]-ADH|Bi(y)-ADHt-loxP71/66 fra2Δ::P[ILV5]-ADH|Bi(y)-ADHt-loxP71/66이었다.
GPD2 결실
내생의 GPD2 코딩 영역을 결실시키기 위하여, 결실 카세트를, 생체 내 상동성 재조합 및 이후 URA3 마커의 제거를 가능하게 하는 축퇴 loxP 자리에 의해 플랭킹되는 URA3 마커를 함유하는 pLA59 (서열번호 29)로부터 PCR-증폭시켰다. KAPA HiFi 및 LA512 (서열번호 55) 및 LA513 (서열번호 56) 프라이머를 이용하여 PCR을 수행하였다. 각 프라이머의 GPD2 부분을 GPD2 출발 코돈의 5' 영역 50bp 업스트림 및 출발 코돈의 3' 영역 50bp 다운스트림으로부터 유도하여, URA3 카세트의 통합이 전체 코딩 영역을 대체하도록 하는 결과를 생성하도록 하였다. 표준 유전학적 기술을 이용하여 PCR 생성물을 PNY2110으로 형질전환시키고, 형질전환체를 30℃에서, 우라실을 결여하고 1% 에탄올로 보충된 합성 완전 배지 상에서 선발하였다. 형질전환체를, 정확한 통합을 입증하기 위해 5' 코딩 영역에 대하여 외부의 LA516 (서열번호 57) 및 URA3에 대하여 내부의 LA135 (서열번호 26) 프라이머를 이용하여 콜로니 PCR에 의하여 스크리닝하였다. 양성 형질전환체는 그 후 LA514 (서열번호 58) 및 GPD2 코딩 영역에 대하여 내부의 LA515 (서열번호 59) 프라이머를 이용하여 콜로니 PCR에 의하여 스크리닝하였다. URA3 마커는 GAL1 프로모터 하에 CRE 재조합효소를 함유하는 pLA34 (서열번호 35)를 이용하여 형질전환함으로써 재활용시키고, 30℃에서 히스티딘을 결여하고 1% 에탄올로 보충된 합성 완전 배지 상에 도말되었다. 형질전환체를 1% 에탄올 및 0.5% 갈락토스로 보충된 강화 배지 상에 도말하여 재조합 효소를 유도하였다. 우라실을 결여하고 1% 에탄올로 보충된 합성 완전 배지에 콜로니를 패치하여 성장의 부재를 입증하여 마커 제거를 확인하였다. PNY2115로 명명된, 생성된 동정된 균주의 유전형은 MATa ura3Δ::loxP his3Δ pdc5Δ::loxP66/71 fra2Δ 2-미크론 pdc1Δ::P[PDC1]-ALS|alsS_Bs-CYC1t-loxP71/66 pdc6Δ::(UAS)PGK1-P[FBA1]-KIVD|Lg(y)-TDH3t-loxP71/66 adh1Δ::P[ADH1]-ADH|Bi(y)-ADHt-loxP71/66 fra2Δ::P[ILV5]-ADH|Bi(y)-ADHt-loxP71/66 gpd2Δ::loxP71/66이었다.
PNY2115로부터의 PNY2145의 구축
pdc5Δ 유전자 좌에서 포스포케톨라제 유전자 카세트의 추가적인 통합에 의해, 그리고 천연의 AMN1 유전자를 CEN.PK로부터의 오솔로그(ortholog)의 코돈 최적화된 형태로 치환함에 의해 PNY2115로부터 PNY2145를 구축하였다. 통합 구축물을 하기에 추가로 기재하였다.
pdc5Δ::FBA(L8)-xpk1-CYC1t-loxP71/66
pRS423::TEF(M4)-xpk1+ENO1-eutD (서열번호 111)로부터의 TEF(M4)-xpk1-CYC1t 유전자를, N1341 및 N1338 (서열번호 112 및 113) 프라이머를 이용하여 PCR 증폭시켜 3.1 kb 생성물을 생성하였다. pLA59 (서열번호 29)로부터의 loxP-플랭킹되는 URA3 유전자 카세트를 N1033c 및 N1342 (서열번호 114 및 115) 프라이머를 이용하여 증폭하여, 1.6 kb 생성물을 생성하였다. xpk1 및 URA3 PCR 생성물을, Phusion DNA 중합효소를 이용하여 PCR의 추가의 10 사이클에 프라이머 없이 조합하여 융합하였다. 생성된 반응 혼합물을 그 후 KAPA Hi Fi 및 N1342 및 N1364 (서열번호 115 및 116) 프라이머를 이용한 PCR 반응에 대한 주형으로서 사용하였다. 4.2 kb PCR 생성물을 전기영동 아가로스 겔 (Zymo 키트)로부터의 정제에 의하여 회수하였다. FBA 프로모터 변이체 L8 (서열번호 117)을, N1366 및 N1368 (서열번호 118 및 119) 프라이머를 이용하여 증폭시켰다. xpk1::URA3 PCR 생성물을 PCR의 추가 구동에 의하여 FBA 프로모터와 조합시켰다. 생성된 생성물을 폴리뉴클레오타이드 키나제로 인산화하고, EcoRV로 분해시키고 송아지 장 포스파타제로 처리된 pBR322 내로 결찰시켰다. 결찰 반응은 대장균 세포로 형질전환되었다 (Invitrogen로부터의 Stbl3 수용 세포). 통합 카세트는 서열분석에 의하여 확인하였다. 통합을 위한 DNA를 제조하기 위하여, 플라스미드는 Kapa HiFi 및 N1371 및 N1372 (서열번호 120 및 121) 프라이머를 이용하는 PCR 반응에서 주형으로서 이용되었다. PCR 생성물을 페놀-클로로포름 추출 및 에탄올 침전 (표준 방법, 예로서, Maniatas 등의 방법 이용)에 의하여 분리하였다. 5 마이크로그램의 DNA를 균주 PNY2115를 형질전환시키는데 이용하였다. 형질전환체를 우라실 결여 배지 (탄소 공급원으로서 1% 에탄올을 갖는, 우라실을 뺀 합성 완전 배지) 상에서 선발하였다. 콜로니를 프라이머 BK93 및 N1114 (서열번호 122 및 123)를 이용하는 PCR (JumpStart)을 이용하여 통합 경우에 대해 스크리닝하였다. 2 개의 클론을 선발하여 앞서 실시하였다. URA3 마커를 GAL1 프로모터 하에서 CRE 재조합효소를 함유하는 pJT254 (서열번호 97)를 이용하여 형질전환시키고, 30℃에서 히스티딘 결여 및 1% 에탄올로 보충된 합성 완전 배지 상에 도말하여 재활용하였다. 형질전환체를 1% 에탄올로 보충된 강화 배지 상에서 배양하여 재조합효소를 억제하였다. 단일 콜로니 분리물을 우라실 결여 및 1% 에탄올로 보충된 합성 완전 배지에 패치시켜 성장의 부재를 입증하기 하여 마커 제거를 확인하였다. 콜로니를 히스티딘을 결여하고 1% 에탄올로 보충된 합성 완전 배지에 패치시켜, 재조합효소 플라스미드 pJT254의 손실을 확인하였다. 적절한 마커 제거는 PCR (프라이머 N160SeqF5 (서열번호 124) 및 BK380 (서열번호 125)에 의하여 확인하였다. 생성된 하나의 클론을 PNY2293로 명명하였다.
amn1Δ::AMN1(y)-loxP71/66
AMN1의 내생의 복제물을, CEN.PK2로부터의 AMN1 유전자의 코돈-최적화된 형태로 대체하기 위하여, CEN.PK AMN1 프로모터, AMN1(y) 유전자 (핵산 서열번호 98; 아미노산 서열번호 99 번역), 및 CEN.PK AMN1 종결자를 함유하는 통합 카세트를 SOE PCR에 의하여 조립하고 셔틀 벡터 pLA59로 서브클로닝하였다. AMN1(y) 유전자를 S. 세레비시에에 대한 코돈-최적화를 갖는 DNA 2.0으로부터 정렬하였다. 완성된 pLA67 플라스미드 (서열번호 100)는: 1) E. 콜라이 복제 기원 및 암피실린 내성 유전자를 함유하는 pUC19 벡터 골격 서열; 2) loxP71 및 loxP66 자리에 의해 플랭킹되는 URA3 선발 마커; 및 3) PAMN1(CEN.PK)-AMN1(y)-termAMN1(CEN.PK) 발현 카세트를 포함하였다.
AMN1(y)-loxP71-URA3-loxP66 카세트의 PCR 증폭은 Kapa Biosystems (Woburn, MA 소재)로부터의 KAPA HiFi 및 프라이머 LA712 (서열번호 101) 및 LA746 (서열번호 102)를 이용하여 수행되었다. 표준 유전학적 기술을 이용하여 PCR 생성물을 PNY2293으로 형질전환하고, 형질전환체를 30℃에서, 우라실을 결여하고 1% 에탄올로 보충된 합성 완전 배지 상에서 선발하였다. 형질전환체를, 대조구 (PNY2293)에 비하여 뭉친 (clumping) 표현형의 부재에 대하여, 확대 하에 관찰하였다 URA3 마커를, 상기 기재된 바와 같이 pJT254 Cre 재조합효소 플라스미드를 이용하여 재활용하였다. 마커 재활용 후, 클론을 확대 하에 다시 관찰하여 뭉친 표현형의 부재를 확인하였다. 생성된 동정된 균주, PNY2145의 유전형은 MATa ura3Δ::loxP his3Δ pdc5Δ::P[FBA(L8)]-XPK|xpk1_Lp-CYCt-loxP66/71 fra2Δ 2-미크론 플라스미드 (CEN.PK2) pdc1Δ::P[PDC1]-ALS|alsS_Bs-CYC1t-loxP71/66 pdc6Δ::(UAS)PGK1-P[FBA1]-KIVD|Lg(y)-TDH3t-loxP71/66 adh1Δ::P[ADH1]-ADH|Bi(y)-ADHt-loxP71/66 fra2Δ::P[ILV5]-ADH|Bi(y)-ADHt-loxP71/66 gpd2Δ::loxP71/66 amn1Δ::AMN1(y)을 가졌다
PNY2118 및 PNY2120은 모두 효모-E. 콜라이 셔틀 벡터를 균주 PNY2115로 형질전환시킴으로써 구축되었다. 플라스미드 형질전환체는 우라실 또는 히스티딘 없이, 단독 탄소 공급원으로서 1% 에탄올 (v/v)을 포함하는 합성 완전 배지 상에서 세포를 도말하여 선발되었다. PNY2118은 PCT 공개 번호 제 WO2012/129555호에 기재된, 플라스미드 pYZ067ΔkivDΔhADH (서열번호 103) 및 pHR81-ILV5p-K9JB4P (서열번호 104)를 수용한 클론이다. PNY2120는 플라스미드 pHR81-ILV5p-K9SB2-SH (서열번호 105) 및 pYZ067ΔkivDΔhADH를 수용한 클론이다. pHR81-ILV5p-K9JB4P 및 pHR81-ILV5p-K9SB2-SH 플라스미드는 pHR81 (ATCC로부터 입수가능, #87541 (Manassas, VA 소재))에 기초하고, KARI (각각, 변이체 K9JB4P, 서열번호 106 nt 및 서열번호 107 단백질; 및 K9SB2-SH, 서열번호 126)의 발현을 위한 유전자를 함유한다. 플라스미드 pYZ067ΔkivDΔhADH는 pRS423 (ATCC로부터 입수가능, # 77104)으로부터 유래되었으며, DHAD의 발현을 위한 유전자를 함유한다.
PNY2318은 PNY2145를 플라스미드 pLH689-L2V4 (서열번호 108) 및 pRS413::BiADH-kivD (서열번호 109)를 이용하여 형질전환함으로써 구축하였다. 형질전환체는 PNY2118 및 PNY2120에 대하여 상기 기재된 것과 같이 수득하였다. 플라스미드 pLH689-L2V4는 pHR81에 기초하며, KARI (K9JB4P 변이체, 아미노산 서열번호 107; ILV5 프로모터의 통제 하) 및 DHAD (C-말단 Lumioㄾ tag를 포함하는 L2V4 변이체, 아미노산 서열번호 127; TEF(M7) 프로모터의 통제 하)의 발현을 위한 유전자를 함유한다. 플라스미드 pRS413::BiADH-kivD는 pRS413 (ATCC#)에 기초하며, BiADH (아미노산 서열번호 128; PDC1 프로모터의 통제 하) 및 L. grayi kivD (아미노산 서열번호 129, PGK(UAS)-FBA1 혼성 프로모터의 통제 하)의 발현을 위한 유전자를 함유한다.
실시예 1
PNY2270에 의한 아이소부탄올 생산
본 실시예의 목적은 에탄올 또는 아세테이트 중 어느 하나를 C2 보충물로서 함유하는 성장 배지 내에서 균주 PNY2270에 의한 성장 및 아이소부탄올 생산을 예증하고자 하는 것이다.
PNY2270은, 0.3% 글루코스 및 2mM 아세테이트 또는 0.3% (vol/vol) 에탄올 중 어느 하나를 합성 완전 배지 중, 30℃에서 플랫폼 진탕기 (platform shaker)에서 (220 rpm), 호기적으로 배양되었다 (환기된 125 ml 플라스크 중 10 ml 배지). 아세테이트-보충된 배지 중 대수적 성장 속도는 에탄올을 이용한 것보다 40% 더 높았다. 어느 한 배지 중 배양물을 약 2의 광학 밀도로 성장시켰다 (에펜도르프 생물광도계 (Eppendorf BioPhotometer) (Eppendorf AG사, Hamburg, Germany 소재)를 사용하여 측정). 배양 배지를 그 후 2% 글루코스, BME 비타민 및 2mM 아세테이트 또는 0.05% (vol/vol) 에탄올을 갖는 합성 완전 배지를 혈청 바이알 중에 (15 ml 바이알 중 10 ml 배지) 0.22의 출발 OD로 접종하는데 사용하였다. 바이알을 마개로 막고(stoppered), 크림프시켜(crimped), 플랫폼 진탕기 (220 rpm) 내 30℃에서 인큐베이션하였다. 48시간 후, 크림프 및 마개를 제거하고, 광학 밀도를 측정하고, 배양 여과물을 아이소부탄올 생산에 대해 HPLC로 분석하였다.
아세테이트를 함유하는 배양 배지 중에서 성장한 균주는, 아세테이트 없는 배지 중에서 성장한 균주보다 더욱 높은 농도로 아이소부탄올을 생산하는 것으로 발견되었다 (하기 표 2에 나타낸 결과).
실시예 2
PNY2092에 의한 아이소부탄올 생산
본 실시예의 목적은 에탄올 또는 아세테이트 중 어느 하나를 C2 보충물로서 함유하는 성장 배지 내에서 균주 PNY2092에 의한 성장 및 아이소부탄올 생산을 예증하고자 하는 것이다.
PNY2092는 0.3% 글루코스 및 2mM 아세테이트 또는 0.3% (vol/vol) 에탄올 중 어느 하나를 갖는 합성 완전 배지 중, 30℃에서 플랫폼 진탕기에서 (220 rpm), 호기적으로 배양되었다 (환기된 125 ml 플라스크 중 10 ml 배지). 아세테이트-보충된 배지 중 대수적 성장 속도는 에탄올을 이용한 것보다 더 높았다. 어느 한 배지 중 배양물을 약 2의 광학 밀도로 성장시켰다 (에펜도르프 생물광도계 (Eppendorf AG사, Hamburg, Germany 소재)). 배양 배지를 그 후 2% 글루코스, BME 비타민 및 2mM 아세테이트 또는 0.05% (vol/vol) 에탄올을 갖는 합성 완전 배지를 혈청 바이알 중 (15 ml 바이알 중 10 ml 배지)에 0.2의 출발 OD로 접종하는데 사용하였다. 바이알을 마개로 막고, 크림프시켜, 플랫폼 진탕기 (220 rpm) 내 30℃에서 인큐베이션하였다. 48시간 후, 크림프 및 마개를 제거하고, 광학 밀도를 측정하고, 배양 여과물을 HPLC로 분석하였다.
아세테이트를 함유하는 배양 배지 중에서 성장한 균주는, 아세테이트 없는 배양 배지 중에서 성장한 균주보다 더욱 높은 농도로 아이소부탄올을 생산하는 것으로 발견되었다 (하기 표 3에 나타낸 결과).
실시예 4
균주 PNY2118 및 PNY2120에 의한 아이소부탄올 생산
본 실시예의 목적은 에탄올 또는 아세테이트 중 어느 하나를 C2 보충물로서 함유하는 배지 내에서 균주 PNY2118 및 PNY2120에 의한 아이소부탄올 생산을 예증하고자 하는 것이다.
샘플을 47.3시간에 분석을 위해 수집한 것을 제외하고는, 상기 실시예 2에서 기재된 것과 같이 균주를 배양한 후 혈청 바이알 내에서 아이소부탄올 생산에 대하여 평가하였다.
실시예 5
PNY2318에 의한 아이소부탄올 생산
본 실시예의 목적은 에탄올 또는 아세테이트 중 어느 하나를 C2 보충물로서 함유하는 배지 내에서 균주 PNY2318에 의한 아이소부탄올 생산을 예증하고자 하는 것이다.
상기 기재된 실험들과 유사하게, 균주를 배양한 후 혈청 바이알 내에서 아이소부탄올 생산에 대하여 평가하였다 (실시예 2 및 3). 이 경우에서, PNY2318은 성장을 위해 C2-보충물을 필요로 하지 않는다. 따라서 균주는 C2와 함께 또는 C2 없이 배양되고, 그 후 혈청 바이알 내로 다시 C2와 함께 또는 C2 없이 접종되었다. 샘플을 분석을 위해 36 시간에 수집하였다.
SEQUENCE LISTING
<110> Butamax(TM) Advanced Biofuels LLC
<120> ACCETATE SUPPLEMENTATION OF MEDIUM FOR BUTANOLOGENS
<130> CL5681USNP
<140> US 61/615,174
<141> 2012-03-23
<160> 134
<170> PatentIn version 3.5
<210> 1
<211> 491
<212> PRT
<213> Artificial
<220>
<223> Escherichia coli ketol-acid reductoisomerase
<400> 1
Met Ala Asn Tyr Phe Asn Thr Leu Asn Leu Arg Gln Gln Leu Ala Gln
1 5 10 15
Leu Gly Lys Cys Arg Phe Met Gly Arg Asp Glu Phe Ala Asp Gly Ala
20 25 30
Ser Tyr Leu Gln Gly Lys Lys Val Val Ile Val Gly Cys Gly Ala Gln
35 40 45
Gly Leu Asn Gln Gly Leu Asn Met Arg Asp Ser Gly Leu Asp Ile Ser
50 55 60
Tyr Ala Leu Arg Lys Glu Ala Ile Ala Glu Lys Arg Ala Ser Trp Arg
65 70 75 80
Lys Ala Thr Glu Asn Gly Phe Lys Val Gly Thr Tyr Glu Glu Leu Ile
85 90 95
Pro Gln Ala Asp Leu Val Ile Asn Leu Thr Pro Asp Lys Gln His Ser
100 105 110
Asp Val Val Arg Thr Val Gln Pro Leu Met Lys Asp Gly Ala Ala Leu
115 120 125
Gly Tyr Ser His Gly Phe Asn Ile Val Glu Val Gly Glu Gln Ile Arg
130 135 140
Lys Asp Ile Thr Val Val Met Val Ala Pro Lys Cys Pro Gly Thr Glu
145 150 155 160
Val Arg Glu Glu Tyr Lys Arg Gly Phe Gly Val Pro Thr Leu Ile Ala
165 170 175
Val His Pro Glu Asn Asp Pro Lys Gly Glu Gly Met Ala Ile Ala Lys
180 185 190
Ala Trp Ala Ala Ala Thr Gly Gly His Arg Ala Gly Val Leu Glu Ser
195 200 205
Ser Phe Val Ala Glu Val Lys Ser Asp Leu Met Gly Glu Gln Thr Ile
210 215 220
Leu Cys Gly Met Leu Gln Ala Gly Ser Leu Leu Cys Phe Asp Lys Leu
225 230 235 240
Val Glu Glu Gly Thr Asp Pro Ala Tyr Ala Glu Lys Leu Ile Gln Phe
245 250 255
Gly Trp Glu Thr Ile Thr Glu Ala Leu Lys Gln Gly Gly Ile Thr Leu
260 265 270
Met Met Asp Arg Leu Ser Asn Pro Ala Lys Leu Arg Ala Tyr Ala Leu
275 280 285
Ser Glu Gln Leu Lys Glu Ile Met Ala Pro Leu Phe Gln Lys His Met
290 295 300
Asp Asp Ile Ile Ser Gly Glu Phe Ser Ser Gly Met Met Ala Asp Trp
305 310 315 320
Ala Asn Asp Asp Lys Lys Leu Leu Thr Trp Arg Glu Glu Thr Gly Lys
325 330 335
Thr Ala Phe Glu Thr Ala Pro Gln Tyr Glu Gly Lys Ile Gly Glu Gln
340 345 350
Glu Tyr Phe Asp Lys Gly Val Leu Met Ile Ala Met Val Lys Ala Gly
355 360 365
Val Glu Leu Ala Phe Glu Thr Met Val Asp Ser Gly Ile Ile Glu Glu
370 375 380
Ser Ala Tyr Tyr Glu Ser Leu His Glu Leu Pro Leu Ile Ala Asn Thr
385 390 395 400
Ile Ala Arg Lys Arg Leu Tyr Glu Met Asn Val Val Ile Ser Asp Thr
405 410 415
Ala Glu Tyr Gly Asn Tyr Leu Phe Ser Tyr Ala Cys Val Pro Leu Leu
420 425 430
Lys Pro Phe Met Ala Glu Leu Gln Pro Gly Asp Leu Gly Lys Ala Ile
435 440 445
Pro Glu Gly Ala Val Asp Asn Gly Gln Leu Arg Asp Val Asn Glu Ala
450 455 460
Ile Arg Ser His Ala Ile Glu Gln Val Gly Lys Lys Leu Arg Gly Tyr
465 470 475 480
Met Thr Asp Met Lys Arg Ile Ala Val Ala Gly
485 490
<210> 2
<211> 338
<212> PRT
<213> Artificial
<220>
<223> Pseudomonas fluorescens ketol-acid reductoisomerase
<400> 2
Met Lys Val Phe Tyr Asp Lys Asp Cys Asp Leu Ser Ile Ile Gln Gly
1 5 10 15
Lys Lys Val Ala Ile Ile Gly Tyr Gly Ser Gln Gly His Ala Gln Ala
20 25 30
Cys Asn Leu Lys Asp Ser Gly Val Asp Val Thr Val Gly Leu Arg Lys
35 40 45
Gly Ser Ala Thr Val Ala Lys Ala Glu Ala His Gly Leu Lys Val Thr
50 55 60
Asp Val Ala Ala Ala Val Ala Gly Ala Asp Leu Val Met Ile Leu Thr
65 70 75 80
Pro Asp Glu Phe Gln Ser Gln Leu Tyr Lys Asn Glu Ile Glu Pro Asn
85 90 95
Ile Lys Lys Gly Ala Thr Leu Ala Phe Ser His Gly Phe Ala Ile His
100 105 110
Tyr Asn Gln Val Val Pro Arg Ala Asp Leu Asp Val Ile Met Ile Ala
115 120 125
Pro Lys Ala Pro Gly His Thr Val Arg Ser Glu Phe Val Lys Gly Gly
130 135 140
Gly Ile Pro Asp Leu Ile Ala Ile Tyr Gln Asp Ala Ser Gly Asn Ala
145 150 155 160
Lys Asn Val Ala Leu Ser Tyr Ala Ala Gly Val Gly Gly Gly Arg Thr
165 170 175
Gly Ile Ile Glu Thr Thr Phe Lys Asp Glu Thr Glu Thr Asp Leu Phe
180 185 190
Gly Glu Gln Ala Val Leu Cys Gly Gly Thr Val Glu Leu Val Lys Ala
195 200 205
Gly Phe Glu Thr Leu Val Glu Ala Gly Tyr Ala Pro Glu Met Ala Tyr
210 215 220
Phe Glu Cys Leu His Glu Leu Lys Leu Ile Val Asp Leu Met Tyr Glu
225 230 235 240
Gly Gly Ile Ala Asn Met Asn Tyr Ser Ile Ser Asn Asn Ala Glu Tyr
245 250 255
Gly Glu Tyr Val Thr Gly Pro Glu Val Ile Asn Ala Glu Ser Arg Gln
260 265 270
Ala Met Arg Asn Ala Leu Lys Arg Ile Gln Asp Gly Glu Tyr Ala Lys
275 280 285
Met Phe Ile Ser Glu Gly Ala Thr Gly Tyr Pro Ser Met Thr Ala Lys
290 295 300
Arg Arg Asn Asn Ala Ala His Gly Ile Glu Ile Ile Gly Glu Gln Leu
305 310 315 320
Arg Ser Met Met Pro Trp Ile Gly Ala Asn Lys Ile Val Asp Lys Ala
325 330 335
Lys Asn
<210> 3
<211> 570
<212> PRT
<213> Artificial
<220>
<223> Lactococcus lactis dihydroxyacid dehydratase
<400> 3
Met Glu Phe Lys Tyr Asn Gly Lys Val Glu Ser Ile Glu Leu Asn Lys
1 5 10 15
Tyr Ser Lys Thr Leu Thr Gln Asp Pro Thr Gln Pro Ala Thr Gln Ala
20 25 30
Met His Tyr Gly Ile Gly Phe Lys Asp Glu Asp Phe Lys Lys Ala Gln
35 40 45
Val Gly Ile Val Ser Met Asp Trp Asp Gly Asn Pro Cys Asn Met His
50 55 60
Leu Gly Thr Leu Gly Ser Lys Ile Lys Asn Ser Val Asn Gln Thr Asp
65 70 75 80
Gly Leu Ile Gly Leu Gln Phe His Thr Ile Gly Val Ser Asp Gly Ile
85 90 95
Ala Asn Gly Lys Leu Gly Met Arg Tyr Ser Leu Val Ser Arg Glu Val
100 105 110
Ile Ala Asp Ser Ile Glu Thr Asn Ala Gly Ala Glu Tyr Tyr Asp Ala
115 120 125
Ile Val Ala Val Pro Gly Cys Asp Lys Asn Met Pro Gly Ser Ile Ile
130 135 140
Gly Met Ala Arg Leu Asn Arg Pro Ser Ile Met Val Tyr Gly Gly Thr
145 150 155 160
Ile Glu His Gly Glu Tyr Lys Gly Glu Lys Leu Asn Ile Val Ser Ala
165 170 175
Phe Glu Ala Leu Gly Gln Lys Ile Thr Gly Asn Ile Ser Glu Glu Asp
180 185 190
Tyr His Gly Val Ile Cys Asn Ala Ile Pro Gly Gln Gly Ala Cys Gly
195 200 205
Gly Met Tyr Thr Ala Asn Thr Leu Ala Ser Ala Ile Glu Thr Leu Gly
210 215 220
Met Ser Leu Pro Tyr Ser Ala Ser Asn Pro Ala Val Ser Gln Glu Lys
225 230 235 240
Glu Asp Glu Cys Asp Glu Ile Gly Leu Ala Ile Lys Asn Leu Leu Glu
245 250 255
Lys Asp Ile Lys Pro Ser Asp Ile Met Thr Lys Glu Ala Phe Glu Asn
260 265 270
Ala Ile Thr Ile Val Met Val Leu Gly Gly Ser Thr Asn Ala Val Leu
275 280 285
His Ile Ile Ala Met Ala Asn Ala Ile Gly Val Glu Ile Thr Gln Asp
290 295 300
Asp Phe Gln Arg Ile Ser Asp Val Thr Pro Val Leu Gly Asp Phe Lys
305 310 315 320
Pro Ser Gly Lys Tyr Met Met Glu Asp Leu His Lys Ile Gly Gly Val
325 330 335
Pro Ala Val Leu Lys Tyr Leu Leu Lys Glu Gly Lys Leu His Gly Asp
340 345 350
Cys Leu Thr Val Thr Gly Lys Thr Leu Ala Glu Asn Val Glu Thr Ala
355 360 365
Leu Asp Leu Asp Phe Asp Ser Gln Asp Ile Ile Arg Pro Leu Glu Asn
370 375 380
Pro Ile Lys Ala Thr Gly His Leu Gln Ile Leu Tyr Gly Asn Leu Ala
385 390 395 400
Glu Gly Gly Ser Val Ala Lys Ile Ser Gly Lys Glu Gly Glu Phe Phe
405 410 415
Lys Gly Thr Ala Arg Val Phe Asp Gly Glu Gln His Phe Ile Asp Gly
420 425 430
Ile Glu Ser Gly Arg Leu His Ala Gly Asp Val Ala Val Ile Arg Asn
435 440 445
Ile Gly Pro Val Gly Gly Pro Gly Met Pro Glu Met Leu Lys Pro Thr
450 455 460
Ser Ala Leu Ile Gly Ala Gly Leu Gly Lys Ser Cys Ala Leu Ile Thr
465 470 475 480
Asp Gly Arg Phe Ser Gly Gly Thr His Gly Phe Val Val Gly His Ile
485 490 495
Val Pro Glu Ala Val Glu Gly Gly Leu Ile Gly Leu Val Glu Asp Asp
500 505 510
Asp Ile Ile Glu Ile Asp Ala Val Asn Asn Ser Ile Ser Leu Lys Val
515 520 525
Ala Asp Asp Glu Ile Ala Arg Arg Arg Ala Asn Tyr Gln Lys Pro Ala
530 535 540
Pro Lys Ala Thr Arg Gly Val Leu Ala Lys Phe Ala Lys Leu Thr Arg
545 550 555 560
Pro Ala Ser Glu Gly Cys Val Thr Asp Leu
565 570
<210> 4
<211> 571
<212> PRT
<213> Artificial
<220>
<223> Streptococcus mutans dihydroxyacid dehydratase
<400> 4
Met Thr Asp Lys Lys Thr Leu Lys Asp Leu Arg Asn Arg Ser Ser Val
1 5 10 15
Tyr Asp Ser Met Val Lys Ser Pro Asn Arg Ala Met Leu Arg Ala Thr
20 25 30
Gly Met Gln Asp Glu Asp Phe Glu Lys Pro Ile Val Gly Val Ile Ser
35 40 45
Thr Trp Ala Glu Asn Thr Pro Cys Asn Ile His Leu His Asp Phe Gly
50 55 60
Lys Leu Ala Lys Val Gly Val Lys Glu Ala Gly Ala Trp Pro Val Gln
65 70 75 80
Phe Gly Thr Ile Thr Val Ser Asp Gly Ile Ala Met Gly Thr Gln Gly
85 90 95
Met Arg Phe Ser Leu Thr Ser Arg Asp Ile Ile Ala Asp Ser Ile Glu
100 105 110
Ala Ala Met Gly Gly His Asn Ala Asp Ala Phe Val Ala Ile Gly Gly
115 120 125
Cys Asp Lys Asn Met Pro Gly Ser Val Ile Ala Met Ala Asn Met Asp
130 135 140
Ile Pro Ala Ile Phe Ala Tyr Gly Gly Thr Ile Ala Pro Gly Asn Leu
145 150 155 160
Asp Gly Lys Asp Ile Asp Leu Val Ser Val Phe Glu Gly Val Gly His
165 170 175
Trp Asn His Gly Asp Met Thr Lys Glu Glu Val Lys Ala Leu Glu Cys
180 185 190
Asn Ala Cys Pro Gly Pro Gly Gly Cys Gly Gly Met Tyr Thr Ala Asn
195 200 205
Thr Met Ala Thr Ala Ile Glu Val Leu Gly Leu Ser Leu Pro Gly Ser
210 215 220
Ser Ser His Pro Ala Glu Ser Ala Glu Lys Lys Ala Asp Ile Glu Glu
225 230 235 240
Ala Gly Arg Ala Val Val Lys Met Leu Glu Met Gly Leu Lys Pro Ser
245 250 255
Asp Ile Leu Thr Arg Glu Ala Phe Glu Asp Ala Ile Thr Val Thr Met
260 265 270
Ala Leu Gly Gly Ser Thr Asn Ser Thr Leu His Leu Leu Ala Ile Ala
275 280 285
His Ala Ala Asn Val Glu Leu Thr Leu Asp Asp Phe Asn Thr Phe Gln
290 295 300
Glu Lys Val Pro His Leu Ala Asp Leu Lys Pro Ser Gly Gln Tyr Val
305 310 315 320
Phe Gln Asp Leu Tyr Lys Val Gly Gly Val Pro Ala Val Met Lys Tyr
325 330 335
Leu Leu Lys Asn Gly Phe Leu His Gly Asp Arg Ile Thr Cys Thr Gly
340 345 350
Lys Thr Val Ala Glu Asn Leu Lys Ala Phe Asp Asp Leu Thr Pro Gly
355 360 365
Gln Lys Val Ile Met Pro Leu Glu Asn Pro Lys Arg Glu Asp Gly Pro
370 375 380
Leu Ile Ile Leu His Gly Asn Leu Ala Pro Asp Gly Ala Val Ala Lys
385 390 395 400
Val Ser Gly Val Lys Val Arg Arg His Val Gly Pro Ala Lys Val Phe
405 410 415
Asn Ser Glu Glu Glu Ala Ile Glu Ala Val Leu Asn Asp Asp Ile Val
420 425 430
Asp Gly Asp Val Val Val Val Arg Phe Val Gly Pro Lys Gly Gly Pro
435 440 445
Gly Met Pro Glu Met Leu Ser Leu Ser Ser Met Ile Val Gly Lys Gly
450 455 460
Gln Gly Glu Lys Val Ala Leu Leu Thr Asp Gly Arg Phe Ser Gly Gly
465 470 475 480
Thr Tyr Gly Leu Val Val Gly His Ile Ala Pro Glu Ala Gln Asp Gly
485 490 495
Gly Pro Ile Ala Tyr Leu Gln Thr Gly Asp Ile Val Thr Ile Asp Gln
500 505 510
Asp Thr Lys Glu Leu His Phe Asp Ile Ser Asp Glu Glu Leu Lys His
515 520 525
Arg Gln Glu Thr Ile Glu Leu Pro Pro Leu Tyr Ser Arg Gly Ile Leu
530 535 540
Gly Lys Tyr Ala His Ile Val Ser Ser Ala Ser Arg Gly Ala Val Thr
545 550 555 560
Asp Phe Trp Lys Pro Glu Glu Thr Gly Lys Lys
565 570
<210> 5
<211> 1641
<212> DNA
<213> Artificial
<220>
<223> Macrococcus caseolyticus 2-ketoisovalerate decarboxylase
<400> 5
atgaaacaac gtatcgggca atacttgatc gatgccctac acgttaatgg tgtcgataag 60
atctttggag tcccaggtga tttcacttta gcctttttgg acgatatcat aagacatgac 120
aacgtggaat gggtgggaaa tactaatgag ttgaacgccg cttacgccgc tgatggttac 180
gctagagtta atggattagc cgctgtatct accacttttg gggttggcga gttatctgct 240
gtgaatggta ttgctggaag ttacgcagag cgtgttcctg taatcaaaat ctcaggcggt 300
ccttcatcag ttgctcaaca agagggtaga tatgtccacc attcattggg tgaaggaatc 360
tttgattcat attcaaagat gtacgctcac ataaccgcaa caactacaat cttatccgtt 420
gacaacgcag tcgacgaaat tgatagagtt attcattgtg ctttgaagga aaagaggcca 480
gtgcatattc atttgcctat tgacgtagcc ttaactgaga ttgaaatccc tcatgcacca 540
aaagtttaca cacacgaatc ccagaacgtc gatgcttaca ttcaagctgt tgagaaaaag 600
ttaatgtctg caaaacaacc agtaatcata gcaggtcatg aaatcaattc attcaagttg 660
cacgaacaac tggaacagtt tgtcaatcag acaaacatcc ctgttgcaca actttccttg 720
ggtaagtctg ctttcaatga agagaatgaa cattaccttg gtatctacga tggcaaaatc 780
gcaaaggaaa atgtgagaga gtacgtcgac aatgctgatg tcatattgaa cataggtgcc 840
aaactgactg attctgctac agctggattt tcctacaagt tcgatacaaa caacataatc 900
tacattaacc ataatgactt caaagctgaa gatgtgattt ctgataatgt ttcactgatt 960
gatcttgtga atggcctgaa ttctattgac tatagaaatg aaacacacta cccatcttat 1020
caaagatctg atatgaaata cgaattgaat gacgcaccac ttacacaatc taactatttc 1080
aaaatgatga acgcttttct agaaaaagat gacatcctac tagctgaaca aggtacatcc 1140
tttttcggcg catatgactt atccctatac aagggaaatc agtttatcgg tcagccttta 1200
tgggggtcaa tagggtatac ttttccatct ttactaggaa gtcaactagc agacatgcat 1260
aggagaaaca ttttgcttat aggcgatggt agtttacaac ttactgttca agccctaagt 1320
acaatgatta gaaaggatat caaaccaatc attttcgtta tcaataacga cggttacacc 1380
gtcgaaagac ttatccacgg catggaagag ccatacaatg atatccaaat gtggaactac 1440
aagcaattgc cagaagtatt tggtggaaaa gatactgtaa aagttcatga tgctaaaacc 1500
tccaacgaac tgaaaactgt aatggattct gttaaagcag acaaagatca catgcatttc 1560
attgaagtgc atatggcagt agaggacgcc ccaaagaagt tgattgatat agctaaagcc 1620
tttagtgatg ctaacaagta a 1641
<210> 6
<211> 1647
<212> DNA
<213> Artificial
<220>
<223> Listeria grayi, 2-ketoisovalerate decarboxylase
<400> 6
atgtacaccg tcggccaata cttagtagac cgcttagaag agatcggcat cgataaggtt 60
tttggtgtcc cgggtgacta caacctgacc tttttggact acatccagaa ccacgaaggt 120
ctgagctggc aaggtaatac gaatgaactg aatgccgcgt acgcagctga tggctatgct 180
cgtgaacgcg gtgttagcgc tttggtcacg accttcggcg ttggtgagct gtccgcaatc 240
aatggcaccg caggtagctt cgcggagcaa gttccggtga ttcatatcgt gggcagcccg 300
accatgaatg ttcagagcaa caagaaactg gttcatcaca gcctgggtat gggcaacttt 360
cacaacttca gcgagatggc gaaagaagtc accgccgcaa ccacgatgct gacggaagag 420
aatgcggcgt cggagattga tcgtgttctg gaaaccgccc tgctggagaa acgcccagtg 480
tacatcaatc tgccgatcga cattgctcac aaggcgatcg tcaagccggc gaaagccctg 540
caaaccgaga agagctctgg cgagcgtgag gcacaactgg cggagatcat tctgagccat 600
ctggagaagg ctgcacagcc gattgtgatt gcgggtcacg agatcgcgcg cttccagatc 660
cgtgagcgtt tcgagaattg gattaatcaa acgaaactgc cggtgaccaa tctggcctac 720
ggcaagggta gcttcaacga agaaaacgag catttcattg gtacctatta tcctgcattt 780
agcgataaga acgtgctgga ctacgtggat aactccgact ttgtcctgca ctttggtggt 840
aaaatcattg ataacagcac ctccagcttc tcccaaggct tcaaaaccga gaacaccctg 900
actgcggcga acgatatcat tatgctgccg gacggtagca cgtattctgg tattagcctg 960
aatggcctgc tggccgagct ggaaaaactg aatttcacgt ttgccgacac cgcagcaaag 1020
caggcggagt tggcggtgtt tgagccgcag gctgaaaccc cgttgaaaca ggaccgtttt 1080
caccaggcgg tgatgaattt tctgcaagct gacgatgtcc tggttacgga acagggcacc 1140
tcttcttttg gcttgatgct ggcgcctctg aaaaagggta tgaacttgat ctcgcaaacg 1200
ctgtggggta gcattggtta cacgttgccg gcgatgattg gtagccaaat tgcggcaccg 1260
gagcgtcgtc atatcctgag cattggtgat ggtagctttc agctgactgc gcaggaaatg 1320
agcaccattt tccgtgagaa actgacccca gtcatcttca tcattaacaa tgatggctat 1380
accgttgagc gtgcgatcca tggcgaagat gaaagctata acgacattcc gacgtggaac 1440
ttgcaactgg tggcggaaac cttcggtggt gacgccgaaa ccgtcgacac tcacaatgtg 1500
ttcacggaga ctgatttcgc caacaccctg gcggcaattg acgcgacgcc gcagaaagca 1560
cacgttgtgg aagttcacat ggaacaaatg gatatgccgg agagcctgcg ccagatcggt 1620
ctggcactgt ccaagcagaa tagctaa 1647
<210> 7
<211> 347
<212> PRT
<213> Artificial
<220>
<223> B. indica alcohol dehydrogenase
<400> 7
Met Lys Ala Leu Val Tyr Arg Gly Pro Gly Gln Lys Leu Val Glu Glu
1 5 10 15
Arg Gln Lys Pro Glu Leu Lys Glu Pro Gly Asp Ala Ile Val Lys Val
20 25 30
Thr Lys Thr Thr Ile Cys Gly Thr Asp Leu His Ile Leu Lys Gly Asp
35 40 45
Val Ala Thr Cys Lys Pro Gly Arg Val Leu Gly His Glu Gly Val Gly
50 55 60
Val Ile Glu Ser Val Gly Ser Gly Val Thr Ala Phe Gln Pro Gly Asp
65 70 75 80
Arg Val Leu Ile Ser Cys Ile Ser Ser Cys Gly Lys Cys Ser Phe Cys
85 90 95
Arg Arg Gly Met Phe Ser His Cys Thr Thr Gly Gly Trp Ile Leu Gly
100 105 110
Asn Glu Ile Asp Gly Thr Gln Ala Glu Tyr Val Arg Val Pro His Ala
115 120 125
Asp Thr Ser Leu Tyr Arg Ile Pro Ala Gly Ala Asp Glu Glu Ala Leu
130 135 140
Val Met Leu Ser Asp Ile Leu Pro Thr Gly Phe Glu Cys Gly Val Leu
145 150 155 160
Asn Gly Lys Val Ala Pro Gly Ser Ser Val Ala Ile Val Gly Ala Gly
165 170 175
Pro Val Gly Leu Ala Ala Leu Leu Thr Ala Gln Phe Tyr Ser Pro Ala
180 185 190
Glu Ile Ile Met Ile Asp Leu Asp Asp Asn Arg Leu Gly Leu Ala Lys
195 200 205
Gln Phe Gly Ala Thr Arg Thr Val Asn Ser Thr Gly Gly Asn Ala Ala
210 215 220
Ala Glu Val Lys Ala Leu Thr Glu Gly Leu Gly Val Asp Thr Ala Ile
225 230 235 240
Glu Ala Val Gly Ile Pro Ala Thr Phe Glu Leu Cys Gln Asn Ile Val
245 250 255
Ala Pro Gly Gly Thr Ile Ala Asn Val Gly Val His Gly Ser Lys Val
260 265 270
Asp Leu His Leu Glu Ser Leu Trp Ser His Asn Val Thr Ile Thr Thr
275 280 285
Arg Leu Val Asp Thr Ala Thr Thr Pro Met Leu Leu Lys Thr Val Gln
290 295 300
Ser His Lys Leu Asp Pro Ser Arg Leu Ile Thr His Arg Phe Ser Leu
305 310 315 320
Asp Gln Ile Leu Asp Ala Tyr Glu Thr Phe Gly Gln Ala Ala Ser Thr
325 330 335
Gln Ala Leu Lys Val Ile Ile Ser Met Glu Ala
340 345
<210> 8
<211> 348
<212> PRT
<213> Artificial
<220>
<223> Achromobacter xylosoxidans alcohol dehydrogenase
<400> 8
Met Lys Ala Leu Val Tyr His Gly Asp His Lys Ile Ser Leu Glu Asp
1 5 10 15
Lys Pro Lys Pro Thr Leu Gln Lys Pro Thr Asp Val Val Val Arg Val
20 25 30
Leu Lys Thr Thr Ile Cys Gly Thr Asp Leu Gly Ile Tyr Lys Gly Lys
35 40 45
Asn Pro Glu Val Ala Asp Gly Arg Ile Leu Gly His Glu Gly Val Gly
50 55 60
Val Ile Glu Glu Val Gly Glu Ser Val Thr Gln Phe Lys Lys Gly Asp
65 70 75 80
Lys Val Leu Ile Ser Cys Val Thr Ser Cys Gly Ser Cys Asp Tyr Cys
85 90 95
Lys Lys Gln Leu Tyr Ser His Cys Arg Asp Gly Gly Trp Ile Leu Gly
100 105 110
Tyr Met Ile Asp Gly Val Gln Ala Glu Tyr Val Arg Ile Pro His Ala
115 120 125
Asp Asn Ser Leu Tyr Lys Ile Pro Gln Thr Ile Asp Asp Glu Ile Ala
130 135 140
Val Leu Leu Ser Asp Ile Leu Pro Thr Gly His Glu Ile Gly Val Gln
145 150 155 160
Tyr Gly Asn Val Gln Pro Gly Asp Ala Val Ala Ile Val Gly Ala Gly
165 170 175
Pro Val Gly Met Ser Val Leu Leu Thr Ala Gln Phe Tyr Ser Pro Ser
180 185 190
Thr Ile Ile Val Ile Asp Met Asp Glu Asn Arg Leu Gln Leu Ala Lys
195 200 205
Glu Leu Gly Ala Thr His Thr Ile Asn Ser Gly Thr Glu Asn Val Val
210 215 220
Glu Ala Val His Arg Ile Ala Ala Glu Gly Val Asp Val Ala Ile Glu
225 230 235 240
Ala Val Gly Ile Pro Ala Thr Trp Asp Ile Cys Gln Glu Ile Val Lys
245 250 255
Pro Gly Ala His Ile Ala Asn Val Gly Val His Gly Val Lys Val Asp
260 265 270
Phe Glu Ile Gln Lys Leu Trp Ile Lys Asn Leu Thr Ile Thr Thr Gly
275 280 285
Leu Val Asn Thr Asn Thr Thr Pro Met Leu Met Lys Val Ala Ser Thr
290 295 300
Asp Lys Leu Pro Leu Lys Lys Met Ile Thr His Arg Phe Glu Leu Ala
305 310 315 320
Glu Ile Glu His Ala Tyr Gln Val Phe Leu Asn Gly Ala Lys Glu Lys
325 330 335
Ala Met Lys Ile Ile Leu Ser Asn Ala Gly Ala Ala
340 345
<210> 9
<211> 4519
<212> DNA
<213> Artificial
<220>
<223> pLA54
<400> 9
caccttggct aactcgttgt atcatcactg gataacttcg tataatgtat gctatacgaa 60
gttatcgaac agagaaacta aatccacatt aattgagagt tctatctatt agaaaatgca 120
aactccaact aaatgggaaa acagataacc tcttttattt ttttttaatg tttgatattc 180
gagtcttttt cttttgttag gtttatattc atcatttcaa tgaataaaag aagcttctta 240
ttttggttgc aaagaatgaa aaaaaaggat tttttcatac ttctaaagct tcaattataa 300
ccaaaaattt tataaatgaa gagaaaaaat ctagtagtat caagttaaac ttagaaaaac 360
tcatcgagca tcaaatgaaa ctgcaattta ttcatatcag gattatcaat accatatttt 420
tgaaaaagcc gtttctgtaa tgaaggagaa aactcaccga ggcagttcca taggatggca 480
agatcctggt atcggtctgc gattccgact cgtccaacat caatacaacc tattaatttc 540
ccctcgtcaa aaataaggtt atcaagtgag aaatcaccat gagtgacgac tgaatccggt 600
gagaatggca aaagcttatg catttctttc cagacttgtt caacaggcca gccattacgc 660
tcgtcatcaa aatcactcgc atcaaccaaa ccgttattca ttcgtgattg cgcctgagcg 720
agacgaaata cgcgatcgct gttaaaagga caattacaaa caggaatcga atgcaaccgg 780
cgcaggaaca ctgccagcgc atcaacaata ttttcacctg aatcaggata ttcttctaat 840
acctggaatg ctgttttgcc ggggatcgca gtggtgagta accatgcatc atcaggagta 900
cggataaaat gcttgatggt cggaagaggc ataaattccg tcagccagtt tagtctgacc 960
atctcatctg taacatcatt ggcaacgcta cctttgccat gtttcagaaa caactctggc 1020
gcatcgggct tcccatacaa tcgatagatt gtcgcacctg attgcccgac attatcgcga 1080
gcccatttat acccatataa atcagcatcc atgttggaat ttaatcgcgg cctcgaaacg 1140
tgagtctttt ccttacccat ctcgagtttt aatgttactt ctcttgcagt tagggaacta 1200
taatgtaact caaaataaga ttaaacaaac taaaataaaa agaagttata cagaaaaacc 1260
catataaacc agtactaatc cataataata atacacaaaa aaactatcaa ataaaaccag 1320
aaaacagatt gaatagaaaa attttttcga tctcctttta tattcaaaat tcgatatatg 1380
aaaaagggaa ctctcagaaa atcaccaaat caatttaatt agatttttct tttccttcta 1440
gcgttggaaa gaaaaatttt tctttttttt tttagaaatg aaaaattttt gccgtaggaa 1500
tcaccgtata aaccctgtat aaacgctact ctgttcacct gtgtaggcta tgattgaccc 1560
agtgttcatt gttattgcga gagagcggga gaaaagaacc gatacaagag atccatgctg 1620
gtatagttgt ctgtccaaca ctttgatgaa cttgtaggac gatgatgtgt atttagacga 1680
gtacgtgtgt gactattaag tagttatgat agagaggttt gtacggtgtg ttctgtgtaa 1740
ttcgattgag aaaatggtta tgaatcccta gataacttcg tataatgtat gctatacgaa 1800
gttatctgaa cattagaata cgtaatccgc aatgcgggga tcctctagag tcgacctgca 1860
ggcatgcaag cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc 1920
tcacaattcc acacaacata cgagccggaa gcataaagtg taaagcctgg ggtgcctaat 1980
gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc 2040
tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg 2100
ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag 2160
cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag 2220
gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc 2280
tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc 2340
agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc 2400
tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt 2460
cgggaagcgt ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg 2520
ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat 2580
ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag 2640
ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt 2700
ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct ctgctgaagc 2760
cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta 2820
gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag 2880
atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga 2940
ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa 3000
gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa 3060
tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc 3120
ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga 3180
taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa 3240
gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt 3300
gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg 3360
ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc 3420
aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg 3480
gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag 3540
cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt 3600
actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt 3660
caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac 3720
gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac 3780
ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag 3840
caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa 3900
tactcatact cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga 3960
gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc 4020
cccgaaaagt gccacctgac gtctaagaaa ccattattat catgacatta acctataaaa 4080
ataggcgtat cacgaggccc tttcgtctcg cgcgtttcgg tgatgacggt gaaaacctct 4140
gacacatgca gctcccggag acggtcacag cttgtctgta agcggatgcc gggagcagac 4200
aagcccgtca gggcgcgtca gcgggtgttg gcgggtgtcg gggctggctt aactatgcgg 4260
catcagagca gattgtactg agagtgcacc atatgcggtg tgaaataccg cacagatgcg 4320
taaggagaaa ataccgcatc aggcgccatt cgccattcag gctgcgcaac tgttgggaag 4380
ggcgatcggt gcgggcctct tcgctattac gccagctggc gaaaggggga tgtgctgcaa 4440
ggcgattaag ttgggtaacg ccagggtttt cccagtcacg acgttgtaaa acgacggcca 4500
gtgaattcga gctcggtac 4519
<210> 10
<211> 80
<212> DNA
<213> Artificial
<220>
<223> BK505
<400> 10
ttccggtttc tttgaaattt ttttgattcg gtaatctccg agcagaagga gcattgcgga 60
ttacgtattc taatgttcag 80
<210> 11
<211> 81
<212> DNA
<213> Artificial
<220>
<223> BK506
<400> 11
gggtaataac tgatataatt aaattgaagc tctaatttgt gagtttagta caccttggct 60
aactcgttgt atcatcactg g 81
<210> 12
<211> 38
<212> DNA
<213> Artificial
<220>
<223> LA468
<400> 12
gcctcgagtt ttaatgttac ttctcttgca gttaggga 38
<210> 13
<211> 31
<212> DNA
<213> Artificial
<220>
<223> LA492
<400> 13
gctaaattcg agtgaaacac aggaagacca g 31
<210> 14
<211> 23
<212> DNA
<213> Artificial
<220>
<223> AK109-1
<400> 14
agtcacatca agatcgttta tgg 23
<210> 15
<211> 23
<212> DNA
<213> Artificial
<220>
<223> AK109-2
<400> 15
gcacggaata tgggactact tcg 23
<210> 16
<211> 23
<212> DNA
<213> Artificial
<220>
<223> AK109-3
<400> 16
actccacttc aagtaagagt ttg 23
<210> 17
<211> 24
<212> DNA
<213> Artificial
<220>
<223> oBP452
<400> 17
ttctcgacgt gggccttttt cttg 24
<210> 18
<211> 49
<212> DNA
<213> Artificial
<220>
<223> oBP453
<400> 18
tgcagcttta aataatcggt gtcactactt tgccttcgtt tatcttgcc 49
<210> 19
<211> 49
<212> DNA
<213> Artificial
<220>
<223> oBP454
<400> 19
gagcaggcaa gataaacgaa ggcaaagtag tgacaccgat tatttaaag 49
<210> 20
<211> 49
<212> DNA
<213> Artificial
<220>
<223> oBP455
<400> 20
tatggaccct gaaaccacag ccacattgta accaccacga cggttgttg 49
<210> 21
<211> 49
<212> DNA
<213> Artificial
<220>
<223> oBP456
<400> 21
tttagcaaca accgtcgtgg tggttacaat gtggctgtgg tttcagggt 49
<210> 22
<211> 49
<212> DNA
<213> Artificial
<220>
<223> oBP457
<400> 22
ccagaaaccc tatacctgtg tggacgtaag gccatgaagc tttttcttt 49
<210> 23
<211> 49
<212> DNA
<213> Artificial
<220>
<223> oBP458
<400> 23
attggaaaga aaaagcttca tggccttacg tccacacagg tatagggtt 49
<210> 24
<211> 22
<212> DNA
<213> Artificial
<220>
<223> oBP459
<400> 24
cataagaaca cctttggtgg ag 22
<210> 25
<211> 22
<212> DNA
<213> Artificial
<220>
<223> BP460
<400> 25
aggattatca ttcataagtt tc 22
<210> 26
<211> 20
<212> DNA
<213> Artificial
<220>
<223> LA135
<400> 26
cttggcagca acaggactag 20
<210> 27
<211> 23
<212> DNA
<213> Artificial
<220>
<223> BP461
<400> 27
ttcttggagc tgggacatgt ttg 23
<210> 28
<211> 22
<212> DNA
<213> Artificial
<220>
<223> LA92
<400> 28
gagaagatgc ggccagcaaa ac 22
<210> 29
<211> 4242
<212> DNA
<213> Artificial
<220>
<223> pLA59
<400> 29
aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt ttgctcacat 60
gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgagtgagc 120
tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga 180
agagcgccca atacgcaaac cgcctctccc cgcgcgttgg ccgattcatt aatgcagctg 240
gcacgacagg tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta 300
gctcactcat taggcacccc aggctttaca ctttatgctt ccggctcgta tgttgtgtgg 360
aattgtgagc ggataacaat ttcacacagg aaacagctat gaccatgatt acgccaagct 420
tgcatgcctg caggtcgact ctagaggatc cgcaatgcgg atccgcattg cggattacgt 480
attctaatgt tcagtaccgt tcgtataatg tatgctatac gaagttatgc agattgtact 540
gagagtgcac cataccacct tttcaattca tcattttttt tttattcttt tttttgattt 600
cggtttcctt gaaatttttt tgattcggta atctccgaac agaaggaaga acgaaggaag 660
gagcacagac ttagattggt atatatacgc atatgtagtg ttgaagaaac atgaaattgc 720
ccagtattct taacccaact gcacagaaca aaaacctgca ggaaacgaag ataaatcatg 780
tcgaaagcta catataagga acgtgctgct actcatccta gtcctgttgc tgccaagcta 840
tttaatatca tgcacgaaaa gcaaacaaac ttgtgtgctt cattggatgt tcgtaccacc 900
aaggaattac tggagttagt tgaagcatta ggtcccaaaa tttgtttact aaaaacacat 960
gtggatatct tgactgattt ttccatggag ggcacagtta agccgctaaa ggcattatcc 1020
gccaagtaca attttttact cttcgaagac agaaaatttg ctgacattgg taatacagtc 1080
aaattgcagt actctgcggg tgtatacaga atagcagaat gggcagacat tacgaatgca 1140
cacggtgtgg tgggcccagg tattgttagc ggtttgaagc aggcggcaga agaagtaaca 1200
aaggaaccta gaggcctttt gatgttagca gaattgtcat gcaagggctc cctatctact 1260
ggagaatata ctaagggtac tgttgacatt gcgaagagcg acaaagattt tgttatcggc 1320
tttattgctc aaagagacat gggtggaaga gatgaaggtt acgattggtt gattatgaca 1380
cccggtgtgg gtttagatga caagggagac gcattgggtc aacagtatag aaccgtggat 1440
gatgtggtct ctacaggatc tgacattatt attgttggaa gaggactatt tgcaaaggga 1500
agggatgcta aggtagaggg tgaacgttac agaaaagcag gctgggaagc atatttgaga 1560
agatgcggcc agcaaaacta aaaaactgta ttataagtaa atgcatgtat actaaactca 1620
caaattagag cttcaattta attatatcag ttattaccct atgcggtgtg aaataccgca 1680
cagatgcgta aggagaaaat accgcatcag gaaattgtaa acgttaatat tttgttaaaa 1740
ttcgcgttaa atttttgtta aatcagctca ttttttaacc aataggccga aatcggcaaa 1800
atcccttata aatcaaaaga atagaccgag atagggttga gtgttgttcc agtttggaac 1860
aagagtccac tattaaagaa cgtggactcc aacgtcaaag ggcgaaaaac cgtctatcag 1920
ggcgatggcc cactacgtga accatcaccc taatcaagat aacttcgtat aatgtatgct 1980
atacgaacgg taccagtgat gatacaacga gttagccaag gtgaattcac tggccgtcgt 2040
tttacaacgt cgtgactggg aaaaccctgg cgttacccaa cttaatcgcc ttgcagcaca 2100
tccccctttc gccagctggc gtaatagcga agaggcccgc accgatcgcc cttcccaaca 2160
gttgcgcagc ctgaatggcg aatggcgcct gatgcggtat tttctcctta cgcatctgtg 2220
cggtatttca caccgcatat ggtgcactct cagtacaatc tgctctgatg ccgcatagtt 2280
aagccagccc cgacacccgc caacacccgc tgacgcgccc tgacgggctt gtctgctccc 2340
ggcatccgct tacagacaag ctgtgaccgt ctccgggagc tgcatgtgtc agaggttttc 2400
accgtcatca ccgaaacgcg cgagacgaaa gggcctcgtg atacgcctat ttttataggt 2460
taatgtcatg ataataatgg tttcttagac gtcaggtggc acttttcggg gaaatgtgcg 2520
cggaacccct atttgtttat ttttctaaat acattcaaat atgtatccgc tcatgagaca 2580
ataaccctga taaatgcttc aataatattg aaaaaggaag agtatgagta ttcaacattt 2640
ccgtgtcgcc cttattccct tttttgcggc attttgcctt cctgtttttg ctcacccaga 2700
aacgctggtg aaagtaaaag atgctgaaga tcagttgggt gcacgagtgg gttacatcga 2760
actggatctc aacagcggta agatccttga gagttttcgc cccgaagaac gttttccaat 2820
gatgagcact tttaaagttc tgctatgtgg cgcggtatta tcccgtattg acgccgggca 2880
agagcaactc ggtcgccgca tacactattc tcagaatgac ttggttgagt actcaccagt 2940
cacagaaaag catcttacgg atggcatgac agtaagagaa ttatgcagtg ctgccataac 3000
catgagtgat aacactgcgg ccaacttact tctgacaacg atcggaggac cgaaggagct 3060
aaccgctttt ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt gggaaccgga 3120
gctgaatgaa gccataccaa acgacgagcg tgacaccacg atgcctgtag caatggcaac 3180
aacgttgcgc aaactattaa ctggcgaact acttactcta gcttcccggc aacaattaat 3240
agactggatg gaggcggata aagttgcagg accacttctg cgctcggccc ttccggctgg 3300
ctggtttatt gctgataaat ctggagccgg tgagcgtggg tctcgcggta tcattgcagc 3360
actggggcca gatggtaagc cctcccgtat cgtagttatc tacacgacgg ggagtcaggc 3420
aactatggat gaacgaaata gacagatcgc tgagataggt gcctcactga ttaagcattg 3480
gtaactgtca gaccaagttt actcatatat actttagatt gatttaaaac ttcattttta 3540
atttaaaagg atctaggtga agatcctttt tgataatctc atgaccaaaa tcccttaacg 3600
tgagttttcg ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga 3660
tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt 3720
ggtttgtttg ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag 3780
agcgcagata ccaaatactg tccttctagt gtagccgtag ttaggccacc acttcaagaa 3840
ctctgtagca ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag 3900
tggcgataag tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca 3960
gcggtcgggc tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac 4020
cgaactgaga tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa 4080
ggcggacagg tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc 4140
agggggaaac gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg 4200
tcgatttttg tgatgctcgt caggggggcg gagcctatgg aa 4242
<210> 30
<211> 80
<212> DNA
<213> Artificial
<220>
<223> LA678
<400> 30
caacgttaac accgttttcg gtttgccagg tgacttcaac ttgtccttgt gcattgcgga 60
ttacgtattc taatgttcag 80
<210> 31
<211> 81
<212> DNA
<213> Artificial
<220>
<223> LA679
<400> 31
gtggagcatc gaagactggc aacatgattt caatcattct gatcttagag caccttggct 60
aactcgttgt atcatcactg g 81
<210> 32
<211> 23
<212> DNA
<213> Artificial
<220>
<223> LA337
<400> 32
ctcatttgaa tcagcttatg gtg 23
<210> 33
<211> 24
<212> DNA
<213> Artificial
<220>
<223> LA692
<400> 33
ggaagtcatt gacaccatct tggc 24
<210> 34
<211> 24
<212> DNA
<213> Artificial
<220>
<223> LA693
<400> 34
agaagctggg acagcagcgt tagc 24
<210> 35
<211> 7523
<212> DNA
<213> Artificial
<220>
<223> pLA34
<400> 35
ccagcttttg ttccctttag tgagggttaa ttgcgcgctt ggcgtaatca tggtcatagc 60
tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatagga gccggaagca 120
taaagtgtaa agcctggggt gcctaatgag tgaggtaact cacattaatt gcgttgcgct 180
cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac 240
gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc 300
tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt 360
tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg 420
ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg 480
agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 540
accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 600
ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct 660
gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc 720
ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 780
gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 840
taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag 900
tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 960
gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 1020
cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc 1080
agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca 1140
cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa 1200
cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat 1260
ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct 1320
taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt 1380
tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat 1440
ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta 1500
atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg 1560
gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt 1620
tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg 1680
cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg 1740
taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc 1800
ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa 1860
ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac 1920
cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt 1980
ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg 2040
gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa 2100
gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata 2160
aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgaacga agcatctgtg 2220
cttcattttg tagaacaaaa atgcaacgcg agagcgctaa tttttcaaac aaagaatctg 2280
agctgcattt ttacagaaca gaaatgcaac gcgaaagcgc tattttacca acgaagaatc 2340
tgtgcttcat ttttgtaaaa caaaaatgca acgcgagagc gctaattttt caaacaaaga 2400
atctgagctg catttttaca gaacagaaat gcaacgcgag agcgctattt taccaacaaa 2460
gaatctatac ttcttttttg ttctacaaaa atgcatcccg agagcgctat ttttctaaca 2520
aagcatctta gattactttt tttctccttt gtgcgctcta taatgcagtc tcttgataac 2580
tttttgcact gtaggtccgt taaggttaga agaaggctac tttggtgtct attttctctt 2640
ccataaaaaa agcctgactc cacttcccgc gtttactgat tactagcgaa gctgcgggtg 2700
cattttttca agataaaggc atccccgatt atattctata ccgatgtgga ttgcgcatac 2760
tttgtgaaca gaaagtgata gcgttgatga ttcttcattg gtcagaaaat tatgaacggt 2820
ttcttctatt ttgtctctat atactacgta taggaaatgt ttacattttc gtattgtttt 2880
cgattcactc tatgaatagt tcttactaca atttttttgt ctaaagagta atactagaga 2940
taaacataaa aaatgtagag gtcgagttta gatgcaagtt caaggagcga aaggtggatg 3000
ggtaggttat atagggatat agcacagaga tatatagcaa agagatactt ttgagcaatg 3060
tttgtggaag cggtattcgc aatattttag tagctcgtta cagtccggtg cgtttttggt 3120
tttttgaaag tgcgtcttca gagcgctttt ggttttcaaa agcgctctga agttcctata 3180
ctttctagag aataggaact tcggaatagg aacttcaaag cgtttccgaa aacgagcgct 3240
tccgaaaatg caacgcgagc tgcgcacata cagctcactg ttcacgtcgc acctatatct 3300
gcgtgttgcc tgtatatata tatacatgag aagaacggca tagtgcgtgt ttatgcttaa 3360
atgcgtactt atatgcgtct atttatgtag gatgaaaggt agtctagtac ctcctgtgat 3420
attatcccat tccatgcggg gtatcgtatg cttccttcag cactaccctt tagctgttct 3480
atatgctgcc actcctcaat tggattagtc tcatccttca atgctatcat ttcctttgat 3540
attggatcat ctaagaaacc attattatca tgacattaac ctataaaaat aggcgtatca 3600
cgaggccctt tcgtctcgcg cgtttcggtg atgacggtga aaacctctga cacatgcagc 3660
tcccggagac ggtcacagct tgtctgtaag cggatgccgg gagcagacaa gcccgtcagg 3720
gcgcgtcagc gggtgttggc gggtgtcggg gctggcttaa ctatgcggca tcagagcaga 3780
ttgtactgag agtgcaccat aaattcccgt tttaagagct tggtgagcgc taggagtcac 3840
tgccaggtat cgtttgaaca cggcattagt cagggaagtc ataacacagt cctttcccgc 3900
aattttcttt ttctattact cttggcctcc tctagtacac tctatatttt tttatgcctc 3960
ggtaatgatt ttcatttttt tttttcccct agcggatgac tctttttttt tcttagcgat 4020
tggcattatc acataatgaa ttatacatta tataaagtaa tgtgatttct tcgaagaata 4080
tactaaaaaa tgagcaggca agataaacga aggcaaagat gacagagcag aaagccctag 4140
taaagcgtat tacaaatgaa accaagattc agattgcgat ctctttaaag ggtggtcccc 4200
tagcgataga gcactcgatc ttcccagaaa aagaggcaga agcagtagca gaacaggcca 4260
cacaatcgca agtgattaac gtccacacag gtatagggtt tctggaccat atgatacatg 4320
ctctggccaa gcattccggc tggtcgctaa tcgttgagtg cattggtgac ttacacatag 4380
acgaccatca caccactgaa gactgcggga ttgctctcgg tcaagctttt aaagaggccc 4440
tactggcgcg tggagtaaaa aggtttggat caggatttgc gcctttggat gaggcacttt 4500
ccagagcggt ggtagatctt tcgaacaggc cgtacgcagt tgtcgaactt ggtttgcaaa 4560
gggagaaagt aggagatctc tcttgcgaga tgatcccgca ttttcttgaa agctttgcag 4620
aggctagcag aattaccctc cacgttgatt gtctgcgagg caagaatgat catcaccgta 4680
gtgagagtgc gttcaaggct cttgcggttg ccataagaga agccacctcg cccaatggta 4740
ccaacgatgt tccctccacc aaaggtgttc ttatgtagtg acaccgatta tttaaagctg 4800
cagcatacga tatatataca tgtgtatata tgtataccta tgaatgtcag taagtatgta 4860
tacgaacagt atgatactga agatgacaag gtaatgcatc attctatacg tgtcattctg 4920
aacgaggcgc gctttccttt tttctttttg ctttttcttt ttttttctct tgaactcgac 4980
ggatctatgc ggtgtgaaat accgcacaga tgcgtaagga gaaaataccg catcaggaaa 5040
ttgtaaacgt taatattttg ttaaaattcg cgttaaattt ttgttaaatc agctcatttt 5100
ttaaccaata ggccgaaatc ggcaaaatcc cttataaatc aaaagaatag accgagatag 5160
ggttgagtgt tgttccagtt tggaacaaga gtccactatt aaagaacgtg gactccaacg 5220
tcaaagggcg aaaaaccgtc tatcagggcg atggcccact acgtgaacca tcaccctaat 5280
caagtttttt ggggtcgagg tgccgtaaag cactaaatcg gaaccctaaa gggagccccc 5340
gatttagagc ttgacgggga aagccggcga acgtggcgag aaaggaaggg aagaaagcga 5400
aaggagcggg cgctagggcg ctggcaagtg tagcggtcac gctgcgcgta accaccacac 5460
ccgccgcgct taatgcgccg ctacagggcg cgtcgcgcca ttcgccattc aggctgcgca 5520
actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 5580
gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 5640
aaacgacggc cagtgagcgc gcgtaatacg actcactata gggcgaattg ggtaccgggc 5700
cccccctcga ggtattagaa gccgccgagc gggcgacagc cctccgacgg aagactctcc 5760
tccgtgcgtc ctcgtcttca ccggtcgcgt tcctgaaacg cagatgtgcc tcgcgccgca 5820
ctgctccgaa caataaagat tctacaatac tagcttttat ggttatgaag aggaaaaatt 5880
ggcagtaacc tggccccaca aaccttcaaa ttaacgaatc aaattaacaa ccataggatg 5940
ataatgcgat tagtttttta gccttatttc tggggtaatt aatcagcgaa gcgatgattt 6000
ttgatctatt aacagatata taaatggaaa agctgcataa ccactttaac taatactttc 6060
aacattttca gtttgtatta cttcttattc aaatgtcata aaagtatcaa caaaaaattg 6120
ttaatatacc tctatacttt aacgtcaagg agaaaaatgt ccaatttact gcccgtacac 6180
caaaatttgc ctgcattacc ggtcgatgca acgagtgatg aggttcgcaa gaacctgatg 6240
gacatgttca gggatcgcca ggcgttttct gagcatacct ggaaaatgct tctgtccgtt 6300
tgccggtcgt gggcggcatg gtgcaagttg aataaccgga aatggtttcc cgcagaacct 6360
gaagatgttc gcgattatct tctatatctt caggcgcgcg gtctggcagt aaaaactatc 6420
cagcaacatt tgggccagct aaacatgctt catcgtcggt ccgggctgcc acgaccaagt 6480
gacagcaatg ctgtttcact ggttatgcgg cggatccgaa aagaaaacgt tgatgccggt 6540
gaacgtgcaa aacaggctct agcgttcgaa cgcactgatt tcgaccaggt tcgttcactc 6600
atggaaaata gcgatcgctg ccaggatata cgtaatctgg catttctggg gattgcttat 6660
aacaccctgt tacgtatagc cgaaattgcc aggatcaggg ttaaagatat ctcacgtact 6720
gacggtggga gaatgttaat ccatattggc agaacgaaaa cgctggttag caccgcaggt 6780
gtagagaagg cacttagcct gggggtaact aaactggtcg agcgatggat ttccgtctct 6840
ggtgtagctg atgatccgaa taactacctg ttttgccggg tcagaaaaaa tggtgttgcc 6900
gcgccatctg ccaccagcca gctatcaact cgcgccctgg aagggatttt tgaagcaact 6960
catcgattga tttacggcgc taaggatgac tctggtcaga gatacctggc ctggtctgga 7020
cacagtgccc gtgtcggagc cgcgcgagat atggcccgcg ctggagtttc aataccggag 7080
atcatgcaag ctggtggctg gaccaatgta aatattgtca tgaactatat ccgtaacctg 7140
gatagtgaaa caggggcaat ggtgcgcctg ctggaagatg gcgattagga gtaagcgaat 7200
ttcttatgat ttatgatttt tattattaaa taagttataa aaaaaataag tgtatacaaa 7260
ttttaaagtg actcttaggt tttaaaacga aaattcttat tcttgagtaa ctctttcctg 7320
taggtcaggt tgctttctca ggtatagcat gaggtcgctc ttattgacca cacctctacc 7380
ggcatgccga gcaaatgcct gcaaatcgct ccccatttca cccaattgta gatatgctaa 7440
ctccagcaat gagttgatga atctcggtgt gtattttatg tcctcagagg acaacacctg 7500
tggtccgcca ccgcggtgga gct 7523
<210> 36
<211> 96
<212> DNA
<213> Artificial
<220>
<223> LA722
<400> 36
tgccaattat ttacctaaac atctataacc ttcaaaagta aaaaaataca caaacgttga 60
atcatcacct tggctaactc gttgtatcat cactgg 96
<210> 37
<211> 80
<212> DNA
<213> Artificial
<220>
<223> LA733
<400> 37
cataatcaat ctcaaagaga acaacacaat acaataacaa gaagaacaaa gcattgcgga 60
ttacgtattc taatgttcag 80
<210> 38
<211> 30
<212> DNA
<213> Artificial
<220>
<223> LA453
<400> 38
caccgaagaa gaatgcaaaa atttcagctc 30
<210> 39
<211> 25
<212> DNA
<213> Artificial
<220>
<223> LA694
<400> 39
gctgaagttg ttagaactgt tgttg 25
<210> 40
<211> 21
<212> DNA
<213> Artificial
<220>
<223> LA695
<400> 40
tgttagctgg agtagacttg g 21
<210> 41
<211> 22
<212> DNA
<213> Artificial
<220>
<223> oBP594
<400> 41
agctgtctcg tgttgtgggt tt 22
<210> 42
<211> 49
<212> DNA
<213> Artificial
<220>
<223> oBP595
<400> 42
cttaataata gaacaatatc atcctttacg ggcatcttat agtgtcgtt 49
<210> 43
<211> 49
<212> DNA
<213> Artificial
<220>
<223> oBP596
<400> 43
gcgccaacga cactataaga tgcccgtaaa ggatgatatt gttctatta 49
<210> 44
<211> 49
<212> DNA
<213> Artificial
<220>
<223> oBP597
<400> 44
tatggaccct gaaaccacag ccacattgca acgacgacaa tgccaaacc 49
<210> 45
<211> 49
<212> DNA
<213> Artificial
<220>
<223> oBP598
<400> 45
tccttggttt ggcattgtcg tcgttgcaat gtggctgtgg tttcagggt 49
<210> 46
<211> 49
<212> DNA
<213> Artificial
<220>
<223> oBP599
<400> 46
atcctctcgc ggagtccctg ttcagtaaag gccatgaagc tttttcttt 49
<210> 47
<211> 49
<212> DNA
<213> Artificial
<220>
<223> oBP600
<400> 47
attggaaaga aaaagcttca tggcctttac tgaacaggga ctccgcgag 49
<210> 48
<211> 22
<212> DNA
<213> Artificial
<220>
<223> oBP601
<400> 48
tcataccaca atcttagacc at 22
<210> 49
<211> 21
<212> DNA
<213> Artificial
<220>
<223> oBP602
<400> 49
tgttcaaacc cctaaccaac c 21
<210> 50
<211> 22
<212> DNA
<213> Artificial
<220>
<223> oBP603
<400> 50
tgttcccaca atctattacc ta 22
<210> 51
<211> 31
<212> DNA
<213> Artificial
<220>
<223> LA811
<400> 51
aacgaagcat ctgtgcttca ttttgtagaa c 31
<210> 52
<211> 59
<212> DNA
<213> Artificial
<220>
<223> LA817
<400> 52
cgatccactt gtatatttgg atgaattttt gaggaattct gaaccagtcc taaaacgag 59
<210> 53
<211> 31
<212> DNA
<213> Artificial
<220>
<223> LA812
<400> 53
aacaaagata tgctattgaa gtgcaagatg g 31
<210> 54
<211> 33
<212> DNA
<213> Artificial
<220>
<223> LA818
<400> 54
ctcaaaaatt catccaaata tacaagtgga tcg 33
<210> 55
<211> 90
<212> DNA
<213> Artificial
<220>
<223> LA512
<400> 55
gtattttggt agattcaatt ctctttccct ttccttttcc ttcgctcccc ttccttatca 60
gcattgcgga ttacgtattc taatgttcag 90
<210> 56
<211> 90
<212> DNA
<213> Artificial
<220>
<223> LA513
<400> 56
ttggttgggg gaaaaagagg caacaggaaa gatcagaggg ggaggggggg ggagagtgtc 60
accttggcta actcgttgta tcatcactgg 90
<210> 57
<211> 29
<212> DNA
<213> Artificial
<220>
<223> LA516
<400> 57
ctcgaaacaa taagacgacg atggctctg 29
<210> 58
<211> 30
<212> DNA
<213> Artificial
<220>
<223> LA514
<400> 58
cactatctgg tgcaaacttg gcaccggaag 30
<210> 59
<211> 29
<212> DNA
<213> Artificial
<220>
<223> LA515
<400> 59
tgtttgtagc cactcgtgaa cttctctgc 29
<210> 60
<211> 6903
<212> DNA
<213> Artificial
<220>
<223> pLA71
<400> 60
aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt ttgctcacat 60
gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgagtgagc 120
tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga 180
agagcgccca atacgcaaac cgcctctccc cgcgcgttgg ccgattcatt aatgcagctg 240
gcacgacagg tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta 300
gctcactcat taggcacccc aggctttaca ctttatgctt ccggctcgta tgttgtgtgg 360
aattgtgagc ggataacaat ttcacacagg aaacagctat gaccatgatt acgccaagct 420
tgcatgcgat ctgaaatgaa taacaatact gacagtagat ctgaaatgaa taacaatact 480
gacagtacta aataattgcc tacttggctt cacatacgtt gcatacgtcg atatagataa 540
taatgataat gacagcagga ttatcgtaat acgtaatagt tgaaaatctc aaaaatgtgt 600
gggtcattac gtaaataatg ataggaatgg gattcttcta tttttccttt ttccattcta 660
gcagccgtcg ggaaaacgtg gcatcctctc tttcgggctc aattggagtc acgctgccgt 720
gagcatcctc tctttccata tctaacaact gagcacgtaa ccaatggaaa agcatgagct 780
tagcgttgct ccaaaaaagt attggatggt taataccatt tgtctgttct cttctgactt 840
tgactcctca aaaaaaaaaa atctacaatc aacagatcgc ttcaattacg ccctcacaaa 900
aacttttttc cttcttcttc gcccacgtta aattttatcc ctcatgttgt ctaacggatt 960
tctgcacttg atttattata aaaagacaaa gacataatac ttctctatca atttcagtta 1020
ttgttcttcc ttgcgttatt cttctgttct tctttttctt ttgtcatata taaccataac 1080
caagtaatac atattcaaat ctagagctga ggatgttgac aaaagcaaca aaagaacaaa 1140
aatcccttgt gaaaaacaga ggggcggagc ttgttgttga ttgcttagtg gagcaaggtg 1200
tcacacatgt atttggcatt ccaggtgcaa aaattgatgc ggtatttgac gctttacaag 1260
ataaaggacc tgaaattatc gttgcccggc acgaacaaaa cgcagcattc atggcccaag 1320
cagtcggccg tttaactgga aaaccgggag tcgtgttagt cacatcagga ccgggtgcct 1380
ctaacttggc aacaggcctg ctgacagcga acactgaagg agaccctgtc gttgcgcttg 1440
ctggaaacgt gatccgtgca gatcgtttaa aacggacaca tcaatctttg gataatgcgg 1500
cgctattcca gccgattaca aaatacagtg tagaagttca agatgtaaaa aatataccgg 1560
aagctgttac aaatgcattt aggatagcgt cagcagggca ggctggggcc gcttttgtga 1620
gctttccgca agatgttgtg aatgaagtca caaatacgaa aaacgtgcgt gctgttgcag 1680
cgccaaaact cggtcctgca gcagatgatg caatcagtgc ggccatagca aaaatccaaa 1740
cagcaaaact tcctgtcgtt ttggtcggca tgaaaggcgg aagaccggaa gcaattaaag 1800
cggttcgcaa gcttttgaaa aaggttcagc ttccatttgt tgaaacatat caagctgccg 1860
gtaccctttc tagagattta gaggatcaat attttggccg tatcggtttg ttccgcaacc 1920
agcctggcga tttactgcta gagcaggcag atgttgttct gacgatcggc tatgacccga 1980
ttgaatatga tccgaaattc tggaatatca atggagaccg gacaattatc catttagacg 2040
agattatcgc tgacattgat catgcttacc agcctgatct tgaattgatc ggtgacattc 2100
cgtccacgat caatcatatc gaacacgatg ctgtgaaagt ggaatttgca gagcgtgagc 2160
agaaaatcct ttctgattta aaacaatata tgcatgaagg tgagcaggtg cctgcagatt 2220
ggaaatcaga cagagcgcac cctcttgaaa tcgttaaaga gttgcgtaat gcagtcgatg 2280
atcatgttac agtaacttgc gatatcggtt cgcacgccat ttggatgtca cgttatttcc 2340
gcagctacga gccgttaaca ttaatgatca gtaacggtat gcaaacactc ggcgttgcgc 2400
ttccttgggc aatcggcgct tcattggtga aaccgggaga aaaagtggtt tctgtctctg 2460
gtgacggcgg tttcttattc tcagcaatgg aattagagac agcagttcga ctaaaagcac 2520
caattgtaca cattgtatgg aacgacagca catatgacat ggttgcattc cagcaattga 2580
aaaaatataa ccgtacatct gcggtcgatt tcggaaatat cgatatcgtg aaatatgcgg 2640
aaagcttcgg agcaactggc ttgcgcgtag aatcaccaga ccagctggca gatgttctgc 2700
gtcaaggcat gaacgctgaa ggtcctgtca tcatcgatgt cccggttgac tacagtgata 2760
acattaattt agcaagtgac aagcttccga aagaattcgg ggaactcatg aaaacgaaag 2820
ctctctagtt aattaatcat gtaattagtt atgtcacgct tacattcacg ccctcccccc 2880
acatccgctc taaccgaaaa ggaaggagtt agacaacctg aagtctaggt ccctatttat 2940
ttttttatag ttatgttagt attaagaacg ttatttatat ttcaaatttt tctttttttt 3000
ctgtacagac gcgtgtacgc atgtaacatt atactgaaaa ccttgcttga gaaggttttg 3060
ggacgctcga aggctttaat ttaggttttg ggacgctcga aggctttaat ttggatccgc 3120
attgcggatt acgtattcta atgttcagta ccgttcgtat aatgtatgct atacgaagtt 3180
atgcagattg tactgagagt gcaccatacc acagcttttc aattcaattc atcatttttt 3240
ttttattctt ttttttgatt tcggtttctt tgaaattttt ttgattcggt aatctccgaa 3300
cagaaggaag aacgaaggaa ggagcacaga cttagattgg tatatatacg catatgtagt 3360
gttgaagaaa catgaaattg cccagtattc ttaacccaac tgcacagaac aaaaacctgc 3420
aggaaacgaa gataaatcat gtcgaaagct acatataagg aacgtgctgc tactcatcct 3480
agtcctgttg ctgccaagct atttaatatc atgcacgaaa agcaaacaaa cttgtgtgct 3540
tcattggatg ttcgtaccac caaggaatta ctggagttag ttgaagcatt aggtcccaaa 3600
atttgtttac taaaaacaca tgtggatatc ttgactgatt tttccatgga gggcacagtt 3660
aagccgctaa aggcattatc cgccaagtac aattttttac tcttcgaaga cagaaaattt 3720
gctgacattg gtaatacagt caaattgcag tactctgcgg gtgtatacag aatagcagaa 3780
tgggcagaca ttacgaatgc acacggtgtg gtgggcccag gtattgttag cggtttgaag 3840
caggcggcag aagaagtaac aaaggaacct agaggccttt tgatgttagc agaattgtca 3900
tgcaagggct ccctatctac tggagaatat actaagggta ctgttgacat tgcgaagagc 3960
gacaaagatt ttgttatcgg ctttattgct caaagagaca tgggtggaag agatgaaggt 4020
tacgattggt tgattatgac acccggtgtg ggtttagatg acaagggaga cgcattgggt 4080
caacagtata gaaccgtgga tgatgtggtc tctacaggat ctgacattat tattgttgga 4140
agaggactat ttgcaaaggg aagggatgct aaggtagagg gtgaacgtta cagaaaagca 4200
ggctgggaag catatttgag aagatgcggc cagcaaaact aaaaaactgt attataagta 4260
aatgcatgta tactaaactc acaaattaga gcttcaattt aattatatca gttattaccc 4320
tatgcggtgt gaaataccgc acagatgcgt aaggagaaaa taccgcatca ggaaattgta 4380
aacgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc attttttaac 4440
caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga gatagggttg 4500
agtgttgttc cagtttggaa caagagtcca ctattaaaga acgtggactc caacgtcaaa 4560
gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg aaccatcacc ctaatcaaga 4620
taacttcgta taatgtatgc tatacgaacg gtaccagtga tgatacaacg agttagccaa 4680
ggtgaattca ctggccgtcg ttttacaacg tcgtgactgg gaaaaccctg gcgttaccca 4740
acttaatcgc cttgcagcac atcccccttt cgccagctgg cgtaatagcg aagaggcccg 4800
caccgatcgc ccttcccaac agttgcgcag cctgaatggc gaatggcgcc tgatgcggta 4860
ttttctcctt acgcatctgt gcggtatttc acaccgcata tggtgcactc tcagtacaat 4920
ctgctctgat gccgcatagt taagccagcc ccgacacccg ccaacacccg ctgacgcgcc 4980
ctgacgggct tgtctgctcc cggcatccgc ttacagacaa gctgtgaccg tctccgggag 5040
ctgcatgtgt cagaggtttt caccgtcatc accgaaacgc gcgagacgaa agggcctcgt 5100
gatacgccta tttttatagg ttaatgtcat gataataatg gtttcttaga cgtcaggtgg 5160
cacttttcgg ggaaatgtgc gcggaacccc tatttgttta tttttctaaa tacattcaaa 5220
tatgtatccg ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa 5280
gagtatgagt attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct 5340
tcctgttttt gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg 5400
tgcacgagtg ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg 5460
ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt 5520
atcccgtatt gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga 5580
cttggttgag tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga 5640
attatgcagt gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac 5700
gatcggagga ccgaaggagc taaccgcttt tttgcacaac atgggggatc atgtaactcg 5760
ccttgatcgt tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac 5820
gatgcctgta gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct 5880
agcttcccgg caacaattaa tagactggat ggaggcggat aaagttgcag gaccacttct 5940
gcgctcggcc cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg 6000
gtctcgcggt atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat 6060
ctacacgacg gggagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg 6120
tgcctcactg attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat 6180
tgatttaaaa cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct 6240
catgaccaaa atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa 6300
gatcaaagga tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa 6360
aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc 6420
gaaggtaact ggcttcagca gagcgcagat accaaatact gtccttctag tgtagccgta 6480
gttaggccac cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct 6540
gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg 6600
atagttaccg gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag 6660
cttggagcga acgacctaca ccgaactgag atacctacag cgtgagctat gagaaagcgc 6720
cacgcttccc gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg 6780
agagcgcacg agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt 6840
tcgccacctc tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg 6900
gaa 6903
<210> 61
<211> 96
<212> DNA
<213> Artificial
<220>
<223> LA829
<400> 61
ccaaatttac aatatctcct gaattcttgg cttggaatat gggcagtaca gcttgtgtga 60
tattgcacct tggctaactc gttgtatcat cactgg 96
<210> 62
<211> 90
<212> DNA
<213> Artificial
<220>
<223> LA834
<400> 62
atgtcccaag gtagaaaagc tgcagaaaga ttggctaaga agactgtcct cattacaggt 60
gatctgaaat gaataacaat actgacagta 90
<210> 63
<211> 29
<212> DNA
<213> Artificial
<220>
<223> N1257
<400> 63
gatgatgcta tttggtgcag agggtgatg 29
<210> 64
<211> 29
<212> DNA
<213> Artificial
<220>
<223> LA830
<400> 64
cacggcaaac ttagaggcac aatagatag 29
<210> 65
<211> 6924
<212> DNA
<213> Artificial
<220>
<223> pLA78
<400> 65
gatccgcatt gcggattacg tattctaatg ttcagtaccg ttcgtataat gtatgctata 60
cgaagttatg cagattgtac tgagagtgca ccataccacc ttttcaattc atcatttttt 120
ttttattctt ttttttgatt tcggtttcct tgaaattttt ttgattcggt aatctccgaa 180
cagaaggaag aacgaaggaa ggagcacaga cttagattgg tatatatacg catatgtagt 240
gttgaagaaa catgaaattg cccagtattc ttaacccaac tgcacagaac aaaaacctgc 300
aggaaacgaa gataaatcat gtcgaaagct acatataagg aacgtgctgc tactcatcct 360
agtcctgttg ctgccaagct atttaatatc atgcacgaaa agcaaacaaa cttgtgtgct 420
tcattggatg ttcgtaccac caaggaatta ctggagttag ttgaagcatt aggtcccaaa 480
atttgtttac taaaaacaca tgtggatatc ttgactgatt tttccatgga gggcacagtt 540
aagccgctaa aggcattatc cgccaagtac aattttttac tcttcgaaga cagaaaattt 600
gctgacattg gtaatacagt caaattgcag tactctgcgg gtgtatacag aatagcagaa 660
tgggcagaca ttacgaatgc acacggtgtg gtgggcccag gtattgttag cggtttgaag 720
caggcggcag aagaagtaac aaaggaacct agaggccttt tgatgttagc agaattgtca 780
tgcaagggct ccctatctac tggagaatat actaagggta ctgttgacat tgcgaagagc 840
gacaaagatt ttgttatcgg ctttattgct caaagagaca tgggtggaag agatgaaggt 900
tacgattggt tgattatgac acccggtgtg ggtttagatg acaagggaga cgcattgggt 960
caacagtata gaaccgtgga tgatgtggtc tctacaggat ctgacattat tattgttgga 1020
agaggactat ttgcaaaggg aagggatgct aaggtagagg gtgaacgtta cagaaaagca 1080
ggctgggaag catatttgag aagatgcggc cagcaaaact aaaaaactgt attataagta 1140
aatgcatgta tactaaactc acaaattaga gcttcaattt aattatatca gttattaccc 1200
tatgcggtgt gaaataccgc acagatgcgt aaggagaaaa taccgcatca ggaaattgta 1260
aacgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc attttttaac 1320
caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga gatagggttg 1380
agtgttgttc cagtttggaa caagagtcca ctattaaaga acgtggactc caacgtcaaa 1440
gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg aaccatcacc ctaatcaaga 1500
taacttcgta taatgtatgc tatacgaacg gtaccagtga tgatacaacg agttagccaa 1560
ggtgaattca ctggccgtcg ttttacaacg tcgtgactgg gaaaaccctg gcgttaccca 1620
acttaatcgc cttgcagcac atcccccttt cgccagctgg cgtaatagcg aagaggcccg 1680
caccgatcgc ccttcccaac agttgcgcag cctgaatggc gaatggcgcc tgatgcggta 1740
ttttctcctt acgcatctgt gcggtatttc acaccgcata tggtgcactc tcagtacaat 1800
ctgctctgat gccgcatagt taagccagcc ccgacacccg ccaacacccg ctgacgcgcc 1860
ctgacgggct tgtctgctcc cggcatccgc ttacagacaa gctgtgaccg tctccgggag 1920
ctgcatgtgt cagaggtttt caccgtcatc accgaaacgc gcgagacgaa agggcctcgt 1980
gatacgccta tttttatagg ttaatgtcat gataataatg gtttcttaga cgtcaggtgg 2040
cacttttcgg ggaaatgtgc gcggaacccc tatttgttta tttttctaaa tacattcaaa 2100
tatgtatccg ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa 2160
gagtatgagt attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct 2220
tcctgttttt gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg 2280
tgcacgagtg ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg 2340
ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt 2400
atcccgtatt gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga 2460
cttggttgag tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga 2520
attatgcagt gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac 2580
gatcggagga ccgaaggagc taaccgcttt tttgcacaac atgggggatc atgtaactcg 2640
ccttgatcgt tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac 2700
gatgcctgta gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct 2760
agcttcccgg caacaattaa tagactggat ggaggcggat aaagttgcag gaccacttct 2820
gcgctcggcc cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg 2880
gtctcgcggt atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat 2940
ctacacgacg gggagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg 3000
tgcctcactg attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat 3060
tgatttaaaa cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct 3120
catgaccaaa atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa 3180
gatcaaagga tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa 3240
aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc 3300
gaaggtaact ggcttcagca gagcgcagat accaaatact gtccttctag tgtagccgta 3360
gttaggccac cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct 3420
gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg 3480
atagttaccg gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag 3540
cttggagcga acgacctaca ccgaactgag atacctacag cgtgagctat gagaaagcgc 3600
cacgcttccc gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg 3660
agagcgcacg agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt 3720
tcgccacctc tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg 3780
gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca 3840
catgttcttt cctgcgttat cccctgattc tgtggataac cgtattaccg cctttgagtg 3900
agctgatacc gctcgccgca gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc 3960
ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt tggccgattc attaatgcag 4020
ctggcacgac aggtttcccg actggaaagc gggcagtgag cgcaacgcaa ttaatgtgag 4080
ttagctcact cattaggcac cccaggcttt acactttatg cttccggctc gtatgttgtg 4140
tggaattgtg agcggataac aatttcacac aggaaacagc tatgaccatg attacgccaa 4200
gcttccaatt accgtcgctc gtgatttgtt tgcaaaaaga acaaaactga aaaaacccag 4260
acacgctcga cttcctgtct tcctattgat tgcagcttcc aatttcgtca cacaacaagg 4320
tcctgtcgac gcctacttgg cttcacatac gttgcatacg tcgatataga taataatgat 4380
aatgacagca ggattatcgt aatacgtaat agttgaaaat ctcaaaaatg tgtgggtcat 4440
tacgtaaata atgataggaa tgggattctt ctatttttcc tttttccatt ctagcagccg 4500
tcgggaaaac gtggcatcct ctctttcggg ctcaattgga gtcacgctgc cgtgagcatc 4560
ctctctttcc atatctaaca actgagcacg taaccaatgg aaaagcatga gcttagcgtt 4620
gctccaaaaa agtattggat ggttaatacc atttgtctgt tctcttctga ctttgactcc 4680
tcaaaaaaaa aaaatctaca atcaacagat cgcttcaatt acgccctcac aaaaactttt 4740
ttccttcttc ttcgcccacg ttaaatttta tccctcatgt tgtctaacgg atttctgcac 4800
ttgatttatt ataaaaagac aaagacataa tacttctcta tcaatttcag ttattgttct 4860
tccttgcgtt attcttctgt tcttcttttt cttttgtcat atataaccat aaccaagtaa 4920
tacatattca agtttaaaca tgtataccgt aggacagtac ttggtagata gactagaaga 4980
gattggtatc gataaggttt tcggtgtgcc aggggattac aatttgactt ttctagatta 5040
cattcaaaat cacgaaggac tttcctggca agggaatact aatgaactaa acgcagcata 5100
tgcagcagat ggctacgccc gtgaaagagg cgtatcagct cttgttacta cattcggagt 5160
gggtgaactg tcagccatta acggaacagc tggtagtttt gcagaacaag tccctgtcat 5220
ccacatcgtg ggttctccaa ctatgaatgt gcaatccaac aaaaagctgg ttcatcattc 5280
cttaggaatg ggtaactttc ataactttag tgaaatggct aaggaagtca ctgccgctac 5340
aaccatgctt actgaagaga atgcagcttc agagatcgac agagtattag aaacagcctt 5400
gttggaaaag aggccagtat acatcaatct tccaattgat atagctcata aagcaatagt 5460
taaacctgca aaagcactac aaacagagaa atcatctggt gagagagagg cacaacttgc 5520
agaaatcata ctatcacact tagaaaaggc cgctcaacct atcgtaatcg ccggtcatga 5580
gatcgcccgt ttccagataa gagaaagatt tgaaaactgg ataaaccaaa caaagttgcc 5640
agtaaccaat ttggcatatg gcaaaggctc tttcaatgaa gagaacgaac atttcattgg 5700
tacctattac ccagcttttt ctgacaaaaa cgttctggat tacgttgaca atagtgactt 5760
cgttttacat tttggtggga aaatcattga caattctacc tcctcatttt ctcaaggctt 5820
taagactgaa aacactttaa ccgctgcaaa tgacatcatt atgctgccag atgggtctac 5880
ttactctggg atttctctta acggtctttt ggcagagctg gaaaaactaa actttacttt 5940
tgctgatact gctgctaaac aagctgaatt agctgttttc gaaccacagg ccgaaacacc 6000
actaaagcaa gacagatttc accaagctgt tatgaacttt ttgcaagctg atgatgtgtt 6060
ggtcactgag caggggacat catctttcgg tttgatgttg gcacctctga aaaagggtat 6120
gaatttgatc agtcaaacat tatggggctc cataggatac acattacctg ctatgattgg 6180
ttcacaaatt gctgccccag aaaggagaca cattctatcc atcggtgatg gatcttttca 6240
actgacagca caggaaatgt ccaccatctt cagagagaaa ttgacaccag tgatattcat 6300
tatcaataac gatggctata cagtcgaaag agccatccat ggagaggatg agagttacaa 6360
tgatatacca acttggaact tgcaattagt tgctgaaaca tttggtggtg atgccgaaac 6420
tgtcgacact cacaacgttt tcacagaaac agacttcgct aatactttag ctgctatcga 6480
tgctactcct caaaaagcac atgtcgttga agttcatatg gaacaaatgg atatgccaga 6540
atcattgaga cagattggct tagccttatc taagcaaaac tcttaagttt aaactaagcg 6600
aatttcttat gatttatgat ttttattatt aaataagtta taaaaaaaat aagtgtatac 6660
aaattttaaa gtgactctta ggttttaaaa cgaaaattct tattcttgag taactctttc 6720
ctgtaggtca ggttgctttc tcaggtatag catgaggtcg ctcttattga ccacacctct 6780
accggcatgc cgagcaaatg cctgcaaatc gctccccatt tcacccaatt gtagatatgc 6840
taactccagc aatgagttga tgaatctcgg tgtgtatttt atgtcctcag aggacaacac 6900
ctgttgtaat cgttcttcca cacg 6924
<210> 66
<211> 92
<212> DNA
<213> Artificial
<220>
<223> LA850
<400> 66
atgactaagc tacactttga cactgctgaa ccagtcaaga tcacacttcc aaatggtttg 60
acataaatta ccgtcgctcg tgatttgttt gc 92
<210> 67
<211> 94
<212> DNA
<213> Artificial
<220>
<223> LA851
<400> 67
ttacaactta attctgacag cttttacttc agtgtatgca tggtagactt cttcacccat 60
ttccaccttg gctaactcgt tgtatcatca ctgg 94
<210> 68
<211> 24
<212> DNA
<213> Artificial
<220>
<223> N1262
<400> 68
cacgtaaggg catgatagaa ttgg 24
<210> 69
<211> 22
<212> DNA
<213> Artificial
<220>
<223> LA740
<400> 69
cgataatcct gctgtcatta tc 22
<210> 70
<211> 26
<212> DNA
<213> Artificial
<220>
<223> N1263
<400> 70
ggatatagca gttgttgtac actagc 26
<210> 71
<211> 6761
<212> DNA
<213> Artificial
<220>
<223> pLA65
<400> 71
gatccgcatt gcggattacg tattctaatg ttcagtaccg ttcgtataat gtatgctata 60
cgaagttatg cagattgtac tgagagtgca ccataccacc ttttcaattc atcatttttt 120
ttttattctt ttttttgatt tcggtttcct tgaaattttt ttgattcggt aatctccgaa 180
cagaaggaag aacgaaggaa ggagcacaga cttagattgg tatatatacg catatgtagt 240
gttgaagaaa catgaaattg cccagtattc ttaacccaac tgcacagaac aaaaacctgc 300
aggaaacgaa gataaatcat gtcgaaagct acatataagg aacgtgctgc tactcatcct 360
agtcctgttg ctgccaagct atttaatatc atgcacgaaa agcaaacaaa cttgtgtgct 420
tcattggatg ttcgtaccac caaggaatta ctggagttag ttgaagcatt aggtcccaaa 480
atttgtttac taaaaacaca tgtggatatc ttgactgatt tttccatgga gggcacagtt 540
aagccgctaa aggcattatc cgccaagtac aattttttac tcttcgaaga cagaaaattt 600
gctgacattg gtaatacagt caaattgcag tactctgcgg gtgtatacag aatagcagaa 660
tgggcagaca ttacgaatgc acacggtgtg gtgggcccag gtattgttag cggtttgaag 720
caggcggcag aagaagtaac aaaggaacct agaggccttt tgatgttagc agaattgtca 780
tgcaagggct ccctatctac tggagaatat actaagggta ctgttgacat tgcgaagagc 840
gacaaagatt ttgttatcgg ctttattgct caaagagaca tgggtggaag agatgaaggt 900
tacgattggt tgattatgac acccggtgtg ggtttagatg acaagggaga cgcattgggt 960
caacagtata gaaccgtgga tgatgtggtc tctacaggat ctgacattat tattgttgga 1020
agaggactat ttgcaaaggg aagggatgct aaggtagagg gtgaacgtta cagaaaagca 1080
ggctgggaag catatttgag aagatgcggc cagcaaaact aaaaaactgt attataagta 1140
aatgcatgta tactaaactc acaaattaga gcttcaattt aattatatca gttattaccc 1200
tatgcggtgt gaaataccgc acagatgcgt aaggagaaaa taccgcatca ggaaattgta 1260
aacgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc attttttaac 1320
caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga gatagggttg 1380
agtgttgttc cagtttggaa caagagtcca ctattaaaga acgtggactc caacgtcaaa 1440
gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg aaccatcacc ctaatcaaga 1500
taacttcgta taatgtatgc tatacgaacg gtaccagtga tgatacaacg agttagccaa 1560
ggtgaattca ctggccgtcg ttttacaacg tcgtgactgg gaaaaccctg gcgttaccca 1620
acttaatcgc cttgcagcac atcccccttt cgccagctgg cgtaatagcg aagaggcccg 1680
caccgatcgc ccttcccaac agttgcgcag cctgaatggc gaatggcgcc tgatgcggta 1740
ttttctcctt acgcatctgt gcggtatttc acaccgcata tggtgcactc tcagtacaat 1800
ctgctctgat gccgcatagt taagccagcc ccgacacccg ccaacacccg ctgacgcgcc 1860
ctgacgggct tgtctgctcc cggcatccgc ttacagacaa gctgtgaccg tctccgggag 1920
ctgcatgtgt cagaggtttt caccgtcatc accgaaacgc gcgagacgaa agggcctcgt 1980
gatacgccta tttttatagg ttaatgtcat gataataatg gtttcttaga cgtcaggtgg 2040
cacttttcgg ggaaatgtgc gcggaacccc tatttgttta tttttctaaa tacattcaaa 2100
tatgtatccg ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa 2160
gagtatgagt attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct 2220
tcctgttttt gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg 2280
tgcacgagtg ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg 2340
ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt 2400
atcccgtatt gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga 2460
cttggttgag tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga 2520
attatgcagt gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac 2580
gatcggagga ccgaaggagc taaccgcttt tttgcacaac atgggggatc atgtaactcg 2640
ccttgatcgt tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac 2700
gatgcctgta gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct 2760
agcttcccgg caacaattaa tagactggat ggaggcggat aaagttgcag gaccacttct 2820
gcgctcggcc cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg 2880
gtctcgcggt atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat 2940
ctacacgacg gggagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg 3000
tgcctcactg attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat 3060
tgatttaaaa cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct 3120
catgaccaaa atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa 3180
gatcaaagga tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa 3240
aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc 3300
gaaggtaact ggcttcagca gagcgcagat accaaatact gtccttctag tgtagccgta 3360
gttaggccac cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct 3420
gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg 3480
atagttaccg gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag 3540
cttggagcga acgacctaca ccgaactgag atacctacag cgtgagctat gagaaagcgc 3600
cacgcttccc gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg 3660
agagcgcacg agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt 3720
tcgccacctc tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg 3780
gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca 3840
catgttcttt cctgcgttat cccctgattc tgtggataac cgtattaccg cctttgagtg 3900
agctgatacc gctcgccgca gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc 3960
ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt tggccgattc attaatgcag 4020
ctggcacgac aggtttcccg actggaaagc gggcagtgag cgcaacgcaa ttaatgtgag 4080
ttagctcact cattaggcac cccaggcttt acactttatg cttccggctc gtatgttgtg 4140
tggaattgtg agcggataac aatttcacac aggaaacagc tatgaccatg attacgccaa 4200
gcttacctgg taaaacctct agtggagtag tagatgtaat caatgaagcg gaagccaaaa 4260
gaccagagta gaggcctata gaagaaactg cgataccttt tgtgatggct aaacaaacag 4320
acatcttttt atatgttttt acttctgtat atcgtgaagt agtaagtgat aagcgaattt 4380
ggctaagaac gttgtaagtg aacaagggac ctcttttgcc tttcaaaaaa ggattaaatg 4440
gagttaatca ttgagattta gttttcgtta gattctgtat ccctaaataa ctcccttacc 4500
cgacgggaag gcacaaaaga cttgaataat agcaaacggc cagtagccaa gaccaaataa 4560
tactagagtt aactgatggt cttaaacagg cattacgtgg tgaactccaa gaccaatata 4620
caaaatatcg ataagttatt cttgcccacc aatttaagga gcctacatca ggacagtagt 4680
accattcctc agagaagagg tatacataac aagaaaatcg cgtgaacacc ttatataact 4740
tagcccgtta ttgagctaaa aaaccttgca aaatttccta tgaataagaa tacttcagac 4800
gtgataaaaa tttactttct aactcttctc acgctgcccc tatctgttct tccgctctac 4860
cgtgagaaat aaagcatcga gtacggcagt tcgctgtcac tgaactaaaa caataaggct 4920
agttcgaatg atgaacttgc ttgctgtcaa acttctgagt tgccgctgat gtgacactgt 4980
gacaataaat tcaaaccggt tatagcggtc tcctccggta ccggttctgc cacctccaat 5040
agagctcagt aggagtcaga acctctgcgg tggctgtcag tgactcatcc gcgtttcgta 5100
agttgtgcgc gtgcacattt cgcccgttcc cgctcatctt gcagcaggcg gaaattttca 5160
tcacgctgta ggacgcaaaa aaaaaataat taatcgtaca agaatcttgg aaaaaaaatt 5220
gaaaaatttt gtataaaagg gatgacctaa cttgactcaa tggcttttac acccagtatt 5280
ttccctttcc ttgtttgtta caattataga agcaagacaa aaacatatag acaacctatt 5340
cctaggagtt atattttttt accctaccag caatataagt aaaaaactgt ttatgaaagc 5400
attagtgtat aggggcccag gccagaagtt ggtggaagag agacagaagc cagagcttaa 5460
ggaacctggt gacgctatag tgaaggtaac aaagactaca atttgcggaa ccgatctaca 5520
cattcttaaa ggtgacgttg cgacttgtaa acccggtcgt gtattagggc atgaaggagt 5580
gggggttatt gaatcagtcg gatctggggt tactgctttc caaccaggcg atagagtttt 5640
gatatcatgt atatcgagtt gcggaaagtg ctcattttgt agaagaggaa tgttcagtca 5700
ctgtacgacc gggggttgga ttctgggcaa cgaaattgat ggtacccaag cagagtacgt 5760
aagagtacca catgctgaca catcccttta tcgtattccg gcaggtgcgg atgaagaggc 5820
cttagtcatg ttatcagata ttctaccaac gggttttgag tgcggagtcc taaacggcaa 5880
agtcgcacct ggttcttcgg tggctatagt aggtgctggt cccgttggtt tggccgcctt 5940
actgacagca caattctact ccccagctga aatcataatg atcgatcttg atgataacag 6000
gctgggatta gccaaacaat ttggtgccac cagaacagta aactccacgg gtggtaacgc 6060
cgcagccgaa gtgaaagctc ttactgaagg cttaggtgtt gatactgcga ttgaagcagt 6120
tgggatacct gctacatttg aattgtgtca gaatatcgta gctcccggtg gaactatcgc 6180
taatgtcggc gttcacggta gcaaagttga tttgcatctt gaaagtttat ggtcccataa 6240
tgtcacgatt actacaaggt tggttgacac ggctaccacc ccgatgttac tgaaaactgt 6300
tcaaagtcac aagctagatc catctagatt gataacacat agattcagcc tggaccagat 6360
cttggacgca tatgaaactt ttggccaagc tgcgtctact caagcactaa aagtcatcat 6420
ttcgatggag gcttgattaa ttaagagtaa gcgaatttct tatgatttat gatttttatt 6480
attaaataag ttataaaaaa aataagtgta tacaaatttt aaagtgactc ttaggtttta 6540
aaacgaaaat tcttattctt gagtaactct ttcctgtagg tcaggttgct ttctcaggta 6600
tagcatgagg tcgctcttat tgaccacacc tctaccggca tgccgagcaa atgcctgcaa 6660
atcgctcccc atttcaccca attgtagata tgctaactcc agcaatgagt tgatgaatct 6720
cggtgtgtat tttatgtcct cagaggacaa cacctgtggt g 6761
<210> 72
<211> 80
<212> DNA
<213> Artificial
<220>
<223> LA855
<400> 72
gcacaatatt tcaagctata ccaagcatac aatcaactat ctcatataca acctggtaaa 60
acctctagtg gagtagtaga 80
<210> 73
<211> 83
<212> DNA
<213> Artificial
<220>
<223> LA856
<400> 73
gcttatttag aagtgtcaac aacgtatcta ccaacgattt gacccttttc cacaccttgg 60
ctaactcgtt gtatcatcac tgg 83
<210> 74
<211> 25
<212> DNA
<213> Artificial
<220>
<223> LA414
<400> 74
ccagagctga tgaggggtat ctcga 25
<210> 75
<211> 25
<212> DNA
<213> Artificial
<220>
<223> LA749
<400> 75
caagtctttt gtgccttccc gtcgg 25
<210> 76
<211> 25
<212> DNA
<213> Artificial
<220>
<223> LA413
<400> 76
ggacataaaa tacacaccga gattc 25
<210> 77
<211> 90
<212> DNA
<213> Artificial
<220>
<223> LA860
<400> 77
tctcaattat tattttctac tcataacctc acgcaaaata acacagtcaa atcaatcaaa 60
atgaaagcat tagtgtatag gggcccaggc 90
<210> 78
<211> 26
<212> DNA
<213> Artificial
<220>
<223> N1093
<400> 78
tttcaagatg caaatcaact ttgcta 26
<210> 79
<211> 20
<212> DNA
<213> Artificial
<220>
<223> LA681
<400> 79
ttattgctta gcgttggtag 20
<210> 80
<211> 9613
<212> DNA
<213> Artificial
<220>
<223> pHR81-ILV5p-K9SB2
<400> 80
aaacagtatg gaagaatgta agatggctaa gatttactac caagaagact gtaacttgtc 60
cttgttggat ggtaagacta tcgccgttat cggttacggt tctcaaggtc acgctcatgc 120
cctgaatgct aaggaatccg gttgtaacgt tatcattggt ttattcgaag gtgcggagga 180
gtggaaaaga gctgaagaac aaggtttcga agtctacacc gctgctgaag ctgctaagaa 240
ggctgacatc attatgatct tgatcccaga tgaaaagcag gctaccatgt acaaaaacga 300
catcgaacca aacttggaag ccggtaacat gttgatgttc gctcacggtt tcaacatcca 360
tttcggttgt attgttccac caaaggacgt tgatgtcact atgatcgctc caaagggtcc 420
aggtcacacc gttagatccg aatacgaaga aggtaaaggt gtcccatgct tggttgctgt 480
cgaacaagac gctactggca aggctttgga tatggctttg gcctacgctt tagccatcgg 540
tggtgctaga gccggtgtct tggaaactac cttcagaacc gaaactgaaa ccgacttgtt 600
cggtgaacaa gctgttttat gtggtggtgt ctgcgctttg atgcaggccg gttttgaaac 660
cttggttgaa gccggttacg acccaagaaa cgcttacttc gaatgtatcc acgaaatgaa 720
gttgatcgtt gacttgatct accaatctgg tttctccggt atgcgttact ctatctccaa 780
cactgctgaa tacggtgact acattaccgg tccaaagatc attactgaag ataccaagaa 840
ggctatgaag aagattttgt ctgacattca agatggtacc tttgccaagg acttcttggt 900
tgacatgtct gatgctggtt cccaggtcca cttcaaggct atgagaaagt tggcctccga 960
acacccagct gaagttgtcg gtgaagaaat tagatccttg tactcctggt ccgacgaaga 1020
caagttgatt aacaactgag gccctgcagg ccagaggaaa ataatatcaa gtgctggaaa 1080
ctttttctct tggaattttt gcaacatcaa gtcatagtca attgaattga cccaatttca 1140
catttaagat tttttttttt tcatccgaca tacatctgta cactaggaag ccctgttttt 1200
ctgaagcagc ttcaaatata tatatttttt acatatttat tatgattcaa tgaacaatct 1260
aattaaatcg aaaacaagaa ccgaaacgcg aataaataat ttatttagat ggtgacaagt 1320
gtataagtcc tcatcgggac agctacgatt tctctttcgg ttttggctga gctactggtt 1380
gctgtgacgc agcggcatta gcgcggcgtt atgagctacc ctcgtggcct gaaagatggc 1440
gggaataaag cggaactaaa aattactgac tgagccatat tgaggtcaat ttgtcaactc 1500
gtcaagtcac gtttggtgga cggccccttt ccaacgaatc gtatatacta acatgcgcgc 1560
gcttcctata tacacatata catatatata tatatatata tgtgtgcgtg tatgtgtaca 1620
cctgtattta atttccttac tcgcgggttt ttcttttttc tcaattcttg gcttcctctt 1680
tctcgagcgg accggatcct ccgcggtgcc ggcagatcta tttaaatggc gcgccgacgt 1740
caggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac 1800
attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa 1860
aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat 1920
tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc 1980
agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga 2040
gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg 2100
cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc 2160
agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag 2220
taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc 2280
tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg 2340
taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg 2400
acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac 2460
ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac 2520
cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg 2580
agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg 2640
tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg 2700
agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac tcatatatac 2760
tttagattga tttaaaactt catttttaat ttaaaaggat ctaggtgaag atcctttttg 2820
ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg 2880
tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc 2940
aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc 3000
tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtt cttctagtgt 3060
agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc 3120
taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact 3180
caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac 3240
agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt gagctatgag 3300
aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg 3360
gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg 3420
tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga 3480
gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt 3540
ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct 3600
ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg 3660
aggaagcgga agagcgccca atacgcaaac cgcctctccc cgcgcgttgg ccgattcatt 3720
aatgcagctg gcacgacagg tttcccgact ggaaagcggg cagtgagcgc aacgcaatta 3780
atgtgagtta gctcactcat taggcacccc aggctttaca ctttatgctt ccggctcgta 3840
tgttgtgtgg aattgtgagc ggataacaat ttcacacagg aaacagctat gaccatgatt 3900
acgccaagct ttttctttcc aatttttttt ttttcgtcat tataaaaatc attacgaccg 3960
agattcccgg gtaataactg atataattaa attgaagctc taatttgtga gtttagtata 4020
catgcattta cttataatac agttttttag ttttgctggc cgcatcttct caaatatgct 4080
tcccagcctg cttttctgta acgttcaccc tctaccttag catcccttcc ctttgcaaat 4140
agtcctcttc caacaataat aatgtcagat cctgtagaga ccacatcatc cacggttcta 4200
tactgttgac ccaatgcgtc tcccttgtca tctaaaccca caccgggtgt cataatcaac 4260
caatcgtaac cttcatctct tccacccatg tctctttgag caataaagcc gataacaaaa 4320
tctttgtcgc tcttcgcaat gtcaacagta cccttagtat attctccagt agatagggag 4380
cccttgcatg acaattctgc taacatcaaa aggcctctag gttcctttgt tacttcttct 4440
gccgcctgct tcaaaccgct aacaatacct gggcccacca caccgtgtgc attcgtaatg 4500
tctgcccatt ctgctattct gtatacaccc gcagagtact gcaatttgac tgtattacca 4560
atgtcagcaa attttctgtc ttcgaagagt aaaaaattgt acttggcgga taatgccttt 4620
agcggcttaa ctgtgccctc catggaaaaa tcagtcaaga tatccacatg tgtttttagt 4680
aaacaaattt tgggacctaa tgcttcaact aactccagta attccttggt ggtacgaaca 4740
tccaatgaag cacacaagtt tgtttgcttt tcgtgcatga tattaaatag cttggcagca 4800
acaggactag gatgagtagc agcacgttcc ttatatgtag ctttcgacat gatttatctt 4860
cgtttcctgc aggtttttgt tctgtgcagt tgggttaaga atactgggca atttcatgtt 4920
tcttcaacac tacatatgcg tatatatacc aatctaagtc tgtgctcctt ccttcgttct 4980
tccttctgtt cggagattac cgaatcaaaa aaatttcaag gaaaccgaaa tcaaaaaaaa 5040
gaataaaaaa aaaatgatga attgaaaagc ttgcatgcct gcaggtcgac tctagtatac 5100
tccgtctact gtacgataca cttccgctca ggtccttgtc ctttaacgag gccttaccac 5160
tcttttgtta ctctattgat ccagctcagc aaaggcagtg tgatctaaga ttctatcttc 5220
gcgatgtagt aaaactagct agaccgagaa agagactaga aatgcaaaag gcacttctac 5280
aatggctgcc atcattatta tccgatgtga cgctgcattt tttttttttt tttttttttt 5340
tttttttttt tttttttttt tttttttttg tacaaatatc ataaaaaaag agaatctttt 5400
taagcaagga ttttcttaac ttcttcggcg acagcatcac cgacttcggt ggtactgttg 5460
gaaccaccta aatcaccagt tctgatacct gcatccaaaa cctttttaac tgcatcttca 5520
atggctttac cttcttcagg caagttcaat gacaatttca acatcattgc agcagacaag 5580
atagtggcga tagggttgac cttattcttt ggcaaatctg gagcggaacc atggcatggt 5640
tcgtacaaac caaatgcggt gttcttgtct ggcaaagagg ccaaggacgc agatggcaac 5700
aaacccaagg agcctgggat aacggaggct tcatcggaga tgatatcacc aaacatgttg 5760
ctggtgatta taataccatt taggtgggtt gggttcttaa ctaggatcat ggcggcagaa 5820
tcaatcaatt gatgttgaac tttcaatgta gggaattcgt tcttgatggt ttcctccaca 5880
gtttttctcc ataatcttga agaggccaaa acattagctt tatccaagga ccaaataggc 5940
aatggtggct catgttgtag ggccatgaaa gcggccattc ttgtgattct ttgcacttct 6000
ggaacggtgt attgttcact atcccaagcg acaccatcac catcgtcttc ctttctctta 6060
ccaaagtaaa tacctcccac taattctcta acaacaacga agtcagtacc tttagcaaat 6120
tgtggcttga ttggagataa gtctaaaaga gagtcggatg caaagttaca tggtcttaag 6180
ttggcgtaca attgaagttc tttacggatt tttagtaaac cttgttcagg tctaacacta 6240
ccggtacccc atttaggacc acccacagca cctaacaaaa cggcatcagc cttcttggag 6300
gcttccagcg cctcatctgg aagtggaaca cctgtagcat cgatagcagc accaccaatt 6360
aaatgatttt cgaaatcgaa cttgacattg gaacgaacat cagaaatagc tttaagaacc 6420
ttaatggctt cggctgtgat ttcttgacca acgtggtcac ctggcaaaac gacgatcttc 6480
ttaggggcag acattacaat ggtatatcct tgaaatatat ataaaaaaaa aaaaaaaaaa 6540
aaaaaaaaaa aatgcagctt ctcaatgata ttcgaatacg ctttgaggag atacagccta 6600
atatccgaca aactgtttta cagatttacg atcgtacttg ttacccatca ttgaattttg 6660
aacatccgaa cctgggagtt ttccctgaaa cagatagtat atttgaacct gtataataat 6720
atatagtcta gcgctttacg gaagacaatg tatgtatttc ggttcctgga gaaactattg 6780
catctattgc ataggtaatc ttgcacgtcg catccccggt tcattttctg cgtttccatc 6840
ttgcacttca atagcatatc tttgttaacg aagcatctgt gcttcatttt gtagaacaaa 6900
aatgcaacgc gagagcgcta atttttcaaa caaagaatct gagctgcatt tttacagaac 6960
agaaatgcaa cgcgaaagcg ctattttacc aacgaagaat ctgtgcttca tttttgtaaa 7020
acaaaaatgc aacgcgagag cgctaatttt tcaaacaaag aatctgagct gcatttttac 7080
agaacagaaa tgcaacgcga gagcgctatt ttaccaacaa agaatctata cttctttttt 7140
gttctacaaa aatgcatccc gagagcgcta tttttctaac aaagcatctt agattacttt 7200
ttttctcctt tgtgcgctct ataatgcagt ctcttgataa ctttttgcac tgtaggtccg 7260
ttaaggttag aagaaggcta ctttggtgtc tattttctct tccataaaaa aagcctgact 7320
ccacttcccg cgtttactga ttactagcga agctgcgggt gcattttttc aagataaagg 7380
catccccgat tatattctat accgatgtgg attgcgcata ctttgtgaac agaaagtgat 7440
agcgttgatg attcttcatt ggtcagaaaa ttatgaacgg tttcttctat tttgtctcta 7500
tatactacgt ataggaaatg tttacatttt cgtattgttt tcgattcact ctatgaatag 7560
ttcttactac aatttttttg tctaaagagt aatactagag ataaacataa aaaatgtaga 7620
ggtcgagttt agatgcaagt tcaaggagcg aaaggtggat gggtaggtta tatagggata 7680
tagcacagag atatatagca aagagatact tttgagcaat gtttgtggaa gcggtattcg 7740
caatatttta gtagctcgtt acagtccggt gcgtttttgg ttttttgaaa gtgcgtcttc 7800
agagcgcttt tggttttcaa aagcgctctg aagttcctat actttctaga gaataggaac 7860
ttcggaatag gaacttcaaa gcgtttccga aaacgagcgc ttccgaaaat gcaacgcgag 7920
ctgcgcacat acagctcact gttcacgtcg cacctatatc tgcgtgttgc ctgtatatat 7980
atatacatga gaagaacggc atagtgcgtg tttatgctta aatgcgtact tatatgcgtc 8040
tatttatgta ggatgaaagg tagtctagta cctcctgtga tattatccca ttccatgcgg 8100
ggtatcgtat gcttccttca gcactaccct ttagctgttc tatatgctgc cactcctcaa 8160
ttggattagt ctcatccttc aatgctatca tttcctttga tattggatca tatgcatagt 8220
accgagaaac tagaggatct cccattaccg acatttgggc gctatacgtg catatgttca 8280
tgtatgtatc tgtatttaaa acacttttgt attatttttc ctcatatatg tgtataggtt 8340
tatacggatg atttaattat tacttcacca ccctttattt caggctgata tcttagcctt 8400
gttactagtc accggtggcg gccgcacctg gtaaaacctc tagtggagta gtagatgtaa 8460
tcaatgaagc ggaagccaaa agaccagagt agaggcctat agaagaaact gcgatacctt 8520
ttgtgatggc taaacaaaca gacatctttt tatatgtttt tacttctgta tatcgtgaag 8580
tagtaagtga taagcgaatt tggctaagaa cgttgtaagt gaacaaggga cctcttttgc 8640
ctttcaaaaa aggattaaat ggagttaatc attgagattt agttttcgtt agattctgta 8700
tccctaaata actcccttac ccgacgggaa ggcacaaaag acttgaataa tagcaaacgg 8760
ccagtagcca agaccaaata atactagagt taactgatgg tcttaaacag gcattacgtg 8820
gtgaactcca agaccaatat acaaaatatc gataagttat tcttgcccac caatttaagg 8880
agcctacatc aggacagtag taccattcct cagagaagag gtatacataa caagaaaatc 8940
gcgtgaacac cttatataac ttagcccgtt attgagctaa aaaaccttgc aaaatttcct 9000
atgaataaga atacttcaga cgtgataaaa atttactttc taactcttct cacgctgccc 9060
ctatctgttc ttccgctcta ccgtgagaaa taaagcatcg agtacggcag ttcgctgtca 9120
ctgaactaaa acaataaggc tagttcgaat gatgaacttg cttgctgtca aacttctgag 9180
ttgccgctga tgtgacactg tgacaataaa ttcaaaccgg ttatagcggt ctcctccggt 9240
accggttctg ccacctccaa tagagctcag taggagtcag aacctctgcg gtggctgtca 9300
gtgactcatc cgcgtttcgt aagttgtgcg cgtgcacatt tcgcccgttc ccgctcatct 9360
tgcagcaggc ggaaattttc atcacgctgt aggacgcaaa aaaaaaataa ttaatcgtac 9420
aagaatcttg gaaaaaaaat tgaaaaattt tgtataaaag ggatgaccta acttgactca 9480
atggctttta cacccagtat tttccctttc cttgtttgtt acaattatag aagcaagaca 9540
aaaacatata gacaacctat tcctaggagt tatatttttt taccctacca gcaatataag 9600
taaaaaactg ttt 9613
<210> 81
<211> 7938
<212> DNA
<213> Artificial
<220>
<223> pYZ067DkivDDhADH
<400> 81
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accataaatt cccgttttaa gagcttggtg agcgctagga gtcactgcca ggtatcgttt 240
gaacacggca ttagtcaggg aagtcataac acagtccttt cccgcaattt tctttttcta 300
ttactcttgg cctcctctag tacactctat atttttttat gcctcggtaa tgattttcat 360
tttttttttt ccacctagcg gatgactctt tttttttctt agcgattggc attatcacat 420
aatgaattat acattatata aagtaatgtg atttcttcga agaatatact aaaaaatgag 480
caggcaagat aaacgaaggc aaagatgaca gagcagaaag ccctagtaaa gcgtattaca 540
aatgaaacca agattcagat tgcgatctct ttaaagggtg gtcccctagc gatagagcac 600
tcgatcttcc cagaaaaaga ggcagaagca gtagcagaac aggccacaca atcgcaagtg 660
attaacgtcc acacaggtat agggtttctg gaccatatga tacatgctct ggccaagcat 720
tccggctggt cgctaatcgt tgagtgcatt ggtgacttac acatagacga ccatcacacc 780
actgaagact gcgggattgc tctcggtcaa gcttttaaag aggccctagg ggccgtgcgt 840
ggagtaaaaa ggtttggatc aggatttgcg cctttggatg aggcactttc cagagcggtg 900
gtagatcttt cgaacaggcc gtacgcagtt gtcgaacttg gtttgcaaag ggagaaagta 960
ggagatctct cttgcgagat gatcccgcat tttcttgaaa gctttgcaga ggctagcaga 1020
attaccctcc acgttgattg tctgcgaggc aagaatgatc atcaccgtag tgagagtgcg 1080
ttcaaggctc ttgcggttgc cataagagaa gccacctcgc ccaatggtac caacgatgtt 1140
ccctccacca aaggtgttct tatgtagtga caccgattat ttaaagctgc agcatacgat 1200
atatatacat gtgtatatat gtatacctat gaatgtcagt aagtatgtat acgaacagta 1260
tgatactgaa gatgacaagg taatgcatca ttctatacgt gtcattctga acgaggcgcg 1320
ctttcctttt ttctttttgc tttttctttt tttttctctt gaactcgacg gatctatgcg 1380
gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggaaat tgtaagcgtt 1440
aatattttgt taaaattcgc gttaaatttt tgttaaatca gctcattttt taaccaatag 1500
gccgaaatcg gcaaaatccc ttataaatca aaagaataga ccgagatagg gttgagtgtt 1560
gttccagttt ggaacaagag tccactatta aagaacgtgg actccaacgt caaagggcga 1620
aaaaccgtct atcagggcga tggcccacta cgtggccggc ttcacatacg ttgcatacgt 1680
cgatatagat aataatgata atgacagcag gattatcgta atacgtaata gctgaaaatc 1740
tcaaaaatgt gtgggtcatt acgtaaataa tgataggaat gggattcttc tatttttcct 1800
ttttccattc tagcagccgt cgggaaaacg tggcatcctc tctttcgggc tcaattggag 1860
tcacgctgcc gtgagcatcc tctctttcca tatctaacaa ctgagcacgt aaccaatgga 1920
aaagcatgag cttagcgttg ctccaaaaaa gtattggatg gttaatacca tttgtctgtt 1980
ctcttctgac tttgactcct caaaaaaaaa aatctacaat caacagatcg cttcaattac 2040
gccctcacaa aaactttttt ccttcttctt cgcccacgtt aaattttatc cctcatgttg 2100
tctaacggat ttctgcactt gatttattat aaaaagacaa agacataata cttctctatc 2160
aatttcagtt attgttcttc cttgcgttat tcttctgttc ttctttttct tttgtcatat 2220
ataaccataa ccaagtaata catattcaaa cacgtgagta tgactgacaa aaaaactctt 2280
aaagacttaa gaaatcgtag ttctgtttac gattcaatgg ttaaatcacc taatcgtgct 2340
atgttgcgtg caactggtat gcaagatgaa gactttgaaa aacctatcgt cggtgtcatt 2400
tcaacttggg ctgaaaacac accttgtaat atccacttac atgactttgg taaactagcc 2460
aaagtcggtg ttaaggaagc tggtgcttgg ccagttcagt tcggaacaat cacggtttct 2520
gatggaatcg ccatgggaac ccaaggaatg cgtttctcct tgacatctcg tgatattatt 2580
gcagattcta ttgaagcagc catgggaggt cataatgcgg atgcttttgt agccattggc 2640
ggttgtgata aaaacatgcc cggttctgtt atcgctatgg ctaacatgga tatcccagcc 2700
atttttgctt acggcggaac aattgcacct ggtaatttag acggcaaaga tatcgattta 2760
gtctctgtct ttgaaggtgt cggccattgg aaccacggcg atatgaccaa agaagaagtt 2820
aaagctttgg aatgtaatgc ttgtcccggt cctggaggct gcggtggtat gtatactgct 2880
aacacaatgg cgacagctat tgaagttttg ggacttagcc ttccgggttc atcttctcac 2940
ccggctgaat ccgcagaaaa gaaagcagat attgaagaag ctggtcgcgc tgttgtcaaa 3000
atgctcgaaa tgggcttaaa accttctgac attttaacgc gtgaagcttt tgaagatgct 3060
attactgtaa ctatggctct gggaggttca accaactcaa cccttcacct cttagctatt 3120
gcccatgctg ctaatgtgga attgacactt gatgatttca atactttcca agaaaaagtt 3180
cctcatttgg ctgatttgaa accttctggt caatatgtat tccaagacct ttacaaggtc 3240
ggaggggtac cagcagttat gaaatatctc cttaaaaatg gcttccttca tggtgaccgt 3300
atcacttgta ctggcaaaac agtcgctgaa aatttgaagg cttttgatga tttaacacct 3360
ggtcaaaagg ttattatgcc gcttgaaaat cctaaacgtg aagatggtcc gctcattatt 3420
ctccatggta acttggctcc agacggtgcc gttgccaaag tttctggtgt aaaagtgcgt 3480
cgtcatgtcg gtcctgctaa ggtctttaat tctgaagaag aagccattga agctgtcttg 3540
aatgatgata ttgttgatgg tgatgttgtt gtcgtacgtt ttgtaggacc aaagggcggt 3600
cctggtatgc ctgaaatgct ttccctttca tcaatgattg ttggtaaagg gcaaggtgaa 3660
aaagttgccc ttctgacaga tggccgcttc tcaggtggta cttatggtct tgtcgtgggt 3720
catatcgctc ctgaagcaca agatggcggt ccaatcgcct acctgcaaac aggagacata 3780
gtcactattg accaagacac taaggaatta cactttgata tctccgatga agagttaaaa 3840
catcgtcaag agaccattga attgccaccg ctctattcac gcggtatcct tggtaaatat 3900
gctcacatcg tttcgtctgc ttctagggga gccgtaacag acttttggaa gcctgaagaa 3960
actggcaaaa aatgttgtcc tggttgctgt ggttaagcgg ccgcgttaat tcaaattaat 4020
tgatatagtt ttttaatgag tattgaatct gtttagaaat aatggaatat tatttttatt 4080
tatttattta tattattggt cggctctttt cttctgaagg tcaatgacaa aatgatatga 4140
aggaaataat gatttctaaa attttacaac gtaagatatt tttacaaaag cctagctcat 4200
cttttgtcat gcactatttt actcacgctt gaaattaacg gccagtccac tgcggagtca 4260
tttcaaagtc atcctaatcg atctatcgtt tttgatagct cattttggag ttcgcgagga 4320
tcccagcttt tgttcccttt agtgagggtt aattgcgcgc ttggcgtaat catggtcata 4380
gctgtttcct gtgtgaaatt gttatccgct cacaattcca cacaacatac gagccggaag 4440
cataaagtgt aaagcctggg gtgcctaatg agtgagctaa ctcacattaa ttgcgttgcg 4500
ctcactgccc gctttccagt cgggaaacct gtcgtgccag ctgcattaat gaatcggcca 4560
acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc 4620
gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg 4680
gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa 4740
ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga 4800
cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag 4860
ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct 4920
taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc atagctcacg 4980
ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc 5040
ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt 5100
aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta 5160
tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaagaac 5220
agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc 5280
ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat 5340
tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc 5400
tcagtggaac gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt 5460
cacctagatc cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta 5520
aacttggtct gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct 5580
atttcgttca tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg 5640
cttaccatct ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga 5700
tttatcagca ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt 5760
atccgcctcc atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt 5820
taatagtttg cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt 5880
tggtatggct tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat 5940
gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc 6000
cgcagtgtta tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc 6060
cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat 6120
gcggcgaccg agttgctctt gcccggcgtc aatacgggat aataccgcgc cacatagcag 6180
aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt 6240
accgctgttg agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc 6300
ttttactttc accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa 6360
gggaataagg gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg 6420
aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa 6480
taaacaaata ggggttccgc gcacatttcc ccgaaaagtg ccacctgaac gaagcatctg 6540
tgcttcattt tgtagaacaa aaatgcaacg cgagagcgct aatttttcaa acaaagaatc 6600
tgagctgcat ttttacagaa cagaaatgca acgcgaaagc gctattttac caacgaagaa 6660
tctgtgcttc atttttgtaa aacaaaaatg caacgcgaga gcgctaattt ttcaaacaaa 6720
gaatctgagc tgcattttta cagaacagaa atgcaacgcg agagcgctat tttaccaaca 6780
aagaatctat acttcttttt tgttctacaa aaatgcatcc cgagagcgct atttttctaa 6840
caaagcatct tagattactt tttttctcct ttgtgcgctc tataatgcag tctcttgata 6900
actttttgca ctgtaggtcc gttaaggtta gaagaaggct actttggtgt ctattttctc 6960
ttccataaaa aaagcctgac tccacttccc gcgtttactg attactagcg aagctgcggg 7020
tgcatttttt caagataaag gcatccccga ttatattcta taccgatgtg gattgcgcat 7080
actttgtgaa cagaaagtga tagcgttgat gattcttcat tggtcagaaa attatgaacg 7140
gtttcttcta ttttgtctct atatactacg tataggaaat gtttacattt tcgtattgtt 7200
ttcgattcac tctatgaata gttcttacta caattttttt gtctaaagag taatactaga 7260
gataaacata aaaaatgtag aggtcgagtt tagatgcaag ttcaaggagc gaaaggtgga 7320
tgggtaggtt atatagggat atagcacaga gatatatagc aaagagatac ttttgagcaa 7380
tgtttgtgga agcggtattc gcaatatttt agtagctcgt tacagtccgg tgcgtttttg 7440
gttttttgaa agtgcgtctt cagagcgctt ttggttttca aaagcgctct gaagttccta 7500
tactttctag agaataggaa cttcggaata ggaacttcaa agcgtttccg aaaacgagcg 7560
cttccgaaaa tgcaacgcga gctgcgcaca tacagctcac tgttcacgtc gcacctatat 7620
ctgcgtgttg cctgtatata tatatacatg agaagaacgg catagtgcgt gtttatgctt 7680
aaatgcgtac ttatatgcgt ctatttatgt aggatgaaag gtagtctagt acctcctgtg 7740
atattatccc attccatgcg gggtatcgta tgcttccttc agcactaccc tttagctgtt 7800
ctatatgctg ccactcctca attggattag tctcatcctt caatgctatc atttcctttg 7860
atattggatc atactaagaa accattatta tcatgacatt aacctataaa aataggcgta 7920
tcacgaggcc ctttcgtc 7938
<210> 82
<211> 9585
<212> DNA
<213> Artificial
<220>
<223> pHR81-ILV5p-R8B2y2
<400> 82
ggccgcacct ggtaaaacct ctagtggagt agtagatgta atcaatgaag cggaagccaa 60
aagaccagag tagaggccta tagaagaaac tgcgatacct tttgtgatgg ctaaacaaac 120
agacatcttt ttatatgttt ttacttctgt atatcgtgaa gtagtaagtg ataagcgaat 180
ttggctaaga acgttgtaag tgaacaaggg acctcttttg cctttcaaaa aaggattaaa 240
tggagttaat cattgagatt tagttttcgt tagattctgt atccctaaat aactccctta 300
cccgacggga aggcacaaaa gacttgaata atagcaaacg gccagtagcc aagaccaaat 360
aatactagag ttaactgatg gtcttaaaca ggcattacgt ggtgaactcc aagaccaata 420
tacaaaatat cgataagtta ttcttgccca ccaatttaag gagcctacat caggacagta 480
gtaccattcc tcagagaaga ggtatacata acaagaaaat cgcgtgaaca ccttatataa 540
cttagcccgt tattgagcta aaaaaccttg caaaatttcc tatgaataag aatacttcag 600
acgtgataaa aatttacttt ctaactcttc tcacgctgcc cctatctgtt cttccgctct 660
accgtgagaa ataaagcatc gagtacggca gttcgctgtc actgaactaa aacaataagg 720
ctagttcgaa tgatgaactt gcttgctgtc aaacttctga gttgccgctg atgtgacact 780
gtgacaataa attcaaaccg gttatagcgg tctcctccgg taccggttct gccacctcca 840
atagagctca gtaggagtca gaacctctgc ggtggctgtc agtgactcat ccgcgtttcg 900
taagttgtgc gcgtgcacat ttcgcccgtt cccgctcatc ttgcagcagg cgaaattttc 960
atcacgctgt aggacgcaaa aaaaaaataa ttaatcgtac aagaatcttg gaaaaaaaat 1020
tgaaaaattt tgtataaaag ggatgaccta acttgactca atggctttta cacccagtat 1080
tttccctttc cttgtttgtt acaattatag aagcaagaca aaaacatata gacaacctat 1140
tcctaggagt tatatttttt taccctacca gcaatataag taaaaaactg tttaaacagt 1200
atgaaggttt tctacgacaa ggattgtgac ttgtctatca ttcaaggtaa aaaggtcgcc 1260
atcatcggtt ttggttccca aggtcacgct caagccttga acttaaagga ctctggtgtc 1320
gatgttaccg tcggtctacc aaagggtttc gctgacgttg ccaaggccga agctcacggt 1380
ttcaaggtta ctgacgtcgc cgctgccgtt gctggtgctg atttggtcat gatcctaatt 1440
ccagacgaat tccaatccca attgtacaaa aacgaaatcg aaccaaacat caaaaagggt 1500
gccactttgg ctttctccca cggtttcgct atccactaca accaagttgt tccaagagct 1560
gacttggacg ttatcatgat tgctcctaag gctccaggtc ataccgttag atctgaattc 1620
gtcaagggtg gtggtatccc agacttgatt gctgtttacc aagacgtttc tggtaatgcc 1680
aaaaacgtcg ctttgtccta cgctgccggt gttggtggtg gtcgtactgg tatcatcgaa 1740
actaccttca aggacgaaac cgaaaccgac ttattcggtg aacaagctgt tttgtgtggt 1800
ggtaccgtcg aattggtcaa ggctggtttt gaaactttgg tcgaagctgg ttacgctcca 1860
gaaatggctt acttcgaatg tttacacgaa ttgaagttga ttgttgattt gatgtacgaa 1920
ggtggtattg ctaacatgaa ctactctatc tctaacaacg ctgaatacgg tgaatacgtt 1980
actggtccag aagtcattaa cgccgaatct agacaagcta tgagaaatgc tttgaagaga 2040
attcaagatg gtgaattcgc taagatgttc atctctgaag gtgctaccgg ttacccttct 2100
atgactgcta agcgtagaaa caacgctgct cacggtatcg aaatcatcgg tgaacaacta 2160
agagctatga tgccatggat tggtgctaac aagatcgtcg ataagagaaa aaactgaagg 2220
ccctgcaggc cagaggaaaa taatatcaag tgctggaaac tttttctctt ggaatttttg 2280
caacatcaag tcatagtcaa ttgaattgac ccaatttcac atttaagatt tttttttttt 2340
catccgacat acatctgtac actaggaagc cctgtttttc tgaagcagct tcaaatatat 2400
atatttttta catatttatt atgattcaat gaacaatcta attaaatcga aaacaagaac 2460
cgaaacgcga ataaataatt tatttagatg gtgacaagtg tataagtcct catcgggaca 2520
gctacgattt ctctttcggt tttggctgag ctactggttg ctgtgacgca gcggcattag 2580
cgcggcgtta tgagctaccc tcgtggcctg aaagatggcg ggaataaagc ggaactaaaa 2640
attactgact gagccatatt gaggtcaatt tgtcaactcg tcaagtcacg tttggtggac 2700
ggcccctttc caacgaatcg tatatactaa catgcgcgcg cttcctatat acacatatac 2760
atatatatat atatatatgt gtgcgtgtat gtgtacacct gtatttaatt tccttactcg 2820
cgggtttttc ttttttctca attcttggct tcctctttct cgagcggacc ggatcctccg 2880
cggtgccggc agatctattt aaatggcgcg ccgacgtcag gtggcacttt tcggggaaat 2940
gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg 3000
agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa 3060
catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac 3120
ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac 3180
atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt 3240
ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc 3300
gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca 3360
ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc 3420
ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag 3480
gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa 3540
ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg 3600
gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa 3660
ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg 3720
gctggctggt ttattgctga taaatctgga gccggtgagc gtggttctcg cggtatcatt 3780
gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt 3840
caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag 3900
cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat 3960
ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct 4020
taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct 4080
tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca 4140
gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc 4200
agcagagcgc agataccaaa tactgttctt ctagtgtagc cgtagttagg ccaccacttc 4260
aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct 4320
gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag 4380
gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc 4440
tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg 4500
agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag 4560
cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt 4620
gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac 4680
gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg 4740
ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc 4800
cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcccaata 4860
cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt 4920
cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct cactcattag 4980
gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat tgtgagcgga 5040
taacaatttc acacaggaaa cagctatgac catgattacg ccaagctttt tctttccaat 5100
tttttttttt tcgtcattat aaaaatcatt acgaccgaga ttcccgggta ataactgata 5160
taattaaatt gaagctctaa tttgtgagtt tagtatacat gcatttactt ataatacagt 5220
tttttagttt tgctggccgc atcttctcaa atatgcttcc cagcctgctt ttctgtaacg 5280
ttcaccctct accttagcat cccttccctt tgcaaatagt cctcttccaa caataataat 5340
gtcagatcct gtagagacaa catcatccac ggttctatac tgttgaccca atgcatctcc 5400
cttgtcatct aaacccacac cgggtgtcat aatcaaccaa tcgtaacctt catctcttcc 5460
acccatgtct ctttgagcaa taaagccgat aacaaaatct ttgtcgctct tcgcaatgtc 5520
aacagtaccc ttagtatatt ctccagtaga tagggagccc ttgcatgaca attctgctaa 5580
catcaaaagg cctctaggtt cctttgttac ttcttctgcc gcctgcttca aaccgctaac 5640
aatacctggg cccaccacac cgtgtgcatt cgtaatgtct gcccattctg ctattctgta 5700
tacacccgca gagtactgca atttgactgt attaccaatg tcagcaaatt ttctgtcttc 5760
gaagagtaaa aaattgtact tggcggataa tgcctttagc ggcttaactg tgccctccat 5820
ggaaaaatca gtcaagatat ccacatgtgt ttttagtaaa caaattttgg gacctaatgc 5880
ttcaactaac tccagtaatt ccttggtggt acgaacatcc aatgaagcac acaagtttgt 5940
ttgcttttcg tgcatgatat taaatagctt ggcagcaaca ggactaggat gagtagcagc 6000
acgttcctta tatgtagctt tcgacatgat ttatcttcgt ttcctgcagg tttttgttct 6060
gtgcagttgg gttaagaata ctgggcaatt tcatgtttct tcaacactac atatgcgtat 6120
atataccaat ctaagtctgt gctccttcct tcgttcttcc ttctgttcgg agattaccga 6180
atcaaaaaaa tttcaaggaa accgaaatca aaaaaaagaa taaaaaaaaa atgatgaatt 6240
gaaaagcttg catgcctgca ggtcgactct agtatactcc gtctactgta cgatacactt 6300
ccgctcaggt ccttgtcctt taacgaggcc ttaccactct tttgttactc tattgatcca 6360
gctcagcaaa ggcagtgtga tctaagattc tatcttcgcg atgtagtaaa actagctaga 6420
ccgagaaaga gactagaaat gcaaaaggca cttctacaat ggctgccatc attattatcc 6480
gatgtgacgc tgcatttttt tttttttttt tttttttttt tttttttttt tttttttttt 6540
ttttttgtac aaatatcata aaaaaagaga atctttttaa gcaaggattt tcttaacttc 6600
ttcggcgaca gcatcaccga cttcggtggt actgttggaa ccacctaaat caccagttct 6660
gatacctgca tccaaaacct ttttaactgc atcttcaatg gctttacctt cttcaggcaa 6720
gttcaatgac aatttcaaca tcattgcagc agacaagata gtggcgatag ggttgacctt 6780
attctttggc aaatctggag cggaaccatg gcatggttcg tacaaaccaa atgcggtgtt 6840
cttgtctggc aaagaggcca aggacgcaga tggcaacaaa cccaaggagc ctgggataac 6900
ggaggcttca tcggagatga tatcaccaaa catgttgctg gtgattataa taccatttag 6960
gtgggttggg ttcttaacta ggatcatggc ggcagaatca atcaattgat gttgaacttt 7020
caatgtaggg aattcgttct tgatggtttc ctccacagtt tttctccata atcttgaaga 7080
ggccaaaaca ttagctttat ccaaggacca aataggcaat ggtggctcat gttgtagggc 7140
catgaaagcg gccattcttg tgattctttg cacttctgga acggtgtatt gttcactatc 7200
ccaagcgaca ccatcaccat cgtcttcctt tctcttacca aagtaaatac ctcccactaa 7260
ttctctaaca acaacgaagt cagtaccttt agcaaattgt ggcttgattg gagataagtc 7320
taaaagagag tcggatgcaa agttacatgg tcttaagttg gcgtacaatt gaagttcttt 7380
acggattttt agtaaacctt gttcaggtct aacactaccg gtaccccatt taggaccacc 7440
cacagcacct aacaaaacgg catcagcctt cttggaggct tccagcgcct catctggaag 7500
tggaacacct gtagcatcga tagcagcacc accaattaaa tgattttcga aatcgaactt 7560
gacattggaa cgaacatcag aaatagcttt aagaacctta atggcttcgg ctgtgatttc 7620
ttgaccaacg tggtcacctg gcaaaacgac gatcttctta ggggcagaca ttacaatggt 7680
atatccttga aatatatata aaaaaaaaaa aaaaaaaaaa aaaaaaaaat gcagcttctc 7740
aatgatattc gaatacgctt tgaggagata cagcctaata tccgacaaac tgttttacag 7800
atttacgatc gtacttgtta cccatcattg aattttgaac atccgaacct gggagttttc 7860
cctgaaacag atagtatatt tgaacctgta taataatata tagtctagcg ctttacggaa 7920
gacaatgtat gtatttcggt tcctggagaa actattgcat ctattgcata ggtaatcttg 7980
cacgtcgcat ccccggttca ttttctgcgt ttccatcttg cacttcaata gcatatcttt 8040
gttaacgaag catctgtgct tcattttgta gaacaaaaat gcaacgcgag agcgctaatt 8100
tttcaaacaa agaatctgag ctgcattttt acagaacaga aatgcaacgc gaaagcgcta 8160
ttttaccaac gaagaatctg tgcttcattt ttgtaaaaca aaaatgcaac gcgagagcgc 8220
taatttttca aacaaagaat ctgagctgca tttttacaga acagaaatgc aacgcgagag 8280
cgctatttta ccaacaaaga atctatactt cttttttgtt ctacaaaaat gcatcccgag 8340
agcgctattt ttctaacaaa gcatcttaga ttactttttt tctcctttgt gcgctctata 8400
atgcagtctc ttgataactt tttgcactgt aggtccgtta aggttagaag aaggctactt 8460
tggtgtctat tttctcttcc ataaaaaaag cctgactcca cttcccgcgt ttactgatta 8520
ctagcgaagc tgcgggtgca ttttttcaag ataaaggcat ccccgattat attctatacc 8580
gatgtggatt gcgcatactt tgtgaacaga aagtgatagc gttgatgatt cttcattggt 8640
cagaaaatta tgaacggttt cttctatttt gtctctatat actacgtata ggaaatgttt 8700
acattttcgt attgttttcg attcactcta tgaatagttc ttactacaat ttttttgtct 8760
aaagagtaat actagagata aacataaaaa atgtagaggt cgagtttaga tgcaagttca 8820
aggagcgaaa ggtggatggg taggttatat agggatatag cacagagata tatagcaaag 8880
agatactttt gagcaatgtt tgtggaagcg gtattcgcaa tattttagta gctcgttaca 8940
gtccggtgcg tttttggttt tttgaaagtg cgtcttcaga gcgcttttgg ttttcaaaag 9000
cgctctgaag ttcctatact ttctagagaa taggaacttc ggaataggaa cttcaaagcg 9060
tttccgaaaa cgagcgcttc cgaaaatgca acgcgagctg cgcacataca gctcactgtt 9120
cacgtcgcac ctatatctgc gtgttgcctg tatatatata tacatgagaa gaacggcata 9180
gtgcgtgttt atgcttaaat gcgtacttat atgcgtctat ttatgtagga tgaaaggtag 9240
tctagtacct cctgtgatat tatcccattc catgcggggt atcgtatgct tccttcagca 9300
ctacccttta gctgttctat atgctgccac tcctcaattg gattagtctc atccttcaat 9360
gctatcattt cctttgatat tggatcatat gcatagtacc gagaaactag aggatctccc 9420
attaccgaca tttgggcgct atacgtgcat atgttcatgt atgtatctgt atttaaaaca 9480
cttttgtatt atttttcctc atatatgtgt ataggtttat acggatgatt taattattac 9540
ttcaccaccc tttatttcag gctgatatct tagccttgtt actag 9585
<210> 83
<211> 13022
<212> DNA
<213> Artificial
<220>
<223> pLA84
<400> 83
ccagcttttg ttccctttag tgagggttaa ttgcgcgctt ggcgtaatca tggtcatagc 60
tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca 120
taaagtgtaa agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct 180
cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac 240
gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc 300
tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt 360
tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg 420
ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg 480
agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 540
accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 600
ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct 660
gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc 720
ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 780
gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 840
taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag 900
tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 960
gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 1020
cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc 1080
agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca 1140
cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa 1200
cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat 1260
ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct 1320
taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt 1380
tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat 1440
ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta 1500
atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg 1560
gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt 1620
tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg 1680
cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg 1740
taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc 1800
ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa 1860
ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac 1920
cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt 1980
ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg 2040
gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa 2100
gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata 2160
aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgaacga agcatctgtg 2220
cttcattttg tagaacaaaa atgcaacgcg agagcgctaa tttttcaaac aaagaatctg 2280
agctgcattt ttacagaaca gaaatgcaac gcgaaagcgc tattttacca acgaagaatc 2340
tgtgcttcat ttttgtaaaa caaaaatgca acgcgagagc gctaattttt caaacaaaga 2400
atctgagctg catttttaca gaacagaaat gcaacgcgag agcgctattt taccaacaaa 2460
gaatctatac ttcttttttg ttctacaaaa atgcatcccg agagcgctat ttttctaaca 2520
aagcatctta gattactttt tttctccttt gtgcgctcta taatgcagtc tcttgataac 2580
tttttgcact gtaggtccgt taaggttaga agaaggctac tttggtgtct attttctctt 2640
ccataaaaaa agcctgactc cacttcccgc gtttactgat tactagcgaa gctgcgggtg 2700
cattttttca agataaaggc atccccgatt atattctata ccgatgtgga ttgcgcatac 2760
tttgtgaaca gaaagtgata gcgttgatga ttcttcattg gtcagaaaat tatgaacggt 2820
ttcttctatt ttgtctctat atactacgta taggaaatgt ttacattttc gtattgtttt 2880
cgattcactc tatgaatagt tcttactaca atttttttgt ctaaagagta atactagaga 2940
taaacataaa aaatgtagag gtcgagttta gatgcaagtt caaggagcga aaggtggatg 3000
ggtaggttat atagggatat agcacagaga tatatagcaa agagatactt ttgagcaatg 3060
tttgtggaag cggtattcgc aatattttag tagctcgtta cagtccggtg cgtttttggt 3120
tttttgaaag tgcgtcttca gagcgctttt ggttttcaaa agcgctctga agttcctata 3180
ctttctagag aataggaact tcggaatagg aacttcaaag cgtttccgaa aacgagcgct 3240
tccgaaaatg caacgcgagc tgcgcacata cagctcactg ttcacgtcgc acctatatct 3300
gcgtgttgcc tgtatatata tatacatgag aagaacggca tagtgcgtgt ttatgcttaa 3360
atgcgtactt atatgcgtct atttatgtag gatgaaaggt agtctagtac ctcctgtgat 3420
attatcccat tccatgcggg gtatcgtatg cttccttcag cactaccctt tagctgttct 3480
atatgctgcc actcctcaat tggattagtc tcatccttca atgctatcat ttcctttgat 3540
attggatcat actaagaaac cattattatc atgacattaa cctataaaaa taggcgtatc 3600
acgaggccct ttcgtctcgc gcgtttcggt gatgacggtg aaaacctctg acacatgcag 3660
ctcccggaga cggtcacagc ttgtctgtaa gcggatgccg ggagcagaca agcccgtcag 3720
ggcgcgtcag cgggtgttgg cgggtgtcgg ggctggctta actatgcggc atcagagcag 3780
attgtactga gagtgcacca taaattcccg ttttaagagc ttggtgagcg ctaggagtca 3840
ctgccaggta tcgtttgaac acggcattag tcagggaagt cataacacag tcctttcccg 3900
caattttctt tttctattac tcttggcctc ctctagtaca ctctatattt ttttatgcct 3960
cggtaatgat tttcattttt ttttttccac ctagcggatg actctttttt tttcttagcg 4020
attggcatta tcacataatg aattatacat tatataaagt aatgtgattt cttcgaagaa 4080
tatactaaaa aatgagcagg caagataaac gaaggcaaag atgacagagc agaaagccct 4140
agtaaagcgt attacaaatg aaaccaagat tcagattgcg atctctttaa agggtggtcc 4200
cctagcgata gagcactcga tcttcccaga aaaagaggca gaagcagtag cagaacaggc 4260
cacacaatcg caagtgatta acgtccacac aggtataggg tttctggacc atatgataca 4320
tgctctggcc aagcattccg gctggtcgct aatcgttgag tgcattggtg acttacacat 4380
agacgaccat cacaccactg aagactgcgg gattgctctc ggtcaagctt ttaaagaggc 4440
cctaggggcc gtgcgtggag taaaaaggtt tggatcagga tttgcgcctt tggatgaggc 4500
actttccaga gcggtggtag atctttcgaa caggccgtac gcagttgtcg aacttggttt 4560
gcaaagggag aaagtaggag atctctcttg cgagatgatc ccgcattttc ttgaaagctt 4620
tgcagaggct agcagaatta ccctccacgt tgattgtctg cgaggcaaga atgatcatca 4680
ccgtagtgag agtgcgttca aggctcttgc ggttgccata agagaagcca cctcgcccaa 4740
tggtaccaac gatgttccct ccaccaaagg tgttcttatg tagtgacacc gattatttaa 4800
agctgcagca tacgatatat atacatgtgt atatatgtat acctatgaat gtcagtaagt 4860
atgtatacga acagtatgat actgaagatg acaaggtaat gcatcattct atacgtgtca 4920
ttctgaacga ggcgcgcttt ccttttttct ttttgctttt tctttttttt tctcttgaac 4980
tcgacggatc tatgcggtgt gaaataccgc acagatgcgt aaggagaaaa taccgcatca 5040
ggaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 5100
attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 5160
gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga acgtggactc 5220
caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg gccggcttca 5280
catacgttgc atacgtcgat atagataata atgataatga cagcaggatt atcgtaatac 5340
gtaatagctg aaaatctcaa aaatgtgtgg gtcattacgt aaataatgat aggaatggga 5400
ttcttctatt tttccttttt ccattctagc agccgtcggg aaaacgtggc atcctctctt 5460
tcgggctcaa ttggagtcac gctgccgtga gcatcctctc tttccatatc taacaactga 5520
gcacgtaacc aatggaaaag catgagctta gcgttgctcc aaaaaagtat tggatggtta 5580
ataccatttg tctgttctct tctgactttg actcctcaaa aaaaaaaatc tacaatcaac 5640
agatcgcttc aattacgccc tcacaaaaac ttttttcctt cttcttcgcc cacgttaaat 5700
tttatccctc atgttgtcta acggatttct gcacttgatt tattataaaa agacaaagac 5760
ataatacttc tctatcaatt tcagttattg ttcttccttg cgttattctt ctgttcttct 5820
ttttcttttg tcatatataa ccataaccaa gtaatacata ttcaaacacg tgagtatgac 5880
tgacaaaaaa actcttaaag acttaagaaa tcgtagttct gtttacgatt caatggttaa 5940
atcacctaat cgtgctatgt tgcgtgcaac tggtatgcaa gatgaagact ttgaaaaacc 6000
tatcgtcggt gtcatttcaa cttgggctga aaacacacct tgtaatatcc acttacatga 6060
ctttggtaaa ctagccaaag tcggtgttaa ggaagctggt gcttggccag ttcagttcgg 6120
aacaatcacg gtttctgatg gaatcgccat gggaacccaa ggaatgcgtt tctccttgac 6180
atctcgtgat attattgcag attctattga agcagccatg ggaggtcata atgcggatgc 6240
ttttgtagcc attggcggtt gtgataaaaa catgcccggt tctgttatcg ctatggctaa 6300
catggatatc ccagccattt ttgcttacgg cggaacaatt gcacctggta atttagacgg 6360
caaagatatc gatttagtct ctgtctttga aggtgtcggc cattggaacc acggcgatat 6420
gaccaaagaa gaagttaaag ctttggaatg taatgcttgt cccggtcctg gaggctgcgg 6480
tggtatgtat actgctaaca caatggcgac agctattgaa gttttgggac ttagccttcc 6540
gggttcatct tctcacccgg ctgaatccgc agaaaagaaa gcagatattg aagaagctgg 6600
tcgcgctgtt gtcaaaatgc tcgaaatggg cttaaaacct tctgacattt taacgcgtga 6660
agcttttgaa gatgctatta ctgtaactat ggctctggga ggttcaacca actcaaccct 6720
tcacctctta gctattgccc atgctgctaa tgtggaattg acacttgatg atttcaatac 6780
tttccaagaa aaagttcctc atttggctga tttgaaacct tctggtcaat atgtattcca 6840
agacctttac aaggtcggag gggtaccagc agttatgaaa tatctcctta aaaatggctt 6900
ccttcatggt gaccgtatca cttgtactgg caaaacagtc gctgaaaatt tgaaggcttt 6960
tgatgattta acacctggtc aaaaggttat tatgccgctt gaaaatccta aacgtgaaga 7020
tggtccgctc attattctcc atggtaactt ggctccagac ggtgccgttg ccaaagtttc 7080
tggtgtaaaa gtgcgtcgtc atgtcggtcc tgctaaggtc tttaattctg aagaagaagc 7140
cattgaagct gtcttgaatg atgatattgt tgatggtgat gttgttgtcg tacgttttgt 7200
aggaccaaag ggcggtcctg gtatgcctga aatgctttcc ctttcatcaa tgattgttgg 7260
taaagggcaa ggtgaaaaag ttgcccttct gacagatggc cgcttctcag gtggtactta 7320
tggtcttgtc gtgggtcata tcgctcctga agcacaagat ggcggtccaa tcgcctacct 7380
gcaaacagga gacatagtca ctattgacca agacactaag gaattacact ttgatatctc 7440
cgatgaagag ttaaaacatc gtcaagagac cattgaattg ccaccgctct attcacgcgg 7500
tatccttggt aaatatgctc acatcgtttc gtctgcttct aggggagccg taacagactt 7560
ttggaagcct gaagaaactg gcaaaaaatg ttgtcctggt tgctgtggtt aagcggccgc 7620
gttaattcaa attaattgat atagtttttt aatgagtatt gaatctgttt agaaataatg 7680
gaatattatt tttatttatt tatttatatt attggtcggc tcttttcttc tgaaggtcaa 7740
tgacaaaatg atatgaagga aataatgatt tctaaaattt tacaacgtaa gatattttta 7800
caaaagccta gctcatcttt tgtcatgcac tattttactc acgcttgaaa ttaacggcca 7860
gtccactgcg gagtcatttc aaagtcatcc taatcgatct atcgtttttg atagctcatt 7920
ttggagttcg cgaggatcca ctagttctag agcggccgct ctagaactag taccacaggt 7980
gttgtcctct gaggacataa aatacacacc gagattcatc aactcattgc tggagttagc 8040
atatctacaa ttgggtgaaa tggggagcga tttgcaggca tttgctcggc atgccggtag 8100
aggtgtggtc aataagagcg acctcatgct atacctgaga aagcaacctg acctacagga 8160
aagagttact caagaataag aattttcgtt ttaaaaccta agagtcactt taaaatttgt 8220
atacacttat tttttttata acttatttaa taataaaaat cataaatcat aagaaattcg 8280
cttactctta attaatcaag cctccatcga aatgatgact tttagtgctt gagtagacgc 8340
agcttggcca aaagtttcat atgcgtccaa gatctggtcc aggctgaatc tatgtgttat 8400
caatctagat ggatctagct tgtgactttg aacagttttc agtaacatcg gggtggtagc 8460
cgtgtcaacc aaccttgtag taatcgtgac attatgggac cataaacttt caagatgcaa 8520
atcaactttg ctaccgtgaa cgccgacatt agcgatagtt ccaccgggag ctacgatatt 8580
ctgacacaat tcaaatgtag caggtatccc aactgcttca atcgcagtat caacacctaa 8640
gccttcagta agagctttca cttcggctgc ggcgttacca cccgtggagt ttactgttct 8700
ggtggcacca aattgtttgg ctaatcccag cctgttatca tcaagatcga tcattatgat 8760
ttcagctggg gagtagaatt gtgctgtcag taaggcggcc aaaccaacgg gaccagcacc 8820
tactatagcc accgaagaac caggtgcgac tttgccgttt aggactccgc actcaaaacc 8880
cgttggtaga atatctgata acatgactaa ggcctcttca tccgcacctg ccggaatacg 8940
ataaagggat gtgtcagcat gtggtactct tacgtactct gcttgggtac catcaatttc 9000
gttgcccaga atccaacccc cggtcgtaca gtgactgaac attcctcttc tacaaaatga 9060
gcactttccg caactcgata tacatgatat caaaactcta tcgcctggtt ggaaagcagt 9120
aaccccagat ccgactgatt caataacccc cactccttca tgccctaata cacgaccggg 9180
tttacaagtc gcaacgtcac ctttaagaat gtgtagatcg gttccgcaaa ttgtagtctt 9240
tgttaccttc actatagcgt caccaggttc cttaagctct ggcttctgtc tctcttccac 9300
caacttctgg cctgggcccc tatacactaa tgctttcatc ctcagctagc tattgtaata 9360
tgtgtgtttg tttggattat taagaagaat aattacaaaa aaaattacaa aggaaggtaa 9420
ttacaacaga attaagaaag gacaagaagg aggaagagaa tcagttcatt atttcttctt 9480
tgttatataa caaacccaag tagcgatttg gccatacatt aaaagttgag aaccaccctc 9540
cctggcaaca gccacaactc gttaccattg ttcatcacga tcatgaaact cgctgtcagc 9600
tgaaatttca cctcagtgga tctctctttt tattcttcat cgttccacta acctttttcc 9660
atcagctggc agggaacgga aagtggaatc ccatttagcg agcttcctct tttcttcaag 9720
aaaagacgaa gcttgtgtgt gggtgcgcgc gctagtatct ttccacatta agaaatatac 9780
cataaaggtt acttagacat cactatggct atatatatat atatatatat atgtaactta 9840
gcaccatcgc gcgtgcatca ctgcatgtgt taaccgaaaa gtttggcgaa cacttcaccg 9900
acacggtcat ttagatctgt cgtctgcatt gcacgtccct tagccttaaa tcctaggcgg 9960
gagcattctc gtgtaattgt gcagcctgcg tagcaactca acatagcgta gtctacccag 10020
tttttcaagg gtttatcgtt agaagattct cccttttctt cctgctcaca aatcttaaag 10080
tcatacattg cacgactaaa tgcaagcgac gtcagggaaa gatatgagct atacagcgga 10140
atttccatat cactcagatt ttgttatcta attttttcct tcccacgtcc gcgggaatct 10200
gtgtatatta ctgcatctag atatatgtta tcttatcttg gcgcgtacat ttaattttca 10260
acgtattcta taagaaattg cgggagtttt tttcatgtag atgatactga ctgcacgcaa 10320
atataggcat gatttatagg catgatttga tggctgtacc gataggaacg ctaagagtaa 10380
cttcagaatc gttatcctgg cggaaaaaat tcatttgtaa actttaaaaa aaaaagccaa 10440
tatccccaaa attattaaga gcgcctccat tattaactaa aatttcactc agcatccaca 10500
atgtatcagg tatctactac agatattaca tgtggcgaaa aagacaagaa caatgcaata 10560
gcgcatcaag aaaaaacaca aagctttcaa tcaatgaatc gaaaatgtca ttaaaatagt 10620
atataaattg aaactaagtc ataaagctat aaaaagaaaa tttatttaaa tgcaagattt 10680
aaagtaaatt cacggccctg caggccttaa gagttttgct tagataaggc taagccaatc 10740
tgtctcaatg attctggcat atccatttgt tccatatgaa cttcaacgac atgtgctttt 10800
tgaggagtag catcgatagc agctaaagta ttagcgaagt ctgtttctgt gaaaacgttg 10860
tgagtgtcga cagtttcggc atcaccacca aatgtttcag caactaattg caagttccaa 10920
gttggtatat cattgtaact ctcatcctct ccatggatgg ctctttcgac tgtatagcca 10980
tcgttattga taatgaatat cactggtgtc aatttctctc tgaagatggt ggacatttcc 11040
tgtgctgtca gttgaaaaga tccatcaccg atggatagaa tgtgtctcct ttctggggca 11100
gcaatttgtg aaccaatcat agcaggtaat gtgtatccta tggagcccca taatgtttga 11160
ctgatcaaat tcataccctt tttcagaggt gccaacatca aaccgaaaga tgatgtcccc 11220
tgctcagtga ccaacacatc atcagcttgc aaaaagttca taacagcttg gtgaaatctg 11280
tcttgcttta gtggtgtttc ggcctgtggt tcgaaaacag ctaattcagc ttgtttagca 11340
gcagtatcag caaaagtaaa gtttagtttt tccagctctg ccaaaagacc gttaagagaa 11400
atcccagagt aagtagaccc atctggcagc ataatgatgt catttgcagc ggttaaagtg 11460
ttttcagtct taaagccttg agaaaatgag gaggtagaat tgtcaatgat tttcccacca 11520
aaatgtaaaa cgaagtcact attgtcaacg taatccagaa cgtttttgtc agaaaaagct 11580
gggtaatagg taccaatgaa atgttcgttc tcttcattga aagagccttt gccatatgcc 11640
aaattggtta ctggcaactt tgtttggttt atccagtttt caaatctttc tcttatctgg 11700
aaacgggcga tctcatgacc ggcgattacg ataggttgag cggccttttc taagtgtgat 11760
agtatgattt ctgcaagttg tgcctctctc tcaccagatg atttctctgt ttgtagtgct 11820
tttgcaggtt taactattgc tttatgagct atatcaattg gaagattgat gtatactggc 11880
ctcttttcca acaaggctgt ttctaatact ctgtcgatct ctgaagctgc attctcttca 11940
gtaagcatgg ttgtagcggc agtgacttcc ttagccattt cactaaagtt atgaaagtta 12000
cccattccta aggaatgatg aaccagcttt ttgttggatt gcacattcat agttggagaa 12060
cccacgatgt ggatgacagg gacttgttct gcaaaactac cagctgttcc gttaatggct 12120
gacagttcac ccactccgaa tgtagtaaca agagctgata cgcctctttc acgggcgtag 12180
ccatctgctg catatgctgc gtttagttca ttagtattcc cttgccagga aagtccttcg 12240
tgattttgaa tgtaatctag aaaagtcaaa ttgtaatccc ctggcacacc gaaaacctta 12300
tcgataccaa tctcttctag tctatctacc aagtactgtc ctacggtata cattttgttt 12360
actagtttat gtgtgtttat tcgaaactaa gttcttggtg ttttaaaact aaaaaaaaga 12420
ctaactataa aagtagaatt taagaagttt aagaaataga tttacagaat tacaatcaat 12480
acctaccgtc tttatatact tattagtcaa gtaggggaat aatttcaggg aactggtttc 12540
aacctttttt ttcagctttt tccaaatcag agagagcaga aggtaataga aggtgtaaga 12600
aaatgagata gatacatgcg tgggtcaatt gccttgtgtc atcatttact ccaggcaggt 12660
tgcatcactc cattgaggtt gtgcccgttt tttgcctgtt tgtgcccctg ttctctgtag 12720
ttgcgctaag agaatggacc tatgaactga tggttggtga agaaaacaat attttggtgc 12780
tgggattctt tttttttctg gatgccagct taaaaagcgg gctccattat atttagtgga 12840
tgccaggaat aaactgttca cccagacacc tacgatgtta tatattctgt gtaacccgcc 12900
ccctattttg ggcatgtacg ggttacagca gaattaaaag gctaattttt tgactaaata 12960
aagttaggaa aatcactact attaattatt tacgtattct ttgaaatggc agtattggag 13020
ct 13022
<210> 84
<211> 90
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 895
<400> 84
tctcaattat tattttctac tcataacctc acgcaaaata acacagtcaa atcaatcaaa 60
atgttgacaa aagcaacaaa agaacaaaaa 90
<210> 85
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> N245
<400> 85
agggtagcct ccccataaca taaac 25
<210> 86
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> N246
<400> 86
tctccaaata tatacctctt gtgtg 25
<210> 87
<211> 90
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 896
<400> 87
ttttatatac agtataaata aaaaacccac gtaatatagc aaaaacatat tgccaacaaa 60
aattaccgtc gctcgtgatt tgtttgcaaa 90
<210> 88
<211> 90
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 897
<400> 88
caaactgtgt aagtttattt atttgcaaca ataattcgtt tgagtacact actaatggcc 60
accttggcta actcgttgta tcatcactgg 90
<210> 89
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> primer 365
<400> 89
ctctatctcc gctcaggcta agcaattg 28
<210> 90
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 366
<400> 90
cagccgactc aacggcctgt ttcacg 26
<210> 91
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> N638
<400> 91
aaaagatagt gtagtagtga taaactgg 28
<210> 92
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> BK415
<400> 92
gcctcattga tggtggtaca taacg 25
<210> 93
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> N1092
<400> 93
agagttttga tatcatgtat atcgag 26
<210> 94
<211> 92
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 906
<400> 94
atgacaggtg aaagaattga aaaggtgaaa ataaatgacg aatttgcaaa atcacatttc 60
acctggtaaa acctctagtg gagtagtaga tg 92
<210> 95
<211> 87
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 907
<400> 95
aaaaagattc aatgccgtct cctttcgaaa cttaataata gaacaatatc atccttcacc 60
ttggctaact cgttgtatca tcactgg 87
<210> 96
<211> 70
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 667
<400> 96
tctcctttcg aaacttaata atagaacaat atcatccttt tgtaaaacga cggccagtga 60
attcaccttg 70
<210> 97
<211> 6728
<212> DNA
<213> Artificial Sequence
<220>
<223> pJT254
<400> 97
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgcgtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accataaatt cccgttttaa gagcttggtg agcgctagga gtcactgcca ggtatcgttt 240
gaacacggca ttagtcaggg aagtcataac acagtccttt cccgcaattt tctttttcta 300
ttactcttgg cctcctctag tacactctat atttttttat gcctcggtaa tgattttcat 360
tttttttttt cccctagcgg atgactcttt ttttttctta gcgattggca ttatcacata 420
atgaattata cattatataa agtaatgtga tttcttcgaa gaatatacta aaaaatgagc 480
aggcaagata aacgaaggca aagatgacag agcagaaagc cctagtaaag cgtattacaa 540
atgaaaccaa gattcagatt gcgatctctt taaagggtgg tcccctagcg atagagcact 600
cgatcttccc agaaaaagag gcagaagcag tagcagaaca ggccacacaa tcgcaagtga 660
ttaacgtcca cacaggtata gggtttctgg accatatgat acatgctctg gccaagcatt 720
ccggctggtc gctaatcgtt gagtgcattg gtgacttaca catagacgac catcacacca 780
ctgaagactg cgggattgct ctcggtcaag cttttaaaga ggccctactg gcgcgtggag 840
taaaaaggtt tggatcagga tttgcgcctt tggatgaggc actttccaga gcggtggtag 900
atctttcgaa caggccgtac gcagttgtcg aacttggttt gcaaagggag aaagtaggag 960
atctctcttg cgagatgatc ccgcattttc ttgaaagctt tgcagaggct agcagaatta 1020
ccctccacgt tgattgtctg cgaggcaaga atgatcatca ccgtagtgag agtgcgttca 1080
aggctcttgc ggttgccata agagaagcca cctcgcccaa tggtaccaac gatgttccct 1140
ccaccaaagg tgttcttatg tagtgacacc gattatttaa agctgcagca tacgatatat 1200
atacatgtgt atatatgtat acctatgaat gtcagtaagt atgtatacga acagtatgat 1260
actgaagatg acaaggtaat gcatcattct atacgtgtca ttctgaacga ggcgcgcttt 1320
ccttttttct ttttgctttt tctttttttt tctcttgaac tcgacggatc tatgcggtgt 1380
gaaataccgc acagatgcgt aaggagaaaa taccgcatca ggaaattgta aacgttaata 1440
ttttgttaaa attcgcgtta aatttttgtt aaatcagctc attttttaac caataggccg 1500
aaatcggcaa aatcccttat aaatcaaaag aatagaccga gatagggttg agtgttgttc 1560
cagtttggaa caagagtcca ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa 1620
ccgtctatca gggcgatggc ccactacgtg aaccatcacc ctaatcaagt tttttggggt 1680
cgaggtgccg taaagcacta aatcggaacc ctaaagggag cccccgattt agagcttgac 1740
ggggaaagcc ggcgaacgtg gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta 1800
gggcgctggc aagtgtagcg gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg 1860
cgccgctaca gggcgcgtcg cgccattcgc cattcaggct gcgcaactgt tgggaagggc 1920
gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt gctgcaaggc 1980
gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg acggccagtg 2040
agcgcgcgta atacgactca ctatagggcg aattgggtac cgggcccccc ctcgaggtcg 2100
acggtatcga taagcttgat tagaagccgc cgagcgggcg acagccctcc gacggaagac 2160
tctcctccgt gcgtcctcgt cttcaccggt cgcgttcctg aaacgcagat gtgcctcgcg 2220
ccgcactgct ccgaacaata aagattctac aatactagct tttatggtta tgaagaggaa 2280
aaattggcag taacctggcc ccacaaacct tcaaattaac gaatcaaatt aacaaccata 2340
ggatgataat gcgattagtt ttttagcctt atttctgggg taattaatca gcgaagcgat 2400
gatttttgat ctattaacag atatataaat ggaaaagctg cataaccact ttaactaata 2460
ctttcaacat tttcagtttg tattacttct tattcaaatg tcataaaagt atcaacaaaa 2520
aattgttaat atacctctat actttaacgt caaggagaaa aatgtccaat ttactgcccg 2580
tacaccaaaa tttgcctgca ttaccggtcg atgcaacgag tgatgaggtt cgcaagaacc 2640
tgatggacat gttcagggat cgccaggcgt tttctgagca tacctggaaa atgcttctgt 2700
ccgtttgccg gtcgtgggcg gcatggtgca agttgaataa ccggaaatgg tttcccgcag 2760
aacctgaaga tgttcgcgat tatcttctat atcttcaggc gcgcggtctg gcagtaaaaa 2820
ctatccagca acatttgggc cagctaaaca tgcttcatcg tcggtccggg ctgccacgac 2880
caagtgacag caatgctgtt tcactggtta tgcggcggat ccgaaaagaa aacgttgatg 2940
ccggtgaacg tgcaaaacag gctctagcgt tcgaacgcac tgatttcgac caggttcgtt 3000
cactcatgga aaatagcgat cgctgccagg atatacgtaa tctggcattt ctggggattg 3060
cttataacac cctgttacgt atagccgaaa ttgccaggat cagggttaaa gatatctcac 3120
gtactgacgg tgggagaatg ttaatccata ttggcagaac gaaaacgctg gttagcaccg 3180
caggtgtaga gaaggcactt agcctggggg taactaaact ggtcgagcga tggatttccg 3240
tctctggtgt agctgatgat ccgaataact acctgttttg ccgggtcaga aaaaatggtg 3300
ttgccgcgcc atctgccacc agccagctat caactcgcgc cctggaaggg atttttgaag 3360
caactcatcg attgatttac ggcgctaagg atgactctgg tcagagatac ctggcctggt 3420
ctggacacag tgcccgtgtc ggagccgcgc gagatatggc ccgcgctgga gtttcaatac 3480
cggagatcat gcaagctggt ggctggacca atgtaaatat tgtcatgaac tatatccgta 3540
acctggatag tgaaacaggg gcaatggtgc gcctgctgga agatggcgat taggagtaag 3600
cgaatttctt atgatttatg atttttatta ttaaataagt tataaaaaaa ataagtgtat 3660
acaaatttta aagtgactct taggttttaa aacgaaaatt cttattcttg agtaactctt 3720
tcctgtaggt caggttgctt tctcaggtat agcatgaggt cgctcttatt gaccacacct 3780
ctaccggcat gccgagcaaa tgcctgcaaa tcgctcccca tttcacccaa ttgtagatat 3840
gctaactcca gcaatgagtt gatgaatctc ggtgtgtatt ttatgtcctc agaggacaac 3900
acctgtggtg ttctagagcg gccgccaccg cggtggagct ccagcttttg ttccctttag 3960
tgagggttaa ttgcgcgctt ggcgtaatca tggtcatagc tgtttcctgt gtgaaattgt 4020
tatccgctca caattccaca caacatagga gccggaagca taaagtgtaa agcctggggt 4080
gcctaatgag tgaggtaact cacattaatt gcgttgcgct cactgcccgc tttccagtcg 4140
ggaaacctgt cgtgccagct gcattaatga atcggccaac gcgcggggag aggcggtttg 4200
cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg 4260
cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat 4320
aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc 4380
gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc 4440
tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga 4500
agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt 4560
ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg 4620
taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc 4680
gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg 4740
gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc 4800
ttgaagtggt ggcctaacta cggctacact agaaggacag tatttggtat ctgcgctctg 4860
ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc 4920
gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct 4980
caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt 5040
taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct tttaaattaa 5100
aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga cagttaccaa 5160
tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc catagttgcc 5220
tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg ccccagtgct 5280
gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat aaaccagcca 5340
gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat ccagtctatt 5400
aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg caacgttgtt 5460
gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc 5520
ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa agcggttagc 5580
tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc actcatggtt 5640
atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt ttctgtgact 5700
ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc 5760
ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt gctcatcatt 5820
ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag atccagttcg 5880
atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac cagcgtttct 5940
gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa 6000
tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca gggttattgt 6060
ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc 6120
acatttcccc gaaaagtgcc acctgggtcc ttttcatcac gtgctataaa aataattata 6180
atttaaattt tttaatataa atatataaat taaaaataga aagtaaaaaa agaaattaaa 6240
gaaaaaatag tttttgtttt ccgaagatgt aaaagactct agggggatcg ccaacaaata 6300
ctacctttta tcttgctctt cctgctctca ggtattaatg ccgaattgtt tcatcttgtc 6360
tgtgtagaag accacacacg aaaatcctgt gattttacat tttacttatc gttaatcgaa 6420
tgtatatcta tttaatctgc ttttcttgtc taataaatat atatgtaaag tacgcttttt 6480
gttgaaattt tttaaacctt tgtttatttt tttttcttca ttccgtaact cttctacctt 6540
ctttatttac tttctaaaat ccaaatacaa aacataaaaa taaataaaca cagagtaaat 6600
tcccaaatta ttccatcatt aaaagatacg aggcgcgtgt aagttacagg caagcgatcc 6660
gtcctaagaa accattatta tcatgacatt aacctataaa aataggcgta tcacgaggcc 6720
ctttcgtc 6728
<210> 98
<211> 1650
<212> DNA
<213> Artificial Sequence
<220>
<223> AMN1
<400> 98
atgaagctgg agcgcgtgag ttctaacggg agctttaagc gtggccgtga catccaaagt 60
ttggagagtc cgtgtacccg cccattaaag aaaatgtcgc catcaccttc atttacgagc 120
ctgaagatgg aaaaaccgtt taaggacatt gttcgaaaat acgggggtca cctgcaccag 180
tcctcgtata acccaggttc ttcaaaagtt gaactcgtgc gtccggacct gagcttgaaa 240
acggaccaat catttttgca gagcagcgtg cagacaaccc cgaacaaaaa gagttgtaac 300
gagtatctgt ccacacccga agccactccc cttaagaaca cggccaccga gaatgcgtgg 360
gctacgtcaa gggtggtgag cgcatcaagc ctgtcaatcg tcacgccgac cgaaatcaaa 420
aatatactgg ttgacgagtt tagtgaacta aaacttggtc agcccttaac agcccagcac 480
caacggagcc atgcagtttt cgagatacct gagatcgtag agaacataat caagatgatc 540
gtttccctcg agagcgccaa tattccgaaa gaacgtccgt gcctgcgtcg caacccgcag 600
agttatgagc attcccttct gatgtataaa gacgaggaac gcgcgaagaa agcatggtcc 660
gcggctcaac aactgcgcga tccgccgctg gtgggtcata aggaaaaaaa acagggcgct 720
ctgtttagct gcatgatggt caaccgcctg tggttgaatg tcacgcgtcc gttcttattt 780
aagtctctgc atttcaaatc agtgcacaac ttcaaagaat ttctgcgcac aagtcaggaa 840
accacgcaag tgatgaggcc atcgcacttt atcctgcata aattgcacca ggtaacgcag 900
ccggatattg agagactgtc tagaatggaa tgccagaacc tcaagtggtt ggaattttat 960
gtatgtcccc gtattacacc tccactgtct tggttcgaca atttgcataa gttagaaaaa 1020
ttaatcatcc ccggaaacaa gaatatcgac gataatttcc tcttacggct gtctcagagt 1080
attcctaacc tgaaacacct cgtgcttcgt gcttgcgaca atgtttccga tagtggtgta 1140
gtttgtatcg ccctgaactg ccctaagctg aagacgttca acatcggacg tcatcgccgc 1200
ggcaatctga ttacatcagt tagcttggtt gccctgggta agtatacgca agttgagacc 1260
gttggttttg caggctgcga tgtggacgac gcaggcatat gggagttcgc gcgtttaaac 1320
gggaaaaacg tcgagcgcct gtcactcaac agttgccggc ttttaaccga ctatagcttg 1380
ccaatcctgt ttgcccttaa tagtttcccg aaccttgcgg tgttggaaat tcgaaacctc 1440
gataaaatta cagatgtccg ccattttgtg aaatataatc tgtggaagaa atcactggat 1500
gctcctatcc tgattgaggc gtgcgaacgc ataacaaagc tgattgatca ggaagagaac 1560
cgggtcaaac gcataaatag cctggtcgct ttaaaggata tgaccgcgtg ggtgaacgct 1620
gacgatgaaa ttgaaaacaa cgtcgattga 1650
<210> 99
<211> 549
<212> PRT
<213> Artificial Sequence
<220>
<223> AMN1
<400> 99
Met Lys Leu Glu Arg Val Ser Ser Asn Gly Ser Phe Lys Arg Gly Arg
1 5 10 15
Asp Ile Gln Ser Leu Glu Ser Pro Cys Thr Arg Pro Leu Lys Lys Met
20 25 30
Ser Pro Ser Pro Ser Phe Thr Ser Leu Lys Met Glu Lys Pro Phe Lys
35 40 45
Asp Ile Val Arg Lys Tyr Gly Gly His Leu His Gln Ser Ser Tyr Asn
50 55 60
Pro Gly Ser Ser Lys Val Glu Leu Val Arg Pro Asp Leu Ser Leu Lys
65 70 75 80
Thr Asp Gln Ser Phe Leu Gln Ser Ser Val Gln Thr Thr Pro Asn Lys
85 90 95
Lys Ser Cys Asn Glu Tyr Leu Ser Thr Pro Glu Ala Thr Pro Leu Lys
100 105 110
Asn Thr Ala Thr Glu Asn Ala Trp Ala Thr Ser Arg Val Val Ser Ala
115 120 125
Ser Ser Leu Ser Ile Val Thr Pro Thr Glu Ile Lys Asn Ile Leu Val
130 135 140
Asp Glu Phe Ser Glu Leu Lys Leu Gly Gln Pro Leu Thr Ala Gln His
145 150 155 160
Gln Arg Ser His Ala Val Phe Glu Ile Pro Glu Ile Val Glu Asn Ile
165 170 175
Ile Lys Met Ile Val Ser Leu Glu Ser Ala Asn Ile Pro Lys Glu Arg
180 185 190
Pro Cys Leu Arg Arg Asn Pro Gln Ser Tyr Glu His Ser Leu Leu Met
195 200 205
Tyr Lys Asp Glu Glu Arg Ala Lys Lys Ala Trp Ser Ala Ala Gln Gln
210 215 220
Leu Arg Asp Pro Pro Leu Val Gly His Lys Glu Lys Lys Gln Gly Ala
225 230 235 240
Leu Phe Ser Cys Met Met Val Asn Arg Leu Trp Leu Asn Val Thr Arg
245 250 255
Pro Phe Leu Phe Lys Ser Leu His Phe Lys Ser Val His Asn Phe Lys
260 265 270
Glu Phe Leu Arg Thr Ser Gln Glu Thr Thr Gln Val Met Arg Pro Ser
275 280 285
His Phe Ile Leu His Lys Leu His Gln Val Thr Gln Pro Asp Ile Glu
290 295 300
Arg Leu Ser Arg Met Glu Cys Gln Asn Leu Lys Trp Leu Glu Phe Tyr
305 310 315 320
Val Cys Pro Arg Ile Thr Pro Pro Leu Ser Trp Phe Asp Asn Leu His
325 330 335
Lys Leu Glu Lys Leu Ile Ile Pro Gly Asn Lys Asn Ile Asp Asp Asn
340 345 350
Phe Leu Leu Arg Leu Ser Gln Ser Ile Pro Asn Leu Lys His Leu Val
355 360 365
Leu Arg Ala Cys Asp Asn Val Ser Asp Ser Gly Val Val Cys Ile Ala
370 375 380
Leu Asn Cys Pro Lys Leu Lys Thr Phe Asn Ile Gly Arg His Arg Arg
385 390 395 400
Gly Asn Leu Ile Thr Ser Val Ser Leu Val Ala Leu Gly Lys Tyr Thr
405 410 415
Gln Val Glu Thr Val Gly Phe Ala Gly Cys Asp Val Asp Asp Ala Gly
420 425 430
Ile Trp Glu Phe Ala Arg Leu Asn Gly Lys Asn Val Glu Arg Leu Ser
435 440 445
Leu Asn Ser Cys Arg Leu Leu Thr Asp Tyr Ser Leu Pro Ile Leu Phe
450 455 460
Ala Leu Asn Ser Phe Pro Asn Leu Ala Val Leu Glu Ile Arg Asn Leu
465 470 475 480
Asp Lys Ile Thr Asp Val Arg His Phe Val Lys Tyr Asn Leu Trp Lys
485 490 495
Lys Ser Leu Asp Ala Pro Ile Leu Ile Glu Ala Cys Glu Arg Ile Thr
500 505 510
Lys Leu Ile Asp Gln Glu Glu Asn Arg Val Lys Arg Ile Asn Ser Leu
515 520 525
Val Ala Leu Lys Asp Met Thr Ala Trp Val Asn Ala Asp Asp Glu Ile
530 535 540
Glu Asn Asn Val Asp
545
<210> 100
<211> 6638
<212> DNA
<213> Artificial Sequence
<220>
<223> pLA67
<400> 100
aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt ttgctcacat 60
gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgagtgagc 120
tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga 180
agagcgccca atacgcaaac cgcctctccc cgcgcgttgg ccgattcatt aatgcagctg 240
gcacgacagg tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta 300
gctcactcat taggcacccc aggctttaca ctttatgctt ccggctcgta tgttgtgtgg 360
aattgtgagc ggataacaat ttcacacagg aaacagctat gaccatgatt acgccaagct 420
tgcatgcctg caggtcgact ctagaggatc cgcattgcgg attacgtatt ctaatgttca 480
gtaccgttcg tataatgtat gctatacgaa gttatgcaga ttgtactgag agtgcaccat 540
accacagctt ttcaattcaa ttcatcattt tttttttatt cttttttttg atttcggttt 600
ctttgaaatt tttttgattc ggtaatctcc gaacagaagg aagaacgaag gaaggagcac 660
agacttagat tggtatatat acgcatatgt agtgttgaag aaacatgaaa ttgcccagta 720
ttcttaaccc aactgcacag aacaaaaacc tgcaggaaac gaagataaat catgtcgaaa 780
gctacatata aggaacgtgc tgctactcat cctagtcctg ttgctgccaa gctatttaat 840
atcatgcacg aaaagcaaac aaacttgtgt gcttcattgg atgttcgtac caccaaggaa 900
ttactggagt tagttgaagc attaggtccc aaaatttgtt tactaaaaac acatgtggat 960
atcttgactg atttttccat ggagggcaca gttaagccgc taaaggcatt atccgccaag 1020
tacaattttt tactcttcga agacagaaaa tttgctgaca ttggtaatac agtcaaattg 1080
cagtactctg cgggtgtata cagaatagca gaatgggcag acattacgaa tgcacacggt 1140
gtggtgggcc caggtattgt tagcggtttg aagcaggcgg cagaagaagt aacaaaggaa 1200
cctagaggcc ttttgatgtt agcagaattg tcatgcaagg gctccctatc tactggagaa 1260
tatactaagg gtactgttga cattgcgaag agcgacaaag attttgttat cggctttatt 1320
gctcaaagag acatgggtgg aagagatgaa ggttacgatt ggttgattat gacacccggt 1380
gtgggtttag atgacaaggg agacgcattg ggtcaacagt atagaaccgt ggatgatgtg 1440
gtctctacag gatctgacat tattattgtt ggaagaggac tatttgcaaa gggaagggat 1500
gctaaggtag agggtgaacg ttacagaaaa gcaggctggg aagcatattt gagaagatgc 1560
ggccagcaaa actaaaaaac tgtattataa gtaaatgcat gtatactaaa ctcacaaatt 1620
agagcttcaa tttaattata tcagttatta ccctatgcgg tgtgaaatac cgcacagatg 1680
cgtaaggaga aaataccgca tcaggaaatt gtaaacgtta atattttgtt aaaattcgcg 1740
ttaaattttt gttaaatcag ctcatttttt aaccaatagg ccgaaatcgg caaaatccct 1800
tataaatcaa aagaatagac cgagataggg ttgagtgttg ttccagtttg gaacaagagt 1860
ccactattaa agaacgtgga ctccaacgtc aaagggcgaa aaaccgtcta tcagggcgat 1920
ggcccactac gtgaaccatc accctaatca agataacttc gtataatgta tgctatacga 1980
acggtaccag tgatgataca acgagttagc caaggtgaat tcgacttagg atgtctcatc 2040
aatcatctta ttcctgctgg tgttttttgt atcgccttgc cttggagtgt ttatgcttgt 2100
cctttgttca gtaaccattc ttcaagtttg tttcaagtag taggatacct tcagatatac 2160
gaaagaaagg gagtatagtt gtggatatat atatatatag caacccttct ttataagggt 2220
cctatagact atactcttca cactttaaag tacggaatta aggcccaagg gaactaacaa 2280
aaacgttcaa aaagttttaa aactatatgt gttaactgta caaaaataac ttatttatca 2340
tatcattttt ttctctgttt atttcttcta gaacttatac ctgtcttttc cttttattct 2400
ttgaatttgk tttaatatcc ctttttgktt taatatccat ccattccttt cacttagaac 2460
taataattcc cttcgtttga taatttatca ttttcctttt ctgttagtaa agtacccatt 2520
aaatgaagct ggagcgcgtg agttctaacg ggagctttaa gcgtggccgt gacatccaaa 2580
gtttggagag tccgtgtacc cgcccattaa agaaaatgtc gccatcacct tcatttacga 2640
gcctgaagat ggaaaaaccg tttaaggaca ttgttcgaaa atacgggggt cacctgcacc 2700
agtcctcgta taacccaggt tcttcaaaag ttgaactcgt gcgtccggac ctgagcttga 2760
aaacggacca atcatttttg cagagcagcg tgcagacaac cccgaacaaa aagagttgta 2820
acgagtatct gtccacaccc gaagccactc cccttaagaa cacggccacc gagaatgcgt 2880
gggctacgtc aagggtggtg agcgcatcaa gcctgtcaat cgtcacgccg accgaaatca 2940
aaaatatact ggttgacgag tttagtgaac taaaacttgg tcagccctta acagcccagc 3000
accaacggag ccatgcagtt ttcgagatac ctgagatcgt agagaacata atcaagatga 3060
tcgtttccct cgagagcgcc aatattccga aagaacgtcc gtgcctgcgt cgcaacccgc 3120
agagttatga gcattccctt ctgatgtata aagacgagga acgcgcgaag aaagcatggt 3180
ccgcggctca acaactgcgc gatccgccgc tggtgggtca taaggaaaaa aaacagggcg 3240
ctctgtttag ctgcatgatg gtcaaccgcc tgtggttgaa tgtcacgcgt ccgttcttat 3300
ttaagtctct gcatttcaaa tcagtgcaca acttcaaaga atttctgcgc acaagtcagg 3360
aaaccacgca agtgatgagg ccatcgcact ttatcctgca taaattgcac caggtaacgc 3420
agccggatat tgagagactg tctagaatgg aatgccagaa cctcaagtgg ttggaatttt 3480
atgtatgtcc ccgtattaca cctccactgt cttggttcga caatttgcat aagttagaaa 3540
aattaatcat ccccggaaac aagaatatcg acgataattt cctcttacgg ctgtctcaga 3600
gtattcctaa cctgaaacac ctcgtgcttc gtgcttgcga caatgtttcc gatagtggtg 3660
tagtttgtat cgccctgaac tgccctaagc tgaagacgtt caacatcgga cgtcatcgcc 3720
gcggcaatct gattacatca gttagcttgg ttgccctggg taagtatacg caagttgaga 3780
ccgttggttt tgcaggctgc gatgtggacg acgcaggcat atgggagttc gcgcgtttaa 3840
acgggaaaaa cgtcgagcgc ctgtcactca acagttgccg gcttttaacc gactatagct 3900
tgccaatcct gtttgccctt aatagtttcc cgaaccttgc ggtgttggaa attcgaaacc 3960
tcgataaaat tacagatgtc cgccattttg tgaaatataa tctgtggaag aaatcactgg 4020
atgctcctat cctgattgag gcgtgcgaac gcataacaaa gctgattgat caggaagaga 4080
accgggtcaa acgcataaat agcctggtcg ctttaaagga tatgaccgcg tgggtgaacg 4140
ctgacgatga aattgaaaac aacgtcgatt gagacgatga aattgaaaac aacgtcgatt 4200
gaggtaccat ggtttttgtg actttaccta taaatagtac acaacagacc accagtaatt 4260
ctacacactt cttaactgat aatattatta taattgtaac tttttagcag cactaaattt 4320
aatgaataca tagattttta actagcattt tactattctg tactttttac ttgaaattcc 4380
agaagggccg aagaaaccag aattccttca cagaaaacga attcactggc cgtcgtttta 4440
caacgtcgtg actgggaaaa ccctggcgtt acccaactta atcgccttgc agcacatccc 4500
cctttcgcca gctggcgtaa tagcgaagag gcccgcaccg atcgcccttc ccaacagttg 4560
cgcagcctga atggcgaatg gcgcctgatg cggtattttc tccttacgca tctgtgcggt 4620
atttcacacc gcatatggtg cactctcagt acaatctgct ctgatgccgc atagttaagc 4680
cagccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct gctcccggca 4740
tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag gttttcaccg 4800
tcatcaccga aacgcgcgag acgaaagggc ctcgtgatac gcctattttt ataggttaat 4860
gtcatgataa taatggtttc ttagacgtca ggtggcactt ttcggggaaa tgtgcgcgga 4920
acccctattt gtttattttt ctaaatacat tcaaatatgt atccgctcat gagacaataa 4980
ccctgataaa tgcttcaata atattgaaaa aggaagagta tgagtattca acatttccgt 5040
gtcgccctta ttcccttttt tgcggcattt tgccttcctg tttttgctca cccagaaacg 5100
ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac gagtgggtta catcgaactg 5160
gatctcaaca gcggtaagat ccttgagagt tttcgccccg aagaacgttt tccaatgatg 5220
agcactttta aagttctgct atgtggcgcg gtattatccc gtattgacgc cgggcaagag 5280
caactcggtc gccgcataca ctattctcag aatgacttgg ttgagtactc accagtcaca 5340
gaaaagcatc ttacggatgg catgacagta agagaattat gcagtgctgc cataaccatg 5400
agtgataaca ctgcggccaa cttacttctg acaacgatcg gaggaccgaa ggagctaacc 5460
gcttttttgc acaacatggg ggatcatgta actcgccttg atcgttggga accggagctg 5520
aatgaagcca taccaaacga cgagcgtgac accacgatgc ctgtagcaat ggcaacaacg 5580
ttgcgcaaac tattaactgg cgaactactt actctagctt cccggcaaca attaatagac 5640
tggatggagg cggataaagt tgcaggacca cttctgcgct cggcccttcc ggctggctgg 5700
tttattgctg ataaatctgg agccggtgag cgtgggtctc gcggtatcat tgcagcactg 5760
gggccagatg gtaagccctc ccgtatcgta gttatctaca cgacggggag tcaggcaact 5820
atggatgaac gaaatagaca gatcgctgag ataggtgcct cactgattaa gcattggtaa 5880
ctgtcagacc aagtttactc atatatactt tagattgatt taaaacttca tttttaattt 5940
aaaaggatct aggtgaagat cctttttgat aatctcatga ccaaaatccc ttaacgtgag 6000
ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc ttgagatcct 6060
ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt 6120
tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg 6180
cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct 6240
gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc 6300
gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg 6360
tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa 6420
ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg 6480
gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg 6540
ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga 6600
tttttgtgat gctcgtcagg ggggcggagc ctatggaa 6638
<210> 101
<211> 100
<212> DNA
<213> Artificial Sequence
<220>
<223> LA712
<400> 101
cttaattgaa agaaagaatt tccttcaact tcggtttcct ggttccgcta tttctcgctt 60
gtttcttcta gcattgcgga ttacgtattc taatgttcag 100
<210> 102
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> LA746
<400> 102
gttttctgtg aaggaattct ggtttcttcg 30
<210> 103
<211> 7938
<212> DNA
<213> Artificial Sequence
<220>
<223> pYZ067deltakivDdeltahADH
<400> 103
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accataaatt cccgttttaa gagcttggtg agcgctagga gtcactgcca ggtatcgttt 240
gaacacggca ttagtcaggg aagtcataac acagtccttt cccgcaattt tctttttcta 300
ttactcttgg cctcctctag tacactctat atttttttat gcctcggtaa tgattttcat 360
tttttttttt ccacctagcg gatgactctt tttttttctt agcgattggc attatcacat 420
aatgaattat acattatata aagtaatgtg atttcttcga agaatatact aaaaaatgag 480
caggcaagat aaacgaaggc aaagatgaca gagcagaaag ccctagtaaa gcgtattaca 540
aatgaaacca agattcagat tgcgatctct ttaaagggtg gtcccctagc gatagagcac 600
tcgatcttcc cagaaaaaga ggcagaagca gtagcagaac aggccacaca atcgcaagtg 660
attaacgtcc acacaggtat agggtttctg gaccatatga tacatgctct ggccaagcat 720
tccggctggt cgctaatcgt tgagtgcatt ggtgacttac acatagacga ccatcacacc 780
actgaagact gcgggattgc tctcggtcaa gcttttaaag aggccctagg ggccgtgcgt 840
ggagtaaaaa ggtttggatc aggatttgcg cctttggatg aggcactttc cagagcggtg 900
gtagatcttt cgaacaggcc gtacgcagtt gtcgaacttg gtttgcaaag ggagaaagta 960
ggagatctct cttgcgagat gatcccgcat tttcttgaaa gctttgcaga ggctagcaga 1020
attaccctcc acgttgattg tctgcgaggc aagaatgatc atcaccgtag tgagagtgcg 1080
ttcaaggctc ttgcggttgc cataagagaa gccacctcgc ccaatggtac caacgatgtt 1140
ccctccacca aaggtgttct tatgtagtga caccgattat ttaaagctgc agcatacgat 1200
atatatacat gtgtatatat gtatacctat gaatgtcagt aagtatgtat acgaacagta 1260
tgatactgaa gatgacaagg taatgcatca ttctatacgt gtcattctga acgaggcgcg 1320
ctttcctttt ttctttttgc tttttctttt tttttctctt gaactcgacg gatctatgcg 1380
gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggaaat tgtaagcgtt 1440
aatattttgt taaaattcgc gttaaatttt tgttaaatca gctcattttt taaccaatag 1500
gccgaaatcg gcaaaatccc ttataaatca aaagaataga ccgagatagg gttgagtgtt 1560
gttccagttt ggaacaagag tccactatta aagaacgtgg actccaacgt caaagggcga 1620
aaaaccgtct atcagggcga tggcccacta cgtggccggc ttcacatacg ttgcatacgt 1680
cgatatagat aataatgata atgacagcag gattatcgta atacgtaata gctgaaaatc 1740
tcaaaaatgt gtgggtcatt acgtaaataa tgataggaat gggattcttc tatttttcct 1800
ttttccattc tagcagccgt cgggaaaacg tggcatcctc tctttcgggc tcaattggag 1860
tcacgctgcc gtgagcatcc tctctttcca tatctaacaa ctgagcacgt aaccaatgga 1920
aaagcatgag cttagcgttg ctccaaaaaa gtattggatg gttaatacca tttgtctgtt 1980
ctcttctgac tttgactcct caaaaaaaaa aatctacaat caacagatcg cttcaattac 2040
gccctcacaa aaactttttt ccttcttctt cgcccacgtt aaattttatc cctcatgttg 2100
tctaacggat ttctgcactt gatttattat aaaaagacaa agacataata cttctctatc 2160
aatttcagtt attgttcttc cttgcgttat tcttctgttc ttctttttct tttgtcatat 2220
ataaccataa ccaagtaata catattcaaa cacgtgagta tgactgacaa aaaaactctt 2280
aaagacttaa gaaatcgtag ttctgtttac gattcaatgg ttaaatcacc taatcgtgct 2340
atgttgcgtg caactggtat gcaagatgaa gactttgaaa aacctatcgt cggtgtcatt 2400
tcaacttggg ctgaaaacac accttgtaat atccacttac atgactttgg taaactagcc 2460
aaagtcggtg ttaaggaagc tggtgcttgg ccagttcagt tcggaacaat cacggtttct 2520
gatggaatcg ccatgggaac ccaaggaatg cgtttctcct tgacatctcg tgatattatt 2580
gcagattcta ttgaagcagc catgggaggt cataatgcgg atgcttttgt agccattggc 2640
ggttgtgata aaaacatgcc cggttctgtt atcgctatgg ctaacatgga tatcccagcc 2700
atttttgctt acggcggaac aattgcacct ggtaatttag acggcaaaga tatcgattta 2760
gtctctgtct ttgaaggtgt cggccattgg aaccacggcg atatgaccaa agaagaagtt 2820
aaagctttgg aatgtaatgc ttgtcccggt cctggaggct gcggtggtat gtatactgct 2880
aacacaatgg cgacagctat tgaagttttg ggacttagcc ttccgggttc atcttctcac 2940
ccggctgaat ccgcagaaaa gaaagcagat attgaagaag ctggtcgcgc tgttgtcaaa 3000
atgctcgaaa tgggcttaaa accttctgac attttaacgc gtgaagcttt tgaagatgct 3060
attactgtaa ctatggctct gggaggttca accaactcaa cccttcacct cttagctatt 3120
gcccatgctg ctaatgtgga attgacactt gatgatttca atactttcca agaaaaagtt 3180
cctcatttgg ctgatttgaa accttctggt caatatgtat tccaagacct ttacaaggtc 3240
ggaggggtac cagcagttat gaaatatctc cttaaaaatg gcttccttca tggtgaccgt 3300
atcacttgta ctggcaaaac agtcgctgaa aatttgaagg cttttgatga tttaacacct 3360
ggtcaaaagg ttattatgcc gcttgaaaat cctaaacgtg aagatggtcc gctcattatt 3420
ctccatggta acttggctcc agacggtgcc gttgccaaag tttctggtgt aaaagtgcgt 3480
cgtcatgtcg gtcctgctaa ggtctttaat tctgaagaag aagccattga agctgtcttg 3540
aatgatgata ttgttgatgg tgatgttgtt gtcgtacgtt ttgtaggacc aaagggcggt 3600
cctggtatgc ctgaaatgct ttccctttca tcaatgattg ttggtaaagg gcaaggtgaa 3660
aaagttgccc ttctgacaga tggccgcttc tcaggtggta cttatggtct tgtcgtgggt 3720
catatcgctc ctgaagcaca agatggcggt ccaatcgcct acctgcaaac aggagacata 3780
gtcactattg accaagacac taaggaatta cactttgata tctccgatga agagttaaaa 3840
catcgtcaag agaccattga attgccaccg ctctattcac gcggtatcct tggtaaatat 3900
gctcacatcg tttcgtctgc ttctagggga gccgtaacag acttttggaa gcctgaagaa 3960
actggcaaaa aatgttgtcc tggttgctgt ggttaagcgg ccgcgttaat tcaaattaat 4020
tgatatagtt ttttaatgag tattgaatct gtttagaaat aatggaatat tatttttatt 4080
tatttattta tattattggt cggctctttt cttctgaagg tcaatgacaa aatgatatga 4140
aggaaataat gatttctaaa attttacaac gtaagatatt tttacaaaag cctagctcat 4200
cttttgtcat gcactatttt actcacgctt gaaattaacg gccagtccac tgcggagtca 4260
tttcaaagtc atcctaatcg atctatcgtt tttgatagct cattttggag ttcgcgagga 4320
tcccagcttt tgttcccttt agtgagggtt aattgcgcgc ttggcgtaat catggtcata 4380
gctgtttcct gtgtgaaatt gttatccgct cacaattcca cacaacatac gagccggaag 4440
cataaagtgt aaagcctggg gtgcctaatg agtgagctaa ctcacattaa ttgcgttgcg 4500
ctcactgccc gctttccagt cgggaaacct gtcgtgccag ctgcattaat gaatcggcca 4560
acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc 4620
gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg 4680
gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa 4740
ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga 4800
cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag 4860
ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct 4920
taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc atagctcacg 4980
ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc 5040
ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt 5100
aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta 5160
tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaagaac 5220
agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc 5280
ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat 5340
tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc 5400
tcagtggaac gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt 5460
cacctagatc cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta 5520
aacttggtct gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct 5580
atttcgttca tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg 5640
cttaccatct ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga 5700
tttatcagca ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt 5760
atccgcctcc atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt 5820
taatagtttg cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt 5880
tggtatggct tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat 5940
gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc 6000
cgcagtgtta tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc 6060
cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat 6120
gcggcgaccg agttgctctt gcccggcgtc aatacgggat aataccgcgc cacatagcag 6180
aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt 6240
accgctgttg agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc 6300
ttttactttc accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa 6360
gggaataagg gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg 6420
aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa 6480
taaacaaata ggggttccgc gcacatttcc ccgaaaagtg ccacctgaac gaagcatctg 6540
tgcttcattt tgtagaacaa aaatgcaacg cgagagcgct aatttttcaa acaaagaatc 6600
tgagctgcat ttttacagaa cagaaatgca acgcgaaagc gctattttac caacgaagaa 6660
tctgtgcttc atttttgtaa aacaaaaatg caacgcgaga gcgctaattt ttcaaacaaa 6720
gaatctgagc tgcattttta cagaacagaa atgcaacgcg agagcgctat tttaccaaca 6780
aagaatctat acttcttttt tgttctacaa aaatgcatcc cgagagcgct atttttctaa 6840
caaagcatct tagattactt tttttctcct ttgtgcgctc tataatgcag tctcttgata 6900
actttttgca ctgtaggtcc gttaaggtta gaagaaggct actttggtgt ctattttctc 6960
ttccataaaa aaagcctgac tccacttccc gcgtttactg attactagcg aagctgcggg 7020
tgcatttttt caagataaag gcatccccga ttatattcta taccgatgtg gattgcgcat 7080
actttgtgaa cagaaagtga tagcgttgat gattcttcat tggtcagaaa attatgaacg 7140
gtttcttcta ttttgtctct atatactacg tataggaaat gtttacattt tcgtattgtt 7200
ttcgattcac tctatgaata gttcttacta caattttttt gtctaaagag taatactaga 7260
gataaacata aaaaatgtag aggtcgagtt tagatgcaag ttcaaggagc gaaaggtgga 7320
tgggtaggtt atatagggat atagcacaga gatatatagc aaagagatac ttttgagcaa 7380
tgtttgtgga agcggtattc gcaatatttt agtagctcgt tacagtccgg tgcgtttttg 7440
gttttttgaa agtgcgtctt cagagcgctt ttggttttca aaagcgctct gaagttccta 7500
tactttctag agaataggaa cttcggaata ggaacttcaa agcgtttccg aaaacgagcg 7560
cttccgaaaa tgcaacgcga gctgcgcaca tacagctcac tgttcacgtc gcacctatat 7620
ctgcgtgttg cctgtatata tatatacatg agaagaacgg catagtgcgt gtttatgctt 7680
aaatgcgtac ttatatgcgt ctatttatgt aggatgaaag gtagtctagt acctcctgtg 7740
atattatccc attccatgcg gggtatcgta tgcttccttc agcactaccc tttagctgtt 7800
ctatatgctg ccactcctca attggattag tctcatcctt caatgctatc atttcctttg 7860
atattggatc atactaagaa accattatta tcatgacatt aacctataaa aataggcgta 7920
tcacgaggcc ctttcgtc 7938
<210> 104
<211> 9613
<212> DNA
<213> Artificial Sequence
<220>
<223> pHR81-ILV5p-K9JB4P
<400> 104
aaacagtatg gaagaatgta agatggctaa gatttactac caagaagact gtaacttgtc 60
cttgttggat ggtaagacta tcgccgttat cggttacggt tctcaaggtc acgctcatgc 120
cctgaatgct aaggaatccg gttgtaacgt tatcattggt ttatacgaag gtgcggagga 180
gtggaaaaga gctgaagaac aaggtttcga agtctacacc gctgctgaag ctgctaagaa 240
ggctgacatc attatgatct tgatcccaga tgaaaagcag gctaccatgt acaaaaacga 300
catcgaacca aacttggaag ccggtaacat gttgatgttc gctcacggtt tcaacatcca 360
tttcggttgt attgttccac caaaggacgt tgatgtcact atgatcgctc caaagggtcc 420
aggtcacacc gttagatccg aatacgaaga aggtaaaggt gtcccatgct tggttgctgt 480
cgaacaagac gctactggca aggctttgga tatggctttg gcctacgctt tagccatcgg 540
tggtgctaga gccggtgtct tggaaactac cttcagaacc gaaactgaaa ccgacttgtt 600
cggtgaacaa gctgttttat gtggtggtgt ctgcgctttg atgcaggccg gttttgaaac 660
cttggttgaa gccggttacg acccaagaaa cgcttacttc gaatgtatcc acgaaatgaa 720
gttgatcgtt gacttgatct accaatctgg tttctccggt atgcgttact ctatctccaa 780
cactgctgaa tacggtgact acattaccgg tccaaagatc attactgaag ataccaagaa 840
ggctatgaag aagattttgt ctgacattca agatggtacc tttgccaagg acttcttggt 900
tgacatgtct gatgctggtt cccaggtcca cttcaaggct atgagaaagt tggcctccga 960
acacccagct gaagttgtcg gtgaagaaat tagatccttg tactcctggt ccgacgaaga 1020
caagttgatt aacaactgag gccctgcagg ccagaggaaa ataatatcaa gtgctggaaa 1080
ctttttctct tggaattttt gcaacatcaa gtcatagtca attgaattga cccaatttca 1140
catttaagat tttttttttt tcatccgaca tacatctgta cactaggaag ccctgttttt 1200
ctgaagcagc ttcaaatata tatatttttt acatatttat tatgattcaa tgaacaatct 1260
aattaaatcg aaaacaagaa ccgaaacgcg aataaataat ttatttagat ggtgacaagt 1320
gtataagtcc tcatcgggac agctacgatt tctctttcgg ttttggctga gctactggtt 1380
gctgtgacgc agcggcatta gcgcggcgtt atgagctacc ctcgtggcct gaaagatggc 1440
gggaataaag cggaactaaa aattactgac tgagccatat tgaggtcaat ttgtcaactc 1500
gtcaagtcac gtttggtgga cggccccttt ccaacgaatc gtatatacta acatgcgcgc 1560
gcttcctata tacacatata catatatata tatatatata tgtgtgcgtg tatgtgtaca 1620
cctgtattta atttccttac tcgcgggttt ttcttttttc tcaattcttg gcttcctctt 1680
tctcgagcgg accggatcct ccgcggtgcc ggcagatcta tttaaatggc gcgccgacgt 1740
caggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac 1800
attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa 1860
aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat 1920
tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc 1980
agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga 2040
gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg 2100
cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc 2160
agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag 2220
taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc 2280
tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg 2340
taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg 2400
acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac 2460
ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac 2520
cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg 2580
agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg 2640
tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg 2700
agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac tcatatatac 2760
tttagattga tttaaaactt catttttaat ttaaaaggat ctaggtgaag atcctttttg 2820
ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg 2880
tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc 2940
aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc 3000
tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtt cttctagtgt 3060
agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc 3120
taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact 3180
caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac 3240
agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt gagctatgag 3300
aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg 3360
gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg 3420
tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga 3480
gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt 3540
ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct 3600
ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg 3660
aggaagcgga agagcgccca atacgcaaac cgcctctccc cgcgcgttgg ccgattcatt 3720
aatgcagctg gcacgacagg tttcccgact ggaaagcggg cagtgagcgc aacgcaatta 3780
atgtgagtta gctcactcat taggcacccc aggctttaca ctttatgctt ccggctcgta 3840
tgttgtgtgg aattgtgagc ggataacaat ttcacacagg aaacagctat gaccatgatt 3900
acgccaagct ttttctttcc aatttttttt ttttcgtcat tataaaaatc attacgaccg 3960
agattcccgg gtaataactg atataattaa attgaagctc taatttgtga gtttagtata 4020
catgcattta cttataatac agttttttag ttttgctggc cgcatcttct caaatatgct 4080
tcccagcctg cttttctgta acgttcaccc tctaccttag catcccttcc ctttgcaaat 4140
agtcctcttc caacaataat aatgtcagat cctgtagaga ccacatcatc cacggttcta 4200
tactgttgac ccaatgcgtc tcccttgtca tctaaaccca caccgggtgt cataatcaac 4260
caatcgtaac cttcatctct tccacccatg tctctttgag caataaagcc gataacaaaa 4320
tctttgtcgc tcttcgcaat gtcaacagta cccttagtat attctccagt agatagggag 4380
cccttgcatg acaattctgc taacatcaaa aggcctctag gttcctttgt tacttcttct 4440
gccgcctgct tcaaaccgct aacaatacct gggcccacca caccgtgtgc attcgtaatg 4500
tctgcccatt ctgctattct gtatacaccc gcagagtact gcaatttgac tgtattacca 4560
atgtcagcaa attttctgtc ttcgaagagt aaaaaattgt acttggcgga taatgccttt 4620
agcggcttaa ctgtgccctc catggaaaaa tcagtcaaga tatccacatg tgtttttagt 4680
aaacaaattt tgggacctaa tgcttcaact aactccagta attccttggt ggtacgaaca 4740
tccaatgaag cacacaagtt tgtttgcttt tcgtgcatga tattaaatag cttggcagca 4800
acaggactag gatgagtagc agcacgttcc ttatatgtag ctttcgacat gatttatctt 4860
cgtttcctgc aggtttttgt tctgtgcagt tgggttaaga atactgggca atttcatgtt 4920
tcttcaacac tacatatgcg tatatatacc aatctaagtc tgtgctcctt ccttcgttct 4980
tccttctgtt cggagattac cgaatcaaaa aaatttcaag gaaaccgaaa tcaaaaaaaa 5040
gaataaaaaa aaaatgatga attgaaaagc ttgcatgcct gcaggtcgac tctagtatac 5100
tccgtctact gtacgataca cttccgctca ggtccttgtc ctttaacgag gccttaccac 5160
tcttttgtta ctctattgat ccagctcagc aaaggcagtg tgatctaaga ttctatcttc 5220
gcgatgtagt aaaactagct agaccgagaa agagactaga aatgcaaaag gcacttctac 5280
aatggctgcc atcattatta tccgatgtga cgctgcattt tttttttttt tttttttttt 5340
tttttttttt tttttttttt tttttttttg tacaaatatc ataaaaaaag agaatctttt 5400
taagcaagga ttttcttaac ttcttcggcg acagcatcac cgacttcggt ggtactgttg 5460
gaaccaccta aatcaccagt tctgatacct gcatccaaaa cctttttaac tgcatcttca 5520
atggctttac cttcttcagg caagttcaat gacaatttca acatcattgc agcagacaag 5580
atagtggcga tagggttgac cttattcttt ggcaaatctg gagcggaacc atggcatggt 5640
tcgtacaaac caaatgcggt gttcttgtct ggcaaagagg ccaaggacgc agatggcaac 5700
aaacccaagg agcctgggat aacggaggct tcatcggaga tgatatcacc aaacatgttg 5760
ctggtgatta taataccatt taggtgggtt gggttcttaa ctaggatcat ggcggcagaa 5820
tcaatcaatt gatgttgaac tttcaatgta gggaattcgt tcttgatggt ttcctccaca 5880
gtttttctcc ataatcttga agaggccaaa acattagctt tatccaagga ccaaataggc 5940
aatggtggct catgttgtag ggccatgaaa gcggccattc ttgtgattct ttgcacttct 6000
ggaacggtgt attgttcact atcccaagcg acaccatcac catcgtcttc ctttctctta 6060
ccaaagtaaa tacctcccac taattctcta acaacaacga agtcagtacc tttagcaaat 6120
tgtggcttga ttggagataa gtctaaaaga gagtcggatg caaagttaca tggtcttaag 6180
ttggcgtaca attgaagttc tttacggatt tttagtaaac cttgttcagg tctaacacta 6240
ccggtacccc atttaggacc acccacagca cctaacaaaa cggcatcagc cttcttggag 6300
gcttccagcg cctcatctgg aagtggaaca cctgtagcat cgatagcagc accaccaatt 6360
aaatgatttt cgaaatcgaa cttgacattg gaacgaacat cagaaatagc tttaagaacc 6420
ttaatggctt cggctgtgat ttcttgacca acgtggtcac ctggcaaaac gacgatcttc 6480
ttaggggcag acattacaat ggtatatcct tgaaatatat ataaaaaaaa aaaaaaaaaa 6540
aaaaaaaaaa aatgcagctt ctcaatgata ttcgaatacg ctttgaggag atacagccta 6600
atatccgaca aactgtttta cagatttacg atcgtacttg ttacccatca ttgaattttg 6660
aacatccgaa cctgggagtt ttccctgaaa cagatagtat atttgaacct gtataataat 6720
atatagtcta gcgctttacg gaagacaatg tatgtatttc ggttcctgga gaaactattg 6780
catctattgc ataggtaatc ttgcacgtcg catccccggt tcattttctg cgtttccatc 6840
ttgcacttca atagcatatc tttgttaacg aagcatctgt gcttcatttt gtagaacaaa 6900
aatgcaacgc gagagcgcta atttttcaaa caaagaatct gagctgcatt tttacagaac 6960
agaaatgcaa cgcgaaagcg ctattttacc aacgaagaat ctgtgcttca tttttgtaaa 7020
acaaaaatgc aacgcgagag cgctaatttt tcaaacaaag aatctgagct gcatttttac 7080
agaacagaaa tgcaacgcga gagcgctatt ttaccaacaa agaatctata cttctttttt 7140
gttctacaaa aatgcatccc gagagcgcta tttttctaac aaagcatctt agattacttt 7200
ttttctcctt tgtgcgctct ataatgcagt ctcttgataa ctttttgcac tgtaggtccg 7260
ttaaggttag aagaaggcta ctttggtgtc tattttctct tccataaaaa aagcctgact 7320
ccacttcccg cgtttactga ttactagcga agctgcgggt gcattttttc aagataaagg 7380
catccccgat tatattctat accgatgtgg attgcgcata ctttgtgaac agaaagtgat 7440
agcgttgatg attcttcatt ggtcagaaaa ttatgaacgg tttcttctat tttgtctcta 7500
tatactacgt ataggaaatg tttacatttt cgtattgttt tcgattcact ctatgaatag 7560
ttcttactac aatttttttg tctaaagagt aatactagag ataaacataa aaaatgtaga 7620
ggtcgagttt agatgcaagt tcaaggagcg aaaggtggat gggtaggtta tatagggata 7680
tagcacagag atatatagca aagagatact tttgagcaat gtttgtggaa gcggtattcg 7740
caatatttta gtagctcgtt acagtccggt gcgtttttgg ttttttgaaa gtgcgtcttc 7800
agagcgcttt tggttttcaa aagcgctctg aagttcctat actttctaga gaataggaac 7860
ttcggaatag gaacttcaaa gcgtttccga aaacgagcgc ttccgaaaat gcaacgcgag 7920
ctgcgcacat acagctcact gttcacgtcg cacctatatc tgcgtgttgc ctgtatatat 7980
atatacatga gaagaacggc atagtgcgtg tttatgctta aatgcgtact tatatgcgtc 8040
tatttatgta ggatgaaagg tagtctagta cctcctgtga tattatccca ttccatgcgg 8100
ggtatcgtat gcttccttca gcactaccct ttagctgttc tatatgctgc cactcctcaa 8160
ttggattagt ctcatccttc aatgctatca tttcctttga tattggatca tatgcatagt 8220
accgagaaac tagaggatct cccattaccg acatttgggc gctatacgtg catatgttca 8280
tgtatgtatc tgtatttaaa acacttttgt attatttttc ctcatatatg tgtataggtt 8340
tatacggatg atttaattat tacttcacca ccctttattt caggctgata tcttagcctt 8400
gttactagtc accggtggcg gccgcacctg gtaaaacctc tagtggagta gtagatgtaa 8460
tcaatgaagc ggaagccaaa agaccagagt agaggcctat agaagaaact gcgatacctt 8520
ttgtgatggc taaacaaaca gacatctttt tatatgtttt tacttctgta tatcgtgaag 8580
tagtaagtga taagcgaatt tggctaagaa cgttgtaagt gaacaaggga cctcttttgc 8640
ctttcaaaaa aggattaaat ggagttaatc attgagattt agttttcgtt agattctgta 8700
tccctaaata actcccttac ccgacgggaa ggcacaaaag acttgaataa tagcaaacgg 8760
ccagtagcca agaccaaata atactagagt taactgatgg tcttaaacag gcattacgtg 8820
gtgaactcca agaccaatat acaaaatatc gataagttat tcttgcccac caatttaagg 8880
agcctacatc aggacagtag taccattcct cagagaagag gtatacataa caagaaaatc 8940
gcgtgaacac cttatataac ttagcccgtt attgagctaa aaaaccttgc aaaatttcct 9000
atgaataaga atacttcaga cgtgataaaa atttactttc taactcttct cacgctgccc 9060
ctatctgttc ttccgctcta ccgtgagaaa taaagcatcg agtacggcag ttcgctgtca 9120
ctgaactaaa acaataaggc tagttcgaat gatgaacttg cttgctgtca aacttctgag 9180
ttgccgctga tgtgacactg tgacaataaa ttcaaaccgg ttatagcggt ctcctccggt 9240
accggttctg ccacctccaa tagagctcag taggagtcag aacctctgcg gtggctgtca 9300
gtgactcatc cgcgtttcgt aagttgtgcg cgtgcacatt tcgcccgttc ccgctcatct 9360
tgcagcaggc ggaaattttc atcacgctgt aggacgcaaa aaaaaaataa ttaatcgtac 9420
aagaatcttg gaaaaaaaat tgaaaaattt tgtataaaag ggatgaccta acttgactca 9480
atggctttta cacccagtat tttccctttc cttgtttgtt acaattatag aagcaagaca 9540
aaaacatata gacaacctat tcctaggagt tatatttttt taccctacca gcaatataag 9600
taaaaaactg ttt 9613
<210> 105
<211> 9598
<212> DNA
<213> Artificial Sequence
<220>
<223> pHR81-ILV5p-K9SB2-SH
<400> 105
aaacagtatg gctaagattt actaccaaga agactgtaac ttgtccttgt tggatggtaa 60
gactatcgcc gttatcggtt acggttctca aggtcacgct catgccctga atgctaagga 120
atccggttgt aacgttatca ttggtttatt cgaaggtgcg gaggagtgga aaagagctga 180
agaacaaggt ttcgaagtct acaccgctgc tgaagctgct aagaaggctg acatcattat 240
gatcttgatc ccagatgaaa agcaggctac catgtacaaa aacgacatcg aaccaaactt 300
ggaagccggt aacatgttga tgttcgctca cggtttcaac atccatttcg gttgtattgt 360
tccaccaaag gacgttgatg tcactatgat cgctccaaag ggtccaggtc acaccgttag 420
atccgaatac gaagaaggta aaggtgtccc atgcttggtt gctgtcgaac aagacgctac 480
tggcaaggct ttggatatgg ctttggccta cgctttagcc atcggtggtg ctagagccgg 540
tgtcttggaa actaccttca gaaccgaaac tgaaaccgac ttgttcggtg aacaagctgt 600
tttatgtggt ggtgtctgcg ctttgatgca ggccggtttt gaaaccttgg ttgaagccgg 660
ttacgaccca agaaacgctt acttcgaatg tatccacgaa atgaagttga tcgttgactt 720
gatctaccaa tctggtttct ccggtatgcg ttactctatc tccaacactg ctgaatacgg 780
tgactacatt accggtccaa agatcattac tgaagatacc aagaaggcta tgaagaagat 840
tttgtctgac attcaagatg gtacctttgc caaggacttc ttggttgaca tgtctgatgc 900
tggttcccag gtccacttca aggctatgag aaagttggcc tccgaacacc cagctgaagt 960
tgtcggtgaa gaaattagat ccttgtactc ctggtccgac gaagacaagt tgattaacaa 1020
ctgaggccct gcaggccaga ggaaaataat atcaagtgct ggaaactttt tctcttggaa 1080
tttttgcaac atcaagtcat agtcaattga attgacccaa tttcacattt aagatttttt 1140
ttttttcatc cgacatacat ctgtacacta ggaagccctg tttttctgaa gcagcttcaa 1200
atatatatat tttttacata tttattatga ttcaatgaac aatctaatta aatcgaaaac 1260
aagaaccgaa acgcgaataa ataatttatt tagatggtga caagtgtata agtcctcatc 1320
gggacagcta cgatttctct ttcggttttg gctgagctac tggttgctgt gacgcagcgg 1380
cattagcgcg gcgttatgag ctaccctcgt ggcctgaaag atggcgggaa taaagcggaa 1440
ctaaaaatta ctgactgagc catattgagg tcaatttgtc aactcgtcaa gtcacgtttg 1500
gtggacggcc cctttccaac gaatcgtata tactaacatg cgcgcgcttc ctatatacac 1560
atatacatat atatatatat atatatgtgt gcgtgtatgt gtacacctgt atttaatttc 1620
cttactcgcg ggtttttctt ttttctcaat tcttggcttc ctctttctcg agcggaccgg 1680
atcctccgcg gtgccggcag atctatttaa atggcgcgcc gacgtcaggt ggcacttttc 1740
ggggaaatgt gcgcggaacc cctatttgtt tatttttcta aatacattca aatatgtatc 1800
cgctcatgag acaataaccc tgataaatgc ttcaataata ttgaaaaagg aagagtatga 1860
gtattcaaca tttccgtgtc gcccttattc ccttttttgc ggcattttgc cttcctgttt 1920
ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga agatcagttg ggtgcacgag 1980
tgggttacat cgaactggat ctcaacagcg gtaagatcct tgagagtttt cgccccgaag 2040
aacgttttcc aatgatgagc acttttaaag ttctgctatg tggcgcggta ttatcccgta 2100
ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta ttctcagaat gacttggttg 2160
agtactcacc agtcacagaa aagcatctta cggatggcat gacagtaaga gaattatgca 2220
gtgctgccat aaccatgagt gataacactg cggccaactt acttctgaca acgatcggag 2280
gaccgaagga gctaaccgct tttttgcaca acatggggga tcatgtaact cgccttgatc 2340
gttgggaacc ggagctgaat gaagccatac caaacgacga gcgtgacacc acgatgcctg 2400
tagcaatggc aacaacgttg cgcaaactat taactggcga actacttact ctagcttccc 2460
ggcaacaatt aatagactgg atggaggcgg ataaagttgc aggaccactt ctgcgctcgg 2520
cccttccggc tggctggttt attgctgata aatctggagc cggtgagcgt gggtctcgcg 2580
gtatcattgc agcactgggg ccagatggta agccctcccg tatcgtagtt atctacacga 2640
cggggagtca ggcaactatg gatgaacgaa atagacagat cgctgagata ggtgcctcac 2700
tgattaagca ttggtaactg tcagaccaag tttactcata tatactttag attgatttaa 2760
aacttcattt ttaatttaaa aggatctagg tgaagatcct ttttgataat ctcatgacca 2820
aaatccctta acgtgagttt tcgttccact gagcgtcaga ccccgtagaa aagatcaaag 2880
gatcttcttg agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac 2940
cgctaccagc ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa 3000
ctggcttcag cagagcgcag ataccaaata ctgttcttct agtgtagccg tagttaggcc 3060
accacttcaa gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag 3120
tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac 3180
cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc 3240
gaacgaccta caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc 3300
ccgaagggag aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca 3360
cgagggagct tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc 3420
tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg 3480
ccagcaacgc ggccttttta cggttcctgg ccttttgctg gccttttgct cacatgttct 3540
ttcctgcgtt atcccctgat tctgtggata accgtattac cgcctttgag tgagctgata 3600
ccgctcgccg cagccgaacg accgagcgca gcgagtcagt gagcgaggaa gcggaagagc 3660
gcccaatacg caaaccgcct ctccccgcgc gttggccgat tcattaatgc agctggcacg 3720
acaggtttcc cgactggaaa gcgggcagtg agcgcaacgc aattaatgtg agttagctca 3780
ctcattaggc accccaggct ttacacttta tgcttccggc tcgtatgttg tgtggaattg 3840
tgagcggata acaatttcac acaggaaaca gctatgacca tgattacgcc aagctttttc 3900
tttccaattt tttttttttc gtcattataa aaatcattac gaccgagatt cccgggtaat 3960
aactgatata attaaattga agctctaatt tgtgagttta gtatacatgc atttacttat 4020
aatacagttt tttagttttg ctggccgcat cttctcaaat atgcttccca gcctgctttt 4080
ctgtaacgtt caccctctac cttagcatcc cttccctttg caaatagtcc tcttccaaca 4140
ataataatgt cagatcctgt agagaccaca tcatccacgg ttctatactg ttgacccaat 4200
gcgtctccct tgtcatctaa acccacaccg ggtgtcataa tcaaccaatc gtaaccttca 4260
tctcttccac ccatgtctct ttgagcaata aagccgataa caaaatcttt gtcgctcttc 4320
gcaatgtcaa cagtaccctt agtatattct ccagtagata gggagccctt gcatgacaat 4380
tctgctaaca tcaaaaggcc tctaggttcc tttgttactt cttctgccgc ctgcttcaaa 4440
ccgctaacaa tacctgggcc caccacaccg tgtgcattcg taatgtctgc ccattctgct 4500
attctgtata cacccgcaga gtactgcaat ttgactgtat taccaatgtc agcaaatttt 4560
ctgtcttcga agagtaaaaa attgtacttg gcggataatg cctttagcgg cttaactgtg 4620
ccctccatgg aaaaatcagt caagatatcc acatgtgttt ttagtaaaca aattttggga 4680
cctaatgctt caactaactc cagtaattcc ttggtggtac gaacatccaa tgaagcacac 4740
aagtttgttt gcttttcgtg catgatatta aatagcttgg cagcaacagg actaggatga 4800
gtagcagcac gttccttata tgtagctttc gacatgattt atcttcgttt cctgcaggtt 4860
tttgttctgt gcagttgggt taagaatact gggcaatttc atgtttcttc aacactacat 4920
atgcgtatat ataccaatct aagtctgtgc tccttccttc gttcttcctt ctgttcggag 4980
attaccgaat caaaaaaatt tcaaggaaac cgaaatcaaa aaaaagaata aaaaaaaaat 5040
gatgaattga aaagcttgca tgcctgcagg tcgactctag tatactccgt ctactgtacg 5100
atacacttcc gctcaggtcc ttgtccttta acgaggcctt accactcttt tgttactcta 5160
ttgatccagc tcagcaaagg cagtgtgatc taagattcta tcttcgcgat gtagtaaaac 5220
tagctagacc gagaaagaga ctagaaatgc aaaaggcact tctacaatgg ctgccatcat 5280
tattatccga tgtgacgctg catttttttt tttttttttt tttttttttt tttttttttt 5340
tttttttttt ttttgtacaa atatcataaa aaaagagaat ctttttaagc aaggattttc 5400
ttaacttctt cggcgacagc atcaccgact tcggtggtac tgttggaacc acctaaatca 5460
ccagttctga tacctgcatc caaaaccttt ttaactgcat cttcaatggc tttaccttct 5520
tcaggcaagt tcaatgacaa tttcaacatc attgcagcag acaagatagt ggcgataggg 5580
ttgaccttat tctttggcaa atctggagcg gaaccatggc atggttcgta caaaccaaat 5640
gcggtgttct tgtctggcaa agaggccaag gacgcagatg gcaacaaacc caaggagcct 5700
gggataacgg aggcttcatc ggagatgata tcaccaaaca tgttgctggt gattataata 5760
ccatttaggt gggttgggtt cttaactagg atcatggcgg cagaatcaat caattgatgt 5820
tgaactttca atgtagggaa ttcgttcttg atggtttcct ccacagtttt tctccataat 5880
cttgaagagg ccaaaacatt agctttatcc aaggaccaaa taggcaatgg tggctcatgt 5940
tgtagggcca tgaaagcggc cattcttgtg attctttgca cttctggaac ggtgtattgt 6000
tcactatccc aagcgacacc atcaccatcg tcttcctttc tcttaccaaa gtaaatacct 6060
cccactaatt ctctaacaac aacgaagtca gtacctttag caaattgtgg cttgattgga 6120
gataagtcta aaagagagtc ggatgcaaag ttacatggtc ttaagttggc gtacaattga 6180
agttctttac ggatttttag taaaccttgt tcaggtctaa cactaccggt accccattta 6240
ggaccaccca cagcacctaa caaaacggca tcagccttct tggaggcttc cagcgcctca 6300
tctggaagtg gaacacctgt agcatcgata gcagcaccac caattaaatg attttcgaaa 6360
tcgaacttga cattggaacg aacatcagaa atagctttaa gaaccttaat ggcttcggct 6420
gtgatttctt gaccaacgtg gtcacctggc aaaacgacga tcttcttagg ggcagacatt 6480
acaatggtat atccttgaaa tatatataaa aaaaaaaaaa aaaaaaaaaa aaaaaaatgc 6540
agcttctcaa tgatattcga atacgctttg aggagataca gcctaatatc cgacaaactg 6600
ttttacagat ttacgatcgt acttgttacc catcattgaa ttttgaacat ccgaacctgg 6660
gagttttccc tgaaacagat agtatatttg aacctgtata ataatatata gtctagcgct 6720
ttacggaaga caatgtatgt atttcggttc ctggagaaac tattgcatct attgcatagg 6780
taatcttgca cgtcgcatcc ccggttcatt ttctgcgttt ccatcttgca cttcaatagc 6840
atatctttgt taacgaagca tctgtgcttc attttgtaga acaaaaatgc aacgcgagag 6900
cgctaatttt tcaaacaaag aatctgagct gcatttttac agaacagaaa tgcaacgcga 6960
aagcgctatt ttaccaacga agaatctgtg cttcattttt gtaaaacaaa aatgcaacgc 7020
gagagcgcta atttttcaaa caaagaatct gagctgcatt tttacagaac agaaatgcaa 7080
cgcgagagcg ctattttacc aacaaagaat ctatacttct tttttgttct acaaaaatgc 7140
atcccgagag cgctattttt ctaacaaagc atcttagatt actttttttc tcctttgtgc 7200
gctctataat gcagtctctt gataactttt tgcactgtag gtccgttaag gttagaagaa 7260
ggctactttg gtgtctattt tctcttccat aaaaaaagcc tgactccact tcccgcgttt 7320
actgattact agcgaagctg cgggtgcatt ttttcaagat aaaggcatcc ccgattatat 7380
tctataccga tgtggattgc gcatactttg tgaacagaaa gtgatagcgt tgatgattct 7440
tcattggtca gaaaattatg aacggtttct tctattttgt ctctatatac tacgtatagg 7500
aaatgtttac attttcgtat tgttttcgat tcactctatg aatagttctt actacaattt 7560
ttttgtctaa agagtaatac tagagataaa cataaaaaat gtagaggtcg agtttagatg 7620
caagttcaag gagcgaaagg tggatgggta ggttatatag ggatatagca cagagatata 7680
tagcaaagag atacttttga gcaatgtttg tggaagcggt attcgcaata ttttagtagc 7740
tcgttacagt ccggtgcgtt tttggttttt tgaaagtgcg tcttcagagc gcttttggtt 7800
ttcaaaagcg ctctgaagtt cctatacttt ctagagaata ggaacttcgg aataggaact 7860
tcaaagcgtt tccgaaaacg agcgcttccg aaaatgcaac gcgagctgcg cacatacagc 7920
tcactgttca cgtcgcacct atatctgcgt gttgcctgta tatatatata catgagaaga 7980
acggcatagt gcgtgtttat gcttaaatgc gtacttatat gcgtctattt atgtaggatg 8040
aaaggtagtc tagtacctcc tgtgatatta tcccattcca tgcggggtat cgtatgcttc 8100
cttcagcact accctttagc tgttctatat gctgccactc ctcaattgga ttagtctcat 8160
ccttcaatgc tatcatttcc tttgatattg gatcatatgc atagtaccga gaaactagag 8220
gatctcccat taccgacatt tgggcgctat acgtgcatat gttcatgtat gtatctgtat 8280
ttaaaacact tttgtattat ttttcctcat atatgtgtat aggtttatac ggatgattta 8340
attattactt caccaccctt tatttcaggc tgatatctta gccttgttac tagtcaccgg 8400
tggcggccgc acctggtaaa acctctagtg gagtagtaga tgtaatcaat gaagcggaag 8460
ccaaaagacc agagtagagg cctatagaag aaactgcgat accttttgtg atggctaaac 8520
aaacagacat ctttttatat gtttttactt ctgtatatcg tgaagtagta agtgataagc 8580
gaatttggct aagaacgttg taagtgaaca agggacctct tttgcctttc aaaaaaggat 8640
taaatggagt taatcattga gatttagttt tcgttagatt ctgtatccct aaataactcc 8700
cttacccgac gggaaggcac aaaagacttg aataatagca aacggccagt agccaagacc 8760
aaataatact agagttaact gatggtctta aacaggcatt acgtggtgaa ctccaagacc 8820
aatatacaaa atatcgataa gttattcttg cccaccaatt taaggagcct acatcaggac 8880
agtagtacca ttcctcagag aagaggtata cataacaaga aaatcgcgtg aacaccttat 8940
ataacttagc ccgttattga gctaaaaaac cttgcaaaat ttcctatgaa taagaatact 9000
tcagacgtga taaaaattta ctttctaact cttctcacgc tgcccctatc tgttcttccg 9060
ctctaccgtg agaaataaag catcgagtac ggcagttcgc tgtcactgaa ctaaaacaat 9120
aaggctagtt cgaatgatga acttgcttgc tgtcaaactt ctgagttgcc gctgatgtga 9180
cactgtgaca ataaattcaa accggttata gcggtctcct ccggtaccgg ttctgccacc 9240
tccaatagag ctcagtagga gtcagaacct ctgcggtggc tgtcagtgac tcatccgcgt 9300
ttcgtaagtt gtgcgcgtgc acatttcgcc cgttcccgct catcttgcag caggcggaaa 9360
ttttcatcac gctgtaggac gcaaaaaaaa aataattaat cgtacaagaa tcttggaaaa 9420
aaaattgaaa aattttgtat aaaagggatg acctaacttg actcaatggc ttttacaccc 9480
agtattttcc ctttccttgt ttgttacaat tatagaagca agacaaaaac atatagacaa 9540
cctattccta ggagttatat ttttttaccc taccagcaat ataagtaaaa aactgttt 9598
<210> 106
<211> 1032
<212> DNA
<213> Artificial Sequence
<220>
<223> K9JB4P KARI
<400> 106
atggaagaat gtaagatggc taagatttac taccaagaag actgtaactt gtccttgttg 60
gatggtaaga ctatcgccgt tatcggttac ggttctcaag gtcacgctca tgccctgaat 120
gctaaggaat ccggttgtaa cgttatcatt ggtttatacg aaggtgcgga ggagtggaaa 180
agagctgaag aacaaggttt cgaagtctac accgctgctg aagctgctaa gaaggctgac 240
atcattatga tcttgatccc agatgaaaag caggctacca tgtacaaaaa cgacatcgaa 300
ccaaacttgg aagccggtaa catgttgatg ttcgctcacg gtttcaacat ccatttcggt 360
tgtattgttc caccaaagga cgttgatgtc actatgatcg ctccaaaggg tccaggtcac 420
accgttagat ccgaatacga agaaggtaaa ggtgtcccat gcttggttgc tgtcgaacaa 480
gacgctactg gcaaggcttt ggatatggct ttggcctacg ctttagccat cggtggtgct 540
agagccggtg tcttggaaac taccttcaga accgaaactg aaaccgactt gttcggtgaa 600
caagctgttt tatgtggtgg tgtctgcgct ttgatgcagg ccggttttga aaccttggtt 660
gaagccggtt acgacccaag aaacgcttac ttcgaatgta tccacgaaat gaagttgatc 720
gttgacttga tctaccaatc tggtttctcc ggtatgcgtt actctatctc caacactgct 780
gaatacggtg actacattac cggtccaaag atcattactg aagataccaa gaaggctatg 840
aagaagattt tgtctgacat tcaagatggt acctttgcca aggacttctt ggttgacatg 900
tctgatgctg gttcccaggt ccacttcaag gctatgagaa agttggcctc cgaacaccca 960
gctgaagttg tcggtgaaga aattagatcc ttgtactcct ggtccgacga agacaagttg 1020
attaacaact ga 1032
<210> 107
<211> 343
<212> PRT
<213> Artificial Sequence
<220>
<223> K9JB4P KARI
<400> 107
Met Glu Glu Cys Lys Met Ala Lys Ile Tyr Tyr Gln Glu Asp Cys Asn
1 5 10 15
Leu Ser Leu Leu Asp Gly Lys Thr Ile Ala Val Ile Gly Tyr Gly Ser
20 25 30
Gln Gly His Ala His Ala Leu Asn Ala Lys Glu Ser Gly Cys Asn Val
35 40 45
Ile Ile Gly Leu Tyr Glu Gly Ala Glu Glu Trp Lys Arg Ala Glu Glu
50 55 60
Gln Gly Phe Glu Val Tyr Thr Ala Ala Glu Ala Ala Lys Lys Ala Asp
65 70 75 80
Ile Ile Met Ile Leu Ile Pro Asp Glu Lys Gln Ala Thr Met Tyr Lys
85 90 95
Asn Asp Ile Glu Pro Asn Leu Glu Ala Gly Asn Met Leu Met Phe Ala
100 105 110
His Gly Phe Asn Ile His Phe Gly Cys Ile Val Pro Pro Lys Asp Val
115 120 125
Asp Val Thr Met Ile Ala Pro Lys Gly Pro Gly His Thr Val Arg Ser
130 135 140
Glu Tyr Glu Glu Gly Lys Gly Val Pro Cys Leu Val Ala Val Glu Gln
145 150 155 160
Asp Ala Thr Gly Lys Ala Leu Asp Met Ala Leu Ala Tyr Ala Leu Ala
165 170 175
Ile Gly Gly Ala Arg Ala Gly Val Leu Glu Thr Thr Phe Arg Thr Glu
180 185 190
Thr Glu Thr Asp Leu Phe Gly Glu Gln Ala Val Leu Cys Gly Gly Val
195 200 205
Cys Ala Leu Met Gln Ala Gly Phe Glu Thr Leu Val Glu Ala Gly Tyr
210 215 220
Asp Pro Arg Asn Ala Tyr Phe Glu Cys Ile His Glu Met Lys Leu Ile
225 230 235 240
Val Asp Leu Ile Tyr Gln Ser Gly Phe Ser Gly Met Arg Tyr Ser Ile
245 250 255
Ser Asn Thr Ala Glu Tyr Gly Asp Tyr Ile Thr Gly Pro Lys Ile Ile
260 265 270
Thr Glu Asp Thr Lys Lys Ala Met Lys Lys Ile Leu Ser Asp Ile Gln
275 280 285
Asp Gly Thr Phe Ala Lys Asp Phe Leu Val Asp Met Ser Asp Ala Gly
290 295 300
Ser Gln Val His Phe Lys Ala Met Arg Lys Leu Ala Ser Glu His Pro
305 310 315 320
Ala Glu Val Val Gly Glu Glu Ile Arg Ser Leu Tyr Ser Trp Ser Asp
325 330 335
Glu Asp Lys Leu Ile Asn Asn
340
<210> 108
<211> 12319
<212> DNA
<213> Artificial Sequence
<220>
<223> pLH689-L2V4
<400> 108
tcccattacc gacatttggg cgctatacgt gcatatgttc atgtatgtat ctgtatttaa 60
aacacttttg tattattttt cctcatatat gtgtataggt ttatacggat gatttaatta 120
ttacttcacc accctttatt tcaggctgat atcttagcct tgttactaga ttaatcatgt 180
aattagttat gtcacgctta cattcacgcc ctccccccac atccgctcta accgaaaagg 240
aaggagttag acaacctgaa gtctaggtcc ctatttattt ttttatagtt atgttagtat 300
taagaacgtt atttatattt caaatttttc ttttttttct gtacagacgc gtgtacgcat 360
gtaacattat actgaaaacc ttgcttgaga aggttttggg acgctcgaag gctttaattt 420
gcgggcggcc gcacctggta aaacctctag tggagtagta gatgtaatca atgaagcgga 480
agccaaaaga ccagagtaga ggcctataga agaaactgcg ataccttttg tgatggctaa 540
acaaacagac atctttttat atgtttttac ttctgtatat cgtgaagtag taagtgataa 600
gcgaatttgg ctaagaacgt tgtaagtgaa caagggacct cttttgcctt tcaaaaaagg 660
attaaatgga gttaatcatt gagatttagt tttcgttaga ttctgtatcc ctaaataact 720
cccttacccg acgggaaggc acaaaagact tgaataatag caaacggcca gtagccaaga 780
ccaaataata ctagagttaa ctgatggtct taaacaggca ttacgtggtg aactccaaga 840
ccaatataca aaatatcgat aagttattct tgcccaccaa tttaaggagc ctacatcagg 900
acagtagtac cattcctcag agaagaggta tacataacaa gaaaatcgcg tgaacacctt 960
atataactta gcccgttatt gagctaaaaa accttgcaaa atttcctatg aataagaata 1020
cttcagacgt gataaaaatt tactttctaa ctcttctcac gctgccccta tctgttcttc 1080
cgctctaccg tgagaaataa agcatcgagt acggcagttc gctgtcactg aactaaaaca 1140
ataaggctag ttcgaatgat gaacttgctt gctgtcaaac ttctgagttg ccgctgatgt 1200
gacactgtga caataaattc aaaccggtta tagcggtctc ctccggtacc ggttctgcca 1260
cctccaatag agctcagtag gagtcagaac ctctgcggtg gctgtcagtg actcatccgc 1320
gtttcgtaag ttgtgcgcgt gcacatttcg cccgttcccg ctcatcttgc agcaggcgga 1380
aattttcatc acgctgtagg acgcaaaaaa aaaataatta atcgtacaag aatcttggaa 1440
aaaaaattga aaaattttgt ataaaaggga tgacctaact tgactcaatg gcttttacac 1500
ccagtatttt ccctttcctt gtttgttaca attatagaag caagacaaaa acatatagac 1560
aacctattcc taggagttat atttttttac cctaccagca atataagtaa aaaactgttt 1620
aaacagtatg gaagaatgta agatggctaa gatttactac caagaagact gtaacttgtc 1680
cttgttggat ggtaagacta tcgccgttat cggttacggt tctcaaggtc acgctcatgc 1740
cctgaatgct aaggaatccg gttgtaacgt tatcattggt ttatacgaag gtgcggagga 1800
gtggaaaaga gctgaagaac aaggtttcga agtctacacc gctgctgaag ctgctaagaa 1860
ggctgacatc attatgatct tgatcccaga tgaaaagcag gctaccatgt acaaaaacga 1920
catcgaacca aacttggaag ccggtaacat gttgatgttc gctcacggtt tcaacatcca 1980
tttcggttgt attgttccac caaaggacgt tgatgtcact atgatcgctc caaagggtcc 2040
aggtcacacc gttagatccg aatacgaaga aggtaaaggt gtcccatgct tggttgctgt 2100
cgaacaagac gctactggca aggctttgga tatggctttg gcctacgctt tagccatcgg 2160
tggtgctaga gccggtgtct tggaaactac cttcagaacc gaaactgaaa ccgacttgtt 2220
cggtgaacaa gctgttttat gtggtggtgt ctgcgctttg atgcaggccg gttttgaaac 2280
cttggttgaa gccggttacg acccaagaaa cgcttacttc gaatgtatcc acgaaatgaa 2340
gttgatcgtt gacttgatct accaatctgg tttctccggt atgcgttact ctatctccaa 2400
cactgctgaa tacggtgact acattaccgg tccaaagatc attactgaag ataccaagaa 2460
ggctatgaag aagattttgt ctgacattca agatggtacc tttgccaagg acttcttggt 2520
tgacatgtct gatgctggtt cccaggtcca cttcaaggct atgagaaagt tggcctccga 2580
acacccagct gaagttgtcg gtgaagaaat tagatccttg tactcctggt ccgacgaaga 2640
caagttgatt aacaactgag gccctgcagg ccagaggaaa ataatatcaa gtgctggaaa 2700
ctttttctct tggaattttt gcaacatcaa gtcatagtca attgaattga cccaatttca 2760
catttaagat tttttttttt tcatccgaca tacatctgta cactaggaag ccctgttttt 2820
ctgaagcagc ttcaaatata tatatttttt acatatttat tatgattcaa tgaacaatct 2880
aattaaatcg aaaacaagaa ccgaaacgcg aataaataat ttatttagat ggtgacaagt 2940
gtataagtcc tcatcgggac agctacgatt tctctttcgg ttttggctga gctactggtt 3000
gctgtgacgc agcggcatta gcgcggcgtt atgagctacc ctcgtggcct gaaagatggc 3060
gggaataaag cggaactaaa aattactgac tgagccatat tgaggtcaat ttgtcaactc 3120
gtcaagtcac gtttggtgga cggccccttt ccaacgaatc gtatatacta acatgcgcgc 3180
gcttcctata tacacatata catatatata tatatatata tgtgtgcgtg tatgtgtaca 3240
cctgtattta atttccttac tcgcgggttt ttcttttttc tcaattcttg gcttcctctt 3300
tctcgagcgg accggatcct cgcgaactcc aaaatgagct atcaaaaacg atagatcgat 3360
taggatgact ttgaaatgac tccgcagtgg actggccgtt aatttcaagc gtgagtaaaa 3420
tagtgcatga caaaagatga gctaggcttt tgtaaaaata tcttacgttg taaaatttta 3480
gaaatcatta tttccttcat atcattttgt cattgacctt cagaagaaaa gagccgacca 3540
ataatataaa taaataaata aaaataatat tccattattt ctaaacagat tcaatactca 3600
ttaaaaaact atatcaatta atttgaatta acgcggccgc ttaaccacag caaccaggac 3660
aacatttttt gccagtttct tcaggcttcc aaaagtctgt tacggctccc ctagaagcag 3720
acgaaacgat gtgagcatat ttaccaagga taccgcgtga atagagcggt ggcaattcaa 3780
tggtctcttg acgatgtttt aactcttcat cggagatatc aaagtgtaat tccttagtgt 3840
cttggtcaat agtgactatg tctcctgttt gcaggtaggc gattggaccg ccatcttgtg 3900
cttcaggagc gatatgaccc acgacaagac cataagtacc acctgagaag cggccatctg 3960
tcagaagggc aactttttca ccttgccctt taccaacaat cattgatgaa agggaaagca 4020
tttcaggcat accaggaccg ccctttggtc ctacaaaacg tacgacaaca acatcaccat 4080
caacaatatc atcattcaag acagcttcaa tggcttcttc ttcagaatta aagaccttag 4140
caggaccgac atgacgacgc acttttacac cagaaacttt ggcaacggca ccgtctggag 4200
ccaagttacc atggagaata atgaccggac catcttcacg tttaggattt tcaagcggca 4260
taataacctt ttgaccaggt gttaaatcat caaaagcctt caaattttca gcgactgttt 4320
tgccagtaca agtgatacgg tcaccatgaa ggaagccatt tttaaggaga tatttcataa 4380
ctgctggtac ccctccgacc ttgtaaaggt cttggaatac atattgacca gaaggtttca 4440
aatcagccaa atgaggaact ttttcttgga aagtattgaa atcatcaagt gtcaattcca 4500
cattagcagc atgggcaata gctaagaggt gaagggttga gttggttgaa cctcccagag 4560
ccatagttac agtaatagca tcttcaaaag cttcacgcgt taaaatgtca gaaggtttta 4620
agcccatttc gagcattttg acaacagcgc gaccagcttc ttcaatatct gctttctttt 4680
ctgcggattc agccgggtga gaagatgaac ccggaaggct aagtcccaaa acttcaatag 4740
ctgtcgccat tgtgttagca gtatacatac caccgcagcc tccaggaccg ggacaagcat 4800
tacattccaa agctttaact tcttctttgg tcatatcgcc gtggttccaa tggccgacac 4860
cttcaaagac agagactaaa tcgatatctt tgccgtctaa attaccaggt gcaattgttc 4920
cgccgtaagc aaaaatggct gggatatcca tgttagccat agcgataaca gaaccgggca 4980
tgtttttatc acaaccgcca atggctacaa aagcatccgc attatgacct cccatggctg 5040
cttcaataga atctgcaata atatcacgag atgtcaagga gaaacgcatt ccttgggttc 5100
ccatggcgat tccatcagaa accgtgattg ttccgaactg aactggccaa gcaccagctt 5160
ccttaacacc gactttggct agtttaccaa agtcatgtaa gtggatatta caaggtgtgt 5220
tttcagccca agttgaaatg acaccgacga taggtttttc aaagtcttca tcttgcatac 5280
cagttgcacg caacatagca cgattaggtg atttaaccat tgaatcgtaa acagaactac 5340
gatttcttaa gtctttaaga gtttttttgt cagtcatact cacgtgaaac ttagattaga 5400
ttgctatgct ttctttccaa tgagcaagaa gtaaaaaaag ttgtaataga acaggaaaaa 5460
tgaagctgaa acttgagaaa ttgaagaccg tttgttaact caaatatcaa tgggaggtcg 5520
tcgaaagaga acaaaatcga aaaaaaagtt ttcaagagaa agaaacgtga taaaaatttt 5580
tattgccttc tccgacgaag aaaaagggac gaggcggtct ctttttcctt ttccaaacct 5640
ttagtacggg taattaacgg caccctagag gaaggaggag ggggaattta gtatgctgtg 5700
cttgggtgtt ttgaagtggt acggcggtgc gcggagtccg agaaaatctg gaagagtaaa 5760
aaaggagtag agacattttg aagctatgcc ggcagatcta tttaaatggc gcgccgacgt 5820
caggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac 5880
attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa 5940
aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat 6000
tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc 6060
agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga 6120
gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg 6180
cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc 6240
agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag 6300
taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc 6360
tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg 6420
taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg 6480
acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac 6540
ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac 6600
cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg 6660
agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg 6720
tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg 6780
agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac tcatatatac 6840
tttagattga tttaaaactt catttttaat ttaaaaggat ctaggtgaag atcctttttg 6900
ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg 6960
tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc 7020
aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc 7080
tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtt cttctagtgt 7140
agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc 7200
taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact 7260
caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac 7320
agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt gagctatgag 7380
aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg 7440
gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg 7500
tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga 7560
gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt 7620
ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct 7680
ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg 7740
aggaagcgga agagcgccca atacgcaaac cgcctctccc cgcgcgttgg ccgattcatt 7800
aatgcagctg gcacgacagg tttcccgact ggaaagcggg cagtgagcgc aacgcaatta 7860
atgtgagtta gctcactcat taggcacccc aggctttaca ctttatgctt ccggctcgta 7920
tgttgtgtgg aattgtgagc ggataacaat ttcacacagg aaacagctat gaccatgatt 7980
acgccaagct ttttctttcc aatttttttt ttttcgtcat tataaaaatc attacgaccg 8040
agattcccgg gtaataactg atataattaa attgaagctc taatttgtga gtttagtata 8100
catgcattta cttataatac agttttttag ttttgctggc cgcatcttct caaatatgct 8160
tcccagcctg cttttctgta acgttcaccc tctaccttag catcccttcc ctttgcaaat 8220
agtcctcttc caacaataat aatgtcagat cctgtagaga ccacatcatc cacggttcta 8280
tactgttgac ccaatgcgtc tcccttgtca tctaaaccca caccgggtgt cataatcaac 8340
caatcgtaac cttcatctct tccacccatg tctctttgag caataaagcc gataacaaaa 8400
tctttgtcgc tcttcgcaat gtcaacagta cccttagtat attctccagt agatagggag 8460
cccttgcatg acaattctgc taacatcaaa aggcctctag gttcctttgt tacttcttct 8520
gccgcctgct tcaaaccgct aacaatacct gggcccacca caccgtgtgc attcgtaatg 8580
tctgcccatt ctgctattct gtatacaccc gcagagtact gcaatttgac tgtattacca 8640
atgtcagcaa attttctgtc ttcgaagagt aaaaaattgt acttggcgga taatgccttt 8700
agcggcttaa ctgtgccctc catggaaaaa tcagtcaaga tatccacatg tgtttttagt 8760
aaacaaattt tgggacctaa tgcttcaact aactccagta attccttggt ggtacgaaca 8820
tccaatgaag cacacaagtt tgtttgcttt tcgtgcatga tattaaatag cttggcagca 8880
acaggactag gatgagtagc agcacgttcc ttatatgtag ctttcgacat gatttatctt 8940
cgtttcctgc aggtttttgt tctgtgcagt tgggttaaga atactgggca atttcatgtt 9000
tcttcaacac tacatatgcg tatatatacc aatctaagtc tgtgctcctt ccttcgttct 9060
tccttctgtt cggagattac cgaatcaaaa aaatttcaag gaaaccgaaa tcaaaaaaaa 9120
gaataaaaaa aaaatgatga attgaaaagc ttgcatgcct gcaggtcgac tctagtatac 9180
tccgtctact gtacgataca cttccgctca ggtccttgtc ctttaacgag gccttaccac 9240
tcttttgtta ctctattgat ccagctcagc aaaggcagtg tgatctaaga ttctatcttc 9300
gcgatgtagt aaaactagct agaccgagaa agagactaga aatgcaaaag gcacttctac 9360
aatggctgcc atcattatta tccgatgtga cgctgcattt tttttttttt tttttttttt 9420
tttttttttt tttttttttt tttttttttg tacaaatatc ataaaaaaag agaatctttt 9480
taagcaagga ttttcttaac ttcttcggcg acagcatcac cgacttcggt ggtactgttg 9540
gaaccaccta aatcaccagt tctgatacct gcatccaaaa cctttttaac tgcatcttca 9600
atggctttac cttcttcagg caagttcaat gacaatttca acatcattgc agcagacaag 9660
atagtggcga tagggttgac cttattcttt ggcaaatctg gagcggaacc atggcatggt 9720
tcgtacaaac caaatgcggt gttcttgtct ggcaaagagg ccaaggacgc agatggcaac 9780
aaacccaagg agcctgggat aacggaggct tcatcggaga tgatatcacc aaacatgttg 9840
ctggtgatta taataccatt taggtgggtt gggttcttaa ctaggatcat ggcggcagaa 9900
tcaatcaatt gatgttgaac tttcaatgta gggaattcgt tcttgatggt ttcctccaca 9960
gtttttctcc ataatcttga agaggccaaa acattagctt tatccaagga ccaaataggc 10020
aatggtggct catgttgtag ggccatgaaa gcggccattc ttgtgattct ttgcacttct 10080
ggaacggtgt attgttcact atcccaagcg acaccatcac catcgtcttc ctttctctta 10140
ccaaagtaaa tacctcccac taattctcta acaacaacga agtcagtacc tttagcaaat 10200
tgtggcttga ttggagataa gtctaaaaga gagtcggatg caaagttaca tggtcttaag 10260
ttggcgtaca attgaagttc tttacggatt tttagtaaac cttgttcagg tctaacacta 10320
ccggtacccc atttaggacc acccacagca cctaacaaaa cggcatcagc cttcttggag 10380
gcttccagcg cctcatctgg aagtggaaca cctgtagcat cgatagcagc accaccaatt 10440
aaatgatttt cgaaatcgaa cttgacattg gaacgaacat cagaaatagc tttaagaacc 10500
ttaatggctt cggctgtgat ttcttgacca acgtggtcac ctggcaaaac gacgatcttc 10560
ttaggggcag acattacaat ggtatatcct tgaaatatat ataaaaaaaa aaaaaaaaaa 10620
aaaaaaaaaa aatgcagctt ctcaatgata ttcgaatacg ctttgaggag atacagccta 10680
atatccgaca aactgtttta cagatttacg atcgtacttg ttacccatca ttgaattttg 10740
aacatccgaa cctgggagtt ttccctgaaa cagatagtat atttgaacct gtataataat 10800
atatagtcta gcgctttacg gaagacaatg tatgtatttc ggttcctgga gaaactattg 10860
catctattgc ataggtaatc ttgcacgtcg catccccggt tcattttctg cgtttccatc 10920
ttgcacttca atagcatatc tttgttaacg aagcatctgt gcttcatttt gtagaacaaa 10980
aatgcaacgc gagagcgcta atttttcaaa caaagaatct gagctgcatt tttacagaac 11040
agaaatgcaa cgcgaaagcg ctattttacc aacgaagaat ctgtgcttca tttttgtaaa 11100
acaaaaatgc aacgcgagag cgctaatttt tcaaacaaag aatctgagct gcatttttac 11160
agaacagaaa tgcaacgcga gagcgctatt ttaccaacaa agaatctata cttctttttt 11220
gttctacaaa aatgcatccc gagagcgcta tttttctaac aaagcatctt agattacttt 11280
ttttctcctt tgtgcgctct ataatgcagt ctcttgataa ctttttgcac tgtaggtccg 11340
ttaaggttag aagaaggcta ctttggtgtc tattttctct tccataaaaa aagcctgact 11400
ccacttcccg cgtttactga ttactagcga agctgcgggt gcattttttc aagataaagg 11460
catccccgat tatattctat accgatgtgg attgcgcata ctttgtgaac agaaagtgat 11520
agcgttgatg attcttcatt ggtcagaaaa ttatgaacgg tttcttctat tttgtctcta 11580
tatactacgt ataggaaatg tttacatttt cgtattgttt tcgattcact ctatgaatag 11640
ttcttactac aatttttttg tctaaagagt aatactagag ataaacataa aaaatgtaga 11700
ggtcgagttt agatgcaagt tcaaggagcg aaaggtggat gggtaggtta tatagggata 11760
tagcacagag atatatagca aagagatact tttgagcaat gtttgtggaa gcggtattcg 11820
caatatttta gtagctcgtt acagtccggt gcgtttttgg ttttttgaaa gtgcgtcttc 11880
agagcgcttt tggttttcaa aagcgctctg aagttcctat actttctaga gaataggaac 11940
ttcggaatag gaacttcaaa gcgtttccga aaacgagcgc ttccgaaaat gcaacgcgag 12000
ctgcgcacat acagctcact gttcacgtcg cacctatatc tgcgtgttgc ctgtatatat 12060
atatacatga gaagaacggc atagtgcgtg tttatgctta aatgcgtact tatatgcgtc 12120
tatttatgta ggatgaaagg tagtctagta cctcctgtga tattatccca ttccatgcgg 12180
ggtatcgtat gcttccttca gcactaccct ttagctgttc tatatgctgc cactcctcaa 12240
ttggattagt ctcatccttc aatgctatca tttcctttga tattggatca tatgcatagt 12300
accgagaaac tagaggatc 12319
<210> 109
<211> 11013
<212> DNA
<213> Artificial Sequence
<220>
<223> pRS413 BiADH kivD
<400> 109
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgcgtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accataaatt cccgttttaa gagcttggtg agcgctagga gtcactgcca ggtatcgttt 240
gaacacggca ttagtcaggg aagtcataac acagtccttt cccgcaattt tctttttcta 300
ttactcttgg cctcctctag tacactctat atttttttat gcctcggtaa tgattttcat 360
tttttttttt cccctagcgg atgactcttt ttttttctta gcgattggca ttatcacata 420
atgaattata cattatataa agtaatgtga tttcttcgaa gaatatacta aaaaatgagc 480
aggcaagata aacgaaggca aagatgacag agcagaaagc cctagtaaag cgtattacaa 540
atgaaaccaa gattcagatt gcgatctctt taaagggtgg tcccctagcg atagagcact 600
cgatcttccc agaaaaagag gcagaagcag tagcagaaca ggccacacaa tcgcaagtga 660
ttaacgtcca cacaggtata gggtttctgg accatatgat acatgctctg gccaagcatt 720
ccggctggtc gctaatcgtt gagtgcattg gtgacttaca catagacgac catcacacca 780
ctgaagactg cgggattgct ctcggtcaag cttttaaaga ggccctactg gcgcgtggag 840
taaaaaggtt tggatcagga tttgcgcctt tggatgaggc actttccaga gcggtggtag 900
atctttcgaa caggccgtac gcagttgtcg aacttggttt gcaaagggag aaagtaggag 960
atctctcttg cgagatgatc ccgcattttc ttgaaagctt tgcagaggct agcagaatta 1020
ccctccacgt tgattgtctg cgaggcaaga atgatcatca ccgtagtgag agtgcgttca 1080
aggctcttgc ggttgccata agagaagcca cctcgcccaa tggtaccaac gatgttccct 1140
ccaccaaagg tgttcttatg tagtgacacc gattatttaa agctgcagca tacgatatat 1200
atacatgtgt atatatgtat acctatgaat gtcagtaagt atgtatacga acagtatgat 1260
actgaagatg acaaggtaat gcatcattct atacgtgtca ttctgaacga ggcgcgcttt 1320
ccttttttct ttttgctttt tctttttttt tctcttgaac tcgacggatc tatgcggtgt 1380
gaaataccgc acagatgcgt aaggagaaaa taccgcatca ggaaattgta aacgttaata 1440
ttttgttaaa attcgcgtta aatttttgtt aaatcagctc attttttaac caataggccg 1500
aaatcggcaa aatcccttat aaatcaaaag aatagaccga gatagggttg agtgttgttc 1560
cagtttggaa caagagtcca ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa 1620
ccgtctatca gggcgatggc ccactacgtg aaccatcacc ctaatcaagt tttttggggt 1680
cgaggtgccg taaagcacta aatcggaacc ctaaagggag cccccgattt agagcttgac 1740
ggggaaagcc ggcgaacgtg gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta 1800
gggcgctggc aagtgtagcg gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg 1860
cgccgctaca gggcgcgtcg cgccattcgc cattcaggct gcgcaactgt tgggaagggc 1920
gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt gctgcaaggc 1980
gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg acggccagtg 2040
agcgcgcgta atacgactca ctatagggcg aattgggtac cgggcccccc ctgtacgcat 2100
gtaacattat actgaaaacc ttgcttgaga aggttttggg acgctcgaag gctttaattt 2160
cctgcaggaa ttaccgtcgc tcgtgatttg tttgcaaaaa gaacaaaact gaaaaaaccc 2220
agacacgctc gacttcctgt cttcctattg attgcagctt ccaatttcgt cacacaacaa 2280
ggtcctgtcg acgcctactt ggcttcacat acgttgcata cgtcgatata gataataatg 2340
ataatgacag caggattatc gtaatacgta atagttgaaa atctcaaaaa tgtgtgggtc 2400
attacgtaaa taatgatagg aatgggattc ttctattttt cctttttcca ttctagcagc 2460
cgtcgggaaa acgtggcatc ctctctttcg ggctcaattg gagtcacgct gccgtgagca 2520
tcctctcttt ccatatctaa caactgagca cgtaaccaat ggaaaagcat gagcttagcg 2580
ttgctccaaa aaagtattgg atggttaata ccatttgtct gttctcttct gactttgact 2640
cctcaaaaaa aaaaaatcta caatcaacag atcgcttcaa ttacgccctc acaaaaactt 2700
ttttccttct tcttcgccca cgttaaattt tatccctcat gttgtctaac ggatttctgc 2760
acttgattta ttataaaaag acaaagacat aatacttctc tatcaatttc agttattgtt 2820
cttccttgcg ttattcttct gttcttcttt ttcttttgtc atatataacc ataaccaagt 2880
aatacatatt caagtttaaa catgtatacc gtaggacagt acttggtaga tagactagaa 2940
gagattggta tcgataaggt tttcggtgtg ccaggggatt acaatttgac ttttctagat 3000
tacattcaaa atcacgaagg actttcctgg caagggaata ctaatgaact aaacgcagca 3060
tatgcagcag atggctacgc ccgtgaaaga ggcgtatcag ctcttgttac tacattcgga 3120
gtgggtgaac tgtcagccat taacggaaca gctggtagtt ttgcagaaca agtccctgtc 3180
atccacatcg tgggttctcc aactatgaat gtgcaatcca acaaaaagct ggttcatcat 3240
tccttaggaa tgggtaactt tcataacttt agtgaaatgg ctaaggaagt cactgccgct 3300
acaaccatgc ttactgaaga gaatgcagct tcagagatcg acagagtatt agaaacagcc 3360
ttgttggaaa agaggccagt atacatcaat cttccaattg atatagctca taaagcaata 3420
gttaaacctg caaaagcact acaaacagag aaatcatctg gtgagagaga ggcacaactt 3480
gcagaaatca tactatcaca cttagaaaag gccgctcaac ctatcgtaat cgccggtcat 3540
gagatcgccc gtttccagat aagagaaaga tttgaaaact ggataaacca aacaaagttg 3600
ccagtaacca atttggcata tggcaaaggc tctttcaatg aagagaacga acatttcatt 3660
ggtacctatt acccagcttt ttctgacaaa aacgttctgg attacgttga caatagtgac 3720
ttcgttttac attttggtgg gaaaatcatt gacaattcta cctcctcatt ttctcaaggc 3780
tttaagactg aaaacacttt aaccgctgca aatgacatca ttatgctgcc agatgggtct 3840
acttactctg ggatttctct taacggtctt ttggcagagc tggaaaaact aaactttact 3900
tttgctgata ctgctgctaa acaagctgaa ttagctgttt tcgaaccaca ggccgaaaca 3960
ccactaaagc aagacagatt tcaccaagct gttatgaact ttttgcaagc tgatgatgtg 4020
ttggtcactg agcaggggac atcatctttc ggtttgatgt tggcacctct gaaaaagggt 4080
atgaatttga tcagtcaaac attatggggc tccataggat acacattacc tgctatgatt 4140
ggttcacaaa ttgctgcccc agaaaggaga cacattctat ccatcggtga tggatctttt 4200
caactgacag cacaggaaat gtccaccatc ttcagagaga aattgacacc agtgatattc 4260
attatcaata acgatggcta tacagtcgaa agagccatcc atggagagga tgagagttac 4320
aatgatatac caacttggaa cttgcaatta gttgctgaaa catttggtgg tgatgccgaa 4380
actgtcgaca ctcacaacgt tttcacagaa acagacttcg ctaatacttt agctgctatc 4440
gatgctactc ctcaaaaagc acatgtcgtt gaagttcata tggaacaaat ggatatgcca 4500
gaatcattga gacagattgg cttagcctta tctaagcaaa actcttaacc tgcagggccg 4560
tgaatttact ttaaatcttg catttaaata aattttcttt ttatagcttt atgacttagt 4620
ttcaatttat atactatttt aatgacattt tcgattcatt gattgaaagc tttgtgtttt 4680
ttcttgatgc gctattgcat tgttcttgtc tttttcgcca catgtaatat ctgtagtaga 4740
tacctgatac attgtggatg ctgagtgaaa ttttagttaa taatggaggc gctcttaata 4800
attttgggga tattggcttt tttttttaaa gtttacaaat gaattttttc cgccaggata 4860
acgattctga agttactctt agcgttccta tcggtacagc catcaaatca tgcctataaa 4920
tcatgcctat atttgcgtgc agtcagtatc atctacatga aaaaaactcc cgcaatttct 4980
tatagaatac gttgaaaatt aaatgtacgc gccaagataa gataacatat atctagatgc 5040
agtaatatac acagattccc gcggacgtgg gaaggaaaaa attagataac aaaatctgag 5100
tgatatggaa attccgctgt atagctcata tctttcccta cctggtaaaa cctctagtgg 5160
agtagtagat gtaatcaatg aagcggaagc caaaagacca gagtagaggc ctatagaaga 5220
aactgcgata ccttttgtga tggctaaaca aacagacatc tttttatatg tttttacttc 5280
tgtatatcgt gaagtagtaa gtgataagcg aatttggcta agaacgttgt aagtgaacaa 5340
gggacctctt ttgcctttca aaaaaggatt aaatggagtt aatcattgag atttagtttt 5400
cgttagattc tgtatcccta aataactccc ttacccgacg ggaaggcaca aaagacttga 5460
ataatagcaa acggccagta gccaagacca aataatacta gagttaactg atggtcttaa 5520
acaggcatta cgtggtgaac tccaagacca atatacaaaa tatcgataag ttattcttgc 5580
ccaccaattt aaggagccta catcaggaca gtagtaccat tcctcagaga agaggtatac 5640
ataacaagaa aatcgcgtga acaccttata taacttagcc cgttattgag ctaaaaaacc 5700
ttgcaaaatt tcctatgaat aagaatactt cagacgtgat aaaaatttac tttctaactc 5760
ttctcacgct gcccctatct gttcttccgc tctaccgtga gaaataaagc atcgagtacg 5820
gcagttcgct gtcactgaac taaaacaata aggctagttc gaatgatgaa cttgcttgct 5880
gtcaaacttc tgagttgccg ctgatgtgac actgtgacaa taaattcaaa ccggttatag 5940
cggtctcctc cggtaccggt tctgccacct ccaatagagc tcccgcacgc cgaaatgcat 6000
gcaagtaacc tattcaaagt aatatctcat acatgtttca tgagggtaac aacatgcgac 6060
tgggtgagca tatgttccgc tgatgtgatg tgcaagataa acaagcaagg cagaaactaa 6120
cttcttcttc atgtaataaa cacaccccgc gtttatttac ctatctctaa acttcaacac 6180
cttatatcat aactaatatt tcttgagata agcacactgc acccatacct tccttaaaaa 6240
cgtagcttcc agtttttggt ggttccggct tccttcccga ttccgcccgc taaacgcata 6300
tttttgttgc ctggtggcat ttgcaaaatg cataacctat gcatttaaaa gattatgtat 6360
gctcttctga cttttcgtgt gatgaggctc gtggaaaaaa tgaataattt atgaatttga 6420
gaacaatttt gtgttgttac ggtattttac tatggaataa tcaatcaatt gaggatttta 6480
tgcaaatatc gtttgaatat ttttccgacc ctttgagtac ttttcttcat aattgcataa 6540
tattgtccgc tgcccctttt tctgttagac ggtgtcttga tctacttgct atcgttcaac 6600
accaccttat tttctaacta tttttttttt agctcatttg aatcagctta tggtgatggc 6660
acatttttgc ataaacctag ctgtcctcgt tgaacatagg aaaaaaaaat atataaacaa 6720
ggctctttca ctctccttgc aatcagattt gggtttgttc cctttatttt catatttctt 6780
gtcatattcc tttctcaatt attattttct actcataacc tcacgcaaaa taacacagtc 6840
aaatcaatca aaatgaaagc attagtgtat aggggcccag gccagaagtt ggtggaagag 6900
agacagaagc cagagcttaa ggaacctggt gacgctatag tgaaggtaac aaagactaca 6960
atttgcggaa ccgatctaca cattcttaaa ggtgacgttg cgacttgtaa acccggtcgt 7020
gtattagggc atgaaggagt gggggttatt gaatcagtcg gatctggggt tactgctttc 7080
caaccaggcg atagagtttt gatatcatgt atatcgagtt gcggaaagtg ctcattttgt 7140
agaagaggaa tgttcagtca ctgtacgacc gggggttgga ttctgggcaa cgaaattgat 7200
ggtacccaag cagagtacgt aagagtacca catgctgaca catcccttta tcgtattccg 7260
gcaggtgcgg atgaagaggc cttagtcatg ttatcagata ttctaccaac gggttttgag 7320
tgcggagtcc taaacggcaa agtcgcacct ggttcttcgg tggctatagt aggtgctggt 7380
cccgttggtt tggccgcctt actgacagca caattctact ccccagctga aatcataatg 7440
atcgatcttg atgataacag gctgggatta gccaaacaat ttggtgccac cagaacagta 7500
aactccacgg gtggtaacgc cgcagccgaa gtgaaagctc ttactgaagg cttaggtgtt 7560
gatactgcga ttgaagcagt tgggatacct gctacatttg aattgtgtca gaatatcgta 7620
gctcccggtg gaactatcgc taatgtcggc gttcacggta gcaaagttga tttgcatctt 7680
gaaagtttat ggtcccataa tgtcacgatt actacaaggt tggttgacac ggctaccacc 7740
ccgatgttac tgaaaactgt tcaaagtcac aagctagatc catctagatt gataacacat 7800
agattcagcc tggaccagat cttggacgca tatgaaactt ttggccaagc tgcgtctact 7860
caagcactaa aagtcatcat ttcgatggag gcttgattaa ttaagagtaa gcgaatttct 7920
tatgatttat gatttttatt attaaataag ttataaaaaa aataagtgta tacaaatttt 7980
aaagtgactc ttaggtttta aaacgaaaat tcttattctt gagtaactct ttcctgtagg 8040
tcaggttgct ttctcaggta tagcatgagg tcgctcttat tgaccacacc tctaccggca 8100
tgccgagcaa atgcctgcaa atcgctcccc atttcaccca attgtagata tgctaactcc 8160
agcaatgagt tgatgaatct cggtgtgtat tttatgtcct cagaggacaa cacctgtggt 8220
gagctccagc ttttgttccc tttagtgagg gttaattgcg cgcttggcgt aatcatggtc 8280
atagctgttt cctgtgtgaa attgttatcc gctcacaatt ccacacaaca taggagccgg 8340
aagcataaag tgtaaagcct ggggtgccta atgagtgagg taactcacat taattgcgtt 8400
gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc cagctgcatt aatgaatcgg 8460
ccaacgcgcg gggagaggcg gtttgcgtat tgggcgctct tccgcttcct cgctcactga 8520
ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat 8580
acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca 8640
aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc 8700
tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata 8760
aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc 8820
gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc 8880
acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga 8940
accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc 9000
ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag 9060
gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag 9120
gacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag 9180
ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca 9240
gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga 9300
cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat 9360
cttcacctag atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga 9420
gtaaacttgg tctgacagtt accaatgctt aatcagtgag gcacctatct cagcgatctg 9480
tctatttcgt tcatccatag ttgcctgact ccccgtcgtg tagataacta cgatacggga 9540
gggcttacca tctggcccca gtgctgcaat gataccgcga gacccacgct caccggctcc 9600
agatttatca gcaataaacc agccagccgg aagggccgag cgcagaagtg gtcctgcaac 9660
tttatccgcc tccatccagt ctattaattg ttgccgggaa gctagagtaa gtagttcgcc 9720
agttaatagt ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc 9780
gtttggtatg gcttcattca gctccggttc ccaacgatca aggcgagtta catgatcccc 9840
catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca gaagtaagtt 9900
ggccgcagtg ttatcactca tggttatggc agcactgcat aattctctta ctgtcatgcc 9960
atccgtaaga tgcttttctg tgactggtga gtactcaacc aagtcattct gagaatagtg 10020
tatgcggcga ccgagttgct cttgcccggc gtcaatacgg gataataccg cgccacatag 10080
cagaacttta aaagtgctca tcattggaaa acgttcttcg gggcgaaaac tctcaaggat 10140
cttaccgctg ttgagatcca gttcgatgta acccactcgt gcacccaact gatcttcagc 10200
atcttttact ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa 10260
aaagggaata agggcgacac ggaaatgttg aatactcata ctcttccttt ttcaatatta 10320
ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa 10380
aaataaacaa ataggggttc cgcgcacatt tccccgaaaa gtgccacctg ggtccttttc 10440
atcacgtgct ataaaaataa ttataattta aattttttaa tataaatata taaattaaaa 10500
atagaaagta aaaaaagaaa ttaaagaaaa aatagttttt gttttccgaa gatgtaaaag 10560
actctagggg gatcgccaac aaatactacc ttttatcttg ctcttcctgc tctcaggtat 10620
taatgccgaa ttgtttcatc ttgtctgtgt agaagaccac acacgaaaat cctgtgattt 10680
tacattttac ttatcgttaa tcgaatgtat atctatttaa tctgcttttc ttgtctaata 10740
aatatatatg taaagtacgc tttttgttga aattttttaa acctttgttt attttttttt 10800
cttcattccg taactcttct accttcttta tttactttct aaaatccaaa tacaaaacat 10860
aaaaataaat aaacacagag taaattccca aattattcca tcattaaaag atacgaggcg 10920
cgtgtaagtt acaggcaagc gatccgtcct aagaaaccat tattatcatg acattaacct 10980
ataaaaatag gcgtatcacg aggccctttc gtc 11013
<210> 110
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> primer 857
<400> 110
gcacaatatt tcaagctata ccaagcatac aatcaactat ctcatataca atgaaagcat 60
tagtgtatag gggcccaggc 80
<210> 111
<211> 10934
<212> DNA
<213> Artificial sequence
<220>
<223> pRS423::TEF(M4)-xpk1+ENO1-eutD
<400> 111
ggtggagctc cagcttttgt tccctttagt gagggttaat tgcgcgcttg gcgtaatcat 60
ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacataggag 120
ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gaggtaactc acattaattg 180
cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 240
tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca 300
ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 360
taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc 420
agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 480
cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 540
tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 600
tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata 660
gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 720
acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 780
acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 840
cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 900
gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 960
gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 1020
agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 1080
ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 1140
ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat 1200
atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga 1260
tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac 1320
gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg 1380
ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg 1440
caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt 1500
cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct 1560
cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat 1620
cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta 1680
agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca 1740
tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat 1800
agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac 1860
atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa 1920
ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt 1980
cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg 2040
caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat 2100
attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt 2160
agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca cctgaacgaa 2220
gcatctgtgc ttcattttgt agaacaaaaa tgcaacgcga gagcgctaat ttttcaaaca 2280
aagaatctga gctgcatttt tacagaacag aaatgcaacg cgaaagcgct attttaccaa 2340
cgaagaatct gtgcttcatt tttgtaaaac aaaaatgcaa cgcgagagcg ctaatttttc 2400
aaacaaagaa tctgagctgc atttttacag aacagaaatg caacgcgaga gcgctatttt 2460
accaacaaag aatctatact tcttttttgt tctacaaaaa tgcatcccga gagcgctatt 2520
tttctaacaa agcatcttag attacttttt ttctcctttg tgcgctctat aatgcagtct 2580
cttgataact ttttgcactg taggtccgtt aaggttagaa gaaggctact ttggtgtcta 2640
ttttctcttc cataaaaaaa gcctgactcc acttcccgcg tttactgatt actagcgaag 2700
ctgcgggtgc attttttcaa gataaaggca tccccgatta tattctatac cgatgtggat 2760
tgcgcatact ttgtgaacag aaagtgatag cgttgatgat tcttcattgg tcagaaaatt 2820
atgaacggtt tcttctattt tgtctctata tactacgtat aggaaatgtt tacattttcg 2880
tattgttttc gattcactct atgaatagtt cttactacaa tttttttgtc taaagagtaa 2940
tactagagat aaacataaaa aatgtagagg tcgagtttag atgcaagttc aaggagcgaa 3000
aggtggatgg gtaggttata tagggatata gcacagagat atatagcaaa gagatacttt 3060
tgagcaatgt ttgtggaagc ggtattcgca atattttagt agctcgttac agtccggtgc 3120
gtttttggtt ttttgaaagt gcgtcttcag agcgcttttg gttttcaaaa gcgctctgaa 3180
gttcctatac tttctagaga ataggaactt cggaatagga acttcaaagc gtttccgaaa 3240
acgagcgctt ccgaaaatgc aacgcgagct gcgcacatac agctcactgt tcacgtcgca 3300
cctatatctg cgtgttgcct gtatatatat atacatgaga agaacggcat agtgcgtgtt 3360
tatgcttaaa tgcgtactta tatgcgtcta tttatgtagg atgaaaggta gtctagtacc 3420
tcctgtgata ttatcccatt ccatgcgggg tatcgtatgc ttccttcagc actacccttt 3480
agctgttcta tatgctgcca ctcctcaatt ggattagtct catccttcaa tgctatcatt 3540
tcctttgata ttggatcatc taagaaacca ttattatcat gacattaacc tataaaaata 3600
ggcgtatcac gaggcccttt cgtctcgcgc gtttcggtga tgacggtgaa aacctctgac 3660
acatgcagct cccggagacg gtcacagctt gtctgtaagc ggatgccggg agcagacaag 3720
cccgtcaggg cgcgtcagcg ggtgttggcg ggtgtcgggg ctggcttaac tatgcggcat 3780
cagagcagat tgtactgaga gtgcaccata aattcccgtt ttaagagctt ggtgagcgct 3840
aggagtcact gccaggtatc gtttgaacac ggcattagtc agggaagtca taacacagtc 3900
ctttcccgca attttctttt tctattactc ttggcctcct ctagtacact ctatattttt 3960
ttatgcctcg gtaatgattt tcattttttt ttttccccta gcggatgact cttttttttt 4020
cttagcgatt ggcattatca cataatgaat tatacattat ataaagtaat gtgatttctt 4080
cgaagaatat actaaaaaat gagcaggcaa gataaacgaa ggcaaagatg acagagcaga 4140
aagccctagt aaagcgtatt acaaatgaaa ccaagattca gattgcgatc tctttaaagg 4200
gtggtcccct agcgatagag cactcgatct tcccagaaaa agaggcagaa gcagtagcag 4260
aacaggccac acaatcgcaa gtgattaacg tccacacagg tatagggttt ctggaccata 4320
tgatacatgc tctggccaag cattccggct ggtcgctaat cgttgagtgc attggtgact 4380
tacacataga cgaccatcac accactgaag actgcgggat tgctctcggt caagctttta 4440
aagaggccct actggcgcgt ggagtaaaaa ggtttggatc aggatttgcg cctttggatg 4500
aggcactttc cagagcggtg gtagatcttt cgaacaggcc gtacgcagtt gtcgaacttg 4560
gtttgcaaag ggagaaagta ggagatctct cttgcgagat gatcccgcat tttcttgaaa 4620
gctttgcaga ggctagcaga attaccctcc acgttgattg tctgcgaggc aagaatgatc 4680
atcaccgtag tgagagtgcg ttcaaggctc ttgcggttgc cataagagaa gccacctcgc 4740
ccaatggtac caacgatgtt ccctccacca aaggtgttct tatgtagtga caccgattat 4800
ttaaagctgc agcatacgat atatatacat gtgtatatat gtatacctat gaatgtcagt 4860
aagtatgtat acgaacagta tgatactgaa gatgacaagg taatgcatca ttctatacgt 4920
gtcattctga acgaggcgcg ctttcctttt ttctttttgc tttttctttt tttttctctt 4980
gaactcgacg gatctatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc 5040
atcaggaaat tgtaaacgtt aatattttgt taaaattcgc gttaaatttt tgttaaatca 5100
gctcattttt taaccaatag gccgaaatcg gcaaaatccc ttataaatca aaagaataga 5160
ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 5220
actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat 5280
caccctaatc aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 5340
ggagcccccg atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga 5400
agaaagcgaa aggagcgggc gctagggcgc tggcaagtgt agcggtcacg ctgcgcgtaa 5460
ccaccacacc cgccgcgctt aatgcgccgc tacagggcgc gtcgcgccat tcgccattca 5520
ggctgcgcaa ctgttgggaa gggcgatcgg tgcgggcctc ttcgctatta cgccagctgg 5580
cgaaaggggg atgtgctgca aggcgattaa gttgggtaac gccagggttt tcccagtcac 5640
gacgttgtaa aacgacggcc agtgagcgcg cgtaatacga ctcactatag ggcgaattgg 5700
gtaccgggcc ccccctcgag gtcgacggta tcgataagct tgatatcgaa ttcctgcgcc 5760
cgggccacta gtcagatgcc gcgggcactt gagcacctca tgcacagcaa taacacaaca 5820
caatggttag tagcaacctg aattcggtca ttgatgcatg catgtgccgt gaagcgggac 5880
aaccagaaaa gtcgtctata aatgccggca cgtgcgatca tcgtggcggg gttttaagag 5940
tgcatatcac aaattgtcgc attaccgcgg aaccgccaga tattcattac ttgacgcaaa 6000
agcgtttgaa ataatgacga aaaagaagga agaaaaaaaa agaaaaatac cgcttctagg 6060
cgggttatct actgatccga gcttccacta ggatagcacc caaacacctg catatttgga 6120
cgacctttac ttacaccacc aaaaaccact ttcgcctctc ccgcccctga taacgtccac 6180
taattgagcg attacctgag cggtcctctt ttgtttgcag catgagactt gcatactgca 6240
aatcgtaagt agcaacgtct caaggtcaaa actgtatgga aaccttgtca cctcacttaa 6300
ttctagctag cctaccctgc aagtcaagag gtctccgtga ttcctagcca cctcaaggta 6360
tgcctctccc cggaaactgt ggccttttct ggcacacatg atctccacga tttcaacata 6420
taaatagctt ttgataatgg caatattaat caaatttatt ttacttcttt cttgtaacat 6480
ctctcttgta atcccttatt ccttctagct atttttcata aaaaaccaag caactgctta 6540
tcaacacaca aacactaaat caaagctgag gatggattta tttgagtcat tagcacaaaa 6600
aattactggt aaagatcaaa caattgtttt ccctgaagga actgaacccc gaattgtcgg 6660
tgcggcagcg cgattagctg cagacggctt ggttaagccg attgttttag gtgcaacgga 6720
caaagttcag gctgtggcta acgatttgaa tgcggattta acaggcgttc aagtccttga 6780
tcctgcgaca tacccggctg aagataagca agcaatgctt gatgccctcg ttgaacggcg 6840
gaaaggtaag aatacgccag aacaagcggc taaaatgctg gaagatgaaa actactttgg 6900
cacgatgctc gtttatatgg gcaaagcgga tgggatggtt tcaggtgcaa tccatccaac 6960
tggtgatacg gtacggccag cgttacaaat tattaagacc aagcccggtt cacaccgaat 7020
ctcgggtgca tttatcatgc aaaagggtga ggaacgctac gtctttgctg actgtgccat 7080
caatattgat cccgatgccg atacgttagc ggaaattgcc actcagagtg cggctactgc 7140
taaggtcttc gatattgacc cgaaagttgc gatgctcagc ttctcaacta agggttcggc 7200
taagggtgaa atggtcacta aagtgcaaga agcaacggcc aaggcgcaag ctgctgaacc 7260
ggaattggct atcgatggtg aacttcaatt tgacgcggcc ttcgttgaaa aagttggttt 7320
gcaaaaggct cctggttcca aagtagctgg tcatgccaat gtctttgtat ttccagagct 7380
tcagtctggt aatattggct ataagattgc gcaacgattt ggtcattttg aagcggtggg 7440
tcctgtcttg caaggcctga acaagccggt ctccgacttg tcacgtggat gcagtgaaga 7500
agacgtttat aaggttgcga ttattacagc agcccaagga ttagcttaat taattaagag 7560
taagcgaatt tcttatgatt tatgattttt attattaaat aagttataaa aaaaataagt 7620
gtatacaaat tttaaagtga ctcttaggtt ttaaaacgaa aattcttatt cttgagtaac 7680
tctttcctgt aggtcaggtt gctttctcag gtatagcatg aggtcgctct tattgaccac 7740
acctctaccg gcatgccgag caaatgcctg caaatcgctc cccatttcac ccaattgtag 7800
atatgctaac tccagcaatg agttgatgaa tctcggtgtg tattttatgt cctcagagga 7860
caacacctgt ggtactagtt ctagagcggc cgcccgcaaa ttaaagcctt cgagcgtccc 7920
aaaaccttct caagcaaggt tttcagtata atgttacatg cgtacacgcg tttgtacaga 7980
aaaaaaagaa aaatttgaaa tataaataac gttcttaata ctaacataac tattaaaaaa 8040
aataaatagg gacctagact tcaggttgtc taactccttc cttttcggtt agagcggatg 8100
tgggaggagg gcgtgaatgt aagcgtgaca taactaatta catgattaat taattatttt 8160
aaacccttcc attgccaatc attaacttct ggcaagtcag ttccggcatc ccggatatag 8220
gcattgtgtt tagcaagcat attatccatg gattgaacga aggccgcacc agtgttttcc 8280
attgctggtt gcgccgcaat tgccgactta gctaagtcga agcggtccat ctggttcatg 8340
acccgtacgt cgaatggtgt ggtaatatca ccattttcac ggtaaccgtg gacgtataag 8400
ttatggttgt gacgatcaaa gaagatgtca cgaactaagt cttcgtaacc gtggaaagca 8460
aagaccactg gtttgtcctt agtaaagtaa tggtcaaact cagcatctga caagccccgc 8520
ggatcctttt caggactacg taacttcaag atgtcgacca cgttcacgaa acgaatcttc 8580
atctctggga aactgtcgtg tagtaattgg atggcagcca acgtttcaag cgttggttcc 8640
gtcccagcag ctgcaaagac aatgtctggt tcgctacctt ggtccgtact tgcccaatca 8700
atgataccaa gaccattgtc aactaattgc ttagcttctt caatgctgaa ccattgttga 8760
cgtgggtgtt ttgacgtaac cacgtagttg atcttttctt ggctccggaa aatgacgtca 8820
ccgacagcta ataacgtgtt ggcatcggct ggtaaatatt cacgaatgta ttctggtttc 8880
ttttcggcca aatgagttaa tgcacctgga tcttggtggg tataaccatt atggtcttgt 8940
tggaatacag ttgaagccgc gataatgtta agtgatgggt actttttacg ccaatcaagt 9000
tcattggctt tacgtaacca cttgaagtgt tgcgtcaaca ttgagtccac aacgcgtagg 9060
aaggcttcat aactggcaaa taacccatga cgtccagtta agacgtaacc ttctaaccaa 9120
ccttcagctt ggtgttcaga taactgagca tctaagaccc ggccagctgg tgcttcatat 9180
tggtcactat ctggatgaat gtcttccatc cattgacgat tagtggtttc gaagacacca 9240
tataaacggt tagacatggt ttcatcaggt ccgaacaacc ggaagttatc aggatttttc 9300
ttgatgacat cccgcaaata gtctgaccaa acgatcatat cttgcttaac attcgcgcct 9360
tctttggacg tatcgaccgc ataatcacgg aagtttggta agttcaaggc tttcggatcg 9420
accccaccat tggtgattgg gttagcagcc atccgactgt ccccagtagg aataatttct 9480
ttaatatcat ccttcaaaga gccatcttca ttgaagagtt cttttggttg atatgattcg 9540
agccaatcaa ctaaagcatc cgcatgttcc atgtcatttt gatcaacagg aatcggaatt 9600
tgatgagcac ggaatgaacc ttcgatctta tcaccgtccc atgacttcgg accagtccag 9660
cccttaggtg cgcggaagac gatcattggc catactggca atgttgcatc gttattttcg 9720
cgagcatgct tctggattgc cttgatcttt tcaacggctt catccatggc cttagctaag 9780
gctgggtgaa ccttttcagg atcgtcacct tcaacgaaga ttggttccca attcatgctt 9840
tcgaagtatt ccttaatctt agcatcagaa gtccgaccaa aaatcgttgg attagaaatc 9900
ttaaaaccat ttaagttcaa gattggtaaa acagccccgt cgttgattgg gttaatgaac 9960
ttcgttgatt gccatgaagt tgctaatgga cccgtttcgg attccccatc accaacaaca 10020
accgcggcga tttcgtcagg attgtcaaga attgccccaa ccccgtgtga aattgagtaa 10080
ccaagttcgc caccttcgtg gattgaaccg ggtgtttcag gtgccgcatg ggaagcaacc 10140
ccacctggga atgagaattg cttgaagagc ttttgcatcc cttcaacatc ctgcgtaatt 10200
tctggataaa tatcggtgta agtaccgtca aggtaagagt ttgaaaccat cacttgacca 10260
ccatgacctg gaccttcaac gtagaacatc ttcaaaccgt acttgttgat gacccggtta 10320
agatgagcat agataaagtt ttgaccggca atcgtccccc agtgaccaat tggatgaacc 10380
ttaacgtcac tggccttcaa tggccgttgt aatagtggat tatcttttaa ataaagttga 10440
ccaactgata agtagttggc agcacgccag tacttatcaa ctttttgcaa atatgctggt 10500
gatgagtaat ctgttgtcat cctcagctgg aacttagatt agattgctat gctttctctc 10560
taacgagcaa gaagtaaaaa aagttgtaat agaacaagaa aaatgaaact gaagcttgag 10620
aaattgaaga ccgtttatta gcttaaatat caatgggagg tcatcgaaag agaaaaaaat 10680
caagaaagaa actctcaaga aaaagaaacg tgataaaaat ttttattgcc tctctcgacg 10740
aagagaaaga aacgaggcgg tccctttttt cttttccaaa cctttagtac gggtaattag 10800
cgacacccta gaggaagaaa gaggggaaat ttagtatgct gtgcttgggt gtcttgaagt 10860
ggtacggcga tgcgcggagt ccgagaaaat ctggaagagt aaaaaggggg tagaagcgtt 10920
ttgaagctat ccgc 10934
<210> 112
<211> 80
<212> DNA
<213> Artificial sequence
<220>
<223> N1341
<400> 112
gttgcaagaa atgcattatg caattttttg attatgacaa tctctcgaaa atagcttcaa 60
aacgcttcta cccccttttt 80
<210> 113
<211> 80
<212> DNA
<213> Artificial sequence
<220>
<223> N1338
<400> 113
catacattat acgaacggta ctgaacatta gaatacgtaa tccgcaatgc ccgcaaatta 60
aagccttcga gcgtcccaaa 80
<210> 114
<211> 30
<212> DNA
<213> Artificial sequence
<220>
<223> N1033c
<400> 114
gcattgcgga ttacgtattc taatgttcag 30
<210> 115
<211> 81
<212> DNA
<213> Artificial sequence
<220>
<223> N1342
<400> 115
acatatgtga aaaaaaatag ttgatatttt aaaccaaatc agaaatttat caccttggct 60
aactcgttgt atcatcactg g 81
<210> 116
<211> 30
<212> DNA
<213> Artificial sequence
<220>
<223> N1364
<400> 116
atgacaacag attactcatc accagcatat 30
<210> 117
<211> 604
<212> DNA
<213> Artificial sequence
<220>
<223> L8
<400> 117
gcctacttgg cttcacatac gttgcatacg acgatataga aaataatgat aatgacagca 60
ggattatcgt ataacgtaat agtcgaaaaa tctcaaaaat ctgtgggtca ttacgtaaat 120
aatgatagga atgtgattct tctatttttc ctttttccat tctggcagcc gtcgggaaaa 180
cgtggcttcc tctctttcgg gctctattgg agtaacgctg ccgtgagctt cctctctttc 240
catatctaac aactgagcac gtaaccaatg gtaaagcatg agcttagcgt tgctccaaag 300
aagtattgga aggttaatac catgtgtctg ttctcttctg actttgactc ctcaaataaa 360
aaaaaattct acaatcaaca gatcgcttca attacgctct cacaaaaact tttttccttc 420
ttcttcgccc acgttaaatt ttaaccctca tgctgtctaa cggatttctg cacttaattt 480
attataaaac gacaaagaca taatacttct ctatcaattt cagttattgt tcttcattgc 540
attactcttc tgttcttctt tttcatttgt catatacaac cataaccaaa taatacatat 600
tcaa 604
<210> 118
<211> 80
<212> DNA
<213> Artificial sequence
<220>
<223> N1366
<400> 118
gttgcaagaa atgcattatg caattttttg attatgacaa tctctcgaaa gcctacttgg 60
cttcacatac gttgcatacg 80
<210> 119
<211> 65
<212> DNA
<213> Artificial sequence
<220>
<223> N1368
<400> 119
atatgctggt gatgagtaat ctgttgtcat tttgaatatg tattatttgg ttatggttgt 60
atatg 65
<210> 120
<211> 80
<212> DNA
<213> Artificial sequence
<220>
<223> N1371
<400> 120
aaaaactaat acgtaaacct gcattaaggt aagattatat cagaaaatgt gttgcaagaa 60
atgcattatg caattttttg 80
<210> 121
<211> 85
<212> DNA
<213> Artificial sequence
<220>
<223> N1372
<400> 121
tagaagctaa tctttaacct ggaagacagg acagaaaagt aattacaaga acatatgtga 60
aaaaaaatag ttgatatttt aaacc 85
<210> 122
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> BK93
<400> 122
aaaaattgat tctcatcgta aatgc 25
<210> 123
<211> 30
<212> DNA
<213> Artificial sequence
<220>
<223> N1114
<400> 123
atatgctggt gatgagtaat ctgttgtcat 30
<210> 124
<211> 22
<212> DNA
<213> Artificial sequence
<220>
<223> N160SeqF5
<400> 124
cctgaagtct aggtccctat tt 22
<210> 125
<211> 37
<212> DNA
<213> Artificial sequence
<220>
<223> BK380
<400> 125
tcgacgtcga tgtaaggcct tgtaattcag tttgttc 37
<210> 126
<211> 338
<212> PRT
<213> Artificial sequence
<220>
<223> Anaerostipes caccae KARI variant K9SB2_SH
<400> 126
Met Ala Lys Ile Tyr Tyr Gln Glu Asp Cys Asn Leu Ser Leu Leu Asp
1 5 10 15
Gly Lys Thr Ile Ala Val Ile Gly Tyr Gly Ser Gln Gly His Ala His
20 25 30
Ala Leu Asn Ala Lys Glu Ser Gly Cys Asn Val Ile Ile Gly Leu Phe
35 40 45
Glu Gly Ala Glu Glu Trp Lys Arg Ala Glu Glu Gln Gly Phe Glu Val
50 55 60
Tyr Thr Ala Ala Glu Ala Ala Lys Lys Ala Asp Ile Ile Met Ile Leu
65 70 75 80
Ile Pro Asp Glu Lys Gln Ala Thr Met Tyr Lys Asn Asp Ile Glu Pro
85 90 95
Asn Leu Glu Ala Gly Asn Met Leu Met Phe Ala His Gly Phe Asn Ile
100 105 110
His Phe Gly Cys Ile Val Pro Pro Lys Asp Val Asp Val Thr Met Ile
115 120 125
Ala Pro Lys Gly Pro Gly His Thr Val Arg Ser Glu Tyr Glu Glu Gly
130 135 140
Lys Gly Val Pro Cys Leu Val Ala Val Glu Gln Asp Ala Thr Gly Lys
145 150 155 160
Ala Leu Asp Met Ala Leu Ala Tyr Ala Leu Ala Ile Gly Gly Ala Arg
165 170 175
Ala Gly Val Leu Glu Thr Thr Phe Arg Thr Glu Thr Glu Thr Asp Leu
180 185 190
Phe Gly Glu Gln Ala Val Leu Cys Gly Gly Val Cys Ala Leu Met Gln
195 200 205
Ala Gly Phe Glu Thr Leu Val Glu Ala Gly Tyr Asp Pro Arg Asn Ala
210 215 220
Tyr Phe Glu Cys Ile His Glu Met Lys Leu Ile Val Asp Leu Ile Tyr
225 230 235 240
Gln Ser Gly Phe Ser Gly Met Arg Tyr Ser Ile Ser Asn Thr Ala Glu
245 250 255
Tyr Gly Asp Tyr Ile Thr Gly Pro Lys Ile Ile Thr Glu Asp Thr Lys
260 265 270
Lys Ala Met Lys Lys Ile Leu Ser Asp Ile Gln Asp Gly Thr Phe Ala
275 280 285
Lys Asp Phe Leu Val Asp Met Ser Asp Ala Gly Ser Gln Val His Phe
290 295 300
Lys Ala Met Arg Lys Leu Ala Ser Glu His Pro Ala Glu Val Val Gly
305 310 315 320
Glu Glu Ile Arg Ser Leu Tyr Ser Trp Ser Asp Glu Asp Lys Leu Ile
325 330 335
Asn Asn
<210> 127
<211> 578
<212> PRT
<213> Artificial sequence
<220>
<223> DHAD variant L2V4
<400> 127
Met Thr Asp Lys Lys Thr Leu Lys Asp Leu Arg Asn Arg Ser Ser Val
1 5 10 15
Tyr Asp Ser Met Val Lys Ser Pro Asn Arg Ala Met Leu Arg Ala Thr
20 25 30
Gly Met Gln Asp Glu Asp Phe Glu Lys Pro Ile Val Gly Val Ile Ser
35 40 45
Thr Trp Ala Glu Asn Thr Pro Cys Asn Ile His Leu His Asp Phe Gly
50 55 60
Lys Leu Ala Lys Val Gly Val Lys Glu Ala Gly Ala Trp Pro Val Gln
65 70 75 80
Phe Gly Thr Ile Thr Val Ser Asp Gly Ile Ala Met Gly Thr Gln Gly
85 90 95
Met Arg Phe Ser Leu Thr Ser Arg Asp Ile Ile Ala Asp Ser Ile Glu
100 105 110
Ala Ala Met Gly Gly His Asn Ala Asp Ala Phe Val Ala Ile Gly Gly
115 120 125
Cys Asp Lys Asn Met Pro Gly Ser Val Ile Ala Met Ala Asn Met Asp
130 135 140
Ile Pro Ala Ile Phe Ala Tyr Gly Gly Thr Ile Ala Pro Gly Asn Leu
145 150 155 160
Asp Gly Lys Asp Ile Asp Leu Val Ser Val Phe Glu Gly Val Gly His
165 170 175
Trp Asn His Gly Asp Met Thr Lys Glu Glu Val Lys Ala Leu Glu Cys
180 185 190
Asn Ala Cys Pro Gly Pro Gly Gly Cys Gly Gly Met Tyr Thr Ala Asn
195 200 205
Thr Met Ala Thr Ala Ile Glu Val Leu Gly Leu Ser Leu Pro Gly Ser
210 215 220
Ser Ser His Pro Ala Glu Ser Ala Glu Lys Lys Ala Asp Ile Glu Glu
225 230 235 240
Ala Gly Arg Ala Val Val Lys Met Leu Glu Met Gly Leu Lys Pro Ser
245 250 255
Asp Ile Leu Thr Arg Glu Ala Phe Glu Asp Ala Ile Thr Val Thr Met
260 265 270
Ala Leu Gly Gly Ser Thr Asn Ser Thr Leu His Leu Leu Ala Ile Ala
275 280 285
His Ala Ala Asn Val Glu Leu Thr Leu Asp Asp Phe Asn Thr Phe Gln
290 295 300
Glu Lys Val Pro His Leu Ala Asp Leu Lys Pro Ser Gly Gln Tyr Val
305 310 315 320
Phe Gln Asp Leu Tyr Lys Val Gly Gly Val Pro Ala Val Met Lys Tyr
325 330 335
Leu Leu Lys Asn Gly Phe Leu His Gly Asp Arg Ile Thr Cys Thr Gly
340 345 350
Lys Thr Val Ala Glu Asn Leu Lys Ala Phe Asp Asp Leu Thr Pro Gly
355 360 365
Gln Lys Val Ile Met Pro Leu Glu Asn Pro Lys Arg Glu Asp Gly Pro
370 375 380
Val Ile Ile Leu His Gly Asn Leu Ala Pro Asp Gly Ala Val Ala Lys
385 390 395 400
Val Ser Gly Val Lys Val Arg Arg His Val Gly Pro Ala Lys Val Phe
405 410 415
Asn Ser Glu Glu Glu Ala Ile Glu Ala Val Leu Asn Asp Asp Ile Val
420 425 430
Asp Gly Asp Val Val Val Val Arg Phe Val Gly Pro Lys Gly Gly Pro
435 440 445
Gly Met Pro Glu Met Leu Ser Leu Ser Ser Met Ile Val Gly Lys Gly
450 455 460
Gln Gly Glu Lys Val Ala Leu Leu Thr Asp Gly Arg Phe Ser Gly Gly
465 470 475 480
Thr Tyr Gly Leu Val Val Gly His Ile Ala Pro Glu Ala Gln Asp Gly
485 490 495
Gly Pro Ile Ala Tyr Leu Gln Thr Gly Asp Ile Val Thr Ile Asp Gln
500 505 510
Asp Thr Lys Glu Leu His Phe Asp Ile Ser Asp Glu Glu Leu Lys His
515 520 525
Arg Gln Glu Thr Ile Glu Leu Pro Pro Leu Tyr Ser Arg Gly Ile Leu
530 535 540
Gly Lys Tyr Ala His Ile Val Ser Ser Ala Ser Arg Gly Ala Val Thr
545 550 555 560
Asp Phe Trp Lys Pro Glu Glu Thr Gly Lys Lys Cys Cys Pro Gly Cys
565 570 575
Cys Gly
<210> 128
<211> 347
<212> PRT
<213> Beijerinkia indica
<400> 128
Met Lys Ala Leu Val Tyr Arg Gly Pro Gly Gln Lys Leu Val Glu Glu
1 5 10 15
Arg Gln Lys Pro Glu Leu Lys Glu Pro Gly Asp Ala Ile Val Lys Val
20 25 30
Thr Lys Thr Thr Ile Cys Gly Thr Asp Leu His Ile Leu Lys Gly Asp
35 40 45
Val Ala Thr Cys Lys Pro Gly Arg Val Leu Gly His Glu Gly Val Gly
50 55 60
Val Ile Glu Ser Val Gly Ser Gly Val Thr Ala Phe Gln Pro Gly Asp
65 70 75 80
Arg Val Leu Ile Ser Cys Ile Ser Ser Cys Gly Lys Cys Ser Phe Cys
85 90 95
Arg Arg Gly Met Phe Ser His Cys Thr Thr Gly Gly Trp Ile Leu Gly
100 105 110
Asn Glu Ile Asp Gly Thr Gln Ala Glu Tyr Val Arg Val Pro His Ala
115 120 125
Asp Thr Ser Leu Tyr Arg Ile Pro Ala Gly Ala Asp Glu Glu Ala Leu
130 135 140
Val Met Leu Ser Asp Ile Leu Pro Thr Gly Phe Glu Cys Gly Val Leu
145 150 155 160
Asn Gly Lys Val Ala Pro Gly Ser Ser Val Ala Ile Val Gly Ala Gly
165 170 175
Pro Val Gly Leu Ala Ala Leu Leu Thr Ala Gln Phe Tyr Ser Pro Ala
180 185 190
Glu Ile Ile Met Ile Asp Leu Asp Asp Asn Arg Leu Gly Leu Ala Lys
195 200 205
Gln Phe Gly Ala Thr Arg Thr Val Asn Ser Thr Gly Gly Asn Ala Ala
210 215 220
Ala Glu Val Lys Ala Leu Thr Glu Gly Leu Gly Val Asp Thr Ala Ile
225 230 235 240
Glu Ala Val Gly Ile Pro Ala Thr Phe Glu Leu Cys Gln Asn Ile Val
245 250 255
Ala Pro Gly Gly Thr Ile Ala Asn Val Gly Val His Gly Ser Lys Val
260 265 270
Asp Leu His Leu Glu Ser Leu Trp Ser His Asn Val Thr Ile Thr Thr
275 280 285
Arg Leu Val Asp Thr Ala Thr Thr Pro Met Leu Leu Lys Thr Val Gln
290 295 300
Ser His Lys Leu Asp Pro Ser Arg Leu Ile Thr His Arg Phe Ser Leu
305 310 315 320
Asp Gln Ile Leu Asp Ala Tyr Glu Thr Phe Gly Gln Ala Ala Ser Thr
325 330 335
Gln Ala Leu Lys Val Ile Ile Ser Met Glu Ala
340 345
<210> 129
<211> 548
<212> PRT
<213> Listeria grayi
<400> 129
Met Tyr Thr Val Gly Gln Tyr Leu Val Asp Arg Leu Glu Glu Ile Gly
1 5 10 15
Ile Asp Lys Val Phe Gly Val Pro Gly Asp Tyr Asn Leu Thr Phe Leu
20 25 30
Asp Tyr Ile Gln Asn His Glu Gly Leu Ser Trp Gln Gly Asn Thr Asn
35 40 45
Glu Leu Asn Ala Ala Tyr Ala Ala Asp Gly Tyr Ala Arg Glu Arg Gly
50 55 60
Val Ser Ala Leu Val Thr Thr Phe Gly Val Gly Glu Leu Ser Ala Ile
65 70 75 80
Asn Gly Thr Ala Gly Ser Phe Ala Glu Gln Val Pro Val Ile His Ile
85 90 95
Val Gly Ser Pro Thr Met Asn Val Gln Ser Asn Lys Lys Leu Val His
100 105 110
His Ser Leu Gly Met Gly Asn Phe His Asn Phe Ser Glu Met Ala Lys
115 120 125
Glu Val Thr Ala Ala Thr Thr Met Leu Thr Glu Glu Asn Ala Ala Ser
130 135 140
Glu Ile Asp Arg Val Leu Glu Thr Ala Leu Leu Glu Lys Arg Pro Val
145 150 155 160
Tyr Ile Asn Leu Pro Ile Asp Ile Ala His Lys Ala Ile Val Lys Pro
165 170 175
Ala Lys Ala Leu Gln Thr Glu Lys Ser Ser Gly Glu Arg Glu Ala Gln
180 185 190
Leu Ala Glu Ile Ile Leu Ser His Leu Glu Lys Ala Ala Gln Pro Ile
195 200 205
Val Ile Ala Gly His Glu Ile Ala Arg Phe Gln Ile Arg Glu Arg Phe
210 215 220
Glu Asn Trp Ile Asn Gln Thr Lys Leu Pro Val Thr Asn Leu Ala Tyr
225 230 235 240
Gly Lys Gly Ser Phe Asn Glu Glu Asn Glu His Phe Ile Gly Thr Tyr
245 250 255
Tyr Pro Ala Phe Ser Asp Lys Asn Val Leu Asp Tyr Val Asp Asn Ser
260 265 270
Asp Phe Val Leu His Phe Gly Gly Lys Ile Ile Asp Asn Ser Thr Ser
275 280 285
Ser Phe Ser Gln Gly Phe Lys Thr Glu Asn Thr Leu Thr Ala Ala Asn
290 295 300
Asp Ile Ile Met Leu Pro Asp Gly Ser Thr Tyr Ser Gly Ile Ser Leu
305 310 315 320
Asn Gly Leu Leu Ala Glu Leu Glu Lys Leu Asn Phe Thr Phe Ala Asp
325 330 335
Thr Ala Ala Lys Gln Ala Glu Leu Ala Val Phe Glu Pro Gln Ala Glu
340 345 350
Thr Pro Leu Lys Gln Asp Arg Phe His Gln Ala Val Met Asn Phe Leu
355 360 365
Gln Ala Asp Asp Val Leu Val Thr Glu Gln Gly Thr Ser Ser Phe Gly
370 375 380
Leu Met Leu Ala Pro Leu Lys Lys Gly Met Asn Leu Ile Ser Gln Thr
385 390 395 400
Leu Trp Gly Ser Ile Gly Tyr Thr Leu Pro Ala Met Ile Gly Ser Gln
405 410 415
Ile Ala Ala Pro Glu Arg Arg His Ile Leu Ser Ile Gly Asp Gly Ser
420 425 430
Phe Gln Leu Thr Ala Gln Glu Met Ser Thr Ile Phe Arg Glu Lys Leu
435 440 445
Thr Pro Val Ile Phe Ile Ile Asn Asn Asp Gly Tyr Thr Val Glu Arg
450 455 460
Ala Ile His Gly Glu Asp Glu Ser Tyr Asn Asp Ile Pro Thr Trp Asn
465 470 475 480
Leu Gln Leu Val Ala Glu Thr Phe Gly Gly Asp Ala Glu Thr Val Asp
485 490 495
Thr His Asn Val Phe Thr Glu Thr Asp Phe Ala Asn Thr Leu Ala Ala
500 505 510
Ile Asp Ala Thr Pro Gln Lys Ala His Val Val Glu Val His Met Glu
515 520 525
Gln Met Asp Met Pro Glu Ser Leu Arg Gln Ile Gly Leu Ala Leu Ser
530 535 540
Lys Gln Asn Ser
545
<210> 130
<211> 343
<212> PRT
<213> Artificial sequence
<220>
<223> Anaerostipes caccae KARI variant K9JB4P
<400> 130
Met Glu Glu Cys Lys Met Ala Lys Ile Tyr Tyr Gln Glu Asp Cys Asn
1 5 10 15
Leu Ser Leu Leu Asp Gly Lys Thr Ile Ala Val Ile Gly Tyr Gly Ser
20 25 30
Gln Gly His Ala His Ala Leu Asn Ala Lys Glu Ser Gly Cys Asn Val
35 40 45
Ile Ile Gly Leu Tyr Glu Gly Ala Glu Glu Trp Lys Arg Ala Glu Glu
50 55 60
Gln Gly Phe Glu Val Tyr Thr Ala Ala Glu Ala Ala Lys Lys Ala Asp
65 70 75 80
Ile Ile Met Ile Leu Ile Pro Asp Glu Lys Gln Ala Thr Met Tyr Lys
85 90 95
Asn Asp Ile Glu Pro Asn Leu Glu Ala Gly Asn Met Leu Met Phe Ala
100 105 110
His Gly Phe Asn Ile His Phe Gly Cys Ile Val Pro Pro Lys Asp Val
115 120 125
Asp Val Thr Met Ile Ala Pro Lys Gly Pro Gly His Thr Val Arg Ser
130 135 140
Glu Tyr Glu Glu Gly Lys Gly Val Pro Cys Leu Val Ala Val Glu Gln
145 150 155 160
Asp Ala Thr Gly Lys Ala Leu Asp Met Ala Leu Ala Tyr Ala Leu Ala
165 170 175
Ile Gly Gly Ala Arg Ala Gly Val Leu Glu Thr Thr Phe Arg Thr Glu
180 185 190
Thr Glu Thr Asp Leu Phe Gly Glu Gln Ala Val Leu Cys Gly Gly Val
195 200 205
Cys Ala Leu Met Gln Ala Gly Phe Glu Thr Leu Val Glu Ala Gly Tyr
210 215 220
Asp Pro Arg Asn Ala Tyr Phe Glu Cys Ile His Glu Met Lys Leu Ile
225 230 235 240
Val Asp Leu Ile Tyr Gln Ser Gly Phe Ser Gly Met Arg Tyr Ser Ile
245 250 255
Ser Asn Thr Ala Glu Tyr Gly Asp Tyr Ile Thr Gly Pro Lys Ile Ile
260 265 270
Thr Glu Asp Thr Lys Lys Ala Met Lys Lys Ile Leu Ser Asp Ile Gln
275 280 285
Asp Gly Thr Phe Ala Lys Asp Phe Leu Val Asp Met Ser Asp Ala Gly
290 295 300
Ser Gln Val His Phe Lys Ala Met Arg Lys Leu Ala Ser Glu His Pro
305 310 315 320
Ala Glu Val Val Gly Glu Glu Ile Arg Ser Leu Tyr Ser Trp Ser Asp
325 330 335
Glu Asp Lys Leu Ile Asn Asn
340
<210> 131
<211> 571
<212> PRT
<213> Streptococcus mutans
<400> 131
Met Thr Asp Lys Lys Thr Leu Lys Asp Leu Arg Asn Arg Ser Ser Val
1 5 10 15
Tyr Asp Ser Met Val Lys Ser Pro Asn Arg Ala Met Leu Arg Ala Thr
20 25 30
Gly Met Gln Asp Glu Asp Phe Glu Lys Pro Ile Val Gly Val Ile Ser
35 40 45
Thr Trp Ala Glu Asn Thr Pro Cys Asn Ile His Leu His Asp Phe Gly
50 55 60
Lys Leu Ala Lys Val Gly Val Lys Glu Ala Gly Ala Trp Pro Val Gln
65 70 75 80
Phe Gly Thr Ile Thr Val Ser Asp Gly Ile Ala Met Gly Thr Gln Gly
85 90 95
Met Arg Phe Ser Leu Thr Ser Arg Asp Ile Ile Ala Asp Ser Ile Glu
100 105 110
Ala Ala Met Gly Gly His Asn Ala Asp Ala Phe Val Ala Ile Gly Gly
115 120 125
Cys Asp Lys Asn Met Pro Gly Ser Val Ile Ala Met Ala Asn Met Asp
130 135 140
Ile Pro Ala Ile Phe Ala Tyr Gly Gly Thr Ile Ala Pro Gly Asn Leu
145 150 155 160
Asp Gly Lys Asp Ile Asp Leu Val Ser Val Phe Glu Gly Val Gly His
165 170 175
Trp Asn His Gly Asp Met Thr Lys Glu Glu Val Lys Ala Leu Glu Cys
180 185 190
Asn Ala Cys Pro Gly Pro Gly Gly Cys Gly Gly Met Tyr Thr Ala Asn
195 200 205
Thr Met Ala Thr Ala Ile Glu Val Leu Gly Leu Ser Leu Pro Gly Ser
210 215 220
Ser Ser His Pro Ala Glu Ser Ala Glu Lys Lys Ala Asp Ile Glu Glu
225 230 235 240
Ala Gly Arg Ala Val Val Lys Met Leu Glu Met Gly Leu Lys Pro Ser
245 250 255
Asp Ile Leu Thr Arg Glu Ala Phe Glu Asp Ala Ile Thr Val Thr Met
260 265 270
Ala Leu Gly Gly Ser Thr Asn Ser Thr Leu His Leu Leu Ala Ile Ala
275 280 285
His Ala Ala Asn Val Glu Leu Thr Leu Asp Asp Phe Asn Thr Phe Gln
290 295 300
Glu Lys Val Pro His Leu Ala Asp Leu Lys Pro Ser Gly Gln Tyr Val
305 310 315 320
Phe Gln Asp Leu Tyr Lys Val Gly Gly Val Pro Ala Val Met Lys Tyr
325 330 335
Leu Leu Lys Asn Gly Phe Leu His Gly Asp Arg Ile Thr Cys Thr Gly
340 345 350
Lys Thr Val Ala Glu Asn Leu Lys Ala Phe Asp Asp Leu Thr Pro Gly
355 360 365
Gln Lys Val Ile Met Pro Leu Glu Asn Pro Lys Arg Glu Asp Gly Pro
370 375 380
Leu Ile Ile Leu His Gly Asn Leu Ala Pro Asp Gly Ala Val Ala Lys
385 390 395 400
Val Ser Gly Val Lys Val Arg Arg His Val Gly Pro Ala Lys Val Phe
405 410 415
Asn Ser Glu Glu Glu Ala Ile Glu Ala Val Leu Asn Asp Asp Ile Val
420 425 430
Asp Gly Asp Val Val Val Val Arg Phe Val Gly Pro Lys Gly Gly Pro
435 440 445
Gly Met Pro Glu Met Leu Ser Leu Ser Ser Met Ile Val Gly Lys Gly
450 455 460
Gln Gly Glu Lys Val Ala Leu Leu Thr Asp Gly Arg Phe Ser Gly Gly
465 470 475 480
Thr Tyr Gly Leu Val Val Gly His Ile Ala Pro Glu Ala Gln Asp Gly
485 490 495
Gly Pro Ile Ala Tyr Leu Gln Thr Gly Asp Ile Val Thr Ile Asp Gln
500 505 510
Asp Thr Lys Glu Leu His Phe Asp Ile Ser Asp Glu Glu Leu Lys His
515 520 525
Arg Gln Glu Thr Ile Glu Leu Pro Pro Leu Tyr Ser Arg Gly Ile Leu
530 535 540
Gly Lys Tyr Ala His Ile Val Ser Ser Ala Ser Arg Gly Ala Val Thr
545 550 555 560
Asp Phe Trp Lys Pro Glu Glu Thr Gly Lys Lys
565 570
<210> 132
<211> 343
<212> PRT
<213> Artificial sequence
<220>
<223> Anaerostipes caccae KARI variant K9G9
<400> 132
Met Glu Glu Cys Lys Met Ala Lys Ile Tyr Tyr Gln Glu Asp Cys Asn
1 5 10 15
Leu Ser Leu Leu Asp Gly Lys Thr Ile Ala Val Ile Gly Tyr Gly Ser
20 25 30
Gln Gly His Ala His Ala Leu Asn Ala Lys Glu Ser Gly Cys Asn Val
35 40 45
Ile Ile Gly Leu Tyr Glu Gly Ala Lys Glu Trp Lys Arg Ala Glu Glu
50 55 60
Gln Gly Phe Glu Val Tyr Thr Ala Ala Glu Ala Ala Lys Lys Ala Asp
65 70 75 80
Ile Ile Met Ile Leu Ile Asn Asp Glu Lys Gln Ala Thr Met Tyr Lys
85 90 95
Asn Asp Ile Glu Pro Asn Leu Glu Ala Gly Asn Met Leu Met Phe Ala
100 105 110
His Gly Phe Asn Ile His Phe Gly Cys Ile Val Pro Pro Lys Asp Val
115 120 125
Asp Val Thr Met Ile Ala Pro Lys Gly Pro Gly His Thr Val Arg Ser
130 135 140
Glu Tyr Glu Glu Gly Lys Gly Val Pro Cys Leu Val Ala Val Glu Gln
145 150 155 160
Asp Ala Thr Gly Lys Ala Leu Asp Met Ala Leu Ala Tyr Ala Leu Ala
165 170 175
Ile Gly Gly Ala Arg Ala Gly Val Leu Glu Thr Thr Phe Arg Thr Glu
180 185 190
Thr Glu Thr Asp Leu Phe Gly Glu Gln Ala Val Leu Cys Gly Gly Val
195 200 205
Cys Ala Leu Met Gln Ala Gly Phe Glu Thr Leu Val Glu Ala Gly Tyr
210 215 220
Asp Pro Arg Asn Ala Tyr Phe Glu Cys Ile His Glu Met Lys Leu Ile
225 230 235 240
Val Asp Leu Ile Tyr Gln Ser Gly Phe Ser Gly Met Arg Tyr Ser Ile
245 250 255
Ser Asn Thr Ala Glu Tyr Gly Asp Tyr Ile Thr Gly Pro Lys Ile Ile
260 265 270
Thr Glu Asp Thr Lys Lys Ala Met Lys Lys Ile Leu Ser Asp Ile Gln
275 280 285
Asp Gly Thr Phe Ala Lys Asp Phe Leu Val Asp Met Ser Asp Ala Gly
290 295 300
Ser Gln Val His Phe Lys Ala Met Arg Lys Leu Ala Ser Glu His Pro
305 310 315 320
Ala Glu Val Val Gly Glu Glu Ile Arg Ser Leu Tyr Ser Trp Ser Asp
325 330 335
Glu Asp Lys Leu Ile Asn Asn
340
<210> 133
<211> 343
<212> PRT
<213> Artificial sequence
<220>
<223> Anaerostipes caccae KARI variant K9D3
<400> 133
Met Glu Glu Cys Lys Met Ala Lys Ile Tyr Tyr Gln Glu Asp Cys Asn
1 5 10 15
Leu Ser Leu Leu Asp Gly Lys Thr Ile Ala Val Ile Gly Tyr Gly Ser
20 25 30
Gln Gly His Ala His Ala Leu Asn Ala Lys Glu Ser Gly Cys Asn Val
35 40 45
Ile Ile Gly Leu Tyr Glu Gly Ala Lys Asp Trp Lys Arg Ala Glu Glu
50 55 60
Gln Gly Phe Glu Val Tyr Thr Ala Ala Glu Ala Ala Lys Lys Ala Asp
65 70 75 80
Ile Ile Met Ile Leu Ile Asn Asp Glu Lys Gln Ala Thr Met Tyr Lys
85 90 95
Asn Asp Ile Glu Pro Asn Leu Glu Ala Gly Asn Met Leu Met Phe Ala
100 105 110
His Gly Phe Asn Ile His Phe Gly Cys Ile Val Pro Pro Lys Asp Val
115 120 125
Asp Val Thr Met Ile Ala Pro Lys Gly Pro Gly His Thr Val Arg Ser
130 135 140
Glu Tyr Glu Glu Gly Lys Gly Val Pro Cys Leu Val Ala Val Glu Gln
145 150 155 160
Asp Ala Thr Gly Lys Ala Leu Asp Met Ala Leu Ala Tyr Ala Leu Ala
165 170 175
Ile Gly Gly Ala Arg Ala Gly Val Leu Glu Thr Thr Phe Arg Thr Glu
180 185 190
Thr Glu Thr Asp Leu Phe Gly Glu Gln Ala Val Leu Cys Gly Gly Val
195 200 205
Cys Ala Leu Met Gln Ala Gly Phe Glu Thr Leu Val Glu Ala Gly Tyr
210 215 220
Asp Pro Arg Asn Ala Tyr Phe Glu Cys Ile His Glu Met Lys Leu Ile
225 230 235 240
Val Asp Leu Ile Tyr Gln Ser Gly Phe Ser Gly Met Arg Tyr Ser Ile
245 250 255
Ser Asn Thr Ala Glu Tyr Gly Asp Tyr Ile Thr Gly Pro Lys Ile Ile
260 265 270
Thr Glu Asp Thr Lys Lys Ala Met Lys Lys Ile Leu Ser Asp Ile Gln
275 280 285
Asp Gly Thr Phe Ala Lys Asp Phe Leu Val Asp Met Ser Asp Ala Gly
290 295 300
Ser Gln Val His Phe Lys Ala Met Arg Lys Leu Ala Ser Glu His Pro
305 310 315 320
Ala Glu Val Val Gly Glu Glu Ile Arg Ser Leu Tyr Ser Trp Ser Asp
325 330 335
Glu Asp Lys Leu Ile Asn Asn
340
<210> 134
<211> 571
<212> PRT
<213> Artificial sequence
<220>
<223> DHAD variant L2V4
<400> 134
Met Thr Asp Lys Lys Thr Leu Lys Asp Leu Arg Asn Arg Ser Ser Val
1 5 10 15
Tyr Asp Ser Met Val Lys Ser Pro Asn Arg Ala Met Leu Arg Ala Thr
20 25 30
Gly Met Gln Asp Glu Asp Phe Glu Lys Pro Ile Val Gly Val Ile Ser
35 40 45
Thr Trp Ala Glu Asn Thr Pro Cys Asn Ile His Leu His Asp Phe Gly
50 55 60
Lys Leu Ala Lys Val Gly Val Lys Glu Ala Gly Ala Trp Pro Val Gln
65 70 75 80
Phe Gly Thr Ile Thr Val Ser Asp Gly Ile Ala Met Gly Thr Gln Gly
85 90 95
Met Arg Phe Ser Leu Thr Ser Arg Asp Ile Ile Ala Asp Ser Ile Glu
100 105 110
Ala Ala Met Gly Gly His Asn Ala Asp Ala Phe Val Ala Ile Gly Gly
115 120 125
Cys Asp Lys Asn Met Pro Gly Ser Val Ile Ala Met Ala Asn Met Asp
130 135 140
Ile Pro Ala Ile Phe Ala Tyr Gly Gly Thr Ile Ala Pro Gly Asn Leu
145 150 155 160
Asp Gly Lys Asp Ile Asp Leu Val Ser Val Phe Glu Gly Val Gly His
165 170 175
Trp Asn His Gly Asp Met Thr Lys Glu Glu Val Lys Ala Leu Glu Cys
180 185 190
Asn Ala Cys Pro Gly Pro Gly Gly Cys Gly Gly Met Tyr Thr Ala Asn
195 200 205
Thr Met Ala Thr Ala Ile Glu Val Leu Gly Leu Ser Leu Pro Gly Ser
210 215 220
Ser Ser His Pro Ala Glu Ser Ala Glu Lys Lys Ala Asp Ile Glu Glu
225 230 235 240
Ala Gly Arg Ala Val Val Lys Met Leu Glu Met Gly Leu Lys Pro Ser
245 250 255
Asp Ile Leu Thr Arg Glu Ala Phe Glu Asp Ala Ile Thr Val Thr Met
260 265 270
Ala Leu Gly Gly Ser Thr Asn Ser Thr Leu His Leu Leu Ala Ile Ala
275 280 285
His Ala Ala Asn Val Glu Leu Thr Leu Asp Asp Phe Asn Thr Phe Gln
290 295 300
Glu Lys Val Pro His Leu Ala Asp Leu Lys Pro Ser Gly Gln Tyr Val
305 310 315 320
Phe Gln Asp Leu Tyr Lys Val Gly Gly Val Pro Ala Val Met Lys Tyr
325 330 335
Leu Leu Lys Asn Gly Phe Leu His Gly Asp Arg Ile Thr Cys Thr Gly
340 345 350
Lys Thr Val Ala Glu Asn Leu Lys Ala Phe Asp Asp Leu Thr Pro Gly
355 360 365
Gln Lys Val Ile Met Pro Leu Glu Asn Pro Lys Arg Glu Asp Gly Pro
370 375 380
Val Ile Ile Leu His Gly Asn Leu Ala Pro Asp Gly Ala Val Ala Lys
385 390 395 400
Val Ser Gly Val Lys Val Arg Arg His Val Gly Pro Ala Lys Val Phe
405 410 415
Asn Ser Glu Glu Glu Ala Ile Glu Ala Val Leu Asn Asp Asp Ile Val
420 425 430
Asp Gly Asp Val Val Val Val Arg Phe Val Gly Pro Lys Gly Gly Pro
435 440 445
Gly Met Pro Glu Met Leu Ser Leu Ser Ser Met Ile Val Gly Lys Gly
450 455 460
Gln Gly Glu Lys Val Ala Leu Leu Thr Asp Gly Arg Phe Ser Gly Gly
465 470 475 480
Thr Tyr Gly Leu Val Val Gly His Ile Ala Pro Glu Ala Gln Asp Gly
485 490 495
Gly Pro Ile Ala Tyr Leu Gln Thr Gly Asp Ile Val Thr Ile Asp Gln
500 505 510
Asp Thr Lys Glu Leu His Phe Asp Ile Ser Asp Glu Glu Leu Lys His
515 520 525
Arg Gln Glu Thr Ile Glu Leu Pro Pro Leu Tyr Ser Arg Gly Ile Leu
530 535 540
Gly Lys Tyr Ala His Ile Val Ser Ser Ala Ser Arg Gly Ala Val Thr
545 550 555 560
Asp Phe Trp Lys Pro Glu Glu Thr Gly Lys Lys
565 570
Claims (32)
- 부탄올의 제조 방법으로서:
a)
i) 조작된 (engineered) 부탄올 생합성 경로
를 포함하는 재조합 숙주 세포를 제공하는 단계; 및
b) a)의 숙주 세포를:
i) 발효가능한 탄소 기질; 및
ii) 숙주 세포의 개선된 성장 또는 개선된 부탄올 생산 중 하나 이상에 대해 충분한 양의 아세테이트
를 포함하는 발효 배지와 접촉시키는 단계를 포함하고,
여기에서 아세테이트는 발효 배지에 첨가된 것이고,
상기 재조합 숙주 세포는 피루베이트 탈카르복실화효소 (PDC) 활성을 감소 또는 제거하도록 조작되었으며;
이에 의하여 부탄올은 조작된 부탄올 생합성 경로를 통하여 발효가능한 탄소 기질로부터 직접 생산되는 것인 제조 방법. - 제 1항에 있어서, 피루베이트 탈카르복실화 효소를 암호화하는 하나 이상의 내생의 유전자가 비활성화된 방법.
- 제 2항에 있어서, 상기 내생의 유전자는 PDC1, PDC5, PDC6 또는 이의 조합인 방법.
- 제 1항 내지 제 3항 중 어느 한 항에 있어서, 숙주 세포는 그의 성장을 위해, 외생의 2탄소 기질 보충물에 대해 감소 또는 제거된 필요를 포함하도록 조작되거나 또는 발달된 (evolved) 방법.
- 제 1항 내지 제 4항 중 어느 한 항에 있어서, 숙주 세포는 포스포케톨라제 활성을 갖는 폴리펩타이드를 암호화하는 이종성 폴리뉴클레오타이드 및 포스포트랜스아세틸라제 활성을 갖는 폴리펩타이드를 암호화하는 이종성 폴리뉴클레오타이드를 포함하는 방법.
- 제 1항에 있어서, 상기 재조합 숙주 세포는 알데하이드 탈수소효소 활성을 감소 또는 제거하도록 조작된 방법.
- 제 6항에 있어서, 알데하이드 탈수소효소를 암호화하는 내생의 유전자는 비활성화된 방법.
- 제 7항에 있어서, 상기 내생의 유전자는 ALD2, ALD3, ALD4, ALD5, ALD6 또는 이의 조합인 방법.
- 제 1항 내지 제 8항 중 어느 한 항에 있어서, 부탄올 생산이 개선된 방법.
- 제 9항에 있어서, 부티르산 생산이 감소된 방법.
- 제 9항에 있어서, 부탄올 수율 또는 유효 적정농도 (effective titer)가 증가된 방법.
- 제 1항 내지 제 11항 중 어느 한 항에 있어서, 부탄올은 아이소부탄올 또는 1-부탄올, 또는 이의 조합인 방법.
- 제 1항 내지 제 11항 중 어느 한 항에 있어서, 부탄올 생합성 경로는 하기 기질에서 생성물로의 전환을 포함하는 방법으로서:
a) 피루베이트에서 아세토락테이트 (경로 단계 a);
b) a)로부터의 아세토락테이트에서 2,3-다이하이드록시아이소발레레이트 (경로 단계 b);
c) b)로부터의 2,3-다이하이드록시아이소발레레이트에서 α-케토아이소발레레이트 (경로 단계 c);
d) c)로부터의 α-케토아이소발레레이트에서 아이소부티르알데하이드 (경로 단계 d); 및
e) d)로부터의 아이소부티르알데하이드에서 아이소부탄올 (경로 단계 e);
여기에서
i) 단계 a)의 기질에서 생성물로의 전환은 아세토락테이트 신타제 (synthase) 효소에 의하여 수행되고;
ii) 단계 b)의 기질에서 생성물로의 전환은 아세토하이드록시산 이성질화환원 효소 (isomeroreductase enzyme)에 의하여 수행되고;
iii) 단계 c)의 기질에서 생성물로의 전환은 다이하드록시산 탈수효소에 의하여 수행되고;
iv) 단계 d)의 기질에서 생성물로의 전환은 α-케토산 탈카르복실화효소에 의하여 수행되고;
v) 단계 e)의 기질에서 생성물로의 전환은 알코올 탈수소효소에 의하여 수행되고;
이에 의하여 아이소부탄올이 조작된 부탄올 생합성 경로를 통해 피루베이트로부터 직접 생산되는 방법. - 제 1항 내지 제 11항 중 어느 한 항에 있어서, 부탄올 생합성 경로는 하기 기질에서 생성물로의 전환을 포함하는 방법으로서:
a) 피루베이트에서 아세토락테이트 (경로 단계 a);
b) a)로부터의 아세토락테이트에서 2,3-다이하이드록시아이소발레레이트 (경로 단계 b);
c) b)로부터의 2,3-다이하이드록시아이소발레레이트에서 α-케토아이소발레레이트 (경로 단계 c);
d) c)로부터의 α-케토아이소발레레이트에서 아이소부티릴-CoA (경로 단계 f);
e) d)로부터의 아이소부티릴-CoA에서 아이소부티르알데하이드 (경로 단계 g); 및
f) e)로부터의 아이소부티르알데하이드에서 아이소부탄올 (경로 단계 e);
여기에서
i) 단계 a)의 기질에서 생성물로의 전환은 아세토락테이트 신타제 효소에 의하여 수행되고;
ii) 단계 b)의 기질에서 생성물로의 전환은 아세토하이드록시산 이성질화환원 효소에 의하여 수행되고;
iii) 단계 c)의 기질에서 생성물로의 전환은 다이하드록시산 탈수효소에 의하여 수행되고;
iv) 단계 d)의 기질에서 생성물로의 전환은 분지쇄 케토산 탈수소효소에 의하여 수행되고;
v) 단계 e)의 기질에서 생성물로의 전환은 아세틸화 알데하이드 탈수소효소에 의하여 수행되고;
vi) 단계 f)의 기질에서 생성물로의 전환은 알코올 탈수소효소에 의하여 수행되고;
이에 의하여 아이소부탄올이 조작된 생합성 경로를 통해 피루베이트로부터 직접 생산되는 방법. - 제 1항 내지 제 11항 중 어느 한 항에 있어서, 재조합 숙주 세포는 세균 또는 효모인 방법.
- 제 15항에 있어서, 재조합 숙주 세포는 효모이고, 여기에서 조작된 부탄올 생합성 경로 중 기질에서 생성물로의 전환을 수행하는 둘 이상의 효소가 미토콘드리아에 국지화되지 않은 방법.
- 제 1항 내지 제 16항 중 어느 한 항에 있어서, 발효 배지는 부탄올을 더 포함하는 방법.
- 제 1항 내지 제 17항 중 어느 한 항에 있어서, 재조합 숙주 세포와 발효 배지의 접촉의 적어도 일부는 혐기성 또는 미세호기성 조건 하에서 수행되는 것인 방법.
- 제 1항 내지 제 18항 중 어느 한 항에 있어서, 재조합 숙주 세포와 발효 배지의 접촉은 배치 (batch) 또는 연속 발효로서 수행되는 방법.
- 제 1항 내지 제 19항 중 어느 한 항에 있어서, c) 부탄올을 회수하는 단계를 더 포함하는 방법.
- 제 20항에 있어서, 회수는 증류, 액체-액체 추출, 흡착, 경사 분리, 투과증발 또는 이의 조합에 의한 것인 방법.
- 제 1항 내지 제 21항 중 어느 한 항에 따른 방법으로부터 생산된 부탄올.
- a)
i) 조작된 부탄올 생합성 경로
를 포함하는 재조합 숙주 세포; 및
b)
i) 발효가능한 탄소 기질; 및
ii) a)의 숙주 세포의 개선된 성장 또는 개선된 부탄올 생산에 대해 충분한 양의 아세테이트
를 포함하는 발효 배지를 포함하는 조성물로,
여기에서 아세테이트는 발효 배지에 첨가된 것이고,
상기 재조합 숙주 세포는 피루베이트 탈카르복실화효소 (PDC) 활성, 및 선택적으로 알데하이드 탈수소효소 활성이 감소 또는 제거되도록 조작된 조성물. - 제 23항에 있어서, 피루베이트 탈카르복실화효소를 암호화하는 하나 이상의 내생의 유전자가 비활성화된 조성물.
- 제 23항에 있어서, 알데하이드 탈수소효소를 암호화하는 내생의 유전자가 비활성화된 조성물.
- 제 25항에 있어서, 상기 내생의 유전자는 ALD2, ALD3, ALD4, ALD5, ALD6 또는 이의 조합인 조성물.
- 제 26항에 있어서, 상기 내생의 유전자는 PDC1, PDC5, PDC6 또는 이의 조합인 조성물.
- 제 23항 내지 제 27항 중 어느 한 항에 있어서, 재조합 숙주 세포는 세균 또는 효모인 조성물.
- 제 23항 내지 제 27항 중 어느 한 항에 있어서, 발효 배지는 부탄올을 더 포함하는 조성물.
- 제 29항에 있어서, 부탄올은 아이소부탄올 또는 1-부탄올, 또는 이의 조합인 조성물.
- 제 29항 또는 제 30항에 있어서, 발효 배지는 부탄올을 약 0.01mM 내지 약 500mM의 범위로 포함하는 조성물.
- 제 23항 내지 제 31항 중 어느 한 항에 있어서, 발효 배지는 아세테이트를 약 0.1mM 내지 약 50mM의 범위로 포함하는 조성물.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261615174P | 2012-03-23 | 2012-03-23 | |
US61/615,174 | 2012-03-23 | ||
PCT/US2013/032159 WO2013142338A1 (en) | 2012-03-23 | 2013-03-15 | Acetate supplemention of medium for butanologens |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20140146616A true KR20140146616A (ko) | 2014-12-26 |
Family
ID=48014374
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020147029367A KR20140146616A (ko) | 2012-03-23 | 2013-03-15 | 부타놀로겐용 배지의 아세테이트 보충물 |
Country Status (10)
Country | Link |
---|---|
US (1) | US9689004B2 (ko) |
EP (1) | EP2828391A1 (ko) |
JP (1) | JP2015510774A (ko) |
KR (1) | KR20140146616A (ko) |
CN (1) | CN104284981A (ko) |
AU (1) | AU2013235391A1 (ko) |
BR (1) | BR112014023603A8 (ko) |
CA (1) | CA2868153A1 (ko) |
MX (1) | MX2014011355A (ko) |
WO (1) | WO2013142338A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101589703B1 (ko) * | 2015-10-15 | 2016-01-28 | (주)서전기전 | 비상 발전기를 이용한 전기료 절감형 배전반 시스템 |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8945899B2 (en) | 2007-12-20 | 2015-02-03 | Butamax Advanced Biofuels Llc | Ketol-acid reductoisomerase using NADH |
US7910342B2 (en) | 2007-04-18 | 2011-03-22 | Butamax(Tm) Advanced Biofuels Llc | Fermentive production of isobutanol using highly active ketol-acid reductoisomerase enzymes |
US8188250B2 (en) | 2008-04-28 | 2012-05-29 | Butamax(Tm) Advanced Biofuels Llc | Butanol dehydrogenase enzyme from the bacterium Achromobacter xylosoxidans |
MX2011003313A (es) | 2008-09-29 | 2011-06-16 | Butamax Tm Advanced Biofuels | Actividad enzimatica de fe-s heterologa aumentada en levadura. |
BR112012016042A2 (pt) | 2009-12-29 | 2020-09-15 | Butamax Advanced Biofuels Llc | "celula hospedeira microbiana recombinante, metodo para a produção de isobutanol, método para a produção de 2-butanol e método para a produção de 14-butanol |
JP5950830B2 (ja) | 2010-02-17 | 2016-07-13 | ビュータマックス・アドバンスド・バイオフューエルズ・エルエルシー | Fe−Sクラスター要求タンパク質の活性の改善 |
US8871488B2 (en) | 2010-06-18 | 2014-10-28 | Butamax Advanced Biofuels Llc | Recombinant host cells comprising phosphoketolases |
WO2012033832A2 (en) | 2010-09-07 | 2012-03-15 | Butamax(Tm) Advanced Biofuels Llc | Integration of a polynucleotide encoding a polypeptide that catalyzes pyruvate to acetolactate conversion |
CN103827304B (zh) | 2011-03-24 | 2018-04-17 | 布特马斯先进生物燃料有限责任公司 | 用于异丁醇生产的宿主细胞和方法 |
CN105473726B (zh) | 2011-07-28 | 2021-03-12 | 布特马斯先进生物燃料有限责任公司 | 酮异戊酸脱羧酶及其使用方法 |
AU2012362274A1 (en) | 2011-12-30 | 2014-07-03 | Butamax (Tm) Advanced Biofuels Llc | Fermentative production of alcohols |
BR112014028153A2 (pt) | 2012-05-11 | 2018-05-08 | Butamax Advanced Biofuels Llc | polipeptídeo , célula hospedeira , método para a conversão de acetolactato e de produção de um produto e composição. |
EP2888350A1 (en) | 2012-08-22 | 2015-07-01 | Butamax Advanced Biofuels LLC | Production of fermentation products |
WO2014047421A1 (en) | 2012-09-21 | 2014-03-27 | Butamax(Tm) Advanced Biofuels Llc | Production of renewable hydrocarbon compositions |
JP6407869B2 (ja) | 2012-09-26 | 2018-10-17 | ビュータマックス・アドバンスド・バイオフューエルズ・エルエルシー | ケトール酸レダクトイソメラーゼ活性を有するポリペプチド |
US9273330B2 (en) | 2012-10-03 | 2016-03-01 | Butamax Advanced Biofuels Llc | Butanol tolerance in microorganisms |
US9650624B2 (en) * | 2012-12-28 | 2017-05-16 | Butamax Advanced Biofuels Llc | DHAD variants for butanol production |
EP2970863B1 (en) | 2013-03-14 | 2019-04-24 | E. I. du Pont de Nemours and Company | Glycerol 3- phosphate dehydrogenase for butanol production |
US9771602B2 (en) | 2013-03-15 | 2017-09-26 | Butamax Advanced Biofuels Llc | Competitive growth and/or production advantage for butanologen microorganism |
US9580705B2 (en) | 2013-03-15 | 2017-02-28 | Butamax Advanced Biofuels Llc | DHAD variants and methods of screening |
CA2957920A1 (en) | 2014-08-11 | 2016-02-18 | Butamax Advanced Biofuels Llc | Yeast preparations and methods of making the same |
US20210071134A1 (en) | 2018-04-23 | 2021-03-11 | Dupont Nutrition Biosciences Aps | Increasing activity of 2'fucosyllactose transporters endogenous to microbial cells |
WO2019209241A1 (en) | 2018-04-23 | 2019-10-31 | Dupont Nutrition Biosciences Aps | Increasing export of 2' fucosyllactose from microbial cells through the expression of a heterologous nucleic acid |
Family Cites Families (76)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101160405B (zh) | 2005-04-12 | 2014-01-01 | 纳幕尔杜邦公司 | 处理生物质以获得目标化学物质 |
US9297028B2 (en) | 2005-09-29 | 2016-03-29 | Butamax Advanced Biofuels Llc | Fermentive production of four carbon alcohols |
US20080274526A1 (en) | 2007-05-02 | 2008-11-06 | Bramucci Michael G | Method for the production of isobutanol |
US8273558B2 (en) | 2005-10-26 | 2012-09-25 | Butamax(Tm) Advanced Biofuels Llc | Fermentive production of four carbon alcohols |
US8945899B2 (en) | 2007-12-20 | 2015-02-03 | Butamax Advanced Biofuels Llc | Ketol-acid reductoisomerase using NADH |
US9303225B2 (en) | 2005-10-26 | 2016-04-05 | Butamax Advanced Biofuels Llc | Method for the production of isobutanol by recombinant yeast |
NZ593809A (en) * | 2005-10-26 | 2013-01-25 | Butamax Tm Advanced Biofuels | Fermentive production of four carbon alcohols |
US8206970B2 (en) | 2006-05-02 | 2012-06-26 | Butamax(Tm) Advanced Biofuels Llc | Production of 2-butanol and 2-butanone employing aminobutanol phosphate phospholyase |
US8828704B2 (en) | 2006-05-02 | 2014-09-09 | Butamax Advanced Biofuels Llc | Fermentive production of four carbon alcohols |
US7659104B2 (en) | 2006-05-05 | 2010-02-09 | E.I. Du Pont De Nemours And Company | Solvent tolerant microorganisms and methods of isolation |
US7541173B2 (en) | 2006-06-15 | 2009-06-02 | E.I. Du Pont De Nemours And Company | Solvent tolerant microorganisms and methods of isolation |
US20080293086A1 (en) * | 2006-09-18 | 2008-11-27 | Cobalt Technologies, Inc. A Delaware Corporation | Real time monitoring of microbial enzymatic pathways |
US20100036174A1 (en) | 2006-10-31 | 2010-02-11 | Lourina Madeleine Raamsdonk | Butanol production in a eukaryotic cell |
US8017364B2 (en) | 2006-12-12 | 2011-09-13 | Butamax(Tm) Advanced Biofuels Llc | Solvent tolerant microorganisms |
US7910342B2 (en) | 2007-04-18 | 2011-03-22 | Butamax(Tm) Advanced Biofuels Llc | Fermentive production of isobutanol using highly active ketol-acid reductoisomerase enzymes |
US8426174B2 (en) | 2007-05-02 | 2013-04-23 | Butamax(Tm) Advanced Biofuels Llc | Method for the production of 2-butanol |
US8426173B2 (en) | 2007-05-02 | 2013-04-23 | Butamax (Tm) Advanced Biofuels Llc | Method for the production of 1-butanol |
ES2575413T3 (es) | 2007-12-20 | 2016-06-28 | Butamax (Tm) Advanced Biofuels Llc | Cetol-ácido reductoisomerasa que utiliza NADH |
US8372612B2 (en) | 2007-12-21 | 2013-02-12 | Butamax(Tm) Advanced Biofuels Llc | Production of four carbon alcohols using improved strain |
US8518678B2 (en) | 2007-12-21 | 2013-08-27 | Butamax(Tm) Advanced Biofuels Llc | Strain comprising increased expression of a CFA coding region for butanol production |
US8188250B2 (en) | 2008-04-28 | 2012-05-29 | Butamax(Tm) Advanced Biofuels Llc | Butanol dehydrogenase enzyme from the bacterium Achromobacter xylosoxidans |
US8389252B2 (en) | 2008-05-12 | 2013-03-05 | Butamax(Tm) Advanced Biofuels Llc | Yeast strain for production of four carbon alcohols |
US8906666B2 (en) | 2008-05-22 | 2014-12-09 | Butamax Advanced Biofuels Llc | Engineering resistance to aliphatic alcohols |
JP2011522543A (ja) | 2008-06-04 | 2011-08-04 | ビュータマックス・アドバンスド・バイオフューエルズ・エルエルシー | 二相抽出発酵を用いてブタノールを生産するための方法 |
US8828695B2 (en) | 2008-06-04 | 2014-09-09 | Butamax Advanced Biofuels Llc | Method for producing butanol using two-phase extractive fermentation |
BRPI0909989A2 (pt) | 2008-06-05 | 2021-06-22 | Butamax Advanced Biofuels Llc | célula de levedura recombinante e método para a produção de um produto |
AU2009296218A1 (en) | 2008-09-29 | 2010-04-01 | Butamax(Tm) Advanced Biofuels Llc | Enhanced dihydroxy-acid dehydratase activity in lactic acid bacteria |
EP2337869B1 (en) | 2008-09-29 | 2015-08-19 | Butamax Advanced Biofuels Llc | Enhanced pyruvate to 2,3-butanediol conversion in lactic acid bacteria |
MX2011003313A (es) | 2008-09-29 | 2011-06-16 | Butamax Tm Advanced Biofuels | Actividad enzimatica de fe-s heterologa aumentada en levadura. |
NZ591244A (en) | 2008-09-29 | 2013-03-28 | Butamax Tm Advanced Biofuels | IDENTIFICATION AND USE OF BACTERIAL [2Fe-2S] DIHYDROXY-ACID DEHYDRATASES |
US20100081182A1 (en) | 2008-09-29 | 2010-04-01 | Butamax(Tm) Advanced Biofuels Llc | Enhanced iron-sulfur cluster formation for increased dihydroxy-acid dehydratase activity in lactic acid bacteria |
WO2010062597A1 (en) | 2008-10-27 | 2010-06-03 | Butamax™ Advanced Biofuels LLC | Carbon pathway optimized production hosts for the production of isobutanol |
US8828694B2 (en) | 2008-11-13 | 2014-09-09 | Butamax Advanced Biofuels Llc | Production of isobutanol in yeast mitochondria |
US8465964B2 (en) | 2008-11-13 | 2013-06-18 | Butamax (TM) Advanced Biofules LLC | Increased production of isobutanol in yeast with reduced mitochondrial amino acid biosynthesis |
US8652823B2 (en) | 2008-12-03 | 2014-02-18 | Butamax(Tm) Advanced Biofuels Llc | Strain for butanol production with increased membrane unsaturated trans fatty acids |
US8557562B2 (en) | 2008-12-29 | 2013-10-15 | Butamax(Tm) Advanced Biofuels Llc | Yeast with increased butanol tolerance involving filamentous growth response |
US8795992B2 (en) | 2008-12-29 | 2014-08-05 | Butamax Advanced Biofuels Llc | Yeast with increased butanol tolerance involving cell wall integrity pathway |
US8455225B2 (en) | 2008-12-29 | 2013-06-04 | Butamax Advanced Biofuels Llc | Yeast with increased butanol tolerance involving high osmolarity/glycerol response pathway |
US8614085B2 (en) | 2009-02-27 | 2013-12-24 | Butamax(Tm) Advanced Biofuels Llc | Yeast with increased butanol tolerance involving a multidrug efflux pump gene |
US20120058541A1 (en) | 2009-05-22 | 2012-03-08 | Butamax(Tm) Advanced Biofuels Llc | Engineering resistance to aliphatic alcohols |
EP2446043A4 (en) | 2009-06-22 | 2013-02-13 | Gevo Inc | YEAST ORGANISMS FOR THE MANUFACTURE OF ISOBUTANOL |
IN2012DN02227A (ko) | 2009-09-29 | 2015-08-21 | Butamax Tm Advanced Biofuels | |
WO2011041402A1 (en) | 2009-09-29 | 2011-04-07 | Butamax(Tm) Advanced Biofuels Llc | Improved flux to acetolactate-derived products in lactic acid bacteria |
CA2775893A1 (en) | 2009-09-29 | 2011-04-07 | Butamax(Tm) Advanced Biofuels Llc | Improved yeast production host cells |
US20110195505A1 (en) | 2009-10-08 | 2011-08-11 | Butamax(Tm) Advanced Biofuels Llc | Bacterial strains for butanol production |
WO2011063402A2 (en) | 2009-11-23 | 2011-05-26 | Butamax(Tm) Advanced Biofuels Llc | Method for producing butanol using extractive fermentation with osmolyte addition |
AU2010321564A1 (en) | 2009-11-23 | 2012-05-10 | Butamax(Tm) Advanced Biofuels Llc | Method for producing butanol using extractive fermentation with electrolyte addition |
BR112012012492A2 (pt) * | 2009-11-24 | 2019-09-24 | Gevo Inc | métodos para aumentar atividade de diidróxi ácido desidratase para aperfeiçoar produção de combustíveis, produtos químicos e aminoácidos |
CA2785660A1 (en) | 2009-12-29 | 2011-07-07 | Butamax(Tm) Advanced Biofuels Llc | Expression of hexose kinase in recombinant host cells |
BR112012016042A2 (pt) | 2009-12-29 | 2020-09-15 | Butamax Advanced Biofuels Llc | "celula hospedeira microbiana recombinante, metodo para a produção de isobutanol, método para a produção de 2-butanol e método para a produção de 14-butanol |
GB2501143B (en) | 2010-02-12 | 2014-03-26 | Gevo Inc | Yeast microorganisms genetically engineered to improve isobutanol biosynthesis |
JP5950830B2 (ja) | 2010-02-17 | 2016-07-13 | ビュータマックス・アドバンスド・バイオフューエルズ・エルエルシー | Fe−Sクラスター要求タンパク質の活性の改善 |
US20120149080A1 (en) | 2010-06-17 | 2012-06-14 | Butamax(Tm) Advanced Biofuels Llc | Yeast production culture for the production of butanol |
US9012190B2 (en) | 2011-06-15 | 2015-04-21 | Butamax Advanced Biofuels Llc | Use of thiamine and nicotine adenine dinucleotide for butanol production |
US8697404B2 (en) | 2010-06-18 | 2014-04-15 | Butamax Advanced Biofuels Llc | Enzymatic production of alcohol esters for recovery of diols produced by fermentation |
US8871488B2 (en) | 2010-06-18 | 2014-10-28 | Butamax Advanced Biofuels Llc | Recombinant host cells comprising phosphoketolases |
US9040263B2 (en) | 2010-07-28 | 2015-05-26 | Butamax Advanced Biofuels Llc | Production of alcohol esters and in situ product removal during alcohol fermentation |
US9175315B2 (en) | 2010-06-18 | 2015-11-03 | Butamax Advanced Biofuels Llc | Production of alcohol esters and in situ product removal during alcohol fermentation |
WO2012033832A2 (en) | 2010-09-07 | 2012-03-15 | Butamax(Tm) Advanced Biofuels Llc | Integration of a polynucleotide encoding a polypeptide that catalyzes pyruvate to acetolactate conversion |
US8759044B2 (en) | 2011-03-23 | 2014-06-24 | Butamax Advanced Biofuels Llc | In situ expression of lipase for enzymatic production of alcohol esters during fermentation |
US8765425B2 (en) | 2011-03-23 | 2014-07-01 | Butamax Advanced Biofuels Llc | In situ expression of lipase for enzymatic production of alcohol esters during fermentation |
CN103827304B (zh) | 2011-03-24 | 2018-04-17 | 布特马斯先进生物燃料有限责任公司 | 用于异丁醇生产的宿主细胞和方法 |
US20120258873A1 (en) | 2011-04-06 | 2012-10-11 | Butamax(Tm) Advanced Biofuels Llc | Reduction of 2,3-dihydroxy-2-methyl butyrate (dhmb) in butanol production |
CA2838519A1 (en) | 2011-06-17 | 2012-12-20 | Butamax Advanced Biofuels Llc | Lignocellulosic hydrolysates as feedstocks for isobutanol fermentation |
CN105473726B (zh) | 2011-07-28 | 2021-03-12 | 布特马斯先进生物燃料有限责任公司 | 酮异戊酸脱羧酶及其使用方法 |
AU2012362274A1 (en) | 2011-12-30 | 2014-07-03 | Butamax (Tm) Advanced Biofuels Llc | Fermentative production of alcohols |
BR112014016005A8 (pt) | 2011-12-30 | 2017-07-04 | Butamax Advanced Biofuels Llc | alterações genéticas para produção de butanol |
BR112014028153A2 (pt) | 2012-05-11 | 2018-05-08 | Butamax Advanced Biofuels Llc | polipeptídeo , célula hospedeira , método para a conversão de acetolactato e de produção de um produto e composição. |
US9109196B2 (en) | 2012-09-12 | 2015-08-18 | Butamax Advanced Biofuels Llc | Processes and systems for the production of fermentation products |
JP6407869B2 (ja) | 2012-09-26 | 2018-10-17 | ビュータマックス・アドバンスド・バイオフューエルズ・エルエルシー | ケトール酸レダクトイソメラーゼ活性を有するポリペプチド |
CA2884876A1 (en) | 2012-09-28 | 2014-04-03 | Butamax Advanced Biofuels Llc | Production of fermentation products |
US9273330B2 (en) | 2012-10-03 | 2016-03-01 | Butamax Advanced Biofuels Llc | Butanol tolerance in microorganisms |
US20140186911A1 (en) | 2012-12-28 | 2014-07-03 | Butamax Advanced Biofuels Llc | Recombinant host cells and methods for producing butanol |
US9650624B2 (en) | 2012-12-28 | 2017-05-16 | Butamax Advanced Biofuels Llc | DHAD variants for butanol production |
EP2970863B1 (en) | 2013-03-14 | 2019-04-24 | E. I. du Pont de Nemours and Company | Glycerol 3- phosphate dehydrogenase for butanol production |
US9580705B2 (en) | 2013-03-15 | 2017-02-28 | Butamax Advanced Biofuels Llc | DHAD variants and methods of screening |
-
2013
- 2013-03-15 BR BR112014023603A patent/BR112014023603A8/pt not_active IP Right Cessation
- 2013-03-15 KR KR1020147029367A patent/KR20140146616A/ko not_active Application Discontinuation
- 2013-03-15 JP JP2015501810A patent/JP2015510774A/ja active Pending
- 2013-03-15 MX MX2014011355A patent/MX2014011355A/es unknown
- 2013-03-15 EP EP13713046.4A patent/EP2828391A1/en not_active Withdrawn
- 2013-03-15 CA CA2868153A patent/CA2868153A1/en not_active Abandoned
- 2013-03-15 CN CN201380015950.5A patent/CN104284981A/zh active Pending
- 2013-03-15 US US13/833,369 patent/US9689004B2/en active Active
- 2013-03-15 AU AU2013235391A patent/AU2013235391A1/en not_active Abandoned
- 2013-03-15 WO PCT/US2013/032159 patent/WO2013142338A1/en active Application Filing
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101589703B1 (ko) * | 2015-10-15 | 2016-01-28 | (주)서전기전 | 비상 발전기를 이용한 전기료 절감형 배전반 시스템 |
Also Published As
Publication number | Publication date |
---|---|
US20130252296A1 (en) | 2013-09-26 |
BR112014023603A8 (pt) | 2017-07-25 |
EP2828391A1 (en) | 2015-01-28 |
US9689004B2 (en) | 2017-06-27 |
WO2013142338A1 (en) | 2013-09-26 |
MX2014011355A (es) | 2014-12-05 |
CN104284981A (zh) | 2015-01-14 |
CA2868153A1 (en) | 2013-09-26 |
BR112014023603A2 (ko) | 2017-06-20 |
JP2015510774A (ja) | 2015-04-13 |
AU2013235391A1 (en) | 2014-09-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20140146616A (ko) | 부타놀로겐용 배지의 아세테이트 보충물 | |
AU2016203445B2 (en) | Integration of a polynucleotide encoding a polypeptide that catalyzes pyruvate to acetolactate conversion | |
KR20140113997A (ko) | 부탄올 생성을 위한 유전자 스위치 | |
DK2663645T3 (da) | Gærstammer, der er modificeret til produktion af ethanol fra glycerol | |
RU2763170C2 (ru) | Производство олигосахаридов человеческого молока в микроорганизмах-хозяевах с модифицированным импортом/экспортом | |
KR20140092759A (ko) | 숙주 세포 및 아이소부탄올의 제조 방법 | |
US6156567A (en) | Truncated transcriptionally active cytomegalovirus promoters | |
US6090393A (en) | Recombinant canine adenoviruses, method for making and uses thereof | |
CN101365788B (zh) | Δ-9延伸酶及其在制备多不饱和脂肪酸中的用途 | |
KR101982360B1 (ko) | 콤팩트 tale-뉴클레아제의 발생 방법 및 이의 용도 | |
CN101939434B (zh) | 用于在大豆中提高种子贮藏油脂的生成和改变脂肪酸谱的来自解脂耶氏酵母的dgat基因 | |
KR20210149060A (ko) | Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합 | |
KR20140099224A (ko) | 케토-아이소발레레이트 데카르복실라제 효소 및 이의 이용 방법 | |
IL236992A (en) | Genetically modified cyanobacteria that produce ethanol | |
DK2718440T3 (en) | NUCLEASE ACTIVITY PROTEIN, FUSION PROTEINS AND APPLICATIONS THEREOF | |
KR20130027063A (ko) | Fe-s 클러스터 요구성 단백질의 활성 향상 | |
KR20130032897A (ko) | 알코올 발효 시의 알코올 에스테르의 생성 및 원위치에서의 생성물 제거 | |
BRPI0806354A2 (pt) | plantas oleaginosas transgências, sementes, óleos, produtos alimentìcios ou análogos a alimento, produtos alimentìcios medicinais ou análogos alimentìcios medicinais, produtos farmacêuticos, bebidas fórmulas para bebês, suplementos nutricionais, rações para animais domésticos, alimentos para aquacultura, rações animais, produtos de sementes inteiras, produtos de óleos misturados, produtos, subprodutos e subprodutos parcialmente processados | |
KR20150014953A (ko) | 케톨-산 리덕토아이소머라아제 효소 및 사용 방법 | |
CN110551713A (zh) | 用于修饰梭状芽孢杆菌属细菌的优化的遗传工具 | |
US20040003420A1 (en) | Modified recombinase | |
KR20120115349A (ko) | 저급 알킬 알코올의 발효 생성에 유용한 알코올 탈수소효소(adh) | |
KR20120136349A (ko) | 고가의 화학적 생성물의 미생물 생산, 및 관련 조성물, 방법 및 시스템 | |
KR20140015136A (ko) | 3-히드록시프로피온산 및 다른 생성물의 제조 방법 | |
KR20120099509A (ko) | 재조합 숙주 세포에서 육탄당 키나아제의 발현 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITN | Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid |