KR20150113170A

KR20150113170A - 탄수화물 분해 폴리펩티드 및 이의 용도

Info

Publication number: KR20150113170A
Application number: KR1020157023753A
Authority: KR
Inventors: 알릭 피테르 로스; 드 르네 마르셀 용; 마이케 아펠두른
Original assignee: 디에스엠 아이피 어셋츠 비.브이.
Priority date: 2013-02-04
Filing date: 2014-02-03
Publication date: 2015-10-07
Also published as: US20190136213A1; EP3686280B1; ES2923460T3; DK3686280T3; US10655115B2; PL3447136T3; MY176331A; EP3202900B1; WO2014118360A3; EP3447136A1; HRP20200976T1; DK3202900T3; EP3202900A1; EP3686280A1; US10316305B2; PL3686280T3; KR102134498B1; DK3447136T3; WO2014118360A2; HRP20220917T1

Abstract

본 발명은 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72에 기재된 아미노산 서열; 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 또는 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74의 뉴클레오티드 서열에 의해 코딩된 아미노산 서열; 또는 이의 변이체 폴리펩티드 또는 변이체 폴리뉴클레오티드를 포함하는, 헤미셀룰라제(hemicellulase) 활성을 갖는 폴리펩티드에 관한 것으로서, 이때 상기 변이체 폴리펩티드는 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72에 기재된 서열과 75% 이상의 서열 동일성을 갖거나, 상기 변이체 폴리뉴클레오티드는 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72에 기재된 서열과 75% 이상의 서열 동일성을 갖는 폴리펩티드를 코딩한다. 본 발명은 신규 유전자의 전체 길이 코딩 서열뿐만 아니라 유전자 또는 아미노산 서열의 전체 길이 기능성 단백질 및 기능성 균등물의 아미노산 서열도 특징으로 한다. 또한, 본 발명은 산업 공정에서 상기 폴리펩티드를 사용하는 방법에 관한 것이다. 이들 단백질들을 제조하는 데에 적합한, 본 발명에 따른 폴리뉴클레오티드로 형질전환된 세포도 본 발명에 포함된다.

Description

탄수화물 분해 폴리펩티드 및 이의 용도{CARBOHYDRATE DEGRADING POLYPEPTIDE AND USES THEREOF}

본 발명은 리그노셀룰로스성(lignocellulosic) 물질 분해 활성을 갖는 폴리펩티드를 코딩하는 유전자를 포함하는 서열에 관한 것이다. 본 발명은 신규 유전자의 전체 길이 코딩 서열뿐만 아니라 전체 길이 기능성 단백질의 아미노산 서열, 및 상기 유전자 또는 아미노산 서열의 변이체 및 단편을 특징으로 한다. 또한, 본 발명은 산업 공정에서 이들 단백질들을 사용하는 방법에 관한 것이다. 이들 단백질들을 제조하는 데에 적합한, 본 발명에 따른 폴리뉴클레오티드로 형질전환된 세포도 본 발명에 포함된다. 또한, 본 발명은 숙주 유기체, 예컨대, 아스퍼길러스 니게르(Aspergillus niger) 및/또는 라삼소니아 에머소니이(Rasamsonia emersonii)에서 리그노셀룰로스성 물질 분해 활성을 갖는 폴리펩티드를 코딩하는 유전자의 성공적인 발현에 관한 것이다.

탄수화물은 지구상에서 가장 풍부한 유기 화합물을 구성한다. 그러나, 이 탄수화물의 대다수가 전분(종자 및 곡물에서 주요 저장 탄수화물)을 비롯한 복합 중합체, 및 리그노셀룰로스로서 공지되어 있는 탄수화물과 리그닌의 집합체에 격리되어 있다. 리그노셀룰로스의 주요 탄수화물 성분은 셀룰로스, 헤미셀룰로스 및 펙틴이다. 이들 복합 중합체들은 종종 리그노셀룰로스로서 총칭된다.

재생가능한 리그노셀룰로스성 바이오매스(biomass)를 발효가능한 당으로 생물전환시킨 후, 상기 발효가능한 당을 발효시켜 액체 연료에 대한 대체물로서 알코올(예를 들면, 에탄올)을 생성하는 것은 OPEC에 의한 석유 생산량의 감소 때문에 오일 위기가 발생한 때인 1970년대 이후 연구자들의 집중적인 관심을 끌고 있다. 에탄올은 지난 이십년 동안 미국에서 가솔린에 대한 10% 블렌드로서 광범위하게 사용되고 있고 브라질에서 차량용 순수 연료로서 사용되고 있다. 보다 최근에는, 85% 에탄올 블렌드인 E85의 사용이 특히 청정 도시 적용분야를 위해 시행되고 있다. 연료 바이오에탄올의 중요성은 오일 가격의 증가 및 그의 공급원의 점진적인 고갈과 동시에 증가할 것이다. 추가로, 발효가능한 당은 플라스틱, 중합체 및 다른 바이오-기제 생성물을 생성하는 데에 사용되고 있고, 이 산업은 실질적으로 성장하여 석유-기제 공급원료 대신에 공급원료로서 사용될 수 있는 풍부한 저렴한 발효가능한 당에 대한 수요를 증가시킬 것으로 예상된다.

식물 바이오매스에서 이러한 많은 양의 탄수화물의 격리는 당(다수의 산업 공정 및 농업 공정에 사용될 수 있는 오탄당 및 육탄당 둘다)의 형태로 잠재적인 에너지의 풍부한 공급원을 제공한다. 그러나, 당이 복합 중합체에 갇혀 있어 발효를 위해 용이하게 접근될 수 없기 때문에 이들 탄수화물들의 막대한 에너지 잠재력은 현재 충분히 이용되지 않고 있다. 식물 바이오매스로부터 당을 생성하는 방법은 화학물질, 플라스틱, 예를 들면, 석신산 및 (바이오)연료(에탄올, 메탄올, 부탄올, 합성 액체 연료 및 바이오가스를 포함함)로의 발효를 위한 풍부한 경제적 경쟁력이 있는 공급원료를 제공할 것이다.

셀룰로스성 공급원료의 종류와 관계없이 효소의 비용 및 가수분해 효율은 바이오매스 생물전환 공정의 상업화를 제한하는 주요 요인이다. 미생물에 의해 생성된 효소의 생산 비용은 효소 생성 균주의 생산성 및 발효 브로쓰에서의 최종 활성 수율과 밀접하게 관련되어 있다.

효소에 의한 리그노셀룰로스성 바이오매스 분해 및 셀룰라제(cellulase) 생성을 이해하기 위한 지난 수십년의 계속된 연구에도 불구하고, 신규 고도 활성 셀룰라제 및 헤미셀룰라제(hemicellulase)를 발견하거나 조작하는 것은 여전히 요구된다. 리그노셀룰로스성 물질의 신속하고 효율적인 생물분해를 수행할 수 있는 고효율적인 효소 조성물, 특히 증가된 열안정성을 갖는 이러한 셀룰라제 및 헤미셀룰라제를 구축하는 것도 매우 요구될 것이다.

이러한 효소는 화학물질, 플라스틱, 예를 들면, 석신산 및 (바이오)연료(에탄올, 메탄올, 부탄올, 합성 액체 연료 및 바이오가스를 포함함)로의 발효용 및 엔사일링(ensiling)용 당을 생성하는 데에 사용될 수 있고, 다른 산업 공정, 예를 들면, 식품 또는 사료, 직물, 펄프 또는 종이, 또는 세제 산업 및 다른 산업에서 효소로서도 사용될 수 있다.

본 발명은 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72에 기재된 아미노산 서열; 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 또는 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74의 뉴클레오티드 서열에 의해 코딩된 아미노산 서열; , 또는 이의 변이체 폴리펩티드 또는 변이체 폴리뉴클레오티드를 포함하는, 헤미셀룰라제 활성 또는 표 1에 따른 활성을 갖는 폴리펩티드를 제공하는데, 이때 상기 변이체 폴리펩티드는 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72에 기재된 서열과 75% 이상의 서열 동일성을 갖거나, 상기 변이체 폴리뉴클레오티드는 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72에 기재된 서열과 75% 이상의 서열 동일성을 갖는 폴리펩티드를 코딩한다.

[표 1]

본 발명의 폴리펩티드는 바람직하게는 β-자일로시다제, α-갈락토시다제, 자일로글루카나제, α-아라비노푸라노시다제, 엔도-자일라나제, 만노시다제/자일로시다제, 페룰로일 에스터라제, 자일로시다제, 엔도-엑소-자일라나제 또는 α-글루쿠로니다제 활성을 갖는다.

나아가, 본 발명은 헤미셀룰라제를 코딩하는 핵산 서열을 제공하는데, 이때 상기 핵산 서열은

(a) 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74, 또는 서열번호 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70 또는 75의 핵산 서열과 70% 이상의 동일성을 갖는 핵산 서열;

(b) 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74, 또는 서열번호 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70 또는 75의 핵산 서열의 상보체와 혼성화하는 핵산 서열;

(c) (i) 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72의 아미노산 서열, (ii) 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72의 아미노산 서열과 70% 이상의 동일성을 갖는 아미노산 서열, 또는 (iii) 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개 또는 12개의 아미노산이 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72의 아미노산 서열과 상이한 아미노산 서열을 코딩하는 핵산 서열; 및

(d) (a), (b) 또는 (c)에 정의된 뉴클레오티드 서열의 역 상보체인 뉴클레오티드 서열

로 구성된 군으로부터 선택된다.

본 발명은 본 발명의 폴리뉴클레오티드를 포함하는 핵산 구축물 또는 벡터, 및 본 발명의 폴리펩티드, 또는 본 발명의 핵산 구축물 또는 벡터를 포함하는 세포도 제공한다.

본 발명의 한 양태에 따르면, 세포는 진균 세포, 바람직하게는 아크레모늄(Acremonium), 아가리커스(Agaricus), 아스퍼길러스(Aspergillus), 아우레오바시듐(Aureobasidium), 크리소스포리움(Chrysosporium), 코프리너스(Coprinus), 크립토코커스(Cryptococcus), 필리바시듐(Filibasidium), 푸사리움(Fusarium), 후미콜라(Humicola), 마그나포르테(Magnaporthe), 뮤코르(Mucor), 마이셀리오프쏘라(Myceliophthora), 네오칼리마스틱스(Neocallimastix), 뉴로스포라(Neurospora), 패실로마이세스(Paecilomyces), 페니실리움(Penicillium), 피로마이세스(Piromyces), 파네로캐테(Panerochaete), 플레우로터스(Pleurotus), 쉬조필룸(Schizophyllum), 탈라로마이세스(Talaromyces), 라삼소니아(Rasamsonia), 써모아스커스(Thermoascus), 티엘라비아(Thielavia), 톨리포클라듐(Tolypocladium) 및 트라이코데르마(Trichoderma) 속으로 구성된 군으로부터 선택된 진균 세포이다. 본 발명의 또 다른 양태에 따르면, 본 발명의 세포의 하나 이상의 유전자가 전체적으로 또는 부분적으로 결실되어 있거나, 넉아웃되어 있거나 파괴되어 있고, 이때 임의적으로 상기 유전자는 프로테아제(protease)를 코딩한다.

본 발명은 헤미셀룰라제 또는 표 1에 따른 활성을 갖는 본 발명에 따른 폴리펩티드를 제조하는 방법으로서, 상기 폴리펩티드의 발현을 허용하는 조건 하에서 본 발명의 세포를 배양하는 단계 및 임의적으로 발현된 폴리펩티드를 회수하는 단계를 포함하는 방법도 제공한다. 나아가, 본 발명은 (i) 본 발명의 폴리펩티드; 및 (ii) 셀룰라제, 추가 헤미셀룰라제 및/또는 펙티나제(pectinase)를 포함하는 조성물을 제공하고, 바람직하게는 상기 셀룰라제는 GH61, 셀로바이오하이드롤라제(cellobiohydrolase), 셀로바이오하이드롤라제 I, 셀로바이오하이드롤라제 II, 엔도-β-1,4-글루카나제(glucanase), β-글루코시다제(glucosidase) 또는 β-(1,3)(1,4)-글루카나제이고/이거나, 상기 헤미셀룰라제는 엔도-자일라나제, β-자일로시다제, α-L-아라비노푸라노시다제, α-D-글루쿠로니다제. 페룰로일 에스터라제, 쿠마로일 에스터라제(coumaroyl esterase), α-갈락토시다제, β-갈락토시다제, β-만나나제(mannanase) 또는 β-만노시다제이다.

추가로, 본 발명은 헤미셀룰로스를 포함하는 기질, 임의적으로 식물 물질을 처리하는 방법으로서, 상기 기질을 본 발명의 폴리펩티드 및/또는 본 발명의 조성물과 접촉시키는 단계를 포함하는 방법을 제공한다.

본 발명의 또 다른 양태는 리그노셀룰로스성 물질로부터 당을 제조하기 위한 본 발명의 폴리펩티드 및/또는 본 발명의 조성물의 용도에 관한 것이다.

본 발명은 탄수화물 물질 분해 또는 탄수화물 가수분해 활성을 갖는 폴리펩티드를 제조하는 방법으로서, 상기 폴리펩티드의 발현을 허용하는 조건 하에서 본 발명의 세포를 배양하는 단계 및 임의적으로 발현된 폴리펩티드를 회수하는 단계를 포함하는 방법; 이러한 방법에 의해 수득될 수 있는 폴리펩티드; 및 (i) 본 발명의 폴리펩티드 및 (ii) 셀룰라제, 헤미셀룰라제 및/또는 펙티나제를 포함하는 조성물도 제공한다.

탄수화물 물질 분해 또는 탄수화물 가수분해 활성을 갖는 본 발명의 폴리펩티드는 산업 공정에서 사용될 수 있다. 따라서, 본 발명은 탄수화물 물질을 포함하는 기질을 처리하는 방법으로서, 상기 기질을 본 발명의 폴리펩티드 또는 조성물과 접촉시키는 단계를 포함하는 방법을 제공한다.

구체적으로, 본 발명은 리그노셀룰로스성 물질로부터 당 또는 당들을 제조하는 방법으로서, 리그노셀룰로스성 물질을 본 발명의 폴리펩티드 또는 조성물과 접촉시키는 단계를 포함하는 방법을 제공한다.

이 방식으로 제조된 당은 발효 공정에서 사용될 수 있다. 따라서, 본 발명은 발효 생성물을 제조하는 방법으로서, 전술된 방법을 이용하여 발효가능한 당을 제조하는 단계; 및 생성된 발효가능한 당을 발효시켜 발효 생성물을 제조하는 단계를 포함하는 방법을 제공한다.

본 발명의 폴리펩티드 또는 조성물은 예를 들면, 식품의 제조, 세제의 제조, 동물 사료의 제조, 펄프의 처리, 종이의 제조, 옷감 또는 직물의 제조 또는 이들의 세정에 사용될 수도 있다.

본 발명은 식물 물질 또는 리그노셀룰로스성 물질을 본 발명의 폴리펩티드 또는 조성물과 접촉시킴으로써 수득될 수 있는 가공된 물질; 본 발명의 폴리펩티드 또는 조성물을 포함하는 식품 또는 사료; 및 본 발명에 따른 폴리뉴클레오티드, 폴리펩티드, 벡터 또는 세포를 포함하는 식물 또는 이의 일부도 제공한다.

도 1은 아스퍼길러스 니게르에서의 유전자의 발현을 위한 pGBTOP의 맵을 보여준다. 글루코아밀라제(glucoamylase) 프로모터(PglaA)로부터 발현된 관심있는 유전자(GOI)가 도시되어 있다. 추가로, 발현 카세트의 글루코아밀라제 플랭크(3' glaA)가 도시되어 있다. 본원에서 관심있는 유전자는 이하에 정의된 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305의 코딩 서열이다.
도 2는 RePepA 좌위로 표적화되는, 라삼소니아 에머소니이 내의 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 과다발현 구축물에 대한 기초인 플라스미드 Te pep.bbn의 도시적 도표를 보여준다. 벡터는 RePepA 좌위에서의 표적화를 위해 RePepA ORF의 업스트림에 있는 1500 bp 5' 플랭킹 영역 1.5 kb를 포함하고, lox66 부위, 아스퍼길러스 니둘란스(A. nidulans) gpdA 프로모터에 의해 유도되는 ble 코딩 영역의 비-기능성 5' 부분(5' ble) 및 ccdB 유전자도 포함한다.
도 3은 라삼소니아 에머소니이에서 RePepA ORF, 및 시작 ATG 코돈의 업스트림에 있는 약 1500개 뉴클레오티드를 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305의 발현 카세트로 교체할 목적으로 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305를 함유하는 pEBA 발현 벡터와 함께 이분(bipartite) 유전자 표적화 방법에서 사용된 플라스미드 pEBA1006의 도시적 도표를 보여준다. 벡터는 ble 코딩 영역의 3' 부분, 아스퍼길러스 니둘란스 trpC 종결요소(terminator), lox71 부위, RePepA ORF의 2500 bp 3' 플랭킹 영역 및 pUC19의 골격(인비트로겐(Invitrogen), 네덜란드 브레다 소재)을 포함한다. 라삼소니아 에머소니이 균주의 형질전환 전, 에스케리키아 콜라이(E. coli) DNA를 제한효소 NotI로 분해하여 제거하였다.
도 4는 라삼소니아 에머소니이에서 RePepA ORF, 및 시작 ATG 코돈의 업스트림에 있는 약 1500개 뉴클레오티드를 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305의 발현 카세트로 교체할 목적으로 pEBA1006 벡터와 함께 이분 유전자 표적화 방법에서 사용된 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305를 함유하는 pEBA 발현 플라스미드의 도시적 도표를 보여준다. 벡터는 RePepA 좌위에서의 표적화를 위해 RePepA ORF의 업스트림에 있는 1500 bp 5' 플랭킹 영역 1.5 kb를 포함하고, 라삼소니아 에머소니이 프로모터 2, Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 코딩 영역 및 아스퍼길러스 니둘란스 amdS 종결요소(TamdS)로 구성된 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 발현 카세트, lox66 부위, 및 아스퍼길러스 니둘란스 gpdA 프로모터에 의해 유도되는 ble 코딩 영역의 비-기능성 5' 부분(5' ble)도 포함한다. 라삼소니아 에머소니이 균주의 형질전환 전, 에스케리키아 콜라이 DNA를 제한효소 NotI로 분해하여 제거하였다.
도 5는 pH 4.5 및 60℃에서 24시간 동안 자일로글루칸 상에서 항온처리한 후 라삼소니아 에머소니이 Temer04790에 의한 올리고머 형성을 시판되는 셀룰라제와 비교하여 보여주는 고성능 음이온 교환 크로마토그래피에 의해 수득된 크로마토그램을 보여준다.
서열목록의 간단한 설명
표 2는 본 발명의 코돈-쌍 최적화된 코딩 서열 서열번호, 아미노산 서열 서열번호, 신호 서열 서열번호, 게놈 DNA 서열 서열번호 및 야생형 코딩 서열 서열번호를 보여준다.
[표 2]

서열번호 76: 라삼소니아 에머소니이 RePepA(플랭크를 포함하는 게놈 서열)
서열번호 77: 라삼소니아 에머소니이 RePepA(cDNA)
서열번호 78: 라삼소니아 에머소니이 RePepA(단백질)
서열번호 79: 아스퍼길러스 니둘란스 gpdA 프로모터 및 ble 코딩 서열의 5' 부분
서열번호 80: ble 코딩 서열의 3' 부분 및 아스퍼길러스 니둘란스 TrpC 종결요소
서열번호 81: 라삼소니아 에머소니이 프로모터 2
서열번호 82: 아스퍼길러스 니둘란스 AmdS 종결요소

본 명세서 및 첨부된 특허청구범위 전체에 걸쳐 용어 "포함한다" 및 "포괄한다", 및 파생어, 예컨대, "포함하고", "포함하는", "포괄하고" 및 "포괄하는"은 포괄적으로 해석되어야 한다. 즉, 이들 용어들은 문맥이 허용하는 경우 구체적으로 언급되지 않은 다른 요소 또는 정수의 가능한 포함을 전달하기 위한 것이다.

본원에서 단수형은 하나 또는 하나 초과의(즉, 하나 또는 하나 이상의) 문법적 객체를 지칭하기 위해 사용된다. 예를 들면, "요소"는 하나의 요소 또는 하나 초과의 요소를 의미할 수 있다.

본 발명은 폴리펩티드, 예를 들면, 탄수화물 물질을 변경시키는, 예를 들면, 분해하는 능력을 갖는 효소를 코딩하는 폴리뉴클레오티드를 제공한다. 탄수화물 물질은 하나 이상의 탄수화물을 포함하거나, 하나 이상의 탄수화물로 구성되거나 실질적으로 하나 이상의 탄수화물로 구성된 물질이다. 본원에서 효소는 폴리펩티드의 서브클래스이다.

본원에서 기질(공급원료로서도 지칭됨)은 그 내부의 탄수화물 물질이 변경되도록 본 발명에 따른 효소로 처리될 수 있는 탄수화물 물질을 포함하는 물질을 지칭하기 위해 사용된다. 기질은 탄수화물 물질 이외에 비-탄수화물 물질 및 전분을 포함하나 이들로 한정되지 않는 임의의 다른 성분을 함유할 수 있다.

Temer09484

전형적으로, 본 발명의 폴리펩티드는 서열번호 2에 따른 아미노산 서열, 이의 변이체, 전형적으로 서열번호 2의 서열을 갖는 폴리펩티드의 기능성 균등물인 서열, 또는 이들 중 어느 하나의 단편인 서열을 갖는, 적어도 β-자일로시다제 활성을 갖는 폴리펩티드(Temer09484로서 가칭됨)를 코딩한다.

β-자일로시다제(EC 3.2.1.37)는 1,4-β-D-자일란의 가수분해를 촉진하여 비-환원 말단으로부터 연속적인 D-자일로스 잔기를 제거할 수 있는 임의의 폴리펩티드이다. 이러한 효소는 자일로바이오스(xylobiose)도 가수분해할 수 있다. 이 효소는 자일란 1,4-β-자일로시다제, 1,4-β-D-자일란 자일로하이드롤라제, 엑소-1,4-β-자일로시다제 또는 자일로비아제로서도 지칭될 수 있다.

본 발명의 폴리펩티드는 β-자일로시다제 활성 이외에 하나 이상의 대안적 및/또는 추가 탄수화물 분해 및/또는 탄수화물 가수분해 활성, 예를 들면, 본원에서 언급된 다른 탄수화물 분해 및/또는 탄수화물 가수분해 활성들 중 하나를 가질 수 있다.

Temer00088

전형적으로, 본 발명의 폴리펩티드는 서열번호 7에 따른 아미노산 서열, 이의 변이체, 전형적으로 서열번호 7의 서열을 갖는 폴리펩티드의 기능성 균등물인 서열, 또는 이들 중 어느 하나의 단편인 서열을 갖는, 적어도 β-자일로시다제 활성을 갖는 폴리펩티드(Temer00088로서 가칭됨)를 코딩한다.

β-자일로시다제(EC 3.2.1.37)는 1,4-β-D-자일란의 가수분해를 촉진하여 비-환원 말단으로부터 연속적인 D-자일로스 잔기를 제거할 수 있는 임의의 폴리펩티드이다. 이러한 효소는 자일로바이오스도 가수분해할 수 있다. 이 효소는 자일란 1,4-β-자일로시다제, 1,4-β-D-자일란 자일로하이드롤라제, 엑소-1,4-β-자일로시다제 또는 자일로비아제로서도 지칭될 수 있다.

Temer08028

전형적으로, 본 발명의 폴리펩티드는 서열번호 12에 따른 아미노산 서열, 이의 변이체, 전형적으로 서열번호 12의 서열을 갖는 폴리펩티드의 기능성 균등물인 서열, 또는 이들 중 어느 하나의 단편인 서열을 갖는, 적어도 α-갈락토시다제 활성을 갖는 폴리펩티드(Temer08028로서 가칭됨)를 코딩한다.

본원에서 α-갈락토시다제(EC 3.2.1.22; GH27)는 갈락토스 올리고사카라이드, 갈락토만난, 갈락탄 및 아라비노갈락탄을 비롯한 α-D-갈락토사이드에서 말단 비-환원 α-D-갈락토스 잔기의 가수분해를 촉진할 수 있는 임의의 폴리펩티드이다. 이러한 폴리펩티드는 α-D-푸코사이드도 가수분해할 수 있다. 이 효소는 멜리비아제(melibiase)로서도 지칭될 수 있다.

본 발명의 폴리펩티드는 α-갈락토시다제 활성 이외에 하나 이상의 대안적 및/또는 추가 탄수화물 분해 및/또는 탄수화물 가수분해 활성, 예를 들면, 본원에서 언급된 다른 탄수화물 분해 및/또는 탄수화물 가수분해 활성들 중 하나를 가질 수 있다.

Temer02362

전형적으로, 본 발명의 폴리펩티드는 서열번호 17에 따른 아미노산 서열, 이의 변이체, 전형적으로 서열번호 17의 서열을 갖는 폴리펩티드의 기능성 균등물인 서열, 또는 이들 중 어느 하나의 단편인 서열을 갖는, 적어도 α-갈락토시다제 활성을 갖는 폴리펩티드(Temer02362로서 가칭됨)를 코딩한다.

Temer08862

전형적으로, 본 발명의 폴리펩티드는 서열번호 22에 따른 아미노산 서열, 이의 변이체, 전형적으로 서열번호 22의 서열을 갖는 폴리펩티드의 기능성 균등물인 서열, 또는 이들 중 어느 하나의 단편인 서열을 갖는, 적어도 α-갈락토시다제 활성을 갖는 폴리펩티드(Temer08862로서 가칭됨)를 코딩한다.

Temer04790

전형적으로, 본 발명의 폴리펩티드는 서열번호 27에 따른 아미노산 서열, 이의 변이체, 전형적으로 서열번호 27의 서열을 갖는 폴리펩티드의 기능성 균등물인 서열, 또는 이들 중 어느 하나의 단편인 서열을 갖는, 적어도 자일로글루카나제 활성을 갖는 폴리펩티드(Temer04790으로서 가칭됨)를 코딩한다.

본원에서 자일로글루카나제는 β1→4-연결된 글루코스 잔기들(이들 중 대다수가 1-6-연결된 자일로스 측쇄로 치환됨)의 골격인 자일로글루칸의 절단을 촉진하는 자일로글루칸 특이적 엔도-β-1,4-글루카나제이다.

본 발명의 폴리펩티드는 자일로글루카나제 활성 이외에 하나 이상의 대안적 및/또는 추가 탄수화물 분해 및/또는 탄수화물 가수분해 활성, 예를 들면, 본원에서 언급된 다른 탄수화물 분해 및/또는 탄수화물 가수분해 활성들 중 하나를 가질 수 있다.

Temer05249

전형적으로, 본 발명의 폴리펩티드는 서열번호 32에 따른 아미노산 서열, 이의 변이체, 전형적으로 서열번호 32의 서열을 갖는 폴리펩티드의 기능성 균등물인 서열, 또는 이들 중 어느 하나의 단편인 서열을 갖는, 적어도 α-아라비노푸라노시다제 활성을 갖는 폴리펩티드(Temer05249로서 가칭됨)를 코딩한다.

본원에서 α-L-아라비노푸라노시다제(EC 3.2.1.55)는 α-L-아라비노푸라노사이드, (1,2)-연결, (1,3)-연결 및/또는 (1,5)-연결을 함유하는 α-L-아라비난, 아라비노자일란 및 아라비노갈락탄에 작용할 수 있는 임의의 폴리펩티드이다. 이 효소는 α-N-아라비노푸라노시다제, 아라비노푸라노시다제 또는 아라비노시다제로서도 지칭될 수 있다.

본 발명의 폴리펩티드는 α-아라비노푸라노시다제 활성 이외에 하나 이상의 대안적 및/또는 추가 탄수화물 분해 및/또는 탄수화물 가수분해 활성, 예를 들면, 본원에서 언급된 다른 탄수화물 분해 및/또는 탄수화물 가수분해 활성들 중 하나를 가질 수 있다.

Temer06848

전형적으로, 본 발명의 폴리펩티드는 서열번호 37에 따른 아미노산 서열, 이의 변이체, 전형적으로 서열번호 37의 서열을 갖는 폴리펩티드의 기능성 균등물인 서열, 또는 이들 중 어느 하나의 단편인 서열을 갖는, 적어도 α-아라비노푸라노시다제 활성을 갖는 폴리펩티드(Temer06848로서 가칭됨)를 코딩한다.

Temer02056

전형적으로, 본 발명의 폴리펩티드는 서열번호 42에 따른 아미노산 서열, 이의 변이체, 전형적으로 서열번호 42의 서열을 갖는 폴리펩티드의 기능성 균등물인 서열, 또는 이들 중 어느 하나의 단편인 서열을 갖는, 적어도 α-아라비노푸라노시다제 활성을 갖는 폴리펩티드(Temer02056으로서 가칭됨)를 코딩한다.

Temer03124

전형적으로, 본 발명의 폴리펩티드는 서열번호 47에 따른 아미노산 서열, 이의 변이체, 전형적으로 서열번호 47의 서열을 갖는 폴리펩티드의 기능성 균등물인 서열, 또는 이들 중 어느 하나의 단편인 서열을 갖는, 적어도 엔도-자일라나제 활성을 갖는 폴리펩티드(Temer03124로서 가칭됨)를 코딩한다.

본원에서 엔도-자일라나제(EC 3.2.1.8)는 자일란에서 1,4-β-D-자일로사이드 연결의 엔도-가수분해를 촉진할 수 있는 임의의 폴리펩티드이다. 이 효소는 엔도-1,4-β-자일라나제 또는 1,4-β-D-자일란 자일라노하이드롤라제로서도 지칭될 수 있다. 대안적 효소는 글루쿠로노아라비노자일란에서 1,4-자일로사이드 연결을 가수분해할 수 있는 효소인 글루쿠로노아라비노자일란 엔도-자일라나제(EC 3.2.1.136)이다.

본 발명의 폴리펩티드는 엔도-자일라나제 활성 이외에 하나 이상의 대안적 및/또는 추가 탄수화물 분해 및/또는 탄수화물 가수분해 활성, 예를 들면, 본원에서 언급된 다른 탄수화물 분해 및/또는 탄수화물 가수분해 활성들 중 하나를 가질 수 있다.

Temer09491

전형적으로, 본 발명의 폴리펩티드는 서열번호 52에 따른 아미노산 서열, 이의 변이체, 전형적으로 서열번호 52의 서열을 갖는 폴리펩티드의 기능성 균등물인 서열, 또는 이들 중 어느 하나의 단편인 서열을 갖는, 적어도 만노시다제 및/또는 자일로시다제 활성을 갖는 폴리펩티드(Temer09491로서 가칭됨)를 코딩한다.

본원에서 β-자일로시다제(EC 3.2.1.37)는 1,4-β-D-자일란의 가수분해를 촉진하여 비-환원 말단으로부터 연속적인 D-자일로스 잔기를 제거할 수 있는 임의의 폴리펩티드이다. 이러한 효소는 자일로바이오스도 가수분해할 수 있다. 이 효소는 자일란 1,4-β-자일로시다제, 1,4-β-D-자일란 자일로하이드롤라제, 엑소-1,4-β-자일로시다제 또는 자일로비아제로서도 지칭될 수 있다.

본원에서 β-만노시다제(EC 3.2.1.25)는 β-D-만노사이드에서 말단 비-환원 β-D-만노스 잔기의 가수분해를 촉진할 수 있는 임의의 폴리펩티드이다. 이 효소는 만나나제 또는 만나제로서도 지칭될 수 있다.

본 발명의 폴리펩티드는 만노시다제 및/또는 자일로시다제 활성 이외에 하나 이상의 대안적 및/또는 추가 탄수화물 분해 및/또는 탄수화물 가수분해 활성, 예를 들면, 본원에서 언급된 다른 탄수화물 분해 및/또는 탄수화물 가수분해 활성들 중 하나를 가질 수 있다.

Temer06400

전형적으로, 본 발명의 폴리펩티드는 서열번호 57에 따른 아미노산 서열, 이의 변이체, 전형적으로 서열번호 57의 서열을 갖는 폴리펩티드의 기능성 균등물인 서열, 또는 이들 중 어느 하나의 단편인 서열을 갖는, 적어도 페룰로일 에스터라제 활성을 갖는 폴리펩티드(Temer06400으로서 가칭됨)를 코딩한다.

본원에서 페룰로일 에스터라제(EC 3.1.1.73; CE1)는 하기 형태의 반응을 촉진할 수 있는 임의의 폴리펩티드이다: 페룰로일-사카라이드 + H(2)O = 페룰레이트 + 사카라이드. 사카라이드는 예를 들면, 올리고사카라이드 또는 폴리사카라이드일 수 있다. 이 효소는 전형적으로 통상적으로 '천연' 기질에서 아라비노스인 에스터화된 당으로부터의 4-하이드록시-3-메톡시신나모일(페룰로일) 기의 가수분해를 촉진할 수 있다. p-니트로페놀 아세테이트 및 메틸 페룰레이트는 전형적으로 보다 더 약한 기질이다. 이 효소는 신나모일 에스터 하이드롤라제, 페룰산 에스터라제 또는 하이드록시신나모일 에스터라제로서도 지칭될 수 있다. 상기 효소는 자일라나제 및 펙티나제가 식물 세포벽 헤미셀룰로스 및 펙틴을 분해하는 것을 도울 수 있기 때문에 헤미셀룰라제 보조 효소로서도 지칭될 수 있다.

본 발명의 폴리펩티드는 페룰로일 에스터라제 활성 이외에 하나 이상의 대안적 및/또는 추가 탄수화물 분해 및/또는 탄수화물 가수분해 활성, 예를 들면, 본원에서 언급된 다른 탄수화물 분해 및/또는 탄수화물 가수분해 활성들 중 하나를 가질 수 있다.

Temer08570

전형적으로, 본 발명의 폴리펩티드는 서열번호 62에 따른 아미노산 서열, 이의 변이체, 전형적으로 서열번호 62의 서열을 갖는 폴리펩티드의 기능성 균등물인 서열, 또는 이들 중 어느 하나의 단편인 서열을 갖는, 적어도 엔도-자일라나제 활성을 갖는 폴리펩티드(Temer08570으로서 가칭됨)를 코딩한다.

본원에서 β-자일로시다제(EC 3.2.1.37; GH39)는 1,4-β-D-자일란의 가수분해를 촉진하여 비-환원 말단으로부터 연속적인 D-자일로스 잔기를 제거할 수 있는 임의의 폴리펩티드이다. 이러한 효소는 자일로바이오스도 가수분해할 수 있다. 이 효소는 자일란 1,4-β-자일로시다제, 1,4-β-D-자일란 자일로하이드롤라제, 엑소-1,4-β-자일로시다제 또는 자일로비아제로서도 지칭될 수 있다.

본 발명의 폴리펩티드는 자일로시다제 활성 이외에 하나 이상의 대안적 및/또는 추가 탄수화물 분해 및/또는 탄수화물 가수분해 활성, 예를 들면, 본원에서 언급된 다른 탄수화물 분해 및/또는 탄수화물 가수분해 활성들 중 하나를 가질 수 있다.

Temer08163

전형적으로, 본 발명의 폴리펩티드는 서열번호 67에 따른 아미노산 서열, 이의 변이체, 전형적으로 서열번호 67의 서열을 갖는 폴리펩티드의 기능성 균등물인 서열, 또는 이들 중 어느 하나의 단편인 서열을 갖는, 적어도 엔도-자일라나제 및/또는 엑소-자일라나제 활성을 갖는 폴리펩티드(Temer08163으로서 가칭됨)를 코딩한다. Temer08163은 유리하게는 자일로바이오스를 주 생성물로서 생성한다.

본 발명의 폴리펩티드는 엔도-자일라나제 및/또는 엑소-자일라나제 활성 이외에 하나 이상의 대안적 및/또는 추가 탄수화물 분해 및/또는 탄수화물 가수분해 활성, 예를 들면, 본원에서 언급된 다른 탄수화물 분해 및/또는 탄수화물 가수분해 활성들 중 하나를 가질 수 있다.

Temer07305

전형적으로, 본 발명의 폴리펩티드는 서열번호 72에 따른 아미노산 서열, 이의 변이체, 전형적으로 서열번호 72의 서열을 갖는 폴리펩티드의 기능성 균등물인 서열, 또는 이들 중 어느 하나의 단편인 서열을 갖는, 적어도 α-글루쿠로니다제 활성을 갖는 폴리펩티드(Temer07305로서 가칭됨)를 코딩한다.

본원에서 α-D-글루쿠로니다제(EC 3.2.1.139; GH115)는 하기 형태의 반응을 촉진할 수 있는 임의의 폴리펩티드이다: α-D-글루쿠로노사이드 + H(2)O = 알코올 + D-글루쿠로네이트. 이 효소는 α-글루쿠로니다제 또는 α-글루코시듀로나제로서도 지칭될 수 있다. 이 효소는 자일란에 치환기로서 존재할 수도 있는 4-O-메틸화된 글루코론산을 가수분해할 수도 있다. 대안적 효소는 α-1,2-(4-O-메틸)글루쿠로노실 연결의 가수분해를 촉진하는 자일란 α-1,2-글루쿠로노시다제(EC 3.2.1.131)이다.

본 발명의 폴리펩티드는 α-글루쿠로니다제활성 이외에 하나 이상의 대안적 및/또는 추가 탄수화물 분해 및/또는 탄수화물 가수분해 활성, 예를 들면, 본원에서 언급된 다른 탄수화물 분해 및/또는 탄수화물 가수분해 활성들 중 하나를 가질 수 있다.

이와 관련하여 탄수화물은 모든 사카라이드, 예를 들면, 폴리사카라이드, 올리고사카라이드, 다이사카라이드 또는 모노사카라이드를 포함한다.

본 발명에 따른 폴리펩티드는 탄수화물 물질을 화학적으로 분해하거나 물리적으로 분해하거나 탄수화물을 가수분해함으로써 이러한 탄수화물 물질을 변경시킬 수 있다. 탄수화물 물질의 화학적 변경은 예를 들면, 가수분해, 산화 또는 다른 화학적 변경, 예컨대, 라이아제(lyase)의 작용에 의한 이러한 물질의 분해를 초래할 수 있다. 물리적 변경은 화학적 변경을 동반할 수 있거나 동반하지 않을 수 있다.

적합한 탄수화물 물질

리그노셀룰로스용해 또는 리그노셀룰로스성 물질 또는 바이오매스는 자연에 풍부하고 대체 에너지 공급원으로서 큰 가치를 갖는다. 진보된 바이오연료로서도 공지되어 있는 제2 세대 바이오연료는 다양한 종류의 바이오매스로부터 제조될 수 있는 연료이다. 바이오매스는 탄소 주기의 일부로서 신속하게 재생되는 유기 탄소의 임의의 공급원을 의미하는 광범위한 용어이다. 바이오매스는 식물 물질로부터 유래되지만 동물 물질도 포함할 수 있다. 리그노셀룰로스성 바이오매스의 조성은 상이하고, 주성분은 셀룰로스(35% 내지 50%)이고 그 다음 많은 성분은 자일란(20% 내지 35%, 헤미셀룰로스의 일종) 및 리그닌(10% 내지 25%)이고, 이와 더불어 리그노셀룰로스성 바이오매스의 남은 분율을 구성하는 부성분, 예컨대, 단백질, 오일 및 재(ash)가 있다. 리그노셀룰로스성 바이오매스는 다양한 탄수화물들을 함유한다. 용어 "탄수화물"은 생화학에서 가장 일반적인 용어이고, 이때 상기 용어는 사카라이드의 동의어이다. 탄수화물(사카라이드)은 하기 4개의 화학 집단으로 나누어진다: 모노사카라이드, 다이사카라이드, 올리고사카라이드 및 폴리사카라이드. 일반적으로, 보다 작은(저분자량) 탄수화물인 모노사카라이드 및 다이사카라이드는 통상적으로 당으로서 지칭된다.

본 발명의 폴리펩티드에 의한 변경에 적합한 비-전분 탄수화물은 리그노셀룰로스이다. 잠재적인 재생가능한 공급원료로서 간주될 수 있는, 상이한 리그노셀룰로스성 잔기를 포함하는 주요 폴리사카라이드는 셀룰로스(글루칸) 및 헤미셀룰로스(자일란, 헤테로자일란 및 자일로글루칸)이다. 추가로, 일부 헤미셀룰로스는 예를 들면, 목재 유래의 공급원료에서 글루코만난으로서 존재할 수 있다. 가용성 당, 예를 들면, 글루코스, 자일로스, 아라비노스, 갈락토스, 프럭토스, 만노스, 람노스, 리보스, D-갈락투론산 및 다른 헥소스 및 펜토스로의 이들 폴리사카라이드들의 효소 가수분해는 협력하여 작용하는 상이한 효소들의 작용 하에서 일어난다.

리그닌은 특히 목질부 헛물관, 도관 요소 및 후막 세포에서 셀룰로스, 헤미셀룰로스 및 펙틴 성분들 사이의 세포벽내 공간을 채운다. 리그닌은 헤미셀룰로스에 공유연결됨으로써 상이한 식물 폴리사카라이드들을 가교연결하여 기계적 강도를 세포벽 및 더 나아가 식물 전체에 부여한다. 리그닌은 다양한 정도로 메톡실화될 수 있는 상이한 모노리그놀 단량체들에 의해 형성되는 고도 소수성 가교연결된 방향족 중합체성 물질이다. 다양한 정도로 메톡실화되는 하기 3종의 모노리그놀 단량체들이 존재한다: p-쿠마릴 알코올, 코니페릴 알코올 및 시나필 알코올. 이들 리그놀들은 페닐프로파노이드(각각 p-하이드록시페닐(H), 구아이아실(guaiacyl)(G) 및 시링길(syringyl)(S))의 형태로 리그닌 내로 도입된다. 리그닌의 생분해는 식물 원료 물질로부터 바이오연료를 가공하기 위한 전제조건이다. 리그닌은 상이한 전처리 방법을 적용함으로써, 또는 리그니나제(ligninase) 또는 리그닌 변경 효소(LME)를 사용함으로써 분해될 수 있다. 리그닌 분해의 개선은 예를 들면, (헤미)셀룰로스성 성분에의 접근성을 개선함으로써, 또는 (헤미)셀룰라제의 작용에 의해 방출된 올리고사카라이드에서 리그닌-(헤미)셀룰로스 연결을 제거함으로써 바이오연료 가공으로부터의 생산량을 보다 더 우수한 수득 또는 보다 더 우수한 효율 계수까지 끌어올릴 것이다.

추가로, 펙틴 및 다른 펙틴성 물질, 예컨대, 아라비난은 전형적으로 비-목재성 식물 조직으로부터의 세포벽의 건조 질량의 상당한 비율을 차지할 수 있다(건조 질량의 약 4분의 1 내지 2분의 1이 펙틴일 수 있다).

셀룰로스는 β-1,4 결합에 의해 연결된 글루코스 잔기들로 구성된 선형 폴리사카라이드이다. 셀룰로스 섬유의 선형 성질 및 (α에 비해) β-연결된 글루코스의 화학양론은 전분의 고도로 분지된 α-연결된 구조보다 더 가닥간 수소결합하기 쉬운 구조를 발생시킨다. 따라서, 셀룰로스 중합체는 일반적으로 보다 더 낮은 가용성을 갖고 전분에서 발견된 섬유보다 더 단단히 결합된 섬유를 형성한다.

헤미셀룰로스는 복합 중합체이고, 그의 조성은 종종 유기체마다 및 조직 종류마다 광범위하게 달라진다. 일반적으로, 헤미셀룰로스의 주성분은 오탄당인 β-1,4-연결된 자일로스이다. 그러나, 이 자일로스는 종종 O-3 및/또는 O-2에서 분지되고, 아라비노스, 갈락토스, 만노스, 글루쿠론산 또는 갈락투론산과의 연결, 또는 아세트산으로의 에스터화(및 아라비노스로의 페룰산의 에스터화)에 의해 치환될 수 있다. 헤미셀룰로스는 β-연결된 육탄당(예컨대, 앞서 언급된 β-(1,3)(1,4)-글루칸 및 헤테로글루칸)에 대한 일반 용어인 글루칸, 및 추가로 글루코만난(이때, 글루코스 및 만노스 둘다가 β-연결에 의해 서로 연결된 상태로 선형 골격에 존재함)도 함유할 수 있다.

헤미셀룰로스의 조성, 치환 성질 및 분지화 정도는 단자엽 식물(외떡잎 식물, 즉 단일 자엽 또는 종자 잎을 갖는 식물, 예컨대, 옥수수, 밀, 벼, 잔디, 보리)에 비해 쌍자엽 식물(쌍떡잎 식물, 즉 2개의 자엽 또는 종자 잎을 갖는 종자를 갖는 식물, 예컨대, 리마콩, 땅콩, 아몬드, 완두콩, 강낭콩)에서 매우 상이하다. 쌍떡잎 식물에서 헤미셀룰로스는 1,6-β-연결된 자일로실 측쇄를 갖는 1,4-β-연결된 글루코스 쇄인 자일로글루칸으로 주로 구성된다. 대다수의 곡물 작물을 포함하는 외떡잎 식물에서, 헤미셀룰로스의 주성분은 헤테로자일란이다. 이것은 아라비노스, 갈락토스, 만노스 및 글루쿠론산 또는 4-O-메틸-글루쿠론산과의 1,3-α 연결을 갖는 1,4-β-연결된 자일로스 골격 중합체, 및 에스터-연결된 아세트산에 의해 변경된 자일로스로 주로 구성된다. 1,3-β-연결된 글루코실 쇄 및 1,4-β-연결된 글루코실 쇄로 구성된 β-글루칸도 존재한다. 외떡잎 식물에서, 셀룰로스, 헤테로자일란 및 β-글루칸은 세포벽의 건조 물질의 약 15% 내지 25%를 각각 차지하면서 거의 동등한 양으로 존재할 수 있다. 또한, 상이한 식물은 상이한 양 및 상이한 조성의 펙틴성 물질을 포함할 수 있다. 예를 들면, 사탕무는 건조 중량 기준으로 약 19%의 펙틴 및 약 21%의 아라비난을 함유한다.

따라서, 본 발명의 조성물은 사용될 구체적인 공급원료(기질로서도 지칭됨) 면에서 조정될 수 있다. 다시 말해, 본 발명의 조성물에서 활성의 스펙트럼은 해당 공급원료에 따라 달라질 수 있다.

효소 조합물 또는 물리적 처리가 동시적으로 또는 순차적으로 투여될 수 있다. 효소는 미생물, 효모, 진균, 세균 또는 식물에서 외생적으로 생성된 후 단리될 수 있고 리그노셀룰로스성 공급원료에 첨가될 수 있다. 대안적으로, 효소는 생성되되 단리되지 않고, 미정제 세포 덩어리 발효 브로쓰 또는 식물 물질(예컨대, 옥수수대) 등이 공급원료에 첨가된다. 대안적으로, 미정제 세포 덩어리, 효소 생성 배지 또는 식물 물질이 추가 미생물 생장을 방지하도록 (예를 들면, 가열 또는 항미생물제의 첨가에 의해) 처리된 후 공급원료에 첨가될 수 있다. 이들 미정제 효소 혼합물들은 효소를 생성하는 유기체를 포함할 수 있다. 대안적으로, 효소는 공급원료(예컨대, 옥수수대)를 사용하여 효소를 생성하는 유기체에게 영양을 제공하는 발효에서 생성될 수 있다. 이 방식으로, 효소를 생성하는 식물은 리그노셀룰로스성 공급원료로서 사용될 수 있고 리그노셀룰로스성 공급원료 내로 첨가될 수 있다.

효소 활성

엔도-1,4-β-글루카나제(EG) 및 엑소-셀로바이오하이드롤라제(CBH)는 셀로올리고사카라이드(주 생성물로서 셀로바이오스)로의 불용성 셀룰로스의 가수분해를 촉진하는 반면, β-글루코시다제(BGL)는 올리고사카라이드, 주로 셀로바이오스 및 셀로트라이오스를 글루코스로 전환시킨다.

자일라나제는 다른 보조 효소, 예를 들면, α-L-아라비노푸라노시다제, 페룰로일 및 아세틸자일란 에스터라제, 글루쿠로니다제 및 β-자일로시다제와 함께 헤미셀룰로스의 일부의 가수분해를 촉진한다.

펙틴성 물질은 펙틴, 아라비난, 갈락탄 및 아라비노갈락탄을 포함한다. 펙틴은 식물 세포벽에서 가장 복잡한 폴리사카라이드이다. 펙틴은 어느 정도까지 L-람노스 사이에 배치된 α(1,4)-연결된 D-갈락투론산 유닛들로 구성된 코어 쇄 주변에서 구축된다. 임의의 한 세포벽에는 이 설명과 들어맞는 다수의 구조 유닛들이 존재하고, 일반적으로 단일 펙틴성 분자에서 상이한 구조 유닛들로 구성된 코어 쇄들은 서로 연속적으로 존재한다고 간주된다.

펙티나제는 예를 들면, 엔도-폴리갈락투로나제, 펙틴 메틸 에스터라제, 엔도-갈락타나제, β-갈락토시다제, 펙틴 아세틸 에스터라제, 엔도-펙틴 라이아제, 펙테이트 라이아제, α-람노시다제, 엑소-갈락투로나제, 엑소-폴리갈락투로네이트 라이아제, 람노갈락투로난 하이드롤라제, 람노갈락투로난 라이아제, 람노갈락투로난 아세틸 에스터라제, 람노갈락투로난 갈락투로노하이드롤라제, 자일로갈락투로나제, 및 α-아라비노푸라노시다제를 포함한다.

구조 유닛의 주요 종류는 다음과 같다: 카복실 기 상에서 메탄올로 치환될 수 있고 O-2 및 O-3 상에서 아세테이트로 치환될 수 있는 갈락투로난(호모갈락투로난); 갈락투론산 유닛이 (1,4)-연결된 갈락탄 및 (1,5)-연결된 아라비난 측쇄를 보유하는 람노스 유닛과 교대로 존재하는 람노갈락투로난 I(RGI)(아라비난 측쇄는 람노스에 직접적으로 또는 갈락탄 쇄를 통해 간접적으로 부착될 수 있음); 갈락투론산의 O-3 상에서 단일 자일로실 유닛을 갖는 자일로갈락투로난(RGI와 밀접하게 관련되어 있음); 및 희귀 당, 예를 들면, 아피오스를 함유하는 특히 복잡한 소수 유닛인 람노갈락투로난 II(RGII). RGII 유닛은 적합한 이온성 조건 하에서 보레이트와 함께 에스터를 가역적으로 형성할 수 있는 2개의 아피오실 잔기를 함유할 수 있다.

전술된 바와 같이, 본 발명의 폴리펩티드는 전형적으로 표 1에 따른 활성을 가질 것이다. 그러나, 본 발명의 폴리펩티드는 그 활성 이외에 또는 대신에 전술된 활성들 중 하나 이상을 가질 수 있다. 또한, 본원에 기재된 본 발명의 조성물은 표 1에 따른 활성을 갖는 본 발명의 폴리펩티드에 의해 제공된 활성 이외에 전술된 활성들 중 하나 이상을 가질 수 있다.

폴리뉴클레오티드 서열

본 발명은 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305를 코딩하는 유전자를 포함하는 게놈 폴리뉴클레오티드 서열뿐만 아니라 그의 코딩 서열도 제공한다. 따라서, 본 발명은 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74, 또는 서열번호 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70 또는 75에 따른 코딩 뉴클레오티드 서열에 따른 게놈 뉴클레오티드 서열을 포함하는 단리된 폴리뉴클레오티드, 및 이의 변이체, 예컨대, 기능성 균등물에 관한 것이다.

구체적으로, 본 발명은 예를 들면, 엄격한 조건 하에서, 바람직하게는 고도로 엄격한 조건 하에서 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74, 또는 서열번호 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70 또는 75에 기재된 서열을 포함하는 폴리뉴클레오티드의 역 상보체와 선택적으로 혼성화할 수 있는 단리된 폴리뉴클레오티드에 관한 것이다.

보다 구체적으로, 본 발명은 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74, 또는 서열번호 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70 또는 75에 따른 뉴클레오티드 서열을 포함하거나 본질적으로 이러한 뉴클레오티드 서열로 구성된 폴리뉴클레오티드에 관한 것이다.

본 발명은 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72에 따른 폴리펩티드 또는 이의 변이체, 예컨대, 기능성 균등물, 또는 이들 중 어느 하나의 단편의 하나 이상의 기능성 도메인을 코딩하는 서열을 포함하거나 본질적으로 이러한 서열로 구성된 단리된 폴리뉴클레오티드에 관한 것이다.

본원에서 사용된 바와 같이, 용어 "유전자" 및 "재조합 유전자"는 염색체 DNA로부터 단리될 수 있고 예를 들면, 본 발명에 따른 활성을 갖는 단백질을 코딩하는 개방 판독 프레임(open reading frame)을 포함하는 핵산 분자를 지칭한다.

유전자는 코딩 서열, 비-코딩 서열, 인트론 및/또는 조절 서열을 포함할 수 있다. 나아가, 용어 "유전자"는 본원에서 정의된 단리된 핵산 분자를 지칭할 수 있다.

본 발명의 핵산 분자, 예컨대, 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74, 또는 서열번호 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70 또는 75의 뉴클레오티드 서열을 갖는 핵산 분자, 또는 이의 변이체, 예컨대, 기능성 균등물은 표준 분자생물학 기법 및 본원에서 제공된 서열 정보를 사용함으로써 단리될 수 있다. 예를 들면, 본 발명에 따른 핵산 분자는 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71의 핵산 서열의 전부 또는 일부를 혼성화 프로브로서 사용하여 표준 기법 및 클로닝 기법(예를 들면, 문헌(Sambrook, J., Fritsh, E. F., and Maniatis, T. Molecular Cloning: A Laboratory Manual.2nd, ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989)에 기재됨)을 이용함으로써 단리될 수 있다.

더욱이, 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74, 또는 서열번호 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70 또는 75의 전부 또는 일부를 포괄하는 핵산 분자는 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74, 또는 서열번호 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70 또는 75에 함유된 서열 정보에 근거하여 디자인된 합성 올리고뉴클레오티드 프라이머를 사용하는 중합효소 연쇄 반응에 의해 단리될 수 있다.

본 발명의 핵산은 표준 PCR 증폭 기법에 따라 주형으로서 cDNA, mRNA 또는 대안적으로 게놈 DNA, 및 적절한 올리고뉴클레오티드 프라이머를 사용함으로써 증폭될 수 있다. 이렇게 증폭된 핵산은 적절한 벡터 내로 클로닝될 수 있고 DNA 서열 분석에 의해 특징규명될 수 있다.

나아가, 본 발명에 따른 뉴클레오티드 서열에 상응하거나 혼성화될 수 있는 올리고뉴클레오티드는 표준 합성 기법에 의해, 예를 들면, 자동 DNA 합성기를 이용함으로써 제조될 수 있다.

바람직한 실시양태에서, 본 발명의 단리된 핵산 분자는 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74, 또는 서열번호 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70 또는 75에 제시된 뉴클레오티드 서열을 포함한다.

또 다른 바람직한 실시양태에서, 본 발명의 단리된 핵산 분자는 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74, 또는 서열번호 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70 또는 75에 제시된 뉴클레오티드 서열 또는 이러한 뉴클레오티드 서열의 변이체, 예컨대, 기능성 균등물의 역 상보체인 핵산 분자를 포함한다.

또 다른 뉴클레오티드 서열에 상보적인 핵산 분자는 다른 뉴클레오티드 서열에 혼성화하여 안정한 이중체를 형성할 수 있을 정도로 다른 뉴클레오티드 서열에 충분히 상보적인 핵산 분자이다.

본 발명의 한 양태는 본 발명의 폴리펩티드 또는 이의 변이체, 예컨대, 기능성 균등물, 예를 들면, 생물학적 활성 단편 또는 도메인을 코딩하는 단리된 핵산 분자; 및 본 발명의 폴리펩티드를 코딩하는 핵산 분자를 확인하기 위한 혼성화 프로브로서 사용되기에 충분한 핵산 분자, 및 핵산 분자의 증폭 또는 돌연변이를 위한 PCR 프라이머로서 사용되기에 적합한 이러한 핵산 분자의 단편에 관한 것이다.

본 발명에 따른 폴리뉴클레오티드는 "단리"될 수 있다. 본 발명과 관련하여, "단리된 폴리뉴클레오티드" 또는 "단리된 핵산"은 그 자신의 기원인 유기체의 천연 게놈에서 그 자신과 바로 인접하여 존재하는 코딩 서열들(5' 말단 상의 한 코딩 서열 및 3' 말단 상의 한 코딩 서열) 중 하나 또는 둘다와 바로 인접하여 존재하지 않는 DNA 또는 RNA이다. 따라서, 한 실시양태에서, 단리된 핵산은 코딩 서열에 바로 인접하여 존재하는 5' 비-코딩(예를 들면, 프로모터) 서열들 중 일부 또는 전부를 포함한다. 따라서, 상기 용어는 예를 들면, 벡터, 자율 복제 플라스미드 또는 바이러스, 또는 원핵생물 또는 진핵생물의 게놈 DNA 내로 도입되거나, 다른 서열과 무관하게 별개의 분자(예를 들면, PCR 또는 제한 엔도뉴클레아제(endonuclease) 처리에 의해 생성된 cDNA 또는 게놈 DNA 단편)로서 존재하는 재조합 DNA를 포함한다. 상기 용어는 세포 물질, 바이러스 물질 또는 배양 배지(재조합 DNA 기법에 의해 생성될 때), 또는 화학 전구체 또는 다른 화학물질(화학적으로 합성될 때)을 실질적으로 갖지 않는 추가 폴리펩티드를 코딩하는 하이브리드 유전자의 일부인 재조합 DNA도 포함한다. 나아가, "단리된 핵산 단편"은 단편으로서 천연적으로 존재하지 않고 천연 상태에서 발견되지 않을 핵산 단편이다.

본원에서 사용된 바와 같이, 용어 "폴리뉴클레오티드" 또는 "핵산 분자"는 DNA 분자(예를 들면, cDNA 또는 게놈 DNA) 및 RNA 분자(예를 들면, mRNA), 및 뉴클레오티드 유사체의 사용에 의해 생성된 DNA 또는 RNA의 유사체를 포함하기 위한 것이다. 핵산 분자는 단일 가닥 또는 이중 가닥일 수 있으나, 바람직하게는 이중 가닥 DNA이다. 핵산은 올리고뉴클레오티드 유사체 또는 유도체(예를 들면, 이노신 또는 포스포로티오에이트 뉴클레오티드)를 사용함으로써 합성될 수 있다. 이러한 올리고뉴클레오티드는 예를 들면, 변경된 염기쌍 형성 능력 또는 뉴클레아제(nuclease)에 대한 증가된 내성을 갖는 핵산을 제조하는 데에 사용될 수 있다.

본 발명의 또 다른 실시양태는 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 핵산 분자, 예를 들면, Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 핵산 분자의 코딩 가닥에 대한 안티센스 가닥인 단리된 핵산 분자를 제공한다. 본원에 기재된 핵산 분자의 상보적 가닥도 본 발명의 범위 내에 포함된다.

달리 표시되어 있지 않은 한, 본원에서 DNA 분자를 서열결정(sequencing)함으로써 결정된 모든 뉴클레오티드 서열들은 자동 DNA 서열결정기를 이용함으로써 결정되었고, 본원에서 결정된 DNA 분자에 의해 코딩된 폴리펩티드의 모든 아미노산 서열들은 상기 결정된 DNA 서열의 번역에 의해 예측되었다. 따라서, 이 자동 방법에 의해 결정된 임의의 DNA 서열에 대해 당분야에서 공지되어 있는 바와 같이, 본원에서 결정된 임의의 뉴클레오티드 서열은 일부 오류를 함유할 수 있다. 자동화에 의해 결정된 뉴클레오티드 서열은 서열결정된 DNA 분자의 실제 뉴클레오티드 서열과 전형적으로 약 90% 이상, 보다 전형적으로 약 95% 이상 내지 약 99.9% 이상 동일하다.

실제 서열은 당분야에서 잘 공지되어 있는 수동 DNA 서열결정 방법을 비롯한 다른 방법에 의해 보다 더 정확히 결정될 수 있다. 당분야에서도 공지되어 있는 바와 같이, 실제 서열에 비해 결정된 뉴클레오티드 서열에서의 단일 삽입 또는 결실은 결정된 뉴클레오티드 서열에 의해 코딩된 예측된 아미노산 서열이 서열결정된 DNA 분자에 의해 실제로 코딩된 아미노산 서열과 완전히 상이할 정도로 뉴클레오티드 서열의 번역에서 이러한 삽입 또는 결실 지점부터 시작되는 프레임 변동을 야기할 것이다.

당업자는 이러한 오류로 확인된 염기를 확인할 수 있고 이러한 오류를 정정하는 방법을 알고 있다.

본 발명에 따른 핵산 분자는 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74, 또는 서열번호 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70 또는 75에 제시된 핵산 서열(또는 이의 변이체)의 일부 또는 단편, 예를 들면, 프로브 또는 프라이머로서 사용될 수 있는 단편, 또는 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305의 일부를 코딩하는 단편만을 포함할 수 있다.

Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 유전자 및 cDNA의 클로닝으로부터 결정된 뉴클레오티드 서열은 다른 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 패밀리 구성원뿐만 아니라, 다른 종으로부터의 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 상동체의 확인 및/또는 클로닝에 사용되도록 디자인된 프로브 및 프라이머의 생성을 가능하게 한다.

상기 프로브/프라이머는 전형적으로 바람직하게는 고도로 엄격한 조건 하에서 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74, 또는 서열번호 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70 또는 75에 제시된 뉴클레오티드 서열 또는 이의 변이체, 예컨대, 기능성 균등물의 적어도 약 12개 내지 약 15개, 바람직하게는 약 18개 내지 약 20개, 바람직하게는 약 22개 내지 약 25개, 보다 바람직하게는 약 30개, 약 35개, 약 40개, 약 45개, 약 50개, 약 55개, 약 60개, 약 65개 또는 약 75개 이상의 연속 뉴클레오티드에 혼성화하는 뉴클레오티드 서열의 영역을 전형적으로 포함하는 실질적으로 정제된 올리고뉴클레오티드를 포함한다.

Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 뉴클레오타이드 서열에 근거한 프로브를 사용하여 예를 들면, 다른 유기체에서 동일한 또는 유사한 단백질을 코딩하는 전사체 또는 게놈 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 서열을 검출할 수 있다. 바람직한 실시양태에서, 프로브는 그에 부착된 표지 기를 더 포함하고, 예를 들면, 표지 기는 방사성 동위원소, 형광 화합물, 효소 또는 효소 보조인자일 수 있다. 이러한 프로브는 Temer09484 단백질을 발현하는 세포를 확인하기 위한 진단 시험 키트의 일부로서 사용될 수도 있다.

본원의 폴리뉴클레오티드는 합성 폴리뉴클레오티드일 수 있다. 합성 폴리뉴클레오티드는 바람직하게는 본원에 참고로 도입되는 국제 특허출원 공개 제WO2006/077258호 및/또는 국제 특허출원 제PCT/EP2007/055943호에 기재된 방법에 따라 코돈 사용에서 최적화될 수 있다. 국제 특허출원 제PCT/EP2007/055943호는 코돈-쌍 최적화를 다룬다. 코돈 쌍 최적화는 폴리펩티드를 코딩하는 뉴클레오티드 서열을 그의 코돈 사용, 특히 사용되는 코돈 쌍에 대하여 변경시켜 폴리펩티드를 코딩하는 뉴클레오티드 서열의 개선된 발현 및/또는 코딩된 폴리펩티드의 개선된 생성을 수득하는 방법이다. 코돈 쌍은 코딩 서열에서 2개의 연속 삼중체들(코돈들)의 세트로서 정의된다.

또한, 본 발명은 전술된 폴리뉴클레오티드를 포함하는 핵산 구축물에 관한 것이다. 본원에서 "핵산 구축물"은 천연 유전자로부터 단리되거나, 자연에 존재하지 않을 방식으로 조합되고 병치되는 핵산 분절들을 함유하도록 변경되어 있는 단일 또는 이중 가닥 핵산 분자로서 정의된다. 용어 "핵산 구축물"은 핵산 구축물이 코딩 서열의 발현에 필요한 모든 조절 서열들을 함유할 때 용어 "발현 카세트"와 동의어이다. 본원에서 정의된 용어 "코딩 서열"은 mRNA로 전사되고 본 발명의 프로테아제 프로모터의 전사 활성화제로 번역되는 서열이다. 코딩 서열의 경계는 일반적으로 mRNA의 5' 말단에 있는 ATG 시작 코돈, 및 mRNA의 3' 말단에서 개방 판독 프레임을 종결하는 번역 정지 코돈 서열에 의해 결정된다. 코딩 서열은 DNA, cDNA 및 재조합 핵산 서열을 포함할 수 있으나 이들로 한정되지 않는다. 바람직하게는, 핵산은 높은 GC 함량을 갖는다. 본원에서 GC 함량은 구축물 내의 G 및 C 뉴클레오티드의 수를 뉴클레오티드의 총 수로 나눈 값(%로 표현됨)을 표시한다. GC 함량은 바람직하게는 56% 이상, 57% 이상, 58% 이상, 59% 이상, 60% 이상, 56% 내지 70%, 또는 58% 내지 65%이다. 바람직하게는, DNA 구축물은 프로모터 DNA 서열, 상기 프로모터 DNA 서열과 작동가능하게 연결된 코딩 서열, 및 조절 서열, 예컨대, 하기 조절 서열을 포함한다:

- 서열 TAAG, TAGA 및 TAAA로부터 선택된, 5'부터 3' 방향으로 배향된 1개의 번역 종결 서열, 바람직하게는 TAAA;

- 서열 GCTACCCCC, GCTACCTCC, GCTACCCTC, GCTACCTTC, GCTCCCCCC, GCTCCCTCC, GCTCCCCTC, GCTCCCTTC, GCTGCCCCC, GCTGCCTCC, GCTGCCCTC, GCTGCCTTC, GCTTCCCCC, GCTTCCTCC, GCTTCCCTC 및 GCTTCCTTC로부터 선택된, 5'부터 3' 방향으로 배향된 1개의 번역 개시요소 코딩 서열, 바람직하게는 GCTTCCTTC; 및/또는

- 뉴클레오티드에 대한 하기 모호한 코드를 사용하는 서열 5'-mwChkyCAAA-3', 5'-mwChkyCACA-3' 및 5'-mwChkyCAAG-3'으로부터 선택된 1개의 번역 개시요소 서열, 바람직하게는 5'-CACCGTCAAA-3' 또는 5'-CGCAGTCAAG-3': m(A/C); w(A/T); y(C/T); k(G/T); h(A/C/T).

본 발명과 관련하여, 용어 "번역 개시요소 코딩 서열"은 DNA 코딩 서열의 개방 판독 프레임의 개시요소 또는 시작 코돈의 바로 다운스트림에 있는 9개의 뉴클레오티드로서 정의된다. 상기 개시요소 또는 시작 코돈은 AA 메티오닌을 코딩한다. 개시요소 코돈은 전형적으로 ATG이지만 임의의 기능성 시작 코돈, 예컨대, GTG일 수도 있다.

본 발명과 관련하여, 용어 "번역 종결 서열"은 개방 판독 프레임 또는 뉴클레오티드 코딩 서열의 3' 말단에 있는 번역 정지 코돈으로부터 시작되고 5'부터 3' 방향으로 배향된 4개의 뉴클레오티드로서 정의된다.

본 발명과 관련하여, 용어 "번역 개시요소 서열"은 폴리펩티드를 코딩하는 DNA 서열의 개방 판독 프레임의 개시요소 또는 시작 코돈의 바로 업스트림에 있는 10개의 뉴클레오티드로서 정의된다. 상기 개시요소 또는 시작 코돈은 AA 메티오닌을 코딩한다. 개시요소 코돈은 전형적으로 ATG이지만 임의의 기능성 시작 코돈, 예컨대, GTG일 수도 있다. RNA에서 우라실인 U가 데옥시뉴클레오티드 타이민인 T를 대체한다는 것은 당분야에서 잘 공지되어 있다.

상동성 및 동일성

아미노산 또는 뉴클레오티드 서열은 일정한 수준의 유사성을 나타낼 때 상동성을 갖는다고 주장된다. 2개의 서열들이 상동성을 갖는다는 것은 공통된 진화 기원을 시사한다. 2개의 상동성 서열들이 밀접하게 관련되어 있는지 아니면 보다 더 멀리 관련되어 있는지는 각각 높은 또는 낮은 "퍼센트 동일성" 또는 "퍼센트 유사성"에 의해 표시된다. 논쟁의 여지가 있지만, "퍼센트 동일성" 또는 "퍼센트 유사성"을 표시하기 위해, "상동성의 수준" 또는 "퍼센트 상동성"은 종종 상호교환적으로 사용된다.

용어 "상동성", "퍼센트 상동성", "퍼센트 동일성" 또는 "퍼센트 유사성"은 본원에서 상호교환적으로 사용된다. 본 발명의 목적상, 2개의 아미노산 서열들 또는 2개의 핵산 서열들의 퍼센트 동일성을 측정하기 위해 완전한 서열들이 최적 비교 목적으로 정렬된다고 본원에서 정의된다. 2개의 서열들 사이의 정렬을 최적화하기 위해 갭이 비교되는 2개의 서열들 중 임의의 서열 내에 도입될 수 있다. 이러한 정렬은 비교되는 서열들의 전체 길이에 걸쳐 수행된다. 대안적으로, 상기 정렬은 보다 더 짧은 길이, 예를 들면, 약 20개, 약 50개 또는 약 100개 이상의 핵산/염기 또는 아미노산에 걸쳐 수행될 수 있다. 동일성은 보고된 정렬된 영역에 걸쳐 2개의 서열들 사이의 동일한 일치의 백분율이다.

서열들의 비교 및 2개의 서열들 사이의 퍼센트 동일성의 측정은 수학 알고리즘을 사용함으로써 달성될 수 있다. 당업자는 여러 상이한 컴퓨터 프로그램들이 2개의 서열들을 정렬하고 2개의 서열들 사이의 상동성을 측정하는 데에 이용될 수 있다는 사실을 알고 있을 것이다(Kruskal, J. B. (1983) An overview of sequence comparison In D. Sankoff and J. B. Kruskal, (ed.), Time warps, string edits and macromolecules: the theory and practice of sequence comparison, pp. 1-44 Addison Wesley). 2개의 아미노산 서열들 사이의 퍼센트 동일성은 2개의 서열들의 정렬을 위한 니들만(Needleman) 및 분슈(Wunsch) 알고리즘을 사용함으로써 측정될 수 있다(Needleman, S. B. and Wunsch, C. D. (1970) J. Mol. Biol. 48, 443-453). 상기 알고리즘은 아미노산 서열뿐만 아니라 뉴클레오티드 서열도 정렬한다. 니들만-분슈 알고리즘은 컴퓨터 프로그램 NEEDLE에서 실행되어 왔다. 본 발명의 목적상, EMBOSS 팩키지로부터의 NEEDLE 프로그램이 사용되었다(버전 2.8.0 이상, EMBOSS: The European Molecular Biology Open Software Suite (2000) Rice, P. Longden, I. and Bleasby, A. Trends in Genetics 16, (6) pp276-277, http://emboss.bioinformatics.nl/). 단백질 서열의 경우, EBLOSUM62가 치환 매트릭스용으로 사용된다. 뉴클레오티드 서열의 경우, EDNAFULL이 사용된다. 다른 매트릭스가 특정될 수 있다. 아미노산 서열들의 정렬을 위해 사용되는 임의적 파라미터는 10의 갭-개방 벌점 및 0.5의 갭 연장 벌점이다. 당업자는 모든 이들 상이한 파라미터들이 약간 상이한 결과를 제공할 것이지만 2개의 서열들의 전체 백분율 동일성은 상이한 알고리즘을 사용할 때 유의하게 변경되지 않는다는 것을 인식할 것이다.

전체 상동성 정의

상동성 또는 동일성은 임의의 갭 또는 연장을 포함하는 총 정렬된 영역에 걸쳐 2개의 전체 서열들 사이에 동일한 일치의 백분율이다. 2개의 정렬된 서열들 사이의 상동성 또는 동일성은 다음과 같이 계산된다: 2개의 서열들에서 동일한 아미노산을 보이는 정렬 내의 상응하는 위치의 수를, 갭을 포함하는 정렬의 총 길이로 나눈다. 본원에서 정의된 동일성은 NEEDLE로부터 수득될 수 있고 프로그램의 출력물에서 "동일성"으로서 표지된다.

가장 긴 동일성 정의

2개의 정렬된 서열들 사이의 상동성 또는 동일성은 다음과 같이 계산된다: 2개의 서열들에서 동일한 아미노산을 보이는 정렬 내의 상응하는 위치의 수를, 정렬 내의 총 갭 수의 차감 후 정렬의 총 길이로 나눈다. 본원에서 정의된 동일성은 NOBRIEF 방법을 이용함으로써 NEEDLE로부터 수득될 수 있고 프로그램의 출력물에서 "가장 긴 동일성"으로서 표지된다. 본 발명의 목적상, 2개의 서열들(아미노산 또는 뉴클레오티드) 사이의 동일성(상동성) 수준은 프로그램 NEEDLE를 사용함으로써 수행될 수 있는 바와 같이 "가장 긴 동일성"의 정의에 따라 계산된다.

본 발명의 단백질 서열은 서열 데이터베이스에 대한 검색을 수행하기 위한, 예를 들면, 다른 패밀리 구성원 또는 관련된 서열을 확인하기 위한 "질의(query) 서열"로서 사용될 수도 있다. 이러한 검색은 BLAST 프로그램을 사용함으로써 수행될 수 있다. BLAST 분석을 수행하기 위한 소프트웨어는 국립 생물공학 정보 센터(http://www.ncbi.nlm.nih.gov)를 통해 공개적으로 입수가능하다. 아미노산 서열의 경우 BLASTP가 사용되고 뉴클레오티드 서열의 경우 BLASTN이 사용된다. BLAST 프로그램은 디폴트로서 하기 파라미터들을 사용한다:

- 갭을 개방하기 위한 값: 디폴트 = 뉴클레오티드의 경우 5/단백질의 경우 11

- 갭을 연장하기 위한 값: 디폴트 = 뉴클레오티드의 경우 2/단백질의 경우 1

- 뉴클레오티드 불일치에 대한 벌점: 디폴트 = -3

- 뉴클레오티드 일치에 대한 보상: 디폴트 = 1

- 기대 값: 디폴트 = 10

- 단어크기: 디폴트 = 뉴클레오티드의 경우 11/메가블라스트(megablast)의 경우 28/단백질의 경우 3.

나아가, 질의 아미노산 서열 또는 질의 핵산 서열과 검색된 상동성 서열 사이의 국소 동일성(상동성) 정도는 BLAST 프로그램에 의해 측정된다. 그러나, 일정한 역치를 초과하는 일치를 제공하는 서열 분절들만이 비교된다. 따라서, 상기 프로그램은 이들 일치하는 분절들에 대해서만 동일성을 계산한다. 따라서, 이 방식으로 계산된 동일성은 국소 동일성으로서 지칭된다.

벡터

본 발명의 또 다른 양태는 Temer09484 단백질 또는 이의 기능성 균등물을 코딩하는 본 발명의 폴리뉴클레오티드를 포함하는 벡터(클로닝 벡터 및 발현 벡터를 포함함), 및 예를 들면, 본 발명의 폴리펩티드의 발현이 일어나는 조건 하에서 적합한 숙주 세포에서 이러한 벡터를 증폭하거나, 형질전환시키거나 형질감염시키는 방법에 관한 것이다. 본원에서 사용된 바와 같이, 용어 "벡터"는 그 자신에 연결된 또 다른 핵산을 수송할 수 있는 핵산 분자를 지칭한다.

본 발명의 폴리뉴클레오티드는 재조합 복제가능한 벡터, 예를 들면, 클로닝 또는 발현 벡터 내로 도입될 수 있다. 상기 벡터는 상용가능한 숙주 세포에서 핵산을 복제하는 데에 사용될 수 있다. 따라서, 추가 실시양태에서, 본 발명은 본 발명의 폴리뉴클레오티드를 복제가능한 벡터 내로 도입하고 상기 벡터를 상용가능한 숙주 세포 내로 도입하고 벡터의 복제를 일으키는 조건 하에서 상기 숙주 세포를 생장시킴으로써 본 발명의 폴리뉴클레오티드를 제조하는 방법을 제공한다. 상기 벡터는 숙주 세포로부터 회수될 수 있다. 적합한 숙주 세포는 이하에 기재되어 있다.

본 발명의 발현 카세트 또는 폴리뉴클레오티드가 삽입되는 벡터는 편리하게는 재조합 DNA 절차로 처리될 수 있는 임의의 벡터일 수 있고, 벡터의 선택은 그 자신이 도입되는 숙주 세포에 의해 종종 좌우될 것이다.

본 발명에 따른 벡터는 자율 복제 벡터, 즉 염색체 외부 물질로서 존재하는 벡터일 수 있고, 이의 복제는 염색체 복제와 무관하다(예를 들면, 플라스미드). 대안적으로, 벡터는 숙주 세포 내로 도입될 때 숙주 세포 게놈 내로 삽입되고 그 자신이 삽입된 염색체와 함께 복제되는 벡터일 수 있다.

벡터의 한 종류는 추가 DNA 분절이 결찰될 수 있는 원형 이중 가닥 DNA 루프를 지칭하는 "플라스미드"이다. 벡터의 또 다른 종류는 바이러스 벡터이고, 이때 추가 DNA 분절은 바이러스 게놈 내로 결찰될 수 있다. 일부 벡터들은 이들이 도입된 숙주 세포에서 자율적으로 복제할 수 있다(예를 들면, 세균 복제기점을 갖는 세균 벡터 및 에피좀 포유동물 벡터). 다른 벡터(예를 들면, 비-에피좀 포유동물 벡터)는 숙주 세포 내로의 도입 시 숙주 세포의 게놈 내로 삽입되어 숙주 게놈과 함께 복제된다. 더욱이, 일부 벡터들은 그들과 작동가능하게 연결된 유전자의 발현을 유도할 수 있다. 이러한 벡터들은 본원에서 "발현 벡터"로서 지칭된다. 일반적으로, 재조합 DNA 기법에서 유용한 발현 벡터는 종종 플라스미드의 형태로 존재한다. 플라스미드가 가장 흔히 사용되는 형태의 벡터이기 때문에 용어 "플라스미드" 및 "벡터"는 본원에서 상호교환적으로 사용될 수 있다. 그러나, 본 발명은 동등한 기능을 제공하는 다른 형태의 발현 벡터, 예컨대, 코스미드, 바이러스 벡터(예를 들면, 복제 결여 레트로바이러스, 아데노바이러스 및 아데노 관련 바이러스) 및 파지 벡터를 포함하기 위한 것이다.

본 발명에 따른 벡터는 예를 들면, RNA의 제조를 위해 시험관내에서 사용될 수 있거나, 숙주 세포를 형질감염시키거나 형질전환시키기 위해 사용될 수 있다.

본 발명의 벡터는 예를 들면, 과다발현을 위해 2개 이상, 예를 들면, 3개, 4개 또는 5개의 본 발명의 폴리뉴클레오티드를 포함할 수 있다.

본 발명의 재조합 발현 벡터는 숙주 세포에서의 핵산의 발현에 적합한 형태로 본 발명의 핵산을 포함하는데, 이것은 상기 재조합 발현 벡터가 발현될 핵산 서열에 작동가능하게 연결된 하나 이상의 조절 서열(발현을 위해 사용되는 숙주 세포에 근거하여 선택됨)을 포함한다는 것을 의미한다.

벡터, 예컨대, 발현 벡터 내에서 "작동가능하게 연결된"은 관심있는 뉴클레오티드 서열이 (예를 들면, 시험관내 전사/번역 시스템에서, 또는 벡터가 숙주 세포 내로 도입될 때 숙주 세포에서) 이 뉴클레오티드 서열의 발현을 허용하는 방식으로 조절 서열에 연결된다는 것을 의미하기 위한 것이다. 즉, 용어 "작동가능하게 연결된"은 기재된 성분들이 그들의 의도된 방식으로 작용할 수 있게 하는 관계로 존재하는 병치를 지칭한다. 코딩 서열에 "작동가능하게 연결된" 조절 서열, 예컨대, 프로모터, 인핸서 또는 다른 발현 조절 신호는 코딩 서열의 발현이 조절 서열과 상용가능한 조건 하에서 달성되거나, 서열들이 그들의 의도된 목적을 위해 협력하여 작용하도록, 예를 들면, 전사가 프로모터에서 시작되고 폴리펩티드를 코딩하는 DNA 서열을 통과하여 진행하도록 정렬되는 방식으로 위치한다.

따라서, 주어진 숙주 세포에 대한 벡터 또는 발현 구축물은 제1 발명의 폴리펩티드를 코딩하는 서열의 코딩 가닥을 기준으로 5' 말단부터 3' 말단까지 연속적인 순서로 서로 작동가능하게 연결된 하기 요소들을 포함할 수 있다: (1) 주어진 숙주 세포에서 폴리펩티드를 코딩하는 뉴클레오티드 서열의 전사를 유도할 수 있는 프로모터 서열; (2) 임의적으로, 주어진 숙주 세포로부터 배양 배지 내로 폴리펩티드의 분비를 유도할 수 있는 신호 서열; (3) 셀로바이오하이드롤라제 활성을 갖는 성숙, 바람직하게는 활성 형태의 폴리펩티드를 코딩하는 본 발명의 DNA 서열; 및 바람직하게는 (4) 폴리펩티드를 코딩하는 뉴클레오티드 서열의 다운스트림에서 전사를 종결할 수 있는 전사 종결 영역(종결요소).

본 발명에 따른 뉴클레오티드 서열의 다운스트림에는 하나 이상의 전사 종결 부위(예를 들면, 종결요소)를 함유하는 3' 비-번역 영역이 존재할 수 있다. 종결요소의 기원은 덜 중요하다. 종결요소는 예를 들면, 폴리펩티드를 코딩하는 DNA 서열에 대한 천연 종결요소일 수 있다. 그러나, 바람직하게는 효모 종결요소는 효모 숙주 세포에서 사용되고, 사상 진균 종결요소는 사상 진균 숙주 세포에서 사용된다. 보다 바람직하게는, 종결요소는 (폴리펩티드를 코딩하는 뉴클레오티드 서열이 발현될) 숙주 세포에 내재한다. 전사된 영역에는 번역을 위한 리보좀 결합 부위가 존재할 수 있다. 구축물에 의해 발현된 성숙 전사체의 코딩 부분은 번역될 폴리펩티드의 시작 부분에 위치하는 번역 시작 AUG 코돈, 및 번역될 폴리펩티드의 말단 부분에 적절하게 위치하는 종결 코돈을 포함할 것이다.

본 발명의 폴리뉴클레오티드의 향상된 발현은 발현 숙주로부터의 관심있는 단백질의 발현 및 원하는 경우 분비 수준을 증가시키는 데에 기여할 수 있고/있거나 본 발명의 폴리펩티드의 발현의 유도성 조절을 제공하는 데에 기여할 수 있는 이종 조절 영역, 예를 들면, 프로모터, 분비 리더 및/또는 종결요소 영역의 선택에 의해 달성될 수도 있다.

당업자는 발현 벡터의 디자인이 형질전환될 숙주 세포의 선택, 원하는 단백질의 발현 수준 등과 같은 요인에 의해 좌우될 수 있다는 것을 인식할 것이다. 본 발명의 벡터, 예컨대, 발현 벡터는 숙주 세포 내로 도입되어 본원에 기재된 핵산에 의해 코딩된 단백질 또는 펩티드(예를 들면, Temer09484 단백질, Temer09484 단백질의 돌연변이체 형태, 이의 단편, 변이체 또는 기능성 균등물)를 생성할 수 있다. 본 발명의 벡터, 예컨대, 재조합 발현 벡터는 원핵 세포 또는 진핵 세포에서 Temer09484 단백질을 발현하도록 디자인될 수 있다.

예를 들면, Temer09484 단백질은 세균 세포, 예컨대, 에스케리키아 콜라이, 곤충 세포(바큘로바이러스 발현 벡터를 사용함), 사상 진균, 효모 세포 또는 포유동물 세포에서 발현될 수 있다. 적합한 숙주 세포는 문헌(Goeddel, Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, CA (1990))에 더 논의되어 있다. 적절한 숙주의 대표적인 예는 이하에 기재되어 있다.

전술된 숙주 세포에 적합한 배양 배지 및 조건은 당분야에서 공지되어 있다.

재조합 발현 벡터는 예를 들면, T7 프로모터 조절 서열 및 T7 중합효소를 사용함으로써 시험관내에서 전사되고 번역될 수 있다.

대다수의 사상 진균들 및 효모들의 경우, 안정한 형질전환체를 수득하기 위해 벡터 또는 발현 구축물은 바람직하게는 숙주 세포의 게놈 내에 삽입된다. 그러나, 일부 효모들의 경우, 안정한 고수준 발현을 위해 발현 구축물이 도입될 수 있는 적합한 에피좀 벡터도 이용가능하고, 이의 예에는 각각 사카로마이세스(Saccharomyces) 및 클루이베로마이세스(Kluyveromyces)의 2μ 및 pKD1 플라스미드로부터 유도된 벡터, 또는 AMA 서열(예를 들면, 아스퍼길러스로부터의 AMA1)을 함유하는 벡터가 포함된다. 발현 구축물이 숙주 세포 게놈 내로 삽입되는 경우, 구축물은 게놈 내의 무작위 좌위에서 삽입되거나, 상동성 재조합의 이용을 통해 예정된 표적 좌위에서 삽입되고, 이 경우 표적 좌위는 바람직하게는 고도로 발현되는 유전자를 포함한다.

따라서, 본 발명에서 유용한 발현 벡터는 염색체로부터 유도된 벡터, 에피좀으로부터 유도된 벡터 및 바이러스로부터 유도된 벡터, 예를 들면, 세균 플라스미드, 박테리오파지, 효모 에피좀, 효모 염색체 요소, 바이러스, 예컨대, 바큘로바이러스, 파포바 바이러스, 백시니아 바이러스, 아데노바이러스, 계두 바이러스, 가성광견병 바이러스 및 레트로바이러스로부터 유도된 벡터, 및 이들의 조합물로부터 유도된 벡터, 예컨대, 플라스미드 및 박테리오파지 유전 요소로부터 유도된 벡터, 예컨대, 코스미드 및 파지미드를 포함한다.

본원에서 용어 "제어 서열" 또는 "조절 서열"은 적어도 폴리펩티드의 발현에 필요할 수 있고/있거나 유리할 수 있는 임의의 성분을 포함하는 것으로 정의된다. 임의의 조절 서열은 폴리펩티드를 코딩하는 본 발명의 핵산 서열에 대한 천연 또는 외래 조절 서열일 수 있다. 이러한 조절 서열은 프로모터, 리더, 최적 번역 개시 서열(문헌(Kozak, 1991, J. Biol. Chem. 266:19867-19870)에 기재됨), 분비 신호 서열, 전구펩티드 서열, 폴리아데닐화 서열 및 전사 종결요소를 포함할 수 있으나 이들로 한정되지 않는다. 최소한, 조절 서열은 전형적으로 프로모터, 및 전사 및 번역 정지 신호를 포함한다. 전술된 바와 같이, 본원에서 용어 "작동가능하게 연결된"은 조절 서열이 폴리펩티드의 생성을 유도하도록 DNA 서열의 코딩 서열을 기준으로 특정 위치에 적절하게 배치되어 있는 배열로서 정의된다.

조절 서열은 폴리펩티드를 코딩하는 핵산 서열의 코딩 영역과 조절 서열의 결찰을 용이하게 하는 특정 제한 부위를 도입할 목적으로 링커를 구비할 수 있다. 본원에서 용어 "작동가능하게 연결된"은 조절 서열이 폴리펩티드의 생성을 유도하도록 DNA 서열의 코딩 서열을 기준으로 특정 위치에 적절하게 배치되어 있는 배열로서 정의된다.

조절 서열은 핵산 서열의 발현을 위해 숙주 세포에 의해 인식되는 핵산 서열인 적절한 프로모터 서열일 수 있다. 프로모터 서열은 폴리펩티드의 발현을 매개하는 전사 조절 서열을 함유한다. 돌연변이체 프로모터, 절두된 프로모터 및 하이브리드 프로모터를 비롯한 프로모터는 세포에서 전사 활성을 보이는 임의의 핵산 서열일 수 있고, 세포에 대한 동종성 또는 이종성을 갖는 세포외 또는 세포내 폴리펩티드를 코딩하는 유전자로부터 수득될 수 있다.

본원에서 용어 "프로모터"는 RNA 중합효소에 결합하고 상기 중합효소가 생물학적 화합물을 코딩하는 핵산 서열의 정확한 다운스트림 전사 시작 부위로 향하여 전사를 시작하게 하는 DNA 서열로서 정의된다. RNA 중합효소는 코딩 영역의 적절한 DNA 가닥에 상보적인 메신저 RNA의 조립을 효율적으로 촉진한다. 용어 "프로모터"는 mRNA로의 전사 후 번역을 위한 (프로모터와 번역 시작 부위 사이의) 5' 비-코딩 영역, 시스-작용 전사 조절 요소, 예컨대, 인핸서, 및 전사 인자와 상호작용할 수 있는 다른 뉴클레오티드 서열을 포함하는 것으로도 이해될 것이다. 프로모터는 전사 활성을 보이는, 진핵 또는 원핵 숙주 세포에 적합한 임의의 적절한 프로모터 서열(돌연변이체 프로모터, 절두된 프로모터 및 하이브리드 프로모터를 포함함)일 수 있고, 세포에 대한 동종(천연) 또는 이종(외래) 세포외 또는 세포내 폴리펩티드를 코딩하는 폴리뉴클레오티드로부터 수득될 수 있다. 프로모터는 항시성 또는 유도성 프로모터일 수 있다.

바람직하게는, 프로모터는 유도성 프로모터이다. 보다 바람직하게는, 프로모터는 탄수화물 유도성 프로모터이다. 바람직하게 사용되는 탄수화물 유도성 프로모터는 전분 유도성 프로모터(즉, 전분, 또는 이의 단량체, 이량체 또는 올리고머에 의해 유도될 수 있는 프로모터, 예를 들면, 말토스 유도성 프로모터, 이소말토스 유도성 프로모터), 셀룰로스 유도성 프로모터(즉, 셀룰로스, 또는 이의 단량체, 이량체 및/또는 올리고머에 의해 유도될 수 있는 프로모터, 예를 들면, 셀로바이오스 유도성 프로모터, 소포로스 유도성 프로모터), 헤미셀룰로스 유도성 프로모터(즉, 헤미셀룰로스, 또는 이의 단량체, 이량체 및/또는 올리고머에 의해 유도될 수 있는 프로모터, 예를 들면, 자일란 유도성 프로모터, 아라바이오노스 유도성 프로모터, 자일로스 유도성 프로모터), 펙틴 유도성 프로모터(즉, 펙틴, 또는 이의 단량체, 이량체 및/또는 올리고머에 의해 유도될 수 있는 프로모터, 예를 들면, 갈락투론산 유도성 프로모터, 람노스 유도성 프로모터), 아라비난 유도성 프로모터(즉, 아라비난, 또는 이의 단량체, 이량체 및/또는 올리고머에 의해 유도될 수 있는 프로모터, 예를 들면, 아라비노스 유도성 프로모터), 글루코스 유도성 프로모터, 락토스 유도성 프로모터, 및 갈락토스 유도성 프로모터로부터 선택된다. 다른 유도성 프로모터는 구리 유도성 프로모터 및 올레산 유도성 프로모터이다.

사상 진균에 적합한 프로모터는 아스퍼길러스 오리자(A. oryzae) TAKA 아밀라제, 리조뮤코르 미에헤이(Rhizomucor miehei) 아스파르트산 프로테이나제, 아스퍼길러스 gpdA 프로모터, 아스퍼길러스 니게르 중성 α-아밀라제, 아스퍼길러스 니게르 산 안정성 α-아밀라제, 아스퍼길러스 니게르 또는 아스퍼길러스 아와모리(A. awamori) 글루코아밀라제(glaA), 아스퍼길러스 니게르 또는 아스퍼길러스 아와모리 엔도-자일라나제(xlnA) 또는 β-자일로시다제(xlnD), 트라이코데르마 리세이(T. reesei) 셀로바이오하이드롤라제 I(CBHI), 리조뮤코르 미에헤이 리파제, 아스퍼길러스 오리자 알칼리성 프로테아제, 아스퍼길러스 오리자 트라이오스 포스페이트 이소머라제, 아스퍼길러스 니둘란스 아세트아미다제, 푸사리움 베네나툼(Fusarium venenatum) 아밀로글루코시다제(국제 특허출원 공개 제WO2000/56900호), 푸사리움 베네나툼 다니아(Dania)(국제 특허출원 공개 제WO2000/56900호), 푸사리움 베네나툼 퀴인(Quinn)(국제 특허출원 공개 제WO2000/56900호), 푸사리움 옥시스포룸(Fusarium oxysporum) 트립신 유사 프로테아제(국제 특허출원 공개 제WO1996/00787호), 트라이코데르마 리세이 β-글루코시다제, 트라이코데르마 리세이 셀로바이오하이드롤라제 I, 트라이코데르마 리세이 셀로바이오하이드롤라제 II, 트라이코데르마 리세이 엔도-글루카나제 I, 트라이코데르마 리세이 엔도-글루카나제 II, 트라이코데르마 리세이 엔도-글루카나제 III, 트라이코데르마 리세이 엔도-글루카나제 IV, 트라이코데르마 리세이 엔도-글루카나제 V, 트라이코데르마 리세이 자일라나제 I, 트라이코데르마 리세이 자일라나제 II 또는 트라이코데르마 리세이 β-자일로시다제를 코딩하는 폴리뉴클레오티드로부터 수득된 프로모터뿐만 아니라, NA2-tpi 프로모터(아스퍼길러스 니게르 중성 α-아밀라제 및 아스퍼길러스 오리자 트라이오스 포스페이트 이소머라제를 코딩하는 폴리뉴클레오티드로부터 수득된 프로모터들의 하이브리드), 및 이들의 돌연변이체 프로모터, 절두된 프로모터 및 하이브리드 프로모터도 포함하나 이들로 한정되지 않는 군으로부터 선택될 수 있는 프로모터이다. 프로모터의 다른 예는 본원에 참고로 도입되는 국제 특허출원 공개 제WO2006/092396호 및 제WO2005/100573호에 기재된 프로모터이다. 프로모터의 사용의 다른 예는 국제 특허출원 공개 제WO2008/098933호에 기재되어 있다. 사상 진균에서 사용될 수 있는 바람직한 탄수화물 유도성 프로모터는 아스퍼길러스 오리자 TAKA 아밀라제, 아스퍼길러스 니게르 중성 α-아밀라제, 아스퍼길러스 니게르 산 안정성 α-아밀라제, 아스퍼길러스 니게르 또는 아스퍼길러스 아와모리 글루코아밀라제(glaA), 아스퍼길러스 니게르 또는 아스퍼길러스 아와모리 엔도-자일라나제(xlnA) 또는 β-자일로시다제(xlnD), 트라이코데르마 리세이 β-글루코시다제, 트라이코데르마 리세이 셀로바이오하이드롤라제 I, 트라이코데르마 리세이 셀로바이오하이드롤라제 II, 트라이코데르마 리세이 엔도-글루카나제 I, 트라이코데르마 리세이 엔도-글루카나제 II, 트라이코데르마 리세이 엔도-글루카나제 III, 트라이코데르마 리세이 엔도-글루카나제 IV, 트라이코데르마 리세이 엔도-글루카나제 V, 트라이코데르마 리세이 자일라나제 I, 트라이코데르마 리세이 자일라나제 II, 트라이코데르마 리세이 β-자일로시다제, 및 상기 정의된 NA2-tpi 프로모터(아스퍼길러스 니게르 중성 α-아밀라제 및 아스퍼길러스 오리자 트라이오스 포스페이트 이소머라제를 코딩하는 폴리뉴클레오티드로부터 수득된 프로모터들의 하이브리드)이다.

그람 양성 미생물로부터 유래된 이러한 프로모터의 예에는 gnt(글루코네이트 오페론 프로모터); 바실러스 리체니포르미스(Bacillus licheniformis)로부터의 penP; glnA(글루타민 신쎄타제(synthetase)); xylAB(자일로스 오페론); araABD(L-아라비노스 오페론 및 Pspac 프로모터; 및 유도제, 예컨대, 이소프로필-β-D-티오갈락토피라노사이드[IPTG]에 의해 조절될 수 있는 하이브리드 SPO1/lac 프로모터가 포함되나 이들로 한정되지 않는다(Yansura D.G., Henner D.J. Proc Natl Acad Sci U S A. 1984 81(2):439-443). (i) 활성화제는 프로모터 활성을 유도하는 서열 특이적 DNA 결합 단백질이다. 그람 양성 미생물로부터 유래된 이러한 프로모터의 예에는 2-성분 시스템((PhoP-PhoR, DegU-DegS, Spo0A-Phosphorelay), LevR, Mry 및 GltC가 포함되나 이들로 한정되지 않는다. (ii) 이차 시그마 인자의 생성은 주로 특정 프로모터로부터의 전사를 책임질 수 있다. 그람 양성 미생물로부터의 예에는 하기 포자형성 특이적 시그마 인자들에 의해 활성화되는 프로모터들이 포함되나 이들로 한정되지 않는다: σF, σE, σG 및 σK, 및 일반적인 스트레스 시그마 인자인 σB. σB 매개 반응은 에너지 제한 및 환경 스트레스에 의해 유도된다(Hecker M, Volker U. Mol Microbiol. 1998; 29(5):1129-1136). (iii) 약화(Attenuation) 및 항종결(antitermination)도 전사를 조절한다. 그람 양성 미생물로부터의 예에는 trp 오페론 및 sacB 유전자가 포함되나 이들로 한정되지 않는다. (iv) 발현 벡터 내의 다른 조절 프로모터는 수크로스 유도성을 부여하는 sacR 조절 시스템에 근거한다(Klier AF, Rapoport G. Annu Rev Microbiol. 1988;42:65-95).

세균, 예컨대, 바실러스에서 유용한 적합한 유도성 프로모터는 그람 양성 미생물로부터 유래된 프로모터, 예컨대, SP01-26, SP01-15, veg, pyc(피루베이트 카복실라제 프로모터) 및 amyE(그러나 이들로 한정되지 않음)를 포함한다. 그람 음성 미생물로부터 유래된 프로모터의 예에는 tac, tet, trp-tet, lpp, lac, lpp-lac, lacIq, T7, T5, T3, gal, trc, ara, SP6, λ-PR 및 λ-PL이 포함되나 이들로 한정되지 않는다.

세균 세포, 예컨대, 바실러스에서 유용한 프로모터의 추가 예에는 α-아밀라제 및 SPo2 프로모터뿐만 아니라 세포외 프로테아제 유전자로부터의 프로모터도 포함된다.

적합한 프로모터의 또 다른 예는 에스케리키아 콜라이 lac 오페론으로부터 수득된 프로모터이다. 또 다른 예는 스트렙토마이세스 코엘리칼라(Streptomyces coelicolor) 아가라제(agarase) 유전자(dagA)의 프로모터이다. 또 다른 예는 바실러스 렌터스(Bacillus lentus) 알칼리성 프로테아제 유전자(aprH)의 프로모터이다. 또 다른 예는 바실러스 리체니포르미스(Bacillus licheniformis) 알칼리성 프로테아제 유전자(서브틸리신 칼스버그(subtilisin Carlsberg) 유전자)의 프로모터이다. 또 다른 예는 바실러스 서브틸리스(Bacillus subtilis) 레반수크라제(levansucrase) 유전자(sacB)의 프로모터이다. 또 다른 예는 바실러스 서브틸리스 α-아밀라제 유전자(amyF)의 프로모터이다. 또 다른 예는 바실러스 리체니포르미스 α-아밀라제 유전자(amyL)의 프로모터이다. 또 다른 예는 바실러스 스테아로써모필러스(Bacillus stearothermophilus) 말토스생성 아밀라제 유전자(amyM)의 프로모터이다. 또 다른 예는 바실러스 아밀로리퀘파시엔스(Bacillus amyloliquefaciens) α-아밀라제 유전자(amyQ)의 프로모터이다. 또 다른 예는 "-35" 영역에 대해 서열 TTGACA 및 "-10" 영역에 대해 TATAAT를 갖는 "컨센서스" 프로모터이다. 또 다른 예는 바실러스 리체니포르미스 페니실리나제(penicillinase) 유전자(penP)의 프로모터이다. 또 다른 예는 바실러스 서브틸리스 xylA 및 xylB 유전자의 프로모터이다.

바람직하게는, 프로모터 서열은 고도로 발현되는 유전자의 프로모터 서열이다. 프로모터가 선택될 수 있고/있거나 발현 구축물의 삽입을 위해 바람직한 예정된 표적 좌위에 포함되는 바람직한 고도로 발현되는 유전자의 예에는 해당 효소, 예컨대, 트라이오스 포스페이트 이소머라제(TPI), 글리세르알데하이드 포스페이트 데하이드로게나제(GAPDH), 포스포글리세레이트 키나제(PGK), 피루베이트 키나제(PYK 또는 PKI) 및 알코올 데하이드로게나제(ADH)를 코딩하는 유전자뿐만 아니라, 아밀라제, 글루코아밀라제, 프로테아제, 자일라나제, 셀로바이오하이드롤라제, β-갈락토시다제 및 알코올(메탄올) 옥시다제, 연장 인자 및 리보좀 단백질을 코딩하는 유전자도 포함되나 이들로 한정되지 않는다. 적합한 고도로 발현되는 유전자의 구체적인 예에는 예를 들면, 클루이베로마이세스 종으로부터의 LAC4 유전자, 한세눌라(Hansenula) 및 피키아(Pichia)로부터의 메탄올 옥시다제 유전자(각각 AOX 및 MOX), 아스퍼길러스 니게르 및 아스퍼길러스 아와모리로부터의 글루코아밀라제(glaA) 유전자, 아스퍼길러스 오리자 TAKA-아밀라제 유전자, 아스퍼길러스 니둘란스 gpdA 유전자 및 트라이코데르마 리세이 셀로바이오하이드롤라제 유전자가 포함된다.

효모에서 사용될 수 있는 프로모터는 예를 들면, 해당효소 유전자로부터의 프로모터, 예컨대, 효모 또는 사상 진균으로부터의 포스포프럭토키나제(PFK), 트라이오스 포스페이트 이소머라제(TPI), 글리세르알데하이드-3-포스페이트 데하이드로게나제(GPD, TDH3 또는 GAPDH), 피루베이트 키나제(PYK) 및 포스포글리세레이트 키나제(PGK) 프로모터를 포함하고; 효모로부터의 이러한 프로모터에 대한 보다 더 상세한 설명은 국제 특허출원 공개 제WO1993/03159호에서 발견될 수 있다. 다른 유용한 프로모터는 리보좀 단백질 코딩 유전자 프로모터, 락타제 유전자 프로모터(LAC4), 알코올 데하이드로게나제 프로모터(ADH1, ADH4 등), 및 에놀라제(enolase) 프로모터(ENO)이다. 다른 항시성 프로모터 및 유도성 프로모터, 및 인핸서 또는 업스트림 활성화 서열은 당업자에게 공지되어 있을 것이다. 본 발명의 숙주 세포에서 사용되는 프로모터는 원하는 경우 그의 조절 특성에 영향을 미치도록 변경될 수 있다. 이와 관련하여 적합한 프로모터는 당업자에게 잘 공지되어 있는 항시성 천연 프로모터 및 유도성 천연 프로모터 둘다뿐만 아니라 조작된 프로모터도 포함한다. 진핵 숙주 세포에서 적합한 프로모터는 GAL7, GAL10, GAL1, CYC1, HIS3, ADH1, PGL, PH05, GAPDH, ADC1, TRP1, URA3, LEU2, ENO1, TPI1 및 AOX1일 수 있다. 다른 적합한 프로모터는 PDC1, GPD1, PGK1, TEF1 및 TDH3을 포함한다. 사용될 수 있는 탄수화물 유도성 프로모터의 예는 GAL 프로모터, 예컨대, GAL1 또는 GAL10 프로모터이다.

전술된 프로모터들 전부가 당분야에서 용이하게 입수될 수 있다.

고등 진핵생물에 의한 본 발명의 폴리펩티드를 코딩하는 DNA의 전사는 인핸서 서열을 벡터 내로 삽입함으로써 증가될 수 있다. 인핸서는 주어진 종류의 숙주 세포에서 프로모터의 전사 활성을 증가시키는 작용을 하는, 통상적으로 약 10 bp 내지 300 bp의 시스-작용 DNA 요소이다. 인핸서의 예에는 100 bp 내지 270 bp에서 복제기점의 뒤쪽에 위치하는 SV40 인핸서, 사이토메갈로바이러스 초기 프로모터 인핸서, 복제기점의 뒤쪽에 위치하는 폴리오마 인핸서 및 아데노바이러스 인핸서가 포함된다.

조절 서열은 사상 진균 세포에 의해 인식되어 전사를 종결하는 서열인 적합한 전사 종결요소 서열일 수도 있다. 종결요소 서열은 폴리펩티드를 코딩하는 핵산 서열의 3' 말단에 작동가능하게 연결된다. 세포에서 작용하는 임의의 종결요소가 본 발명에서 사용될 수 있다.

조절 서열은 종결요소일 수도 있다. 사상 진균 세포에 바람직한 종결요소는 아스퍼길러스 오리자 TAKA 아밀라제, 아스퍼길러스 니게르 글루코아밀라제(glaA), 아스퍼길러스 니둘란스 안쓰라닐레이트 신타제, 아스퍼길러스 니게르 α-글루코시다제, trpC 유전자 및 푸사리움 옥시스포룸 트립신 유사 프로테아제를 코딩하는 유전자로부터 수득된다.

조절 서열은 사상 진균 세포에 의해 번역에 중요한 mRNA의 비-번역된 영역인 적합한 리더 서열도 포함할 수 있다. 리더 서열은 폴리펩티드를 코딩하는 핵산 서열의 5' 말단에 작동가능하게 연결된다. 세포에서 작용하는 임의의 리더 서열은 본 발명에서 사용될 수 있다. 사상 진균 세포에 바람직한 리더는 아스퍼길러스 오리자 TAKA 아밀라제, 아스퍼길러스 니둘란스 트라이오스 포스페이트 이소머라제 및 아스퍼길러스 니게르 glaA를 코딩하는 유전자로부터 수득된다. 다른 바람직한 서열은 국제 특허출원 공개 제WO2006/077258호에서 단리되어 있고/있거나 개시되어 있다.

다른 조절 서열은 페니실리움 IPNS 유전자, pcbC 유전자 또는 β 튜불린 유전자로부터 단리될 수 있다. 국제 특허출원 공개 제WO2001/21779호에서 언급된 모든 조절 서열들이 본원에 참고로 도입된다.

조절 서열은 핵산 서열의 3' 말단에 작동가능하게 연결되고 전사될 때 폴리아데노신 잔기를 전사된 mRNA에 추가하는 신호로서 사상 진균 세포에 의해 인식되는 서열인 폴리아데닐화 서열일 수도 있다. 세포에서 작용하는 임의의 폴리아데닐화 서열이 본 발명에서 사용될 수 있다. 사상 진균 세포에 바람직한 폴리아데닐화 서열은 아스퍼길러스 오리자 TAKA 아밀라제, 아스퍼길러스 니게르 글루코아밀라제, 아스퍼길러스 니둘란스 안쓰라닐레이트 신타제, 푸사리움 옥시스포룸 트립신 유사 프로테아제 및 아스퍼길러스 니게르 α-글루코시다제를 코딩하는 유전자로부터 수득된다.

본 발명에 따른 폴리펩티드가 숙주 세포로부터 배양 배지 내로 분비되어야 할 때, 새로 합성된 폴리펩티드가 숙주 세포의 분비 경로로 향하게 하기 위해 적절한 신호 서열이 폴리펩티드에 추가될 수 있다. 당업자는 특정 숙주에 적합한 신호 서열을 선택해야 하는 것을 인식하고 있다. 신호 서열은 숙주 세포에 대한 천연 신호 서열일 수 있거나, 숙주 세포에 대한 외래 신호 서열일 수 있다. 한 예로서, 숙주 세포에 대한 천연 단백질로부터의 신호 서열이 사용될 수 있다. 바람직하게는, 상기 천연 단백질은 고도로 분비되는 단백질, 즉 분비되는 단백질의 총량의 10%보다 더 높은 양으로 분비되는 단백질이다. 본 발명에 따라 바람직하게 사용되는 신호 서열은 예를 들면, pmeA이다.

신호 서열에 대한 대체물로서, 본 발명의 폴리펩티드는 분비되는 담체 단백질 또는 이의 일부에 융합될 수 있다. 이러한 키메라 구축물은 상기 담체 단백질의 신호 서열 또는 이의 일부에 의해 분비 경로로 향한다. 또한, 담체 단백질은 본 발명에 따른 폴리펩티드에게 안정화 효과를 제공할 것이고/것이거나 가용성을 향상시킬 수 있다. 이러한 담체 단백질은 임의의 단백질일 수 있다. 바람직하게는, 고도로 분비되는 단백질은 담체 단백질로서 사용된다. 담체 단백질은 본 발명에 따른 폴리펩티드에 대한 천연 또는 외래 담체 단백질일 수 있다. 담체 단백질은 숙주 세포에 대한 천연 또는 외래 담체 단백질일 수 있다. 이러한 담체 단백질의 예는 글루코아밀라제, α-교배 인자의 예비전구 서열, 클로스트리듐 셀룰로보란스(Clostridium cellulovorans) 셀룰로스 결합 단백질 A의 셀룰로스 결합 도메인, 글루타티온 S-트랜스퍼라제, 바실러스 서큘란스(Bacillus circulans) 키티나제(chitinase) A1의 키틴 결합 도메인, 에스케리키아 콜라이 K12의 malE 유전자에 의해 코딩된 말토스 결합 도메인, β-갈락토시다제 및 알칼리성 포스파타제이다. 아스퍼길러스 세포에서의 이러한 키메라 구축물의 발현에 바람직한 담체 단백질은 글루코아밀라제이다. 담체 단백질 및 본 발명에 따른 폴리펩티드는 폴리펩티드의 단리를 용이하게 하기 위한 특정 아미노산 모티프를 함유할 수 있고; 본 발명에 따른 폴리펩티드는 특별한 방출제에 의해 방출될 수 있다. 방출제는 단백질용해 효소 또는 화학 물질일 수 있다. 이러한 아미노산 모티프의 한 예는 당업자에게 잘 공지되어 있는 KEX 프로테아제 절단 부위이다.

신호 서열은 본 발명의 단백질 또는 폴리펩티드의 분비 및 단리를 용이하게 하기 위해 사용될 수 있다. 신호 서열은 전형적으로 하나 이상의 절단 사건에서 분비 동안 성숙 단백질로부터 일반적으로 절단되는 소수성 아미노산의 코어를 특징으로 한다. 이러한 신호 펩티드는 이것이 분비 경로를 통과할 때 성숙 단백질로부터의 신호 서열의 절단을 허용하는 프로세싱 부위를 함유한다. 신호 서열은 예컨대, 발현 벡터로 형질전환된 진핵 숙주로부터의 단백질의 분비를 유도하고, 신호 서열은 후속적으로 또는 동시에 절단된다. 그 다음, 단백질은 공지되어 있는 방법에 의해 세포외 매질로부터 용이하게 정제될 수 있다. 대안적으로, 신호 서열은 정제를 용이하게 하는 서열, 예컨대, GST 도메인의 사용을 통해 관심있는 단백질에 연결될 수 있다. 따라서, 예를 들면, 폴리펩티드를 코딩하는 서열은 마커 서열, 예컨대, 융합된 폴리펩티드의 정제를 용이하게 하는 펩티드를 코딩하는 서열에 융합될 수 있다. 본 발명의 이 양태의 일부 바람직한 실시양태에서, 마커 서열은 헥사-히스티딘 펩티드, 예컨대, pQE 벡터(퀴아젠 인코포레이티드(Qiagen, Inc.)) 내에 제공된 태그이고, 특히 이들 중 대다수는 상업저으로 입수가능하다. 문헌(Gentz et al., Proc. Natl. Acad. Sci. USA 86: 821-824(1989))에 기재된 바와 같이, 예를 들면, 헥사-히스티딘은 융합 단백질의 편리한 정제를 제공한다. HA 태그는 예를 들면, 문헌(Wilson et al., Cell 37:767 (1984))에 기재되어 있는 인플루엔자 헤마글루티닌(hemaglutinin) 단백질로부터 유래된 에피토프에 상응하는, 정제에 유용한 또 다른 펩티드이다.

바람직하게는, 본 발명의 Temer09484 융합 단백질은 표준 재조합 DNA 기법에 의해 제조된다. 예를 들면, 상이한 폴리펩티드 서열들을 코딩하는 DNA 단편들은 보편적인 기법에 따라, 예를 들면, 결찰을 위한 블런트(blunt)-종결 또는 스태거(stagger)-종결 말단, 적절한 말단을 제공하기 위한 제한효소 분해, 적절한 경우 점착(cohesive) 말단들의 충전, 바람직하지 않은 연결을 피하기 위한 알칼리성 포스파타제(phosphatase) 처리 및 효소에 의한 결찰을 이용함으로써 인-프레임(in-frame)으로 함께 결찰된다. 또 다른 실시양태에서, 융합 유전자는 자동 DNA 합성기를 비롯한 보편적인 기법에 의해 합성될 수 있다. 대안적으로, 유전자 단편의 PCR 증폭은 후속적으로 어닐링되고 재증폭되어 키메라 유전자 서열을 생성할 수 있는 2개의 연속 유전자 단편들 사이에 상보적 돌출부(overhangs)를 발생시키는 앵커(anchor) 프라이머를 사용함으로써 수행될 수 있다(예를 들면, 문헌(Current Protocols in Molecular Biology, eds. Ausubel et al. John Wiley & Sons: 1992) 참조). 나아가, 융합 모이어티(예를 들면, GST 폴리펩티드)를 이미 코딩하는 많은 발현 벡터들이 상업적으로 입수가능하다. Temer09484 코딩 핵산은 융합 모이어티가 Temer09484 단백질에 인-프레임으로 연결되도록 이러한 발현 벡터 내로 클로닝될 수 있다.

(과다)발현

바람직한 실시양태에서, 본원에 기재된 본 발명의 폴리뉴클레오티드는 이 유전자가 과다발현되지 않는 모 미생물 균주에 비해 본 발명의 미생물 균주에서 과다발현될 수 있다. 본원에서 폴리뉴클레오티드 서열의 과다발현은 미생물 균주에서 상기 서열에 의해 코딩된 효소의 활성이 모 미생물에서의 상기 효소의 활성의 약 1.5배 이상이 되게 하는 상기 서열 유전자의 발현으로서 정의되고; 바람직하게는 상기 효소의 활성은 모 미생물에서의 상기 효소의 활성의 약 2배 이상, 보다 바람직하게는 약 3배 이상, 보다 바람직하게는 약 4배 이상, 보다 바람직하게는 약 5배 이상, 훨씬 더 바람직하게는 약 10배 이상, 가장 바람직하게는 약 20배 이상이다.

벡터는 진핵생물 게놈 서열 또는 바이러스 게놈 서열에 대한 상동성을 갖는 서열을 포함하는 RNA를 생성하는 폴리뉴클레오티드를 플랭킹하는 서열을 추가로 포함할 수 있다. 이것은 본 발명의 폴리뉴클레오티드가 숙주 세포의 게놈 내로 도입될 수 있게 할 것이다.

삽입 클로닝 벡터는 그 자신이 삽입되는 숙주 세포의 염색체 내의 무작위 좌위 또는 예정된 표적 좌위에서 삽입될 수 있다. 본 발명의 바람직한 실시양태에서, 삽입 클로닝 벡터는 예정된 좌위에서의 클로닝 벡터의 삽입을 표적화하기 위해 숙주 세포의 게놈 내의 예정된 표적 좌위에 있는 DNA 서열에 대한 상동성을 갖는 DNA 단편을 포함할 수 있다. 표적화된 삽입을 촉진하기 위해, 클로닝 벡터는 바람직하게는 숙주 세포의 형질전환 전에 선형화될 수 있다. 선형화는 바람직하게는 클로닝 벡터의 하나 이상의 말단, 바람직하게는 어느 한 말단이 표적 좌위에 대한 상동성을 갖는 서열에 의해 플랭킹되도록 수행될 수 있다. 표적 좌위를 플랭킹하는 상동성 서열의 길이는 바람직하게는 약 0.1 kb 이상, 예컨대, 약 0.2 kb 이상, 보다 바람직하게는 약 0.5 kb 이상, 훨씬 더 바람직하게는 약 1 kb 이상, 가장 바람직하게는 약 2 kb 이상이다. 바람직하게는, 모 숙주 균주는 국제 특허출원 공개 제WO2005/095624호 및/또는 국제 특허출원 공개 제WO2007/115886호에 기재된 바와 같이 표적화된 DNA 삽입의 개선된 빈도를 위해 변경될 수 있다.

본 발명에서 제공된 결실 예는 프로모터와 유전자 사이에 선택 마커를 삽입하여 유전자 전사를 방해하기(즉, 기능적으로 불활성화시키기) 위해 유전자의 프로모터를 5'-플랭크로서 사용하고 유전자를 3'-플랭크로서 사용한다. 상기 제공된 유전자 서열은 유사한 기능적으로 불활성화된 유전자를 제조하는 데에 사용될 수 있다. 유전자는 2개로 분할되어 5'-플랭크 및 3'-플랭크를 생성할 수 있으나, 유전자는 5'-플랭크 및 3'-플랭크로서 작용할 수 있는, 유전자의 프로모터 및 종결요소 영역을 함유하는 보다 더 큰 게놈 DNA 조각을 클로닝하는 데에 사용될 수도 있다.

벡터 시스템은 단일 벡터, 예컨대, 단일 플라스미드일 수 있거나, 숙주 세포의 게놈 내로 도입될 전체 DNA를 함께 함유하는 2개 이상의 벡터, 예컨대, 2개 이상의 플라스미드일 수 있다.

벡터는 안티센스 RNA의 생성을 제공하도록 안티센스 방향으로 배향된 본 발명의 폴리뉴클레오티드를 함유할 수 있다.

벡터 DNA는 보편적인 형질전환 또는 형질감염 기법을 통해 원핵 세포 또는 진핵 세포 내로 도입될 수 있다. 본원에서 사용된 바와 같이, 용어 "형질전환" 및 "형질감염"은 칼슘 포스페이트 또는 칼슘 클로라이드 공-침전, DEAE-덱스트란 매개 형질감염, 형질도입, 감염, 지질감염, 양이온성 지질 매개 형질감염 또는 전기천공을 비롯한, 외래 핵산(예를 들면, DNA)을 숙주 세포 내로 도입하는 당분야에서 인정된 다양한 기법들을 지칭하기 위한 것이다. 숙주 세포를 형질전환시키거나 형질감염시키는 적합한 방법은 문헌(Sambrook, et al., Molecular Cloning: A Laboratory Manual, 2nd,ed. Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989), 문헌(Davis et al., Basic Methods in Molecular Biology (1986)) 및 다른 실험실 매뉴얼에서 발견될 수 있다.

당업자는 세포를 하나 이상의 발현 카세트 및 선택 마커로 형질전환시키는 방법을 알고 있다. 예를 들면, 당업자는 하나 이상의 발현 벡터를 사용할 수 있고, 이때 하나 이상의 클로닝 벡터는 발현 카세트 및 선택 마커를 포함한다.

돌연변이체 미생물 숙주 세포의 형질전환은 예를 들면, 전기천공 방법, 입자 충격 또는 미립자가속장치(microprojectile) 충격, 프로토플라스트(protoplast) 방법 및 아그로박테리움(Agrobacterium) 매개 형질전환(AMT)을 비롯한 임의의 적합한 공지되어 있는 방법에 의해 수행될 수 있다. 바람직하게는, 프로토플라스트 방법이 이용된다. 형질전환을 위한 절차는 문헌(J.R.S. Fincham, Transformation in fungi. 1989, Microbiological reviews. 53, 148-170)에 기재되어 있다.

형질전환은 프로토플라스트 형성, 프로토플라스트의 형질전환 및 그 자체로 공지되어 있는 방식에 의한 세포벽의 재생으로 구성된 과정을 포함할 수 있다. 아스퍼길러스 세포의 형질전환에 적합한 절차는 유럽 특허 제238 023호 및 문헌(Yelton et al., 1984, Proceedings of the National Academy of Sciences USA 81:1470-1474)에 기재되어 있다. 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens)를 사용하는 아스퍼길러스 및 다른 사상 진균 숙주 세포의 형질전환에 적합한 절차는 예를 들면, 문헌(De Groot et al., Agrobacterium tumefaciens-mediated transformation of filamentous fungi. Nat Biotechnol. 1998, 16:839-842. Erratum in: Nat Biotechnol 1998 16:1074)에 기재되어 있다. 푸사리움 종을 형질전환시키는 적합한 방법은 문헌(Malardier et al., 1989, Gene 78:147-156) 또는 국제 특허출원 공개 제WO1996/00787호에 기재되어 있다. 다른 방법, 예컨대, 문헌(Christiansen et al., Biolistic transformation of the obligate plant pathogenic fungus, Erysiphe graminis f.sp. hordei. 1995, Curr Genet. 29:100-102)에 기재된 바이올리스틱(biolistic) 형질전환을 이용하는 방법이 적용될 수 있다. 효모는 문헌(Becker and Guarente, In Abelson, J. N. and Simon, M. I., editors, Guide to Yeast Genetics and Molecular Biology, Methods in Enzymology, Volume 194, pp 182-187, Academic Press, Inc., New York); 문헌(Ito et al., 1983, Journal of Bacteriology 153: 163); 및 문헌(Hinnen et al., 1978, Proceedings of the National Academy of Sciences USA 75: 1920)에 기재된 절차를 이용함으로써 형질전환될 수 있다.

돌연변이된 미생물 숙주 세포에서 관심있는 화합물을 코딩하거나 세포에 의한 관심있는 화합물의 생성에 관여하는 화합물을 코딩하는 폴리뉴클레오티드(유전자)의 카피의 양을 향상시키기 위해, 숙주 세포의 다회 형질전환이 요구될 수 있다. 이 방식으로, 숙주 세포에 의해 생성되는 상이한 효소들의 비가 영향을 받을 수 있다. 또한, 발현 벡터는 형질전환될 폴리뉴클레오티드의 카피의 양을 증가시키기 위해 다수의 발현 카세트를 포함할 수 있다.

또 다른 방법은 선택에 따라 원하는 폴리펩티드의 보다 더 높은 또는 보다 더 낮은 생성을 야기할 수 있는, 상이한 폴리뉴클레오티드들에 대한 상이한 조절 서열들을 선택하는 것일 수 있다.

선택 마커로 형질전환된 세포는 선택 마커의 존재에 근거하여 선택될 수 있다. (아스퍼길러스) 세포의 형질전환의 경우, 통상적으로 세포가 동시에 모든 핵산 물질로 형질전환되는 경우, 선택 마커가 존재할 때 원하는 폴리펩티드를 코딩하는 폴리뉴클레오티드도 존재한다.

포유동물 세포의 안정한 형질감염의 경우, 이용되는 발현 벡터 및 형질감염 기법에 따라 단지 극소량의 세포가 외래 DNA를 그의 게놈 내로 삽입할 수 있다는 것은 공지되어 있다. 이 삽입체를 확인하고 선택하기 위해, 선택 마커(예를 들면, 항생제에 대한 내성)를 코딩하는 유전자를 일반적으로 관심있는 유전자와 함께 숙주 세포 내로 도입한다. 바람직한 선택 마커는 약물에 대한 내성을 부여하거나 숙주 세포에서 결함을 보완하는 선택 마커들을 포함하나 이들로 한정되지 않는다. 이러한 선택 마커는 예를 들면, 대다수의 사상 진균 및 효모의 형질전환에 사용될 수 있는 다재다능한 마커 유전자, 예컨대, 아세트아미다제 유전자 또는 cDNA(아스퍼길러스 니둘란스, 아스퍼길러스 오리자 또는 아스퍼길러스 니게르로부터의 amdS, niaD, facA 유전자 또는 cDNA); 또는 항생제에 대한 내성, 예컨대, G418, 하이그로마이신, 블레오마이신, 카나마이신, 메토트렉세이트 또는 플레오마이신 오르베노밀(phleomycin orbenomyl)(benA) 내성을 제공하는 유전자를 포함한다. 대안적으로, 특정 선택 마커, 예컨대, 상응하는 돌연변이체 숙주 균주를 요구하는 영양요구성 마커, 예를 들면, (사카로마이세스 세레비지애(S. cerevisiae)로부터의) URA3(또는 다른 효모의 유사한 유전자), (아스퍼길러스 니둘란스 또는 아스퍼길러스 니게르부터의) pyrG 또는 pyrA, (아스퍼길러스 니둘란스 또는 아스퍼길러스 니게르부터의) argB, 또는 trpC가 사용될 수 있다. 바람직한 실시양태에서, 선택 마커는 선택 마커 유전자를 갖지 않는 폴리펩티드를 생성할 수 있는 형질전환된 숙주 세포를 수득하기 위해 발현 구축물의 도입 후 형질전환된 숙주 세포로부터 결실된다.

다른 마커는 ATP 신쎄타제, 서브유닛 9(oliC), 오로티딘(orotidine)-5'-포스페이트 데카복실라제(decarboxylase)(pvrA), 세균 G418 내성 유전자(이것은 효모에서도 사용될 수 있으나 진균에서는 사용될 수 없음), 앰피실린 내성 유전자(에스케리키아 콜라이), 네오마이신 내성 유전자(바실러스) 및 β-글루쿠로니다제(GUS)를 코딩하는 에스케리키아 콜라이 uidA 유전자를 포함한다. 벡터는 예를 들면, RNA의 생성을 위해 시험관내에서 사용될 수 있거나, 숙주 세포를 형질감염시키거나 형질전환시키기 위해 사용될 수 있다.

원핵생물에서의 단백질의 발현은 종종 융합 또는 비-융합 단백질의 발현을 유도하는 항시성 또는 유도성 프로모터를 함유하는 벡터를 사용함으로써 에스케리키아 콜라이에서 수행된다. 융합 벡터는 다수의 아미노산들을 그 내에 코딩된 단백질, 예를 들면, 재조합 단백질의 아미노 말단에 추가한다. 이러한 융합 벡터는 전형적으로 3가지 목적에 기여한다: 1) 재조합 단백질의 발현을 증가시키는 것; 2) 재조합 단백질의 가용성을 증가시키는 것; 및 3) 친화성 정제에서 리간드로서 작용함으로써 재조합 단백질의 정제에 도움을 주는 것. 종종, 융합 발현 벡터에서 단백질용해 절단 부위는 융합 모이어티와 재조합 단백질의 연접부(junction)에 도입되어 융합 단백질의 정제 후 융합 모이어티로부터의 재조합 단백질의 분리를 가능하게 한다.

표시된 바와 같이, 발현 벡터는 바람직하게는 선택 마커를 함유할 것이다. 이러한 마커는 진핵 세포 배양을 위한 다이하이드로폴레이트 리덕타제 또는 네오마이신 내성, 및 에스케리키아 콜라이 및 다른 세균에서의 배양을 위한 테트라사이클린 또는 앰피실린 내성을 포함한다.

세균에서 사용되기에 바람직한 벡터는 예를 들면, 본원에 참고로 도입되는 국제 특허출원 공개 제WO2004/074468(A1)호에 개시되어 있다. 다른 적합한 벡터는 당업자에게 용이하게 자명할 것이다.

번역된 단백질이 소포체(endoplasmic reticulum)의 내강, 세포질주변 공간 또는 세포외 환경으로 분비되기 위해, 적절한 분비 신호가 발현된 폴리펩티드 내로 도입될 수 있다. 신호는 폴리펩티드에 내재할 수 있거나 폴리펩티드에 대한 이종 신호일 수 있다.

Temer09484 폴리펩티드는 변경된 형태, 예컨대, 융합 단백질로서 발현될 수 있고, 분비 신호뿐만 아니라 추가 이종 기능성 영역도 포함할 수 있다. 따라서, 예를 들면, 추가 아미노산, 특히 하전된 아미노산의 영역이 폴리펩티드의 N-말단에 추가되어 정제 동안 또는 후속 취급 및 저장 동안 숙주 세포에서 안정성 및 지속성을 개선할 수 있다. 또한, 펩티드 모이어티는 정제를 용이하게 하기 위해 폴리펩티드에 추가될 수 있다.

본 발명은 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72에 따른 아미노산 서열; 또는 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74, 또는 서열번호 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70 또는 75의 폴리뉴클레오티드를 적절한 숙주에서 발현시킴으로써 수득될 수 있는 아미노산 서열을 갖는 단리된 폴리펩티드를 제공한다. 또한, 상기 폴리펩티드의 변이체, 예컨대, 기능성 균등물을 포함하는 펩티드 또는 폴리펩티드도 본 발명 내에 포함된다. 상기 폴리펩티드들은 용어 "본 발명에 따른 폴리펩티드" 내에 집합적으로 포함된다.

본원에서 용어 "변이체 펩티드" 또는 "변이체 폴리펩티드"는 각각 펩티드 또는 폴리펩티드 내의 하나 이상의 특정 위치에서 하나 이상의 특정 아미노산 잔기의 하나 이상의 변경, 예컨대, 치환, 삽입, 결실 및/또는 절두를 포함하는 각각 펩티드 또는 폴리펩티드로서 정의된다. 따라서, 변이체 신호 펩티드는 신호 펩티드 내의 하나 이상의 특정 위치에서 하나 이상의 특정 아미노산 잔기의 하나 이상의 변경, 예컨대, 치환, 삽입, 결실 및/또는 절두를 포함하는 신호 펩티드이다.

용어 "폴리뉴클레오티드"는 용어 "핵산 분자"와 동일하고 본원에서 상호교환적으로 읽힐 수 있다. 상기 용어는 단일 가닥 또는 이중 가닥 리보핵산(RNA) 또는 데옥시리보핵산(DNA) 분자인 폴리뉴클레오티드 분자를 지칭한다. 폴리뉴클레오티드는 단리된 형태로 존재할 수 있거나, 재조합 핵산 분자 또는 벡터 내에 포함될 수 있거나, 숙주 세포 내에 포함될 수 있다.

본원에서 용어 "변이체 폴리뉴클레오티드"는 폴리뉴클레오티드 내의 하나 이상의 특정 위치에서 하나 이상의 뉴클레오티드의 하나 이상의 변경, 예컨대, 치환, 삽입, 결실 및/또는 절두를 포함하는 폴리뉴클레오티드로서 정의된다.

용어 "펩티드" 및 "올리고펩티드"는 (통상적으로 인식되는 바와 같이) 동의어로 간주되고, 문맥이 요구할 때 각각의 용어는 펩티딜 연결에 의해 커플링된 2개 이상의 아미노산들로 구성된 쇄를 표시하기 위해 상호교환적으로 사용될 수 있다. 본원에서 용어 "폴리펩티드"는 7개 초과의 아미노산 잔기를 함유하는 쇄에 대해 사용된다. 본원에서 모든 올리고펩티드 및 폴리펩티드 식 및 서열은 아미노 말단부터 카복시 말단 방향으로 좌측부터 우측으로 기재되어 있다. 본원에서 사용된 아미노산의 1-문자 코드는 당분야에서 통상적으로 공지되어 있고 문헌(Sambrook, et al., Molecular Cloning: A Laboratory Manual, 2nd,ed. Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989)에서 발견될 수 있다.

"단리된" 폴리펩티드 또는 단백질은 그의 천연 환경으로부터 제거된 폴리펩티드 또는 단백질을 의미한다. 예를 들면, 숙주 세포에서 발현된 재조합적으로 제조된 폴리펩티드 및 단백질은 임의의 적합한 기법, 예를 들면, 문헌(Smith and Johnson, Gene 67:31-40 (1988))에 개시된 단일 단계 정제 방법에 의해 실질적으로 정제된 천연 또는 재조합 폴리펩티드이기 때문에 본 발명의 목적상 단리된 것으로 간주된다.

본 발명에 따른 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 단백질은 당분야에서 공지되어 있는 방법에 의해 재조합 세포 배양물로부터 회수될 수 있고 정제될 수 있다. 가장 바람직하게는, 고성능 액체 크로마토그래피("HPLC")가 정제를 위해 이용된다.

본 발명의 폴리펩티드는 천연적으로 정제된 생성물, 화학적 합성 절차의 생성물, 및 예를 들면, 세균, 효모, 고등 식물, 곤충 및 포유동물 세포를 비롯한 원핵 또는 진핵 숙주로부터 재조합 기법에 의해 제조된 생성물을 포함한다. 재조합 제조 절차에서 사용된 숙주에 따라, 본 발명의 폴리펩티드는 글리코실화될 수 있거나 글리코실화되지 않을 수 있다. 추가로, 본 발명의 폴리펩티드는 일부 경우 숙주 매개 과정의 결과로서 변경된 첫번째 메티오닌 잔기도 포함할 수 있다.

본 발명은 본 발명에 따른 폴리펩티드의 생물학적 활성 단편도 특징으로 한다.

본 발명의 폴리펩티드의 생물학적 활성 단편은 전체 길이 단백질보다 더 적은 수의 아미노산을 포함하되 상응하는 전체 길이 단백질의 하나 이상의 생물학적 활성을 나타내는, Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 단백질의 아미노산 서열(예를 들면, 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72의 아미노산 서열)과 충분히 동일한 또는 이러한 아미노산 서열로부터 유도된 아미노산 서열을 포함하는 폴리펩티드를 포함한다. 전형적으로. 생물학적 활성 단편은 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 단백질의 하나 이상의 활성을 갖는 도메인 또는 모티프를 포함한다.

본 발명의 단백질의 생물학적 활성 단편은 예를 들면, 약 10개, 약 25개, 약 50개 또는 약 100개 이상의 아미노산 길이, 약 100개 이상의 아미노산, 150개, 200개, 250개, 300개, 350개 또는 400개 이상의 아미노산 길이, 또는 본 발명의 폴리펩티드의 아미노산의 총 수에 해당하는 길이를 갖는 폴리펩티드일 수 있다.

나아가, 단백질의 다른 영역이 결실되어 있는 다른 생물학적 활성 부분은 재조합 기법에 의해 제조될 수 있고 본 발명의 폴리펩티드의 천연 형태의 생물학적 활성들 중 하나 이상의 생물학적 활성에 대해 평가될 수 있다. 본 발명은 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 단백질의 상기 생물학적 활성 단편을 코딩하는 핵산 단편도 특징으로 한다.

단백질

본 발명의 또 다른 양태에서, 개선된 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 단백질이 제공된다. 개선된 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 단백질은 하나 이상의 생물학적 활성이 개선된 단백질이다. 이러한 단백질은 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 코딩 서열의 전부 또는 일부를 따라 돌연변이를 무작위로 도입함으로써, 예컨대, 포화 돌연변이유발에 의해 수득될 수 있고, 생성된 돌연변이체는 재조합적으로 발현될 수 있고 생물학적 활성에 대해 스크리닝될 수 있다. 예를 들면, 당분야는 본 발명의 단백질의 효소 활성을 측정하는 표준 분석을 제공하므로, 개선된 단백질은 용이하게 선택될 수 있다.

개선된 셀로바이오하이드롤라제 기능을 이끌어내는, 본 발명의 아미노산 서열의 개선된 변이체는 본 발명의 상응하는 유전자에 의해 수득될 수 있다. 이러한 변경에는 하기 변경들이 포함된다:

1. 무작위 돌연변이를 도입하기 위한 오류 유발 PCR에 이어서, 수득된 변이체의 스크리닝 및 개선된 동력학적 성질을 갖는 변이체의 단리; 및

2. 셀로바이오하이드롤라제를 코딩하는 유전자의 관련 변이체의 패밀리 셔플링(shuffling)에 이어서, 수득된 변이체의 스크리닝 및 개선된 동력학적 성질을 갖는 변이체의 단리.

보다 더 높은 표 1에 따른 활성을 야기하는 증가된 mRNA 및/또는 단백질 수준을 이끌어내는 본 발명의 유전자의 변이체는 상기 유전자의 폴리뉴클레오티드 서열에 의해 수득될 수 있다. 이러한 변경에는 하기 변경들이 포함된다:

1. 코돈이 모 미생물 숙주에 (최적으로) 적응되게 하는 방식으로 코돈 사용의 개선;

2. 코돈이 모 미생물 숙주에 (최적으로) 적응되게 하는 방식으로 코돈 쌍 사용의 개선; 및

3. 증가된 반감기를 갖는 mRNA 분자를 생성하는, 셀로바이오하이드롤라제를 코딩하는 유전 정보에의 안정화 서열의 추가.

개선된 촉매 성질 또는 증가된 mRNA 또는 단백질 수준을 갖는 변이체를 단리하는 바람직한 방법은 국제 특허출원 공개 제WO2003/010183호 및 제WO2003/01311호에 기재되어 있다. 모 미생물 균주에서 코돈 사용을 최적화하는 바람직한 방법은 국제 특허출원 제PCT/EP2007/05594호에 기재되어 있다. 본 발명의 셀로바이오하이드롤라제를 코딩하는 유전자에 안정화 요소를 추가하는 바람직한 방법은 국제 특허출원 공개 제WO2005/059149호에 기재되어 있다.

바람직한 실시양태에서, 본 발명의 단백질은 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72에 따른 아미노산 서열을 갖는다. 또 다른 실시양태에서, 본 발명의 폴리펩티드는 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72에 따른 아미노산 서열에 대한 실질적 상동성을 갖고 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72에 따른 폴리펩티드의 하나 이상의 생물학적 활성을 보유하되, 기재된 바와 같이 천연 변이 또는 돌연변이유발로 인해 아미노산 서열에서 상이하다.

추가 바람직한 실시양태에서, 본 발명의 단백질은 바람직하게는 고도로 엄격한 혼성화 조건 하에서 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74, 또는 서열번호 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70 또는 75에 따른 핵산과 혼성화할 수 있는 단리된 핵산 단편에 의해 코딩된 아미노산 서열을 갖는다.

따라서, Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 단백질 또는 본 발명의 단백질은 바람직하게는 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72에 제시된 아미노산 서열에 대한 50% 이상, 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 91% 이상, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.8% 또는 99.9% 이상의 상동성을 갖는 아미노산 서열을 포함하고 전형적으로 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72에 따른 폴리펩티드의 하나 이상의 기능적 활성을 보유하는 단백질이다.

본 발명의 한 양태에 따르면, 본 발명의 폴리펩티드는 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72에 기재된 아미노산 서열, 또는 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개 또는 12개의 아미노산이 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72에 기재된 아미노산 서열과 상이한 아미노산 서열을 포함할 수 있고, 이때 상기 폴리펩티드는 본 발명의 폴리펩티드의 활성 또는 기능을 여전히 갖는다. 당업자는 본 발명의 폴리펩티드에서의 이들 소수 아미노산 변화가 존재할 수 있거나(예를 들면, 천연 돌연변이), 단백질 기능 또는 활성을 손실시키지 않으면서 (예를 들면, r-DNA 기술의 이용을 통해) 만들어질 수 있다. 이 돌연변이들이 폴리펩티드의 결합 도메인, 활성 부위 또는 다른 기능성 도메인에 존재하는 경우, 폴리펩티드의 성질(예를 들면, 그의 열안정성)이 변할 수 있으나, 폴리펩티드는 그의 헤미셀룰라제 활성을 유지할 수 있다. 활성 부위, 결합 도메인 또는 다른 기능성 도메인에 가깝지 않은 돌연변이가 존재하는 경우, 보다 적은 영향이 예상될 수 있다.

본 발명에 따른 단백질의 기능성 균등물도 예를 들면, 표 1에 따른 활성에 대해 본 발명의 단백질의 돌연변이체, 예를 들면, 절두 돌연변이체의 조합 라이브러리를 스크리닝함으로써 확인될 수 있다. 한 실시양태에서, 변이체의 다채로운 라이브러리는 핵산 수준에서 조합 돌연변이유발에 의해 생성된다. 변이체의 다채로운 라이브러리는 예를 들면, 잠재적 단백질 서열의 축퇴 세트가 개별 폴리펩티드로서 또는 대안적으로 보다 더 큰 융합 단백질의 세트(예를 들면, 파지 디스플레이의 경우)로서 발현될 수 있도록 효소를 사용하여 합성 올리고뉴클레오티드의 혼합물을 유전자 서열로 결찰함으로써 생성될 수 있다. 축퇴 올리고뉴클레오티드 서열로부터 본 발명의 폴리펩티드의 잠재적 변이체의 라이브러리를 생성하는 데에 이용될 수 있는 다양한 방법들이 존재한다. 축퇴 올리고뉴클레오티드를 합성하는 방법은 당분야에서 공지되어 있다(예를 들면, 문헌(Narang (1983) Tetrahedron 39:3); 문헌(Itakura et al. (1984) Annu. Rev. Biochem. 53:323); 문헌(Itakura et al. (1984) Science 198:1056); 및 문헌(Ike et al. (1983) Nucleic Acid Res. 11:477) 참조).

추가로, 본 발명의 폴리펩티드의 코딩 서열의 단편의 라이브러리는 변이체의 후속 선택을 스크리닝하기 위해 다채로운 폴리펩티드 집단을 생성하는 데에 사용될 수 있다. 예를 들면, 코딩 서열 단편의 라이브러리는 닉킹(nicking)이 분자 당 약 1회만 일어나는 조건 하에서 관심있는 코딩 서열의 이중 가닥 PCR 단편을 뉴클레아제로 처리하고 이중 가닥 DNA를 변성시키고 DNA를 재생시켜 상이한 닉킹된 생성물로부터 센스/안티센스 쌍을 포함할 수 있는 이중 가닥 DNA를 형성하고 S1 뉴클레아제로 처리하여 재형성된 이중체로부터 단일 가닥 부분을 제거하고 생성된 단편 라이브러리를 발현 벡터 내로 결찰함으로써 생성될 수 있다. 이 방법에 의해 다양한 크기의 관심있는 단백질의 N-말단 단편 및 내부 단편을 코딩하는 발현 라이브러리가 유도될 수 있다.

점 돌연변이 또는 절두에 의해 만들어진 조합 라이브러리의 유전자 생성물을 스크리닝하고 선택된 성질을 갖는 유전자 생성물에 대해 cDNA 라이브러리를 스크리닝하는 여러 기법들이 당분야에서 공지되어 있다. 큰 유전자 라이브러리를 스크리닝하는, 고처리율 분석에 적합한 가장 널리 이용되는 기법은 전형적으로 유전자 라이브러리를 복제가능한 발현 벡터 내로 클로닝하는 단계, 적절한 세포를 생성된 벡터 라이브러리로 형질전환시키는 단계, 및 원하는 활성의 검출이 검출되는 생성물의 유전자를 코딩하는 벡터의 단리를 용이하게 하는 조건 하에서 조합 유전자를 발현시키는 단계를 포함한다. 라이브러리에서 기능성 돌연변이체의 빈도를 향상시키는 기법인 반복 앙상블(ensemble) 돌연변이유발(REM)이 본 발명의 단백질의 변이체를 확인하기 위해 스크리닝 분석과 함께 이용될 수 있다(Arkin and Yourvan (1992) Proc. Natl. Acad. Sci. USA 89:7811-7815; Delgrave et al. (1993) Protein Engineering 6(3): 327-331).

서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74, 또는 서열번호 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70 또는 75에 제시된 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 유전자 서열 이외에, Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 단백질의 아미노산 서열의 변화를 유발할 수 있는 DNA 서열 다형성이 주어진 집단 내에 존재할 수 있다는 것은 당업자에게 자명할 것이다. 이러한 유전적 다형성은 천연 대립형질 변이로 인해 상이한 집단들로부터의 세포들 또는 한 집단 내에 존재할 수 있다. 대립형질 변이체는 기능성 균등물도 포함할 수 있다.

본 발명에 따른 폴리뉴클레오티드의 단편은 기능성 폴리펩티드를 코딩하지 않는 폴리뉴클레오티드도 포함할 수 있다. 이러한 폴리뉴클레오티드는 프로브 또는 PCR 반응용 프라이머로서 작용할 수 있다.

본 발명에 따른 핵산은 기능성 폴리펩티드를 코딩하는지 아니면 비-기능성 폴리펩티드를 코딩하는지 관계없이 혼성화 프로브 또는 중합효소 연쇄 반응(PCR) 프라이머로서 사용될 수 있다. Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 활성을 갖는 폴리펩티드를 코딩하지 않는 본 발명의 핵산 분자의 용도는 특히, (1) 예를 들면, 적합한 미생물로부터의 cDNA 라이브러리로부터 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 단백질을 코딩하는 유전자, 또는 이의 대립형질 변이체의 단리; (2) 문헌(Verma et al., Human Chromosomes: a Manual of Basic Techniques, Pergamon Press, New York (1988))에 기재된 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 유전자의 정확한 염색체 위치를 제공하기 위한 중기 염색체 스프레드(spreads)에의 제자리 혼성화(예를 들면, FISH); (3) 특정 조직 및/또는 세포에서 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 mRNA의 발현을 검출하기 위한 노던 블롯 분석; 및 4) 주어진 생물학적 (예를 들면, 조직) 샘플에서 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 프로브에 혼성화될 수 있는 핵산의 존재를 분석하기 위한 진단 수단으로서 사용될 수 있는 프로브 및 프라이머를 포함한다.

Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 유전자의 기능성 균등물을 수득하는 방법도 본 발명에 포함된다. 이러한 방법은 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72에 따른 단백질 서열 또는 이의 변이체의 전부 또는 일부를 코딩하는 단리된 핵산을 포함하는 표지된 프로브를 수득하는 단계; 프로브와 라이브러리 내의 핵산 단편의 혼성화를 허용하여 핵산 이중체를 형성하는 조건 하에서 핵산 단편 라이브러리를 상기 표지된 프로브로 스크리닝하는 단계; 및 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 유전자와 관련된 유전자를 수득하기 위해 임의의 표지된 이중체에서 핵산 단편으로부터 전체 길이 유전자 서열을 결정하는 단계를 수반한다.

한 실시양태에서, 본 발명의 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 핵산은 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74, 또는 서열번호 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70 또는 75에 제시된 핵산 서열 또는 이의 상보체에 대한 50% 이상, 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 91% 이상, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 상동성을 갖는다.

본 발명의 폴리뉴클레오티드 또는 벡터를 포함하는 숙주 세포도 제공된다. 상기 폴리뉴클레오티드는 숙주 세포의 게놈에 대한 이종성을 가질 수 있다. 통상적으로 숙주 세포와 관련하여 용어 "이종성"은 폴리뉴클레오티드가 숙주 세포의 게놈에 천연적으로 존재하지 않거나 폴리펩티드가 그 세포에 의해 천연적으로 생성되지 않는다는 것을 의미한다.

또 다른 실시양태에서, 본 발명은 본 발명에 의해 포괄되는 핵산을 함유하는 세포, 예를 들면, 형질전환된 숙주 세포 또는 재조합 숙주 세포를 특징으로 한다. "형질전환된 세포" 또는 "재조합 세포"는 본 발명에 따른 핵산이 재조합 DNA 기법에 의해 도입되어 있는 세포(또는 이의 조상세포)이다. 원핵 세포 및 진핵 세포 둘다, 예를 들면, 세균, 진균, 효모 등이 포함되고, 사상 진균, 예컨대, 아스퍼길러스 니게르로부터의 세포가 특히 바람직하다.

삽입된 서열의 발현을 조절하거나 유전자 생성물을 특정 원하는 방식으로 변경시키고 프로세싱하는 숙주 세포가 선택될 수 있다. 단백질 생성물의 이러한 변경(예를 들면, 글리코실화) 및 프로세싱(예를 들면, 절단)은 단백질의 최적 작용을 용이하게 할 수 있다.

다양한 숙주 세포들이 단백질 및 유전자 생성물의 번역 후 프로세싱 및 변경을 위한 특징적인 특정 기작을 갖는다. 분자생물학 및/또는 미생물 분야의 숙련된 자에게 익숙한 적절한 세포주 또는 숙주 시스템은 발현되는 외래 단백질의 원하는 정확한 변경 및 프로세싱을 보장하도록 선택될 수 있다. 이를 위해, 유전자 생성물의 적절한 일차 전사체 프로세싱, 글리코실화 및 인산화를 위한 세포 기구를 보유하는 진핵 숙주 세포가 사용될 수 있다. 이러한 숙주 세포는 당분야에서 잘 공지되어 있다.

원하는 경우, 전술된 세포는 본 발명에 따른 폴리펩티드의 제조에 사용될 수 있다. 이러한 방법은 전형적으로 폴리펩티드를 코딩하는 코딩 서열의 (벡터에 의한) 발현을 제공하는 조건 하에서 (예를 들면, 전술된 바와 같이 발현 벡터로 형질전환되거나 형질감염된) 숙주 세포를 배양하는 단계, 및 임의적으로 발현된 폴리펩티드를 회수하는 단계를 포함한다. 본 발명의 폴리뉴클레오티드는 재조합 복제가능한 벡터, 예를 들면, 발현 벡터 내로 도입될 수 있다. 벡터는 상용가능한 숙주 세포에서 핵산을 복제하는 데에 사용될 수 있다. 따라서, 추가 실시양태에서, 본 발명은 본 발명의 폴리뉴클레오티드를 복제가능한 벡터 내로 도입하고 상기 벡터를 상용가능한 숙주 세포 내로 도입하고 상기 벡터의 복제를 일으키는 조건 하에서 상기 숙주 세포를 생장시킴으로써 본 발명의 폴리뉴클레오티드를 제조하는 방법을 제공한다. 상기 벡터는 상기 숙주 세포로부터 회수될 수 있다.

바람직하게는, 폴리펩티드는 분비 단백질로서 생성되고, 이 경우 발현 구축물에서 성숙 형태의 폴리펩티드를 코딩하는 뉴클레오티드 서열은 신호 서열을 코딩하는 뉴클레오티드 서열에 작동가능하게 연결된다. 바람직하게는, 신호 서열은 폴리펩티드를 코딩하는 뉴클레오티드 서열에 대한 천연(상동성) 신호 서열이다. 대안적으로, 신호 서열은 폴리펩티드를 코딩하는 뉴클레오티드 서열에 대한 외래(이종) 신호 서열이고, 이 경우 신호 서열은 바람직하게는 본 발명에 따른 뉴클레오티드 서열이 발현되는 숙주 세포에 내재한다. 효모 숙주 세포에 적합한 신호 서열의 예는 효모 α-인자 유전자로부터 유래된 신호 서열이다. 유사하게, 사상 진균 숙주 세포에 적합한 신호 서열은 예를 들면, 사상 진균 아밀로글루코시다제(AG) 유전자, 예를 들면, 아스퍼길러스 니게르 glaA 유전자로부터 유래된 신호 서열이다. 이것은 아밀로글루코시다제((글루코)아밀라제로서도 지칭됨) 프로모터 자체와 함께 사용될 수 있을 뿐만 아니라, 다른 프로모터와도 함께 사용될 수 있다. 하이브리드 신호 서열도 본 발명에서 사용될 수 있다.

바람직한 이종 분비 리더 서열은 진균 아밀로글루코시다제(AG) 유전자(예를 들면, 아스퍼길러스로부터의 glaA - 18개 아미노산 버전 및 24개 아미노산 버전 둘다), α-인자 유전자(효모, 예를 들면, 사카로마이세스 및 클루이베로마이세스) 또는 α-아밀라제 유전자(바실러스)로부터 유래된 분비 리더 서열이다.

벡터는 전술된 바와 같이 적합한 숙주 세포 내로 형질전환되거나 형질감염되어 본 발명의 폴리펩티드의 발현을 제공할 수 있다. 이 과정은 폴리펩티드를 코딩하는 코딩 서열의 벡터에 의한 발현을 제공하는 조건 하에서 전술된 바와 같이 발현 벡터로 형질전환된 숙주 세포를 배양하는 단계를 포함할 수 있다.

숙주 세포

따라서, 본 발명은 본 발명의 폴리뉴클레오티드 또는 벡터로 형질전환되거나 형질감염된, 또는 본 발명의 폴리뉴클레오티드 또는 벡터를 포함하는 숙주 세포를 제공한다. 바람직하게는, 폴리뉴클레오티드는 이 폴리뉴클레오티드의 복제 및 발현을 위해 벡터 내에 보유된다. 세포는 상기 벡터와 상용가능하도록 선택될 것이고, 예를 들면, 원핵(예를 들면, 세균), 진균, 효모 또는 식물 세포일 수 있다.

이종 숙주도 선택될 수 있고, 이때 본 발명의 폴리펩티드는 다른 셀룰로스 분해 또는 헤미셀룰로스 분해 효소를 실질적으로 갖지 않는 형태로 생성된다. 이것은 이러한 효소를 정상적으로 생성하지 않는 숙주를 선택함으로써 달성될 수 있다.

본 발명은 폴리펩티드를 코딩하는 DNA 서열을 재조합 발현시킴으로써 본 발명의 폴리펩티드를 제조하는 방법을 포괄한다. 이를 목적으로, 본 발명의 DNA 서열은 적합한 동종 또는 이종 숙주 세포에서 폴리펩티드의 경제적 생성을 가능하게 하기 위해 발현 신호, 예컨대, 프로모터 또는 분비 신호 서열의 유전자 증폭 및/또는 교환에 사용될 수 있다. 동종 숙주 세포는 동일한 종의 숙주 세포이거나, DNA 서열의 기원인 종과 동일한 종 내의 변이체인 숙주 세포이다.

적합한 숙주 세포는 바람직하게는 원핵 미생물, 예컨대, 세균, 보다 바람직하게는 진핵 유기체, 예를 들면, 진균, 예컨대, 효모 또는 사상 진균, 또는 식물 세포이다. 일반적으로, 효모 세포는 조작하기 더 용이하기 때문에 진균 세포에 비해 바람직하다. 그러나, 일부 단백질들은 효모로부터 잘 분비되지 않거나, 일부 경우 적절하게 프로세싱되지 않는다(예를 들면, 효모에서의 과다글리코실화). 이 경우, 진균 숙주 유기체가 선택되어야 한다.

숙주 세포는 폴리펩티드를 과다발현할 수 있고, 과다발현을 조작하는 기법은 잘 공지되어 있다. 따라서, 숙주는 코딩 폴리뉴클레오티드의 2개 이상의 카피를 가질 수 있다(이에 따라 벡터는 2개 이상의 카피를 가질 수 있다).

본 발명과 관련하여, "모 미생물 숙주 세포" 및 "돌연변이체 미생물 숙주 세포"는 임의의 종류의 숙주 세포일 수 있다. 돌연변이체 미생물 숙주 세포의 특정 실시양태는 이하에 기재되어 있다. 달리 표시되어 있지 않은 한, 돌연변이체 미생물 숙주 세포에 적용가능한 실시양태는 모 미생물 숙주 세포에도 적용될 수 있다는 것은 당업자에게 명확할 것이다.

본 발명에 따른 돌연변이체 미생물 숙주 세포는 원핵 세포일 수 있다. 바람직하게는, 원핵 숙주 세포는 세균 세포이다. 용어 "세균 세포"는 그람 음성 미생물 및 그람 양성 미생물 둘다를 포함한다. 적합한 세균은 예를 들면, 에스케리키아(Escherichia), 아나배나(Anabaena), 카울로박테르트(Caulobactert), 글루코노박터(Gluconobacter), 로도박터(Rhodobacter), 슈도모나스(Pseudomonas), 파라코커스(Paracoccus), 바실러스(Bacillus), 브레비박테리움(Brevibacterium), 코리네박테리움(Corynebacterium), 리조비움(Rhizobium)(시노리조비움(Sinorhizobium)), 플라보박테리움(Flavobacterium), 크렙시엘라(Klebsiella), 엔테로박터(Enterobacter), 락토바실러스(Lactobacillus), 락토코커스(Lactococcus), 메틸로박테리움(Methylobacterium), 스타필로코커스(Staphylococcus) 또는 스트렙토마세스(Streptomyces)로부터 선택될 수 있다. 바람직하게는, 세균 세포는 바실러스 서브틸리스(B. subtilis), 바실러스 아밀로리쿠에파시엔스(B. amyloliquefaciens), 바실러스 리체니포르미스(B. licheniformis), 바실러스 푼티스(B. puntis), 바실러스 메가테리움(B. megaterium), 바실러스 할로두란스(B. halodurans), 바실러스 푸밀러스(B. pumilus), 글루코노박터 옥시단스(G. oxydans), 카울로박테르트 크레센터스(Caulobactert crescentus) CB 15, 메틸로박테리움 엑토르쿠엔스(Methylobacterium extorquens), 로도박터 스패로이데스(Rhodobacter sphaeroides), 슈도모나스 제아잔티니파시엔스(Pseudomonas zeaxanthinifaciens), 파라코커스 데니트라이피칸스(Paracoccus denitrificans), 에스케리키아 콜라이(E. coli), 코리네박테리움 글루타미쿰(C. glutamicum), 스타필로코커스 카르노서스(Staphylococcus carnosus), 스트렙토마이세스 리비단스(Streptomyces lividans), 시노리조비움 멜리오티(Sinorhizobium melioti) 및 리조비움 라디오박터(Rhizobium radiobacter)로 구성된 군으로부터 선택된다.

한 실시양태에 따르면, 본 발명에 따른 돌연변이체 미생물 숙주 세포는 진핵 숙주 세포이다. 바람직하게는, 진핵 세포는 포유동물, 곤충, 식물, 진균 또는 해조류 세포이다. 바람직한 포유동물 세포는 예를 들면, 중국 햄스터 난소(CHO) 세포, COS 세포, 293 세포, PerC6 세포 및 하이브리도마를 포함한다. 바람직한 곤충 세포는 예를 들면, Sf9 및 Sf21 세포, 및 이들의 유도체를 포함한다. 보다 바람직하게는, 진핵 세포는 진균 세포, 즉 효모 세포, 예컨대, 칸디다(Candida), 한세눌라(Hansenula), 클루이베로마이세스(Kluyveromyces), 피키아(Pichia), 사카로마이세스(Saccharomyces), 시조사카로마이세스(Schizosaccharomyces) 또는 야로위아(Yarrowia) 균주이다. 보다 바람직하게는, 진핵 숙주 세포는 클루이베로마이세스 락티스(Kluyveromyces lactis), 사카로마이세스 세레비지애(S. cerevisiae), 한세눌라 폴리모르파(Hansenula polymorpha), 야로위아 리폴라이티카(Yarrowia lipolytica) 또는 피키아 파스토리스(Pichia pastoris), 또는 사상 진균 세포이다. 가장 바람직하게는, 진핵 세포는 사상 진균 세포이다.

사상 진균은 (문헌(Hawksworth et al., In, Ainsworth and Bisby's Dictionary of The Fungi, 8th edition, 1995, CAB International, University Press, Cambridge, UK)에 의해 정의된) 유마이코타(Eumycota) 및 오마이코타(Oomycota) 아목의 모든 사상 형태들을 포함한다. 사상 진균은 키틴, 셀룰로스, 글루칸, 키토산, 만난 및 다른 복합 폴리사카라이드로 구성된 균사벽을 특징으로 한다. 양양 성장은 균사 연장에 의한 성장이고, 탄소 이화작용은 불가피하게 호기성 탄소 이화작용이다. 사상 진균 균주는 아크레모늄(Acremonium), 아가리커스(Agaricus), 아스퍼길러스(Aspergillus), 아우레오바시듐(Aureobasidium), 크리소스포리움(Chrysosporium), 코프리너스(Coprinus), 크립토코커스(Cryptococcus), 필리바시듐(Filibasidium), 푸사리움(Fusarium), 후미콜라(Humicola), 마그나포르테(Magnaporthe), 뮤코르(Mucor), 마이셀리오프쏘라(Myceliophthora), 네오칼리마스틱스(Neocallimastix), 뉴로스포라(Neurospora), 패실로마이세스(Paecilomyces), 페니실리움(Penicillium), 피로마이세스(Piromyces), 파네로캐테(Panerochaete), 플레우로터스(Pleurotus), 쉬조필룸(Schizophyllum), 탈라로마이세스(Talaromyces), 라삼소니아(Rasamsonia), 써모아스커스(Thermoascus), 티엘라비아(Thielavia), 톨리포클라듐(Tolypocladium) 및 트라이코데르마(Trichoderma)의 균주들을 포함하나 이들로 한정되지 않는다.

바람직한 사상 진균 세포는 아크레모늄, 아스퍼길러스, 크리소스포리움, 마이셀리오프쏘라, 페니실리움, 탈라로마이세스, 라삼소니아, 티엘라비아, 푸사리움 또는 트라이코데르마 속의 종, 가장 바람직하게는 아스퍼길러스 니게르, 아크레모늄 알라바멘스, 아스퍼길러스 아와모리, 아스퍼길러스 포에티더스, 아스퍼길러스 소자, 아스퍼길러스 푸미가터스, 탈라로마이세스 에머소니이, 라삼소니아 에머소니이, 아스퍼길러스 오리자, 크리소스포리움 럭노웬스, 푸사리움 옥시스포룸, 마이셀리오프쏘라 써모필라, 트라이코데르마 리세이, 티엘라비아 테레스트리스 또는 페니실리움 크리소게눔의 종에 속한다. 보다 바람직한 숙주 세포는 아스퍼길러스 또는 라삼소니아 속에 속하고, 보다 바람직하게는 숙주 세포는 아스퍼길러스 니게르 또는 라삼소니아 에머소니이 종에 속한다. 본 발명에 따른 숙주 세포가 아스퍼길러스 니게르 숙주 세포인 경우, 숙주 세포는 바람직하게는 CBS 513.88, CBS124.903 또는 이의 유도체이다.

사상 진균의 여러 균주들이 다수의 배양물 보관기관, 예컨대, ATCC(American Type Culture Collection), DSM(Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH), CBS(Centraal bureau Voor Schimmelcultures), NRRL(Agricultural Research Service Patent Culture Collection, Northern Regional Research Center) 및 러시아 과학학회의 러시아 미생물 보관기관(러시아어 약어 - VKM, 영어 약어 - RCM)(러시아 모스코바 소재)에서 대중에게 용이하게 입수될 수 있다. 본 발명과 관련하여 유용한 균주는 아스퍼길러스 니게르 CBS 513.88, CBS124.903, 아스퍼길러스 오리자 ATCC 20423, IFO 4177, ATCC 1011, CBS205.89, ATCC 9576, ATCC 14488-14491, ATCC 11601, ATCC 12892, 페니실리움 크리소게눔 CBS 455.95, 페니실리움 크리소게눔 위스콘신54-1255(ATCC 28089), 페니실리움 시트리눔(Penicillium citrinum) ATCC 38065, 페니실리움 크리소게눔 P2, 티엘라비아 테레스트리스 NRRL8126, 탈라로마이세스 에머소니이 CBS 124.902, 아크레모늄 크리소게눔 ATCC 36225 또는 ATCC 48272, 트라이코데르마 리세이 ATCC 2692, ATCC 56765 또는 ATCC 26921, 아스퍼길러스 소자 ATCC 11906, 마이셀리오프쏘라 써모필라 C1, Garg 27K, VKM-F 3500 D, 크리소스포리움 럭노웬스 C1, Garg 27K, VKM-F 3500 D, ATCC 44006 및 이들의 유도체일 수 있다.

본 발명의 한 실시양태에 따라, 본 발명에 따른 돌연변이체 미생물 숙주 세포가 사상 진균 숙주 세포인 경우, 상기 돌연변이체 미생물 숙주 세포는 이 돌연변이체 미생물 숙주 세포가 모 숙주 세포와 비교되고 동일한 조건 하에서 측정될 때 글루코아밀라제(glaA), 산 안정성 α-아밀라제(amyA), 중성 α-아밀라제(amyBI 및 amyBII), 옥살산 하이드롤라제(oahA), 독소, 바람직하게는 오크라톡신(ochratoxin) 및/또는 푸모니신(fumonisin), 프로테아제 전사 조절제 prtT, PepA, 유전자 hdfA 및/또는 hdfB에 의해 코딩된 생성물 및 비-리보좀 펩티드 신타제 npsE로부터 선택된 하나 이상의 생성물의 생성에서 결핍되도록 그의 게놈 내에 하나 이상의 변경을 포함할 수 있다.

따라서, 본 발명에 따른 돌연변이체 미생물 숙주 세포가 사상 진균 숙주 세포인 경우, 숙주 세포는 주요 세포외 아스파르트산 프로테아제 PepA의 생성에서의 결핍을 초래하도록 그의 게놈 내에 하나 이상의 변경을 포함할 수 있다. 예를 들면, 본 발명에 따른 숙주 세포는 주요 세포외 아스파르트산 프로테아제 PepA를 코딩하는 pepA 유전자의 파괴를 추가로 포함할 수 있다.

본 발명에 따른 돌연변이체 미생물 숙주 세포가 사상 진균 숙주 세포인 경우, 본 발명에 따른 숙주 세포는 hdfA 및/또는 hdfB 유전자에 의해 코딩된 생성물의 생성에서의 결핍을 초래하도록 그의 게놈 내에 하나 이상의 변경을 추가로 포함할 수 있다. 예를 들면, 본 발명에 따른 숙주 세포는 hdfA 및/또는 hdfB 유전자의 파괴를 추가로 포함할 수 있다. hdfA 및/또는 hdfB 유전자에 의해 코딩된 생성물에서 결핍된 사상 진균 숙주 세포는 국제 특허출원 공개 제WO2005/095624호에 기재되어 있다.

본 발명에 따른 돌연변이체 미생물 숙주 세포가 사상 진균 숙주 세포인 경우, 본 발명에 따른 숙주 세포는 비-리보좀 펩티드 신타제 npsE의 생성에서의 결핍을 초래하도록 그의 게놈 내에 변경을 추가로 포함할 수 있다. 비-리보좀 펩티드 신타제 npsE의 생성에서 결핍된 이러한 숙주 세포는 국제 특허출원 공개 제WO2012/001169호에 기재되어 있다(npsE는 국제 특허출원 공개 제WO2012/001169호의 서열번호 35에 제시된 게놈 서열, 서열번호 36에 제시된 코딩 서열, 서열번호 37에 제시된 mRNA 및 서열번호 38에 제시된 nrps 단백질을 갖는다).

본 발명에 따른 돌연변이체 미생물 숙주 세포가 사상 진균 숙주 세포인 경우, 숙주 세포는 관심있는 화합물을 코딩하는 폴리뉴클레오티드의 하나 이상의 카피의 삽입에 적합한 2개 이상의 실질적 상동성 DNA 도메인들을 추가로 포함할 수 있고, 이때 상기 2개 이상의 실질적 상동성 DNA 도메인들 중 하나 이상은 그 자신의 기원인 실질적 상동성 DNA 도메인에 비해 관심있는 화합물을 코딩하는 폴리뉴클레오티드에 대한 향상된 삽입 선호도를 갖도록 개조되고, 개조된 실질적 상동성 DNA 도메인의 기원인 상기 실질적 상동성 DNA 도메인은 상기 2개 이상의 실질적 상동성 DNA 도메인들의 나머지들 중 하나보다 10% 이상 더 높은 유전자 전환 빈도를 갖는다. 이들 세포들은 국제 특허출원 공개 제WO2011/009700호에 기재되어 있다. 이들 실질적 상동성 DNA 도메인들의 2개 이상의 카피를 함유하는 균주는 이하에서 2개 이상의 앰플리콘을 함유하는 균주로서도 지칭된다. 이러한 앰플리콘을 포함하는 숙주 세포의 예는 예를 들면, 문헌(van Dijck et al, 2003, Regulatory Toxicology and Pharmacology 28; 27-35: On the safety of a new generation of DSM Aspergillus niger enzyme production strains)에 기재되어 있다. 상기 문헌(van Dijck et al.)에는 7개의 증폭된 글루코아밀라제 유전자 좌위, 즉 7개의 앰플리콘들을 포함하는 아스퍼길러스 니게르 균주가 기재되어 있다. 이와 관련하여 바람직한 숙주 세포는 2개 이상의 앰플리콘, 바람직하게는 2개 이상의 ΔglaA 앰플리콘들을 포함하는(바람직하게는 3개, 4개, 5개, 6개 또는 7개의 ΔglaA 앰플리콘들을 포함하는) 사상 진균 숙주 세포, 바람직하게는 아스퍼길러스 니게르 숙주 세포이고, 이때 가장 높은 빈도의 유전자 전환을 갖는 앰플리콘은 그 자신이 유래된 앰플리콘에 비해 관심있는 화합물을 코딩하는 폴리뉴클레오티드에 대한 향상된 삽입 선호도를 갖도록 개조된다. 앰플리콘의 개조는 국제 특허출원 공개 제WO2011/009700호(전체적으로 본원에 참고로 도입됨)에 기재된 방법들 중 어느 한 방법에 따라 수행될 수 있다. 국제 특허출원 공개 제WO2011/009700호에 기재된 이들 숙주 세포들의 한 예는 BamHI 절두된 앰플리콘, SalI 절두된 앰플리콘 및 BglII 절두된 앰플리콘인 3개의 ΔglaA 앰플리콘들을 포함하는 숙주 세포이고, 이때 BamHI 앰플리콘은 그 자신의 기원인 BamHI 앰플리콘에 비해 관심있는 화합물을 코딩하는 폴리뉴클레오티드에 대한 향상된 삽입 선호도를 갖도록 개조된다. 2개 이상의 앰플리콘들을 포함하는 숙주 세포로서, 이때 1개의 앰플리콘이 그 자신의 기원인 앰플리콘에 비해 관심있는 화합물을 코딩하는 폴리뉴클레오티드에 대한 향상된 삽입 선호도를 갖도록 개조된, 숙주 세포는 이하에서 개조된 앰플리콘을 포함하는 숙주 세포로서 지칭된다.

본 발명에 따른 돌연변이체 미생물 숙주 세포가 사상 진균 숙주 세포인 경우, 본 발명에 따른 숙주 세포는 Sec61의 변경을 추가로 포함할 수 있다. 바람직한 SEC61 변경은 SEC61의 한 방향 돌연변이체, 즉 새로 합성된 단백질이 SEC61을 통해 ER로 들어갈 수 있되 상기 단백질이 SEC61을 통해 ER을 떠날 수 없는 돌연변이체를 초래하는 변경이다. 이러한 변경은 국제 특허출원 공개 제WO2005/123763호에 광범위하게 기재되어 있다. 가장 바람직하게는, SEC61 변경은 세린 376이 트립토판으로 교체되어 있는 S376W 돌연변이이다.

본 발명에 따른 숙주 세포는 식물 세포를 포함하므로, 본 발명은 하나 이상의 본 발명의 세포를 함유하는 형질전환 유기체, 예컨대, 식물 및 이의 일부까지 확장된다. 상기 세포는 본 발명의 폴리펩티드를 이종적으로 발현할 수 있거나, 본 발명의 폴리뉴클레오티드들 중 하나 이상의 폴리뉴클레오티드를 이종적으로 함유할 수 있다. 따라서, 형질전환(또는 유전적으로 변경된) 식물은 그의 게놈 내로 (예를 들면, 안정하게) 삽입된 본 발명의 폴리펩티드들 중 하나 이상의 폴리펩티드를 코딩하는 서열을 가질 수 있다. 식물 세포의 형질전환은 공지되어 있는 기법을 이용함으로써, 예를 들면, 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens)로부터의 Ti 또는 Ri 플라스미드를 사용함으로써 수행될 수 있다. 따라서, 플라스미드(또는 벡터)는 식물을 감염시키기 위해 필요한 서열을 함유할 수 있고, Ti 및/또는 Ri 플라스미드의 유도체가 사용될 수 있다.

대안적으로, 식물의 일부, 예컨대, 잎, 뿌리 또는 줄기의 직접적인 감염이 수행될 수 있다. 이 기법에서 감염될 식물은 예를 들면, 면도칼을 사용한 식물의 절단, 바늘을 사용한 식물의 천공, 또는 연마제를 사용한 식물의 문지르기에 의해 상처를 입을 수 있다. 그 다음, 상처는 아그로박테리움으로 접종된다. 그 다음, 식물 또는 식물의 일부는 적합한 배양 배지 상에서 성장될 수 있고 성숙 식물로 발달될 수 있다. 유전적으로 변경된 식물로의 형질전환된 세포의 재생은 공지되어 있는 기법을 이용함으로써, 예를 들면, 항생제를 사용하여 형질전환된 싹을 선택하고 적절한 영양분, 식물 호르몬 등을 함유하는 배지 상에서 상기 싹을 하위배양함으로써 달성될 수 있다.

본 발명은 본 발명의 셀로바이오하이드롤라제 또는 이의 변이체를 발현하도록 변경된 세포도 포함한다. 이러한 세포는 일시적인 또는 바람직하게는 안정한 고등 진핵 세포주, 예컨대, 포유동물 세포 또는 곤충 세포, 하등 진핵 세포, 예컨대, 효모 및 (예를 들면, 사상) 진균 세포 또는 원핵 세포, 예컨대, 세균 세포를 포함한다.

본 발명의 단백질을 세포주 내에서 또는 막 상에서, 예컨대, 바큘로바이러스 발현 시스템 내에서 일시적으로 발현시키는 것도 가능하다. 본 발명에 따른 단백질을 발현하도록 개조되는 이러한 시스템도 본 발명의 범위 내에 포함된다.

본 발명에 따르면, 본 발명의 폴리펩티드의 제조는 하나 이상의 본 발명의 폴리뉴클레오티드로 형질전환된 미생물 발현 숙주를 보편적인 영양 발효 배지에서 배양함으로써 수행될 수 있다.

폴리펩티드/효소 제조

본 발명에 따른 재조합 숙주 세포는 당분야에서 공지되어 있는 절차를 이용함으로써 배양될 수 있다. 프로모터와 숙주 세포의 각각의 조합의 경우, 폴리펩티드를 코딩하는 DNA 서열의 발현에 기여하는 배양 조건이 이용가능하다. 원하는 세포 밀도 또는 폴리펩티드 역가에 도달한 후, 배양을 중단하고 공지되어 있는 절차를 이용하여 폴리펩티드를 회수한다.

발효 배지는 탄소원(예를 들면, 글루코스, 말토스, 당밀, 전분, 셀룰로스, 자일란, 펙틴, 리그노셀룰로스용해 바이오매스 가수분해물 등), 질소원(예를 들면, 암모늄 설페이트, 암모늄 니트레이트, 암모늄 클로라이드 등), 유기 질소원(예를 들면, 효모 추출물, 맥아 추출물, 펙톤 등) 및 무기 영양분 공급원(예를 들면, 포스페이트, 마그네슘, 칼륨, 아연, 철 등)을 함유하는 공지되어 있는 배양 배지를 포함할 수 있다. 임의적으로, 유도제(예를 들면, 셀룰로스, 펙틴, 자일란, 말토스, 말토덱스트린 또는 자일로갈락투로난)가 포함될 수 있다.

적절한 배지의 선택은 발현 숙주의 선택에 근거할 수 있고/있거나 발현 구축물의 조절 요구에 근거할 수 있다. 이러한 배지는 당업자에게 공지되어 있다. 원하는 경우, 배지는 다른 잠재적 오염 미생물에 비해 형질전환된 발현 숙주에 유리한 추가 성분을 함유할 수 있다.

발효는 약 0.5일 내지 약 30일의 기간에 걸쳐 수행될 수 있다. 발효는 적절하게는 0℃ 내지 100℃ 또는 0℃ 내지 80℃, 예를 들면, 약 0℃ 내지 약 50℃의 온도 및/또는 예를 들면, 약 2 내지 약 10의 pH에서의 회분식, 연속식 또는 유가식 공정일 수 있다. 바람직한 발효 조건은 약 20℃ 내지 약 45℃의 온도 및/또는 약 3 내지 약 9의 pH이다. 적절한 조건은 통상적으로 발현 숙주 및 발현될 단백질의 선택에 근거하여 선택된다.

필요한 경우, 발효 후 세포는 원심분리 또는 여과에 의해 발효 브로쓰로부터 제거될 수 있다. 발효가 중단된 후 또는 세포의 제거 후, 본 발명의 폴리펩티드는 회수될 수 있고, 원하는 경우 보편적인 수단에 의해 정제되고 단리될 수 있다.

폴리펩티드/효소 조성물

본 발명은 본 발명의 폴리펩티드, 및 셀룰라제, 헤미셀룰라제, 펙티나제 및/또는 리그니나제 또는 리그닌 변경 효소를 포함하는 조성물을 제공한다.

본 발명의 폴리펩티드가 셀룰라제인 경우, 본 발명의 조성물은 전형적으로 본 발명의 폴리펩티드 이외에 헤미셀룰라제, 펙티나제 및/또는 리그니나제 또는 리그닌 변경 효소를 포함할 것이다.

본 발명의 폴리펩티드가 헤미셀룰라제인 경우, 본 발명의 조성물은 전형적으로 본 발명의 폴리펩티드 이외에 셀룰라제, 펙티나제 및/또는 리그니나제 또는 리그닌 변경 효소를 포함할 것이다.

본 발명의 폴리펩티드가 펙티나제인 경우, 본 발명의 조성물은 전형적으로 본 발명의 폴리펩티드 이외에 셀룰라제, 헤미셀룰라제 및/또는 리그니나제 또는 리그닌 변경 효소를 포함할 것이다.

본 발명의 폴리펩티드가 리그니나제 또는 리그닌 변경 효소인 경우, 본 발명의 조성물은 전형적으로 본 발명의 폴리펩티드 이외에 셀룰라제, 헤미셀룰라제 및/또는 펙티나제를 포함할 것이다.

본 발명의 조성물은 셀룰라제의 1개, 2개 또는 3개 이상의 클래스, 예를 들면, GH61, 엔도-1,4-β-글루카나제(EG), 엑소-셀로바이오하이드롤라제(CBH) 및 β-글루코시다제(BGL) 중 하나, 둘 또는 전부를 포함할 수 있다.

본 발명의 조성물은 본 발명의 폴리펩티드에 의해 제공된 효소 활성과 동일한 효소 활성, 예를 들면, 동일한 종류의 셀룰라제, 헤미셀룰라제 및/또는 펙티나제 활성을 갖는 폴리펩티드를 포함할 수 있다.

본 발명의 조성물은 본 발명의 폴리펩티드에 의해 제공된 효소 활성과 상이한 종류의 셀룰라제 활성, 헤미셀룰라제 활성 및/또는 펙티나제 활성을 갖는 폴리펩티드를 포함할 수 있다. 예를 들면, 본 발명의 조성물은 본 발명의 폴리펩티드에 의해 제공된 제1종의 셀룰라제 활성, 헤미셀룰라제 활성 및/또는 펙티나제 활성 및 추가 헤미셀룰라제/펙티나제에 의해 제공된 제2종의 셀룰라제 활성, 헤미셀룰라제 활성 및/또는 펙티나제 활성을 포함할 수 있다.

본원에서 셀룰라제는 셀룰로스를 분해할 수 있는 임의의 폴리펩티드이다. 셀룰로스를 분해할 수 있는 폴리펩티드는 셀룰로스를 보다 더 작은 유닛으로 부분적으로(예를 들면, 셀로덱스트린으로) 또는 전체적으로(글루코스 단량체로) 분해하는 과정을 촉진할 수 있는 폴리펩티드이다. 본 발명에 따른 셀룰라제는 셀룰라제와 접촉될 때 셀로덱스트린과 글루코스 단량체의 혼합된 집단을 생성할 수 있다. 이러한 분해는 전형적으로 가수분해 반응에 의해 일어날 것이다.

본원에서 헤미셀룰라제는 헤미셀룰로스를 분해할 수 있는 임의의 폴리펩티드이다. 다시 말해, 헤미셀룰라제는 자일란, 글루쿠로노자일란, 아라비노자일란, 글루코만난 및 자일로글루칸 중 하나 이상을 분해할 수 있다. 헤미셀룰로스를 분해할 수 있는 폴리펩티드는 헤미셀룰로스를 보다 더 작은 폴리사카라이드로 부분적으로(예를 들면, 올리고사카라이드로) 또는 전체적으로(당 단량체, 예를 들면, 헥소스 또는 펜토스 당 단량체로) 분해하는 과정을 촉진할 수 있는 폴리펩티드이다. 본 발명에 따른 헤미셀룰라제는 헤미셀룰라제와 접촉될 때 올리고사카라이드와 당 단량체의 혼합된 집단을 생성할 수 있다. 이러한 분해는 전형적으로 가수분해 반응에 의해 일어날 것이다.

본원에서 펙티나제는 펙틴을 분해할 수 있는 임의의 폴리펩티드이다. 펙틴을 분해할 수 있는 폴리펩티드는 펙틴을 보다 더 작은 유닛으로 부분적으로(예를 들면, 올리고사카라이드로) 또는 전체적으로(당 단량체로) 분해하는 과정을 촉진할 수 있는 폴리펩티드이다. 본 발명에 따른 펙티나제는 펙티나제와 접촉될 때 올리고사카라이드와 당 단량체의 혼합된 집단을 생성할 수 있다. 이러한 분해는 전형적으로 가수분해 반응에 의해 일어날 것이다.

본원에서 리그니나제 또는 리그닌 변경 효소는 리그닌 또는 이의 분해 성분을 분해할 수 있거나 변경시킬 수 있는 임의의 폴리펩티드이다. 리그닌을 분해할 수 있거나 변경시킬 수 있는 폴리펩티드는 리그닌을 보다 더 작은 유닛으로 부분적으로(예를 들면, 모노페놀성 화합물로) 분해하는 과정을 촉진할 수 있는 폴리펩티드이다. 본 발명에 따른 리그니나제 또는 리그닌 변경 효소는 리그닌과 접촉될 때 페놀성 화합물들의 혼합된 집단을 생성할 수 있다. 이러한 분해는 전형적으로 산화 반응에 의해 일어날 것이다. 본원에서 리그니나제 또는 리그닌 변경 효소는 리그닌의 페놀성 분해 생성물을 분해할 수 있는 임의의 폴리펩티드일 수도 있다. 리그닌의 페놀성 분해 생성물을 분해할 수 있는 폴리펩티드는 예를 들면, 페놀성 고리의 개환 반응을 촉진함으로써 리그닌의 페놀성 분해 생성물을 훨씬 더 작은 유닛으로 분해하는 과정을 촉진할 수 있는 폴리펩티드이다. 본 발명에 따른 리그니나제 또는 리그닌 변경 효소는 리그닌의 페놀성 분해 생성물과 접촉될 때 페놀성 화합물의 개환된 분해 생성물들의 혼합된 집단을 생성할 수 있다. 이러한 분해는 전형적으로 산화 반응에 의해 일어날 것이다. 리그니나제 또는 리그닌 변경 효소는 셀룰로스 또는 헤미셀룰로스와 리그닌 또는 이의 분해 생성물 사이의 연결을 더 분해할 수 있다. 리그닌을 분해할 수 있는 효소는 리그닌 퍼록시다제(peroxidase), 망간 퍼록시다제, 락카제(laccase) 및 페룰로일 에스터라제, 및 리그닌 중합체를 탈중합시키거나 다른 방식으로 분해하는 것으로 당분야에서 공지되어 있는 다른 효소를 포함한다. 헤미셀룰로스성 당(특히 아라비노스)와 리그닌 사이에 형성된 결합을 가수분해할 수 있는 효소도 포함된다. 리그니나제는 하기 효소 군을 포함하나 이들로 한정되지 않는다: 리그닌 퍼록시다제(EC 1.11.14), 망간 퍼록시다제(EC 1.11.1.13), 락카제(EC 1.10.3.2) 및 페룰로일 에스터라제(EC 3.1.1.73).

따라서, 본 발명의 조성물은 임의의 셀룰라제, 예를 들면, GH61, 셀로바이오하이드롤라제, 엔도-β-1,4-글루카나제, β-글루코시다제 또는 β-(1,3)(1,4)-글루카나제를 포함할 수 있다.

GH61(글리코사이드 하이드롤라제 패밀리 61, 또는 종종 EGIV로서 지칭됨) 단백질은 최근 문헌에 따르면 산소 의존성 폴리사카라이드 모노옥시게나제(PMO)이다. 종종, 문헌에서 이 단백질은 리그노셀룰로스 기질에 대한 셀룰라제의 작용을 향상시키는 것으로 언급되어 있다. GH61은 처음에 한 패밀리 구성원에서의 매우 약한 엔도-1,4-β-D-글루카나제 활성의 측정에 근거하여 엔도-글루코나제로서 분류되었다. 본원에서 사용된 용어 "GH61"은 공통의 보존된 서열 부분 및 폴딩을 공유하여 잘 확립된 CAZY GH 분류 시스템(http://www.cazy.org/GH61.html)의 패밀리 61로 분류되는 한 효소 패밀리로서 이해되어야 한다. 글리코사이드 하이드롤라제 패밀리 61은 글리코사이드 하이드롤라제 EC 3.2.1의 패밀리의 구성원이다. GH61은 본원에서 셀룰라제의 일부로서 사용된다.

본원에서 셀로바이오하이드롤라제(EC 3.2.1.91)는 셀룰로스 또는 셀로테트라오스에서 1,4-β-D-글루코사이드 연결의 가수분해를 촉진하여 쇄의 비-환원 말단으로부터 셀로바이오스를 방출시킬 수 있는 임의의 폴리펩티드이다. 이 효소는 셀룰라제 1,4-β-셀로바이오시다제, 1,4-β-셀로바이오하이드롤라제, 1,4-β-D-글루칸 셀로바이오하이드롤라제, 아비셀라제, 엑소-1,4-β-D-글루카나제, 엑소-셀로바이오하이드롤라제 또는 엑소-글루카나제로서도 지칭될 수 있다. 상기 효소는 EC 코드 EC 3.2.1.91을 가질 수 있다.

본원에서 엔도-β-1,4-글루카나제(EC 3.2.1.4)는 셀룰로스, 리케닌 또는 곡물 β-D-글루칸에서 1,4-β-D-글루코사이드 연결의 내부가수분해를 촉진할 수 있는 임의의 폴리펩티드이다. 이러한 폴리펩티드는 1,3-연결도 함유하는 β-D-글루칸에서 1,4-연결을 가수분해할 수도 있다. 이 효소는 셀룰라제, 아비셀라제, β-1,4-엔도글루칸 하이드롤라제, β-1,4-글루카나제, 카복시메틸 셀룰라제, 셀루덱스트리나제, 엔도-1,4-β-D-글루카나제, 엔도-1,4-β-D-글루카노하이드롤라제, 엔도-1,4-β-글루카나제 또는 엔도-글루카나제로서도 지칭될 수 있다. 엔도-글루카나제는 β1→4-연결된 글루코스 잔기들(이들 중 대다수는 1-6-연결된 자일로스 측쇄로 치환됨)의 골격인 자일로글루칸의 절단도 촉진할 수 있고, 그 후 상기 효소는 자일로글루칸 특이적 엔도-β-1,4-글루카나제 또는 자일로글루카나제로서도 지칭된다.

본원에서 β-글루코시다제(EC 3.2.1.21)는 β-D-글루코스를 방출시키면서 말단 비-환원 β-D-글루코스 잔기의 가수분해를 촉진할 수 있는 임의의 폴리펩티드이다. 이러한 폴리펩티드는 β-D-글루코사이드에 대한 넓은 특이성을 가질 수 있고 β-D-갈락토사이드, α-L-아라비노사이드, β-D-자일로사이드 및 β-D-푸코사이드 중 하나 이상을 가분해할 수도 있다. 이 효소는 아미그달라제(amygdalase), β-D-글루코사이드 글루코하이드롤라제, 셀로비아제 또는 젠토비아제(gentobiase)로서도 지칭될 수 있다.

본원에서 β-(1,3)(1,4)-글루카나제(EC 3.2.1.73)는 1.3-결합 및 1,4-결합을 함유하는 β-D-글루칸에서 1,4-β-D-글루코사이드 연결의 가수분해를 촉진할 수 있는 임의의 폴리펩티드이다. 이러한 폴리펩티드는 리케닌 및 곡물 β-D-글루칸에 작용할 수 있으나, 1,3-결합 또는 1,4-결합만을 함유하는 β-D-글루칸에는 작용할 수 없다. 이 효소는 리케니나제(licheninase), 1,3-1,4-β-D-글루칸 4-글루카노하이드롤라제, β-글루카나제, 엔도-β-1,3-1,4-글루카나제, 리케나제(lichenase) 또는 혼합된 연결 β-글루카나제로서도 지칭될 수 있다. 이러한 종류의 효소에 대한 대체물은 엔도-1,3(4)-β-글루카나제로서 기재되는 EC 3.2.1.6이다. 이러한 종류의 효소는 가수분해될 연결에 관여하는 환원 기를 갖는 글루코스 잔기 그 자체가 C-3에서 치환될 때 β-D-글루칸에서 1,3-연결 또는 1,4-연결을 가수분해한다. 대안적 명칭은 엔도-1,3-β-글루카나제, 라미나리나제(laminarinase), 및 1,3-(1,3;1,4)-β-D-글루칸 3(4) 글루카노하이드롤라제를 포함하고; 기질은 라미나린, 리케닌 및 곡물 β-D-글루칸을 포함한다.

본 발명의 조성물은 임의의 헤미셀룰라제, 예를 들면, 엔도-자일라나제, β-자일로시다제, α-L-아라바이오노푸라노시다제, α-D-글루쿠로니다제, 셀로바이오하이드롤라제, 페룰로일 에스터라제, 쿠마로일 에스터라제, α-갈락토시다제, β-갈락토시다제, β-만나나제 또는 β-만노시다제를 포함할 수 있다.

본원에서 엔도-자일라나제(EC 3.2.1.8)는 자일란에서 1,4-β-D-자일로사이드 연결의 엔도-가수분해를 촉진할 수 있는 임의의 폴리펩티드이다. 이 효소는 엔도-1,4-β-자일라나제 또는 1,4-β-D-자일란 자일라노하이드롤라제로서도 지칭될 수 있다. 대체물은 글루쿠로노아라비노자일란에서 1,4-자일로사이드 연결을 가수분해할 수 있는 효소인 글루쿠로노아라비노자일란 엔도-자일라나제(EC 3.2.1.136)이다.

본원에서 β-자일로시다제(EC 3.2.1.37; GH3)는 1,4-β-D-자일란의 가수분해를 촉진하여 비-환원 말단으로부터 연속 D-자일로스 잔기를 제거할 수 있는 임의의 폴리펩티드이다. 이러한 효소는 자일로바이오스도 가수분해할 수 있다. 이 효소는 자일란 1,4-β-자일로시다제, 1,4-β-D-자일란 자일로하이드롤라제, 엑소-1,4-β-자일로시다제 또는 자일로비아제로서도 지칭될 수 있다.

본원에서 α-D-글루쿠로니다제(EC 3.2.1.139)는 하기 형태의 반응을 촉진할 수 있는 임의의 폴리펩티드이다: α-D-글루쿠로노사이드 + H(2)O = 알코올 + D-글루쿠로네이트. 이 효소는 α-글루쿠로니다제 또는 α-글루코시듀로나제로서 지칭될 수도 있다. 이 효소는 자일란에 치환기로서 존재할 수도 있는 4-O-메틸화된 글루코론산을 가수분해할 수도 있다. 대체물은 α-1,2-(4-O-메틸)글루쿠로노실 연결의 가수분해를 촉진하는 자일란 α-1,2-글루쿠로노시다제(EC 3.2.1.131)이다.

본원에서 아세틸 자일란 에스터라제(EC 3.1.1.72)는 자일란 및 자일로-올리고사카라이드의 탈아세틸화를 촉진할 수 있는 임의의 폴리펩티드이다. 이러한 폴리펩티드는 중합체성 자일란, 아세틸화된 자일로스, 아세틸화된 글루코스, α-나프틸 아세테이트 또는 p-니트로페닐 아세테이트로부터의 아세틸 기의 가수분해를 촉진할 수 있으나, 전형적으로 트라이아세틸글리세롤로부터의 아세틸 기의 가수분해를 촉진할 수는 없다. 이러한 폴리펩티드는 전형적으로 아세틸화된 만난 또는 펙틴에 작용하지 않는다.

본원에서 페룰로일 에스터라제(EC 3.1.1.73)는 하기 형태의 반응을 촉진할 수 있는 임의의 폴리펩티드이다: 페룰로일-사카라이드 + H(2)O = 페룰레이트 + 사카라이드. 사카라이드는 예를 들면, 올리고사카라이드 또는 폴리사카라이드일 수 있다. 상기 효소는 전형적으로 에스터화된 당(통상적으로 '천연' 기질에서 아라비노스)으로부터의 4-하이드록시-3-메톡시신나모일(페룰로일) 기의 가수분해를 촉진할 수 있다. p-니트로페놀 아세테이트 및 메틸 페룰레이트는 전형적으로 보다 더 약한 기질이다. 이 효소는 신나모일 에스터 하이드롤라제, 페룰산 에스터라제 또는 하이드록시신나모일 에스터라제로서도 지칭될 수 있다. 상기 효소는 자일라나제 및 펙티나제가 식물 세포벽 헤미셀룰로스 및 펙틴을 분해하는 것을 도울 수 있기 때문에 헤미셀룰라제 보조 효소로서도 지칭될 수 있다.

본원에서 쿠마로일 에스터라제(EC 3.1.1.73)는 하기 형태의 반응을 촉진할 수 있는 임의의 폴리펩티드이다: 쿠마로일-사카라이드 + H(2)O = 쿠마레이트 + 사카라이드. 사카라이드는 예를 들면, 올리고사카라이드 또는 폴리사카라이드일 수 있다. 이 효소는 트랜스-4-쿠마로일 에스터라제, 트랜스-p-쿠마로일 에스터라제, p-쿠마로일 에스터라제 또는 p-쿠마르산 에스터라제로서도 지칭될 수 있다. 이 효소는 EC 3.1.1.73 내에도 속하므로, 페룰로일 에스터라제로서도 지칭될 수 있다.

본원에서 α-갈락토시다제(EC 3.2.1.22)는 갈락토스 올리고사카라이드, 갈락토만난, 갈락탄 및 아라비노갈락탄을 비롯한 α-D-갈락토사이드에서 말단 비-환원 α-D-갈락토스 잔기의 가수분해를 촉진할 수 있는 임의의 폴리펩티드이다. 이러한 폴리펩티드는 α-D-푸코사이드를 가수분해할 수도 있다. 이 효소는 멜리비아제로서도 지칭될 수 있다.

본원에서 β-갈락토시다제(EC 3.2.1.23)는 β-D-갈락토사이드에서 말단 비-환원 β-D-갈락토스 잔기의 가수분해를 촉진할 수 있는 임의의 폴리펩티드이다. 이러한 폴리펩티드는 α-L-아라비노사이드를 가수분해할 수도 있다. 이 효소는 엑소-(1→4)-β-D-갈락타나제 또는 락타제로서도 지칭될 수 있다.

본원에서 β-만나나제(EC 3.2.1.78)는 만난, 갈락토만난 및 글루코만난에서 1,4-β-D-만노사이드 연결의 무작위 가수분해를 촉진할 수 있는 임의의 폴리펩티드이다. 이 효소는 만난 엔도-1,4-β-만노시다제 또는 엔도-1,4-만나나제로서도 지칭될 수 있다.

본 발명의 조성물은 임의의 펙티나제, 예를 들면, 엔도-폴리갈락투로나제, 펙틴 메틸 에스터라제, 엔도-갈락타나제, β-갈락토시다제, 펙틴 아세틸 에스터라제, 엔도-펙틴 라이아제, 펙테이트 라이아제, α-람노시다제, 엑소-갈락투로나제, 엑소-폴리갈락투로네이트 라이아제, 람노갈락투로난 하이드롤라제, 람노갈락투로난 라이아제, 람노갈락투로난 아세틸 에스터라제, 람노갈락투로난 갈락투로노하이드롤라제 또는 자일로갈락투로나제를 포함할 수 있다.

본원에서 엔도-폴리갈락투로나제(EC 3.2.1.15)는 펙테이트 및 다른 갈락투로난에서 1,4-α-D-갈락토시듀론 연결의 무작위 가수분해를 촉진할 수 있는 임의의 폴리펩티드이다. 이 효소는 폴리갈락투로나제 펙틴 탈중합효소, 펙티나제, 엔도-폴리갈락투로나제, 펙트롤라제, 펙틴 하이드롤라제, 펙틴 폴리갈락투로나제, 폴리-α-1,4-갈락투로나이드 글리카노하이드롤라제, 엔도-갈락투로나제, 엔도-D-갈락투로나제 또는 폴리(1,4-α-D-갈락투로나이드) 글리카노하이드롤라제로서도 지칭될 수 있다.

본원에서 펙틴 메틸 에스터라제(EC 3.1.1.11)는 하기 반응을 촉진할 수 있는 임의의 효소이다: 펙틴 + n H₂O = n 메탄올 + 펙테이트. 상기 효소는 펙틴 에스터라제, 펙틴 데메톡실라제, 펙틴 메톡실라제, 펙틴 메틸에스터라제, 펙타제, 펙티노에스터라제 또는 펙틴 펙틸하이드롤라제로서도 공지되어 있을 수 있다.

본원에서 엔도-갈락타나제(EC 3.2.1.89)는 아라비노갈락탄에서 1,4-β-D-갈락토사이드 연결의 내부가수분해를 촉진할 수 있는 임의의 효소이다. 상기 효소는 아라비노갈락탄 엔도-1,4-β-갈락토시다제, 엔도-1,4-β-갈락타나제, 갈락타나제, 아라비노갈락타나제 또는 아라비노갈락탄 4-β-D-갈락타노하이드롤라제로서도 공지되어 있을 수 있다.

본원에서 펙틴 아세틸 에스터라제는 펙틴의 GalUA 잔기의 하이드록실 기에서 아세틸 기의 탈아세틸화를 촉진하는 아세틸 에스터라제 활성을 갖는 임의의 효소로서 정의된다.

본원에서 엔도-펙틴 라이아제(EC 4.2.2.10)는 (1→4)-α-D-갈락투로난 메틸 에스터의 제거적 절단을 촉진하여 그의 비-환원 말단에서 4-데옥시-6-O-메틸-α-D-갈락트-4-에누로노실 기를 갖는 올리고사카라이드를 제공할 수 있는 임의의 효소이다. 상기 효소는 펙틴 라이아제, 펙틴 트랜스엘리미나제(transeliminase), 엔도-펙틴 라이아제, 폴리메틸갈락투론산 트랜스엘리미나제, 펙틴 메틸트랜스엘리미나제, 펙토라이아제, PL, PNL 또는 PMGL 또는 (1→4)-6-O-메틸-α-D-갈락투로난 라이아제로서도 공지되어 있을 수 있다.

본원에서 펙테이트 라이아제(EC 4.2.2.2)는 (1→4)-α-D-갈락투로난의 제거적 절단을 촉진하여 그의 비-환원 말단에서 4-데옥시-α-D-갈락트-4-에누로노실 기를 갖는 올리고사카라이드를 제공할 수 있는 임의의 효소이다. 상기 효소는 폴리갈락투론산 트랜스엘리미나제, 펙트산 트랜스엘리미나제, 폴리갈락투로네이트 라이아제, 엔도-펙틴 메틸트랜스엘리미나제, 펙테이트 트랜스엘리미나제, 엔도-갈락투로네이트 트랜스엘리미나제, 펙트산 라이아제, 펙틱 라이아제, α-1,4-D-엔도-폴리갈락투론산 라이아제, PGA 라이아제, PPase-N, 엔도-α-1,4-폴리갈락투론산 라이아제, 폴리갈락투론산 라이아제, 펙틴 트랜스엘리미나제, 폴리갈락투론산 트랜스엘리미나제 또는 (1→4)-α-D-갈락투로난 라이아제로서도 공지되어 있을 수 있다.

본원에서 α-람노시다제(EC 3.2.1.40)는 α-L-람노사이드 또는 대안적으로 람노갈락투로난에서 말단 비-환원 α-L-람노스 잔기의 가수분해를 촉진할 수 있는 임의의 폴리펩티드이다. 이 효소는 α-L-람노시다제 T, α-L-람노시다제 N 또는 α-L-람노사이드 람노하이드롤라제로서도 공지되어 있을 수 있다.

본원에서 엑소-갈락투로나제(EC 3.2.1.82)는 비-환원 말단으로부터 펙트산을 가수분해하여 다이갈락투로네이트를 방출시킬 수 있는 임의의 폴리펩티드이다. 상기 효소는 엑소-폴리-α-갈락투로노시다제, 엑소-폴리갈락투로노시다제 또는 엑소-폴리갈락투라노시다제로서도 공지되어 있을 수 있다.

본원에서 엑소-갈락투로나제(EC 3.2.1.67)는 하기 반응을 촉진할 수 있는 임의의 폴리펩티드이다: (1,4-α-D-갈락투로나이드)_n + H₂O = (1,4-α-D-갈락투로나이드)_n-1 + D-갈락투로네이트. 상기 효소는 갈락투란 1,4-α-갈락투로니다제, 엑소-폴리갈락투로나제, 폴리(갈락투로네이트) 하이드롤라제, 엑소-D-갈락투로나제, 엑소-D-갈락투로나제, 엑소-폴리-D-갈락투로나제 또는 폴리(1,4-α-D-갈락투로나이드) 갈락투로노하이드롤라제로서도 공지되어 있을 수 있다.

본원에서 엑소-폴리갈락투로네이트 라이아제(EC 4.2.2.9)는 펙테이트, 즉 탈에스터화된 펙틴의 환원 말단으로부터 4-(4-데옥시-α-D-갈락트-4-에누로노실)-D-갈락투로네이트의 제거적 절단을 촉진할 수 있는 임의의 폴리펩티드이다. 이 효소는 펙테이트 다이사카라이드-라이아제, 펙테이트 엑소-라이아제, 엑소-펙트산 트랜스엘리미나제, 엑소-펙테이트 라이아제, 엑소-폴리갈락투론산-트랜스엘리미나제, PATE, 엑소-PATE, 엑소-PGL 또는 (1→4)-α-D-갈락투로난 환원 말단-다이사카라이드-라이아제로서 공지되어 있을 수 있다.

본원에서 람노갈락투로난 하이드롤라제는 다이사카라이드[(1,2-α-L-람노일-(1,4)-α-갈락토실유론산]로 구성된, 엄격히 교대로 존재하는 람노갈락투로난 구조물에서 갈락토실유론산과 람노피라노실 사이의 연결을 엔도 방식으로 가수분해할 수 있는 임의의 폴리펩티드이다.

본원에서 람노갈락투로난 라이아제는 β-제거를 통해 람노갈락투로난에서 α-L-Rhap-(1→4)-α-D-GalpA 연결을 엔도 방식으로 절단할 수 있는 임의의 폴리펩티드이다.

본원에서 람노갈락투로난 아세틸 에스터라제는 람노갈락투로난에서 교대로 존재하는 람노스와 갈락투론산 잔기로 구성된 골격의 탈아세틸화를 촉진하는 임의의 폴리펩티드이다.

본원에서 람노갈락투로난 갈락투로노하이드롤라제는 엄격히 교대로 존재하는 람노갈락투로난 구조물의 비-환원 말단으로부터 갈락투론산을 엑소 방식으로 가수분해할 수 있는 임의의 폴리펩티드이다.

본원에서 자일로갈락투로나제는 β-자일로스 치환된 갈락투론산 골격을 엔도 방식으로 절단함으로써 자일로갈락투로난에 작용하는 임의의 폴리펩티드이다. 이 효소는 자일로갈락투로난 하이드롤라제로서도 공지되어 있을 수 있다.

본원에서 엔도-아라비나제(EC 3.2.1.99)는 1,5-아라비난에서 1,5-α-아라비노푸라노사이드 연결의 내부가수분해를 촉진할 수 있는 임의의 폴리펩티드이다. 이 효소는 엔도-아라비나제, 아라비난 엔도-1,5-α-L-아라비노시다제, 엔도-1,5-α-L-아라비나나제, 엔도-α-1,5-아라바나제, 엔도-아라바나제 또는 1,5-α-L-아라비난 1,5-α-L-아라비나노하이드롤라제로서도 공지되어 있을 수 있다.

본 발명의 조성물은 전형적으로 하나 이상의 셀룰라제, 하나 이상의 헤미셀룰라제 및/또는 하나 이상의 펙티나제(이들 중 하나는 본 발명에 따른 폴리펩티드임)를 포함할 것이다. 본 발명의 조성물은 셀로바이오하이드롤라제, 엔도-글루카나제 및/또는 β-글루코시다제를 포함할 수 있다. 이러한 조성물은 하나 이상의 헤미셀룰라제 및/또는 하나 이상의 펙티나제도 포함할 수 있다.

하나 이상의(예를 들면, 2개의, 3개의, 4개의 또는 모든) 아밀라제, 프로테아제, 리파제, 리그니나제, 헥소실트랜스퍼라제 또는 글루쿠로니다제가 본 발명의 조성물에 존재할 수 있다.

"프로테아제"는 펩티드 결합을 가수분해하는 효소(펩티다제)뿐만 아니라 펩티드와 다른 모이어티, 예컨대, 당 사이의 결합을 가수분해하는 효소(글리코펩티다제)도 포함한다. 많은 프로테아제들이 EC 3.4 하에서 특징규명되어 있고 본원에 참고로 도입되는 발명에서 사용되기에 적합하다. 일부 특정 종류의 프로테아제들은 펩신 및 파파인을 비롯한 시스테인 프로테아제, 및 카이모트립신, 카복시펩티다제 및 메탈로엔도-펩티다제를 비롯한 세린 프로테아제를 포함한다.

"리파제"는 지질, 지방산, 및 아실글리세라이드(포스포글리세라이드, 지단백질, 다이아실글리세롤 등을 포함함)를 가수분해하는 효소를 포함한다. 식물에서, 지질은 수분 손실 및 병원체 감염을 제한하는 구조 성분으로서 사용된다. 이들 지질들은 지방산으로부터 유도된 왁스뿐만 아니라 쿠틴 및 수베린도 포함한다.

"헥소실트랜스퍼라제"(2.4.1-)는 글리코실 기, 보다 구체적으로 헥소실 기를 전달할 수 있는 효소를 포함한다. 글리코실 기를 글리코실 함유 공여자로부터 또 다른 글리코실 함유 화합물로 전달하는 것 이외에, 상기 효소는 글리코실 기를 수용자인 물에게 전달할 수도 있다. 이 반응은 전달 반응 대신에 가수분해 반응으로서도 공지되어 있다. 본 발명에서 사용될 수 있는 헥소실트랜스퍼라제의 한 예는 β-글루카노실트랜스퍼라제이다. 이러한 효소는 (1,3)(1,4)글루칸, 셀룰로스 및/또는 셀룰로스 분해 생성물의 분해를 촉진할 수 있다.

"글루쿠로니다제"는 글루쿠로노사이드, 예를 들면, β-글루쿠로노사이드의 가수분해를 촉진하여 알코올을 생성하는 효소를 포함한다. 많은 글루쿠로니다제들, 예를 들면, β-글루쿠로니다제(EC 3.2.1.31), 하이알루로노-글루쿠로니다제(EC 3.2.1.36), 글루쿠로노실-다이설포글루코스아민 글루쿠로니다제(3.2.1.56), 글리시리지네이트 β-글루쿠로니다제(3.2.1.128) 또는 α-D-글루쿠로니다제(EC 3.2.1.139)가 특징규명되어 있고 본 발명에서 사용되기에 적합할 수 있다.

본 발명의 조성물은 익스팬신(expansin) 또는 익스팬신 유사 단백질, 예컨대, 스왈레닌(swollenin)(문헌(Salheimo et al., Eur. J. Biochem. 269, 4202-4211, 2002) 참조) 또는 스왈레닌 유사 단백질을 포함할 수 있다.

익스팬신은 식물 세포 생장 동안 세포벽 구조가 느슨해지는 것에 관여한다. 익스팬신은 가수분해 활성을 갖지 않으면서 셀룰로스와 다른 세포벽 폴리사카라이드 사이의 수소 결합을 파괴하는 것으로 제안되었다. 이 방식으로, 익스팬신은 셀룰로스 섬유의 활주 및 세포벽의 확장을 가능하게 하는 것으로 생각된다. 익스팬신 유사 단백질인 스왈레닌은 N-말단 탄수화물 결합 모듈 패밀리 1 도메인(CBD) 및 C-말단 익스팬신 유사 도메인을 함유한다. 본 발명의 목적상, 익스팬신 유사 단백질 또는 스왈레닌 유사 단백질은 이러한 도메인들 중 하나 또는 둘다를 포함할 수 있고/있거나, 임의적으로 검출가능한 양의 환원 당을 생성하지 않으면서 세포벽의 구조를 파괴(예컨대, 셀룰로스 구조를 파괴)할 수 있다.

본 발명의 조성물은 셀룰로스 삽입 단백질, 스카폴딘(scaffoldin) 또는 스카폴딘 유사 단백질, 예를 들면, 클로스트리듐 써모셀룸(Clostridium thermocellum) 또는 클로스트리듐 셀룰로라이티쿰(Clostridium cellulolyticum)으로부터의 각각 CipA 또는 CipC의 폴리펩티드 생성물을 포함할 수 있다.

스카폴딘 및 셀룰로스 삽입 단백질은 셀룰로스용해 서브유닛을 다중-효소 복합체로 조직화할 수 있는 다중-기능 삽입 서브유닛이다. 이것은 2개의 상보적인 클래스의 도메인, 즉 스카폴딘 상의 점착 도메인과 각각의 효소 유닛 상의 독케린(dockerin) 도메인의 상호작용에 의해 달성된다. 스카폴딘 서브유닛은 셀룰로좀이 그의 기질에 부착하는 것을 매개하는 셀룰로스 결합 모듈(CBM)도 보유한다. 본 발명의 목적상 스카폴딘 또는 셀룰로스 삽입 단백질은 이러한 도메인들 중 하나 또는 둘다를 포함할 수 있다.

본 발명의 조성물은 예를 들면, 트라이코데르마 리세이(Trichoderma reesei)/하이포크레아 자코리나(Hypocrea jacorina)로부터의 cip1 또는 cip2 유전자 또는 유사한 유전자에 의해 코딩된 셀룰로스-유도된 단백질 또는 조절 단백질을 포함할 수 있다(문헌(Foreman et al., J. Biol. Chem. 278(34), 31988-31997, 2003) 참조). 이들 유전자들의 폴리펩티드 생성물은 셀룰로스 결합 모듈, 및 공지되어 있는 글리코실 하이드롤라제 패밀리와 관련되어 있지 않을 수 있는 기능 또는 활성을 갖는 도메인을 함유하는 바이모듈 단백질이다. 셀룰로스 결합 모듈의 존재 및 셀룰라제 성분에 의한 이들 유전자들의 발현의 공-조절은 바이오매스 분해에 있어서 잠재적 역할을 갖는 이전에 인식되지 않은 활성을 시사한다.

본 발명의 조성물은 전술된 각각의 폴리펩티드 클래스의 구성원, 한 폴리펩티드 클래스의 여러 구성원, 또는 이들 폴리펩티드 클래스들의 임의의 조합물로 구성될 수 있다.

본 발명의 조성물은 (1) 상업적 공급처; (2) 폴리펩티드, 예를 들면, 효소를 발현하는 클로닝된 유전자; (3) 복합 브로쓰(예컨대, 단백질 및 효소를 배지 내로 분비하는 미생물 균주가 배지에서 생장함으로써 생성된 복합 브로쓰); (4) (3)에서와 같이 생장된 균주의 세포 용해물; 및/또는 (5) 폴리펩티드, 예를 들면, 효소를 발현하는 식물 물질로부터의 폴리펩티드, 예를 들면, 효소로 구성될 수 있다. 본 발명의 조성물 중의 상이한 폴리펩티드, 예를 들면, 효소는 상이한 공급원으로부터 입수될 수 있다.

폴리펩티드의 용도

본 발명에 따른 폴리펩티드 및 폴리펩티드 조성물은 많은 상이한 적용분야에서 사용될 수 있다. 예를 들면, 이들은 발효가능한 당의 제조에 사용될 수 있다. 발효가능한 당은 바이오연료 공정의 일부로서 바이오가스 또는 에탄올, 부탄올, 이소부탄올, 2-부탄올 또는 다른 적합한 물질로 전환될 수 있다. 대안적으로, 폴리펩티드 및 이의 조성물은 예를 들면, 식품의 제조, 세제 조성물, 종이 및 펄프 산업, 항균 제제, 약품, 예컨대, 인후 로젠지, 치약 및 구강세척제에서 효소로서 사용될 수 있다. 용도 중 일부는 이하에 보다 더 상세히 예시될 것이다.

이하에 기재된 용도 및 방법에서, 전술된 조성물의 성분들은 동시에(즉, 단일 조성물 그 자체로서), 별도로 또는 순차적으로 제공될 수 있다.

또한, 본 발명은 산업 공정에서 본 발명에 따른 셀로바이오하이드롤라제 및 이러한 효소를 포함하는 조성물의 용도에 관한 것이다.

이 공정에 대해 수득된 장기간 경험에도 불구하고, 본 발명에 따른 셀로바이오하이드롤라제는 현재 사용되는 효소들에 비해 다수의 유의한 장점들을 특징으로 할 수 있다. 구체적인 적용분야에 따라, 이들 장점들은 양태, 예컨대, 보다 더 낮은 생산 비용, 기질에 대한 보다 더 높은 특이성, 감소된 항원성, 보다 더 적은 바람직하지 않은 부작용, 적합한 미생물에서 생성될 때 보다 더 높은 수율, 보다 더 큰 적합한 pH 및 온도 범위, 소수성 리그닌-유도된 생성물에 의한 비-억제 또는 보다 더 낮은 생성물 억제, 또는 식품 산업의 경우 최종 생성물의 보다 더 우수한 맛 또는 식감뿐만 아니라 식품 등급 및 코셔(kosher) 양태를 포함할 수 있다.

원칙적으로, 본 발명의 셀로바이오하이드롤라제 또는 조성물은 폴리사카라이드를 포함하는 물질의 처리를 필요로 하는 임의의 공정에서 사용될 수 있다. 따라서, 본 발명의 폴리펩티드 또는 조성물은 폴리사카라이드 물질의 처리에 사용될 수 있다. 본원에서 폴리사카라이드 물질은 하나 이상, 전형적으로 하나 초과의 폴리사카라이드를 포함하거나 본질적으로 이러한 폴리사카라이드로 구성된 물질이다.

전형적으로, 식물 및 이로부터 유래된 물질은 상당한 양의 비-전분 폴리사카라이드 물질을 포함한다. 따라서, 본 발명의 폴리펩티드는 식물 또는 진균 물질, 또는 이로부터 유도된 물질의 처리에 사용될 수 있다.

리그노셀룰로스

식물 비-전분 폴리사카라이드 물질의 중요한 성분은 리그노셀룰로스(본원에서 리그노셀룰로스용해 바이오매스로서도 지칭됨)이다. 리그노셀룰로스는 셀룰로스, 헤미셀룰로스 및 리그닌을 포함하는 식물 물질이다. 탄수화물 중합체(셀룰로스 및 헤미셀룰로스)는 수소결합 및 공유결합에 의해 리그닌에 단단히 결합된다. 따라서, 본 발명의 폴리펩티드는 리그노셀룰로스용해 물질의 처리에 사용될 수 있다. 본원에서 리그노셀룰로스용해 물질은 리그노셀룰로스를 포함하거나 본질적으로 리그노셀룰로스로 구성된 물질이다. 따라서, 비-전분 폴리사카라이드를 처리하는 본 발명의 방법에서 비-전분 폴리사카라이드는 리그노셀룰로스성 물질/바이오매스일 수 있다.

따라서, 본 발명은 비-전분 폴리사카라이드를 포함하는 기질을 처리하는 방법을 제공하고, 이때 상기 처리는 셀룰로스, 헤미셀룰로스 및/또는 펙틴성 물질의 분해, 가수분해 및/또는 변경을 포함한다.

이와 관련하여 분해는 상기 처리가 셀룰로스, 헤미셀룰로스 및/또는 펙틴성 물질의 가수분해 생성물을 생성한다는 것, 즉 유사한 비처리된 비-전분 폴리사카라이드에 존재하는 것보다 더 짧은 길이의 사카라이드가 처리의 결과로서 존재한다는 것을 시사한다. 따라서, 이와 관련하여 분해는 올리고사카라이드 및/또는 당 단량체를 유리시킬 수 있다.

모든 식물들은 사실상 모든 식물 유래의 폴리사카라이드 물질들처럼 비-전분 폴리사카라이드를 함유한다. 따라서, 비-전분 폴리사카라이드를 포함하는 기질을 처리하는 본 발명의 방법에서 상기 기질은 식물 또는 식물 유래의 물질의 형태, 또는 식물 또는 식물 유래의 물질을 포함하는 물질, 예를 들면, 식물 펄프, 식물 추출물, 식품 또는 이의 성분, 옷감, 직물 또는 의복의 형태로 제공될 수 있다.

본 발명에서 사용되기에 적합한 리그노셀룰로스용해 바이오매스는 바이오매스를 포함하고 순수 바이오매스 및/또는 비-순수 바이오매스, 예컨대, 농업 바이오매스, 상업 유기물, 건축 및 파괴 잔해, 자치도시 고체 폐기물, 폐지 및 구내 폐기물을 포함할 수 있다. 흔한 형태의 바이오매스는 나무, 관목 및 잔디, 밀, 밀짚, 사탕수수 찌꺼기, 옥수수, 옥수수 껍질, 옥수수 속대, 옥수수 알(알로부터의 섬유를 포함함), 곡물, 예컨대, 옥수수, 밀 및 보리의 제분(습식 제분 및 건식 제분을 포함함)으로부터의 생성물 및 부산물(종종 "겨 또는 섬유"로서 지칭됨)뿐만 아니라, 자치도시 고체 폐기물, 폐지 및 구내 폐기물도 포함한다. 바이오매스는 초본 물질, 농업 잔류물, 임업 잔류물, 자치도시 고체 폐기물, 폐지, 및 펄프 및 종이 제분 잔류물일 수도 있으나 이들로 한정되지 않는다. "농업 바이오매스"는 가지, 덤불, 줄기, 옥수수 및 옥수수 껍질, 에너지 작물, 숲, 과일, 꽃, 곡물, 잔디, 초본 작물, 잎, 나무껍질, 솔잎, 통나무, 뿌리, 묘목, 짧은 회전 목재 작물, 관목, 수수, 나무, 채소, 과일 껍질, 포도나무, 사탕무 펄프, 밀 분쇄물, 귀리 껍질, 및 경질 및 연질 목재(유해한 물질을 갖는 목재를 포함하지 않음)를 포함한다. 추가로, 농업 바이오매스는 농사 및 임업 활동을 포함하는 농업 공정으로부터 발생된 유기 폐기 물질(구체적으로, 산림 목재 폐기물을 포함함)을 포함한다. 농업 바이오매스는 단독으로 존재하거나 임의의 조합물 또는 혼합물로 존재하는 상기 언급된 물질들 중 임의의 물질일 수 있다. 적합한 바이오매스의 추가 예는 과수원 밑자리 잎, 수풀, 제분 폐기물, 도시 목재 폐기물, 자치도시 폐기물, 벌목 폐기물, 산림 간벌, 짧은 회전 목재 작물, 산업 폐기물, 밀짚, 귀리짚, 벼짚, 보리짚, 호밀짚, 아마짚, 대두 껍질, 벼 껍질, 벼짚, 옥수수 글루텐 사료, 귀리 껍질, 사탕수수, 옥수수대, 옥수수 줄기, 옥수수 속대, 옥수수 껍질, 대초원 목초, 가마그래스(gamagrass), 뚝새풀, 사탕무 펄프, 시트러스 과일 펄프, 종자 껍질, 셀룰로스성 동물 폐기물, 잔디 절단조각, 목화, 해초, 나무, 관목, 잔디, 밀, 사탕수수 찌꺼기, 옥수수, 옥수수 속대, 옥수수 알, 알로부터의 섬유, 곡물의 습식 또는 건식 제분으로부터의 생성물 및 부산물, 자치도시 고체 폐기물, 폐지, 구내 폐기물, 초본 물질, 농업 잔류물, 임업 잔류물, 펄프, 종이 제분 잔류물, 가지, 덤불, 줄기, 에너지 작물, 숲, 과일, 꽃, 곡물, 초본 작물, 잎, 나무껍질, 솔잎, 통나무, 뿌리, 묘목, 수수, 채소, 과일 껍질, 포도나무, 사탕무 펄프, 밀 분쇄물, 및 경질 및 연질 목재, 농업 과정으로부터 발생된 유기 폐기 물질, 산림 목재 폐기물, 또는 이들 중 임의의 둘 이상의 물질들의 조합물이다.

식품 및 사료 또는 종이 및 펄핑 산업에서 이미 가공된 순수한 바이오매스 또는 공급원료와 별도로, 효소 분해를 향상시키기 위해 바이오매스/공급원료는 열, 기계적 및/또는 화학적 변경, 또는 이러한 방법들의 임의의 조합에 의해 추가로 전처리될 수 있다.

전처리

효소 처리 전에, 효소 가수분해에의 기질의 접근성을 향상시키고/시키거나, 헤미셀룰로스를 가수분해하고/하거나, 헤미셀룰로스, 셀룰로스 및/또는 리그닌을 가용화시키기 위해 공급원료는 임의적으로 당분야에서 공지되어 있는 임의의 방식으로 열, 기계적 및/또는 화학적 변경, 또는 이러한 방법들의 임의의 조합에 의해 전처리될 수 있다. 전처리는 리그노셀룰로스성 물질을 (고온) 물, 증기(증기 폭발), 산, 염기, 용매, 열, 퍼록사이드, 오존, 기계적 채썰기(shredding), 연마, 제분 또는 신속한 압력제거, 또는 이들 중 임의의 둘 이상의 조합에 노출시키는 단계를 포함할 수 있다. 이 화학적 전처리는 종종 열 전처리, 예를 들면, 1분 내지 30분 동안 150℃ 내지 220℃에서의 전처리와 조합된다.

전당화(presaccharification)

전처리 단계 후, 효소 또는 효소 혼합물과의 항온처리를 수반하는 액화/가수분해 또는 전당화 단계가 이용될 수 있다. 전당화 단계는 많은 상이한 온도에서 수행될 수 있으나, 전당화 단계는 시험되는 효소 혼합물에 가장 잘 맞는 온도, 또는 시험되는 효소의 예상된 효소 최적 온도에서 일어나는 것이 바람직하다. 전당화 단계의 온도는 약 10℃ 내지 약 95℃, 약 20℃ 내지 약 85℃, 약 30℃ 내지 약 70℃, 약 40℃ 내지 약 60℃, 약 37℃ 내지 약 50℃, 바람직하게는 약 37℃ 내지 약 80℃, 보다 바람직하게는 약 60℃ 내지 70℃, 훨씬 더 바람직하게는 약 65℃일 수 있다. 전당화 혼합물의 pH는 약 2.0 내지 약 10.0일 수 있으나, 바람직하게는 약 3.0 내지 약 7.0, 보다 바람직하게는 약 4.0 내지 약 6.0, 훨씬 더 바람직하게는 약 4.0 내지 약 5.0이다. 또한, pH는 효소 활성을 최대화하도록 조절될 수 있고 효소의 첨가에 의해 조절될 수 있다. 이 시험으로부터의 분석 결과의 비교는 방법을 시험되는 효소에 가장 잘 맞도록 변경시킬 수 있게 할 것이다.

액화/가수분해 또는 전당화 단계 반응은 수분 내지 수시간, 예컨대, 약 1시간 내지 약 120시간, 바람직하게는 약 2시간 내지 약 48시간, 보다 바람직하게는 약 2시간 내지 약 24시간, 가장 바람직하게는 약 2시간 내지 약 6시간 동안 일어날 수 있다. 셀룰라제 처리는 수분 내지 수시간, 예컨대, 약 6시간 내지 약 120시간, 바람직하게는 약 12시간 내지 약 72시간, 보다 바람직하게는 약 24시간 내지 48시간 동안 일어날 수 있다.

당화

본 발명은 리그노셀룰로스성 물질로부터 당을 제조하는 방법으로서, 본 발명의 폴리펩티드 또는 본 발명의 조성물을 리그노셀룰로스성 물질과 접촉시키는 단계를 포함하는 방법을 제공한다.

이러한 방법은 자유 당(단량체) 및/또는 올리고사카라이드가 리그노셀룰로스성 바이오매스로부터 생성될 수 있게 한다. 이 방법은 본 발명의 폴리펩티드 또는 조성물을 사용하여 리그노셀룰로스성 바이오매스를 자유 당 및 작은 올리고사카라이드로 전환시키는 단계를 포함한다.

복합 탄수화물, 예컨대, 리그노셀룰로스를 당으로 전환시키는 공정은 바람직하게는 발효가능한 당으로의 전환을 가능하게 한다. 이러한 공정은 "당화"로서 지칭될 수 있다. 따라서, 본 발명의 방법은 하나 이상의 헥소스 및/또는 펜토스 당, 예컨대, 글루코스, 자일로스, 아라비노스, 갈락토스, 갈락투론산, 글루쿠론산, 만노스, 람노스, 리보스 및 프럭토스 중 하나 이상을 유리시킬 수 있다.

따라서, 본 발명의 또 다른 양태는 추가 효소 또는 물리적 처리, 예컨대, 온도 및 pH와 함께 전술된 본 발명의 폴리펩티드 또는 조성물을 사용하여 리그노셀룰로스성 식물 바이오매스를 당 및 올리고사카라이드로 전환시키는 방법을 포함한다.

조성물이 단일 혼합물로서 논의되어 있지만, 온도, pH 및 다른 조건이 각각의 개별 효소의 활성을 증가시키도록 변경될 수 있는 경우 효소가 순차적으로 첨가될 수 있다는 것은 인식되어 있다. 대안적으로, 효소 혼합물에 대한 최적 pH 및 온도가 결정될 수 있다.

효소는 임의의 적절한 조건 하에서 기질과 반응한다. 예를 들면, 효소는 약 25℃, 약 30℃, 약 35℃, 약 37℃, 약 40℃, 약 45℃, 약 50℃, 약 55℃, 약 60℃, 약 65℃, 약 70℃, 약 75℃, 약 80℃, 약 85℃ 또는 약 90℃ 이상에서 항온처리될 수 있다. 즉, 효소는 예를 들면, 낮은 내지 중간 이온 강도 및/또는 낮은 내지 중성 pH의 완충제에서 약 20℃ 내지 약 95℃의 온도에서 항온처리될 수 있다. "중간 이온 강도"는 완충제가 임의의 단일 이온 성분에 대해 약 200 밀리몰(mM) 이하의 이온 농도를 갖는다는 것을 의미한다. pH는 약 pH 2.5, 약 pH 3.0, 약 pH 3.5, 약 pH 4.0, 약 pH 4.5, 약 pH 5, 약 pH 5.5, 약 pH 6, 약 pH 6.5, 약 pH 7, 약 pH 7.5, 약 pH 8.0 내지 약 pH 8.5일 수 있다. 일반적으로, pH 범위는 약 pH 3.0 내지 약 pH 7일 것이다. 에탄올 생성의 경우, 산성 배지, 예를 들면, pH=4의 배지가 바람직한 반면, 바이오가스 생성의 경우 중성 pH, 예를 들면, pH=7이 바람직하다. 이 조건 하에서의 효소 조합물의 항온처리는 리그노셀룰로스로부터 상당한 양의 당을 방출시키거나 유리시킨다. 상당한 양은 이용가능한 당의 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% 또는 95% 이상을 의미한다.

폴리펩티드, 예컨대, 효소는 미생물, 효모, 진균, 세균 또는 식물에서 외생적으로 생성된 후 단리되고, 예를 들면, 리그노셀룰로스성 공급원료에 첨가될 수 있다. 대안적으로, 효소는 생성되지만 단리되지 않고, 미정제 세포 덩어리 발효 브로쓰 또는 식물 물질(예컨대, 옥수수대) 등이 예를 들면, 공급원료에 첨가될 수 있다. 대안적으로, 미정제 세포 덩어리, 효소 생성 배지 또는 식물 물질은 (예를 들면, 가열 또는 항미생물제의 첨가에 의해) 추가 미생물 생장을 방지하도록 처리된 후, 예를 들면, 공급원료에 첨가될 수 있다. 이들 미정제 효소 혼합물들은 효소를 생성하는 유기체를 포함할 수 있다. 대안적으로, 효소는 공급원료(예컨대, 옥수수대)를 사용하여 영양분을 효소 생성 유기체에게 제공하는 발효에서 생성될 수 있다. 이 방식으로, 효소를 생성하는 식물은 그 자체가 리그노셀룰로스성 공급원료로서 사용될 수 있고 리그노셀룰로스성 공급원료 내로 첨가될 수 있다.

당의 발효

발효가능한 당은 유용한 부가 가치 발효 생성물로 전환될 수 있고, 이 발효 생성물의 비-한정적 예에는 아미노산, 비타민, 약제, 동물 사료 보충제, 특수 화학물질, 화학 공급원료, 플라스틱, 용매, 연료 또는 다른 유기 중합체, 젖산 및 에탄올(연료 에탄올을 포함함)이 포함된다. 구체적으로, 당은 화학물질, 플라스틱, 예를 들면, 석신산 및 (바이오)연료(에탄올, 메탄올, 부탄올, 합성 액체 연료 및 바이오가스를 포함함)로의 발효를 위한 공급원료로서 사용될 수 있다.

예를 들면, 본 발명의 방법에서, 효소 또는 효소의 조합물은 공급원료로서 사용되는 리그노셀룰로스성 기질 또는 식물 바이오매스에 작용함으로써, 에탄올 또는 다른 유용한 발효 생성물을 생성하도록 이 복합 기질을 단순한 당 및 올리고사카라이드로 전환시킨다.

바이오매스로부터 방출된 당은 유용한 발효 생성물, 예컨대, 아미노산, 비타민, 약제, 동물 사료 보충제, 특수 화학물질, 화학 공급원료, 플라스틱 및 에탄올(연료 에탄올을 포함함)을 포함하나 이들로 한정되지 않는 발효 생성물들 중 하나로 전환될 수 있다.

따라서, 본 발명은 발효 생성물의 제조 방법으로서,

a. 본원에 기재된 방법을 이용하여 리그노셀룰로스를 분해하는 단계; 및

b. 생성된 물질을 발효시켜 발효 생성물을 제조하는 단계

를 포함하는 방법을 제공한다.

발효는 호기성 또는 혐기성 조건 하에서 수행될 수 있다. 바람직하게는, 이 공정은 미호기성(micro-aerophilic) 또는 산소-한정된 조건 하에서 수행된다.

본원에서 혐기성 발효 공정은 산소의 부재 하에서 수행되는 발효 공정, 또는 실질적으로 산소가 소모되지 않는, 바람직하게는 약 5 mmol/ℓ/h 이하, 약 2.5 mmol/ℓ/h 이하 또는 약 1 mmol/ℓ/h 이하의 산소가 소모되는 발효 공정으로서 정의되고, 이때 유기 분자는 전자 공여자 및 전자 수용자 둘다로서 사용된다.

산소-한정된 발효 공정은 산소 소모가 기체로부터 액체에로의 산소 전달에 의해 한정되는 공정이다. 산소 한정의 정도는 들어오는 기류의 양 및 조성뿐만 아니라 이용된 발효 장치의 실제 혼합/물질 전달 성질에 의해서도 결정된다. 바람직하게는, 산소-한정된 조건 하에서의 공정에서 산소 소모의 속도는 약 5.5 mmol/ℓ/h 이상, 보다 바람직하게는 약 6 mmol/ℓ/h 이상, 훨씬 더 바람직하게는 약 7 mmol/ℓ/h 이상이다.

발효 생성물의 제조 방법은 임의적으로 발효 생성물을 회수하는 단계를 포함할 수 있다.

SSF

발효 및 당화는 동시적인 당화 및 발효(SSF) 방식으로 수행될 수도 있다. 이 방식의 장점들 중 하나는 효소 가수분해에 대한 당 억제의 감소이다(셀룰라제에 대한 당 억제는 문헌(Caminal B&B Vol XXVII Pp 1282-1290)에 기재되어 있다).

발효 생성물

본 발명에 따라 제조될 수 있는 발효 생성물은 아미노산, 비타민, 약제, 동물 사료 보충제, 특수 화학물질, 화학 공급원료, 플라스틱, 용매, 연료 또는 다른 유기 중합체, 젖산 및 에탄올(연료 에탄올을 포함함)(용어 "에탄올"은 에틸 알코올, 또는 에틸 알코올과 물의 혼합물을 포함하는 것으로 이해됨)을 포함한다.

본 발명의 방법에 따라 제조될 수 있는 특정 부가 가치 생성물은 바이오연료(에탄올 및 부탄올, 및 바이오가스를 포함함); 젖산; 플라스틱; 특수 화학물질; 시트르산, 석신산, 푸마르산, 이타콘산 및 말레산을 비롯한 유기산; 3-하이드록시-프로피온산; 아크릴산; 아세트산; 1,3-프로판-다이올; 에틸렌; 글리세롤; 용매; 동물 사료 보충제; 약제, 예컨대, β-락탐 항생제 또는 세팔로스포린; 비타민; 아미노산, 예컨대, 라이신, 메티오닌, 트립토판, 쓰레오닌 및 아스파르트산; 산업 효소, 예컨대, 프로테아제, 셀룰라제, 아밀라제, 글루카나제, 락타제, 리파제, 라이아제, 옥시도리덕타제, 트랜스퍼라제 또는 자일라나제; 및 화학 공급원료를 포함하나 이들로 한정되지 않는다.

바이오가스

본 발명은 바이오가스 제조 방법에 있어서 본원에 기재된 폴리펩티드 또는 조성물의 용도도 제공한다. 바이오가스는 전형적으로 산소의 부재 하에서 유기 물질, 예를 들면, 비-전분 탄수화물 함유 물질의 생물학적 분해에 의해 생성된 가스를 지칭한다. 바이오가스는 생물생성(biogenic) 물질로부터 유래되고 바이오연료의 한 종류이다. 바이오가스의 한 종류는 생분해가능한 물질, 예컨대, 바이오매스, 거름 또는 하수, 자치도시 폐기물 및 에너지 작물의 혐기성 분해 또는 발효에 의해 생성된다. 이 종류의 바이오가스는 주로 메탄 및 이산화탄소로 구성된다. 메탄 가스는 연소될 수 있거나 산소에 의해 산화될 수 있다. 공기는 21%의 산소를 함유한다. 이 에너지 방출은 바이오가스가 연료로서 사용될 수 있게 한다. 바이오가스는 임의의 가열 목적, 예컨대, 요리를 위해 임의의 국가에서 저렴한 연료로서 사용될 수 있다. 바이오가스는 현대식 폐기물 관리 시설에서도 사용될 수 있고, 이 시설에서 바이오가스는 임의의 종류의 열 엔진을 작동시켜 기계적 또는 전기적 동력을 발생시키는 데에 사용될 수 있다.

미생물 바이오가스 제조에서 제1 단계는 중합체 및 복합 기질(예를 들면, 비-전분 탄수화물)의 효소 분해로 구성된다. 따라서, 본 발명은 비-전분 탄수화물을 포함하는 기질을 본 발명의 폴리펩티드 또는 조성물과 접촉시켜 유기체, 예컨대, 미생물에 의해 바이오가스로 전환될 수 있는 발효가능한 물질을 생성하는 바이오가스 제조 방법을 제공한다. 이러한 방법에서, 본 발명의 폴리펩티드는 유기체, 예를 들면, 이러한 폴리펩티드를 발현하는 미생물에 의해 제공될 수 있다.

식품에서의 효소의 용도

본 발명의 폴리펩티드 및 조성물은 식물 물질을 가공하는 방법에서 사용되어 식물 또는 진균 물질의 세포벽의 셀룰로스, 헤미셀룰로스 또는 펙틴성 물질 성분을 분해할 수 있거나 변경시킬 수 있다. 이러한 방법은 식품의 제조에 유용할 수 있다. 따라서, 본 발명은 식품의 제조 동안 본 발명의 폴리펩티드 또는 조성물을 도입하는 식품 제조 방법을 제공한다.

본 발명은 식물 물질을 가공하는 방법으로서, 식물 물질을 본 발명의 폴리펩티드 또는 조성물과 접촉시켜 상기 (식물) 물질에서 셀룰로스를 분해하거나 변경시키는 단계를 포함하는 방법도 제공한다. 바람직하게는, 식물 물질은 식물 펄프 또는 식물 추출물, 예컨대, 쥬스이다.

본 발명은 식물 추출물의 점성, 투명성 및/또는 여과성을 감소시키는 방법으로서, 식물 추출물을 이 식물 추출물에 함유된 셀룰로스, 헤미셀룰로스 또는 펙틴성 물질의 분해에 효과적인 양의 본 발명의 폴리펩티드 또는 조성물과 접촉시키는 단계를 포함하는 방법도 제공한다.

식물 및 셀룰로스/헤미셀룰로스/펙틴성 물질 함유 물질은 식물 펄프, 식물의 일부 및 식물 추출물을 포함한다. 본 발명과 관련하여 식물 물질로부터의 추출물은 (기계적 및/또는 화학적) 추출, 가공 또는 다른 분리 기법에 의해 식물 물질로부터 유도될 수 있는 임의의 물질이다. 추출물은 쥬스, 넥타, 염기, 또는 이들의 농축물일 수 있다. 식물 물질은 채소, 예를 들면, 당근, 셀러리, 양파, 콩류 또는 콩과 식물(콩, 대두, 땅콩) 또는 과일, 예를 들면, 이과 또는 종자 과일(사과, 배, 모과 등), 포도, 토마토, 시트러스(오렌지, 레몬, 라임, 만다린), 멜론, 프룬, 체리, 까막까치밥나무, 레드커런트(redcurrant), 라즈베리, 딸기, 크랜베리, 파인애플 및 다른 열대 과일, 나무 및 이의 일부(예를 들면, 소나무 화분), 또는 곡물(귀리, 보리, 밀, 옥수수, 벼)을 포함할 수 있거나 이들로부터 유래될 수 있다. (가수분해될) 상기 물질은 농업 잔류물, 예컨대, 사탕무 펄프, 옥수수 속대, 밀짚, (땅속) 견과껍질, 또는 재활용가능한 물질, 예를 들면, (폐기된) 종이일 수도 있다.

따라서, 본 발명의 폴리펩티드는 식물 펄프 및 식물 추출물을 비롯한 식물 물질의 처리에 사용될 수 있다. 본 발명의 폴리펩티드는 액체 또는 고체 식품 또는 식용가능한 식품 성분의 처리에 사용될 수도 있거나, 커피, 식물유 또는 전분의 추출에 사용될 수도 있거나, 식품에서 증점제로서 사용될 수도 있다.

전형적으로, 본 발명의 폴리펩티드는 전술된 조성물/효소 제제로서 사용된다. 조성물은 일반적으로 예를 들면, 식물 물질의 기계적 가공, 예컨대, 분쇄 또는 제분에 의해 수득될 수 있는 식물 펄프에 첨가될 것이다. 조성물과 식물의 항온처리는 전형적으로 10분 내지 5시간, 예컨대, 30분 내지 2시간, 바람직하게는 약 1시간 동안 수행될 것이다. 가공 온도는 바람직하게는 약 10℃ 내지 약 55℃, 예를 들면, 약 15℃ 내지 약 25℃, 최적으로 약 20℃이고, 처리될 물질 톤(ton) 당 약 10 g 내지 약 300 g, 바람직하게는 약 30 g 내지 약 70 g, 최적으로 약 50 g의 효소를 사용할 수 있다.

사용되는 모든 효소 또는 이들의 조성물은 식물 펄프에 순차적으로 또는 동시에 첨가될 수 있다. 효소 제제의 조성에 따라 식물 물질은 먼저 (예를 들면, 순수할 때까지) 침연될(macerated) 수 있거나 액화될 수 있다. 본 발명의 폴리펩티드를 사용하여 가공 파라미터, 예컨대, 추출의 수율, 추출물의 점성 및/또는 추출물의 품질을 개선할 수 있다.

대안적으로 또는 추가로, 본 발명의 폴리펩티드는 식물 펄프를 압착시키거나 액화시킴으로써 수득된 생쥬스에 첨가될 수 있다. 생쥬스의 처리는 용량, 온도 및 유지 시간 면에서 식물 펄프와 유사한 방식으로 수행될 것이다. 또한, 다른 효소, 예컨대, 앞서 논의된 효소가 포함될 수 있다. 전형적인 항온처리 조건은 이전 단락에 기재된 바와 같다.

일단 생쥬스가 본 발명의 폴리펩티드와 함께 항온처리되면, 상기 쥬스를 원심분리하거나 (한외)여과하여 최종 생성물을 생성한다.

본 발명의 폴리펩티드를 사용한 처리 후, 본 발명의 폴리펩티드를 부분적으로 또는 전체적으로 불활성화시키는 조건 하에서 예를 들면, 약 1분 내지 약 1시간 동안 약 100℃에서 (최종) 생성물을 열 처리할 수 있다.

본 발명의 폴리펩티드를 함유하는 조성물은 과일 또는 채소 퓌레(purees)의 제조 동안 사용될 수도 있다.

본 발명의 폴리펩티드는 양조, 와인 제조, 증류 또는 베이킹에 사용될 수도 있다. 따라서, 상기 폴리펩티드는 알코올성 음료, 예컨대, 와인 및 맥주의 제조에 사용될 수 있다. 예를 들면, 상기 폴리펩티드는 예를 들면, 맥주, (예를 들면, 보리 및/또는 수수 맥아를 함유하는) 맥아즙 또는 와인의 여과성 또는 투명성을 개선할 수 있다.

나아가, 본 발명의 폴리펩티드 또는 조성물은 양조업자가 소모한 곡물, 즉 보리 또는 맥아 보리, 또는 다른 곡물을 함유하는 보리 맥아즙 생성의 잔류물을 처리하여, 예를 들면, 동물 사료를 위한 상기 잔류물의 활용을 개선하는 데에 사용될 수 있다.

단백질은 예를 들면, 유기물로부터 유래된 증류 폐기물이 미생물 바이오매스로 생물전환되는 브로쓰 또는 배양 배지로부터 용해된 유기 물질을 제거하는 것을 보조할 수 있다. 본 발명의 폴리펩티드는 예컨대, (예를 들면, α-아밀라제를 사용한) 액화에 의해 생성된 곡물로부터의 글루코스 시럽에서 여과성을 개선할 수 있고/있거나 점성을 감소시킬 수 있다.

베이킹에서, 폴리펩티드는 도우(dough) 구조를 개선할 수 있거나, 그의 점착성 또는 유연성을 변경시킬 수 있거나, 덩어리(loaf) 부피 및/또는 부스러기 구조를 개선할 수 있거나, 보다 더 우수한 질감 특성, 예컨대, 깨지거나, 찢어지거나 부서지는 질감을 부여할 수 있다.

따라서, 본 발명은 본 발명의 폴리펩티드 또는 조성물을 도우 내로 도입하는 단계를 포함하는, 도우 또는 곡물-기제 식품의 제조 방법에 관한 것이다. 이것은 상기 도우 또는 이 도우로부터 수득된 곡물-기제 식품의 하나 이상의 성질을, 상기 폴리펩티드가 도입되지 않은 도우 또는 곡물-기제 식품에 비해 개선할 수 있다.

본 발명에 따른 곡물-기제 식품의 제조는 당분야에서 공지되어 있는 단계, 예컨대, 수득된 도우를 끓이거나, 건조하거나, 튀기거나 증기처리하거나 굽는 단계를 추가로 포함할 수 있다.

끓여진 도우로부터 제조된 제품은 예를 들면, 끓여진 면 및 덤플링(dumpling)이고, 튀겨진 도우로부터 제조된 제품은 예를 들면, 도우넛, 튀김 및 튀긴 면이고, 증기처리된 도우로부터 제조된 제품은 예를 들면, 증기처리된 번(bun) 및 증기처리된 면이고, 건조된 도우로부터 제조된 제품의 예는 파스타 및 건조된 면이고, 구워진 도우로부터 제조된 제품의 예는 빵, 쿠키 및 케이크이다.

본원에서 용어 "개선된 성질"은 본 발명에 따른 폴리펩티드가 도입되지 않은 도우 또는 제품에 비해 본 발명에 따른 폴리펩티드의 작용에 의해 개선되는, 도우 및/또는 도우로부터 수득된 제품, 특히 곡물-기제 식품의 임의의 성질로서 정의된다. 개선된 성질은 도우의 증가된 강도, 도우의 증가된 탄성, 도우의 증가된 안정성, 도우의 개선된 기계가공성, 도우의 개선된 가공 내성, 도우의 감소된 점착성, 도우의 개선된 연신성, 곡물-기제 식품의 증가된 부피, 곡물-기제 식품의 감소된 블리스터링, 구워진 제품의 개선된 부스러기 구조, 곡물-기제 식품의 개선된 연성, 곡물-기제 식품의 개선된 풍미, 및 곡물-기제 식품의 개선된 노화방지를 포함할 수 있으나 이들로 한정되지 않는다. 파스타 및 면 종류의 곡물-기제 제품과 관련된 개선된 성질은 예를 들면, 개선된 견고성, 감소된 점착성, 개선된 응집성 및 감소된 조리 손실이다.

개선된 성질은 본 발명의 폴리펩티드를 첨가하여 제조한 도우 및/또는 곡물-기제 식품을 본 발명의 폴리펩티드를 첨가하지 않고 제조한 도우 및/또는 곡물-기제 식품과 비교함으로써 확인될 수 있다. 감각수용성 품질은 베이킹 산업에서 잘 확립된 절차를 이용함으로써 평가될 수 있고, 예를 들면, 훈련받은 맛 시험관(taste-tester)의 패널의 이용을 포함할 수 있다.

본원에서 용어 "도우"는 혼련하거나 롤링하기에 충분한 강도의 곡물 가루와 다른 성분의 혼합물로서 정의된다. 곡물의 예는 밀, 호밀, 옥수수, 메이즈(maize), 보리, 벼, 그로트(groats), 메밀 및 귀리이다. 여기서 및 이하에서 밀은 트라이티쿰(Triticum) 속의 모든 공지되어 있는 종들, 예를 들면, 소맥(aestivum), 듀럼밀(durum) 및/또는 스펠트밀(spelt)을 포괄하기 위한 것이다. 적합한 다른 성분의 예는 본 발명에 따른 셀로바이오하이드롤라제, 추가 효소, 화학적 첨가제 및/또는 가공 보조제이다. 도우는 새로 만든 것일 수 있거나, 냉동될 수 있거나, 제조될 수 있거나 미리 구워질 수 있다. 전술된 성분들로부터의 도우의 제조는 당분야에서 잘 공지되어 있고, 상기 성분들과 가공 보조제의 혼합, 및 하나 이상의 성형 및 임의적으로 발효 단계를 포함한다. 냉동된 도우의 제조는 문헌(Kulp and Lorenz, Frozen and Refrigerated Doughs and Batters)에 기재되어 있다.

본원에서 용어 "곡물-기제 식품"은 도우로부터 제조된, 연한 또는 부스러지는 특성을 갖는 임의의 제품으로서 정의된다. 백색 유형이든, 밝은 색 유형이든 아니면 어두운 색 유형이든 관계없이 본 발명에 의해 유리하게 제조될 수 있는 곡물-기제 식품의 예는 전형적으로 덩어리 또는 롤 형태의 빵(특히, 백색, 통밀 또는 호밀 빵), 프랑스 바게트 유형 빵, 파스타, 면, 도우넛, 베이글, 케이크, 피타 빵, 토틸라(tortillas), 타코, 팬케이크, 비스킷, 쿠키, 파이 크러스트, 찐빵 및 귀리빵 등이다.

본원에서 용어 "구워진 제품"은 도우의 베이킹에 의해 제조된 임의의 곡물-기제 식품으로서 정의된다.

비-전분 폴리사카라이드(NSP)는 소화물의 점성을 증가시켜 영양분 이용가능성 및 동물 성능을 감소시킬 수 있다. 본 발명의 셀로바이오하이드롤라제의 사용은 인 사용뿐만 아니라 동물 소화 동안 양이온 광물 및 단백질을 개선할 수 있다.

사료에의 특정 영양분의 첨가는 동물 소화를 개선하여 사료 가격을 감소시킨다. 많은 사료 첨가제들이 현재 사용되고 있고, 새로운 개념이 계속 개발되고 있다. 섬유가 분해될 때 단백질의 접근성이 더 우수해지기 때문에, 특정 효소, 예컨대, 비-전분 탄수화물 분해 효소의 사용은 섬유를 분해하여 에너지를 방출시킬 수 있을 뿐만 아니라 단백질 소화능도 증가시킬 수 있다. 이 방식으로 사료 가격이 떨어질 수 있을 뿐만 아니라 사료 중의 단백질 수준도 감소될 수 있다.

비-전분 폴리사카라이드(NSP)도 사실상 식물 유래의 모든 사료 성분들에 존재한다. NSP는 잘 사용되지 않고, 가용화될 때 소화에 대한 불리한 영향을 발휘할 수 있다. 외생성 효소는 이 NSP의 보다 더 우수한 사용에 기여할 수 있고, 그 결과 임의의 항-영양 효과를 감소시킬 수 있다. 본 발명의 비-전분 탄수화물 분해 효소는 가금류, 및 보다 덜한 정도로 돼지 및 다른 종을 위한 곡물-기제 정규식에서 이 목적으로 사용될 수 있다.

본 발명의 비-전분 탄수화물 분해 폴리펩티드/효소(또는 본 발명의 폴리펩티드/효소를 포함하는 조성물)는 세제 산업, 예를 들면, 세탁물로부터의 탄수화물-기제 얼룩의 제거에 사용될 수 있다. 세제 조성물은 본 발명의 폴리펩티드/효소, 및 추가로 셀룰라제, 헤미셀룰라제, 펙티나제, 프로테아제, 리파제, 쿠티나제(cutinase), 아밀라제 및 카보하이드라제(carbohydrase) 중 하나 이상을 포함할 수 있다.

세제 조성물에서의 효소의 용도

본 발명의 폴리펩티드 또는 조성물을 포함하는 세제 조성물은 임의의 편리한 형태, 예를 들면, 페이스트, 겔, 분말 또는 액체로 존재할 수 있다. 액체 세제는 전형적으로 약 70% 이하의 물 및 약 0% 내지 약 30%의 유기 용매 또는 비-수성 물질을 함유하는 수성 액체 세제일 수 있다.

이러한 세제 조성물은 예를 들면, 오염된 직물의 전처리에 적합한 세탁물 첨가제 조성물 및 린스-첨가된 직물 연화제 조성물을 비롯한 손 또는 기계 세탁물 세제 조성물로서 제제화될 수 있거나, 일반적으로 가정 경질 표면 세척 작업에서 사용되는 세제 조성물로서 제제화될 수 있거나, 손 또는 기계 접시 세척 작업용으로 제제화될 수 있다.

일반적으로, 효소의 성질은 선택된 세제에 적합해야 하고(예를 들면, pH-최적치, 다른 효소 및/또는 비-효소 성분과의 상용성 등), 효소는 유효량으로 존재해야 한다.

세제 조성물은 계면활성제, 예를 들면, 음이온성 또는 비-이온성 계면활성제, 세제 구축제 또는 착물화제, 하나 이상의 중합체, 표백 시스템(예를 들면, H₂O₂ 공급원), 또는 효소 안정화제를 포함할 수 있다. 세제 조성물은 임의의 다른 보편적인 세제 성분, 예를 들면, 점토를 포함하는 컨디셔너, 거품 증강제(foam booster), 거품 억제제, 항부식제, 오물 현탁제, 오물 재침착 방지제, 염료, 살세균제, 광증백제, 하이드로트롭(hydrotropes), 변색 억제제 또는 방향제도 포함할 수 있다.

종이 및 펄프 가공에서의 효소의 용도

본 발명의 폴리펩티드 또는 조성물은 종이 및 펄프 산업, 특히 표백 공정에서 표백된 펄프의 명도를 향상시키고(이에 따라 표백 단계에서 사용되는 염소의 양이 감소될 수 있음) 재활용된 종이 공정에서 펄프의 여수도(freeness)를 증가시키는 데에 사용될 수 있다(Eriksson, K. E. L., Wood Science and Technology 24 (1990):79-101; Paice, et al., Biotechnol. and Bioeng. 32 (1988):235-239 and Pommier et al., Tappi Journal (1989):187-191). 나아가, 본 발명의 폴리펩티드 또는 조성물은 리그노셀룰로스성 펄프의 표백능을 개선하도록 리그노셀룰로스성 펄프를 처리하는 데에 사용될 수 있다. 이에 따라, 펄프의 만족스러운 표백을 수득하기 위해 필요한 염소의 양이 감소될 수 있다.

본 발명의 폴리펩티드 또는 조성물은 셀룰로스 함유 직물이 거칠어지는 속도를 감소시키거나 셀룰로스 함유 직물의 거친 정도를 감소시키는 방법으로서, 셀룰로스 함유 직물을 전술된 폴리펩티드 또는 조성물로 처리하는 단계를 포함하는 방법에서 사용될 수 있다. 추가로, 본 발명은 착색된 셀룰로스 함유 직물의 색채 정화를 제공하는 방법으로서, 착색된 셀룰로스 함유 직물을 전술된 폴리펩티드 또는 조성물로 처리하는 단계를 포함하는 방법; 및 착색된 셀룰로스 함유 직물의 색채에서의 국한된 변경을 제공하는 방법으로서, 착색된 셀룰로스 함유 직물을 전술된 폴리펩티드 또는 조성물로 처리하는 단계를 포함하는 방법에 관한 것이다. 본 발명의 방법은 세척 동안 셀룰로스 함유 직물을 처리함으로써 수행될 수 있다. 그러나, 원하는 경우, 직물의 처리는 담구거나 린싱하는 동안 수행될 수도 있거나, 전술된 폴리펩티드 또는 조성물을 직물이 함침되거나 함침될 물에 단순히 첨가함으로써 수행될 수도 있다.

다른 효소 용도

추가로, 본 발명의 폴리펩티드 또는 조성물은 항균 제제뿐만 아니라 약품, 예컨대, 인후 로젠지, 치약 및 구강세척제에서도 사용될 수 있다.

하기 실시예는 본 발명을 예시한다.

실시예

실험 정보

균주 및 효소 조성물

아스퍼길러스 니게르 균주는 수탁번호 CBS 513.88로서 CBS(CENTRAAL BUREAU VOOR SCHIMMELCULTURES)에 기탁되어 있다.

라삼소니아(탈라로마이세스) 에머소니이 균주 TEC-142는 2009년 7월 1일에 수탁번호 CBS 124902로서 CBS(CENTRAAL BUREAU VOOR SCHIMMELCULTURES)(네덜란드 엔엘-3508 아데 우트레흐트 피.오. 박스 85167 업살라라안 8 소재)에 기탁되어 있다. TEC-142S는 TEC-142의 단일 단리물이다.

라삼소니아(탈라로마이세스) 에머소니이 균주는 1964년 12월에 수탁번호 CBS 393.64로서 CBS(CENTRAAL BUREAU VOOR SCHIMMELCULTURES)(네덜란드 엔엘-3508 아데 우트레흐트 피.오. 박스 85167 업살라라안 8 소재)에 기탁되었다. 본 발명의 효과 및 장점을 보여주기 위해 다른 적합한 균주들이 본 실시예에서 동등하게 사용될 수 있다. 예를 들면, TEC-101, TEC-147, TEC-192, TEC-201 또는 TEC-210은 국제 특허출원 공개 제WO2011/000949호에 기재된 적합한 라삼소니아 균주이다.

TEC-210 셀룰라제 함유 조성물은 국제 특허출원 공개 제WO2011/000949호에 기재된 절차, 예컨대, 접종 및 발효에 따라 제조되었다.

β-글루코시다제(BG)는 국제 특허출원 공개 제WO2011/098577호에 기재된 바와 같이 아스퍼길러스 니게르에서의 EBA4의 과다발현 후 아스퍼길러스 니게르 형질전환체의 발효에 의해 제조된다. EBA4는 라삼소니아 에머소니이(탈라로마이세스 에머소니이) BG이고 국제 특허출원 공개 제WO2011/098577호에서 탈라로마이세스 에머소니이 β-글루코시다제(BG)로서 확인되어 있고 국제 특허출원 공개 제WO2011/098577호에서 서열번호 5로 표시되어 있다.

셀루클라스트(Celluclast)(트라이코데르마 셀룰라제)는 시그마(Sigma)로부터 입수되었다.

분자생물학 기법

이들 균주들에서 당업자에게 공지되어 있는 분자생물학 기법(문헌(Sambrook & Russell, Molecular Cloning: A Laboratory Manual, 3rd Ed., CSHL Press, Cold Spring Harbor, NY, 2001) 참조)을 이용하여 여러 유전자들을 과다발현시켰고 다른 유전자들을 후술된 바와 같이 하향조절하였다. 유전자 과다발현을 위한 발현 벡터 및 하향조절을 위한 파괴 벡터의 일반적인 디자인, 형질전환, 마커의 사용 및 선택 배지의 예는 국제 특허출원 공개 제WO1998/46772호, 국제 특허출원 공개 제WO1999/32617호, 국제 특허출원 공개 제WO2001/121779호, 국제 특허출원 공개 제WO2005/095624호, 국제 특허출원 공개 제WO2006/040312호, 유럽 특허 제635574B호, 국제 특허출원 공개 제WO2005/100573호, 국제 특허출원 공개 제WO2011/009700호, 국제 특허출원 공개 제WO2012/001169호 및 국제 특허출원 공개 제WO2011/054899호에서 발견될 수 있다. 모든 유전자 교체 벡터들은 예정된 게놈 좌위에서의 상동성 재조합을 위해 표적화하도록 각각의 ORF 서열의 약 1 kb 내지 2 kb 플랭킹 영역을 포함한다. 또한, 아스퍼길러스 니게르 벡터는 직접적인 반복부들 사이에 형질전환을 위한 아스퍼길러스 니둘란스 쌍방향 amdS 선택 마커를 함유한다. 본원의 모든 실시예들에서 유전자 결실을 위해 적용된 방법은 이중 교차에 의해 플랭킹 서열의 상동성 좌위에서 게놈 내로 삽입되어 결실될 유전자를 amdS 유전자로 치환시키는 선형 DNA를 사용한다. 형질전환 후, 직접적인 반복부는 (제2) 상동성 재조합 사건에 의한 선택 마커의 제거를 허용한다. amdS 마커의 제거는 플루오로-아세트아미드 배지 상에 플레이팅하여 마커 유전자 무함유 균주를 선택함으로써 수행될 수 있다. 유럽 특허 제0 635 574호에 "마커 유전자 무함유" 방법으로서도 기재되어 있는 이 형질전환 및 후속 반대-선택 방법을 이용하여 amdS 마커를 균주 변경 프로그램에서 무기한으로 사용할 수 있다.

배지 및 용액:

감자 덱스트로스 한천(PDA)(플루카(Fluka), 카탈로그 번호 70139): ℓ 당: 감자 추출물 4 g; 덱스트로스 20 g; 박토 한천 15 g; pH 5.4; 120℃에서 20분 동안 멸균한다.

라삼소니아 한천 배지: ℓ 당: 염 분획 제3번 15 g; 셀룰로스 30 g; 박토 펩톤 7.5 g; 곡물 가루 15 g; KH₂PO₄ 5 g; CaCl₂.2aq 1 g; 박토 한천 20 g; pH 6.0; 120℃에서 20분 동안 멸균한다.

염 분획 조성물: "염 분획 제3번"은 국제 특허출원 공개 제WO98/37179호의 표 1의 개시내용에 맞추어졌다. 이 표의 조성으로부터의 편차는 다음과 같았다: CaCl₂.2aq 1.0 g/ℓ, KCl 1.8 g/ℓ, 시트르산 1aq 0.45 g/ℓ(킬레이팅제).

라삼소니아를 위한 진탕 플라스크 배지

라삼소니아 배지 1: ℓ 당: 글루코스 20 g; 효모 추출물(딥코(Difco)) 20 g; 클레롤(Clerol) FBA3107(AF) 4 방울; pH 6.0; 120℃에서 20분 동안 멸균한다.

라삼소니아 배지 2: ℓ 당: 염 분획 제3번 15 g; 셀룰로스 20 g; 박토 펩톤 4 g; 곡물 가루 7.5 g; KH₂PO₄ 10 g; CaCl₂.2H₂0 0.5 g; 클레롤 FBA3107(AF) 0.4 ㎖; pH 5; 120℃에서 20분 동안 멸균한다.

라삼소니아 배지 3: ℓ 당: 염 분획 제3번 15 g; 글루코스 50 g; 박토 펩톤 7.5 g; KH₂PO₄ 10 g; CaCl₂.2H₂0 0.5 g; 클레롤 FBA3107(AF) 0.4 ㎖; pH 5; 120℃에서 20분 동안 멸균한다.

라삼소니아를 위한 포자 회분 제조

40℃에서 5일 내지 7일 동안 10 cm 직경 페트리 접시 내의 라삼소니아 한천 배지 상에서 스톡(stock)으로부터의 균주를 생장시켰다. MTP 발효를 위해, 라삼소니아 한천 배지를 함유하는 96웰 플레이트에서 균주를 생장시켰다. 10% 글리세롤 중의 균주 스톡을 -80℃에서 저장하였다.

염색체 DNA 단리

균주를 42℃ 및 250 rpm에서 16시간 동안 YGG 배지(ℓ 당: 8 g KCl, 16 g 글루코스.H₂O, 20 ㎖의 10% 효모 추출물, 10 ㎖의 100x 페니실린/스트렙토마이신, 6.66 g YNB+아미노산, 1.5 g 시트르산 및 6 g K₂HPO₄)에서 생장시키고 DNeasy 식물 미니 키트(퀴아젠(Qiagen), 독일 힐덴 소재)를 사용하여 염색체 DNA를 단리하였다.

라삼소니아의 MTP 발효

포자형성된 라삼소니아 에머소니이 균주를 갖는 96웰 마이크로타이터 플레이트(MTP)를 이용하여 MTP 발효를 위해 포자를 수거하였다. 이를 위해, 200 ㎕의 10배 희석된 라삼소니아 배지 1을 각각의 웰에 첨가하고, 혼합물을 재현탁한 후 100 ㎕의 포자 현탁액을 44℃, 550 rpm 및 80% 습도에서 16시간 동안 습한 진탕기(인포르스(Infors)) 내에서 항온처리하였다. 그 후, 50 ㎕의 예비배양물을 사용하여 MTP 플레이트에서 250 ㎕의 라삼소니아 배지 2를 접종하였다. 96웰 플레이트를 44℃, 550 rpm 및 80% 습도에서 6일 동안 습한 진탕기(인포르스) 내에서 항온처리하였다. 플레이트를 원심분리하고 상청액을 수거하였다.

라삼소니아의 진탕 플라스크 생장 프로토콜

100 ㎖의 라삼소니아 배지 2 또는 3을 함유하는 500 ㎖ 진탕 플라스크 내로 포자를 직접 접종하고 45℃ 및 250 rpm에서 3일 내지 4일 동안 항온처리 진탕기 내에서 항온처리하였다. 대안적으로, 라삼소니아 배지 1을 함유하는 100 ㎖ 진탕 플라스크 내에 포자를 접종하고 45℃ 및 250 rpm에서 1일(예비배양) 동안 항온처리 진탕기 내에서 항온처리한 후, 5 ㎖ 또는 10 ㎖의 바이오매스를 예비배양물로부터 100 ㎖의 라삼소니아 배지 2 또는 3을 함유하는 500 ㎖ 진탕 플라스크로 옮기고 전술된 바와 같은 조건 하에서 생장시켰다.

단백질 분석

NuPAGE 4% 내지 12% 비스-트라이스(Bis-Tris) 겔(인비트로겐, 네덜란드 브레다 소재) 상에서 환원 조건 하에서 단백질 샘플을 분리하고 염색하였다. 겔을 제조자의 설명서에 따라 인스탄트블루(InstantBlue)(익스페데온(Expedeon), 영국 캠브리지 소재), 심플리블루 세이프스테인(SimplyBlue safestain)(인비트로겐, 네덜란드 브레다 소재) 또는 사이프로 루비(Sypro Ruby)(인비트로겐, 네덜란드 브레다 소재)로 염색하였다.

총 단백질 함량

회수된 상청액의 단백질 함량을 브래드포드(Bradford) 방법에 따라 측정하였다. 쿠마시(Coomassie) 단백질 시약을 사용하여 효소 샘플 중의 단백질의 양을 브래드포드 단백질 분석으로 측정하였다. 25 ㎕의 적절하게 희석된 효소 샘플을 1.2 ㎖의 쿠마시 시약과 혼합하였다. 실온에서 10분 후, 분광광도계(유비콘 엘스엘(Uvikon XL))를 이용하여 595 nm에서 혼합물의 흡광도를 측정하였다. 단백질 함량을 BSA 표준물과 비교하여 계산하였다.

산 전처리된 옥수수대 공급원료로부터의 당-방출 활성 분석

각각의 (헤미)셀룰라제 분석 조건에 대해, 효소 배양 상청액을 하기 절차에 따라 이중으로 분석하였다: 효소 배양 상청액(건조 물질 공급원료 g 당 5 mg 단백질)을, pH 3.5, pH 4.5 또는 pH 5.0에서 완충된 50 mM 시트레이트 완충제 중의 약산 전처리된 옥수수대 기질 800 ㎕(2.5%(중량/중량) 건조 물질)를 함유하는 적합한 바이알로 옮겼다. 추가로, 블랭크 샘플로서 동일한 양의 효소 배양 상청액을 또 다른 바이알에 첨가하였는데, 이때 50 mM 시트레이트 완충제 중의 약산 전처리된 옥수수대 기질 800 ㎕(2.5%(중량/중량) 건조 물질)는 pH 4.5에서 완충된 50 mM 시트레이트 완충제 800 ㎕로 교체되었다. pH 3.5에서 완충된 분석 샘플을 65℃에서 72시간 동안 항온처리하였다. pH 5.0에서 완충된 분석 샘플을 50℃에서 72시간 동안 항온처리하였다. pH 4.5에서 완충된 분석 샘플, 및 효소 상청액 중의 단량체 당 함량의 보정을 위한 블랭크 샘플을 65℃에서 72시간 동안 항온처리하였다. 또한, pH 4.5에서 완충된 분석 샘플을 75℃에서 72시간 동안 항온처리하였다.

전술된 개별 항온처리 이외에, 효소 배양 상청액을 하기 2개의 상이한 헤미셀룰라제 혼합물과 함께 시험하였다: 추가 β-글루코시다제(BG)(라삼소니아 에머소니이로부터의 BG를 발현하는 아스퍼길러스 니게르 균주)가 첨가된(0.08 mg/g 건조 물질) TEC-210(라삼소니아 에머소니이), 및 추가 BG(노보자임(Novozym)-188)가 첨가된(0.08 mg/g 건조 물질) 셀루클라스트(트라이코데르마 리세이). 상기 혼합물을 공급원료의 건조 물질 g 당 1 mg 단백질의 농도로 첨가하였다. 이들 항온처리를 전술된 조건과 동일한 조건에서 수행하였다.

각각의 절차에 대해, 항온처리 후 공급원료에 존재하는 가능한 단량체 당을 보정하기 위해 효소 상청액이 탈염수로 교체되는 분석을 수행하였다.

분석 샘플의 항온처리 후, 고정된 부피의 내부 표준물, 말레산(20 g/ℓ), EDTA(40 g/ℓ) 및 DSS(2,2-다이메틸-2-실라펜탄-5-설포네이트)(0.5 g/ℓ)를 각각의 바이알에 첨가하였다. 원심분리 후, 650 ㎕의 상청액을 새로운 바이알로 옮겼다.

샘플의 상청액을 밤새 동결건조한 후, 50 ㎕의 D₂O를 건조된 잔류물에 첨가하고 다시 한번 동결건조하였다. 건조된 잔류물을 600 ㎕의 D₂O에 용해시켰다. 17℃의 온도에서 물 억제를 갖지 않되 90도 여기 펄스, 2.0초의 획득 시간 및 10초의 이완 지연을 갖는 펄스 프로그램을 이용하여 N2 냉각 크라이오-프로브(cryo-probe)를 갖춘 브루커 아반스(Bruker Avance) III HD 400 MHz 상에서 1D 1H NMR 스펙트럼을 기록하였다. 하기 신호에 근거하여 분석물 농도를 계산하였다(DSS(4,4-다이메틸-4-실라펜탄-1-설폰산)에 대한 상대적인 δ): 4.63 ppm에서 1/2의 β-글루코스 피크(d, 0.31 H, J = 8 Hz), 4.56 ppm에서 1/2의 β-자일로스 피크(d, 0.315 H, J = 8 Hz), 4.45 ppm에서 자일로-올리고 피크(d, 1H, J=8Hz), 4.66 ppm에서 1/2의 셀로바이오스의 환원 말단의 β-아노머 피크(d, 0.31H, J=8Hz). 6.26 ppm에서 표준물:말레산 피크에 대한 신호 사용자(s, 2H).

(헤미)셀룰라제 효소 용액은 잔류 당을 함유할 수 있다. 따라서, 분석의 결과를 효소 용액의 항온처리 후 측정된 당 함량에 대해 보정하였다.

β-자일로시다제 활성 측정

이 분석은 p-니트로페닐-β-D-자일로피라노사이드(PNPX)에 대한 β-자일로시다제의 작용에 의한 p-니트로페놀의 방출을 측정한다. 1 β-자일로시다제 활성 유닛은 60℃ 및 pH 4.5에서 1분 이내에 1 μM의 p-니트로페놀을 유리시키는 효소의 양이다. 아세테이트 완충제(0.1 M, pH 4.5)를 다음과 같이 제조한다: 용액의 최종 부피가 1000 ㎖가 되도록 8.2 g의 무수 나트륨 아세테이트를 증류수에 용해시킨다(용액 A). 별도의 플라스크에서, 6.0 g(5.72 ㎖)의 빙초산을 증류수와 혼합하여 총 1000 ㎖의 부피를 만든다(용액 B). 생성된 용액의 pH가 4.5와 동등할 때까지 용액 A를 용액 B와 혼합하여 최종 0.1 M 아세테이트 완충제(pH 4.5)를 제조한다. 완충제 용액 ℓ 당 한 방울(약 25 ㎕)의 트라이톤 X-100을 첨가한다. PNPX(시그마)를 분석 기질로서 사용한다.

100 mg의 PNPX를 84 ㎖의 0.1 M 아세테이트 완충제에 용해시켜 4.4 mM 스톡 용액을 수득한다. 중단 시약(1 M 나트륨 카보네이트 용액)을 다음과 같이 제조한다: 10.6 g의 무수 나트륨 카보네이트를 50 ㎖의 증류수에 용해시키고, 용액 부피를 100 ㎖로 조절한다. 이 시약을 사용하여 효소 반응을 종결시킨다.

효소와의 항온처리를 위해, 0.1 ㎖의 4.4 mM PNPX 스톡 용액을 0.1 ㎖의 적절하게 희석된 효소 샘플과 혼합하고 60분 동안 60℃에서 항온처리한다. 60분의 항온처리 후, 0.1 ㎖의 반응 혼합물을 0.1 ㎖의 1 M 나트륨 카보네이트 용액과 혼합하고 마이크로타이터 플레이트에서 흡광도를 405 nm에서 A_S로서 측정한다.

기질 블랭크를 위해, 0.1 ㎖의 4.4 mM PNPX 스톡 용액을 0.1 ㎖의 0.1 M 아세테이트 완충제(pH 4.5)와 혼합하고 샘플과 동일하게 처리한다: 60분 동안 60℃에서 항온처리한 후, 0.1 ㎖의 반응 혼합물을 0.1 ㎖의 1 M 나트륨 카보네이트 용액과 혼합하고, 마이크로타이터 플레이트에서 흡광도를 405 nm에서 A_SB로서 측정한다.

(기질이 첨가되지 않은) 효소 블랭크를 측정하여 효소로부터 유래된 배경 색채를 보정한다. 0.1 ㎖의 적절하게 희석된 효소 샘플을 0.1 ㎖의 0.1 M 아세테이트 완충제(pH 4.5)와 혼합하고 60분 동안 60℃에서 항온처리한다. 60분의 항온처리 후, 0.1 ㎖의 반응 혼합물을 0.1 ㎖의 1 M 나트륨 카보네이트 용액과 혼합하고, 마이크로타이터 플레이트에서 흡광도를 405 nm에서 A_EB로서 측정한다.

1 M 나트륨 카보네이트 용액과 1:1의 비로 혼합된 p-니트로페놀(0.1 M 아세테이트 완충제로 적절하게 희석됨, pH 4.5)의 보정 곡선을 이용하여 효소의 작용에 의한 PNPX로부터의 그의 방출을 정량한다.

효소와 기질의 항온처리 후, 보정된 흡광도(= A_S-A_EB-A_SB)를 이용하여 효소에 의해 방출된 p-니트로페놀의 양을 계산한다.

활성은 분석 조건 하에서 분 당 1 μM p-니트로페놀을 방출시키기 위해 요구된 효소의 양으로서 표현된다.

이 분석을 이용하여 효소, 예컨대, GH3, GH30, GH39, GH43, GH52 및 GH54 효소(그러나, 이들로 한정되지 않음)의 활성을 시험할 수 있다.

β-자일로시다제 활성 분석 2

이 분석은 자일로바이오스에 대한 β-자일로시다제의 작용에 의한 자일로스의 방출을 측정한다.

나트륨 아세테이트 완충제(0.05 M, pH 4.5)를 다음과 같이 제조하였다: 4.1 g의 무수 나트륨 아세테이트 또는 6.8 g의 나트륨 아세테이트 * 3H₂O를 1000 ㎖의 최종 부피까지 증류수에 용해시켰다(용액 A). 별도의 플라스크에서, 3.0 g(2.86 ㎖)의 빙초산을 증류수와 혼합하여 총 1000 ㎖의 부피를 만들었다(용액 B). 생성된 용액의 pH가 4.5와 동등할 때까지 용액 A를 용액 B와 혼합하여 최종 0.05 M 나트륨 아세테이트 완충제(pH 4.5)를 제조하였다. 자일로바이오스를 시그마로부터 구입하고 100 ㎍/㎖의 농도까지 나트륨 아세테이트 완충제(pH 4.5)에 용해시켰다.

분석을 이하에 상세히 기재된 바와 같이 수행하였다.

효소 배양 상청액을 기질 g 당 1 mg 내지 5 mg 단백질의 용량으로 기질에 첨가한 후 62℃에서 24시간 동안 항온처리하였다. 100℃에서 10분 동안 샘플을 가열하여 반응을 중단시켰다. 자일로스의 방출을 고성능 음이온 교환 크로마토그래피로 분석하였다.

기질 블랭크

효소 배양 상청액 대신에 동일한 양의 완충제를 기질 용액에 첨가한 후 62℃에서 24시간 동안 항온처리하였다. 샘플을 100℃에서 10분 동안 가열하여 반응을 중지시켰다. 샘플을 고성능 음이온 교환 크로마토그래피로 분석하였다. 카보팩(CarboPac) PA 가드(guard) 컬럼(2 mm ID x 50 mm) 및 다이오넥스(Dionex) PAD-검출기(다이오넥스 컴파니(Dionex Co.), 미국 서니베일 소재)와 함께 다이오넥스 카보팩 PA-1(2 mm ID x 250 mm) 컬럼을 갖춘 다이오넥스 HPLC 시스템을 이용하여 분석을 수행하였다. 0.1 M NaOH 중의 하기 나트륨 아세테이트 구배와 함께 0.3 ㎖/분의 유속을 이용하였다: 0분 내지 20분, 0 mM 내지 180 mM. 각각의 용출 후, 0.1 M NaOH 중의 1000 mM 나트륨 아세테이트를 사용한 5분의 세척 단계 및 0.1 M NaOH를 사용한 15분의 평형화 단계를 수행하였다.

자일로스 확인을 복잡하게 하는 간섭 화합물이 존재하는 경우, 30분 동안 H₂O 상에서 등용매 용출(검출을 위해 0.5 M NaOH를 0.1 ㎖/분으로 포스트-컬럼에 첨가함)을 실시한 후, 0.1 M NaOH 중의 1000 mM 나트륨 아세테이트를 사용한 5분의 세척 단계 및 H₂O를 사용한 15분의 평형화 단계를 실시하여 분석을 수행하였다.

기질 및 효소에 의해 형성된 생성물의 확인을 위해 자일로스 및 자일로바이오스(시그마)의 표준물을 사용하였다.

β-자일로시다제 활성 분석 3

중합체성 기질에 대한 자일로시다제 활성을 측정하기 위해 자일로바이오스 대신에 자일란 기질, 예컨대, 귀리 아라비노자일란, 너도밤나무 자일란 및 자작나무 자일란(시그마)을 사용하여 전술된 분석과 동일한 분석을 수행하였다.

모든 기질들이 2 mg/㎖의 농도까지 용해되었다는 점을 제외하고 분석 조건은 동일하였다. 항온처리를 10 mg/g의 용량에서 24시간 동안 60℃에서 수행하였다. 자일로스 및 자일로바이오스 다음에 자일로트라이오스 및 자일로테트라오스를 정량하였다.

α-갈락토시다제 활성 측정

이 분석은 p-니트로페닐-α-D-갈락토피라노사이드(PNPG)에 대한 α-갈락토시다제의 작용에 의한 p-니트로페놀의 방출을 측정한다. 1 α-갈락토시다제 활성 유닛은 60℃ 및 pH 4.5에서 1분 이내에 1 μM의 p-니트로페놀을 유리시키는 효소의 양이다. 아세테이트 완충제(0.1 M, pH 4.5)를 다음과 같이 제조한다: 용액의 최종 부피가 1000 ㎖가 되도록 8.2 g의 무수 나트륨 아세테이트를 증류수에 용해시킨다(용액 A). 별도의 플라스크에서, 6.0 g(5.72 ㎖)의 빙초산을 증류수와 혼합하여 총 1000 ㎖의 부피를 만든다(용액 B). 생성된 용액의 pH가 4.5와 동등할 때까지 용액 A를 용액 B와 혼합하여 최종 0.1 M 아세테이트 완충제(pH 4.5)를 제조한다. 완충제 용액 ℓ 당 한 방울(약 25 ㎕)의 트라이톤 X-100을 첨가한다. PNPG(시그마)를 분석 기질로서 사용한다.

4.4 mM PNPG 스톡 용액을 0.1 M 아세테이트 완충제로 제조한다. 중단 시약(1 M 나트륨 카보네이트 용액)을 다음과 같이 제조한다: 10.6 g의 무수 나트륨 카보네이트를 50 ㎖의 증류수에 용해시키고, 용액 부피를 100 ㎖로 조절한다. 이 시약을 사용하여 효소 반응을 종결한다.

효소와의 항온처리를 위해, 0.1 ㎖의 4.4 mM PNPG 스톡 용액을 0.1 ㎖의 적절하게 희석된 효소 샘플과 혼합하고 60℃에서 60분 동안 항온처리한다. 60분의 항온처리 후, 0.1 ㎖의 반응 혼합물을 0.1 ㎖의 1 M 나트륨 카보네이트 용액과 혼합하고, 마이크로타이터 플레이트에서 흡광도를 405 nm에서 A_S로서 측정한다.

기질 블랭크를 위해, 0.1 ㎖의 4.4 mM PNPG 스톡 용액을 0.1 ㎖의 0.1 M 아세테이트 완충제(pH 4.5)와 혼합하고 샘플과 동일하게 처리한다: 60℃에서 60분 동안 항온처리한 후, 0.1 ㎖의 반응 혼합물을 0.1 ㎖의 1 M 나트륨 카보네이트 용액과 혼합하고, 마이크로타이터 플레이트에서 흡광도를 405 nm에서 A_SB로서 측정한다.

1 M 나트륨 카보네이트 용액과 1:1의 비로 혼합된 p-니트로페놀(0.1 M 아세테이트 완충제로 적절하게 희석됨, pH 4.5)의 보정 곡선을 이용하여 효소의 작용에 의한 PNPG로부터의 그의 방출을 정량한다.

이 분석을 이용하여 효소, 예컨대, GH4, GH27 및 GH36 효소(그러나, 이들로 한정되지 않음)의 활성을 시험할 수 있다.

자일로글루카나제 활성 분석 1

나트륨 아세테이트 완충제(0.05 M, pH 4.5)를 다음과 같이 제조하였다: 4.1 g의 무수 나트륨 아세테이트를 1000 ㎖의 최종 부피까지 증류수에 용해시켰다(용액 A). 별도의 플라스크에서, 3.0 g(2.86 ㎖)의 빙초산을 증류수와 혼합하여 총 1000 ㎖의 부피를 만들었다(용액 B). 생성된 용액의 pH가 4.5일 때까지 용액 A를 용액 B와 혼합하여 최종 0.05 M 나트륨 아세테이트 완충제(pH 4.5)를 제조하였다.

타마린드(Tamarind) 자일로글루칸을 나트륨 아세테이트 완충제에 용해시켜 2.0 mg/㎖를 수득하였다. 효소 배양 상청액을 기질 g 당 10 mg 단백질의 용량으로 기질에 첨가한 후 60℃에서 24시간 동안 항온처리하였다. 샘플을 100℃에서 10분 동안 가열하여 반응을 중단시켰다. 올리고사카라이드의 방출을 고성능 음이온 교환 크로마토그래피로 분석하였다.

블랭크 샘플로서, 기질을 동일한 방식으로 처리하고 항온처리하되 효소를 첨가하지 않았다.

50배 희석된 후 20 ㎕가 항온처리에 첨가된 시판되는 트라이코데르마 리세이 셀룰라제 제제(셀루클라스트; 시그마)와 함께 동일한 조건 하에서 기준물로서 기질도 항온처리하였다.

카보팩 PA 가드 컬럼(2 mm ID x 50 mm) 및 다이오넥스 PAD-검출기(다이오넥스 컴파니, 미국 서니베일 소재)와 함께 다이오넥스 카보팩 PA-1(2 mm ID x 250 mm) 컬럼을 갖춘 다이오넥스 HPLC 시스템을 이용하여 분석을 수행하였다. 0.1 M NaOH 중의 하기 나트륨 아세테이트 구배와 함께 0.3 ㎖/분의 유속을 이용하였다: 0분 내지 40분, 0 mM 내지 150 mM. 각각의 용출 후, 0.1 M NaOH 중의 1000 mM 나트륨 아세테이트를 사용한 5분의 세척 단계 및 0.1 M NaOH를 사용한 15분의 평형화 단계를 수행하였다.

이 분석을 이용하여 효소, 예컨대, GH5, GH12, GH16, GH44 및 GH74 효소(그러나, 이들로 한정되지 않음)의 활성을 시험할 수 있다.

자일로글루카나제 활성 분석 2

하기 실시예는 자일로글루카나제 활성을 측정하기 위한 분석을 예시한다.

자일로글루칸을 기질로서 사용하고 환원 당 분석(PAHBAH)을 검출 방법으로서 이용하여 이러한 활성을 입증하였다. 값을, 시판되는 트라이코데르마 리세이 셀룰라제 제제(셀루클라스트; 시그마)를 사용하여 제조한 표준물과 비교하였다.

시약 A: 5 g의 p-하이드록시벤조산 하이드라자이드(PAHBAH)를 60 ㎖의 물에 현탁시키고, 4.1 ㎖의 농축된 염산을 첨가하고 부피를 100 ㎖로 조절하였다. 시약 B: 24.9 g의 삼나트륨 시트레이트를 500 ㎖의 물에 용해시켰다. 2.2 g의 칼슘 클로라이드 및 40 g의 나트륨 하이드록사이드를 이 용액에 첨가하였다. 물을 사용하여 부피를 2 ℓ로 조절하였다. 상기 두 시약들을 실온에서 저장하였다. 작업 시약: 10 ㎖의 시약 A를 40 ㎖의 시약 B에 첨가하였다. 이 용액을 매일 새로 제조하고 사용 사이에 얼음 상에서 저장하였다. 상기 시약들을 사용하여 분석을 이하에 상세히 기재된 바와 같이 수행하였다.

자일로글루칸 다음에 카복시메틸셀룰로스도 기질로서 사용하여 효소의 특이성을 측정하였다.

항온처리 후, 10 ㎕의 각각의 웰을 200 ㎕의 작업 시약과 혼합하였다. 이들 용액들을 30분 동안 70℃에서 가열하였다. 냉각시킨 후, 405 nm에서 흡광도를 측정함으로써 샘플을 분석하였다. 글루코스를 표준물로서 사용하여 형성된 환원 말단을 글루코스 당량으로서 정량하였다.

대조군으로서, 기질도 효소 배양 상청액의 첨가 없이 항온처리하고 효소 배양 상청액을 기질 없이 항온처리하였다.

자일로글루카나제 활성 분석 3

나트륨 아세테이트 완충제(0.05 M, pH 4.5)를 다음과 같이 제조한다: 4.1 g의 무수 나트륨 아세테이트를 1000 ㎖의 최종 부피까지 증류수에 용해시킨다(용액 A). 별도의 플라스크에서, 3.0 g(2.86 ㎖)의 빙초산을 증류수와 혼합하여 총 1000 ㎖의 부피를 만든다(용액 B). 생성된 용액의 pH가 4.5일 때까지 용액 A를 용액 B와 혼합하여 최종 0.05 M 나트륨 아세테이트 완충제(pH 4.5)를 제조한다.

타마린드 자일로글루카난을 나트륨 아세테이트 완충제에 용해시켜 2.0 mg/㎖를 수득한다. 효소를 기질 g 당 10 mg 단백질의 용량으로 기질에 첨가한 후 60℃에서 24시간 동안 항온처리한다. 샘플을 100℃에서 10분 동안 가열하여 반응을 중단시킨다. 저분자량 올리고사카라이드의 형성을 고성능 크기 배제 크로마토그래피로 분석한다.

블랭크 샘플로서, 기질을 동일한 방식으로 처리하고 항온처리하되 효소를 첨가하지 않는다.

기준물로서, 예를 들면, 시판되는 아스퍼길러스 니게르 또는 트라이코데르마 리세이 셀룰라제 제제(60℃에서 불활성을 나타내는 경우 그 자신의 최적 온도에서 셀룰라제 표준물)과 함께 동일한 조건 하에서 기질을 항온처리한다.

PWX 가드 컬럼(토소 바이오사이언스(Tosoh Bioscience))과 함께 3개의 TSK-겔 컬럼들(컬럼 당 6.0 mm x 15.0 cm; 일련의 SuperAW4000, SuperAW3000 및 SuperAW2500; 토소 바이오사이언스) 상에서 수행된 고성능 크기 배제 크로마토그래피(HPSEC)를 이용하여 분석을 수행한다. 0.2 M 나트륨 니트레이트를 사용하여 0.6 ㎖/분의 속도로 55℃에서 용출을 수행한다. 쇼덱스(Shodex) RI-101(카와사키(Kawasaki)) 굴절 지수(RI) 검출기를 이용하여 용출물을 모니터링한다. 0.18 kDa 내지 788 kDa의 범위 내에서 분자량을 갖는 풀루란(pullulan)(어소시에이티드 폴리머 랩스 인코포레이티드(Associated Polymer Labs Inc.), 미국 뉴욕 소재)을 사용하여 보정을 수행한다.

α-아라비노푸라노시다제 활성 분석

하기 실시예는 치환된 자일로스 잔기로부터 α-L-아라비노푸라노실 잔기를 제거하는 α-아라비노푸라노시다제의 능력을 측정하는 분석을 예시한다.

아라비노자일란을 아라비노스 및 자일로스로 완전히 분해하기 위해, 엔도-자일라나제 및 아라비노푸라노시다제를 비롯한 여러 효소 활성이 필요하다. 밀 아라비노자일란 분자는 아라비노실 잔기로 고도로 치환된다. 이들은 자일로실 잔기의 C2 또는 C3 위치에서 치환될 수 있거나(단일 치환), 자일로스의 C2 위치 및 C3 위치 둘다에서 치환될 수 있다(이중 치환).

40℃에서 48시간 동안 50 mM 아세테이트 완충제(pH 4.5) 중의 밀 아라비노자일란(WAX; 10 mg/㎖; 메가자임(Megazyme), 아일랜드 브레이 소재)을 적절한 양의 엔도-자일라나제(아스퍼길러스 아와모리로부터 유래됨, Kormelink F. et al; Journal of Biotechnology (1993) 27: 249-265)와 함께 항온처리하여 충분한 양의 아라비노자일로-올리고사카라이드를 생성함으로써 단일 치환된 올리고사카라이드 및 이중 치환된 올리고사카라이드를 제조하였다. 샘플을 100℃에서 10분 동안 가열하여 반응을 중단시켰다. 샘플을 10,000 x g에서 5분 동안 원심분리하였다. 상청액을 추가 실험에 사용하였다. 아라비노자일란의 분해 후, 형성된 환원 당의 분석 및 고성능 음이온 교환 크로마토그래피(HPAEC)를 수행하였다.

효소 배양 상청액을 50 mg 나트륨 아세테이트 완충제 중의 기질 g 당 10 mg 단백질의 용량으로 단일 치환된 아라비노자일로-올리고사카라이드 및 이중 치환된 아라비노자일로-올리고사카라이드(엔도-자일라나제로 처리된 WAX; 2 mg/㎖)에 첨가한 후, 65℃에서 24시간 동안 항온처리하였다. 샘플을 100℃에서 10분 동안 가열하여 반응을 중단시켰다. 샘플을 10,000 x g에서 5분 동안 원심분리하였다. 아라비노스의 방출 후 HPAEC 분석을 수행하였다.

카보팩 PA 가드 컬럼(2 mm ID x 50 mm) 및 다이오넥스 PAD-검출기(다이오넥스 컴파니, 미국 서니베일 소재)와 함께 다이오넥스 카보팩 PA-1(2 mm ID x 250 mm) 컬럼을 갖춘 다이오넥스 HPLC 시스템을 이용하여 분석을 수행하였다. 0.1 M NaOH 중의 하기 나트륨 아세테이트 구배와 함께 0.3 ㎖/분의 유속을 이용하였다: 0분 내지 40분, 0 mM 내지 400 mM. 각각의 용출 후, 0.1 M NaOH 중의 1000 mM 나트륨 아세테이트를 사용한 5분의 세척 단계 및 0.1 M NaOH를 사용한 15분의 평형화 단계를 수행하였다. 아라비노스 방출을 확인하고 표준물(시그마)로 정량하였다.

이 분석을 이용하여 효소, 예컨대, GH3, GH43, GH51, GH54 및 GH62 효소(그러나, 이들로 한정되지 않음)의 활성을 시험할 수 있다.

엔도-자일라나제 활성 분석

엔도-자일라나제는 자일란 골격에서 β-1,4 결합을 가수분해하여 짧은 자일로-올리고사카라이드를 생성할 수 있는 효소이다. 이 분석은 밀 아라비노자일란(WAX)(메가자임, 중간 점성 29 cSt), 귀리 아라비노자일란, 너도밤나무 자일란 및 자작나무 자일란(시그마)에 대한 자일라나제의 작용에 의한 자일로스 및 자일로-올리고사카라이드의 방출을 측정한다.

나트륨 아세테이트 완충제(0.05 M, pH 4.5)를 다음과 같이 제조하였다: 4.1 g의 무수 나트륨 아세테이트를 1000 ㎖의 최종 부피까지 증류수에 용해시켰다(용액 A). 별도의 플라스크에서, 3.0 g(2.86 ㎖)의 빙초산을 증류수와 혼합하여 총 1000 ㎖의 부피를 만들었다(용액 B). 생성된 용액의 pH가 4.5일 때까지 용액 A를 용액 B와 혼합하여 최종 0.05 M 나트륨 아세테이트 완충제(pH 4.5)를 제조하였다. 각각의 기질을 나트륨 아세테이트 완충제에 용해시켜 2.0 mg/㎖를 수득하였다. 효소 배양 상청액을 기질 g 당 10 mg 단백질의 용량으로 기질에 첨가한 후, 60℃에서 20시간 동안 항온처리하였다. 샘플을 100℃에서 10분 동안 가열하여 반응을 중단시켰다. 자일로스 및 자일로-올리고사카라이드의 방출을 고성능 음이온 교환 크로마토그래피로 분석하였다.

카보팩 PA 가드 컬럼(2 mm ID x 50 mm) 및 다이오넥스 PAD-검출기(다이오넥스 컴파니, 미국 서니베일 소재)와 함께 다이오넥스 카보팩 PA-1(2 mm ID x 250 mm) 컬럼을 갖춘 다이오넥스 HPLC 시스템을 이용하여 분석을 수행하였다. 0.1 M NaOH 중의 하기 나트륨 아세테이트 구배와 함께 0.3 ㎖/분의 유속을 이용하였다: 0분 내지 40분, 0 mM 내지 400 mM. 각각의 용출 후, 0.1 M NaOH 중의 1000 mM 나트륨 아세테이트를 사용한 5분의 세척 단계 및 0.1 M NaOH를 사용한 15분의 평형화 단계를 수행하였다. 자일로스, 자일로바이오스 및 자일로트라이오스의 표준물(시그마)을 사용하여 상기 효소의 작용에 의해 방출된 이들 올리고머들을 확인하였다.

이 분석을 이용하여 효소, 예컨대, GH5, GH8, GH10 및 GH11 효소(그러나, 이들로 한정되지 않음)의 활성을 시험할 수 있다.

α/β-자일로시다제 활성 측정

이 분석은 p-니트로페닐-α/β-D-자일로피라노사이드(PNPX)에 대한 α/β-자일로시다제의 작용에 의한 p-니트로페놀의 방출을 측정한다. 1 β-자일로시다제 활성 유닛은 60℃ 및 pH 4.5에서 1분 이내에 1 μM의 p-니트로페놀을 유리시키는 효소의 양이다. 아세테이트 완충제(0.1 M, pH 4.5)를 다음과 같이 제조한다: 용액의 최종 부피가 1000 ㎖가 되도록 8.2 g의 무수 나트륨 아세테이트를 증류수에 용해시킨다(용액 A). 별도의 플라스크에서, 6.0 g(5.72 ㎖)의 빙초산을 증류수와 혼합하여 총 1000 ㎖의 부피를 만든다(용액 B). 생성된 용액의 pH가 4.5와 동등할 때까지 용액 A를 용액 B와 혼합하여 최종 0.1 M 아세테이트 완충제(pH 4.5)를 제조한다. 완충제 용액 ℓ 당 한 방울(약 25 ㎕)의 트라이톤 X-100을 첨가한다. PNPX(시그마)를 분석 기질로서 사용한다.

이 분석을 이용하여 효소, 예컨대, GH3, GH30, GH31, GH39, GH43, GH52 및 GH54 효소(그러나, 이들로 한정되지 않음)의 활성을 시험할 수 있다.

α/β-만노시다제 활성 측정

이 분석은 p-니트로페닐-α/β-D-만노피라노사이드(PNPM)에 대한 α/β-만노시다제의 작용에 의한 p-니트로페놀의 방출을 측정한다. 1 α/β-만노시다제 활성 유닛은 60℃ 및 pH 4.5에서 1분 이내에 1 μM의 p-니트로페놀을 유리시키는 효소의 양이다. 아세테이트 완충제(0.1 M, pH 4.5)를 다음과 같이 제조한다: 용액의 최종 부피가 1000 ㎖가 되도록 8.2 g의 무수 나트륨 아세테이트를 증류수에 용해시킨다(용액 A). 별도의 플라스크에서, 6.0 g(5.72 ㎖)의 빙초산을 증류수와 혼합하여 총 1000 ㎖의 부피를 만든다(용액 B). 생성된 용액의 pH가 4.5와 동등할 때까지 용액 A를 용액 B와 혼합하여 최종 0.1 M 아세테이트 완충제(pH 4.5)를 제조한다. 완충제 용액 ℓ 당 한 방울(약 25 ㎕)의 트라이톤 X-100을 첨가한다. PNPM(시그마)을 분석 기질로서 사용한다.

4.4 mM PNPM 스톡 용액을 0.1 M 아세테이트 완충제로 제조한다. 중단 시약(1 M 나트륨 카보네이트 용액)을 다음과 같이 제조한다: 10.6 g의 무수 나트륨 카보네이트를 50 ㎖의 증류수에 용해시키고, 용액 부피를 100 ㎖로 조절한다. 이 시약을 사용하여 효소 반응을 종결시킨다.

효소와의 항온처리를 위해, 0.1 ㎖의 4.4 mM PNPM 스톡 용액을 0.1 ㎖의 적절하게 희석된 효소 샘플과 혼합하고 60분 동안 60℃에서 항온처리한다. 60분의 항온처리 후, 0.1 ㎖의 반응 혼합물을 0.1 ㎖의 1 M 나트륨 카보네이트 용액과 혼합하고 마이크로타이터 플레이트에서 흡광도를 405 nm에서 A_S로서 측정한다.

기질 블랭크를 위해, 0.1 ㎖의 4.4 mM PNPM 스톡 용액을 0.1 ㎖의 0.1 M 아세테이트 완충제(pH 4.5)와 혼합하고 샘플과 동일하게 처리한다: 60분 동안 60℃에서 항온처리한 후, 0.1 ㎖의 반응 혼합물을 0.1 ㎖의 1 M 나트륨 카보네이트 용액과 혼합하고, 마이크로타이터 플레이트에서 흡광도를 405 nm에서 A_SB로서 측정한다.

1 M 나트륨 카보네이트 용액과 1:1의 비로 혼합된 p-니트로페놀(0.1 M 아세테이트 완충제로 적절하게 희석됨, pH 4.5)의 보정 곡선을 이용하여 효소의 작용에 의한 PNPM으로부터의 그의 방출을 정량한다.

이 분석을 이용하여 효소, 예컨대, GH1, GH2, GH5, GH38, GH47, GH92 및 GH125 효소(그러나, 이들로 한정되지 않음)의 활성을 시험할 수 있다.

페룰로일 에스터라제 활성 측정

합성 기질: 메틸 카페에이트(caffeate), 메틸 쿠마레이트(coumarate), 메틸 시나피네이트(sinapinate) 및 메틸 페룰레이트(ferulate)를 아핀 케미칼스(Apin Chemicals)로부터 입수한다. 효소를 5.0의 pH(50 mM 나트륨 아세테이트 완충제)에서 약 5 mg/g DM의 용량으로 기질과 함께 항온처리하여 이들 합성 기질들에 대한 활성을 측정한다. 반응은 최대 24시간 동안 60℃에서 수행될 것이다.

항온처리의 말기에 샘플을 5분 동안 끓여 효소를 불활성화시키고 실온에서 원심분리한다(10분, 10,000 x g). 하이퍼실(Hypersyl) GOLD 컬럼(2.1 mm X 150 mm, 1.9 ㎛ 입자 크기; 써모 사이언티픽(Thermo Scientific))을 갖춘 악셀라(Accela) UHPLC 시스템(써모 사이언티픽) 상에서 종래 기재된 바와 같이(Appeldoorn et al., 2010) 음이온 모드로 RP-UHPLC-MS 분석을 수행하여 기질로부터의 하이드록시신남산 방출을 측정한다. 이동상은 (A) H₂O + 1%(부피/부피) 아세토니트릴 + 0.2%(부피/부피) 아세트산, 및 (B) 아세토니트릴 + 0.2%(부피/부피) 아세트산으로 구성된다. 유속은 0.4 ㎖/분이고, 컬럼 온도는 30℃이다. 용출 프로파일은 다음과 같다: 먼저 5분, 등용매 0% B; 5분 내지 23분, 0% B부터 50% B까지 선형; 23분 내지 24분, 50% B부터 100% B까지 선형; 24분 내지 27분, 100% B에서 등용매; 27분 내지 28분, 100% B부터 0% B까지 선형, 이어서 7분 동안 컬럼의 재컨디셔닝. 스펙트럼 데이터를 200 nm부터 600 nm까지 수집하고, 320 nm에서 정량을 수행한다. 페룰산(ferulic acid), 카페산(caffeic acid), 시납산(sinapic acid) 및 쿠마르산(coumaric acid) 함량을 확인하고 표준물에 근거하여 정량한다.

3.5 kV의 이온 분무 전압, -20 V의 모세관 전압 및 35℃의 모세관 온도를 이용하여 MS 데이터를 음성 모드로 수집한다. m/z 150-1500 범위 내에서 전체 MS 스캔을 수행하고 가장 강한 이온의 MS2 데이터를 수득한다.

이 분석을 이용하여 효소, 예컨대, CE1 효소(그러나, 이것으로 한정되지 않음)의 활성을 시험할 수 있다.

페룰로일 에스터라제 활성 측정

천연 기질: 전처리된 옥수수 섬유(CF)로부터 정제된 아라비노자일란 올리고머(각각 1 mg/㎖)(Appeldoorn et al., 2010)를 5.0의 pH(50 mM 나트륨 아세테이트 완충제)에서 약 5 mg/g DM의 용량으로 페룰산 에스터라제와 함께 항온처리한다. 반응은 최대 24시간 동안 60℃에서 수행될 것이다.

항온처리의 말기에 샘플을 5분 동안 끓여 효소를 불활성화시키고 실온에서 원심분리한다(10분, 10,000 x g). 하이퍼실 GOLD 컬럼(2.1 mm X 150 mm, 1.9 ㎛ 입자 크기; 써모 사이언티픽)을 갖춘 악셀라 UHPLC 시스템(써모 사이언티픽) 상에서 종래 기재된 바와 같이(Appeldoorn et al., 2010) 음이온 모드로 RP-UHPLC-MS 분석을 수행하여 기질로부터의 하이드록시신남산 방출을 측정한다. 이동상은 (A) H₂O + 1%(부피/부피) 아세토니트릴 + 0.2%(부피/부피) 아세트산, 및 (B) 아세토니트릴 + 0.2%(부피/부피) 아세트산으로 구성된다. 유속은 0.4 ㎖/분이고, 컬럼 온도는 30℃이다. 용출 프로파일은 다음과 같다: 먼저 5분, 등용매 0% B; 5분 내지 23분, 0% B부터 50% B까지 선형; 23분 내지 24분, 50% B부터 100% B까지 선형; 24분 내지 27분, 100% B에서 등용매; 27분 내지 28분, 100% B부터 0% B까지 선형, 이어서 7분 동안 컬럼의 재컨디셔닝. 스펙트럼 데이터를 200 nm부터 600 nm까지 수집하고, 320 nm에서 정량을 수행한다. 페룰산 및 쿠마르산(coumaric acid) 함량을 확인하고 표준물에 근거하여 정량한다.

알칼리성 가수분해 및 에틸에테르 추출 후 전술된 UHPLC 방법을 이용하여 옥수수 올리고머 중의 에스터-연결된 페룰산의 총량을 측정한다.

참고문헌: MAAIKE M. APPELDOORN et al, J. Agric. Food Chem. 2010, 58, 11294-11301.

α- 글루쿠로니다제 활성 분석

하기 실시예는 알도우론산(aldouronic acid)(메가자임)에 대한 α-글루쿠로니다제 활성을 측정하는 분석을 예시한다. 이 분석은 글루쿠로노자일란 올리고사카라이드에 대한 α-글루쿠로니다제의 작용에 의한 자일로스 및 자일로올리고머의 방출을 측정한다.

나트륨 아세테이트 완충제(0.05 M, pH 4.5)를 다음과 같이 제조하였다: 4.1 g의 무수 나트륨 아세테이트를 최종 1000 ㎖의 부피까지 증류수에 용해시켰다(용액 A). 별도의 플라스크에서, 3.0 g(2.86 ㎖)의 빙초산을 증류수와 혼합하여 총 1000 ㎖의 부피를 만들었다(용액 B). 생성된 용액의 pH가 4.5일 때까지 용액 A를 용액 B와 혼합하여 최종 0.05 M 나트륨 아세테이트 완충제(pH 4.5)를 제조하였다.

작은 올리고머에 대한 활성을 측정하기 위해 알도우론산을 나트륨 아세테이트 완충제에 용해시켜 1.0 mg/㎖를 수득하였다. 효소 배양 상청액을 기질 g 당 1 mg 및 10 mg 단백질의 용량으로 기질에 첨가한 후, 60℃에서 24시간 동안 항온처리하였다. 샘플을 100℃에서 10분 동안 가열하여 반응을 중단시켰다. 4-O-메틸 글루쿠론산 제거의 결과로서 자일로올리고머의 방출을 고성능 음이온 교환 크로마토그래피로 분석하였다.

카보팩 PA 가드 컬럼(2 mm ID x 50 mm) 및 다이오넥스 PAD-검출기(다이오넥스 컴파니, 미국 서니베일 소재)와 함께 다이오넥스 카보팩 PA-1(2 mm ID x 250 mm) 컬럼을 갖춘 다이오넥스 HPLC 시스템을 이용하여 분석을 수행하였다. 0.1 M NaOH 중의 하기 나트륨 아세테이트 구배와 함께 0.3 ㎖/분의 유속을 이용하였다: 0분 내지 40분, 0 mM 내지 400 mM. 각각의 용출 후, 0.1 M NaOH 중의 1000 mM 나트륨 아세테이트를 사용한 5분의 세척 단계 및 0.1 M NaOH를 사용한 15분의 평형화 단계를 수행하였다.

자일로스, 자일로바이오스 및 자일로트라이오스의 표준물(시그마)을 사용하여 이들 올리고머들로부터 4-O-메틸-글루쿠론산을 제거하는 효소의 작용에 의해 방출된 자일로올리고머를 확인하였다.

이 분석을 이용하여 효소, 예컨대, GH67 및 GH115 효소(그러나, 이들로 한정되지 않음)의 활성을 시험할 수 있다.

실시예 1: 아스퍼길러스 니게르 발현 벡터의 구축

본 실시예는 아스퍼길러스 니게르에서 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305를 과다발현시키기 위한 발현 구축물의 구축을 기술한다. 라삼소니아 에머소니이 규주 CBS 393.64의 게놈 DNA를 서열결정하고 분석하였다. 표 1에 따른 활성을 갖는 단백질로서 해독된 번역된 단백질을 갖는 유전자를 확인하였다. 코돈-쌍 최적화된 ORF 서열, 단백질 서열, 신호 서열, 게놈 서열 및 야생형 cDNA 서열을 포함하는 라삼소니아 에머소니이 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 및 Temer07305 유전자의 서열들이 서열목록에서 서열번호 1 내지 75로 제시되어 있다.

발현 플라스미드의 구축

EcoRI 및 PacI 부위를 사용하여 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71을 갖는 서열을, 글루코아밀라제 프로모터 및 종결요소 서열을 포함하는 pGBTOP 벡터(도 1) 내로 클로닝한다. 아스퍼길러스 니게르 CBS 513.88의 형질전환 전, NotI 분해를 통해 에스케리키아 콜라이 부분을 제거한다.

아스퍼길러스 니게르의 형질전환 및 진탕 플라스크 발효

실험 정보 단락에 기재된 방법에 따라 아스퍼길러스 니게르 균주 CBS 513.88을 발현 구축물 및 적절한 선택 마커(amdS 또는 플레오마이신) 함유 플라스미드로 공-형질전환시킨다. 재조합 및 대조군 아스퍼길러스 니게르 균주들의 포자 또는 균사체를 제조자의 설명서에 따라 제조된 PDA 플레이트(감자 덱스트로스 한천, 옥소이드(Oxoid)) 상에 플레이팅하여 큰 포자 회분을 생성한다. 30℃에서 3일 내지 7일 동안 생장시킨 후, 0.01% 트라이톤 X-100을 플레이트에 첨가한 후 포자를 수집한다. 멸균수로 세척한 후, 선택된 형질전환체 및 대조군 균주의 약 10⁷개의 포자를, ℓ 당 하기 용량의 성분들로 구성된 20 ㎖의 액체 예비배양 배지(pH 5.5)를 함유하는 100 ㎖ 배플(baffles) 보유 진탕 플라스크 내로 접종한다: 30 g 말토스.H₂O; 5 g 효모 추출물; 10 g 가수분해된 카세인; 1 g KH₂PO₄; 0.5 g MgSO₄.7H₂O; 0.03 g ZnCl₂; 0.02 g CaCl₂; 0.01 g MnSO₄.4H₂O; 0.3 g FeSO₄.7H₂O; 3 g 트윈 80; 및 10 ㎖ 페니실린(5000 IU/㎖)/스트렙토마이신(5000 UG/㎖). 이 배양물을 34℃에서 16시간 내지 24시간 동안 생장시킨다. 10 ㎖의 이 배양물을, ℓ 당 하기 용량의 성분들로 구성되고 pH 5.6으로 조절된 100 ㎖ 발효 배지를 함유하는 500 ㎖ 배플 보유 진탕 플라스크 내로 접종한다: 70 g 글루코스.H₂O; 25 g 가수분해된 카세인; 12.5 g 효모 추출물; 1 g KH₂PO₄; 2 g K₂SO₄; 0.5 g MgSO₄.7H₂O; 0.03 g ZnCl₂; 0.02 g CaCl₂; 0.01 g MnSO₄.4H₂O; 0.3 g FeSO₄.7H₂O; 및 10 ㎖ 페니실린(5000 IU/㎖)/스트렙토마이신(5000 UG/㎖). 모든 글루코스가 고갈될 때까지(통상적으로 4일 내지 7일 후) 이 배양물을 34℃에서 생장시킨다. 발효 브로쓰로부터 채취된 샘플을 진동 버킷(swinging bucket) 원심분리기에서 (5000 x g에서 10분 동안) 원심분리하고 상청액을 수집하고 0.2 ㎛ 필터(날진(Nalgene)) 상에서 여과한다.

SDS-PAGE 및 총 단백질 측정으로 상청액을 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 및 Temer07305의 발현에 대해 분석한다.

실시예 2: 라삼소니아 에머소니이 발현 벡터의 구축

본 실시예는 라삼소니아 에머소니이에서 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305를 과다발현시키기 위한 발현 구축물의 구축을 기술한다. 발현 카세트를 RePepA 좌위 내로 표적화 삽입하였다.

프로모터-레포터 구축물을 pepA 좌위 내로 표적화하기 위해, 표적화용 발현 벡터를 클로닝하였다. 프로테아제 pepA로서 해독된 번역된 단백질을 갖는 유전자를 게놈에서 확인하였다. ORF 및 약 3000 bp의 5' 영역 및 2500 bp의 3' 플랭킹 영역의 게놈 서열, cDNA 및 단백질 서열을 포함하는, 라삼소니아 에머소니이 pepA (RePepA)의 서열은 서열목록에서 각각 서열번호 76, 77 및 78로 제시되어 있다.

RePepA 좌위 내로의 표적화를 위해 상용적인 클로닝 절차에 따라 2개의 벡터들을 구축하였다. 두 벡터들의 삽입체 단편들은 소위 "이분 유전자 표적화" 방법(Nielsen et al., 2006, 43: 54-64)에 의해 함께 적용될 수 있다. 이 방법은 유전자 표적화 서열과 함께 중첩되는 선택 마커의 2개 비-기능성 DNA 단편들을 사용하는 방법이다(이분 방법의 추가 상세한 내용에 대해서는 국제 특허출원 공개 제WO2008/113847호 또한 참조). 정확한 상동성 재조합 시, 선택 마커는 상동성 표적 좌위에서의 삽입에 의해 기능성을 갖게 된다. 국제 특허출원 공개 제WO2008/113847호에도 상세히 기재된 바와 같이, 이분 유전자 표적화를 위한 2개의 중첩 DNA 분자들을 제공할 수 있도록 2개의 상이한 결실 벡터들인 Te pep.bbn 및 pEBA1006을 디자인하고 구축하였다. 제1 벡터 Te pep.bbn(도 2에서와 같은 일반적인 배치)은 RePepA 좌위에서의 표적화를 위해 RePepA ORF의 약 1.5 kb 업스트림에 위치하는 1500 bp 5' 플랭킹 영역(ORF 및 약 1500 bp의 RePepA 프로모터)을 포함하고 lox66 부위, 및 아스퍼길러스 니둘란스 gpdA 프로모터에 의해 유발되는 ble 코딩 영역의 비-기능성 5' 부분(ble의 3' 말단에서 코딩 서열의 마지막 104개 염기를 결여하는 PgpdA-ble 서열, 서열번호 79)을 포함한다. 에스케리키아 콜라이에서의 프로모터-레포터 카세트의 효율적인 클로닝을 가능하게 하기 위해, 5' RePepA 플랭킹 영역과 lox66 부위 사이에 ccdB 유전자를 삽입하였다. 제2 pEBA1006 벡터(도 3에서와 같은 일반적인 배치)는 ble 코딩 영역의 비-기능성 3' 부분 및 아스퍼길러스 니둘란스 trpC 종결요소(ble의 5' 말단에서 코딩 서열의 처음 12개 염기를 결여하는 ble-TtrpC 서열, 서열번호 80), lox71 부위, 및 RePepA 좌위에서의 표적화를 위한 RePepA ORF의 2500 bp 3' 플랭킹 영역을 포함한다. 상동성 재조합 시, 제1 비-기능성 단편 및 제2 비-기능성 단편은 기능성을 갖게 되어 기능성 ble 카세트를 생성한다. RePepA 업스트림 유전자 플랭킹 영역 및 다운스트림 유전자 플랭킹 영역 둘다가 예정된 RePepA 게놈 좌위에서의 이분 단편들의 상동성 재조합을 위해 표적화된다.

벡터 Te pep.bbn 내의 ccdB 유전자를 상용적인 클로닝 절차에 따라 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 발현 카세트로 교체하였다. 서열번호 81로 표시되는 라삼소니아 에머소니이 프로모터 2를, 아스퍼길러스 니둘란스 amdS 종결요소를 갖는 라삼소니아 에머소니이 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 코딩 영역의 업스트림에서 클로닝하여 구축물 pEBA를 생성하였다. 아스퍼길러스 니둘란스 amdS 종결요소 서열은 서열번호 82로 표시된다. 관심있는 유전자(GOI)인 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305의 과다발현을 위한 pEBA의 도식적 묘사는 도 4에 제시되어 있다.

실시예 3: 라삼소니아 에머소니이에서의 Temer00088 , Temer09484 , Temer08028, Temer02362 , Temer08862 , Temer04790 , Temer05249 , Temer06848 , Temer02056, Temer03124 , Temer09491 , Temer06400 , Temer08570 , Temer08163 또는 Temer07305 유전자의 과다발현

국제 특허출원 공개 제WO2011/054899호에 이미 기재된 방법을 이용하여 pEBA 및 pEBA1006의 선형 DNA를 단리하고 사용하여 라삼소니아 에머소니이를 형질전환시킨다. 선형 DNA들은 RePepA 좌위에서 게놈 내로 함께 삽입되어 RePepA 유전자를 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 및 ble 유전자로 치환시킬 수 있다. 형질전환체를 플레오마이신 배지 상에서 선택하고 콜로니를 정제하고 국제 특허출원 공개 제WO2011/054899호에 기재된 절차에 따라 시험한다. 결실 카세트의 gpdA 프로모터 내의 프라이머 및 5' 표적화 영역의 바로 업스트림에 위치하는 게놈 서열에 대해 유도된 프라이머를 사용하여 성장하는 콜로니를 RePepA 좌위에서의 삽입에 대해 PCR로 진단한다. RePepA가 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305/ble 카세트로 교체되어 있는 후보 형질전환체를 수득한다.

실시예 4: Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 과다발현 라삼소니아 에머소니이 균주에서의 효소 활성

Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 과다발현 균주를 진탕 플라스크 내에서 라삼소니아 배지 3에서 발효시키고 상청액을 적합한 분석에서 표 1에 따른 활성에 대해 분석한다. 야생형 균주에 비해 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305 과다발현 균주에서 활성의 증가가 관찰되는데, 이것은 Temer00088, Temer09484, Temer08028, Temer02362, Temer08862, Temer04790, Temer05249, Temer06848, Temer02056, Temer03124, Temer09491, Temer06400, Temer08570, Temer08163 또는 Temer07305의 과다발현이 라삼소니아 에머소니이에서 활성을 개선한다는 것을 시사한다.

실시예 5: 아스퍼길러스 니게르 진탕 플라스크 발효

선택된 형질전환체 및 대조군 균주의 약 10⁷개의 포자를, ℓ 당 하기 용량의 성분들로 구성된 20 ㎖의 액체 예비배양 배지(pH 5.5)를 함유하는 100 ㎖ 배플 보유 진탕 플라스크 내로 접종하였다: 30 g 말토스.H₂O; 5 g 효모 추출물; 10 g 가수분해된 카세인; 1 g KH₂PO₄; 0.5 g MgSO₄.7H₂O; 0.03 g ZnCl₂; 0.02 g CaCl₂; 0.01 g MnSO₄.4H₂O; 0.3 g FeSO₄.7H₂O; 3 g 트윈 80; 및 10 ㎖ 페니실린(5000 IU/㎖)/스트렙토마이신(5000 UG/㎖). 이 배양물을 34℃에서 16시간 내지 24시간 동안 생장시켰다. 10 ㎖의 이 배양물을, ℓ 당 하기 용량의 성분들로 구성되고 pH 5.6으로 조절된 100 ㎖ 발효 배지를 함유하는 500 ㎖ 배플 보유 진탕 플라스크 내로 접종하였다: 70 g 글루코스.H₂O; 25 g 가수분해된 카세인; 12.5 g 효모 추출물; 1 g KH₂PO₄; 2 g K₂SO₄; 0.5 g MgSO₄.7H₂O; 0.03 g ZnCl₂; 0.02 g CaCl₂; 0.01 g MnSO₄.4H₂O; 0.3 g FeSO₄.7H₂O; 및 10 ㎖ 페니실린(5000 IU/㎖)/스트렙토마이신(5000 UG/㎖). 모든 글루코스가 고갈될 때까지(통상 4일 내지 7일 후) 이 배양물을 34℃에서 생장시켰다. 발효 브로쓰로부터 채취된 샘플을 진동 버킷 원심분리기에서 (5000 x g에서 10분 동안) 원심분리하고 상청액을 수집하고 0.2 ㎛ 필터(날진) 상에서 여과하였다.

TCA-뷰렛(biuret) 방법을 이용한 진탕 플라스크 농도 및 단백질 농도 측정

추가 시험을 위한 보다 많은 양의 물질을 수득하기 위해, 10 kDa 스핀 필터를 이용하여 전술된 바와 같이 수득된 발효 상청액(75 ㎖ 내지 100 ㎖의 부피)을 약 5 ㎖의 부피까지 농축하였다. 그 후, 농축된 상청액 중의 단백질 농도를 TCA-뷰렛 방법을 통해 측정하였다.

농축된 단백질 샘플(상청액)을 물로 2 mg/㎖ 내지 8 mg/㎖의 농도까지 희석하였다. 소 혈청 알부민(BSA) 희석물(0 mg/㎖, 1 mg/㎖, 2 mg/㎖, 5 mg/㎖, 8 mg/㎖ 및 10 mg/㎖)을 제조하고 샘플로서 포함시켜 보정 곡선을 생성하였다. 각각의 희석된 단백질 샘플 중 270 ㎕를, 830 ㎕의 아세톤 중의 12%(중량/부피) 트라이클로로아세트산 용액을 함유하는 10 ㎖ 튜브 내로 옮기고 철저히 혼합하였다. 그 후, 상기 튜브를 빙수 상에서 1시간 동안 항온처리하고 4℃ 및 6000 rpm에서 30분 동안 원심분리하였다. 상청액을 따라내고, 튜브를 티슈 상에 뒤집어 놓고 실온에서 30분 동안 세워두어 펠렛을 건조하였다. 다음으로, 3 ㎖의 바이오퀀트(BioQuant) 뷰렛 시약 혼합물을 튜브 내의 펠렛에 첨가하고 혼합 후 1 ㎖의 물을 첨가하여 펠렛을 가용화하였다. 튜브를 철저히 혼합하고 실온에서 30분 동안 항온처리하였다. 블랭크 측정으로서 사용된 물 샘플을 사용하여 혼합물의 흡수를 546 nm에서 측정하고 단백질 농도를 BSA 보정 선을 통해 계산하였다.

실시예 6: 자일로바이오스에 대한 호열성 라삼소니아 에머소니이 Temer09484 β-자일로시다제 활성의 확인

라삼소니아 에머소니이 Temer09484의 β-자일로시다제 활성을 전술된 바와 같이 분석하였다. Temer09484 아스퍼길러스 니게르 진탕 플라스크 발효의 상청액을 농축하고, pH 4.5 및 62℃에서 24시간 동안 항온처리한 후 자일로바이오스로부터의 자일로스 방출에 대해 2개 용량에서 분석하였다. 상기 효소는 표 3에 제시된 바와 같이 자일로바이오스로부터의 유의한 자일로스 방출을 보였다. 이것은 Temer09484가 β-자일로시다제 활성을 갖는다는 것을 보여준다.

[표 3]

실시예 7: 중합체성 자일란 기질에 대한 호열성 라삼소니아 에머소니이 Temer09484 β-자일로시다제 활성의 확인

제2 실험으로서, 중합체성 자일란 기질에 대한 라삼소니아 에머소니이 Temer09484의 β-자일로시다제 활성도 분석하였다. Temer09484 아스퍼길러스 니게르 진탕 플라스크의 상청액을 10 mg/g의 용량으로 3개의 상이한 중합체성 자일란 기질들에 첨가하였다. 모든 3개의 기질들로부터 자일로스가 방출된 반면(표 4), 자일로올리고머는 형성되지 않았다. 이것은 Temer09484가 실시예 6에 제시된 작은 올리고머 다음으로 중합체성 기질에 대한 β-자일로시다제 활성도 갖는다는 것을 보여준다.

[표 4]

실시예 8: 리그노셀룰로스성 공급원료의 가수분해를 위한 Temer09484의 첨가에 의한 2개의 상이한 셀룰로스 혼합물들의 개선

Temer09484 아스퍼길러스 니게르 진탕 플라스크 발효의 상청액을 농축하고 전술된 바와 같이 약산 전처리된 옥수수대 공급원료에 첨가하였다. 상기 효소는 표 5에 제시된 바와 같이 72시간의 항온처리 동안 이용된 넓은 온도(50℃, 65℃ 및 75℃) 및 pH 값(3.5 - 4.5 - 5.0) 범위 내에서 이 공급원료로부터의 유의한 자일로스 방출을 보였다. 이것은 Temer09484가 리그노셀룰로스성 공급원료의 가수분해에 중요하다는 것을 보여준다.

[표 5]

Temer09484 아스퍼길러스 니게르 진탕 플라스크 발효의 상청액을 2개의 상이한 셀룰로스 혼합물들과 함께 시험하였다: 추가 BG가 첨가된 TEC-210 및 셀루클라스트. 상기 두 셀룰로스 혼합물들의 경우 약산 전처리된 옥수수대로부터의 자일로스 방출이 표 6에 제시된 바와 같이 72시간의 항온처리 동안 이용된 넓은 온도(50℃, 65℃ 및 75℃) 및 pH 값(3.5 - 4.5 - 5.0) 범위 내에서 Temer09484의 첨가에 의해 개선되었다. 이것은 Temer09484가 리그노셀룰로스성 공급원료의 가수분해에 이용된 넓은 온도 및 pH 값 범위 내에서 셀룰로스 혼합물을 개선하는 데에 이용될 수 있다는 것을 보여준다.

[표 6]

실시예 9: 자일로바이오스에 대한 호열성 라삼소니아 에머소니이 Temer00088 β-자일로시다제 활성의 확인

라삼소니아 에머소니이 Temer00088의 β-자일로시다제 활성을 전술된 바와 같이 분석하였다. Temer00088 아스퍼길러스 니게르 진탕 플라스크 발효의 상청액을 농축하고, pH 4.5 및 62℃에서 24시간 동안 항온처리한 후 자일로바이오스로부터의 자일로스 방출에 대해 2개의 용량에서 분석하였다. 상기 효소는 표 7에 제시된 바와 같이 자일로바이오스로부터의 유의한 자일로스 방출을 보였다. 이것은 Temer00088이 β-자일로시다제 활성을 갖는다는 것을 보여준다.

[표 7]

실시예 10: 중합체성 자일란 기질에 대한 호열성 라삼소니아 에머소니이 Temer00088 β-자일로시다제 활성의 확인

제2 실험으로서, 중합체성 자일란 기질에 대한 라삼소니아 에머소니이 Temer00088의 β-자일로시다제 활성도 분석하였다. Temer00088 아스퍼길러스 니게르 진탕 플라스크의 상청액을 10 mg/g의 용량으로 3개의 상이한 중합체성 자일란 기질들에 첨가하였다. 모든 3개의 기질들로부터 자일로스가 방출된 반면(표 8), 자일로올리고머는 형성되지 않았다. 이것은 Temer00088이 실시예 9에 제시된 작은 올리고머 다음으로 중합체성 기질에 대한 β-자일로시다제 활성도 갖는다는 것을 보여준다.

[표 8]

실시예 11: 리그노셀룰로스성 공급원료의 가수분해를 위한 Temer00088의 첨가에 의한 2개의 상이한 셀룰로스 혼합물들의 개선

Temer00088 아스퍼길러스 니게르 진탕 플라스크 발효의 상청액을 농축하고 전술된 바와 같이 약산 전처리된 옥수수대 공급원료에 첨가하였다. 상기 효소는 표 3에 제시된 바와 같이 72시간의 항온처리 동안 이용된 넓은 온도(50℃, 65℃ 및 75℃) 및 pH 값(3.5 - 4.5 - 5.0) 범위 내에서 이 공급원료로부터의 유의한 자일로스 방출을 보였다. 이것은 Temer00088이 리그노셀룰로스성 공급원료의 가수분해에 중요하다는 것을 보여준다.

[표 9]

Temer00088 아스퍼길러스 니게르 진탕 플라스크 발효의 상청액을 2개의 상이한 셀룰로스 혼합물들과 함께 시험하였다: 추가 BG가 첨가된 TEC-210 및 셀루클라스트. 상기 두 셀룰로스 혼합물들의 경우 약산 전처리된 옥수수대로부터의 자일로스 방출이 표 10에 제시된 바와 같이 72시간의 항온처리 동안 이용된 넓은 온도(50℃, 65℃ 및 75℃) 및 pH 값(3.5 - 4.5 - 5.0) 범위 내에서 Temer00088의 첨가에 의해 개선되었다. 이것은 Temer00088이 리그노셀룰로스성 공급원료의 가수분해에 이용된 넓은 온도 및 pH 값 범위 내에서 셀룰로스 혼합물을 개선하는 데에 이용될 수 있다는 것을 보여준다.

[표 10]

실시예 12: 호열성 라삼소니아 에머소니이 자일로글루칸 특이적 엔도-글루카나제의 확인

라삼소니아 에머소니이 Temer04790의 자일로글루카나제 활성을 전술된 바와 같이 분석하였다. Temer04790 아스퍼길러스 니게르 진탕 플라스크 발효의 상청액을 농축하고 기질 자일로글루칸에 첨가하고 pH 4.5 및 60℃에서 24시간 동안 항온처리하였다. 상기 효소는 표 6에 제시된 바와 같이 여러 올리고머들을 방출시킬 수 있었다. 이것은 Temer04790이 자일로글루칸에 대한 활성을 갖고 시판되는 트라이코데르마 리세이 셀룰라제 혼합물인 셀루클라스트와 유사한 올리고머를 방출시킨다는 것을 보여준다.

형성된 올리고머의 양을 정량하기 위해, Temer04790 및 셀룰라제 혼합물 둘다의 항온처리 후 환원 말단을 측정하였다. 카복시메틸셀룰로스를 기질로서 사용하여 효소 특이성도 측정하였고, 60℃ 다음으로 보다 더 높은 온도인 75℃를 이용하였다. 셀룰라제 혼합물과 대조적으로 CMC에 대한 어떠한 활성도 거의 관찰되지 않았기 때문에 Temer04790은 자일로글루칸에 대한 특이성을 갖는다(표 11). 나아가, Temer04790은 75℃에서 여전히 활성을 가진 반면, 셀룰라제 혼합물은 75℃에서 자일로글루칸에 대한 활성을 거의 갖지 않았다.

[표 11]

실시예 13: 호열성 라삼소니아 에머소니이 아라비노푸라노시다제 활성의 확인

라삼소니아 에머소니이 Temer05249의 아라비노푸라노시다제 활성을 전술된 바와 같이 분석하였다. Temer05249 아스퍼길러스 니게르 진탕 플라스크 발효의 상청액을 농축하고 10 mg/g의 용량으로 아라비노자일로올리고머에 첨가한 후, pH 4.5 및 65℃에서 24시간 동안 항온처리하였다. 상기 효소는 표 12에 제시된 바와 같이 아라비노자일로올리고머로부터의 유의한 아라비노스 방출을 보였다. 이것은 Temer05249가 아라비노푸라노시다제 활성을 갖는다는 것을 보여준다.

[표 12]

실시예 14: 호열성 라삼소니아 에머소니이 엔도-자일라나제 활성의 확인

라삼소니아 에머소니이 Temer03124의 엔도-자일라나제 활성을 전술된 바와 같이 분석하였다. Temer03124 아스퍼길러스 니게르 진탕 플라스크 발효의 상청액을 농축하고 10 mg/g의 용량으로 여러 자일란 기질들에 첨가한 후, pH 4.5 및 60℃에서 20시간 동안 항온처리하였다. 상기 효소는 표 13에 제시된 바와 같이 자일로스 및 다양한 자일로올리고머의 유의한 방출을 보였다. 이것은 Temer03124가 엔도-자일라나제 활성을 갖는다는 것을 보여준다.

[표 13]

실시예 15: 호열성 라삼소니아 에머소니이 엔도-자일라나제 활성의 확인

라삼소니아 에머소니이 Temer08570의 엔도-자일라나제 활성을 전술된 바와 같이 분석하였다. Temer08570 아스퍼길러스 니게르 진탕 플라스크 발효의 상청액을 농축하고 10 mg/g의 용량으로 여러 자일란 기질들에 첨가한 후, pH 4.5 및 60℃에서 20시간 동안 항온처리하였다. 상기 효소는 표 14에 제시된 바와 같이 자일로스 및 다양한 자일로올리고머의 유의한 방출을 보였다. 이것은 Temer08570이 주요 생성물로서 자일로바이오스, 자일로트라이오스 및 자일로테트라오스를 갖는 엔도-자일라나제 활성을 갖는다는 것을 보여준다.

[표 14]

실시예 16: 호열성 라삼소니아 에머소니이 엔도-자일라나제 활성의 확인

라삼소니아 에머소니이 Temer08163의 엔도-자일라나제 활성을 전술된 바와 같이 분석하였다. Temer08163 아스퍼길러스 니게르 진탕 플라스크 발효의 상청액을 농축하고 10 mg/g의 용량으로 여러 자일란 기질들에 첨가한 후, pH 4.5 및 60℃에서 20시간 동안 항온처리하였다. 상기 효소는 표 15에 제시된 바와 같이 자일로바이오스 및 자일로스의 유의한 방출을 보였다. 이것은 Temer08163이 방출된 자일로스의 양보다 12배 내지 25배 더 높은 주요 생성물로서 자일로바이오스를 갖는 엔도-자일라나제 활성을 갖는다는 것을 보여준다.

[표 15]

실시예 17: 호열성 라삼소니아 에머소니이 α- 글루쿠로니다제 활성의 확인

라삼소니아 에머소니이 Temer07305의 α-글루쿠로니다제 활성을 전술된 바와 같이 분석하였다. Temer07305 아스퍼길러스 니게르 진탕 플라스크 발효의 상청액을 농축하고 1 mg/g 및 10 mg/g의 용량으로 알도우론산에 첨가한 후, pH 4.5 및 60℃에서 24시간 동안 항온처리하였다. 상기 효소는 표 16에 제시된 바와 같이 자일로올리고머로부터 4-O-메틸글루쿠론산을 제거하여 자일로스, 자일로바이오스, 자일로트라이오스 및 자일로테트라오스를 동시에 방출시킬 수 있었다. 이것은 Temer07305가 α-글루쿠로니다제 활성을 갖는다는 것을 보여준다.

[표 16]

SEQUENCE LISTING <110> DSM IP Assets B.V. <120> CARBOHYDRATE DEGRADING POLYPEPTIDE AND USES THEREOF <130> 29207-WO-PCT <140> PCT/EP2014/051998 <141> 2014-02-03 <150> EP 13153824.1 <151> 2013-02-04 <160> 82 <170> PatentIn version 3.5 <210> 1 <211> 2286 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(2286) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 1 atggtccttg gtgtctccct ggtccttctg gccactgctg tctccgccac cttccccgac 60 tgctctcagc ctcctctcaa ggacaacgcc gtctgcgaca ccagccttga ccctgtctcc 120 cgcgctgctg ccctcgttgc tgctttcacc ctggaggaga agatcaacaa cactcagaac 180 ggctcccccg gtgttccccg tctgggtctg cctccctacc agtggtggtc tgagggtctg 240 cacggtgttg ccatctcccc cggcgtcaac ttctctgctc acggtgactt ctcctacgcc 300 accagcttcc ctcagcccat cctgatgtcc gctgccttcg atgatgacct catccgccag 360 gtcggctccg tcgtcagcac tgaggctcgt gctttctcca acgccaaccg cgctggtctg 420 gactactgga ctcccaacat caaccccttc aaggaccctc gctggggtcg tggccaggag 480 actcccggtg aagatgcctt ccacatccag cgctacgtgt actctttgat tgatggcctc 540 cagaacggca ttggacctgc caaccccaag atcatggcca cctgcaagca cttcgctgcc 600 tacgacctcg aggactggca cggcaacgag cgctacggtt tcaacgccgt tgtgagcact 660 caggacctgg cggaatacta ccttcctccc ttcaagtcct gcgctcgtga tgccaaggtc 720 gatgccctca tgtgctcgta caacgctgtc aacggtgtgc cctcttgcgc ggactcctac 780 ctcttggaag atatcctccg tgaccactgg ggctggaaca ccaccggtca ctgggtgacc 840 tccgactgcg atgccgtcca gaacatctac gccaaccacc actacacttc caccgctccc 900 caggctgctg ccgatgcctt gggtgctggt actgatcttg actgcggtac cacctacccc 960 gacaaccttg gtgccgccta cacccagggt ctgttccaga accagacctt ggacaccgct 1020 ctgatccgtc tgtactcttc tctggtcaag cttggatact tcgaccctcc cgagaaccag 1080 ccctaccgca gcattggctg gtcagatgtc agcactcctg ctgctcagca gcttgcccgc 1140 actgctgctg ctgagggcat tgtcctcctc aagaacgatg agaagaaggt cctccccctc 1200 agccgtgagg gtcagaccct cgccgtcatc ggtcccttcg ccaacgccac cacccagctg 1260 cagggtaact accagggtgt tgctccttac atctggactg ttgttgctgc tgcggagcag 1320 ctgggctaca aggtcaacta cgccgacggt actgccatca acgctaccaa caccactggc 1380 ttcgccgagg ccgttgctgc cgccaagtcc tccgatgttg tcatctacgc tggtggtatc 1440 gacaacagca ttgaggctga aggccacgac cgtgacacca ttgtgtggcc cggcaaccag 1500 ctccagctca tctccgagct ggcgcagacc ggcaagcctc tggttgtcat ccagttcggt 1560 ggtggtcagg ttgatgactc ctccctcctt gccaacgact ccggtgtcaa cgccctcctc 1620 tgggctggct acccctccca ggctggtggt gctgccatct tcgagatcct gaccggtgcc 1680 actgcccccg ccggtcgtct gcctaccacc cagtaccctg ctcagtacgt ggatgaggtt 1740 cccatgaccg acatgaccct ccgcccctct gccaccaacc ccggtcgcac ctacagatgg 1800 tacgacaagg ccgtcatccc cttcggtttc ggcttgcact acaccacctt cgatgtcacc 1860 tggagcaagg cccagcttgg accttacgaa attggctctc ttgtcaagaa cgcgtcgtcg 1920 tcggatgctc ctgccgacac cgcccccttc gacaccttca ccatccacgt ccgcaacact 1980 ggcaagacca cctcggacta cgtggctctc ctcttcctct ccacccgcaa cgccggtcct 2040 gctccctacc ccctcaagac cctagttgga tacactcgtg cccgtgccat ccagcccggt 2100 gagactcgtg ccgtcgacat tgccgtcacc gttggcagcg ttgcccgtac cgacgagcgt 2160 ggtgacctcg tcctctaccc cggcacctac accctcgagg ttgacgtcaa cggccagtac 2220 cccactgctg gcttcgaagt caccggtgag gctgctgtcc tggatgagtt cccccagccc 2280 ccggcg 2286 <210> 2 <211> 746 <212> PRT <213> Rasamsonia emersonii <400> 2 Thr Phe Pro Asp Cys Ser Gln Pro Pro Leu Lys Asp Asn Ala Val Cys 1 5 10 15 Asp Thr Ser Leu Asp Pro Val Ser Arg Ala Ala Ala Leu Val Ala Ala 20 25 30 Phe Thr Leu Glu Glu Lys Ile Asn Asn Thr Gln Asn Gly Ser Pro Gly 35 40 45 Val Pro Arg Leu Gly Leu Pro Pro Tyr Gln Trp Trp Ser Glu Gly Leu 50 55 60 His Gly Val Ala Ile Ser Pro Gly Val Asn Phe Ser Ala His Gly Asp 65 70 75 80 Phe Ser Tyr Ala Thr Ser Phe Pro Gln Pro Ile Leu Met Ser Ala Ala 85 90 95 Phe Asp Asp Asp Leu Ile Arg Gln Val Gly Ser Val Val Ser Thr Glu 100 105 110 Ala Arg Ala Phe Ser Asn Ala Asn Arg Ala Gly Leu Asp Tyr Trp Thr 115 120 125 Pro Asn Ile Asn Pro Phe Lys Asp Pro Arg Trp Gly Arg Gly Gln Glu 130 135 140 Thr Pro Gly Glu Asp Ala Phe His Ile Gln Arg Tyr Val Tyr Ser Leu 145 150 155 160 Ile Asp Gly Leu Gln Asn Gly Ile Gly Pro Ala Asn Pro Lys Ile Met 165 170 175 Ala Thr Cys Lys His Phe Ala Ala Tyr Asp Leu Glu Asp Trp His Gly 180 185 190 Asn Glu Arg Tyr Gly Phe Asn Ala Val Val Ser Thr Gln Asp Leu Ala 195 200 205 Glu Tyr Tyr Leu Pro Pro Phe Lys Ser Cys Ala Arg Asp Ala Lys Val 210 215 220 Asp Ala Leu Met Cys Ser Tyr Asn Ala Val Asn Gly Val Pro Ser Cys 225 230 235 240 Ala Asp Ser Tyr Leu Leu Glu Asp Ile Leu Arg Asp His Trp Gly Trp 245 250 255 Asn Thr Thr Gly His Trp Val Thr Ser Asp Cys Asp Ala Val Gln Asn 260 265 270 Ile Tyr Ala Asn His His Tyr Thr Ser Thr Ala Pro Gln Ala Ala Ala 275 280 285 Asp Ala Leu Gly Ala Gly Thr Asp Leu Asp Cys Gly Thr Thr Tyr Pro 290 295 300 Asp Asn Leu Gly Ala Ala Tyr Thr Gln Gly Leu Phe Gln Asn Gln Thr 305 310 315 320 Leu Asp Thr Ala Leu Ile Arg Leu Tyr Ser Ser Leu Val Lys Leu Gly 325 330 335 Tyr Phe Asp Pro Pro Glu Asn Gln Pro Tyr Arg Ser Ile Gly Trp Ser 340 345 350 Asp Val Ser Thr Pro Ala Ala Gln Gln Leu Ala Arg Thr Ala Ala Ala 355 360 365 Glu Gly Ile Val Leu Leu Lys Asn Asp Glu Lys Lys Val Leu Pro Leu 370 375 380 Ser Arg Glu Gly Gln Thr Leu Ala Val Ile Gly Pro Phe Ala Asn Ala 385 390 395 400 Thr Thr Gln Leu Gln Gly Asn Tyr Gln Gly Val Ala Pro Tyr Ile Trp 405 410 415 Thr Val Val Ala Ala Ala Glu Gln Leu Gly Tyr Lys Val Asn Tyr Ala 420 425 430 Asp Gly Thr Ala Ile Asn Ala Thr Asn Thr Thr Gly Phe Ala Glu Ala 435 440 445 Val Ala Ala Ala Lys Ser Ser Asp Val Val Ile Tyr Ala Gly Gly Ile 450 455 460 Asp Asn Ser Ile Glu Ala Glu Gly His Asp Arg Asp Thr Ile Val Trp 465 470 475 480 Pro Gly Asn Gln Leu Gln Leu Ile Ser Glu Leu Ala Gln Thr Gly Lys 485 490 495 Pro Leu Val Val Ile Gln Phe Gly Gly Gly Gln Val Asp Asp Ser Ser 500 505 510 Leu Leu Ala Asn Asp Ser Gly Val Asn Ala Leu Leu Trp Ala Gly Tyr 515 520 525 Pro Ser Gln Ala Gly Gly Ala Ala Ile Phe Glu Ile Leu Thr Gly Ala 530 535 540 Thr Ala Pro Ala Gly Arg Leu Pro Thr Thr Gln Tyr Pro Ala Gln Tyr 545 550 555 560 Val Asp Glu Val Pro Met Thr Asp Met Thr Leu Arg Pro Ser Ala Thr 565 570 575 Asn Pro Gly Arg Thr Tyr Arg Trp Tyr Asp Lys Ala Val Ile Pro Phe 580 585 590 Gly Phe Gly Leu His Tyr Thr Thr Phe Asp Val Thr Trp Ser Lys Ala 595 600 605 Gln Leu Gly Pro Tyr Glu Ile Gly Ser Leu Val Lys Asn Ala Ser Ser 610 615 620 Ser Asp Ala Pro Ala Asp Thr Ala Pro Phe Asp Thr Phe Thr Ile His 625 630 635 640 Val Arg Asn Thr Gly Lys Thr Thr Ser Asp Tyr Val Ala Leu Leu Phe 645 650 655 Leu Ser Thr Arg Asn Ala Gly Pro Ala Pro Tyr Pro Leu Lys Thr Leu 660 665 670 Val Gly Tyr Thr Arg Ala Arg Ala Ile Gln Pro Gly Glu Thr Arg Ala 675 680 685 Val Asp Ile Ala Val Thr Val Gly Ser Val Ala Arg Thr Asp Glu Arg 690 695 700 Gly Asp Leu Val Leu Tyr Pro Gly Thr Tyr Thr Leu Glu Val Asp Val 705 710 715 720 Asn Gly Gln Tyr Pro Thr Ala Gly Phe Glu Val Thr Gly Glu Ala Ala 725 730 735 Val Leu Asp Glu Phe Pro Gln Pro Pro Ala 740 745 <210> 3 <211> 16 <212> PRT <213> Rasamsonia emersonii <400> 3 Met Val Leu Gly Val Ser Leu Val Leu Leu Ala Thr Ala Val Ser Ala 1 5 10 15 <210> 4 <211> 2289 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(2289) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 4 atggttctgg gtgtcagtct cgtcctcctg gcgacggccg tctctgccac gttccccgac 60 tgcagccagc ctccgctgaa ggacaacgcc gtgtgcgata cctcgctgga ccccgtatcg 120 cgtgctgctg cgctcgtcgc ggccttcacg ctcgaggaga agatcaacaa cacgcagaat 180 ggatcgcctg gcgtgccccg gctgggcctg ccgccgtatc aatggtggag cgaaggcctg 240 cacggcgtgg ccatctcgcc gggcgtcaac ttctccgcgc acggcgactt cagctacgca 300 acctccttcc cccagcccat cctcatgagc gccgcctttg acgacgacct catcaggcag 360 gtcggcagtg tggtcagcac cgaggcgcgc gccttcagca acgccaaccg cgctggcctc 420 gactactgga cgcccaacat caaccccttc aaggacccgc gctggggtcg cgggcaggag 480 acgcccggcg aagacgcatt ccacatccag cgctacgtct acagcctcat cgacggcctg 540 caaaacggca ttgggccggc caaccccaag atcatggcca cctgcaagca cttcgccgcc 600 tacgacctcg aggactggca cggcaacgag cgctatggct tcaacgccgt cgtgtccacg 660 caggacctgg ccgagtacta cctgccgccc ttcaagagct gcgcccgcga cgccaaagtc 720 gacgcgctca tgtgcagcta caacgccgtc aacggggtgc cctcgtgcgc cgactcgtat 780 ctgctggagg acatcctgcg cgaccactgg ggctggaaca cgaccggcca ctgggtgacg 840 tccgactgcg atgccgtgca gaacatctac gccaaccatc actacacgtc gactgcgccc 900 caggcggccg cggacgccct gggcgccggc accgatctcg actgcggcac cacttatccc 960 gacaatctgg gcgctgccta cacgcagggg ctcttccaga accagaccct cgacacggcg 1020 ctcatccgcc tgtactcgtc gctcgtcaag ctgggctact ttgatccgcc ggagaaccag 1080 ccctaccggt cgataggctg gagtgatgtg tccacgccgg ccgcgcagca gctggcccgc 1140 acggcggcgg cggaggggat cgttcttctc aagaacgacg agaagaaagt cctgccgctg 1200 tcgcgcgagg gacagacgct cgccgtgatc gggcccttcg ccaacgcgac gacccagctg 1260 cagggcaatt accaaggcgt ggcgccgtac atctggacgg tggtcgcggc agcagagcag 1320 ctgggataca aggtcaacta cgcggatggc acggctatca acgcgaccaa cacgactggc 1380 tttgcagagg cagtggccgc agccaagtcg tccgacgtcg tcatctatgc gggcggcatc 1440 gacaactcga tcgaagcgga gggccacgac cgcgacacga tcgtctggcc gggcaaccag 1500 ctgcagctga tcagcgagct agcgcagact ggcaaaccgc tggtcgtcat ccaattcggc 1560 ggcgggcaag tggacgactc gtccctgctg gcaaacgaca gcggcgtcaa cgccctgctg 1620 tgggcgggct atcccagcca ggctgggggc gccgccatct tcgaaatcct gacgggagcg 1680 acagcgccgg caggccgtct cccgacgacg cagtacccgg cgcagtacgt cgacgaggtg 1740 ccgatgacgg acatgacgct gcggccgagc gcgacgaacc cgggacggac gtaccggtgg 1800 tacgacaagg cggtgatccc gttcggattc gggctgcact acacgacgtt tgacgtgacg 1860 tggagcaagg cgcagctggg accgtacgag atcggctctc tcgtgaaaaa cgcctcttct 1920 tccgatgcgc ctgccgacac ggctccgttc gacaccttca ccatccacgt ccgaaacacg 1980 ggcaagacga cctcagacta cgtcgcgctg ctcttcctct cgacgcgcaa cgcgggacca 2040 gcaccgtatc cgctcaagac gctggtgggc tacacgcggg cgcgggcgat ccagccgggc 2100 gagacgcgcg cggtcgacat cgcggtgacg gtgggatcgg tggcgcggac agacgagcgc 2160 ggggatctgg tactgtatcc ggggacgtac acgctggagg tggatgtgaa cgggcagtat 2220 ccaactgcag ggtttgaggt gaccggggag gcggcggttc tggatgagtt tccgcagccg 2280 ccggcataa 2289 <210> 5 <211> 2289 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(2289) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 5 atggttctgg gtgtcagtct cgtcctcctg gcgacggccg tctctgccac gttccccgac 60 tgcagccagc ctccgctgaa ggacaacgcc gtgtgcgata cctcgctgga ccccgtatcg 120 cgtgctgctg cgctcgtcgc ggccttcacg ctcgaggaga agatcaacaa cacgcagaat 180 ggatcgcctg gcgtgccccg gctgggcctg ccgccgtatc aatggtggag cgaaggcctg 240 cacggcgtgg ccatctcgcc gggcgtcaac ttctccgcgc acggcgactt cagctacgca 300 acctccttcc cccagcccat cctcatgagc gccgcctttg acgacgacct catcaggcag 360 gtcggcagtg tggtcagcac cgaggcgcgc gccttcagca acgccaaccg cgctggcctc 420 gactactgga cgcccaacat caaccccttc aaggacccgc gctggggtcg cgggcaggag 480 acgcccggcg aagacgcatt ccacatccag cgctacgtct acagcctcat cgacggcctg 540 caaaacggca ttgggccggc caaccccaag atcatggcca cctgcaagca cttcgccgcc 600 tacgacctcg aggactggca cggcaacgag cgctatggct tcaacgccgt cgtgtccacg 660 caggacctgg ccgagtacta cctgccgccc ttcaagagct gcgcccgcga cgccaaagtc 720 gacgcgctca tgtgcagcta caacgccgtc aacggggtgc cctcgtgcgc cgactcgtat 780 ctgctggagg acatcctgcg cgaccactgg ggctggaaca cgaccggcca ctgggtgacg 840 tccgactgcg atgccgtgca gaacatctac gccaaccatc actacacgtc gactgcgccc 900 caggcggccg cggacgccct gggcgccggc accgatctcg actgcggcac cacttatccc 960 gacaatctgg gcgctgccta cacgcagggg ctcttccaga accagaccct cgacacggcg 1020 ctcatccgcc tgtactcgtc gctcgtcaag ctgggctact ttgatccgcc ggagaaccag 1080 ccctaccggt cgataggctg gagtgatgtg tccacgccgg ccgcgcagca gctggcccgc 1140 acggcggcgg cggaggggat cgttcttctc aagaacgacg agaagaaagt cctgccgctg 1200 tcgcgcgagg gacagacgct cgccgtgatc gggcccttcg ccaacgcgac gacccagctg 1260 cagggcaatt accaaggcgt ggcgccgtac atctggacgg tggtcgcggc agcagagcag 1320 ctgggataca aggtcaacta cgcggatggc acggctatca acgcgaccaa cacgactggc 1380 tttgcagagg cagtggccgc agccaagtcg tccgacgtcg tcatctatgc gggcggcatc 1440 gacaactcga tcgaagcgga gggccacgac cgcgacacga tcgtctggcc gggcaaccag 1500 ctgcagctga tcagcgagct agcgcagact ggcaaaccgc tggtcgtcat ccaattcggc 1560 ggcgggcaag tggacgactc gtccctgctg gcaaacgaca gcggcgtcaa cgccctgctg 1620 tgggcgggct atcccagcca ggctgggggc gccgccatct tcgaaatcct gacgggagcg 1680 acagcgccgg caggccgtct cccgacgacg cagtacccgg cgcagtacgt cgacgaggtg 1740 ccgatgacgg acatgacgct gcggccgagc gcgacgaacc cgggacggac gtaccggtgg 1800 tacgacaagg cggtgatccc gttcggattc gggctgcact acacgacgtt tgacgtgacg 1860 tggagcaagg cgcagctggg accgtacgag atcggctctc tcgtgaaaaa cgcctcttct 1920 tccgatgcgc ctgccgacac ggctccgttc gacaccttca ccatccacgt ccgaaacacg 1980 ggcaagacga cctcagacta cgtcgcgctg ctcttcctct cgacgcgcaa cgcgggacca 2040 gcaccgtatc cgctcaagac gctggtgggc tacacgcggg cgcgggcgat ccagccgggc 2100 gagacgcgcg cggtcgacat cgcggtgacg gtgggatcgg tggcgcggac agacgagcgc 2160 ggggatctgg tactgtatcc ggggacgtac acgctggagg tggatgtgaa cgggcagtat 2220 ccaactgcag ggtttgaggt gaccggggag gcggcggttc tggatgagtt tccgcagccg 2280 ccggcataa 2289 <210> 6 <211> 2388 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(2388) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 6 atggtgaccc gtgctgccat tttgactgct gttgctgctc tcctccccac tgccacctgg 60 gcgcaggaca accagaccta cgccaactac tcttcccaga gccagcccga cctcttcccc 120 cgcaccgttg ccaccatcga tctttctttc cctgactgcg agaacggacc tctgagcacc 180 aacctcgtct gcaacaagtc ggcggacccc tgggctcgtg ctgaggctct gatctccctc 240 ttcactttgg aggagctcat caacaacacc cagaacactg ctcccggtgt tcctcgtctg 300 ggcctccccc agtaccaggt ctggaacgag gccttgcacg gtcttgaccg tgccaacttc 360 tctcactccg gtgaatactc ttgggccacc agcttcccca tgcccatcct gagcatggcc 420 tccttcaacc gcaccctcat caaccagatt gcctccatca ttgccactca ggcccgtgct 480 ttcaacaacg ctggccgcta cggcttggat tcctacgctc ccaacatcaa cggtttccgc 540 tctcctctct ggggtcgtgg tcaggaaacc cccggtgagg atgccttctt cctgagctca 600 acatacgcct acgaatacat caccggcttg cagggtggtg ttgaccctga gcacgtcaag 660 atcgtcgcca ctgccaagca cttcgctgga tacgaccttg agaactgggg taacgtgtct 720 cgcttgggtt tcaacgccat catcacccag caggatcttt ctgaatacta cactccccag 780 ttcctggcct ccgctcgcta cgccaagacc cgcagcatca tgtgctccta caacgccgtc 840 aacggtgttc cctcctgcgc gaactcgttc ttcctgcaga ctctcctccg cgagaacttc 900 gacttcgtcg acgatggata cgtgagctcc gactgcgatg ccgtctacaa cgtgttcaac 960 ccccacggat acgctctcaa ccagtctggt gctgctgccg actctcttct ggctggtacc 1020 gacatcgact gcggtcagac cctcccctgg cacctgaacg agagcttcgt ggaaggatat 1080 gtctcccgtg gtgacattga gaagtccctc acccgtctgt actccaacct ggtccgccta 1140 ggatacttcg atggaaacaa cagcgaatac cgcaacctca actggaacga cgttgtcacc 1200 accgatgcct ggaacatctc ctacgaagcc gccgttgagg gtatcaccct gctcaagaac 1260 gatggcaccc ttcctctttc caagaaggtc cgctccatcg ccttgattgg accttgggcc 1320 aacgccactg tccagatgca gggcaactac tacggcactc ctccctacct catctcccct 1380 ctggaggctg ccaaggcctc cggcttcacc gtcaactacg ctttcggcac caacatctcc 1440 accgacagca cccagtggtt cgctgaggcc atcgctgctg ccaagaagtc ggatgtcatc 1500 atctacgctg gtggcattga caacaccatt gaggctgagg gccaggaccg taccgacttg 1560 aaatggcccg gcaaccagct cgacctcatt gagcagctgt cccaggtcgg caagcctctg 1620 gtcgtcctcc agatgggtgg tggccaggtc gactcttcct ccctcaaggc caacaagaac 1680 gtcaacgccc ttgtctgggg tggataccct ggccagtccg gcggtgctgc tcttttcgac 1740 atcctgaccg gcaagcgtgc tcctgctggt cgtcttgtct ccacccagta ccccgctgaa 1800 tacgccaccc agttccccgc caacgacatg aacctgcgcc ccaacggctc caaccccggc 1860 cagacttaca tctggtacac cggtactccc gtctacgagt tcggccacgg tctgttctac 1920 actgagttcc aggagtccgc tgctgctggt accaacaaga ccagcacttt tgacatcctg 1980 gatctgttct ccactcctca ccctggttac gagtacatcg agcaggttcc cttcatcaac 2040 gtcaccgttg atgtcaagaa cgttggccac accccttctc cctacaccgg cctcctcttc 2100 gccaacacca ctgctggtcc caagccctac cccaacaagt ggctggtcgg tttcgaccgt 2160 ctgcccacca ttcaaccagg cgaaaccgcc aagctcacca tccccgttcc tcttggtgcc 2220 attgcccgtg ccgatgagaa cggcaacaag gttgtgttcc ccggtaacta cgagcttgct 2280 ctcaacaacg agcgctccgt tgttgtctct ttcaccctca ccggtgatgc tgccaccctc 2340 gagaagtggc ccctctggga gcaggctgtt cccggtgtca ctcagcag 2388 <210> 7 <211> 775 <212> PRT <213> Rasamsonia emersonii <400> 7 Gln Asp Asn Gln Thr Tyr Ala Asn Tyr Ser Ser Gln Ser Gln Pro Asp 1 5 10 15 Leu Phe Pro Arg Thr Val Ala Thr Ile Asp Leu Ser Phe Pro Asp Cys 20 25 30 Glu Asn Gly Pro Leu Ser Thr Asn Leu Val Cys Asn Lys Ser Ala Asp 35 40 45 Pro Trp Ala Arg Ala Glu Ala Leu Ile Ser Leu Phe Thr Leu Glu Glu 50 55 60 Leu Ile Asn Asn Thr Gln Asn Thr Ala Pro Gly Val Pro Arg Leu Gly 65 70 75 80 Leu Pro Gln Tyr Gln Val Trp Asn Glu Ala Leu His Gly Leu Asp Arg 85 90 95 Ala Asn Phe Ser His Ser Gly Glu Tyr Ser Trp Ala Thr Ser Phe Pro 100 105 110 Met Pro Ile Leu Ser Met Ala Ser Phe Asn Arg Thr Leu Ile Asn Gln 115 120 125 Ile Ala Ser Ile Ile Ala Thr Gln Ala Arg Ala Phe Asn Asn Ala Gly 130 135 140 Arg Tyr Gly Leu Asp Ser Tyr Ala Pro Asn Ile Asn Gly Phe Arg Ser 145 150 155 160 Pro Leu Trp Gly Arg Gly Gln Glu Thr Pro Gly Glu Asp Ala Phe Phe 165 170 175 Leu Ser Ser Thr Tyr Ala Tyr Glu Tyr Ile Thr Gly Leu Gln Gly Gly 180 185 190 Val Asp Pro Glu His Val Lys Ile Val Ala Thr Ala Lys His Phe Ala 195 200 205 Gly Tyr Asp Leu Glu Asn Trp Gly Asn Val Ser Arg Leu Gly Phe Asn 210 215 220 Ala Ile Ile Thr Gln Gln Asp Leu Ser Glu Tyr Tyr Thr Pro Gln Phe 225 230 235 240 Leu Ala Ser Ala Arg Tyr Ala Lys Thr Arg Ser Ile Met Cys Ser Tyr 245 250 255 Asn Ala Val Asn Gly Val Pro Ser Cys Ala Asn Ser Phe Phe Leu Gln 260 265 270 Thr Leu Leu Arg Glu Asn Phe Asp Phe Val Asp Asp Gly Tyr Val Ser 275 280 285 Ser Asp Cys Asp Ala Val Tyr Asn Val Phe Asn Pro His Gly Tyr Ala 290 295 300 Leu Asn Gln Ser Gly Ala Ala Ala Asp Ser Leu Leu Ala Gly Thr Asp 305 310 315 320 Ile Asp Cys Gly Gln Thr Leu Pro Trp His Leu Asn Glu Ser Phe Val 325 330 335 Glu Gly Tyr Val Ser Arg Gly Asp Ile Glu Lys Ser Leu Thr Arg Leu 340 345 350 Tyr Ser Asn Leu Val Arg Leu Gly Tyr Phe Asp Gly Asn Asn Ser Glu 355 360 365 Tyr Arg Asn Leu Asn Trp Asn Asp Val Val Thr Thr Asp Ala Trp Asn 370 375 380 Ile Ser Tyr Glu Ala Ala Val Glu Gly Ile Thr Leu Leu Lys Asn Asp 385 390 395 400 Gly Thr Leu Pro Leu Ser Lys Lys Val Arg Ser Ile Ala Leu Ile Gly 405 410 415 Pro Trp Ala Asn Ala Thr Val Gln Met Gln Gly Asn Tyr Tyr Gly Thr 420 425 430 Pro Pro Tyr Leu Ile Ser Pro Leu Glu Ala Ala Lys Ala Ser Gly Phe 435 440 445 Thr Val Asn Tyr Ala Phe Gly Thr Asn Ile Ser Thr Asp Ser Thr Gln 450 455 460 Trp Phe Ala Glu Ala Ile Ala Ala Ala Lys Lys Ser Asp Val Ile Ile 465 470 475 480 Tyr Ala Gly Gly Ile Asp Asn Thr Ile Glu Ala Glu Gly Gln Asp Arg 485 490 495 Thr Asp Leu Lys Trp Pro Gly Asn Gln Leu Asp Leu Ile Glu Gln Leu 500 505 510 Ser Gln Val Gly Lys Pro Leu Val Val Leu Gln Met Gly Gly Gly Gln 515 520 525 Val Asp Ser Ser Ser Leu Lys Ala Asn Lys Asn Val Asn Ala Leu Val 530 535 540 Trp Gly Gly Tyr Pro Gly Gln Ser Gly Gly Ala Ala Leu Phe Asp Ile 545 550 555 560 Leu Thr Gly Lys Arg Ala Pro Ala Gly Arg Leu Val Ser Thr Gln Tyr 565 570 575 Pro Ala Glu Tyr Ala Thr Gln Phe Pro Ala Asn Asp Met Asn Leu Arg 580 585 590 Pro Asn Gly Ser Asn Pro Gly Gln Thr Tyr Ile Trp Tyr Thr Gly Thr 595 600 605 Pro Val Tyr Glu Phe Gly His Gly Leu Phe Tyr Thr Glu Phe Gln Glu 610 615 620 Ser Ala Ala Ala Gly Thr Asn Lys Thr Ser Thr Phe Asp Ile Leu Asp 625 630 635 640 Leu Phe Ser Thr Pro His Pro Gly Tyr Glu Tyr Ile Glu Gln Val Pro 645 650 655 Phe Ile Asn Val Thr Val Asp Val Lys Asn Val Gly His Thr Pro Ser 660 665 670 Pro Tyr Thr Gly Leu Leu Phe Ala Asn Thr Thr Ala Gly Pro Lys Pro 675 680 685 Tyr Pro Asn Lys Trp Leu Val Gly Phe Asp Arg Leu Pro Thr Ile Gln 690 695 700 Pro Gly Glu Thr Ala Lys Leu Thr Ile Pro Val Pro Leu Gly Ala Ile 705 710 715 720 Ala Arg Ala Asp Glu Asn Gly Asn Lys Val Val Phe Pro Gly Asn Tyr 725 730 735 Glu Leu Ala Leu Asn Asn Glu Arg Ser Val Val Val Ser Phe Thr Leu 740 745 750 Thr Gly Asp Ala Ala Thr Leu Glu Lys Trp Pro Leu Trp Glu Gln Ala 755 760 765 Val Pro Gly Val Thr Gln Gln 770 775 <210> 8 <211> 21 <212> PRT <213> Rasamsonia emersonii <400> 8 Met Val Thr Arg Ala Ala Ile Leu Thr Ala Val Ala Ala Leu Leu Pro 1 5 10 15 Thr Ala Thr Trp Ala 20 <210> 9 <211> 2391 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(2391) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 9 atggtgactc gcgcggcgat tctcaccgca gtggcggcgc tcctgcccac cgcgacatgg 60 gcacaggata accaaaccta tgccaattac tcgtcgcagt ctcagccgga cctgtttccc 120 cggaccgtcg cgaccatcga cctgtccttc cccgactgtg agaatggccc gctcagcacg 180 aacctggtgt gcaacaaatc ggccgatccc tgggcccgag ctgaggccct catctcgctc 240 tttaccctcg aagagctgat taacaacacc cagaacaccg ctcctggcgt gccccgtttg 300 ggtctgcccc agtatcaggt gtggaatgaa gctctgcacg gactggaccg cgccaatttc 360 tcccattcgg gcgaatacag ctgggccacg tccttcccca tgcccatcct gtcgatggcg 420 tccttcaacc ggaccctcat caaccagatt gcctccatca ttgcaacgca agcccgtgcc 480 ttcaacaacg ccggccgtta cggccttgac agctatgcgc ccaacatcaa tggcttccgc 540 agtcccctct ggggccgtgg acaggagacg cctggtgagg atgcgttctt cttgagttcc 600 acctatgcgt acgagtacat cacaggcctg cagggcggtg tcgacccaga gcatgtcaag 660 atcgtcgcga cggcgaagca cttcgccggc tatgatctgg agaactgggg caacgtctct 720 cggctggggt tcaatgctat catcacgcag caggatctct ccgagtacta cacccctcag 780 ttcctggcgt ctgctcgata cgccaagacg cgcagcatca tgtgctccta caatgcagtg 840 aatggagtcc caagctgtgc caactccttc ttcctccaga cgcttctccg agaaaacttt 900 gacttcgttg acgacgggta cgtctcgtcg gattgcgacg ccgtctacaa cgtcttcaac 960 ccacacggtt acgcccttaa ccagtcggga gccgctgcgg actcgctcct agcaggtacc 1020 gatatcgact gtggtcagac cttgccgtgg cacctgaatg agtccttcgt agaaggatac 1080 gtctcccgcg gtgatatcga gaaatccctc acccgtctct actcaaacct ggtgcgtctc 1140 ggctactttg acggcaacaa cagcgagtac cgcaacctca actggaacga cgtcgtgact 1200 acggacgcct ggaacatctc gtacgaggcc gcggtggaag gtatcaccct gctcaagaac 1260 gacggaacgc tgccgctgtc caagaaggtc cgcagcattg cgctcatcgg tccttgggcc 1320 aatgccacgg tgcagatgca gggtaactac tatggaacgc caccgtatct gatcagtccg 1380 ctggaagccg ccaaggccag tgggttcacg gtcaactatg cattcggtac caacatctcg 1440 accgattcta cccagtggtt cgcggaagcc atcgcggcgg cgaagaagtc ggacgtgatc 1500 atctacgccg gtggtattga caacacgatc gaggcagagg gacaggaccg cacggatctc 1560 aagtggccgg ggaaccagct ggatctgatc gagcagctca gccaggtggg caagcccttg 1620 gtcgtcctgc agatgggcgg tggccaggtg gattcgtcgt cactcaaggc caacaagaat 1680 gtcaacgctc tggtgtgggg tggctatccc ggacagtcgg gtggtgcggc cctgtttgac 1740 atccttacgg gcaagcgtgc gccggccggt cgtctggtga gcacgcagta cccggccgag 1800 tatgcgacgc agttcccggc caacgacatg aacctgcgtc cgaacggcag caacccggga 1860 cagacataca tctggtacac gggcacgccc gtgtatgagt tcggccacgg tctgttctac 1920 acggagttcc aggagtcggc tgcggcgggc acgaacaaga cgtcgacttt cgacattctg 1980 gaccttttct ccacccctca tccgggatac gagtacatcg agcaggttcc gttcatcaac 2040 gtgactgtgg acgtgaagaa cgtcggccac acgccatcgc cgtacacggg tctgttgttc 2100 gcgaacacga cagccgggcc caagccgtac ccgaacaaat ggctcgtcgg gttcgaccgg 2160 ctgccgacga tccagccggg cgagactgcc aagttgacga tcccggtgcc gttgggcgcg 2220 attgcgcggg cggacgagaa cggcaacaag gtggtcttcc cgggcaacta cgaattggca 2280 ctgaacaatg agcgatcggt agtggtgtcg ttcacgctga cgggcgatgc ggcgactcta 2340 gagaaatggc ctttgtggga gcaggcggtg ccgggggtga cccagcagta g 2391 <210> 10 <211> 2391 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(2391) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 10 atggtgactc gcgcggcgat tctcaccgca gtggcggcgc tcctgcccac cgcgacatgg 60 gcacaggata accaaaccta tgccaattac tcgtcgcagt ctcagccgga cctgtttccc 120 cggaccgtcg cgaccatcga cctgtccttc cccgactgtg agaatggccc gctcagcacg 180 aacctggtgt gcaacaaatc ggccgatccc tgggcccgag ctgaggccct catctcgctc 240 tttaccctcg aagagctgat taacaacacc cagaacaccg ctcctggcgt gccccgtttg 300 ggtctgcccc agtatcaggt gtggaatgaa gctctgcacg gactggaccg cgccaatttc 360 tcccattcgg gcgaatacag ctgggccacg tccttcccca tgcccatcct gtcgatggcg 420 tccttcaacc ggaccctcat caaccagatt gcctccatca ttgcaacgca agcccgtgcc 480 ttcaacaacg ccggccgtta cggccttgac agctatgcgc ccaacatcaa tggcttccgc 540 agtcccctct ggggccgtgg acaggagacg cctggtgagg atgcgttctt cttgagttcc 600 acctatgcgt acgagtacat cacaggcctg cagggcggtg tcgacccaga gcatgtcaag 660 atcgtcgcga cggcgaagca cttcgccggc tatgatctgg agaactgggg caacgtctct 720 cggctggggt tcaatgctat catcacgcag caggatctct ccgagtacta cacccctcag 780 ttcctggcgt ctgctcgata cgccaagacg cgcagcatca tgtgctccta caatgcagtg 840 aatggagtcc caagctgtgc caactccttc ttcctccaga cgcttctccg agaaaacttt 900 gacttcgttg acgacgggta cgtctcgtcg gattgcgacg ccgtctacaa cgtcttcaac 960 ccacacggtt acgcccttaa ccagtcggga gccgctgcgg actcgctcct agcaggtacc 1020 gatatcgact gtggtcagac cttgccgtgg cacctgaatg agtccttcgt agaaggatac 1080 gtctcccgcg gtgatatcga gaaatccctc acccgtctct actcaaacct ggtgcgtctc 1140 ggctactttg acggcaacaa cagcgagtac cgcaacctca actggaacga cgtcgtgact 1200 acggacgcct ggaacatctc gtacgaggcc gcggtggaag gtatcaccct gctcaagaac 1260 gacggaacgc tgccgctgtc caagaaggtc cgcagcattg cgctcatcgg tccttgggcc 1320 aatgccacgg tgcagatgca gggtaactac tatggaacgc caccgtatct gatcagtccg 1380 ctggaagccg ccaaggccag tgggttcacg gtcaactatg cattcggtac caacatctcg 1440 accgattcta cccagtggtt cgcggaagcc atcgcggcgg cgaagaagtc ggacgtgatc 1500 atctacgccg gtggtattga caacacgatc gaggcagagg gacaggaccg cacggatctc 1560 aagtggccgg ggaaccagct ggatctgatc gagcagctca gccaggtggg caagcccttg 1620 gtcgtcctgc agatgggcgg tggccaggtg gattcgtcgt cactcaaggc caacaagaat 1680 gtcaacgctc tggtgtgggg tggctatccc ggacagtcgg gtggtgcggc cctgtttgac 1740 atccttacgg gcaagcgtgc gccggccggt cgtctggtga gcacgcagta cccggccgag 1800 tatgcgacgc agttcccggc caacgacatg aacctgcgtc cgaacggcag caacccggga 1860 cagacataca tctggtacac gggcacgccc gtgtatgagt tcggccacgg tctgttctac 1920 acggagttcc aggagtcggc tgcggcgggc acgaacaaga cgtcgacttt cgacattctg 1980 gaccttttct ccacccctca tccgggatac gagtacatcg agcaggttcc gttcatcaac 2040 gtgactgtgg acgtgaagaa cgtcggccac acgccatcgc cgtacacggg tctgttgttc 2100 gcgaacacga cagccgggcc caagccgtac ccgaacaaat ggctcgtcgg gttcgaccgg 2160 ctgccgacga tccagccggg cgagactgcc aagttgacga tcccggtgcc gttgggcgcg 2220 attgcgcggg cggacgagaa cggcaacaag gtggtcttcc cgggcaacta cgaattggca 2280 ctgaacaatg agcgatcggt agtggtgtcg ttcacgctga cgggcgatgc ggcgactcta 2340 gagaaatggc ctttgtggga gcaggcggtg ccgggggtga cccagcagta g 2391 <210> 11 <211> 1473 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(1473) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 11 atgggtcgcc gcattgccac tgctgctctg ctcctgttcg gtctgaacgc cctcaagggt 60 gttgttgctc tcgacaacgg tcttgccatc actccccaga tgggctggaa cacctggaac 120 tcgttcggct gctcgctgaa cgaaaccgtc atcctggatg ctgctgagaa gcttgtgtcg 180 ctaggattca aggacctagg atacgagtac gtggtgctgg atgactgctg gtccgctggc 240 cgtaacgcct ctggctacct ggttcctgac cctgccaagt tccccaacgg cattgatggt 300 cttgccgaga agatccacgc tcttggcctc aagatcggta tctactcttc tgctggtacc 360 atgacctgcg ctcgttacgc tggctctctt ggatacgagg agaaggatgc cgccctctgg 420 gcctcctggg gtatcgacta cctcaagtac gacaactgct acaaccaggg tcaagagggt 480 actcccaagc tcagctacga ccgctacaac gccatgggcc aggctctgaa caagaccggc 540 cgtcccattc tctactccct ctgcaactgg ggtgttgacg gcccctggaa cttcgcctcc 600 accattgcca acagctggcg cacctccggt gacctgctca acacctggga ccgtgatgat 660 gccaactgcc cctgctctga gctcgaaggc ttggactgca agacccccgg ctacaagtgc 720 tcgatcctga acgtcatcaa caaggccgtc tactacccct ccaaggcctt ccctggtgcc 780 tggaacgacc ttgacatgct ccaggtcggc aacggtggat tgaccgacga tgaggccgtt 840 gctcacatga gcctctgggc tgctttcaag tctcctctcc tcatgaccaa cgtcctcagc 900 aacattgacc ctcccaccct gtccatcctg cagaaccccg ccgttctagc ggtgtctcag 960 gaccccgtcg gctcctccgt caaccgtatc tggcgctact acgtggatga tgtcgacgcc 1020 aacggatacg gcgagatcca gctgttctcc ggtggtcttg ctggtggtga ccagctcgtc 1080 ctccttctga acgctggcag caaggaccgt accatgaacg ccaccctgga ggacatcttc 1140 tgggaagatg gacctggtgg tactgcctcc caggtccagc agtcctggga tgtctacgat 1200 ctctgggcca accgcatgag caacgagact gctgctgcca tcatcaacgc cgccaacagc 1260 actggaagcg ctgctcctgc tgctcccatc aacatgactg ctcttggtgg tgccaagcac 1320 gtctactctc aggttcctcc ctccgactcc aaggctctga tgggtaccaa ggtcggctcc 1380 gtccagccct ccggcaccgt caaggctttc gtcaaggccc acggtgttgc catgctccgc 1440 ctccgtcagc agtcccagaa gaaggacgaa cta 1473 <210> 12 <211> 468 <212> PRT <213> Rasamsonia emersonii <400> 12 Leu Asp Asn Gly Leu Ala Ile Thr Pro Gln Met Gly Trp Asn Thr Trp 1 5 10 15 Asn Ser Phe Gly Cys Ser Leu Asn Glu Thr Val Ile Leu Asp Ala Ala 20 25 30 Glu Lys Leu Val Ser Leu Gly Phe Lys Asp Leu Gly Tyr Glu Tyr Val 35 40 45 Val Leu Asp Asp Cys Trp Ser Ala Gly Arg Asn Ala Ser Gly Tyr Leu 50 55 60 Val Pro Asp Pro Ala Lys Phe Pro Asn Gly Ile Asp Gly Leu Ala Glu 65 70 75 80 Lys Ile His Ala Leu Gly Leu Lys Ile Gly Ile Tyr Ser Ser Ala Gly 85 90 95 Thr Met Thr Cys Ala Arg Tyr Ala Gly Ser Leu Gly Tyr Glu Glu Lys 100 105 110 Asp Ala Ala Leu Trp Ala Ser Trp Gly Ile Asp Tyr Leu Lys Tyr Asp 115 120 125 Asn Cys Tyr Asn Gln Gly Gln Glu Gly Thr Pro Lys Leu Ser Tyr Asp 130 135 140 Arg Tyr Asn Ala Met Gly Gln Ala Leu Asn Lys Thr Gly Arg Pro Ile 145 150 155 160 Leu Tyr Ser Leu Cys Asn Trp Gly Val Asp Gly Pro Trp Asn Phe Ala 165 170 175 Ser Thr Ile Ala Asn Ser Trp Arg Thr Ser Gly Asp Leu Leu Asn Thr 180 185 190 Trp Asp Arg Asp Asp Ala Asn Cys Pro Cys Ser Glu Leu Glu Gly Leu 195 200 205 Asp Cys Lys Thr Pro Gly Tyr Lys Cys Ser Ile Leu Asn Val Ile Asn 210 215 220 Lys Ala Val Tyr Tyr Pro Ser Lys Ala Phe Pro Gly Ala Trp Asn Asp 225 230 235 240 Leu Asp Met Leu Gln Val Gly Asn Gly Gly Leu Thr Asp Asp Glu Ala 245 250 255 Val Ala His Met Ser Leu Trp Ala Ala Phe Lys Ser Pro Leu Leu Met 260 265 270 Thr Asn Val Leu Ser Asn Ile Asp Pro Pro Thr Leu Ser Ile Leu Gln 275 280 285 Asn Pro Ala Val Leu Ala Val Ser Gln Asp Pro Val Gly Ser Ser Val 290 295 300 Asn Arg Ile Trp Arg Tyr Tyr Val Asp Asp Val Asp Ala Asn Gly Tyr 305 310 315 320 Gly Glu Ile Gln Leu Phe Ser Gly Gly Leu Ala Gly Gly Asp Gln Leu 325 330 335 Val Leu Leu Leu Asn Ala Gly Ser Lys Asp Arg Thr Met Asn Ala Thr 340 345 350 Leu Glu Asp Ile Phe Trp Glu Asp Gly Pro Gly Gly Thr Ala Ser Gln 355 360 365 Val Gln Gln Ser Trp Asp Val Tyr Asp Leu Trp Ala Asn Arg Met Ser 370 375 380 Asn Glu Thr Ala Ala Ala Ile Ile Asn Ala Ala Asn Ser Thr Gly Ser 385 390 395 400 Ala Ala Pro Ala Ala Pro Ile Asn Met Thr Ala Leu Gly Gly Ala Lys 405 410 415 His Val Tyr Ser Gln Val Pro Pro Ser Asp Ser Lys Ala Leu Met Gly 420 425 430 Thr Lys Val Gly Ser Val Gln Pro Ser Gly Thr Val Lys Ala Phe Val 435 440 445 Lys Ala His Gly Val Ala Met Leu Arg Leu Arg Gln Gln Ser Gln Lys 450 455 460 Lys Asp Glu Leu 465 <210> 13 <211> 23 <212> PRT <213> Rasamsonia emersonii <400> 13 Met Gly Arg Arg Ile Ala Thr Ala Ala Leu Leu Leu Phe Gly Leu Asn 1 5 10 15 Ala Leu Lys Gly Val Val Ala 20 <210> 14 <211> 1670 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(1670) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 14 atggggagaa gaattgctac tgctgcactt ctcttgttcg ggctcaatgc cttgaaagga 60 gtggtggcgc tggacaatgg cctggccatc actccgcaga tgggatgggt aagaatatat 120 ccaattgaat ggccaaactt gaaagttgca attggaattt gaataatcct gctcatgcat 180 aagtcaacag aacacatgga actccttcgg atgctcgcta aacgagaccg tcatcctaga 240 cgcggccgaa aagctcgtct cgctcggatt caaggatctc ggctatgagt acgtcgtcct 300 ggacgactgc tggtctgccg gccggaacgc gtctggctat ctggtgccgg atccagccaa 360 gtttcccaat ggcatcgatg gcctggcgga gaagatccat gcgctgggct tgaagattgg 420 catttattcc agtgcgggaa ccatgacttg cgcccgctat gctgggtcgt tgggatatga 480 agagaaggat gcagcgcttt gggctagttg gggggtaagt acgcctaaag ggcataaaac 540 ctgcaaagaa aatacttaaa aaaaaacgta aatagatcga ctacctcaaa tacgacaact 600 gctacaacca aggccaagaa ggcacgccca agctctcgta cgaccgctac aacgccatgg 660 gccaagccct caacaagaca ggccgcccga ttctctactc gctctgcaac tggggcgtcg 720 acggcccgtg gaactttgcc tcgaccatcg ccaactcgtg gcgcacgtcg ggcgatctgc 780 tcaacacgtg ggaccgcgac gacgcaaact gtccgtgcag tgagctcgag ggcctcgact 840 gcaagactcc cgggtacaag tgttcgatcc tgaacgtcat caacaaggcg gtgtattatc 900 cgtctaaggc gttccctggg gcgtggaatg acctggacat gctacgtatg tctccatcta 960 tctatcattc tattacatga tctaacacgc ctgcagaggt tggcaacgga ggcctcaccg 1020 acgacgaagc cgtcgcccac atgagtctct gggcagcctt caagtccccg ctgctgatga 1080 ccaacgtcct gagcaacatc gaccctccta cgctgtccat cctgcagaac ccggccgtgc 1140 tggccgtctc gcaggacccg gtcggctcca gcgtcaaccg catctggcgg tactacgtcg 1200 acgacgtgga cgccaacggg tacggcgaga tccagctgtt cagcggcggc ctggcaggag 1260 gcgaccagct ggtgctgctg ctgaacgcgg ggtcgaagga ccgcaccatg aacgcgacgc 1320 tggaggacat cttctgggaa gacgggcccg gtggcacggc cagccaggta cagcagagct 1380 gggacgtgta cgacctgtgg gcgaaccgga tgagcaacga gacggcggcg gcgatcatca 1440 acgccgccaa ctcgaccggt tctgctgcgc ctgctgcgcc gatcaacatg accgccctcg 1500 ggggtgccaa gcacgtgtac tcgcaggtgc cgccgtccga ctcgaaggcg ttgatgggca 1560 ccaaggttgg gagcgtccag ccgagtggga cggtcaaggc gtttgtcaag gcgcacggcg 1620 tggcgatgtt gcggctgcgc cagcagtcgc agaagaagga tgagttgtaa 1670 <210> 15 <211> 1476 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(1476) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 15 atggggagaa gaattgctac tgctgcactt ctcttgttcg ggctcaatgc cttgaaagga 60 gtggtggcgc tggacaatgg cctggccatc actccgcaga tgggatggaa cacatggaac 120 tccttcggat gctcgctaaa cgagaccgtc atcctagacg cggccgaaaa gctcgtctcg 180 ctcggattca aggatctcgg ctatgagtac gtcgtcctgg acgactgctg gtctgccggc 240 cggaacgcgt ctggctatct ggtgccggat ccagccaagt ttcccaatgg catcgatggc 300 ctggcggaga agatccatgc gctgggcttg aagattggca tttattccag tgcgggaacc 360 atgacttgcg cccgctatgc tgggtcgttg ggatatgaag agaaggatgc agcgctttgg 420 gctagttggg ggatcgacta cctcaaatac gacaactgct acaaccaagg ccaagaaggc 480 acgcccaagc tctcgtacga ccgctacaac gccatgggcc aagccctcaa caagacaggc 540 cgcccgattc tctactcgct ctgcaactgg ggcgtcgacg gcccgtggaa ctttgcctcg 600 accatcgcca actcgtggcg cacgtcgggc gatctgctca acacgtggga ccgcgacgac 660 gcaaactgtc cgtgcagtga gctcgagggc ctcgactgca agactcccgg gtacaagtgt 720 tcgatcctga acgtcatcaa caaggcggtg tattatccgt ctaaggcgtt ccctggggcg 780 tggaatgacc tggacatgct acaggttggc aacggaggcc tcaccgacga cgaagccgtc 840 gcccacatga gtctctgggc agccttcaag tccccgctgc tgatgaccaa cgtcctgagc 900 aacatcgacc ctcctacgct gtccatcctg cagaacccgg ccgtgctggc cgtctcgcag 960 gacccggtcg gctccagcgt caaccgcatc tggcggtact acgtcgacga cgtggacgcc 1020 aacgggtacg gcgagatcca gctgttcagc ggcggcctgg caggaggcga ccagctggtg 1080 ctgctgctga acgcggggtc gaaggaccgc accatgaacg cgacgctgga ggacatcttc 1140 tgggaagacg ggcccggtgg cacggccagc caggtacagc agagctggga cgtgtacgac 1200 ctgtgggcga accggatgag caacgagacg gcggcggcga tcatcaacgc cgccaactcg 1260 accggttctg ctgcgcctgc tgcgccgatc aacatgaccg ccctcggggg tgccaagcac 1320 gtgtactcgc aggtgccgcc gtccgactcg aaggcgttga tgggcaccaa ggttgggagc 1380 gtccagccga gtgggacggt caaggcgttt gtcaaggcgc acggcgtggc gatgttgcgg 1440 ctgcgccagc agtcgcagaa gaaggatgag ttgtaa 1476 <210> 16 <211> 2046 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(2046) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 16 atgactcgct acccctccct ctcctactac gctctcagca gctaccttct cttcacctcc 60 tgcggtgctc ttgccagcac tcgtctggag ccccgtctgg acaacggatt ggccatcact 120 cctcccatgg gctggaactc ctacaaccac tactcttgct cccccaacga gtccatcatc 180 cagtccaacg ccaaggcctt ggttgacttc ggtctggaca ccctaggata ccgctacgtc 240 accaccgact gcggctggac tgtcccctac cgtctgccca acggctccct cacctggaac 300 gagactctct tcccctccgg tttccctgct cttggccagt acatccacga ccttggactc 360 ctcttcggtg tctaccagga tgctggtatc aagacctgcg gtggtccccc tgaccaggtc 420 ggttccctgt tccacgagca gcaggatgcc gagactttcg ctgcctggaa ggccgatgcc 480 ctcaagtacg acaactgcta ctcggatgct gctgctggct accccgatgc cgactacact 540 cctagcacct cccccagctt ccgttacgcc aacatgacca aggcccttgc ctccgttgac 600 cgcaagatcc tcttccagat ctgcgactgg ggtgttgact tccccgccct ctgggctcct 660 tctctgggaa acacctggcg catctccaac gacattattc ctgcctggcg caccatcttc 720 cgtatcctga accaggcggt gcctcagact tctttcgctg gtcccggtca ctggcccgac 780 ctcgacatgc ttgaggttgg caacaacgtg ttcaccatcc ccgaggagca gacccacttc 840 tctctgtggg ccattctcaa gtcgcctctg accattggtg ctgccctcaa cgacaccctg 900 accaccatcc gcgatgcctc cctccagatc ctcaagcaga aggatgtcat cagctacaac 960 caggacccct tgggtgtctc tgcctccctg aagcgtcgtt ggaccgaaga aggattcgag 1020 gtctggagcg gtcccatctc cggtggcaag accgttgctg ctctcatcaa ctgggcggac 1080 gagtcccgca acctgaccct ggatcttcct gttgttggcc tccagcacgc tcagaccctc 1140 cgcaacatct gggatgagtc tgctgccacc aacgtccgca cctcctacac tgccaacgtc 1200 gctgctcacg gcaccatgtt ggttgagctt gctggtacca ctgaggctgg aaagtacccc 1260 gccgacatct tcgccacctc ggatggccac tccaccactt tcgagaacat ctacgctgag 1320 actacttctt cccagtacca gctcaccatt gctttcgctc ccggttcttc tcactcttcc 1380 gagatcacca tccgtacctc gctaggcggc ttcaagacct cggccaaggt ccagcccact 1440 gagagccaga tctccgtcaa catctccctg tctgctggca gctccaacac catcaccatc 1500 tctcccagcc ccatcatctc ctacatcaac gtcacctcgc ctagcggtac ctactacccc 1560 tgcacctcgt tcactcctgt cggttccgcc aagcccgaga cttgcgatgc tggtttctgc 1620 ctgcccgtcg gctccaagat tggttacatc tcccccaccg gcaacgccag catcaccatt 1680 cccgccaccg tcgtcagcgg ctccggtgac aacaccactg ccgccaccac caccgctggc 1740 aagtacctcg aaattgatta catcaacaac gacatcgctt tctccacctc ctggaccact 1800 ggcagcaact ctcgcaacct caccatttcc gtcaacggtg gtcctcctac ccgtattgag 1860 gttcctcttt ctggcaagca cagcgaactc ttcggtcctg gtcgtggctg gtgggattct 1920 gccaccttcg gtgtgcttgt tgacggctgg cgcaacggtg agaacactgt tgtcattggc 1980 aaccagggtg gtgacgaggg tgtgcagccc tacggtgccg acttcgtcgg tctgcgtctg 2040 tacgac 2046 <210> 17 <211> 657 <212> PRT <213> Rasamsonia emersonii <400> 17 Ser Thr Arg Leu Glu Pro Arg Leu Asp Asn Gly Leu Ala Ile Thr Pro 1 5 10 15 Pro Met Gly Trp Asn Ser Tyr Asn His Tyr Ser Cys Ser Pro Asn Glu 20 25 30 Ser Ile Ile Gln Ser Asn Ala Lys Ala Leu Val Asp Phe Gly Leu Asp 35 40 45 Thr Leu Gly Tyr Arg Tyr Val Thr Thr Asp Cys Gly Trp Thr Val Pro 50 55 60 Tyr Arg Leu Pro Asn Gly Ser Leu Thr Trp Asn Glu Thr Leu Phe Pro 65 70 75 80 Ser Gly Phe Pro Ala Leu Gly Gln Tyr Ile His Asp Leu Gly Leu Leu 85 90 95 Phe Gly Val Tyr Gln Asp Ala Gly Ile Lys Thr Cys Gly Gly Pro Pro 100 105 110 Asp Gln Val Gly Ser Leu Phe His Glu Gln Gln Asp Ala Glu Thr Phe 115 120 125 Ala Ala Trp Lys Ala Asp Ala Leu Lys Tyr Asp Asn Cys Tyr Ser Asp 130 135 140 Ala Ala Ala Gly Tyr Pro Asp Ala Asp Tyr Thr Pro Ser Thr Ser Pro 145 150 155 160 Ser Phe Arg Tyr Ala Asn Met Thr Lys Ala Leu Ala Ser Val Asp Arg 165 170 175 Lys Ile Leu Phe Gln Ile Cys Asp Trp Gly Val Asp Phe Pro Ala Leu 180 185 190 Trp Ala Pro Ser Leu Gly Asn Thr Trp Arg Ile Ser Asn Asp Ile Ile 195 200 205 Pro Ala Trp Arg Thr Ile Phe Arg Ile Leu Asn Gln Ala Val Pro Gln 210 215 220 Thr Ser Phe Ala Gly Pro Gly His Trp Pro Asp Leu Asp Met Leu Glu 225 230 235 240 Val Gly Asn Asn Val Phe Thr Ile Pro Glu Glu Gln Thr His Phe Ser 245 250 255 Leu Trp Ala Ile Leu Lys Ser Pro Leu Thr Ile Gly Ala Ala Leu Asn 260 265 270 Asp Thr Leu Thr Thr Ile Arg Asp Ala Ser Leu Gln Ile Leu Lys Gln 275 280 285 Lys Asp Val Ile Ser Tyr Asn Gln Asp Pro Leu Gly Val Ser Ala Ser 290 295 300 Leu Lys Arg Arg Trp Thr Glu Glu Gly Phe Glu Val Trp Ser Gly Pro 305 310 315 320 Ile Ser Gly Gly Lys Thr Val Ala Ala Leu Ile Asn Trp Ala Asp Glu 325 330 335 Ser Arg Asn Leu Thr Leu Asp Leu Pro Val Val Gly Leu Gln His Ala 340 345 350 Gln Thr Leu Arg Asn Ile Trp Asp Glu Ser Ala Ala Thr Asn Val Arg 355 360 365 Thr Ser Tyr Thr Ala Asn Val Ala Ala His Gly Thr Met Leu Val Glu 370 375 380 Leu Ala Gly Thr Thr Glu Ala Gly Lys Tyr Pro Ala Asp Ile Phe Ala 385 390 395 400 Thr Ser Asp Gly His Ser Thr Thr Phe Glu Asn Ile Tyr Ala Glu Thr 405 410 415 Thr Ser Ser Gln Tyr Gln Leu Thr Ile Ala Phe Ala Pro Gly Ser Ser 420 425 430 His Ser Ser Glu Ile Thr Ile Arg Thr Ser Leu Gly Gly Phe Lys Thr 435 440 445 Ser Ala Lys Val Gln Pro Thr Glu Ser Gln Ile Ser Val Asn Ile Ser 450 455 460 Leu Ser Ala Gly Ser Ser Asn Thr Ile Thr Ile Ser Pro Ser Pro Ile 465 470 475 480 Ile Ser Tyr Ile Asn Val Thr Ser Pro Ser Gly Thr Tyr Tyr Pro Cys 485 490 495 Thr Ser Phe Thr Pro Val Gly Ser Ala Lys Pro Glu Thr Cys Asp Ala 500 505 510 Gly Phe Cys Leu Pro Val Gly Ser Lys Ile Gly Tyr Ile Ser Pro Thr 515 520 525 Gly Asn Ala Ser Ile Thr Ile Pro Ala Thr Val Val Ser Gly Ser Gly 530 535 540 Asp Asn Thr Thr Ala Ala Thr Thr Thr Ala Gly Lys Tyr Leu Glu Ile 545 550 555 560 Asp Tyr Ile Asn Asn Asp Ile Ala Phe Ser Thr Ser Trp Thr Thr Gly 565 570 575 Ser Asn Ser Arg Asn Leu Thr Ile Ser Val Asn Gly Gly Pro Pro Thr 580 585 590 Arg Ile Glu Val Pro Leu Ser Gly Lys His Ser Glu Leu Phe Gly Pro 595 600 605 Gly Arg Gly Trp Trp Asp Ser Ala Thr Phe Gly Val Leu Val Asp Gly 610 615 620 Trp Arg Asn Gly Glu Asn Thr Val Val Ile Gly Asn Gln Gly Gly Asp 625 630 635 640 Glu Gly Val Gln Pro Tyr Gly Ala Asp Phe Val Gly Leu Arg Leu Tyr 645 650 655 Asp <210> 18 <211> 25 <212> PRT <213> Rasamsonia emersonii <400> 18 Met Thr Arg Tyr Pro Ser Leu Ser Tyr Tyr Ala Leu Ser Ser Tyr Leu 1 5 10 15 Leu Phe Thr Ser Cys Gly Ala Leu Ala 20 25 <210> 19 <211> 2315 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(2315) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 19 atgacaagat atcctagtct tagctactat gcactctctt catatttact atttaccagc 60 tgtggtgcac tggcatccac aaggttggaa cctaggttag acaatggact ggcaatcaca 120 cctccaatgg ggtaagtctc gtcttgtgaa gagttattat tattattatt ctagctagat 180 acagcttggc tcattcatat atgaaccgtg aagatggaac tcctacaacc actactcatg 240 ctccccgaac gaatcgatca tccagtcaaa cgcgaaggct ctcgtggact ttggccttga 300 tacccttggc tatcgatatg tcacaactga ttgcggctgg acggtcccct accgactccc 360 caatgggtcc ttgacctgga atgaaacgct gtttccgagt ggattcccgg cactagggca 420 gtacattcac gatctggggc ttctctttgg cgtctatcaa gatgcgggga ttaagacttg 480 tggaggaccc cctgatcaag taggaagttt atgtaagggc tttgactccc ccgggatgtg 540 cattggccgg cgtggttaat tcgaatcaag tccatgaaca acaggacgca gagacgttcg 600 ctgcctggaa agcggatgcg ttgaaatgta cgtgctgttg tgtctcttct tgcgcccgtc 660 gcattgattg atactgatct tccttccaga cgacaactgc tattctgatg cagccgctgg 720 gtatccagat gcggattata caccgagcac ctcgccatcg ttccgctacg cgaacatgac 780 aaaggcgctg gccagtgtgg atcggaaaat ccttttccaa atctgtgact ggggcgtcga 840 tttccccgcg ctctgggctc cctctctggg caacacctgg cgaatttcca acgacataat 900 ccccgcgtgg cggacgatct tcaggatcct caaccaggcc gtgccgcaga cttcttttgc 960 cggacctggc cactggccag acctcgatat gctcgaggtg gggaacaatg tgtttacgat 1020 cccggaagag cagacgcact tttccctttg ggcgatcctg aaaagccccc tgaccatcgg 1080 tgccgcgttg aatgatacct tgacgacgat cagagatgcc tcgctccaga tcttgaaaca 1140 gaaggatgtc atcagctaca accaagaccc gcttggtgtg agtgccagtc tgaagaggag 1200 atggaccgaa gagggctttg aagtgtggag cgggcccata tcgggtggga agacagtggc 1260 tgcattgatc aactgggcgg atgaatcgag gaacttgacg ctggatctcc ctgtcgtagg 1320 cctacaacac gcgcagacgc tgcggaacat ctgggacgaa agcgcagcca cgaacgtccg 1380 tacgtcgtac actgcgaacg tggcagctca tggaacgatg ttggtagaac tggccgggac 1440 aacagaagca gggaagtatc ctgctgatat ttttgcaact tcagatgggt cagtcctaac 1500 ccctcttccc ttgacaggaa aaaaaaaata agggacgctg accgcttagc aggcactcga 1560 caacttttga aaacatctat gccgagacca ctagcagcca gtaccagttg acaatcgcgt 1620 ttgctcccgg atcatctcac tcgagcgaaa taacgatccg aacgagcctc gggggattca 1680 agacgtctgc caaggtgcaa ccgactgaga gccaaatctc ggtcaacatc tcgctgtcag 1740 caggttcatc gaacacgatc acgatttcgc cgtctccaat tatcagttac ataaacgtca 1800 cctccccatc ggggacatac tatccctgta catcgtttac acctgtggga tccgccaaac 1860 ccgagacttg cgatgcggga ttctgcctgc ctgtcgggtc caaaatcggc tatatcagcc 1920 cgacaggtaa tgcaagcatc actatccctg ccacggtggt gtctggcagt ggcgataata 1980 ctactgctgc tactacgact gcagggaaat acctcgagat cgactacatc aacaacgaca 2040 ttgccttttc aacctcgtgg accacgggct ccaattctcg gaatctgaca atctcggtca 2100 acggcggacc accgacgagg atcgaggtgc ctctttctgg gaagcacagc gagctcttcg 2160 gaccaggccg tggctggtgg gatagcgcga cctttggcgt tttggttgat gggtggagga 2220 atggagaaaa cacggtggtg atagggaacc agggaggtga cgagggagta cagccgtatg 2280 gtgcggactt tgtgggcttg cgactgtatg attga 2315 <210> 20 <211> 2049 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(2049) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 20 atgacaagat atcctagtct tagctactat gcactctctt catatttact atttaccagc 60 tgtggtgcac tggcatccac aaggttggaa cctaggttag acaatggact ggcaatcaca 120 cctccaatgg gatggaactc ctacaaccac tactcatgct ccccgaacga atcgatcatc 180 cagtcaaacg cgaaggctct cgtggacttt ggccttgata cccttggcta tcgatatgtc 240 acaactgatt gcggctggac ggtcccctac cgactcccca atgggtcctt gacctggaat 300 gaaacgctgt ttccgagtgg attcccggca ctagggcagt acattcacga tctggggctt 360 ctctttggcg tctatcaaga tgcggggatt aagacttgtg gaggaccccc tgatcaagta 420 ggaagtttat tccatgaaca acaggacgca gagacgttcg ctgcctggaa agcggatgcg 480 ttgaaatacg acaactgcta ttctgatgca gccgctgggt atccagatgc ggattataca 540 ccgagcacct cgccatcgtt ccgctacgcg aacatgacaa aggcgctggc cagtgtggat 600 cggaaaatcc ttttccaaat ctgtgactgg ggcgtcgatt tccccgcgct ctgggctccc 660 tctctgggca acacctggcg aatttccaac gacataatcc ccgcgtggcg gacgatcttc 720 aggatcctca accaggccgt gccgcagact tcttttgccg gacctggcca ctggccagac 780 ctcgatatgc tcgaggtggg gaacaatgtg tttacgatcc cggaagagca gacgcacttt 840 tccctttggg cgatcctgaa aagccccctg accatcggtg ccgcgttgaa tgataccttg 900 acgacgatca gagatgcctc gctccagatc ttgaaacaga aggatgtcat cagctacaac 960 caagacccgc ttggtgtgag tgccagtctg aagaggagat ggaccgaaga gggctttgaa 1020 gtgtggagcg ggcccatatc gggtgggaag acagtggctg cattgatcaa ctgggcggat 1080 gaatcgagga acttgacgct ggatctccct gtcgtaggcc tacaacacgc gcagacgctg 1140 cggaacatct gggacgaaag cgcagccacg aacgtccgta cgtcgtacac tgcgaacgtg 1200 gcagctcatg gaacgatgtt ggtagaactg gccgggacaa cagaagcagg gaagtatcct 1260 gctgatattt ttgcaacttc agatgggcac tcgacaactt ttgaaaacat ctatgccgag 1320 accactagca gccagtacca gttgacaatc gcgtttgctc ccggatcatc tcactcgagc 1380 gaaataacga tccgaacgag cctcggggga ttcaagacgt ctgccaaggt gcaaccgact 1440 gagagccaaa tctcggtcaa catctcgctg tcagcaggtt catcgaacac gatcacgatt 1500 tcgccgtctc caattatcag ttacataaac gtcacctccc catcggggac atactatccc 1560 tgtacatcgt ttacacctgt gggatccgcc aaacccgaga cttgcgatgc gggattctgc 1620 ctgcctgtcg ggtccaaaat cggctatatc agcccgacag gtaatgcaag catcactatc 1680 cctgccacgg tggtgtctgg cagtggcgat aatactactg ctgctactac gactgcaggg 1740 aaatacctcg agatcgacta catcaacaac gacattgcct tttcaacctc gtggaccacg 1800 ggctccaatt ctcggaatct gacaatctcg gtcaacggcg gaccaccgac gaggatcgag 1860 gtgcctcttt ctgggaagca cagcgagctc ttcggaccag gccgtggctg gtgggatagc 1920 gcgacctttg gcgttttggt tgatgggtgg aggaatggag aaaacacggt ggtgataggg 1980 aaccagggag gtgacgaggg agtacagccg tatggtgcgg actttgtggg cttgcgactg 2040 tatgattga 2049 <210> 21 <211> 1821 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(1821) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 21 atgatctccg ctgctgttct ggtgtctttg ctactcacca ccatccagcc cggtgcctac 60 gcccagtggc agtgcggtgg ttccacctac actcccggct ccgtcaactt caccgaggag 120 tgctaccagg ctgctcagga ctgcgttgct cagttcggtg cgaacgcctc tctggtcaac 180 tgccaggatg ctgctggtaa cctcttcatg cagcagcagt ccaaccaggg caagaacaac 240 gactacttga ttgcctacca ggatatcctg gacttctgct tgctcgatgg attcaccact 300 ggtacctggt acgatgactc tcagtggtac tggatggctg ctgagcctgg ctgctactct 360 cccaacggct ccatcggtac caccggtccc ggtttctgcg tgcagaaccg cgatgacacc 420 gtcctcaacg gctgctaccc ccagccccag tccggtgctg gtcctctcca ggtcctccgc 480 actgctcgca ctgccaacgg cttcacctcg tctgcccgtg gctggaacag ctggggaatc 540 caggctctgg agaaccccag caccatcccc ggctggactg tgttcaacca gactgctgtc 600 aagcagcagt gctccgtcct tgctcgctcc gacttcaagg ctgctggcta cgacctttgc 660 tctcttgatg ctggctggtc gacctcttcc gaggttgatg agtacggccg tatcctgtac 720 aacagcaccc tcttcgacct tcctgagctg gccgactacc tccacggtca gggtctgaag 780 ctcggtgtct acgtcatccc cggtgttcct tgcgttgccg ccaacaagac cattgagggt 840 accaacatcc gcattggtga tgtcctgaac ggcaacaacg acgagctctc ctactgcgac 900 tgggacttct ccaaggatgg tgtccagcag tggcacgact cgctgatcaa cctctgggcc 960 agctggggtg ttgacatgat caagctcgac ttcgtcactc ctggaagccc tcagaacggt 1020 gccaacttgg tgtgcaacaa ctctgctgcc gttgaggcct accacaaggc cattgccaac 1080 tctggccgtc agatccgtct ggacctcagc tggaagctct gccgtaacga aacctacctg 1140 cccgtctggt ccagccttgc cgactccatc cgcactgacc aggacattga taactacggc 1200 tacaacacct tcgtcgcctg gcaggtcgtc cagcgtgcca tcgagaacta ccgtcagtac 1260 atcctgctgc agaagcagcg caacgttccc atcaccctgt accccgacat ggacaacctg 1320 ttcgtcggca acgccgccaa cctcaccggt gtctccgatg cccagcgtat caccatcatg 1380 aaccactggc ttggtgctgc tgccaacctg atcattggct ccgacctcaa ccagctcgat 1440 gaccttggta ccaagctcct cacctccaac gagtccatcc aggctgccga cttcttcgct 1500 cagtacccca tgcagccccg caaccctggt actggtgaca acgtccccca gcagctccag 1560 gcctggattg ctggcccctc cgacaacaac gaagcctacg tgcttgttgt caactacggc 1620 cctgaccagg gccacggtgg tttcggtacc agcttgactg gtgtgcagaa cgtcaccgtt 1680 tctcttgccg atcttggtat cgctggcaag agctgggaat tctccgatgt ctggaacgga 1740 aactcctcca ccgtcagcac ctcgttcact gcctacctgg atgagggtga gtcccagctc 1800 ctgcacctca ccgttgcgca g 1821 <210> 22 <211> 586 <212> PRT <213> Rasamsonia emersonii <400> 22 Gln Trp Gln Cys Gly Gly Ser Thr Tyr Thr Pro Gly Ser Val Asn Phe 1 5 10 15 Thr Glu Glu Cys Tyr Gln Ala Ala Gln Asp Cys Val Ala Gln Phe Gly 20 25 30 Ala Asn Ala Ser Leu Val Asn Cys Gln Asp Ala Ala Gly Asn Leu Phe 35 40 45 Met Gln Gln Gln Ser Asn Gln Gly Lys Asn Asn Asp Tyr Leu Ile Ala 50 55 60 Tyr Gln Asp Ile Leu Asp Phe Cys Leu Leu Asp Gly Phe Thr Thr Gly 65 70 75 80 Thr Trp Tyr Asp Asp Ser Gln Trp Tyr Trp Met Ala Ala Glu Pro Gly 85 90 95 Cys Tyr Ser Pro Asn Gly Ser Ile Gly Thr Thr Gly Pro Gly Phe Cys 100 105 110 Val Gln Asn Arg Asp Asp Thr Val Leu Asn Gly Cys Tyr Pro Gln Pro 115 120 125 Gln Ser Gly Ala Gly Pro Leu Gln Val Leu Arg Thr Ala Arg Thr Ala 130 135 140 Asn Gly Phe Thr Ser Ser Ala Arg Gly Trp Asn Ser Trp Gly Ile Gln 145 150 155 160 Ala Leu Glu Asn Pro Ser Thr Ile Pro Gly Trp Thr Val Phe Asn Gln 165 170 175 Thr Ala Val Lys Gln Gln Cys Ser Val Leu Ala Arg Ser Asp Phe Lys 180 185 190 Ala Ala Gly Tyr Asp Leu Cys Ser Leu Asp Ala Gly Trp Ser Thr Ser 195 200 205 Ser Glu Val Asp Glu Tyr Gly Arg Ile Leu Tyr Asn Ser Thr Leu Phe 210 215 220 Asp Leu Pro Glu Leu Ala Asp Tyr Leu His Gly Gln Gly Leu Lys Leu 225 230 235 240 Gly Val Tyr Val Ile Pro Gly Val Pro Cys Val Ala Ala Asn Lys Thr 245 250 255 Ile Glu Gly Thr Asn Ile Arg Ile Gly Asp Val Leu Asn Gly Asn Asn 260 265 270 Asp Glu Leu Ser Tyr Cys Asp Trp Asp Phe Ser Lys Asp Gly Val Gln 275 280 285 Gln Trp His Asp Ser Leu Ile Asn Leu Trp Ala Ser Trp Gly Val Asp 290 295 300 Met Ile Lys Leu Asp Phe Val Thr Pro Gly Ser Pro Gln Asn Gly Ala 305 310 315 320 Asn Leu Val Cys Asn Asn Ser Ala Ala Val Glu Ala Tyr His Lys Ala 325 330 335 Ile Ala Asn Ser Gly Arg Gln Ile Arg Leu Asp Leu Ser Trp Lys Leu 340 345 350 Cys Arg Asn Glu Thr Tyr Leu Pro Val Trp Ser Ser Leu Ala Asp Ser 355 360 365 Ile Arg Thr Asp Gln Asp Ile Asp Asn Tyr Gly Tyr Asn Thr Phe Val 370 375 380 Ala Trp Gln Val Val Gln Arg Ala Ile Glu Asn Tyr Arg Gln Tyr Ile 385 390 395 400 Leu Leu Gln Lys Gln Arg Asn Val Pro Ile Thr Leu Tyr Pro Asp Met 405 410 415 Asp Asn Leu Phe Val Gly Asn Ala Ala Asn Leu Thr Gly Val Ser Asp 420 425 430 Ala Gln Arg Ile Thr Ile Met Asn His Trp Leu Gly Ala Ala Ala Asn 435 440 445 Leu Ile Ile Gly Ser Asp Leu Asn Gln Leu Asp Asp Leu Gly Thr Lys 450 455 460 Leu Leu Thr Ser Asn Glu Ser Ile Gln Ala Ala Asp Phe Phe Ala Gln 465 470 475 480 Tyr Pro Met Gln Pro Arg Asn Pro Gly Thr Gly Asp Asn Val Pro Gln 485 490 495 Gln Leu Gln Ala Trp Ile Ala Gly Pro Ser Asp Asn Asn Glu Ala Tyr 500 505 510 Val Leu Val Val Asn Tyr Gly Pro Asp Gln Gly His Gly Gly Phe Gly 515 520 525 Thr Ser Leu Thr Gly Val Gln Asn Val Thr Val Ser Leu Ala Asp Leu 530 535 540 Gly Ile Ala Gly Lys Ser Trp Glu Phe Ser Asp Val Trp Asn Gly Asn 545 550 555 560 Ser Ser Thr Val Ser Thr Ser Phe Thr Ala Tyr Leu Asp Glu Gly Glu 565 570 575 Ser Gln Leu Leu His Leu Thr Val Ala Gln 580 585 <210> 23 <211> 21 <212> PRT <213> Rasamsonia emersonii <400> 23 Met Ile Ser Ala Ala Val Leu Val Ser Leu Leu Leu Thr Thr Ile Gln 1 5 10 15 Pro Gly Ala Tyr Ala 20 <210> 24 <211> 1824 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(1824) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 24 atgatctccg ccgcagtcct ggtctccctg cttctgacca ccatccagcc cggggcttac 60 gcccagtggc aatgtggcgg atcaacgtac acgccaggct cggtgaactt caccgaagag 120 tgctaccagg ctgctcagga ttgcgtcgcg caattcggcg ctaatgccag cctggtcaac 180 tgtcaagacg ccgcaggcaa tctgttcatg cagcagcaat ccaaccaggg gaagaacaac 240 gactacctga ttgcctacca ggacatcctt gacttctgcc tgctcgatgg cttcacgaca 300 gggacgtggt acgacgacag ccagtggtac tggatggccg ctgaaccggg ctgctactct 360 ccaaacggca gcattggcac cactgggccc ggtttctgcg tccagaaccg cgacgacacc 420 gtcctcaatg gttgctatcc ccagccccag tctggtgcag gccccctgca ggtattgcga 480 accgcccgca cagccaacgg gtttacttcg tctgcgcgag gatggaattc ctggggaatt 540 caggcgcttg agaatccgag cacgattccc ggctggacgg tattcaacca gacagccgtg 600 aaacagcaat gctcagtgct ggctcgctcg gatttcaagg cagcaggcta cgatctctgc 660 agcctggacg ccggttggtc cacgagcagc gaagtcgacg aatacgggcg aatcctctac 720 aacagcacct tgttcgacct ccccgagctg gcagattacc tgcacggaca aggcctcaag 780 ctgggtgtgt atgtgatccc gggcgtgccc tgcgttgcgg caaataagac gatcgaaggg 840 accaacattc gcatcgggga cgtcctcaat ggcaacaacg atgaactgtc gtactgcgac 900 tgggacttct ccaaggacgg cgtgcagcaa tggcacgatt cacttatcaa cctgtgggcc 960 tcctggggcg tggacatgat caagctggac tttgtcacgc caggcagtcc gcaaaacggc 1020 gcgaatctcg tctgcaacaa cagcgccgca gtggaggcgt accacaaggc aatcgccaat 1080 tcggggcgcc agatccgact ggatctgtcg tggaaactgt gccgcaatga aacctacctg 1140 ccggtctgga gcagtctggc ggattcgatc cgaacggacc aggacatcga caattatgga 1200 tacaacacgt tcgtcgcatg gcaggtcgtg cagcgggcga tcgagaatta ccgccagtat 1260 atcctgttgc agaagcagcg caacgtgccc atcacgctgt acccggacat ggacaatctc 1320 tttgtgggca atgcagcgaa cctgacgggg gtcagcgacg cgcaacgcat caccatcatg 1380 aaccactggc tcggggcggc agcgaatctg atcataggct cggatttgaa ccagctcgac 1440 gatctgggca cgaagctgct gacgagcaat gagtccatcc aggctgccga tttctttgcg 1500 cagtatccga tgcaaccgcg caacccgggc acgggcgata acgtcccgca acagctgcaa 1560 gcgtggatcg ccggaccgtc cgacaacaac gaagcgtatg tcctcgtcgt caactacgga 1620 ccggatcagg ggcacggcgg gtttgggacg tcgttgactg gcgtccagaa tgtgaccgtg 1680 tcgctggcgg atctgggcat cgcaggcaag agctgggagt tctctgatgt ctggaatggg 1740 aactcgagca cggtgtcgac ttcttttaca gcctatctag atgaagggga gtcgcagctc 1800 ctgcatttga ccgtggcaca ataa 1824 <210> 25 <211> 1824 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(1824) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 25 atgatctccg ccgcagtcct ggtctccctg cttctgacca ccatccagcc cggggcttac 60 gcccagtggc aatgtggcgg atcaacgtac acgccaggct cggtgaactt caccgaagag 120 tgctaccagg ctgctcagga ttgcgtcgcg caattcggcg ctaatgccag cctggtcaac 180 tgtcaagacg ccgcaggcaa tctgttcatg cagcagcaat ccaaccaggg gaagaacaac 240 gactacctga ttgcctacca ggacatcctt gacttctgcc tgctcgatgg cttcacgaca 300 gggacgtggt acgacgacag ccagtggtac tggatggccg ctgaaccggg ctgctactct 360 ccaaacggca gcattggcac cactgggccc ggtttctgcg tccagaaccg cgacgacacc 420 gtcctcaatg gttgctatcc ccagccccag tctggtgcag gccccctgca ggtattgcga 480 accgcccgca cagccaacgg gtttacttcg tctgcgcgag gatggaattc ctggggaatt 540 caggcgcttg agaatccgag cacgattccc ggctggacgg tattcaacca gacagccgtg 600 aaacagcaat gctcagtgct ggctcgctcg gatttcaagg cagcaggcta cgatctctgc 660 agcctggacg ccggttggtc cacgagcagc gaagtcgacg aatacgggcg aatcctctac 720 aacagcacct tgttcgacct ccccgagctg gcagattacc tgcacggaca aggcctcaag 780 ctgggtgtgt atgtgatccc gggcgtgccc tgcgttgcgg caaataagac gatcgaaggg 840 accaacattc gcatcgggga cgtcctcaat ggcaacaacg atgaactgtc gtactgcgac 900 tgggacttct ccaaggacgg cgtgcagcaa tggcacgatt cacttatcaa cctgtgggcc 960 tcctggggcg tggacatgat caagctggac tttgtcacgc caggcagtcc gcaaaacggc 1020 gcgaatctcg tctgcaacaa cagcgccgca gtggaggcgt accacaaggc aatcgccaat 1080 tcggggcgcc agatccgact ggatctgtcg tggaaactgt gccgcaatga aacctacctg 1140 ccggtctgga gcagtctggc ggattcgatc cgaacggacc aggacatcga caattatgga 1200 tacaacacgt tcgtcgcatg gcaggtcgtg cagcgggcga tcgagaatta ccgccagtat 1260 atcctgttgc agaagcagcg caacgtgccc atcacgctgt acccggacat ggacaatctc 1320 tttgtgggca atgcagcgaa cctgacgggg gtcagcgacg cgcaacgcat caccatcatg 1380 aaccactggc tcggggcggc agcgaatctg atcataggct cggatttgaa ccagctcgac 1440 gatctgggca cgaagctgct gacgagcaat gagtccatcc aggctgccga tttctttgcg 1500 cagtatccga tgcaaccgcg caacccgggc acgggcgata acgtcccgca acagctgcaa 1560 gcgtggatcg ccggaccgtc cgacaacaac gaagcgtatg tcctcgtcgt caactacgga 1620 ccggatcagg ggcacggcgg gtttgggacg tcgttgactg gcgtccagaa tgtgaccgtg 1680 tcgctggcgg atctgggcat cgcaggcaag agctgggagt tctctgatgt ctggaatggg 1740 aactcgagca cggtgtcgac ttcttttaca gcctatctag atgaagggga gtcgcagctc 1800 ctgcatttga ccgtggcaca ataa 1824 <210> 26 <211> 756 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(756) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 26 atgaagtcgt tcctggctgt gaccctcagc ctttctcttg cctccctgac cactgctgct 60 cctactccca ccaagaccct ggagaagcgt gccgacttct gcggccagtg ggattcgacc 120 gtcactggca gctacaccgt ttacaacaac ctctggggtg agagctctgc ctcctccggc 180 agccagtgca ccggtgttga ctcgctgaac ggcaacaccc tggcctggca caccagctgg 240 acctgggagg gtggtgcctc ttccgtcaag tcgttcgcca acgctgccta cgctttcact 300 gccactcagc tctcccagat ctcctccatc cccaccacct ggcagtggag ctacactggt 360 acctccatcg atgccgatgt tgcctacgac ctcttcacct cctcctcccc cagcggcagc 420 aacgaatacg aagtcatgat ctggctagct gctcttggtg gtgctttccc tatatcttcc 480 accggtacca cccccattgc cactcctacc attggtggta tctcctggaa cctgtactct 540 ggccccaacg gtgccaccac cgtctactct ttcgtcgcct cccgcgagca gaccgacttc 600 tccggtgaca tcaacgactt cctgacctac ctccagcaga acgagggtct ttcttcttcc 660 cagtacctcc tctccatcca ggctggcacc gagcccttca ctggtgagaa cgctgagctc 720 aagaccactg cctactctgt ctccgtcagc acttca 756 <210> 27 <211> 233 <212> PRT <213> Rasamsonia emersonii <400> 27 Ala Pro Thr Pro Thr Lys Thr Leu Glu Lys Arg Ala Asp Phe Cys Gly 1 5 10 15 Gln Trp Asp Ser Thr Val Thr Gly Ser Tyr Thr Val Tyr Asn Asn Leu 20 25 30 Trp Gly Glu Ser Ser Ala Ser Ser Gly Ser Gln Cys Thr Gly Val Asp 35 40 45 Ser Leu Asn Gly Asn Thr Leu Ala Trp His Thr Ser Trp Thr Trp Glu 50 55 60 Gly Gly Ala Ser Ser Val Lys Ser Phe Ala Asn Ala Ala Tyr Ala Phe 65 70 75 80 Thr Ala Thr Gln Leu Ser Gln Ile Ser Ser Ile Pro Thr Thr Trp Gln 85 90 95 Trp Ser Tyr Thr Gly Thr Ser Ile Asp Ala Asp Val Ala Tyr Asp Leu 100 105 110 Phe Thr Ser Ser Ser Pro Ser Gly Ser Asn Glu Tyr Glu Val Met Ile 115 120 125 Trp Leu Ala Ala Leu Gly Gly Ala Phe Pro Ile Ser Ser Thr Gly Thr 130 135 140 Thr Pro Ile Ala Thr Pro Thr Ile Gly Gly Ile Ser Trp Asn Leu Tyr 145 150 155 160 Ser Gly Pro Asn Gly Ala Thr Thr Val Tyr Ser Phe Val Ala Ser Arg 165 170 175 Glu Gln Thr Asp Phe Ser Gly Asp Ile Asn Asp Phe Leu Thr Tyr Leu 180 185 190 Gln Gln Asn Glu Gly Leu Ser Ser Ser Gln Tyr Leu Leu Ser Ile Gln 195 200 205 Ala Gly Thr Glu Pro Phe Thr Gly Glu Asn Ala Glu Leu Lys Thr Thr 210 215 220 Ala Tyr Ser Val Ser Val Ser Thr Ser 225 230 <210> 28 <211> 19 <212> PRT <213> Rasamsonia emersonii <400> 28 Met Lys Ser Phe Leu Ala Val Thr Leu Ser Leu Ser Leu Ala Ser Leu 1 5 10 15 Thr Thr Ala <210> 29 <211> 819 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(819) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 29 atgaagtcct tcctcgccgt aactctgtcc ctatccctcg caagcctcac caccgccgcc 60 ccaaccccaa ccaaaaccct cgaaaagcgg gccgacttct gcggacaatg ggactcgacc 120 gtcacaggca gctacaccgt ctacaacaac ctctgggggg aatccagcgc gtcgtccgga 180 tcgcagtgca cgggcgtcga ctcgctcaac gggaacacgc tcgcctggca cacctcgtgg 240 acctgggagg gcggggcgtc cagtgtcaag agcttcgcca atgccgcgta tgcgttcacg 300 gcgacgcagc tgagccagat tagcagtatt ccgacgacgt ggcagtggag gtatgaatga 360 cacttccttt tctgcctctc tgtctatgta cttgctgctg acacgtacag ctacaccggc 420 acctccatcg acgccgacgt cgcgtacgac ctattcacga gttccagccc cagcggcagc 480 aacgagtacg aggttatgat ctggctggcc gcgctcgggg gcgcattccc catctcgtcg 540 acgggcacga cgcccatcgc gacgcccacc atcggcggca tctcatggaa tctgtacagc 600 gggcccaacg gcgcgacgac ggtgtacagc ttcgtagcgt cgagagagca gacggacttt 660 tcgggcgaca tcaacgattt tctgacctat ctccagcaga acgagggcct cagctcgagc 720 cagtacctgc tgtccatcca ggcgggcacg gagccgttta cgggggagaa tgcggagctg 780 aagacgacgg cgtatagtgt cagtgtatca acctcgtga 819 <210> 30 <211> 759 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(759) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 30 atgaagtcct tcctcgccgt aactctgtcc ctatccctcg caagcctcac caccgccgcc 60 ccaaccccaa ccaaaaccct cgaaaagcgg gccgacttct gcggacaatg ggactcgacc 120 gtcacaggca gctacaccgt ctacaacaac ctctgggggg aatccagcgc gtcgtccgga 180 tcgcagtgca cgggcgtcga ctcgctcaac gggaacacgc tcgcctggca cacctcgtgg 240 acctgggagg gcggggcgtc cagtgtcaag agcttcgcca atgccgcgta tgcgttcacg 300 gcgacgcagc tgagccagat tagcagtatt ccgacgacgt ggcagtggag ctacaccggc 360 acctccatcg acgccgacgt cgcgtacgac ctattcacga gttccagccc cagcggcagc 420 aacgagtacg aggttatgat ctggctggcc gcgctcgggg gcgcattccc catctcgtcg 480 acgggcacga cgcccatcgc gacgcccacc atcggcggca tctcatggaa tctgtacagc 540 gggcccaacg gcgcgacgac ggtgtacagc ttcgtagcgt cgagagagca gacggacttt 600 tcgggcgaca tcaacgattt tctgacctat ctccagcaga acgagggcct cagctcgagc 660 cagtacctgc tgtccatcca ggcgggcacg gagccgttta cgggggagaa tgcggagctg 720 aagacgacgg cgtatagtgt cagtgtatca acctcgtga 759 <210> 31 <211> 1923 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(1923) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 31 atgtccctcg ccagcaagaa cctgcttgct tgcggcctct tcctggctgt tgctcagctt 60 gctcagcccg ttactggctt ggaattgact gtcagcacct ccggtggcaa caagtcctcc 120 cccatcctct acggcttcat gttcgaagat atcaaccact ccggtgatgg tggtatccac 180 tcccagctcc tccagaacaa cggattccag ggtgccaacc ccggtctgac tgcctacgcc 240 cccatcggta acgtttccct cgccgttgac actgagaacc ctctctcctc tgccatcacc 300 cgctcgctga aggtcaccgt tcctcccaac gcctctggca aggtcggttt ctccaactcc 360 ggctactggg ggatacccgt caacgaggcc aactacacca actcgttcta catcaagggt 420 gactacaacg gtgatgtcac cctccgcctc gccggtgcct cctccggctc tctgtacgcc 480 tcccagacca tctccgtcaa gtccaacagc agcagctaca cctacgtcga gactcagtac 540 cccgtcaagc aggctcctga cggcaacaac atctgggagc tcaccttcga tgcctccaag 600 gttgctggca agtccctcaa cttcgacctc atccagctgt accctcctac cttccacgac 660 cgtcccaacg gtctgaagcc cgagattgcc aacgtccttg ttgacatgaa gggctctttc 720 ctccgtttcc ccggtggtaa caacctcgag ggtctgaccc ccgccacccg ttggaagtgg 780 aacgagacta ttggacctct gacctcccgt cctggtcgcc agggtaactg gggctacccc 840 aacaccgatg ctcttggtct gaacgaatac ttcctctgga tccaggacat gggcttgact 900 gctgtcctgg gtgtctggga tggcttgacc attggtggtc cttctcccca ggtcatcacc 960 ggtgatgctc tcaagcccta cattgatgat gttctcaacg agctggaata catcctgggt 1020 gacaaggaca ccacctacgg caagctccgt gcctctcacg gattccccga cccttggccc 1080 ctccagtacg tggagattgg caacgaggac aacctgaacg gtggtggacc tagctacgct 1140 gagcgcttca ctgctttcca cgacgccatc aaggccaagt acccccacct gaccatcatc 1200 tccagcactg accagtacct tcccaacccc aagcccaagg gtatctggat ggactggcac 1260 acctactctc ctgctggtga attggtgagc atgtttaaca agttcgacaa cgtcgaccgc 1320 gctttcccct acttcgtcgg tgaatacgcc tgcatttctc ttgacaacgg cactgagctt 1380 gcccagccca tcatgcaggg ctctgttgct gaggctgtgt tcatgatcgg tatggagcgc 1440 aactcggatg ttgtcaagat ggccgcctac gctcccttgc tccagcagta cggcggctac 1500 acctggaacg accacgtccc caacctgatc atgttcaaca acaaccccaa cggcattgtc 1560 cgctccacct cgtactacgt gcagcagatg ttctccgtga accgtggaag caccatcctt 1620 cctgttgagt ccgacggctc tttcggtcct gtctactacg tggcctccaa gacctccgac 1680 aacaagacct actacgtcaa gttcgccaac tacggtccta ctccccagcc cgtcaccgtc 1740 aacatcccca agaccgagac tggtcgtctg accaccctct ctggtgctgc cactgctgcc 1800 aacacctggt ccagccccaa cgccgtcact cctaagacct cgaacgtcag ctccgccgat 1860 ggtgctcctg gcaagttcac catcaccctc cccgcctggt ccgttgctgt ccttgctgtc 1920 gag 1923 <210> 32 <211> 615 <212> PRT <213> Rasamsonia emersonii <400> 32 Leu Glu Leu Thr Val Ser Thr Ser Gly Gly Asn Lys Ser Ser Pro Ile 1 5 10 15 Leu Tyr Gly Phe Met Phe Glu Asp Ile Asn His Ser Gly Asp Gly Gly 20 25 30 Ile His Ser Gln Leu Leu Gln Asn Asn Gly Phe Gln Gly Ala Asn Pro 35 40 45 Gly Leu Thr Ala Tyr Ala Pro Ile Gly Asn Val Ser Leu Ala Val Asp 50 55 60 Thr Glu Asn Pro Leu Ser Ser Ala Ile Thr Arg Ser Leu Lys Val Thr 65 70 75 80 Val Pro Pro Asn Ala Ser Gly Lys Val Gly Phe Ser Asn Ser Gly Tyr 85 90 95 Trp Gly Ile Pro Val Asn Glu Ala Asn Tyr Thr Asn Ser Phe Tyr Ile 100 105 110 Lys Gly Asp Tyr Asn Gly Asp Val Thr Leu Arg Leu Ala Gly Ala Ser 115 120 125 Ser Gly Ser Leu Tyr Ala Ser Gln Thr Ile Ser Val Lys Ser Asn Ser 130 135 140 Ser Ser Tyr Thr Tyr Val Glu Thr Gln Tyr Pro Val Lys Gln Ala Pro 145 150 155 160 Asp Gly Asn Asn Ile Trp Glu Leu Thr Phe Asp Ala Ser Lys Val Ala 165 170 175 Gly Lys Ser Leu Asn Phe Asp Leu Ile Gln Leu Tyr Pro Pro Thr Phe 180 185 190 His Asp Arg Pro Asn Gly Leu Lys Pro Glu Ile Ala Asn Val Leu Val 195 200 205 Asp Met Lys Gly Ser Phe Leu Arg Phe Pro Gly Gly Asn Asn Leu Glu 210 215 220 Gly Leu Thr Pro Ala Thr Arg Trp Lys Trp Asn Glu Thr Ile Gly Pro 225 230 235 240 Leu Thr Ser Arg Pro Gly Arg Gln Gly Asn Trp Gly Tyr Pro Asn Thr 245 250 255 Asp Ala Leu Gly Leu Asn Glu Tyr Phe Leu Trp Ile Gln Asp Met Gly 260 265 270 Leu Thr Ala Val Leu Gly Val Trp Asp Gly Leu Thr Ile Gly Gly Pro 275 280 285 Ser Pro Gln Val Ile Thr Gly Asp Ala Leu Lys Pro Tyr Ile Asp Asp 290 295 300 Val Leu Asn Glu Leu Glu Tyr Ile Leu Gly Asp Lys Asp Thr Thr Tyr 305 310 315 320 Gly Lys Leu Arg Ala Ser His Gly Phe Pro Asp Pro Trp Pro Leu Gln 325 330 335 Tyr Val Glu Ile Gly Asn Glu Asp Asn Leu Asn Gly Gly Gly Pro Ser 340 345 350 Tyr Ala Glu Arg Phe Thr Ala Phe His Asp Ala Ile Lys Ala Lys Tyr 355 360 365 Pro His Leu Thr Ile Ile Ser Ser Thr Asp Gln Tyr Leu Pro Asn Pro 370 375 380 Lys Pro Lys Gly Ile Trp Met Asp Trp His Thr Tyr Ser Pro Ala Gly 385 390 395 400 Glu Leu Val Ser Met Phe Asn Lys Phe Asp Asn Val Asp Arg Ala Phe 405 410 415 Pro Tyr Phe Val Gly Glu Tyr Ala Cys Ile Ser Leu Asp Asn Gly Thr 420 425 430 Glu Leu Ala Gln Pro Ile Met Gln Gly Ser Val Ala Glu Ala Val Phe 435 440 445 Met Ile Gly Met Glu Arg Asn Ser Asp Val Val Lys Met Ala Ala Tyr 450 455 460 Ala Pro Leu Leu Gln Gln Tyr Gly Gly Tyr Thr Trp Asn Asp His Val 465 470 475 480 Pro Asn Leu Ile Met Phe Asn Asn Asn Pro Asn Gly Ile Val Arg Ser 485 490 495 Thr Ser Tyr Tyr Val Gln Gln Met Phe Ser Val Asn Arg Gly Ser Thr 500 505 510 Ile Leu Pro Val Glu Ser Asp Gly Ser Phe Gly Pro Val Tyr Tyr Val 515 520 525 Ala Ser Lys Thr Ser Asp Asn Lys Thr Tyr Tyr Val Lys Phe Ala Asn 530 535 540 Tyr Gly Pro Thr Pro Gln Pro Val Thr Val Asn Ile Pro Lys Thr Glu 545 550 555 560 Thr Gly Arg Leu Thr Thr Leu Ser Gly Ala Ala Thr Ala Ala Asn Thr 565 570 575 Trp Ser Ser Pro Asn Ala Val Thr Pro Lys Thr Ser Asn Val Ser Ser 580 585 590 Ala Asp Gly Ala Pro Gly Lys Phe Thr Ile Thr Leu Pro Ala Trp Ser 595 600 605 Val Ala Val Leu Ala Val Glu 610 615 <210> 33 <211> 26 <212> PRT <213> Rasamsonia emersonii <400> 33 Met Ser Leu Ala Ser Lys Asn Leu Leu Ala Cys Gly Leu Phe Leu Ala 1 5 10 15 Val Ala Gln Leu Ala Gln Pro Val Thr Gly 20 25 <210> 34 <211> 2381 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(2381) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 34 atgtcgttgg cttcgaagaa tctcctggcc tgcgggcttt tcttagcagt cgcccagctt 60 gcacagccag tgactggttt agaacttacg gtgtcgacgt ctggcggcaa taaatccagc 120 cctatcttgt atgggttcat gttcgaggtg agtttttgcc aagctggctg tgaaaccgcc 180 tgctggtgga gagttacgat aaccatgtcc acgctcacta tagcgtgatt gattatgtgc 240 tgacacctgc aggatatcaa ccactctggt gatggaggga tccacagtca gcttctgcag 300 aacaacggct tccagggtgc aaaccccggc ttgactgcat acgctccaat cgggaatgtg 360 tcgttggccg tggatacgga aaaccctctc tcgagcgcga taacgcggtc tctgaaggtc 420 actgtcccgc ccaacgcctc cggaaaggtt ggcttctcga attcgggtta ctggggtatt 480 cccgtgaacg aggccaacta caccaacagc ttctacatca agggagacta taatggcgac 540 gtcacgcttc gccttgcggg ggccagcagc ggcagtctgt atgcatcgca aacgatcagc 600 gtcaagagca actcgtccag ctacacctat gtcgagacgc aatatccagt gaagcaggct 660 cctgacggca acaacatctg ggaactgacc tttgacgcgt ccaaggtggc gggaaagtca 720 ttgaattttg acctgatcca gctctaccca ccaacattcc acgacaggtg cgattgcttg 780 tattcctcca ggattgtgtc gctgatgctg acctatttta tagacctaat ggcctcaaac 840 cggaaattgc aaatgttttg gttgacatga agggttcttt cctgcgcttt cccggaggaa 900 acaatctgtg agttgcttcg gtctgtatct ggcgatcctt gctgactttt ggccagcgaa 960 ggattaactc cggcaacgcg ctggaagtgg aatgagacca ttgggcctct gacgagccgt 1020 cctgggcggc aaggtaactg ggggtatccc aacacagatg cacttggtag gctttattta 1080 aaagtgatct gtgtatgaag cattgctaaa tgcgatgaca ggtctgaatg aatatttctt 1140 gtggatccag gacatgggtt tgacggcagt tctcggtgtc tgggatggac tgactatcgg 1200 agggccgagc cctcaagtta tcactgggga cgctttgaag ccctacatcg acgacgtttt 1260 gaacgagctt gaggtaagtg cctctggatg atctttttgt tcggtttcgc taacaattgc 1320 agtatatcct tggagacaag gataccacgt acggcaagct tcgtgcttct catggcttcc 1380 ctgacccctg gccactccaa tacgtggaaa tcggcaacga ggacaacctc aatggaggcg 1440 ggccctcata tgcagagcgc ttcacggcct tccacgacgc aatcaaggcc aagtacccgc 1500 atctgaccat cattagcagc acggaccagt acctcccaaa tcccaagcca aaaggaatct 1560 ggatggactg gcacacgtac tcgccggcgg gggagcttgt gagcatgttc aacaagttcg 1620 acaacgtgga ccgggctttc ccgtactttg tcggcgaata tgcctgcatc tccctcgata 1680 acgggaccga gctcgcgcag ccgatcatgc aggggtctgt ggcggaagct gtctttatga 1740 ttggcatgga aaggaacagc gatgttgtca agatggctgc ctatgcaccg ctgctgcagc 1800 aatacggcgg gtacacatgg aatgtgagat gcgcaaacga aaaatcaaga agactgatat 1860 atgcagactg actgactgac atcaggacca cgtgccaaac ctgattatgt tcaacaacaa 1920 cccaaacggc attgtccgga gcaccagcta ctacgtacag cagatgttct cagtgaaccg 1980 gggcagcacc attctgccag tggaatcaga cgggtcattt ggaccaggta cgtacagacc 2040 aacaaacacc agccacagcc agggcagcag gtccgcctcg acttactaat ttcaatgaca 2100 atgcagtcta ctacgtcgcc tccaaaacct cagacaacaa gacatactac gtcaagttcg 2160 ccaactacgg ccctaccccg cagcccgtca ccgtcaacat ccccaagaca gaaaccgggc 2220 gactgacgac gctgtccggc gccgctactg cagccaacac ctggagcagc cctaatgctg 2280 tcacacccaa gaccagcaat gtcagctctg ctgatggtgc gccaggaaag tttactatta 2340 ctctgcctgc gtggagtgtt gctgtgttgg ctgtggagtg a 2381 <210> 35 <211> 1926 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(1926) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 35 atgtcgttgg cttcgaagaa tctcctggcc tgcgggcttt tcttagcagt cgcccagctt 60 gcacagccag tgactggttt agaacttacg gtgtcgacgt ctggcggcaa taaatccagc 120 cctatcttgt atgggttcat gttcgaggat atcaaccact ctggtgatgg agggatccac 180 agtcagcttc tgcagaacaa cggcttccag ggtgcaaacc ccggcttgac tgcatacgct 240 ccaatcggga atgtgtcgtt ggccgtggat acggaaaacc ctctctcgag cgcgataacg 300 cggtctctga aggtcactgt cccgcccaac gcctccggaa aggttggctt ctcgaattcg 360 ggttactggg gtattcccgt gaacgaggcc aactacacca acagcttcta catcaaggga 420 gactataatg gcgacgtcac gcttcgcctt gcgggggcca gcagcggcag tctgtatgca 480 tcgcaaacga tcagcgtcaa gagcaactcg tccagctaca cctatgtcga gacgcaatat 540 ccagtgaagc aggctcctga cggcaacaac atctgggaac tgacctttga cgcgtccaag 600 gtggcgggaa agtcattgaa ttttgacctg atccagctct acccaccaac attccacgac 660 agacctaatg gcctcaaacc ggaaattgca aatgttttgg ttgacatgaa gggttctttc 720 ctgcgctttc ccggaggaaa caatctcgaa ggattaactc cggcaacgcg ctggaagtgg 780 aatgagacca ttgggcctct gacgagccgt cctgggcggc aaggtaactg ggggtatccc 840 aacacagatg cacttggtct gaatgaatat ttcttgtgga tccaggacat gggtttgacg 900 gcagttctcg gtgtctggga tggactgact atcggagggc cgagccctca agttatcact 960 ggggacgctt tgaagcccta catcgacgac gttttgaacg agcttgagta tatccttgga 1020 gacaaggata ccacgtacgg caagcttcgt gcttctcatg gcttccctga cccctggcca 1080 ctccaatacg tggaaatcgg caacgaggac aacctcaatg gaggcgggcc ctcatatgca 1140 gagcgcttca cggccttcca cgacgcaatc aaggccaagt acccgcatct gaccatcatt 1200 agcagcacgg accagtacct cccaaatccc aagccaaaag gaatctggat ggactggcac 1260 acgtactcgc cggcggggga gcttgtgagc atgttcaaca agttcgacaa cgtggaccgg 1320 gctttcccgt actttgtcgg cgaatatgcc tgcatctccc tcgataacgg gaccgagctc 1380 gcgcagccga tcatgcaggg gtctgtggcg gaagctgtct ttatgattgg catggaaagg 1440 aacagcgatg ttgtcaagat ggctgcctat gcaccgctgc tgcagcaata cggcgggtac 1500 acatggaatg accacgtgcc aaacctgatt atgttcaaca acaacccaaa cggcattgtc 1560 cggagcacca gctactacgt acagcagatg ttctcagtga accggggcag caccattctg 1620 ccagtggaat cagacgggtc atttggacca gtctactacg tcgcctccaa aacctcagac 1680 aacaagacat actacgtcaa gttcgccaac tacggcccta ccccgcagcc cgtcaccgtc 1740 aacatcccca agacagaaac cgggcgactg acgacgctgt ccggcgccgc tactgcagcc 1800 aacacctgga gcagccctaa tgctgtcaca cccaagacca gcaatgtcag ctctgctgat 1860 ggtgcgccag gaaagtttac tattactctg cctgcgtgga gtgttgctgt gttggctgtg 1920 gagtga 1926 <210> 36 <211> 2235 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(2235) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 36 atgatcctcc gctcgctacc catccacgcc gccgccattg ctgctgcttt gacttctctt 60 gttgacgcca agcccctccg ccacgacatc cgtcaggttg ctgagactca ccgtatcaac 120 agcactcact acaacgacac ttctgctgtt gtcctggatg tgtctctgaa ggacgccgcc 180 ggtcgtaaca acacttctcc tctcctgtac ggctggatgt tcgaggacat ctcccactct 240 ggcgatggcg gtatctacgc tgagctgatc aagaaccgtg ctttccaggg cagcacttct 300 actgtcaagc aggctcctgg tatctccggt gactccgttg ttgctgctca gaaccccatt 360 gtgcccttcg gtcctgtcct cgatggctgg cgccctatag gagatgccaa gctgtctctt 420 gatgtcctgc accctctgtc ggatgccctc cccgtcgtcc tccagatcga tatcccctgg 480 aacgccactg gcgaggttgg tttcctcaac gaaggctggt ggggtattga tgtccgccct 540 cagacctaca acgcctcctt ctacatgctt gccaacgctc ctcgctacaa caagaccttg 600 acctccatca acctgtcgct acgcagcaac ctcaccgacg atgtctgggc caccaccacc 660 atccacgttg accccgacaa ggttcctacc ttcgactacg agcagtacca ggcctccatt 720 gtgaacaccg tcaaggcccc caactccaac aacaccttcg ccatcacctt caacgccgac 780 gaggttgctg gaagcacctt ctacttcggc ttggtgtctc tgttccctga aaccttcaac 840 aaccgcccca acggcctacg caaggacctt gctcagggta tcaaggacat gggtgccaag 900 ttcctgcgtt tccctggtgg aaacaacctc gagggttact ccatcttcca gcgttggaag 960 tggaacgaaa ccattggtcc cctccgttac cgcaagggtc gtgtcggtaa ctgggaatac 1020 tacaacacca acggtcttgg tcttttggaa ttcctggaat ggactgagga ccttggcatg 1080 gagcccgtcc ttgctgtcta cgctggcttc tctctggaca tctggggcca ggaaggcacc 1140 tcctaccccg aggaccgcat ggatgagatc gtccaggaca tcctgaacga gcttgagtac 1200 tgcatgggtg atgtcaacac ccactacggt gctctccgtg cccagcacgg ccaccccgag 1260 cccttcgaca tcaagtacat tgagatcggt aacgaggact ggttctccag cacctacccc 1320 taccgtttcc ccatcatcta caaggccatc aagtccgcct accccaacat taccctcatc 1380 tccactgcct acaacgagaa cgccaactac accatcgaca tccctgctgg tggtatgtgg 1440 gatacccacc actacgaaac cccctccttc ttcctggaga acttcaacta cttcgacaac 1500 tggcaggctg ccactaacaa caccgatgtc aagatcttcg tcggtgaata ctccgtctac 1560 cagatcgaca cccccgatgg ctacgtcaac ttctccaacc ccgagggtat ccacatgttc 1620 ttccccgagc ttgtatctgc tattgctgag gctgtctacc tccttggtgc tgagcgtaac 1680 cccaacactg tcaccatgac ctcctacgct cccagcttcc agaacctgaa ctggtacaac 1740 tggtccccca acctggttgc tttcactgcc aaccctgacg agactgtgtt cagcaccagc 1800 tactacatgc agaagatgtt cgccaaccac cgtggcaccc agaccctccc tgtcaagaac 1860 agcaagggtg acttcaaccc tctctggtgg gttgccacca ttgacgaggg tgctggtgtt 1920 gtctacttca agatcgtcaa ctccggcaac tcctccatcc ccctcaccat taacctggac 1980 caggcgtaca agggtgtcaa cggcaccatc ctcgtccgcc gccgtatctg cctccagctc 2040 cacatctaca ccgtccccga tgagctcacc attgctttcc tccagaccca ccccaacctc 2100 tacggattca actacctgaa caaccagact gccattgtcc ccgtgcctgc caacatcacc 2160 tcccccagca agtcccagaa ccgcttcgac tgggatgttc ccaagtactc cgtcaccgtt 2220 ctccagttcg acatc 2235 <210> 37 <211> 722 <212> PRT <213> Rasamsonia emersonii <400> 37 Lys Pro Leu Arg His Asp Ile Arg Gln Val Ala Glu Thr His Arg Ile 1 5 10 15 Asn Ser Thr His Tyr Asn Asp Thr Ser Ala Val Val Leu Asp Val Ser 20 25 30 Leu Lys Asp Ala Ala Gly Arg Asn Asn Thr Ser Pro Leu Leu Tyr Gly 35 40 45 Trp Met Phe Glu Asp Ile Ser His Ser Gly Asp Gly Gly Ile Tyr Ala 50 55 60 Glu Leu Ile Lys Asn Arg Ala Phe Gln Gly Ser Thr Ser Thr Val Lys 65 70 75 80 Gln Ala Pro Gly Ile Ser Gly Asp Ser Val Val Ala Ala Gln Asn Pro 85 90 95 Ile Val Pro Phe Gly Pro Val Leu Asp Gly Trp Arg Pro Ile Gly Asp 100 105 110 Ala Lys Leu Ser Leu Asp Val Leu His Pro Leu Ser Asp Ala Leu Pro 115 120 125 Val Val Leu Gln Ile Asp Ile Pro Trp Asn Ala Thr Gly Glu Val Gly 130 135 140 Phe Leu Asn Glu Gly Trp Trp Gly Ile Asp Val Arg Pro Gln Thr Tyr 145 150 155 160 Asn Ala Ser Phe Tyr Met Leu Ala Asn Ala Pro Arg Tyr Asn Lys Thr 165 170 175 Leu Thr Ser Ile Asn Leu Ser Leu Arg Ser Asn Leu Thr Asp Asp Val 180 185 190 Trp Ala Thr Thr Thr Ile His Val Asp Pro Asp Lys Val Pro Thr Phe 195 200 205 Asp Tyr Glu Gln Tyr Gln Ala Ser Ile Val Asn Thr Val Lys Ala Pro 210 215 220 Asn Ser Asn Asn Thr Phe Ala Ile Thr Phe Asn Ala Asp Glu Val Ala 225 230 235 240 Gly Ser Thr Phe Tyr Phe Gly Leu Val Ser Leu Phe Pro Glu Thr Phe 245 250 255 Asn Asn Arg Pro Asn Gly Leu Arg Lys Asp Leu Ala Gln Gly Ile Lys 260 265 270 Asp Met Gly Ala Lys Phe Leu Arg Phe Pro Gly Gly Asn Asn Leu Glu 275 280 285 Gly Tyr Ser Ile Phe Gln Arg Trp Lys Trp Asn Glu Thr Ile Gly Pro 290 295 300 Leu Arg Tyr Arg Lys Gly Arg Val Gly Asn Trp Glu Tyr Tyr Asn Thr 305 310 315 320 Asn Gly Leu Gly Leu Leu Glu Phe Leu Glu Trp Thr Glu Asp Leu Gly 325 330 335 Met Glu Pro Val Leu Ala Val Tyr Ala Gly Phe Ser Leu Asp Ile Trp 340 345 350 Gly Gln Glu Gly Thr Ser Tyr Pro Glu Asp Arg Met Asp Glu Ile Val 355 360 365 Gln Asp Ile Leu Asn Glu Leu Glu Tyr Cys Met Gly Asp Val Asn Thr 370 375 380 His Tyr Gly Ala Leu Arg Ala Gln His Gly His Pro Glu Pro Phe Asp 385 390 395 400 Ile Lys Tyr Ile Glu Ile Gly Asn Glu Asp Trp Phe Ser Ser Thr Tyr 405 410 415 Pro Tyr Arg Phe Pro Ile Ile Tyr Lys Ala Ile Lys Ser Ala Tyr Pro 420 425 430 Asn Ile Thr Leu Ile Ser Thr Ala Tyr Asn Glu Asn Ala Asn Tyr Thr 435 440 445 Ile Asp Ile Pro Ala Gly Gly Met Trp Asp Thr His His Tyr Glu Thr 450 455 460 Pro Ser Phe Phe Leu Glu Asn Phe Asn Tyr Phe Asp Asn Trp Gln Ala 465 470 475 480 Ala Thr Asn Asn Thr Asp Val Lys Ile Phe Val Gly Glu Tyr Ser Val 485 490 495 Tyr Gln Ile Asp Thr Pro Asp Gly Tyr Val Asn Phe Ser Asn Pro Glu 500 505 510 Gly Ile His Met Phe Phe Pro Glu Leu Val Ser Ala Ile Ala Glu Ala 515 520 525 Val Tyr Leu Leu Gly Ala Glu Arg Asn Pro Asn Thr Val Thr Met Thr 530 535 540 Ser Tyr Ala Pro Ser Phe Gln Asn Leu Asn Trp Tyr Asn Trp Ser Pro 545 550 555 560 Asn Leu Val Ala Phe Thr Ala Asn Pro Asp Glu Thr Val Phe Ser Thr 565 570 575 Ser Tyr Tyr Met Gln Lys Met Phe Ala Asn His Arg Gly Thr Gln Thr 580 585 590 Leu Pro Val Lys Asn Ser Lys Gly Asp Phe Asn Pro Leu Trp Trp Val 595 600 605 Ala Thr Ile Asp Glu Gly Ala Gly Val Val Tyr Phe Lys Ile Val Asn 610 615 620 Ser Gly Asn Ser Ser Ile Pro Leu Thr Ile Asn Leu Asp Gln Ala Tyr 625 630 635 640 Lys Gly Val Asn Gly Thr Ile Leu Val Arg Arg Arg Ile Cys Leu Gln 645 650 655 Leu His Ile Tyr Thr Val Pro Asp Glu Leu Thr Ile Ala Phe Leu Gln 660 665 670 Thr His Pro Asn Leu Tyr Gly Phe Asn Tyr Leu Asn Asn Gln Thr Ala 675 680 685 Ile Val Pro Val Pro Ala Asn Ile Thr Ser Pro Ser Lys Ser Gln Asn 690 695 700 Arg Phe Asp Trp Asp Val Pro Lys Tyr Ser Val Thr Val Leu Gln Phe 705 710 715 720 Asp Ile <210> 38 <211> 23 <212> PRT <213> Rasamsonia emersonii <400> 38 Met Ile Leu Arg Ser Leu Pro Ile His Ala Ala Ala Ile Ala Ala Ala 1 5 10 15 Leu Thr Ser Leu Val Asp Ala 20 <210> 39 <211> 2483 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(2483) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 39 atgatcctcc gatccctccc tatccatgct gcggccattg cagcagcctt aacttccctc 60 gtcgacgcaa aacccctgcg acatgacatc aggcaggtgg cagaaacgca tcggatcaat 120 agcacgcact acaacgacac ctctgccgtc gtgctggatg tgtcgttgaa ggacgcggcc 180 gggaggaaca atacgtcgcc gctgctgtat gggtggatgt ttgaggatat tagtgtaatt 240 acctccattt gttgaccctt gactattacc gttctcaaga tgcgttgttt gttttgtact 300 ggtgtcattt tatattactg tgcttcagac gaagatggtt tttttttcct atttcctcaa 360 gctaagcctt cttgcagcac tccggcgacg gcggtatata cgcggaattg atcaagaacc 420 gggctttcca gggtgagaac taccttgact ttctttctct tcgtcgttct gacgacctgc 480 caggctcgac atccaccgtc aaacaagcac ccggcatttc aggcgacagc gtggttgctg 540 cacagaaccc catcgtcccg tttggccccg tcctcgacgg atggcgaccc attggcgatg 600 caaaactctc tctcgacgtg cttcaccccc tgtccgatgc ccttccggtc gtcctgcaga 660 tcgacatccc ctggaacgcc accggcgaag ttggcttcct gaatgaaggc tggtggggca 720 tcgacgtccg gccgcagaca tacaacgcct cgttctacat gctggccaac gccccgcgat 780 acaacaagac gctgaccagc atcaacctgt cgctgcggtc gaacctgacg gacgacgtct 840 gggccacgac gacgatccac gtcgacccgg acaaggtccc cacgttcgac tacgagcagt 900 accaggccag catcgtcaac acggtcaagg cgcccaactc gaacaacacc tttgccatca 960 ccttcaatgc ggacgaggtg gctggctcga cattctactt tggcctcgtc agtctgttcc 1020 ctgagacgtt caacaaccgt cccaacggtc tgcgcaagga cctcgcccag ggcatcaagg 1080 acatgggcgc gaaattcctc cgcttcccag gcggcaacaa cctcgaggga tactccatct 1140 tccagcggtg gaagtggaac gagaccatcg gcccgttgcg ataccgcaag ggacgcgtcg 1200 gcaactggga atactacaac accaacgggc tgggtctgct ggagttcctg gagtggacgg 1260 aggacctcgg catggagccc gttctggccg tgtacgccgg attctcgctc gacatatggg 1320 gccaggaggg cacgtcctac cccgaagacc gcatggacga gattgtgcag gacatcctga 1380 acgagctgga gtactgcatg ggcgacgtca acacgcacta cggcgctctg cgcgcgcagc 1440 acggccaccc ggagccgttc gatatcaagt acatcgagat cggcaacgag gactggttct 1500 ccagcacgta tccctaccgg ttccccatca tctacaaggc catcaagtcc gcgtacccca 1560 acatcaccct catctcgacc gcctacaacg agaacgccaa ctacaccatc gacatccccg 1620 cgggcggcat gtgggacacg catcactacg agacgccgtc cttcttcctc gagaacttca 1680 actacttcga caactggcag gcggcgacga acaacaccga cgtcaagatc ttcgtcggcg 1740 agtactccgt ctaccagatc gacacaccgg acggctacgt caacttcagc aacccggagg 1800 gcatccacat gttcttcccg gagctcgtgt cggcgatcgc agaggcagtc tatctgctcg 1860 gcgcagagcg caatccgaac acggtcacca tgacctcgta cgcgcccagc ttccagaacc 1920 tgaactggta caactggtcg cccaacctgg tggcctttac tgccaatccc gacgagacgg 1980 tcttcagcac cagctactac atgcagaaga tgtttgccaa tcaccggggc acgcagacgc 2040 tgccagtgaa gaattccaag ggagacttta acccgctgtg gtgggttgca acgattgacg 2100 agggggctgg tgttgtttac ttcaaggtat tatccattat aacattgctc gttcctgttg 2160 tcactaacaa caagcagatc gtcaactcgg gaaactcctc catcccgttg acaatcaacc 2220 tcgaccaggc atacaaggga gtcaatggga cgatactggt gcgtcgcaga atctgccttc 2280 agctacatat atataccgtt cctgacgaac tgacaattgc ctttctacag acacacccca 2340 acctctacgg attcaactac ctgaacaacc agactgccat cgtgcctgtt ccggcgaaca 2400 tcacttctcc ctcgaagagt cagaaccgct tcgattggga tgtcccgaag tattcggtca 2460 cggtgttgca gtttgatatt taa 2483 <210> 40 <211> 2238 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(2238) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 40 atgatcctcc gatccctccc tatccatgct gcggccattg cagcagcctt aacttccctc 60 gtcgacgcaa aacccctgcg acatgacatc aggcaggtgg cagaaacgca tcggatcaat 120 agcacgcact acaacgacac ctctgccgtc gtgctggatg tgtcgttgaa ggacgcggcc 180 gggaggaaca atacgtcgcc gctgctgtat gggtggatgt ttgaggatat tagtcactcc 240 ggcgacggcg gtatatacgc ggaattgatc aagaaccggg ctttccaggg ctcgacatcc 300 accgtcaaac aagcacccgg catttcaggc gacagcgtgg ttgctgcaca gaaccccatc 360 gtcccgtttg gccccgtcct cgacggatgg cgacccattg gcgatgcaaa actctctctc 420 gacgtgcttc accccctgtc cgatgccctt ccggtcgtcc tgcagatcga catcccctgg 480 aacgccaccg gcgaagttgg cttcctgaat gaaggctggt ggggcatcga cgtccggccg 540 cagacataca acgcctcgtt ctacatgctg gccaacgccc cgcgatacaa caagacgctg 600 accagcatca acctgtcgct gcggtcgaac ctgacggacg acgtctgggc cacgacgacg 660 atccacgtcg acccggacaa ggtccccacg ttcgactacg agcagtacca ggccagcatc 720 gtcaacacgg tcaaggcgcc caactcgaac aacacctttg ccatcacctt caatgcggac 780 gaggtggctg gctcgacatt ctactttggc ctcgtcagtc tgttccctga gacgttcaac 840 aaccgtccca acggtctgcg caaggacctc gcccagggca tcaaggacat gggcgcgaaa 900 ttcctccgct tcccaggcgg caacaacctc gagggatact ccatcttcca gcggtggaag 960 tggaacgaga ccatcggccc gttgcgatac cgcaagggac gcgtcggcaa ctgggaatac 1020 tacaacacca acgggctggg tctgctggag ttcctggagt ggacggagga cctcggcatg 1080 gagcccgttc tggccgtgta cgccggattc tcgctcgaca tatggggcca ggagggcacg 1140 tcctaccccg aagaccgcat ggacgagatt gtgcaggaca tcctgaacga gctggagtac 1200 tgcatgggcg acgtcaacac gcactacggc gctctgcgcg cgcagcacgg ccacccggag 1260 ccgttcgata tcaagtacat cgagatcggc aacgaggact ggttctccag cacgtatccc 1320 taccggttcc ccatcatcta caaggccatc aagtccgcgt accccaacat caccctcatc 1380 tcgaccgcct acaacgagaa cgccaactac accatcgaca tccccgcggg cggcatgtgg 1440 gacacgcatc actacgagac gccgtccttc ttcctcgaga acttcaacta cttcgacaac 1500 tggcaggcgg cgacgaacaa caccgacgtc aagatcttcg tcggcgagta ctccgtctac 1560 cagatcgaca caccggacgg ctacgtcaac ttcagcaacc cggagggcat ccacatgttc 1620 ttcccggagc tcgtgtcggc gatcgcagag gcagtctatc tgctcggcgc agagcgcaat 1680 ccgaacacgg tcaccatgac ctcgtacgcg cccagcttcc agaacctgaa ctggtacaac 1740 tggtcgccca acctggtggc ctttactgcc aatcccgacg agacggtctt cagcaccagc 1800 tactacatgc agaagatgtt tgccaatcac cggggcacgc agacgctgcc agtgaagaat 1860 tccaagggag actttaaccc gctgtggtgg gttgcaacga ttgacgaggg ggctggtgtt 1920 gtttacttca agatcgtcaa ctcgggaaac tcctccatcc cgttgacaat caacctcgac 1980 caggcataca agggagtcaa tgggacgata ctggtgcgtc gcagaatctg ccttcagcta 2040 catatatata ccgttcctga cgaactgaca attgcctttc tacagacaca ccccaacctc 2100 tacggattca actacctgaa caaccagact gccatcgtgc ctgttccggc gaacatcact 2160 tctccctcga agagtcagaa ccgcttcgat tgggatgtcc cgaagtattc ggtcacggtg 2220 ttgcagtttg atatttaa 2238 <210> 41 <211> 1518 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(1518) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 41 atgaccacct tcaccaagct cagcgacgag gagactccta ccatctccgt ccacgcttct 60 cgccgcctct ccaagatcaa ccccaacatc tactctggct tcactgagca catgggccgc 120 tgcatctacg gtggtatcta cgaccccggc aaccctctct ccgacgagaa cggattccgc 180 aaggatgttc tcgaagcgtt gaaggagctc aacatccccg tcgtccgtta ccccggtggc 240 aacttcactg ccacctacca ctggttggat ggtgttggtc ccaaggacca gcgccccgcc 300 cgtcccgagc tggcctggct aggaaccgaa accaaccagt tcggtaccga cgagttcctc 360 aagtggtgcg agatgcttgg tgctgagccc tacctctgcc tgaacttcgg tactggtacc 420 ctcgacgagg ccatggcctg ggttgaatac tgcaacggca ccggcaacac ctactacgcc 480 aacctccgtc gcaagaacgg ccgtgagaag ccctacaacg tcaagtactg ggctcttggc 540 aacgaaacct ggggtccctg gcagatcgag cagatgacca aggaagccta cgctcacaag 600 gcctaccagt gggccaaggc tctcaagctc ctggatccca acatcatcct gatcctctgc 660 ggtcaggatg gaactgccag ctgggactac tacaccctca agcactgctt gcagcccacc 720 aaggccaccc tcaactccaa ccccgttcct ctgattgaca tgcactccat ccacatgtac 780 actgcttctt ccaagcacct gcccaacgcc actgcgcctc ttgctgctga gcgtgccatt 840 gagatcacca gcagcttgat tgaccttgct cgcattgaga acggcatctc ccccgatgag 900 cctcgtccca ccatctgctt cgacgaatgg aacgtctggg accctgtccg tgctgagggc 960 tccaagggtg ctgaggagag ctacactctg tcggatgccc ttgctgttgg tgtgttcctc 1020 aacgtgttcg tccgcaagtc caaggacctt ggaatggcct gcattgccca gtccgtcaac 1080 gtcatctccc ctctgatgac cactcgtgac ggtatcgtca agcagaccac ctggtggcct 1140 ctctggctgt tctcccgctt catgcgtggc tggaccattg gtgctcacgt ttcctgcggt 1200 gcctacgagg gtgagacttc tcctgcctgg ctgcgtggtg tcaaggacac tccttggctg 1260 gatgtctctg ccgctcttgg tgatgacggc ttcgtcaacg ttgttgttgt caacatccac 1320 gaaaccaagg acttcaagac caacgtgaag ggtgtctccg gtggtcccgt gaccgtctac 1380 accgtcactg gtgctgatgt gtctgccacc aacatgaagg gcaagcagga agtcggtgtc 1440 caggagtcca cctgggatgg caagggcagc tacgtgttcc ccaagcactc gctgaccctg 1500 ctccgctgga aggccgag 1518 <210> 42 <211> 506 <212> PRT <213> Rasamsonia emersonii <400> 42 Met Thr Thr Phe Thr Lys Leu Ser Asp Glu Glu Thr Pro Thr Ile Ser 1 5 10 15 Val His Ala Ser Arg Arg Leu Ser Lys Ile Asn Pro Asn Ile Tyr Ser 20 25 30 Gly Phe Thr Glu His Met Gly Arg Cys Ile Tyr Gly Gly Ile Tyr Asp 35 40 45 Pro Gly Asn Pro Leu Ser Asp Glu Asn Gly Phe Arg Lys Asp Val Leu 50 55 60 Glu Ala Leu Lys Glu Leu Asn Ile Pro Val Val Arg Tyr Pro Gly Gly 65 70 75 80 Asn Phe Thr Ala Thr Tyr His Trp Leu Asp Gly Val Gly Pro Lys Asp 85 90 95 Gln Arg Pro Ala Arg Pro Glu Leu Ala Trp Leu Gly Thr Glu Thr Asn 100 105 110 Gln Phe Gly Thr Asp Glu Phe Leu Lys Trp Cys Glu Met Leu Gly Ala 115 120 125 Glu Pro Tyr Leu Cys Leu Asn Phe Gly Thr Gly Thr Leu Asp Glu Ala 130 135 140 Met Ala Trp Val Glu Tyr Cys Asn Gly Thr Gly Asn Thr Tyr Tyr Ala 145 150 155 160 Asn Leu Arg Arg Lys Asn Gly Arg Glu Lys Pro Tyr Asn Val Lys Tyr 165 170 175 Trp Ala Leu Gly Asn Glu Thr Trp Gly Pro Trp Gln Ile Glu Gln Met 180 185 190 Thr Lys Glu Ala Tyr Ala His Lys Ala Tyr Gln Trp Ala Lys Ala Leu 195 200 205 Lys Leu Leu Asp Pro Asn Ile Ile Leu Ile Leu Cys Gly Gln Asp Gly 210 215 220 Thr Ala Ser Trp Asp Tyr Tyr Thr Leu Lys His Cys Leu Gln Pro Thr 225 230 235 240 Lys Ala Thr Leu Asn Ser Asn Pro Val Pro Leu Ile Asp Met His Ser 245 250 255 Ile His Met Tyr Thr Ala Ser Ser Lys His Leu Pro Asn Ala Thr Ala 260 265 270 Pro Leu Ala Ala Glu Arg Ala Ile Glu Ile Thr Ser Ser Leu Ile Asp 275 280 285 Leu Ala Arg Ile Glu Asn Gly Ile Ser Pro Asp Glu Pro Arg Pro Thr 290 295 300 Ile Cys Phe Asp Glu Trp Asn Val Trp Asp Pro Val Arg Ala Glu Gly 305 310 315 320 Ser Lys Gly Ala Glu Glu Ser Tyr Thr Leu Ser Asp Ala Leu Ala Val 325 330 335 Gly Val Phe Leu Asn Val Phe Val Arg Lys Ser Lys Asp Leu Gly Met 340 345 350 Ala Cys Ile Ala Gln Ser Val Asn Val Ile Ser Pro Leu Met Thr Thr 355 360 365 Arg Asp Gly Ile Val Lys Gln Thr Thr Trp Trp Pro Leu Trp Leu Phe 370 375 380 Ser Arg Phe Met Arg Gly Trp Thr Ile Gly Ala His Val Ser Cys Gly 385 390 395 400 Ala Tyr Glu Gly Glu Thr Ser Pro Ala Trp Leu Arg Gly Val Lys Asp 405 410 415 Thr Pro Trp Leu Asp Val Ser Ala Ala Leu Gly Asp Asp Gly Phe Val 420 425 430 Asn Val Val Val Val Asn Ile His Glu Thr Lys Asp Phe Lys Thr Asn 435 440 445 Val Lys Gly Val Ser Gly Gly Pro Val Thr Val Tyr Thr Val Thr Gly 450 455 460 Ala Asp Val Ser Ala Thr Asn Met Lys Gly Lys Gln Glu Val Gly Val 465 470 475 480 Gln Glu Ser Thr Trp Asp Gly Lys Gly Ser Tyr Val Phe Pro Lys His 485 490 495 Ser Leu Thr Leu Leu Arg Trp Lys Ala Glu 500 505 <210> 43 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> no signal peptide predicted <400> 43 Met Met Met Met 1 <210> 44 <211> 2005 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(2005) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 44 atgacgacat tcaccaagct cagcgacgag gagacgccca ccatctctgt ccatgcgtcc 60 aggcgtctgt ccaaaatcaa ccccaacatc tactcggggt tcacagagta gggagccgac 120 agacgtgtct accggtttta gttcgctagt gagaccctgc tgactgatag ctttcgttac 180 caggcatatg ggacgatgca tctacggagg catatatgat cccggaaatc ctctgtcgga 240 cgagaatggc tttcgaaagg atgttctgga ggctctgaag gagctcaata tccctgtggt 300 tcgctatccc ggcggaaact ttaccgccac gtatcactgg ttagacggtg ttggcccgaa 360 ggatcaacga cccgcgaggt attcaatgac ttcttctctt ggatttcatt tctttcgttt 420 gactgtctgt gttttaccat ggttctgttt taataccatg aactatttga gagactttag 480 ctggtttcca tataattttt ttaccatacg cggcacctgt catgctaaca aagggaaaca 540 atttgaacag accggagctc gcctggctgg ggactgagac caatcagttc ggcactgatg 600 agttcttaaa atggtgtgag atgctcggcg cggagccgta cctctgcttg aactttggaa 660 caggtgcggc gtgccgatat cctgaccctt gtacctgaga acaaacaaac taattggatt 720 gatttaggca ctcttgatga aggtgagcat ccttcaattc ctgtcctata atgccagcac 780 aagatgatgt tgacacttct cagcaatggc atgggtcgag tactgcaatg ggacgggaaa 840 tacctactat gccaacctgc ggaggaagaa tggtcgggag aagccctaca atgtacgatc 900 cagtcactga ttggacattc tgttttttaa atactaatac cagagtttca ggttaaatac 960 tgggctctgg gtaacgagac atggggtccg tggcaaattg aacaaatgac caaggaagcc 1020 tatgctcaca aggcgtatca atgggccaaa ggtacgttga caatttatat atctatttat 1080 ctatacctct aacatacgta cagctctcaa gctgctcgat ccgaatataa ttctcattct 1140 ttgcggtcag gacggcactg catcgtggga ctactacacc ctcaaacact gtctgcagcc 1200 aacaaaggct actctaaaca gcaacccggt tccccttatt gacatgcaca gcattcacat 1260 gtacacggcg tcgtccaagc atttgccaaa cgccaccgca cccttggctg cggagcgtgc 1320 gattgagatt acatcctccc tgatcgacct ggctcggatc gaaaacggga tatccccgga 1380 tgagccgcgc ccgacgatct gctttgacga gtggaacgtc tgggatcccg tgcgtgccga 1440 gggcagcaag ggagccgagg agagctacac cctgtccgac gcgttggcgg tgggagtttt 1500 cctcaacgtg ttcgtccgga agagcaagga cctgggaatg gcgtgcatcg cgcaaagcgt 1560 caatgtcatt tcgccgctca tgacgaccag agacggcatt gtgaagcaaa cgacgtggtg 1620 gccgctgtgg cttttctccc gattcatgcg gggctggacc atcggtgcgc atgtttcctg 1680 tggcgcctac gagggcgaaa cctcacccgc gtggctgcgc ggcgtcaagg acactccctg 1740 gctggacgtc agcgcggcct tgggtgacga tggctttgtc aacgtagttg tcgtcaacat 1800 ccatgaaact aaggacttta agaccaacgt caagggcgtc agtggaggtc ctgtcactgt 1860 ctacacggtc accggagccg atgtgtctgc tactaacatg aaggggaagc aagaggtggg 1920 agttcaggag agtacatggg acggcaaagg cagttatgtg ttcccgaagc attctctgac 1980 gctgctgaga tggaaggcag agtga 2005 <210> 45 <211> 1521 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(1521) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 45 atgacgacat tcaccaagct cagcgacgag gagacgccca ccatctctgt ccatgcgtcc 60 aggcgtctgt ccaaaatcaa ccccaacatc tactcggggt tcacagagca tatgggacga 120 tgcatctacg gaggcatata tgatcccgga aatcctctgt cggacgagaa tggctttcga 180 aaggatgttc tggaggctct gaaggagctc aatatccctg tggttcgcta tcccggcgga 240 aactttaccg ccacgtatca ctggttagac ggtgttggcc cgaaggatca acgacccgcg 300 agaccggagc tcgcctggct ggggactgag accaatcagt tcggcactga tgagttctta 360 aaatggtgtg agatgctcgg cgcggagccg tacctctgct tgaactttgg aacaggcact 420 cttgatgaag caatggcatg ggtcgagtac tgcaatggga cgggaaatac ctactatgcc 480 aacctgcgga ggaagaatgg tcgggagaag ccctacaatg ttaaatactg ggctctgggt 540 aacgagacat ggggtccgtg gcaaattgaa caaatgacca aggaagccta tgctcacaag 600 gcgtatcaat gggccaaagc tctcaagctg ctcgatccga atataattct cattctttgc 660 ggtcaggacg gcactgcatc gtgggactac tacaccctca aacactgtct gcagccaaca 720 aaggctactc taaacagcaa cccggttccc cttattgaca tgcacagcat tcacatgtac 780 acggcgtcgt ccaagcattt gccaaacgcc accgcaccct tggctgcgga gcgtgcgatt 840 gagattacat cctccctgat cgacctggct cggatcgaaa acgggatatc cccggatgag 900 ccgcgcccga cgatctgctt tgacgagtgg aacgtctggg atcccgtgcg tgccgagggc 960 agcaagggag ccgaggagag ctacaccctg tccgacgcgt tggcggtggg agttttcctc 1020 aacgtgttcg tccggaagag caaggacctg ggaatggcgt gcatcgcgca aagcgtcaat 1080 gtcatttcgc cgctcatgac gaccagagac ggcattgtga agcaaacgac gtggtggccg 1140 ctgtggcttt tctcccgatt catgcggggc tggaccatcg gtgcgcatgt ttcctgtggc 1200 gcctacgagg gcgaaacctc acccgcgtgg ctgcgcggcg tcaaggacac tccctggctg 1260 gacgtcagcg cggccttggg tgacgatggc tttgtcaacg tagttgtcgt caacatccat 1320 gaaactaagg actttaagac caacgtcaag ggcgtcagtg gaggtcctgt cactgtctac 1380 acggtcaccg gagccgatgt gtctgctact aacatgaagg ggaagcaaga ggtgggagtt 1440 caggagagta catgggacgg caaaggcagt tatgtgttcc cgaagcattc tctgacgctg 1500 ctgagatgga aggcagagtg a 1521 <210> 46 <211> 966 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(966) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 46 atgcgcccca gcttcctccg ctacgtgtct cttgctcctc tgctctggtc tgctgctgcc 60 tccgctgagc ctgtccgtgt tctcgacacc gacttccctg acccttgctt gatctccacc 120 aacggcaagt actacgcttt cgccaccact ggcaacggtg tcaacgtcca gattgcccag 180 tcggatgact tcgtcacctg ggagcgtctt gctggtactg atgcccttcc tggtcccttc 240 cccagctggg ttgcctcctc ccccactgtc tgggctcccg atgtcatcca gcgtctggac 300 ggtacctacg tcatgtacta ctctgctctt tcttccaccg accccagcaa gcactgcttc 360 ggtgctgcca cctcgacctc catcaccggt ccctacaagc ccgaggacaa ctacattgcc 420 tgccccctcg accagggtgg tgccatcgac cccgatggat tcatcgatga tgacggcacc 480 atgtacgtgg tctacaaggt tgacggcagc aacctggatg gagatggcac catccacccc 540 actcccatca tgctccaggc tctggagcct gacggcatca cccccactgg tgaccccatc 600 aagctcctcg accgtgatgc ctccgacggc atcttgattg aggctccctc cctcgtccgc 660 tccgttgttt ccggcaccta cttcctgagc tactcttctc actactacgc ctccctgcac 720 tacgacgttg gatacgccac tggccctgcc gtcaagggtc ccttcaccaa ggcccaggct 780 cctcttctcg tcaccggtga caacaccacc aacgccggtc ctctgggtgg tcccggtggt 840 gccgacttct ccgtcgacgg cactcgtatc gtgttccacg ctttcgagaa cggccgcaac 900 ctgaccaacg gccgtgctct ctacaccagc ggtatcgtcc tcgagggtga tgtcattcgc 960 ctagtt 966 <210> 47 <211> 300 <212> PRT <213> Rasamsonia emersonii <400> 47 Glu Pro Val Arg Val Leu Asp Thr Asp Phe Pro Asp Pro Cys Leu Ile 1 5 10 15 Ser Thr Asn Gly Lys Tyr Tyr Ala Phe Ala Thr Thr Gly Asn Gly Val 20 25 30 Asn Val Gln Ile Ala Gln Ser Asp Asp Phe Val Thr Trp Glu Arg Leu 35 40 45 Ala Gly Thr Asp Ala Leu Pro Gly Pro Phe Pro Ser Trp Val Ala Ser 50 55 60 Ser Pro Thr Val Trp Ala Pro Asp Val Ile Gln Arg Leu Asp Gly Thr 65 70 75 80 Tyr Val Met Tyr Tyr Ser Ala Leu Ser Ser Thr Asp Pro Ser Lys His 85 90 95 Cys Phe Gly Ala Ala Thr Ser Thr Ser Ile Thr Gly Pro Tyr Lys Pro 100 105 110 Glu Asp Asn Tyr Ile Ala Cys Pro Leu Asp Gln Gly Gly Ala Ile Asp 115 120 125 Pro Asp Gly Phe Ile Asp Asp Asp Gly Thr Met Tyr Val Val Tyr Lys 130 135 140 Val Asp Gly Ser Asn Leu Asp Gly Asp Gly Thr Ile His Pro Thr Pro 145 150 155 160 Ile Met Leu Gln Ala Leu Glu Pro Asp Gly Ile Thr Pro Thr Gly Asp 165 170 175 Pro Ile Lys Leu Leu Asp Arg Asp Ala Ser Asp Gly Ile Leu Ile Glu 180 185 190 Ala Pro Ser Leu Val Arg Ser Val Val Ser Gly Thr Tyr Phe Leu Ser 195 200 205 Tyr Ser Ser His Tyr Tyr Ala Ser Leu His Tyr Asp Val Gly Tyr Ala 210 215 220 Thr Gly Pro Ala Val Lys Gly Pro Phe Thr Lys Ala Gln Ala Pro Leu 225 230 235 240 Leu Val Thr Gly Asp Asn Thr Thr Asn Ala Gly Pro Leu Gly Gly Pro 245 250 255 Gly Gly Ala Asp Phe Ser Val Asp Gly Thr Arg Ile Val Phe His Ala 260 265 270 Phe Glu Asn Gly Arg Asn Leu Thr Asn Gly Arg Ala Leu Tyr Thr Ser 275 280 285 Gly Ile Val Leu Glu Gly Asp Val Ile Arg Leu Val 290 295 300 <210> 48 <211> 22 <212> PRT <213> Rasamsonia emersonii <400> 48 Met Arg Pro Ser Phe Leu Arg Tyr Val Ser Leu Ala Pro Leu Leu Trp 1 5 10 15 Ser Ala Ala Ala Ser Ala 20 <210> 49 <211> 1026 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(1026) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 49 atgcgaccat ctttccttcg atacgtctct ctagcacccc tcctgtggag cgcagcagca 60 tctgctgagc ccgtccgagt gctggacacc gacttcccag acccctgcct gatctccacc 120 aacggcaagt actatgcctt tgcgacgacg ggcaatggcg tcaacgtgca aatcgcccag 180 tcggacgact tcgtcacctg ggagcgtctg gctggcactg atgccctgcc gggaccgttt 240 ccctcgtggg tggcgtcttc gccgactgta tgggcgccgg acgtgattca acgggtgcgt 300 ttaaactata cataggattt ttcatcgtca tatctaacga ggtgcatcta gctcgatggc 360 acgtacgtga tgtactactc cgccctctcg agcacggacc cgtccaagca ctgctttggc 420 gccgccacct cgacctccat cacaggccct tacaagcccg aagacaacta catcgcctgt 480 ccgctggacc agggcggcgc catcgaccca gacggcttca tcgacgacga cggcaccatg 540 tacgtcgtct acaaggtcga cgggagcaac ctggacggcg acggcacgat ccatccgacg 600 cccatcatgc tgcaggcgct ggagccggac ggcatcactc cgacagggga cccgatcaag 660 ctgctagacc gggacgcgtc ggacgggatc ctgattgagg cgcccagtct ggtcagaagc 720 gtcgtcagcg ggacgtactt cctctcgtac tcgtcgcact actacgccag tttgcactac 780 gacgtcggct acgcgacagg gccggctgtg aaggggccct tcaccaaggc gcaggccccg 840 ttgctggtga cgggcgacaa tactaccaat gctggtcctc tgggtggacc tggaggagca 900 gacttttccg tcgacgggac gaggattgtc tttcatgcgt ttgagaatgg aaggaatctt 960 actaatggca gggcgctgta tacgtcgggg attgtccttg agggggacgt catacggttg 1020 gtgtag 1026 <210> 50 <211> 969 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(969) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 50 atgcgaccat ctttccttcg atacgtctct ctagcacccc tcctgtggag cgcagcagca 60 tctgctgagc ccgtccgagt gctggacacc gacttcccag acccctgcct gatctccacc 120 aacggcaagt actatgcctt tgcgacgacg ggcaatggcg tcaacgtgca aatcgcccag 180 tcggacgact tcgtcacctg ggagcgtctg gctggcactg atgccctgcc gggaccgttt 240 ccctcgtggg tggcgtcttc gccgactgta tgggcgccgg acgtgattca acggctcgat 300 ggcacgtacg tgatgtacta ctccgccctc tcgagcacgg acccgtccaa gcactgcttt 360 ggcgccgcca cctcgacctc catcacaggc ccttacaagc ccgaagacaa ctacatcgcc 420 tgtccgctgg accagggcgg cgccatcgac ccagacggct tcatcgacga cgacggcacc 480 atgtacgtcg tctacaaggt cgacgggagc aacctggacg gcgacggcac gatccatccg 540 acgcccatca tgctgcaggc gctggagccg gacggcatca ctccgacagg ggacccgatc 600 aagctgctag accgggacgc gtcggacggg atcctgattg aggcgcccag tctggtcaga 660 agcgtcgtca gcgggacgta cttcctctcg tactcgtcgc actactacgc cagtttgcac 720 tacgacgtcg gctacgcgac agggccggct gtgaaggggc ccttcaccaa ggcgcaggcc 780 ccgttgctgg tgacgggcga caatactacc aatgctggtc ctctgggtgg acctggagga 840 gcagactttt ccgtcgacgg gacgaggatt gtctttcatg cgtttgagaa tggaaggaat 900 cttactaatg gcagggcgct gtatacgtcg gggattgtcc ttgaggggga cgtcatacgg 960 ttggtgtag 969 <210> 51 <211> 1998 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(1998) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 51 atgctttctg ctttcctctt ctcctccccc actctcagct ctcctcagtc tgcttccaag 60 accgagaaca gcactgccaa cactcctggt atccgcttga tcaacggcca cgaacacgtc 120 ctgatccagc cctggggtgc cgatggcttc cgcgttcgtg ccactctcaa ccgcttcccc 180 gacaactccg tccagcgtca ccaccgctct ccttccggcc gtcccgccga tcttcccatt 240 ggtaccagct actccaccat caacgccact cagactgcca ccgtcaccaa cggacacgcc 300 tccgtcgtcg tcgacaaggg tcagctgtcg ttctaccgtg tcaacggcaa caactccaag 360 accctcgtcc tccaggagct ctggctccag acccccggtt tccctgctcg ctggtaccag 420 aagcgtgatg ctcgccgtgg attccgtgct cagttctcct tcgtcgctcc tgactccccc 480 accgagcgtc tgttcggtac cggccaggat ttgactggct ctctgatcaa gaagaaccag 540 accatcgatc ttgtcaagtt caacaccctc aaccccatcc ccaccattgt ctccgaccgt 600 ggatacctct tcttctggaa cgttccctcc ctcggtcaga tggagctttc tcctacccgc 660 acctcgttcc tgtccgacca cacctccgtt gtggactact acattgccat ccgtcccgag 720 gccgactacg acggtctgct ccagcgttac acttccgtca ccggccgcag ccccatgatc 780 cctgacttcg gtactggata ctggcagtgc aagctccgtt acgccaccca ggaagaattg 840 ctcaacgtca ccatgggttt cgctgagcgc aagatccccg tcagcatgtt catcatcaac 900 tacctgagct ggtcccacga gggtgactgg gctctcaacg cctccgcctg gcctgacccc 960 gccaagatgg ctgctgaggc tgagctgatg gcctccgtct ggccctccat tgaggatgcc 1020 agccccaact gggctgagat gcagtctctt ggattcgctg cccagacttt cgaccctctt 1080 gacattgctg gctactggca gaacaagtac cagaacggta tccgcaactt ctggctagat 1140 gaggatgagg gtggccaggt tgctctcgat gtctacccct ggactgacta ctaccttgga 1200 cctggtgacc agtacgccat gcttttcccc tacttccacc agatgggtgt tttcgagggc 1260 cagatgaaaa ctgttggcag caacaacgtt tctgctgtct ctctgtcccg ctcgtctgcc 1320 aactgggaca gcatgaagat gatgatctcc gctggccagt ccatggccat gtccggccag 1380 ggatggtgga ccctcgacat tggtggtttc aagactgatg gccagtcgaa ctcggccaac 1440 atctcggacc ccgagtacca ggagctgttc gtccgctggc tgcagtgggg taccttcctc 1500 cccatcatgc gcaaccacgg tatgcgtacc tgcctgccct ccgctcagga aggcttcctg 1560 acctgcccct ccgagccctg gagctacggt cctgacaacc tgcccatcat tgtcagctac 1620 atcaacctcc gttacaagct gcagccctac atcaaggccc tcttccgcat gctgagcgaa 1680 tctggccgtg ccatgatgcg ccctctgttc atggacttct ccctctccga cccctacacc 1740 ctggaggcca ctgaggacct caagctccag tacatgttcg gtcctcgctt gcttgtctct 1800 cctgtcacca cctaccgtgc caccaacgcc accgtctacc ttcccaagct tccttcggat 1860 gctcccgata ccaagtggac ctactggtgg accaacgagt ctttcgatgg tggtcagtgg 1920 gtgaccgttc ctgccaacaa gtccatcatc cccttgttcc gtctgggcag cgaagcggac 1980 atcctcaccc gcaacatt 1998 <210> 52 <211> 647 <212> PRT <213> Rasamsonia emersonii <400> 52 Lys Thr Glu Asn Ser Thr Ala Asn Thr Pro Gly Ile Arg Leu Ile Asn 1 5 10 15 Gly His Glu His Val Leu Ile Gln Pro Trp Gly Ala Asp Gly Phe Arg 20 25 30 Val Arg Ala Thr Leu Asn Arg Phe Pro Asp Asn Ser Val Gln Arg His 35 40 45 His Arg Ser Pro Ser Gly Arg Pro Ala Asp Leu Pro Ile Gly Thr Ser 50 55 60 Tyr Ser Thr Ile Asn Ala Thr Gln Thr Ala Thr Val Thr Asn Gly His 65 70 75 80 Ala Ser Val Val Val Asp Lys Gly Gln Leu Ser Phe Tyr Arg Val Asn 85 90 95 Gly Asn Asn Ser Lys Thr Leu Val Leu Gln Glu Leu Trp Leu Gln Thr 100 105 110 Pro Gly Phe Pro Ala Arg Trp Tyr Gln Lys Arg Asp Ala Arg Arg Gly 115 120 125 Phe Arg Ala Gln Phe Ser Phe Val Ala Pro Asp Ser Pro Thr Glu Arg 130 135 140 Leu Phe Gly Thr Gly Gln Asp Leu Thr Gly Ser Leu Ile Lys Lys Asn 145 150 155 160 Gln Thr Ile Asp Leu Val Lys Phe Asn Thr Leu Asn Pro Ile Pro Thr 165 170 175 Ile Val Ser Asp Arg Gly Tyr Leu Phe Phe Trp Asn Val Pro Ser Leu 180 185 190 Gly Gln Met Glu Leu Ser Pro Thr Arg Thr Ser Phe Leu Ser Asp His 195 200 205 Thr Ser Val Val Asp Tyr Tyr Ile Ala Ile Arg Pro Glu Ala Asp Tyr 210 215 220 Asp Gly Leu Leu Gln Arg Tyr Thr Ser Val Thr Gly Arg Ser Pro Met 225 230 235 240 Ile Pro Asp Phe Gly Thr Gly Tyr Trp Gln Cys Lys Leu Arg Tyr Ala 245 250 255 Thr Gln Glu Glu Leu Leu Asn Val Thr Met Gly Phe Ala Glu Arg Lys 260 265 270 Ile Pro Val Ser Met Phe Ile Ile Asn Tyr Leu Ser Trp Ser His Glu 275 280 285 Gly Asp Trp Ala Leu Asn Ala Ser Ala Trp Pro Asp Pro Ala Lys Met 290 295 300 Ala Ala Glu Ala Glu Leu Met Ala Ser Val Trp Pro Ser Ile Glu Asp 305 310 315 320 Ala Ser Pro Asn Trp Ala Glu Met Gln Ser Leu Gly Phe Ala Ala Gln 325 330 335 Thr Phe Asp Pro Leu Asp Ile Ala Gly Tyr Trp Gln Asn Lys Tyr Gln 340 345 350 Asn Gly Ile Arg Asn Phe Trp Leu Asp Glu Asp Glu Gly Gly Gln Val 355 360 365 Ala Leu Asp Val Tyr Pro Trp Thr Asp Tyr Tyr Leu Gly Pro Gly Asp 370 375 380 Gln Tyr Ala Met Leu Phe Pro Tyr Phe His Gln Met Gly Val Phe Glu 385 390 395 400 Gly Gln Met Lys Thr Val Gly Ser Asn Asn Val Ser Ala Val Ser Leu 405 410 415 Ser Arg Ser Ser Ala Asn Trp Asp Ser Met Lys Met Met Ile Ser Ala 420 425 430 Gly Gln Ser Met Ala Met Ser Gly Gln Gly Trp Trp Thr Leu Asp Ile 435 440 445 Gly Gly Phe Lys Thr Asp Gly Gln Ser Asn Ser Ala Asn Ile Ser Asp 450 455 460 Pro Glu Tyr Gln Glu Leu Phe Val Arg Trp Leu Gln Trp Gly Thr Phe 465 470 475 480 Leu Pro Ile Met Arg Asn His Gly Met Arg Thr Cys Leu Pro Ser Ala 485 490 495 Gln Glu Gly Phe Leu Thr Cys Pro Ser Glu Pro Trp Ser Tyr Gly Pro 500 505 510 Asp Asn Leu Pro Ile Ile Val Ser Tyr Ile Asn Leu Arg Tyr Lys Leu 515 520 525 Gln Pro Tyr Ile Lys Ala Leu Phe Arg Met Leu Ser Glu Ser Gly Arg 530 535 540 Ala Met Met Arg Pro Leu Phe Met Asp Phe Ser Leu Ser Asp Pro Tyr 545 550 555 560 Thr Leu Glu Ala Thr Glu Asp Leu Lys Leu Gln Tyr Met Phe Gly Pro 565 570 575 Arg Leu Leu Val Ser Pro Val Thr Thr Tyr Arg Ala Thr Asn Ala Thr 580 585 590 Val Tyr Leu Pro Lys Leu Pro Ser Asp Ala Pro Asp Thr Lys Trp Thr 595 600 605 Tyr Trp Trp Thr Asn Glu Ser Phe Asp Gly Gly Gln Trp Val Thr Val 610 615 620 Pro Ala Asn Lys Ser Ile Ile Pro Leu Phe Arg Leu Gly Ser Glu Ala 625 630 635 640 Asp Ile Leu Thr Arg Asn Ile 645 <210> 53 <211> 19 <212> PRT <213> Rasamsonia emersonii <400> 53 Met Leu Ser Ala Phe Leu Phe Ser Ser Pro Thr Leu Ser Ser Pro Gln 1 5 10 15 Ser Ala Ser <210> 54 <211> 2684 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(2684) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 54 atgctttccg cttttctttt ctcttcacca acgctgtcct caccacaaag cgcgtccaaa 60 acagagaaca gcacagcaaa tacaccaggg attcgtctga tcaacggcca tgaacacgtt 120 ctgattcagc cttggggagc agatgggttc cgtgtccggg ccactctgaa cagatttcct 180 gacagtgcgt agccacggaa aacgcatctt gttcatctga ctaatttctt acctgctgat 240 tgacactctg tagatgaagc gtacagcgtc atcatagatc cccctctgga cggcccgcag 300 acctccccat cggcaccagc tacagcacca tcaatgcgac acaaaccgcc accgtgacca 360 acggccatgc ctcggtggtc gtcgacaagg gccagctgag tttctatcgc gtaaatggca 420 acaacagtaa aacactcgtc ttgcaggagc tgtggctaca gacaccggga ttcccagcgc 480 gatggtatca aaagagagat gcaagacggg gctttcgagc gcagttcagc ttcgtcgcgc 540 ccgacagtcc cacggagcgg ctgtttggga cgggccagga tctgacgggc tctctcatca 600 agaagaatca gaccatcgac ttggtcaagt tcaacacgct gaatccgatt ccgacaatcg 660 tgtccgatcg agggtatctg tttttctgga acgtgccttc gcttgggcag atggagttgt 720 ctccaacgag gtatgcatca gcaaaatttg aggaacagga tcatttctaa tgtcaatatt 780 agaaccagtt tcctgagcga tcacacttca gtggtggact attacattgc cattcgcccc 840 gaagccgact atgacggcct gctgcagcgg tacaccagtg tcactgggag atcgcccatg 900 attcctgatt ttggcaccgg atactggcag tgcaagctcc gttatgcgac tcaggaggag 960 ctcctcaatg tgactatggg atttgcagag gtcagaccct ttggaaatga taagactgtt 1020 tctgctgact tgtttgcagc gaaaaatacc tgtttcgatg ttcatcatca actatctcag 1080 ctggtctcac gagggtgact gggctctgaa cgcatcggcg tggccagatc cggcgaagat 1140 ggccgcagag ggtgagaaga gtcatttcta ccaaggtgtt gtagtctgac tggagccgaa 1200 ctgatggcat ccgtctggcc cagtatcgag gacgccagtc ccaactgggc tgaaatgcag 1260 agcttgggtt ttgccgcgca gacattcgat cctctcgata ttgctggcta ctggcagaac 1320 aaatacgtgc atatgatcga tcctaccaat gcagcagcca gggacttcct ctggagtaac 1380 ctttaccggc attactagca gaacgggatc cgaaacttct ggctcgacga agacgaggga 1440 ggccaggtcg cgctcgacgt ctacccgtgg acggactatt acctgggtcc gggggatcag 1500 tatgccatgc tgttccccta ctttcatcag atgggggttt ttgaaggaca gatgaagaca 1560 gtggggtcga ataatgtttc cgctgtgtcc ctgtcgcggt cctcgtgggt gggctcccag 1620 cgtttttgcc ggcgcagtgt ggagtggaga tattttgtat gtgttgcaca cttttcaata 1680 atgtaacctg ctgattctgg tcaacagcgc caactgggat tccatgaaga tgatgatatc 1740 cgcaggacag agcatggcca tgtcagggca gggttggtgg actttggaca ttggaggctt 1800 caagacagac gggcagtcca actcggcgaa tattagcgac ccggagtacc aggaattgtt 1860 tgtacggtgg ctgcagtggt aagcatttga atactccatt tcctgtattg ataagtaata 1920 cgtacagggg aaccttctta ccggtgcgta aatgaatgcc ctgttggcaa ttcaccaact 1980 gaacttgacg tagattatgc gcaaccacgg aatgagaacc tgtctccctt cagcacagga 2040 aggcttcctg acctgtccta gcggtacaga cccgtgccat atttttataa cccaaataag 2100 tatctactga cactgtcaaa cttctagaac cctggagcta cggccccgac aacctcccca 2160 tcatcgtgtc ctacatcaac ctccgataca aactgcagcc ctacatcaag gcgctcttcc 2220 ggatgctctc cgagagtgga cgggcaatga tgcggcccct gtttatggat ttctctctca 2280 gcgatcctta cactttggag gcgacggaag atctgaaatt gcagtacatg tttgggccgc 2340 gcttgctcgt cagtcccgtc acaacgtatc gcgcgacgaa tgcgaccgtc tacctgccaa 2400 aattgccgtc ggatgctccc gatacgaaat ggacgtactg gtggacgaac gagagttttg 2460 acggtggtca atgggtgagt tgtctctctc ttttttgata gccagttgac tgacattaat 2520 ttctcaggtc accgttcctg cgaacaaaag catgtaagta ttcaaatcac gtacacatgc 2580 agcttcgaat tgaaatattc ctgtctgacc tgagctgatc tgcatgcaga attccgctct 2640 tccgactcgg cagcgaagca gacatcttga cgaggaacat ctaa 2684 <210> 55 <211> 2001 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(2001) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 55 atgctttccg cttttctttt ctcttcacca acgctgtcct caccacaaag cgcgtccaaa 60 acagagaaca gcacagcaaa tacaccaggg attcgtctga tcaacggcca tgaacacgtt 120 ctgattcagc cttggggagc agatgggttc cgtgtccggg ccactctgaa cagatttcct 180 gacaatagcg tacagcgtca tcatagatcc ccctctggac ggcccgcaga cctccccatc 240 ggcaccagct acagcaccat caatgcgaca caaaccgcca ccgtgaccaa cggccatgcc 300 tcggtggtcg tcgacaaggg ccagctgagt ttctatcgcg taaatggcaa caacagtaaa 360 acactcgtct tgcaggagct gtggctacag acaccgggat tcccagcgcg atggtatcaa 420 aagagagatg caagacgggg ctttcgagcg cagttcagct tcgtcgcgcc cgacagtccc 480 acggagcggc tgtttgggac gggccaggat ctgacgggct ctctcatcaa gaagaatcag 540 accatcgact tggtcaagtt caacacgctg aatccgattc cgacaatcgt gtccgatcga 600 gggtatctgt ttttctggaa cgtgccttcg cttgggcaga tggagttgtc tccaacgaga 660 accagtttcc tgagcgatca cacttcagtg gtggactatt acattgccat tcgccccgaa 720 gccgactatg acggcctgct gcagcggtac accagtgtca ctgggagatc gcccatgatt 780 cctgattttg gcaccggata ctggcagtgc aagctccgtt atgcgactca ggaggagctc 840 ctcaatgtga ctatgggatt tgcagagcga aaaatacctg tttcgatgtt catcatcaac 900 tatctcagct ggtctcacga gggtgactgg gctctgaacg catcggcgtg gccagatccg 960 gcgaagatgg ccgcagaggc cgaactgatg gcatccgtct ggcccagtat cgaggacgcc 1020 agtcccaact gggctgaaat gcagagcttg ggttttgccg cgcagacatt cgatcctctc 1080 gatattgctg gctactggca gaacaaatac cagaacggga tccgaaactt ctggctcgac 1140 gaagacgagg gaggccaggt cgcgctcgac gtctacccgt ggacggacta ttacctgggt 1200 ccgggggatc agtatgccat gctgttcccc tactttcatc agatgggggt ttttgaagga 1260 cagatgaaga cagtggggtc gaataatgtt tccgctgtgt ccctgtcgcg gtcctccgcc 1320 aactgggatt ccatgaagat gatgatatcc gcaggacaga gcatggccat gtcagggcag 1380 ggttggtgga ctttggacat tggaggcttc aagacagacg ggcagtccaa ctcggcgaat 1440 attagcgacc cggagtacca ggaattgttt gtacggtggc tgcagtgggg aaccttctta 1500 ccgattatgc gcaaccacgg aatgagaacc tgtctccctt cagcacagga aggcttcctg 1560 acctgtccta gcgaaccctg gagctacggc cccgacaacc tccccatcat cgtgtcctac 1620 atcaacctcc gatacaaact gcagccctac atcaaggcgc tcttccggat gctctccgag 1680 agtggacggg caatgatgcg gcccctgttt atggatttct ctctcagcga tccttacact 1740 ttggaggcga cggaagatct gaaattgcag tacatgtttg ggccgcgctt gctcgtcagt 1800 cccgtcacaa cgtatcgcgc gacgaatgcg accgtctacc tgccaaaatt gccgtcggat 1860 gctcccgata cgaaatggac gtactggtgg acgaacgaga gttttgacgg tggtcaatgg 1920 gtcaccgttc ctgcgaacaa aagcataatt ccgctcttcc gactcggcag cgaagcagac 1980 atcttgacga ggaacatcta a 2001 <210> 56 <211> 840 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(840) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 56 atgcagatgc tcctcttgtt gctcctcctc cttcctccca gcctttgcgc tatcatcaag 60 ggtatctccg ctcctctcct tgcccgtctg acccagatgg ccaccctctg catgagcacc 120 tacctgaacg acctttgcat tgttcccggt ggtatgacca agatctccga catcaccaac 180 tccaccactg atgtccacgg ctggatcctg cgtgatgatg gtgcccgtga gatcctggcg 240 gtgttccgtg gtaccgagtc cctccagaac tacgccaccg acaccaacta caccctggct 300 cccttcgaca tcttccccca gtgcgaaggc tgcgaggtcc acggtggata ctaccttgcc 360 tgggtgtcga ttgtcgagca ggtccaggct cgcctgcagg agcagaaggc cctcttcccc 420 gactacggtg ttgtcttgac tggccactcc ctcggtggct ccctggctgc tcttgctgct 480 gcccagttct ctcctctctt cgacaacatc accgtctaca ccatgggtga gcctcgcact 540 ggcaacgccg ccttcgcctc cttcattgac cagcgttaca gcacttcttc tcccgagact 600 acccgcttct accgctgcac ccacgccgat gacggtatcc ccaacgctcc tcccacctcc 660 gacggctacg tccaccacgg tctggaatac tggaacctcg accccacttc tgctgagaac 720 acctacgtgt gcactgagga tggtgccgtc cagtgctgcg aagcgcagaa cggcagcggt 780 atcaacgctg cccacctggt ctacttcggc cgccccgttg ttgttggtgg ccagtgtctg 840 <210> 57 <211> 233 <212> PRT <213> Rasamsonia emersonii <400> 57 Ala Ile Ile Lys Gly Ile Ser Ala Pro Leu Leu Ala Arg Leu Thr Gln 1 5 10 15 Met Ala Thr Leu Cys Met Ser Thr Tyr Leu Asn Asp Leu Cys Ile Val 20 25 30 Pro Gly Gly Met Thr Lys Ile Ser Asp Ile Thr Asn Ser Thr Thr Asp 35 40 45 Val His Gly Trp Ile Leu Arg Asp Asp Gly Ala Arg Glu Ile Leu Ala 50 55 60 Val Phe Arg Gly Thr Glu Ser Leu Gln Asn Tyr Ala Thr Asp Thr Asn 65 70 75 80 Tyr Thr Leu Ala Pro Phe Asp Ile Phe Pro Gln Cys Glu Gly Cys Glu 85 90 95 Val His Gly Gly Tyr Tyr Leu Ala Trp Val Ser Ile Val Glu Gln Val 100 105 110 Gln Ala Arg Leu Gln Glu Gln Lys Ala Leu Phe Pro Asp Tyr Gly Val 115 120 125 Val Leu Thr Gly His Ser Leu Gly Gly Ser Leu Ala Ala Leu Ala Ala 130 135 140 Ala Gln Phe Ser Pro Leu Phe Asp Asn Ile Thr Val Tyr Thr Met Gly 145 150 155 160 Glu Pro Arg Thr Gly Asn Ala Ala Phe Ala Ser Phe Ile Asp Gln Arg 165 170 175 Tyr Ser Thr Ser Ser Pro Glu Thr Thr Arg Phe Tyr Arg Cys Thr His 180 185 190 Ala Asp Asp Gly Ile Pro Asn Ala Pro Pro Thr Ser Asp Gly Tyr Val 195 200 205 His His Gly Leu Glu Tyr Trp Asn Leu Asp Pro Thr Ser Ala Glu Asn 210 215 220 Thr Phe Pro Met Asn Gly Gln Leu Ser 225 230 <210> 58 <211> 20 <212> PRT <213> Rasamsonia emersonii <400> 58 Met Gln Met Leu Leu Leu Leu Leu Leu Leu Leu Pro Pro Ser Leu Cys 1 5 10 15 Ala Ile Ile Lys 20 <210> 59 <211> 1100 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(1100) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 59 atgcaaacgc aaatgcaaat gctcctacta ctcctgctgc tactaccacc ctccctctgc 60 gccatcatca aaggcatctc cgcccccctc ctagcccgcc taacccagat ggccacgctc 120 tgcatgtcca cctacctcaa cgacctgtgc atcgtgcccg gggggatgac caagatcagc 180 gacatcacca acagcacaac cgacgtgcac ggctggatcc tgcgcgacga cggcgcgcgc 240 gagatcctcg ccgtgttccg cggcaccgag tcgctgcaga actacgcgac ggatacgaac 300 tacacgcttg cgccgttcga cattttcccg cagtgtgagg gctgtgaggt ccatggcggg 360 tactatctcg cctgggtatc gattgtcgag caggtgcagg ctcgtctgca ggagcagaag 420 gcgctgtttc cggattatgg ggttgttttg acggggcata ggtatgcata tacccaccta 480 acctaggtat aaatatactg tctgtgtata gatactgact tgatatatag tcttggaggc 540 tccctcgccg cgctggccgc agcacagttc tctcccctct tcgacaacat caccgtgtac 600 acaatgggcg agcctcgcac cggcaacgcc gccttcgcgt ccttcatcga ccagcgctac 660 agcacgtcct cgcccgagac gacgcggttc taccggtgca cgcacgcgga cgacggcatc 720 cccaatgcgc cgccgacgtc ggacgggtat gtgcaccacg ggctggagta ctggaacttg 780 gacccgacga gtgcggagaa tacgtatgtc tgtacggagg acggggcggt gcagtgctgc 840 gaggcgcaga atgggtcggg tatcaatgct gctcatctgg tgtattttgg tcggccggtt 900 gtggtggggg ggcagtgtct ttaaatagta ttgagaaggg gaatcaacag gctggatggg 960 atcagatttg gatattcacg aggactaaca ttagctgatg ggtgtacata caggacattt 1020 atataaatga ccgcagatcg aaatcaatca actaataact acagacgtgt aggtttccta 1080 tgaacggtca actatcttag 1100 <210> 60 <211> 843 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(843) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 60 atgcaaatgc tcctactact cctgctgcta ctaccaccct ccctctgcgc catcatcaaa 60 ggcatctccg cccccctcct agcccgccta acccagatgg ccacgctctg catgtccacc 120 tacctcaacg acctgtgcat cgtgcccggg gggatgacca agatcagcga catcaccaac 180 agcacaaccg acgtgcacgg ctggatcctg cgcgacgacg gcgcgcgcga gatcctcgcc 240 gtgttccgcg gcaccgagtc gctgcagaac tacgcgacgg atacgaacta cacgcttgcg 300 ccgttcgaca ttttcccgca gtgtgagggc tgtgaggtcc atggcgggta ctatctcgcc 360 tgggtatcga ttgtcgagca ggtgcaggct cgtctgcagg agcagaaggc gctgtttccg 420 gattatgggg ttgttttgac ggggcatagt cttggaggct ccctcgccgc gctggccgca 480 gcacagttct ctcccctctt cgacaacatc accgtgtaca caatgggcga gcctcgcacc 540 ggcaacgccg ccttcgcgtc cttcatcgac cagcgctaca gcacgtcctc gcccgagacg 600 acgcggttct accggtgcac gcacgcggac gacggcatcc ccaatgcgcc gccgacgtcg 660 gacgggtatg tgcaccacgg gctggagtac tggaacttgg acccgacgag tgcggagaat 720 acgtatgtct gtacggagga cggggcggtg cagtgctgcg aggcgcagaa tgggtcgggt 780 atcaatgctg ctcatctggt gtattttggt cggccggttg tggtgggggg gcagtgtctt 840 taa 843 <210> 61 <211> 1374 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(1374) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 61 atgaagtcgc tggtctacgc tctttgcttc gcctccgccg ttgctgcctc caacagcact 60 ggtactgcca ctgttgacct caacgtcaag cgtggacctc cctcccacct tgcctccgga 120 ttcatctacg gcattcctga cacccccaac caggttcctg ctcactggta caccgacatg 180 ggtttccgct acggccgtgc tggtggtgct cagcttggtg ctcctgctcg tggctggatt 240 tggggtattg atgaatacca gggccgtctg aactcgaccc tcagcaacta ccgcacctgc 300 cgtcagtacg gtgccgactt catcatcctc ccccacgaca tctggggtac cgaccacgcc 360 aacgacagca ccatctggcc tggtgacaac ggtgactgga ctgactacga caacttcatc 420 cgccgtctga tggccgatct caaggccaac aacgccttgg atggcctggt ctgggatgtc 480 tggaacgagc ctgacatctc catcttctgg actcgctctc agcagcagtg gattgatctc 540 tacatccgca cccacaagct cctccgccag gatcctgact tcgaccgcgt gcagatctct 600 ggccccaccc tagcgttccg tcccttcccc aacaacacct ggtggaccaa ctggttggat 660 cagattgctg gcaaccagac cattcccgat cagtacgcct accacctcga gggtgacccc 720 agcagccccg atgatgacct gcagaacacc aacgcctccc tggctgccat gctgcagacc 780 taccgcctcc cctctcgcca gatcaacatc aacgagtacg ccaccttcgc tgagcagatc 840 cccgccggtg ctgcctggtg gatctcccgt cttgagcgct acgaggccta cggcctgcgt 900 ggcaactggc agtccggcac catgctccac gacctcttcg ccaacctcct caccaagaag 960 tccgacccct ccaactacac tgccaccgac tacgtgtctg ctcctgaata ccccgtctac 1020 cgctactact accgcaacat gactggccag cgtgtgcaga ccactggatc cgaggaccgt 1080 ctgttggatg tctacgctac tgttgacaag gacaaggtcc gtatcctggc tggtgtccgt 1140 ctggccactg gtacctggca ggtcaccgtc aacagccttt ctgctgttgg attgccctcc 1200 gctggtaccc tcaacatcca gacctggggt ttcgatggtg actccgtctg ggaagaggtt 1260 gaccgccccg aggatcttgg tgtcactgct cacacctact ctggcgactc cgtcaccttc 1320 cccatctacc agaccgacaa ccacaccgcc tgggcgttcg agttcgatgt agct 1374 <210> 62 <211> 442 <212> PRT <213> Rasamsonia emersonii <400> 62 Ser Asn Ser Thr Gly Thr Ala Thr Val Asp Leu Asn Val Lys Arg Gly 1 5 10 15 Pro Pro Ser His Leu Ala Ser Gly Phe Ile Tyr Gly Ile Pro Asp Thr 20 25 30 Pro Asn Gln Val Pro Ala His Trp Tyr Thr Asp Met Gly Phe Arg Tyr 35 40 45 Gly Arg Ala Gly Gly Ala Gln Leu Gly Ala Pro Ala Arg Gly Trp Ile 50 55 60 Trp Gly Ile Asp Glu Tyr Gln Gly Arg Leu Asn Ser Thr Leu Ser Asn 65 70 75 80 Tyr Arg Thr Cys Arg Gln Tyr Gly Ala Asp Phe Ile Ile Leu Pro His 85 90 95 Asp Ile Trp Gly Thr Asp His Ala Asn Asp Ser Thr Ile Trp Pro Gly 100 105 110 Asp Asn Gly Asp Trp Thr Asp Tyr Asp Asn Phe Ile Arg Arg Leu Met 115 120 125 Ala Asp Leu Lys Ala Asn Asn Ala Leu Asp Gly Leu Val Trp Asp Val 130 135 140 Trp Asn Glu Pro Asp Ile Ser Ile Phe Trp Thr Arg Ser Gln Gln Gln 145 150 155 160 Trp Ile Asp Leu Tyr Ile Arg Thr His Lys Leu Leu Arg Gln Asp Pro 165 170 175 Asp Phe Asp Arg Val Gln Ile Ser Gly Pro Thr Leu Ala Phe Arg Pro 180 185 190 Phe Pro Asn Asn Thr Trp Trp Thr Asn Trp Leu Asp Gln Ile Ala Gly 195 200 205 Asn Gln Thr Ile Pro Asp Gln Tyr Ala Tyr His Leu Glu Gly Asp Pro 210 215 220 Ser Ser Pro Asp Asp Asp Leu Gln Asn Thr Asn Ala Ser Leu Ala Ala 225 230 235 240 Met Leu Gln Thr Tyr Arg Leu Pro Ser Arg Gln Ile Asn Ile Asn Glu 245 250 255 Tyr Ala Thr Phe Ala Glu Gln Ile Pro Ala Gly Ala Ala Trp Trp Ile 260 265 270 Ser Arg Leu Glu Arg Tyr Glu Ala Tyr Gly Leu Arg Gly Asn Trp Gln 275 280 285 Ser Gly Thr Met Leu His Asp Leu Phe Ala Asn Leu Leu Thr Lys Lys 290 295 300 Ser Asp Pro Ser Asn Tyr Thr Ala Thr Asp Tyr Val Ser Ala Pro Glu 305 310 315 320 Tyr Pro Val Tyr Arg Tyr Tyr Tyr Arg Asn Met Thr Gly Gln Arg Val 325 330 335 Gln Thr Thr Gly Ser Glu Asp Arg Leu Leu Asp Val Tyr Ala Thr Val 340 345 350 Asp Lys Asp Lys Val Arg Ile Leu Ala Gly Val Arg Leu Ala Thr Gly 355 360 365 Thr Trp Gln Val Thr Val Asn Ser Leu Ser Ala Val Gly Leu Pro Ser 370 375 380 Ala Gly Thr Leu Asn Ile Gln Thr Trp Gly Phe Asp Gly Asp Ser Val 385 390 395 400 Trp Glu Glu Val Asp Arg Pro Glu Asp Leu Gly Val Thr Ala His Thr 405 410 415 Tyr Ser Gly Asp Ser Val Thr Phe Pro Ile Tyr Gln Thr Asp Asn His 420 425 430 Thr Ala Trp Ala Phe Glu Phe Asp Val Ala 435 440 <210> 63 <211> 16 <212> PRT <213> Rasamsonia emersonii <400> 63 Met Lys Ser Leu Val Tyr Ala Leu Cys Phe Ala Ser Ala Val Ala Ala 1 5 10 15 <210> 64 <211> 1377 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(1377) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 64 atgaaaagtc tggtctatgc cctgtgcttc gccagcgctg ttgctgctag caacagcaca 60 ggcacggcga cagtcgacct caatgtcaag cgtggcccgc cctctcacct cgcttcaggc 120 ttcatctacg gcatccccga tacccccaac caggtccccg cccactggta caccgacatg 180 ggcttccgat acggccgcgc aggcggtgcg cagctagggg cccccgcgcg aggctggatc 240 tggggcatcg acgagtacca gggccgtctc aactcgaccc tgtcgaatta ccgcacctgt 300 cgtcagtacg gcgccgactt tatcatcttg ccgcacgaca tctggggcac cgaccacgcc 360 aacgactcaa caatctggcc cggcgacaac ggcgactgga ccgactacga caacttcatc 420 cgccgactga tggccgacct gaaggcgaac aacgccctgg acggcctcgt ctgggatgtt 480 tggaacgagc ccgacatctc catcttctgg acgcgcagcc agcagcagtg gatcgatctg 540 tacatccgca cgcacaagct tctccggcag gaccccgact ttgaccgtgt tcagatctca 600 ggtcccaccc tggccttccg tcccttcccc aacaatacct ggtggacgaa ctggctggac 660 cagattgcag gtaaccagac tatcccggac cagtacgcct atcatctgga gggcgatcca 720 tcctcgccgg atgatgacct ccagaacacc aacgcgtccc tggcggcgat gctgcagacg 780 taccggcttc cgtcgcggca gatcaacatc aacgagtacg cgacattcgc agagcagatt 840 cccgcaggcg cggcatggtg gatctcccgg ctcgagcgct atgaggcgta cgggctgcgc 900 gggaactggc agagcggaac catgctgcat gatctttttg ctaatctcct gaccaagaag 960 tcggaccctt ccaactacac ggcgacagac tacgtatcgg cgccggagta cccggtgtac 1020 aggtactact accggaacat gacaggccag cgggtgcaga cgacgggctc cgaggatcgc 1080 ctgctggacg tgtatgccac tgtcgacaag gacaaggtgc gtatcttggc gggtgtgcgc 1140 ctggccactg gcacctggca agtcacggtc aattcactca gcgccgtggg cctacccagt 1200 gcggggacgt tgaacatcca gacctggggt tttgatggag actcggtgtg ggaggaggtc 1260 gaccgtccag aggatcttgg tgttaccgcg catacctaca gcggggattc ggtgacgttt 1320 ccaatctacc agacggacaa tcatacggcg tgggcatttg aattcgacgt tgcttga 1377 <210> 65 <211> 1377 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(1377) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 65 atgaaaagtc tggtctatgc cctgtgcttc gccagcgctg ttgctgctag caacagcaca 60 ggcacggcga cagtcgacct caatgtcaag cgtggcccgc cctctcacct cgcttcaggc 120 ttcatctacg gcatccccga tacccccaac caggtccccg cccactggta caccgacatg 180 ggcttccgat acggccgcgc aggcggtgcg cagctagggg cccccgcgcg aggctggatc 240 tggggcatcg acgagtacca gggccgtctc aactcgaccc tgtcgaatta ccgcacctgt 300 cgtcagtacg gcgccgactt tatcatcttg ccgcacgaca tctggggcac cgaccacgcc 360 aacgactcaa caatctggcc cggcgacaac ggcgactgga ccgactacga caacttcatc 420 cgccgactga tggccgacct gaaggcgaac aacgccctgg acggcctcgt ctgggatgtt 480 tggaacgagc ccgacatctc catcttctgg acgcgcagcc agcagcagtg gatcgatctg 540 tacatccgca cgcacaagct tctccggcag gaccccgact ttgaccgtgt tcagatctca 600 ggtcccaccc tggccttccg tcccttcccc aacaatacct ggtggacgaa ctggctggac 660 cagattgcag gtaaccagac tatcccggac cagtacgcct atcatctgga gggcgatcca 720 tcctcgccgg atgatgacct ccagaacacc aacgcgtccc tggcggcgat gctgcagacg 780 taccggcttc cgtcgcggca gatcaacatc aacgagtacg cgacattcgc agagcagatt 840 cccgcaggcg cggcatggtg gatctcccgg ctcgagcgct atgaggcgta cgggctgcgc 900 gggaactggc agagcggaac catgctgcat gatctttttg ctaatctcct gaccaagaag 960 tcggaccctt ccaactacac ggcgacagac tacgtatcgg cgccggagta cccggtgtac 1020 aggtactact accggaacat gacaggccag cgggtgcaga cgacgggctc cgaggatcgc 1080 ctgctggacg tgtatgccac tgtcgacaag gacaaggtgc gtatcttggc gggtgtgcgc 1140 ctggccactg gcacctggca agtcacggtc aattcactca gcgccgtggg cctacccagt 1200 gcggggacgt tgaacatcca gacctggggt tttgatggag actcggtgtg ggaggaggtc 1260 gaccgtccag aggatcttgg tgttaccgcg catacctaca gcggggattc ggtgacgttt 1320 ccaatctacc agacggacaa tcatacggcg tgggcatttg aattcgacgt tgcttga 1377 <210> 66 <211> 1425 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(1425) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 66 atgatctccc tgctggccct tgctgctgtt cccatccccg tcctctctgc tccctcccgc 60 ccccacgctc acatctccgt caacacccag actcgcttcc agcaggttga cggcttcggt 120 ttcagcgaag cgttccagcg tgctgaggat atctacggca aggacggtct ttctcctgag 180 aaccgtaccc gtgtcctcga cctcctcttc tccgacaccc acggtgctgg tctgaccatt 240 gtccgcaacg gcattggcag cagcaacagc agcatcaagg acttcatgaa ctccattgag 300 cccttctccc ccggctcccc ctctgctcct cctcactacg tgtgggaccg caacgactct 360 ggccaggtct ggctatccca cgaagccgcc tcctacggtg tcaacacctt ctacgccgat 420 gcctggtccg ctcctggata catgaaaacc aacgatgatg actccaacgg tggatacctc 480 tgcggtgtca ccaacacttc ttgcgcttcc ggtgactgga agcaggccta cgccaactac 540 cttgttcagt acgtgcgctt ctaccagcag gtcggtatca aggtcaccca cctcggattc 600 ctgaacgagc cccaggaaga tgtcacctac gcctccatgc tctccgacgg cacccaggct 660 gccgacttca tcaaggtcct tgcccccacc gtcaaggccg ccggtctgga tgtcaagctc 720 acctgctgcg atggtgttgg ctgggaggag cagcgtgcca tgcttcctgg tctgcaggct 780 ggtggtcccg agcactccgc tgagagctac ctgtccgtca tcactgctca cggatacaac 840 agccctccca ccactcctct cgagacttct ctgcccgtgt ggatgactga atgggcggat 900 ctcaacggca actacactgc tgcctggtac gagaacggcg ctgctggtga aggcttgacc 960 tgggccaacc gtatccagga tgccttcacc cgctccaacg tgtctgcttt cctgcactgg 1020 attggtgctg agaacggcac cagcaactcg cctctgatca acctcaacgg tgacagctac 1080 gtggccacca agcgtctgtg ggcgttcggc cagttctccc gcttcgtccg tcccggtgcc 1140 gtccgtatcg atgccgtttc ctccgactct ttagtgaccg tttccgcttt ccagaacaag 1200 gacaacggtg ttgttgccac tcaggccatc aacaacgccg acaccgacta cgaggttgag 1260 gttgagttga ctggctacgg tcctgtctcc gtcatccagc cctacctcac caacaacgag 1320 aacgacctcg aggcctccaa gcccatcatt gctctcgccg tcggtgctgc caccaagttc 1380 acctccatcg tccccgcccg ctctcttgtc tccttcgtat ctaag 1425 <210> 67 <211> 459 <212> PRT <213> Rasamsonia emersonii <400> 67 Ala Pro Ser Arg Pro His Ala His Ile Ser Val Asn Thr Gln Thr Arg 1 5 10 15 Phe Gln Gln Val Asp Gly Phe Gly Phe Ser Glu Ala Phe Gln Arg Ala 20 25 30 Glu Asp Ile Tyr Gly Lys Asp Gly Leu Ser Pro Glu Asn Arg Thr Arg 35 40 45 Val Leu Asp Leu Leu Phe Ser Asp Thr His Gly Ala Gly Leu Thr Ile 50 55 60 Val Arg Asn Gly Ile Gly Ser Ser Asn Ser Ser Ile Lys Asp Phe Met 65 70 75 80 Asn Ser Ile Glu Pro Phe Ser Pro Gly Ser Pro Ser Ala Pro Pro His 85 90 95 Tyr Val Trp Asp Arg Asn Asp Ser Gly Gln Val Trp Leu Ser His Glu 100 105 110 Ala Ala Ser Tyr Gly Val Asn Thr Phe Tyr Ala Asp Ala Trp Ser Ala 115 120 125 Pro Gly Tyr Met Lys Thr Asn Asp Asp Asp Ser Asn Gly Gly Tyr Leu 130 135 140 Cys Gly Val Thr Asn Thr Ser Cys Ala Ser Gly Asp Trp Lys Gln Ala 145 150 155 160 Tyr Ala Asn Tyr Leu Val Gln Tyr Val Arg Phe Tyr Gln Gln Val Gly 165 170 175 Ile Lys Val Thr His Leu Gly Phe Leu Asn Glu Pro Gln Glu Asp Val 180 185 190 Thr Tyr Ala Ser Met Leu Ser Asp Gly Thr Gln Ala Ala Asp Phe Ile 195 200 205 Lys Val Leu Ala Pro Thr Val Lys Ala Ala Gly Leu Asp Val Lys Leu 210 215 220 Thr Cys Cys Asp Gly Val Gly Trp Glu Glu Gln Arg Ala Met Leu Pro 225 230 235 240 Gly Leu Gln Ala Gly Gly Pro Glu His Ser Ala Glu Ser Tyr Leu Ser 245 250 255 Val Ile Thr Ala His Gly Tyr Asn Ser Pro Pro Thr Thr Pro Leu Glu 260 265 270 Thr Ser Leu Pro Val Trp Met Thr Glu Trp Ala Asp Leu Asn Gly Asn 275 280 285 Tyr Thr Ala Ala Trp Tyr Glu Asn Gly Ala Ala Gly Glu Gly Leu Thr 290 295 300 Trp Ala Asn Arg Ile Gln Asp Ala Phe Thr Arg Ser Asn Val Ser Ala 305 310 315 320 Phe Leu His Trp Ile Gly Ala Glu Asn Gly Thr Ser Asn Ser Pro Leu 325 330 335 Ile Asn Leu Asn Gly Asp Ser Tyr Val Ala Thr Lys Arg Leu Trp Ala 340 345 350 Phe Gly Gln Phe Ser Arg Phe Val Arg Pro Gly Ala Val Arg Ile Asp 355 360 365 Ala Val Ser Ser Asp Ser Leu Val Thr Val Ser Ala Phe Gln Asn Lys 370 375 380 Asp Asn Gly Val Val Ala Thr Gln Ala Ile Asn Asn Ala Asp Thr Asp 385 390 395 400 Tyr Glu Val Glu Val Glu Leu Thr Gly Tyr Gly Pro Val Ser Val Ile 405 410 415 Gln Pro Tyr Leu Thr Asn Asn Glu Asn Asp Leu Glu Ala Ser Lys Pro 420 425 430 Ile Ile Ala Leu Ala Val Gly Ala Ala Thr Lys Phe Thr Ser Ile Val 435 440 445 Pro Ala Arg Ser Leu Val Ser Phe Val Ser Lys 450 455 <210> 68 <211> 16 <212> PRT <213> Rasamsonia emersonii <400> 68 Met Ile Ser Leu Leu Ala Leu Ala Ala Val Pro Ile Pro Val Leu Ser 1 5 10 15 <210> 69 <211> 1428 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(1428) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 69 atgatctctc tcctcgcgtt ggccgctgtg ccaattcctg tcctgtccgc cccgtctaga 60 cctcacgccc acatctccgt caatacacaa acccgcttcc agcaggtcga cggattcggc 120 ttctccgagg ccttccagcg cgcagaggac atctacggca aggatggctt gtcgcccgag 180 aaccgcacca gagtgctcga tctcctgttc agcgacaccc atggcgccgg cctgaccatc 240 gtccgcaatg gcatcggctc cagcaatagc tccatcaagg acttcatgaa ctccatcgag 300 cccttcagtc ccggctcgcc gtctgcgccg ccgcactacg tctgggaccg caacgacagc 360 ggccaggtgt ggctgtccca cgaagcggcc tcgtatggcg tcaacacgtt ctatgccgac 420 gcctggtctg ctcccggtta catgaagacc aacgacgacg actccaacgg cgggtacctg 480 tgcggcgtga ccaacacgtc ctgcgcctcc ggggactgga agcaggccta cgccaactac 540 ctcgtccagt acgtccggtt ctaccaacag gtcggcatca aggtcaccca cctgggtttc 600 ctgaacgagc cccaggaaga cgtcacctat gccagcatgc tgtcggacgg cacccaggcg 660 gccgacttca tcaaagttct agcacccacc gtcaaggcgg caggactcga cgtcaagctc 720 acctgctgcg acggcgtcgg gtgggaggag cagcgagcga tgctgccggg cctccaggct 780 ggaggtcccg agcacagcgc ggaaagctat ctgtctgtga tcaccgccca tggctacaac 840 tccccgccca caacgcctct tgagacctcg ttgccagtgt ggatgaccga gtgggccgat 900 ctgaatggga actatacggc cgcctggtac gagaacggcg ccgccggcga gggtctgacc 960 tgggcgaacc gcatccaaga cgccttcacg cggagcaacg tcagcgcctt tctgcactgg 1020 atcggagcgg agaatggcac gagcaacagc cctctcatca acctgaacgg cgattcgtat 1080 gtcgcgacca agcggctgtg ggcgttcggc cagttcagtc gattcgtccg gccgggtgcc 1140 gtccgcatcg acgcggtcag ttcggactcc ttggtcacgg tgagcgcgtt ccagaacaag 1200 gataacggcg tggtggccac gcaggccatc aacaatgccg acacagacta tgaggtcgag 1260 gtggagttga cgggttatgg acccgtgtcc gttatccagc cgtatctgac gaacaatgaa 1320 aacgacctgg aagcctccaa gccgatcatc gcgcttgctg ttggggcagc aaccaagttc 1380 acgagtatcg ttccggcgag gtccttggtt agtttcgtaa gtaaatag 1428 <210> 70 <211> 1428 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(1428) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 70 atgatctctc tcctcgcgtt ggccgctgtg ccaattcctg tcctgtccgc cccgtctaga 60 cctcacgccc acatctccgt caatacacaa acccgcttcc agcaggtcga cggattcggc 120 ttctccgagg ccttccagcg cgcagaggac atctacggca aggatggctt gtcgcccgag 180 aaccgcacca gagtgctcga tctcctgttc agcgacaccc atggcgccgg cctgaccatc 240 gtccgcaatg gcatcggctc cagcaatagc tccatcaagg acttcatgaa ctccatcgag 300 cccttcagtc ccggctcgcc gtctgcgccg ccgcactacg tctgggaccg caacgacagc 360 ggccaggtgt ggctgtccca cgaagcggcc tcgtatggcg tcaacacgtt ctatgccgac 420 gcctggtctg ctcccggtta catgaagacc aacgacgacg actccaacgg cgggtacctg 480 tgcggcgtga ccaacacgtc ctgcgcctcc ggggactgga agcaggccta cgccaactac 540 ctcgtccagt acgtccggtt ctaccaacag gtcggcatca aggtcaccca cctgggtttc 600 ctgaacgagc cccaggaaga cgtcacctat gccagcatgc tgtcggacgg cacccaggcg 660 gccgacttca tcaaagttct agcacccacc gtcaaggcgg caggactcga cgtcaagctc 720 acctgctgcg acggcgtcgg gtgggaggag cagcgagcga tgctgccggg cctccaggct 780 ggaggtcccg agcacagcgc ggaaagctat ctgtctgtga tcaccgccca tggctacaac 840 tccccgccca caacgcctct tgagacctcg ttgccagtgt ggatgaccga gtgggccgat 900 ctgaatggga actatacggc cgcctggtac gagaacggcg ccgccggcga gggtctgacc 960 tgggcgaacc gcatccaaga cgccttcacg cggagcaacg tcagcgcctt tctgcactgg 1020 atcggagcgg agaatggcac gagcaacagc cctctcatca acctgaacgg cgattcgtat 1080 gtcgcgacca agcggctgtg ggcgttcggc cagttcagtc gattcgtccg gccgggtgcc 1140 gtccgcatcg acgcggtcag ttcggactcc ttggtcacgg tgagcgcgtt ccagaacaag 1200 gataacggcg tggtggccac gcaggccatc aacaatgccg acacagacta tgaggtcgag 1260 gtggagttga cgggttatgg acccgtgtcc gttatccagc cgtatctgac gaacaatgaa 1320 aacgacctgg aagcctccaa gccgatcatc gcgcttgctg ttggggcagc aaccaagttc 1380 acgagtatcg ttccggcgag gtccttggtt agtttcgtaa gtaaatag 1428 <210> 71 <211> 3036 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(3036) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 71 atgatcctga gctctctcct cgtcggctgc gtatctctct ggggtgctgc ccacgccctt 60 ggccagcagc ccgttgttgc cttcacctcc tcccccggat acctcaagct ggctggcccc 120 ggtactcctc ccggtaccgt tgtcctcgac tctgccgact ggcccgctgt cctgcgtgct 180 gccggtgatc ttgctgtcga cttcggtcgt gtcaccggca ccaacctgac caagactgtc 240 atcaacggta ccaccaccag ctccggtctt gctgctgttt ccaacaaggg ccccgtcatc 300 attgctggta ccattggtaa cagcagcttg atcaacgccc ttgcccagtc cggcaagatc 360 gatgtctccg ccactgaggg ccgctgggag gctttccaga ccgagattgt ggacaacccc 420 ttcccaggga tatctcgtgc tctggtcgtt tccggctccg accgtcgtgg aactgtctac 480 ggcttgtacg acatctccga gcagatcggt gtctccccct ggtactggtt cgccgatgtt 540 cctcctgctc agcacgagga gatctacgcc ctggacacca agaagatcca gggttccccc 600 tccgtcaagt accgtggtct gttcatcaac gacgaggctc ccgccctcac caactggatc 660 aacgtcaact accctccttg caagtacggt cctggcttca acgccgactt ctacgcccac 720 gttttcgagc tcttgctgcg cctccgtgcc aactacctct ggcctgctga atggagcaac 780 atcttcgccc ttgacgaccc ccgcaacttc cctactgccg atctctacgg cattgtcatt 840 ggcacctccc acaccgagcc cttgatgcgc tggaccctgg aacaatcgct actactccag 900 ggcccttgga actggctgac caacgagaag aacatctacc agttcctcaa ggaaggtgtt 960 gagcgctcca agaactacga agtcatctac accatgggta tgcgtggtct tggtgacact 1020 gcctccccca ccatcaacgc caccactctg gctcagatcg tcgctgctga ggagcagatc 1080 ctctccgagg tgttcaacac caccaacatc tcctggatcc cccagatgtg gtgcctctac 1140 aaggaagtcg gtggttacta cgaggatggt ctgcgtgttg ccgatgacat cactctcctc 1200 tgggctgatg acaactgggg taacattgag agacttccca tcggtaacga gactgctcgc 1260 tccggtggtg ctggtgtcta ctaccacttc gactacgtcg gtgaccccca ggactacaag 1320 tggatcaaca ccatctccct ccagaaaacc tgggagcaga tgcacctggc ctacgagcgt 1380 caggctcgca acatctggat tgtcaacgtt ggtgacctga aggcccttga gatccccacc 1440 aaccacttct tcgaccttgc ctacgacacc cccagctggt cagatcccga cagcacctcc 1500 cgctggctca agctctgggc tactcgtgag ttcggtgctg ctggtgccga caaggtcgcc 1560 gatatcgtca accgctacgg ccagtacgct gcccgtcgca agttcgagat gatcaccccc 1620 tccaccttct ccatcatcaa ctacaacgag gccaacaacg tcgtgtctca gtgggaatct 1680 ctggtcaacg acgcccgtga tgtctaccgt ggcctgtccg aggctgctcg tcccgccttc 1740 ttcgagctgg tcctccagcc ctgcatggct ggtcacatca tcacccagat ccacgtcact 1800 gctgccaaga acaacctgta cgcctcccag cgccgcactt ccgccaaggc catggccgat 1860 aaggccctga agcttttcaa ggaagatcac gacctcaccg tgagctacca caagattctt 1920 gacggcaagt ggaaccacat catggaccag acccacctgg gctacctcta ctggcagcag 1980 cccatgcgca acaccctccc tcccctccag tacacccagc tgttggaaga ttcgctagcg 2040 ggacctatgg gtgtttccgt tgagggcagc aacgcctccg ttcccggtga tgaccagtac 2100 cacgctctct ccagcaccac cttgactctt cctcccattg acccctacgg cccttctact 2160 cgttggattg agatctactc tcgctcgacc gagtccttcg agttccagat atctcccaat 2220 gtcagctggg tgaccgccac tcccagctct ggcactgtcc acgtttctgg caacggcacc 2280 accaccgatg ttcgcgttca gctctccgtt gactgggaca aggctcccat tggaagctct 2340 ctcgtcagca tcaacgtttc catccccact ggccacttcc ccaccggtga ttacggtaac 2400 tccgccatgc ccgtcgtcca gctccccgtc aacaagactg ttgttcctgc ttctttccac 2460 ggtttcgtgg aatcggatgg tgtcgtttct atcgaagctc ctcacgccac ccgcaacacc 2520 agcactgcca acgtcagcta cgccgtcatc cccggctacg gccgcaccct gtccggtgtc 2580 accctcctgc ctgtcaacgc cccctcccag aaggctcctt cttcccctcg tctggagtac 2640 gacatgtacc tcttctctcc cgccgccaac ggatcgaccg tcaacatcac cctctacctc 2700 ggtccctccc tgaacgtcaa ccccgaccgc cctctccgtt acgctcttgc tttcgatgac 2760 gatgacaacc cccaggttgt ccagtacgtg cccagcaccg tcctcggcac ctacccacct 2820 gactggccct ctgctgtctc caacaatgtg tgggcctcca ccacctccta caccatcaag 2880 ggtttcaacg gcaactccac ttctgccact ggcaccggtt ccgctcacac tctcaagctg 2940 tgggctctgg agcccggtgt tgttttcgag aagatcgtca ttgaccttgg tggtcagcgt 3000 gacagctacc ttggtcctcc tgagtccagg atagta 3036 <210> 72 <211> 991 <212> PRT <213> Rasamsonia emersonii <400> 72 Gln Gln Pro Val Val Ala Phe Thr Ser Ser Pro Gly Tyr Leu Lys Leu 1 5 10 15 Ala Gly Pro Gly Thr Pro Pro Gly Thr Val Val Leu Asp Ser Ala Asp 20 25 30 Trp Pro Ala Val Leu Arg Ala Ala Gly Asp Leu Ala Val Asp Phe Gly 35 40 45 Arg Val Thr Gly Thr Asn Leu Thr Lys Thr Val Ile Asn Gly Thr Thr 50 55 60 Thr Ser Ser Gly Leu Ala Ala Val Ser Asn Lys Gly Pro Val Ile Ile 65 70 75 80 Ala Gly Thr Ile Gly Asn Ser Ser Leu Ile Asn Ala Leu Ala Gln Ser 85 90 95 Gly Lys Ile Asp Val Ser Ala Thr Glu Gly Arg Trp Glu Ala Phe Gln 100 105 110 Thr Glu Ile Val Asp Asn Pro Phe Pro Gly Ile Ser Arg Ala Leu Val 115 120 125 Val Ser Gly Ser Asp Arg Arg Gly Thr Val Tyr Gly Leu Tyr Asp Ile 130 135 140 Ser Glu Gln Ile Gly Val Ser Pro Trp Tyr Trp Phe Ala Asp Val Pro 145 150 155 160 Pro Ala Gln His Glu Glu Ile Tyr Ala Leu Asp Thr Lys Lys Ile Gln 165 170 175 Gly Ser Pro Ser Val Lys Tyr Arg Gly Leu Phe Ile Asn Asp Glu Ala 180 185 190 Pro Ala Leu Thr Asn Trp Ile Asn Val Asn Tyr Pro Pro Cys Lys Tyr 195 200 205 Gly Pro Gly Phe Asn Ala Asp Phe Tyr Ala His Val Phe Glu Leu Leu 210 215 220 Leu Arg Leu Arg Ala Asn Tyr Leu Trp Pro Ala Glu Trp Ser Asn Ile 225 230 235 240 Phe Ala Leu Asp Asp Pro Arg Asn Phe Pro Thr Ala Asp Leu Tyr Gly 245 250 255 Ile Val Ile Gly Thr Ser His Thr Glu Pro Leu Met Arg Trp Thr Leu 260 265 270 Glu Gln Ser Leu Leu Leu Gln Gly Pro Trp Asn Trp Leu Thr Asn Glu 275 280 285 Lys Asn Ile Tyr Gln Phe Leu Lys Glu Gly Val Glu Arg Ser Lys Asn 290 295 300 Tyr Glu Val Ile Tyr Thr Met Gly Met Arg Gly Leu Gly Asp Thr Ala 305 310 315 320 Ser Pro Thr Ile Asn Ala Thr Thr Leu Ala Gln Ile Val Ala Ala Glu 325 330 335 Glu Gln Ile Leu Ser Glu Val Phe Asn Thr Thr Asn Ile Ser Trp Ile 340 345 350 Pro Gln Met Trp Cys Leu Tyr Lys Glu Val Gly Gly Tyr Tyr Glu Asp 355 360 365 Gly Leu Arg Val Ala Asp Asp Ile Thr Leu Leu Trp Ala Asp Asp Asn 370 375 380 Trp Gly Asn Ile Glu Arg Leu Pro Ile Gly Asn Glu Thr Ala Arg Ser 385 390 395 400 Gly Gly Ala Gly Val Tyr Tyr His Phe Asp Tyr Val Gly Asp Pro Gln 405 410 415 Asp Tyr Lys Trp Ile Asn Thr Ile Ser Leu Gln Lys Thr Trp Glu Gln 420 425 430 Met His Leu Ala Tyr Glu Arg Gln Ala Arg Asn Ile Trp Ile Val Asn 435 440 445 Val Gly Asp Leu Lys Ala Leu Glu Ile Pro Thr Asn His Phe Phe Asp 450 455 460 Leu Ala Tyr Asp Thr Pro Ser Trp Ser Asp Pro Asp Ser Thr Ser Arg 465 470 475 480 Trp Leu Lys Leu Trp Ala Thr Arg Glu Phe Gly Ala Ala Gly Ala Asp 485 490 495 Lys Val Ala Asp Ile Val Asn Arg Tyr Gly Gln Tyr Ala Ala Arg Arg 500 505 510 Lys Phe Glu Met Ile Thr Pro Ser Thr Phe Ser Ile Ile Asn Tyr Asn 515 520 525 Glu Ala Asn Asn Val Val Ser Gln Trp Glu Ser Leu Val Asn Asp Ala 530 535 540 Arg Asp Val Tyr Arg Gly Leu Ser Glu Ala Ala Arg Pro Ala Phe Phe 545 550 555 560 Glu Leu Val Leu Gln Pro Cys Met Ala Gly His Ile Ile Thr Gln Ile 565 570 575 His Val Thr Ala Ala Lys Asn Asn Leu Tyr Ala Ser Gln Arg Arg Thr 580 585 590 Ser Ala Lys Ala Met Ala Asp Lys Ala Leu Lys Leu Phe Lys Glu Asp 595 600 605 His Asp Leu Thr Val Ser Tyr His Lys Ile Leu Asp Gly Lys Trp Asn 610 615 620 His Ile Met Asp Gln Thr His Leu Gly Tyr Leu Tyr Trp Gln Gln Pro 625 630 635 640 Met Arg Asn Thr Leu Pro Pro Leu Gln Tyr Thr Gln Leu Leu Glu Asp 645 650 655 Ser Leu Ala Gly Pro Met Gly Val Ser Val Glu Gly Ser Asn Ala Ser 660 665 670 Val Pro Gly Asp Asp Gln Tyr His Ala Leu Ser Ser Thr Thr Leu Thr 675 680 685 Leu Pro Pro Ile Asp Pro Tyr Gly Pro Ser Thr Arg Trp Ile Glu Ile 690 695 700 Tyr Ser Arg Ser Thr Glu Ser Phe Glu Phe Gln Ile Ser Pro Asn Val 705 710 715 720 Ser Trp Val Thr Ala Thr Pro Ser Ser Gly Thr Val His Val Ser Gly 725 730 735 Asn Gly Thr Thr Thr Asp Val Arg Val Gln Leu Ser Val Asp Trp Asp 740 745 750 Lys Ala Pro Ile Gly Ser Ser Leu Val Ser Ile Asn Val Ser Ile Pro 755 760 765 Thr Gly His Phe Pro Thr Gly Asp Tyr Gly Asn Ser Ala Met Pro Val 770 775 780 Val Gln Leu Pro Val Asn Lys Thr Val Val Pro Ala Ser Phe His Gly 785 790 795 800 Phe Val Glu Ser Asp Gly Val Val Ser Ile Glu Ala Pro His Ala Thr 805 810 815 Arg Asn Thr Ser Thr Ala Asn Val Ser Tyr Ala Val Ile Pro Gly Tyr 820 825 830 Gly Arg Thr Leu Ser Gly Val Thr Leu Leu Pro Val Asn Ala Pro Ser 835 840 845 Gln Lys Ala Pro Ser Ser Pro Arg Leu Glu Tyr Asp Met Tyr Leu Phe 850 855 860 Ser Pro Ala Ala Asn Gly Ser Thr Val Asn Ile Thr Leu Tyr Leu Gly 865 870 875 880 Pro Ser Leu Asn Val Asn Pro Asp Arg Pro Leu Arg Tyr Ala Leu Ala 885 890 895 Phe Asp Asp Asp Asp Asn Pro Gln Val Val Gln Tyr Val Pro Ser Thr 900 905 910 Val Leu Gly Thr Tyr Pro Pro Asp Trp Pro Ser Ala Val Ser Asn Asn 915 920 925 Val Trp Ala Ser Thr Thr Ser Tyr Thr Ile Lys Gly Phe Asn Gly Asn 930 935 940 Ser Thr Ser Ala Thr Gly Thr Gly Ser Ala His Thr Leu Lys Leu Trp 945 950 955 960 Ala Leu Glu Pro Gly Val Val Phe Glu Lys Ile Val Ile Asp Leu Gly 965 970 975 Gly Gln Arg Asp Ser Tyr Leu Gly Pro Pro Glu Ser Arg Ile Val 980 985 990 <210> 73 <211> 21 <212> PRT <213> Rasamsonia emersonii <400> 73 Met Ile Leu Ser Ser Leu Leu Val Gly Cys Val Ser Leu Trp Gly Ala 1 5 10 15 Ala His Ala Leu Gly 20 <210> 74 <211> 3152 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(3152) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 74 atgatcctct ccagtctcct tgtggggtgc gtctccctat ggggagcagc acatgccctt 60 ggacaacagc ctgtcgtcgc cttcacctcc agtccaggat atctgaagct tgcaggccca 120 ggaactcccc ctggaacggt tgttctcgat tcagccgact ggccggcagt cttgagagca 180 gccggtgacc ttgccgtgga ctttgggcgt gttactggaa cgaacctgac caaaacggtg 240 atcaatggca ccacaacgtc gtctgggcta gcagcagtat caaacaaggg ccccgtgatt 300 atcgccggca ccattggcaa ctccagtctc atcaatgctt tggcgcagtc cggcaagatc 360 gacgtctccg cgacagaggg cagatgggag gccttccaga ccgaaatcgt ggacaatcct 420 ttcccgggga tatcgcgggc gttggtcgtc agtggcagcg acaggcgtgg cactgtctac 480 gggctgtacg acatctcaga gcagatcggg gtctcgccgt ggtactggtt cgccgacgtg 540 ccgcccgctc agcacgagga gatatacgct ttggacacga agaaaatcca gggctcgccg 600 tcggtcaaat accgcggatt gttcatcaac gacgaggcac ctgccttgac aaactggatc 660 aatgtgaact acccaccctg caagtatggg cctgggttca acgccgactt ctacgcacac 720 gtgttcgaac tcctcctgag gctgagagcc aactacctgt ggccggcaga atggagcaac 780 atcttcgctc tggacgatcc gcgcaatttc cccacagcag acctgtacgg gattgtgatt 840 ggaaccagcc acacagagcc cctgatgcga tggactctgg agcagagctt gcttctccag 900 ggcccgtgga attggcttac gaacgagaaa aacatctacc agttcctgaa agaaggcgtc 960 gagaggtcca agaattacga ggtcatatat actatgggca tgagaggtct cggcgacacg 1020 gcatcgccca cgatcaacgc cacaactctg gcgcaaatcg tcgccgcgga ggagcagatc 1080 ctctccgagg ttttcaacac gacgaacatc tcttggatcc cgcagatgtg gtgtctctac 1140 aaggaagtgg gcggctacta cgaagacggg ctccgtgtgg cggacgatat cacgctcctc 1200 tgggcagacg acaactgggg gaacatcgag agactgccga ttggcaatga gactgcacgg 1260 tctggcggtg ctggcgtcta ttatcacttt gactacgtcg gggaccccca agactacaag 1320 tggatcaaca ctatttcatt gcagaaaacc tgggagcaga tgcatctcgc atacgagcgg 1380 caggcaagga atatttggat cgtgaatgtt ggcgacttga aagcattggt tagcaagcct 1440 cttccgtggg aatatccgtc atatattgac aagatgacta ggaaatcccg actaaccact 1500 tcttcgactt ggcctacgat acacccagct ggtccgatcc ggacagcacc agccggtggc 1560 tcaagctctg ggccactcgt gaattcgggg cagcgggggc cgacaaagtc gcagacatcg 1620 taaaccgcta cggccagtac gcagctagac gcaaattcga gatgatcacc ccgagcacgt 1680 tcagcatcat caactacaac gaggctaaca acgtggtgag tcaatgggag agtctggtca 1740 acgatgcccg tgatgtgtac cgcggactca gcgaagctgc ccggccggcg ttcttcgagc 1800 tggtattgca accttgcatg gctggccaca tcatcactca gatccatgtt acggccgcca 1860 agaataatct ctatgcgtcc cagagacgga caagcgcgaa ggcaatggca gacaaggcgt 1920 tgaaactgtt caaagaggac cacgacttga cggtttccta tcacaagatt cttgatggaa 1980 aatggaacca tatcatggac cagacgcatc tgggttacct ttactggtga gtattttttt 2040 ttactaataa ccttgaccga ggttttgctg aaacggattc gtataggcag cagccgatga 2100 gaaacacact cccccctctc caatacactc agctgttaga ggacagtttg gcgggtccaa 2160 tgggtgtttc tgtcgagggc agcaatgcct ctgtccctgg cgacgatcaa taccacgctt 2220 tgtcgagtac caccctgacc ctgccaccca tagatcccta cggaccgtcg acgcgctgga 2280 tcgagatcta ctctcgctca actgaaagct tcgagttcca aatctccccc aacgtctcct 2340 gggtcaccgc gacaccgtcc tccggcaccg tccatgttag tggaaacgga acgaccaccg 2400 acgtccgcgt gcagctgtcc gtcgactggg acaaggctcc tatcggctcg agcctcgtct 2460 cgatcaacgt cagcatccca accggccact tcccgacggg ggactacggg aactcggcca 2520 tgccggttgt ccagctcccc gtgaacaaga cggtcgtgcc agcgtccttc cacggcttcg 2580 tcgagtcgga cggcgtcgtc agcatcgagg cgccgcacgc aacgcgcaac acctcgacgg 2640 cgaacgtctc ctacgccgtg atcccggggt acggacgcac actgtcgggc gtcaccttgc 2700 tgccggtgaa cgcgccgtca cagaaagcgc cttcctcccc gcgtctcgag tacgacatgt 2760 acctcttcag ccctgcggcc aacggcagca ccgtcaacat aacgctgtac ctgggaccgt 2820 cactcaacgt caaccctgac cgaccgctgc gatacgcgct ggccttcgac gacgacgaca 2880 atccccaggt agtgcagtac gtcccgagca cggtgctggg cacctaccca ccggactggc 2940 cctcggccgt gtccaacaac gtgtgggcgt cgacgacgtc gtatacaatc aagggcttta 3000 acggaaacag cactagtgca acaggaacgg gatccgcgca cacgctcaag ctgtgggctc 3060 ttgagcctgg cgtggtgttt gagaagattg tcattgatct gggcgggcag agggatagtt 3120 atctcggtcc gccggagagt cggattgtgt ag 3152 <210> 75 <211> 3039 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(3039) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 75 atgatcctct ccagtctcct tgtggggtgc gtctccctat ggggagcagc acatgccctt 60 ggacaacagc ctgtcgtcgc cttcacctcc agtccaggat atctgaagct tgcaggccca 120 ggaactcccc ctggaacggt tgttctcgat tcagccgact ggccggcagt cttgagagca 180 gccggtgacc ttgccgtgga ctttgggcgt gttactggaa cgaacctgac caaaacggtg 240 atcaatggca ccacaacgtc gtctgggcta gcagcagtat caaacaaggg ccccgtgatt 300 atcgccggca ccattggcaa ctccagtctc atcaatgctt tggcgcagtc cggcaagatc 360 gacgtctccg cgacagaggg cagatgggag gccttccaga ccgaaatcgt ggacaatcct 420 ttcccgggga tatcgcgggc gttggtcgtc agtggcagcg acaggcgtgg cactgtctac 480 gggctgtacg acatctcaga gcagatcggg gtctcgccgt ggtactggtt cgccgacgtg 540 ccgcccgctc agcacgagga gatatacgct ttggacacga agaaaatcca gggctcgccg 600 tcggtcaaat accgcggatt gttcatcaac gacgaggcac ctgccttgac aaactggatc 660 aatgtgaact acccaccctg caagtatggg cctgggttca acgccgactt ctacgcacac 720 gtgttcgaac tcctcctgag gctgagagcc aactacctgt ggccggcaga atggagcaac 780 atcttcgctc tggacgatcc gcgcaatttc cccacagcag acctgtacgg gattgtgatt 840 ggaaccagcc acacagagcc cctgatgcga tggactctgg agcagagctt gcttctccag 900 ggcccgtgga attggcttac gaacgagaaa aacatctacc agttcctgaa agaaggcgtc 960 gagaggtcca agaattacga ggtcatatat actatgggca tgagaggtct cggcgacacg 1020 gcatcgccca cgatcaacgc cacaactctg gcgcaaatcg tcgccgcgga ggagcagatc 1080 ctctccgagg ttttcaacac gacgaacatc tcttggatcc cgcagatgtg gtgtctctac 1140 aaggaagtgg gcggctacta cgaagacggg ctccgtgtgg cggacgatat cacgctcctc 1200 tgggcagacg acaactgggg gaacatcgag agactgccga ttggcaatga gactgcacgg 1260 tctggcggtg ctggcgtcta ttatcacttt gactacgtcg gggaccccca agactacaag 1320 tggatcaaca ctatttcatt gcagaaaacc tgggagcaga tgcatctcgc atacgagcgg 1380 caggcaagga atatttggat cgtgaatgtt ggcgacttga aagcattgga aatcccgact 1440 aaccacttct tcgacttggc ctacgataca cccagctggt ccgatccgga cagcaccagc 1500 cggtggctca agctctgggc cactcgtgaa ttcggggcag cgggggccga caaagtcgca 1560 gacatcgtaa accgctacgg ccagtacgca gctagacgca aattcgagat gatcaccccg 1620 agcacgttca gcatcatcaa ctacaacgag gctaacaacg tggtgagtca atgggagagt 1680 ctggtcaacg atgcccgtga tgtgtaccgc ggactcagcg aagctgcccg gccggcgttc 1740 ttcgagctgg tattgcaacc ttgcatggct ggccacatca tcactcagat ccatgttacg 1800 gccgccaaga ataatctcta tgcgtcccag agacggacaa gcgcgaaggc aatggcagac 1860 aaggcgttga aactgttcaa agaggaccac gacttgacgg tttcctatca caagattctt 1920 gatggaaaat ggaaccatat catggaccag acgcatctgg gttaccttta ctggcagcag 1980 ccgatgagaa acacactccc ccctctccaa tacactcagc tgttagagga cagtttggcg 2040 ggtccaatgg gtgtttctgt cgagggcagc aatgcctctg tccctggcga cgatcaatac 2100 cacgctttgt cgagtaccac cctgaccctg ccacccatag atccctacgg accgtcgacg 2160 cgctggatcg agatctactc tcgctcaact gaaagcttcg agttccaaat ctcccccaac 2220 gtctcctggg tcaccgcgac accgtcctcc ggcaccgtcc atgttagtgg aaacggaacg 2280 accaccgacg tccgcgtgca gctgtccgtc gactgggaca aggctcctat cggctcgagc 2340 ctcgtctcga tcaacgtcag catcccaacc ggccacttcc cgacggggga ctacgggaac 2400 tcggccatgc cggttgtcca gctccccgtg aacaagacgg tcgtgccagc gtccttccac 2460 ggcttcgtcg agtcggacgg cgtcgtcagc atcgaggcgc cgcacgcaac gcgcaacacc 2520 tcgacggcga acgtctccta cgccgtgatc ccggggtacg gacgcacact gtcgggcgtc 2580 accttgctgc cggtgaacgc gccgtcacag aaagcgcctt cctccccgcg tctcgagtac 2640 gacatgtacc tcttcagccc tgcggccaac ggcagcaccg tcaacataac gctgtacctg 2700 ggaccgtcac tcaacgtcaa ccctgaccga ccgctgcgat acgcgctggc cttcgacgac 2760 gacgacaatc cccaggtagt gcagtacgtc ccgagcacgg tgctgggcac ctacccaccg 2820 gactggccct cggccgtgtc caacaacgtg tgggcgtcga cgacgtcgta tacaatcaag 2880 ggctttaacg gaaacagcac tagtgcaaca ggaacgggat ccgcgcacac gctcaagctg 2940 tgggctcttg agcctggcgt ggtgtttgag aagattgtca ttgatctggg cgggcagagg 3000 gatagttatc tcggtccgcc ggagagtcgg attgtgtag 3039 <210> 76 <211> 6493 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(6493) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 76 ggagttgctt gcccgggcag gatatcggtt ggcggcgtgg ttggacttga ttgcgaagca 60 gtagagacag gtattctgct gatagcatgg atttatatta tcaataagca gaggcctaaa 120 gacattcaac cagaagaaac gtccttcatg caacagcaag ctagaacata tacatatgag 180 aacaagcata gtgccaatca agcagaccta tactgtactc tattacaaca aactactatc 240 acggtagtcg tacactggtc aatgaaataa tgtgagtaaa aatgatcatg attctatgac 300 agaacagcta gtacgcttga tttattgggg tataaatttt actttattta ggtggttaag 360 agccagcaga ctagatatat agctcagata taatataatt aatagtcaca gaaaaaaata 420 aataaaaata aaaatagcaa gatccatgat atggtataca caaaaaaata ataatcataa 480 atcacacaat tccatcctct ccaaaaccac ctagccagct cctaccaaac gatacatact 540 cagtccaagc aaatcccccg ttccgtcctc ccgtccgtcc gatcagtccc gaataccgac 600 caaaaaaaaa aagagacaaa atccaaatca cgggttcatt cacatcccca caggataccc 660 atggatcagt cgtcctactt actgtggtac agattagaac agaaaattag gtttttacac 720 aactcagggt ggttgcattg cattgcattg tgctgtggag ttagttaact tagttgtact 780 ccatccagtt catacgcagt acattattgg gcatttgacc ccatcagaca agatatctaa 840 ggataagagt agaaattagg taataatagt caaaagagaa gaagagatac caagggaact 900 agatactaac aaccaatcag gatatgccac agtgtggaac agaatggaag cagacaggat 960 caacataact ggaaataacc ttttctttct ttcttcgtac agcatcttgg caggaagtaa 1020 cttgatattg ttaattaatg tccatgtcca tgtccatgtc tttgttatgt cttgtcttgt 1080 ctttcttgtg tgctacaagt acagtgtaac agattcatat ccgctgaaac agacataaca 1140 ttcgacacat ggaatacgga gataaagaaa taaattatac tatatacgga atgatatcaa 1200 taaatatccg tgttgtactc cttattaaga aagagtggcg cttggcgcgt ctacgtgcat 1260 ggactggtac tacatatttg attacttcga tttttaataa caacaaccta gtagacgtat 1320 gtatgtcatg tgaaactttc gattgcgtgc tttcttgtct acttgtcgac ttgttacaat 1380 cttgtcgaat attaataata ataatccatc gcactgacat cttggcaagt actccgtaca 1440 tcaggttaca tacatactga ttctctaaag ctagataacg aataggattc tcgcacagac 1500 agtatgtgtc tcttgtctgt cagatgataa gcagatgaac aaagaaagta taactgctta 1560 ctacctacat gccgacattt agtcgattcc tttcggagaa tttattatgg attattaata 1620 gcataccccg ggattggcag aaggggtaaa aggtccgact agacaaggat atccatacag 1680 tacataccgt tgatacagat cgaatcacat gcatactgct gatggtgtga tgaatccttg 1740 aattagacaa tcatccagac ctgtctggac agagatcctg gcactgaaca atccactcat 1800 tgctatctat cggtactctg tacctgtttc agctgaagct tgccaatcgc agactgccat 1860 ctgcaactga tcagcgccag gatgcaggtc atgatacccc agcgttgttc ccgaggtgtc 1920 attgcttaaa cgcgttaacc agtgtgctaa acgtgctaaa cgtgctaaat gctaaactgc 1980 tgatgctatg cagctgcatc gccgaatctg gagaatgcag atcacctgcc gacggcgggc 2040 tccgggcacg tgcacggggg accccgtagg acagaaacgt ccatcgagag tacggagtac 2100 ggagtattac aagaccctgt ccatcagacc ctgtccatcg tcattgccaa gatctctcat 2160 tgtttgctgt ttcatgctcg gatcaccagt ggacagcaat gccccgtgaa cagcaagccg 2220 catgctggtc cgtgtcttgt ccgtgtgccg atgtagtatt gctaacgaga cccagaatgg 2280 catcaatgac gttgcggatg acagaatgag ggggatcatc agtacgtctg ctatcaggat 2340 gattatccta cggagtattt actcagctga agacaggaac aagatcgtct gatggatgag 2400 gcccacggcc agccagcaca gactccgtac tcttcagtct tctggatttg accgttcgac 2460 ggcgcctccg acgtagcatc tcgctagcct gatccttggc tgcgcctatc gtcggctcat 2520 gcccctgttg atgacgggga agtggagcgg cgccgcgata aggttgcctt gctaatttag 2580 cgcctgcacg ctccagccaa aaagaccaat attgaggtcg atcgtctccc ctggctccgt 2640 gctgctggcc tgcgatcgcc ggcgcgatca taccctgcaa tcacgccgcc agcctatcac 2700 agaccatgcg gtccttgcac catctgggag ctcgagctct cctgactgcc gtcggggcgt 2760 caatgcgtcc ggagcctccg acgagggcct ctgctcctcg tctgtcctac tggagcttgt 2820 ccgtcagacg tcgcatcctg agccgtgtgc tgatatcgcc atggctctga cgtgatcgac 2880 tgcgagcggc cggcgaggct ataagaagcc gcaacttgct gctcgaagta ccgtctccca 2940 tccatcgatc agacagtcag cagtcctcac tcagtcagtc ctcagtcgtc cttcaccacc 3000 atgggtctgt ccaaagcctt cgtgtctgca ctctcgctgt gctccgccgt cgccgtggcc 3060 gccccgaccg ggccagctcc caacgtgcag ttctccctga agcaggtcgc ggtgccccgg 3120 accaagcctc gtgcgccccc agctgccgac tacgcgcgcg ctctggccaa gtatggcgct 3180 ccaattccgt cgtctgtgcg gacggccgcg tccggcacgc agagcggctc tgcggccaac 3240 acgcccgtcg ccggcgacag cttgtatctc acgcccgtta ccatcggcca gagcacgctg 3300 aacctggact ttgacacggg ctctgcggat ctgtaagtgt cccaactctc gcaagaacaa 3360 gaacggagca gctgactcgt ccagctgggt cttctccaac gagacgccct ccagcgagcg 3420 cggcaaccac gccatctaca agcccagctc gacggccaag aagctgaacg gctacacctg 3480 gagcatctcg tacggcgacg gcagctcggc cggcggcgac gtctaccagg acagcgtctc 3540 ggtgggcggc gtcaacgcct ccaaccaggc ggtcgaggcc gccaccaagg tcagctccga 3600 gttcacgcag gagccgggcg acggcttgct gggcctggcc ttcagcagca tcaacaccgt 3660 caagcccaag ccgcagacga ccttcttcga cacggtcaag tcctcgctcg ccaagccgct 3720 gttcgccgtc accctcaagc acaacgagcc cggcagctac gactttggct acatcgacag 3780 ctccaagtac aagggcagca tccagtacac ccaggtcgac aactcgcagg gcttctggca 3840 gttcacggcc gacggctact cgattggcgg cagcagcggc agcggtggct ccatttctgg 3900 cattgctggt aagaactccc cctacatcag agttatctag atgctgattt cgcagacacc 3960 ggcaccaccc tcctcctgct cgacgaccag atcgtcaacg agtactacca gcaggtccag 4020 ggcgcgcaga acgaccagaa cgccggcggc tacaccttcc cgtgcgacgc gcagctgccc 4080 gagctgagct tcaccatcgg ccagtacacc gccaccgtgc cggccgagta cctcaacttc 4140 cagcccgtgt cgcagggcag ccagacctgc ttcggcggtc tgcagtccaa ccagggcatt 4200 ggcttctcca tcttcggcga cgtcttcctc aagagccagt acgtcgtctt tgactcggac 4260 ggtcctcagc tgggctttgc tgctcaggcg tagaccagtc gtcctccagc ccaggttggt 4320 tggtaggaga tgatttttcg atcgatcgat tatcatggtg attgatagga tatgtgcatg 4380 agcagttgcc tgtacataca tacataatga tttattgaat caattagtta tgatcaatct 4440 cgaatatatt ttcagtgaaa tacgtacatg gtcatagcat aacgatatac tccgttttct 4500 tcaggtagct agtaaatata cacaaattca tcgttctccc ggtccgtcag gtccaggaag 4560 gctttgtctc cgatcgtccc gtcgggatca ctctcgctgg tatcgtgata gcgctccctc 4620 atcgagtaat caaccacctt ggccggcttt ccattccgca cgcgccgccg ctcctgcatc 4680 cggttcagca cgaccaaatt cgcccactgc gccagcacga cggccaccag cgccacgaag 4740 atggccagac aagcccgcac gcccggccga tacgccggcg cgtccttctt gctgaagagc 4800 agcgggccga cgatgttgcc cgccgagctg gccgcgttgt acaggctcat cagcgccgat 4860 ttcttcgttg tgccgcccgt gttgcccacg atccacgtca cgatcagtgg gttgccgccg 4920 aagagaaacg cgagcaggta gtagcctacc aggagggagg gttcgactga gttttgcttc 4980 gtgctgttat tactgcgtgg cacggcgtac agaattgcca ggcccgcgac taccggcagc 5040 atgaagccgg ccagcacgac gcccttcatc cgcgcccgct gcgccagata gctccccgcc 5100 aggatgacca gcagctgcag cgcgccaaac ggcatgttga gcagactcgt cgtgtacgcg 5160 tcgtacccca ggccgttgag gatcagcggg ccgaacgtgt tgctcacgct ggcgccgacg 5220 ttcagcagca tcgccatgcc gatccagagg taggttttgg gctcgagcgc tgcctcgacg 5280 acgtgccgga tcttgaactc gcggctccct gtgcccgtct ggttcgcgcg cagccgctcg 5340 atggcctgcg ctttttccgt ctccgtcagg aaccgcgctg aggggatgtc gttgtctagt 5400 ttccagtaga tgaacggcac tgagatgatg gtcaggaggc cgacggtgag gaagatactg 5460 cgccagtcgt cagcagtcag tcagtcagcg ttcggggtag aaggggagta catctgccat 5520 ggcctcagaa caggcgactc gatatggccc aacccgtacg acagggccgc cgcgatgaca 5580 gtcgccgcgc cgttggtact gtaccaggcc gcaatgcgca gcggctgctc ggcgcggcgg 5640 taccactggc tggtgatgac gctgaacagc ggcagacagg cggcctcgaa caggccgagg 5700 aagaagcgcg cggccatcag ggaggcgaaa ctgcgacagg cggccatggc ggcctgggcg 5760 acgccccagc ccagacacag cgcgggcatc aggcggcgat gcggcacgcg cacgatcagc 5820 cacgacgaga acggctgcca gacgagctgg gcgatgggcg cgatcgaccc cagcagcgag 5880 tactggttgc ccgtcaggtg cgtgtcggcc tgcaagccga aggtggcccc gtacccgagc 5940 accgacttgt ccaggatctg caggaagtac acccacacga ggatggccag gatgacgcgg 6000 tctgtcttgc gccggatgcg cttgctgtcg gcgtccgtga gtgggattct ctgctggccg 6060 atcaggcgga gcgccgtgtc gccgtggacg gcgggttgct cttcttcatg ggtgacggtc 6120 ggtttggatg ccatggtagc gattactaga tgtaatcaag ttgtaatggg agacaaacga 6180 ccaagttctc tctcgacgtt ttataccggc ttatatgtct gttcagcagc attgcaagtc 6240 aagtaatgac atcggaattc ctccggttcc ccgcattgcg cggcgatcat cggctggcac 6300 tagcagtata gctagctcag agtccgtatt actggattct attgcattgc gctgattgca 6360 gacgttgact gacagcagga gctttgactc tattaccccc acgcttcggc aattccccgc 6420 gtgctcgggc ctctatgcac ccccacgtgg gggaacattc cagagtatgc aggcagtagt 6480 atgcagcatg gat 6493 <210> 77 <211> 1194 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(1194) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 77 atgggtctgt ccaaagcctt cgtgtctgca ctctcgctgt gctccgccgt cgccgtggcc 60 gccccgaccg ggccagctcc caacgtgcag ttctccctga agcaggtcgc ggtgccccgg 120 accaagcctc gtgcgccccc agctgccgac tacgcgcgcg ctctggccaa gtatggcgct 180 ccaattccgt cgtctgtgcg gacggccgcg tccggcacgc agagcggctc tgcggccaac 240 acgcccgtcg ccggcgacag cttgtatctc acgcccgtta ccatcggcca gagcacgctg 300 aacctggact ttgacacggg ctctgcggat ctctgggtct tctccaacga gacgccctcc 360 agcgagcgcg gcaaccacgc catctacaag cccagctcga cggccaagaa gctgaacggc 420 tacacctgga gcatctcgta cggcgacggc agctcggccg gcggcgacgt ctaccaggac 480 agcgtctcgg tgggcggcgt caacgcctcc aaccaggcgg tcgaggccgc caccaaggtc 540 agctccgagt tcacgcagga gccgggcgac ggcttgctgg gcctggcctt cagcagcatc 600 aacaccgtca agcccaagcc gcagacgacc ttcttcgaca cggtcaagtc ctcgctcgcc 660 aagccgctgt tcgccgtcac cctcaagcac aacgagcccg gcagctacga ctttggctac 720 atcgacagct ccaagtacaa gggcagcatc cagtacaccc aggtcgacaa ctcgcagggc 780 ttctggcagt tcacggccga cggctactcg attggcggca gcagcggcag cggtggctcc 840 atttctggca ttgctgacac cggcaccacc ctcctcctgc tcgacgacca gatcgtcaac 900 gagtactacc agcaggtcca gggcgcgcag aacgaccaga acgccggcgg ctacaccttc 960 ccgtgcgacg cgcagctgcc cgagctgagc ttcaccatcg gccagtacac cgccaccgtg 1020 ccggccgagt acctcaactt ccagcccgtg tcgcagggca gccagacctg cttcggcggt 1080 ctgcagtcca accagggcat tggcttctcc atcttcggcg acgtcttcct caagagccag 1140 tacgtcgtct ttgactcgga cggtcctcag ctgggctttg ctgctcaggc gtag 1194 <210> 78 <211> 397 <212> PRT <213> Rasamsonia emersonii <400> 78 Met Gly Leu Ser Lys Ala Phe Val Ser Ala Leu Ser Leu Cys Ser Ala 1 5 10 15 Val Ala Val Ala Ala Pro Thr Gly Pro Ala Pro Asn Val Gln Phe Ser 20 25 30 Leu Lys Gln Val Ala Val Pro Arg Thr Lys Pro Arg Ala Pro Pro Ala 35 40 45 Ala Asp Tyr Ala Arg Ala Leu Ala Lys Tyr Gly Ala Pro Ile Pro Ser 50 55 60 Ser Val Arg Thr Ala Ala Ser Gly Thr Gln Ser Gly Ser Ala Ala Asn 65 70 75 80 Thr Pro Val Ala Gly Asp Ser Leu Tyr Leu Thr Pro Val Thr Ile Gly 85 90 95 Gln Ser Thr Leu Asn Leu Asp Phe Asp Thr Gly Ser Ala Asp Leu Trp 100 105 110 Val Phe Ser Asn Glu Thr Pro Ser Ser Glu Arg Gly Asn His Ala Ile 115 120 125 Tyr Lys Pro Ser Ser Thr Ala Lys Lys Leu Asn Gly Tyr Thr Trp Ser 130 135 140 Ile Ser Tyr Gly Asp Gly Ser Ser Ala Gly Gly Asp Val Tyr Gln Asp 145 150 155 160 Ser Val Ser Val Gly Gly Val Asn Ala Ser Asn Gln Ala Val Glu Ala 165 170 175 Ala Thr Lys Val Ser Ser Glu Phe Thr Gln Glu Pro Gly Asp Gly Leu 180 185 190 Leu Gly Leu Ala Phe Ser Ser Ile Asn Thr Val Lys Pro Lys Pro Gln 195 200 205 Thr Thr Phe Phe Asp Thr Val Lys Ser Ser Leu Ala Lys Pro Leu Phe 210 215 220 Ala Val Thr Leu Lys His Asn Glu Pro Gly Ser Tyr Asp Phe Gly Tyr 225 230 235 240 Ile Asp Ser Ser Lys Tyr Lys Gly Ser Ile Gln Tyr Thr Gln Val Asp 245 250 255 Asn Ser Gln Gly Phe Trp Gln Phe Thr Ala Asp Gly Tyr Ser Ile Gly 260 265 270 Gly Ser Ser Gly Ser Gly Gly Ser Ile Ser Gly Ile Ala Asp Thr Gly 275 280 285 Thr Thr Leu Leu Leu Leu Asp Asp Gln Ile Val Asn Glu Tyr Tyr Gln 290 295 300 Gln Val Gln Gly Ala Gln Asn Asp Gln Asn Ala Gly Gly Tyr Thr Phe 305 310 315 320 Pro Cys Asp Ala Gln Leu Pro Glu Leu Ser Phe Thr Ile Gly Gln Tyr 325 330 335 Thr Ala Thr Val Pro Ala Glu Tyr Leu Asn Phe Gln Pro Val Ser Gln 340 345 350 Gly Ser Gln Thr Cys Phe Gly Gly Leu Gln Ser Asn Gln Gly Ile Gly 355 360 365 Phe Ser Ile Phe Gly Asp Val Phe Leu Lys Ser Gln Tyr Val Val Phe 370 375 380 Asp Ser Asp Gly Pro Gln Leu Gly Phe Ala Ala Gln Ala 385 390 395 <210> 79 <211> 1066 <212> DNA <213> Aspergillus nidulans <220> <221> source <222> (1)..(1066) <223> /organism="Aspergillus nidulans" /mol_type="unassigned DNA" <400> 79 agacagctct ggcggctctg aggtgcagtg gatgattatt aatccgggac cggccgcccc 60 tccgccccga agtggaaagg ctggtgtgcc cctcgttgac caagaatcta ttgcatcatc 120 ggagaatatg gagcttcatc gaatcaccgg cagtaagcga aggagaatgt gaagccaggg 180 gtgtatagcc gtcggcgaaa tagcatgcca ttaacctagg tacagaagtc caattgcttc 240 cgatctggta aaagattcac gagatagtac cttctccgaa gtaggtagag cgagtacccg 300 gcgcgtaagc tccctaattg gcccatccgg catctgtagg gcgtccaaat atcgtgcctc 360 tcctgctttg cccggtgtat gaaaccggaa aggccgctca ggagctggcc agcggcgcag 420 accgggaaca caagctggca gtcgacccat ccggtgctct gcactcgacc tgctgaggtc 480 cctcagtccc tggtaggcag ctttgccccg tctgtccgcc cggtgtgtcg gcggggttga 540 caaggtcgtt gcgtcagtcc aacatttgtt gccatatttt cctgctctcc ccaccagctg 600 ctcttttctt ttctctttct tttcccatct tcagtatatt catcttccca tccaagaacc 660 tttatttccc ctaagtaagt actttgctac atccatactc catccttccc atcccttatt 720 cctttgaacc tttcagttcg agctttccca cttcatcgca gcttgactaa cagctacccc 780 gcttgagcag acatcaccat ggccaagttg accagtgccg ttccggtgct caccgcgcgc 840 gacgtcgccg gagcggtcga gttctggacc gaccggctcg ggttctcccg ggacttcgtg 900 gaggacgact tcgccggtgt ggtccgggac gacgtgaccc tgttcatcag cgcggtccag 960 gaccaggtgg tgccggacaa caccctggcc tgggtgtggg tgcgcggcct ggacgagctg 1020 tacgccgagt ggtcggaggt cgtgtccacg aacttccggg acgcct 1066 <210> 80 <211> 1062 <212> DNA <213> Aspergillus nidulans <220> <221> source <222> (1)..(1062) <223> /organism="Aspergillus nidulans" /mol_type="unassigned DNA" <400> 80 accagtgccg ttccggtgct caccgcgcgc gacgtcgccg gagcggtcga gttctggacc 60 gaccggctcg ggttctcccg ggacttcgtg gaggacgact tcgccggtgt ggtccgggac 120 gacgtgaccc tgttcatcag cgcggtccag gaccaggtgg tgccggacaa caccctggcc 180 tgggtgtggg tgcgcggcct ggacgagctg tacgccgagt ggtcggaggt cgtgtccacg 240 aacttccggg acgcctccgg gccggccatg accgagatcg gcgagcagcc gtgggggcgg 300 gagttcgccc tgcgcgaccc ggccggcaac tgcgtgcact tcgtggccga ggagcaggac 360 tgaccgacgc cgaccaacac cgccggtccg acggcggccc acgggtccca ggagcttgag 420 atccacttaa cgttactgaa atcatcaaac agcttgacga atctggatat aagatcgttg 480 gtgtcgatgt cagctccgga gttgagacaa atggtgttca ggatctcgat aagatacgtt 540 catttgtcca agcagcaaag agtgccttct agtgatttaa tagctccatg tcaacaagaa 600 taaaacgcgt tttcgggttt acctcttcca gatacagctc atctgcaatg cattaatgca 660 ttgactgcaa cctagtaacg ccttcaggct ccggcgaaga gaagaatagc ttagcagagc 720 tattttcatt ttcgggagac gagatcaagc agatcaacgg tcgtcaagag acctacgaga 780 ctgaggaatc cgctcttggc tccacgcgac tatatatttg tctctaattg tactttgaca 840 tgctcctctt ctttactctg atagcttgac tatgaaaatt ccgtcaccag ccctgggttc 900 gcaaagataa ttgcatgttt cttccttgaa ctctcaagcc tacaggacac acattcatcg 960 taggtataaa cctcgaaatc attcctacta agatggtata caatagtaac catgcatggt 1020 tgcctagtga atgctccgta acacccaata cgccggccgg cc 1062 <210> 81 <211> 1501 <212> DNA <213> Rasamsonia emersonii <220> <221> source <222> (1)..(1501) <223> /organism="Rasamsonia emersonii" /mol_type="unassigned DNA" <400> 81 ccaattattc aaatcttcaa cctgggtcct ttgcgactag actcggcact atacccacct 60 gagtcgaatc tccgctggac gatttttttt cttagaagaa aaaaagcttc agaggctaag 120 gattaggctt ccgtacggac tccatgccct atcagacaga gactccgcaa ctcatctgat 180 ctcttcgatg gagggaaaat ctgctgtttt tcgcaaattt ccaacccacc agaaacaccc 240 agaactgtca cgactcacac gtcctacggt ctttgtgtga gtataactga ttatattcac 300 agatgggtta ctcaatgcag gtacaaactt tgatcgcgct ctttttggga ccgtctatca 360 accggcttcg aaaaatggct cgactagcca atctgacagg aaattgcgat gttgcaaccg 420 tgtatacgga gtcctctgta caacctctgc caacctctgc cacctcggta catgtacgga 480 gtagctcccc gcagccgcga ttggatgcat taaagtgggt caaccgcagt ggcttgcagt 540 ccgctgcacg agtccgtatg caataattct tgacacacac gagtgcacat aataatagga 600 aagcagacaa actttgagct gaaggctgtc gagcttggca aattgcagga tctggctagt 660 ttcgaagtcg acttcgcgcg cgcagcagta ttgcattatt gagtgtgacc tgctgcgtgg 720 gattagcgtc gcaccggccg aaagctagtc tcatccaagg ctgagcctga gcgctaatta 780 ccccggatca gccaagccct aatggatcta atgaggtgcc tcctccagca ttcggcctgc 840 atggtgcggc gacccctctc tccacgtcca ataattgctg ttgcgcctgt cgaaccctgc 900 caccgcatct ttgccgtttt actccgagat ctgaaaagcc tgctgtggat ggcagttcgc 960 aatatgcact ctcaatcagg tctgtagcat cttttaacta ttattctatt actaattgct 1020 tctggaaggc ttgtggggtg tggtttgtca tcaagttggc tccctgagcg ccgcgttgca 1080 atctccacgc gcggttgtac ggagtatatt catgcggatc cccggggcag agccgtagtg 1140 catgtgacac taatcgatca tccgctcaat tggatcctgg atttcgaccc tggcttgaac 1200 atatccaatg atcttccagg gacgaaccga cccggtcatg ctttgttacc tacgtacgga 1260 gtagcggcct gggtgatggt tccggaaggt ctgctaaaag gagatcgagt ataccccccg 1320 gggtccgtct gagacttata aagggctctc tgcaactctc cggccgactt ttttcttcat 1380 tcgacagcca tcactcgttt atctggtcga ttctgcagac ttgcccaagg agcaaagagc 1440 atcttcatac gcgcatcatc catctccagc tttctctctc caaacataca ccgtcaaaat 1500 g 1501 <210> 82 <211> 301 <212> DNA <213> Aspergillus nidulans <220> <221> source <222> (1)..(301) <223> /organism="Aspergillus nidulans" /mol_type="unassigned DNA" <400> 82 ctaataagtg tcagatagca atttgcacaa gaaatcaata ccagcaactg taaataagcg 60 ctgaagtgac catgccatgc tacgaaagag cagaaaaaaa cctgccgtag aaccgaagag 120 atatgacacg cttccatctc tcaaaggaag aatcccttca gggttgcgtt tccagtctag 180 acacgtataa cggcacaagt gtctctcacc aaatgggtta tatctcaaat gtgatctaag 240 gatggaaagc ccagaatatt ggctgggttg atggctgctt cgagtgcagt ctcatgctgc 300 c 301

Claims

서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72에 기재된 아미노산 서열; 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 또는 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74의 뉴클레오티드 서열에 의해 코딩된 아미노산 서열; 또는 이의 변이체 폴리펩티드 또는 변이체 폴리뉴클레오티드를 포함하는, 헤미셀룰라제(hemicellulase) 활성을 갖는 폴리펩티드로서, 상기 변이체 폴리펩티드가 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72에 기재된 서열과 75% 이상의 서열 동일성을 갖거나, 상기 변이체 폴리뉴클레오티드가 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72에 기재된 서열과 75% 이상의 서열 동일성을 갖는 폴리펩티드를 코딩하는, 폴리펩티드.
제1항에 있어서,
β-자일로시다제(xylosidase), α-갈락토시다제(galactosidase), 자일로글루카나제(xyloglucanase), α-아라비노푸라노시다제(arabinofuranosidase), 엔도-자일라나제(endo-xylanase), 만노시다제(mannosidase)/자일로시다제, 페룰로일 에스터라제(feruloyl esterase), 자일로시다제, 엔도-엑소-자일라나제(endo-exo-xylanase) 또는 α-글루쿠로니다제(glucuronidase) 활성을 갖는 폴리펩티드.
헤미셀룰라제를 코딩하는 핵산 서열로서,
(a) 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74, 또는 서열번호 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70 또는 75의 핵산 서열과 70% 이상의 동일성을 갖는 핵산 서열;
(b) 서열번호 1, 6, 11, 16, 21, 26, 31, 36, 41, 46, 51, 56, 61, 66 또는 71, 서열번호 4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59, 64, 69 또는 74, 또는 서열번호 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70 또는 75의 핵산 서열의 상보체와 혼성화하는 핵산 서열;
(c) (i) 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72의 아미노산 서열, (ii) 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72의 아미노산 서열과 70% 이상의 동일성을 갖는 아미노산 서열, 또는 (iii) 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개 또는 12개의 아미노산이 서열번호 2, 7, 12, 17, 22, 27, 32, 37, 42, 47, 52, 57, 62, 67 또는 72의 아미노산 서열과 상이한 아미노산 서열을 코딩하는 핵산 서열; 및
(d) (a), (b) 또는 (c)에 정의된 뉴클레오티드 서열의 역 상보체인 뉴클레오티드 서열
로 구성된 군으로부터 선택된 핵산 서열.
제1항 또는 제2항에 따른 폴리뉴클레오티드를 포함하는 핵산 구축물 또는 벡터.
제1항 또는 제2항에 따른 폴리펩티드, 또는 제3항에 따른 핵산 구축물 또는 벡터를 포함하는 세포로서, 바람직하게는 진균 세포, 바람직하게는 아크레모늄(Acremonium), 아가리커스(Agaricus), 아스퍼길러스(Aspergillus), 아우레오바시듐(Aureobasidium), 크리소스포리움(Chrysosporium), 코프리너스(Coprinus), 크립토코커스(Cryptococcus), 필리바시듐(Filibasidium), 푸사리움(Fusarium), 후미콜라(Humicola), 마그나포르테(Magnaporthe), 뮤코르(Mucor), 마이셀리오프쏘라(Myceliophthora), 네오칼리마스틱스(Neocallimastix), 뉴로스포라(Neurospora), 패실로마이세스(Paecilomyces), 페니실리움(Penicillium), 피로마이세스(Piromyces), 파네로캐테(Panerochaete), 플레우로터스(Pleurotus), 쉬조필룸(Schizophyllum), 탈라로마이세스(Talaromyces), 라삼소니아(Rasamsonia), 써모아스커스(Thermoascus), 티엘라비아(Thielavia), 톨리포클라듐(Tolypocladium) 및 트라이코데르마(Trichoderma) 속으로 구성된 군으로부터 선택된 진균 세포인 세포.
제5항에 있어서,
하나 이상의 유전자가 전체적으로 또는 부분적으로 결실되어 있거나, 넉아웃되어 있거나 파괴되어 있고, 이때 임의적으로 상기 유전자가 프로테아제(protease)를 코딩하는, 세포.
헤미셀룰라제 활성을 갖는 제1항 또는 제2항에 따른 폴리펩티드를 제조하는 방법으로서, 상기 폴리펩티드의 발현을 허용하는 조건 하에서 제4항 내지 제6항 중 어느 한 항에 따른 세포를 배양하는 단계, 및 임의적으로 발현된 폴리펩티드를 회수하는 단계를 포함하는 방법.
(i) 제1항 또는 제2항에 따른 폴리펩티드; 및 (ii) 셀룰라제(cellulase), 추가 헤미셀룰라제 및/또는 펙티나제(pectinase)를 포함하는 조성물.
제8항에 있어서,
셀룰라제가 GH61, 셀로바이오하이드롤라제(cellobiohydrolase), 셀로바이오하이드롤라제 I, 셀로바이오하이드롤라제 II, 엔도-β-1,4-글루카나제(glucanase), β-글루코시다제(glucosidase) 또는 β-(1,3)(1,4)-글루카나제인 조성물.
제8항 또는 제9항에 있어서,
추가 헤미셀룰라제가 엔도-자일라나제, β-자일로시다제, α-L-아라비노푸라노시다제, α-D-글루쿠로니다제, 셀로바이오하이드롤라제, 페룰로일 에스터라제, 쿠마로일 에스터라제, α-갈락토시다제, β-갈락토시다제, β-만나나제(mannanase) 또는 β-만노시다제인 조성물.
헤미셀룰로스를 포함하는 기질, 임의적으로 식물 물질을 처리하는 방법으로서, 상기 기질을 제1항 또는 제2항에 따른 폴리펩티드 및/또는 제8항 내지 제10항 중 어느 한 항에 따른 조성물과 접촉시키는 단계를 포함하는 방법.
리그노셀룰로스성(lignocellulosic) 물질로부터 당을 제조하기 위한 제1항 또는 제2항에 따른 폴리펩티드 및/또는 제8항 내지 제10항 중 어느 한 항에 따른 조성물의 용도.