KR102181315B1

KR102181315B1 - 활성 개선된 리조무코르 미에헤이 유래 변이 리파제 및 효모를 이용한 재조합 생산 방법

Info

Publication number: KR102181315B1
Application number: KR1020190138830A
Authority: KR
Inventors: 손정훈; 김미진; 배정훈; 고현준; 성봉현
Original assignee: 한국생명공학연구원
Priority date: 2018-11-01
Filing date: 2019-11-01
Publication date: 2020-11-20
Also published as: KR20200050438A

Abstract

본 발명은 리파제를 코딩하는 핵산을 포함하는 리파제 분비 발현 카세트로서, 상기 리파제는 서열번호 1의 아미노산 서열에서 N-말단으로부터 52 번째 및 190 번째 아미노산 중 어느 하나 이상이 다른 아미노산으로 치환된 리파제 분비 발현 카세트; 이를 포함하는 발현 벡터; 이를 포함하는 형질전환 미생물; 상기 형질전환 미생물을 배양하는 단계 및 리파제를 회수하는 단계를 포함하는 리파제의 제조방법; 및 전이에스터 활성 및 분비 발현능이 증가된 변이형 리파제에 관한 것이다.
본 발명의 분비 발현 카세트, 발현 벡터 및 이를 포함하는 형질전환 미생물을 이용하여, 전이에스터 활성이 개선된 리파제를 고효율로 생산할 수 있으며, 생산된 리파제는 전이에스터 반응이 필요한 모든 공정에 유용하게 이용될 수 있다.

Description

활성 개선된 리조무코르 미에헤이 유래 변이 리파제 및 효모를 이용한 재조합 생산 방법{Mutant lipases of Rhizomucor miehei having enhanced transesterification activity and a method of producing the lipase}

본 발명은 리파제를 코딩하는 핵산을 포함하는 리파제 분비 발현 카세트로서, 상기 리파제는 서열번호 1의 아미노산 서열에서 N-말단으로부터 52 번째 및 190 번째 아미노산 중 어느 하나 이상이 다른 아미노산으로 치환된 리파제 분비 발현 카세트; 이를 포함하는 발현 벡터; 이를 포함하는 형질전환 미생물; 상기 형질전환 미생물을 배양하는 단계 및 리파제를 회수하는 단계를 포함하는 리파제의 제조방법; 및 에스터(ester) 전이 활성 및 분비 발현능이 증가된 변이형 리파제에 관한 것이다.

리파제(Lipase)는 중성지질의 에스터 결합을 가수분해하여 지방산과 글리세롤을 생산하며 지방산의 탄소수에 따라 다양한 기질 특이성을 가진다. 리파제는 가수분해 반응 외에도 에스터화 반응, 에스터전이화(또는 전이에스터) 반응, 아미노분해, 산분해, 알콜분해와 같은 여러 가지 반응을 수행할 수 있고 유전공학 기술로 손쉽게 대량으로 얻을 수 있어 세제산업, 식품산업, 에너지 산업, 제약 산업 등에서 산업적으로 이용하려는 연구가 끊임없이 확대되고 있다.

바이오디젤(Biodiesel)은 동, 식물성 기름이 메탄올과 에스터 반응 후 생성되는 지방산 메틸에스터(methyl ester)로 기존의 석유계 경유와 성질이 매우 유사하여 연소 시 공해가 거의 발생하지 않아 석유계 경유와 섞어서 사용할 경우 대기오염의 주범인 자동차 공해를 획기적으로 줄일 수 있는 선진국형 청정 대체 에너지로 최근 그 수요와 필요성이 대폭 증대되고 있다. 각종 오일에서 바이오디젤이 생산되는 과정은 2단계의 화학 반응이 요구되는데 먼저 지질의 가수분해 반응에 의하여 지방산과 글리세롤이 생산되고, 뒤이어 지방산과 알콜(메탄올)이 에스터화하여 메틸에스터화합물, 즉, 바이오디젤을 생산한다.

바이오디젤 생산은 강염기 등을 이용하는 화학적 촉매방법을 주로 사용하고 있으나 복잡한 반응공정과 부산물발생 및 다량의 폐수발생으로 2차 환경오염을 유발하는 단점이 있다. 이와 같은 문제를 극복하기 위하여 미생물 유래 생촉매인 효소를 이용하여 바이오디젤을 생산하기 위한 노력이 활발하게 진행되고 있다. 바이오디젤 생산에 이용되는 리파제는 지방산과 메탄올 에스터화 반응을 동시에 촉매하는 전이에스터화 반응이 가능하기 때문에 바이오디젤을 쉽게 생산 할 수 있다.

1996년 Nelson 등이 유기용매 하에서 지방분해효소를 통해 바이오디젤 생산이 가능함을 최초로 보고한 바가 있고, 일본에서 고정화 지질분해효소로 바이오디젤 고효율 생산이 가능함을 확인한 바가 있다. 이러한 연구들은 바이오디젤 생산에 유기용매를 사용하지 않아 환경오염을 줄일 수 있다는 점에서 친환경적 생산 공정의 개발 가능성을 보여주며, 현재의 화학공정 중심의 바이오디젤 생산을 미래 친환경 지향적인 생물공정으로 대체가 가능함을 시사한다. 이에, 바이오디젤 생산의 경제성을 확보하기 위해서 높은 효소 활성을 가지는 리파제를 대량으로 생산하기 위한 연구가 경쟁적으로 진행되고 있다.

이러한 배경 하에, 본 발명자들은 고활성 리파제를 대량생산할 수 있는 기술을 개발하기 위하여 예의 노력한 결과, 단백질 분비 융합인자 한국특허 제0975596호)를 이용하여 리조무코르 미에헤이 유래 리파제를 효모에서 대량생산하였다. 나아가 방향성 진화 기술을 이용하여 전이에스터 활성이 250% 개선된 리파제를 제작하여 본 발명을 완성하였다.

본 발명의 하나의 목적은 리파제를 코딩하는 핵산을 포함하는 리파제 분비 발현 카세트로서, 상기 리파제는 서열번호 1의 아미노산 서열에서 N-말단으로부터 52 번째 및 190 번째 아미노산 중 어느 하나 이상이 다른 아미노산으로 치환된, 리파제 분비 발현 카세트를 제공하는 것이다.

본 발명의 다른 하나의 목적은 상기 발현 카세트를 포함하는, 발현 벡터를 제공하는 것이다.

본 발명의 또 다른 하나의 목적은 상기 발현 벡터를 포함하는 형질전환 미생물을 제공하는 것이다.

본 발명의 또 다른 하나의 목적은 상기 형질전환 미생물을 배양하는 단계; 및 상기 배양된 미생물 또는 이의 배양 상등액으로부터 리파제를 회수하는 단계;를 포함하는 리파제의 제조방법을 제공하는 것이다.

본 발명의 또 다른 하나의 목적은 서열번호 1의 아미노산 서열에서 N-말단으로부터 52 번째 및 190 번째 아미노산 중 어느 하나 이상의 아미노산이 다른 아미노산으로 치환된, 전이에스터 활성 및 분비 발현능이 증가된 변이형 리파제를 제공하는 것이다.

본 발명에서 개시된 각각의 설명 및 실시형태는 각각의 다른 설명 및 실시 형태에도 적용될 수 있다. 즉, 본 발명에서 개시된 다양한 요소들의 모든 조합이 본 발명의 범주에 속한다. 또한, 하기 기술된 구체적인 서술에 의하여 본 발명의 범주가 제한된다고 볼 수 없다.

상기 목적을 달성하기 위한 하나의 양태로서, 본 발명은 리파제를 코딩하는 핵산을 포함하는 리파제 분비 발현 카세트로서, 상기 리파제는 서열번호 1의 아미노산 서열에서 N-말단으로부터 52 번째 및 190 번째 아미노산 중 어느 하나 이상이 다른 아미노산으로 치환된, 리파제 분비 발현 카세트를 제공한다.

본 발명의 용어, “리파제(lipase)”는 지방을 분해하는 효소를 의미하며, 구체적으로 중성 지방에 작용하여 트라이아실글리세리드에서 다이아실글리세리드와 모노아실글리세리드를 거쳐서 지방산과 글리세린으로 분해하는 효소를 의미한다. 다양한 리파제들 중에서 리조무코르 미에헤이(Rhizomucor miehei) 유래의 리파제는 당-에스터, 왁스-에스터 등 다양한 유화학제품의 생산에 사용되는 대표적 리파제로서, 지방(Triacylglycerol) 분자의 sn-1과 3의 위치에 특이적으로 작용하는 성질을 가진다. 이는 지방의 에스터 결합을 가수분해하여 글리세롤과 지방산으로 분해한 후, 다시 역으로 에스터 전이 반응하는 기능을 가진다. 반응 위치 특이성을 갖는 1,3-특이적 리파제에 의한 반응 중 일부 지방은 1,2(2,3)-디아실글리세롤(DAG)과 모노아실글리세롤(MAG)로 분해되어 가수분해 생성물을 부수적으로 생성하며 결국 재구성 지질 합성에 있어 미량의 DAG과 MAG가 생성될 수 있다. DAG와 MAG는 식품산업에 있어서 유화제로서 이용되고 있으며, 유지의 물성을 변화시켜 유지의 기능을 개선시킨다.

상기 리파제는 서열번호 1의 아미노산 서열과 적어도 80%, 90%, 95%, 96%, 97%, 98% 또는 99% 상동성 또는 서열 동일성을 가지는 폴리펩티드를 포함할 수 있다. 예를 들어, 이러한 상동성 혹은 서열 동일성을 가지며, 상기 서열번호 1의 아미노산 서열을 포함하는 리파제와 상응하는 효능을 나타내는 아미노산 서열이라면, 일부 서열이 결실, 변형, 치환 또는 부가된 아미노산 서열을 가지더라도 본 발명의 범위 내에 포함됨은 자명하다.

즉, 본 발명에서 '특정 서열번호로 기재된 아미노산 서열을 갖는 단백질 또는 폴리펩티드', '특정 서열번호로 기재된 아미노산 서열을 포함하는 단백질 또는 폴리펩티드'라고 기재되어 있다 하더라도, 해당 서열번호의 아미노산 서열로 이루어진 폴리펩티드와 동일 또는 상응하는 활성을 가지는 경우라면, 일부 서열이 결실, 변형, 치환 또는 부가된 아미노산 서열을 갖는 단백질도 본 발명에서 사용될 수 있음은 자명하다. 예를 들어, '서열번호 1의 아미노산 서열로 이루어진 폴리펩티드'는, 이와 동일 또는 상응하는 활성을 가지는 경우라면 '서열번호 1의 아미노산 서열로 이루어진 폴리펩티드'에 속할 수 있음은 자명하다.

또한, 상기 리파제는 본 발명의 리조무코르 미에헤이(Rhizomucor miehei) 유래일 수 있으나, 이에 제한되지 않고 전술한 바와 같이 서열 상동성을 가지면서 동일, 유사한 활성을 나타내는 한 모두 본 발명의 범위에 포함될 수 있다.

상기 리파제는 서열번호 1의 아미노산 서열에서 N-말단으로부터 52번째 아미노산이 아스파라긴(Asn)으로, 및/또는 190번째 아미노산이 아스파르트산(Asp)으로 치환된 리파제일 수 있으나, 이에 제한되지 않는다. 구체적으로, 상기 서열번호 1의 아미노산 서열에서 N-말단으로부터 52번째 아미노산이 아스파라긴(Asn)으로, 190번째 아미노산이 아스파르트산(Asp)으로 치환된 리파제는 서열번호 57의 아미노산 서열을 포함할 수 있으나, 이에 제한되지 않는다. 본 발명의 목적상, 상기 리파제는 리파제의 변이형인 것일 수 있으나, 이에 제한되지 않는다.

본 발명의 용어, "변이형(variant)"은 하나 이상의 아미노산이 보존적 치환(conservative substitution) 및/또는 변형(modification)에 있어서 상기 열거된 서열(the recited sequence)과 상이하나, 상기 단백질의 기능(functions) 또는 특성(properties)이 유지되는 단백질을 지칭한다. 변이형은 수 개의 아미노산 치환, 결실 또는 부가에 의해 식별되는 서열(identified sequence)과 상이하다. 이러한 변이형은 일반적으로 상기 단백질의 아미노산 서열 중 하나 이상의 아미노산을 변형하고, 상기 변형된 단백질의 특성을 평가하여 식별될 수 있다. 즉, 변이형의 능력은 본래 단백질(native protein)에 비하여 증가되거나, 변하지 않거나, 또는 감소될 수 있다. 또한, 일부 변이형은 N-말단 리더 서열 또는 막전이 도메인(transmembrane domain)과 같은 하나 이상의 부분이 제거된 변이형을 포함할 수 있다. 다른 변이형은 성숙 단백질(mature protein)의 N- 및/또는 C-말단으로부터 일부분이 제거된 변이형을 포함할 수 있다. 상기 용어 "변이형"는 변이체, 변형, 변이된 단백질, 변이형 폴리펩티드, 변이 등의 용어(영문 표현으로는 modification, modified protein, modified polypeptide, mutant, mutein, divergent, variant 등)가 사용될 수 있으며, 변이된 의미로 사용되는 용어라면 이에 제한되지 않는다. 본 발명의 목적상, 상기 변이형은 천연의 야생형 또는 비변형 단백질 대비 변이된 단백질의 전이에스터 활성 및 분비 발현능이 증가된 것일 수 있으나, 이에 제한되지 않는다.

상기에서 "분비 발현능"은 단백질을 발현시키고 이를 미생물 밖으로 분비시키는 기능을 의미한다.

본 발명의 구체적인 일실시예에서는, 방향성 진화 방법을 이용하여 리파제의 분비 발현능 및 분비된 리파제의 특이 활성이 향상된 개량 균주에서 리파제의 돌연변이를 확인한 결과, 리파제의 52번째 아미노산이 아스파라긴(Asn)으로, 190번째 아미노산이 아스파르트산(Asp)으로 치환되었음을 확인하였다(표 6).

또한, 본 발명의 구체적인 다른 일실시예에서는, 본 발명의 변이형 리파제를 생산하는 변이주(3G#4)는 리파제 분비 발현량이 증가되었을 뿐만 아니라, 분비된 리파제의 특이 활성도 약 114%로 현저히 증가된 것을 확인하였다(표 8). 또한, 야생형 균주로부터 분비 생산되거나 기존에 시판되는 리파제에 비해 상기 변이주로부터 분비 생산된 리파제는 에스터화 활성 및 전이에스터 활성 모두 월등히 우수함을 확인하였다(도 10).

본 발명의 용어, "발현 카세트(expression cassette)"는 자체적으로 발현되는데 필요한 모든 요소를 포함하는 유전자 구조체를 의미한다. 발현 카세트는 통상 유전자에 작동 가능하게 연결되어 있는 프로모터(promoter), 전사 종결신호, 리보좀 결합부위 및 번역 종결신호를 포함할 수 있다. 상기 발현 카세트는 자체 복제가 가능한 발현 벡터 형태일 수 있다. 또한, 상기 유전자는 그 자체의 형태로 숙주세포에 도입되어 숙주세포에서 발현에 필요한 서열과 작동 가능하게 연결되어 있는 것일 수도 있으며, 이에 제한되지 않는다. 본 발명의 목적상, 상기 발현 카세트는 리파제를 코딩하는 핵산을 포함하는 것일 수 있으며, 리파제의 분비를 유도하는 리파제 분비 발현용 발현 카세트일 수 있다.

본 발명의 용어, "핵산"은 알려져 있는 모든 생명체에 필수적인 생체고분자 또는 작은 생체분자로, DNA와 RNA를 모두 포함한다. 핵산은 뉴클레오타이드 단위체로 구성되어 있으며, 뉴클레오타이드는 인산, 5탄당, 핵염기의 3가지 구성 성분으로 이루어진 단위체이다. 핵산은 여러 개의 뉴클레오타이드가 결합한 폴리뉴클레오타이드이므로, 상기 핵산은 폴리뉴클레오타이드 또는 유전자와 혼용하여 사용할 수 있다.

상기 리파제를 코딩하는 핵산은 코돈의 축퇴성(degeneracy)으로 인하여 또는 상기 리파제, 즉, 폴리펩티드를 발현시키고자 하는 생물에서 선호되는 코돈을 고려하여, 폴리펩티드의 아미노산 서열을 변화시키지 않는 범위 내에서 코딩 영역에 다양한 변형이 이루어질 수 있다. 구체적으로, 서열번호 1의 아미노산 서열에서 N-말단으로부터 52 번째 및 190 번째 아미노산 중 어느 하나 이상이 다른 아미노산으로 치환된 리파제를 코딩하는 폴리뉴클레오티드 서열이라면 제한 없이 포함할 수 있다.

또한 공지의 유전자 서열로부터 조제될 수 있는 프로브, 예를 들면, 상기 염기 서열의 전체 또는 일부에 대한 상보 서열과 엄격한 조건 하에 하이드리드화하여, 서열번호 1의 아미노산 서열로 이루어지는 리파제 활성을 가지는 단백질을 코딩하는 서열이라면 제한없이 포함될 수 있다. 상기 "엄격한 조건(stringent condition)"이란 폴리뉴클레오티드 간의 특이적 혼성화를 가능하게 하는 조건을 의미한다. 이러한 조건은 문헌(예컨대, J. Sambrook et al., 상동)에 구체적으로 기재되어 있다. 예를 들어, 상동성 또는 동일성이 높은 유전자끼리, 40% 이상, 구체적으로는 90% 이상, 보다 구체적으로는 95% 이상, 더욱 구체적으로는 97% 이상, 특히 구체적으로는 99% 이상의 상동성 또는 동일성을 갖는 유전자끼리 하이브리드화하고, 그보다 상동성 또는 동일성이 낮은 유전자끼리 하이브리드화하지 않는 조건, 또는 통상의 써던 하이브리드화(southern hybridization)의 세척 조건인 60 ℃, 1ХSSC, 0.1% SDS, 구체적으로는 60 ℃, 0.1ХSSC, 0.1% SDS, 보다 구체적으로는 68 ℃, 0.1ХSSC, 0.1% SDS에 상당하는 염 농도 및 온도에서, 1회, 구체적으로는 2회 내지 3회 세정하는 조건을 열거할 수 있다.

혼성화는 비록 혼성화의 엄격도에 따라 염기 간의 미스매치(mismatch)가 가능할지라도, 두 개의 핵산이 상보적 서열을 가질 것을 요구한다. 용어, "상보적"은 서로 혼성화가 가능한 뉴클레오티드 염기 간의 관계를 기술하는데 사용된다. 예를 들면, DNA에 관하여, 아데노신은 티민에 상보적이며 시토신은 구아닌에 상보적이다. 따라서, 본 발명은 또한 실질적으로 유사한 핵산 서열뿐만 아니라 전체 서열에 상보적인 단리된 핵산 단편을 포함할 수 있다.

구체적으로, 상동성 또는 동일성을 가지는 폴리뉴클레오티드는 55 ℃의 Tm 값에서 혼성화 단계를 포함하는 혼성화 조건을 사용하고 상술한 조건을 사용하여 탐지할 수 있다. 또한, 상기 Tm 값은 60 ℃, 63 ℃ 또는 65 ℃일 수 있으나, 이에 제한되는 것은 아니고 그 목적에 따라 당업자에 의해 적절히 조절될 수 있다.

폴리뉴클레오티드를 혼성화하는 적절한 엄격도는 폴리뉴클레오티드의 길이 및 상보성 정도에 의존하고 변수는 해당기술분야에 잘 알려져 있다(Sambrook et al., supra, 9.50-9.51, 11.7-11.8 참조).

본 발명에서, 용어 '상동성(homology)' 또는 '동일성(identity)'은 두 개의 주어진 아미노산 서열 또는 염기 서열과 관련된 정도를 의미하며 백분율로 표시될 수 있다. 용어 상동성 및 동일성은 종종 상호교환적으로 이용될 수 있다.

보존된(conserved) 폴리뉴클레오티드 또는 폴리펩티드의 서열 상동성 또는 동일성은 표준 배열 알고리즘에 의해 결정되며, 사용되는 프로그램에 의해 확립된 디폴트 갭 페널티가 함께 이용될 수 있다. 실질적으로, 상동성을 갖거나(homologous) 또는 동일한(identical) 서열은 일반적으로 서열 전체 또는 전체-길이의 적어도 약 50%, 60%, 70%, 80% 또는 90%를 따라 중간 또는 높은 엄격한 조건(stringent conditions)에서 하이브리드할 수 있다. 하이브리드화는 폴리뉴클레오티드에서 코돈 대신 축퇴 코돈을 함유하는 폴리뉴클레오티드 또한 고려된다.

임의의 두 폴리뉴클레오티드 또는 폴리펩티드 서열이 상동성, 유사성 또는 동일성을 갖는지 여부는 예를 들어, Pearson et al (1988)[Proc. Natl. Acad. Sci. USA 85]: 2444에서와 같은 디폴트 파라미터를 이용하여 "FASTA" 프로그램과 같은 공지의 컴퓨터 알고리즘을 이용하여 결정될 수 있다. 또는, EMBOSS 패키지의 니들만 프로그램(EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends Genet. 16: 276-277)(버전 5.0.0 또는 이후 버전)에서 수행되는 바와 같은, 니들만-운치(Needleman-Wunsch) 알고리즘(Needleman and Wunsch, 1970, J. Mol. Biol. 48: 443-453)이 사용되어 결정될 수 있다(GCG 프로그램 패키지 (Devereux, J., et al, Nucleic Acids Research 12: 387 (1984)), BLASTP, BLASTN, FASTA (Atschul, [S.] [F.,] [ET AL, J MOLEC BIOL 215]: 403 (1990); Guide to Huge Computers, Martin J. Bishop, [ED.,] Academic Press, San Diego,1994, 및 [CARILLO ETA/.](1988) SIAM J Applied Math 48: 1073을 포함한다). 예를 들어, 국립 생물공학 정보 데이터베이스 센터의 BLAST, 또는 ClustalW를 이용하여 상동성, 유사성 또는 동일성을 결정할 수 있다.

폴리뉴클레오티드 또는 폴리펩티드의 상동성, 유사성 또는 동일성은 예를 들어, Smith and Waterman, Adv. Appl. Math (1981) 2:482 에 공지된 대로, 예를 들면, Needleman et al. (1970), J Mol Biol. 48:443과 같은 GAP 컴퓨터 프로그램을 이용하여 서열 정보를 비교함으로써 결정될 수 있다. 요약하면, GAP 프로그램은 두 서열 중 더 짧은 것에서의 기호의 전체 수로, 유사한 배열된 기호(즉, 뉴클레오티드 또는 아미노산)의 수를 나눈 값으로 정의한다. GAP 프로그램을 위한 디폴트 파라미터는 (1) 이진법 비교 매트릭스(동일성을 위해 1 그리고 비-동일성을 위해 0의 값을 함유함) 및 Schwartz and Dayhoff, eds., Atlas Of Protein Sequence And Structure, National Biomedical Research Foundation, pp. 353-358 (1979)에 의해 개시된 대로, Gribskov et al(1986) Nucl. Acids Res. 14: 6745의 가중된 비교 매트릭스(또는 EDNAFULL(NCBI NUC4.4의 EMBOSS 버전) 치환 매트릭스); (2) 각 갭을 위한 3.0의 페널티 및 각 갭에서 각 기호를 위한 추가의 0.10 페널티(또는 갭 개방 패널티 10, 갭 연장 패널티 0.5); 및 (3) 말단 갭을 위한 무 페널티를 포함할 수 있다.

또한, 임의의 두 폴리뉴클레오티드 또는 폴리펩티드 서열이 상동성, 유사성 또는 동일성을 갖는지 여부는 정의된 엄격한 조건하에서 써던 혼성화 실험에 의해 서열을 비교함으로써 확인할 수 있으며, 정의되는 적절한 혼성화 조건은 해당 기술 범위 내이고, 당업자에게 잘 알려진 방법(예컨대, J. Sambrook et al., Molecular Cloning, A Laboratory Manual, 2nd Edition, Cold Spring Harbor Laboratory press, Cold Spring Harbor, New York, 1989; F.M. Ausubel et al., Current Protocols in Molecular Biology, John Wiley & Sons, Inc., New York)으로 결정될 수 있다.

본 발명에 있어서, 상기 서열번호 1의 아미노산 서열은 서열번호 2의 염기서열로 코딩되는 것일 수 있으나, 이에 제한되지 않는다.

본 발명의 리파제 분비 발현 카세트는 단백질 분비 융합인자(translational fusion partner, TFP)를 코딩하는 핵산을 추가적으로 포함하는 것일 수 있으나, 이에 제한되지 않는다.

본 발명의 용어, "단백질 분비 융합인자(translational fusion partner, TFP)"는 난발현성 단백질을 코딩하는 유전자와 융합되어 난발현성 단백질의 분비생산을 유도하는 유전자를 의미한다. 본 발명의 목적상, 상기 난발현성 단백질은 리조무코르 미에헤이 유래 리파제일 수 있으나, 이에 제한되지 않는다.

상기 단백질 분비 융합인자는 한국공개특허 제10-2008-0042823호에 개시된 것일 수 있고,　서열번호 7의 TFP 1, 서열번호 8의 TFP 2, 서열번호 9의 TFP 3, 서열번호 10의 TFP 4, 서열번호 11의 TFP 5, 서열번호 12의 TFP 6, 서열번호 13의 TFP 7, 서열번호 14의 TFP 8, 서열번호 15의 TFP 9, 서열번호 16의 TFP 10, 서열번호 17의 TFP 11, 서열번호 18의 TFP 12, 서열번호 19의 TFP 13, 서열번호 20의 TFP 14, 서열번호 21의 TFP 15, 서열번호 22의 TFP 16, 서열번호 23의 TFP 17, 서열번호 24의 TFP 18, 서열번호 25의 TFP 19, 서열번호 26의 TFP 20, 서열번호 27의 TFP 21, 서열번호 28의 TFP 22, 서열번호 29의 TFP 23, 서열번호 30의 TFP 24일 수 있다. 보다 구체적으로, 상기 단백질 분비 융합인자는 서열번호 10로 이루어진 TFP 4, 서열번호 14으로 이루어진 TFP 8, 서열번호 19로 이루어진 TFP 13 또는 서열번호 25로 이루어진 TFP 19일 수 있으나, 목적 단백질의 분비 발현을 향상시킬 수 있는 인자라면 제한 없이 포함될 수 있다.

　따라서 서열번호 7, 서열번호 8, 서열번호 9, 서열번호 10, 서열번호 11, 서열번호 12, 서열번호 13, 서열번호 14, 서열번호 15, 서열번호 16, 서열번호 17, 서열번호 18, 서열번호 19, 서열번호 20, 서열번호 21, 서열번호 22, 서열번호 23, 서열번호 24, 서열번호 25, 서열번호 26, 서열번호 27, 서열번호 28, 서열번호 29 또는 서열번호 30의 아미노산 서열을 포함하거나, 또는 상기 서열번호 7, 서열번호 8, 서열번호 9, 서열번호 10, 서열번호 11, 서열번호 12, 서열번호 13, 서열번호 14, 서열번호 15, 서열번호 16, 서열번호 17, 서열번호 18, 서열번호 19, 서열번호 20, 서열번호 21, 서열번호 22, 서열번호 23, 서열번호 24, 서열번호 25, 서열번호 26, 서열번호 27, 서열번호 28, 서열번호 29 또는 서열번호 30의 아미노산 서열의 보존서열을 포함하고 하나 이상의 위치에서 1 개 또는 다수 개(단백질의 아미노산 잔기의 입체 구조에 있어서의 위치나 종류에 따라서 상이하지만, 구체적으로는 2 내지 20 개, 보다 구체적으로는 2 내지 10 개, 보다 더 구체적으로는 2 내지 5 개)의 아미노산이 치환, 결실, 삽입, 첨가 또는 역위된 아미노산 서열을 포함할 수 있는데, 상기 목적 단백질의 분비　발현을 향상시킬 수 있는 한, 서열번호 7, 서열번호 8, 서열번호 9, 서열번호 10, 서열번호 11, 서열번호 12, 서열번호 13, 서열번호 14, 서열번호 15, 서열번호 16, 서열번호 17, 서열번호 18, 서열번호 19, 서열번호 20, 서열번호 21, 서열번호 22, 서열번호 23, 서열번호 24, 서열번호 25, 서열번호 26, 서열번호 27, 서열번호 28, 서열번호 29 또는 서열번호 30의 아미노산 서열에 대하여, 80 % 이상, 구체적으로는 90 % 이상, 보다 구체적으로는 95 % 이상, 특히 구체적으로는 97 % 이상의 상동성을 갖는 아미노산 서열을 포함할 수 있고, 상기 아미노산의 치환, 결실, 삽입, 첨가 또는 역위 등에는 상기 TFP의 활성을 함유하는 미생물에서 천연적으로 생기는 돌연변이 서열 또는 인위적인 변이 서열까지도 포함할 수 있다.

본 발명의 구체적인 일실시예에서는, 상기 24종의 단백질 분비 융합인자를 각각 도입한 형질전환 사카로마이세스 세레비지에 균주에서 리파제가 분비 생산됨을 확인하였고, pH 적정법을 통해 분비된 리파제의 효소 활성을 확인한 결과, TFP 4, 8, 13 및 19가 분비 발현능 및 효소 활성이 가장 우수함을 확인하였다(도 5).

상기 TFP 4는 서열번호 10, TFP 8은 서열번호 14, TFP 13은 서열번호 19, TFP19는 서열번호 25를 포함하는 것일 수 있으나, 이에 제한되지 않는다.

또한, 상기 단백질 분비 융합인자 TFP 19는 서열번호 25의 아미노산 서열에서 N-말단으로부터 109번째 아미노산이 트레오닌(Thr)으로 치환된 것일 수 있으나, 이에 제한되지 않는다.

본 발명의 구체적인 일실시에에서는, 방향성 진화 방법을 이용하여 리파제의 분비 발현능 및 분비된 리파제의 특이 활성이 향상된 개량 효소의 돌연변이를 확인한 결과, 단백질 분비 융합인자 TFP19의 109번째 아미노산이 트레오닌(Thr)으로 치환되었음을 확인하였다(표 6).

상기 리파제 분비　발현　카세트에 있어서, 상기 카세트에 포함되는 리파제를 코딩하는 핵산 및 단백질 분비 융합인자를 코딩하는 핵산은 링커(linker)로 서로 연결된 것일 수 있다.

상기 링커는 프로테아제 인식 서열 또는 친화성 태그(affinity tag)를 포함하는 것일 수 있다. 본 발명의 목적상, 상기 링커는 프로테아제인 케신(Kexin) (EC 3.4.21.61)의 인식 서열인 Lys-Arg(KR) 서열을 포함하는 것일 수 있고, 구체적으로 상기 링커는 LDKR의 아미노산 서열을 포함하는 것일 수 있으나, 이에 제한되지 않는다(도 11).

또한, 본 발명에서 사용되는 리파제를 코딩하는 핵산 서열은 본 발명의 선형 벡터와 세포 내에서 재조합시키는데 사용되는 링커 DNA를 포함할 수 있다. 이러한 링커 서열을 리파제를 코딩하는 핵산 서열에 부가하는 것은 일반적인 DNA 기술, 예컨대 PCR 및/또는 제한효소 절단 및 연결로 수행할 수 있다.

본 발명의 링커 DNA는 충분한 길이여야 하고, 숙주 세포 내로 도입되어 세포 내에서 리파제를 코딩하는 핵산 서열이 TFP를 코딩하는 핵산 서열을 포함하는 선형 벡터안에 재조합을 일으킬 수 있도록 선형 벡터의 핵산 서열 일부와 충분한 상동성을 가지는 것일 수 있다. 구체적으로, 링커 DNA는 20 bp 이상의 길이, 예컨대 30 또는 40 bp 이상의 길이를 갖는다. 보다 구체적으로, 링커 DNA는 선형 벡터와 최소 80 % 정도 상동성을 가지며, 85 %, 90 %, 95 % 또는 99 %의 상동성을 가질 수 있다.

본 발명의 리파제 분비　발현　카세트에 포함되는 리파제는 서열번호 1의 아미노산 서열에서 N-말단으로부터 52 번째 및 190 번째 아미노산 중 어느 하나 이상이 다른 아미노산으로 치환된 아미노산 서열에서 N-말단에 세린(serine) 및 발린(valine)으로 이루어지는 아미노산 서열이 추가된 것일 수 있으나, 이에 제한되지 않는다. 상기 서열번호 1의 아미노산 서열에서 N-말단으로부터 52 번째 및 190 번째 아미노산 중 어느 하나 이상이 다른 아미노산으로 치환된 아미노산 서열은 서열번호 57의 아미노산 서열을 포함하는 것일 수 있으나, 이에 제한되지 않는다.

구체적으로, 상기 세린(serine) 및 발린(valine)으로 이루어지는 아미노산 서열(Ser-Val, SV)은 서열번호 57의 아미노산 서열의 N-말단에, 보다 구체적으로, 서열번호 57의 아미노산 서열의 N-말단과 링커 내 케신(Kexin)의 인식부위인 Lys-Arg(KR) 서열의 하단 사이에 추가되어, 케신의 절단 효율을 높일 수 있다. 상기 SV 서열이 추가됨으로써, TFP와 RML을 연결하는 링커 서열은 LDKR에서 LDKRSV로 변경되는 것일 수 있다.

본 발명에 따른 리파제와 TFP는 케신 인식 서열인 KR을 포함하는 링커로 연결되어 있는 상태로 발현되며, 미생물로부터 리파제 분비 시에는 골지체에서 TFP가 케신에 의해 절단되어 온전한 형태의 리파제만 분비된다. 상기 케신은 Lys-Arg(KR) 서열을 인식하고 절단하는 역할을 한다. 그러나, 리파제의 구조에 의해서 케신 인식 부위가 표면으로 노출되지 않는 경우, 케신이 접근할 수 없기 때문에 TFP와 RML은 분리되지 않고 융합 단백질 형태로 분비된다. 이러한 융합 단백질은 효소 활성에 부정적인 영향을 미칠 수 있기 때문에 융합 단백질이 발현되는 것을 최소화하는 것이 고활성 단백질 생산에 도움이 될 수 있다. 이에, 케신의 효율을 높여주는 것으로 확인된 SV 서열을 N-말단에 추가하였다.

구체적으로, 상기 서열번호 57의 아미노산 서열에서 N-말단에 SV 서열이 추가된 리파제는 서열번호 60으로 이루어진 아미노산 서열을 포함하는 것일 수 있다.

본 발명의 구체적인 일실시예에서는, TFP19 분비 시그널을 이용하여 RML-3G#4을 생산한 경우 분비 시그널이 잘리지 않은 형태의 융합 단백질도 같이 생산되나, 케신의 TFP 절단 효율을 높여주는 것으로 확인된 SV 아미노산 서열을 리파제의 N-말단에 추가한 결과 융합 단백질 발현이 현저히 감소하는 것을 확인하였다(도 11). 또한, SV 아미노산 서열이 추가되어 발현된 리파제의 활성이 SV 아미노산 서열이 추가되지 않은 리파제에 비해 116% 증가함을 확인하였다(도 12).

본 발명의 다른 하나의 양태는 상기 분비 발현 카세트를 포함하는 벡터를 제공하는 것이다.

상기 용어 "발현 카세트" 등에 대한 설명은 전술한 바와 같다.

본 발명의 용어, "벡터"는 적합한 숙주 세포 내에서 목적 유전자를 발현시킬 수 있도록 유전 물질을 보유하는 인위적 DNA 분자로서, 적합한 유전자 발현 조절 서열; 및 이에 작동 가능하게 연결된 목적 유전자의 뉴클레오티드 서열을 포함하는 DNA 제조물을 의미한다. 상기 "목적 유전자"는 발현을 증가시키고자 하는 목적 단백질을 코딩하는 유전자를 의미하며, 특히, 본 발명에서 상기 유전자는 리파제 및 단백질 분비 융합인자를 코딩하는 유전자를 의미한다.

구체적으로, 상기 유전자 발현 조절 서열은 유전자의 전사를 실시하기 위한 프로모터 외에 전사를 조절하기 위한 임의의 오퍼레이터 서열, 적합한 mRNA 리보좀 결합 부위를 코딩하는 서열 및 전사 및 해독의 종결을 조절하는 DNA를 포함할 수 있으나, 이에 제한되지 않는다. 또한, 원핵 생물에 적합한 조절 서열로서 프로모터, 및 리보좀 결합 부위를 포함할 수 있으나, 이에 제한되지 않는다.

상기 벡터는 적당한 숙주세포 내로 형질전환된 후, 숙주 게놈과 무관하게 복제되거나 기능할 수 있으며, 게놈 그 자체에 통합될 수 있다.

본 발명에서 사용되는 벡터는 숙주세포 내에서 복제 가능한 것이면 특별히 한정되지 않으며, 당업계에 알려진 임의의 벡터를 이용할 수 있다. 통상 사용되는 벡터의 예로는 천연 상태이거나 재조합된 상태의 플라스미드, 코스미드, 바이러스 및 박테리오파지를 들 수 있다. 예를 들면, 파지 벡터 또는 코스미드 벡터로서 pWE15, M13, MBL3, MBL4, IXII, ASHII, APII, t10, t11, Charon4A, 및 Charon21A 등을 사용할 수 있으며, 플라스미드 벡터로서 pRS416, pRS426, pRS415, pRS425, YEp13, YEp24, YCp50, pBR계, pUC계, pBluescriptII계, pGEM계, pTZ계, pCL계 및 pET계 등을 사용할 수 있다.

일례로 세포 내 염색체 삽입용 벡터를 통해 염색체 내에 목적 폴리펩티드를 코딩하는 폴리뉴클레오티드를 염색체 내로 삽입할 수 있다. 상기 폴리뉴클레오티드의 염색체 내로의 삽입은 당업계에 알려진 임의의 방법, 예를 들면, 상동재조합(homologous recombination)에 의하여 이루어질 수 있으나, 이에 제한되지 않는다. 상기 염색체 삽입 여부를 확인하기 위한 선별 마커(selection marker)를 추가로 포함할 수 있다. 선별 마커는 벡터로 형질전환된 세포를 선별, 즉 목적 핵산 분자의 삽입 여부를 확인하기 위한 것으로, 약물 내성, 영양 요구성, 세포 독성제에 대한 내성 또는 표면 폴리펩티드의 발현과 같은 선택가능 표현형을 부여하는 마커들이 사용될 수 있다. 선택제(selective agent)가 처리된 환경에서는 선별 마커를 발현하는 세포만 생존하거나 다른 표현 형질을 나타내므로, 형질전환된 세포를 선별할 수 있다.

상기에서 용어 "작동 가능하게 연결"된 것이란 본 발명의 목적 폴리펩티드를 코딩하는 폴리뉴클레오티드의 전사를 개시 및 매개하도록 하는 프로모터 서열과 상기 유전자 서열이 기능적으로 연결되어 있는 것을 의미한다.

또한, 상기 벡터에는, 목적 유전자의　발현 억제 또는 증폭, 또는 유도를 위한 각종의 기능을 가진　발현　조절용 단편이나, 형질전환체의 선택을 위한 마커나 항생물질에 대한 내성 유전자, 난발현성 단백질의 분비　발현에 적합한 맞춤형 융합인자 등을 추가로 포함할 수 있다. 특히, 상기 난발현성 단백질에 적합한 맞춤형 융합인자로서, 상기 단백질 분비 융합인자를 사용함이 바람직할 수 있으나, 이에 제한되지 않는다.

본 발명의 구체적인 일실시예에서는, 서열번호 1로 이루어진 리파제를 고분비 생산하는 TFP 19를 선별하여, 발현 벡터 YGasST19-RML-6H를 제작하였다(도 6).

본 발명의 다른 하나의 양태는 상기 발현 벡터를 포함하는 형질전환 미생물을 제공하는 것이다.

상기 용어 "벡터" 등에 대한 설명은 전술한 바와 같다.

본 발명의 용어, “형질전환”은 DNA를 숙주세포로 도입하여 DNA가 염색체 외 인자로서 또는 염색체 통합완성에 의해 복제 가능하게 되는 것을 의미한다.

본 발명의 형질전환 방법은 임의의 형질전환 방법이 사용될 수 있으며, 당업계의 통상적인 방법에 따라 용이하게 수행할 수 있다.

본 발명의 용어, "형질전환 미생물"은 전술한 형질전환의 대상이 되는 미생물, 즉, 형질전환에 사용된 미생물을 의미하며, 숙주 세포와 혼용하여 사용될 수 있다.

본 발명에 따른 형질전환 미생물은 당업계에 널리 알려져 있는 숙주 세포라면 어떤 것이나 사용할 수 있으나, 본 발명의 리파제 유전자의 도입 효율과　발현 효율이 높은 숙주를 사용할 수 있는데, 예를 들면 박테리아, 곰팡이, 효모를 포함할 수 있다. 구체적으로 상기 형질전환 미생물은 효모일 수 있고, 더 구체적으로 상기 효모는 캔디다(Candida), 디베리오마이세스(Debaryomyces), 한세눌라(Hansenula), 클루이베로마이세스(Kluyveromyces), 피키아(Pichia), 스키조사카로마이세스(Schizosaccharomyces), 야로이야(Yarrowia), 사카로마이세스(Saccharomyces), 슈완니오마이세스(Schwanniomyces) 또는 아르술라(Arxula) 속에 속하는 것일 수 있으며, 보다 구체적으로 캔디다 뷰티리(Candida　butyri), 캔디다 유틸리스(Candida utilis), 캔디다 보이디니(Candida　boidinii), 캔디다 알비칸스(Candida albicans), 클루이베로마이세스 락티스(Kluyveromyces　lactis), 피키아 파스토리스(Pichia pastoris), 피키아 스티피티스(Pichia stipitis), 스키조사카로마이세스 폼베(Schizosaccharomyces pombe), 사카로마이세스 세레비지에(Saccharomyces cerevisiae), 한세눌라 폴리모르파(Hansenula　polymorpha), 야로이야 리폴리티카(Yarrowia lipolytica), 슈완니오마이세스 옥시덴탈리스(Schwanniomyces occidentalis) 또는 아르술라 아데니니보란스(Arxula adeninivorans)일 수 있으나, 이에 제한되지 않는다.

본 발명의 구체적인 일실시예에서는, 서열번호 1의 리파제 유전자를 단백질 분비 융합인자(TFP)를 포함하는 GA110 프로모터 벡터에 연결하고, 이를 도입한 효모 형질 전환체인 사카로마이세스 세레비지에 균주를 제작하였다.

상기 균주는 리파제의 활성 또는 분비 발현이 야생형 또는 비변형 미생물에서의 활성 또는 분비 발현을 기준으로 하여 증가한 것일 수 있으나, 이에 제한되지 않는다.

본 발명의 용어 "비변형 미생물"은 미생물에 자연적으로 발생할 수 있는 돌연변이를 포함하는 균주를 제외하는 것이 아니며, 천연형 균주 자체이거나, 상기 발현 카세트를 포함하지 않는 미생물, 상기 벡터로 형질전환되지 않은 미생물 또는 형질전환 등의 변형 전 미생물을 의미한다.

본 발명의 다른 하나의 양태는 상기 형질전환 미생물을 배양하는 단계; 및 상기 배양된 미생물 또는 이의 배양 상등액으로부터 리파제를 회수하는 단계;를 포함하는 리파제의 제조방법을 제공하는 것이다.

상기 용어 "형질전환", "리파제", "형질전환 미생물" 등에 대한 설명은 전술한 바와 같다.

본 발명의 용어 "배양 상등액"은 배양액을 원심분리하여 수득한 상등액을 의미한다.

본 발명의 용어 "배양"은 미생물을 적당히 인공적으로 조절한 환경조건에서 생육시키는 것을 의미한다. 본 발명에서 상기 형질전환 미생물을 이용하여 목적 물질을 생산하는 방법은 당업계에 널리 알려져 있는 방법을 이용하여 수행할 수 있다. 구체적으로, 상기 배양은 배치 공정, 주입 배치 또는 반복 주입 배치 공정(fed batch or repeated fed batch process)에서 연속식으로 배양할 수 있으나, 이에 제한되는 것은 아니다. 배양에 사용되는 배지는 적절한 방식으로 특정 균주의 요건을 충족해야 한다.

배지 중에서 사용될 수 있는 당원으로는 포도당, 사카로즈, 유당, 과당, 말토즈, 전분, 셀룰로즈와 같은 당 및 탄수화물, 대두유, 해바라기유, 피마자유, 코코넛유 등과 같은 오일 및 지방, 팔미트산, 스테아린산, 리놀레산과 같은 지방산, 글리세롤, 에탄올과 같은 알코올, 아세트산과 같은 유기산이 포함된다. 이들 물질은 개별적으로 또는 혼합물로서 사용될 수 있으며, 이에 제한되는 것은 아니다.

사용될 수 있는 질소원으로는 펩톤, 효모 추출물, 육즙, 맥아 추출물, 옥수수 침지액, 대두밀 및 요소 또는 무기 화합물, 예를 들면 황산암모늄, 염화암모늄, 인산암모늄, 탄산암모늄 및 질산암모늄이 포함된다. 질소원 또한 개별적으로 또는 혼합물로서 사용할 수 있으며, 이에 제한되는 것은 아니다.

사용될 수 있는 인원으로는 인산이수소칼륨 또는 인산수소이칼륨 또는 상응하는 나트륨을 함유하는 염이 포함될 수 있다. 또한, 배양 배지는 성장에 필요한 황산마그네슘 또는 황산철과 같은 금속염을 함유할 수 있다. 마지막으로, 상기 물질에 더하여 아미노산 및 비타민과 같은 필수 성장 물질이 사용될 수 있다. 또한, 배양 배지에 적절한 전구체들이 사용될 수 있다. 상기된 원료들은 배양과정에서 배양물에 적절한 방식에 의해 회분식으로 또는 연속식으로 첨가될 수 있다.

상기 미생물의 배양 중 수산화나트륨, 수산화칼륨, 암모니아와 같은 기초 화합물 또는 인산 또는 황산과 같은 산 화합물을 적절한 방식으로 사용하여 배양물의 pH를 조절할 수 있다. 또한, 지방산 폴리글리콜 에스터와 같은 소포제를 사용하여 기포 생성을 억제할 수 있다. 호기 상태를 유지하기 위해 배양물 내로 산소 또는 산소-함유 기체(예, 공기)를 주입할 수 있다.

배지의 온도는 보통 20 ℃내지 45 ℃, 구체적으로는 25 ℃ 내지 40 ℃일 수 있다. 배양 시간은 원하는 목적 물질의 생성량이 얻어질 때까지 계속할 수 있으나, 구체적으로는 10 내지 160시간일 수 있다. 본 발명에 있어서, 상기 목적 물질은 리파제일 수 있으나, 이에 제한되지 않는다.

상기 미생물 또는 배양 상등액으로부터의 리파제의 회수는 당업계에 알려진 통상적인 방법에 의하여 분리되어 회수될 수 있다. 이러한 분리 방법에는, 원심분리, 여과, 크로마토그래피 및 결정화 등의 방법이 이용될 수 있다. 예를 들면, 배양액을 저속 원심분리하여 얻어진 상등액을, 이온교환 크로마토그래피를 통하여 분리할 수 있으나, 이에 제한되는 것은 아니다.

상기 회수 단계는 정제 공정을 추가로 포함할 수 있다.

본 발명의 또 다른 하나의 양태는 서열번호 1의 아미노산 서열에서 N-말단으로부터 52번째 및 190번째 아미노산 중 어느 하나 이상의 아미노산이 다른 아미노산으로 치환된, 전이에스터 활성 및 분비 발현능이 증가된 변이형 리파제를 제공하는 것이다.

상기 용어 "변이형 리파제" 등에 대한 설명은 전술한 바와 같다.

상기 변이형 리파제는 서열번호 1의 아미노산 서열에서 N-말단으로부터 52번째 아미노산이 아스파라긴(Asn)으로, 또는 190번째 아미노산이 아스파르트산(Asp)으로 치환된 것일 수 있으나, 이에 제한되지 않으며, 이에 대해서는 전술한 바와 같다.

본 발명의 분비 발현 카세트, 이를 포함하는 발현 벡터 및 이를 포함하는 형질전환 미생물을 이용하여 전이에스터 활성이 개선된 리파제를 고효율로 생산할 수 있으며, 생산된 리파제는 전이에스터 반응이 필요한 모든 공정에 유용하게 이용될 수 있다.

도 1은 리파제 유전자를 24 종의 효모 단백질 분비 융합인자 (TFP)를 포함하는 GAL10 프로모터 벡터에 연결하여 사카로마이세스 세레비지에 균주에 도입하는 생체 내 재조합 과정을 보여주는 모식도이다.
도 2는 사카로마이세스 세레비지에 균주 24 종에서 발현되어 세포 밖으로 분비된 리파제 단백질을 SDS-PAGE와 웨스턴블랏으로 분석한 결과이다.
도 3는 사카로마이세스 세레비지에 균주 24 종 배양액의 리파제 활성을 분석한 결과이다.
도 4는 24 종의 TFP 균주 중에서 1 차로 선별된 4 종의 균주에서 3 개씩의 단일 균주를 배양하여 분비된 리파제 단백질을 SDS-PAGE와 웨스턴블랏으로 분석한 결과이다.
도 5은 24 종의 TFP 균주 중에서 1 차로 선별된 4 종의 균주에서 3 개씩 선별한 단일 균주 배양액의 리파제 활성을 분석한 결과이다.
도 6은 분비 융합 인자 TFP 19번과 리파제 유전자를 포함하고 있는 YGa-ST19-RML-6H 발현 및 분비 벡터의 모식도이다.
도 7은 방향성 진화 방법으로 활성이 개선된 RML을 선별하는 과정을 보여주는 모식도이다.
도 8은 야생형 리파제와 활성이 개선된 리파제 발현균주를 5L 발효조에서 유가식 배양 후 시간별 배양상등액을 SDS-PAGE와 활성 분석한 결과이다.
도 9는 발효 생산된 야생형과 변이주 리파제의 고정화 과정을 보여주는 결과이다.
도 10는 야생형과 변이주 리파제의 전이에스터 반응 활성을 분석한 결과이다.
도 11은 SV가 추가된 RML-3G#4의 발현벡터 구조 및 발현을 확인한 결과이다.
도 12는 유가식 발효를 통한 SV-RML-3G#4 단백질 발현 및 활성을 비교한 결과이다.

이하, 본 발명을 하기 실시예를 통하여 보다 상세하게 설명한다. 그러나 이들 실시예는 본 발명을 예시적으로 설명하기 위한 것으로 본 발명의 범위가 이들 실시예만으로 한정되는 것은 아니다.

<실시예 1> 리조무코르 미에헤이( Rhizomucor miehei ) 유래 리파제 유전자 합성 및 단백질 융합인자(TFP)가 도입된 형질전환체의 제작

효모 균주에 적용할 리조무코르 미에헤이(Rhizomucor miehei) 유래의 리파제(이하, RML) 유전자 분비 발현 벡터를 제작하기 위하여 NCBI GenBank: ATU74725.1의 서열정보를 바탕으로 효모 코돈 최적화 후, ㈜바이오니아에 유전자 합성을 의뢰하였다. 합성된 RML의 경우 1020bp로서(서열번호 1), 339개의 아미노산으로 구성되어 있으며(서열번호 2), 효모에서 인식되는 자체적인 분비 신호는 포함하지 않는다. RML의 아미노산, 뉴클레오타이드 서열을 하기 표 1에 나타내었다.

RML의 분비 발현 벡터를 제작하기 위하여, 서열번호 3 및 서열번호 4으로 이루어진 프라이머를 이용하여, 1차 PCR(94 ℃ 5분 1회, 94 ℃ 30초, 55 ℃ 30초, 72℃ 1분 25회, 72℃ 7분 1회) 반응을 통해 RML 유전자를 증폭시켰다. 1차 PCR로 증폭된 유전자는 다시 LNK39(서열번호 5) 및 HisGT50R(서열번호 6) 프라이머를 이용하여 2차로 증폭시켜, 벡터와 세포내 재조합(in vivo recombination)에 필요한 서열이 도입되고, C-말단에는 히스티딘-태그(Hig-tag)가 도입된 유전자를 확보하였다. 상기 사용된 프라이머의 서열을 하기 표 2에 나타내었다.

RML의 아미노산, 뉴클레오타이드 서열

아미노산 서열	서열번호
VPIKRQSNSTVDSLPPLIPSRTSAPSSSPSTTDPEAPAMSRNGPLPSDVETKYGMALNATSYPDSVVQAMSIDGGIRAATSQEINELTYYTTLSANSYCRTVIPGATWDCIHCDATEDLKIIKTWSTLIYDTNAMVARGDSEKTIYIVFRGSSSIRNWIADLTFVPVSYPPVSGTKVHKGFLDSYGEVQNELVATVLDQFKQYPSYKVAVTGHSLGGATALLCALGLYQREEGLSSSNLFLYTQGQPRVGDPAFANYVVSTGIPYRRTVNERDIVPHLPPAAFGFLHAGEEYWITDNSPETVQVCTSDLETSDCSNSIVPFTSVLDHLSYFGINTGLCT	1
뉴클레오타이드 서열	서열번호
GTGCCAATCAAGAGACAATCAAACAGCACGGTGGATAGTCTGCCACCCCTCATCCCCTCTCGAACCTCGGCACCTTCATCATCACCAAGCACAACCGACCCTGAAGCTCCAGCCATGAGTCGCAATGGACCGCTGCCCTCGGATGTAGAGACTAAATATGGCATGGCTTTGAATGCTACTTCCTATCCGGATTCTGTGGTCCAAGCAATGAGCATTGATGGTGGTATCCGCGCTGCGACCTCGCAAGAAATCAATGAATTGACTTATTACACTACACTATCTGCCAACTCGTACTGCCGCACTGTCATTCCTGGAGCTACCTGGGACTGTATCCACTGTGATGCAACGGAGGATCTCAAGATTATCAAGACTTGGAGCACGCTCATCTATGATACAAATGCAATGGTTGCACGTGGTGACAGCGAAAAAACTATCTATATCGTTTTCCGAGGTTCGAGCTCTATCCGCAACTGGATTGCTGATCTCACCTTTGTGCCAGTTTCATATCCTCCGGTCAGTGGTACAAAAGTACACAAGGGATTCCTGGACAGTTACGGGGAAGTTCAAAACGAGCTTGTTGCTACTGTTCTTGATCAATTCAAGCAATATCCAAGCTACAAGGTTGCTGTTACAGGTCACTCACTCGGTGGTGCTACTGCGTTGCTTTGCGCCCTGGGTCTCTATCAACGAGAAGAAGGACTCTCATCCAGCAACTTGTTCCTTTACACTCAAGGTCAACCACGGGTAGGCGACCCTGCCTTTGCCAACTACGTTGTTAGCACCGGCATTCCTTACAGGCGCACGGTCAATGAACGAGATATCGTTCCTCATCTTCCACCTGCTGCTTTTGGTTTTCTCCACGCTGGCGAGGAGTATTGGATTACTGACAATAGCCCAGAGACTGTTCAGGTCTGCACAAGCGATCTGGAAACCTCTGATTGCTCTAACAGCATTGTTCCCTTCACAAGTGTTCTTGACCATCTCTCGTACTTTGGTATCAACACAGGCCTCTGTACTTAA	2

프라이머	서열	서열번호
RML-TFP-F	CTCGCCTTAGATAAAAGAGTGCCAATCAAGAGACAA	3
RML-TFP-R	TTAGTGATGGTGATGGTGATGCTTAAGTACAGAGGCCTG	4
LNK39	GGCCGCCTCGGCCTCTGCTGGCCTCGCCTTAGATAAAAGA	5
HisGT50R	GTCATTATTAAATATATATATATATATATTGTCACTCCGTTCAAGTCGACTTAGTGATGGTGATGGTGATG	6

상기 증폭된 유전자는 단백질 분비발현을 도와주는 24종의 단백질 분비융합인자(한국등록특허 제0975596호 참조)를 함유한 선형의 벡터와 함께 효모 균주 Y2805G(Mat a pep4::HIS3 prb1 can1 his3-200 ura3-52, gal80)에 도입하여 세포 내 재조합을 통하여 형질전환체가 형성되도록 하였다. LNK39 및 HisGT50R 프라이머로 증폭한 PCR 산물은 벡터의 링커(linker) 말단과 40염기, GAL7 전사 종결자 말단과 50염기가 동일하기 때문에, 선형화된 벡터와 함께 효모 세포로 도입하면 세포 내에서 교차가 일어나게 된다. 이에 따라, RML 유전자와 단백질 분비융합인자(TFP: Translational fusion partner) 벡터가 일정한 방향으로 연결되고, 우라실(uracil)이 없는 선택배지인 SD-Ura 배지(0.67% 아미노산이 결여된 효모기질, 0.77% 우라실이 결핍된 영양보충물, 2% 포도당)에서 선별하여, 대장균을 이용한 벡터 제작 과정 없이 곧바로 각각의 발현벡터가 도입된 형질전환체를 제작하였다(도 1). 본 발명에 사용된 단백질 분비융합인자(TFP)의 아미노산 서열을 하기 표 3에 나타내었다.

단백질 분비 융합인자의 아미노산 서열

단백질 분비 융합인자	아미노산 서열	서열번호
TFP 1	MFNRFNKFQAAVALALLSRGALGDSYTNSTSSADLSSITSVSSASASATASDSLSSSDGTVYLPSTTISGDLTVTGKVIATEAVEVAAGGKLTLLDGEKYVFSSEAASASAGLALDKR	7
TFP 2	MTPYAVAITVALLIVTVSALQVNNSCVAFPPSNLRGKNGDGTNEQYATALLSIPWNGPPESSRDINLIELEPQVALYLLENYINHYYNTTRDNKCPNNHYLMGGQLGSSSDNRSLNEAASASAGLALDKR	8
TFP 3	MQFKNVALAASVAALSATASAEGYTPGEPWSTLTPTGSISCGAAEYTTTFGIAVQAITSSKAKRDVISQIGDGQVQATSAATAQATDSQAQATTTATPTSSEKMAASASAGLALDKR	9
TFP 4	MRFAEFLVVFATLGGGMAAPVESLAGTQRYLVQMKERFTTEKLCALDDKAASASAGLALDKR	10
TFP 5	MFNRFNKFQAAVALALLSRGALGAPVNTTTEDETALIPAEAVIGYLDLEGDFDVAVLPFSNSTNNGLLFINTTIASIAAKEEGVAASASAGLALDKR	11
TFP 6	MRFPSIFTAVLFAASSALAAPVNTTTEDETAQIPAEAVIGYLDLEGDFDVAVLPFSNSTNNGLLFINTTIASIAAKEEGVAASASAGLALDKR	12
TFP 7	MVFGQLYALFIFTLSCCISKTVQADSSKESSSFISFDKESNWDTISTISSTADVISSVDSAIAVFEFDNFSLLDSLMIDEEYPFFNRFFANDVSLTVHDDSPLNISQSLSPIMEQFTVDELPESASDLLYEYSLDDKSIVLFKFTSDAYDLKKLDEFIDSCLSFLEDKSGDNLTVVINSLGWAFEDEDGDDEYATEETLSHHDNNKGKEGDDLAASASAGLALDKR	13
TFP 8	MLQSVVFFALLTFASSVSAIYSNNTVSTTTTLAPSYSLVPQETTISYADDLAASASAGLALDKR	14
TFP 9	MKFSTAVTTLISSGAIVSALPHVDVHQEDAHQHKRAVAYKYVYETVVVDSDGHTVTPAASEVATAATSAIITTSVLAPTSSAAAADSSASIAVSSAALAKNEKISDAAASATASTSQGASSSSYLAASASAGLALDKR	15
TFP 10	MNWLFLVSLVFFCGVSTHPALAMSSNRLLKLANKSPKKIIPLKDSSFENILAPPHENAYIVALFTATAPEIGCSLCLELESEYDTIVASWFDDHPDAKSSNSDTSIFFTKVNLEDPSKTIPKAFQFFQLNNVPRLFIFKLNSPSILDHSVISISTDTGSERMKQIIQAIKQFSQVNDFSLHLPVGLAASASAGLALDKR	16
TFP 11	MKFSSVTAITLATVATVATAKKGEHDFTTTLTLSSDGSLTTTTSTHTTHKYGKFNKTSKSKTPLAASASAGLALDKR	17
TFP 12	MASFATKFVIACFLFFSASAHNVLLPAYGRRCFFEDLSKGDELSISFQFGDRNPQSSSQLTGDFIIYGPERHEVLKTVRELAASASAGLALDKR	18
TFP 13	MQYKKTLVASALAATTLAAYAPSEPWSTLTPTATYSGGVTDYASTFGIAVQPISTTSSASSAATTASSKAKRAASQIGDGQVQAATTTASVSTKSTAAAVSQIGDGQIQATTKTTAAAVSQIGDGQIQATTKTTSAKTTAAAVSQISDGQIQATTTTLAPLAASASAGLALDKR	19
TFP 14	MQFKNALTATAILSASALAANSTTSIPSSCSIGTSATATAQATDSQAQATTTAPLAASASAGLALDKR	20
TFP 15	MVSKTWICGFISIITVVQALSCEKHDVLKKYQVGKFSSLTSTERDTPPSTTIEKWWINVCEEHNVEPPEECKKNDMLCGLTDVILPGKDAITTQIIDFDKNIGFNVEETESALTLTLNGATWGANSFDAKLEFQCNDNMKQDELAASASAGLALDKR	21
TFP 16	MKLSALLALSASTAVLAAPAVHHSDNHHHNDKRAVVTVTQYVNADGAVVIPAATTATSAAADGKVESVAAATTTLSSTAAAATTLAASASAGLALDKR	22
TFP 17	MKLSTVLLSAGLASTTLAQFSNSTSASSTDVTSSSSISTSSGSVTITSSEAPESDNGTSTAAPTETSTEAPTTAIPTNGTSTEAPTTAIPTNGTSTEAPTDTTTEAPTTALPTNGTSTEAPTDTTTEAPTTGLPTNGTTSAFPPTTSLPPSNTTTTPPYNPSTDYTTDYTVVTEYTTYCPERAASASAGLALDKR	23
TFP 18	MRFSTTLATAATALFFTASQVSAIGELAFNLGVKNNDGTCKSTSDYETELQALKSYTSTVKVYAASDCNTLQNLGPAAEAEGFTIFVGVWPLAASASAGLALDKR	24
TFP 19	MRLSNLIASASLLSAATLAAPANHEHKDKRAVVTTTVQKQTTIIVNGAASTPVAALEENAVVNSAPAAATSTTSSAASVATAASSSENNSQVSAAASPASSSAATSTQSSLAASASAGLALDKR	25
TFP 20	MQFSTVASIAAVAAVASAAANVTTATVSQESTTLVTITSCEDHVCSETVSPALVSTATVTVDDVITQYTTWCPLTTEAPKNGTSTAAPVTSTEAPKNTTSAAPTHSVTSYTGAAAKALPAAGALLAASASAGLALDKR	26
TFP 21	MKFSSALVLSAVAATALAESITTTITATKNGHVYTKTVTQDATFVWGGEDSYASSTSAAESSAAETSAAETSAAATTSAAATTSAAETSSAAETSSADEGSGSSITTTITATKNGHVYTKTVTQDATFVWTGEGSSNTWSPSSTSTSSEAATSSASTTATTLLAASASAGLALDKR	27
TFP 22	MKFQVVLSALLACSSAVVASPIENLFKYRAVKASHSKNINSTLPAWNGSNSSNVTYANGTNSTTNTTTAESSQLQIIVTGGQVPITNSSLTHTNYTRLFNSSSALNITELYNVARVVNETIQDNLAASASAGLALDKR	28
TFP 23	MRAITLLSSVVSLALLSKEVLATPPACLLACVAQVGKSSSTCDSLNQVTCYCEHENSAVKKCLDSICPNNDADAAYSAFKSSCSEQNASLGDSSGSASSSVLAASASAGLALDKR	29
TFP 24	MKLSTVLLSAGLASTTLAQFSNSTSASSTDVTSSSSISTSSGSVTITSSEAPESDNGTSTAAPTETSTEAPTTAIPTNGTSTEAPTTAIPTNGTSTEAPTDTTTEAPTTALPTNGTSTEAPTDTTTEAPTTGLPTNGTTSAFPPTTSLPPSNTTTTLAASASAGLALDKR	30

<실시예 2> 단백질 분비융합인자(TFP)를 이용한 RML의 분비 생산 확인

상기 실시예 1에서 제작한 24종의 형질전환체를 이용하여 RML를 분비 생산하고, 높은 분비 생산율을 나타내는 단백질 분비 융합인자(TFP)를 확인하기 위해, YPD 배지(1% 효모추출물, 2% 펩톤, 1% 포도당)에서 40시간 배양한 후 원심분리하여 균체를 제거하고 배양 상등액 0.6 ml을 0.4 ml 아세톤(acetone)으로 침전시켜 SDS-PAGE 분석, 및 항-His 항체를 이용한 웨스턴블랏 분석으로, 분비 발현된 리파제를 확인하였다(도 2).

활성 검증은 pH 적정에 의한 활성이 탐지되지 않아 p-니트로페닐 팔미테이트(p-Nitrophenyl palmitate)를 기질로 하여, 분비 발현된 리파제에 의해 생성되는 p-니트로페놀(p-Nitrophenol)을 410nm 파장으로 흡광도를 측정하여 비교 분석하였다(도 3).

형질전환체의 RML 분비 생산을 SDS-PAGE 및 웨스턴 블랏으로 분석한 결과, 도 2에서 확인할 수 있는 바와 같이, 예상되는 분자량인 38kDa 부근에서 일부 TFP는 발현 단백질이 확인되었으나, 대부분은 예상되는 단백질 위치보다 큰 분자량에서 단백질이 확인되어 다중-밴드(multi-band)로 분리되는 것을 확인하였다. 이러한 결과는 RML 단백질 서열 상에 포함된 2개의 당쇄부과 서열 부위에서 당쇄가 첨가되었음을 나타내는 것이다.

pH 적정법을 통해, 분비된 리파제의 효소 활성을 확인한 결과, 도 3에서 확인할 수 있는 바와 같이, 선별된 TFP 중 TFP 4, 8, 13 및 19가 분비 발현능 및 활성이 가장 우수함을 확인하였다.

상기와 같은 방법으로 선별된 균주는 각 분비 융합 인자의 형질전환체를 혼합하여 분석한 결과이기 때문에, 보다 정확한 분석을 위해 분비 융합 인자 4, 8, 13, 19 당 세 개의 단일 콜로니 균체를 분리하여 RML의 분비 발현능 및 활성을 분석하였다. 구체적으로, 1차 선별에서 수행한 SDS-PAGE 및 웨스턴 블랏에서는 RML에 당쇄가 부가되어있음이 관찰되었으므로, 2차 선별에서는 이를 확인하기 위해, 당쇄분해효소(Endoglycosidase) H를 처리하여 단백질에 결합된 당쇄를 제거한 후에 분석하였다.

동일한 조성의 배지와 조건에서 배양한 시료를 이용하여 SDS-PAGE 분석 및 웨스턴 블랏을 통해 분비 발현능을 확인한 결과, 도 4에서 확인할 수 있는 바와 같이, 예상 분자량 부위에서 분비 발현 단백질(RML)이 생산되었음을 확인하였다.

pH 적정법을 통해 활성을 분석한 결과, 도 5에서 확인할 수 있는 바와 같이, 선별한 TFP 중 TFP 4, 8, 13 및 19가 RML의 분비 발현능 및 효소 활성이 우수함을 확인할 수 있었다. 이에 따라, 최종적으로 RML을 고효율로 분비 생산하는 발현벡터로서, 단백질 분비 융합인자 TFP 19를 함유하는 YGaST19-RML-6H를 최종 균주로 선별하였다(도 6).

<실시예 3> 방향성 진화를 이용한 RML 변이 라이브러리의 제조

RML 유전자에 무작위적으로 변이를 도입하기 위하여 변이유도 중합효소연쇄반응(error-prone PCR, PCR random mutagenesis kit, Clontech, USA) 및 세포내 재조합 방법을 이용하였다. RML 발현 벡터인 YGaST19-RML-6H를 주형으로 GAL100 프라이머(서열번호 55) 및 GT50R 프라이머(서열번호 56)를 사용하여 변이유도 중합효소연쇄반응을 수행하였다. 변이유도는 1kb당 4~7개의 변이가 도입되도록 하였으며, 94℃에서 30초 동안 1회; 94℃ 30초간, 68℃ 2분간 반응을 25회; 68℃에서 1분간 1회 반응 조건으로 수행하였다. 증폭된 PCR 산물을 제한효소 EcoRI/SalI으로 처리하고 동일효소로 선형화한 100ng의 YGa 벡터에 클로닝하여 효모에 형질전환시킨후, 1% 트리뷰티린(tributyrin)을 함유하는 YPD 고체배지 상에서 형질전환체의 활성을 비교하였다(도 7).

그 결과, 대조구인 야생형 RML의 경우 2일간 배양시 전혀 활성이 나타나지 않았으나, 변이주 라이브러리를 발현한 경우에는 아주 약한 활성환이 관찰되었다. 약 3,000개의 형질전환체들의 활성환의 크기를 비교한 결과 활성환이 증가된 36개 변이주를 1차 선별하였다. 1차 선별된 변이주는 가수분해 활성과 전이에스터 반응 활성을 각각 검증하였다. 가수분해 활성은 4-니트로페닐 팔미테이트를 기질로 하여, 리파제에 의해 생성되는 4-니트로페놀의 양을 분석하였으며, 전이에스터 활성은 콩기름 9 ml 및 메탄올 1 ml를 기질로 하여, 배양 상등액을 1 ml 첨가하여 45 ℃에서 1시간 반응 후 형성된 지방산 메틸에스터의 양을 가스크로마토그래피로 분석하였다.

상기 과정을 통하여 얻은 1세대의 변이체 유전자를 주형으로 하여 동일한 방법을 3번 반복하여, 단계적으로 활성이 증가된 2세대 변이체 2G 및 3세대 변이체 3G를 제작하였다. 각 세대별 변이 균주에 포함된 RML 유전자의 서열을 확인한 결과, 1세대 변이체에서는 단백질 분비융합인자 TFP19의 S109T 변이, RML 서열의 K52N, Hig-tag 서열 내 H4D 변이가 확인되었다. 2세대 균주에서는 추가적으로 N190D 변이가 확인되었다. 3세대 균주에서는 추가적인 변이는 없었으나, 130번째 아미노산에 잠재성 돌연변이(silent mutation)만 확인되었다(표 5).

변이 라이브러리 구축을 위해 사용된 프라이머 서열 정보, 방향성 진화를 통한 RML 개량 균주의 변이 서열 정보 및 3G#4 RML 개량균주의 아미노산, 뉴클레오타이드 서열을 각각 하기 표 4 내지 6에 나타내었다.

변이 라이브러리 구축을 위해 사용한 프라이머

프라이머	서열	서열번호
GAL100	GTATATGGTGGTAATGCCATG	55
GT50R	GTCATTATTAAATATATATATATATATATTGTCACTCCGTTCAAGTCGAC	56

방향성 진화를 통한 RML 개량균주의 변이 서열 정보

균주	STFP19	RML	His-tag
WT(야생형)	-	-	-
1G	S109T	K52N	H4D
2G	S109T	K52N,N190D	H4D
3G	S109T	K52N,130(TAT -> TAC),N190D	H4D

방향성 진화를 통한 3G#4 RML 개량균주의 아미노산, 뉴클레오타이드 서열

아미노산 서열	서열번호
VPIKRQSNSTVDSLPPLIPSRTSAPSSSPSTTDPEAPAMSRNGPLPSDVETNYGMALNATSYPDSVVQAMSIDGGIRAATSQEINELTYYTTLSANSYCRTVIPGATWDCIHCDATEDLKIIKTWSTLIYDTNAMVARGDSEKTIYIVFRGSSSIRNWIADLTFVPVSYPPVSGTKVHKGFLDSYGEVQDELVATVLDQFKQYPSYKVAVTGHSLGGATALLCALGLYQREEGLSSSNLFLYTQGQPRVGDPAFANYVVSTGIPYRRTVNERDIVPHLPPAAFGFLHAGEEYWITDNSPETVQVCTSDLETSDCSNSIVPFTSVLDHLSYFGINTGLCTHHHDHH	57
뉴클레오타이드 서열	서열번호
GTGCCAATCAAGAGACAATCAAACAGCACGGTGGATAGTCTGCCACCCCTCATCCCCTCTCGAACCTCGGCACCTTCATCATCACCAAGCACAACCGACCCTGAAGCTCCAGCCATGAGTCGCAATGGACCGCTGCCCTCGGATGTAGAGACTAATTATGGCATGGCTTTGAATGCTACTTCCTATCCGGATTCTGTGGTCCAAGCAATGAGCATTGATGGTGGTATCCGCGCTGCGACCTCGCAAGAAATCAATGAATTGACTTATTACACTACACTATCTGCCAACTCGTACTGCCGCACTGTCATTCCTGGAGCTACCTGGGACTGTATCCACTGTGATGCAACGGAGGATCTCAAGATTATCAAGACTTGGAGCACGCTCATCTATGATACAAATGCAATGGTTGCACGTGGTGACAGCGAAAAAACTATCTATATCGTTTTCCGAGGTTCGAGCTCTATCCGCAACTGGATTGCTGATCTCACCTTTGTGCCAGTTTCATATCCTCCGGTCAGTGGTACAAAAGTACACAAGGGATTCCTGGACAGTTACGGGGAAGTTCAAGACGAGCTTGTTGCTACTGTTCTTGATCAATTCAAGCAATATCCAAGCTACAAGGTTGCTGTTACAGGTCACTCACTCGGTGGTGCTACTGCGTTGCTTTGCGCCCTGGGTCTCTATCAACGAGAAGAAGGACTCTCATCCAGCAACTTGTTCCTTTACACTCAAGGTCAACCACGGGTAGGCGACCCTGCCTTTGCCAACTACGTTGTTAGCACCGGCATTCCTTACAGGCGCACGGTCAATGAACGAGATATCGTTCCTCATCTTCCACCTGCTGCTTTTGGTTTTCTCCACGCTGGCGAGGAGTATTGGATTACTGACAATAGCCCAGAGACTGTTCAGGTCTGCACAAGCGATCTGGAAACCTCTGATTGCTCTAACAGCATTGTTCCCTTCACAAGTGTTCTTGACCATCTCTCGTACTTTGGTATCAACACAGGCCTCTGTACTCATCACCATgACCATCACTAA	58

개량된 3G#4 변이주(서열번호 57)와 야생형 균주 간의 분비 발현율 및 특이 활성의 명확한 비교를 위해, 5L 발효조에서 유가식 배양을 수행하였다(도 8). 본 배양에 들어가기 전에, 50ml YNB 배지에서 초기 배양한 후, 200ml 액체배지에서 배양하여 활성화시킨 후, 본 배양액에 접종하여 30℃에서 48시간 동안 배양하였다. 분비된 리파제를 확인하기 위하여, 시간별 배양 상등액을 취하여 SDS-PAGE 분석하였다.

야생형 균주 및 변이주의 RML 분비 발현율 및 분비된 RML의 특이 활성을 비교한 결과, 도 8에서 확인할 수 있는 바와 같이, 48시간 배양 후, 야생형 및 3G#4 변이주 각각은 0.76g/L 및 0.93g/L의 리파제가 분비 생산되었음을 확인하였다. 이를 통해, 야생형 균주에 비해 본 발명의 변이주가 더 많은 양의 리파제를 분비 생산할 수 있음을 확인할 수 있었다.

또한, pNPP를 이용하여 가수분해 활성을 분석한 결과, 야생형은 44,820U/L, 3G#4 변이주는 62,910U/L의 활성을 나타냄을 확인하였다. 이를 통해, 야생형 균주에 비해 본 발명의 변이주로부터 생산된 RML이 더 우수한 가수분해 활성을 나타냄을 확인할 수 있다.

즉, 본 발명의 변이주(3G#4)는 리파제 분비 발현량을 증가시킬 뿐만 아니라, 분비된 RML의 특이 활성도 약 114%로 현저히 증가시킴을 확인하였다(표 7).

야생형과 변이주의 단백질 발현량과 활성 비교

균주	세포 생장(A600)	리파제	가수분해 활성	특이 활성
WT(야생형)	153	0.76ml/ml	44,820U/L	58,973U/mg
변이주 3G#4	160	0.93ml/ml	62,910U/L	67,645U/mg

<실시예 4> 고정화 RML을 이용한 바이오디젤 전환 효율의 비교

야생형 및 변이주로부터 분비 생산된 리파제의 전이에스터 활성을 비교하기 위해, 효소 고정화를 진행하였다. 효소 고정화는 Lewatit VP OC 1600 레진(resin)을 사용했으며 레진 1g당 20mg 효소를 사용하여 25 ℃에서 20시간 동안 반응하여 고정화를 실시하였다. 반응 중간 상등액을 취하여 SDS-PAGE와 브래드포드 분석(bradford assay)으로 잔여 단백질을 분석한 결과, 배양 18시간 이후 대부분의 단백질들의 고정화가 이루어지는 것을 확인할 수 있었다(도 9).

에스터화 활성 비교를 위해 라우르산(Lauric acid) 및 프로판올(propanol)을 기질로 하여 45 ℃에서 30분간 반응을 수행하였다. 이후, 0.2N KOH를 이용하여 적정 후 생성된 프로필 라우레이트(propyl laurate)의 양으로 효소 활성을 분석하였다. 전이에스터 활성은 효소 1 g(40 mg/g)과 콩기름(soy oil)을 혼합한 용액에 총 3%의 메탄올을 첨가하여 30분 반응 후 GC 분석으로 생성된 FAME을 확인하여 도출하였다(도 10).

야생형 및 최종 선별된 변이주로부터 분비 생산된 리파제의 효소 활성을 비교한 결과, 도 10에서 확인할 수 있는 바와 같이, 에스터화(esterification) 활성은 야생형 대비 176%의 활성 증가를 보였고, 전이에스터(transesterification) 활성은 250% 증가하였음을 확인하였다. 또한, 본 발명에서 제작된 변이주는 상용화 효소인 Sigma RML 보다 에스터화 활성 및 전이에스터 활성이 각각 135% 및 181% 증가한 것으로 확인되었다.

상기와 같은 결과를 통해, 야생형 균주로부터 분비 생산된 리파제(RML), 및 기존에 시판되는 리파제(RML)에 비해 본 발명의 변이주로부터 분비 생산된 리파제(RML)는 에스터화 활성 및 전이에스터 활성이 월등히 우수하여, 바이오디젤 전환 효율이 매우 좋음을 확인할 수 있다.

<실시예 5> 온전한 RML 발현을 위한 융합 단백질 구조 변경

TFP와 RML은 케신 인식 서열인 KR을 포함하는 링커로 연결되어 있어, TFP는 골지체에서 케신에 의하여 절단되어 온전한 형태의 RML만 분비될 수 있다. 그러나, RML의 구조에 의해서 케신 인식부위가 표면으로 노출되지 않는 경우, 케신이 접근할 수 없어 절단이 일어나지 않기 때문에 TFP와 RML은 분리되지 않고 융합 단백질(TFP-RML) 형태로 분비된다. 도 11에서 보듯이, TFP19 분비 시그널을 이용하여 RML-3G#4을 생산할 경우 TFP19가 잘리지 않은 형태의 융합 단백질도 같이 생산되고, 이러한 융합 단백질이 효소 활성에 부정적인 영향을 미칠 수 있기 때문에 융합 단백질이 발현되는 것을 최소화하는 것이 고활성 단백질 생산에 도움이 될 수 있다.

따라서, TFP19와 RML-3G#4 간의 절단을 촉진하기 위해서 케신 인식 서열 주위의 아미노산 서열을 케신이 접근하기 용이한 구조로 변경하였다. 구체적으로, Arg-lys 프로펩타이드 절단 예측 서버(Arg-lys propeptide cleavage prediction server)인 ProP 1.0(http://www.cbs.dtu.dk/services/ProP/)을 이용하여 케신 처리효율을 높여주는 것으로 확인된 SV(세린-발린) 아미노산 서열을 케신 인식부위인 KR 서열의 하단, 즉, RML 3G#4의 아미노산 서열(서열번호 57)에서 N-말단과 링커 내 케신(Kexin)의 인식부위인 Lys-Arg(KR) 서열의 하단 사이에 추가하였다. 아미노산 변이는 리파제 발현 벡터인 YGaST19-RML 3G#4를 주형으로 MJ706 프라이머(서열번호 59)와 GT50R 프라이머(서열번호 56)를 사용하여 도입하였으며 서열 확인 후 2805gal80 균주에 도입하여 발현을 유도하였다. 형질전환을 통해 얻은 SV-RML-3G#4을 3ml 배양 후 아세톤 침전으로 농축 후 endoH를 처리하여 SDS-PAGE로 분석한 결과 SV 도입으로 인해 TFP19가 제거된 온전한 RML-3G#4만이 발현되는 것을 확인하였다(도 11). SV-RML-3G#4 벡터 구축을 위해 사용한 프라이머, SV-RML-3G#4의 아미노산 및 뉴클레오타이드 서열을 하기 표 8 내지 9에 나타내었다.

SV-RML-3G#4 벡터 구축을 위해 사용한 프라이머

프라이머	서열	서열번호
MJ706	TAGATAAAAGATCTGTTGTGCCAATCAAGAGA	59

SV-RML-3G#4의 아미노산, 뉴클레오타이드 서열

아미노산 서열	서열번호
SVVPIKRQSNSTVDSLPPLIPSRTSAPSSSPSTTDPEAPAMSRNGPLPSDVETNYGMALNATSYPDSVVQAMSIDGGIRAATSQEINELTYYTTLSANSYCRTVIPGATWDCIHCDATEDLKIIKTWSTLIYDTNAMVARGDSEKTIYIVFRGSSSIRNWIADLTFVPVSYPPVSGTKVHKGFLDSYGEVQDELVATVLDQFKQYPSYKVAVTGHSLGGATALLCALGLYQREEGLSSSNLFLYTQGQPRVGDPAFANYVVSTGIPYRRTVNERDIVPHLPPAAFGFLHAGEEYWITDNSPETVQVCTSDLETSDCSNSIVPFTSVLDHLSYFGINTGLCT	60
뉴클레오타이드 서열	서열번호
TCTGTTGTGCCAATCAAGAGACAATCAAACAGCACGGTGGATAGTCTGCCACCCCTCATCCCCTCTCGAACCTCGGCACCTTCATCATCACCAAGCACAACCGACCCTGAAGCTCCAGCCATGAGTCGCAATGGACCGCTGCCCTCGGATGTAGAGACTAATTATGGCATGGCTTTGAATGCTACTTCCTATCCGGATTCTGTGGTCCAAGCAATGAGCATTGATGGTGGTATCCGCGCTGCGACCTCGCAAGAAATCAATGAATTGACTTATTACACTACACTATCTGCCAACTCGTACTGCCGCACTGTCATTCCTGGAGCTACCTGGGACTGTATCCACTGTGATGCAACGGAGGATCTCAAGATTATCAAGACTTGGAGCACGCTCATCTATGATACAAATGCAATGGTTGCACGTGGTGACAGCGAAAAAACTATCTATATCGTTTTCCGAGGTTCGAGCTCTATCCGCAACTGGATTGCTGATCTCACCTTTGTGCCAGTTTCATATCCTCCGGTCAGTGGTACAAAAGTACACAAGGGATTCCTGGACAGTTACGGGGAAGTTCAAGACGAGCTTGTTGCTACTGTTCTTGATCAATTCAAGCAATATCCAAGCTACAAGGTTGCTGTTACAGGTCACTCACTCGGTGGTGCTACTGCGTTGCTTTGCGCCCTGGGTCTCTATCAACGAGAAGAAGGACTCTCATCCAGCAACTTGTTCCTTTACACTCAAGGTCAACCACGGGTAGGCGACCCTGCCTTTGCCAACTACGTTGTTAGCACCGGCATTCCTTACAGGCGCACGGTCAATGAACGAGATATCGTTCCTCATCTTCCACCTGCTGCTTTTGGTTTTCTCCACGCTGGCGAGGAGTATTGGATTACTGACAATAGCCCAGAGACTGTTCAGGTCTGCACAAGCGATCTGGAAACCTCTGATTGCTCTAACAGCATTGTTCCCTTCACAAGTGTTCTTGACCATCTCTCGTACTTTGGTATCAACACAGGCCTCTGTACT	61

<실시예 6> 유가식 발효를 통한 SV-RML-3G#4 단백질 발현

RML-3G#4와 SV 아미노산이 도입된 SV-RML-3G#4의 특이활성을 비교해 보기 위해 먼저 유가식 발효를 이용하여 각각의 단백질을 생산하였다. 유가식 발효는 25 ℃에서 48시간동안 진행되었으며 상기 실시예 3에 제시된 방법과 동일하게 수행되었다. 도 12에서 나타낸 것처럼 48시간 배양하는 동안 RML-3G#4와 SV-RML-3G#4는 약 146, 150 OD로 유사한 세포성장을 보였고, 시간별 발효배양액 10μl를 농축하지 않고 SDS-PAGE 분석한 결과 RML-3G#4는 TFP가 융합된 형태와 잘린 형태가 60:40 비율로 발현되었으나 SV-RML-3G#4는 95% 이상 TFP가 잘린 온전한 RML-3G#4로 발현되었음을 확인하였다. 배양 시간별 활성을 pNPP 어세이로 확인 후 특이 활성을 비교해 본 결과 RML-3G#4와 SV-RML-3G#4는 각각 11,319U/mg, 13,131U/mg로 나타나, SV-RML-3G#4가 SV가 도입되지 않은 RML-3G#4보다 16% 높은 활성을 보여 TFP가 제거된 형태의 단백질이 효소 활성 증가에 영향을 주었을 것으로 예상되었다.

이상의 내용을 종합하면, 본 발명에서는 리조무코르 미에헤이 유래 리파제(RML)에 단백질 분비 융합인자(TFP)를 결합한 리파제 분비 발현 카세트를 제조하고, 리파제 분비 발현능 및 분비된 리파제(RML)의 활성이 우수한 단백질 분비융합인자(TFP)를 선별하였다.

또한, 상기 리파제 분비 발현 카세트를 방향성 진화 기술을 이용하여 개량하고, 서열번호 25로 이루어진 단백질 분비융합인자(TFP 19)의 아미노산 서열 중 109번째 아미노산, 서열번호 1로 이루어진 리파제(RML)의 아미노산 서열 중 52번째 아미노산, 및 190번째 아미노산이 각각 트레오닌(Thr), 아스파라긴(Asn), 및 아스파르트산(Asp)으로 치환된 변이주를 선별하였고, 상기 변이주로부터 분비 생산된 리파제는 야생형으로부터 분비 생산된 리파제에 비해 전이에스터 활성이 약 250%로 현저히 개선됨을 확인하였다.

또한, 상기 TFP와 RML을 연결하는 링커 서열을 변경하여 케신의 절단 효율을 증가시키기 위해 아미노 말단에 SV가 추가된 형태의 RML을 발현하였고 이러한 방법으로 발현된 TFP가 절단된 온전한 형태의 RML은 효소 활성이 116% 증가함을 확인하였다.

이상의 설명으로부터, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 이와 관련하여, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허 청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

<110> KOREA RESEARCH INSTITUTE OF BIOSCIENCE AND BIOTECHNOLOGY <120> Mutant lipases of Rhizomucor miehei having enhanced transesterification activity and a method of producing the lipase <130> KPA181117-KR-P1 <150> KR 2018-0132934 <151> 2018-11-01 <160> 61 <170> KoPatentIn 3.0 <210> 1 <211> 339 <212> PRT <213> Rhizomucor miehei <400> 1 Val Pro Ile Lys Arg Gln Ser Asn Ser Thr Val Asp Ser Leu Pro Pro 1 5 10 15 Leu Ile Pro Ser Arg Thr Ser Ala Pro Ser Ser Ser Pro Ser Thr Thr 20 25 30 Asp Pro Glu Ala Pro Ala Met Ser Arg Asn Gly Pro Leu Pro Ser Asp 35 40 45 Val Glu Thr Lys Tyr Gly Met Ala Leu Asn Ala Thr Ser Tyr Pro Asp 50 55 60 Ser Val Val Gln Ala Met Ser Ile Asp Gly Gly Ile Arg Ala Ala Thr 65 70 75 80 Ser Gln Glu Ile Asn Glu Leu Thr Tyr Tyr Thr Thr Leu Ser Ala Asn 85 90 95 Ser Tyr Cys Arg Thr Val Ile Pro Gly Ala Thr Trp Asp Cys Ile His 100 105 110 Cys Asp Ala Thr Glu Asp Leu Lys Ile Ile Lys Thr Trp Ser Thr Leu 115 120 125 Ile Tyr Asp Thr Asn Ala Met Val Ala Arg Gly Asp Ser Glu Lys Thr 130 135 140 Ile Tyr Ile Val Phe Arg Gly Ser Ser Ser Ile Arg Asn Trp Ile Ala 145 150 155 160 Asp Leu Thr Phe Val Pro Val Ser Tyr Pro Pro Val Ser Gly Thr Lys 165 170 175 Val His Lys Gly Phe Leu Asp Ser Tyr Gly Glu Val Gln Asn Glu Leu 180 185 190 Val Ala Thr Val Leu Asp Gln Phe Lys Gln Tyr Pro Ser Tyr Lys Val 195 200 205 Ala Val Thr Gly His Ser Leu Gly Gly Ala Thr Ala Leu Leu Cys Ala 210 215 220 Leu Gly Leu Tyr Gln Arg Glu Glu Gly Leu Ser Ser Ser Asn Leu Phe 225 230 235 240 Leu Tyr Thr Gln Gly Gln Pro Arg Val Gly Asp Pro Ala Phe Ala Asn 245 250 255 Tyr Val Val Ser Thr Gly Ile Pro Tyr Arg Arg Thr Val Asn Glu Arg 260 265 270 Asp Ile Val Pro His Leu Pro Pro Ala Ala Phe Gly Phe Leu His Ala 275 280 285 Gly Glu Glu Tyr Trp Ile Thr Asp Asn Ser Pro Glu Thr Val Gln Val 290 295 300 Cys Thr Ser Asp Leu Glu Thr Ser Asp Cys Ser Asn Ser Ile Val Pro 305 310 315 320 Phe Thr Ser Val Leu Asp His Leu Ser Tyr Phe Gly Ile Asn Thr Gly 325 330 335 Leu Cys Thr <210> 2 <211> 1020 <212> DNA <213> Rhizomucor miehei <400> 2 gtgccaatca agagacaatc aaacagcacg gtggatagtc tgccacccct catcccctct 60 cgaacctcgg caccttcatc atcaccaagc acaaccgacc ctgaagctcc agccatgagt 120 cgcaatggac cgctgccctc ggatgtagag actaaatatg gcatggcttt gaatgctact 180 tcctatccgg attctgtggt ccaagcaatg agcattgatg gtggtatccg cgctgcgacc 240 tcgcaagaaa tcaatgaatt gacttattac actacactat ctgccaactc gtactgccgc 300 actgtcattc ctggagctac ctgggactgt atccactgtg atgcaacgga ggatctcaag 360 attatcaaga cttggagcac gctcatctat gatacaaatg caatggttgc acgtggtgac 420 agcgaaaaaa ctatctatat cgttttccga ggttcgagct ctatccgcaa ctggattgct 480 gatctcacct ttgtgccagt ttcatatcct ccggtcagtg gtacaaaagt acacaaggga 540 ttcctggaca gttacgggga agttcaaaac gagcttgttg ctactgttct tgatcaattc 600 aagcaatatc caagctacaa ggttgctgtt acaggtcact cactcggtgg tgctactgcg 660 ttgctttgcg ccctgggtct ctatcaacga gaagaaggac tctcatccag caacttgttc 720 ctttacactc aaggtcaacc acgggtaggc gaccctgcct ttgccaacta cgttgttagc 780 accggcattc cttacaggcg cacggtcaat gaacgagata tcgttcctca tcttccacct 840 gctgcttttg gttttctcca cgctggcgag gagtattgga ttactgacaa tagcccagag 900 actgttcagg tctgcacaag cgatctggaa acctctgatt gctctaacag cattgttccc 960 ttcacaagtg ttcttgacca tctctcgtac tttggtatca acacaggcct ctgtacttaa 1020 1020 <210> 3 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> RML-TFP-F <400> 3 ctcgccttag ataaaagagt gccaatcaag agacaa 36 <210> 4 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> RML-TFP-R <400> 4 ttagtgatgg tgatggtgat gcttaagtac agaggcctg 39 <210> 5 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> LNK39 <400> 5 ggccgcctcg gcctctgctg gcctcgcctt agataaaaga 40 <210> 6 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> HisGT50R <400> 6 gtcattatta aatatatata tatatatatt gtcactccgt tcaagtcgac ttagtgatgg 60 tgatggtgat g 71 <210> 7 <211> 118 <212> PRT <213> Artificial Sequence <220> <223> TFP 1 <400> 7 Met Phe Asn Arg Phe Asn Lys Phe Gln Ala Ala Val Ala Leu Ala Leu 1 5 10 15 Leu Ser Arg Gly Ala Leu Gly Asp Ser Tyr Thr Asn Ser Thr Ser Ser 20 25 30 Ala Asp Leu Ser Ser Ile Thr Ser Val Ser Ser Ala Ser Ala Ser Ala 35 40 45 Thr Ala Ser Asp Ser Leu Ser Ser Ser Asp Gly Thr Val Tyr Leu Pro 50 55 60 Ser Thr Thr Ile Ser Gly Asp Leu Thr Val Thr Gly Lys Val Ile Ala 65 70 75 80 Thr Glu Ala Val Glu Val Ala Ala Gly Gly Lys Leu Thr Leu Leu Asp 85 90 95 Gly Glu Lys Tyr Val Phe Ser Ser Glu Ala Ala Ser Ala Ser Ala Gly 100 105 110 Leu Ala Leu Asp Lys Arg 115 <210> 8 <211> 130 <212> PRT <213> Artificial Sequence <220> <223> TFP 2 <400> 8 Met Thr Pro Tyr Ala Val Ala Ile Thr Val Ala Leu Leu Ile Val Thr 1 5 10 15 Val Ser Ala Leu Gln Val Asn Asn Ser Cys Val Ala Phe Pro Pro Ser 20 25 30 Asn Leu Arg Gly Lys Asn Gly Asp Gly Thr Asn Glu Gln Tyr Ala Thr 35 40 45 Ala Leu Leu Ser Ile Pro Trp Asn Gly Pro Pro Glu Ser Ser Arg Asp 50 55 60 Ile Asn Leu Ile Glu Leu Glu Pro Gln Val Ala Leu Tyr Leu Leu Glu 65 70 75 80 Asn Tyr Ile Asn His Tyr Tyr Asn Thr Thr Arg Asp Asn Lys Cys Pro 85 90 95 Asn Asn His Tyr Leu Met Gly Gly Gln Leu Gly Ser Ser Ser Asp Asn 100 105 110 Arg Ser Leu Asn Glu Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp 115 120 125 Lys Arg 130 <210> 9 <211> 117 <212> PRT <213> Artificial Sequence <220> <223> TFP 3 <400> 9 Met Gln Phe Lys Asn Val Ala Leu Ala Ala Ser Val Ala Ala Leu Ser 1 5 10 15 Ala Thr Ala Ser Ala Glu Gly Tyr Thr Pro Gly Glu Pro Trp Ser Thr 20 25 30 Leu Thr Pro Thr Gly Ser Ile Ser Cys Gly Ala Ala Glu Tyr Thr Thr 35 40 45 Thr Phe Gly Ile Ala Val Gln Ala Ile Thr Ser Ser Lys Ala Lys Arg 50 55 60 Asp Val Ile Ser Gln Ile Gly Asp Gly Gln Val Gln Ala Thr Ser Ala 65 70 75 80 Ala Thr Ala Gln Ala Thr Asp Ser Gln Ala Gln Ala Thr Thr Thr Ala 85 90 95 Thr Pro Thr Ser Ser Glu Lys Met Ala Ala Ser Ala Ser Ala Gly Leu 100 105 110 Ala Leu Asp Lys Arg 115 <210> 10 <211> 62 <212> PRT <213> Artificial Sequence <220> <223> TFP 4 <400> 10 Met Arg Phe Ala Glu Phe Leu Val Val Phe Ala Thr Leu Gly Gly Gly 1 5 10 15 Met Ala Ala Pro Val Glu Ser Leu Ala Gly Thr Gln Arg Tyr Leu Val 20 25 30 Gln Met Lys Glu Arg Phe Thr Thr Glu Lys Leu Cys Ala Leu Asp Asp 35 40 45 Lys Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 50 55 60 <210> 11 <211> 97 <212> PRT <213> Artificial Sequence <220> <223> TFP 5 <400> 11 Met Phe Asn Arg Phe Asn Lys Phe Gln Ala Ala Val Ala Leu Ala Leu 1 5 10 15 Leu Ser Arg Gly Ala Leu Gly Ala Pro Val Asn Thr Thr Thr Glu Asp 20 25 30 Glu Thr Ala Leu Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Asp Leu 35 40 45 Glu Gly Asp Phe Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn 50 55 60 Asn Gly Leu Leu Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys 65 70 75 80 Glu Glu Gly Val Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp Lys 85 90 95 Arg <210> 12 <211> 93 <212> PRT <213> Artificial Sequence <220> <223> TFP 6 <400> 12 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Asp Leu Glu Gly Asp Phe 35 40 45 Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu 50 55 60 Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 85 90 <210> 13 <211> 226 <212> PRT <213> Artificial Sequence <220> <223> TFP 7 <400> 13 Met Val Phe Gly Gln Leu Tyr Ala Leu Phe Ile Phe Thr Leu Ser Cys 1 5 10 15 Cys Ile Ser Lys Thr Val Gln Ala Asp Ser Ser Lys Glu Ser Ser Ser 20 25 30 Phe Ile Ser Phe Asp Lys Glu Ser Asn Trp Asp Thr Ile Ser Thr Ile 35 40 45 Ser Ser Thr Ala Asp Val Ile Ser Ser Val Asp Ser Ala Ile Ala Val 50 55 60 Phe Glu Phe Asp Asn Phe Ser Leu Leu Asp Ser Leu Met Ile Asp Glu 65 70 75 80 Glu Tyr Pro Phe Phe Asn Arg Phe Phe Ala Asn Asp Val Ser Leu Thr 85 90 95 Val His Asp Asp Ser Pro Leu Asn Ile Ser Gln Ser Leu Ser Pro Ile 100 105 110 Met Glu Gln Phe Thr Val Asp Glu Leu Pro Glu Ser Ala Ser Asp Leu 115 120 125 Leu Tyr Glu Tyr Ser Leu Asp Asp Lys Ser Ile Val Leu Phe Lys Phe 130 135 140 Thr Ser Asp Ala Tyr Asp Leu Lys Lys Leu Asp Glu Phe Ile Asp Ser 145 150 155 160 Cys Leu Ser Phe Leu Glu Asp Lys Ser Gly Asp Asn Leu Thr Val Val 165 170 175 Ile Asn Ser Leu Gly Trp Ala Phe Glu Asp Glu Asp Gly Asp Asp Glu 180 185 190 Tyr Ala Thr Glu Glu Thr Leu Ser His His Asp Asn Asn Lys Gly Lys 195 200 205 Glu Gly Asp Asp Leu Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp 210 215 220 Lys Arg 225 <210> 14 <211> 64 <212> PRT <213> Artificial Sequence <220> <223> TFP 8 <400> 14 Met Leu Gln Ser Val Val Phe Phe Ala Leu Leu Thr Phe Ala Ser Ser 1 5 10 15 Val Ser Ala Ile Tyr Ser Asn Asn Thr Val Ser Thr Thr Thr Thr Leu 20 25 30 Ala Pro Ser Tyr Ser Leu Val Pro Gln Glu Thr Thr Ile Ser Tyr Ala 35 40 45 Asp Asp Leu Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 50 55 60 <210> 15 <211> 138 <212> PRT <213> Artificial Sequence <220> <223> TFP 9 <400> 15 Met Lys Phe Ser Thr Ala Val Thr Thr Leu Ile Ser Ser Gly Ala Ile 1 5 10 15 Val Ser Ala Leu Pro His Val Asp Val His Gln Glu Asp Ala His Gln 20 25 30 His Lys Arg Ala Val Ala Tyr Lys Tyr Val Tyr Glu Thr Val Val Val 35 40 45 Asp Ser Asp Gly His Thr Val Thr Pro Ala Ala Ser Glu Val Ala Thr 50 55 60 Ala Ala Thr Ser Ala Ile Ile Thr Thr Ser Val Leu Ala Pro Thr Ser 65 70 75 80 Ser Ala Ala Ala Ala Asp Ser Ser Ala Ser Ile Ala Val Ser Ser Ala 85 90 95 Ala Leu Ala Lys Asn Glu Lys Ile Ser Asp Ala Ala Ala Ser Ala Thr 100 105 110 Ala Ser Thr Ser Gln Gly Ala Ser Ser Ser Ser Tyr Leu Ala Ala Ser 115 120 125 Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 130 135 <210> 16 <211> 199 <212> PRT <213> Artificial Sequence <220> <223> TFP 10 <400> 16 Met Asn Trp Leu Phe Leu Val Ser Leu Val Phe Phe Cys Gly Val Ser 1 5 10 15 Thr His Pro Ala Leu Ala Met Ser Ser Asn Arg Leu Leu Lys Leu Ala 20 25 30 Asn Lys Ser Pro Lys Lys Ile Ile Pro Leu Lys Asp Ser Ser Phe Glu 35 40 45 Asn Ile Leu Ala Pro Pro His Glu Asn Ala Tyr Ile Val Ala Leu Phe 50 55 60 Thr Ala Thr Ala Pro Glu Ile Gly Cys Ser Leu Cys Leu Glu Leu Glu 65 70 75 80 Ser Glu Tyr Asp Thr Ile Val Ala Ser Trp Phe Asp Asp His Pro Asp 85 90 95 Ala Lys Ser Ser Asn Ser Asp Thr Ser Ile Phe Phe Thr Lys Val Asn 100 105 110 Leu Glu Asp Pro Ser Lys Thr Ile Pro Lys Ala Phe Gln Phe Phe Gln 115 120 125 Leu Asn Asn Val Pro Arg Leu Phe Ile Phe Lys Leu Asn Ser Pro Ser 130 135 140 Ile Leu Asp His Ser Val Ile Ser Ile Ser Thr Asp Thr Gly Ser Glu 145 150 155 160 Arg Met Lys Gln Ile Ile Gln Ala Ile Lys Gln Phe Ser Gln Val Asn 165 170 175 Asp Phe Ser Leu His Leu Pro Val Gly Leu Ala Ala Ser Ala Ser Ala 180 185 190 Gly Leu Ala Leu Asp Lys Arg 195 <210> 17 <211> 77 <212> PRT <213> Artificial Sequence <220> <223> TFP 11 <400> 17 Met Lys Phe Ser Ser Val Thr Ala Ile Thr Leu Ala Thr Val Ala Thr 1 5 10 15 Val Ala Thr Ala Lys Lys Gly Glu His Asp Phe Thr Thr Thr Leu Thr 20 25 30 Leu Ser Ser Asp Gly Ser Leu Thr Thr Thr Thr Ser Thr His Thr Thr 35 40 45 His Lys Tyr Gly Lys Phe Asn Lys Thr Ser Lys Ser Lys Thr Pro Leu 50 55 60 Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 65 70 75 <210> 18 <211> 94 <212> PRT <213> Artificial Sequence <220> <223> TFP 12 <400> 18 Met Ala Ser Phe Ala Thr Lys Phe Val Ile Ala Cys Phe Leu Phe Phe 1 5 10 15 Ser Ala Ser Ala His Asn Val Leu Leu Pro Ala Tyr Gly Arg Arg Cys 20 25 30 Phe Phe Glu Asp Leu Ser Lys Gly Asp Glu Leu Ser Ile Ser Phe Gln 35 40 45 Phe Gly Asp Arg Asn Pro Gln Ser Ser Ser Gln Leu Thr Gly Asp Phe 50 55 60 Ile Ile Tyr Gly Pro Glu Arg His Glu Val Leu Lys Thr Val Arg Glu 65 70 75 80 Leu Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 85 90 <210> 19 <211> 174 <212> PRT <213> Artificial Sequence <220> <223> TFP 13 <400> 19 Met Gln Tyr Lys Lys Thr Leu Val Ala Ser Ala Leu Ala Ala Thr Thr 1 5 10 15 Leu Ala Ala Tyr Ala Pro Ser Glu Pro Trp Ser Thr Leu Thr Pro Thr 20 25 30 Ala Thr Tyr Ser Gly Gly Val Thr Asp Tyr Ala Ser Thr Phe Gly Ile 35 40 45 Ala Val Gln Pro Ile Ser Thr Thr Ser Ser Ala Ser Ser Ala Ala Thr 50 55 60 Thr Ala Ser Ser Lys Ala Lys Arg Ala Ala Ser Gln Ile Gly Asp Gly 65 70 75 80 Gln Val Gln Ala Ala Thr Thr Thr Ala Ser Val Ser Thr Lys Ser Thr 85 90 95 Ala Ala Ala Val Ser Gln Ile Gly Asp Gly Gln Ile Gln Ala Thr Thr 100 105 110 Lys Thr Thr Ala Ala Ala Val Ser Gln Ile Gly Asp Gly Gln Ile Gln 115 120 125 Ala Thr Thr Lys Thr Thr Ser Ala Lys Thr Thr Ala Ala Ala Val Ser 130 135 140 Gln Ile Ser Asp Gly Gln Ile Gln Ala Thr Thr Thr Thr Leu Ala Pro 145 150 155 160 Leu Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 165 170 <210> 20 <211> 68 <212> PRT <213> Artificial Sequence <220> <223> TFP 14 <400> 20 Met Gln Phe Lys Asn Ala Leu Thr Ala Thr Ala Ile Leu Ser Ala Ser 1 5 10 15 Ala Leu Ala Ala Asn Ser Thr Thr Ser Ile Pro Ser Ser Cys Ser Ile 20 25 30 Gly Thr Ser Ala Thr Ala Thr Ala Gln Ala Thr Asp Ser Gln Ala Gln 35 40 45 Ala Thr Thr Thr Ala Pro Leu Ala Ala Ser Ala Ser Ala Gly Leu Ala 50 55 60 Leu Asp Lys Arg 65 <210> 21 <211> 157 <212> PRT <213> Artificial Sequence <220> <223> TFP 15 <400> 21 Met Val Ser Lys Thr Trp Ile Cys Gly Phe Ile Ser Ile Ile Thr Val 1 5 10 15 Val Gln Ala Leu Ser Cys Glu Lys His Asp Val Leu Lys Lys Tyr Gln 20 25 30 Val Gly Lys Phe Ser Ser Leu Thr Ser Thr Glu Arg Asp Thr Pro Pro 35 40 45 Ser Thr Thr Ile Glu Lys Trp Trp Ile Asn Val Cys Glu Glu His Asn 50 55 60 Val Glu Pro Pro Glu Glu Cys Lys Lys Asn Asp Met Leu Cys Gly Leu 65 70 75 80 Thr Asp Val Ile Leu Pro Gly Lys Asp Ala Ile Thr Thr Gln Ile Ile 85 90 95 Asp Phe Asp Lys Asn Ile Gly Phe Asn Val Glu Glu Thr Glu Ser Ala 100 105 110 Leu Thr Leu Thr Leu Asn Gly Ala Thr Trp Gly Ala Asn Ser Phe Asp 115 120 125 Ala Lys Leu Glu Phe Gln Cys Asn Asp Asn Met Lys Gln Asp Glu Leu 130 135 140 Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 145 150 155 <210> 22 <211> 98 <212> PRT <213> Artificial Sequence <220> <223> TFP 16 <400> 22 Met Lys Leu Ser Ala Leu Leu Ala Leu Ser Ala Ser Thr Ala Val Leu 1 5 10 15 Ala Ala Pro Ala Val His His Ser Asp Asn His His His Asn Asp Lys 20 25 30 Arg Ala Val Val Thr Val Thr Gln Tyr Val Asn Ala Asp Gly Ala Val 35 40 45 Val Ile Pro Ala Ala Thr Thr Ala Thr Ser Ala Ala Ala Asp Gly Lys 50 55 60 Val Glu Ser Val Ala Ala Ala Thr Thr Thr Leu Ser Ser Thr Ala Ala 65 70 75 80 Ala Ala Thr Thr Leu Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp 85 90 95 Lys Arg <210> 23 <211> 195 <212> PRT <213> Artificial Sequence <220> <223> TFP 17 <400> 23 Met Lys Leu Ser Thr Val Leu Leu Ser Ala Gly Leu Ala Ser Thr Thr 1 5 10 15 Leu Ala Gln Phe Ser Asn Ser Thr Ser Ala Ser Ser Thr Asp Val Thr 20 25 30 Ser Ser Ser Ser Ile Ser Thr Ser Ser Gly Ser Val Thr Ile Thr Ser 35 40 45 Ser Glu Ala Pro Glu Ser Asp Asn Gly Thr Ser Thr Ala Ala Pro Thr 50 55 60 Glu Thr Ser Thr Glu Ala Pro Thr Thr Ala Ile Pro Thr Asn Gly Thr 65 70 75 80 Ser Thr Glu Ala Pro Thr Thr Ala Ile Pro Thr Asn Gly Thr Ser Thr 85 90 95 Glu Ala Pro Thr Asp Thr Thr Thr Glu Ala Pro Thr Thr Ala Leu Pro 100 105 110 Thr Asn Gly Thr Ser Thr Glu Ala Pro Thr Asp Thr Thr Thr Glu Ala 115 120 125 Pro Thr Thr Gly Leu Pro Thr Asn Gly Thr Thr Ser Ala Phe Pro Pro 130 135 140 Thr Thr Ser Leu Pro Pro Ser Asn Thr Thr Thr Thr Pro Pro Tyr Asn 145 150 155 160 Pro Ser Thr Asp Tyr Thr Thr Asp Tyr Thr Val Val Thr Glu Tyr Thr 165 170 175 Thr Tyr Cys Pro Glu Arg Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu 180 185 190 Asp Lys Arg 195 <210> 24 <211> 105 <212> PRT <213> Artificial Sequence <220> <223> TFP 18 <400> 24 Met Arg Phe Ser Thr Thr Leu Ala Thr Ala Ala Thr Ala Leu Phe Phe 1 5 10 15 Thr Ala Ser Gln Val Ser Ala Ile Gly Glu Leu Ala Phe Asn Leu Gly 20 25 30 Val Lys Asn Asn Asp Gly Thr Cys Lys Ser Thr Ser Asp Tyr Glu Thr 35 40 45 Glu Leu Gln Ala Leu Lys Ser Tyr Thr Ser Thr Val Lys Val Tyr Ala 50 55 60 Ala Ser Asp Cys Asn Thr Leu Gln Asn Leu Gly Pro Ala Ala Glu Ala 65 70 75 80 Glu Gly Phe Thr Ile Phe Val Gly Val Trp Pro Leu Ala Ala Ser Ala 85 90 95 Ser Ala Gly Leu Ala Leu Asp Lys Arg 100 105 <210> 25 <211> 124 <212> PRT <213> Artificial Sequence <220> <223> TFP 19 <400> 25 Met Arg Leu Ser Asn Leu Ile Ala Ser Ala Ser Leu Leu Ser Ala Ala 1 5 10 15 Thr Leu Ala Ala Pro Ala Asn His Glu His Lys Asp Lys Arg Ala Val 20 25 30 Val Thr Thr Thr Val Gln Lys Gln Thr Thr Ile Ile Val Asn Gly Ala 35 40 45 Ala Ser Thr Pro Val Ala Ala Leu Glu Glu Asn Ala Val Val Asn Ser 50 55 60 Ala Pro Ala Ala Ala Thr Ser Thr Thr Ser Ser Ala Ala Ser Val Ala 65 70 75 80 Thr Ala Ala Ser Ser Ser Glu Asn Asn Ser Gln Val Ser Ala Ala Ala 85 90 95 Ser Pro Ala Ser Ser Ser Ala Ala Thr Ser Thr Gln Ser Ser Leu Ala 100 105 110 Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 115 120 <210> 26 <211> 138 <212> PRT <213> Artificial Sequence <220> <223> TFP 20 <400> 26 Met Gln Phe Ser Thr Val Ala Ser Ile Ala Ala Val Ala Ala Val Ala 1 5 10 15 Ser Ala Ala Ala Asn Val Thr Thr Ala Thr Val Ser Gln Glu Ser Thr 20 25 30 Thr Leu Val Thr Ile Thr Ser Cys Glu Asp His Val Cys Ser Glu Thr 35 40 45 Val Ser Pro Ala Leu Val Ser Thr Ala Thr Val Thr Val Asp Asp Val 50 55 60 Ile Thr Gln Tyr Thr Thr Trp Cys Pro Leu Thr Thr Glu Ala Pro Lys 65 70 75 80 Asn Gly Thr Ser Thr Ala Ala Pro Val Thr Ser Thr Glu Ala Pro Lys 85 90 95 Asn Thr Thr Ser Ala Ala Pro Thr His Ser Val Thr Ser Tyr Thr Gly 100 105 110 Ala Ala Ala Lys Ala Leu Pro Ala Ala Gly Ala Leu Leu Ala Ala Ser 115 120 125 Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 130 135 <210> 27 <211> 176 <212> PRT <213> Artificial Sequence <220> <223> TFP 21 <400> 27 Met Lys Phe Ser Ser Ala Leu Val Leu Ser Ala Val Ala Ala Thr Ala 1 5 10 15 Leu Ala Glu Ser Ile Thr Thr Thr Ile Thr Ala Thr Lys Asn Gly His 20 25 30 Val Tyr Thr Lys Thr Val Thr Gln Asp Ala Thr Phe Val Trp Gly Gly 35 40 45 Glu Asp Ser Tyr Ala Ser Ser Thr Ser Ala Ala Glu Ser Ser Ala Ala 50 55 60 Glu Thr Ser Ala Ala Glu Thr Ser Ala Ala Ala Thr Thr Ser Ala Ala 65 70 75 80 Ala Thr Thr Ser Ala Ala Glu Thr Ser Ser Ala Ala Glu Thr Ser Ser 85 90 95 Ala Asp Glu Gly Ser Gly Ser Ser Ile Thr Thr Thr Ile Thr Ala Thr 100 105 110 Lys Asn Gly His Val Tyr Thr Lys Thr Val Thr Gln Asp Ala Thr Phe 115 120 125 Val Trp Thr Gly Glu Gly Ser Ser Asn Thr Trp Ser Pro Ser Ser Thr 130 135 140 Ser Thr Ser Ser Glu Ala Ala Thr Ser Ser Ala Ser Thr Thr Ala Thr 145 150 155 160 Thr Leu Leu Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 165 170 175 <210> 28 <211> 138 <212> PRT <213> Artificial Sequence <220> <223> TFP 22 <400> 28 Met Lys Phe Gln Val Val Leu Ser Ala Leu Leu Ala Cys Ser Ser Ala 1 5 10 15 Val Val Ala Ser Pro Ile Glu Asn Leu Phe Lys Tyr Arg Ala Val Lys 20 25 30 Ala Ser His Ser Lys Asn Ile Asn Ser Thr Leu Pro Ala Trp Asn Gly 35 40 45 Ser Asn Ser Ser Asn Val Thr Tyr Ala Asn Gly Thr Asn Ser Thr Thr 50 55 60 Asn Thr Thr Thr Ala Glu Ser Ser Gln Leu Gln Ile Ile Val Thr Gly 65 70 75 80 Gly Gln Val Pro Ile Thr Asn Ser Ser Leu Thr His Thr Asn Tyr Thr 85 90 95 Arg Leu Phe Asn Ser Ser Ser Ala Leu Asn Ile Thr Glu Leu Tyr Asn 100 105 110 Val Ala Arg Val Val Asn Glu Thr Ile Gln Asp Asn Leu Ala Ala Ser 115 120 125 Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 130 135 <210> 29 <211> 115 <212> PRT <213> Artificial Sequence <220> <223> TFP 23 <400> 29 Met Arg Ala Ile Thr Leu Leu Ser Ser Val Val Ser Leu Ala Leu Leu 1 5 10 15 Ser Lys Glu Val Leu Ala Thr Pro Pro Ala Cys Leu Leu Ala Cys Val 20 25 30 Ala Gln Val Gly Lys Ser Ser Ser Thr Cys Asp Ser Leu Asn Gln Val 35 40 45 Thr Cys Tyr Cys Glu His Glu Asn Ser Ala Val Lys Lys Cys Leu Asp 50 55 60 Ser Ile Cys Pro Asn Asn Asp Ala Asp Ala Ala Tyr Ser Ala Phe Lys 65 70 75 80 Ser Ser Cys Ser Glu Gln Asn Ala Ser Leu Gly Asp Ser Ser Gly Ser 85 90 95 Ala Ser Ser Ser Val Leu Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu 100 105 110 Asp Lys Arg 115 <210> 30 <211> 170 <212> PRT <213> Artificial Sequence <220> <223> TFP 24 <400> 30 Met Lys Leu Ser Thr Val Leu Leu Ser Ala Gly Leu Ala Ser Thr Thr 1 5 10 15 Leu Ala Gln Phe Ser Asn Ser Thr Ser Ala Ser Ser Thr Asp Val Thr 20 25 30 Ser Ser Ser Ser Ile Ser Thr Ser Ser Gly Ser Val Thr Ile Thr Ser 35 40 45 Ser Glu Ala Pro Glu Ser Asp Asn Gly Thr Ser Thr Ala Ala Pro Thr 50 55 60 Glu Thr Ser Thr Glu Ala Pro Thr Thr Ala Ile Pro Thr Asn Gly Thr 65 70 75 80 Ser Thr Glu Ala Pro Thr Thr Ala Ile Pro Thr Asn Gly Thr Ser Thr 85 90 95 Glu Ala Pro Thr Asp Thr Thr Thr Glu Ala Pro Thr Thr Ala Leu Pro 100 105 110 Thr Asn Gly Thr Ser Thr Glu Ala Pro Thr Asp Thr Thr Thr Glu Ala 115 120 125 Pro Thr Thr Gly Leu Pro Thr Asn Gly Thr Thr Ser Ala Phe Pro Pro 130 135 140 Thr Thr Ser Leu Pro Pro Ser Asn Thr Thr Thr Thr Leu Ala Ala Ser 145 150 155 160 Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 165 170 <210> 31 <211> 354 <212> DNA <213> Artificial Sequence <220> <223> TFP 1 <400> 31 atgttcaatc gttttaacaa attccaagct gctgtcgctt tggccctact ctctcgcggc 60 gctctcggtg actcttacac caatagcacc tcctccgcag acttgagttc tatcacttcc 120 gtctcgtcag ctagtgcaag tgccaccgct tccgactcac tttcttccag tgacggtacc 180 gtttatttgc catccacaac aattagcggt gatctcacag ttactggtaa agtaattgca 240 accgaggccg tggaagtcgc tgccggtggt aagttgactt tacttgacgg tgaaaaatac 300 gtcttctcat ctgaggccgc ctcggcctct gctggcctcg ccttagataa aaga 354 <210> 32 <211> 390 <212> DNA <213> Artificial Sequence <220> <223> TFP 2 <400> 32 atgacgccct atgcagtagc aattaccgtg gccttactaa ttgtaacagt gagcgcactc 60 caggtcaaca attcatgtgt cgcttttccg ccatcaaatc tcaggggcaa gaatggagac 120 ggtactaatg aacagtatgc aactgcacta ctttctattc cctggaatgg gcctcctgag 180 tcatcgaggg atattaatct tatcgaactc gaaccgcaag ttgcactcta tttgctcgaa 240 aattatatta accattacta caacaccaca agagacaata agtgccctaa taaccactac 300 ctaatgggag ggcagttggg tagctcatcg gataatagga gtttgaacga ggccgcctcg 360 gcctctgctg gcctcgcctt agataaaaga 390 <210> 33 <211> 351 <212> DNA <213> Artificial Sequence <220> <223> TFP 3 <400> 33 atgcaattca aaaacgtcgc cctagctgcc tccgttgctg ctctatccgc cactgcttct 60 gctgaaggtt acactccagg tgaaccatgg tccaccttaa ccccaaccgg ctccatctct 120 tgtggtgcag ccgaatacac taccaccttt ggtattgctg ttcaagctat tacctcttca 180 aaagctaaga gagacgttat ctctcaaatt ggtgacggtc aagtccaagc cacttctgct 240 gctactgctc aagccaccga tagtcaagcc caagctacta ctaccgctac cccaaccagc 300 tccgaaaaga tggccgcctc ggcctctgct ggcctcgcct tagataaaag a 351 <210> 34 <211> 186 <212> DNA <213> Artificial Sequence <220> <223> TFP 4 <400> 34 atgagatttg cagaattctt ggtggtattt gccacgttag gcggggggat ggctgcaccg 60 gttgagtctc tggccgggac ccaacggtat ctggtgcaaa tgaaggagcg gttcaccaca 120 gagaagctgt gtgctttgga cgacaaggcc gcctcggcct ctgctggcct cgccttagat 180 aaaaga 186 <210> 35 <211> 291 <212> DNA <213> Artificial Sequence <220> <223> TFP 5 <400> 35 atgttcaatc gttttaacaa attccaagct gctgtcgctt tggccctact ctctcgcggc 60 gctctcggtg ctccagtcaa cactacaaca gaagatgaaa cggcactaat tccggctgaa 120 gctgtcatcg gttacttaga tttagaaggg gatttcgatg ttgctgtttt gccattttcc 180 aacagcacaa ataacgggtt attgtttata aatactacta ttgccagcat tgctgctaaa 240 gaagaagggg tggccgcctc ggcctctgct ggcctcgcct tagataaaag a 291 <210> 36 <211> 279 <212> DNA <213> Artificial Sequence <220> <223> TFP 6 <400> 36 atgagatttc cttcaatttt tactgcagtt ttattcgcag catcctccgc attagctgct 60 ccagtcaaca ctacaacaga agatgaaacg gcacaaattc cggctgaagc tgtcatcggt 120 tacttagatt tagaagggga tttcgatgtt gctgttttgc cattttccaa cagcacaaat 180 aacgggttat tgtttataaa tactactatt gccagcattg ctgctaaaga agaaggggtg 240 gccgcctcgg cctctgctgg cctcgcctta gataaaaga 279 <210> 37 <211> 678 <212> DNA <213> Artificial Sequence <220> <223> TFP 7 <400> 37 atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60 actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120 aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180 gctatcgctg tttttgaatt tgacaatttc tcattattgg acagcttgat gattgacgaa 240 gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300 tcgcctttga acatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360 ttacctgaaa gtgcctctga cttactatat gaatactcct tagatgataa aagcatcgtt 420 ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480 tgcttatcgt ttttggaaga taaatctggc gacaatttga ctgtggttat taactctctt 540 ggttgggctt ttgaagatga agatggtgac gatgaatatg caacagaaga gactttgagc 600 catcatgata acaacaaggg taaagaaggc gacgatctgg ccgcctcggc ctctgctggc 660 ctcgccttag ataaaaga 678 <210> 38 <211> 192 <212> DNA <213> Artificial Sequence <220> <223> TFP 8 <400> 38 atgcttcaat ccgttgtctt tttcgctctt ttaaccttcg caagttctgt gtcagcgatt 60 tattcaaaca atactgtttc tacaactacc actttagcgc ccagctactc cttggtgccc 120 caagagacta ccatatcgta cgccgacgac ctggccgcct cggcctctgc tggcctcgcc 180 ttagataaaa ga 192 <210> 39 <211> 414 <212> DNA <213> Artificial Sequence <220> <223> TFP 9 <400> 39 atgaaattct caactgccgt tactacgttg attagttctg gtgccatcgt gtctgcttta 60 ccacacgtgg atgttcacca agaagatgcc caccaacata agagggccgt tgcgtacaaa 120 tacgtttacg aaactgttgt tgtcgattct gatggccaca ctgtaactcc tgctgcttca 180 gaagtcgcta ctgctgctac ctctgctatc attacaacat ctgtgttggc tccaacctcc 240 tccgcagccg ctgcggatag ctccgcttcc attgctgttt catctgctgc cttagccaag 300 aatgagaaaa tctctgatgc cgctgcatct gccactgcct caacatctca aggggcatcc 360 tcctcatcct acctggccgc ctcggcctct gctggcctcg ccttagataa aaga 414 <210> 40 <211> 597 <212> DNA <213> Artificial Sequence <220> <223> TFP 10 <400> 40 atgaattggc tgtttttggt ctcgctggtt ttcttctgcg gcgtgtcaac ccatcctgcc 60 ctggcaatgt ccagcaacag actactaaag ctggctaata aatctcccaa gaaaattata 120 cctctgaagg actcaagttt tgaaaacatc ttggcaccac ctcacgaaaa tgcctatata 180 gttgctctgt ttactgccac agcgcccgaa attggctgtt ctctgtgtct cgagctagaa 240 tccgaatacg acaccatagt ggcctcctgg tttgatgatc atccggatgc aaaatcgtcc 300 aattccgata catctatttt cttcacaaag gtcaatttgg aggacccttc taagaccatt 360 cctaaagcgt tccagttttt ccaactaaac aatgttccta gattgttcat cttcaaacta 420 aactctccct ctattctgga ccacagcgtg atcagtattt ccactgatac tggctcagaa 480 agaatgaagc aaatcataca agccattaag cagttctcgc aagtaaacga cttctcttta 540 cacttacctg tgggtctggc cgcctcggcc tctgctggcc tcgccttaga taaaaga 597 <210> 41 <211> 231 <212> DNA <213> Artificial Sequence <220> <223> TFP 11 <400> 41 atgaagttct cttctgttac tgctattact ctagccaccg ttgccaccgt tgccactgct 60 aagaagggtg aacatgattt cactaccact ttaactttgt catcggacgg tagtttaact 120 actaccacct ctactcatac cactcacaag tatggtaagt tcaacaagac ttccaagtcc 180 aagacccccc tggccgcctc ggcctctgct ggcctcgcct tagataaaag a 231 <210> 42 <211> 282 <212> DNA <213> Artificial Sequence <220> <223> TFP 12 <400> 42 atggcctcat ttgctactaa gtttgtcatt gcttgcttcc tgttcttctc ggcgtccgcc 60 cataatgtcc ttcttccagc ttatggccgt agatgcttct tcgaagactt gagtaagggt 120 gacgagctct ccatttcgtt ccagttcggt gatagaaacc ctcaatccag tagccagctg 180 actggtgact ttatcatcta cgggccggaa agacatgaag ttttgaaaac ggttagggaa 240 ctggccgcct cggcctctgc tggcctcgcc ttagataaaa ga 282 <210> 43 <211> 522 <212> DNA <213> Artificial Sequence <220> <223> TFP 13 <400> 43 atgcaataca aaaagacttt ggttgcctct gctttggccg ctactacatt ggccgcctat 60 gctccatctg agccttggtc cactttgact ccaacagcca cttacagcgg tggtgttacc 120 gactacgctt ccaccttcgg tattgccgtt caaccaatct ccactacatc cagcgcatca 180 tctgcagcca ccacagcctc atctaaggcc aagagagctg cttcccaaat tggtgatggt 240 caagtccaag ctgctaccac tactgcttct gtctctacca agagtaccgc tgccgccgtt 300 tctcagatcg gtgatggtca aatccaagct actaccaaga ctaccgctgc tgctgtctct 360 caaattggtg atggtcaaat tcaagctacc accaagacta cctctgctaa gactaccgcc 420 gctgccgttt ctcaaatcag tgatggtcaa atccaagcta ccaccactac tttagcccct 480 ctggccgcct cggcctctgc tggcctcgcc ttagataaaa ga 522 <210> 44 <211> 204 <212> DNA <213> Artificial Sequence <220> <223> TFP 14 <400> 44 atgcaattca agaacgcttt gactgctact gctattctaa gtgcctccgc tctagctgct 60 aactcaacta cttctattcc atcttcatgt agtattggta cttctgccac tgctactgct 120 caagccaccg atagtcaagc ccaagctact actaccgcac ccctggccgc ctcggcctct 180 gctggcctcg ccttagataa aaga 204 <210> 45 <211> 471 <212> DNA <213> Artificial Sequence <220> <223> TFP 15 <400> 45 atggtatcga agacttggat atgtggcttc atcagtataa ttacagtggt acaggccttg 60 tcctgcgaga agcatgatgt attgaaaaag tatcaggtgg gaaaatttag ctcactaact 120 tctacggaaa gggatactcc gccaagcaca actattgaaa agtggtggat aaacgtttgc 180 gaagagcata acgtagaacc tcctgaagaa tgtaaaaaaa atgacatgct atgtggttta 240 acagatgtca tcttgcccgg taaggatgct atcaccactc aaattataga ttttgacaaa 300 aacattggct tcaatgtcga ggaaactgag agtgcgctta cattgacact aaacggcgct 360 acgtggggcg ccaattcttt tgacgcaaaa ctagaatttc agtgtaatga caatatgaaa 420 caagacgaac tggccgcctc ggcctctgct ggcctcgcct tagataaaag a 471 <210> 46 <211> 294 <212> DNA <213> Artificial Sequence <220> <223> TFP 16 <400> 46 atgaaattat ccgctctatt agctttatca gcctccaccg ccgtcttggc cgctccagct 60 gtccaccata gtgacaacca ccaccacaac gacaagcgtg ccgttgtcac cgttactcag 120 tacgtcaacg cagacggcgc tgttgttatt ccagctgcca ccaccgctac ctcggcggct 180 gctgatggaa aggtcgagtc tgttgctgct gccaccacta ctttgtcctc gactgccgcc 240 gccgctacaa ccctggccgc ctcggcctct gctggcctcg ccttagataa aaga 294 <210> 47 <211> 585 <212> DNA <213> Artificial Sequence <220> <223> TFP 17 <400> 47 atgaaattat caactgtcct attatctgcc ggtttagcct cgactacttt ggcccaattt 60 tccaacagta catctgcttc ttccaccgat gtcacttcct cctcttccat ctccacttcc 120 tctggctcag taactatcac atcttctgaa gctccagaat ccgacaacgg taccagcaca 180 gctgcaccaa ctgaaacctc aacagaggct ccaaccactg ctatcccaac taacggtacc 240 tctactgaag ctccaaccac tgctatccca actaacggta cctctactga agctccaact 300 gatactacta ctgaagctcc aaccaccgct cttccaacta acggtacttc tactgaagct 360 ccaactgata ctactactga agctccaacc accggtcttc caaccaacgg taccacttca 420 gctttcccac caactacatc tttgccacca agcaacacta ccaccactcc tccttacaac 480 ccatctactg actacaccac tgactacact gtagtcactg aatatactac ttactgtccg 540 gaacgggccg cctcggcctc tgctggcctc gccttagata aaaga 585 <210> 48 <211> 315 <212> DNA <213> Artificial Sequence <220> <223> TFP 18 <400> 48 atgcgtttct ctactacact cgctactgca gctactgcgc tatttttcac agcctcccaa 60 gtttcagcta ttggtgaact agcctttaac ttgggtgtca agaacaacga tggtacttgt 120 aagtccactt ccgactatga aaccgaatta caagctttga agagctacac ttccaccgtc 180 aaagtttacg ctgcctcaga ttgtaacact ttgcaaaact taggtcctgc tgctgaagct 240 gagggattta ctatctttgt cggtgtttgg ccactggccg cctcggcctc tgctggcctc 300 gccttagata aaaga 315 <210> 49 <211> 372 <212> DNA <213> Artificial Sequence <220> <223> TFP 19 <400> 49 atgcgtctct ctaacctaat tgcttctgcc tctcttttat ctgctgctac tcttgctgct 60 cccgctaacc acgaacacaa ggacaagcgt gctgtggtca ctaccactgt tcaaaaacaa 120 accactatca ttgttaatgg tgccgcttca actccagttg ctgctttgga agaaaatgct 180 gttgtcaact ccgctccagc tgccgctacc agtacaacat cgtctgctgc ttctgtagct 240 accgctgctt cctcttctga gaacaactca caagtttctg ctgccgcatc tccagcctcc 300 agctctgctg ctacatctac tcaatcttct ctggccgcct cggcctctgc tggcctcgcc 360 ttagataaaa ga 372 <210> 50 <211> 414 <212> DNA <213> Artificial Sequence <220> <223> TFP 20 <400> 50 atgcaatttt ctactgtcgc ttctatcgcc gctgtcgccg ctgtcgcttc tgccgctgct 60 aacgttacca ctgctactgt cagccaagaa tctaccactt tggtcaccat cacttcttgt 120 gaagaccacg tctgttctga aactgtctcc ccagctttgg tttccaccgc taccgtcacc 180 gtcgatgacg ttatcactca atacaccacc tggtgcccat tgaccactga agccccaaag 240 aacggtactt ctactgctgc tccagttacc tctactgaag ctccaaagaa caccacctct 300 gctgctccaa ctcactctgt cacctcttac actggtgctg ctgctaaggc tttgccagct 360 gctggtgctt tgctggccgc ctcggcctct gctggcctcg ccttagataa aaga 414 <210> 51 <211> 528 <212> DNA <213> Artificial Sequence <220> <223> TFP 21 <400> 51 atgaaattct cttccgcttt ggttctatct gctgttgccg ctactgctct tgctgagagt 60 atcaccacca ccatcactgc caccaagaac ggtcatgtct acactaagac tgtcacccaa 120 gatgctactt ttgtttgggg tggtgaagac tcttacgcca gcagcacttc tgccgctgaa 180 tcttctgccg ccgaaacttc tgccgccgaa acctctgctg ccgctaccac ttctgctgcc 240 gctaccactt ctgctgctga gacttcttct gctgctgaga cttcttctgc tgatgaaggt 300 tctggttcta gtatcactac cactatcact gccaccaaga acggtcacgt ctacactaag 360 actgtcaccc aagatgctac ttttgtctgg actggtgaag gcagcagcaa cacctggtct 420 ccaagtagta cctctaccag ctcagaagct gctacctctt ctgcttcaac cactgcaacc 480 accctgctgg ccgcctcggc ctctgctggc ctcgccttag ataaaaga 528 <210> 52 <211> 414 <212> DNA <213> Artificial Sequence <220> <223> TFP 22 <400> 52 atgaagttcc aagttgtttt atctgccctt ttggcatgtt catctgccgt cgtcgcaagc 60 ccaatcgaaa acctattcaa atacagggca gttaaggcat ctcacagtaa gaatatcaac 120 tccactttgc cggcctggaa tgggtctaac tctagcaatg ttacctacgc taatggaaca 180 aacagtacta ccaatactac tactgccgaa agcagtcaat tacaaatcat tgtaacaggt 240 ggtcaagtac caatcaccaa cagttctttg acccacacaa actacaccag attattcaac 300 agttcttctg ctttgaacat taccgaattg tacaatgttg cccgtgttgt taacgaaacg 360 atccaagata acctggccgc ctcggcctct gctggcctcg ccttagataa aaga 414 <210> 53 <211> 345 <212> DNA <213> Artificial Sequence <220> <223> TFP 23 <400> 53 atgcgtgcca tcactttatt atcttcagtc gtttctttgg cattgttgtc gaaggaagtc 60 ttagcaacac ctccagcttg tttattggcc tgtgttgcgc aagtcggcaa atcctcttcc 120 acatgtgact ctttgaatca agtcacctgt tactgtgaac acgaaaactc cgccgtcaag 180 aaatgtctag actccatctg cccaaacaat gacgctgatg ctgcttattc tgctttcaag 240 agttcttgtt ccgaacaaaa tgcttcattg ggcgattcca gcggcagtgc ctcctcatcc 300 gttctggccg cctcggcctc tgctggcctc gccttagata aaaga 345 <210> 54 <211> 510 <212> DNA <213> Artificial Sequence <220> <223> TFP 24 <400> 54 atgaaattat caactgtcct attatctgcc ggtttggcct cgactacttt ggcccaattt 60 tccaacagta catctgcttc ttccaccgat gtcacttcct cctcttccat ctccacttcc 120 tctggctcag taactatcac atcttctgaa gctccagaat ccgacaacgg taccagcaca 180 gctgcaccaa ctgaaacctc aacagaggct ccaaccactg ctatcccaac taacggtacc 240 tctactgaag ctccaaccac tgctatccca actaacggta cctctactga agctccaact 300 gatactacta ctgaagctcc aaccaccgct cttccaacta acggtacttc tactgaagct 360 ccaactgata ctactactga agctccaacc accggtcttc caaccaacgg taccacttca 420 gctttcccac caactacatc tttgccacca agcaacacta ccaccactct ggccgcctcg 480 gcctctgctg gcctcgcctt agataaaaga 510 <210> 55 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> GAL100 <400> 55 gtatatggtg gtaatgccat g 21 <210> 56 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> GT50R <400> 56 gtcattatta aatatatata tatatatatt gtcactccgt tcaagtcgac 50 <210> 57 <211> 345 <212> PRT <213> Artificial Sequence <220> <223> RML-3G#4 <400> 57 Val Pro Ile Lys Arg Gln Ser Asn Ser Thr Val Asp Ser Leu Pro Pro 1 5 10 15 Leu Ile Pro Ser Arg Thr Ser Ala Pro Ser Ser Ser Pro Ser Thr Thr 20 25 30 Asp Pro Glu Ala Pro Ala Met Ser Arg Asn Gly Pro Leu Pro Ser Asp 35 40 45 Val Glu Thr Asn Tyr Gly Met Ala Leu Asn Ala Thr Ser Tyr Pro Asp 50 55 60 Ser Val Val Gln Ala Met Ser Ile Asp Gly Gly Ile Arg Ala Ala Thr 65 70 75 80 Ser Gln Glu Ile Asn Glu Leu Thr Tyr Tyr Thr Thr Leu Ser Ala Asn 85 90 95 Ser Tyr Cys Arg Thr Val Ile Pro Gly Ala Thr Trp Asp Cys Ile His 100 105 110 Cys Asp Ala Thr Glu Asp Leu Lys Ile Ile Lys Thr Trp Ser Thr Leu 115 120 125 Ile Tyr Asp Thr Asn Ala Met Val Ala Arg Gly Asp Ser Glu Lys Thr 130 135 140 Ile Tyr Ile Val Phe Arg Gly Ser Ser Ser Ile Arg Asn Trp Ile Ala 145 150 155 160 Asp Leu Thr Phe Val Pro Val Ser Tyr Pro Pro Val Ser Gly Thr Lys 165 170 175 Val His Lys Gly Phe Leu Asp Ser Tyr Gly Glu Val Gln Asp Glu Leu 180 185 190 Val Ala Thr Val Leu Asp Gln Phe Lys Gln Tyr Pro Ser Tyr Lys Val 195 200 205 Ala Val Thr Gly His Ser Leu Gly Gly Ala Thr Ala Leu Leu Cys Ala 210 215 220 Leu Gly Leu Tyr Gln Arg Glu Glu Gly Leu Ser Ser Ser Asn Leu Phe 225 230 235 240 Leu Tyr Thr Gln Gly Gln Pro Arg Val Gly Asp Pro Ala Phe Ala Asn 245 250 255 Tyr Val Val Ser Thr Gly Ile Pro Tyr Arg Arg Thr Val Asn Glu Arg 260 265 270 Asp Ile Val Pro His Leu Pro Pro Ala Ala Phe Gly Phe Leu His Ala 275 280 285 Gly Glu Glu Tyr Trp Ile Thr Asp Asn Ser Pro Glu Thr Val Gln Val 290 295 300 Cys Thr Ser Asp Leu Glu Thr Ser Asp Cys Ser Asn Ser Ile Val Pro 305 310 315 320 Phe Thr Ser Val Leu Asp His Leu Ser Tyr Phe Gly Ile Asn Thr Gly 325 330 335 Leu Cys Thr His His His Asp His His 340 345 <210> 58 <211> 1038 <212> DNA <213> Artificial Sequence <220> <223> RML-3G#4 <400> 58 gtgccaatca agagacaatc aaacagcacg gtggatagtc tgccacccct catcccctct 60 cgaacctcgg caccttcatc atcaccaagc acaaccgacc ctgaagctcc agccatgagt 120 cgcaatggac cgctgccctc ggatgtagag actaattatg gcatggcttt gaatgctact 180 tcctatccgg attctgtggt ccaagcaatg agcattgatg gtggtatccg cgctgcgacc 240 tcgcaagaaa tcaatgaatt gacttattac actacactat ctgccaactc gtactgccgc 300 actgtcattc ctggagctac ctgggactgt atccactgtg atgcaacgga ggatctcaag 360 attatcaaga cttggagcac gctcatctat gatacaaatg caatggttgc acgtggtgac 420 agcgaaaaaa ctatctatat cgttttccga ggttcgagct ctatccgcaa ctggattgct 480 gatctcacct ttgtgccagt ttcatatcct ccggtcagtg gtacaaaagt acacaaggga 540 ttcctggaca gttacgggga agttcaagac gagcttgttg ctactgttct tgatcaattc 600 aagcaatatc caagctacaa ggttgctgtt acaggtcact cactcggtgg tgctactgcg 660 ttgctttgcg ccctgggtct ctatcaacga gaagaaggac tctcatccag caacttgttc 720 ctttacactc aaggtcaacc acgggtaggc gaccctgcct ttgccaacta cgttgttagc 780 accggcattc cttacaggcg cacggtcaat gaacgagata tcgttcctca tcttccacct 840 gctgcttttg gttttctcca cgctggcgag gagtattgga ttactgacaa tagcccagag 900 actgttcagg tctgcacaag cgatctggaa acctctgatt gctctaacag cattgttccc 960 ttcacaagtg ttcttgacca tctctcgtac tttggtatca acacaggcct ctgtactcat 1020 caccatgacc atcactaa 1038 <210> 59 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> MJ706 <400> 59 tagataaaag atctgttgtg ccaatcaaga ga 32 <210> 60 <211> 341 <212> PRT <213> Artificial Sequence <220> <223> SV-RML-3G#4 <400> 60 Ser Val Val Pro Ile Lys Arg Gln Ser Asn Ser Thr Val Asp Ser Leu 1 5 10 15 Pro Pro Leu Ile Pro Ser Arg Thr Ser Ala Pro Ser Ser Ser Pro Ser 20 25 30 Thr Thr Asp Pro Glu Ala Pro Ala Met Ser Arg Asn Gly Pro Leu Pro 35 40 45 Ser Asp Val Glu Thr Asn Tyr Gly Met Ala Leu Asn Ala Thr Ser Tyr 50 55 60 Pro Asp Ser Val Val Gln Ala Met Ser Ile Asp Gly Gly Ile Arg Ala 65 70 75 80 Ala Thr Ser Gln Glu Ile Asn Glu Leu Thr Tyr Tyr Thr Thr Leu Ser 85 90 95 Ala Asn Ser Tyr Cys Arg Thr Val Ile Pro Gly Ala Thr Trp Asp Cys 100 105 110 Ile His Cys Asp Ala Thr Glu Asp Leu Lys Ile Ile Lys Thr Trp Ser 115 120 125 Thr Leu Ile Tyr Asp Thr Asn Ala Met Val Ala Arg Gly Asp Ser Glu 130 135 140 Lys Thr Ile Tyr Ile Val Phe Arg Gly Ser Ser Ser Ile Arg Asn Trp 145 150 155 160 Ile Ala Asp Leu Thr Phe Val Pro Val Ser Tyr Pro Pro Val Ser Gly 165 170 175 Thr Lys Val His Lys Gly Phe Leu Asp Ser Tyr Gly Glu Val Gln Asp 180 185 190 Glu Leu Val Ala Thr Val Leu Asp Gln Phe Lys Gln Tyr Pro Ser Tyr 195 200 205 Lys Val Ala Val Thr Gly His Ser Leu Gly Gly Ala Thr Ala Leu Leu 210 215 220 Cys Ala Leu Gly Leu Tyr Gln Arg Glu Glu Gly Leu Ser Ser Ser Asn 225 230 235 240 Leu Phe Leu Tyr Thr Gln Gly Gln Pro Arg Val Gly Asp Pro Ala Phe 245 250 255 Ala Asn Tyr Val Val Ser Thr Gly Ile Pro Tyr Arg Arg Thr Val Asn 260 265 270 Glu Arg Asp Ile Val Pro His Leu Pro Pro Ala Ala Phe Gly Phe Leu 275 280 285 His Ala Gly Glu Glu Tyr Trp Ile Thr Asp Asn Ser Pro Glu Thr Val 290 295 300 Gln Val Cys Thr Ser Asp Leu Glu Thr Ser Asp Cys Ser Asn Ser Ile 305 310 315 320 Val Pro Phe Thr Ser Val Leu Asp His Leu Ser Tyr Phe Gly Ile Asn 325 330 335 Thr Gly Leu Cys Thr 340 <210> 61 <211> 1023 <212> DNA <213> Artificial Sequence <220> <223> SV-RML-3G#4 <400> 61 tctgttgtgc caatcaagag acaatcaaac agcacggtgg atagtctgcc acccctcatc 60 ccctctcgaa cctcggcacc ttcatcatca ccaagcacaa ccgaccctga agctccagcc 120 atgagtcgca atggaccgct gccctcggat gtagagacta attatggcat ggctttgaat 180 gctacttcct atccggattc tgtggtccaa gcaatgagca ttgatggtgg tatccgcgct 240 gcgacctcgc aagaaatcaa tgaattgact tattacacta cactatctgc caactcgtac 300 tgccgcactg tcattcctgg agctacctgg gactgtatcc actgtgatgc aacggaggat 360 ctcaagatta tcaagacttg gagcacgctc atctatgata caaatgcaat ggttgcacgt 420 ggtgacagcg aaaaaactat ctatatcgtt ttccgaggtt cgagctctat ccgcaactgg 480 attgctgatc tcacctttgt gccagtttca tatcctccgg tcagtggtac aaaagtacac 540 aagggattcc tggacagtta cggggaagtt caagacgagc ttgttgctac tgttcttgat 600 caattcaagc aatatccaag ctacaaggtt gctgttacag gtcactcact cggtggtgct 660 actgcgttgc tttgcgccct gggtctctat caacgagaag aaggactctc atccagcaac 720 ttgttccttt acactcaagg tcaaccacgg gtaggcgacc ctgcctttgc caactacgtt 780 gttagcaccg gcattcctta caggcgcacg gtcaatgaac gagatatcgt tcctcatctt 840 ccacctgctg cttttggttt tctccacgct ggcgaggagt attggattac tgacaatagc 900 ccagagactg ttcaggtctg cacaagcgat ctggaaacct ctgattgctc taacagcatt 960 gttcccttca caagtgttct tgaccatctc tcgtactttg gtatcaacac aggcctctgt 1020 act 1023

Claims

리파제를 코딩하는 핵산을 포함하는 리파제 분비 발현 카세트로서, 상기 리파제는 서열번호 1의 아미노산 서열에서 N-말단으로부터 52 번째 아미노산이 아스파라긴(Asn)으로 치환되고 190 번째 아미노산이 아스파르트산(Asp)으로 치환된, 리파제 분비 발현 카세트.
삭제
제1항에 있어서, 상기 리파제 분비 발현 카세트는 단백질 분비 융합인자를 코딩하는 핵산을 추가적으로 포함하는 것인, 리파제 분비 발현 카세트.
제3항에 있어서, 상기 단백질 분비 융합인자는 서열번호 10의 TFP 4, 서열번호 14의 TFP 8, 서열번호 19의 TFP 13, 서열번호 25의 TFP 19로 이루어진 군으로부터 선택되는 것인, 리파제 분비 발현 카세트.
제4항에 있어서, 상기 단백질 분비 융합인자 TFP 19는 서열번호 25의 아미노산 서열에서 N-말단으로부터 109 번째 아미노산이 트레오닌(Thr)으로 치환된, 리파제 분비 발현 카세트.
제1항에 있어서, 상기 리파제는 서열번호 1의 아미노산 서열에서 N-말단으로부터 52 번째 아미노산이 아스파라긴(Asn)으로 치환되고 190 번째 아미노산이 아스파르트산(Asp)으로 치환된 아미노산 서열에서 N-말단에 세린(serine) 및 발린(valine)으로 이루어지는 아미노산 서열이 추가된, 리파제 분비 발현 카세트.
제1항, 제3항 내지 제6항 중 어느 한 항의 리파제 분비 발현 카세트를 포함하는, 발현벡터.
제7항의 발현 벡터가 포함된, 형질전환 미생물.
제8항에 있어서, 상기 형질전환 미생물은 효모인 것인, 형질전환 미생물.
제9항에 있어서, 상기 효모는 캔디다 (Candida), 디베리오마이세스 (Debaryomyces), 한세눌라 (Hansenula), 클루이베로마이세스 (Kluyveromyces), 피키아 (Pichia), 스키조사카로마이세스 (Schizosaccharomyces), 야로이야 (Yarrowia), 사카로마이세스 (Saccharomyces), 슈완니오마이세스 (Schwanniomyces) 및 아르술라 (Arxula) 속으로 이루어진 군으로부터 선택되는 것인, 형질전환 미생물.
(i) 제8항 내지 제10항 중 어느 한 항의 형질전환 미생물을 배양하는 단계; 및
(ii) 상기 배양된 미생물 또는 이의 배양 상등액으로부터 리파제를 회수하는 단계;를 포함하는, 리파제 제조방법.
서열번호 1의 아미노산 서열에서 N-말단으로부터 52 번째 아미노산이 아스파라긴(Asn)으로 치환되고 190 번째 아미노산이 아스파르트산(Asp)으로 치환된, 전이에스터 활성 및 분비 발현능이 증가된 변이형 리파제.
삭제