KR102181315B1 - Mutant lipases of Rhizomucor miehei having enhanced transesterification activity and a method of producing the lipase - Google Patents

Mutant lipases of Rhizomucor miehei having enhanced transesterification activity and a method of producing the lipase Download PDF

Info

Publication number
KR102181315B1
KR102181315B1 KR1020190138830A KR20190138830A KR102181315B1 KR 102181315 B1 KR102181315 B1 KR 102181315B1 KR 1020190138830 A KR1020190138830 A KR 1020190138830A KR 20190138830 A KR20190138830 A KR 20190138830A KR 102181315 B1 KR102181315 B1 KR 102181315B1
Authority
KR
South Korea
Prior art keywords
ala
ser
thr
leu
lipase
Prior art date
Application number
KR1020190138830A
Other languages
Korean (ko)
Other versions
KR20200050438A (en
Inventor
손정훈
김미진
배정훈
고현준
성봉현
Original Assignee
한국생명공학연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국생명공학연구원 filed Critical 한국생명공학연구원
Publication of KR20200050438A publication Critical patent/KR20200050438A/en
Application granted granted Critical
Publication of KR102181315B1 publication Critical patent/KR102181315B1/en

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/18Carboxylic ester hydrolases (3.1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Mycology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

본 발명은 리파제를 코딩하는 핵산을 포함하는 리파제 분비 발현 카세트로서, 상기 리파제는 서열번호 1의 아미노산 서열에서 N-말단으로부터 52 번째 및 190 번째 아미노산 중 어느 하나 이상이 다른 아미노산으로 치환된 리파제 분비 발현 카세트; 이를 포함하는 발현 벡터; 이를 포함하는 형질전환 미생물; 상기 형질전환 미생물을 배양하는 단계 및 리파제를 회수하는 단계를 포함하는 리파제의 제조방법; 및 전이에스터 활성 및 분비 발현능이 증가된 변이형 리파제에 관한 것이다.
본 발명의 분비 발현 카세트, 발현 벡터 및 이를 포함하는 형질전환 미생물을 이용하여, 전이에스터 활성이 개선된 리파제를 고효율로 생산할 수 있으며, 생산된 리파제는 전이에스터 반응이 필요한 모든 공정에 유용하게 이용될 수 있다.
The present invention is a lipase secretion expression cassette comprising a nucleic acid encoding lipase, wherein the lipase secretion expression in which at least one of the 52nd and 190th amino acids from the N-terminus in the amino acid sequence of SEQ ID NO: 1 is substituted with another amino acid. cassette; An expression vector comprising this; Transgenic microorganisms including this; A method for producing a lipase comprising the step of culturing the transformed microorganism and recovering the lipase; And a mutant lipase having increased transester activity and secretory expression ability.
By using the secreted expression cassette of the present invention, the expression vector, and the transforming microorganism containing the same, a lipase having improved transester activity can be produced with high efficiency, and the produced lipase will be usefully used in all processes requiring a transester reaction. I can.

Description

활성 개선된 리조무코르 미에헤이 유래 변이 리파제 및 효모를 이용한 재조합 생산 방법{Mutant lipases of Rhizomucor miehei having enhanced transesterification activity and a method of producing the lipase}Mutant lipases of Rhizomucor miehei having enhanced transesterification activity and a method of producing the lipase using mutant lipase derived from Rhizomucor miehei with improved activity

본 발명은 리파제를 코딩하는 핵산을 포함하는 리파제 분비 발현 카세트로서, 상기 리파제는 서열번호 1의 아미노산 서열에서 N-말단으로부터 52 번째 및 190 번째 아미노산 중 어느 하나 이상이 다른 아미노산으로 치환된 리파제 분비 발현 카세트; 이를 포함하는 발현 벡터; 이를 포함하는 형질전환 미생물; 상기 형질전환 미생물을 배양하는 단계 및 리파제를 회수하는 단계를 포함하는 리파제의 제조방법; 및 에스터(ester) 전이 활성 및 분비 발현능이 증가된 변이형 리파제에 관한 것이다.The present invention is a lipase secretion expression cassette comprising a nucleic acid encoding lipase, wherein the lipase secretion expression in which at least one of the 52nd and 190th amino acids from the N-terminus in the amino acid sequence of SEQ ID NO: 1 is substituted with another amino acid. cassette; An expression vector comprising this; Transgenic microorganisms including this; A method for producing a lipase comprising the step of culturing the transformed microorganism and recovering the lipase; And it relates to a mutant lipase having increased ester transfer activity and secretion expression ability.

리파제(Lipase)는 중성지질의 에스터 결합을 가수분해하여 지방산과 글리세롤을 생산하며 지방산의 탄소수에 따라 다양한 기질 특이성을 가진다. 리파제는 가수분해 반응 외에도 에스터화 반응, 에스터전이화(또는 전이에스터) 반응, 아미노분해, 산분해, 알콜분해와 같은 여러 가지 반응을 수행할 수 있고 유전공학 기술로 손쉽게 대량으로 얻을 수 있어 세제산업, 식품산업, 에너지 산업, 제약 산업 등에서 산업적으로 이용하려는 연구가 끊임없이 확대되고 있다.Lipase hydrolyzes ester bonds of neutral lipids to produce fatty acids and glycerol, and has various substrate specificities depending on the carbon number of fatty acids. In addition to the hydrolysis reaction, lipase can perform various reactions such as esterification reaction, transesterification (or transesterification) reaction, amino decomposition, acid decomposition, and alcohol decomposition, and can be easily obtained in large quantities with genetic engineering technology. , Food industry, energy industry, pharmaceutical industry, etc. industrial use research is constantly expanding.

바이오디젤(Biodiesel)은 동, 식물성 기름이 메탄올과 에스터 반응 후 생성되는 지방산 메틸에스터(methyl ester)로 기존의 석유계 경유와 성질이 매우 유사하여 연소 시 공해가 거의 발생하지 않아 석유계 경유와 섞어서 사용할 경우 대기오염의 주범인 자동차 공해를 획기적으로 줄일 수 있는 선진국형 청정 대체 에너지로 최근 그 수요와 필요성이 대폭 증대되고 있다. 각종 오일에서 바이오디젤이 생산되는 과정은 2단계의 화학 반응이 요구되는데 먼저 지질의 가수분해 반응에 의하여 지방산과 글리세롤이 생산되고, 뒤이어 지방산과 알콜(메탄올)이 에스터화하여 메틸에스터화합물, 즉, 바이오디젤을 생산한다.Biodiesel is a fatty acid methyl ester that is produced after ester reaction of copper and vegetable oils with methanol. It has very similar properties to conventional petroleum diesel, so it is mixed with petroleum diesel because it generates little pollution during combustion. When used, it is an advanced country type clean alternative energy that can drastically reduce automobile pollution, which is the main culprit of air pollution, and its demand and necessity are increasing significantly. The process of producing biodiesel from various oils requires a two-step chemical reaction. First, fatty acids and glycerol are produced by the hydrolysis of lipids, followed by esterification of fatty acids and alcohols (methanol) to form methyl ester compounds, that is, Produces biodiesel.

바이오디젤 생산은 강염기 등을 이용하는 화학적 촉매방법을 주로 사용하고 있으나 복잡한 반응공정과 부산물발생 및 다량의 폐수발생으로 2차 환경오염을 유발하는 단점이 있다. 이와 같은 문제를 극복하기 위하여 미생물 유래 생촉매인 효소를 이용하여 바이오디젤을 생산하기 위한 노력이 활발하게 진행되고 있다. 바이오디젤 생산에 이용되는 리파제는 지방산과 메탄올 에스터화 반응을 동시에 촉매하는 전이에스터화 반응이 가능하기 때문에 바이오디젤을 쉽게 생산 할 수 있다.Biodiesel production mainly uses a chemical catalytic method using strong bases, but there is a disadvantage of causing secondary environmental pollution due to complex reaction processes, generation of by-products, and generation of large amounts of wastewater. In order to overcome this problem, efforts to produce biodiesel using enzymes, which are microbial-derived biocatalysts, are being actively conducted. The lipase used in biodiesel production can easily produce biodiesel because it enables a transesterification reaction that catalyzes the esterification of fatty acids and methanol at the same time.

1996년 Nelson 등이 유기용매 하에서 지방분해효소를 통해 바이오디젤 생산이 가능함을 최초로 보고한 바가 있고, 일본에서 고정화 지질분해효소로 바이오디젤 고효율 생산이 가능함을 확인한 바가 있다. 이러한 연구들은 바이오디젤 생산에 유기용매를 사용하지 않아 환경오염을 줄일 수 있다는 점에서 친환경적 생산 공정의 개발 가능성을 보여주며, 현재의 화학공정 중심의 바이오디젤 생산을 미래 친환경 지향적인 생물공정으로 대체가 가능함을 시사한다. 이에, 바이오디젤 생산의 경제성을 확보하기 위해서 높은 효소 활성을 가지는 리파제를 대량으로 생산하기 위한 연구가 경쟁적으로 진행되고 있다. In 1996, Nelson et al. reported for the first time that biodiesel production is possible through lipolytic enzymes in organic solvents, and it has been confirmed in Japan that high-efficiency biodiesel production is possible with immobilized lipolytic enzymes. These studies show the possibility of developing an eco-friendly production process in that it can reduce environmental pollution by not using organic solvents for biodiesel production, and it is possible to replace the current chemical process-centered biodiesel production with future eco-friendly bioprocesses. Suggests possible. Accordingly, in order to secure the economic feasibility of biodiesel production, research on mass production of lipase having high enzyme activity is being conducted competitively.

이러한 배경 하에, 본 발명자들은 고활성 리파제를 대량생산할 수 있는 기술을 개발하기 위하여 예의 노력한 결과, 단백질 분비 융합인자 한국특허 제0975596호)를 이용하여 리조무코르 미에헤이 유래 리파제를 효모에서 대량생산하였다. 나아가 방향성 진화 기술을 이용하여 전이에스터 활성이 250% 개선된 리파제를 제작하여 본 발명을 완성하였다.Under this background, the present inventors have made great efforts to develop a technology capable of mass-producing a highly active lipase, and as a result, mass-produce lipase derived from Rhizomucor Miehei in yeast using a protein secretion fusion factor Korean Patent No. 0975596). . Furthermore, the present invention was completed by producing a lipase having 250% improvement in transester activity using directional evolution technology.

본 발명의 하나의 목적은 리파제를 코딩하는 핵산을 포함하는 리파제 분비 발현 카세트로서, 상기 리파제는 서열번호 1의 아미노산 서열에서 N-말단으로부터 52 번째 및 190 번째 아미노산 중 어느 하나 이상이 다른 아미노산으로 치환된, 리파제 분비 발현 카세트를 제공하는 것이다.One object of the present invention is a lipase secretion expression cassette containing a nucleic acid encoding a lipase, wherein the lipase is substituted with any one or more of the 52nd and 190th amino acids from the N-terminus in the amino acid sequence of SEQ ID NO: 1 It is to provide a lipase secretion expression cassette.

본 발명의 다른 하나의 목적은 상기 발현 카세트를 포함하는, 발현 벡터를 제공하는 것이다.Another object of the present invention is to provide an expression vector comprising the expression cassette.

본 발명의 또 다른 하나의 목적은 상기 발현 벡터를 포함하는 형질전환 미생물을 제공하는 것이다.Another object of the present invention is to provide a transformed microorganism comprising the expression vector.

본 발명의 또 다른 하나의 목적은 상기 형질전환 미생물을 배양하는 단계; 및 상기 배양된 미생물 또는 이의 배양 상등액으로부터 리파제를 회수하는 단계;를 포함하는 리파제의 제조방법을 제공하는 것이다.Another object of the present invention is culturing the transformed microorganism; And recovering lipase from the cultured microorganism or a culture supernatant thereof.

본 발명의 또 다른 하나의 목적은 서열번호 1의 아미노산 서열에서 N-말단으로부터 52 번째 및 190 번째 아미노산 중 어느 하나 이상의 아미노산이 다른 아미노산으로 치환된, 전이에스터 활성 및 분비 발현능이 증가된 변이형 리파제를 제공하는 것이다.Another object of the present invention is a variant lipase with increased transester activity and secretion expression ability in which any one or more of the 52nd and 190th amino acids from the N-terminus in the amino acid sequence of SEQ ID NO: 1 is substituted with another amino acid Is to provide.

본 발명에서 개시된 각각의 설명 및 실시형태는 각각의 다른 설명 및 실시 형태에도 적용될 수 있다. 즉, 본 발명에서 개시된 다양한 요소들의 모든 조합이 본 발명의 범주에 속한다. 또한, 하기 기술된 구체적인 서술에 의하여 본 발명의 범주가 제한된다고 볼 수 없다.Each description and embodiment disclosed in the present invention can be applied to each other description and embodiment. That is, all combinations of various elements disclosed in the present invention belong to the scope of the present invention. In addition, it cannot be seen that the scope of the present invention is limited by the specific description described below.

상기 목적을 달성하기 위한 하나의 양태로서, 본 발명은 리파제를 코딩하는 핵산을 포함하는 리파제 분비 발현 카세트로서, 상기 리파제는 서열번호 1의 아미노산 서열에서 N-말단으로부터 52 번째 및 190 번째 아미노산 중 어느 하나 이상이 다른 아미노산으로 치환된, 리파제 분비 발현 카세트를 제공한다. As an aspect for achieving the above object, the present invention is a lipase secretion expression cassette comprising a nucleic acid encoding lipase, wherein the lipase is any of amino acids 52 and 190 from the N-terminus in the amino acid sequence of SEQ ID NO: 1 It provides a lipase secretion expression cassette in which at least one is substituted with another amino acid.

본 발명의 용어, “리파제(lipase)”는 지방을 분해하는 효소를 의미하며, 구체적으로 중성 지방에 작용하여 트라이아실글리세리드에서 다이아실글리세리드와 모노아실글리세리드를 거쳐서 지방산과 글리세린으로 분해하는 효소를 의미한다. 다양한 리파제들 중에서 리조무코르 미에헤이(Rhizomucor miehei) 유래의 리파제는 당-에스터, 왁스-에스터 등 다양한 유화학제품의 생산에 사용되는 대표적 리파제로서, 지방(Triacylglycerol) 분자의 sn-1과 3의 위치에 특이적으로 작용하는 성질을 가진다. 이는 지방의 에스터 결합을 가수분해하여 글리세롤과 지방산으로 분해한 후, 다시 역으로 에스터 전이 반응하는 기능을 가진다. 반응 위치 특이성을 갖는 1,3-특이적 리파제에 의한 반응 중 일부 지방은 1,2(2,3)-디아실글리세롤(DAG)과 모노아실글리세롤(MAG)로 분해되어 가수분해 생성물을 부수적으로 생성하며 결국 재구성 지질 합성에 있어 미량의 DAG과 MAG가 생성될 수 있다. DAG와 MAG는 식품산업에 있어서 유화제로서 이용되고 있으며, 유지의 물성을 변화시켜 유지의 기능을 개선시킨다.The term “lipase” of the present invention refers to an enzyme that breaks down fat, and specifically refers to an enzyme that acts on neutral fat and breaks down from triacyl glyceride to diacylglyceride and monoacyl glyceride into fatty acids and glycerin. do. Rhizomucor miehei among various lipases The derived lipase is a representative lipase used in the production of various dairy products such as sugar-ester and wax-ester, and has the property of acting specifically at the positions of sn-1 and 3 of the fat (Triacylglycerol) molecule. This has the function of hydrolyzing the ester bond of fat to decompose it into glycerol and fatty acid, and then reverse ester transfer reaction. During the reaction by 1,3-specific lipase with reaction site specificity, some fats are decomposed into 1,2(2,3)-diacylglycerol (DAG) and monoacylglycerol (MAG), concomitantly of hydrolysis products. In the end, in the synthesis of reconstituted lipids, trace amounts of DAG and MAG may be produced. DAG and MAG are used as emulsifiers in the food industry, and improve the function of fats and oils by changing the properties of fats and oils.

상기 리파제는 서열번호 1의 아미노산 서열과 적어도 80%, 90%, 95%, 96%, 97%, 98% 또는 99% 상동성 또는 서열 동일성을 가지는 폴리펩티드를 포함할 수 있다. 예를 들어, 이러한 상동성 혹은 서열 동일성을 가지며, 상기 서열번호 1의 아미노산 서열을 포함하는 리파제와 상응하는 효능을 나타내는 아미노산 서열이라면, 일부 서열이 결실, 변형, 치환 또는 부가된 아미노산 서열을 가지더라도 본 발명의 범위 내에 포함됨은 자명하다.The lipase may include a polypeptide having at least 80%, 90%, 95%, 96%, 97%, 98% or 99% homology or sequence identity with the amino acid sequence of SEQ ID NO: 1. For example, if an amino acid sequence that has such homology or sequence identity and exhibits efficacy corresponding to a lipase comprising the amino acid sequence of SEQ ID NO: 1, even if some sequences have an amino acid sequence that is deleted, modified, substituted or added It is obvious to be included within the scope of the present invention.

즉, 본 발명에서 '특정 서열번호로 기재된 아미노산 서열을 갖는 단백질 또는 폴리펩티드', '특정 서열번호로 기재된 아미노산 서열을 포함하는 단백질 또는 폴리펩티드'라고 기재되어 있다 하더라도, 해당 서열번호의 아미노산 서열로 이루어진 폴리펩티드와 동일 또는 상응하는 활성을 가지는 경우라면, 일부 서열이 결실, 변형, 치환 또는 부가된 아미노산 서열을 갖는 단백질도 본 발명에서 사용될 수 있음은 자명하다. 예를 들어, '서열번호 1의 아미노산 서열로 이루어진 폴리펩티드'는, 이와 동일 또는 상응하는 활성을 가지는 경우라면 '서열번호 1의 아미노산 서열로 이루어진 폴리펩티드'에 속할 수 있음은 자명하다.That is, even if the present invention is described as'protein or polypeptide having an amino acid sequence described by a specific sequence number' or'protein or polypeptide containing an amino acid sequence described by a specific sequence number', a polypeptide consisting of the amino acid sequence of the corresponding sequence number It is obvious that proteins having an amino acid sequence in which some sequences are deleted, modified, substituted or added can also be used in the present invention if they have the same or corresponding activity as. For example, it is obvious that the'polypeptide consisting of the amino acid sequence of SEQ ID NO: 1'may belong to the'polypeptide consisting of the amino acid sequence of SEQ ID NO: 1'if it has the same or corresponding activity.

또한, 상기 리파제는 본 발명의 리조무코르 미에헤이(Rhizomucor miehei) 유래일 수 있으나, 이에 제한되지 않고 전술한 바와 같이 서열 상동성을 가지면서 동일, 유사한 활성을 나타내는 한 모두 본 발명의 범위에 포함될 수 있다.In addition, the lipase may be derived from Rhizomucor miehei of the present invention, but is not limited thereto, and as long as it has sequence homology and exhibits the same or similar activity as described above, all are included in the scope of the present invention. I can.

상기 리파제는 서열번호 1의 아미노산 서열에서 N-말단으로부터 52번째 아미노산이 아스파라긴(Asn)으로, 및/또는 190번째 아미노산이 아스파르트산(Asp)으로 치환된 리파제일 수 있으나, 이에 제한되지 않는다. 구체적으로, 상기 서열번호 1의 아미노산 서열에서 N-말단으로부터 52번째 아미노산이 아스파라긴(Asn)으로, 190번째 아미노산이 아스파르트산(Asp)으로 치환된 리파제는 서열번호 57의 아미노산 서열을 포함할 수 있으나, 이에 제한되지 않는다. 본 발명의 목적상, 상기 리파제는 리파제의 변이형인 것일 수 있으나, 이에 제한되지 않는다.The lipase may be a lipase in which the 52nd amino acid from the N-terminus in the amino acid sequence of SEQ ID NO: 1 is substituted with asparagine (Asn) and/or the 190th amino acid is substituted with aspartic acid (Asp), but is not limited thereto. Specifically, in the amino acid sequence of SEQ ID NO: 1, the lipase in which the 52nd amino acid from the N-terminus is substituted with asparagine (Asn) and the 190th amino acid with aspartic acid (Asp) may include the amino acid sequence of SEQ ID NO: 57. , Is not limited thereto. For the purposes of the present invention, the lipase may be a variant of lipase, but is not limited thereto.

본 발명의 용어, "변이형(variant)"은 하나 이상의 아미노산이 보존적 치환(conservative substitution) 및/또는 변형(modification)에 있어서 상기 열거된 서열(the recited sequence)과 상이하나, 상기 단백질의 기능(functions) 또는 특성(properties)이 유지되는 단백질을 지칭한다. 변이형은 수 개의 아미노산 치환, 결실 또는 부가에 의해 식별되는 서열(identified sequence)과 상이하다. 이러한 변이형은 일반적으로 상기 단백질의 아미노산 서열 중 하나 이상의 아미노산을 변형하고, 상기 변형된 단백질의 특성을 평가하여 식별될 수 있다. 즉, 변이형의 능력은 본래 단백질(native protein)에 비하여 증가되거나, 변하지 않거나, 또는 감소될 수 있다. 또한, 일부 변이형은 N-말단 리더 서열 또는 막전이 도메인(transmembrane domain)과 같은 하나 이상의 부분이 제거된 변이형을 포함할 수 있다. 다른 변이형은 성숙 단백질(mature protein)의 N- 및/또는 C-말단으로부터 일부분이 제거된 변이형을 포함할 수 있다. 상기 용어 "변이형"는 변이체, 변형, 변이된 단백질, 변이형 폴리펩티드, 변이 등의 용어(영문 표현으로는 modification, modified protein, modified polypeptide, mutant, mutein, divergent, variant 등)가 사용될 수 있으며, 변이된 의미로 사용되는 용어라면 이에 제한되지 않는다. 본 발명의 목적상, 상기 변이형은 천연의 야생형 또는 비변형 단백질 대비 변이된 단백질의 전이에스터 활성 및 분비 발현능이 증가된 것일 수 있으나, 이에 제한되지 않는다.The term "variant" of the present invention is one or more amino acids different from the recited sequence in conservative substitution and/or modification, but the function of the protein It refers to a protein in which functions or properties are maintained. Variants differ from the identified sequence by several amino acid substitutions, deletions or additions. Such variants can generally be identified by modifying one or more amino acids of the amino acid sequence of the protein and evaluating the properties of the modified protein. That is, the ability of the variant form may be increased, unchanged, or decreased compared to the native protein. In addition, some variants may include variants in which one or more portions, such as an N-terminal leader sequence or a transmembrane domain, have been removed. Other variants may include variants in which a portion of the mature protein has been removed from the N- and/or C-terminus. The term "variant" may be a term such as variant, modified, mutated protein, variant polypeptide, and mutant (in English expression, modification, modified protein, modified polypeptide, mutant, mutein, divergent, variant, etc.), The term used in a mutated meaning is not limited thereto. For the purposes of the present invention, the mutant may be one having increased transester activity and secretion expression ability of the mutated protein compared to the natural wild type or unmodified protein, but is not limited thereto.

상기에서 "분비 발현능"은 단백질을 발현시키고 이를 미생물 밖으로 분비시키는 기능을 의미한다.In the above, "secretory expression ability" refers to a function of expressing a protein and secreting it out of a microorganism.

본 발명의 구체적인 일실시예에서는, 방향성 진화 방법을 이용하여 리파제의 분비 발현능 및 분비된 리파제의 특이 활성이 향상된 개량 균주에서 리파제의 돌연변이를 확인한 결과, 리파제의 52번째 아미노산이 아스파라긴(Asn)으로, 190번째 아미노산이 아스파르트산(Asp)으로 치환되었음을 확인하였다(표 6).In a specific embodiment of the present invention, as a result of confirming the mutation of lipase in an improved strain with improved secretion expression ability of lipase and specific activity of secreted lipase using a directed evolution method, the 52nd amino acid of lipase is asparagine (Asn). , It was confirmed that the 190 th amino acid was substituted with aspartic acid (Asp) (Table 6).

또한, 본 발명의 구체적인 다른 일실시예에서는, 본 발명의 변이형 리파제를 생산하는 변이주(3G#4)는 리파제 분비 발현량이 증가되었을 뿐만 아니라, 분비된 리파제의 특이 활성도 약 114%로 현저히 증가된 것을 확인하였다(표 8). 또한, 야생형 균주로부터 분비 생산되거나 기존에 시판되는 리파제에 비해 상기 변이주로부터 분비 생산된 리파제는 에스터화 활성 및 전이에스터 활성 모두 월등히 우수함을 확인하였다(도 10).In addition, in another specific embodiment of the present invention, the mutant strain (3G#4) producing the mutant lipase of the present invention not only increased the expression of lipase secretion, but also the specific activity of the secreted lipase was significantly increased to about 114%. It was confirmed (Table 8). In addition, it was confirmed that the lipase secretedly produced from the mutant strain was significantly superior to both the esterification activity and the transesterification activity compared to the lipase produced by secretion from the wild-type strain or previously marketed (FIG. 10).

본 발명의 용어, "발현 카세트(expression cassette)"는 자체적으로 발현되는데 필요한 모든 요소를 포함하는 유전자 구조체를 의미한다. 발현 카세트는 통상 유전자에 작동 가능하게 연결되어 있는 프로모터(promoter), 전사 종결신호, 리보좀 결합부위 및 번역 종결신호를 포함할 수 있다. 상기 발현 카세트는 자체 복제가 가능한 발현 벡터 형태일 수 있다. 또한, 상기 유전자는 그 자체의 형태로 숙주세포에 도입되어 숙주세포에서 발현에 필요한 서열과 작동 가능하게 연결되어 있는 것일 수도 있으며, 이에 제한되지 않는다. 본 발명의 목적상, 상기 발현 카세트는 리파제를 코딩하는 핵산을 포함하는 것일 수 있으며, 리파제의 분비를 유도하는 리파제 분비 발현용 발현 카세트일 수 있다.As used herein, the term "expression cassette" refers to a gene construct including all elements necessary for self-expression. The expression cassette may generally include a promoter operably linked to a gene, a transcription termination signal, a ribosome binding site, and a translation termination signal. The expression cassette may be in the form of an expression vector capable of self-replicating. In addition, the gene may be introduced into a host cell in its own form and operably linked to a sequence required for expression in the host cell, but is not limited thereto. For the purposes of the present invention, the expression cassette may include a nucleic acid encoding lipase, and may be an expression cassette for expressing lipase secretion that induces secretion of lipase.

본 발명의 용어, "핵산"은 알려져 있는 모든 생명체에 필수적인 생체고분자 또는 작은 생체분자로, DNA와 RNA를 모두 포함한다. 핵산은 뉴클레오타이드 단위체로 구성되어 있으며, 뉴클레오타이드는 인산, 5탄당, 핵염기의 3가지 구성 성분으로 이루어진 단위체이다. 핵산은 여러 개의 뉴클레오타이드가 결합한 폴리뉴클레오타이드이므로, 상기 핵산은 폴리뉴클레오타이드 또는 유전자와 혼용하여 사용할 수 있다.The term "nucleic acid" of the present invention is a biopolymer or small biomolecule essential for all known living organisms, and includes both DNA and RNA. Nucleic acid is composed of nucleotide units, and nucleotides are units composed of three components: phosphoric acid, pentose, and nucleobase. Since a nucleic acid is a polynucleotide in which several nucleotides are bound, the nucleic acid can be used in combination with a polynucleotide or gene.

상기 리파제를 코딩하는 핵산은 코돈의 축퇴성(degeneracy)으로 인하여 또는 상기 리파제, 즉, 폴리펩티드를 발현시키고자 하는 생물에서 선호되는 코돈을 고려하여, 폴리펩티드의 아미노산 서열을 변화시키지 않는 범위 내에서 코딩 영역에 다양한 변형이 이루어질 수 있다. 구체적으로, 서열번호 1의 아미노산 서열에서 N-말단으로부터 52 번째 및 190 번째 아미노산 중 어느 하나 이상이 다른 아미노산으로 치환된 리파제를 코딩하는 폴리뉴클레오티드 서열이라면 제한 없이 포함할 수 있다. The nucleic acid encoding the lipase is a coding region within a range that does not change the amino acid sequence of the polypeptide due to the degeneracy of the codon or in consideration of the codon preferred in the organism to express the lipase, that is, the polypeptide. Various variations can be made. Specifically, any polynucleotide sequence encoding a lipase in which at least one of the 52nd and 190th amino acids from the N-terminus in the amino acid sequence of SEQ ID NO: 1 is substituted with another amino acid may be included without limitation.

또한 공지의 유전자 서열로부터 조제될 수 있는 프로브, 예를 들면, 상기 염기 서열의 전체 또는 일부에 대한 상보 서열과 엄격한 조건 하에 하이드리드화하여, 서열번호 1의 아미노산 서열로 이루어지는 리파제 활성을 가지는 단백질을 코딩하는 서열이라면 제한없이 포함될 수 있다. 상기 "엄격한 조건(stringent condition)"이란 폴리뉴클레오티드 간의 특이적 혼성화를 가능하게 하는 조건을 의미한다. 이러한 조건은 문헌(예컨대, J. Sambrook et al., 상동)에 구체적으로 기재되어 있다. 예를 들어, 상동성 또는 동일성이 높은 유전자끼리, 40% 이상, 구체적으로는 90% 이상, 보다 구체적으로는 95% 이상, 더욱 구체적으로는 97% 이상, 특히 구체적으로는 99% 이상의 상동성 또는 동일성을 갖는 유전자끼리 하이브리드화하고, 그보다 상동성 또는 동일성이 낮은 유전자끼리 하이브리드화하지 않는 조건, 또는 통상의 써던 하이브리드화(southern hybridization)의 세척 조건인 60 ℃, 1ХSSC, 0.1% SDS, 구체적으로는 60 ℃, 0.1ХSSC, 0.1% SDS, 보다 구체적으로는 68 ℃, 0.1ХSSC, 0.1% SDS에 상당하는 염 농도 및 온도에서, 1회, 구체적으로는 2회 내지 3회 세정하는 조건을 열거할 수 있다.In addition, a probe that can be prepared from a known gene sequence, for example, a protein having lipase activity consisting of the amino acid sequence of SEQ ID NO: 1 by hydride under stringent conditions with a complementary sequence for all or part of the nucleotide sequence Any coding sequence may be included without limitation. The "stringent condition" means a condition that enables specific hybridization between polynucleotides. These conditions are specifically described in the literature (eg, J. Sambrook et al., homolog). For example, between genes with high homology or identity, 40% or more, specifically 90% or more, more specifically 95% or more, more specifically 97% or more, particularly specifically 99% or more homology or Under conditions that hybridize genes with identity and do not hybridize with genes with lower homology or identity, or wash conditions for common southern hybridization at 60°C, 1ХSSC, 0.1% SDS, specifically At a salt concentration and temperature corresponding to 60° C., 0.1 ХSSC, 0.1% SDS, more specifically 68° C., 0.1 ХSSC, and 0.1% SDS, the conditions for washing once, specifically 2 to 3 times can be listed. have.

혼성화는 비록 혼성화의 엄격도에 따라 염기 간의 미스매치(mismatch)가 가능할지라도, 두 개의 핵산이 상보적 서열을 가질 것을 요구한다. 용어, "상보적"은 서로 혼성화가 가능한 뉴클레오티드 염기 간의 관계를 기술하는데 사용된다. 예를 들면, DNA에 관하여, 아데노신은 티민에 상보적이며 시토신은 구아닌에 상보적이다. 따라서, 본 발명은 또한 실질적으로 유사한 핵산 서열뿐만 아니라 전체 서열에 상보적인 단리된 핵산 단편을 포함할 수 있다.Hybridization requires that two nucleic acids have a complementary sequence, although a mismatch between bases is possible depending on the stringency of hybridization. The term "complementary" is used to describe the relationship between nucleotide bases capable of hybridizing to each other. For example, with respect to DNA, adenosine is complementary to thymine and cytosine is complementary to guanine. Thus, the present invention may also include substantially similar nucleic acid sequences as well as isolated nucleic acid fragments that are complementary to the entire sequence.

구체적으로, 상동성 또는 동일성을 가지는 폴리뉴클레오티드는 55 ℃의 Tm 값에서 혼성화 단계를 포함하는 혼성화 조건을 사용하고 상술한 조건을 사용하여 탐지할 수 있다. 또한, 상기 Tm 값은 60 ℃, 63 ℃ 또는 65 ℃일 수 있으나, 이에 제한되는 것은 아니고 그 목적에 따라 당업자에 의해 적절히 조절될 수 있다.Specifically, polynucleotides having homology or identity can be detected using hybridization conditions including a hybridization step at a Tm value of 55° C. and using the above-described conditions. In addition, the Tm value may be 60°C, 63°C, or 65°C, but is not limited thereto and may be appropriately adjusted by a person skilled in the art according to the purpose.

폴리뉴클레오티드를 혼성화하는 적절한 엄격도는 폴리뉴클레오티드의 길이 및 상보성 정도에 의존하고 변수는 해당기술분야에 잘 알려져 있다(Sambrook et al., supra, 9.50-9.51, 11.7-11.8 참조).The appropriate stringency to hybridize a polynucleotide depends on the length and degree of complementarity of the polynucleotide, and the parameters are well known in the art (see Sambrook et al., supra, 9.50-9.51, 11.7-11.8).

본 발명에서, 용어 '상동성(homology)' 또는 '동일성(identity)'은 두 개의 주어진 아미노산 서열 또는 염기 서열과 관련된 정도를 의미하며 백분율로 표시될 수 있다. 용어 상동성 및 동일성은 종종 상호교환적으로 이용될 수 있다. In the present invention, the term'homology' or'identity' means the degree to which two given amino acid sequences or base sequences are related and may be expressed as a percentage. The terms homology and identity can often be used interchangeably.

보존된(conserved) 폴리뉴클레오티드 또는 폴리펩티드의 서열 상동성 또는 동일성은 표준 배열 알고리즘에 의해 결정되며, 사용되는 프로그램에 의해 확립된 디폴트 갭 페널티가 함께 이용될 수 있다. 실질적으로, 상동성을 갖거나(homologous) 또는 동일한(identical) 서열은 일반적으로 서열 전체 또는 전체-길이의 적어도 약 50%, 60%, 70%, 80% 또는 90%를 따라 중간 또는 높은 엄격한 조건(stringent conditions)에서 하이브리드할 수 있다. 하이브리드화는 폴리뉴클레오티드에서 코돈 대신 축퇴 코돈을 함유하는 폴리뉴클레오티드 또한 고려된다.The sequence homology or identity of a conserved polynucleotide or polypeptide is determined by standard alignment algorithms, and a default gap penalty established by the program used can be used together. Substantially, homologous or identical sequences are generally in medium or high stringent conditions along at least about 50%, 60%, 70%, 80% or 90% of the sequence or full-length. (stringent conditions) can be hybridized. Hybridization is also contemplated for polynucleotides containing degenerate codons instead of codons in the polynucleotide.

임의의 두 폴리뉴클레오티드 또는 폴리펩티드 서열이 상동성, 유사성 또는 동일성을 갖는지 여부는 예를 들어, Pearson et al (1988)[Proc. Natl. Acad. Sci. USA 85]: 2444에서와 같은 디폴트 파라미터를 이용하여 "FASTA" 프로그램과 같은 공지의 컴퓨터 알고리즘을 이용하여 결정될 수 있다. 또는, EMBOSS 패키지의 니들만 프로그램(EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends Genet. 16: 276-277)(버전 5.0.0 또는 이후 버전)에서 수행되는 바와 같은, 니들만-운치(Needleman-Wunsch) 알고리즘(Needleman and Wunsch, 1970, J. Mol. Biol. 48: 443-453)이 사용되어 결정될 수 있다(GCG 프로그램 패키지 (Devereux, J., et al, Nucleic Acids Research 12: 387 (1984)), BLASTP, BLASTN, FASTA (Atschul, [S.] [F.,] [ET AL, J MOLEC BIOL 215]: 403 (1990); Guide to Huge Computers, Martin J. Bishop, [ED.,] Academic Press, San Diego,1994, 및 [CARILLO ETA/.](1988) SIAM J Applied Math 48: 1073을 포함한다). 예를 들어, 국립 생물공학 정보 데이터베이스 센터의 BLAST, 또는 ClustalW를 이용하여 상동성, 유사성 또는 동일성을 결정할 수 있다. Whether any two polynucleotide or polypeptide sequences have homology, similarity or identity can be determined, for example, in Pearson et al (1988) [Proc. Natl. Acad. Sci. USA 85]: Can be determined using a known computer algorithm such as the "FASTA" program using default parameters as in 2444. Alternatively, as performed in the Needleman program (EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends Genet. 16: 276-277) (version 5.0.0 or later) of the EMBOSS package, Needleman-Wunsch algorithm (Needleman and Wunsch, 1970, J. Mol. Biol. 48: 443-453) can be used to determine (GCG program package (Devereux, J., et al, Nucleic Acids). Research 12: 387 (1984)), BLASTP, BLASTN, FASTA (Atschul, [S.] [F.,] [ET AL, J MOLEC BIOL 215]: 403 (1990); Guide to Huge Computers, Martin J. Bishop , [ED.,] Academic Press, San Diego, 1994, and [CARILLO ETA/.] (1988) SIAM J Applied Math 48: 1073), for example, BLAST of the National Center for Biotechnology Information, or ClustalW can be used to determine homology, similarity or identity.

폴리뉴클레오티드 또는 폴리펩티드의 상동성, 유사성 또는 동일성은 예를 들어, Smith and Waterman, Adv. Appl. Math (1981) 2:482 에 공지된 대로, 예를 들면, Needleman et al. (1970), J Mol Biol. 48:443과 같은 GAP 컴퓨터 프로그램을 이용하여 서열 정보를 비교함으로써 결정될 수 있다. 요약하면, GAP 프로그램은 두 서열 중 더 짧은 것에서의 기호의 전체 수로, 유사한 배열된 기호(즉, 뉴클레오티드 또는 아미노산)의 수를 나눈 값으로 정의한다. GAP 프로그램을 위한 디폴트 파라미터는 (1) 이진법 비교 매트릭스(동일성을 위해 1 그리고 비-동일성을 위해 0의 값을 함유함) 및 Schwartz and Dayhoff, eds., Atlas Of Protein Sequence And Structure, National Biomedical Research Foundation, pp. 353-358 (1979)에 의해 개시된 대로, Gribskov et al(1986) Nucl. Acids Res. 14: 6745의 가중된 비교 매트릭스(또는 EDNAFULL(NCBI NUC4.4의 EMBOSS 버전) 치환 매트릭스); (2) 각 갭을 위한 3.0의 페널티 및 각 갭에서 각 기호를 위한 추가의 0.10 페널티(또는 갭 개방 패널티 10, 갭 연장 패널티 0.5); 및 (3) 말단 갭을 위한 무 페널티를 포함할 수 있다. The homology, similarity or identity of a polynucleotide or polypeptide can be found in, eg, Smith and Waterman, Adv. Appl. As known in Math (1981) 2:482, for example, Needleman et al. (1970), J Mol Biol. It can be determined by comparing sequence information using a GAP computer program such as 48:443. In summary, the GAP program defines the total number of symbols in the shorter of two sequences, divided by the number of similarly aligned symbols (ie, nucleotides or amino acids). The default parameters for the GAP program are (1) binary comparison matrix (contains values of 1 for identity and 0 for non-identity) and Schwartz and Dayhoff, eds., Atlas Of Protein Sequence And Structure, National Biomedical Research Foundation , pp. As disclosed by 353-358 (1979), Gribskov et al (1986) Nucl. Acids Res. 14: weighted comparison matrix of 6745 (or EDNAFULL (EMBOSS version of NCBI NUC4.4) substitution matrix); (2) a penalty of 3.0 for each gap and an additional 0.10 penalty for each symbol in each gap (or a gap opening penalty of 10, a gap extension penalty of 0.5); And (3) no penalty for end gaps.

또한, 임의의 두 폴리뉴클레오티드 또는 폴리펩티드 서열이 상동성, 유사성 또는 동일성을 갖는지 여부는 정의된 엄격한 조건하에서 써던 혼성화 실험에 의해 서열을 비교함으로써 확인할 수 있으며, 정의되는 적절한 혼성화 조건은 해당 기술 범위 내이고, 당업자에게 잘 알려진 방법(예컨대, J. Sambrook et al., Molecular Cloning, A Laboratory Manual, 2nd Edition, Cold Spring Harbor Laboratory press, Cold Spring Harbor, New York, 1989; F.M. Ausubel et al., Current Protocols in Molecular Biology, John Wiley & Sons, Inc., New York)으로 결정될 수 있다.In addition, whether any two polynucleotide or polypeptide sequences have homology, similarity or identity can be confirmed by comparing the sequences by Southern hybridization experiments under defined stringent conditions, and the appropriate hybridization conditions defined are within the scope of the technology. , Methods well known to those skilled in the art (e.g., J. Sambrook et al., Molecular Cloning, A Laboratory Manual, 2nd Edition, Cold Spring Harbor Laboratory press, Cold Spring Harbor, New York, 1989; FM Ausubel et al., Current Protocols in Molecular Biology, John Wiley & Sons, Inc., New York).

본 발명에 있어서, 상기 서열번호 1의 아미노산 서열은 서열번호 2의 염기서열로 코딩되는 것일 수 있으나, 이에 제한되지 않는다.In the present invention, the amino acid sequence of SEQ ID NO: 1 may be encoded by the nucleotide sequence of SEQ ID NO: 2, but is not limited thereto.

본 발명의 리파제 분비 발현 카세트는 단백질 분비 융합인자(translational fusion partner, TFP)를 코딩하는 핵산을 추가적으로 포함하는 것일 수 있으나, 이에 제한되지 않는다.The lipase secretion expression cassette of the present invention may additionally contain a nucleic acid encoding a translational fusion partner (TFP), but is not limited thereto.

본 발명의 용어, "단백질 분비 융합인자(translational fusion partner, TFP)"는 난발현성 단백질을 코딩하는 유전자와 융합되어 난발현성 단백질의 분비생산을 유도하는 유전자를 의미한다. 본 발명의 목적상, 상기 난발현성 단백질은 리조무코르 미에헤이 유래 리파제일 수 있으나, 이에 제한되지 않는다.As used herein, the term "translational fusion partner (TFP)" refers to a gene that induces secretory production of an unexpressed protein by fusion with a gene encoding an unexpressed protein. For the purposes of the present invention, the poorly expressed protein may be a lipase derived from Rizomucor Miehei, but is not limited thereto.

상기 단백질 분비 융합인자는 한국공개특허 제10-2008-0042823호에 개시된 것일 수 있고, 서열번호 7의 TFP 1, 서열번호 8의 TFP 2, 서열번호 9의 TFP 3, 서열번호 10의 TFP 4, 서열번호 11의 TFP 5, 서열번호 12의 TFP 6, 서열번호 13의 TFP 7, 서열번호 14의 TFP 8, 서열번호 15의 TFP 9, 서열번호 16의 TFP 10, 서열번호 17의 TFP 11, 서열번호 18의 TFP 12, 서열번호 19의 TFP 13, 서열번호 20의 TFP 14, 서열번호 21의 TFP 15, 서열번호 22의 TFP 16, 서열번호 23의 TFP 17, 서열번호 24의 TFP 18, 서열번호 25의 TFP 19, 서열번호 26의 TFP 20, 서열번호 27의 TFP 21, 서열번호 28의 TFP 22, 서열번호 29의 TFP 23, 서열번호 30의 TFP 24일 수 있다. 보다 구체적으로, 상기 단백질 분비 융합인자는 서열번호 10로 이루어진 TFP 4, 서열번호 14으로 이루어진 TFP 8, 서열번호 19로 이루어진 TFP 13 또는 서열번호 25로 이루어진 TFP 19일 수 있으나, 목적 단백질의 분비 발현을 향상시킬 수 있는 인자라면 제한 없이 포함될 수 있다. The protein secretion fusion factor may be disclosed in Korean Patent Laid-Open Publication No. 10-2008-0042823,   TFP 1 of SEQ ID NO: 7, TFP 2 of SEQ ID NO: 8, TFP 3 of SEQ ID NO: 9, TFP 4 of SEQ ID NO: 10, TFP 5 of SEQ ID NO: 11, TFP 6 of SEQ ID NO: 12, TFP 7 of SEQ ID NO: 13, TFP 8 of SEQ ID NO: 14, TFP 9 of SEQ ID NO: 15, TFP 10 of SEQ ID NO: 16, TFP 11 of SEQ ID NO: 17, sequence TFP 12 of SEQ ID NO: 18, TFP 13 of SEQ ID NO: 19, TFP 14 of SEQ ID NO: 20, TFP 15 of SEQ ID NO: 21, TFP 16 of SEQ ID NO: 22, TFP 17 of SEQ ID NO: 23, TFP 18 of SEQ ID NO: 24, SEQ ID NO It may be TFP 19 of 25, TFP 20 of SEQ ID NO: 26, TFP 21 of SEQ ID NO: 27, TFP 22 of SEQ ID NO: 28, TFP 23 of SEQ ID NO: 29, and TFP 24 of SEQ ID NO: 30. More specifically, the protein secretion fusion factor may be TFP 4 consisting of SEQ ID NO: 10, TFP 8 consisting of SEQ ID NO: 14, TFP 13 consisting of SEQ ID NO: 19, or TFP 19 consisting of SEQ ID NO: 25, but secretion expression of the target protein Any factor that can improve is included without limitation.

 따라서 서열번호 7, 서열번호 8, 서열번호 9, 서열번호 10, 서열번호 11, 서열번호 12, 서열번호 13, 서열번호 14, 서열번호 15, 서열번호 16, 서열번호 17, 서열번호 18, 서열번호 19, 서열번호 20, 서열번호 21, 서열번호 22, 서열번호 23, 서열번호 24, 서열번호 25, 서열번호 26, 서열번호 27, 서열번호 28, 서열번호 29 또는 서열번호 30의 아미노산 서열을 포함하거나, 또는 상기 서열번호 7, 서열번호 8, 서열번호 9, 서열번호 10, 서열번호 11, 서열번호 12, 서열번호 13, 서열번호 14, 서열번호 15, 서열번호 16, 서열번호 17, 서열번호 18, 서열번호 19, 서열번호 20, 서열번호 21, 서열번호 22, 서열번호 23, 서열번호 24, 서열번호 25, 서열번호 26, 서열번호 27, 서열번호 28, 서열번호 29 또는 서열번호 30의 아미노산 서열의 보존서열을 포함하고 하나 이상의 위치에서 1 개 또는 다수 개(단백질의 아미노산 잔기의 입체 구조에 있어서의 위치나 종류에 따라서 상이하지만, 구체적으로는 2 내지 20 개, 보다 구체적으로는 2 내지 10 개, 보다 더 구체적으로는 2 내지 5 개)의 아미노산이 치환, 결실, 삽입, 첨가 또는 역위된 아미노산 서열을 포함할 수 있는데, 상기 목적 단백질의 분비 발현을 향상시킬 수 있는 한, 서열번호 7, 서열번호 8, 서열번호 9, 서열번호 10, 서열번호 11, 서열번호 12, 서열번호 13, 서열번호 14, 서열번호 15, 서열번호 16, 서열번호 17, 서열번호 18, 서열번호 19, 서열번호 20, 서열번호 21, 서열번호 22, 서열번호 23, 서열번호 24, 서열번호 25, 서열번호 26, 서열번호 27, 서열번호 28, 서열번호 29 또는 서열번호 30의 아미노산 서열에 대하여, 80 % 이상, 구체적으로는 90 % 이상, 보다 구체적으로는 95 % 이상, 특히 구체적으로는 97 % 이상의 상동성을 갖는 아미노산 서열을 포함할 수 있고, 상기 아미노산의 치환, 결실, 삽입, 첨가 또는 역위 등에는 상기 TFP의 활성을 함유하는 미생물에서 천연적으로 생기는 돌연변이 서열 또는 인위적인 변이 서열까지도 포함할 수 있다.Therefore, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, sequence The amino acid sequence of SEQ ID NO: 19, SEQ ID NO: 20, SEQ ID NO: 21, SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 24, SEQ ID NO: 25, SEQ ID NO: 26, SEQ ID NO: 27, SEQ ID NO: 28, SEQ ID NO: 29 or SEQ ID NO: 30 Or the SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, sequence SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 20, SEQ ID NO: 21, SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 24, SEQ ID NO: 25, SEQ ID NO: 26, SEQ ID NO: 27, SEQ ID NO: 28, SEQ ID NO: 29 or SEQ ID NO: 30 It includes a conserved sequence of the amino acid sequence of one or more at one or more positions (different depending on the position and type in the conformational structure of the amino acid residue of the protein, but specifically 2 to 20, more specifically 2 To 10 amino acids, more specifically 2 to 5) amino acids may include substituted, deleted, inserted, added or reversed amino acid sequences, as long as the secretion and expression of the target protein can be improved, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, With respect to the amino acid sequence of SEQ ID NO: 20, SEQ ID NO: 21, SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 24, SEQ ID NO: 25, SEQ ID NO: 26, SEQ ID NO: 27, SEQ ID NO: 28, SEQ ID NO: 29 or SEQ ID NO: 30, 80 % Or more, specifically 90% or more, more specifically 95% or more, particularly specifically 97% or more, may contain amino acid sequences having homology. In addition, substitutions, deletions, insertions, additions, or inversions of the amino acids may include mutant sequences naturally occurring in microorganisms containing the TFP activity or even artificial mutant sequences.

본 발명의 구체적인 일실시예에서는, 상기 24종의 단백질 분비 융합인자를 각각 도입한 형질전환 사카로마이세스 세레비지에 균주에서 리파제가 분비 생산됨을 확인하였고, pH 적정법을 통해 분비된 리파제의 효소 활성을 확인한 결과, TFP 4, 8, 13 및 19가 분비 발현능 및 효소 활성이 가장 우수함을 확인하였다(도 5). In a specific embodiment of the present invention, it was confirmed that the lipase was secreted and produced in the transformed Saccharomyces cerevisiae strains each of the 24 protein secretion fusion factors introduced, and the enzyme activity of the lipase secreted through the pH titration method. As a result of confirming, it was confirmed that TFP 4, 8, 13 and 19 were the most excellent in secretion expression ability and enzyme activity (FIG. 5).

상기 TFP 4는 서열번호 10, TFP 8은 서열번호 14, TFP 13은 서열번호 19, TFP19는 서열번호 25를 포함하는 것일 수 있으나, 이에 제한되지 않는다.The TFP 4 may include SEQ ID NO: 10, TFP 8 may include SEQ ID NO: 14, TFP 13 may include SEQ ID NO: 19, and TFP19 may include SEQ ID NO: 25, but are not limited thereto.

또한, 상기 단백질 분비 융합인자 TFP 19는 서열번호 25의 아미노산 서열에서 N-말단으로부터 109번째 아미노산이 트레오닌(Thr)으로 치환된 것일 수 있으나, 이에 제한되지 않는다.In addition, the protein secretion fusion factor TFP 19 may be one in which the 109th amino acid from the N-terminus in the amino acid sequence of SEQ ID NO: 25 is substituted with threonine (Thr), but is not limited thereto.

본 발명의 구체적인 일실시에에서는, 방향성 진화 방법을 이용하여 리파제의 분비 발현능 및 분비된 리파제의 특이 활성이 향상된 개량 효소의 돌연변이를 확인한 결과, 단백질 분비 융합인자 TFP19의 109번째 아미노산이 트레오닌(Thr)으로 치환되었음을 확인하였다(표 6).In a specific embodiment of the present invention, as a result of confirming the mutation of the improved enzyme with improved secretory expression ability of lipase and specific activity of secreted lipase using the directed evolution method, the 109th amino acid of the protein secretion fusion factor TFP19 is threonine (Thr ) Was confirmed to be substituted (Table 6).

상기 리파제 분비 발현 카세트에 있어서, 상기 카세트에 포함되는 리파제를 코딩하는 핵산 및 단백질 분비 융합인자를 코딩하는 핵산은 링커(linker)로 서로 연결된 것일 수 있다.In the lipase secretion   expression   cassette, the nucleic acid encoding the lipase contained in the cassette and the nucleic acid encoding the protein secretion fusion factor may be linked to each other by a linker.

상기 링커는 프로테아제 인식 서열 또는 친화성 태그(affinity tag)를 포함하는 것일 수 있다. 본 발명의 목적상, 상기 링커는 프로테아제인 케신(Kexin) (EC 3.4.21.61)의 인식 서열인 Lys-Arg(KR) 서열을 포함하는 것일 수 있고, 구체적으로 상기 링커는 LDKR의 아미노산 서열을 포함하는 것일 수 있으나, 이에 제한되지 않는다(도 11).The linker may include a protease recognition sequence or an affinity tag. For the purposes of the present invention, the linker is a protease kesin (Kexin) It may include the Lys-Arg (KR) sequence, which is the recognition sequence of (EC 3.4.21.61), specifically, the linker may include the amino acid sequence of LDKR, but is not limited thereto (FIG. 11).

또한, 본 발명에서 사용되는 리파제를 코딩하는 핵산 서열은 본 발명의 선형 벡터와 세포 내에서 재조합시키는데 사용되는 링커 DNA를 포함할 수 있다. 이러한 링커 서열을 리파제를 코딩하는 핵산 서열에 부가하는 것은 일반적인 DNA 기술, 예컨대 PCR 및/또는 제한효소 절단 및 연결로 수행할 수 있다.In addition, the nucleic acid sequence encoding the lipase used in the present invention may include the linear vector of the present invention and the linker DNA used for recombination in cells. The addition of such a linker sequence to a nucleic acid sequence encoding a lipase can be performed by conventional DNA techniques, such as PCR and/or restriction enzyme cleavage and ligation.

본 발명의 링커 DNA는 충분한 길이여야 하고, 숙주 세포 내로 도입되어 세포 내에서 리파제를 코딩하는 핵산 서열이 TFP를 코딩하는 핵산 서열을 포함하는 선형 벡터안에 재조합을 일으킬 수 있도록 선형 벡터의 핵산 서열 일부와 충분한 상동성을 가지는 것일 수 있다. 구체적으로, 링커 DNA는 20 bp 이상의 길이, 예컨대 30 또는 40 bp 이상의 길이를 갖는다. 보다 구체적으로, 링커 DNA는 선형 벡터와 최소 80 % 정도 상동성을 가지며, 85 %, 90 %, 95 % 또는 99 %의 상동성을 가질 수 있다.The linker DNA of the present invention must be of sufficient length, and a portion of the nucleic acid sequence of the linear vector and a portion of the nucleic acid sequence of the linear vector can be introduced into the host cell so that the nucleic acid sequence encoding the lipase in the cell can be recombined in the linear vector containing the nucleic acid sequence encoding TFP It may have sufficient homology. Specifically, the linker DNA has a length of 20 bp or more, such as 30 or 40 bp or more. More specifically, the linker DNA has at least 80% homology with the linear vector, and may have 85%, 90%, 95% or 99% homology.

본 발명의 리파제 분비 발현 카세트에 포함되는 리파제는 서열번호 1의 아미노산 서열에서 N-말단으로부터 52 번째 및 190 번째 아미노산 중 어느 하나 이상이 다른 아미노산으로 치환된 아미노산 서열에서 N-말단에 세린(serine) 및 발린(valine)으로 이루어지는 아미노산 서열이 추가된 것일 수 있으나, 이에 제한되지 않는다. 상기 서열번호 1의 아미노산 서열에서 N-말단으로부터 52 번째 및 190 번째 아미노산 중 어느 하나 이상이 다른 아미노산으로 치환된 아미노산 서열은 서열번호 57의 아미노산 서열을 포함하는 것일 수 있으나, 이에 제한되지 않는다. The lipase secretion   expression   contained in the cassette of the present invention is a serine at the N-terminus in the amino acid sequence in which any one or more of the 52nd and 190th amino acids from the N-terminus in the amino acid sequence of SEQ ID NO: 1 is substituted with another amino acid. And the amino acid sequence consisting of valine may be added, but is not limited thereto. The amino acid sequence in which at least one of the 52nd and 190th amino acids from the N-terminus in the amino acid sequence of SEQ ID NO: 1 is substituted with another amino acid may include the amino acid sequence of SEQ ID NO: 57, but is not limited thereto.

구체적으로, 상기 세린(serine) 및 발린(valine)으로 이루어지는 아미노산 서열(Ser-Val, SV)은 서열번호 57의 아미노산 서열의 N-말단에, 보다 구체적으로, 서열번호 57의 아미노산 서열의 N-말단과 링커 내 케신(Kexin)의 인식부위인 Lys-Arg(KR) 서열의 하단 사이에 추가되어, 케신의 절단 효율을 높일 수 있다. 상기 SV 서열이 추가됨으로써, TFP와 RML을 연결하는 링커 서열은 LDKR에서 LDKRSV로 변경되는 것일 수 있다.Specifically, the amino acid sequence (Ser-Val, SV) consisting of serine and valine is at the N-terminus of the amino acid sequence of SEQ ID NO: 57, more specifically, the N- It is added between the end and the lower end of the Lys-Arg(KR) sequence, which is the recognition site of kesin in the linker, so that the cleavage efficiency of kesin can be improved. By adding the SV sequence, the linker sequence connecting the TFP and RML may be changed from LDKR to LDKRSV.

본 발명에 따른 리파제와 TFP는 케신 인식 서열인 KR을 포함하는 링커로 연결되어 있는 상태로 발현되며, 미생물로부터 리파제 분비 시에는 골지체에서 TFP가 케신에 의해 절단되어 온전한 형태의 리파제만 분비된다. 상기 케신은 Lys-Arg(KR) 서열을 인식하고 절단하는 역할을 한다. 그러나, 리파제의 구조에 의해서 케신 인식 부위가 표면으로 노출되지 않는 경우, 케신이 접근할 수 없기 때문에 TFP와 RML은 분리되지 않고 융합 단백질 형태로 분비된다. 이러한 융합 단백질은 효소 활성에 부정적인 영향을 미칠 수 있기 때문에 융합 단백질이 발현되는 것을 최소화하는 것이 고활성 단백질 생산에 도움이 될 수 있다. 이에, 케신의 효율을 높여주는 것으로 확인된 SV 서열을 N-말단에 추가하였다.The lipase and TFP according to the present invention are expressed in a state connected by a linker containing the kesin recognition sequence KR, and when lipase is secreted from the microorganism, TFP is cleaved by kecin in the Golgi body and only the intact lipase is secreted. The kesin plays a role in recognizing and cleaving the Lys-Arg (KR) sequence. However, if the kecin recognition site is not exposed to the surface due to the structure of the lipase, TFP and RML are not separated and secreted in the form of a fusion protein because kecin cannot be accessed. Since such fusion proteins can negatively affect enzyme activity, minimizing the expression of the fusion protein can help in the production of highly active proteins. Thus, the SV sequence confirmed to increase the efficiency of kecin was added to the N-terminus.

구체적으로, 상기 서열번호 57의 아미노산 서열에서 N-말단에 SV 서열이 추가된 리파제는 서열번호 60으로 이루어진 아미노산 서열을 포함하는 것일 수 있다. Specifically, the lipase to which the SV sequence is added to the N-terminus in the amino acid sequence of SEQ ID NO: 57 may include an amino acid sequence consisting of SEQ ID NO: 60.

본 발명의 구체적인 일실시예에서는, TFP19 분비 시그널을 이용하여 RML-3G#4을 생산한 경우 분비 시그널이 잘리지 않은 형태의 융합 단백질도 같이 생산되나, 케신의 TFP 절단 효율을 높여주는 것으로 확인된 SV 아미노산 서열을 리파제의 N-말단에 추가한 결과 융합 단백질 발현이 현저히 감소하는 것을 확인하였다(도 11). 또한, SV 아미노산 서열이 추가되어 발현된 리파제의 활성이 SV 아미노산 서열이 추가되지 않은 리파제에 비해 116% 증가함을 확인하였다(도 12).In a specific embodiment of the present invention, when RML-3G#4 is produced using the TFP19 secretion signal, a fusion protein in which the secretion signal is not truncated is also produced, but SV confirmed to increase the TFP cleavage efficiency of kecin. As a result of adding the amino acid sequence to the N-terminus of the lipase, it was confirmed that the expression of the fusion protein was significantly reduced (FIG. 11). In addition, it was confirmed that the activity of the lipase expressed by the addition of the SV amino acid sequence was increased by 116% compared to the lipase to which the SV amino acid sequence was not added (FIG. 12).

본 발명의 다른 하나의 양태는 상기 분비 발현 카세트를 포함하는 벡터를 제공하는 것이다.Another aspect of the present invention is to provide a vector comprising the secreted expression cassette.

상기 용어 "발현 카세트" 등에 대한 설명은 전술한 바와 같다.The description of the term "expression cassette" and the like is as described above.

본 발명의 용어, "벡터"는 적합한 숙주 세포 내에서 목적 유전자를 발현시킬 수 있도록 유전 물질을 보유하는 인위적 DNA 분자로서, 적합한 유전자 발현 조절 서열; 및 이에 작동 가능하게 연결된 목적 유전자의 뉴클레오티드 서열을 포함하는 DNA 제조물을 의미한다. 상기 "목적 유전자"는 발현을 증가시키고자 하는 목적 단백질을 코딩하는 유전자를 의미하며, 특히, 본 발명에서 상기 유전자는 리파제 및 단백질 분비 융합인자를 코딩하는 유전자를 의미한다.The term "vector" of the present invention is an artificial DNA molecule that holds a genetic material so as to express a gene of interest in a suitable host cell, and includes a suitable gene expression control sequence; And it means a DNA preparation comprising the nucleotide sequence of the gene of interest operably linked thereto. The “target gene” refers to a gene encoding a protein of interest to be increased in expression. In particular, in the present invention, the gene refers to a gene encoding a lipase and a protein secretion fusion factor.

구체적으로, 상기 유전자 발현 조절 서열은 유전자의 전사를 실시하기 위한 프로모터 외에 전사를 조절하기 위한 임의의 오퍼레이터 서열, 적합한 mRNA 리보좀 결합 부위를 코딩하는 서열 및 전사 및 해독의 종결을 조절하는 DNA를 포함할 수 있으나, 이에 제한되지 않는다. 또한, 원핵 생물에 적합한 조절 서열로서 프로모터, 및 리보좀 결합 부위를 포함할 수 있으나, 이에 제한되지 않는다.Specifically, the gene expression control sequence includes an arbitrary operator sequence for controlling transcription, a sequence encoding a suitable mRNA ribosome binding site, and a DNA controlling the termination of transcription and translation, in addition to a promoter for carrying out transcription of the gene. However, it is not limited thereto. In addition, as a regulatory sequence suitable for prokaryotes, a promoter and a ribosome binding site may be included, but are not limited thereto.

상기 벡터는 적당한 숙주세포 내로 형질전환된 후, 숙주 게놈과 무관하게 복제되거나 기능할 수 있으며, 게놈 그 자체에 통합될 수 있다.The vector can be transformed into a suitable host cell, then replicated or function independently of the host genome, and can be integrated into the genome itself.

본 발명에서 사용되는 벡터는 숙주세포 내에서 복제 가능한 것이면 특별히 한정되지 않으며, 당업계에 알려진 임의의 벡터를 이용할 수 있다. 통상 사용되는 벡터의 예로는 천연 상태이거나 재조합된 상태의 플라스미드, 코스미드, 바이러스 및 박테리오파지를 들 수 있다. 예를 들면, 파지 벡터 또는 코스미드 벡터로서 pWE15, M13, MBL3, MBL4, IXII, ASHII, APII, t10, t11, Charon4A, 및 Charon21A 등을 사용할 수 있으며, 플라스미드 벡터로서 pRS416, pRS426, pRS415, pRS425, YEp13, YEp24, YCp50, pBR계, pUC계, pBluescriptII계, pGEM계, pTZ계, pCL계 및 pET계 등을 사용할 수 있다.The vector used in the present invention is not particularly limited as long as it can replicate in host cells, and any vector known in the art may be used. Examples of commonly used vectors include natural or recombinant plasmids, cosmids, viruses and bacteriophages. For example, pWE15, M13, MBL3, MBL4, IXII, ASHII, APII, t10, t11, Charon4A, Charon21A, etc. can be used as a phage vector or a cosmid vector. YEp13, YEp24, YCp50, pBR system, pUC system, pBluescript II system, pGEM system, pTZ system, pCL system, pET system, etc. can be used.

일례로 세포 내 염색체 삽입용 벡터를 통해 염색체 내에 목적 폴리펩티드를 코딩하는 폴리뉴클레오티드를 염색체 내로 삽입할 수 있다. 상기 폴리뉴클레오티드의 염색체 내로의 삽입은 당업계에 알려진 임의의 방법, 예를 들면, 상동재조합(homologous recombination)에 의하여 이루어질 수 있으나, 이에 제한되지 않는다. 상기 염색체 삽입 여부를 확인하기 위한 선별 마커(selection marker)를 추가로 포함할 수 있다. 선별 마커는 벡터로 형질전환된 세포를 선별, 즉 목적 핵산 분자의 삽입 여부를 확인하기 위한 것으로, 약물 내성, 영양 요구성, 세포 독성제에 대한 내성 또는 표면 폴리펩티드의 발현과 같은 선택가능 표현형을 부여하는 마커들이 사용될 수 있다. 선택제(selective agent)가 처리된 환경에서는 선별 마커를 발현하는 세포만 생존하거나 다른 표현 형질을 나타내므로, 형질전환된 세포를 선별할 수 있다. For example, a polynucleotide encoding a target polypeptide may be inserted into a chromosome through a vector for intracellular chromosome insertion. Insertion of the polynucleotide into the chromosome may be performed by any method known in the art, for example, homologous recombination, but is not limited thereto. A selection marker for confirming whether the chromosome is inserted may be additionally included. Selectable markers are used to select cells transformed with a vector, i.e., to confirm the insertion of a nucleic acid molecule of interest, and impart a selectable phenotype such as drug resistance, nutrient demand, resistance to cytotoxic agents, or expression of surface polypeptides. Markers can be used. In an environment treated with a selective agent, only cells expressing the selection marker survive or exhibit other phenotypic traits, and thus transformed cells can be selected.

상기에서 용어 "작동 가능하게 연결"된 것이란 본 발명의 목적 폴리펩티드를 코딩하는 폴리뉴클레오티드의 전사를 개시 및 매개하도록 하는 프로모터 서열과 상기 유전자 서열이 기능적으로 연결되어 있는 것을 의미한다.In the above, the term "operably linked" means that the gene sequence is functionally linked to a promoter sequence that initiates and mediates transcription of the polynucleotide encoding the target polypeptide of the present invention.

또한, 상기 벡터에는, 목적 유전자의 발현 억제 또는 증폭, 또는 유도를 위한 각종의 기능을 가진 발현 조절용 단편이나, 형질전환체의 선택을 위한 마커나 항생물질에 대한 내성 유전자, 난발현성 단백질의 분비 발현에 적합한 맞춤형 융합인자 등을 추가로 포함할 수 있다. 특히, 상기 난발현성 단백질에 적합한 맞춤형 융합인자로서, 상기 단백질 분비 융합인자를 사용함이 바람직할 수 있으나, 이에 제한되지 않는다.In addition, the vector includes a fragment for  expression   that has various functions for suppressing or amplifying or inducing expression of a target gene, or a marker for selection of a transformant, a resistance gene for antibiotics, and secretion   expression of a poorly expressed protein. It may further include a customized fusion factor suitable for. In particular, as a customized fusion factor suitable for the poorly expressed protein, it may be preferable to use the protein secretion fusion factor, but is not limited thereto.

본 발명의 구체적인 일실시예에서는, 서열번호 1로 이루어진 리파제를 고분비 생산하는 TFP 19를 선별하여, 발현 벡터 YGasST19-RML-6H를 제작하였다(도 6).In a specific embodiment of the present invention, the expression vector YGasST19-RML-6H was prepared by selecting TFP 19 which produces a high secretion of lipase consisting of SEQ ID NO: 1 (FIG. 6).

본 발명의 다른 하나의 양태는 상기 발현 벡터를 포함하는 형질전환 미생물을 제공하는 것이다.Another aspect of the present invention is to provide a transformed microorganism comprising the expression vector.

상기 용어 "벡터" 등에 대한 설명은 전술한 바와 같다.The description of the term "vector" and the like is as described above.

본 발명의 용어, “형질전환”은 DNA를 숙주세포로 도입하여 DNA가 염색체 외 인자로서 또는 염색체 통합완성에 의해 복제 가능하게 되는 것을 의미한다.The term "transformation" of the present invention means that DNA is introduced into a host cell so that DNA can be replicated as an extrachromosomal factor or by chromosomal integration completion.

본 발명의 형질전환 방법은 임의의 형질전환 방법이 사용될 수 있으며, 당업계의 통상적인 방법에 따라 용이하게 수행할 수 있다.Any transformation method may be used for the transformation method of the present invention, and may be easily performed according to a conventional method in the art.

본 발명의 용어, "형질전환 미생물"은 전술한 형질전환의 대상이 되는 미생물, 즉, 형질전환에 사용된 미생물을 의미하며, 숙주 세포와 혼용하여 사용될 수 있다.The term "transformed microorganism" of the present invention refers to a microorganism to be transformed, ie, a microorganism used for transformation, and may be used interchangeably with a host cell.

본 발명에 따른 형질전환 미생물은 당업계에 널리 알려져 있는 숙주 세포라면 어떤 것이나 사용할 수 있으나, 본 발명의 리파제 유전자의 도입 효율과 발현 효율이 높은 숙주를 사용할 수 있는데, 예를 들면 박테리아, 곰팡이, 효모를 포함할 수 있다. 구체적으로 상기 형질전환 미생물은 효모일 수 있고, 더 구체적으로 상기 효모는 캔디다(Candida), 디베리오마이세스(Debaryomyces), 한세눌라(Hansenula), 클루이베로마이세스(Kluyveromyces), 피키아(Pichia), 스키조사카로마이세스(Schizosaccharomyces), 야로이야(Yarrowia), 사카로마이세스(Saccharomyces), 슈완니오마이세스(Schwanniomyces) 또는 아르술라(Arxula) 속에 속하는 것일 수 있으며, 보다 구체적으로 캔디다 뷰티리(Candida butyri), 캔디다 유틸리스(Candida utilis), 캔디다 보이디니(Candida boidinii), 캔디다 알비칸스(Candida albicans), 클루이베로마이세스 락티스(Kluyveromyces lactis), 피키아 파스토리스(Pichia pastoris), 피키아 스티피티스(Pichia stipitis), 스키조사카로마이세스 폼베(Schizosaccharomyces pombe), 사카로마이세스 세레비지에(Saccharomyces cerevisiae), 한세눌라 폴리모르파(Hansenula polymorpha), 야로이야 리폴리티카(Yarrowia lipolytica), 슈완니오마이세스 옥시덴탈리스(Schwanniomyces occidentalis) 또는 아르술라 아데니니보란스(Arxula adeninivorans)일 수 있으나, 이에 제한되지 않는다.The transforming microorganism according to the present invention can be used as long as it is a host cell well known in the art, but a host having high efficiency of introduction and expression of the lipase gene of the present invention can be used. For example, bacteria, fungi, yeast It may include. May be the transformed microorganism The specifically yeasts, more specifically, the yeast is Candida (Candida), di berry Oh, my process (Debaryomyces), Hanse Cronulla (Hansenula), Cluj Vero My process (Kluyveromyces), Pichia (Pichia) , Schizosaccharomyces , Yarrowia , Saccharomyces , Schwanniomyces , or Arxula may belong to the genus, and more specifically Candida Beauty Lee ( Candida butyri ), Candida utilis , Candida boidinii , Candida albicans , Kluyveromyces lactis , Pichia pastoris , Pichia Pichia stipitis , Schizosaccharomyces pombe , Saccharomyces cerevisiae , Hansenula polymorpha , Yarrowia lipolytica , Schwanniomyces occidentalis ( Schwanniomyces occidentalis ) or Arsula adenini borans ( Arxula adeninivorans ), but is not limited thereto.

본 발명의 구체적인 일실시예에서는, 서열번호 1의 리파제 유전자를 단백질 분비 융합인자(TFP)를 포함하는 GA110 프로모터 벡터에 연결하고, 이를 도입한 효모 형질 전환체인 사카로마이세스 세레비지에 균주를 제작하였다.In a specific embodiment of the present invention, the lipase gene of SEQ ID NO: 1 was ligated to a GA110 promoter vector containing a protein secretion fusion factor (TFP), and a yeast transformant, Saccharomyces cerevisiae strain was prepared. I did.

상기 균주는 리파제의 활성 또는 분비 발현이 야생형 또는 비변형 미생물에서의 활성 또는 분비 발현을 기준으로 하여 증가한 것일 수 있으나, 이에 제한되지 않는다. The strain may have an increased activity or secretion expression of lipase based on the activity or secretion expression in a wild-type or unmodified microorganism, but is not limited thereto.

본 발명의 용어 "비변형 미생물"은 미생물에 자연적으로 발생할 수 있는 돌연변이를 포함하는 균주를 제외하는 것이 아니며, 천연형 균주 자체이거나, 상기 발현 카세트를 포함하지 않는 미생물, 상기 벡터로 형질전환되지 않은 미생물 또는 형질전환 등의 변형 전 미생물을 의미한다.The term "unmodified microorganism" of the present invention does not exclude strains containing mutations that may occur naturally in microorganisms, or is a natural strain itself, a microorganism not containing the expression cassette, or not transformed with the vector. It means a microorganism or a microorganism before transformation such as transformation.

본 발명의 다른 하나의 양태는 상기 형질전환 미생물을 배양하는 단계; 및 상기 배양된 미생물 또는 이의 배양 상등액으로부터 리파제를 회수하는 단계;를 포함하는 리파제의 제조방법을 제공하는 것이다. Another aspect of the present invention is the step of culturing the transformed microorganism; And recovering lipase from the cultured microorganism or a culture supernatant thereof.

상기 용어 "형질전환", "리파제", "형질전환 미생물" 등에 대한 설명은 전술한 바와 같다.The descriptions of the terms "transformation", "lipase", "transformation microorganism" and the like are as described above.

본 발명의 용어 "배양 상등액"은 배양액을 원심분리하여 수득한 상등액을 의미한다.The term "culture supernatant" of the present invention means a supernatant obtained by centrifuging a culture solution.

본 발명의 용어 "배양"은 미생물을 적당히 인공적으로 조절한 환경조건에서 생육시키는 것을 의미한다. 본 발명에서 상기 형질전환 미생물을 이용하여 목적 물질을 생산하는 방법은 당업계에 널리 알려져 있는 방법을 이용하여 수행할 수 있다. 구체적으로, 상기 배양은 배치 공정, 주입 배치 또는 반복 주입 배치 공정(fed batch or repeated fed batch process)에서 연속식으로 배양할 수 있으나, 이에 제한되는 것은 아니다. 배양에 사용되는 배지는 적절한 방식으로 특정 균주의 요건을 충족해야 한다.The term "culture" of the present invention refers to growing microorganisms under appropriately artificially controlled environmental conditions. In the present invention, the method of producing the target substance using the transformed microorganism may be performed using a method widely known in the art. Specifically, the culture may be cultured continuously in a batch process, an injection batch or a repeated fed batch process, but is not limited thereto. The medium used for cultivation must meet the requirements of the specific strain in an appropriate manner.

배지 중에서 사용될 수 있는 당원으로는 포도당, 사카로즈, 유당, 과당, 말토즈, 전분, 셀룰로즈와 같은 당 및 탄수화물, 대두유, 해바라기유, 피마자유, 코코넛유 등과 같은 오일 및 지방, 팔미트산, 스테아린산, 리놀레산과 같은 지방산, 글리세롤, 에탄올과 같은 알코올, 아세트산과 같은 유기산이 포함된다. 이들 물질은 개별적으로 또는 혼합물로서 사용될 수 있으며, 이에 제한되는 것은 아니다. Sugar sources that can be used in the medium include sugars and carbohydrates such as glucose, saccharose, lactose, fructose, maltose, starch, and cellulose, oils and fats such as soybean oil, sunflower oil, castor oil, coconut oil, palmitic acid, stearic acid. , Fatty acids such as linoleic acid, alcohols such as glycerol and ethanol, and organic acids such as acetic acid. These materials may be used individually or as a mixture, but are not limited thereto.

사용될 수 있는 질소원으로는 펩톤, 효모 추출물, 육즙, 맥아 추출물, 옥수수 침지액, 대두밀 및 요소 또는 무기 화합물, 예를 들면 황산암모늄, 염화암모늄, 인산암모늄, 탄산암모늄 및 질산암모늄이 포함된다. 질소원 또한 개별적으로 또는 혼합물로서 사용할 수 있으며, 이에 제한되는 것은 아니다. Nitrogen sources that can be used include peptone, yeast extract, broth, malt extract, corn steep liquor, soybean meal and urea or inorganic compounds such as ammonium sulfate, ammonium chloride, ammonium phosphate, ammonium carbonate and ammonium nitrate. The nitrogen source may also be used individually or as a mixture, but is not limited thereto.

사용될 수 있는 인원으로는 인산이수소칼륨 또는 인산수소이칼륨 또는 상응하는 나트륨을 함유하는 염이 포함될 수 있다. 또한, 배양 배지는 성장에 필요한 황산마그네슘 또는 황산철과 같은 금속염을 함유할 수 있다. 마지막으로, 상기 물질에 더하여 아미노산 및 비타민과 같은 필수 성장 물질이 사용될 수 있다. 또한, 배양 배지에 적절한 전구체들이 사용될 수 있다. 상기된 원료들은 배양과정에서 배양물에 적절한 방식에 의해 회분식으로 또는 연속식으로 첨가될 수 있다.Personnel that may be used may include potassium dihydrogen phosphate or dipotassium hydrogen phosphate or salts containing the corresponding sodium. In addition, the culture medium may contain a metal salt such as magnesium sulfate or iron sulfate required for growth. Finally, essential growth substances such as amino acids and vitamins can be used in addition to the above substances. In addition, precursors suitable for the culture medium may be used. The above-described raw materials may be added batchwise or continuously to the culture during the culture process by an appropriate method.

상기 미생물의 배양 중 수산화나트륨, 수산화칼륨, 암모니아와 같은 기초 화합물 또는 인산 또는 황산과 같은 산 화합물을 적절한 방식으로 사용하여 배양물의 pH를 조절할 수 있다. 또한, 지방산 폴리글리콜 에스터와 같은 소포제를 사용하여 기포 생성을 억제할 수 있다. 호기 상태를 유지하기 위해 배양물 내로 산소 또는 산소-함유 기체(예, 공기)를 주입할 수 있다. In the culture of the microorganism, a basic compound such as sodium hydroxide, potassium hydroxide, ammonia, or an acid compound such as phosphoric acid or sulfuric acid may be used in an appropriate manner to adjust the pH of the culture. In addition, foam generation can be suppressed by using an antifoaming agent such as fatty acid polyglycol ester. Oxygen or an oxygen-containing gas (eg, air) may be injected into the culture to maintain an aerobic condition.

배지의 온도는 보통 20 ℃내지 45 ℃, 구체적으로는 25 ℃ 내지 40 ℃일 수 있다. 배양 시간은 원하는 목적 물질의 생성량이 얻어질 때까지 계속할 수 있으나, 구체적으로는 10 내지 160시간일 수 있다. 본 발명에 있어서, 상기 목적 물질은 리파제일 수 있으나, 이에 제한되지 않는다.The temperature of the medium may be usually 20 ℃ to 45 ℃, specifically 25 ℃ to 40 ℃. The cultivation time may be continued until the desired amount of the target substance is obtained, but may be specifically 10 to 160 hours. In the present invention, the target substance may be lipase, but is not limited thereto.

상기 미생물 또는 배양 상등액으로부터의 리파제의 회수는 당업계에 알려진 통상적인 방법에 의하여 분리되어 회수될 수 있다. 이러한 분리 방법에는, 원심분리, 여과, 크로마토그래피 및 결정화 등의 방법이 이용될 수 있다. 예를 들면, 배양액을 저속 원심분리하여 얻어진 상등액을, 이온교환 크로마토그래피를 통하여 분리할 수 있으나, 이에 제한되는 것은 아니다.The recovery of the lipase from the microorganism or the culture supernatant may be separated and recovered by a conventional method known in the art. In this separation method, methods such as centrifugation, filtration, chromatography, and crystallization may be used. For example, the supernatant obtained by centrifuging the culture medium at a low speed may be separated through ion exchange chromatography, but is not limited thereto.

상기 회수 단계는 정제 공정을 추가로 포함할 수 있다.The recovery step may further include a purification process.

본 발명의 또 다른 하나의 양태는 서열번호 1의 아미노산 서열에서 N-말단으로부터 52번째 및 190번째 아미노산 중 어느 하나 이상의 아미노산이 다른 아미노산으로 치환된, 전이에스터 활성 및 분비 발현능이 증가된 변이형 리파제를 제공하는 것이다.Another aspect of the present invention is a variant lipase with increased transester activity and secretion expression ability in which any one or more of the 52nd and 190th amino acids from the N-terminus in the amino acid sequence of SEQ ID NO: 1 is substituted with another amino acid. Is to provide.

상기 용어 "변이형 리파제" 등에 대한 설명은 전술한 바와 같다. The description of the term "variant lipase" and the like is as described above.

상기 변이형 리파제는 서열번호 1의 아미노산 서열에서 N-말단으로부터 52번째 아미노산이 아스파라긴(Asn)으로, 또는 190번째 아미노산이 아스파르트산(Asp)으로 치환된 것일 수 있으나, 이에 제한되지 않으며, 이에 대해서는 전술한 바와 같다.The variant lipase may be one in which the 52nd amino acid from the N-terminus in the amino acid sequence of SEQ ID NO: 1 is substituted with asparagine (Asn), or the 190th amino acid is substituted with aspartic acid (Asp), but is not limited thereto. As described above.

본 발명의 분비 발현 카세트, 이를 포함하는 발현 벡터 및 이를 포함하는 형질전환 미생물을 이용하여 전이에스터 활성이 개선된 리파제를 고효율로 생산할 수 있으며, 생산된 리파제는 전이에스터 반응이 필요한 모든 공정에 유용하게 이용될 수 있다.Using the secreted expression cassette of the present invention, an expression vector containing the same, and a transforming microorganism containing the same, a lipase having improved transester activity can be produced with high efficiency, and the produced lipase is useful in all processes requiring a transester reaction. Can be used.

도 1은 리파제 유전자를 24 종의 효모 단백질 분비 융합인자 (TFP)를 포함하는 GAL10 프로모터 벡터에 연결하여 사카로마이세스 세레비지에 균주에 도입하는 생체 내 재조합 과정을 보여주는 모식도이다.
도 2는 사카로마이세스 세레비지에 균주 24 종에서 발현되어 세포 밖으로 분비된 리파제 단백질을 SDS-PAGE와 웨스턴블랏으로 분석한 결과이다.
도 3는 사카로마이세스 세레비지에 균주 24 종 배양액의 리파제 활성을 분석한 결과이다.
도 4는 24 종의 TFP 균주 중에서 1 차로 선별된 4 종의 균주에서 3 개씩의 단일 균주를 배양하여 분비된 리파제 단백질을 SDS-PAGE와 웨스턴블랏으로 분석한 결과이다.
도 5은 24 종의 TFP 균주 중에서 1 차로 선별된 4 종의 균주에서 3 개씩 선별한 단일 균주 배양액의 리파제 활성을 분석한 결과이다.
도 6은 분비 융합 인자 TFP 19번과 리파제 유전자를 포함하고 있는 YGa-ST19-RML-6H 발현 및 분비 벡터의 모식도이다.
도 7은 방향성 진화 방법으로 활성이 개선된 RML을 선별하는 과정을 보여주는 모식도이다.
도 8은 야생형 리파제와 활성이 개선된 리파제 발현균주를 5L 발효조에서 유가식 배양 후 시간별 배양상등액을 SDS-PAGE와 활성 분석한 결과이다.
도 9는 발효 생산된 야생형과 변이주 리파제의 고정화 과정을 보여주는 결과이다.
도 10는 야생형과 변이주 리파제의 전이에스터 반응 활성을 분석한 결과이다.
도 11은 SV가 추가된 RML-3G#4의 발현벡터 구조 및 발현을 확인한 결과이다.
도 12는 유가식 발효를 통한 SV-RML-3G#4 단백질 발현 및 활성을 비교한 결과이다.
1 is a schematic diagram showing a recombination process in vivo in which a lipase gene is connected to a GAL10 promoter vector containing 24 yeast protein secretion fusion factors (TFP) and introduced into a Saccharomyces cerevisiae strain.
2 is a result of SDS-PAGE and Western blot analysis of lipase proteins expressed in 24 strains of Saccharomyces cerevisiae and secreted out of cells.
3 is a result of analyzing the lipase activity of the culture medium of 24 strains of Saccharomyces cerevisiae.
FIG. 4 is a result of analyzing the secreted lipase protein by culturing 3 single strains from 4 strains primarily selected among 24 TFP strains by SDS-PAGE and Western blot.
5 is a result of analyzing the lipase activity of the culture medium of a single strain selected by three from four strains primarily selected among 24 TFP strains.
6 is a schematic diagram of a secretory fusion factor TFP 19 and a YGa-ST19-RML-6H expression and secretion vector containing a lipase gene.
7 is a schematic diagram showing a process of selecting RML with improved activity by a directional evolution method.
8 is a result of SDS-PAGE and activity analysis of the culture supernatant for each time after fed-batch culture of wild-type lipase and lipase-expressing strain with improved activity in a 5L fermentor.
9 is a result showing the immobilization process of fermented wild type and mutant lipase.
10 is a result of analysis of the transester reaction activity of wild-type and mutant lipase.
11 is a result of confirming the structure and expression of the expression vector of RML-3G#4 to which SV was added.
12 is a result of comparing the expression and activity of SV-RML-3G#4 protein through fed-batch fermentation.

이하, 본 발명을 하기 실시예를 통하여 보다 상세하게 설명한다. 그러나 이들 실시예는 본 발명을 예시적으로 설명하기 위한 것으로 본 발명의 범위가 이들 실시예만으로 한정되는 것은 아니다.Hereinafter, the present invention will be described in more detail through the following examples. However, these examples are for illustrative purposes only, and the scope of the present invention is not limited to these examples.

<실시예 1> 리조무코르 미에헤이(<Example 1> Rizomucor Miehei ( Rhizomucor mieheiRhizomucor miehei ) 유래 리파제 유전자 합성 및 단백질 융합인자(TFP)가 도입된 형질전환체의 제작) Synthesis of derived lipase gene and production of transformants into which protein fusion factor (TFP) was introduced

효모 균주에 적용할 리조무코르 미에헤이(Rhizomucor miehei) 유래의 리파제(이하, RML) 유전자 분비 발현 벡터를 제작하기 위하여 NCBI GenBank: ATU74725.1의 서열정보를 바탕으로 효모 코돈 최적화 후, ㈜바이오니아에 유전자 합성을 의뢰하였다. 합성된 RML의 경우 1020bp로서(서열번호 1), 339개의 아미노산으로 구성되어 있으며(서열번호 2), 효모에서 인식되는 자체적인 분비 신호는 포함하지 않는다. RML의 아미노산, 뉴클레오타이드 서열을 하기 표 1에 나타내었다.To create a lipase (hereinafter, RML) gene secretion expression vector derived from Rhizomucor miehei to be applied to yeast strains, after optimization of yeast codons based on sequence information of NCBI GenBank: ATU74725.1, Bioneer Co., Ltd. Gene synthesis was requested. In the case of the synthesized RML, it is 1020bp (SEQ ID NO: 1), and is composed of 339 amino acids (SEQ ID NO: 2), and does not contain its own secretion signal recognized by yeast. The amino acid and nucleotide sequences of RML are shown in Table 1 below.

RML의 분비 발현 벡터를 제작하기 위하여, 서열번호 3 및 서열번호 4으로 이루어진 프라이머를 이용하여, 1차 PCR(94 ℃ 5분 1회, 94 ℃ 30초, 55 ℃ 30초, 72℃ 1분 25회, 72℃ 7분 1회) 반응을 통해 RML 유전자를 증폭시켰다. 1차 PCR로 증폭된 유전자는 다시 LNK39(서열번호 5) 및 HisGT50R(서열번호 6) 프라이머를 이용하여 2차로 증폭시켜, 벡터와 세포내 재조합(in vivo recombination)에 필요한 서열이 도입되고, C-말단에는 히스티딘-태그(Hig-tag)가 도입된 유전자를 확보하였다. 상기 사용된 프라이머의 서열을 하기 표 2에 나타내었다.In order to prepare the secretion expression vector of RML, using a primer consisting of SEQ ID NO: 3 and SEQ ID NO: 4, the first PCR (94 5 minutes once, 94 ℃ 30 seconds, 55 ℃ 30 seconds, 72 1 minute 25 Times, 72° C. 7 minutes once) The RML gene was amplified through the reaction. The gene amplified by the first PCR was amplified secondarily using primers LNK39 (SEQ ID NO: 5) and HisGT50R (SEQ ID NO: 6), and the sequence required for vector and intracellular recombination ( in vivo recombination) was introduced, and C- At the end, a gene into which a histidine-tag was introduced was obtained. The sequences of the primers used are shown in Table 2 below.

RML의 아미노산, 뉴클레오타이드 서열 Amino acid and nucleotide sequence of RML 아미노산 서열Amino acid sequence 서열번호Sequence number VPIKRQSNSTVDSLPPLIPSRTSAPSSSPSTTDPEAPAMSRNGPLPSDVETKYGMALNATSYPDSVVQAMSIDGGIRAATSQEINELTYYTTLSANSYCRTVIPGATWDCIHCDATEDLKIIKTWSTLIYDTNAMVARGDSEKTIYIVFRGSSSIRNWIADLTFVPVSYPPVSGTKVHKGFLDSYGEVQNELVATVLDQFKQYPSYKVAVTGHSLGGATALLCALGLYQREEGLSSSNLFLYTQGQPRVGDPAFANYVVSTGIPYRRTVNERDIVPHLPPAAFGFLHAGEEYWITDNSPETVQVCTSDLETSDCSNSIVPFTSVLDHLSYFGINTGLCTVPIKRQSNSTVDSLPPLIPSRTSAPSSSPSTTDPEAPAMSRNGPLPSDVETKYGMALNATSYPDSVVQAMSIDGGIRAATSQEINELTYYTTLSANSYCRTVIPGATWDCIHCDATEDLKIIKTWSTLIYDTNAMVARGDSEKTIYIVFRGSSSIRNWIADLTFVPVSYPPVSGTKVHKGFLDSYGEVQNELVATVLDQFKQYPSYKVAVTGHSLGGATALLCALGLYQREEGLSSSNLFLYTQGQPRVGDPAFANYVVSTGIPYRRTVNERDIVPHLPPAAFGFLHAGEEYWITDNSPETVQVCTSDLETSDCSNSIVPFTSVLDHLSYFGINTGLCT 1One 뉴클레오타이드 서열Nucleotide sequence 서열번호Sequence number GTGCCAATCAAGAGACAATCAAACAGCACGGTGGATAGTCTGCCACCCCTCATCCCCTCTCGAACCTCGGCACCTTCATCATCACCAAGCACAACCGACCCTGAAGCTCCAGCCATGAGTCGCAATGGACCGCTGCCCTCGGATGTAGAGACTAAATATGGCATGGCTTTGAATGCTACTTCCTATCCGGATTCTGTGGTCCAAGCAATGAGCATTGATGGTGGTATCCGCGCTGCGACCTCGCAAGAAATCAATGAATTGACTTATTACACTACACTATCTGCCAACTCGTACTGCCGCACTGTCATTCCTGGAGCTACCTGGGACTGTATCCACTGTGATGCAACGGAGGATCTCAAGATTATCAAGACTTGGAGCACGCTCATCTATGATACAAATGCAATGGTTGCACGTGGTGACAGCGAAAAAACTATCTATATCGTTTTCCGAGGTTCGAGCTCTATCCGCAACTGGATTGCTGATCTCACCTTTGTGCCAGTTTCATATCCTCCGGTCAGTGGTACAAAAGTACACAAGGGATTCCTGGACAGTTACGGGGAAGTTCAAAACGAGCTTGTTGCTACTGTTCTTGATCAATTCAAGCAATATCCAAGCTACAAGGTTGCTGTTACAGGTCACTCACTCGGTGGTGCTACTGCGTTGCTTTGCGCCCTGGGTCTCTATCAACGAGAAGAAGGACTCTCATCCAGCAACTTGTTCCTTTACACTCAAGGTCAACCACGGGTAGGCGACCCTGCCTTTGCCAACTACGTTGTTAGCACCGGCATTCCTTACAGGCGCACGGTCAATGAACGAGATATCGTTCCTCATCTTCCACCTGCTGCTTTTGGTTTTCTCCACGCTGGCGAGGAGTATTGGATTACTGACAATAGCCCAGAGACTGTTCAGGTCTGCACAAGCGATCTGGAAACCTCTGATTGCTCTAACAGCATTGTTCCCTTCACAAGTGTTCTTGACCATCTCTCGTACTTTGGTATCAACACAGGCCTCTGTACTTAAGTGCCAATCAAGAGACAATCAAACAGCACGGTGGATAGTCTGCCACCCCTCATCCCCTCTCGAACCTCGGCACCTTCATCATCACCAAGCACAACCGACCCTGAAGCTCCAGCCATGAGTCGCAATGGACCGCTGCCCTCGGATGTAGAGACTAAATATGGCATGGCTTTGAATGCTACTTCCTATCCGGATTCTGTGGTCCAAGCAATGAGCATTGATGGTGGTATCCGCGCTGCGACCTCGCAAGAAATCAATGAATTGACTTATTACACTACACTATCTGCCAACTCGTACTGCCGCACTGTCATTCCTGGAGCTACCTGGGACTGTATCCACTGTGATGCAACGGAGGATCTCAAGATTATCAAGACTTGGAGCACGCTCATCTATGATACAAATGCAATGGTTGCACGTGGTGACAGCGAAAAAACTATCTATATCGTTTTCCGAGGTTCGAGCTCTATCCGCAACTGGATTGCTGATCTCACCTTTGTGCCAGTTTCATATCCTCCGGTCAGTGGTACAAAAGTACACAAGGGATTCCTGGACAGTTACGGGGAAGTTCAAAACGAGCTTGTTGCTACTGTTCTTGATCAATTCAAGCAATATCCAAGCTACAAGGTTGCTGTTACAGGTCACTCACTCGGTGGTGCTACTGCGTTGCTTTGCGCCCTGGGTCTCTATCAACGAGAAGAAGGACTCTCATCCAGCAACTTGTTCCTTTACACTCAAGGTCAACCACGGGTAGGCGACCCTGCCTTTGCCAACTACGTTGTTAGCACCGGCATTCCTTACAGGCGCACGGTCAATGAACGAGATATCGTTCCTCATCTTCCACCTGCTGCTTTTGGTTTTCTCCACGCTGGCGAGGAGTATTGGATTACTGACAATAGCCCAGAGACTGTTCAGGTCTGCACAAGCGATCTGGAAACCTCTGATTGCTCTAACAGCATTGTTCCCTTCACAAGTGTTCTTGACCATCTCTCGTACTTTGGTATCA ACACAGGCCTCTGTACTTAA 22

프라이머primer 서열order 서열번호Sequence number RML-TFP-FRML-TFP-F CTCGCCTTAGATAAAAGAGTGCCAATCAAGAGACAACTCGCCTTAGATAAAAGAGTGCCAATCAAGAGACAA 33 RML-TFP-RRML-TFP-R TTAGTGATGGTGATGGTGATGCTTAAGTACAGAGGCCTGTTAGTGATGGTGATGGTGATGCTTAAGTACAGAGGCCTG 44 LNK39LNK39 GGCCGCCTCGGCCTCTGCTGGCCTCGCCTTAGATAAAAGAGGCCGCCTCGGCCTCTGCTGGCCTCGCCTTAGATAAAAGA 55 HisGT50RHisGT50R GTCATTATTAAATATATATATATATATATTGTCACTCCGTTCAAGTCGACTTAGTGATGGTGATGGTGATGGTCATTATTAAATATATATATATATATATTGTCACTCCGTTCAAGTCGACTTAGTGATGGTGATGGTGATG 66

상기 증폭된 유전자는 단백질 분비발현을 도와주는 24종의 단백질 분비융합인자(한국등록특허 제0975596호 참조)를 함유한 선형의 벡터와 함께 효모 균주 Y2805G(Mat a pep4::HIS3 prb1 can1 his3-200 ura3-52, gal80)에 도입하여 세포 내 재조합을 통하여 형질전환체가 형성되도록 하였다. LNK39 및 HisGT50R 프라이머로 증폭한 PCR 산물은 벡터의 링커(linker) 말단과 40염기, GAL7 전사 종결자 말단과 50염기가 동일하기 때문에, 선형화된 벡터와 함께 효모 세포로 도입하면 세포 내에서 교차가 일어나게 된다. 이에 따라, RML 유전자와 단백질 분비융합인자(TFP: Translational fusion partner) 벡터가 일정한 방향으로 연결되고, 우라실(uracil)이 없는 선택배지인 SD-Ura 배지(0.67% 아미노산이 결여된 효모기질, 0.77% 우라실이 결핍된 영양보충물, 2% 포도당)에서 선별하여, 대장균을 이용한 벡터 제작 과정 없이 곧바로 각각의 발현벡터가 도입된 형질전환체를 제작하였다(도 1). 본 발명에 사용된 단백질 분비융합인자(TFP)의 아미노산 서열을 하기 표 3에 나타내었다.The amplified gene is a yeast strain Y2805G (Mat a pep4::HIS3 prb1 can1 his3-200) with a linear vector containing 24 types of protein secretion fusion factors (refer to Korean Patent No. 0975596) that help protein secretion and expression. ura3-52, gal80) to form transformants through intracellular recombination. Since the PCR product amplified with LNK39 and HisGT50R primers has the same linker end and 50 bases as the vector's linker end, and 50 bases as the GAL7 transcription terminator end, crossing occurs within the cell when introduced into yeast cells with the linearized vector. do. Accordingly, the RML gene and the protein secretion fusion factor (TFP: Translational Fusion Partner) vector are linked in a certain direction, and SD-Ura medium (0.67% amino acid-free yeast substrate, 0.77%) is a selective medium without uracil. Uracil-deficient nutrient supplements, 2% glucose) were selected to produce transformants into which each expression vector was introduced immediately without a vector production process using E. coli (FIG. 1). The amino acid sequence of the protein secretion fusion factor (TFP) used in the present invention is shown in Table 3 below.

단백질 분비 융합인자의 아미노산 서열Amino acid sequence of protein secretion fusion factor 단백질 분비 융합인자Protein secretion fusion factor 아미노산 서열Amino acid sequence 서열번호Sequence number TFP 1TFP 1 MFNRFNKFQAAVALALLSRGALGDSYTNSTSSADLSSITSVSSASASATASDSLSSSDGTVYLPSTTISGDLTVTGKVIATEAVEVAAGGKLTLLDGEKYVFSSEAASASAGLALDKRMFNRFNKFQAAVALALLSRGALGDSYTNSTSSADLSSITSVSSASASATASDSLSSSDGTVYLPSTTISGDLTVTGKVIATEAVEVAAGGKLTLLDGEKYVFSSEAASASAGLALDKR 77 TFP 2TFP 2 MTPYAVAITVALLIVTVSALQVNNSCVAFPPSNLRGKNGDGTNEQYATALLSIPWNGPPESSRDINLIELEPQVALYLLENYINHYYNTTRDNKCPNNHYLMGGQLGSSSDNRSLNEAASASAGLALDKRMTPYAVAITVALLIVTVSALQVNNSCVAFPPSNLRGKNGDGTNEQYATALLSIPWNGPPESSRDINLIELEPQVALYLLENYINHYYNTTRDNKCPNNHYLMGGQLGSSSDNRSLNEAASASAGLALDKR 88 TFP 3TFP 3 MQFKNVALAASVAALSATASAEGYTPGEPWSTLTPTGSISCGAAEYTTTFGIAVQAITSSKAKRDVISQIGDGQVQATSAATAQATDSQAQATTTATPTSSEKMAASASAGLALDKRMQFKNVALAASVAALSATASAEGYTPGEPWSTLTPTGSISCGAAEYTTTFGIAVQAITSSKAKRDVISQIGDGQVQATSAATAQATDSQAQATTTATPTSSEKMAASASAGLALDKR 99 TFP 4TFP 4 MRFAEFLVVFATLGGGMAAPVESLAGTQRYLVQMKERFTTEKLCALDDKAASASAGLALDKRMRFAEFLVVFATLGGGMAAPVESLAGTQRYLVQMKERFTTEKLCALDDKAASASAGLALDKR 1010 TFP 5TFP 5 MFNRFNKFQAAVALALLSRGALGAPVNTTTEDETALIPAEAVIGYLDLEGDFDVAVLPFSNSTNNGLLFINTTIASIAAKEEGVAASASAGLALDKRMFNRFNKFQAAVALALLSRGALGAPVNTTTEDETALIPAEAVIGYLDLEGDFDVAVLPFSNSTNNGLLFINTTIASIAAKEEGVAASASAGLALDKR 1111 TFP 6TFP 6 MRFPSIFTAVLFAASSALAAPVNTTTEDETAQIPAEAVIGYLDLEGDFDVAVLPFSNSTNNGLLFINTTIASIAAKEEGVAASASAGLALDKRMRFPSIFTAVLFAASSALAAPVNTTTEDETAQIPAEAVIGYLDLEGDFDVAVLPFSNSTNNGLLFINTTIASIAAKEEGVAASASAGLALDKR 1212 TFP 7TFP 7 MVFGQLYALFIFTLSCCISKTVQADSSKESSSFISFDKESNWDTISTISSTADVISSVDSAIAVFEFDNFSLLDSLMIDEEYPFFNRFFANDVSLTVHDDSPLNISQSLSPIMEQFTVDELPESASDLLYEYSLDDKSIVLFKFTSDAYDLKKLDEFIDSCLSFLEDKSGDNLTVVINSLGWAFEDEDGDDEYATEETLSHHDNNKGKEGDDLAASASAGLALDKRMVFGQLYALFIFTLSCCISKTVQADSSKESSSFISFDKESNWDTISTISSTADVISSVDSAIAVFEFDNFSLLDSLMIDEEYPFFNRFFANDVSLTVHDDSPLNISQSLSPIMEQFTVDELPESASDLLYEYSLDDKSIVLFKFTSDAYDLKKLDEFIDSVCLSFDKDNASDLASKSFLEDGDNAS 1313 TFP 8TFP 8 MLQSVVFFALLTFASSVSAIYSNNTVSTTTTLAPSYSLVPQETTISYADDLAASASAGLALDKRMLQSVVFFALLTFASSVSAIYSNNTVSTTTTLAPSYSLVPQETTISYADDLAASASAGLALDKR 1414 TFP 9TFP 9 MKFSTAVTTLISSGAIVSALPHVDVHQEDAHQHKRAVAYKYVYETVVVDSDGHTVTPAASEVATAATSAIITTSVLAPTSSAAAADSSASIAVSSAALAKNEKISDAAASATASTSQGASSSSYLAASASAGLALDKRMKFSTAVTTLISSGAIVSALPHVDVHQEDAHQHKRAVAYKYVYETVVVDSDGHTVTPAASEVATAATSAIITTSVLAPTSSAAAADSSASIAVSSAALAKNEKISDAAASATASTSQGASSSSYLAASASAGLALDKR 1515 TFP 10TFP 10 MNWLFLVSLVFFCGVSTHPALAMSSNRLLKLANKSPKKIIPLKDSSFENILAPPHENAYIVALFTATAPEIGCSLCLELESEYDTIVASWFDDHPDAKSSNSDTSIFFTKVNLEDPSKTIPKAFQFFQLNNVPRLFIFKLNSPSILDHSVISISTDTGSERMKQIIQAIKQFSQVNDFSLHLPVGLAASASAGLALDKRMNWLFLVSLVFFCGVSTHPALAMSSNRLLKLANKSPKKIIPLKDSSFENILAPPHENAYIVALFTATAPEIGCSLCLELESEYDTIVASWFDDHPDAKSSNSDTSIFFTKVNLEDPSKTIPKAFQFFQLNNVPRLFIFKLNSPSILDHSVISISTDTGSERMKASASLAKLDLPVGASASFSLAKLDQ 1616 TFP 11TFP 11 MKFSSVTAITLATVATVATAKKGEHDFTTTLTLSSDGSLTTTTSTHTTHKYGKFNKTSKSKTPLAASASAGLALDKRMKFSSVTAITLATVATVATAKKGEHDFTTTLTLSSDGSLTTTTSTHTTHKYGKFNKTSKSKTPLAASASAGLALDKR 1717 TFP 12TFP 12 MASFATKFVIACFLFFSASAHNVLLPAYGRRCFFEDLSKGDELSISFQFGDRNPQSSSQLTGDFIIYGPERHEVLKTVRELAASASAGLALDKRMASFATKFVIACFLFFSASAHNVLLPAYGRRCFFEDLSKGDELSISFQFGDRNPQSSSQLTGDFIIYGPERHEVLKTVRELAASASAGLALDKR 1818 TFP 13TFP 13 MQYKKTLVASALAATTLAAYAPSEPWSTLTPTATYSGGVTDYASTFGIAVQPISTTSSASSAATTASSKAKRAASQIGDGQVQAATTTASVSTKSTAAAVSQIGDGQIQATTKTTAAAVSQIGDGQIQATTKTTSAKTTAAAVSQISDGQIQATTTTLAPLAASASAGLALDKRMQYKKTLVASALAATTLAAYAPSEPWSTLTPTATYSGGVTDYASTFGIAVQPISTTSSASSAATTASSKAKRAASQIGDGQVQAATTTASVSTKSTAAAVSQIGDGQIQATTKTTAAAVSQIGDGQIQATTKTTSAKTTAAAVSQISDGQIQLALDKRLDAPLA 1919 TFP 14TFP 14 MQFKNALTATAILSASALAANSTTSIPSSCSIGTSATATAQATDSQAQATTTAPLAASASAGLALDKRMQFKNALTATAILSASALAANSTTSIPSSCSIGTSATATAQATDSQAQATTTAPLAASASAGLALDKR 2020 TFP 15TFP 15 MVSKTWICGFISIITVVQALSCEKHDVLKKYQVGKFSSLTSTERDTPPSTTIEKWWINVCEEHNVEPPEECKKNDMLCGLTDVILPGKDAITTQIIDFDKNIGFNVEETESALTLTLNGATWGANSFDAKLEFQCNDNMKQDELAASASAGLALDKRMVSKTWICGFISIITVVQALSCEKHDVLKKYQVGKFSSLTSTERDTPPSTTIEKWWINVCEEHNVEPPEECKKNDMLCGLTDVILPGKDAITTQIIDFDKNIGFNVEETESALTLTLNGATWGANSFDAKLEFQCNDNMKQDELAASASAGLALDKR 2121 TFP 16TFP 16 MKLSALLALSASTAVLAAPAVHHSDNHHHNDKRAVVTVTQYVNADGAVVIPAATTATSAAADGKVESVAAATTTLSSTAAAATTLAASASAGLALDKRMKLSALLALSASTAVLAAPAVHHSDNHHHNDKRAVVTVTQYVNADGAVVIPAATTATSAAADGKVESVAAATTTLSSTAAAATTLAASASAGLALDKR 2222 TFP 17TFP 17 MKLSTVLLSAGLASTTLAQFSNSTSASSTDVTSSSSISTSSGSVTITSSEAPESDNGTSTAAPTETSTEAPTTAIPTNGTSTEAPTTAIPTNGTSTEAPTDTTTEAPTTALPTNGTSTEAPTDTTTEAPTTGLPTNGTTSAFPPTTSLPPSNTTTTPPYNPSTDYTTDYTVVTEYTTYCPERAASASAGLALDKRMKLSTVLLSAGLASTTLAQFSNSTSASSTDVTSSSSISTSSGSVTITSSEAPESDNGTSTAAPTETSTEAPTTAIPTNGTSTEAPTTAIPTNGTSTEAPTDTTTEAPTTALPTNGTSTEAPTDTTTEAPTTGLPTNGTTSAFPPTTSLPPSNTTTTPPYNPSTDYTTDYTVVTEYTTYCPERA 2323 TFP 18TFP 18 MRFSTTLATAATALFFTASQVSAIGELAFNLGVKNNDGTCKSTSDYETELQALKSYTSTVKVYAASDCNTLQNLGPAAEAEGFTIFVGVWPLAASASAGLALDKRMRFSTTLATAATALFFTASQVSAIGELAFNLGVKNNDGTCKSTSDYETELQALKSYTSTVKVYAASDCNTLQNLGPAAEAEGFTIFVGVWPLAASASAGLALDKR 2424 TFP 19TFP 19 MRLSNLIASASLLSAATLAAPANHEHKDKRAVVTTTVQKQTTIIVNGAASTPVAALEENAVVNSAPAAATSTTSSAASVATAASSSENNSQVSAAASPASSSAATSTQSSLAASASAGLALDKRMRLSNLIASASLLSAATLAAPANHEHKDKRAVVTTTVQKQTTIIVNGAASTPVAALEENAVVNSAPAAATSTTSSAASVATAASSSENNSQVSAAASPASSSAATSTQSSLAASASAGLALDKR 2525 TFP 20TFP 20 MQFSTVASIAAVAAVASAAANVTTATVSQESTTLVTITSCEDHVCSETVSPALVSTATVTVDDVITQYTTWCPLTTEAPKNGTSTAAPVTSTEAPKNTTSAAPTHSVTSYTGAAAKALPAAGALLAASASAGLALDKRMQFSTVASIAAVAAVASAAANVTTATVSQESTTLVTITSCEDHVCSETVSPALVSTATVTVDDVITQYTTWCPLTTEAPKNGTSTAAPVTSTEAPKNTTSAAPTHSVTSYTGAAAKALPAAGALLAASASAGLALDKR 2626 TFP 21TFP 21 MKFSSALVLSAVAATALAESITTTITATKNGHVYTKTVTQDATFVWGGEDSYASSTSAAESSAAETSAAETSAAATTSAAATTSAAETSSAAETSSADEGSGSSITTTITATKNGHVYTKTVTQDATFVWTGEGSSNTWSPSSTSTSSEAATSSASTTATTLLAASASAGLALDKRMKFSSALVLSAVAATALAESITTTITATKNGHVYTKTVTQDATFVWGGEDSYASSTSAAESSAAETSAAETSAAATTSAAATTSAAETSSAAETSSADEGSGSSITTTITATKNGHVYTKTVTQDATFVWTGEGSSNTWSPSSTSTSSEAATSSASTTATTLLAASAGLDLA 2727 TFP 22TFP 22 MKFQVVLSALLACSSAVVASPIENLFKYRAVKASHSKNINSTLPAWNGSNSSNVTYANGTNSTTNTTTAESSQLQIIVTGGQVPITNSSLTHTNYTRLFNSSSALNITELYNVARVVNETIQDNLAASASAGLALDKRMKFQVVLSALLACSSAVVASPIENLFKYRAVKASHSKNINSTLPAWNGSNSSNVTYANGTNSTTNTTTAESSQLQIIVTGGQVPITNSSLTHTNYTRLFNSSSALNITELYNVARVVNETIQDNLAASASAGLALDKR 2828 TFP 23TFP 23 MRAITLLSSVVSLALLSKEVLATPPACLLACVAQVGKSSSTCDSLNQVTCYCEHENSAVKKCLDSICPNNDADAAYSAFKSSCSEQNASLGDSSGSASSSVLAASASAGLALDKRMRAITLLSSVVSLALLSKEVLATPPACLLACVAQVGKSSSTCDSLNQVTCYCEHENSAVKKCLDSICPNNDADAAYSAFKSSCSEQNASLGDSSGSASSSVLAASASAGLALDKR 2929 TFP 24TFP 24 MKLSTVLLSAGLASTTLAQFSNSTSASSTDVTSSSSISTSSGSVTITSSEAPESDNGTSTAAPTETSTEAPTTAIPTNGTSTEAPTTAIPTNGTSTEAPTDTTTEAPTTALPTNGTSTEAPTDTTTEAPTTGLPTNGTTSAFPPTTSLPPSNTTTTLAASASAGLALDKRMKLSTVLLSAGLASTTLAQFSNSTSASSTDVTSSSSISTSSGSVTITSSEAPESDNGTSTAAPTETSTEAPTTAIPTNGTSTEAPTTAIPTNGTSTEAPTDTTTEAPTTALPTNGTSTEAPTDTTTEAPTTGLPTNGTTSAFPPTTSLPPSNTTTTLAASASAGLALDKR 3030

<실시예 2> 단백질 분비융합인자(TFP)를 이용한 RML의 분비 생산 확인<Example 2> Confirmation of secretion production of RML using protein secretion fusion factor (TFP)

상기 실시예 1에서 제작한 24종의 형질전환체를 이용하여 RML를 분비 생산하고, 높은 분비 생산율을 나타내는 단백질 분비 융합인자(TFP)를 확인하기 위해, YPD 배지(1% 효모추출물, 2% 펩톤, 1% 포도당)에서 40시간 배양한 후 원심분리하여 균체를 제거하고 배양 상등액 0.6 ml을 0.4 ml 아세톤(acetone)으로 침전시켜 SDS-PAGE 분석, 및 항-His 항체를 이용한 웨스턴블랏 분석으로, 분비 발현된 리파제를 확인하였다(도 2). In order to secrete production of RML using the 24 transformants prepared in Example 1 and to confirm the protein secretion fusion factor (TFP) showing a high secretion production rate, YPD medium (1% yeast extract, 2% peptone , 1% glucose) for 40 hours and then centrifuged to remove the cells, and 0.6 ml of the culture supernatant was precipitated with 0.4 ml acetone, SDS-PAGE analysis, and Western blot analysis using anti-His antibodies, secretion The expressed lipase was confirmed (FIG. 2).

활성 검증은 pH 적정에 의한 활성이 탐지되지 않아 p-니트로페닐 팔미테이트(p-Nitrophenyl palmitate)를 기질로 하여, 분비 발현된 리파제에 의해 생성되는 p-니트로페놀(p-Nitrophenol)을 410nm 파장으로 흡광도를 측정하여 비교 분석하였다(도 3). Activity verification was performed using p-Nitrophenyl palmitate as a substrate as the activity by pH titration was not detected, and p-nitrophenol produced by secreted-expressed lipase at 410 nm wavelength. The absorbance was measured and analyzed for comparison (Fig. 3).

형질전환체의 RML 분비 생산을 SDS-PAGE 및 웨스턴 블랏으로 분석한 결과, 도 2에서 확인할 수 있는 바와 같이, 예상되는 분자량인 38kDa 부근에서 일부 TFP는 발현 단백질이 확인되었으나, 대부분은 예상되는 단백질 위치보다 큰 분자량에서 단백질이 확인되어 다중-밴드(multi-band)로 분리되는 것을 확인하였다. 이러한 결과는 RML 단백질 서열 상에 포함된 2개의 당쇄부과 서열 부위에서 당쇄가 첨가되었음을 나타내는 것이다. As a result of analyzing the RML secretion production of the transformant by SDS-PAGE and Western blot, as can be seen in FIG. 2, some TFP expression proteins were identified near the expected molecular weight of 38 kDa, but most of them were expected protein positions. It was confirmed that the protein was identified at a higher molecular weight and separated into a multi-band. These results indicate that a sugar chain was added at the two sugar chain portions and the sequence portion included on the RML protein sequence.

pH 적정법을 통해, 분비된 리파제의 효소 활성을 확인한 결과, 도 3에서 확인할 수 있는 바와 같이, 선별된 TFP 중 TFP 4, 8, 13 및 19가 분비 발현능 및 활성이 가장 우수함을 확인하였다. As a result of confirming the enzyme activity of the secreted lipase through the pH titration method, it was confirmed that TFP 4, 8, 13 and 19 of the selected TFPs had the most excellent secretion expression and activity.

상기와 같은 방법으로 선별된 균주는 각 분비 융합 인자의 형질전환체를 혼합하여 분석한 결과이기 때문에, 보다 정확한 분석을 위해 분비 융합 인자 4, 8, 13, 19 당 세 개의 단일 콜로니 균체를 분리하여 RML의 분비 발현능 및 활성을 분석하였다. 구체적으로, 1차 선별에서 수행한 SDS-PAGE 및 웨스턴 블랏에서는 RML에 당쇄가 부가되어있음이 관찰되었으므로, 2차 선별에서는 이를 확인하기 위해, 당쇄분해효소(Endoglycosidase) H를 처리하여 단백질에 결합된 당쇄를 제거한 후에 분석하였다. Since the strain selected by the above method is the result of mixing and analyzing the transformants of each secretory fusion factor, three single colony cells per secretory fusion factor 4, 8, 13, and 19 are isolated for more accurate analysis. The secretory expression ability and activity of RML were analyzed. Specifically, it was observed that sugar chains were added to RML in the SDS-PAGE and Western blot performed in the first screening, so in order to confirm this in the second screening, Endoglycosidase H was treated to bind to the protein. After removing the sugar chain, it was analyzed.

동일한 조성의 배지와 조건에서 배양한 시료를 이용하여 SDS-PAGE 분석 및 웨스턴 블랏을 통해 분비 발현능을 확인한 결과, 도 4에서 확인할 수 있는 바와 같이, 예상 분자량 부위에서 분비 발현 단백질(RML)이 생산되었음을 확인하였다.As a result of confirming the secretion expression ability through SDS-PAGE analysis and Western blot using a sample cultured under the same composition of the medium and conditions, as can be seen in FIG. 4, secretion-expressing protein (RML) is produced at the expected molecular weight site Was confirmed.

pH 적정법을 통해 활성을 분석한 결과, 도 5에서 확인할 수 있는 바와 같이, 선별한 TFP 중 TFP 4, 8, 13 및 19가 RML의 분비 발현능 및 효소 활성이 우수함을 확인할 수 있었다. 이에 따라, 최종적으로 RML을 고효율로 분비 생산하는 발현벡터로서, 단백질 분비 융합인자 TFP 19를 함유하는 YGaST19-RML-6H를 최종 균주로 선별하였다(도 6).As a result of analyzing the activity through the pH titration method, as can be seen in FIG. 5, it was confirmed that TFP 4, 8, 13, and 19 were excellent in secretory expression and enzyme activity of RML among the selected TFPs. Accordingly, as an expression vector for secreting and producing RML with high efficiency, YGaST19-RML-6H containing the protein secretion fusion factor TFP 19 was selected as the final strain (Fig. 6).

<실시예 3> 방향성 진화를 이용한 RML 변이 라이브러리의 제조<Example 3> Preparation of RML mutation library using directed evolution

RML 유전자에 무작위적으로 변이를 도입하기 위하여 변이유도 중합효소연쇄반응(error-prone PCR, PCR random mutagenesis kit, Clontech, USA) 및 세포내 재조합 방법을 이용하였다. RML 발현 벡터인 YGaST19-RML-6H를 주형으로 GAL100 프라이머(서열번호 55) 및 GT50R 프라이머(서열번호 56)를 사용하여 변이유도 중합효소연쇄반응을 수행하였다. 변이유도는 1kb당 4~7개의 변이가 도입되도록 하였으며, 94℃에서 30초 동안 1회; 94℃ 30초간, 68℃ 2분간 반응을 25회; 68℃에서 1분간 1회 반응 조건으로 수행하였다. 증폭된 PCR 산물을 제한효소 EcoRI/SalI으로 처리하고 동일효소로 선형화한 100ng의 YGa 벡터에 클로닝하여 효모에 형질전환시킨후, 1% 트리뷰티린(tributyrin)을 함유하는 YPD 고체배지 상에서 형질전환체의 활성을 비교하였다(도 7). In order to introduce mutations randomly into the RML gene, mutation-induced polymerase chain reaction (error-prone PCR, PCR random mutagenesis kit, Clontech, USA) and intracellular recombination methods were used. Mutation-induced polymerase chain reaction was performed using the RML expression vector YGaST19-RML-6H as a template, using a GAL100 primer (SEQ ID NO: 55) and a GT50R primer (SEQ ID NO: 56). Mutation induction was made to introduce 4 to 7 mutations per 1 kb, once for 30 seconds at 94 ℃; 94 ℃ 30 seconds, 68 2 minutes reaction 25 times; It was carried out under the conditions of one-time reaction at 68°C for 1 minute. The amplified PCR product was treated with restriction enzyme EcoRI/SalI, cloned into 100 ng of YGa vector linearized with the same enzyme, transformed into yeast, and transformed on YPD solid medium containing 1% tributyrin. The activity of was compared (Fig. 7).

그 결과, 대조구인 야생형 RML의 경우 2일간 배양시 전혀 활성이 나타나지 않았으나, 변이주 라이브러리를 발현한 경우에는 아주 약한 활성환이 관찰되었다. 약 3,000개의 형질전환체들의 활성환의 크기를 비교한 결과 활성환이 증가된 36개 변이주를 1차 선별하였다. 1차 선별된 변이주는 가수분해 활성과 전이에스터 반응 활성을 각각 검증하였다. 가수분해 활성은 4-니트로페닐 팔미테이트를 기질로 하여, 리파제에 의해 생성되는 4-니트로페놀의 양을 분석하였으며, 전이에스터 활성은 콩기름 9 ml 및 메탄올 1 ml를 기질로 하여, 배양 상등액을 1 ml 첨가하여 45 ℃에서 1시간 반응 후 형성된 지방산 메틸에스터의 양을 가스크로마토그래피로 분석하였다.As a result, in the case of wild-type RML as a control, no activity was observed when cultured for 2 days, but a very weak active ring was observed when the mutant library was expressed. As a result of comparing the size of the active ring of about 3,000 transformants, 36 mutant strains with increased active ring were first selected. The primary selected mutant strains were verified for hydrolytic activity and transester reaction activity, respectively. The hydrolytic activity was analyzed using 4-nitrophenyl palmitate as a substrate, and the amount of 4-nitrophenol produced by lipase was analyzed, and the transfer ester activity was based on 9 ml of soybean oil and 1 ml of methanol as substrates, and the culture supernatant was 1 ml was added and reacted at 45° C. for 1 hour, and the amount of fatty acid methyl ester formed was analyzed by gas chromatography.

상기 과정을 통하여 얻은 1세대의 변이체 유전자를 주형으로 하여 동일한 방법을 3번 반복하여, 단계적으로 활성이 증가된 2세대 변이체 2G 및 3세대 변이체 3G를 제작하였다. 각 세대별 변이 균주에 포함된 RML 유전자의 서열을 확인한 결과, 1세대 변이체에서는 단백질 분비융합인자 TFP19의 S109T 변이, RML 서열의 K52N, Hig-tag 서열 내 H4D 변이가 확인되었다. 2세대 균주에서는 추가적으로 N190D 변이가 확인되었다. 3세대 균주에서는 추가적인 변이는 없었으나, 130번째 아미노산에 잠재성 돌연변이(silent mutation)만 확인되었다(표 5). The same method was repeated three times using the first-generation mutant gene obtained through the above process as a template, thereby producing a second-generation variant 2G and a third-generation variant 3G with stepwise increased activity. As a result of checking the sequence of the RML gene included in the mutant strains for each generation, the S109T mutation of the protein secretion fusion factor TFP19, the K52N of the RML sequence, and the H4D mutation in the Hig-tag sequence were identified in the first generation variant. In the second generation strain, additional N190D mutations were confirmed. In the third generation strain, there was no additional mutation, but only a silent mutation was identified at the 130th amino acid (Table 5).

변이 라이브러리 구축을 위해 사용된 프라이머 서열 정보, 방향성 진화를 통한 RML 개량 균주의 변이 서열 정보 및 3G#4 RML 개량균주의 아미노산, 뉴클레오타이드 서열을 각각 하기 표 4 내지 6에 나타내었다.Primer sequence information used for constructing the mutant library, mutant sequence information of the RML improved strain through directional evolution, and amino acid and nucleotide sequences of the 3G#4 RML improved strain are shown in Tables 4 to 6, respectively.

변이 라이브러리 구축을 위해 사용한 프라이머Primers used to build the mutation library 프라이머primer 서열order 서열번호Sequence number GAL100GAL100 GTATATGGTGGTAATGCCATGGTATATGGTGGTAATGCCATG 5555 GT50RGT50R GTCATTATTAAATATATATATATATATATTGTCACTCCGTTCAAGTCGACGTCATTATTAAATATATATATATATATATTGTCACTCCGTTCAAGTCGAC 5656

방향성 진화를 통한 RML 개량균주의 변이 서열 정보Mutant sequence information of RML improved strains through directional evolution 균주Strain STFP19STFP19 RMLRML His-tagHis-tag WT(야생형)WT (wild type) -- -- -- 1G1G S109TS109T K52NK52N H4DH4D 2G2G S109TS109T K52N,N190DK52N,N190D H4DH4D 3G3G S109TS109T K52N,130(TAT -> TAC),N190DK52N,130(TAT -> TAC),N190D H4DH4D

방향성 진화를 통한 3G#4 RML 개량균주의 아미노산, 뉴클레오타이드 서열Amino acid and nucleotide sequence of 3G#4 RML improved strain through directed evolution 아미노산 서열Amino acid sequence 서열번호Sequence number VPIKRQSNSTVDSLPPLIPSRTSAPSSSPSTTDPEAPAMSRNGPLPSDVETNYGMALNATSYPDSVVQAMSIDGGIRAATSQEINELTYYTTLSANSYCRTVIPGATWDCIHCDATEDLKIIKTWSTLIYDTNAMVARGDSEKTIYIVFRGSSSIRNWIADLTFVPVSYPPVSGTKVHKGFLDSYGEVQDELVATVLDQFKQYPSYKVAVTGHSLGGATALLCALGLYQREEGLSSSNLFLYTQGQPRVGDPAFANYVVSTGIPYRRTVNERDIVPHLPPAAFGFLHAGEEYWITDNSPETVQVCTSDLETSDCSNSIVPFTSVLDHLSYFGINTGLCTHHHDHH VPIKRQSNSTVDSLPPLIPSRTSAPSSSPSTTDPEAPAMSRNGPLPSDVETNYGMALNATSYPDSVVQAMSIDGGIRAATSQEINELTYYTTLSANSYCRTVIPGATWDCIHCDATEDLKIIKTWSTLIYDTNAMVARGDSEKTIYIVFRGSSSIRNWIADLTFVPVSYPPVSGTKVHKGFLDSYGEVQDELVATVLDQFKQYPSYKVAVTGHSLGGATALLCALGLYQREEGLSSSNLFLYTQGQPRVGDPAFANYVVSTGIPYRRTVNERDIVPHLPPAAFGFLHAGEEYWITDNSPETVQVCTSDLETSDCSNSIVPFTSVLDHLSYFGINTGLCTHHHDHH 5757 뉴클레오타이드 서열Nucleotide sequence 서열번호Sequence number GTGCCAATCAAGAGACAATCAAACAGCACGGTGGATAGTCTGCCACCCCTCATCCCCTCTCGAACCTCGGCACCTTCATCATCACCAAGCACAACCGACCCTGAAGCTCCAGCCATGAGTCGCAATGGACCGCTGCCCTCGGATGTAGAGACTAATTATGGCATGGCTTTGAATGCTACTTCCTATCCGGATTCTGTGGTCCAAGCAATGAGCATTGATGGTGGTATCCGCGCTGCGACCTCGCAAGAAATCAATGAATTGACTTATTACACTACACTATCTGCCAACTCGTACTGCCGCACTGTCATTCCTGGAGCTACCTGGGACTGTATCCACTGTGATGCAACGGAGGATCTCAAGATTATCAAGACTTGGAGCACGCTCATCTATGATACAAATGCAATGGTTGCACGTGGTGACAGCGAAAAAACTATCTATATCGTTTTCCGAGGTTCGAGCTCTATCCGCAACTGGATTGCTGATCTCACCTTTGTGCCAGTTTCATATCCTCCGGTCAGTGGTACAAAAGTACACAAGGGATTCCTGGACAGTTACGGGGAAGTTCAAGACGAGCTTGTTGCTACTGTTCTTGATCAATTCAAGCAATATCCAAGCTACAAGGTTGCTGTTACAGGTCACTCACTCGGTGGTGCTACTGCGTTGCTTTGCGCCCTGGGTCTCTATCAACGAGAAGAAGGACTCTCATCCAGCAACTTGTTCCTTTACACTCAAGGTCAACCACGGGTAGGCGACCCTGCCTTTGCCAACTACGTTGTTAGCACCGGCATTCCTTACAGGCGCACGGTCAATGAACGAGATATCGTTCCTCATCTTCCACCTGCTGCTTTTGGTTTTCTCCACGCTGGCGAGGAGTATTGGATTACTGACAATAGCCCAGAGACTGTTCAGGTCTGCACAAGCGATCTGGAAACCTCTGATTGCTCTAACAGCATTGTTCCCTTCACAAGTGTTCTTGACCATCTCTCGTACTTTGGTATCAACACAGGCCTCTGTACTCATCACCATgACCATCACTAAGTGCCAATCAAGAGACAATCAAACAGCACGGTGGATAGTCTGCCACCCCTCATCCCCTCTCGAACCTCGGCACCTTCATCATCACCAAGCACAACCGACCCTGAAGCTCCAGCCATGAGTCGCAATGGACCGCTGCCCTCGGATGTAGAGACTAATTATGGCATGGCTTTGAATGCTACTTCCTATCCGGATTCTGTGGTCCAAGCAATGAGCATTGATGGTGGTATCCGCGCTGCGACCTCGCAAGAAATCAATGAATTGACTTATTACACTACACTATCTGCCAACTCGTACTGCCGCACTGTCATTCCTGGAGCTACCTGGGACTGTATCCACTGTGATGCAACGGAGGATCTCAAGATTATCAAGACTTGGAGCACGCTCATCTATGATACAAATGCAATGGTTGCACGTGGTGACAGCGAAAAAACTATCTATATCGTTTTCCGAGGTTCGAGCTCTATCCGCAACTGGATTGCTGATCTCACCTTTGTGCCAGTTTCATATCCTCCGGTCAGTGGTACAAAAGTACACAAGGGATTCCTGGACAGTTACGGGGAAGTTCAAGACGAGCTTGTTGCTACTGTTCTTGATCAATTCAAGCAATATCCAAGCTACAAGGTTGCTGTTACAGGTCACTCACTCGGTGGTGCTACTGCGTTGCTTTGCGCCCTGGGTCTCTATCAACGAGAAGAAGGACTCTCATCCAGCAACTTGTTCCTTTACACTCAAGGTCAACCACGGGTAGGCGACCCTGCCTTTGCCAACTACGTTGTTAGCACCGGCATTCCTTACAGGCGCACGGTCAATGAACGAGATATCGTTCCTCATCTTCCACCTGCTGCTTTTGGTTTTCTCCACGCTGGCGAGGAGTATTGGATTACTGACAATAGCCCAGAGACTGTTCAGGTCTGCACAAGCGATCTGGAAACCTCTGATTGCTCTAACAGCATTGTTCCCTTCACAAGTGTTCTTGACCATCTCTCGTACTTTGGTATCA ACACAGGCCTCTGTACTCATCACCATgACCATCACTAA 5858

개량된 3G#4 변이주(서열번호 57)와 야생형 균주 간의 분비 발현율 및 특이 활성의 명확한 비교를 위해, 5L 발효조에서 유가식 배양을 수행하였다(도 8). 본 배양에 들어가기 전에, 50ml YNB 배지에서 초기 배양한 후, 200ml 액체배지에서 배양하여 활성화시킨 후, 본 배양액에 접종하여 30℃에서 48시간 동안 배양하였다. 분비된 리파제를 확인하기 위하여, 시간별 배양 상등액을 취하여 SDS-PAGE 분석하였다. For a clear comparison of the secretion expression rate and specific activity between the improved 3G#4 mutant strain (SEQ ID NO: 57) and the wild type strain, fed-batch culture was performed in a 5L fermentor (FIG. 8). Before entering the main culture, after initial culture in 50ml YNB medium, after culturing in 200ml liquid medium to activate, inoculate the main culture medium and incubate at 30°C for 48 hours. In order to confirm the secreted lipase, the culture supernatant for each time was taken and analyzed by SDS-PAGE.

야생형 균주 및 변이주의 RML 분비 발현율 및 분비된 RML의 특이 활성을 비교한 결과, 도 8에서 확인할 수 있는 바와 같이, 48시간 배양 후, 야생형 및 3G#4 변이주 각각은 0.76g/L 및 0.93g/L의 리파제가 분비 생산되었음을 확인하였다. 이를 통해, 야생형 균주에 비해 본 발명의 변이주가 더 많은 양의 리파제를 분비 생산할 수 있음을 확인할 수 있었다. As a result of comparing the RML secretion expression rate and the specific activity of the secreted RML of wild-type strain and mutant strain, as can be seen in FIG. It was confirmed that L lipase was secreted and produced. Through this, it was confirmed that the mutant strain of the present invention can secrete and produce a greater amount of lipase than the wild-type strain.

또한, pNPP를 이용하여 가수분해 활성을 분석한 결과, 야생형은 44,820U/L, 3G#4 변이주는 62,910U/L의 활성을 나타냄을 확인하였다. 이를 통해, 야생형 균주에 비해 본 발명의 변이주로부터 생산된 RML이 더 우수한 가수분해 활성을 나타냄을 확인할 수 있다. In addition, as a result of analyzing the hydrolytic activity using pNPP, it was confirmed that the wild type showed an activity of 44,820 U/L, and the 3G#4 mutant strain showed an activity of 62,910 U/L. Through this, it can be confirmed that RML produced from the mutant strain of the present invention exhibits more excellent hydrolytic activity compared to the wild-type strain.

즉, 본 발명의 변이주(3G#4)는 리파제 분비 발현량을 증가시킬 뿐만 아니라, 분비된 RML의 특이 활성도 약 114%로 현저히 증가시킴을 확인하였다(표 7).That is, it was confirmed that the mutant strain (3G#4) of the present invention not only increased the expression level of lipase secretion, but also significantly increased the specific activity of secreted RML to about 114% (Table 7).

야생형과 변이주의 단백질 발현량과 활성 비교Comparison of protein expression and activity of wild-type and mutant strains 균주Strain 세포 생장(A600)Cell growth (A600) 리파제Lipase 가수분해 활성Hydrolytic activity 특이 활성Specific activity WT(야생형)WT (wild type) 153153 0.76ml/ml0.76ml/ml 44,820U/L44,820U/L 58,973U/mg58,973 U/mg 변이주 3G#4Mutant 3G#4 160160 0.93ml/ml0.93ml/ml 62,910U/L62,910U/L 67,645U/mg67,645 U/mg

<실시예 4> 고정화 RML을 이용한 바이오디젤 전환 효율의 비교<Example 4> Comparison of biodiesel conversion efficiency using immobilized RML

야생형 및 변이주로부터 분비 생산된 리파제의 전이에스터 활성을 비교하기 위해, 효소 고정화를 진행하였다. 효소 고정화는 Lewatit VP OC 1600 레진(resin)을 사용했으며 레진 1g당 20mg 효소를 사용하여 25 ℃에서 20시간 동안 반응하여 고정화를 실시하였다. 반응 중간 상등액을 취하여 SDS-PAGE와 브래드포드 분석(bradford assay)으로 잔여 단백질을 분석한 결과, 배양 18시간 이후 대부분의 단백질들의 고정화가 이루어지는 것을 확인할 수 있었다(도 9). In order to compare the transester activity of lipase secreted and produced from wild-type and mutant strains, enzyme immobilization was performed. For enzyme immobilization, Lewatit VP OC 1600 resin was used, and immobilization was performed by reacting at 25° C. for 20 hours using 20 mg enzyme per 1 g of resin. As a result of taking the reaction intermediate supernatant and analyzing the residual protein by SDS-PAGE and Bradford assay, it was confirmed that most of the proteins were immobilized after 18 hours of incubation (FIG. 9).

에스터화 활성 비교를 위해 라우르산(Lauric acid) 및 프로판올(propanol)을 기질로 하여 45 ℃에서 30분간 반응을 수행하였다. 이후, 0.2N KOH를 이용하여 적정 후 생성된 프로필 라우레이트(propyl laurate)의 양으로 효소 활성을 분석하였다. 전이에스터 활성은 효소 1 g(40 mg/g)과 콩기름(soy oil)을 혼합한 용액에 총 3%의 메탄올을 첨가하여 30분 반응 후 GC 분석으로 생성된 FAME을 확인하여 도출하였다(도 10). For comparison of esterification activity, a reaction was performed at 45° C. for 30 minutes using lauric acid and propanol as substrates. Then, the enzyme activity was analyzed with the amount of propyl laurate produced after titration using 0.2N KOH. Transester activity was derived by confirming the FAME generated by GC analysis after 30 minutes reaction by adding a total of 3% methanol to a solution of 1 g (40 mg/g) of enzyme and soy oil (Fig. 10). ).

야생형 및 최종 선별된 변이주로부터 분비 생산된 리파제의 효소 활성을 비교한 결과, 도 10에서 확인할 수 있는 바와 같이, 에스터화(esterification) 활성은 야생형 대비 176%의 활성 증가를 보였고, 전이에스터(transesterification) 활성은 250% 증가하였음을 확인하였다. 또한, 본 발명에서 제작된 변이주는 상용화 효소인 Sigma RML 보다 에스터화 활성 및 전이에스터 활성이 각각 135% 및 181% 증가한 것으로 확인되었다. As a result of comparing the enzyme activity of the lipase secreted and produced from the wild-type and the final selected mutant, as can be seen in FIG. 10, the esterification activity showed an increase in activity of 176% compared to the wild-type, and the transesterification It was confirmed that the activity increased by 250%. In addition, it was confirmed that the mutant strain produced in the present invention increased the esterification activity and the transfer ester activity by 135% and 181%, respectively, than the commercially available enzyme Sigma RML.

상기와 같은 결과를 통해, 야생형 균주로부터 분비 생산된 리파제(RML), 및 기존에 시판되는 리파제(RML)에 비해 본 발명의 변이주로부터 분비 생산된 리파제(RML)는 에스터화 활성 및 전이에스터 활성이 월등히 우수하여, 바이오디젤 전환 효율이 매우 좋음을 확인할 수 있다.Through the above results, compared to the lipase secretedly produced from the wild-type strain (RML), and the lipase (RML) secretedly produced from the mutant strain of the present invention compared to the existing commercially available lipase (RML), the esterification and transesterification activity It is remarkably excellent, and it can be confirmed that the biodiesel conversion efficiency is very good.

<실시예 5> 온전한 RML 발현을 위한 융합 단백질 구조 변경<Example 5> Modification of fusion protein structure for intact RML expression

TFP와 RML은 케신 인식 서열인 KR을 포함하는 링커로 연결되어 있어, TFP는 골지체에서 케신에 의하여 절단되어 온전한 형태의 RML만 분비될 수 있다. 그러나, RML의 구조에 의해서 케신 인식부위가 표면으로 노출되지 않는 경우, 케신이 접근할 수 없어 절단이 일어나지 않기 때문에 TFP와 RML은 분리되지 않고 융합 단백질(TFP-RML) 형태로 분비된다. 도 11에서 보듯이, TFP19 분비 시그널을 이용하여 RML-3G#4을 생산할 경우 TFP19가 잘리지 않은 형태의 융합 단백질도 같이 생산되고, 이러한 융합 단백질이 효소 활성에 부정적인 영향을 미칠 수 있기 때문에 융합 단백질이 발현되는 것을 최소화하는 것이 고활성 단백질 생산에 도움이 될 수 있다. TFP and RML are linked by a linker containing a kesin recognition sequence KR, so that TFP can be cleaved by kecin in the Golgi body to secrete only intact RML. However, if the kecin recognition site is not exposed to the surface due to the structure of RML, TFP and RML are not separated and secreted in the form of a fusion protein (TFP-RML) because kecin cannot be accessed and cleavage does not occur. As shown in FIG. 11, when RML-3G#4 is produced using a TFP19 secretion signal, a fusion protein in which TFP19 is not truncated is also produced, and the fusion protein can negatively affect enzyme activity. Minimizing what is expressed can help in the production of highly active proteins.

따라서, TFP19와 RML-3G#4 간의 절단을 촉진하기 위해서 케신 인식 서열 주위의 아미노산 서열을 케신이 접근하기 용이한 구조로 변경하였다. 구체적으로, Arg-lys 프로펩타이드 절단 예측 서버(Arg-lys propeptide cleavage prediction server)인 ProP 1.0(http://www.cbs.dtu.dk/services/ProP/)을 이용하여 케신 처리효율을 높여주는 것으로 확인된 SV(세린-발린) 아미노산 서열을 케신 인식부위인 KR 서열의 하단, 즉, RML 3G#4의 아미노산 서열(서열번호 57)에서 N-말단과 링커 내 케신(Kexin)의 인식부위인 Lys-Arg(KR) 서열의 하단 사이에 추가하였다. 아미노산 변이는 리파제 발현 벡터인 YGaST19-RML 3G#4를 주형으로 MJ706 프라이머(서열번호 59)와 GT50R 프라이머(서열번호 56)를 사용하여 도입하였으며 서열 확인 후 2805gal80 균주에 도입하여 발현을 유도하였다. 형질전환을 통해 얻은 SV-RML-3G#4을 3ml 배양 후 아세톤 침전으로 농축 후 endoH를 처리하여 SDS-PAGE로 분석한 결과 SV 도입으로 인해 TFP19가 제거된 온전한 RML-3G#4만이 발현되는 것을 확인하였다(도 11). SV-RML-3G#4 벡터 구축을 위해 사용한 프라이머, SV-RML-3G#4의 아미노산 및 뉴클레오타이드 서열을 하기 표 8 내지 9에 나타내었다.Therefore, in order to facilitate cleavage between TFP19 and RML-3G#4, the amino acid sequence around the kesin recognition sequence was changed to a structure that is easy to access by kecin. Specifically, using ProP 1.0 (http://www.cbs.dtu.dk/services/ProP/), an Arg-lys propeptide cleavage prediction server, improves kecin processing efficiency. The identified SV (serine-valine) amino acid sequence was used at the lower end of the KR sequence, which is the kesin recognition site, that is, the N-terminus at the amino acid sequence (SEQ ID NO: 57) of RML 3G#4, which is the recognition site of Kexin in the linker. It was added between the bottom of the Lys-Arg(KR) sequence. The amino acid mutation was introduced using YGaST19-RML 3G#4, a lipase expression vector, as a template, using MJ706 primer (SEQ ID NO: 59) and GT50R primer (SEQ ID NO: 56), and after sequence confirmation, it was introduced into 2805gal80 strain to induce expression. SV-RML-3G#4 obtained through transformation was cultured in 3 ml, concentrated with acetone precipitation, treated with endoH, and analyzed by SDS-PAGE. As a result, only intact RML-3G#4 from which TFP19 was removed due to SV introduction was expressed. Confirmed (Fig. 11). The primers used to construct the SV-RML-3G#4 vector, and the amino acid and nucleotide sequences of SV-RML-3G#4 are shown in Tables 8 to 9 below.

SV-RML-3G#4 벡터 구축을 위해 사용한 프라이머Primer used to construct SV-RML-3G#4 vector 프라이머primer 서열order 서열번호Sequence number MJ706MJ706 TAGATAAAAGATCTGTTGTGCCAATCAAGAGATAGATAAAAGATCTGTTGTGCCAATCAAGAGA 5959

SV-RML-3G#4의 아미노산, 뉴클레오타이드 서열 Amino acid and nucleotide sequence of SV-RML-3G#4 아미노산 서열Amino acid sequence 서열번호Sequence number SVVPIKRQSNSTVDSLPPLIPSRTSAPSSSPSTTDPEAPAMSRNGPLPSDVETNYGMALNATSYPDSVVQAMSIDGGIRAATSQEINELTYYTTLSANSYCRTVIPGATWDCIHCDATEDLKIIKTWSTLIYDTNAMVARGDSEKTIYIVFRGSSSIRNWIADLTFVPVSYPPVSGTKVHKGFLDSYGEVQDELVATVLDQFKQYPSYKVAVTGHSLGGATALLCALGLYQREEGLSSSNLFLYTQGQPRVGDPAFANYVVSTGIPYRRTVNERDIVPHLPPAAFGFLHAGEEYWITDNSPETVQVCTSDLETSDCSNSIVPFTSVLDHLSYFGINTGLCT SVVPIKRQSNSTVDSLPPLIPSRTSAPSSSPSTTDPEAPAMSRNGPLPSDVETNYGMALNATSYPDSVVQAMSIDGGIRAATSQEINELTYYTTLSANSYCRTVIPGATWDCIHCDATEDLKIIKTWSTLIYDTNAMVARGDSEKTIYIVFRGSSSIRNWIADLTFVPVSYPPVSGTKVHKGFLDSYGEVQDELVATVLDQFKQYPSYKVAVTGHSLGGATALLCALGLYQREEGLSSSNLFLYTQGQPRVGDPAFANYVVSTGIPYRRTVNERDIVPHLPPAAFGFLHAGEEYWITDNSPETVQVCTSDLETSDCSNSIVPFTSVLDHLSYFGINTGLCT 6060 뉴클레오타이드 서열Nucleotide sequence 서열번호Sequence number TCTGTTGTGCCAATCAAGAGACAATCAAACAGCACGGTGGATAGTCTGCCACCCCTCATCCCCTCTCGAACCTCGGCACCTTCATCATCACCAAGCACAACCGACCCTGAAGCTCCAGCCATGAGTCGCAATGGACCGCTGCCCTCGGATGTAGAGACTAATTATGGCATGGCTTTGAATGCTACTTCCTATCCGGATTCTGTGGTCCAAGCAATGAGCATTGATGGTGGTATCCGCGCTGCGACCTCGCAAGAAATCAATGAATTGACTTATTACACTACACTATCTGCCAACTCGTACTGCCGCACTGTCATTCCTGGAGCTACCTGGGACTGTATCCACTGTGATGCAACGGAGGATCTCAAGATTATCAAGACTTGGAGCACGCTCATCTATGATACAAATGCAATGGTTGCACGTGGTGACAGCGAAAAAACTATCTATATCGTTTTCCGAGGTTCGAGCTCTATCCGCAACTGGATTGCTGATCTCACCTTTGTGCCAGTTTCATATCCTCCGGTCAGTGGTACAAAAGTACACAAGGGATTCCTGGACAGTTACGGGGAAGTTCAAGACGAGCTTGTTGCTACTGTTCTTGATCAATTCAAGCAATATCCAAGCTACAAGGTTGCTGTTACAGGTCACTCACTCGGTGGTGCTACTGCGTTGCTTTGCGCCCTGGGTCTCTATCAACGAGAAGAAGGACTCTCATCCAGCAACTTGTTCCTTTACACTCAAGGTCAACCACGGGTAGGCGACCCTGCCTTTGCCAACTACGTTGTTAGCACCGGCATTCCTTACAGGCGCACGGTCAATGAACGAGATATCGTTCCTCATCTTCCACCTGCTGCTTTTGGTTTTCTCCACGCTGGCGAGGAGTATTGGATTACTGACAATAGCCCAGAGACTGTTCAGGTCTGCACAAGCGATCTGGAAACCTCTGATTGCTCTAACAGCATTGTTCCCTTCACAAGTGTTCTTGACCATCTCTCGTACTTTGGTATCAACACAGGCCTCTGTACTTCTGTTGTGCCAATCAAGAGACAATCAAACAGCACGGTGGATAGTCTGCCACCCCTCATCCCCTCTCGAACCTCGGCACCTTCATCATCACCAAGCACAACCGACCCTGAAGCTCCAGCCATGAGTCGCAATGGACCGCTGCCCTCGGATGTAGAGACTAATTATGGCATGGCTTTGAATGCTACTTCCTATCCGGATTCTGTGGTCCAAGCAATGAGCATTGATGGTGGTATCCGCGCTGCGACCTCGCAAGAAATCAATGAATTGACTTATTACACTACACTATCTGCCAACTCGTACTGCCGCACTGTCATTCCTGGAGCTACCTGGGACTGTATCCACTGTGATGCAACGGAGGATCTCAAGATTATCAAGACTTGGAGCACGCTCATCTATGATACAAATGCAATGGTTGCACGTGGTGACAGCGAAAAAACTATCTATATCGTTTTCCGAGGTTCGAGCTCTATCCGCAACTGGATTGCTGATCTCACCTTTGTGCCAGTTTCATATCCTCCGGTCAGTGGTACAAAAGTACACAAGGGATTCCTGGACAGTTACGGGGAAGTTCAAGACGAGCTTGTTGCTACTGTTCTTGATCAATTCAAGCAATATCCAAGCTACAAGGTTGCTGTTACAGGTCACTCACTCGGTGGTGCTACTGCGTTGCTTTGCGCCCTGGGTCTCTATCAACGAGAAGAAGGACTCTCATCCAGCAACTTGTTCCTTTACACTCAAGGTCAACCACGGGTAGGCGACCCTGCCTTTGCCAACTACGTTGTTAGCACCGGCATTCCTTACAGGCGCACGGTCAATGAACGAGATATCGTTCCTCATCTTCCACCTGCTGCTTTTGGTTTTCTCCACGCTGGCGAGGAGTATTGGATTACTGACAATAGCCCAGAGACTGTTCAGGTCTGCACAAGCGATCTGGAAACCTCTGATTGCTCTAACAGCATTGTTCCCTTCACAAGTGTTCTTGACCATCTCTCGTACTTTG GTATCAACACAGGCCTCTGTACT 6161

<실시예 6> 유가식 발효를 통한 SV-RML-3G#4 단백질 발현<Example 6> SV-RML-3G#4 protein expression through fed-batch fermentation

RML-3G#4와 SV 아미노산이 도입된 SV-RML-3G#4의 특이활성을 비교해 보기 위해 먼저 유가식 발효를 이용하여 각각의 단백질을 생산하였다. 유가식 발효는 25 ℃에서 48시간동안 진행되었으며 상기 실시예 3에 제시된 방법과 동일하게 수행되었다. 도 12에서 나타낸 것처럼 48시간 배양하는 동안 RML-3G#4와 SV-RML-3G#4는 약 146, 150 OD로 유사한 세포성장을 보였고, 시간별 발효배양액 10μl를 농축하지 않고 SDS-PAGE 분석한 결과 RML-3G#4는 TFP가 융합된 형태와 잘린 형태가 60:40 비율로 발현되었으나 SV-RML-3G#4는 95% 이상 TFP가 잘린 온전한 RML-3G#4로 발현되었음을 확인하였다. 배양 시간별 활성을 pNPP 어세이로 확인 후 특이 활성을 비교해 본 결과 RML-3G#4와 SV-RML-3G#4는 각각 11,319U/mg, 13,131U/mg로 나타나, SV-RML-3G#4가 SV가 도입되지 않은 RML-3G#4보다 16% 높은 활성을 보여 TFP가 제거된 형태의 단백질이 효소 활성 증가에 영향을 주었을 것으로 예상되었다. To compare the specific activities of RML-3G#4 and SV-RML-3G#4 into which SV amino acids were introduced, each protein was first produced by fed-batch fermentation. Fed-batch fermentation was carried out at 25° C. for 48 hours and was carried out in the same manner as in Example 3. As shown in FIG. 12, during the 48-hour culture, RML-3G#4 and SV-RML-3G#4 showed similar cell growth at about 146 and 150 OD, and the results of SDS-PAGE analysis without concentration of 10 μl of the fermentation broth by time It was confirmed that RML-3G#4 expressed intact RML-3G#4 with TFP fused and truncated at a ratio of 60:40, whereas SV-RML-3G#4 was expressed as intact RML-3G#4 with 95% or more TFP cut off. As a result of comparing the specific activity after confirming the activity of each culture time by pNPP assay, RML-3G#4 and SV-RML-3G#4 were respectively 11,319U/mg and 13,131U/mg, SV-RML-3G#4 Showed 16% higher activity than RML-3G#4 to which SV was not introduced, so it was expected that the TFP-removed protein had an effect on the increase in enzyme activity.

이상의 내용을 종합하면, 본 발명에서는 리조무코르 미에헤이 유래 리파제(RML)에 단백질 분비 융합인자(TFP)를 결합한 리파제 분비 발현 카세트를 제조하고, 리파제 분비 발현능 및 분비된 리파제(RML)의 활성이 우수한 단백질 분비융합인자(TFP)를 선별하였다. In summary, in the present invention, in the present invention, a lipase secretion expression cassette in which a protein secretion fusion factor (TFP) is bound to a lipase derived from Rizomucor Miehei (RML) is prepared, and the lipase secretion expression ability and the activity of secreted lipase (RML) This excellent protein secretion fusion factor (TFP) was selected.

또한, 상기 리파제 분비 발현 카세트를 방향성 진화 기술을 이용하여 개량하고, 서열번호 25로 이루어진 단백질 분비융합인자(TFP 19)의 아미노산 서열 중 109번째 아미노산, 서열번호 1로 이루어진 리파제(RML)의 아미노산 서열 중 52번째 아미노산, 및 190번째 아미노산이 각각 트레오닌(Thr), 아스파라긴(Asn), 및 아스파르트산(Asp)으로 치환된 변이주를 선별하였고, 상기 변이주로부터 분비 생산된 리파제는 야생형으로부터 분비 생산된 리파제에 비해 전이에스터 활성이 약 250%로 현저히 개선됨을 확인하였다.In addition, the lipase secretion expression cassette was improved using directional evolution technology, and the 109th amino acid of the amino acid sequence of the protein secretion fusion factor (TFP 19) consisting of SEQ ID NO: 25 and the amino acid sequence of lipase (RML) consisting of SEQ ID NO: 1 The 52nd amino acid and the 190th amino acid among the mutant strains in which threonine (Thr), asparagine (Asn), and aspartic acid (Asp) were respectively substituted were selected, and the lipase secreted from the mutant strain was selected for lipase secreted from the wild type. In comparison, it was confirmed that the transfer ester activity was significantly improved to about 250%.

또한, 상기 TFP와 RML을 연결하는 링커 서열을 변경하여 케신의 절단 효율을 증가시키기 위해 아미노 말단에 SV가 추가된 형태의 RML을 발현하였고 이러한 방법으로 발현된 TFP가 절단된 온전한 형태의 RML은 효소 활성이 116% 증가함을 확인하였다.In addition, in order to increase the cleavage efficiency of kecin by changing the linker sequence connecting the TFP and RML, RML in the form of SV added to the amino terminal was expressed, and the intact form of RML in which the TFP expressed by this method was cleaved is an enzyme. It was confirmed that the activity increased by 116%.

이상의 설명으로부터, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 이와 관련하여, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허 청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.From the above description, those skilled in the art to which the present invention pertains will understand that the present invention can be implemented in other specific forms without changing the technical spirit or essential features thereof. In this regard, it should be understood that the embodiments described above are illustrative in all respects and not limiting. The scope of the present invention should be construed that all changes or modifications derived from the meaning and scope of the claims to be described later rather than the above detailed description and equivalent concepts are included in the scope of the present invention.

<110> KOREA RESEARCH INSTITUTE OF BIOSCIENCE AND BIOTECHNOLOGY <120> Mutant lipases of Rhizomucor miehei having enhanced transesterification activity and a method of producing the lipase <130> KPA181117-KR-P1 <150> KR 2018-0132934 <151> 2018-11-01 <160> 61 <170> KoPatentIn 3.0 <210> 1 <211> 339 <212> PRT <213> Rhizomucor miehei <400> 1 Val Pro Ile Lys Arg Gln Ser Asn Ser Thr Val Asp Ser Leu Pro Pro 1 5 10 15 Leu Ile Pro Ser Arg Thr Ser Ala Pro Ser Ser Ser Pro Ser Thr Thr 20 25 30 Asp Pro Glu Ala Pro Ala Met Ser Arg Asn Gly Pro Leu Pro Ser Asp 35 40 45 Val Glu Thr Lys Tyr Gly Met Ala Leu Asn Ala Thr Ser Tyr Pro Asp 50 55 60 Ser Val Val Gln Ala Met Ser Ile Asp Gly Gly Ile Arg Ala Ala Thr 65 70 75 80 Ser Gln Glu Ile Asn Glu Leu Thr Tyr Tyr Thr Thr Leu Ser Ala Asn 85 90 95 Ser Tyr Cys Arg Thr Val Ile Pro Gly Ala Thr Trp Asp Cys Ile His 100 105 110 Cys Asp Ala Thr Glu Asp Leu Lys Ile Ile Lys Thr Trp Ser Thr Leu 115 120 125 Ile Tyr Asp Thr Asn Ala Met Val Ala Arg Gly Asp Ser Glu Lys Thr 130 135 140 Ile Tyr Ile Val Phe Arg Gly Ser Ser Ser Ile Arg Asn Trp Ile Ala 145 150 155 160 Asp Leu Thr Phe Val Pro Val Ser Tyr Pro Pro Val Ser Gly Thr Lys 165 170 175 Val His Lys Gly Phe Leu Asp Ser Tyr Gly Glu Val Gln Asn Glu Leu 180 185 190 Val Ala Thr Val Leu Asp Gln Phe Lys Gln Tyr Pro Ser Tyr Lys Val 195 200 205 Ala Val Thr Gly His Ser Leu Gly Gly Ala Thr Ala Leu Leu Cys Ala 210 215 220 Leu Gly Leu Tyr Gln Arg Glu Glu Gly Leu Ser Ser Ser Asn Leu Phe 225 230 235 240 Leu Tyr Thr Gln Gly Gln Pro Arg Val Gly Asp Pro Ala Phe Ala Asn 245 250 255 Tyr Val Val Ser Thr Gly Ile Pro Tyr Arg Arg Thr Val Asn Glu Arg 260 265 270 Asp Ile Val Pro His Leu Pro Pro Ala Ala Phe Gly Phe Leu His Ala 275 280 285 Gly Glu Glu Tyr Trp Ile Thr Asp Asn Ser Pro Glu Thr Val Gln Val 290 295 300 Cys Thr Ser Asp Leu Glu Thr Ser Asp Cys Ser Asn Ser Ile Val Pro 305 310 315 320 Phe Thr Ser Val Leu Asp His Leu Ser Tyr Phe Gly Ile Asn Thr Gly 325 330 335 Leu Cys Thr <210> 2 <211> 1020 <212> DNA <213> Rhizomucor miehei <400> 2 gtgccaatca agagacaatc aaacagcacg gtggatagtc tgccacccct catcccctct 60 cgaacctcgg caccttcatc atcaccaagc acaaccgacc ctgaagctcc agccatgagt 120 cgcaatggac cgctgccctc ggatgtagag actaaatatg gcatggcttt gaatgctact 180 tcctatccgg attctgtggt ccaagcaatg agcattgatg gtggtatccg cgctgcgacc 240 tcgcaagaaa tcaatgaatt gacttattac actacactat ctgccaactc gtactgccgc 300 actgtcattc ctggagctac ctgggactgt atccactgtg atgcaacgga ggatctcaag 360 attatcaaga cttggagcac gctcatctat gatacaaatg caatggttgc acgtggtgac 420 agcgaaaaaa ctatctatat cgttttccga ggttcgagct ctatccgcaa ctggattgct 480 gatctcacct ttgtgccagt ttcatatcct ccggtcagtg gtacaaaagt acacaaggga 540 ttcctggaca gttacgggga agttcaaaac gagcttgttg ctactgttct tgatcaattc 600 aagcaatatc caagctacaa ggttgctgtt acaggtcact cactcggtgg tgctactgcg 660 ttgctttgcg ccctgggtct ctatcaacga gaagaaggac tctcatccag caacttgttc 720 ctttacactc aaggtcaacc acgggtaggc gaccctgcct ttgccaacta cgttgttagc 780 accggcattc cttacaggcg cacggtcaat gaacgagata tcgttcctca tcttccacct 840 gctgcttttg gttttctcca cgctggcgag gagtattgga ttactgacaa tagcccagag 900 actgttcagg tctgcacaag cgatctggaa acctctgatt gctctaacag cattgttccc 960 ttcacaagtg ttcttgacca tctctcgtac tttggtatca acacaggcct ctgtacttaa 1020 1020 <210> 3 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> RML-TFP-F <400> 3 ctcgccttag ataaaagagt gccaatcaag agacaa 36 <210> 4 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> RML-TFP-R <400> 4 ttagtgatgg tgatggtgat gcttaagtac agaggcctg 39 <210> 5 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> LNK39 <400> 5 ggccgcctcg gcctctgctg gcctcgcctt agataaaaga 40 <210> 6 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> HisGT50R <400> 6 gtcattatta aatatatata tatatatatt gtcactccgt tcaagtcgac ttagtgatgg 60 tgatggtgat g 71 <210> 7 <211> 118 <212> PRT <213> Artificial Sequence <220> <223> TFP 1 <400> 7 Met Phe Asn Arg Phe Asn Lys Phe Gln Ala Ala Val Ala Leu Ala Leu 1 5 10 15 Leu Ser Arg Gly Ala Leu Gly Asp Ser Tyr Thr Asn Ser Thr Ser Ser 20 25 30 Ala Asp Leu Ser Ser Ile Thr Ser Val Ser Ser Ala Ser Ala Ser Ala 35 40 45 Thr Ala Ser Asp Ser Leu Ser Ser Ser Asp Gly Thr Val Tyr Leu Pro 50 55 60 Ser Thr Thr Ile Ser Gly Asp Leu Thr Val Thr Gly Lys Val Ile Ala 65 70 75 80 Thr Glu Ala Val Glu Val Ala Ala Gly Gly Lys Leu Thr Leu Leu Asp 85 90 95 Gly Glu Lys Tyr Val Phe Ser Ser Glu Ala Ala Ser Ala Ser Ala Gly 100 105 110 Leu Ala Leu Asp Lys Arg 115 <210> 8 <211> 130 <212> PRT <213> Artificial Sequence <220> <223> TFP 2 <400> 8 Met Thr Pro Tyr Ala Val Ala Ile Thr Val Ala Leu Leu Ile Val Thr 1 5 10 15 Val Ser Ala Leu Gln Val Asn Asn Ser Cys Val Ala Phe Pro Pro Ser 20 25 30 Asn Leu Arg Gly Lys Asn Gly Asp Gly Thr Asn Glu Gln Tyr Ala Thr 35 40 45 Ala Leu Leu Ser Ile Pro Trp Asn Gly Pro Pro Glu Ser Ser Arg Asp 50 55 60 Ile Asn Leu Ile Glu Leu Glu Pro Gln Val Ala Leu Tyr Leu Leu Glu 65 70 75 80 Asn Tyr Ile Asn His Tyr Tyr Asn Thr Thr Arg Asp Asn Lys Cys Pro 85 90 95 Asn Asn His Tyr Leu Met Gly Gly Gln Leu Gly Ser Ser Ser Asp Asn 100 105 110 Arg Ser Leu Asn Glu Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp 115 120 125 Lys Arg 130 <210> 9 <211> 117 <212> PRT <213> Artificial Sequence <220> <223> TFP 3 <400> 9 Met Gln Phe Lys Asn Val Ala Leu Ala Ala Ser Val Ala Ala Leu Ser 1 5 10 15 Ala Thr Ala Ser Ala Glu Gly Tyr Thr Pro Gly Glu Pro Trp Ser Thr 20 25 30 Leu Thr Pro Thr Gly Ser Ile Ser Cys Gly Ala Ala Glu Tyr Thr Thr 35 40 45 Thr Phe Gly Ile Ala Val Gln Ala Ile Thr Ser Ser Lys Ala Lys Arg 50 55 60 Asp Val Ile Ser Gln Ile Gly Asp Gly Gln Val Gln Ala Thr Ser Ala 65 70 75 80 Ala Thr Ala Gln Ala Thr Asp Ser Gln Ala Gln Ala Thr Thr Thr Ala 85 90 95 Thr Pro Thr Ser Ser Glu Lys Met Ala Ala Ser Ala Ser Ala Gly Leu 100 105 110 Ala Leu Asp Lys Arg 115 <210> 10 <211> 62 <212> PRT <213> Artificial Sequence <220> <223> TFP 4 <400> 10 Met Arg Phe Ala Glu Phe Leu Val Val Phe Ala Thr Leu Gly Gly Gly 1 5 10 15 Met Ala Ala Pro Val Glu Ser Leu Ala Gly Thr Gln Arg Tyr Leu Val 20 25 30 Gln Met Lys Glu Arg Phe Thr Thr Glu Lys Leu Cys Ala Leu Asp Asp 35 40 45 Lys Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 50 55 60 <210> 11 <211> 97 <212> PRT <213> Artificial Sequence <220> <223> TFP 5 <400> 11 Met Phe Asn Arg Phe Asn Lys Phe Gln Ala Ala Val Ala Leu Ala Leu 1 5 10 15 Leu Ser Arg Gly Ala Leu Gly Ala Pro Val Asn Thr Thr Thr Glu Asp 20 25 30 Glu Thr Ala Leu Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Asp Leu 35 40 45 Glu Gly Asp Phe Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn 50 55 60 Asn Gly Leu Leu Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys 65 70 75 80 Glu Glu Gly Val Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp Lys 85 90 95 Arg <210> 12 <211> 93 <212> PRT <213> Artificial Sequence <220> <223> TFP 6 <400> 12 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Asp Leu Glu Gly Asp Phe 35 40 45 Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu 50 55 60 Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 85 90 <210> 13 <211> 226 <212> PRT <213> Artificial Sequence <220> <223> TFP 7 <400> 13 Met Val Phe Gly Gln Leu Tyr Ala Leu Phe Ile Phe Thr Leu Ser Cys 1 5 10 15 Cys Ile Ser Lys Thr Val Gln Ala Asp Ser Ser Lys Glu Ser Ser Ser 20 25 30 Phe Ile Ser Phe Asp Lys Glu Ser Asn Trp Asp Thr Ile Ser Thr Ile 35 40 45 Ser Ser Thr Ala Asp Val Ile Ser Ser Val Asp Ser Ala Ile Ala Val 50 55 60 Phe Glu Phe Asp Asn Phe Ser Leu Leu Asp Ser Leu Met Ile Asp Glu 65 70 75 80 Glu Tyr Pro Phe Phe Asn Arg Phe Phe Ala Asn Asp Val Ser Leu Thr 85 90 95 Val His Asp Asp Ser Pro Leu Asn Ile Ser Gln Ser Leu Ser Pro Ile 100 105 110 Met Glu Gln Phe Thr Val Asp Glu Leu Pro Glu Ser Ala Ser Asp Leu 115 120 125 Leu Tyr Glu Tyr Ser Leu Asp Asp Lys Ser Ile Val Leu Phe Lys Phe 130 135 140 Thr Ser Asp Ala Tyr Asp Leu Lys Lys Leu Asp Glu Phe Ile Asp Ser 145 150 155 160 Cys Leu Ser Phe Leu Glu Asp Lys Ser Gly Asp Asn Leu Thr Val Val 165 170 175 Ile Asn Ser Leu Gly Trp Ala Phe Glu Asp Glu Asp Gly Asp Asp Glu 180 185 190 Tyr Ala Thr Glu Glu Thr Leu Ser His His Asp Asn Asn Lys Gly Lys 195 200 205 Glu Gly Asp Asp Leu Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp 210 215 220 Lys Arg 225 <210> 14 <211> 64 <212> PRT <213> Artificial Sequence <220> <223> TFP 8 <400> 14 Met Leu Gln Ser Val Val Phe Phe Ala Leu Leu Thr Phe Ala Ser Ser 1 5 10 15 Val Ser Ala Ile Tyr Ser Asn Asn Thr Val Ser Thr Thr Thr Thr Leu 20 25 30 Ala Pro Ser Tyr Ser Leu Val Pro Gln Glu Thr Thr Ile Ser Tyr Ala 35 40 45 Asp Asp Leu Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 50 55 60 <210> 15 <211> 138 <212> PRT <213> Artificial Sequence <220> <223> TFP 9 <400> 15 Met Lys Phe Ser Thr Ala Val Thr Thr Leu Ile Ser Ser Gly Ala Ile 1 5 10 15 Val Ser Ala Leu Pro His Val Asp Val His Gln Glu Asp Ala His Gln 20 25 30 His Lys Arg Ala Val Ala Tyr Lys Tyr Val Tyr Glu Thr Val Val Val 35 40 45 Asp Ser Asp Gly His Thr Val Thr Pro Ala Ala Ser Glu Val Ala Thr 50 55 60 Ala Ala Thr Ser Ala Ile Ile Thr Thr Ser Val Leu Ala Pro Thr Ser 65 70 75 80 Ser Ala Ala Ala Ala Asp Ser Ser Ala Ser Ile Ala Val Ser Ser Ala 85 90 95 Ala Leu Ala Lys Asn Glu Lys Ile Ser Asp Ala Ala Ala Ser Ala Thr 100 105 110 Ala Ser Thr Ser Gln Gly Ala Ser Ser Ser Ser Tyr Leu Ala Ala Ser 115 120 125 Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 130 135 <210> 16 <211> 199 <212> PRT <213> Artificial Sequence <220> <223> TFP 10 <400> 16 Met Asn Trp Leu Phe Leu Val Ser Leu Val Phe Phe Cys Gly Val Ser 1 5 10 15 Thr His Pro Ala Leu Ala Met Ser Ser Asn Arg Leu Leu Lys Leu Ala 20 25 30 Asn Lys Ser Pro Lys Lys Ile Ile Pro Leu Lys Asp Ser Ser Phe Glu 35 40 45 Asn Ile Leu Ala Pro Pro His Glu Asn Ala Tyr Ile Val Ala Leu Phe 50 55 60 Thr Ala Thr Ala Pro Glu Ile Gly Cys Ser Leu Cys Leu Glu Leu Glu 65 70 75 80 Ser Glu Tyr Asp Thr Ile Val Ala Ser Trp Phe Asp Asp His Pro Asp 85 90 95 Ala Lys Ser Ser Asn Ser Asp Thr Ser Ile Phe Phe Thr Lys Val Asn 100 105 110 Leu Glu Asp Pro Ser Lys Thr Ile Pro Lys Ala Phe Gln Phe Phe Gln 115 120 125 Leu Asn Asn Val Pro Arg Leu Phe Ile Phe Lys Leu Asn Ser Pro Ser 130 135 140 Ile Leu Asp His Ser Val Ile Ser Ile Ser Thr Asp Thr Gly Ser Glu 145 150 155 160 Arg Met Lys Gln Ile Ile Gln Ala Ile Lys Gln Phe Ser Gln Val Asn 165 170 175 Asp Phe Ser Leu His Leu Pro Val Gly Leu Ala Ala Ser Ala Ser Ala 180 185 190 Gly Leu Ala Leu Asp Lys Arg 195 <210> 17 <211> 77 <212> PRT <213> Artificial Sequence <220> <223> TFP 11 <400> 17 Met Lys Phe Ser Ser Val Thr Ala Ile Thr Leu Ala Thr Val Ala Thr 1 5 10 15 Val Ala Thr Ala Lys Lys Gly Glu His Asp Phe Thr Thr Thr Leu Thr 20 25 30 Leu Ser Ser Asp Gly Ser Leu Thr Thr Thr Thr Ser Thr His Thr Thr 35 40 45 His Lys Tyr Gly Lys Phe Asn Lys Thr Ser Lys Ser Lys Thr Pro Leu 50 55 60 Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 65 70 75 <210> 18 <211> 94 <212> PRT <213> Artificial Sequence <220> <223> TFP 12 <400> 18 Met Ala Ser Phe Ala Thr Lys Phe Val Ile Ala Cys Phe Leu Phe Phe 1 5 10 15 Ser Ala Ser Ala His Asn Val Leu Leu Pro Ala Tyr Gly Arg Arg Cys 20 25 30 Phe Phe Glu Asp Leu Ser Lys Gly Asp Glu Leu Ser Ile Ser Phe Gln 35 40 45 Phe Gly Asp Arg Asn Pro Gln Ser Ser Ser Gln Leu Thr Gly Asp Phe 50 55 60 Ile Ile Tyr Gly Pro Glu Arg His Glu Val Leu Lys Thr Val Arg Glu 65 70 75 80 Leu Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 85 90 <210> 19 <211> 174 <212> PRT <213> Artificial Sequence <220> <223> TFP 13 <400> 19 Met Gln Tyr Lys Lys Thr Leu Val Ala Ser Ala Leu Ala Ala Thr Thr 1 5 10 15 Leu Ala Ala Tyr Ala Pro Ser Glu Pro Trp Ser Thr Leu Thr Pro Thr 20 25 30 Ala Thr Tyr Ser Gly Gly Val Thr Asp Tyr Ala Ser Thr Phe Gly Ile 35 40 45 Ala Val Gln Pro Ile Ser Thr Thr Ser Ser Ala Ser Ser Ala Ala Thr 50 55 60 Thr Ala Ser Ser Lys Ala Lys Arg Ala Ala Ser Gln Ile Gly Asp Gly 65 70 75 80 Gln Val Gln Ala Ala Thr Thr Thr Ala Ser Val Ser Thr Lys Ser Thr 85 90 95 Ala Ala Ala Val Ser Gln Ile Gly Asp Gly Gln Ile Gln Ala Thr Thr 100 105 110 Lys Thr Thr Ala Ala Ala Val Ser Gln Ile Gly Asp Gly Gln Ile Gln 115 120 125 Ala Thr Thr Lys Thr Thr Ser Ala Lys Thr Thr Ala Ala Ala Val Ser 130 135 140 Gln Ile Ser Asp Gly Gln Ile Gln Ala Thr Thr Thr Thr Leu Ala Pro 145 150 155 160 Leu Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 165 170 <210> 20 <211> 68 <212> PRT <213> Artificial Sequence <220> <223> TFP 14 <400> 20 Met Gln Phe Lys Asn Ala Leu Thr Ala Thr Ala Ile Leu Ser Ala Ser 1 5 10 15 Ala Leu Ala Ala Asn Ser Thr Thr Ser Ile Pro Ser Ser Cys Ser Ile 20 25 30 Gly Thr Ser Ala Thr Ala Thr Ala Gln Ala Thr Asp Ser Gln Ala Gln 35 40 45 Ala Thr Thr Thr Ala Pro Leu Ala Ala Ser Ala Ser Ala Gly Leu Ala 50 55 60 Leu Asp Lys Arg 65 <210> 21 <211> 157 <212> PRT <213> Artificial Sequence <220> <223> TFP 15 <400> 21 Met Val Ser Lys Thr Trp Ile Cys Gly Phe Ile Ser Ile Ile Thr Val 1 5 10 15 Val Gln Ala Leu Ser Cys Glu Lys His Asp Val Leu Lys Lys Tyr Gln 20 25 30 Val Gly Lys Phe Ser Ser Leu Thr Ser Thr Glu Arg Asp Thr Pro Pro 35 40 45 Ser Thr Thr Ile Glu Lys Trp Trp Ile Asn Val Cys Glu Glu His Asn 50 55 60 Val Glu Pro Pro Glu Glu Cys Lys Lys Asn Asp Met Leu Cys Gly Leu 65 70 75 80 Thr Asp Val Ile Leu Pro Gly Lys Asp Ala Ile Thr Thr Gln Ile Ile 85 90 95 Asp Phe Asp Lys Asn Ile Gly Phe Asn Val Glu Glu Thr Glu Ser Ala 100 105 110 Leu Thr Leu Thr Leu Asn Gly Ala Thr Trp Gly Ala Asn Ser Phe Asp 115 120 125 Ala Lys Leu Glu Phe Gln Cys Asn Asp Asn Met Lys Gln Asp Glu Leu 130 135 140 Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 145 150 155 <210> 22 <211> 98 <212> PRT <213> Artificial Sequence <220> <223> TFP 16 <400> 22 Met Lys Leu Ser Ala Leu Leu Ala Leu Ser Ala Ser Thr Ala Val Leu 1 5 10 15 Ala Ala Pro Ala Val His His Ser Asp Asn His His His Asn Asp Lys 20 25 30 Arg Ala Val Val Thr Val Thr Gln Tyr Val Asn Ala Asp Gly Ala Val 35 40 45 Val Ile Pro Ala Ala Thr Thr Ala Thr Ser Ala Ala Ala Asp Gly Lys 50 55 60 Val Glu Ser Val Ala Ala Ala Thr Thr Thr Leu Ser Ser Thr Ala Ala 65 70 75 80 Ala Ala Thr Thr Leu Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp 85 90 95 Lys Arg <210> 23 <211> 195 <212> PRT <213> Artificial Sequence <220> <223> TFP 17 <400> 23 Met Lys Leu Ser Thr Val Leu Leu Ser Ala Gly Leu Ala Ser Thr Thr 1 5 10 15 Leu Ala Gln Phe Ser Asn Ser Thr Ser Ala Ser Ser Thr Asp Val Thr 20 25 30 Ser Ser Ser Ser Ile Ser Thr Ser Ser Gly Ser Val Thr Ile Thr Ser 35 40 45 Ser Glu Ala Pro Glu Ser Asp Asn Gly Thr Ser Thr Ala Ala Pro Thr 50 55 60 Glu Thr Ser Thr Glu Ala Pro Thr Thr Ala Ile Pro Thr Asn Gly Thr 65 70 75 80 Ser Thr Glu Ala Pro Thr Thr Ala Ile Pro Thr Asn Gly Thr Ser Thr 85 90 95 Glu Ala Pro Thr Asp Thr Thr Thr Glu Ala Pro Thr Thr Ala Leu Pro 100 105 110 Thr Asn Gly Thr Ser Thr Glu Ala Pro Thr Asp Thr Thr Thr Glu Ala 115 120 125 Pro Thr Thr Gly Leu Pro Thr Asn Gly Thr Thr Ser Ala Phe Pro Pro 130 135 140 Thr Thr Ser Leu Pro Pro Ser Asn Thr Thr Thr Thr Pro Pro Tyr Asn 145 150 155 160 Pro Ser Thr Asp Tyr Thr Thr Asp Tyr Thr Val Val Thr Glu Tyr Thr 165 170 175 Thr Tyr Cys Pro Glu Arg Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu 180 185 190 Asp Lys Arg 195 <210> 24 <211> 105 <212> PRT <213> Artificial Sequence <220> <223> TFP 18 <400> 24 Met Arg Phe Ser Thr Thr Leu Ala Thr Ala Ala Thr Ala Leu Phe Phe 1 5 10 15 Thr Ala Ser Gln Val Ser Ala Ile Gly Glu Leu Ala Phe Asn Leu Gly 20 25 30 Val Lys Asn Asn Asp Gly Thr Cys Lys Ser Thr Ser Asp Tyr Glu Thr 35 40 45 Glu Leu Gln Ala Leu Lys Ser Tyr Thr Ser Thr Val Lys Val Tyr Ala 50 55 60 Ala Ser Asp Cys Asn Thr Leu Gln Asn Leu Gly Pro Ala Ala Glu Ala 65 70 75 80 Glu Gly Phe Thr Ile Phe Val Gly Val Trp Pro Leu Ala Ala Ser Ala 85 90 95 Ser Ala Gly Leu Ala Leu Asp Lys Arg 100 105 <210> 25 <211> 124 <212> PRT <213> Artificial Sequence <220> <223> TFP 19 <400> 25 Met Arg Leu Ser Asn Leu Ile Ala Ser Ala Ser Leu Leu Ser Ala Ala 1 5 10 15 Thr Leu Ala Ala Pro Ala Asn His Glu His Lys Asp Lys Arg Ala Val 20 25 30 Val Thr Thr Thr Val Gln Lys Gln Thr Thr Ile Ile Val Asn Gly Ala 35 40 45 Ala Ser Thr Pro Val Ala Ala Leu Glu Glu Asn Ala Val Val Asn Ser 50 55 60 Ala Pro Ala Ala Ala Thr Ser Thr Thr Ser Ser Ala Ala Ser Val Ala 65 70 75 80 Thr Ala Ala Ser Ser Ser Glu Asn Asn Ser Gln Val Ser Ala Ala Ala 85 90 95 Ser Pro Ala Ser Ser Ser Ala Ala Thr Ser Thr Gln Ser Ser Leu Ala 100 105 110 Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 115 120 <210> 26 <211> 138 <212> PRT <213> Artificial Sequence <220> <223> TFP 20 <400> 26 Met Gln Phe Ser Thr Val Ala Ser Ile Ala Ala Val Ala Ala Val Ala 1 5 10 15 Ser Ala Ala Ala Asn Val Thr Thr Ala Thr Val Ser Gln Glu Ser Thr 20 25 30 Thr Leu Val Thr Ile Thr Ser Cys Glu Asp His Val Cys Ser Glu Thr 35 40 45 Val Ser Pro Ala Leu Val Ser Thr Ala Thr Val Thr Val Asp Asp Val 50 55 60 Ile Thr Gln Tyr Thr Thr Trp Cys Pro Leu Thr Thr Glu Ala Pro Lys 65 70 75 80 Asn Gly Thr Ser Thr Ala Ala Pro Val Thr Ser Thr Glu Ala Pro Lys 85 90 95 Asn Thr Thr Ser Ala Ala Pro Thr His Ser Val Thr Ser Tyr Thr Gly 100 105 110 Ala Ala Ala Lys Ala Leu Pro Ala Ala Gly Ala Leu Leu Ala Ala Ser 115 120 125 Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 130 135 <210> 27 <211> 176 <212> PRT <213> Artificial Sequence <220> <223> TFP 21 <400> 27 Met Lys Phe Ser Ser Ala Leu Val Leu Ser Ala Val Ala Ala Thr Ala 1 5 10 15 Leu Ala Glu Ser Ile Thr Thr Thr Ile Thr Ala Thr Lys Asn Gly His 20 25 30 Val Tyr Thr Lys Thr Val Thr Gln Asp Ala Thr Phe Val Trp Gly Gly 35 40 45 Glu Asp Ser Tyr Ala Ser Ser Thr Ser Ala Ala Glu Ser Ser Ala Ala 50 55 60 Glu Thr Ser Ala Ala Glu Thr Ser Ala Ala Ala Thr Thr Ser Ala Ala 65 70 75 80 Ala Thr Thr Ser Ala Ala Glu Thr Ser Ser Ala Ala Glu Thr Ser Ser 85 90 95 Ala Asp Glu Gly Ser Gly Ser Ser Ile Thr Thr Thr Ile Thr Ala Thr 100 105 110 Lys Asn Gly His Val Tyr Thr Lys Thr Val Thr Gln Asp Ala Thr Phe 115 120 125 Val Trp Thr Gly Glu Gly Ser Ser Asn Thr Trp Ser Pro Ser Ser Thr 130 135 140 Ser Thr Ser Ser Glu Ala Ala Thr Ser Ser Ala Ser Thr Thr Ala Thr 145 150 155 160 Thr Leu Leu Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 165 170 175 <210> 28 <211> 138 <212> PRT <213> Artificial Sequence <220> <223> TFP 22 <400> 28 Met Lys Phe Gln Val Val Leu Ser Ala Leu Leu Ala Cys Ser Ser Ala 1 5 10 15 Val Val Ala Ser Pro Ile Glu Asn Leu Phe Lys Tyr Arg Ala Val Lys 20 25 30 Ala Ser His Ser Lys Asn Ile Asn Ser Thr Leu Pro Ala Trp Asn Gly 35 40 45 Ser Asn Ser Ser Asn Val Thr Tyr Ala Asn Gly Thr Asn Ser Thr Thr 50 55 60 Asn Thr Thr Thr Ala Glu Ser Ser Gln Leu Gln Ile Ile Val Thr Gly 65 70 75 80 Gly Gln Val Pro Ile Thr Asn Ser Ser Leu Thr His Thr Asn Tyr Thr 85 90 95 Arg Leu Phe Asn Ser Ser Ser Ala Leu Asn Ile Thr Glu Leu Tyr Asn 100 105 110 Val Ala Arg Val Val Asn Glu Thr Ile Gln Asp Asn Leu Ala Ala Ser 115 120 125 Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 130 135 <210> 29 <211> 115 <212> PRT <213> Artificial Sequence <220> <223> TFP 23 <400> 29 Met Arg Ala Ile Thr Leu Leu Ser Ser Val Val Ser Leu Ala Leu Leu 1 5 10 15 Ser Lys Glu Val Leu Ala Thr Pro Pro Ala Cys Leu Leu Ala Cys Val 20 25 30 Ala Gln Val Gly Lys Ser Ser Ser Thr Cys Asp Ser Leu Asn Gln Val 35 40 45 Thr Cys Tyr Cys Glu His Glu Asn Ser Ala Val Lys Lys Cys Leu Asp 50 55 60 Ser Ile Cys Pro Asn Asn Asp Ala Asp Ala Ala Tyr Ser Ala Phe Lys 65 70 75 80 Ser Ser Cys Ser Glu Gln Asn Ala Ser Leu Gly Asp Ser Ser Gly Ser 85 90 95 Ala Ser Ser Ser Val Leu Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu 100 105 110 Asp Lys Arg 115 <210> 30 <211> 170 <212> PRT <213> Artificial Sequence <220> <223> TFP 24 <400> 30 Met Lys Leu Ser Thr Val Leu Leu Ser Ala Gly Leu Ala Ser Thr Thr 1 5 10 15 Leu Ala Gln Phe Ser Asn Ser Thr Ser Ala Ser Ser Thr Asp Val Thr 20 25 30 Ser Ser Ser Ser Ile Ser Thr Ser Ser Gly Ser Val Thr Ile Thr Ser 35 40 45 Ser Glu Ala Pro Glu Ser Asp Asn Gly Thr Ser Thr Ala Ala Pro Thr 50 55 60 Glu Thr Ser Thr Glu Ala Pro Thr Thr Ala Ile Pro Thr Asn Gly Thr 65 70 75 80 Ser Thr Glu Ala Pro Thr Thr Ala Ile Pro Thr Asn Gly Thr Ser Thr 85 90 95 Glu Ala Pro Thr Asp Thr Thr Thr Glu Ala Pro Thr Thr Ala Leu Pro 100 105 110 Thr Asn Gly Thr Ser Thr Glu Ala Pro Thr Asp Thr Thr Thr Glu Ala 115 120 125 Pro Thr Thr Gly Leu Pro Thr Asn Gly Thr Thr Ser Ala Phe Pro Pro 130 135 140 Thr Thr Ser Leu Pro Pro Ser Asn Thr Thr Thr Thr Leu Ala Ala Ser 145 150 155 160 Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 165 170 <210> 31 <211> 354 <212> DNA <213> Artificial Sequence <220> <223> TFP 1 <400> 31 atgttcaatc gttttaacaa attccaagct gctgtcgctt tggccctact ctctcgcggc 60 gctctcggtg actcttacac caatagcacc tcctccgcag acttgagttc tatcacttcc 120 gtctcgtcag ctagtgcaag tgccaccgct tccgactcac tttcttccag tgacggtacc 180 gtttatttgc catccacaac aattagcggt gatctcacag ttactggtaa agtaattgca 240 accgaggccg tggaagtcgc tgccggtggt aagttgactt tacttgacgg tgaaaaatac 300 gtcttctcat ctgaggccgc ctcggcctct gctggcctcg ccttagataa aaga 354 <210> 32 <211> 390 <212> DNA <213> Artificial Sequence <220> <223> TFP 2 <400> 32 atgacgccct atgcagtagc aattaccgtg gccttactaa ttgtaacagt gagcgcactc 60 caggtcaaca attcatgtgt cgcttttccg ccatcaaatc tcaggggcaa gaatggagac 120 ggtactaatg aacagtatgc aactgcacta ctttctattc cctggaatgg gcctcctgag 180 tcatcgaggg atattaatct tatcgaactc gaaccgcaag ttgcactcta tttgctcgaa 240 aattatatta accattacta caacaccaca agagacaata agtgccctaa taaccactac 300 ctaatgggag ggcagttggg tagctcatcg gataatagga gtttgaacga ggccgcctcg 360 gcctctgctg gcctcgcctt agataaaaga 390 <210> 33 <211> 351 <212> DNA <213> Artificial Sequence <220> <223> TFP 3 <400> 33 atgcaattca aaaacgtcgc cctagctgcc tccgttgctg ctctatccgc cactgcttct 60 gctgaaggtt acactccagg tgaaccatgg tccaccttaa ccccaaccgg ctccatctct 120 tgtggtgcag ccgaatacac taccaccttt ggtattgctg ttcaagctat tacctcttca 180 aaagctaaga gagacgttat ctctcaaatt ggtgacggtc aagtccaagc cacttctgct 240 gctactgctc aagccaccga tagtcaagcc caagctacta ctaccgctac cccaaccagc 300 tccgaaaaga tggccgcctc ggcctctgct ggcctcgcct tagataaaag a 351 <210> 34 <211> 186 <212> DNA <213> Artificial Sequence <220> <223> TFP 4 <400> 34 atgagatttg cagaattctt ggtggtattt gccacgttag gcggggggat ggctgcaccg 60 gttgagtctc tggccgggac ccaacggtat ctggtgcaaa tgaaggagcg gttcaccaca 120 gagaagctgt gtgctttgga cgacaaggcc gcctcggcct ctgctggcct cgccttagat 180 aaaaga 186 <210> 35 <211> 291 <212> DNA <213> Artificial Sequence <220> <223> TFP 5 <400> 35 atgttcaatc gttttaacaa attccaagct gctgtcgctt tggccctact ctctcgcggc 60 gctctcggtg ctccagtcaa cactacaaca gaagatgaaa cggcactaat tccggctgaa 120 gctgtcatcg gttacttaga tttagaaggg gatttcgatg ttgctgtttt gccattttcc 180 aacagcacaa ataacgggtt attgtttata aatactacta ttgccagcat tgctgctaaa 240 gaagaagggg tggccgcctc ggcctctgct ggcctcgcct tagataaaag a 291 <210> 36 <211> 279 <212> DNA <213> Artificial Sequence <220> <223> TFP 6 <400> 36 atgagatttc cttcaatttt tactgcagtt ttattcgcag catcctccgc attagctgct 60 ccagtcaaca ctacaacaga agatgaaacg gcacaaattc cggctgaagc tgtcatcggt 120 tacttagatt tagaagggga tttcgatgtt gctgttttgc cattttccaa cagcacaaat 180 aacgggttat tgtttataaa tactactatt gccagcattg ctgctaaaga agaaggggtg 240 gccgcctcgg cctctgctgg cctcgcctta gataaaaga 279 <210> 37 <211> 678 <212> DNA <213> Artificial Sequence <220> <223> TFP 7 <400> 37 atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60 actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120 aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180 gctatcgctg tttttgaatt tgacaatttc tcattattgg acagcttgat gattgacgaa 240 gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300 tcgcctttga acatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360 ttacctgaaa gtgcctctga cttactatat gaatactcct tagatgataa aagcatcgtt 420 ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480 tgcttatcgt ttttggaaga taaatctggc gacaatttga ctgtggttat taactctctt 540 ggttgggctt ttgaagatga agatggtgac gatgaatatg caacagaaga gactttgagc 600 catcatgata acaacaaggg taaagaaggc gacgatctgg ccgcctcggc ctctgctggc 660 ctcgccttag ataaaaga 678 <210> 38 <211> 192 <212> DNA <213> Artificial Sequence <220> <223> TFP 8 <400> 38 atgcttcaat ccgttgtctt tttcgctctt ttaaccttcg caagttctgt gtcagcgatt 60 tattcaaaca atactgtttc tacaactacc actttagcgc ccagctactc cttggtgccc 120 caagagacta ccatatcgta cgccgacgac ctggccgcct cggcctctgc tggcctcgcc 180 ttagataaaa ga 192 <210> 39 <211> 414 <212> DNA <213> Artificial Sequence <220> <223> TFP 9 <400> 39 atgaaattct caactgccgt tactacgttg attagttctg gtgccatcgt gtctgcttta 60 ccacacgtgg atgttcacca agaagatgcc caccaacata agagggccgt tgcgtacaaa 120 tacgtttacg aaactgttgt tgtcgattct gatggccaca ctgtaactcc tgctgcttca 180 gaagtcgcta ctgctgctac ctctgctatc attacaacat ctgtgttggc tccaacctcc 240 tccgcagccg ctgcggatag ctccgcttcc attgctgttt catctgctgc cttagccaag 300 aatgagaaaa tctctgatgc cgctgcatct gccactgcct caacatctca aggggcatcc 360 tcctcatcct acctggccgc ctcggcctct gctggcctcg ccttagataa aaga 414 <210> 40 <211> 597 <212> DNA <213> Artificial Sequence <220> <223> TFP 10 <400> 40 atgaattggc tgtttttggt ctcgctggtt ttcttctgcg gcgtgtcaac ccatcctgcc 60 ctggcaatgt ccagcaacag actactaaag ctggctaata aatctcccaa gaaaattata 120 cctctgaagg actcaagttt tgaaaacatc ttggcaccac ctcacgaaaa tgcctatata 180 gttgctctgt ttactgccac agcgcccgaa attggctgtt ctctgtgtct cgagctagaa 240 tccgaatacg acaccatagt ggcctcctgg tttgatgatc atccggatgc aaaatcgtcc 300 aattccgata catctatttt cttcacaaag gtcaatttgg aggacccttc taagaccatt 360 cctaaagcgt tccagttttt ccaactaaac aatgttccta gattgttcat cttcaaacta 420 aactctccct ctattctgga ccacagcgtg atcagtattt ccactgatac tggctcagaa 480 agaatgaagc aaatcataca agccattaag cagttctcgc aagtaaacga cttctcttta 540 cacttacctg tgggtctggc cgcctcggcc tctgctggcc tcgccttaga taaaaga 597 <210> 41 <211> 231 <212> DNA <213> Artificial Sequence <220> <223> TFP 11 <400> 41 atgaagttct cttctgttac tgctattact ctagccaccg ttgccaccgt tgccactgct 60 aagaagggtg aacatgattt cactaccact ttaactttgt catcggacgg tagtttaact 120 actaccacct ctactcatac cactcacaag tatggtaagt tcaacaagac ttccaagtcc 180 aagacccccc tggccgcctc ggcctctgct ggcctcgcct tagataaaag a 231 <210> 42 <211> 282 <212> DNA <213> Artificial Sequence <220> <223> TFP 12 <400> 42 atggcctcat ttgctactaa gtttgtcatt gcttgcttcc tgttcttctc ggcgtccgcc 60 cataatgtcc ttcttccagc ttatggccgt agatgcttct tcgaagactt gagtaagggt 120 gacgagctct ccatttcgtt ccagttcggt gatagaaacc ctcaatccag tagccagctg 180 actggtgact ttatcatcta cgggccggaa agacatgaag ttttgaaaac ggttagggaa 240 ctggccgcct cggcctctgc tggcctcgcc ttagataaaa ga 282 <210> 43 <211> 522 <212> DNA <213> Artificial Sequence <220> <223> TFP 13 <400> 43 atgcaataca aaaagacttt ggttgcctct gctttggccg ctactacatt ggccgcctat 60 gctccatctg agccttggtc cactttgact ccaacagcca cttacagcgg tggtgttacc 120 gactacgctt ccaccttcgg tattgccgtt caaccaatct ccactacatc cagcgcatca 180 tctgcagcca ccacagcctc atctaaggcc aagagagctg cttcccaaat tggtgatggt 240 caagtccaag ctgctaccac tactgcttct gtctctacca agagtaccgc tgccgccgtt 300 tctcagatcg gtgatggtca aatccaagct actaccaaga ctaccgctgc tgctgtctct 360 caaattggtg atggtcaaat tcaagctacc accaagacta cctctgctaa gactaccgcc 420 gctgccgttt ctcaaatcag tgatggtcaa atccaagcta ccaccactac tttagcccct 480 ctggccgcct cggcctctgc tggcctcgcc ttagataaaa ga 522 <210> 44 <211> 204 <212> DNA <213> Artificial Sequence <220> <223> TFP 14 <400> 44 atgcaattca agaacgcttt gactgctact gctattctaa gtgcctccgc tctagctgct 60 aactcaacta cttctattcc atcttcatgt agtattggta cttctgccac tgctactgct 120 caagccaccg atagtcaagc ccaagctact actaccgcac ccctggccgc ctcggcctct 180 gctggcctcg ccttagataa aaga 204 <210> 45 <211> 471 <212> DNA <213> Artificial Sequence <220> <223> TFP 15 <400> 45 atggtatcga agacttggat atgtggcttc atcagtataa ttacagtggt acaggccttg 60 tcctgcgaga agcatgatgt attgaaaaag tatcaggtgg gaaaatttag ctcactaact 120 tctacggaaa gggatactcc gccaagcaca actattgaaa agtggtggat aaacgtttgc 180 gaagagcata acgtagaacc tcctgaagaa tgtaaaaaaa atgacatgct atgtggttta 240 acagatgtca tcttgcccgg taaggatgct atcaccactc aaattataga ttttgacaaa 300 aacattggct tcaatgtcga ggaaactgag agtgcgctta cattgacact aaacggcgct 360 acgtggggcg ccaattcttt tgacgcaaaa ctagaatttc agtgtaatga caatatgaaa 420 caagacgaac tggccgcctc ggcctctgct ggcctcgcct tagataaaag a 471 <210> 46 <211> 294 <212> DNA <213> Artificial Sequence <220> <223> TFP 16 <400> 46 atgaaattat ccgctctatt agctttatca gcctccaccg ccgtcttggc cgctccagct 60 gtccaccata gtgacaacca ccaccacaac gacaagcgtg ccgttgtcac cgttactcag 120 tacgtcaacg cagacggcgc tgttgttatt ccagctgcca ccaccgctac ctcggcggct 180 gctgatggaa aggtcgagtc tgttgctgct gccaccacta ctttgtcctc gactgccgcc 240 gccgctacaa ccctggccgc ctcggcctct gctggcctcg ccttagataa aaga 294 <210> 47 <211> 585 <212> DNA <213> Artificial Sequence <220> <223> TFP 17 <400> 47 atgaaattat caactgtcct attatctgcc ggtttagcct cgactacttt ggcccaattt 60 tccaacagta catctgcttc ttccaccgat gtcacttcct cctcttccat ctccacttcc 120 tctggctcag taactatcac atcttctgaa gctccagaat ccgacaacgg taccagcaca 180 gctgcaccaa ctgaaacctc aacagaggct ccaaccactg ctatcccaac taacggtacc 240 tctactgaag ctccaaccac tgctatccca actaacggta cctctactga agctccaact 300 gatactacta ctgaagctcc aaccaccgct cttccaacta acggtacttc tactgaagct 360 ccaactgata ctactactga agctccaacc accggtcttc caaccaacgg taccacttca 420 gctttcccac caactacatc tttgccacca agcaacacta ccaccactcc tccttacaac 480 ccatctactg actacaccac tgactacact gtagtcactg aatatactac ttactgtccg 540 gaacgggccg cctcggcctc tgctggcctc gccttagata aaaga 585 <210> 48 <211> 315 <212> DNA <213> Artificial Sequence <220> <223> TFP 18 <400> 48 atgcgtttct ctactacact cgctactgca gctactgcgc tatttttcac agcctcccaa 60 gtttcagcta ttggtgaact agcctttaac ttgggtgtca agaacaacga tggtacttgt 120 aagtccactt ccgactatga aaccgaatta caagctttga agagctacac ttccaccgtc 180 aaagtttacg ctgcctcaga ttgtaacact ttgcaaaact taggtcctgc tgctgaagct 240 gagggattta ctatctttgt cggtgtttgg ccactggccg cctcggcctc tgctggcctc 300 gccttagata aaaga 315 <210> 49 <211> 372 <212> DNA <213> Artificial Sequence <220> <223> TFP 19 <400> 49 atgcgtctct ctaacctaat tgcttctgcc tctcttttat ctgctgctac tcttgctgct 60 cccgctaacc acgaacacaa ggacaagcgt gctgtggtca ctaccactgt tcaaaaacaa 120 accactatca ttgttaatgg tgccgcttca actccagttg ctgctttgga agaaaatgct 180 gttgtcaact ccgctccagc tgccgctacc agtacaacat cgtctgctgc ttctgtagct 240 accgctgctt cctcttctga gaacaactca caagtttctg ctgccgcatc tccagcctcc 300 agctctgctg ctacatctac tcaatcttct ctggccgcct cggcctctgc tggcctcgcc 360 ttagataaaa ga 372 <210> 50 <211> 414 <212> DNA <213> Artificial Sequence <220> <223> TFP 20 <400> 50 atgcaatttt ctactgtcgc ttctatcgcc gctgtcgccg ctgtcgcttc tgccgctgct 60 aacgttacca ctgctactgt cagccaagaa tctaccactt tggtcaccat cacttcttgt 120 gaagaccacg tctgttctga aactgtctcc ccagctttgg tttccaccgc taccgtcacc 180 gtcgatgacg ttatcactca atacaccacc tggtgcccat tgaccactga agccccaaag 240 aacggtactt ctactgctgc tccagttacc tctactgaag ctccaaagaa caccacctct 300 gctgctccaa ctcactctgt cacctcttac actggtgctg ctgctaaggc tttgccagct 360 gctggtgctt tgctggccgc ctcggcctct gctggcctcg ccttagataa aaga 414 <210> 51 <211> 528 <212> DNA <213> Artificial Sequence <220> <223> TFP 21 <400> 51 atgaaattct cttccgcttt ggttctatct gctgttgccg ctactgctct tgctgagagt 60 atcaccacca ccatcactgc caccaagaac ggtcatgtct acactaagac tgtcacccaa 120 gatgctactt ttgtttgggg tggtgaagac tcttacgcca gcagcacttc tgccgctgaa 180 tcttctgccg ccgaaacttc tgccgccgaa acctctgctg ccgctaccac ttctgctgcc 240 gctaccactt ctgctgctga gacttcttct gctgctgaga cttcttctgc tgatgaaggt 300 tctggttcta gtatcactac cactatcact gccaccaaga acggtcacgt ctacactaag 360 actgtcaccc aagatgctac ttttgtctgg actggtgaag gcagcagcaa cacctggtct 420 ccaagtagta cctctaccag ctcagaagct gctacctctt ctgcttcaac cactgcaacc 480 accctgctgg ccgcctcggc ctctgctggc ctcgccttag ataaaaga 528 <210> 52 <211> 414 <212> DNA <213> Artificial Sequence <220> <223> TFP 22 <400> 52 atgaagttcc aagttgtttt atctgccctt ttggcatgtt catctgccgt cgtcgcaagc 60 ccaatcgaaa acctattcaa atacagggca gttaaggcat ctcacagtaa gaatatcaac 120 tccactttgc cggcctggaa tgggtctaac tctagcaatg ttacctacgc taatggaaca 180 aacagtacta ccaatactac tactgccgaa agcagtcaat tacaaatcat tgtaacaggt 240 ggtcaagtac caatcaccaa cagttctttg acccacacaa actacaccag attattcaac 300 agttcttctg ctttgaacat taccgaattg tacaatgttg cccgtgttgt taacgaaacg 360 atccaagata acctggccgc ctcggcctct gctggcctcg ccttagataa aaga 414 <210> 53 <211> 345 <212> DNA <213> Artificial Sequence <220> <223> TFP 23 <400> 53 atgcgtgcca tcactttatt atcttcagtc gtttctttgg cattgttgtc gaaggaagtc 60 ttagcaacac ctccagcttg tttattggcc tgtgttgcgc aagtcggcaa atcctcttcc 120 acatgtgact ctttgaatca agtcacctgt tactgtgaac acgaaaactc cgccgtcaag 180 aaatgtctag actccatctg cccaaacaat gacgctgatg ctgcttattc tgctttcaag 240 agttcttgtt ccgaacaaaa tgcttcattg ggcgattcca gcggcagtgc ctcctcatcc 300 gttctggccg cctcggcctc tgctggcctc gccttagata aaaga 345 <210> 54 <211> 510 <212> DNA <213> Artificial Sequence <220> <223> TFP 24 <400> 54 atgaaattat caactgtcct attatctgcc ggtttggcct cgactacttt ggcccaattt 60 tccaacagta catctgcttc ttccaccgat gtcacttcct cctcttccat ctccacttcc 120 tctggctcag taactatcac atcttctgaa gctccagaat ccgacaacgg taccagcaca 180 gctgcaccaa ctgaaacctc aacagaggct ccaaccactg ctatcccaac taacggtacc 240 tctactgaag ctccaaccac tgctatccca actaacggta cctctactga agctccaact 300 gatactacta ctgaagctcc aaccaccgct cttccaacta acggtacttc tactgaagct 360 ccaactgata ctactactga agctccaacc accggtcttc caaccaacgg taccacttca 420 gctttcccac caactacatc tttgccacca agcaacacta ccaccactct ggccgcctcg 480 gcctctgctg gcctcgcctt agataaaaga 510 <210> 55 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> GAL100 <400> 55 gtatatggtg gtaatgccat g 21 <210> 56 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> GT50R <400> 56 gtcattatta aatatatata tatatatatt gtcactccgt tcaagtcgac 50 <210> 57 <211> 345 <212> PRT <213> Artificial Sequence <220> <223> RML-3G#4 <400> 57 Val Pro Ile Lys Arg Gln Ser Asn Ser Thr Val Asp Ser Leu Pro Pro 1 5 10 15 Leu Ile Pro Ser Arg Thr Ser Ala Pro Ser Ser Ser Pro Ser Thr Thr 20 25 30 Asp Pro Glu Ala Pro Ala Met Ser Arg Asn Gly Pro Leu Pro Ser Asp 35 40 45 Val Glu Thr Asn Tyr Gly Met Ala Leu Asn Ala Thr Ser Tyr Pro Asp 50 55 60 Ser Val Val Gln Ala Met Ser Ile Asp Gly Gly Ile Arg Ala Ala Thr 65 70 75 80 Ser Gln Glu Ile Asn Glu Leu Thr Tyr Tyr Thr Thr Leu Ser Ala Asn 85 90 95 Ser Tyr Cys Arg Thr Val Ile Pro Gly Ala Thr Trp Asp Cys Ile His 100 105 110 Cys Asp Ala Thr Glu Asp Leu Lys Ile Ile Lys Thr Trp Ser Thr Leu 115 120 125 Ile Tyr Asp Thr Asn Ala Met Val Ala Arg Gly Asp Ser Glu Lys Thr 130 135 140 Ile Tyr Ile Val Phe Arg Gly Ser Ser Ser Ile Arg Asn Trp Ile Ala 145 150 155 160 Asp Leu Thr Phe Val Pro Val Ser Tyr Pro Pro Val Ser Gly Thr Lys 165 170 175 Val His Lys Gly Phe Leu Asp Ser Tyr Gly Glu Val Gln Asp Glu Leu 180 185 190 Val Ala Thr Val Leu Asp Gln Phe Lys Gln Tyr Pro Ser Tyr Lys Val 195 200 205 Ala Val Thr Gly His Ser Leu Gly Gly Ala Thr Ala Leu Leu Cys Ala 210 215 220 Leu Gly Leu Tyr Gln Arg Glu Glu Gly Leu Ser Ser Ser Asn Leu Phe 225 230 235 240 Leu Tyr Thr Gln Gly Gln Pro Arg Val Gly Asp Pro Ala Phe Ala Asn 245 250 255 Tyr Val Val Ser Thr Gly Ile Pro Tyr Arg Arg Thr Val Asn Glu Arg 260 265 270 Asp Ile Val Pro His Leu Pro Pro Ala Ala Phe Gly Phe Leu His Ala 275 280 285 Gly Glu Glu Tyr Trp Ile Thr Asp Asn Ser Pro Glu Thr Val Gln Val 290 295 300 Cys Thr Ser Asp Leu Glu Thr Ser Asp Cys Ser Asn Ser Ile Val Pro 305 310 315 320 Phe Thr Ser Val Leu Asp His Leu Ser Tyr Phe Gly Ile Asn Thr Gly 325 330 335 Leu Cys Thr His His His Asp His His 340 345 <210> 58 <211> 1038 <212> DNA <213> Artificial Sequence <220> <223> RML-3G#4 <400> 58 gtgccaatca agagacaatc aaacagcacg gtggatagtc tgccacccct catcccctct 60 cgaacctcgg caccttcatc atcaccaagc acaaccgacc ctgaagctcc agccatgagt 120 cgcaatggac cgctgccctc ggatgtagag actaattatg gcatggcttt gaatgctact 180 tcctatccgg attctgtggt ccaagcaatg agcattgatg gtggtatccg cgctgcgacc 240 tcgcaagaaa tcaatgaatt gacttattac actacactat ctgccaactc gtactgccgc 300 actgtcattc ctggagctac ctgggactgt atccactgtg atgcaacgga ggatctcaag 360 attatcaaga cttggagcac gctcatctat gatacaaatg caatggttgc acgtggtgac 420 agcgaaaaaa ctatctatat cgttttccga ggttcgagct ctatccgcaa ctggattgct 480 gatctcacct ttgtgccagt ttcatatcct ccggtcagtg gtacaaaagt acacaaggga 540 ttcctggaca gttacgggga agttcaagac gagcttgttg ctactgttct tgatcaattc 600 aagcaatatc caagctacaa ggttgctgtt acaggtcact cactcggtgg tgctactgcg 660 ttgctttgcg ccctgggtct ctatcaacga gaagaaggac tctcatccag caacttgttc 720 ctttacactc aaggtcaacc acgggtaggc gaccctgcct ttgccaacta cgttgttagc 780 accggcattc cttacaggcg cacggtcaat gaacgagata tcgttcctca tcttccacct 840 gctgcttttg gttttctcca cgctggcgag gagtattgga ttactgacaa tagcccagag 900 actgttcagg tctgcacaag cgatctggaa acctctgatt gctctaacag cattgttccc 960 ttcacaagtg ttcttgacca tctctcgtac tttggtatca acacaggcct ctgtactcat 1020 caccatgacc atcactaa 1038 <210> 59 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> MJ706 <400> 59 tagataaaag atctgttgtg ccaatcaaga ga 32 <210> 60 <211> 341 <212> PRT <213> Artificial Sequence <220> <223> SV-RML-3G#4 <400> 60 Ser Val Val Pro Ile Lys Arg Gln Ser Asn Ser Thr Val Asp Ser Leu 1 5 10 15 Pro Pro Leu Ile Pro Ser Arg Thr Ser Ala Pro Ser Ser Ser Pro Ser 20 25 30 Thr Thr Asp Pro Glu Ala Pro Ala Met Ser Arg Asn Gly Pro Leu Pro 35 40 45 Ser Asp Val Glu Thr Asn Tyr Gly Met Ala Leu Asn Ala Thr Ser Tyr 50 55 60 Pro Asp Ser Val Val Gln Ala Met Ser Ile Asp Gly Gly Ile Arg Ala 65 70 75 80 Ala Thr Ser Gln Glu Ile Asn Glu Leu Thr Tyr Tyr Thr Thr Leu Ser 85 90 95 Ala Asn Ser Tyr Cys Arg Thr Val Ile Pro Gly Ala Thr Trp Asp Cys 100 105 110 Ile His Cys Asp Ala Thr Glu Asp Leu Lys Ile Ile Lys Thr Trp Ser 115 120 125 Thr Leu Ile Tyr Asp Thr Asn Ala Met Val Ala Arg Gly Asp Ser Glu 130 135 140 Lys Thr Ile Tyr Ile Val Phe Arg Gly Ser Ser Ser Ile Arg Asn Trp 145 150 155 160 Ile Ala Asp Leu Thr Phe Val Pro Val Ser Tyr Pro Pro Val Ser Gly 165 170 175 Thr Lys Val His Lys Gly Phe Leu Asp Ser Tyr Gly Glu Val Gln Asp 180 185 190 Glu Leu Val Ala Thr Val Leu Asp Gln Phe Lys Gln Tyr Pro Ser Tyr 195 200 205 Lys Val Ala Val Thr Gly His Ser Leu Gly Gly Ala Thr Ala Leu Leu 210 215 220 Cys Ala Leu Gly Leu Tyr Gln Arg Glu Glu Gly Leu Ser Ser Ser Asn 225 230 235 240 Leu Phe Leu Tyr Thr Gln Gly Gln Pro Arg Val Gly Asp Pro Ala Phe 245 250 255 Ala Asn Tyr Val Val Ser Thr Gly Ile Pro Tyr Arg Arg Thr Val Asn 260 265 270 Glu Arg Asp Ile Val Pro His Leu Pro Pro Ala Ala Phe Gly Phe Leu 275 280 285 His Ala Gly Glu Glu Tyr Trp Ile Thr Asp Asn Ser Pro Glu Thr Val 290 295 300 Gln Val Cys Thr Ser Asp Leu Glu Thr Ser Asp Cys Ser Asn Ser Ile 305 310 315 320 Val Pro Phe Thr Ser Val Leu Asp His Leu Ser Tyr Phe Gly Ile Asn 325 330 335 Thr Gly Leu Cys Thr 340 <210> 61 <211> 1023 <212> DNA <213> Artificial Sequence <220> <223> SV-RML-3G#4 <400> 61 tctgttgtgc caatcaagag acaatcaaac agcacggtgg atagtctgcc acccctcatc 60 ccctctcgaa cctcggcacc ttcatcatca ccaagcacaa ccgaccctga agctccagcc 120 atgagtcgca atggaccgct gccctcggat gtagagacta attatggcat ggctttgaat 180 gctacttcct atccggattc tgtggtccaa gcaatgagca ttgatggtgg tatccgcgct 240 gcgacctcgc aagaaatcaa tgaattgact tattacacta cactatctgc caactcgtac 300 tgccgcactg tcattcctgg agctacctgg gactgtatcc actgtgatgc aacggaggat 360 ctcaagatta tcaagacttg gagcacgctc atctatgata caaatgcaat ggttgcacgt 420 ggtgacagcg aaaaaactat ctatatcgtt ttccgaggtt cgagctctat ccgcaactgg 480 attgctgatc tcacctttgt gccagtttca tatcctccgg tcagtggtac aaaagtacac 540 aagggattcc tggacagtta cggggaagtt caagacgagc ttgttgctac tgttcttgat 600 caattcaagc aatatccaag ctacaaggtt gctgttacag gtcactcact cggtggtgct 660 actgcgttgc tttgcgccct gggtctctat caacgagaag aaggactctc atccagcaac 720 ttgttccttt acactcaagg tcaaccacgg gtaggcgacc ctgcctttgc caactacgtt 780 gttagcaccg gcattcctta caggcgcacg gtcaatgaac gagatatcgt tcctcatctt 840 ccacctgctg cttttggttt tctccacgct ggcgaggagt attggattac tgacaatagc 900 ccagagactg ttcaggtctg cacaagcgat ctggaaacct ctgattgctc taacagcatt 960 gttcccttca caagtgttct tgaccatctc tcgtactttg gtatcaacac aggcctctgt 1020 act 1023 <110> KOREA RESEARCH INSTITUTE OF BIOSCIENCE AND BIOTECHNOLOGY <120> Mutant lipases of Rhizomucor miehei having enhanced transesterification activity and a method of producing the lipase <130> KPA181117-KR-P1 <150> KR 2018-0132934 <151> 2018-11-01 <160> 61 <170> KoPatentIn 3.0 <210> 1 <211> 339 <212> PRT <213> Rhizomucor miehei <400> 1 Val Pro Ile Lys Arg Gln Ser Asn Ser Thr Val Asp Ser Leu Pro Pro 1 5 10 15 Leu Ile Pro Ser Arg Thr Ser Ala Pro Ser Ser Ser Pro Ser Thr Thr 20 25 30 Asp Pro Glu Ala Pro Ala Met Ser Arg Asn Gly Pro Leu Pro Ser Asp 35 40 45 Val Glu Thr Lys Tyr Gly Met Ala Leu Asn Ala Thr Ser Tyr Pro Asp 50 55 60 Ser Val Val Gln Ala Met Ser Ile Asp Gly Gly Ile Arg Ala Ala Thr 65 70 75 80 Ser Gln Glu Ile Asn Glu Leu Thr Tyr Tyr Tyr Thr Thr Leu Ser Ala Asn 85 90 95 Ser Tyr Cys Arg Thr Val Ile Pro Gly Ala Thr Trp Asp Cys Ile His 100 105 110 Cys Asp Ala Thr Glu Asp Leu Lys Ile Ile Lys Thr Trp Ser Thr Leu 115 120 125 Ile Tyr Asp Thr Asn Ala Met Val Ala Arg Gly Asp Ser Glu Lys Thr 130 135 140 Ile Tyr Ile Val Phe Arg Gly Ser Ser Ser Ile Arg Asn Trp Ile Ala 145 150 155 160 Asp Leu Thr Phe Val Pro Val Ser Tyr Pro Pro Val Ser Gly Thr Lys 165 170 175 Val His Lys Gly Phe Leu Asp Ser Tyr Gly Glu Val Gln Asn Glu Leu 180 185 190 Val Ala Thr Val Leu Asp Gln Phe Lys Gln Tyr Pro Ser Tyr Lys Val 195 200 205 Ala Val Thr Gly His Ser Leu Gly Gly Ala Thr Ala Leu Leu Cys Ala 210 215 220 Leu Gly Leu Tyr Gln Arg Glu Glu Gly Leu Ser Ser Ser Asn Leu Phe 225 230 235 240 Leu Tyr Thr Gln Gly Gln Pro Arg Val Gly Asp Pro Ala Phe Ala Asn 245 250 255 Tyr Val Val Ser Thr Gly Ile Pro Tyr Arg Arg Thr Val Asn Glu Arg 260 265 270 Asp Ile Val Pro His Leu Pro Pro Ala Ala Phe Gly Phe Leu His Ala 275 280 285 Gly Glu Glu Tyr Trp Ile Thr Asp Asn Ser Pro Glu Thr Val Gln Val 290 295 300 Cys Thr Ser Asp Leu Glu Thr Ser Asp Cys Ser Asn Ser Ile Val Pro 305 310 315 320 Phe Thr Ser Val Leu Asp His Leu Ser Tyr Phe Gly Ile Asn Thr Gly 325 330 335 Leu Cys Thr <210> 2 <211> 1020 <212> DNA <213> Rhizomucor miehei <400> 2 gtgccaatca agagacaatc aaacagcacg gtggatagtc tgccacccct catcccctct 60 cgaacctcgg caccttcatc atcaccaagc acaaccgacc ctgaagctcc agccatgagt 120 cgcaatggac cgctgccctc ggatgtagag actaaatatg gcatggcttt gaatgctact 180 tcctatccgg attctgtggt ccaagcaatg agcattgatg gtggtatccg cgctgcgacc 240 tcgcaagaaa tcaatgaatt gacttattac actacactat ctgccaactc gtactgccgc 300 actgtcattc ctggagctac ctgggactgt atccactgtg atgcaacgga ggatctcaag 360 attatcaaga cttggagcac gctcatctat gatacaaatg caatggttgc acgtggtgac 420 agcgaaaaaa ctatctatat cgttttccga ggttcgagct ctatccgcaa ctggattgct 480 gatctcacct ttgtgccagt ttcatatcct ccggtcagtg gtacaaaagt acacaaggga 540 ttcctggaca gttacgggga agttcaaaac gagcttgttg ctactgttct tgatcaattc 600 aagcaatatc caagctacaa ggttgctgtt acaggtcact cactcggtgg tgctactgcg 660 ttgctttgcg ccctgggtct ctatcaacga gaagaaggac tctcatccag caacttgttc 720 ctttacactc aaggtcaacc acgggtaggc gaccctgcct ttgccaacta cgttgttagc 780 accggcattc cttacaggcg cacggtcaat gaacgagata tcgttcctca tcttccacct 840 gctgcttttg gttttctcca cgctggcgag gagtattgga ttactgacaa tagcccagag 900 actgttcagg tctgcacaag cgatctggaa acctctgatt gctctaacag cattgttccc 960 ttcacaagtg ttcttgacca tctctcgtac tttggtatca acacaggcct ctgtacttaa 1020 1020 <210> 3 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> RML-TFP-F <400> 3 ctcgccttag ataaaagagt gccaatcaag agacaa 36 <210> 4 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> RML-TFP-R <400> 4 ttagtgatgg tgatggtgat gcttaagtac agaggcctg 39 <210> 5 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> LNK39 <400> 5 ggccgcctcg gcctctgctg gcctcgcctt agataaaaga 40 <210> 6 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> HisGT50R <400> 6 gtcattatta aatatatata tatatatatt gtcactccgt tcaagtcgac ttagtgatgg 60 tgatggtgat g 71 <210> 7 <211> 118 <212> PRT <213> Artificial Sequence <220> <223> TFP 1 <400> 7 Met Phe Asn Arg Phe Asn Lys Phe Gln Ala Ala Val Ala Leu Ala Leu 1 5 10 15 Leu Ser Arg Gly Ala Leu Gly Asp Ser Tyr Thr Asn Ser Thr Ser Ser 20 25 30 Ala Asp Leu Ser Ser Ile Thr Ser Val Ser Ser Ala Ser Ala Ser Ala 35 40 45 Thr Ala Ser Asp Ser Leu Ser Ser Ser Asp Gly Thr Val Tyr Leu Pro 50 55 60 Ser Thr Thr Ile Ser Gly Asp Leu Thr Val Thr Gly Lys Val Ile Ala 65 70 75 80 Thr Glu Ala Val Glu Val Ala Ala Gly Gly Lys Leu Thr Leu Leu Asp 85 90 95 Gly Glu Lys Tyr Val Phe Ser Ser Glu Ala Ala Ser Ala Ser Ala Gly 100 105 110 Leu Ala Leu Asp Lys Arg 115 <210> 8 <211> 130 <212> PRT <213> Artificial Sequence <220> <223> TFP 2 <400> 8 Met Thr Pro Tyr Ala Val Ala Ile Thr Val Ala Leu Leu Ile Val Thr 1 5 10 15 Val Ser Ala Leu Gln Val Asn Asn Ser Cys Val Ala Phe Pro Pro Ser 20 25 30 Asn Leu Arg Gly Lys Asn Gly Asp Gly Thr Asn Glu Gln Tyr Ala Thr 35 40 45 Ala Leu Leu Ser Ile Pro Trp Asn Gly Pro Pro Glu Ser Ser Arg Asp 50 55 60 Ile Asn Leu Ile Glu Leu Glu Pro Gln Val Ala Leu Tyr Leu Leu Glu 65 70 75 80 Asn Tyr Ile Asn His Tyr Tyr Asn Thr Thr Arg Asp Asn Lys Cys Pro 85 90 95 Asn Asn His Tyr Leu Met Gly Gly Gln Leu Gly Ser Ser Ser Asp Asn 100 105 110 Arg Ser Leu Asn Glu Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp 115 120 125 Lys Arg 130 <210> 9 <211> 117 <212> PRT <213> Artificial Sequence <220> <223> TFP 3 <400> 9 Met Gln Phe Lys Asn Val Ala Leu Ala Ala Ser Val Ala Ala Leu Ser 1 5 10 15 Ala Thr Ala Ser Ala Glu Gly Tyr Thr Pro Gly Glu Pro Trp Ser Thr 20 25 30 Leu Thr Pro Thr Gly Ser Ile Ser Cys Gly Ala Ala Glu Tyr Thr Thr 35 40 45 Thr Phe Gly Ile Ala Val Gln Ala Ile Thr Ser Ser Lys Ala Lys Arg 50 55 60 Asp Val Ile Ser Gln Ile Gly Asp Gly Gln Val Gln Ala Thr Ser Ala 65 70 75 80 Ala Thr Ala Gln Ala Thr Asp Ser Gln Ala Gln Ala Thr Thr Thr Ala 85 90 95 Thr Pro Thr Ser Ser Glu Lys Met Ala Ala Ser Ala Ser Ala Gly Leu 100 105 110 Ala Leu Asp Lys Arg 115 <210> 10 <211> 62 <212> PRT <213> Artificial Sequence <220> <223> TFP 4 <400> 10 Met Arg Phe Ala Glu Phe Leu Val Val Phe Ala Thr Leu Gly Gly Gly 1 5 10 15 Met Ala Ala Pro Val Glu Ser Leu Ala Gly Thr Gln Arg Tyr Leu Val 20 25 30 Gln Met Lys Glu Arg Phe Thr Thr Glu Lys Leu Cys Ala Leu Asp Asp 35 40 45 Lys Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 50 55 60 <210> 11 <211> 97 <212> PRT <213> Artificial Sequence <220> <223> TFP 5 <400> 11 Met Phe Asn Arg Phe Asn Lys Phe Gln Ala Ala Val Ala Leu Ala Leu 1 5 10 15 Leu Ser Arg Gly Ala Leu Gly Ala Pro Val Asn Thr Thr Thr Glu Asp 20 25 30 Glu Thr Ala Leu Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Asp Leu 35 40 45 Glu Gly Asp Phe Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn 50 55 60 Asn Gly Leu Leu Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys 65 70 75 80 Glu Glu Gly Val Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp Lys 85 90 95 Arg <210> 12 <211> 93 <212> PRT <213> Artificial Sequence <220> <223> TFP 6 <400> 12 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Asp Leu Glu Gly Asp Phe 35 40 45 Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu 50 55 60 Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 85 90 <210> 13 <211> 226 <212> PRT <213> Artificial Sequence <220> <223> TFP 7 <400> 13 Met Val Phe Gly Gln Leu Tyr Ala Leu Phe Ile Phe Thr Leu Ser Cys 1 5 10 15 Cys Ile Ser Lys Thr Val Gln Ala Asp Ser Ser Lys Glu Ser Ser Ser 20 25 30 Phe Ile Ser Phe Asp Lys Glu Ser Asn Trp Asp Thr Ile Ser Thr Ile 35 40 45 Ser Ser Thr Ala Asp Val Ile Ser Ser Val Asp Ser Ala Ile Ala Val 50 55 60 Phe Glu Phe Asp Asn Phe Ser Leu Leu Asp Ser Leu Met Ile Asp Glu 65 70 75 80 Glu Tyr Pro Phe Phe Asn Arg Phe Phe Ala Asn Asp Val Ser Leu Thr 85 90 95 Val His Asp Asp Ser Pro Leu Asn Ile Ser Gln Ser Leu Ser Pro Ile 100 105 110 Met Glu Gln Phe Thr Val Asp Glu Leu Pro Glu Ser Ala Ser Asp Leu 115 120 125 Leu Tyr Glu Tyr Ser Leu Asp Asp Lys Ser Ile Val Leu Phe Lys Phe 130 135 140 Thr Ser Asp Ala Tyr Asp Leu Lys Lys Leu Asp Glu Phe Ile Asp Ser 145 150 155 160 Cys Leu Ser Phe Leu Glu Asp Lys Ser Gly Asp Asn Leu Thr Val Val 165 170 175 Ile Asn Ser Leu Gly Trp Ala Phe Glu Asp Glu Asp Gly Asp Asp Glu 180 185 190 Tyr Ala Thr Glu Glu Thr Leu Ser His His Asp Asn Asn Lys Gly Lys 195 200 205 Glu Gly Asp Asp Leu Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp 210 215 220 Lys Arg 225 <210> 14 <211> 64 <212> PRT <213> Artificial Sequence <220> <223> TFP 8 <400> 14 Met Leu Gln Ser Val Val Phe Phe Ala Leu Leu Thr Phe Ala Ser Ser 1 5 10 15 Val Ser Ala Ile Tyr Ser Asn Asn Thr Val Ser Thr Thr Thr Thr Leu 20 25 30 Ala Pro Ser Tyr Ser Leu Val Pro Gln Glu Thr Thr Ile Ser Tyr Ala 35 40 45 Asp Asp Leu Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 50 55 60 <210> 15 <211> 138 <212> PRT <213> Artificial Sequence <220> <223> TFP 9 <400> 15 Met Lys Phe Ser Thr Ala Val Thr Thr Leu Ile Ser Ser Gly Ala Ile 1 5 10 15 Val Ser Ala Leu Pro His Val Asp Val His Gln Glu Asp Ala His Gln 20 25 30 His Lys Arg Ala Val Ala Tyr Lys Tyr Val Tyr Glu Thr Val Val Val 35 40 45 Asp Ser Asp Gly His Thr Val Thr Pro Ala Ala Ser Glu Val Ala Thr 50 55 60 Ala Ala Thr Ser Ala Ile Ile Thr Thr Ser Val Leu Ala Pro Thr Ser 65 70 75 80 Ser Ala Ala Ala Ala Asp Ser Ser Ala Ser Ile Ala Val Ser Ser Ala 85 90 95 Ala Leu Ala Lys Asn Glu Lys Ile Ser Asp Ala Ala Ala Ser Ala Thr 100 105 110 Ala Ser Thr Ser Gln Gly Ala Ser Ser Ser Ser Tyr Leu Ala Ala Ser 115 120 125 Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 130 135 <210> 16 <211> 199 <212> PRT <213> Artificial Sequence <220> <223> TFP 10 <400> 16 Met Asn Trp Leu Phe Leu Val Ser Leu Val Phe Phe Cys Gly Val Ser 1 5 10 15 Thr His Pro Ala Leu Ala Met Ser Ser Asn Arg Leu Leu Lys Leu Ala 20 25 30 Asn Lys Ser Pro Lys Lys Ile Ile Pro Leu Lys Asp Ser Ser Phe Glu 35 40 45 Asn Ile Leu Ala Pro Pro His Glu Asn Ala Tyr Ile Val Ala Leu Phe 50 55 60 Thr Ala Thr Ala Pro Glu Ile Gly Cys Ser Leu Cys Leu Glu Leu Glu 65 70 75 80 Ser Glu Tyr Asp Thr Ile Val Ala Ser Trp Phe Asp Asp His Pro Asp 85 90 95 Ala Lys Ser Ser Asn Ser Asp Thr Ser Ile Phe Phe Thr Lys Val Asn 100 105 110 Leu Glu Asp Pro Ser Lys Thr Ile Pro Lys Ala Phe Gln Phe Phe Gln 115 120 125 Leu Asn Asn Val Pro Arg Leu Phe Ile Phe Lys Leu Asn Ser Pro Ser 130 135 140 Ile Leu Asp His Ser Val Ile Ser Ile Ser Thr Asp Thr Gly Ser Glu 145 150 155 160 Arg Met Lys Gln Ile Ile Gln Ala Ile Lys Gln Phe Ser Gln Val Asn 165 170 175 Asp Phe Ser Leu His Leu Pro Val Gly Leu Ala Ala Ser Ala Ser Ala 180 185 190 Gly Leu Ala Leu Asp Lys Arg 195 <210> 17 <211> 77 <212> PRT <213> Artificial Sequence <220> <223> TFP 11 <400> 17 Met Lys Phe Ser Ser Val Thr Ala Ile Thr Leu Ala Thr Val Ala Thr 1 5 10 15 Val Ala Thr Ala Lys Lys Gly Glu His Asp Phe Thr Thr Thr Leu Thr 20 25 30 Leu Ser Ser Asp Gly Ser Leu Thr Thr Thr Thr Ser Thr His Thr Thr 35 40 45 His Lys Tyr Gly Lys Phe Asn Lys Thr Ser Lys Ser Lys Thr Pro Leu 50 55 60 Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 65 70 75 <210> 18 <211> 94 <212> PRT <213> Artificial Sequence <220> <223> TFP 12 <400> 18 Met Ala Ser Phe Ala Thr Lys Phe Val Ile Ala Cys Phe Leu Phe Phe 1 5 10 15 Ser Ala Ser Ala His Asn Val Leu Leu Pro Ala Tyr Gly Arg Arg Cys 20 25 30 Phe Phe Glu Asp Leu Ser Lys Gly Asp Glu Leu Ser Ile Ser Phe Gln 35 40 45 Phe Gly Asp Arg Asn Pro Gln Ser Ser Ser Gln Leu Thr Gly Asp Phe 50 55 60 Ile Ile Tyr Gly Pro Glu Arg His Glu Val Leu Lys Thr Val Arg Glu 65 70 75 80 Leu Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 85 90 <210> 19 <211> 174 <212> PRT <213> Artificial Sequence <220> <223> TFP 13 <400> 19 Met Gln Tyr Lys Lys Thr Leu Val Ala Ser Ala Leu Ala Ala Thr Thr 1 5 10 15 Leu Ala Ala Tyr Ala Pro Ser Glu Pro Trp Ser Thr Leu Thr Pro Thr 20 25 30 Ala Thr Tyr Ser Gly Gly Val Thr Asp Tyr Ala Ser Thr Phe Gly Ile 35 40 45 Ala Val Gln Pro Ile Ser Thr Thr Ser Ser Ala Ser Ser Ala Ala Thr 50 55 60 Thr Ala Ser Ser Lys Ala Lys Arg Ala Ala Ser Gln Ile Gly Asp Gly 65 70 75 80 Gln Val Gln Ala Ala Thr Thr Thr Ala Ser Val Ser Thr Lys Ser Thr 85 90 95 Ala Ala Ala Val Ser Gln Ile Gly Asp Gly Gln Ile Gln Ala Thr Thr 100 105 110 Lys Thr Thr Ala Ala Ala Val Ser Gln Ile Gly Asp Gly Gln Ile Gln 115 120 125 Ala Thr Thr Lys Thr Thr Ser Ala Lys Thr Thr Ala Ala Ala Val Ser 130 135 140 Gln Ile Ser Asp Gly Gln Ile Gln Ala Thr Thr Thr Thr Leu Ala Pro 145 150 155 160 Leu Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 165 170 <210> 20 <211> 68 <212> PRT <213> Artificial Sequence <220> <223> TFP 14 <400> 20 Met Gln Phe Lys Asn Ala Leu Thr Ala Thr Ala Ile Leu Ser Ala Ser 1 5 10 15 Ala Leu Ala Ala Asn Ser Thr Thr Ser Ile Pro Ser Ser Cys Ser Ile 20 25 30 Gly Thr Ser Ala Thr Ala Thr Ala Gln Ala Thr Asp Ser Gln Ala Gln 35 40 45 Ala Thr Thr Thr Ala Pro Leu Ala Ala Ser Ala Ser Ala Gly Leu Ala 50 55 60 Leu Asp Lys Arg 65 <210> 21 <211> 157 <212> PRT <213> Artificial Sequence <220> <223> TFP 15 <400> 21 Met Val Ser Lys Thr Trp Ile Cys Gly Phe Ile Ser Ile Ile Thr Val 1 5 10 15 Val Gln Ala Leu Ser Cys Glu Lys His Asp Val Leu Lys Lys Tyr Gln 20 25 30 Val Gly Lys Phe Ser Ser Leu Thr Ser Thr Glu Arg Asp Thr Pro Pro 35 40 45 Ser Thr Thr Ile Glu Lys Trp Trp Ile Asn Val Cys Glu Glu His Asn 50 55 60 Val Glu Pro Pro Glu Glu Cys Lys Lys Asn Asp Met Leu Cys Gly Leu 65 70 75 80 Thr Asp Val Ile Leu Pro Gly Lys Asp Ala Ile Thr Thr Gln Ile Ile 85 90 95 Asp Phe Asp Lys Asn Ile Gly Phe Asn Val Glu Glu Thr Glu Ser Ala 100 105 110 Leu Thr Leu Thr Leu Asn Gly Ala Thr Trp Gly Ala Asn Ser Phe Asp 115 120 125 Ala Lys Leu Glu Phe Gln Cys Asn Asp Asn Met Lys Gln Asp Glu Leu 130 135 140 Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 145 150 155 <210> 22 <211> 98 <212> PRT <213> Artificial Sequence <220> <223> TFP 16 <400> 22 Met Lys Leu Ser Ala Leu Leu Ala Leu Ser Ala Ser Thr Ala Val Leu 1 5 10 15 Ala Ala Pro Ala Val His His Ser Asp Asn His His His Asn Asp Lys 20 25 30 Arg Ala Val Val Thr Val Thr Gln Tyr Val Asn Ala Asp Gly Ala Val 35 40 45 Val Ile Pro Ala Ala Thr Thr Ala Thr Ser Ala Ala Ala Asp Gly Lys 50 55 60 Val Glu Ser Val Ala Ala Ala Thr Thr Thr Leu Ser Ser Thr Ala Ala 65 70 75 80 Ala Ala Thr Thr Leu Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp 85 90 95 Lys Arg <210> 23 <211> 195 <212> PRT <213> Artificial Sequence <220> <223> TFP 17 <400> 23 Met Lys Leu Ser Thr Val Leu Leu Ser Ala Gly Leu Ala Ser Thr Thr 1 5 10 15 Leu Ala Gln Phe Ser Asn Ser Thr Ser Ala Ser Ser Thr Asp Val Thr 20 25 30 Ser Ser Ser Ser Ile Ser Thr Ser Ser Gly Ser Val Thr Ile Thr Ser 35 40 45 Ser Glu Ala Pro Glu Ser Asp Asn Gly Thr Ser Thr Ala Ala Pro Thr 50 55 60 Glu Thr Ser Thr Glu Ala Pro Thr Thr Ala Ile Pro Thr Asn Gly Thr 65 70 75 80 Ser Thr Glu Ala Pro Thr Thr Ala Ile Pro Thr Asn Gly Thr Ser Thr 85 90 95 Glu Ala Pro Thr Asp Thr Thr Thr Glu Ala Pro Thr Thr Ala Leu Pro 100 105 110 Thr Asn Gly Thr Ser Thr Glu Ala Pro Thr Asp Thr Thr Thr Glu Ala 115 120 125 Pro Thr Thr Gly Leu Pro Thr Asn Gly Thr Thr Ser Ala Phe Pro Pro 130 135 140 Thr Thr Ser Leu Pro Pro Ser Asn Thr Thr Thr Thr Pro Pro Tyr Asn 145 150 155 160 Pro Ser Thr Asp Tyr Thr Thr Asp Tyr Thr Val Val Thr Glu Tyr Thr 165 170 175 Thr Tyr Cys Pro Glu Arg Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu 180 185 190 Asp Lys Arg 195 <210> 24 <211> 105 <212> PRT <213> Artificial Sequence <220> <223> TFP 18 <400> 24 Met Arg Phe Ser Thr Thr Leu Ala Thr Ala Ala Thr Ala Leu Phe Phe 1 5 10 15 Thr Ala Ser Gln Val Ser Ala Ile Gly Glu Leu Ala Phe Asn Leu Gly 20 25 30 Val Lys Asn Asn Asp Gly Thr Cys Lys Ser Thr Ser Asp Tyr Glu Thr 35 40 45 Glu Leu Gln Ala Leu Lys Ser Tyr Thr Ser Thr Val Lys Val Tyr Ala 50 55 60 Ala Ser Asp Cys Asn Thr Leu Gln Asn Leu Gly Pro Ala Ala Glu Ala 65 70 75 80 Glu Gly Phe Thr Ile Phe Val Gly Val Trp Pro Leu Ala Ala Ser Ala 85 90 95 Ser Ala Gly Leu Ala Leu Asp Lys Arg 100 105 <210> 25 <211> 124 <212> PRT <213> Artificial Sequence <220> <223> TFP 19 <400> 25 Met Arg Leu Ser Asn Leu Ile Ala Ser Ala Ser Leu Leu Ser Ala Ala 1 5 10 15 Thr Leu Ala Ala Pro Ala Asn His Glu His Lys Asp Lys Arg Ala Val 20 25 30 Val Thr Thr Thr Val Gln Lys Gln Thr Thr Ile Ile Val Asn Gly Ala 35 40 45 Ala Ser Thr Pro Val Ala Ala Leu Glu Glu Asn Ala Val Val Asn Ser 50 55 60 Ala Pro Ala Ala Ala Thr Ser Thr Thr Ser Ser Ala Ala Ser Val Ala 65 70 75 80 Thr Ala Ala Ser Ser Ser Glu Asn Asn Ser Gln Val Ser Ala Ala Ala 85 90 95 Ser Pro Ala Ser Ser Ser Ala Ala Thr Ser Thr Gln Ser Ser Leu Ala 100 105 110 Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 115 120 <210> 26 <211> 138 <212> PRT <213> Artificial Sequence <220> <223> TFP 20 <400> 26 Met Gln Phe Ser Thr Val Ala Ser Ile Ala Ala Val Ala Ala Val Ala 1 5 10 15 Ser Ala Ala Ala Asn Val Thr Thr Ala Thr Val Ser Gln Glu Ser Thr 20 25 30 Thr Leu Val Thr Ile Thr Ser Cys Glu Asp His Val Cys Ser Glu Thr 35 40 45 Val Ser Pro Ala Leu Val Ser Thr Ala Thr Val Thr Val Asp Asp Val 50 55 60 Ile Thr Gln Tyr Thr Thr Trp Cys Pro Leu Thr Thr Glu Ala Pro Lys 65 70 75 80 Asn Gly Thr Ser Thr Ala Ala Pro Val Thr Ser Thr Glu Ala Pro Lys 85 90 95 Asn Thr Thr Ser Ala Ala Pro Thr His Ser Val Thr Ser Tyr Thr Gly 100 105 110 Ala Ala Ala Lys Ala Leu Pro Ala Ala Gly Ala Leu Leu Ala Ala Ser 115 120 125 Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 130 135 <210> 27 <211> 176 <212> PRT <213> Artificial Sequence <220> <223> TFP 21 <400> 27 Met Lys Phe Ser Ser Ala Leu Val Leu Ser Ala Val Ala Ala Thr Ala 1 5 10 15 Leu Ala Glu Ser Ile Thr Thr Thr Ile Thr Ala Thr Lys Asn Gly His 20 25 30 Val Tyr Thr Lys Thr Val Thr Gln Asp Ala Thr Phe Val Trp Gly Gly 35 40 45 Glu Asp Ser Tyr Ala Ser Ser Thr Ser Ala Ala Glu Ser Ser Ala Ala 50 55 60 Glu Thr Ser Ala Ala Glu Thr Ser Ala Ala Ala Thr Thr Ser Ala Ala 65 70 75 80 Ala Thr Thr Ser Ala Ala Glu Thr Ser Ser Ala Ala Glu Thr Ser Ser 85 90 95 Ala Asp Glu Gly Ser Gly Ser Ser Ile Thr Thr Thr Ile Thr Ala Thr 100 105 110 Lys Asn Gly His Val Tyr Thr Lys Thr Val Thr Gln Asp Ala Thr Phe 115 120 125 Val Trp Thr Gly Glu Gly Ser Ser Asn Thr Trp Ser Pro Ser Ser Thr 130 135 140 Ser Thr Ser Ser Glu Ala Ala Thr Ser Ser Ala Ser Thr Thr Ala Thr 145 150 155 160 Thr Leu Leu Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 165 170 175 <210> 28 <211> 138 <212> PRT <213> Artificial Sequence <220> <223> TFP 22 <400> 28 Met Lys Phe Gln Val Val Leu Ser Ala Leu Leu Ala Cys Ser Ser Ala 1 5 10 15 Val Val Ala Ser Pro Ile Glu Asn Leu Phe Lys Tyr Arg Ala Val Lys 20 25 30 Ala Ser His Ser Lys Asn Ile Asn Ser Thr Leu Pro Ala Trp Asn Gly 35 40 45 Ser Asn Ser Ser Asn Val Thr Tyr Ala Asn Gly Thr Asn Ser Thr Thr 50 55 60 Asn Thr Thr Thr Ala Glu Ser Ser Gln Leu Gln Ile Ile Val Thr Gly 65 70 75 80 Gly Gln Val Pro Ile Thr Asn Ser Ser Leu Thr His Thr Asn Tyr Thr 85 90 95 Arg Leu Phe Asn Ser Ser Ser Ala Leu Asn Ile Thr Glu Leu Tyr Asn 100 105 110 Val Ala Arg Val Val Asn Glu Thr Ile Gln Asp Asn Leu Ala Ala Ser 115 120 125 Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 130 135 <210> 29 <211> 115 <212> PRT <213> Artificial Sequence <220> <223> TFP 23 <400> 29 Met Arg Ala Ile Thr Leu Leu Ser Ser Val Val Ser Leu Ala Leu Leu 1 5 10 15 Ser Lys Glu Val Leu Ala Thr Pro Pro Ala Cys Leu Leu Ala Cys Val 20 25 30 Ala Gln Val Gly Lys Ser Ser Ser Thr Cys Asp Ser Leu Asn Gln Val 35 40 45 Thr Cys Tyr Cys Glu His Glu Asn Ser Ala Val Lys Lys Cys Leu Asp 50 55 60 Ser Ile Cys Pro Asn Asn Asp Ala Asp Ala Ala Tyr Ser Ala Phe Lys 65 70 75 80 Ser Ser Cys Ser Glu Gln Asn Ala Ser Leu Gly Asp Ser Ser Gly Ser 85 90 95 Ala Ser Ser Ser Val Leu Ala Ala Ser Ala Ser Ala Gly Leu Ala Leu 100 105 110 Asp Lys Arg 115 <210> 30 <211> 170 <212> PRT <213> Artificial Sequence <220> <223> TFP 24 <400> 30 Met Lys Leu Ser Thr Val Leu Leu Ser Ala Gly Leu Ala Ser Thr Thr 1 5 10 15 Leu Ala Gln Phe Ser Asn Ser Thr Ser Ala Ser Ser Thr Asp Val Thr 20 25 30 Ser Ser Ser Ser Ile Ser Thr Ser Ser Gly Ser Val Thr Ile Thr Ser 35 40 45 Ser Glu Ala Pro Glu Ser Asp Asn Gly Thr Ser Thr Ala Ala Pro Thr 50 55 60 Glu Thr Ser Thr Glu Ala Pro Thr Thr Ala Ile Pro Thr Asn Gly Thr 65 70 75 80 Ser Thr Glu Ala Pro Thr Thr Ala Ile Pro Thr Asn Gly Thr Ser Thr 85 90 95 Glu Ala Pro Thr Asp Thr Thr Thr Glu Ala Pro Thr Thr Ala Leu Pro 100 105 110 Thr Asn Gly Thr Ser Thr Glu Ala Pro Thr Asp Thr Thr Thr Glu Ala 115 120 125 Pro Thr Thr Gly Leu Pro Thr Asn Gly Thr Thr Ser Ala Phe Pro Pro 130 135 140 Thr Thr Ser Leu Pro Pro Ser Asn Thr Thr Thr Thr Leu Ala Ala Ser 145 150 155 160 Ala Ser Ala Gly Leu Ala Leu Asp Lys Arg 165 170 <210> 31 <211> 354 <212> DNA <213> Artificial Sequence <220> <223> TFP 1 <400> 31 atgttcaatc gttttaacaa attccaagct gctgtcgctt tggccctact ctctcgcggc 60 gctctcggtg actcttacac caatagcacc tcctccgcag acttgagttc tatcacttcc 120 gtctcgtcag ctagtgcaag tgccaccgct tccgactcac tttcttccag tgacggtacc 180 gtttatttgc catccacaac aattagcggt gatctcacag ttactggtaa agtaattgca 240 accgaggccg tggaagtcgc tgccggtggt aagttgactt tacttgacgg tgaaaaatac 300 gtcttctcat ctgaggccgc ctcggcctct gctggcctcg ccttagataa aaga 354 <210> 32 <211> 390 <212> DNA <213> Artificial Sequence <220> <223> TFP 2 <400> 32 atgacgccct atgcagtagc aattaccgtg gccttactaa ttgtaacagt gagcgcactc 60 caggtcaaca attcatgtgt cgcttttccg ccatcaaatc tcaggggcaa gaatggagac 120 ggtactaatg aacagtatgc aactgcacta ctttctattc cctggaatgg gcctcctgag 180 tcatcgaggg atattaatct tatcgaactc gaaccgcaag ttgcactcta tttgctcgaa 240 aattatatta accattacta caacaccaca agagacaata agtgccctaa taaccactac 300 ctaatgggag ggcagttggg tagctcatcg gataatagga gtttgaacga ggccgcctcg 360 gcctctgctg gcctcgcctt agataaaaga 390 <210> 33 <211> 351 <212> DNA <213> Artificial Sequence <220> <223> TFP 3 <400> 33 atgcaattca aaaacgtcgc cctagctgcc tccgttgctg ctctatccgc cactgcttct 60 gctgaaggtt acactccagg tgaaccatgg tccaccttaa ccccaaccgg ctccatctct 120 tgtggtgcag ccgaatacac taccaccttt ggtattgctg ttcaagctat tacctcttca 180 aaagctaaga gagacgttat ctctcaaatt ggtgacggtc aagtccaagc cacttctgct 240 gctactgctc aagccaccga tagtcaagcc caagctacta ctaccgctac cccaaccagc 300 tccgaaaaga tggccgcctc ggcctctgct ggcctcgcct tagataaaag a 351 <210> 34 <211> 186 <212> DNA <213> Artificial Sequence <220> <223> TFP 4 <400> 34 atgagatttg cagaattctt ggtggtattt gccacgttag gcggggggat ggctgcaccg 60 gttgagtctc tggccgggac ccaacggtat ctggtgcaaa tgaaggagcg gttcaccaca 120 gagaagctgt gtgctttgga cgacaaggcc gcctcggcct ctgctggcct cgccttagat 180 aaaaga 186 <210> 35 <211> 291 <212> DNA <213> Artificial Sequence <220> <223> TFP 5 <400> 35 atgttcaatc gttttaacaa attccaagct gctgtcgctt tggccctact ctctcgcggc 60 gctctcggtg ctccagtcaa cactacaaca gaagatgaaa cggcactaat tccggctgaa 120 gctgtcatcg gttacttaga tttagaaggg gatttcgatg ttgctgtttt gccattttcc 180 aacagcacaa ataacgggtt attgtttata aatactacta ttgccagcat tgctgctaaa 240 gaagaagggg tggccgcctc ggcctctgct ggcctcgcct tagataaaag a 291 <210> 36 <211> 279 <212> DNA <213> Artificial Sequence <220> <223> TFP 6 <400> 36 atgagatttc cttcaatttt tactgcagtt ttattcgcag catcctccgc attagctgct 60 ccagtcaaca ctacaacaga agatgaaacg gcacaaattc cggctgaagc tgtcatcggt 120 tacttagatt tagaagggga tttcgatgtt gctgttttgc cattttccaa cagcacaaat 180 aacgggttat tgtttataaa tactactatt gccagcattg ctgctaaaga agaaggggtg 240 gccgcctcgg cctctgctgg cctcgcctta gataaaaga 279 <210> 37 <211> 678 <212> DNA <213> Artificial Sequence <220> <223> TFP 7 <400> 37 atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60 actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120 aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180 gctatcgctg tttttgaatt tgacaatttc tcattattgg acagcttgat gattgacgaa 240 gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300 tcgcctttga acatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360 ttacctgaaa gtgcctctga cttactatat gaatactcct tagatgataa aagcatcgtt 420 ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480 tgcttatcgt ttttggaaga taaatctggc gacaatttga ctgtggttat taactctctt 540 ggttgggctt ttgaagatga agatggtgac gatgaatatg caacagaaga gactttgagc 600 catcatgata acaacaaggg taaagaaggc gacgatctgg ccgcctcggc ctctgctggc 660 ctcgccttag ataaaaga 678 <210> 38 <211> 192 <212> DNA <213> Artificial Sequence <220> <223> TFP 8 <400> 38 atgcttcaat ccgttgtctt tttcgctctt ttaaccttcg caagttctgt gtcagcgatt 60 tattcaaaca atactgtttc tacaactacc actttagcgc ccagctactc cttggtgccc 120 caagagacta ccatatcgta cgccgacgac ctggccgcct cggcctctgc tggcctcgcc 180 ttagataaaa ga 192 <210> 39 <211> 414 <212> DNA <213> Artificial Sequence <220> <223> TFP 9 <400> 39 atgaaattct caactgccgt tactacgttg attagttctg gtgccatcgt gtctgcttta 60 ccacacgtgg atgttcacca agaagatgcc caccaacata agagggccgt tgcgtacaaa 120 tacgtttacg aaactgttgt tgtcgattct gatggccaca ctgtaactcc tgctgcttca 180 gaagtcgcta ctgctgctac ctctgctatc attacaacat ctgtgttggc tccaacctcc 240 tccgcagccg ctgcggatag ctccgcttcc attgctgttt catctgctgc cttagccaag 300 aatgagaaaa tctctgatgc cgctgcatct gccactgcct caacatctca aggggcatcc 360 tcctcatcct acctggccgc ctcggcctct gctggcctcg ccttagataa aaga 414 <210> 40 <211> 597 <212> DNA <213> Artificial Sequence <220> <223> TFP 10 <400> 40 atgaattggc tgtttttggt ctcgctggtt ttcttctgcg gcgtgtcaac ccatcctgcc 60 ctggcaatgt ccagcaacag actactaaag ctggctaata aatctcccaa gaaaattata 120 cctctgaagg actcaagttt tgaaaacatc ttggcaccac ctcacgaaaa tgcctatata 180 gttgctctgt ttactgccac agcgcccgaa attggctgtt ctctgtgtct cgagctagaa 240 tccgaatacg acaccatagt ggcctcctgg tttgatgatc atccggatgc aaaatcgtcc 300 aattccgata catctatttt cttcacaaag gtcaatttgg aggacccttc taagaccatt 360 cctaaagcgt tccagttttt ccaactaaac aatgttccta gattgttcat cttcaaacta 420 aactctccct ctattctgga ccacagcgtg atcagtattt ccactgatac tggctcagaa 480 agaatgaagc aaatcataca agccattaag cagttctcgc aagtaaacga cttctcttta 540 cacttacctg tgggtctggc cgcctcggcc tctgctggcc tcgccttaga taaaaga 597 <210> 41 <211> 231 <212> DNA <213> Artificial Sequence <220> <223> TFP 11 <400> 41 atgaagttct cttctgttac tgctattact ctagccaccg ttgccaccgt tgccactgct 60 aagaagggtg aacatgattt cactaccact ttaactttgt catcggacgg tagtttaact 120 actaccacct ctactcatac cactcacaag tatggtaagt tcaacaagac ttccaagtcc 180 aagacccccc tggccgcctc ggcctctgct ggcctcgcct tagataaaag a 231 <210> 42 <211> 282 <212> DNA <213> Artificial Sequence <220> <223> TFP 12 <400> 42 atggcctcat ttgctactaa gtttgtcatt gcttgcttcc tgttcttctc ggcgtccgcc 60 cataatgtcc ttcttccagc ttatggccgt agatgcttct tcgaagactt gagtaagggt 120 gacgagctct ccatttcgtt ccagttcggt gatagaaacc ctcaatccag tagccagctg 180 actggtgact ttatcatcta cgggccggaa agacatgaag ttttgaaaac ggttagggaa 240 ctggccgcct cggcctctgc tggcctcgcc ttagataaaa ga 282 <210> 43 <211> 522 <212> DNA <213> Artificial Sequence <220> <223> TFP 13 <400> 43 atgcaataca aaaagacttt ggttgcctct gctttggccg ctactacatt ggccgcctat 60 gctccatctg agccttggtc cactttgact ccaacagcca cttacagcgg tggtgttacc 120 gactacgctt ccaccttcgg tattgccgtt caaccaatct ccactacatc cagcgcatca 180 tctgcagcca ccacagcctc atctaaggcc aagagagctg cttcccaaat tggtgatggt 240 caagtccaag ctgctaccac tactgcttct gtctctacca agagtaccgc tgccgccgtt 300 tctcagatcg gtgatggtca aatccaagct actaccaaga ctaccgctgc tgctgtctct 360 caaattggtg atggtcaaat tcaagctacc accaagacta cctctgctaa gactaccgcc 420 gctgccgttt ctcaaatcag tgatggtcaa atccaagcta ccaccactac tttagcccct 480 ctggccgcct cggcctctgc tggcctcgcc ttagataaaa ga 522 <210> 44 <211> 204 <212> DNA <213> Artificial Sequence <220> <223> TFP 14 <400> 44 atgcaattca agaacgcttt gactgctact gctattctaa gtgcctccgc tctagctgct 60 aactcaacta cttctattcc atcttcatgt agtattggta cttctgccac tgctactgct 120 caagccaccg atagtcaagc ccaagctact actaccgcac ccctggccgc ctcggcctct 180 gctggcctcg ccttagataa aaga 204 <210> 45 <211> 471 <212> DNA <213> Artificial Sequence <220> <223> TFP 15 <400> 45 atggtatcga agacttggat atgtggcttc atcagtataa ttacagtggt acaggccttg 60 tcctgcgaga agcatgatgt attgaaaaag tatcaggtgg gaaaatttag ctcactaact 120 tctacggaaa gggatactcc gccaagcaca actattgaaa agtggtggat aaacgtttgc 180 gaagagcata acgtagaacc tcctgaagaa tgtaaaaaaa atgacatgct atgtggttta 240 acagatgtca tcttgcccgg taaggatgct atcaccactc aaattataga ttttgacaaa 300 aacattggct tcaatgtcga ggaaactgag agtgcgctta cattgacact aaacggcgct 360 acgtggggcg ccaattcttt tgacgcaaaa ctagaatttc agtgtaatga caatatgaaa 420 caagacgaac tggccgcctc ggcctctgct ggcctcgcct tagataaaag a 471 <210> 46 <211> 294 <212> DNA <213> Artificial Sequence <220> <223> TFP 16 <400> 46 atgaaattat ccgctctatt agctttatca gcctccaccg ccgtcttggc cgctccagct 60 gtccaccata gtgacaacca ccaccacaac gacaagcgtg ccgttgtcac cgttactcag 120 tacgtcaacg cagacggcgc tgttgttatt ccagctgcca ccaccgctac ctcggcggct 180 gctgatggaa aggtcgagtc tgttgctgct gccaccacta ctttgtcctc gactgccgcc 240 gccgctacaa ccctggccgc ctcggcctct gctggcctcg ccttagataa aaga 294 <210> 47 <211> 585 <212> DNA <213> Artificial Sequence <220> <223> TFP 17 <400> 47 atgaaattat caactgtcct attatctgcc ggtttagcct cgactacttt ggcccaattt 60 tccaacagta catctgcttc ttccaccgat gtcacttcct cctcttccat ctccacttcc 120 tctggctcag taactatcac atcttctgaa gctccagaat ccgacaacgg taccagcaca 180 gctgcaccaa ctgaaacctc aacagaggct ccaaccactg ctatcccaac taacggtacc 240 tctactgaag ctccaaccac tgctatccca actaacggta cctctactga agctccaact 300 gatactacta ctgaagctcc aaccaccgct cttccaacta acggtacttc tactgaagct 360 ccaactgata ctactactga agctccaacc accggtcttc caaccaacgg taccacttca 420 gctttcccac caactacatc tttgccacca agcaacacta ccaccactcc tccttacaac 480 ccatctactg actacaccac tgactacact gtagtcactg aatatactac ttactgtccg 540 gaacgggccg cctcggcctc tgctggcctc gccttagata aaaga 585 <210> 48 <211> 315 <212> DNA <213> Artificial Sequence <220> <223> TFP 18 <400> 48 atgcgtttct ctactacact cgctactgca gctactgcgc tatttttcac agcctcccaa 60 gtttcagcta ttggtgaact agcctttaac ttgggtgtca agaacaacga tggtacttgt 120 aagtccactt ccgactatga aaccgaatta caagctttga agagctacac ttccaccgtc 180 aaagtttacg ctgcctcaga ttgtaacact ttgcaaaact taggtcctgc tgctgaagct 240 gagggattta ctatctttgt cggtgtttgg ccactggccg cctcggcctc tgctggcctc 300 gccttagata aaaga 315 <210> 49 <211> 372 <212> DNA <213> Artificial Sequence <220> <223> TFP 19 <400> 49 atgcgtctct ctaacctaat tgcttctgcc tctcttttat ctgctgctac tcttgctgct 60 cccgctaacc acgaacacaa ggacaagcgt gctgtggtca ctaccactgt tcaaaaacaa 120 accactatca ttgttaatgg tgccgcttca actccagttg ctgctttgga agaaaatgct 180 gttgtcaact ccgctccagc tgccgctacc agtacaacat cgtctgctgc ttctgtagct 240 accgctgctt cctcttctga gaacaactca caagtttctg ctgccgcatc tccagcctcc 300 agctctgctg ctacatctac tcaatcttct ctggccgcct cggcctctgc tggcctcgcc 360 ttagataaaa ga 372 <210> 50 <211> 414 <212> DNA <213> Artificial Sequence <220> <223> TFP 20 <400> 50 atgcaatttt ctactgtcgc ttctatcgcc gctgtcgccg ctgtcgcttc tgccgctgct 60 aacgttacca ctgctactgt cagccaagaa tctaccactt tggtcaccat cacttcttgt 120 gaagaccacg tctgttctga aactgtctcc ccagctttgg tttccaccgc taccgtcacc 180 gtcgatgacg ttatcactca atacaccacc tggtgcccat tgaccactga agccccaaag 240 aacggtactt ctactgctgc tccagttacc tctactgaag ctccaaagaa caccacctct 300 gctgctccaa ctcactctgt cacctcttac actggtgctg ctgctaaggc tttgccagct 360 gctggtgctt tgctggccgc ctcggcctct gctggcctcg ccttagataa aaga 414 <210> 51 <211> 528 <212> DNA <213> Artificial Sequence <220> <223> TFP 21 <400> 51 atgaaattct cttccgcttt ggttctatct gctgttgccg ctactgctct tgctgagagt 60 atcaccacca ccatcactgc caccaagaac ggtcatgtct acactaagac tgtcacccaa 120 gatgctactt ttgtttgggg tggtgaagac tcttacgcca gcagcacttc tgccgctgaa 180 tcttctgccg ccgaaacttc tgccgccgaa acctctgctg ccgctaccac ttctgctgcc 240 gctaccactt ctgctgctga gacttcttct gctgctgaga cttcttctgc tgatgaaggt 300 tctggttcta gtatcactac cactatcact gccaccaaga acggtcacgt ctacactaag 360 actgtcaccc aagatgctac ttttgtctgg actggtgaag gcagcagcaa cacctggtct 420 ccaagtagta cctctaccag ctcagaagct gctacctctt ctgcttcaac cactgcaacc 480 accctgctgg ccgcctcggc ctctgctggc ctcgccttag ataaaaga 528 <210> 52 <211> 414 <212> DNA <213> Artificial Sequence <220> <223> TFP 22 <400> 52 atgaagttcc aagttgtttt atctgccctt ttggcatgtt catctgccgt cgtcgcaagc 60 ccaatcgaaa acctattcaa atacagggca gttaaggcat ctcacagtaa gaatatcaac 120 tccactttgc cggcctggaa tgggtctaac tctagcaatg ttacctacgc taatggaaca 180 aacagtacta ccaatactac tactgccgaa agcagtcaat tacaaatcat tgtaacaggt 240 ggtcaagtac caatcaccaa cagttctttg acccacacaa actacaccag attattcaac 300 agttcttctg ctttgaacat taccgaattg tacaatgttg cccgtgttgt taacgaaacg 360 atccaagata acctggccgc ctcggcctct gctggcctcg ccttagataa aaga 414 <210> 53 <211> 345 <212> DNA <213> Artificial Sequence <220> <223> TFP 23 <400> 53 atgcgtgcca tcactttatt atcttcagtc gtttctttgg cattgttgtc gaaggaagtc 60 ttagcaacac ctccagcttg tttattggcc tgtgttgcgc aagtcggcaa atcctcttcc 120 acatgtgact ctttgaatca agtcacctgt tactgtgaac acgaaaactc cgccgtcaag 180 aaatgtctag actccatctg cccaaacaat gacgctgatg ctgcttattc tgctttcaag 240 agttcttgtt ccgaacaaaa tgcttcattg ggcgattcca gcggcagtgc ctcctcatcc 300 gttctggccg cctcggcctc tgctggcctc gccttagata aaaga 345 <210> 54 <211> 510 <212> DNA <213> Artificial Sequence <220> <223> TFP 24 <400> 54 atgaaattat caactgtcct attatctgcc ggtttggcct cgactacttt ggcccaattt 60 tccaacagta catctgcttc ttccaccgat gtcacttcct cctcttccat ctccacttcc 120 tctggctcag taactatcac atcttctgaa gctccagaat ccgacaacgg taccagcaca 180 gctgcaccaa ctgaaacctc aacagaggct ccaaccactg ctatcccaac taacggtacc 240 tctactgaag ctccaaccac tgctatccca actaacggta cctctactga agctccaact 300 gatactacta ctgaagctcc aaccaccgct cttccaacta acggtacttc tactgaagct 360 ccaactgata ctactactga agctccaacc accggtcttc caaccaacgg taccacttca 420 gctttcccac caactacatc tttgccacca agcaacacta ccaccactct ggccgcctcg 480 gcctctgctg gcctcgcctt agataaaaga 510 <210> 55 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> GAL100 <400> 55 gtatatggtg gtaatgccat g 21 <210> 56 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> GT50R <400> 56 gtcattatta aatatatata tatatatatt gtcactccgt tcaagtcgac 50 <210> 57 <211> 345 <212> PRT <213> Artificial Sequence <220> <223> RML-3G#4 <400> 57 Val Pro Ile Lys Arg Gln Ser Asn Ser Thr Val Asp Ser Leu Pro Pro 1 5 10 15 Leu Ile Pro Ser Arg Thr Ser Ala Pro Ser Ser Ser Pro Ser Thr Thr 20 25 30 Asp Pro Glu Ala Pro Ala Met Ser Arg Asn Gly Pro Leu Pro Ser Asp 35 40 45 Val Glu Thr Asn Tyr Gly Met Ala Leu Asn Ala Thr Ser Tyr Pro Asp 50 55 60 Ser Val Val Gln Ala Met Ser Ile Asp Gly Gly Ile Arg Ala Ala Thr 65 70 75 80 Ser Gln Glu Ile Asn Glu Leu Thr Tyr Tyr Tyr Thr Thr Leu Ser Ala Asn 85 90 95 Ser Tyr Cys Arg Thr Val Ile Pro Gly Ala Thr Trp Asp Cys Ile His 100 105 110 Cys Asp Ala Thr Glu Asp Leu Lys Ile Ile Lys Thr Trp Ser Thr Leu 115 120 125 Ile Tyr Asp Thr Asn Ala Met Val Ala Arg Gly Asp Ser Glu Lys Thr 130 135 140 Ile Tyr Ile Val Phe Arg Gly Ser Ser Ser Ile Arg Asn Trp Ile Ala 145 150 155 160 Asp Leu Thr Phe Val Pro Val Ser Tyr Pro Pro Val Ser Gly Thr Lys 165 170 175 Val His Lys Gly Phe Leu Asp Ser Tyr Gly Glu Val Gln Asp Glu Leu 180 185 190 Val Ala Thr Val Leu Asp Gln Phe Lys Gln Tyr Pro Ser Tyr Lys Val 195 200 205 Ala Val Thr Gly His Ser Leu Gly Gly Ala Thr Ala Leu Leu Cys Ala 210 215 220 Leu Gly Leu Tyr Gln Arg Glu Glu Gly Leu Ser Ser Ser Asn Leu Phe 225 230 235 240 Leu Tyr Thr Gln Gly Gln Pro Arg Val Gly Asp Pro Ala Phe Ala Asn 245 250 255 Tyr Val Val Ser Thr Gly Ile Pro Tyr Arg Arg Thr Val Asn Glu Arg 260 265 270 Asp Ile Val Pro His Leu Pro Pro Ala Ala Phe Gly Phe Leu His Ala 275 280 285 Gly Glu Glu Tyr Trp Ile Thr Asp Asn Ser Pro Glu Thr Val Gln Val 290 295 300 Cys Thr Ser Asp Leu Glu Thr Ser Asp Cys Ser Asn Ser Ile Val Pro 305 310 315 320 Phe Thr Ser Val Leu Asp His Leu Ser Tyr Phe Gly Ile Asn Thr Gly 325 330 335 Leu Cys Thr His His His Asp His His 340 345 <210> 58 <211> 1038 <212> DNA <213> Artificial Sequence <220> <223> RML-3G#4 <400> 58 gtgccaatca agagacaatc aaacagcacg gtggatagtc tgccacccct catcccctct 60 cgaacctcgg caccttcatc atcaccaagc acaaccgacc ctgaagctcc agccatgagt 120 cgcaatggac cgctgccctc ggatgtagag actaattatg gcatggcttt gaatgctact 180 tcctatccgg attctgtggt ccaagcaatg agcattgatg gtggtatccg cgctgcgacc 240 tcgcaagaaa tcaatgaatt gacttattac actacactat ctgccaactc gtactgccgc 300 actgtcattc ctggagctac ctgggactgt atccactgtg atgcaacgga ggatctcaag 360 attatcaaga cttggagcac gctcatctat gatacaaatg caatggttgc acgtggtgac 420 agcgaaaaaa ctatctatat cgttttccga ggttcgagct ctatccgcaa ctggattgct 480 gatctcacct ttgtgccagt ttcatatcct ccggtcagtg gtacaaaagt acacaaggga 540 ttcctggaca gttacgggga agttcaagac gagcttgttg ctactgttct tgatcaattc 600 aagcaatatc caagctacaa ggttgctgtt acaggtcact cactcggtgg tgctactgcg 660 ttgctttgcg ccctgggtct ctatcaacga gaagaaggac tctcatccag caacttgttc 720 ctttacactc aaggtcaacc acgggtaggc gaccctgcct ttgccaacta cgttgttagc 780 accggcattc cttacaggcg cacggtcaat gaacgagata tcgttcctca tcttccacct 840 gctgcttttg gttttctcca cgctggcgag gagtattgga ttactgacaa tagcccagag 900 actgttcagg tctgcacaag cgatctggaa acctctgatt gctctaacag cattgttccc 960 ttcacaagtg ttcttgacca tctctcgtac tttggtatca acacaggcct ctgtactcat 1020 caccatgacc atcactaa 1038 <210> 59 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> MJ706 <400> 59 tagataaaag atctgttgtg ccaatcaaga ga 32 <210> 60 <211> 341 <212> PRT <213> Artificial Sequence <220> <223> SV-RML-3G#4 <400> 60 Ser Val Val Pro Ile Lys Arg Gln Ser Asn Ser Thr Val Asp Ser Leu 1 5 10 15 Pro Pro Leu Ile Pro Ser Arg Thr Ser Ala Pro Ser Ser Ser Pro Ser 20 25 30 Thr Thr Asp Pro Glu Ala Pro Ala Met Ser Arg Asn Gly Pro Leu Pro 35 40 45 Ser Asp Val Glu Thr Asn Tyr Gly Met Ala Leu Asn Ala Thr Ser Tyr 50 55 60 Pro Asp Ser Val Val Gln Ala Met Ser Ile Asp Gly Gly Ile Arg Ala 65 70 75 80 Ala Thr Ser Gln Glu Ile Asn Glu Leu Thr Tyr Tyr Thr Thr Leu Ser 85 90 95 Ala Asn Ser Tyr Cys Arg Thr Val Ile Pro Gly Ala Thr Trp Asp Cys 100 105 110 Ile His Cys Asp Ala Thr Glu Asp Leu Lys Ile Ile Lys Thr Trp Ser 115 120 125 Thr Leu Ile Tyr Asp Thr Asn Ala Met Val Ala Arg Gly Asp Ser Glu 130 135 140 Lys Thr Ile Tyr Ile Val Phe Arg Gly Ser Ser Ser Ile Arg Asn Trp 145 150 155 160 Ile Ala Asp Leu Thr Phe Val Pro Val Ser Tyr Pro Pro Val Ser Gly 165 170 175 Thr Lys Val His Lys Gly Phe Leu Asp Ser Tyr Gly Glu Val Gln Asp 180 185 190 Glu Leu Val Ala Thr Val Leu Asp Gln Phe Lys Gln Tyr Pro Ser Tyr 195 200 205 Lys Val Ala Val Thr Gly His Ser Leu Gly Gly Ala Thr Ala Leu Leu 210 215 220 Cys Ala Leu Gly Leu Tyr Gln Arg Glu Glu Gly Leu Ser Ser Ser Asn 225 230 235 240 Leu Phe Leu Tyr Thr Gln Gly Gln Pro Arg Val Gly Asp Pro Ala Phe 245 250 255 Ala Asn Tyr Val Val Ser Thr Gly Ile Pro Tyr Arg Arg Thr Val Asn 260 265 270 Glu Arg Asp Ile Val Pro His Leu Pro Pro Ala Ala Phe Gly Phe Leu 275 280 285 His Ala Gly Glu Glu Tyr Trp Ile Thr Asp Asn Ser Pro Glu Thr Val 290 295 300 Gln Val Cys Thr Ser Asp Leu Glu Thr Ser Asp Cys Ser Asn Ser Ile 305 310 315 320 Val Pro Phe Thr Ser Val Leu Asp His Leu Ser Tyr Phe Gly Ile Asn 325 330 335 Thr Gly Leu Cys Thr 340 <210> 61 <211> 1023 <212> DNA <213> Artificial Sequence <220> <223> SV-RML-3G#4 <400> 61 tctgttgtgc caatcaagag acaatcaaac agcacggtgg atagtctgcc acccctcatc 60 ccctctcgaa cctcggcacc ttcatcatca ccaagcacaa ccgaccctga agctccagcc 120 atgagtcgca atggaccgct gccctcggat gtagagacta attatggcat ggctttgaat 180 gctacttcct atccggattc tgtggtccaa gcaatgagca ttgatggtgg tatccgcgct 240 gcgacctcgc aagaaatcaa tgaattgact tattacacta cactatctgc caactcgtac 300 tgccgcactg tcattcctgg agctacctgg gactgtatcc actgtgatgc aacggaggat 360 ctcaagatta tcaagacttg gagcacgctc atctatgata caaatgcaat ggttgcacgt 420 ggtgacagcg aaaaaactat ctatatcgtt ttccgaggtt cgagctctat ccgcaactgg 480 attgctgatc tcacctttgt gccagtttca tatcctccgg tcagtggtac aaaagtacac 540 aagggattcc tggacagtta cggggaagtt caagacgagc ttgttgctac tgttcttgat 600 caattcaagc aatatccaag ctacaaggtt gctgttacag gtcactcact cggtggtgct 660 actgcgttgc tttgcgccct gggtctctat caacgagaag aaggactctc atccagcaac 720 ttgttccttt acactcaagg tcaaccacgg gtaggcgacc ctgcctttgc caactacgtt 780 gttagcaccg gcattcctta caggcgcacg gtcaatgaac gagatatcgt tcctcatctt 840 ccacctgctg cttttggttt tctccacgct ggcgaggagt attggattac tgacaatagc 900 ccagagactg ttcaggtctg cacaagcgat ctggaaacct ctgattgctc taacagcatt 960 gttcccttca caagtgttct tgaccatctc tcgtactttg gtatcaacac aggcctctgt 1020 act 1023

Claims (13)

리파제를 코딩하는 핵산을 포함하는 리파제 분비 발현 카세트로서, 상기 리파제는 서열번호 1의 아미노산 서열에서 N-말단으로부터 52 번째 아미노산이 아스파라긴(Asn)으로 치환되고 190 번째 아미노산이 아스파르트산(Asp)으로 치환된, 리파제 분비 발현 카세트.
As a lipase secretion expression cassette containing a nucleic acid encoding a lipase, the lipase is substituted with asparagine (Asn) for the 52nd amino acid from the N-terminus in the amino acid sequence of SEQ ID NO: 1 and the 190th amino acid with aspartic acid (Asp) , Lipase secretion expression cassette.
삭제delete 제1항에 있어서, 상기 리파제 분비 발현 카세트는 단백질 분비 융합인자를 코딩하는 핵산을 추가적으로 포함하는 것인, 리파제 분비 발현 카세트.
The lipase secretion expression cassette of claim 1, wherein the lipase secretion expression cassette further comprises a nucleic acid encoding a protein secretion fusion factor.
제3항에 있어서, 상기 단백질 분비 융합인자는 서열번호 10의 TFP 4, 서열번호 14의 TFP 8, 서열번호 19의 TFP 13, 서열번호 25의 TFP 19로 이루어진 군으로부터 선택되는 것인, 리파제 분비 발현 카세트.
The method of claim 3, wherein the protein secretion fusion factor is selected from the group consisting of TFP 4 of SEQ ID NO: 10, TFP 8 of SEQ ID NO: 14, TFP 13 of SEQ ID NO: 19, and TFP 19 of SEQ ID NO: 25, lipase secretion Expression cassette.
제4항에 있어서, 상기 단백질 분비 융합인자 TFP 19는 서열번호 25의 아미노산 서열에서 N-말단으로부터 109 번째 아미노산이 트레오닌(Thr)으로 치환된, 리파제 분비 발현 카세트.
The lipase secretion expression cassette according to claim 4, wherein the protein secretion fusion factor TFP 19 has an amino acid sequence 109 from the N-terminus in the amino acid sequence of SEQ ID NO: 25 is substituted with threonine (Thr).
제1항에 있어서, 상기 리파제는 서열번호 1의 아미노산 서열에서 N-말단으로부터 52 번째 아미노산이 아스파라긴(Asn)으로 치환되고 190 번째 아미노산이 아스파르트산(Asp)으로 치환된 아미노산 서열에서 N-말단에 세린(serine) 및 발린(valine)으로 이루어지는 아미노산 서열이 추가된, 리파제 분비 발현 카세트.
The method of claim 1, wherein the lipase is at the N-terminus in the amino acid sequence in which the 52nd amino acid from the N-terminus in the amino acid sequence of SEQ ID NO: 1 is substituted with asparagine (Asn) and the 190th amino acid is substituted with aspartic acid (Asp). A lipase secretion expression cassette to which an amino acid sequence consisting of serine and valine is added.
제1항, 제3항 내지 제6항 중 어느 한 항의 리파제 분비 발현 카세트를 포함하는, 발현벡터.
An expression vector comprising the lipase secretion expression cassette of any one of claims 1 and 3 to 6.
제7항의 발현 벡터가 포함된, 형질전환 미생물.
A transformant microorganism containing the expression vector of claim 7.
제8항에 있어서, 상기 형질전환 미생물은 효모인 것인, 형질전환 미생물.
The transforming microorganism according to claim 8, wherein the transforming microorganism is yeast.
제9항에 있어서, 상기 효모는 캔디다 (Candida), 디베리오마이세스 (Debaryomyces), 한세눌라 (Hansenula), 클루이베로마이세스 (Kluyveromyces), 피키아 (Pichia), 스키조사카로마이세스 (Schizosaccharomyces), 야로이야 (Yarrowia), 사카로마이세스 (Saccharomyces), 슈완니오마이세스 (Schwanniomyces) 및 아르술라 (Arxula) 속으로 이루어진 군으로부터 선택되는 것인, 형질전환 미생물.
10. The method of claim 9, wherein the yeast is Candida (Candida), di berry Oh, my process (Debaryomyces), Hanse Cronulla (Hansenula), Cluj Vero My process (Kluyveromyces), Pichia (Pichia), ski irradiation Caro My process (Schizosaccharomyces) , Yarrowia ( Yarrowia ), Saccharomyces ( Saccharomyces ), Schwanniomyces ( Schwanniomyces ) and Arsula ( Arxula ) that is selected from the group consisting of the genus, a transforming microorganism.
(i) 제8항 내지 제10항 중 어느 한 항의 형질전환 미생물을 배양하는 단계; 및
(ii) 상기 배양된 미생물 또는 이의 배양 상등액으로부터 리파제를 회수하는 단계;를 포함하는, 리파제 제조방법.
(i) culturing the transformed microorganism according to any one of claims 8 to 10; And
(ii) recovering lipase from the cultured microorganism or a culture supernatant thereof; containing, lipase production method.
서열번호 1의 아미노산 서열에서 N-말단으로부터 52 번째 아미노산이 아스파라긴(Asn)으로 치환되고 190 번째 아미노산이 아스파르트산(Asp)으로 치환된, 전이에스터 활성 및 분비 발현능이 증가된 변이형 리파제.In the amino acid sequence of SEQ ID NO: 1, the 52nd amino acid from the N-terminus is substituted with asparagine (Asn) and the 190th amino acid is substituted with aspartic acid (Asp), and the transesterification activity and secretion expression ability are increased. 삭제delete
KR1020190138830A 2018-11-01 2019-11-01 Mutant lipases of Rhizomucor miehei having enhanced transesterification activity and a method of producing the lipase KR102181315B1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20180132934 2018-11-01
KR1020180132934 2018-11-01

Publications (2)

Publication Number Publication Date
KR20200050438A KR20200050438A (en) 2020-05-11
KR102181315B1 true KR102181315B1 (en) 2020-11-20

Family

ID=70729598

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190138830A KR102181315B1 (en) 2018-11-01 2019-11-01 Mutant lipases of Rhizomucor miehei having enhanced transesterification activity and a method of producing the lipase

Country Status (1)

Country Link
KR (1) KR102181315B1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2024044062A (en) * 2022-09-20 2024-04-02 花王株式会社 Lipase variants

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100475133B1 (en) * 2002-09-13 2005-03-10 한국생명공학연구원 Method for screening of a lipase having improved enzymatic activity using yeast surface display vector and the lipase
KR101460228B1 (en) * 2011-11-18 2014-11-10 한국생명공학연구원 Mutant lipase with advanced activity and process for production bio-diesel using the same
KR101803013B1 (en) * 2014-05-27 2017-12-04 주식회사 제노포커스 New Lipase Signal Sequences and Expression Method Using The Same

Also Published As

Publication number Publication date
KR20200050438A (en) 2020-05-11

Similar Documents

Publication Publication Date Title
Takahashi et al. Extracellular production of active Rhizopus oryzae lipase by Saccharomyces cerevisiae
US7247463B2 (en) Enzymes with lipase/acyltransferase activity, nucleic acids encoding the same and methods of use thereof
CN108239648B (en) Method for efficiently expressing rhizomucor miehei lipase
EP1275711B1 (en) Lipase/acyltransferase from Candida parapsilosis
JP2022515531A (en) Pichia pastoris mutant strain for expressing foreign genes
KR102181315B1 (en) Mutant lipases of Rhizomucor miehei having enhanced transesterification activity and a method of producing the lipase
KR102170228B1 (en) A mutant lipase having enhanced transesterification activity and its application for biodiesel production
KR101779890B1 (en) A microorganism having enhanced levan fructotransferase productivity and a method of producing difructose anhydride IV using the microorganism
KR102237465B1 (en) Recombinant yeast secreting inulosucrase and a method of producing fructooligosaccharides
KR101837130B1 (en) Novel lipase from yeast Candida butyri SH-14 and the Use thereof
CN109609486B (en) Fumarase mutant and application thereof
Lim et al. Recombinant production of an inulinase in a Saccharomyces cerevisiae gal80 strain
Simatupang et al. Lipolytic activity of Itb1. 1 and Lk3 thermostable lipases expressed in Escherichia coli and Pichia pastoris
Li et al. Overexpression of an inulinase gene in an oleaginous yeast, Aureobasidium melanogenum P10, for efficient lipid production from inulin
KR102613936B1 (en) Kexin enzyme with reduced autolysis and production method thereof
KR101775226B1 (en) Fatty acid double bond hydratases acting in periplasm and process for producing hydroxy fatty acids using thereof
Yin et al. Construction of a shuttle vector for heterologous expression of a novel fungal α-amylase gene in Aspergillus oryzae
KR20200028555A (en) A novel biological method for producing sugar alcohols from agar
KR102613937B1 (en) Yeast strain in which all genes involved in galactose utilization are deleted and method for producing recombinant protein using the same
KR20130027984A (en) Mutant beta-glucosidase with advanced activity and process for preparing bio-ethanol employing the same
KR102577306B1 (en) Enzyme complex for decomposing polyethylene terephthalate and manufacturing method thereof
RU2728240C1 (en) Method for producing secreted fully functional phospholipase a2 in saccharomyces cerevisiae yeast, a precursor protein for implementing said method (versions)
US8187835B2 (en) Method for producing protein
KR101897189B1 (en) Lipase derived from Penicillium chrysogenum and preparation method of lipase using the same
JPH09505989A (en) .ALPHA.-1,4-Glucan lyase from fungi, its purification, gene cloning and microbial expression

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant