KR20130098150A

KR20130098150A - 유전자 모자이크 제조 방법

Info

Publication number: KR20130098150A
Application number: KR1020127029534A
Authority: KR
Inventors: 루디 팬드제이탄; 알레잔드로 루크
Original assignee: 에비아제닉스 에스.에이.
Priority date: 2010-04-09
Filing date: 2011-04-08
Publication date: 2013-09-04
Also published as: US8912127B2; DK2478100T3; PL2478100T3; BR112012025858A2; CA2795246A1; ES2445565T3; PT2478100E; WO2011124693A1; EP2647710A1; EP2478100A1; JP2013524785A; US20130090246A1; HRP20140079T1; CN102933710A; AU2011237547A1; SG184470A1; EP2478100B1

Abstract

본 발명은
a) 단일 단계 절차로서,
(i) 세포 유전체의 삽입(integral) 부분이거나 유전적 구조의 골격에 존재하는 재조합되는 다른 유전자와 99.5% 미만의 서열 상동성을 가지는 적어도 하나의 유전자 A로 세포를 형질전환하고;
(ii) 상기 유전자들을 재조합하고;
(iii) 목적 유전체의 삽입 위치에 유전자들의 유전자 모자이크를 생성하며, 상기 적어도 하나의 유전자 A는 상기 삽입 위치의 5' 말단 또는 3' 말단에 고정하는 5' 말단 또는 3' 말단에 단일 인접 목적 서열(single flanking target sequence)을 갖는 단계; 및
b) 유전자 모자이크를 포함하는 클론들을 선택하는 단계를 포함하는, 체세포 내 재조합(somatic in vivo recombination)을 통한 유전자 모자이크(gene mosaic) 제조 방법에 관한 것이자, 유전자 모자이크와 유전자 조립체의 다양성을 생산하는 방법에 관한 것이다.

Description

유전자 모자이크 제조 방법 {METHOD OF GENERATING GENE MOSAICS}

본 발명은 부분 상동성 생체 내 재조합에 의해 유전자 모자이크를 제조하는 방법에 관한 것이다.

단백질 설계의 주요한 목표 중의 하나는 새롭거나 개선된 특성을 갖는 단백질을 만드는 것이다. 단백질이나 효소에 원하는 활성을 부여하는 능력은 화학 또는 약학 산업에서 상당히 실용적인 응용을 갖는다. 방향적 단백질 진화(directed protein evolution)는 요구되는 특성을 가진 클론을 실험적으로 변이체 라이브러리에서 탐색하는 단백질 공학에서 강력한 기술 플랫폼으로 떠오르고 있다.

방향적 단백질 진화는 자연에서 찾을 수 없는 요구되는 특성을 가진 단백질 또는 핵산의 진화를 위해 자연 선택(natural selection)의 힘을 이용한다. 단백질 돌연변이와 변이체를 생성하고 요구되는 기능을 선별하기 위해 다양한 기술들이 이용된다. DNA 재조합기술은 빠른 증식 및/또는 고차원 단백질 생산을 위해 단일 구조 유전자 또는 전체 경로에 대한 유전자를 적절한 대리 숙주에 전이하는 것이 가능하게 했다. 활성 또는 다른 특성에 축적된 개선점들은 일반적으로 돌연변이와 스크리닝의 반복을 통해 얻어진다. 단백질의 안정성을 향상시키고 활성 또는 효소와 유기체의 능력을 증진시키거나 또는 효소 기질 특이성을 변화시키고 새로운 활성들을 고안하는 방향적 진화의 적용은 주로 학교 및 산업 실험실에서 찾아진다. 대부분의 방향적 진화 계획들은 농업, 의학 또는 산업적 맥락(생체 촉매)에서 인류에게 유용한 특성을 발전시키는 것을 추구한다.

모든 대사 과정의 진화는 특히 매력적인 개념인데, 왜냐하면 대부분의 자연적 그리고 새로운 화합물은 단일 효소에 의해서라기 보다는 경로에 의해서 생산되기 때문이다. 대사 경로 공학(metabolic pathways engineering)은 일반적으로 경로에 있는 모든 효소의 협조된 조작을 필요로 한다. 새로운 대사 경로들의 진화 그리고 생물학적 제조법의 증진은 일반적으로 재조합과 스크리닝 또는 개별 유전자들, 전체 플라스미드들, 다유전자 클러스터들(multigene clusters), 또는 전체 유전체들을 진화시키기 위한 선택의 반복적인 순환 과정 통해 수행된다.

Shao 외 다수(Nucleic Acids Research 37(2):e16 Epub 2008 Dec 12)는 사카로미세스 세레비시아(Saccharomyces cerevisiae)에서 인접 단편의 5' 및 3' 말단에서 서열을 가지고 있는 5' 및 3' 말단들에서 두 인접 (고정) 부위의 생체 내 상동성 재조합을 통한 단일 단계로 전체 생화학 경로 또는 유전체를 암호화하고 있는 대형 재조합 DNA의 조립체에 대해 기술한다.

Elefanty 외 다수(Proc. Natl. Acad. Sci. 95, 11897-11902 (1998))는 lacZ 보고 유전자(reporter gene)가 SCL 자리로 넉-인(knock-in)된 돌연변이 생쥐를 만들기 위한 유전자 적중 실험(gene targeting experiments)들에 대해 기술한다. 참고문헌은 두 고정 서열, 즉, 5' 및 3' 말단의 각각 하나씩인 것을 사용하는 SCL-lacZ 유전자 적중 전략을 도시하는 도 1로 만들어졌다.

방향적 진화는, 생체 내 진화(in vivo evolution)라고도 불리는, 살아 있는 세포들에서 수행될 수 있거나, 또는 세포를 전혀 수반하지 않을 것이다 (실험관 내 진화; in vitro evolution). 생체 내 진화는 관계된 단백질 또는 핵산이 살아있는 유기체에서 이용될 때, 유용한 세포 환경에서의 특성을 선택하는 장점을 가진다. 효모에서 생체 내 상동성 재조합은 유전자 클로닝, 플라스미드 구성, 및 라이브러리 생성에 널리 이용되어 왔다.

라이브러리 다양성은 돌연변이 생성 또는 재조합을 통해 얻어진다. DNA 뒤섞음(DNA shuffling)은 다수의 유전자들로부터 유용한 돌연변이의 직접적인 재조합을 가능하게 한다. DNA 뒤섞음에서 DNA 서열들의 집단은 무작위적으로 조각나고 이어 전체 길이의 혼성 서열로 다시 조립된다.

자연적으로 발생하는 상동성 재조합을 위하여 상동 유전자가 다양성이 시작되는 원천으로 이용된다. 단일-유전자 뒤섞음 라이브러리(single-gene shuffling library) 구성원들은 전형적으로 95% 이상 동일하다. 하지만, 계통-뒤섞음(family shuffling)은 전형적으로 60% 이상 동일한 서열들의 블록 교환(block exchange)을 가능하게 한다. 기능적 서열 다양성은 자연 선택에서 살아 남아온 관계된 부모의 서열로부터 기인한; 따라서, 더 많은 수의 돌연변이들은 구조나 기능에 유해한 효과의 도입 없이 주어진 서열에서 용인된다.

최대 30%까지 다양성을 가진 서로 다른 유래의 DNA 단편들의 재조합은 국제출원공보 제WO1990007576A1호에 기술되어 있다. 혼성 유전자는 부정합 보수 (mismatch repair; MMR) 결실 박테리아 또는 부정합 보수 체계가 일시적으로 불활성되어 있는 박테리아에서 속간(intergeneric) 및/또는 종간(interspecific) 재조합에 의해 생체 내에서 생산된다. 그렇게 함으로써, 상이한 서열 사이에 재조합, 즉 부분 상동성 재조합 빈도에 억제 효과를 가질 수 있는 손상된 DNA가 보수되는 과정들이 회피된다.

MMR의 기초적인 메커니즘의 고찰은 Kunz 외 다수(Cell. Mol. Life Sci. 66 (2009) 1021-1038)에 의해 제공된다.

MMR 결실 식물들에서의 표적된 부분 상동성 재조합(targeted homeolougous recombination)은 국제출원공보 제WO2006/134496A2호에 기술되어 있다. 최대 10%의 차이를 가진 서열을 가지고 있는 자리(locus)에 표적되는 것은 가능했다.

폴리뉴클레오티드 라이브러리의 생성을 위한 박테리아로의 상동성 재조합은 국제특허 제WO03/095658A1호에서 밝혀졌다. 폴리뉴클레오티드 및 숙주 세포 유전체 부위에 상동성을 가지는 두 인접 서열을 포함하는 비복제 선형 삽입 카세트(non-replicating linear integration cassette)를 이용한, 수용 박테리아 숙주 세포(competent bacterium host cell)의 유전체 안으로의 상동성 재조합을 통해 각 폴리뉴클레오티드를 삽입하여 그곳에 폴리뉴클레오티드들의 발현 라이브러리(expression library)가 생성되었다.

배수체(diploid) 유기체의 형성으로 유도하는 반수체(haploid) 세포의 효율적 교배 능력의 장점을 취함으로써 라이브러리들의 다양성은 증진될 수 있다. 그의 영양 생활 주기(vegetative life cycle)에서 S. 세레비시아(s. cerevisiae) 세포들은 반수체 유전체를 가지며, 즉 모든 염색체가 단일 사본(single copy)으로 존재한다. 특정 상태 하에서 반수체 세포들은 교배할 수 있다. 이러한 방법에 의해 배수체 세포가 형성된다. 배수체 세포들은 다시 반수체 세포들을 형성할 수 있으며, 특히 어떤 영양분들이 사라졌을 때 그러하다. 그리고 나서 그들은 감수 분열(meiosis)이라고 하는 과정에 이어 네 개의 반수체 포자를 형성하는 포자 형성(sporulation)을 겪는다. 감수 분열 동안에 두 부모 유전체들의 서로 다른 염색체가 재조합한다. 감수 분열 재조합 동안에 DNA 단편이 교환되어 재조합된 DNA 물질이 야기된다.

국제출원공보 제WO2005/075654A1호는 S. 세레비시아의 유성 생식 주기(sexual reproductive cycle)에 기초를 둔, 사카로미세스 세레비시아에서 재조합 DNA 서열들을 생성하기 위한 시스템을 기술하고 있다. 이형접합 배수체 세포들(heterozygous diploid cells)은 감수 분열 및 포자 형성의 과정들이 유도하는 상태 하에서 성장한다. 감수 분열은 일반적으로 유전적 재조합의 증가된 빈도에 의해 특징지어진다. 따라서, 반수체 세포 또는 포자와 같은 감수 분열의 생산물들은 두 분기된 DNA 서열 사이의 재조합에 따른 재조합 DNA 서열들을 가질 수 있다. 반복적인 방법에 의해서 재조합 반수체 자손은 다른 하나에 선택되고 교배되며, 결과로 초래된 배수체는 다시 포자 형성되고, 그리고 그들의 자손 포자는 새로운 재조합 현상을 확인하기 위한 적절한 선택 환경에 종속된다. 이 과정은 야생형(wild-type) 또는 부정합 보수 결손 S. 세레비시아 세포에서 기술된다. 그러므로, 두 선택 표지자(marker)에 의해 각각 인접된, 관심 있는 유전자는 부정합 보수 결실 배수체 계통의 두 딸 염색체(sister chromosome)의 각각의 동일한 자리에 삽입된다. DNA가 삽입되어야 하는 자리의 인접한 DNA 서열에 대해 100% 동일한 새로운 DNA 단편의 5’ 또는 3’ 말단에 DNA 서열이 덧붙여 진다. 이러한 인접 목적 서열들은 약 400-450 뉴클레오티드 길이이다. 이어서 세포는 포자 형성을 시작하도록 강요된다. 포자 형성 중에 재조합 과정이 일어난다. 수득된 포자들과 재조합 서열들은 적절한 인접 표지자들에 대한 선택에 의해 구분될 수 있다.

상동성 DNA 서열을 효율적으로 재조합하는 효모의 능력은 라이브러리의 다양성을 증가시키는 것에도 활용될 수 있다. 89.9% 상동성을 공유하는 두 유전자가 PCR에 의해 돌연변이가 되고 야생형 효모에 형질전환되었을 때, 생체 내 상동성 재조합을 통해, 두 유전자를 통틀어 몇 개의 교차점들(cross-over points)이 보이는 10의 7승 개의 키메라 라이브러리(chimeric library)가 만들어 진다(Swers et al Nucleic Acids Research 32(3) e36 (2004)).

유사 분열 상동성 재조합(mitotic homologous recombination)의 방법은 Nicholson 외 다수(Genetics 154: 133-146 (2000))에 의해 기술되었다. 야생형 또는 MMR-결손 계통에서 짧은 역반복을 포함하는 정해진 부정합의 재조합율에 대한 효과가 연구되었다.

특히, 본 발명의 목적은 유전자 모자이크의 다양성을 마련하고 조립하는, 긴 DNA 단편들을 재조합하기 위한 개선된 방법을 제공하는 것이다. 그 결과 개선된 재조합체의 선택을 위한 각각의 변이체 라이브러리를 제공할 것이 바람직하다.

본 목적은 본 출원의 실시양태들의 제공에 의해서 달성된다.

본 발명은

a) 단일 단계 절차로서,

(i) 세포 유전체의 삽입 부분이거나 또는 유전적 구조의 골격에 존재하는 재조합되는 다른 유전자와 99.5% 미만의 서열 상동성을 가지는 적어도 하나의 유전자 A로 세포를 형질전환하고;

(ii) 상기 유전자를 재조합하고;

(iii) 목적 유전체의 삽입 위치에 유전자들의 유전자 모자이크를 생성하며, 상기 적어도 하나의 유전자 A는 상기 삽입 위치의 5’ 말단 또는 3’ 말단에 고정하는 5’ 말단 또는 3’ 말단 중 어느 하나에 단일 인접 목적 서열을 갖는 단계; 및

b) 유전자 모자이크를 포함하는 클론들을 선택하는 단계를 포함하는, 체세포 내 재조합을 통한 새로운 유전자 모자이크 제조 방법을 제공한다.

구체적으로 본 발명은

a) 단일 단계 절차에서

(i) 세포 유전체의 삽입 부분이거나 또는 유전적 구조의 골격에 존재하거나 또는 발현 카세트(expression cassette)인 재조합되는 다른 유전자 B와 99.5% 미만의 서열 상동성을 가지는 적어도 하나의 유전자 A로 세포를 형질전환하고;

(ii) 상기 유전자를 재조합하고;

(iii) 목적 유전체의 삽입 위치에 A 및 B의 유전자 모자이크를 생성하며, 상기의 적어도 하나의 유전자 A는 상기 삽입 위치의 5’ 말단 또는 3’ 말단에 고정하는 유전적 구조의 5’ 말단 또는 3’말단 중 어느 하나에 단일 인접 목적 서열에 연결되는 단계; 및

b) 유전자 모자이크를 포함하는 클론들을 선택하는 단계를 포함하는, 체세포 내 재조합을 통한 유전자 모자이크 제조 방법에 관한 것이다.

특히, 선택 표지자가 유전자 모자이크에서 사용되고, 선택 표지자의 존재에 따라 클론이 선택되는 것이 바람직하다. 예를 들면, 유전자 모자이크는 선택 표지자를 포함하는데, 예를 들어 상기 유전자 A는 선택 표지자에 연결된다. 이와 달리, 선택은 재조합의 결과인 어떤 생산물의 존재에 의해서, 예를 들어 수율 또는 기능적 특징을 결정하는 것을 통해서 이루어 질 수 있다. 구체적으로 하나 또는 그 이상의 다른 선택 표지자들이 유전자 모자이크들의 타입을 구분하기 위해 이용될 수 있다.

구체적으로 본 발명에 따른 방법은 목적 유전체, 예를 들면 세포 유전체의 일부인 상기 또 다른 유전자를 사용할 것이다. 바람직한 실시양태에서 상기 또 다른 유전자는 세포 유전체의 일부인 유전자 B이다.

또 다른 바람직한 실시예에 따르면, 상기 또 다른 유전자는 목적 유전체로부터 분리된 선형 폴리뉴클레오티드와 같은 유전적 구조이고, 그리고 선택적으로 재조합의 과정에서 목적 유전체로 삽입된다.

본 발명의 구체적인 실시양태에 따르면 세포는 적어도 하나의 유전자 A 및 적어도 하나의 유전자 B로 동시 형질전환(co-transform) 되는데, 유전자 A의 상기 단일 인접 목적 서열은 상기 목적 유전체 위의 삽입 위치의 5’ 말단에 고정되고, 그리고 상기의 유전자 B는 삽입 위치의 3’ 말단에 고정하는 단일 인접 목적 서열에 연결된다.

구체적으로, 세포는 선택 표지자를 가진 적어도 하나의 유전자 A 및 적어도 하나의 유전자 B로 동시 형질전환 될 수 있는데, 상기의 유전자 A의 단일 인접 목적 서열은 상기 목적 유전체 위의 삽입 위치의 5’ 말단에 고정되고, 그리고 상기 유전자 B는 서로 다른 선택 표지자와 연결되고, 그리고 상기 클론은 적어도 두 개의 선택 표지자에 의해 선택된다.

구체적으로, 세포는 적어도 두 개의 서로 다른 유전자 A1 및 A2와 그리고 선택으로 적어도 두 개의 서로 다른 유전자 B1 및 B2로 동시 형질전환될 수 있다.

구체적 실시양태에 따르면, 유전자 A 및/또는 상기의 또 다른 유전자와 추가적인 유전자 C 와의 조립체을 얻기 위해서, 유전자 A의 서열 및/또는 상기의 또 다른 유전자와 혼성화하는 서열을 가진 적어도 하나의 추가적인 유전자 C가 동시 형질전환 된다.

구체적으로, 유전자 A 및/또는 B와 상기의 추가적인 유전자 C와의 재조합과 조립체을 얻기 위해서 유전자 A 및/또는 B의 서열과 혼성화하는 서열, 예를 들어 유전자 A 또는 B의 전체 길이 또는 A 및/또는 B의 부분 서열을 가진 적어도 하나의 추가적인 유전자 C가 동시 형질전환된다.

구체적으로, 상기의 유전자 C의 혼성화 서열은 상기의 서열에 대해 99.5% 미만의 서열 상동성을, 바람직하게는 적어도 30%의 서열 상동성을 가진다.

구체적으로, 유전자들 사이에서 적어도 하나의 뉴클레오티드 교환 또는 교차를 갖는 유전자 모자이크가 선택되는데, 즉, 다른 측면에서 생산물의 발현에 적합한, 예를 들면 개선된 특성 또는 향상된 수율을 가지고 있는 그러한 유전자들의 재조합된 유전자 내 유전자 모자이크를 얻기 위한 부분 유전자들의 혼합물로 이해되는, 유전자 A의 부분들 및 상기의 또 다른 유전자의 부분들을 포함하는 유전자 내 교차를 가진 모자이크이다.

바람직한 실시양태에 따르면, 세 개의 서로 다른 유전자 A 및/또는 B 및/또는 C의 모자이크가 얻어질 수 있다.

바람직하게는, 상기 유전자 A 및/또는 상기 또 다른 유전자는 폴리펩티드 또는 활성을 가진 폴리펩티드의 일부분을 암호화하고 있다.

구체적으로, 본 발명된 방법은 활성을 가진 폴리펩티드의 일부분을 암호화하고 있는 유전자 A, B 및/또는 C를 이용한다. 따라서, A 및/또는 B 및/또는 C 유전자와 같은 유전자들, 바람직하게는 그것들 모두가 개별적으로 보통 말하는 생물학적 활성 펩타이드를 암호화하지는 않지만, 그 일부분만을 암호화하고 있을 것이며, 그리고 유전자 조립체에서만 각각의 활성 또는 변형된 활성을 나타낼 수 있을 것이다.

본 발명의 방법을 이용하여, 생화학적 경로의 폴리펩티드들을 암호화하는 여러 유전자들은 조립되거나 재조합될 수 있다.

또 다른 구체적인 실시양태에서, 본 발명된 방법은 비암호화 서열, 예를 들어 개시자(promotor), 비번역 영역(untranslated region), 리보좀 결합 위치(ribosomal binding site), 종결자(terminator) 등을 생기게 하는 유전자의 재조합 및 최종적인 조립체을 제공한다.

어떠한 재조합 수용 진핵 또는 원핵 숙주 세포도 본 발명에 따라 체세포 내 재조합에 의해 유전자 모자이크 생성에 이용될 수 있다. 본 발명의 바람직한 실시양태에 따르면, 세포는 수선 결실 세포, 예를 들면 DNA 보수 결실 또는 MMR 결실 세포와 같은 핵산 수선 결실 세포이다.

구체적으로, 세포는 진핵세포, 바람직하게는 균류, 포유류 또는 식물 세포, 또는 원핵 세포이다.

바람직하게는 세포는 아스페르길루스 속(Aspergillus sp) 또는 균류 세포이고, 바람직하게는 사카로미세스 속(Saccharomyces), 칸디다 속(Candida), 클루이베로미세스 속(Kluyveromyces), 한세눌라 속(Hansenula), 스키조사카로미세스 속(Schizosaccaromyces), 야로이야 속(Yarrowia), 피치아 속(Pichia) 및 아스페르길루스 속(Aspergillus)으로 구성된 군에서 선택될 수 있다.

바람직하게는 반수체 효모 균주와 같은, 반수체 균주가 이용될 수 있다.

이와 달리, E. coli , Bacillus , Streptomyces와 같은 원핵 세포, 또는 헬라(HeLa) 세포 또는 저캣(Jurkat) 세포와 같은 포유류 세포, 또는 애기장대와 같은 식물세포가 사용될 수 있다.

구체적인 실시양태에 따르면, 근접 목적 서열은 적어도 5 bp, 바람직하게는 적어도 10 bp, 더 바람직하게는 적어도 20 bp, 50 bp, 100 bp, 최대 5,000 bp까지의 길이이다. 구체적으로 인접 목적 서열은 상기 목적 유전자에 연명되거나, 상기 유전자의 말단 부분이다. 상기 인접 목적 서열은 상기 삽입 위치의 고정 서열과 혼성화하는, 30% 내지 99.5%, 바람직하게는 95% 미만, 90% 미만, 80% 미만의 범위 상동성을 갖는 것이 바람직하다.

유전체의 목적 삽입 부위에 부착하는 적어도 두 서로 다른 인접 목적 서열이 본 발명에 따라 이용되었을 때, 그들은 서로 재조합되지 않고, 바람직하게는 30% 미만의 상동성을 공유하는 것이 바람직하다.

본 발명의 방법에 유용한 선택 표지자는 알려진 영양 요구성 표지자(nutrition auxotrophic markers), 항생제 내성 표지자(antibiotics resistance markers), 형광 표지자(fluorescent markers), 넉-인 표지자(knock-in markers), 활성자/부착 도메인 표지자(activator/binding domain markers), 및 우성 열성 표지자(dominant recessive markers) 및 비색 표지자(colorimetric markers)의 어떤 것으로든 구성된 군에서 선택될 수 있다. 바람직한 표지자는 일시적으로 불활성화되거나 또는 기능적으로 넉-아웃(knocked out)될 수 있으며, 그 표지하는 특성을 다시 얻어 재건될 수 있을 것이다. 더욱 바람직한 표지자는 추적할 수 있는 유전자들인데, 상기의 표지자는 표지자 기능과 분리된 서열들이 없이 유전자 서열 A 및/또는 유전자 B와 같은, 또 다른 유전자(들) 중 하나의 기능이고, 그래서 유전자 모자이크의 발현이 모자이크 그 자신의 검출에 의해 직접적으로 결정될 수 있다. 이러한 경우에 유전자 모자이크는 직접적으로 추적 가능하다.

구체적인 실시양태에 따르면, 상기 유전자는 선형 폴리뉴클레오티드, 벡터 또는 효모 인공 염색체에 포함된다. 구체적으로, 재조합되는 유전자 A 및/또는 또 다른 유전자는 바람직하게는 300 내지 20,000 bp의 선형 폴리뉴클레오티드의 형태이다. 구체적으로, 플라스미드들이나 메가플라스미드들(megaplasmids)를 구성하거나 사용할 필요는 없을 것이다. 그러므로 유전자(들)는 보통 말하는, 다른 말로는 운반체(carrier) 없이 이용될 수 있을 것이다.

재조합과 삽입에 이용되는 유전자들은 또한 어떤 유전적 구조, 예를 들면 상기의 유전자(들)를 운반하는 벡터로 쓰이는 것에 포함될 수 있다. 상기의 유전자는 이와 같이 유전적 구조, 예를 들면 선형 폴리뉴클레오티드, 벡터 또는 효모 인공 염색체에 포함될 수 있다. 이들은 바람직하게는 선형 폴리뉴클레오티드들, 플라스미드들, PCR 구조물들(PCR constructs), 인공 염색체들, 효모 인공 염색체 유사물, 바이러스 벡터들(viral vectors) 또는 운반 가능한 요소들(transposable elements)을 포함한다.

본 발명의 구체적인 실시양태에 따라 목적 유전체의 삽입 위치는 유전자들 중, 예를 들면 선형 폴리뉴클레오티드, 플라스미드, 또는 인공 염색체를 포함하는 염색체 중에 있다.

본 발명에 따른 방법은 구체적으로 유전자 내 유전자 모자이크를 가지고 있는 적어도 하나의 클론에 대한 선택을 제공한다. 구체적으로는, 유전자 조립체와 적어도 하나의 유전자 내 유전자 모자이크를 가지고 있는 적어도 하나의 클론이 선택된다.

본 발명에 따른 방법을 이용하여 적어도 3, 바람직하게는 적어도 9, 최대 20,000 염기쌍들의 유전자 모자이크를 얻을 수 있고, 예를 들어 적어도 하나의 유전자 내 모자이크를 포함하는, 유전자 모자이크는 바람직하게는 적어도 3개의 교차 현상들, 바람직하게는 적어도 4, 5, 또는 10 개의 교차 현상들을 700 염기쌍 당, 더 바람직하게는 600 bp 당, 500 bp 당, 또는 그 이하까지도 마찬가지로 얻을 수 있다. 적당한 라이브러리 구성원을 선택하는 라이브러리를 생산하는데 사용될 수 있는, 전형적으로 높은 정도의 교차 현상은 재조합 유전자의 큰 다양성을 제공한다. 모자이크들 또는 교차 현상들의 정도는 그러한 라이브러리의 질적 변수로서 이해될 수 있다.

본 발명의 방법에 따라 변형된 유전자는 과학적으로 또는 산업적 목적들을 위한 어떠한 유전자도 가능하다. 예를 들면 재조합 발현 시스템에 쓰일 수 있는 그런 비암호화 서열들, 또는 폴리펩티드의 변이체들, 전체 또는 일부, 생물학적 활성을 가지는 폴리펩티드를 암호화하지 않는 그러한 부분 서열을 포함하여, 폴리펩티드들은 구체적으로 효소들, 항체들 또는 그의 일부들, 사이토카인들, 백신 항원들, 성장 인자들 또는 펩티드들로 구성된 집단에서 이러한 유전자들은 선택되는 것이 가능하다. "부분 유전자”라고도 하는, 비암호화 서열을 암호화하고 있거나 또는 생물학적 활성을 가지고 있는 폴리펩티드의 부분인 아미노산 서열의 유전자가 변형되었다면, 그러한 부분 유전자들의 조립체는 기능적 특성을 가지게 되는 것, 예를 들면 생물학적 활성을 가지고 있는 폴리펩티드를 암호화하는 것이 바람직할 것이다. 크기 범위 3 bp에서 최대 20,000까지에서, 구체적으로는 적어도 100 bp, 바람직하게는 300에서 20,000 bp, 구체적으로는 최대 10,000 bp까지의, 예를 들어 향상된 생물학적 활성을 가지는, 예를 들어 유리하게 변형된 생물학적 활성을 가지는, 비암호화 또는 암호화 재조합 폴리펩티드인 재조합된 유전자 서열을 생산하기 위한 재조합되는 서로 다른 유전자들의 수는 적어도 2, 더 구체적으로는 적어도 3, 4, 5, 6, 7, 8, 9, 또는 적어도 10 개의 바람직하게 다수의 서로 다른 유전자들이 재조합된다. 효소 활성과 관련하여 사용하는 본 용어 “생물학적 활성”은 구체적으로 특별히 특정한 기질을 특정한 생산물로 바꾸는 활성과 같은, 효소 활성을 말한다. 본 발명에 따라 다양화되는 바람직한 유전자들은 다중 사슬 플리펩티드들이다.

본 발명의 특정한 실시양태에 따라, 발명을 따른 방법을 이용하여 세포들에서 유전자 모자이크들의 다양성을 만드는 것, 및 모자이크들의 라이브러리를 얻기 위해 상기의 세포들의 표면에 상기의 다양성을 보이는 것을 포함하는 유전자 변이체들의 세포 디스플레이 방법이 제공된다.

그런 바람직한 디스플레이로 얻을 수 있는 라이브러리는 구체적으로 기능적 열린 해독틀(open reading frame; ORF) 안에서 유전자 모자이크들의 높은 비율, 바람직하게는 적어도 80%를 포함한다.

본 발명에 따른 라이브러리는 구체적으로 어떠한 적절한 형태, 구체적으로 유전자 변이체들을 가진 다양한 유기체들을 포함하는 생물학적 라이브러리도 가능할 수 있다. 본 발명에 따른 생물학적 라이브러리는 가져지거나 및/또는 개별 유기체들이 적어도 하나의 라이브러리 구성원을 포함하고 있는 그러한, 유기체들의 레퍼토리를 만드는 유기체들의 집단에 의해서 구체적으로 발현된다.

본 발명의 구체적 측면에 따라, 그러한 라이브러리로부터의 유전자 변이체를 포함하는 유기체, 예를 들어 유기체들의 레퍼토리로부터 선택된 유기체를 추가적으로 제공한다. 본 발명을 따라 제공되는 유기체는 적절한 발현 시스템, 예를 들면 생산 숙주 세포에서 유전자 발현 생산물을 발현할 것이다.

그러므로, 본 발명은 부분 상동성 DNA 서열들, 즉 유사하지만 동일하지 않은 서열들의 생체 내 재조합을 위한 새롭고 효율이 높은 방법에 관한 것이다. 부분 상동성 서열들이 재조합될 경우, 때때로 부분 상동성 재조합이라 일컬어진, 이하 용어 상동성 재조합은 동일하거나 동일하지 않은 일정한 상동성을 가지는 서열들의 재조합을 말한다. 위치 특이적인 절단(digestion) 및 연결(ligation)에 의존하는 기존의 클로닝 접근법과는 달리, 상동성 재조합은 상보적인 서열들을 정렬하고, 단편들 사이의 교환을 가능하게 한다. 혼성화 유전자들이라고도 하는, 재조합 모자이크 유전자들은 부정합 염기를 가진 서열들의 혼성화를 통해 세포 내에서 생성된다. 그러한 독창적인 돌연변이 생성 방법에 의해 적절한 선택을 위한 다양성을 용이하게 만드는 것과 및 관심 있는 폴리펩티드들을 시간 면에서 효율적인 방식으로 다시 디자인(redesign)하는 것이 가능하다.

본 발명에 따른 용어 “단일 단계 절차”는 유전자로 세포들을 형질전환, 유전자들의 재조합 모자이크 유전자의 생성, 및 목적 유전체로의 유전자 삽입과 같은 재조합체들을 제조하는 몇 가지 과정의 단계들이 하나의 방법 단계에서 수행되는 것을 의미한다. 따라서, 생체 내 재조합에 앞서 DNA 운반체의 시험관 내 재조합, 또는 감수분열을 이용하는 것을 포함하여 과정 단계들의 어떠한 반복 주기들도 필요하지 않을 것이다. 유리하게는, 감수분열 효모 세포들의 이용을 피할 수 있다.

본 발명에 따른 단일 단계 절차는 동시에 숙주에 의한 상기 조작된 재조합체의 발현 또한 포함할 수도 있다. 그럼으로써 발현 생산물을 얻기 위한 추가적인 조작은 필요하지 않을 것이다.

본 발명에 따른 용어 “유전자 모자이크(gene mosaic)”는 적어도 한 번의 교차 현상에 의한 적어도 두 개의 서로 다른 유전자들의 재조합을 의미한다. 구체적으로 그러한 교차는 DNA 서열들의 재조합 또는 혼합을 제공한다. 유전자 모자이크는 유전자(들)의 유전자 내 혼합, 유전자 내 유전자 모자이크, 및/또는 유전자 조립, 부가적으로 유전자 내 및 유전자 간 교차(들) 또는 유전자 모자이크(들) 둘 다 가진 유전자들의 조립에 의해 만들어질 것이다.

본 용어 “교차(cross-over)”는 두 개의 DNA 가닥들이 유전적 정보, 즉 적어도 하나의 뉴클레오티드를 교환할 수 있는 위치에서 유전자들 사이의 재조합을 말한다. 교차 과정은 부모 유전자들로부터 유래한 유전자들 또는 서열들의 서로 다른 조합들을 가지고 있는 자손 모자이크 유전자들로 이어진다.

이와 달리, 교차에 기반하지 않는 다른 수선 메커니즘들, 예를 들어 뉴클레오티드 삭제 수선 또는 부정확한 뉴클레오티드들의 인지, 삭제 및 /또는 교체 후의 가닥들의 연결을 포함하는 비 상동성 말단 결합 메커니즘들을 제공할 것이다.

본 발명에 따른 용어 “인접 목적 서열(flanking target sequence)”은 재조합될 유전자 A(들) 및/또는 다른 유전자(들), 선형 폴리뉴클레오티드들, 선형 또는 원형 플라스미드들, YAC 및 그와 유사한 것들을 포함하는 유전체의 목적 삽입 위치 같은 관심 있는 목표에 상보적인 뉴클레오티드 서열의 영역을 말한다. 구체적인 상보성 또는 상동성 정도에 따라, 인접 목적 서열은 유전자들을 혼성화하고, 목적 삽입 위치로 유전자를 삽입할 것이다.

본 발명에 따른 용어 세포의 “유전체(genome)”는 예를 들면, 재조합되는 유전자 A 및/또는 다른 유전자(들)을 포함하는 선형 폴리뉴클레오티드들, 바이러스, 자가 복제 운반자들 및 벡터, 플라스미드, 및 인공 염색체 및 유사한 것들을 포함하는 수송 가능한 물질들과 같은 염색체 또는 비 염색체 유전 물질들 중 하나, 유전자들 및 DNA의 비 암호화 서열들에 의해 나타나는 유기체의 유전적 정보의 총체를 말한다. 인공 염색체는 세포로 도입하는데 안정적인 유지에 필요한 모든 서열을 가지고 있는 선형 또는 원형 DNA 분자이고, 자연 염색체와 유사하게 행동하며, 그래서 유전체의 한 부분처럼 여겨진다.

본 발명에 따른 용어 “상동성(homologous)”은 둘 또는 그 이상의 뉴클레오티드 서열들이 (일정한 정도, 최대 100%) 상응하는 위치에서 동일 또는 보전된 염기쌍을 가지는 것을 가리킨다. 본 발명에서 사용되는 상보적(complementary), 적절한(corresponding) 또는 짝을 이룬(matching) 서열이라고도 불리는, 상동 서열은 예를 들면, 각각의 상보적 서열과, 전체 길이의 원형 DNA 서열 또는 DNA 서열의 단편에 대해 적어도 30%의 서열 유사성, 그러나 99.5% 미만의 서열 유사성을 가지는, 가능하다면 95% 미만, 90% 미만, 85% 미만, 80% 미만의 상동성의 대칭 서열과 바람직하게 여기서 밝힌 대로 혼성화된다.

바람직하게는, 상동성 서열은 적어도 30%의 뉴클레오티드 서열 유사성, 바람직하게는 적어도 약 40%의 유사성, 더 바람직하게는 적어도 약 50%의 유사성, 더 바람직하게는 적어도 60%의 유사성, 더 바람직하게는 적어도 70%의 유사성, 더 바람직하게는 적어도 80%의 유사성, 더 바람직하게는 적어도 90%의 유사성, 더 바람직하게는 적어도 95%의 유사성을 가질 것이다. 바람직한 상하한 범위는 위에 언급한대로 서열 유사성에 부합하는 30% 내지 99.5%의 범위이다. 여기에서 쓰인 것처럼, 유사성의 정도는 언제나 상보 서열들에 대해서도 마찬가지로 해당한다.

유전자의 뉴클레오티드 서열에 따른 “백분율(%) 유사성”은 서열 유사성의 부분으로서 어떤 보수적인 치환을 고려하지 않은 후에, 서열을 정렬하고 최대 비율의 서열 유사성을 달성하기 위해, 필요하다면 공백을 끼워넣고, 후보 DNA 서열에서 해당 DNA 서열의 뉴클레오티드들과 동일한 뉴클레오티드들의 백분율로 정의된다. 뉴클레오티드 서열 유사성의 비율 결정을 목적으로 하는 정렬은 해당 기술분야에서 사용하는 여러 가지 방법, 예를 들면, 공개적으로 이용 가능한 컴퓨터 소프트웨어를 이용함으로써 달성될 수 있다. 당업자는 정렬을 측정하기 위해 적절한 변수, 비교되는 서열의 전체 길이 위에 최선의 정렬을 달성하기 위해 필요한 특정 알고리즘를 결정할 수 있다.

본 발명에 따른 용어 “고정(anchoring)”은 해당 유전자 또는 유전자 모자이크의 유전체의 삽입 위치로의 삽입을 가능케 하기 위해, 부분 또는 완전한 서열 상동성을 가지는 “고정 서열”이라고 하는 조각을 통해 삽입 서열로 유전자 또는 유전자 모자이크를 부착하는 것을 의미한다. 구체적으로 고정 서열은 인접 목적 위치와 상동성을 가지거나 또는 유전체 서열의 삽입 위치와 부분 상동성을 가질 수 있다. 바람직한 고정 서열은 바람직하게는 유전체의 혼성화 부분과 적어도 약 70% 서열 상동성을 목적 통합 위치에 가지고, 더 바람직하게는 적어도 80%, 90%, 95%, 최대 99.55%까지 또는 완전히 합치되는 상동성을 갖는다.

삽입 위치는 재조합 현상의 높은 빈도가 일어나는 적절한 숙주 유전체의 위치로 정해질 수 있다. 바람직한 위치는, 예를 들면, S. 세레비시아의 염색체 3번 위에 BUD31-HCM1 장소이다. 일반적으로, 높은 빈도의 재조합율을 보이지만, 세포 생존율에는 변화를 주지 않는 효모 염색체 상의 추가적인 어떤 장소도 바람직하다.

본 용어 “발현(expression)” 또는 “발현 시스템(expression system)” 또는 “발현 카세트(expression cassete)”는 작동할 수 있게 연결한 원하는 암호화 서열 및 조절 서열들을 가지고 있어, 이러한 서열들로 형질전환 또는 형질전이된 숙주가 암호화된 단백질들을 생산할 수 있는 핵산 분자들을 말한다. 형질전환에 미치는 효과 때문에, 발현 시스템은 벡터에 포함될 수 있다; 그러나 해당 DNA는 또한 숙주 염색체에 삽입될 수도 있다.

본 발명에 따른 용어 “유전자”는 특히 부분 유전자들인 유전자의 DNA 단편들을 포함할 것이다. 단편은 또한 동일한 ORF 또는 상이한 ORF의 반복인 몇 개의 개방형 해독틀을 포함한다. 상기 용어는 구체적으로 비암호화 뉴클레오티드 서열, 예를 들면, 비전사 또는 비번역 서열, 암호화 되는 폴리펩티드 전체 또는 부분을 포함한다.

본 발명에 따른 용어 “유전자 A”는 비암호화 서열 또는 폴리펩티드 또는 관심 있는 폴리펩티드를 암호화 하는 어떠한 뉴클레오티드 서열도 의미할 수 있다. 유전자 A는 바람직하게는 적어도 표지자 서열을 포함하고 하나의 인접 목적 서열을 유전자 A의 5’ 말단 또는 3’ 말단에 가지고 있거나 또는 유전적 구조를 가진 발현 카세트, 선형 폴리뉴클레오티드, 플라스미드 및 벡터와 같은, 유전자 구조의 골격에 나타나는 것을 특징으로 한다. 본 발명의 방법에서 유전자 A는 전형적으로 유전자 모자이크 형성을 위해 재조합되는 유전자들의 연속들 중에서 첫 유전자이다. 유전자 A는 재조합되는 다른 유전자들과 상동성을 갖는데, 결국 유전자 A, 또는 어떠한 경우에는 유전자 B, C, D, E, F, G, H 등의 어떤 유전자들의 변이체일 수 있다. 그럼으로써 반드시 유전자 A 당 하나의 인접 목적 서열 은 전형적으로 최대의 충실한 목적을 위해 제공된다. 유전자 A의 변이체는 A1, A2, A3 등으로 불리는데, 그것은 일정 정도의 서열 상동성을 가지고 있고, 부가적으로 유사한 기능 특성을 가진다. 본 용어 “적어도 한 유전자 A”는 적어도 하나의 유전자 A와 유전자 A의 변이체를 의미할 것이다.

본 발명에 따른 용어 “유전자 B”는 다른 유전자와 재조합되는 유전자와 유전자 모자이크 형성을 위해 선택된 비암호화 서열 또는 폴리펩티드나 관심있는 폴리펩티드를 암호화 하는 서열의 어떤 뉴클레오티드 서열을 의미할 수 있는데, 결국 유전자 A, 유전자 B의 변이체, 또는 어떤 경우에는 유전자 C, D, E, F, G, H 등 중 어떤 것일 수도 있다. 유전자 B는 유전자 A 또는 다른 유전자에 대해 재조합되는 유전자 A 또는 다른 유전자들과 모자이크 형성이 가능한 특정 정도로 상동이다. 본 발명에 따른 방법에서 유전자 B는 유전자 모자이크를 만들기 위해 일련의 재조합되어야 하는 유전자들 중에 일반적으로 마지막 유전자이다. 유전자 B는 세포 유전체에서 삽입 부분이거나, 유전자의 반대쪽을 의미하는 유전자 A의 인접 목적 서열의 반대 대칭되는 부분으로서 , 유전자 B의 5’ 말단 또는 유전적 구조 중 하나에 적어도 하나의 표지자 서열을 포함하고 단일 인접 목적 서열을 가진 발현 카세트, 선형 폴리뉴클레오티드, 플라스미드 또는 벡터와 같은 유전자 구조에 골격일 수 있다. 그러므로 반드시 유전자 B 당 하나의 인접 목적 서열이 일반적으로 최대의 충실한 목적을 위해 제공된다. 유전자 B는 유전자 A의 변이체일 수 있다. 유전자 B의 변이체는 B1, B2, B3 등으로 불리는데, 그것은 특정 정도의 서열 상동성을 가지고 있고, 그리고 부가적으로 비슷한 기능적 특성을 가지고 있다. 본 용어 “적어도 하나의 유전자 B”는 적어도 유전자 B 및 부가적으로 유전자 B의 변이체를 의미할 것이다.

본 발명에 따른 용어 “유전자 C”는 비암호화 서열의 어떤 뉴클레오티드 서열 또는 암호화 폴리펩티드를 서열 또는 관심있는 폴리펩티드를 의미한다. 유전자 C는 유전작 구조의 골격에서 나타나고, 발현 카세트, 선형 폴리뉴클레오티드, 플라스미드 또는 벡터인 것이 특징인데, 부가적으로 표지자 서열을 포함하며, 그리고 유전자 A 및/또는 유전자 B, 유전자 C의 변이체 또는 어떠한 경우에는 궁극적으로 유전자 D, E, F, G, H 등의 뉴클레오티드의 단편으로 추가적 특징이 된다. 유전자 C는 바람직하게 단일 측위 목적 서열, 유전자 C의 5’ 말단과 3’ 말단, 또는 양쪽에 모두 측위 목적 서열을 갖는다. 그럼으로써 유전자 C는 부분적으로 또는 온전하게 유전자 A 및/또는 재조합, 연결 및 조립되는 다른 유전자들과 혼성화된다. 본 발명에 따른 방법에서 유전자 C는 전형적으로 유전자 모자이크를 형성하기 위해 재조합될 일련의 유전자들 중에서 유전자 A에 이은 두 번째 유전자이다. 유전자 C의 변이체들은 C1, C2, C3 등으로 불리는데, 그것들은 어느 정도의 서열 상동성 및, 부가적으로 유사한 기능 특성을 가진다.

추가적인 유전자 D는 그의 뉴클레오티드 서열 또는 유전자 C의 서열, 유전자 D의 변이체 또는 궁극적으로 다른 유전자 A, B, E, F, G, H 등과의 상동성이 있는 뉴클레오티드 서열의 단편을 통해 추가적으로 재조합되고 조립될 것이며, 경우에 따라 각각의 재조합 및 연결을 제공할 것이다. 유전자 D는 바람직하게 단일 측위 목적 서열, 유전자 D의 5’ 말단과 3’ 말단, 또는 양쪽에 모두 측위 목적 서열을 갖는다. 본 발명에 따른 방법에서 유전자 D는 전형적으로 유전자 모자이크를 형성하기 위해 재조합될 일련의 유전자들 중에서 유전자 C에 이은 다음 유전자이다. 유전자 D의 변이체들은 D1, D2, D3 등으로 불리는데, 그것들은 어느 정도의 서열 상동성 및, 부가적으로 유사한 기능 특성을 가진다.

추가적인 유전자 E는 그의 뉴클레오티드 서열 또는 유전자 D의 서열, 유전자 E의 변이체 또는 궁극적으로 다른 유전자 A, B, C, F, G, H 등과의 상동성이 있는 뉴클레오티드 서열의 단편을 통해 추가적으로 재조합되고 조립될 것이며, 경우에 따라 각각의 재조합 및 연결을 제공할 것이다. 유전자 E는 바람직하게 단일 측위 목적 서열, 유전자 E의 5’ 말단과 3’ 말단, 또는 양쪽에 모두 측위 목적 서열을 갖는다. 본 발명에 따른 방법에서 유전자 E는 전형적으로 유전자 모자이크를 형성하기 위해 재조합될 일련의 유전자들 중에서 유전자 D에 이은 유전자이다. 유전자 E의 변이체들은 E1, E2, E3 등으로 불리는데, 그것들은 어느 정도의 서열 상동성 및, 부가적으로 유사한 기능 특성을 가진다.

추가적인 유전자 F, G, H 등은 상황에 따라 사용될 수 있다. 일련의 추가 유전자는 알파벳 문자의 개수에 의해 제한되지 않도록 이해된다. 관심있는 유전자의 마지막 사슬은 유전체의 통합 위치에서 유전자 조립을 얻기 위한 유전자 A 및 B의 연결을 통해 얻어질 것이다. 그렇게 조립된 관심있는 유전자는 관심있는 폴리펩티드와 대사체에 각각 부합하는 발현을 지원할 수 있도록 작동 가능하도록 연결될 것이다. 조립의 구체적인 방법은 심지어 많은 수의 DNA 단편들을 조립하는 생체 내 재조합에 의해 카세트의 조합을 이용하는데, 실제적인 크기의 원하는 DNA 분자를 얻기 위해서이다. 중첩 서열을 나타내는 카세트는 원하는 서열 전체를 덮기 위해 적절히 고안된다. 일 실시예에서 바람직한 중첩은 적어도 5 bp, 바람직하게는 적어도 10 bp이다. 다른 실시예에서, 중첩은 적어도 15, 바람직하게는 20에서 최대 1,000 bp일 수 있다.

바람직한 일 실시양태에서, 일부 카세트는 구분을 할 수 있게 하는 표지자 서열을 가지도록 고안된다. 전형적으로 표지자 서열은 최종적으로 원하는 핵산 서열에 생물학적 효과가 최소화되도록 트랜스포존(transposon) 삽입이 허용되는 위치에 자리한다.

구체적인 실시양태에서 숙주 세포는 중첩 서열로 핵산의 DNA 단편이나 많은 수의 유전자조차 재조합이나 또는 조립이 가능한데, 예를 들면 상기의 유전자 또는 단편의 혼합물 및 배양된 상기의 재조합되거나 또는 조립되는 전이될 서열의 숙주 세포로 동시 형질전환에 의해 숙주 세포에서 적어도 2, 바람직하게는 3, 4, 5, 6, 7, 8, 9, 더 바람직하게는 적어도 10 개의 유전자 또는 핵산단편이 가능하다.

본 발명에 따라 이용되는 유전자 또는 DNA 단편, 전체 유전자 또는 부분은 이중 사슬 또는 단일 사슬 모두일 수 있다. 이중 사슬 핵산 서열은 일반적으로 300-20,000 염기쌍이고 단일 사슬 단편은 일반적으로 짧거나 40에서 10,000 핵산 범위일 수 있다. 예를 들면, 2 Mb에서 최대 500 Mb 까지 정도의 조립체는 효모에서 조립될 수 있다.

다수의 유기체에서 온 유전체 서열은 공중이 이용할 수 있으며, 본 발명에 따른 방법으로 이용될 수 있다. 이러한 유전체 서열은 바람직하게는 특이적 다양성을 가진 상동성 서열을 제공하는 숙주 세포 또는 다른 종의 서로 다른 계통들로부터 획득된 정보를 포함한다.

재조합을 위한 기질로써 사용되는 초기 유전자는 일반적으로 유전자의 변이체 형태로 구성되는 폴리뉴클레오티드의 모음이다. 변이체 형태는 기질들 사이에 상동성 재조합을 가능하게 하는 각자에게 충분한 필수적인 서열 특성을 보여준다. 폴리뉴클레오티드 사이의 다양성은 자연적일 수 있는데, 예를 들면, 대립형질 또는 종들의 변이체이고, 유도될 수 있는데, 예를 들면, 오류가 생기기 쉬운 PCR 또는 오류가 생기기 쉬운 반복적인 서열 재조합, 또는 실험관 내 재조합의 결과이다. 다양성은 대체 코돈 용법으로써 자연의 단백질을 암호화하고 있는 재합성 유전자로부터의 결과일 수도 있다. 시작 물질들이 있는 것보다 재조합이 더 다양한 생산물들을 생성할 수 있는 기질들 사이에 적어도 적당한 다양성이 있어야 한다. 적어도 하나 이상의 위치에서 다른 적어도 두 기질이 있어야 한다. 다양성의 정도는 재조합될 기질의 길이에 의존적이고 그리고 기능 변화의 정도는 진화될 수 있다. 위치의 다양성은 최대 69%인 것이 일반적이다.

본 발명의 방법에 따라 유전자 A, B, C, 및 추가 유전자는 상동성을 적어도 혼성화를 위해 고안된 특이적 단편에서 적어도 30% 공유하는 것이 바람직한데, 그것은 전체 길이의 유전자를 포함할 것이다. 바람직한 상동성 백분율은 적어도 40%, 더 바람직하게는 적어도 50%, 더 바람직하게는 적어도 60%, 더 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더 바람직하게는 적어도 90%, 더욱 더 바람직하게는 적어도 95% 최대 99.5% 미만이다.

단순히 조립하는 것 또한 바람직할 수 있는데, 예를 들면, 함께 잇는 것 그리고 부가적으로 유전자 변이체와 유전자를 섞는 것, 더 큰 유전자들을 다양하게 만드는 것, 예를 들면, 개별 대사 과정의 구성원 또는 본 방법에 따라 대사 과정의 다수를 조립하는 것일 수 있다. 자연에 존재하지 않는 대사 과정은 이러한 방법으로 만들어 질 수 있다. 그래서, 하위의 효소가 결핍된 다른 유기체에 의해 생산되는 원하는 기질에 작용하는 하나의 유기체에 존재하는 효소는 같은 유기체에 재조합 효소를 얻기 위한 유전자 또는 부분 유전자의 조립체을 만드는 방식으로써 암호화될 수 있다. 그래서 여러 효소들은 복잡한 대사 과정을 구성하는 것을 포함할 수 있다. 이는 과정에서 그들의 기능에 따라 정렬되어야 하는 폴리펩티드 클러스터든지 또는 부분 폴리펩티드든지 이익이 된다. 모범적인 흥미있는 유전자 과정들은 산업적으로 관심있는 플라보놀(flavonol), 매크로라이드(macrolides), 폴리케티드(polyketides)와 같은 이차 대사체의 합성을 위한 암호화된 효소들이다.

아울러, 조합 라이브러리는 효소 또는 다른 단백질을 암호화 하고 있는 다른 끼어 있는 서열을 제외하고, 하나 또는 그 이상의 단편들이 같은 혼성화 서열들로 제공되는 단편의 혼합에 의한 것이 바람직할 수 있다.

유전적 경로는 조합 라이브러리의 각 구성원들이 유전자 변이체의 다른 조합을 가지고 있는 조합 방식으로 구성될 수 있다. 예를 들면, 서로 다른 단편들이 조합되고 조립되어, 변이체의 조합 라이브러리는 상기 서로 다른 단편들 각각은 몇 개의 변이체를 갖는 개별 DNA 요소들로 구성될 수 있다. 대사 경로의 재조합 및 조립은 성공적인 조작을 증명할 표지자 서열의 존재가 필요하지 않을 것이다. 원하는 방향으로의 대사체의 발현은 이미 작업 예에 나타냈다. 예를 들면, 성공적인 재조합 및 조립은 세포 배양 배지에서 이차 대사체의 검출에 의해 확인될 수 있다.

대장균(E. coli) 또는 바실러스 속(Bacillus sp)과 같은 박테리아 숙주 세포, 사카로미세스 세레비시아와 같은 효모 숙주 세포들, 사포돕테라 프루지페르다와 같은 곤충 숙주 세포들, 또는 헬라 및 저캣과 같은 인간 숙주 세포를 포함하는, 원핵 및 진핵 숙주 세포 둘 모두는 공지된 방법과 함께 사용이 고려된다.

바람직한 숙주 세포들은 칸디다 속, 피치아 속 및 사카로미세스 속에서 온 것과 같은 반수체 세포들이다.

본 발명의 방법은 유성 세대 또는 감수 분열 재조합을 사용하지 않을 것이다. DNA 단편들은 반수체 세포들로 형질전환 될 수 있다. 형질전환체는 즉각적으로 선택 플레이트들에서 흔적을 나타낼 수 있다. 그리고 나서 재조합체는 PCR 또는 틈새 수선과 같은 다른 방법에 의해 분리될 것이다.

어떤 야생형 또는 DNA 또는 RNA 보수와 같은, 핵산 보수 결실된 것들을 포함하는 보수 결실 원핵 또는 진핵 세포들에서 본 발명의 단계는 이루어질 수 있다. 야생형 세포들에서, 부분 상동성 재조합을 허용하는 적합한 삽입 위치가 선택된다. 야생형 세포들에서 수행되는 본 발명에 따른 방법은 적어도 80%, 바람직하게는 적어도 90% 서열 유사성을 갖는 유전자 A 및 B와 같은, 유전자들의 재조합을 바람직하게 제공한다. 손상되고 부정합된 DNA는 일반적으로 보수되고 재조합은 차단되지만, 놀랍게도 삽입 부위에서의 부분 상동성 재조합은 야생형 세포들에서만큼이나 가능하다는 것이 밝혀졌다.

부정합 보수 시스템의 돌연변이들 또는 변형들은 세포들에서 재조합의 빈도를 촉진할 것이다. 이와 달리, 재조합을 촉진할 수 있는 DNA 보수 유전자들 rad1, recQ의 완전한 또는 일시적인 넉-아웃과 같은 다른 보수 결실 시스템들은 사용될 수 있다.

DNA 보수 결실 세포들은 본 발명에 따른 방법에 바람직하게 사용된다. 예로서, 부정합 보수는 완전히 또는 일시적으로 넉-아웃될 수 있거나, 또는 조건화 되거나 목적 재조합이 수행되는 동안 또는 후에 세포가 배양되는, 세포 배양 배지에 특정 기질들의 첨가에 의해 유도될 수 있다. 구체적으로, 세포의 MMR 결실은 부정합 보수와 관련된 유전자의 돌연변이, 자외선으로 처리, 2-아미노퓨린(2-aminopurine)과 같은 화학물질들로 처리, 예를 들어 일시적인 불활성화와 활성화를 가능케 하는, 조절 가능한 프로모터들을 통해 부정합 보수과 관련된 유전자의 유도 가능한 발현이나 억제를 포함하여 일시적 또는 영구적으로 부정합 보수를 손상시키는 어떠한 전략에 의해서도 이루어질 수 있다.

박테리아 부정합 보수 시스템들은 널리 연구되어 왔다. 효모와 같은 다른 시스템들에서, 몇 개의 유전자들은 생산물들이 박테리아 부정합 보수 단백질들, 예를 들면 S. 세레비시아에서 MutS 단백질의 유사체, 즉 Msh1, Msh2p, Msh3p, Msh4, Msh5, Msh6p 및 MutL 단백질의 유사체, 즉 Mlh1p, Mlh2p, Mlh3p, 및 Pms1과 상동성을 공유하는 것으로 확인되었다.

바람직한 부정합 보수 결실 세포들의 예는 결손 또는 (일시적으로) 불활성화된 MSH2를 가진 S. 세레비시아 균주, 예를 들면 제작된 W303, BY, SK1 균주들, MXY47(MSH2 파괴된 W303) 균주와 같은 특정 효모 세포들이다.

MMR의 더 바람직한 시스템들은 미국특허 제5912119호에 설명되어 있는 것처럼, 예를 들어 부정합들의 인식에 참여하는 MutS 및 MutL 달백질들에 결함이 있는, mutS 타입 또는 mutL 타입의 효소 MutHLS 부정합 보수 시스템에 결합이 있는 균주들과 같이 잘 알려진 박테리아 균주들의 선택이다. 바람직한 균주들은 예를 들어 F- mutL 를 이용하는 S. 티피무리움 (S. Typhimurium) 또는 재조합 E. 콜리 Hfr/S. 티피무리움 F- mutL이다.

뿐만 아니라, 헬라 및 저켓 세포들과 같은, 다른 진핵세포 부정합 보수 결실 세포들은 본 발명에 따라 바람직하게 사용된다.

본 발명에 따른 방법은 주요하게 성공적인 재조합 생산물의 선택을 돕는 표지자를 사용한다. 분자 표지자들 또는 DNA 지문 (DNA fingerprinting)과 같은 도구들(tools)의 사용은 관심있는 유전자들의 지도를 만들 수 있게 한다. 이는 관심 있는 특성을 보유하는 세포들에 대한 선택을 얻기 위한 세포들의 큰 레퍼토리의 스크리닝을 가능케 한다. 스크리닝은 특정 유전자의 유무에 기초된다.

본 발명에 따른 상기 용어 “선택 표지자”는 성공적인 삽입의 표식을 제공하는 단백질을 암호화하거나 또는 암호화 하지 않는 DNA 서열들이다. 구체적으로, 단백질을 암호화한 표지자 서열들은 영양성 표지자들, 형광 표지자들, 넉-인 표지자들, 활성자/결합 도메인 표지자들 및 우성 열성 표지자들, 비색 표지자들, 및 두 개 또는 그 이상의 단위체가 발현했을 경우에만 기능하는 효소의 서로 다른 단위체들(subunits)을 암호화하는 서열들의 집단으로부터 선택된다. 상기 용어는 분리된 표지자의 이용이 필요 없이, 서열들의 유전자 모자이크의 직접적인 결정을 제공하는 재조합되는 추적 가능한 유전자에 대해서도 마찬가지이다.

"영양성 표지자"는 세포의 영양 요구성을 보상할 수 있고 그래서 그 영양요구성 세포에 원영양성을 부여하는 유전자 생산물을 암호화하고 있는 표지자 서열이다. 본 발명에 따라 “영양요구성”은 세포가 반드시 영양요구성 세포 스스로에 의해서는 생산될 수 없는 필수 영양소를 가지고 있는 배지에서 길러져야 한다는 것을 의미한다. 영양성 표지자 유전자의 유전자 생산물은 영양요구성 세포에서 상실한 필수 영상소의 합성을 촉진한다. 성공적으로 발현한 영양성 표지자 유전자에 의해 세포가 길러지는 배양 배지에 필수 영양소를 첨부할 필요는 없을 것이다.

바람직한 표지자 서열들은 URA3, LEU2, CAN1, CYH2, TRP1, ADE1 and MET5이다.

“색소 표지자”를 암호화하고 있는 유전자는 발현이 세포를 염색할 수 있는 색소의 합성에 관계된 유전자 생산물을 암호화하고 있다. 그렇게 함으로써 성공적으로 색소 표지자들을 발현한 세포들의 빠른 표현형적 검출이 제공된다.

“항생제 내성 표지자”는 상기의 생산물을 발현하지 않는 세포들이 자랄 수 없는 농도에서 항생물질들의 존재 하에서 세포를 자라도록 하는 유전자 생산물을 암호화하고 있는 유전자이다.

“항생제 민감성 표지자”는 유전자 생산물이 상기의 표지자를 발현하는 세포들의 생장을 항생물질의 존재 하에서 억제하는 표지자 유전자이다.

“넉-인” 표지자는 넉-아웃 세포에 상실한 연결을 표현해 주고, 따라서 성공적으로 재조합 및 작동하도록 자라는 것을 유발하는 뉴클레오티드 서열로 알려져 있다. 넉-아웃 세포는 표적 돌연변이를 통해 하나 또는 그 이상의 유전자들이 꺼져 있는 유전적으로 만들어진 세포이다. 그러한 상실 유전자들은 넉-인 표지자들로서 적합하게 사용된다.

“형광 표지자”는 각자의 형광 신호를 여기함으로써 검출 가능한 형광단(fluorophore)을 암호화 하는 뉴클레오티드 서열을 의미할 것이다. 세포들은 잘 알려진 분별 형광 표시(differential fluorescent labeling)의 기초한 유동세포 분석법(flow cytometry)의 기술들에 의해 쉽게 분별될 것이다.

다양화 또는 재조합에 이용되는 유전자들은 성공적인 재조합 현상들을 위해 충분한 서열 길이를 가진 비암호화 서열들 또는 폴리펩티드들을 암호화하는 서열들 또는 단백질을 암호화하는 서열들 또는 일부분들 또는 단편들일 수 있다. 좀 더 구체적으로, 상기의 유전자들은 3 bp, 바람직하게는 적어도 100 bp, 더 바람직하게는 적어도 300 bp의 최소 길이를 갖는다.

본 발명에 따른 바람직한 유전자 모자이크들은 적어도 3, 바람직하게는 20,000까지의 염기쌍들이며, 바람직한 범위는 300-10,000 bp이다; 특히 바람직하게는 적어도 500 bp 또는 적어도 1,000 bp의 큰 DNA 서열들은 얻었다.

구체적으로 바람하게는 더 큰 뉴클레오티드 서열들에서 단일 뉴클레오티드들의, 또는 적어도 1의, 바람직하게는 적어도 2, 3, 4, 5, 10, 20 개의 절편들의 교차를 포함하는 700 염기쌍마다 적어도 3 번의 교차 현상, 바람직하게는 700 염기쌍마다 적어도 4 번의 교차, 더 바람직하게는 700 또는 500 염기쌍마다 적어도 5, 6 또는 7 번의 교차에 의해 특성화되는 유전자 모자이크들이다.

본 발명의 방법에 따라 홀수 개뿐만 아니라 짝수 개의 재조합 현상들이 하나의 단일 재조합 유전자에서 얻어질 수 있다. 이것은 감수분열 생체 내 재조합에 비하여 특이적인 장점이다.

재조합 모자이크의 복잡한 패턴들은 하나의 단일 분자에서 서로 다른 길이의 많은 수의 재조합된 서열 블록들이 이어져 본 방법에 의해 얻어질 수 있다. 게다가, 가닥 주형들의 하나에 대한 뉴클레오티드들의 점 같은 교체는 개방형 해독틀들의 틀에 대한 다양성의 중요한 원천으로서 얻어질 수 있다. 모자이크 및 점 같은 교체는 단백질 수준에서 필수적으로 보존적이지 않다. 실질적으로, 다른 극성의 특성들을 가진 새로운 아미노산들은 새로운 잠재력 및 효소 단백질 특성들을 본 방법으로 유래된 재조합 단백질들에 주는 재조합 후에 생성될 수 있다.

바람직하게, 유전자들은 단백질을 암호화하고 있는 서열들 또는 치료 또는 산업적 적용의 효소 또는 단백질을 암호화하고 있는 단편들의 부분들이다. 이하에서 용어 “폴리펩티드들”은 바람직하게 적어도 2 개의 아미노산들 가진 관심 있는 펩티드, 바람직하게 적어도 3 개의 폴리펩티드들 및 단백질들을 포함할 것이다. 관심있는 폴리펩티드들은 바람직하게는 효소, 항체들 및 항체 도메인들 또는 단편들 같은 면역 글로불린 슈퍼패밀리의 일원들, 사이토카인들, 백신 항원들, 성장 인자들 및 펩티드들 중에서 선택되지만 이에 한정되지 않는다.

효소 촉매들은 그들의 높은 선택 특이성 때문에 많은 산업적 공정들에서 적합하게 사용된다. 본 발명에 의해 다양화에 쓰이는 바람직한 효소들은 서브틸리신(subtilisins)과 같은 단백질 분해 효소들(proteolytic enzymes); 펄프 및 종이 산업에 쓰이는 세포벽 완화 효소들과 같은 섬유소 분해효소들(cellulolytic enzymes), 엔도글루카나제(endoglucanase), 아밀로슈크라아제(amylosucrase), 엔돌산 분해효소(aldolase), 당 인산화효소(sugar kinase), 셀룰라아제(cellulose), 아밀라아제(amylase), 자일라나아제(xylanase), 포도당 탈수화효소(glucose dehydrogenase) 및 베타-글루코시다아제(beta-glucosidase), 라카아제(laccase); 정밀화학제품들, 농약들 및 약물들의 합성에 쓰이는 리파아제들(lipases); 바이오연료의 생산을 위한 이스테라아제들(esterases)을 포함한다. 효소 개선의 바람직한 예는 향상된 열안정성(thermostability)을 가진 알코올 탈수소효소(dehydrogenase)의 생산이다.

복잡한 구조들과 접힘들을 가진 다중쇄 폴리펩티드들(multichain polypeptides)을 암호화하고 있는 어떤 유전자들도 재조합 및 조립될 수 있다는 것을 보여 줄 수 있다. 바람직한 예시는 면역 시스템의 세포 표면 항원 수용체들, 공동 수용체들 및 공동 자극 분자들, 림프구들에 항원 표지에 관계된 분자들, 세포 결합 분자들, 특정 사이토카인 수용체들 및 세포 내 근육 단백질들을 포함하는 면역글로불린 도메인 또는 접힘으로 알려진 도메인을 처리하는 면역글로불린들과 구조적 특성을 공유하는 면역글로불린들 및 폴리펩티드들 중에서 면역글로불린 슈퍼패밀리의 일원들이다. 바람직하게 항체들과 Fab, Fv 또는 scFv와 같은 항체 단편들은 재조합 및 조립된다.

이와 달리, 모자이크 유전자들은 단백질 암호화 서열의 발현의 조절과 관계된 서열들과 같은 예처럼 비단백질 암호화 서열들일 수도 있고, 짧고 긴 비 암호화 RNA의 조절 서열들일 수도 있다. 이는 프로모터 서열들, 인트론 서열들, 폴리아데닐레이션 신호들의 암호화 서열들일 수 있지만, 이에 제한되지 않는다.

본 발명의 바람직한 실시양태에서, 모자이크 유전자의 조립, 숙주 유전체와의 그의 재조합, 및 상기의 숙주 세포의 관심 있는 폴리펩티드 재조합체 또는 대사체의 생산을 위한 추가적인 모자이크 유전자의 발현은 단일 단계 절차로 수행된다.

본 발명에 따라 기존의 분자 생물학, 미생물학, 및 재조합 DNA 기술들이 해당 기술분야의 통상의 기술로 사용될 수 있다. 그러한 기술들은 문헌상 온전히 설명된다. Maniatis, Fritsch & Sambrook, "Molecular Cloning: A Laboratory Manual (1982) 참고.

생체 내 재조합을 위해, 유전체 또는 다른 유전자들과 재조합되는 유전자는 표준의 형질주입 기술들을 이용해 숙주를 형질주입하기 위해 이용된다. 적합한 실시예에서 복제 개시점을 제공하는 DNA는 구조에 포함된다. 복제 개시점은 당업자에 의해 적절하게 선택될 수 있다. 유전자들의 성격에 따라, 만일 서열들이 이미 스스로 복제 개시점으로서 작동 가능한 유전자들 또는 유전체가 존재한다면 추가적인 복제 개시점은 필요하지 않을 수 있다.

합성 핵산 서열들 또는 카세트 및 일부분들은 선형 폴리뉴클레오티드들, 플라스미드들, 메가플라스미드들, 합성 또는 인공 염색체들, 식물, 박테리아, 포유류 또는 효모의 인공 염색체들과 같은 형태로 생산될 수 있을 것이다.

세포는 그러한 DNA가 세포 안으로 도입되었을 때 외인성 또는 상이성 DNA에 의해 형질전환 될 것이다. 형질전환하는 DNA는 삽입되거나 그렇지 않을 것인데, 즉, 세포의 유전체에 공유결합될 것이다. 예를 들어 원핵세포들, 효모, 및 포유류 세포들에서, 형질전환하는 DNA는 플라스미드와 같은 에피좀(episome)의 요소에 유지될 것이다. 진핵세포들에 대하여, 안정적으로 형질전환된 세포는 형질전환하는 DNA가 염색체로 삽입되어, 염색체 복제를 통해 딸 세포들에 의해 유전되는 것이다. 이러한 안정성은 형질전환하는 DNA를 가지고 있는 딸 세포들의 집단을 포함하는 세포주들이나 클론들을 확립하는 진핵세포의 능력에 의해 입증되었다.

다양한 유전자 기질들은 플라스미드들로 삽입될 수도 있다. 플라스미드들은 종종 벡터, 예를 들면, 박테리아 다중카피 플라스미드들 표준 클로닝 벡터들이다. 기질들은 동일하거나 그렇지 않은 플라스미드들로 삽입될 수 있다. 종종 선택 표지자들의 다른 타입들을 가진 플라스미드의 적어도 두 서로 다른 타입들은 적어도 두 타입의 벡터들을 가진 세포들에 대해 선택하도록 하는데 이용된다.

다양한 유전자 기질들을 가진 플라스미드들은 어떤 방법(예를 들면, 화학적 형질전환, 중성 수용, 전기천공, 바이오리스틱들(biolistics), 파아지 또는 바이러스 시스템들로 포장)에 의해서도 세포 안으로 처음에 도입된다. 보통, 플라스미드들은 같은 세포에 하나의 플라스미드가 진입하는 것보다 많은 가능성을 증가시키기 위해 (최대 형질주입 수용력을 고려하여) 포화 농도로 또는 그 가까이로 제공한다. 다양한 기질들을 가지고 있는 플라스미드들은 동시에 또는 여러 차례로 형질주입될 수 있다. 예를 들면, 마지막에 접근한 세포들은 플라스미드의 첫 번째 분주로 형질 주입될 수 있고, 형질주입체들은 선택되고 증폭되고, 그런 다음에 두 번째 분주로 형질 주입된다. 바람직한 플라스미드들은 예를 들어, pMXY9에서 유래된 pUC 및 pBluscribe, pMXY12 및 pMIX-LAM 또는 YCp50에서 유래된 YAC이다.

진화의 정도는 모든 유전자 기질들이 재조합에 참여하는 것을 허용하는 것에 의해 증가될 수 있다. 그것은 전기천공은 형질주입된 세포들에 수행하는 것에 의해 달성될 수 있다. 전기천공을 위한 조건들은 세포들로 외인성 DNA를 도입하기 위해 기존에 사용되던 것들과 동일하다. 진화의 정도는 플라스미드들 또는 염색체들의 교환을 유도하기 위해 세포들을 융합하는 것에 의해서도 증가된다. 융합은 PEG와 같은 화학 물질들, 또는 인플루엔자 바이러스 헤마글루티닌(influenza virus hemagglutinin), HSV-1 gB 및 gD과 같은 바이러스 단백질에 의해서 유도될 수 있다. 진화의 정도는 돌연변이를 유발자 숙주 세포들(박테리아의 Mut L, S, D, T, H, 효모의 유사한 돌연변이체, 및 아탁시아 텔란지엑타시아(Ataxia telangiectasia) 인간 세포주)의 사용에 의해서도 증가될 수도 있다.

재조합된 유전자들을 품고 있는 세포들은 원하는 기능에 대한 스크리닝 또는 선택을 받아야 한다. 예를 들어, 만약 진화된 기질이 약물 저항성 유전자를 가지고 있다면, 이는 약물 저항성을 위해 선택할 것이다.

일반적으로, 본 발명의 재조합 방법에서, 원하는 표현형을 획득하고 있는 재조합의 최종 생산물은 위치들의 0.1%-50%로 출발 기질과는 구분되고, 자연적으로 획득한 돌연변이의 정도를 초과한 규모(예를 들어, 적어도 10배, 100배, 1,000배, 또는 10,000배)의 상태 정도로 진화되었다. 최종 유전자 모자이크 생산물은 생산 목적들을 위해 뒤섞인 DNA의 활용을 위해 더 적합한 또 다른 숙주로 형질주입될 것이다.

본 발명에 따른 바람직한 방법에서 숙주 세포는 잘 알려진 세포 디스플레이 시스템을 이용해서 세포의 표면에 유전자 모자이크를 디스플레이하고 있다. 상기 혼성화를 통한 다양화에 의해, 상기 변이체들의 라이브러리의 생성을 적합하게 디스플레이될 수 있는 유전자 변이체의 레퍼토리는 생산된다.

적합한 디스플레이 방법들은 효모 디스플레이 및 박테리아 세포 디스플레이를 포함한다. 특히 바람직한 라이브러리들은 단백질 공학과 라이브러리 스크리닝에 많은 응용들을 가지고 이용되는 효모 표면 디스플레이 라이브러리들이다. 그러한 라이브러리들은 야생형 폴리펩티드의 그것들과 관계된 강화된 표현형적 특성들을 가지고 폴리펩티드 변이체들의 적합한 선택을 제공한다. 바람직하게 세포를 기반으로 한 선택 방법들, 예를 들어, 표면-고정 리간드들에 대응하는 방법이 이용되었다. 일반적으로 사용되는 선택 기술은 상기 라이브러리로부터 얻어진 돌연변이 폴리펩티드의 특성을 분석 및 야생형 펩티드의 특성과 비교하는 것을 포함한다. 개선된 원하는 특성들은 수용체에 결합할 수 있는 리간드 폴리펩티드의 결합하는 특성들의 특이성 또는 친화력의 변화를 포함할 수도 있다. 폴리펩티드 친화력 성숙은 본 발명의 특히 바람직한 실시예이다. 변이체에 추가적으로 원하는 특성들은 안정성, 예를 들면 열안정성, pH 안정성, 단백질 분해 효소 안정성(protease stability), 용해성, 관심있는 재조합 폴리펩티드의 수율 또는 분비의 수준을 언급한다.

본 발명에 따른 방법으로 얻어진 라이브러리는 높은 백분율의 잠재성은 기능적 ORF에서 발현될 수 있는 기능적 모자이크 유전자들의 후보들로 유도한다. 바람직한 라이브러리는 적어도 80%, 바람직하게는 적어도 85%, 적어도 90%, 적어도 최대 95%까지 기능적 ORF를 가진 유전자 모자이크들을 갖는다. 발명에 따라 제공되는 라이브러리는 구체적으로 성공적인 혼성화의 높은 백분율을 나타내는 표지자 서열의 존재에 의해 더욱 특성화된다. 발명에 따르면, 상기의 방법에 의해 생산된 재조합체 라이브러리에서 변이체들 또는 라이브러리 구성원들의 개수를 증가시키는 홀수 개뿐만 아니라 짝수 개의 모자이크 조각들을 얻을 수 있다.

발명에 따른 라이브러리들은 보통 적어도 10 개, 바람직하게는 적어도 100개, 더 바람직하게는 적어도 1,000 개, 더 바람직하게는 적어도 10⁴개, 더 바람직하게는 적어도 10⁵개, 더 바람직하게는 적어도 10⁶ 개, 더 바람직하게는 적어도 10⁷ 개, 더 바람직하게는 적어도 10⁸ 개, 더 바람직하게는 적어도 10⁹ 개, 더 바람직하게는 적어도 10¹⁰ 개의, 더 바람직하게는 적어도 10¹¹ 개의, 최대 10¹² 개까지의, 실현 가능한 더 많은 숫자까지도 유전자 모자이크들의 변이체들을 포함한다.

본 발명에 따른 방법은 유전자 모자이크들의 기능적 변이체들을 발현하는 적어도 10²개의 독립적인 클론들을 가지고 있는 라이브러리를 제공할 수 있다. 발명에 따르면 미리 선택된 독립적인 클론들, 예를 들면 친화력이 성숙된 클론들의 풀(pool) 또한 제공되는데, 풀은 바람직하게 적어도 10 개, 더 바람직하게 적어도 100 개, 더 바람직하게 적어도 1,000 개, 더 바람직하게 적어도 10,000 개, 100,000 개 이상의 독립적인 클론들까지도 포함한다. 미리 선택된 풀들을 가진 상기 라이브러리들은 본 발명에 따라 높은 친화력 변이체들을 선택하기 위한 바람직한 원천들이다.

본 발명에 따라 이용되는 라이브러리들은 바람직하게는 적어도 10² 개의 라이브러리 구성원들, 더 바람직하게는 적어도 10³개, 더 바람직하게는 적어도 10⁴ 개, 더 바람직하게는 적어도 10⁵개, 더 바람직하게는 적어도 10⁶ 개의 라이브러리 구성원들, 더 바람직하게는 적어도 10⁷개, 더 바람직하게는 적어도 10⁸ 개, 더 바람직하게는 적어도 10⁹개, 더 바람직하게는 적어도 10¹⁰ 개, 더 바람직하게는 적어도 10¹¹ 개, 최대 10¹² 개까지의, 바람직하게는 관심있는 폴리펩티드에 부합하는 새로운 특성을 조작하기 위해 부모 유전자로부터 유래한 라이브러리 구성원들을 포함한다.

바람직하게 라이브러리는 효모 라이브러리이고 세포의 표면에 생물학적 활서을 가진 관심 있는 폴리펩티드를 바람직하게 드러내는 효모 숙주 세포이다. 이와 달리, 생산물들은 세포 안에 머무르거나 또는 세포 밖으로 분비된다. 효모 숙주 세포는 사카로미세스 속, 피치아 속, 한세눌라 속, 스키조사카로미세스 속, 클루이베로미세스 속, 야로이야 속 및 칸디다 속에서 바람직하게 선택된다. 가장 바람직하게는, 숙주 세포가 사카로미세스 세레비시아이다.

여기에 기술된 실시예들은 본 발명을 예시하는 것이고 이들로 제한 되는 것이 아니다. 본 발명의 다른 실시양태들은 본 발명에 따라 기술되었다. 이상에서 기술되고 설명된 기술들에 그 기술적 사상이나 발명의 범위에서 벗어나지 않고 많은 개량 및 변화들이 이루어질 수 있다. 따라서, 실시예들은 단지 예시적인 것일 뿐이고 본 발명의 범위를 제한하지 않는 것으로 해석되어야 한다.

구체적으로, 본 발명은 생체 내 재조합의 기능적 시스템을 이용함으로써, 최초로 효과적인 재조합 및 모자이크 형성, 다양화 및 다양한 유전자의 조립을 단일 단계 절차로 가능하게 한다.

도 1 생체 내 비감수분열(non-meiotic) 재조합
부분 상동 유전자 A와 B (99.5% 미만의 상동성)는 재조합되었다. 표지자 서열 및 인접 목적 서열은 상동이 아니므로, 재조합/조립은 유전자 A 및 B사이에서만 일어났다. 그 결과 혼성/모자이크 DNA는 재조합된 유전자 A 및 B, 두 표지자 및 양쪽 인접 목적 서열들을 포함하였다. 유전자 모자이크는 목적 염색체 상의 목적 위치로 삽입되었다. 삽입된 전체 구조를 가진 클론들은 두 표지자들을 모두에 선택적인 적합 배지에서 키웠다.
T5’ 및 T3’는 염색체 위치에 상동성 삽입을 부여하는 효모 유전체(ca. 400 bp)에 있는 목적 서열(99.5% 미만의 상동성)에 부합한다. M1 및 M2는 이중 선택을 위한 인접 표지자이다. 유전자 A 및 유전자 B는 주어진 상동성의 정도(99.5% 미만)를 가지는 유사 부분 상동성 버전(homeologous version)들이다. 중첩 서열은 두 유전자들 모두의 전체 ORF들에 부합한다. MMR 결실 효모 형질전환체에서 부분 상동성 재조합에 의한 조립 이후에, 이중 선택은 형질전환체들의 분리를 가능케 한다.
도 2 부분 상동성 재조합에 의한 DNA의 재조합 및 조립
본 도면은 구체적인 실시예의 도식적인 설명을 보여 주는데, 세포는 적어도 두 개의 유전자, 여기에서는 그들의 80 bp의 중첩 부분에서 99.5% 미만의 상동성을 갖는 DNA 절편 A 및 B로 동시 형질전환된다. 각 DNA 단편은 하나의 선택 표지자에 의해 측면에 배치된다.
단편 A는 염색체 상의 5’ 말단에 정확한 삽입 위치에 부합하는 인접 목적 서열 및 절편 B와 중첩되는 혼성화 서열을 가졌고, 단편 B는 3’ 말단 삽입 위치에 부합하는 인접 목적 서열 및 절편 A와 중첩되는 혼성화 서열을 가졌다. 부정합 결실 효모 세포들은 수득된 단편들(resulting fragments)로 형질전환 되었다. 수득된 형질전환체들은 두 표지자들 모두에 대한 선택 배지 위에 도말되었다. 두 표지자들 모두에 의해 선택될 수 있는 클론들은 분리되었고, 그리고 조립된/삽입된 클러스터의 온전성은 유전자 A 및 B의 ORF의 재구성과 마찬가지로, 선택된 재조합체들의 유전체 DNA에 대한 분자적 분석으로 확인되었다.
T5’ 및 T3’는 염색체 위로 상동성 삽입은 위치를 부여하는 효모 유전체(ca. 400 bp)위에 목적 서열(99.5% 미만의 상동성)에 부합한다. M1 및 M2는 이중 선택을 위한 인접 표지자들이다. DNA 절편 A 및 B는 GFP처럼 추적 가능한 하나의 유전자에 조립될 수 있고, 또는 이러한 방법으로 조립된 두 개의 유전자들을 나타낼 수 있다. 모든 유전자들의 중첩 서열은 99.5% 미만의 상동성을 가져 부분 상동성 재조합에 의한 조립 후에 ORF의 재구성을 가능케 한다. 이중 선택은 재조합체들의 분리를 가능케 하고 그리고 중요한 조립의 근거로서 역할한다.
도 3 유전자 A, B 및 C의 재조합 및 조립
본 도면은 유전자 A 및 B에 상기 유전자C의 조립체을 얻기 위해서 유전자 A 및 /또는 B의 인접 서열과 혼성화하는 서열을 가지고 있는 추가적인 유전자 C의 동시 형질전환을 보여준다.
T5’ 및 T3’는 염색체 위로 상동성 삽입을 부여하는 효모 유전체(ca. 400 bp) 위에 목적 서열(99.5% 미만의 상동성)에 부합한다. M1 및 M2는 이중 선택을 위한 인접 표지자이다. 유전자 A, 유전자 B 및 유전자 C는 주어진 상동성의 정도(99.5% 미만)를 가지는 유사성(관련된) 부분 상동성 버전들이다. 중첩 서열들은 유전자들의 5’ 부분 및 3’ 부분에 부합한다. 유전자 B는 인접 단편에 연결되고 그리고 새로운 ORF ABC는 서열 유사성에 의해 재구성된다. MMR 결실 효모 형질전환체에서 부분 상동성 재조합에 의한 조립 후에, 이중 선택은 형질전환체들의 분리를 가능하게 한다.
도 4 Oxa 재조합 기질들
네 개의 유전자들은 베타-락타마아제(β-lactamase) 효소의 변이체들를 암호화한다. 그것들은 DNA 수준(95%에서 49%까지)에서 상이한 상동성을 가지는 버전들이다. 위쪽 패널은 유전자의 ORF들의 개략적인 어닐링을 정렬 후에 생성된 수형도로 보여준다. 유전자들의 크기는 약 800 bp 이다. ATG 및 TAA는 시작 및 종결 코돈들을 의미한다. 아래쪽 표는 DNA 수준에서 네 유전자들 사이의 서열 유사성의 백분율을 보여준다.
도 5 유전자 및 단백질 모자이크 OXA11/OXA7 (SEQ ID NOs 1-14)의 서열
OXA7 유래의 뉴클레오티드 서열들은 굵고 밑줄이 있으며, 돌연변이 뉴클레오티드 서열들은 굵고 이탤릭체이다.
클론들은 이중 선택에 의해 분리되고, DNA는 증폭 및 서열분석에 이용되었다. 두 선 모두에서 명백히 읽을 수 있는 서열들만이 사용되었다. 결과적인 크로마토그램들(chromatograms)은 Clustal 유사 프로그램으로 정렬되었다.
도 6a 내지는 도 6d 유전자 및 단백질 모자이크 OXA11/OXA5 (SEQ ID NOs 15-38)의 서열
OXA5 유래의 뉴클레오티드 서열들은 굵고 밑줄이 있고, 돌연변이 뉴클레오티드 서열들은 굵고 이탤릭체이다.
클론들은 이중 선택에 의해 분리되고, DNA는 증폭 및 서열분석에 이용되었다. 두 선 모두에서 명백히 읽을 수 있는 서열들만이 사용되었다. 결과적인 크로마토그램들은 Clustal 유사 프로그램에서 정렬되었다.
도 7 부모 유전자들 OXA11, OXA7 및 OXA5 (SEQ ID NOs 39-41)의 서열들
도 8a 내지는 8e 부분 상동성 조립체 OXA11/OXA5/OXA7에 부합하는, 복합 모자이크 유전자들을 포함하는 클론들의 서열들
클론들의 서열들 및 각각의 단백질 어닐링의 결과들: OXA11/OXA5/OXA7에 관하여 도 8a의 a) OUL3-05-II (SEQ ID NOs 42 및 43), 도 8b의 b) OUL3-05-III (SEQ ID NOs 44 및 45), 도 8c의 c) OUL3-05-IV (SEQ ID NOs 46 및 47), 도 8d의 d) OUL3-05-IX (SEQ ID NOs 48 및 49) 및 도 8e의 e) OUL3-05-X (SEQ ID NOs 50 및 51).
뉴클레오티드 서열들은 굵고, OXA7에 부합하는 것들은 밑줄이 되어 있다. 굵게 되지 않고, 밑줄이 되어 있지 않은 서열들은 OXA11에 부합한다.
도 9 클루이베로미세스 락티스, 사카로미세스 세레비시아의 ADH1 유전자의 서열들 및 재조합체의 서열들
클루이베로미세스 락티스 유래의 뉴클레오티드 서열은 밑줄이 되어 있다.
도 9a의 a): (SEQ ID NOs 52) ADH 클루이베로미세스, 도 9a의 b): (SEQ ID NOs 53) 사카로미세스, 도 9b의 c): (SEQ ID NOs 54) 클론 A02, 도 9b의 d): (SEQ ID NOs 55) A03, 도 9c의 e): (SEQ ID NOs 56) A05, 도 9c의 f): (SEQ ID NOs 57) A06, 도 9d의 g): (SEQ ID NOs 58) A10, 도 9d의 h): (SEQ ID NOs 59) A11.

실시예 1

구체적인 설명

실험상 준비에서, 본 발명자들은 재조합될 기질로서 OXA 클래스의 베타 락타마아제(beta lactamase genes of the OXA class)를 이용한다. OXA 유전자들의 장점은 서로 다른 다양성의 (5-50%에서의) 사용 가능한 부분 상동 유전자가 있다는 사실에 있다. 그래서 이러한 유전자들은 생체 내 재조합의 다양성의 한계를 시험해 보기 위한 좋은 후보들이다. 해당 유전자들은 또한 다루기도 쉽다(약 800 bp의 길이).

도 4는 OXA 재조합 기질들을 도시한다: 유전자들 및 상동성

Oxa 유전자들의 서열 유사성

	Oxa 7	Oxa 11	Oxa 5	Oxa 1
Oxa 7	100%	-	-	-
Oxa 11	95%	100%	-	-
Oxa 5	77%	78%	100%	-
Oxa 1	50%	49%	50%	100%

첫 번째 실험에서 Oxa 11은 Oxa 7 (95% 유사성), Oxa 5 (77% 유사성) 그리고 Oxa 1 (49% 유사성)과 각각 재조합하였다.

본 발명자들은 영양 요구성 (-ura3, -leu2) 표지자 유전자와 msh2의 넉-아웃(knock outs)을 가지고 있는 균주 모음(EUROSCARF)으로부터 유래한 효모 균주 BY47을 이용했다. 우라실(uracil) 및 류신(leucin) 생합성 경로에서의 유전자 결함은 영양요구를 야기하는데, 즉, 우라실 및 류신이 반드시 성장 배지에 추가되어야 한다.

첫 번째 단계에서 유전자 단편들은 한쪽에 URA3 및 OXA11 표지자를 가지거나 또는 다른 한쪽에 OXA 5/7/1를 가지고 각각은 함께 하도록 또 다른 표지자 LEU2와 설계하였다. 효모 염색체의 BUD 31 지역에 5’ 삽입 위치에 들어 맞는 URA-OXA11 단편의 5’ 말단에 인접한 약 400 bp의 DNA 단편은 삽입되었다(5’ 인접 목표 서열). OXA 5/7/1 의 3’ 말단에서 약 400 bp의 DNA 단편(3’ 인접 목표 서열)은 염색체(들) 위의 인접한 3’ 위치에 부합한다(도 3). 모든 단편들은 Geneart(Germany)의 표준 실험방법에 따라 합성하였다.

합성된 단편들은 PCR에 의해 증폭되고 형질전환에 이용됐다.

URA3-OXA 11 단편 및 다른 OXA-LEU2 단편들의 하나는 야생형(diploid BY26240, Euroscarf) 및 부정합 결실 균주(haploid a-mater BY06240, msh2-, Euroscarf)로 형질전환하였다. 형질전환 실험방법은 Gietz [Gietz, R.D. and R.A. Woods. (2002) TRANSFORMATION OF YEAST BY THE Liac/SS CARRIER DNA/PEG METHOD를 따랐다. 형질전환체들은 적절한 표지자들(우라실, 류신 결핍)에 의한 선택을 위한 선택 배지를 포함하는 플레이트 위에 도말하였다. 72시간 후에 콜로니들이 관찰될 수 있었다.

형질전환/선택 후에 얻어진 클론들의 개수

효모/형질전환	Oxa11/Oxa11 (1)	Oxa11/Oxa07 (2)	Oxa11/Oxa05 (3)	Oxa11/Oxa1 (4)
BY26240 (배수체 msh+)	10⁶(5)	＜10	0	ND
BY06240 (반수체 Δmsh2)	5×10⁴	5×10³	10³	ND

(1) 상동성 대조군

(2) DNA 수준에서 차이 5 %

(3) DNA 수준에서 차이 23 %

(4) DNA 수준에서 차이 51 %

(5) 측정된 형질전환 혼합의 ml 당 cpu 및 선택 배지(-ura -leu)에서 DNA의 ㎍

BY06240형질전환에서 나온 48 개의 콜로니들 전체를 분리하여, 콜로니 PCR을 수행하였다(lysis and Herculase PCR based on Cha and Thilly protocol: Specificity, Efficiency and fidelity of PCR, in PCR primer: A laboratory Manual, Dieffenbach and Dveksler eds. 1995, pp 37). 목적 부위로의 단편들의 정확한 삽입을 확인하기 위해서 서로 다른 PCR 반응들이 수행되었다. 48 개 중에 37 개의 클론들이 정확한 삽입 프로필을 보였다. 이러한 37 개로부터, 31개가 서열분석 실험에 명확하고 그리고 이용할 수 있는 증폭 산물들을 주었다. 만일 OXA 서열들이 실제로 조립되었다면 Oxa ORF들에 인접한 두 특이적 프라이머들을 사용한 반응은 실제 재조합체들만의 증폭을 가능하게 한다. 게다가, 얻어진 산물은 다이렉트 서열분석 실험에 알맞는 기질이다. 따라서, 양성 증폭 산물들을 서열분석 실험(GATC)하였다.

서열분석 실험의 결과

31 개 중에 24 개의 클론들 (더 명확한 양성 증폭신호들을 가진 것들)은 서열분석 실험되었다. 그것들은 다음에 부합했다:

상동성 대조군 Oxa11/Oxa11 (SEQ ID NO. 39), 상동성 대조군 Oxa07/Oxa07 (SEQ ID NO. 40), 상동성 대조군Oxa05/Oxa05 (SEQ ID NO. 41)

fe02 to fe06, fe09 및 fe11: Oxa11/Oxa07 (SEQ ID NO. 1 내지 SEQ ID NO. 14)

fe09 and fe13, fe14, fe16 to fe24: Oxa11/Oxa5 (SEQ ID NO. 15 내지 SEQ ID NO. 38)

클론들의 모든 서열분석 실험 결과는 도 5 및 6, 및 SEQ ID NOs 1 내지 38을 참고.

Oxa11/Oxa07 클론들의 DNA 어닐링은 도 5, SEQ ID NOs. 1, 3, 5, 7, 9, 11 및 13을 참고.

Oxa11/Oxa05 클론들의 DNA 어닐링은 도 6, SEQ ID NOs. 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 및 37을 참고.

OXA11/Oxa07 단백질 어닐링은 도 5, SEQ ID NOs. 2, 4, 6, 8, 10, 12 및 14을 참고.

Oxa11/Oxa05 단백질 어닐링은 도 6, SEQ ID NOs. 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36 및 38을 참고.

실시예 2

구체적인 설명

복잡한 모자이크 유전자들의 라이브러리들을 생성하기 위한 두 번째 대안으로서, 세 개의 상이한 그러나 관련되어 있는 유전자 서열을 조립 및 재조합되었다. 실시예 1과 같이, OXA 유전자 서열들은 MMR 결실 효모(OXA 유전자 유사성은 도 4 참고)에서 그들의 조립을 위해 사용되었다. 도 3에서 보여진 것과 같이, 모자이크 생성의 원리는 OXA 5 (유전자 C)의 ORF 와 혼성화되는 OXA 11 (유전자 A) 및 OXA 7 (유전자 B)의 각각의 끝이 잘려진 서열의 이용에 기초를 두게 된다. 그래서, 영양요구성 표지자들을 공유하는 조립되고 삽입된 카세트 A-B-C만이 형질전환 후에 선택될 것이다.

실시예 1과 같이, 본 발명자들은 영양 요구성 (-ura3, -leu2) 표지자 유전자와 msh2의 넉-아웃들(knock outs)을 가지고 있는 균주 모음(EUROSCARF)으로부터 유래한 효모 균주 BY47을 이용했다. 우라실(uracil) 및 류신(leucin) 생합성 경로에서의 유전자 결함은 영양요구를 야기하는데, 즉, 우라실 및 류신이 반드시 성장 배지에 추가되어야 한다.

잘려진 유전자 A 및 B를 포함하고 있는 새로운 유전자 단편들은 실시예 1에서 이미 기술된 단편들로부터의 특이적 PCR에 의해 얻었다: URA-Oxa11 (OXA11 ORF 의 386-406에 어닐링하는 역방향 프라이머) 및 OXA7-Leu (OXA 7 ORF의 421-441에 어닐링하는 정방향 프라이머). OXA5 유전자의 전체 ORF는 OXA5-Leu 단편으로부터의 PCR에 의해 얻었다. END-Leu 단편은 실시예 1과 같이 쓰였다. 정제된 PCR 단편들은 형질전환에 쓰였다.

형질전환 실험방법은 Gietz [Gietz, R.D. and R.A. Woods. (2002) TRANSFORMATION OF YEAST BY THE Liac/SS CARRIER DNA/PEG METHOD를 따랐다. 형질전환체들은 적절한 표지자들(우라실, 류신 결핍)에 의한 선택을 위한 선택 배지를 포함하는 플레이트 위에 도말하였다. 72시간 후에 콜로니들이 관찰될 수 있었다.

형질전환/선택 후에 얻어진 클론들의 개수

효모/형질전환	Oxa11/Oxa5/Oxa7 (1)	Oxa11/Oxa07 (2)
BY26240 (배수체 msh2+)	＜10¹ (3)	ND (5)
BY06240 (반수체 Δmsh2)	1.4×10⁴(4)	＜5

(1) 조립될 세 개의 OXA 서열

(2) 중간 서열 OXA5가 빠짐 (음성 대조군)

(3) MMR이 능숙한 효모에서의 상동 재조합 백그라운드

(4) MMR이 결실인 효모에서의 상동 재조합 백그라운드

(5) ND = 콜로니가 검출되지 않음

BY06240형질전환에서 나온 8 개의 콜로니들 전체를 무작위적으로 분리하였고, 콜로니 PCR을 수행하였다 (lysis and Herculase PCR based on Cha and Thilly protocol: Specificity, Efficiency and fidelity of PCR, in PCR primer: A laboratory Manual, Dieffenbach and Dveksler eds. 1995, pp 37). 목적 부위로의 단편들의 정확한 삽입을 확인하기 위해서 서로 다른 PCR 반응들이 수행되었다. 8 개 중에 7 개의 클론들이 정확한 삽입 프로필을 보였다. 이러한 7 개가 서열분석 실험에 명확하고 그리고 이용할 수 있는 증폭 산물들을 주었다. 만일 OXA 서열들이 실제로 조립되었다면 Oxa ORF들에 인접한 두 특이적 프라이머들을 사용한 반응은 실제 재조합체들만의 증폭을 가능하게 한다. 게다가, 얻어진 산물은 다이렉트 서열분석 실험에 알맞는 기질이다. 따라서, 양성 증폭 산물들을 서열분석 실험(GATC)하였다.

서열분석 실험의 결과

8 개 중에 7 개의 클론들 (더 명확한 양성 증폭신호들을 가진 것들)은 서열분석 실험되었고, 5개의 사용할 수 있는 서열들을 얻었다. 그것들은 OUL3-05-II, OUL3-05-III, OUL3-05-IV, OUL3-05-IX and OUL3-05-X 클론들에서 온 부분 상동성 조립체 OXA11/OXA5/OXA7 에 모두 부합했다.

모든 클론들 및 단백질 어닐링의 서열분석 실험 결과는 도 8을 참고: OXA11/OXA5/OXA7에 대하여 OUL3-05-II (SEQ ID NO 42 및 43), OUL3-05-III (SEQ ID NO 44 및 45), OUL3-05-IV (SEQ ID NO 46 및 47), OUL3-05-IX (SEQ ID NO 48 및 49) and OUL3-05-X (SEQ ID NO 50 및 51).

논의

세포에 의한 조립 및 생체 내 재조합에 의한 다양성의 생성을 위해 주형으로서 분기한 서열들을 포함하는 유사분열 MMR 결실 세포들의 간단한 형질전환 방법이 증명되었다 (도 5, 6 및 8).

실시예 1에 기술한 방법에 의해 서로 다른 길이의 적어도 17 조각들이 결합하여, 800 bp의 하나의 단일 분자(예를 들면, 클론들 fe19 (SEQ ID NO 27) 및 fe20 (SEQ ID NO. 28)가 된, 재조합 모자이크 현상의 복잡한 패턴들이 얻어졌다, 재조합 현상들은 서열들 전체에 걸쳐서 발생하는 것으로 보인다.

게다가, 주형 가닥의 하나에 부합하는 뉴클레오티드의 점 같은 교체 (point-like)가 ORF들(예를 들면, 크론들 fe19 (SEQ ID NO. 27) 및 fe20 (SEQ ID NO. 29)의 틀에 관한 다양성의 중요한 근원으로 관찰되었다.

덧붙여, 실시예 2에서 보여지듯이 세 개의 관계된 유전자들(OXA 11, OXA 7 and OXA 5)로부터 서열들을 동시에 이용한 (예를 들면, 클론들 OUL3-05-III 및 OUL3-05-IX) 이러한 재조합 방법은 두 개 이상의 관계된 유전자들로부터 모자이크들을 생산해 냈다. 이는 몇 개의 유전자들로부터 관심 있는 영역들을 재조합하는 높은 효율의 방법이고, 생체 내 모자이크 유전자들 라이브러리들의 생성에 기반을 둔 분기의 새로운 근원을 제시한다.

어떤 재조합 클론들도 번역된 DNA들의 컴퓨터 내(in silico) 분석에 의한 확인한 잘려진 단백질 생산물들을 산출하지 않았다 (도 5, 6 및 8).

21 개 중에서 단 하나의 클론 (fe15)만이 부모의 프로필을 보였다 (데이터는 보이지 않음).

모자이크 현상 및 점 같은 교체는 단백질 수준에서 보존적일 필요는 없다. 실제로, 재조합 돌연변이 단백질들(muteins)에 새로운 잠재성과 효소 단백질 특성들을 주는 다른 극성의 특성을 가진 새로운 아미노산들이 재조합 후에 생성되었다(즉, 클론들 fe19 (SEQ ID NO. 27) 및 fe20 (SEQ ID NO. 29)).

재조합체 라이브러리들을 더욱 풍부하게 만드는 이러한 접근법에 의한 재조합체 생성의 대단히 매력적인 하나의 특성은 라이브러리 안에 단지 홀수 개의 재조합 현상들을 나타내게 되는, 감수분열 재조합에 비해, 홀수 개뿐만 아니라 짝수 개의 재조합 현상들을 얻을 수 있다는 사실이다(즉, fe06 (SEQ ID NO 7), fe11 (SEQ ID NO 13), fe13 (SEQ ID NO 17), fe19 (SEQ ID NO 27)).

어떤 점 돌연변이들은, 부모 주형들과 관계되어 있지 않고, 적은 수의 서열들에서 관찰되었다(즉, fe16 (SEQ ID NO 21) 및 fe17 (SEQ ID NO 23)). 모든 그러한 경우들에서, 돌연변이들은 결과로 얻어진 ORF들의 리딩 프레임을 바꾸지 않았다.

실시예 3:

ADH 1

두 번째 실시예에서 우리는 재조합을 위한 목표로서 내재적 DNA(endogenous DNA)를 선택했다. 알코올 탈수화효소 1 (Alcohol dehydrogenase 1; ADH1)은 효모 사카로미세스 세레비시아에서 에탄올 생산을 위한 핵심 효소이다. 그것은 개선된 Adh1 변이체들의 생성을 위한 산업적 관심이다.

Euroscarf사의 BY06246 그리고 Euroscarf사의 W303 균주들이 이 실험에 사용되었다.

사카로미세스 세레비시아 ADH1 유전자는 이미 염색체 XV 위에 위치되었다. 그러므로, 단 하나의 부분 상동성 유전자의 도입은 재조합에 충분하다. 재조합된 재조합체들이 추가적으로 돌연변이가 일어나지 않을 것이라는 것을 확인하기 위해서 우리는 또한 부정합 보수 야생형을 재확립한다. 그러므로 우리는 추가적으로 기능적 MSH2 유전자를 가진 단편을 그의 개시자(promotor) 및 종결자(terminator) 영역과 함께 첨가했다.

체세포 유전자 재조합을 위한 파트너로서 사카로미세스 세리비시아 유전자에 82%의 상동성을 가지는 클루이베로미세스 써모톨러란스/라찬시아 써모톨러란스 ADH1 유전자(Kluyveromyces thermotholerans / Lachancea thermotolerans ADH1 gene)를 선택했다. 두 개의 단편들이 만들어졌다. 하나의 단편은 K. 써모톨러란스 ADH1 개방형 해독틀을 가진다. 클루이베로미세스 락티스(Kluyveromyces lactis)에서 온 개시자의 283 bp 및 URA3 ORF의 처음743 bp를 포함하는 TRP1 유전자 카세트로부터 온 종결자 영역의 296 bp를 3’ 말단에 가진 단편을 만들었다. K. 락티스의 URA3 유전자 생산물은 사카로미세스 세레비시아에서 ura3 결함을 보완할 수 있다. 두 번째 단편은 URA3의 마지막 160 bp 및 URA3의 종결자 영역의 223 bp를 가진다. 이 서열은 내부의 MSH2 개시자의 468 bp 및 MSH2 ORF (2894 bp) 및 TEF1 종결자의 242 bp에 따른다. 해당 단편은 염색체 XV(Chr. XV ) 상의 삽입 장소와 동일한 403 bp 서열 바로 옆의 3’ 옆 측면에 위치 된다. 모든 단편들은 Geneart에서 합성되었다.

ADH1-URA3 단편의 3’ 말단과 URA3-MSH2 단편의 5’ 말단이 상동이므로 두 단편들은 조립할 수 있다. 조립 후에 사카로미세스 세레비시아 ADH1 유전자의 재조합 및 삽입 단계가 일어난다.

형질전환 후에 몇 가지 클론들은 무작위적으로 분리되고 DNA가 제조되었다. ADH 재조합체들의 DNA를 서열분석 하였다. 밑줄이 그어진 서열들은 ADH 클루이베로마이서스 락티스에서 , 다른 것들은 사카로미세스 세레비시아에서 유래되었다 (도 9 참조).

<110> Eviagenics S.A. <120> Method of generating gene mosaics <130> IPA120883 <150> US 61/322,680 <151> 2010-04-09 <150> EP 10159515.5 <151> 2010-04-09 <160> 59 <170> KopatentIn 2.0 <210> 1 <211> 801 <212> DNA <213> Artificial Sequence <220> <223> gene hybrid OXA11/OXA7 <400> 1 atgaaaacat ttgccgcata tgtaattatc gcgtgtcttt cgagtacggc attagctagt 60 tcaattacag aaaatacgtt ttggaacaaa gagttctctg ccgaagccgt caatggtgtt 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca ataacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcagattttc aaatgggacg gaaaaccaag agccatgaaa 300 caatgggaaa gagacttgag cttaagaggg gcaatacaag tttcagcggt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga aatatcttaa aaaattttca 420 tatggtaacc agaatatcag tggcggcatt gacaaattct ggttggaggg tcagcttaga 480 atttccgcag ttaatcaagt ggagtttcta gagtctctat ttttaaataa attgtcagca 540 tcaaaagaaa atcagctaat agtaaaagag gctttggtaa cggaggctgc gcctgaatat 600 cttgtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg gttgggttga gaagggagca gaggtttact ttttcgcatt taacatggat 720 atagacaacg aaaataagtt gccgctaaga aaatccattc ccaccaaaat catggcaagt 780 gagggcatca ttggtggcta a 801 <210> 2 <211> 266 <212> PRT <213> Artificial Sequence <220> <223> protein hybrid OXA11/OXA7 <400> 2 Met Lys Thr Phe Ala Ala Tyr Val Ile Ile Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Ser Ser Ile Thr Glu Asn Thr Phe Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asn Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Ile Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Ser Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Asn Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Gly Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Val Glu Phe Leu Glu Ser Leu Phe Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Gly Ala Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Asn Lys Leu Pro Leu Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Ala Ser Glu Gly Ile Ile Gly Gly 260 265 <210> 3 <211> 801 <212> DNA <213> Artificial Sequence <220> <223> gene hybrid OXO11/OXO7 <400> 3 atgaaaacat ttgccgcata tgtaattatc gcgtgtcttt cgagtacggc attagctggt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcagattttc aaatgggacg gaaagccaag agccatgaaa 300 caatgggaaa gagacttgac cttaagaggg gcaatacaag tttcagcggt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga aatatcttaa aaaattttca 420 tatggtaacc agaatatcag tggtggcatt gacaaattct ggtcggaggg tcagcttaga 480 atttccgcag ttaatcaagt ggagtttcta gagtctctat ttttaaataa attgtcagca 540 tcaaaagaaa atcagctaat agtaaaagag gctttggtaa cggaggctgc gcctgaatat 600 cttgtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg gttgggttga gaagggagca gaggtttact ttttcgcatt taacatggat 720 atagacaacg aaaataagtt gccgctaaga aaatccattc ccaccaaaat catggcaagt 780 gagggcatca ttggtggcta a 801 <210> 4 <211> 266 <212> PRT <213> Artificial Sequence <220> <223> protein hybrid OXA11/OXA7 <400> 4 Met Lys Thr Phe Ala Ala Tyr Val Ile Ile Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Gly Ser Ile Thr Glu Asn Thr Ser Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Ile Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Thr Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Asn Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Ser Glu Gly Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Val Glu Phe Leu Glu Ser Leu Phe Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Gly Ala Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Asn Lys Leu Pro Leu Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Ala Ser Glu Gly Ile Ile Gly Gly 260 265 <210> 5 <211> 801 <212> DNA <213> Artificial Sequence <220> <223> gene hybrid OXA11/OXA7 <400> 5 atgaaaacat ttgccgcata tgtaattatc gcgtgtcttt cgagtacggc attagctggt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcaggttttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttgac cttaagaggg gcaatacaag tttcagctgt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga aataccttaa aaaattttcc 420 tatggcagcc agaatatcag tggtggcatt gacaaattct ggttggaaga ccagcttaga 480 atttccgcag ttaatcaagt ggagtttcta gagtctctat atttaaataa attgtcagca 540 tctaaagaaa accagctaat agtaaaagag gctttggtaa cggaggcggc acctgaatat 600 ctagtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg ggtgggttga gaaggagaca gaggtttact ttttcgcctt taacatggat 720 atagacaacg aaagtaagtt gccgctaaga aaatccattc ccaccaaaat cagggaaagt 780 gagggcatca ttggtggcta a 801 <210> 6 <211> 266 <212> PRT <213> Artificial Sequence <220> <223> protein hybrid OXA11/OXA7 <400> 6 Met Lys Thr Phe Ala Ala Tyr Val Ile Ile Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Gly Ser Ile Thr Glu Asn Thr Ser Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Thr Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Ser Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Asp Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Val Glu Phe Leu Glu Ser Leu Tyr Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Glu Thr Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Ser Lys Leu Pro Leu Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Arg Glu Ser Glu Gly Ile Ile Gly Gly 260 265 <210> 7 <211> 801 <212> DNA <213> Artificial Sequence <220> <223> gene hybrid OXA11/OXA7 <400> 7 atgaaaacat ttgccgcata tgtaattatc gcgtgtcttt cgagtacggc attagctggt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcacca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcaggttttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttgac cttaagaggg gcaatacaag tttcagctgt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga aataccttaa aaaattttcc 420 tatggcagcc agaatatcag tggtggcatt gacaaattct ggttggaagg tcagcttaga 480 atttccgcag ttaatcaagt ggagtttcta gagtctctat ttttaaataa attgtcagca 540 tcaaaagaaa atcagctaat agtaaaagag gctttggtaa cggaggctgc gcctgaatat 600 cttgtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg gttgggttga gaagggagca gaggtttact ttttcgcatt taacatggat 720 atagacaacg aaaataagtt gccgctaaga aaatccattc ccaccaaaat catggcaagt 780 gagggcatca ttggtggcta a 801 <210> 8 <211> 266 <212> PRT <213> Artificial Sequence <220> <223> protein hybrid OXA11/OXA7 <400> 8 Met Lys Thr Phe Ala Ala Tyr Val Ile Ile Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Gly Ser Ile Thr Glu Asn Thr Ser Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Pro Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Thr Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Ser Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Gly Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Val Glu Phe Leu Glu Ser Leu Phe Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Gly Ala Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Asn Lys Leu Pro Leu Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Ala Ser Glu Gly Ile Ile Gly Gly 260 265 <210> 9 <211> 801 <212> DNA <213> Artificial Sequence <220> <223> gene hybrid OXA11/OXA7 <400> 9 atgaaaacat ttgccgcata tgtaattatc gcgtgtcttt cgagtacggc attagctggt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcaggttttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttgac cttaagaggg gcaatacaag tttcagctgt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga aataccttaa aaaattttcc 420 tatggcagcc agaatatcag tggtggcatt gacaaattct ggttggaaga ccagcttaga 480 atttccgcag ttaatcaagt ggagtttcta gagtctctat atttaaataa attgtcagca 540 tctaaagaaa accagctaat agtaaaagag gctttggtaa cggaggcggc acctgaatat 600 ctagtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg ggtgggttga gaaggagaca gaggtttact ttttcgcctt taacatggat 720 atggacaacg aaagtaagtt gccgctaaga aaatccattc ccaccaaaat catggaaagt 780 gagggcatca ttggtggcta a 801 <210> 10 <211> 266 <212> PRT <213> Artificial Sequence <220> <223> protein hybrid OXA11/OXA7 <400> 10 Met Lys Thr Phe Ala Ala Tyr Val Ile Ile Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Gly Ser Ile Thr Glu Asn Thr Ser Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Thr Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Ser Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Asp Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Val Glu Phe Leu Glu Ser Leu Tyr Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Glu Thr Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Met Asp Asn Glu Ser Lys Leu Pro Leu Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Glu Ser Glu Gly Ile Ile Gly Gly 260 265 <210> 11 <211> 801 <212> DNA <213> Artificial Sequence <220> <223> gene hybrid OXA11/OXA7 <400> 11 atgaaaacat ttgccgcata tgtaattact gcgtgtcttt caagtacggc attagctagt 60 tcaattacag aaaatacgtt ttggaacaaa gagttctctg ccgaagccgt caatggtgtt 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacct ataacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcagattttc aaatgggacg gaaagccaag agccatgaaa 300 caatgggaaa gagacttgag cttaagaggg gcaatacaag tttcagcggt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga aatatcttaa aaaattttca 420 tatggtaacc agaatatcag tggtggcatt gacaaattct ggttggaggg tcagcttaga 480 atttccgcag ttaatcaagt ggagtttcta gagtctctat ttttaaataa attgtcagca 540 tcaaaagaaa atcagctaat agtaaaagag gctttggtaa cggaggctgc gcctgaatat 600 cttgtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg gttgggttga gaagggagca gaggtttact ttttcgcatt taacatggat 720 atagacaacg aaaataagtt gccgctaaga aaatccattc ccaccaaaat catggcaagt 780 gagggcatca ttggtggcta a 801 <210> 12 <211> 266 <212> PRT <213> Artificial Sequence <220> <223> protein hybrid OXA11/OXA7 <400> 12 Met Lys Thr Phe Ala Ala Tyr Val Ile Thr Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Ser Ser Ile Thr Glu Asn Thr Phe Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Tyr Asn Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Ile Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Ser Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Asn Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Gly Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Val Glu Phe Leu Glu Ser Leu Phe Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Gly Ala Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Asn Lys Leu Pro Leu Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Ala Ser Glu Gly Ile Ile Gly Gly 260 265 <210> 13 <211> 801 <212> DNA <213> Artificial Sequence <220> <223> gene hybrid OXA11/OXA7 <400> 13 atgaaaacat ttgccgcata tgtaattatc gcgtgtcttt cgagtacggc attagctggt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa ggaatgagca tcaggttttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttgac cttaagaggg gcaatacaag tttcagctgt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga aataccttaa aaaattttcc 420 tatggcagcc agaatatcag tggtggcatt gacaaattct ggttggaaga ccagcttaga 480 atttccgcag ttaatcaagt ggagtttcta gagtctctat atttaaataa attgtcagca 540 tctaaagaaa atcagctaat agtaaaagag gctttggtaa cggaggctgc gcctgaatat 600 cttgtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg ggtgggttga gaaggagaca gaggtttact ttttcgcatt taacatggat 720 atagacaacg aaaataagtt gccgctaaga aaattcattc ccaccaaaat catggcaagt 780 gagggcatca ttggtggcta a 801 <210> 14 <211> 266 <212> PRT <213> Artificial Sequence <220> <223> protein hybrid OXA11/OXA7 <400> 14 Met Lys Thr Phe Ala Ala Tyr Val Ile Ile Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Gly Ser Ile Thr Glu Asn Thr Ser Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Arg Asn Glu His Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Thr Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Ser Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Asp Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Val Glu Phe Leu Glu Ser Leu Tyr Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Glu Thr Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Asn Lys Leu Pro Leu Arg Lys Phe Ile Pro Thr Lys 245 250 255 Ile Met Ala Ser Glu Gly Ile Ile Gly Gly 260 265 <210> 15 <211> 804 <212> DNA <213> Artificial Sequence <220> <223> gene hybrid OXA11/OXA5 <400> 15 atgaaaacat ttgccgcata tgtaattatc gcgtgtcttt cgagtacggc attagctggt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagagact 240 ggtgtcataa agaatgagca tcaggttttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttgac cttaagaggg gcaatacaag tttcagctgt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga aataccttaa aaaattttcc 420 tatggcagcc agaatatcag tggtggcatt gacaaattct ggttggaaga ccagcttaga 480 atttccgcag ttaatcaagt ggagtttcta gagtctctat atttaaataa attgtcagca 540 tctaaagaaa accagctaat agtaaaagag gcaatagtta cagaagcaac tccagaatat 600 atagttcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg ggtgggttga gaaggagaca gaggtttact ttttcgcctt taacatggat 720 atagacaacg aaagtaagtt gccgctaaga aaatccattc ccaccaaaat catggaaagt 780 gagggcatca tcattggtgg ctaa 804 <210> 16 <211> 267 <212> PRT <213> Artificial Sequence <220> <223> protein hybrid OXA11/OXA5 <400> 16 Met Lys Thr Phe Ala Ala Tyr Val Ile Ile Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Gly Ser Ile Thr Glu Asn Thr Ser Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Thr Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Ser Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Asp Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Val Glu Phe Leu Glu Ser Leu Tyr Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Ile 180 185 190 Val Thr Glu Ala Thr Pro Glu Tyr Ile Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Glu Thr Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Ser Lys Leu Pro Leu Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Glu Ser Glu Gly Ile Ile Ile Gly Gly 260 265 <210> 17 <211> 801 <212> DNA <213> Artificial Sequence <220> <223> gene hybrid OXA11/OXA5 <400> 17 atgaaaacat ttgccgcata tgtaattatc gcgtgtcttt cgagtacggc attagctggt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcaggttttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttgac cttaagaggg gcaatacaag tttcagctgt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga aataccttaa aaaattttcc 420 tatggcagcc agaatatcag tggtggcatt gacaaattct ggttggaaga ccagcttaga 480 atttccgcag ttaatcaagt ggagtttcta gagtctctat atttaaataa attgtcagca 540 tctaaagaaa accagctaat agtaaaagag gctttggtaa cggaggcggc acctgaatat 600 ctagtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg ggtgggtaga gaaaggaact gaggtttact ttttcgcctt tagcatggat 720 atagacaacg aaagtaagtt gccgctaaga aaatccattc ccaccaaaat catggaaagt 780 gagggcatca ttggtggcta a 801 <210> 18 <211> 266 <212> PRT <213> Artificial Sequence <220> <223> protein hybrid OXA11/OXA7 <400> 18 Met Lys Thr Phe Ala Ala Tyr Val Ile Ile Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Gly Ser Ile Thr Glu Asn Thr Ser Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Thr Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Ser Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Asp Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Val Glu Phe Leu Glu Ser Leu Tyr Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Gly Thr Glu Val Tyr Phe Phe Ala Phe Ser Met Asp 225 230 235 240 Ile Asp Asn Glu Ser Lys Leu Pro Leu Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Glu Ser Glu Gly Ile Ile Gly Gly 260 265 <210> 19 <211> 804 <212> DNA <213> Artificial Sequence <220> <223> gene hybris OXA11/OXA5 <400> 19 atgaaaacat ttgccgcata tgtaattatc gcgtgtcttt cgagtacggc attagctggt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcaggttttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttgac cttaagaggg gcaatacaag tttcagctgt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga aataccttaa aaaattttcc 420 tatggcagcc agaatatcag tggtggcatt gacaaattct ggttggaaga ccagcttaga 480 atttccgcag ttaatcaagt ggagtttcta gagtctctat atttaaataa attgtcagca 540 tctaaagaaa accagctaat agtaaaagag gctttggtaa cggaggcggc acctgaatat 600 ctagtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg ggtgggttga gaaggagaca gaggtttact ttttcgcctt taacatggat 720 atagacaacg agagtaaatt gccgtcaaga aaatccattt caacgaaaat catggcaagt 780 gaaggcatca tcattggtgg ctaa 804 <210> 20 <211> 267 <212> PRT <213> Artificial Sequence <220> <223> protein hybrid OXA11/OXA5 <400> 20 Met Lys Thr Phe Ala Ala Tyr Val Ile Ile Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Gly Ser Ile Thr Glu Asn Thr Ser Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Thr Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Ser Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Asp Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Val Glu Phe Leu Glu Ser Leu Tyr Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Glu Thr Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Ser Lys Leu Pro Ser Arg Lys Ser Ile Ser Thr Lys 245 250 255 Ile Met Ala Ser Glu Gly Ile Ile Ile Gly Gly 260 265 <210> 21 <211> 801 <212> DNA <213> Artificial Sequence <220> <223> gene hybrid OXO11/OXO5 <400> 21 atgaaaacat ttgccgcata tgtaattatc gcgtgtcttt cgagtacggc attagctggt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcaggttttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttgac cttaagaggg gcaatacaag tttcagctgt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagtg agaatgcaga aataccttaa aaaattttcc 420 tatggcagcc agaatatcag tggtggcatt gacaaattct ggttggaaga ccagcttaga 480 atttccgcag ttaatcaagt ggagtctcta gagtctctat atttaaataa attgtcagca 540 tctaaagaaa accagctaat agtaaaagag gctttggtaa cggaggcggc acctgaatat 600 ctagtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg ggtgggttga gaaggagaca gaggtttact ttttcgcctt taacatggat 720 atagacaacg aaagtaagtt gccgctaaga aaatccattc ccaccaaaat catggaaagt 780 gagggcatca ttggtggcta a 801 <210> 22 <211> 266 <212> PRT <213> Artificial Sequence <220> <223> protein hybrid OXO11/OXO5 <400> 22 Met Lys Thr Phe Ala Ala Tyr Val Ile Ile Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Gly Ser Ile Thr Glu Asn Thr Ser Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Thr Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Ser Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Asp Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Val Glu Ser Leu Glu Ser Leu Tyr Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Glu Thr Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Ser Lys Leu Pro Leu Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Glu Ser Glu Gly Ile Ile Gly Gly 260 265 <210> 23 <211> 804 <212> DNA <213> Artificial Sequence <220> <223> gene hybrid OXO11/OXO5 <400> 23 atgaaaacat ttgccgcata tgtaattatc gcgtgtcttt cgagtacggc attagctggt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcaggttttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttgac cttaagaggg gcaatacaag tttcagctgt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga aataccttaa aaaattttcc 420 tatggcagcc agaatatcag tggtggcatt gacaaattct ggttggaaga ccagcttaga 480 atttccgcag ttaatcaaga ggagtttcta gagtctctat atttaaataa attgtcagca 540 tctaaagaaa accagctaat agtaaaagag gctttggtaa cggaggcggc acctgaatat 600 ctagtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg ggtgggttga gaaggagaca gaggtttact ttttcgcctt taacatggat 720 atagacaacg aaagtaagtt gccgctaaga aaatccattc ccaccaaaat catggaaagt 780 gagggcatca tcattggtgg ctaa 804 <210> 24 <211> 267 <212> PRT <213> Artificial Sequence <220> <223> protein hybrid OXO11/OXO5 <400> 24 Met Lys Thr Phe Ala Ala Tyr Val Ile Ile Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Gly Ser Ile Thr Glu Asn Thr Ser Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Thr Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Ser Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Asp Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Glu Glu Phe Leu Glu Ser Leu Tyr Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Glu Thr Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Ser Lys Leu Pro Leu Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Glu Ser Glu Gly Ile Ile Ile Gly Gly 260 265 <210> 25 <211> 800 <212> DNA <213> Artificial Sequence <220> <223> gene hybrid OXO11/OXO5 <400> 25 atgaaaacat ttgccgcata tgtaattatc gcgtgtcttt cgagtacggc attagctggt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcaggttttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttgag cttaagaggg gcaatacaag tttcagctgt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga gataccttaa aaaattttcc 420 tatggcagcc agaatatcag tggtggcatt gacaaattct ggttggaaga ccagcttaga 480 atttccgcag ttaatcaagt ggagtttcta gagtctctat atttaaataa attgtcagca 540 tctaaagaaa accagctaat agtaaaagag gctttggtaa cggaggcggc acctgaatat 600 ctagtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg ggtgggttgg gaaggagaca gaggtttact ttttcgcctt taacatggat 720 atagacaacg aaagtaagtt gccgctaaga aatccattcc caccaaaatc atggaaagtg 780 agggcatcat tggtggctaa 800 <210> 26 <211> 266 <212> PRT <213> Artificial Sequence <220> <223> protein hybrid OXO11/OXO5 <400> 26 Met Lys Thr Phe Ala Ala Tyr Val Ile Ile Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Gly Ser Ile Thr Glu Asn Thr Ser Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Ser Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Arg Tyr Leu Lys Lys Phe Ser Tyr Gly Ser Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Asp Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Val Glu Phe Leu Glu Ser Leu Tyr Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Gly Lys Glu Thr Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Ser Lys Leu Pro Leu Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Glu Ser Glu Gly Ile Ile Gly Gly 260 265 <210> 27 <211> 802 <212> DNA <213> Artificial Sequence <220> <223> gene hybrid OXO11/OXO5 <400> 27 atgaaaacat ttgccgcata tgtaattact gcgtgtcttt caagtacggc attagctagt 60 tcaattacag aaaatacgtt ttggaacaaa gagttctctg ccgaagccgt caatggtgtt 120 ttttcgtgct ttgtaaaagt agcagtaaat cctgcgctac caataactta gctcgtgcat 180 caaaggaata tcttccagca tcaacattta agatccccaa cgcaattatc ggcctagaaa 240 ctggtgtcat aaagaatgag catcaggttt tcaaatggga cggaaagcca agagccatga 300 aacaatggga aagagacttg agcttaagag gggcaataca agtttcagcg gttcccgtat 360 ttcaacaaat cgccagagaa gttggcgaag taagaatgca gaaatatctt aaaaaatttt 420 catatggtaa ccagaatatc agtggtggca ttgacaaatt ctggttggag ggtcagctta 480 gaatttccgc agttaatcaa gtggagtttc tagagtctct atttttaaat aaattgtcag 540 catcaaaaga aaatcagcta atagtaaaag aggctttggt aacggaggct gcgcctgaat 600 atcttgtgca ttcaaaaact ggtttttctg gtgtgggaac tgagtcaaat cctggtgtcg 660 catggtgggt tggttgggtt gagaagggag cagaggttta ctttttcgca tttaacatgg 720 atatagacaa cgaaaataag ttgccgctaa gaaaatccat tcccaccaaa tcatggcaag 780 tgagggcatc attggtggct aa 802 <210> 28 <211> 266 <212> PRT <213> Artificial Sequence <220> <223> protein hybrid OXO11/OXO5 <400> 28 Met Lys Thr Phe Ala Ala Tyr Val Ile Thr Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Ser Ser Ile Thr Glu Asn Thr Phe Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asn Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Ser Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Asn Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Gly Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Val Glu Phe Leu Glu Ser Leu Phe Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Gly Ala Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Asn Lys Leu Pro Leu Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Ala Ser Glu Gly Ile Ile Gly Gly 260 265 <210> 29 <211> 801 <212> DNA <213> Artificial Sequence <220> <223> gene hybrid OXO11/OXO5 <400> 29 atgaaaacat ttgccgcata cgtaattact gcgtgtcttt caagtacggc attagctagt 60 tcaattacag aaaatacgtt ttggaacaaa gagttctctg ccgaagccgt caatggtgtt 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcagattttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttgac cttaagaggg gcaatacaag tttcagctgt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga aataccttaa aaaattttca 420 tatggtaacc agaatatcag tggtggcatt gacaaattct ggttggaggg tcagcttaga 480 attcccgcag ttaatcaagt ggagtttcta gagtctctat ttttaaataa attgtcagca 540 tcaaaagaaa atcagctaat agtaaaagag gctttggtaa cggaggcggc acctgaatat 600 cttgtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg gttgggttga gaagggagca gaggtttact ttttcgcatt taacatggat 720 atagacaacg aaaataagtt gccgctaaga aaatccattc ccaccaaaat catggcaagt 780 gagggcatca ttggtggcta a 801 <210> 30 <211> 266 <212> PRT <213> Artificial Sequence <220> <223> protein hybrid OXO11/OXO5 <400> 30 Met Lys Thr Phe Ala Ala Tyr Val Ile Thr Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Ser Ser Ile Thr Glu Asn Thr Phe Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Ile Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Thr Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Asn Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Gly Gln Leu Arg 145 150 155 160 Ile Pro Ala Val Asn Gln Val Glu Phe Leu Glu Ser Leu Phe Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Gly Ala Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Asn Lys Leu Pro Leu Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Ala Ser Glu Gly Ile Ile Gly Gly 260 265 <210> 31 <211> 801 <212> DNA <213> Artificial Sequence <220> <223> gene hybrid OXO11/OXO5 <400> 31 atgaaaacat ttgccgcata tgtaattatc gcgtgtcttt cgagtacggc attagctggt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcaggttttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttgac cttaagaggg gcaatacaag tttcagctgt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga aataccttaa aaaattttcc 420 tatggcagcc agaatatcag tggtggcatt gacaaattct ggttggaaga ccagcttaga 480 atttccgcag ttaatcaagt ggagtttcta gagtctctat atttaaataa attgtcagca 540 tctaaagaaa accagctaat agtaaaagag gctttggtaa cggaggcggc acctgaatat 600 ctagtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg ggtgggttga gaaggagaca gaggtttact ttttcgcctt taacatggat 720 atagacaacg aaagtaagtt gccgctaaga aaatccattc ccaccaaaat catggaaagt 780 gagggcatca ttggtggcta a 801 <210> 32 <211> 266 <212> PRT <213> Artificial Sequence <220> <223> protein hybrid OXO11/OXO5 <400> 32 Met Lys Thr Phe Ala Ala Tyr Val Ile Ile Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Gly Ser Ile Thr Glu Asn Thr Ser Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Thr Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Ser Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Asp Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Val Glu Phe Leu Glu Ser Leu Tyr Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Glu Thr Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Ser Lys Leu Pro Leu Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Glu Ser Glu Gly Ile Ile Gly Gly 260 265 <210> 33 <211> 801 <212> DNA <213> Artificial Sequence <220> <223> gene hybrid OXO11/OXO5 <400> 33 atgaaaacat ttgccgcata tgtaattatc gcgtgtcttt cgagtacggc attagctggt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcaggttttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttgac cttaagaggg gcaatacaag tttcagctgt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga aataccttaa aaaattttcc 420 tatggcagcc agaatatcag tggtggcatt gacaaattct ggttggaaga ccagcttaga 480 atttccgcag ttaatcaagt ggagtttcta gagtctctat atttaaataa attgtcagca 540 tctaaagaaa accagctaat agtaaaagag gctttggtaa cggaggcggc acctgaacat 600 ctagtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg ggtgggttga gaaggagaca gaggtttact ttttcgcctt taacatggac 720 atagacaacg aaagtaagtt gccgctaaga aaatccattc ccaccaaaat catggaaagt 780 gagggcatca ttggtggcta a 801 <210> 34 <211> 266 <212> PRT <213> Artificial Sequence <220> <223> protein hybrid OXO11/OXO5 <400> 34 Met Lys Thr Phe Ala Ala Tyr Val Ile Ile Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Gly Ser Ile Thr Glu Asn Thr Ser Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Thr Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Ser Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Asp Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Val Glu Phe Leu Glu Ser Leu Tyr Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu His Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Glu Thr Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Ser Lys Leu Pro Leu Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Glu Ser Glu Gly Ile Ile Gly Gly 260 265 <210> 35 <211> 804 <212> DNA <213> Artificial Sequence <220> <223> gene hybrid OXO11/OXO5 <400> 35 atgaaaacat ttgccgcata tttaattatc gcgtgtcttt cgagtacggc attagctggt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcaggttttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttgac cttaagaggg gcaatacaag tttcagctgt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga aataccttaa aaaattttcc 420 tatggcagcc agaatatcag tggtggcatt gacaaattct ggttggaaga ccagcttaga 480 atttccgcag ttaatcaagt ggagtttcta gagtctctat atttaaataa attgtcagca 540 tctaaagaaa accagctaat agtaaaagag gctttggtaa cggaggcggc acctgaatat 600 ctagtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg ggtgggttga gaaggagaca gaggtttact ttttcgcctt taacatggat 720 atagacaacg aaagtaagtt gccgctaaga aaatccattc ccaccaaaat catggaaagt 780 gagggcatca tcattggtgg ctta 804 <210> 36 <211> 267 <212> PRT <213> Artificial Sequence <220> <223> protein hybrid OXO11/OXO5 <400> 36 Met Lys Thr Phe Ala Ala Tyr Leu Ile Ile Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Gly Ser Ile Thr Glu Asn Thr Ser Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Thr Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Ser Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Asp Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Val Glu Phe Leu Glu Ser Leu Tyr Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Glu Thr Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Ser Lys Leu Pro Leu Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Glu Ser Glu Gly Ile Ile Ile Gly Gly 260 265 <210> 37 <211> 804 <212> DNA <213> Artificial Sequence <220> <223> gene hybrid OXO11/OXO5 <400> 37 atgaaaacat ttgccgcata tgtaattatc gcgtgtcttt cgagtacggc attagctggt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcaggttttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttgac cttaagaggg gcaatacaag tttctgctgt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga aataccttaa aaaattttcc 420 tatggcagcc agaatatcag tggtggcatt gacaaattct ggttggaaga ccagcttaga 480 atttccgcag ttaatcaagt ggagtttcta gagtctctat atttaaataa attgtcagca 540 tctaaagaaa accagctaat agtaaaagag gctttggtaa cggaggcggc acctgaatat 600 ctagtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg ggtgggttga gaaggagact gaggtttact tttttgcttc taacatggac 720 atagacaatg agagtaaatt gccgtcaaga aaatccattt caacgaaaat catggcaagt 780 gaaggcatca tcattggtgg ctaa 804 <210> 38 <211> 267 <212> PRT <213> Artificial Sequence <220> <223> protein hybrid OXO11/OXO5 <400> 38 Met Lys Thr Phe Ala Ala Tyr Val Ile Ile Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Gly Ser Ile Thr Glu Asn Thr Ser Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Thr Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Ser Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Asp Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Val Glu Phe Leu Glu Ser Leu Tyr Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Glu Thr Glu Val Tyr Phe Phe Ala Ser Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Ser Lys Leu Pro Ser Arg Lys Ser Ile Ser Thr Lys 245 250 255 Ile Met Ala Ser Glu Gly Ile Ile Ile Gly Gly 260 265 <210> 39 <211> 801 <212> DNA <213> Saccharomyces cerevisiae <400> 39 atgaaaacat ttgccgcata tgtaattatc gcgtgtcttt cgagtacggc attagctggt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcaggttttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttgac cttaagaggg gcaatacaag tttcagctgt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga aataccttaa aaaattttcc 420 tatggcagcc agaatatcag tggtggcatt gacaaatcct ggttggaaga ccagcttaga 480 atttccgcag ttaatcaagt ggagtttcta gagtctctat atttaaataa attgtcagca 540 tctaaagaaa accagctaat agtaaaagag gctttggtaa cggaggcggc acctgaatat 600 ctagtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg ggtgggttga gaaggagaca gaggtttact ttttcgcctt taacatggat 720 atagacaacg aaagtaagtt gccgctaaga aaatccattc ccaccaaaat catggaaagt 780 gagggcatca ttggtggcta a 801 <210> 40 <211> 801 <212> DNA <213> Saccharomyces cerevisiae <400> 40 atgaaaacat ttgccgcata tgtaattact gcgtgtcttt caagtacggc attagctagt 60 tcaattacag aaaatacgtt ttggaacaaa gagttctctg ccgaagccgt caatggtgtt 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca ataacttagc tcgtgcacca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcagattttc aaatgggacg gaaaaccaag agccatgaaa 300 caatgggaaa gagacttgag cttaagaggg gcaatacaag tttcagcggt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga aatatcttaa aaaattttca 420 tatggtaacc agaatatcag tggcggcatt gacaaattct ggtcggaggg tcagcttaga 480 atttccgcag ttaatcaagt ggagtttcta gagtctctat ttttaaataa attgtcagca 540 tcaaaagaaa atcagctaat agtaaaagag gctttggtaa cggaggctgc gcctgaatat 600 cttgtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg gttgggttga gaagggagca gaggtttact ttttcgcatt taacatggat 720 atagacaacg aaaataagtt gccgctaaga aaatccattc ccaccaaaat catggcaagt 780 gagggcatca ttggtggcta a 801 <210> 41 <211> 804 <212> DNA <213> Saccharomyces cerevisiae <400> 41 atgaaaacca tagccgcata cttagttact tcctgttttt caagcaccgc gctctcaaag 60 tctatttctg aaaatttggt gtggaataaa gaattttcta gtgaatccgt acatggcgtt 120 tttgtacttt gtaaaagtag tagcaattcc tgtactacaa ataatgcggc acgtgcatct 180 acagcctata ttccagcatc aacattcaaa attcctaatg ctctaatagg tcttgaaacc 240 ggcgccataa aagatgaacg gcagattttc aaatgggacg gcaagcccag agccatgaaa 300 caatgggaaa aagacttaag gctaaggggc gctatacagg tttctgcggt tccggtattt 360 caacaaattg ccagagaagt tggcgaaatg agaatgcaaa gatatcttaa cctgttttca 420 tacggtaacg ccaatatagg gggaggcatt gacaaattct ggctagaggg tcagcttaga 480 atcccagcat tcaatcaaga taaatcttta gagtcgctct tcctgaataa tttgccagca 540 tcaaaagcaa atcaactaat agtaaaagag gcaatagtta cagaagctac gccagaatat 600 attgttcatt caaaaactgg gtattccggt gttggcacag aatcaagtcc tggtgtcgct 660 tggtgggttg gttgggtagg gaaaggagct gaggtttact tttttgcatt taacatggac 720 atagacaatg agaataaatt gccgtcaaga aaatccattt caacgaaaat catggcaagt 780 gaaggcatca tcattggtgg ctaa 804 <210> 42 <211> 827 <212> DNA <213> Artificial Sequence <220> <223> OUL3-05-II <400> 42 atgaaaacat ttgccgcata tgtaattatc gcgtgtcttt cgagtacggc attagctggt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacattcaaa attcctaatg ctctaatagg tcttgaaacc 240 ggcgccataa aagatgaacg gcaggttttc aaatgggacg gcaagcccag agccatgaag 300 caatgggaaa aagacttaaa gctaaggggc gctatacagg tttctgctgt tccggtattt 360 caacaaattg ccagagaagt tggcgaaata agaatgcaaa aataccttaa cctgttttca 420 tacggcaacg ccaatatagg gggaggcatt gacaaattct ggctagaagg tcagcttaga 480 atctcagcat tcaatcaagt taaattttta gagtcgctct acctgaataa tttgccagca 540 tcaaaagcaa accaactaat agtaaaagag gcaatagtta cagaagcaac tccagaatat 600 atagttcatt caaaaactgg gtattccggt gttggcacag aatcaagtcc tggtgtcgct 660 tggtgggttg gttgggtaga gaaaggaact gaggtttact tttttgcttt taacatggac 720 atagacaatg agagtaaatt gccgtcaaga aaatccattc ccaccaaaat catggcaagt 780 gagggcatca ttggtggcta agctgtgaag atcccagcaa aggctta 827 <210> 43 <211> 266 <212> PRT <213> Artificial Sequence <220> <223> OUL3-05-II <400> 43 Met Lys Thr Phe Ala Ala Tyr Val Ile Ile Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Gly Ser Ile Thr Glu Asn Thr Ser Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Leu Ile Gly Leu Glu Thr 65 70 75 80 Gly Ala Ile Lys Asp Glu Arg Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Lys Asp Leu Lys Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Ile Arg Met Gln Lys Tyr Leu Asn Leu Phe Ser Tyr Gly Asn Ala 130 135 140 Asn Ile Gly Gly Gly Ile Asp Lys Phe Trp Leu Glu Gly Gln Leu Arg 145 150 155 160 Ile Ser Ala Phe Asn Gln Val Lys Phe Leu Glu Ser Leu Tyr Leu Asn 165 170 175 Asn Leu Pro Ala Ser Lys Ala Asn Gln Leu Ile Val Lys Glu Ala Ile 180 185 190 Val Thr Glu Ala Thr Pro Glu Tyr Ile Val His Ser Lys Thr Gly Tyr 195 200 205 Ser Gly Val Gly Thr Glu Ser Ser Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Gly Thr Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Ser Lys Leu Pro Ser Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Ala Ser Glu Gly Ile Ile Gly Gly 260 265 <210> 44 <211> 801 <212> DNA <213> Artificial Sequence <220> <223> OUL3-05-III <400> 44 atgaaaacat ttgccgcata tttagttctc gcgtgtcttt cgagtacggc attagctggt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg tctagaaact 240 ggtgtcataa agaatgagca tcaggttttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttgac cttaagaggg gcaatacaag tttcagctgt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaaata agaatgcaga aatatcttaa aaaattttca 420 tatggtaacc agaatatcag tggtggcatt gacaaattct ggctagaagg tcagcttaga 480 atctcagcat tcaatcaagt taaattttta gagtcgctct acctgaataa tttgccagca 540 tcaaaagaaa atcagctaat agtaaaagag gctttggtaa cggaggctgc gcctgaatat 600 cttgtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg gttgggttga gaagggagca gaggtttact ttttcgcatt taacatggat 720 atagacaacg aaaataagtt gccgctaaga aaatccattc ccaccaaaat catggcaagt 780 gagggcatca ttggtggcta a 801 <210> 45 <211> 266 <212> PRT <213> Artificial Sequence <220> <223> OUL3-05-III <400> 45 Met Lys Thr Phe Ala Ala Tyr Leu Val Leu Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Gly Ser Ile Thr Glu Asn Thr Ser Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Thr Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Ile Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Asn Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Gly Gln Leu Arg 145 150 155 160 Ile Ser Ala Phe Asn Gln Val Lys Phe Leu Glu Ser Leu Tyr Leu Asn 165 170 175 Asn Leu Pro Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Gly Ala Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Asn Lys Leu Pro Leu Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Ala Ser Glu Gly Ile Ile Gly Gly 260 265 <210> 46 <211> 801 <212> DNA <213> Artificial Sequence <220> <223> OUL3-05-IV <400> 46 atgaaaacat ttgccgcata tgtaattatc gcgtgtcttt cgagtacggc attagctagt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcaggttttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttgac cttaagaggg gcaatacaag tttcagctgt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaaata agaatgcaga aatatcttaa aaaattttca 420 tatggtaacc agaatatcag tggtggcatt gacaaattct ggttggaggg tcagcttaga 480 atttccgcag ttaatcaagt ggagtttcta gagtctctat ttttaaataa attgtcagca 540 tcaaaagaaa atcagctaat agtaaaagag gctttggtaa cggaggctgc gcctgaatat 600 cttgtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg gttgggttga gaagggagca gaggtttact ttttcgcatt taacatggat 720 atagacaacg aaaataagtt gccgctaaga aaatccattc ccaccaaaat catggcaagt 780 gagggcatca ttggtggcta a 801 <210> 47 <211> 266 <212> PRT <213> Artificial Sequence <220> <223> OUL3_05_IV <400> 47 Met Lys Thr Phe Ala Ala Tyr Val Ile Ile Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Ser Ser Ile Thr Glu Asn Thr Ser Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Thr Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Ile Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Asn Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Gly Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Val Glu Phe Leu Glu Ser Leu Phe Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Gly Ala Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Asn Lys Leu Pro Leu Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Ala Ser Glu Gly Ile Ile Gly Gly 260 265 <210> 48 <211> 801 <212> DNA <213> Artificial Sequence <220> <223> OUL3-05-IX <400> 48 atgaaaacat tagccgcata tttagttcta gttttttatg caagcaccgc gctctcagag 60 tcaattacag aaaatttggc gtggaataaa gaattttcta gtgaatccgt acatggcgtt 120 tttgtacttt gtaaaagtag tagcaattcc tgtactacaa ataatgcggc acgtgcatct 180 acagcctata ttccagcatc aacattcaaa attcctaatg ctctaatagg tcttgaaacc 240 ggcgccataa aagatgaacg gcaggttttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttaaa gctaaggggc gctatacagg tttctgctgt tccggtattt 360 caacaaattg ccagagaagt tggcgaaata agaatgcaaa aataccttaa cctgttttca 420 tacggcaacg ccaatatagg gggaggcatt gacaaattct ggctagaagg tcagcttaga 480 atctcagcat tcaatcaagt taaattttta gagtcgctct acctgaataa attgtcagca 540 tcaaaagaaa accaactaat agtaaaagag gcaatagtta cagaagcaac tccagaatat 600 atagttcatt caaaaactgg tttttctggt gttggcacag aatcaagtcc tggtgtcgct 660 tggtgggttg gttgggtaga gaaaggaact gaggtttact tttttgcttt taacatggac 720 atagacaatg agagtaaatt gccgtcaaga aaatccattc ccaccaaaat catggcaagt 780 gagggcatca ttggtggcta a 801 <210> 49 <211> 266 <212> PRT <213> Artificial Sequence <220> <223> OUL3-05-IX <400> 49 Met Lys Thr Leu Ala Ala Tyr Leu Val Leu Val Phe Tyr Ala Ser Thr 1 5 10 15 Ala Leu Ser Glu Ser Ile Thr Glu Asn Leu Ala Trp Asn Lys Glu Phe 20 25 30 Ser Ser Glu Ser Val His Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Asn Ser Cys Thr Thr Asn Asn Ala Ala Arg Ala Ser Thr Ala Tyr Ile 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Leu Ile Gly Leu Glu Thr 65 70 75 80 Gly Ala Ile Lys Asp Glu Arg Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Lys Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Ile Arg Met Gln Lys Tyr Leu Asn Leu Phe Ser Tyr Gly Asn Ala 130 135 140 Asn Ile Gly Gly Gly Ile Asp Lys Phe Trp Leu Glu Gly Gln Leu Arg 145 150 155 160 Ile Ser Ala Phe Asn Gln Val Lys Phe Leu Glu Ser Leu Tyr Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Ile 180 185 190 Val Thr Glu Ala Thr Pro Glu Tyr Ile Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Ser Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Gly Thr Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Ser Lys Leu Pro Ser Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Ala Ser Glu Gly Ile Ile Gly Gly 260 265 <210> 50 <211> 801 <212> DNA <213> Artificial Sequence <220> <223> OUL3-05-X <400> 50 atgaaaacat ttgccgcata tgtaattatc gcgtgtcttt cgagtacggc attagctggt 60 tcaattacag aaaatacgtc ttggaacaaa gagttctctg ccgaagccgt caatggtgtc 120 ttcgtgcttt gtaaaagtag cagtaaatcc tgcgctacca atgacttagc tcgtgcatca 180 aaggaatatc ttccagcatc aacatttaag atccccaacg caattatcgg cctagaaact 240 ggtgtcataa agaatgagca tcaggttttc aaatgggacg gaaagccaag agccatgaag 300 caatgggaaa gagacttgac cttaagaggg gcaatacaag tttcagctgt tcccgtattt 360 caacaaatcg ccagagaagt tggcgaagta agaatgcaga aatatcttaa aaaattttca 420 tatggtaacc agaatatcag tggtggcatt gacaaattct ggttggaagg tcagcttaga 480 atttccgcag ttaatcaagt ggagtttcta gagtctctat ttttaaataa attgtcagca 540 tcaaaagaaa atcagctaat agtaaaagag gctttggtaa cggaggctgc gcctgaatat 600 cttgtgcatt caaaaactgg tttttctggt gtgggaactg agtcaaatcc tggtgtcgca 660 tggtgggttg gttgggttga gaagggagca gaggtttact ttttcgcatt taacatggat 720 atagacaacg aaaataagtt gccgctaaga aaatccattc ccaccaaaat catggcaagt 780 gagggcatca ttggtggcta a 801 <210> 51 <211> 266 <212> PRT <213> Artificial Sequence <220> <223> OUL3-05-X <400> 51 Met Lys Thr Phe Ala Ala Tyr Val Ile Ile Ala Cys Leu Ser Ser Thr 1 5 10 15 Ala Leu Ala Gly Ser Ile Thr Glu Asn Thr Ser Trp Asn Lys Glu Phe 20 25 30 Ser Ala Glu Ala Val Asn Gly Val Phe Val Leu Cys Lys Ser Ser Ser 35 40 45 Lys Ser Cys Ala Thr Asn Asp Leu Ala Arg Ala Ser Lys Glu Tyr Leu 50 55 60 Pro Ala Ser Thr Phe Lys Ile Pro Asn Ala Ile Ile Gly Leu Glu Thr 65 70 75 80 Gly Val Ile Lys Asn Glu His Gln Val Phe Lys Trp Asp Gly Lys Pro 85 90 95 Arg Ala Met Lys Gln Trp Glu Arg Asp Leu Thr Leu Arg Gly Ala Ile 100 105 110 Gln Val Ser Ala Val Pro Val Phe Gln Gln Ile Ala Arg Glu Val Gly 115 120 125 Glu Val Arg Met Gln Lys Tyr Leu Lys Lys Phe Ser Tyr Gly Asn Gln 130 135 140 Asn Ile Ser Gly Gly Ile Asp Lys Phe Trp Leu Glu Gly Gln Leu Arg 145 150 155 160 Ile Ser Ala Val Asn Gln Val Glu Phe Leu Glu Ser Leu Phe Leu Asn 165 170 175 Lys Leu Ser Ala Ser Lys Glu Asn Gln Leu Ile Val Lys Glu Ala Leu 180 185 190 Val Thr Glu Ala Ala Pro Glu Tyr Leu Val His Ser Lys Thr Gly Phe 195 200 205 Ser Gly Val Gly Thr Glu Ser Asn Pro Gly Val Ala Trp Trp Val Gly 210 215 220 Trp Val Glu Lys Gly Ala Glu Val Tyr Phe Phe Ala Phe Asn Met Asp 225 230 235 240 Ile Asp Asn Glu Asn Lys Leu Pro Leu Arg Lys Ser Ile Pro Thr Lys 245 250 255 Ile Met Ala Ser Glu Gly Ile Ile Gly Gly 260 265 <210> 52 <211> 1056 <212> DNA <213> Kluyveromyces <400> 52 atgtctgctc acgaaatccc aaagacccag aaaggtgtta tcttctacga gaccggtggt 60 aagctggaat acaaggacat cgatgtccca accccaaagg ccaacgagct tttggtcaac 120 gtcaagtact ccggtgtgtg ccacactgac ttgcacgcct accacggtga ctggccattg 180 ccagttaagt tgcctctagt cggtggccac gagggtgccg gtgtcgttgt cgccatgggt 240 gagaacgtca agggctggaa ggtcggtgac ttggccggta tcaagtggtt gaacggctcc 300 tgtatgtcct gtgagtcctg tgagttgggt aacgagtcca actgtccaga ggctgacttg 360 tccggttaca cccacgacgg ttctttccag cagtacgcta ctgccgatgc cgtccaggcc 420 gctaagatcc cagctggcgc tgaccttgct gagatcgccc caatcctgtg tgccggtatc 480 actgtctaca aggctttgaa gtctgctaac ttgcaggccg gtgactgggt tgccatctcc 540 ggtgccgccg gtggtttggg ttccctagcc gtccagtacg ccaaggccat gggttaccgt 600 gtcttgggta tcgacggtgg tgaggagaag gagcagctct tcagacagtt gggtggtgag 660 gtcttcatcg acttcagaac ctgcaaggac atcgagggtg agatcatcaa ggccaccaac 720 ggtggtgctc acggtgtcat caacgtctct gtctccgagg ccgccatcga gtcctctacc 780 aactacgtca gagccaacgg taccgtcgtc ttggtcggtt tgccagctgg cgccaagtgc 840 aagtctgacg ttttcaacca ggtcgtcaag tccatctcta tcgtcggttc ttacgtcggt 900 aacagagctg acaccagaga ggctctagac ttcttcgtcc gtggtttggt cagatctcca 960 atcaaggttg tcggtctatc tactctacca gagattttcg agaagatgga gaagggccaa 1020 attgttggca gatacgttgt cgacacctcc aactaa 1056 <210> 53 <211> 1045 <212> DNA <213> Saccharomyces <400> 53 atgtctatcc cagaaactca aaaaggtgtt atcttctacg aatcccacgg taagttggaa 60 tacaaagata ttccagttcc aaagccaaag gccaacgaat tgttgatcaa cgttaaatac 120 tctggtgtct gtcacactga cttgcacgct tggcacggtg actggccatt gccagttaag 180 ctaccattag tcggtggtca cgaaggtgcc ggtgtcgttg tcggcatggg tgaaaacgtt 240 aagggctgga agatcggtga ctacgccggt atcaaatggt tgaacggttc ttgtatggcc 300 tgtgaatact gtgaattggg taacgaatcc aactgtcctc acgctgactt gtctggttac 360 acccacgacg gttctttcca acaatacgct accgctgacg ctgttcaagc cgctcacatt 420 cctcaaggta ccgacttggc ccaagtcgcc cccatcttgt gtgctggtat caccgtctac 480 aaggctttga agtctgctaa cttgatggcc ggtcactggg ttgctatctc cggtgctgct 540 ggtggtctag gttctttggc tgttcaatac gccaaggcta tgggttacag agtcttgggt 600 attgacggtg gtgaaggtaa ggaagaatta ttcagatcca tcggtggtga agtcttcatt 660 gacttcacta aggaaaagga cattgtcggt gtgttctaaa ggccactgac ggtggtgctc 720 acggtgtcat caacgtttcc gttccgaagc cgctattgaa gcttctacca gatacgttag 780 agctaacggt accaccgttt tggtcggtat gccagctggt gccaagtgtt gttctgatgt 840 cttcaaccaa gtcgtcaagt ccatctctat tgttggttct tacgtcggta acagagctga 900 caccagagaa gctttggact tcttcgccag aggtttggtc aagtctccaa tcaaggttgt 960 cggcttgtct accttgccag aaatttacga aaagatggaa aagggtcaaa tcgttggtag 1020 atacgttgtt gacacttcta aataa 1045 <210> 54 <211> 1047 <212> DNA <213> Artificial Sequence <220> <223> Clon A02 <400> 54 atgtctatcc cagaaactca aaaaggtgtt atcttctacg aatcccacgg taagttggaa 60 tacaaagata ttccagttcc aaagccaaag gccaacgaat tgttgatcaa cgttaaatac 120 tctggtgtct gtcacactga cttgcacgct tggcacggtg actggccatt gccagttaag 180 ctaccattag tcggtggtca cgaaggtgcc ggtgtcgttg tcggcatggg tgaaaacgtt 240 aagggctgga agatcggtga ctacgccggt atcaaatggt tgaacggttc ttgtatggcc 300 tgtgaatact gtgaattggg taacgaatcc aactgtccag aggctgactt gtccggttac 360 acccacgacg gttctttcca gcagtacgct actgccgatg ccgtccaggc cgctaagatc 420 ccagctggcg ctgaccttgc tgagatcgcc ccaatcctgt gtgccggtat cactgtctac 480 aaggctttga agtctgctaa cttgcaggcc ggtgactggg ttgccatctc cggtgccgcc 540 ggtggtttgg gttccctagc cgtccagtac gccaaggcca tgggttaccg tgtcttgggt 600 atcgacggtg gtgaggagaa ggagcagctc ttcagacagt tgggtggtga ggtcttcatc 660 gacttcagaa cctgcaagga catcgagggt gagatcatca aggccaccaa cggtggcgct 720 cacggtgtca tcaacgtctc tgtctccgag gccgccatcg agtcctctac caactacgtc 780 agagccaacg gtaccgtcgt cttggtcggt ttgccagctg gcgccaagtg caagtctgac 840 gttttcaacc aggtcgtcaa gtccatctct atcgtcggtt cttacgtcgg taacagagct 900 gacaccagag aggctctaga cttcttcgtc cgtggtttgg tcagatctcc aatcaaggtt 960 gtcggtctat ctactctacc agagattttc gagaagatgg agaagggcca aattgttggc 1020 agatacgttg tcgacacctc caactaa 1047 <210> 55 <211> 1060 <212> DNA <213> Artificial Sequence <220> <223> Clon A03 <400> 55 gccatgggtg agaatgtcta tcccagaaac tcaaaaaggt gttatcttct acgaatccca 60 cggtaagttg gaatacaaag atattccagt tccaaagcca aaggccaacg aattgttgat 120 caacgttaaa tactctggtg tctgtcacac tgacttgcac gcttggcacg gtgactggcc 180 attgccagtt aagctaccat tagtcggtgg tcacgaaggt gccggtgtcg ttgtcgccat 240 gggtgagaac gtcaagggct ggaaggtcgg tgacttggcc ggtatcaagt ggttgaacgg 300 ctcctgtatg tcctgtgagt cctgtgagtt gggtaacgag tccaactgtc cagaggctga 360 cttgtccggt tacacccacg acggttcttt ccagcagtac gctactgccg atgccgtcca 420 ggccgctaag atcccagctg gcgctgacct tgctgagatc gccccaatcc tgtgtgccgg 480 tatcactgtc tacaaggctt tgaagtctgc taacttgcag gccggtgact gggttgccat 540 ctccggtgcc gccggtggtt tgggttccct agccgtccag tacgccaagg ccatgggtta 600 ccgtgtcttg ggtatcgacg gtggtgagga gaaggagcag ctcttcagac agttgggtgg 660 tgaggtcttc atcgacttca gaacctgcaa ggacatcgag ggtgagatca tcaaggccac 720 caacggtggt gctcacggtg tcatcaacgt ctctgtctcc gaggccgcca tcgagtcctc 780 taccaactac gtcagagcca acggtaccgt cgtcttggtc ggtttgccag ctggcgccaa 840 gtgcaagtct gacgttttca accaggtcgt caagtccatc tctatcgtcg gttcttacgt 900 cggtaacaga gctgacacca gagaggctct agacttcttc gtccgtggtt tggtcagatc 960 tccaatcaag gttgtcggtc tatctactct accagagatt ttcgagaaga tggagaaggg 1020 ccaaattgtt ggcagatacg ttgtcgacac ctccaactaa 1060 <210> 56 <211> 1047 <212> DNA <213> Artificial Sequence <220> <223> Clon A05 <400> 56 atgtctatcc caaagaccca gaaaggtgtt atcttctacg agaccggtgg taagctggaa 60 tacaaggaca tcgatgtccc aaccccaaag gccaacgagc ttttggtcaa cgtcaagtac 120 tccggtgtgt gccacactga cttgcacgcc taccacggtg actggccatt gccagttaag 180 ttgcctctag tcggtggcca cgagggtgcc ggtgtcgttg tcgccatggg tgagaacgtc 240 aagggctgga aggtcggtga cttggccggt atcaagtggt tgaacggctc ctgtatgtcc 300 tgtgagtcct gtgagttggg taacgagtcc aactgtccag aggctgactt gtccggttac 360 acccacgacg gttctttcca gcagtacgct actgccgatg ccgtccaggc cgctaagatc 420 ccagctggcg ctgaccttgc tgagatcgcc ccaatcctgt gtgccggtat cactgtctac 480 aaggctttga agtctgctaa cttgcaggcc ggtgactggg ttgccatctc cggtgccgcc 540 ggtggtttgg gttccctagc cgtccagtac gccaaggcca tgggttaccg tgtcttgggt 600 atcgacggtg gtgaggagaa ggagcagctc ttcagacagt tgggtggtga ggtcttcatc 660 gacttcagaa cctgcaagga catcgagggt gagatcatca aggccaccaa cggtggtgct 720 cacggtgtca tcaacgtctc tgtctccgag gccgccatcg agtcctctac caactacgtc 780 agagccaacg gtaccgtcgt cttggtcggt ttgccagctg gcgccaagtg caagtctgac 840 gttttcaacc aggtcgtcaa gtccatctct atcgtcggtt cttacgtcgg taacagagct 900 gacaccagag aggctctaga cttcttcgtc cgtggtttgg tcagatctcc aatcaaggtt 960 gtcggtctat ctactctacc agagattttc gagaagatgg agaagggcca aattgttggc 1020 agatacgttg tcgacacctc caactaa 1047 <210> 57 <211> 1047 <212> DNA <213> Artificial Sequence <220> <223> Clon A06 <400> 57 atgtctatcc cagaaactca aaaaggtgtt atcttctacg aatcccacgg taagttggaa 60 tacaaagata ttccagttcc aaagccaaag gccaacgaat tgttgatcaa cgttaaatac 120 tctggtgtct gtcacactga cttgcacgct tggcacggtg actggccatt gccagttaag 180 ctaccattag tcggtggtca cgaaggtgcc ggtgtcgttg tcggcatggg tgaaaacgtt 240 aagggctgga agatcggtga ctacgccggt atcaaatggt tgaacggttc ttgtatggcc 300 tgtgaatact gtgaattggg taacgagtcc aactgtccag aggctgactt gtctggttac 360 acccacgacg gttctttcca acaatacgct actgccgatg ccgtccaggc cgctaagatc 420 ccagctggcg ctgaccttgc tgagatcgcc ccaatcctgt gtgccggtat cactgtctac 480 aaggctttga agtctgctaa cttgcaggcc ggtgactggg ttgccatctc cggtgccgcc 540 ggtggtttgg gttccctagc cgtccagtac gccaaggcca tgggttaccg tgtcttgggt 600 atcgacggtg gtgaggagaa ggagcagctc ttcagacagt tgggtggtga ggtcttcatc 660 gacttcagaa cctgcaagga catcgagggt gagatcatca aggccaccaa cggtggtgct 720 cacggtgtca tcaacgtctc tgtctccgag gccgccatcg agtcctctac caactacgtc 780 agagccaacg gtaccgtcgt cttggtcggt ttgccagccg gcgccaagtg caagtctgac 840 gttttcaacc aggtcgtcaa gtccatctct atcgtcggtt cttacgtcgg taacagagct 900 gacaccagag aggctctaga cttcttcgtc cgtggtttgg tcagatctcc aatcaaggtt 960 gtcggtctat ctactctacc agagattttc gagaagatgg agaagggcca aattgttggc 1020 agatacgttg tcgacacctc caactaa 1047 <210> 58 <211> 1049 <212> DNA <213> Artificial Sequence <220> <223> Clon A10 <400> 58 atgtctatcc cagaaactca aaaaggtgtt atcttctacg agaccggtgg taagctggaa 60 tacaaggaca tcgatgtccc aaccccaaag gccaacgagc ttttggtcaa cgtcaagtac 120 tccggtgtgt gccacactga cttgcacgcc taccacggtg actggccatt gccagttaag 180 ttgcctctag tcggtggcca cgagggtgcc ggtgtcgttg tcgccatggg tgagaacgtc 240 aagggctgga aggtcggtga cttggccggt atcaagtggt tgaacggctc ctgtatgtcc 300 tgtgagtcct gtgagttggg taacgagtcc aactgtccag aggctgactt gtccggttac 360 acccacgacg gttctttcca gcagtacgct actgccgatg ccgtccaggc cgctaagatc 420 ccagctggcg ctgaccttgc tgagatcgcc ccaatcctgt gtgccggtat cactgtctac 480 aaggctttga agtctgctaa cttgcaggcc ggtgactggg ttgccatctc cggtgccgcc 540 ggtggtttgg gttccctagc cgtccagtac gccaaggcca tgggtttacc gtgtcttggg 600 tatcgacggt ggtgaggaga aggagcagct cttcagacag ttgggtggtg gaggtcttca 660 tcgacttcag aacctgcaag gacatcgagg gtgagatcat caagcccacc aacggtggtg 720 ctcacggtgt catcaacgtc tctgtctccg aggccgccat cgagtcctct accaactacg 780 tcagagccaa cggtaccgtc gtcttggtcg gtttgccagc tggcgccaag tgcaagtctg 840 acgttttcaa ccaggtcgtc aagtccatct ctatcgtcgg ttcttacgtc ggtaacagag 900 ctgacaccag agaggctcta gacttcttcg tccgtggttt ggtcagatct ccaatcaagg 960 ttgtcggtct atctactcta ccagagattt tcgagaagat ggagaagggc caaattgttg 1020 gcagatacgt tgtcgacacc tccaactaa 1049 <210> 59 <211> 1047 <212> DNA <213> Artificial Sequence <220> <223> Clon A11 <400> 59 atgtctatcc cagaaactca aaaaggtgtt atcttctacg aatcccacgg taagttggaa 60 tacaaagata ttccagttcc aaagccaaag gccaacgaat tgttgatcaa cgttaaatac 120 tctggtgtct gtcacactga cttgcacgct tggcacggtg actggccatt gccagttaag 180 ctaccattag tcggtggtca cgaaggtgcc ggtgtcgttg tcggcatggg tgaaaacgtt 240 aagggctgga agatcggtga ctacgccggt atcaaatggt tgaacggttc ttgtatggcc 300 tgtgaatact gtgaattggg taacgaatcc aactgtcctc acgctgactt gtctggttac 360 acccacgacg gttctttcca gcagtacgct actgccgatg ccgtccaggc cgctaagatc 420 ccagctggcg ctgaccttgc tgagatcgcc ccaatcctgt gtgccggtat cactgtctac 480 aaggctttga agtctgctaa cttgcaggcc ggtgactggg ttgccatctc cggtgccgcc 540 ggtggtttgg gttccctagc cgtccagtac gccaaggcca tgggttaccg tgtcttgggt 600 atcgacggtg gtgaggagaa ggagcagctc ttcagacagt tgggtggtga ggtcttcatc 660 gacttcagaa cctgcaagga catcgagggt gagatcatca aggccaccaa cggtggtgct 720 cacggtgtca tcaacgtctc tgtctccgag gccgccatcg agtcctctac caactacgtc 780 agagccaacg gtaccgtcgt cttggtcggt ttgccagctg gcgccaagtg caagtctgac 840 gttttcaacc aggtcgtcat gtccatctct atcgtcggtt cttacgtcgg taacagagct 900 gacaccagag aggctctaga cttcttcgtc cgtggtttgg tcagatctcc aatcaaggtt 960 gtcggtctat ctactctacc agagattttc gagaagatgg agaagggcca aattgttggc 1020 agatacgttg tcgacacctc caactaa 1047

Claims

a) 단일 단계 절차로서,
(i) 세포 유전체의 삽입(integral) 부분이거나 유전적 구조의 골격에 존재하는 재조합되는 다른 유전자와 99.5% 미만의 서열 상동성을 가지는 적어도 하나의 유전자 A로 세포를 형질전환하고;
(ii) 상기 유전자들을 재조합하고;
(iii) 목적 유전체의 삽입 위치에 유전자들의 유전자 모자이크를 생성하며, 상기 적어도 하나의 유전자 A는 상기 삽입(integration) 위치의 5’ 말단 또는 3’ 말단에 고정하는 5’ 말단 또는 3’ 말단에 단일 인접 목적 서열(single flanking target sequence)을 갖는 단계; 및
b) 유전자 모자이크를 포함하는 클론들을 선택하는 단계를 포함하는, 체세포 내 재조합(somatic in vivo recombination)을 통한 유전자 모자이크(gene mosaic) 제조 방법.
제1항에 있어서,
선택 표지자가 유전자 모자이크에 사용되고, 선택 표지자의 존재에 따라 클론이 선택되는 것인, 방법.
제1항 또는 제2항에 있어서,
상기 다른 유전자는 세포 유전체의 일부인 것인 방법.
제1항 내지 제3항 중 어느 한 항에 있어서,
상기 세포는 적어도 하나의 유전자 A 및 적어도 하나의 유전자 B로 동시 형질전환되고, 상기 유전자 A의 단일 인접 목적 서열은 상기 목적 유전체의 삽입 위치의 5’말단에 고정되며, 유전자 B는 삽입 위치의 3’말단에 고정하는 단일 인접 목적 서열과 연결되는 것인, 방법.
제1항 내지 제4항 중 어느 한 항에 있어서,
세포는 적어도 2개의 상이한 유전자인 A1과 A2, 및 선택적으로 적어도 2개의 상이한 유전자인 B1 및 B2로 동시 형질전환된 것인, 방법.
제1항 내지 제5항 중 어느 한 항에 있어서,
추가적으로 유전자 A의 서열 및/또는 상기 다른 유전자와 혼성화하는 서열을 갖는 적어도 하나의 추가 유전자 C가 동시 형질전환되어, 상기 추가 유전자 C와 유전자 A 및/또는 상기 다른 유전자의 조립체(Assembly)를 얻는 것인, 방법.
제1항 내지 제6항 중 어느 한 항에 있어서,
상기 유전자 A 및/또는 상기 다른 유전자는 활성을 가지는 폴리펩타이드 또는 폴리펩타이드의 부분을 암호화하는 것인, 방법.
제6항 또는 제7항에 있어서,
생화학적 경로의 폴리펩타이드를 암호화하는 다수의 유전자들이 재조합되고 조립된 것인 방법.
제1항 내지 제8항 중 어느 한 항에 있어서,
세포는 보수 결실 세포인 것인 방법.
제1항 내지 제9항 중 어느 한 항에 있어서,
세포는 진핵세포, 바람직하게는 균류, 포유류, 또는 식물세포, 또는 원핵세포인 것인, 방법.
제10항에 있어서,
세포는 균류이며, 바람직하게는 사카로미세스(Saccharomyces), 칸디다(Candida), 클루이베로미세스(Kluyveromyces), 한세눌라(Hansenula), 스키조사카로미세스(Schizosaccaromyces), 야로이야(Yarrowia), 피치아(Pichia) 및 아스퍼질러스(Aspergillus)로 구성되는 군에서 선택되는 것인, 방법.
제1항 내지 제11항 중 어느 한 항에 있어서,
인접 목적 서열은 적어도 5 bp(base pairs)인 것인, 방법.
제1항 내지 제12항 중 어느 한 항에 있어서,
인접 목적 서열은 상기 삽입 위치의 고정 서열과 30% 내지 99.5% 범위의 상동성을 가지는 것인, 방법.
제1항 내지 제13항 중 어느 한 항에 있어서,
영양 요구성 표지자(nutrition auxotrophic markers), 항생제 내성 표지자, 형광 표지자, 넉-인 표지자(knock-in markers), 활성자/결합 도메인 표지자(activator/binding domain markers), 및 우성 열성 표지자(dominant recessive markers) 및 비색 표지자(colorimetric markers)로 구성된 집단으로부터 선택되는 선택 표지자가 사용되는 것인 방법.
제1항 내지 제14항 중 어느 한 항에 있어서,
상기 유전자들은 선형 폴리뉴클레오티드, 벡터 또는 효모 인공 염색체에 포함되는 것인, 방법.
제1항 내지 제15항 중 어느 한 항에 있어서,
상기 유전자들은 선형 폴리뉴클레오타이드이며, 바람직하게는 300 에서 20,000 bp인 것인, 방법.
제1항 내지 제16항 중 어느 한 항에 있어서,
유전자 내 유전자 모자이크를 가지는 적어도 하나의 클론이 선택되는 것인, 방법.
제1항 내지 제17항 중 어느 한 항에 있어서,
유전자 조립체와 적어도 하나의 유전자 내 유전자 모자이크를 가지는 적어도 하나의 클론이 선택되는 것인, 방법.
제1항 내지 제18항 중 어느 한 항에 있어서,
최소 3에서 최대 20,000까지의 염기쌍, 바람직하게는 700 bp 당 적어도 3 번의 교차 현상들(cross-over events)이 일어난 유전자 모자이크가 얻어지는 것인, 방법.
제1항 내지 제19항 중 어느 한 항에 있어서,
상기 유전자들은 비-암호화 서열 또는, 효소, 항체 또는 그의 일부분, 사이토카인, 성장 인자, 백신 항원 그리고 펩타이드로 구성된 군으로부터 선택된 폴리펩타이드의 변이체를 암호화하는 것인, 방법.
제1항 내지 제20항 중 어느 한 항의 방법을 이용하여 세포에 다양한 유전자 모자이크를 생성하는 단계, 및 상기 세포의 표면에 상기 다양성을 디스플레이(displaying)하여 모자이크의 라이브러리를 얻는 단계를 포함하는 유전자 변이체의 세포 디스플레이 방법.
최소 80%의 유전자 모자이크를 기능적 ORF내에 포함하고 있는, 제1항 내지 제20항 중 어느 한 항의 방법에 의해 얻을 수 있는 유전자 모자이크 라이브러리.
제22항에 있어서,
유전자 변이체를 포함하는 다양한 유기체를 포함하는 것인, 라이브러리.
제22항 또는 제23항에 따른 라이브러리로부터의 유전자 변이체를 포함하는 유기체.