KR20110126717A

KR20110126717A - 단백질 생성 증강을 위한 ｍｒｎａ１차 구조의 재구조화

Info

Publication number: KR20110126717A
Application number: KR1020117022256A
Authority: KR
Inventors: 빈센트 피. 마우로; 스티븐 에이. 채플; 웨이 저우; 제랄드 엠. 에델만
Original assignee: 더 스크립스 리서치 인스티튜트
Priority date: 2009-02-24
Filing date: 2010-02-24
Publication date: 2011-11-23
Also published as: JP5735927B2; EP2401365B1; US8853179B2; EP2401365A1; WO2010098861A1; JP2013520158A; CA2753362A1; SG174150A1; AU2010218388B2; AU2010218388A1; US20120053333A1; US20140370545A1; CA2753362C; CN102428174A; EP2401365A4

Abstract

본원에서는 mRNA의 번역 효율이 증가되도록 천연 mRNA를 변형시키거나 또는 합성 mRNA를 조작하는 원칙이 기술된다. 이러한 원칙은, 1) 코딩 서열 내의 AUG 또는 비-표준적인 개시 코돈을 통한 리보솜 방향전환의 감소, 및/또는 2) 코딩 서열에서 하나 이상의 miRNA 결합 부위를 제거함에 의한 miRNA-매개성 하향-조절의 회피를 이용하여, 단백질 합성 증강을 목적으로 한 mRNA 코딩 서열 및 3' UTR 서열에 대한 변형을 기술한다.

Description

단백질 생성 증강을 위한 ＭＲＮＡ１차 구조의 재구조화 {REENGINEERING MRNA PRIMARY STRUCTURE FOR ENHANCED PROTEIN PRODUCTION}

우선권에 대한 참조

본 출원은, "단백질 생성 증강을 위한 mRNA 1차 구조의 재구조화"를 발명의 명칭으로 하여 2009년 2월 24일 제출된 미국 가출원 일련번호 제61/155,049호에 대해 35 U.S.C. §119(e) 하에서의 우선권의 혜택을 주장한다. 상기 언급한 출원의 대상 내용은 그 전체가 이에 대한 언급에 의해 참고로 포함된다.

진핵생물에서 번역 개시는 5' 캡(cap)-구조 또는 내부 리보솜 유입 부위 (IRES)로의 40S 리보솜 소단위체 및 번역 장치의 여타의 구성요소의 mRNA에 의한 동원을 수반한다. 동원된 후, 40S 소단위체는 개시 코돈으로 이동한다. 번역 개시에 대해 널리 지지되고 있는 개념 중 하나는, 40S 소단위체가 양호한 뉴클레오티드 환경 중에 위치하는 첫번째 AUG 코돈을 만날 때까지 5' 선도자를 통해 5'에서 3' 방향으로 스캐닝(scanning)하면서 동원 부위에서부터 개시 코돈 쪽으로 이동한다는 것을 상정한다(문헌 [Kozak "The Scanning Model for Translation: An Update" J. Cell Biol. 108:229-241 (1989)]). 보다 최근에는, 번역 개시가 스캐닝을 수반하지 않지만, 캡-구조 또는 IRES에서의 리보솜 소단위체의 고정(tethering), 또는 내부 부위에서의 리보솜 소단위체의 군집화를 수반하는 것일 수 있다는 것이 상정되었다 (문헌 [Chappell et al. "Ribosomal shunting mediated by a translational enhancer element that base pairs to 18S rRNA" PNAS USA 103(25):9488-9493 (2006)]; [Chappell et al., "Ribosomal tethering and clustering as mechanisms for translation initiation" PNAS USA 103(48):18077-82 (2006)]). 40S 소단위체는 mRNA 내의 반드시 첫번째 AUG 코돈은 아닌 접근가능한 AUG 코돈으로 이동한다. 어떤 메커니즘으로든지 일단 상기 소단위체가 개시 코돈에 도달하면, 상기 소단위체에 결합된 개시자인 메티오닌-tRNA, 개시 코돈에 대한 염기쌍, 큰 (60S) 리보솜 소단위체가 부착하여, 펩티드 합성이 시작된다.

일반적으로 번역이 스캐닝 메커니즘에 의해 개시된다고 여겨지고 있는 바, 상류 AUG 코돈으로 일컬어지는 5' 선도자 내에 함유된 AUG 코돈의 번역에 대한 영향이 고려되었으며, 5' 선도자 내의 AUG 코돈이 유전자, 뉴클레오티드 환경, 및 세포 상태에 따라 단백질 합성에 대해 긍정적 또는 부정적 영향을 가질 수 있는 것으로 알려져 있다. 예를 들어, 상류 AUG 코돈은 리보솜을 진정한 개시 코돈으로부터 방향전환시킴으로써 번역 개시를 억제할 수 있다. 그러나, 번역이 스캐닝 메커니즘에 의해 개시된다는 개념은 코딩 서열 내에 존재할 수 있는 개시 코돈들이 단백질 합성에 미치는 영향을 고려하지 않고 있다. 이와 대조적으로, 번역 개시의 고정/군집화 메커니즘은, AUG 코돈 및 비-표준적인 코돈을 모두 포함하는 코딩 서열 내의 추정상의 개시 코돈이 이용될 수 있으며, 그 결과로 리보솜에 대해 진정한 개시 코돈과 경쟁함으로써 단백질 합성률을 저하시킬 수 있다는 것을 제안한다.

마이크로 RNA (miRNA)-매개성 하향-조절도 또한 번역 효율에 부정적인 영향을 미칠 수 있다. miRNA는 일반적으로 21 내지 23개 뉴클레오티드 길이이며, 리보핵단백질 복합체의 구성요소이다. miRNA는 mRNA와 염기쌍을 형성하여 mRNA 안정성, 초기의 펩티드 안정성 및 번역 효율을 감소시킴으로써 단백질 수준에 부정적인 영향을 미칠 수 있는 것으로 시사되었다 (문헌 [Eulalio et al. "Getting to the Root of miRNA-Mediated Gene Silencing" Cell 132:9-14 (1998)]). miRNA는 일반적으로 mRNA의 3' 미번역 서열 (UTR) 내 결합 부위에 대해 염기쌍을 형성하여 효과를 발휘하지만, 코딩 서열 및 5' 선도 서열 내에 함유된 결합 부위로부터도 유사한 억제 효과를 갖는 것으로 밝혀졌다. 염기쌍 형성은 miRNA의 뉴클레오티드 2 내지 8을 포함하는 소위 말하는 "시드 서열"을 통해 일어난다. 인간에서는 1,000개가 넘는 상이한 miRNA가 존재할 수 있다.

mRNA 코딩 서열 내의 추정되는 개시 코돈 및 mRNA 내 miRNA-결합 부위의 부정적 영향은 제약 산업에 도전이 되고 있다. 예를 들어, 단백질 약물의 공업적 생산, 항원 생성을 위한 DNA 백신, 일반적인 연구 목적 및 유전자 치료 용도 모두 준-적정 수준(sub-optimal rate)의 단백질 합성 또는 서열 안정성에 의해 영향받는다. 단백질 수율의 향상 및 더 높은 단백질 농도는 공업적 규모의 배양과 관련된 비용을 최소화하고, 약물 생산 비용을 감소시키며, 단백질 정제를 용이하게 할 수 있다. 저조한 단백질 발현은 특정 기술의 대규모 이용을 제한하는데, 예를 들어, DNA 백신으로부터 제3상 임상 시험을 수행하기 위한 면역 반응을 생성하기에 충분한 항원을 발현시키는데 있어서의 문제들이 있다.

발명의 개요

당업계에서는, 예를 들어, 단백질 약물의 공업적 생산에서, 단백질 번역의 효율 및 안정성을 향상시키고 단백질 수율 및 농도를 향상시켜야 할 필요성이 존재한다.

전장 단백질 발현 효율을 향상시키는 방법이 개시된다. 이 방법은 상기 단백질에 대한 코딩 서열; 이 코딩 서열의 상류에 존재하는 1차 개시 코돈; 및 상기 코딩 서열 내부에 위치한 하나 이상의 2차 개시 코돈을 갖는 폴리뉴클레오티드를 제공하는 것을 포함한다. 이 방법은 또한 하나 이상의 2차 개시 코돈을 변이시켜, 이 하나 이상의 2차 개시 코돈에서의 단백질 합성 개시의 감소를 초래하여, 1차 개시 코돈으로부터의 리보솜 방향전환을 감소시키고, 이로써 전장 단백질 발현 효율을 증가시키는 것을 포함한다.

이 방법은 또한 아미노산 서열이 변경되지 않은 채 남아있도록 하나 이상의 뉴클레오티드를 변이시키는 것을 포함할 수도 있다. 상기 하나 이상의 2차 개시 코돈은 코딩 서열과 동일한 리딩 프레임 (reading frame)내에 또는 코딩 서열에 대해 아웃-오브-프레임(out-of-frame)으로 존재할 수 있다. 하나 이상의 2차 개시 코돈은 리보솜 동원 부위로부터 하나 이상의 뉴클레오티드 상류 또는 하류에 위치할 수 있다. 리보솜 동원 부위는 캡 또는 IRES를 포함할 수 있다. 하나 이상의 2차 개시 코돈은 AUG, ACG, GUG, UUG, CUG, AUA, AUC, 및 AUU로부터 선택될 수 있다. 이 방법은 코딩 서열 내의 2 이상의 2차 개시 코돈을 변이시키는 것을 포함할 수 있다. 이 방법은 코딩 서열 내의 모든 2차 개시 코돈을 변이시키는 것을 포함할 수 있다. 측면(flanking) 뉴클레오티드는 덜 유리한 뉴클레오티드 환경이 되도록 변이될 수 있다. 하나 이상의 2차 개시 코돈의 변이는 새로운 개시 코돈을 도입하는 것을 피할 수 있다. 하나 이상의 2차 개시 코돈의 변이는 miRNA 시드 서열을 도입하는 것을 피할 수 있다. 하나 이상의 2차 개시 코돈의 변이는 변이된 코돈의 사용빈도 편향을 변경시키는 것을 피할 수 있다. 전장 코딩된 단백질 이외의 말단절단된 단백질, 폴리펩티드, 또는 펩티드의 생성이 감소될 수 있다. 하나 이상의 2차 개시 코돈을 변이시키는 것은 miRNA 시드 서열, 스플라이스 공여 또는 수용 부위, 또는 mRNA 탈안정화 요소를 도입하는 것을 피할 수 있다.

또한, 전장 단백질 발현 효율을 향상시키는 방법이 개시된다. 이 방법은 상기 단백질에 대한 코딩 서열 및 상기 코딩 서열 내에 위치한 하나 이상의 miRNA 결합 부위를 갖는 폴리뉴클레오티드 서열을 제공하는 단계; 및 하나 이상의 miRNA 결합 부위를 변이시키는 단계를 포함한다. 이 변이는 하나 이상의 miRNA 결합 부위에서의 miRNA 결합의 감소를 초래하여, miRNA-매개성의 단백질 번역 하향 조절을 감소시키고, 이로써 전장 단백질 발현 효율을 증가시킨다.

이 방법은 또한 아미노산 서열이 변경되지 않은 채 남아있도록 하나 이상의 뉴클레오티드를 변이시키는 것을 포함할 수 있다. 이 방법은 miRNA 시드 서열 내의 하나 이상의 뉴클레오티드를 변이시키는 것을 포함할 수 있다. 이 방법은 폴리뉴클레오티드 서열 내로 개시 코돈이 도입되지 않도록 하나 이상의 뉴클레오티드를 변이시키는 것을 포함할 수 있다. 이 방법은 폴리뉴클레오티드 서열 내로 희귀 코돈이 도입되지 않도록 하나 이상의 뉴클레오티드를 변이시키는 것을 포함할 수 있다. 이 방법은 폴리뉴클레오티드 서열 내로 추가적인 miRNA 시드 서열이 도입되지 않도록 하나 이상의 뉴클레오티드를 변이시키는 것을 포함할 수 있다. 하나 이상의 miRNA 결합 부위는 코딩 서열 내에 위치할 수 있다. 하나 이상의 miRNA 결합 부위는 3' 비번역 영역 내에 위치할 수 있다. 하나 이상의 miRNA 결합 부위는 5' 선도 서열 내에 위치할 수 있다.

본 개시내용의 본질 및 이점은 상세한 설명의 나머지 부분 및 특허청구범위를 참조하면 추가적으로 이해될 수 있을 것이다.

도 1A 내지 1B는 CAT (마름모꼴) 또는 mCAT 발현 구조물 (정사각형)로 형질전환된 이. 콜라이 (E. coli) DH5α 세포 배양물의 생장 곡선을 제시하고;
도 2는 CAT (C) 또는 mCAT (mC) 발현 구조물로 형질전환된 이. 콜라이 DH5α 세포로부터 수거한 용해물에 대한 웨스턴 블롯 분석을 제시하며;
도 3은 야생형 CAT 또는 변형 CAT 발현 구조물로 형질전환된 DG44 세포로부터의 추출물에 대한 웨스턴 블롯 분석을 제시하고;
도 4는 야생형 CD5 (cd5-1) 또는 변형 CD5 신호 펩티드 α-티로글로불린 경쇄 발현 구조물 (cd5-2 내지 cd5-5)로 형질전환된 DG44 세포로부터의 상청액에 대한 웨스턴 블롯 분석을 제시한다.

I. 개관

본원에서는 코딩된 단백질의 수준이 증가되도록 천연 mRNA를 변형시키거나 또는 합성 mRNA를 조작하는 방법이 기술된다. 이러한 원칙은, 1) 코딩 서열 내의 AUG 또는 비-표준적인 개시 코돈을 통한 리보솜 방향전환을 감소시키고/시키거나, 2) 코딩 서열에서 miRNA 결합 부위를 제거함에 의해 miRNA-매개성 하향-조절을 회피함으로써, 단백질 합성 증강을 목적으로 한 mRNA 코딩 서열 및 3' UTR 서열에 대한 변형을 기술한다.

진핵 세포 및 박테리아 세포에서 특정 단백질의 수율을 증가시키기 위해 사용가능한 mRNA 1차 구조를 재구조화하는 방법이 기재된다. 본원에 기재된 방법은 단백질 약물의 공업적 생산에, 이뿐 아니라 연구 목적을 위해, 유전자 치료 용도에, 및 항원 생성을 증가시키기 위한 DNA 백신에 적용될 수 있다. 단백질 수율이 커질 수록 공업적 규모의 배양과 관련된 비용이 최소화되고 약물 비용도 감소된다. 또한, 단백질 농도가 높아질수록 단백질 정제가 용이해질 수 있다. 나아가, 예컨대 제3상 임상 시험의 수행에서, 또는 DNA 백신으로부터 면역 반응을 생성하기에 충분한 항원을 발현시킴에 있어, 저조한 단백질 발현으로 인해 다른 방식으로는 가능하지 않을 수 있는 공정이 본원에 기재된 방법을 사용할 경우 가능해질 수 있다.

II. 정의

본 명세서는 기재된 특정 방법론, 프로토콜 및 시약에 국한되지 않으며, 이들은 가변적일 수 있다. 또한, 본원에 사용된 용어는 오로지 특정 실시양태를 기술하기 위한 것이며, 첨부된 특허청구범위에 의해 기재되는 본 발명의 방법의 범위를 제한하기 위해 의도된 것이 아님을 이해해야 한다.

본원에 사용된 바, 단수 형태는 문맥상 명백히 다르게 읽혀지지 않는 한 복수 형태를 포함한다. 따라서, 예를 들어, "세포"라는 언급은 복수의 그러한 세포를 포함하며, "단백질"이라는 언급은 하나 이상의 단백질 및 당업자에 공지된 그의 등가물을 포함하는 식이다.

달리 정의되지 않는 한, 본원에 사용된 모든 기술 및 과학 용어는 본 개시내용이 관련된 업계의 통상의 지식을 가진 자에 의해 통상 이해되는 바와 동일한 의미를 갖는다. 하기 참조문헌은 당업자에 본 개시내용에 사용된 용어들 중 다수에 대한 일반적인 정의를 제공한다: 문헌 [Academic Press Dictionary of Science and Technology, Morris (Ed.), Academic Press (1^st ed., 1992)]; [Oxford Dictionary of Biochemistry and Molecular Biology, Smith et al. (Eds.), Oxford University Press (revised ed., 2000)]; [Encyclopaedic Dictionary of Chemistry, Kumar (Ed.), Anmol Publications Pvt. Ltd. (2002)]; [Dictionary of Microbiology and Molecular Biology, Singleton et al. (Eds.), John Wiley & Sons (3^rd ed., 2002)]; [Dictionary of Chemistry, Hunt (Ed.), Routledge (1^st ed., 1999)]; [Dictionary of Pharmaceutical Medicine, Nahler (Ed.), Springer-Verlag Telos (1994)]; [Dictionary of Organic Chemistry, Kumar and Anandand (Eds.), Anmol Publications Pvt. Ltd. (2002)]; 및 [A Dictionary of Biology (Oxford Paperback Reference), Martin and Hine (Eds.), Oxford University Press (4^th ed., 2000)]. 이들 용어 중 본 개시내용에 특이적으로 적용된 몇몇 용어에 대한 추가적인 설명이 본원에서 제시된다.

"작용제"라는 용어는 임의의 물질, 분자, 요소, 화합물, 독립체, 또는 이들의 조합물을 포함한다. 이에는, 예컨대, 단백질, 폴리펩티드, 유기 소분자, 다당류, 폴리뉴클레오티드 등이 포함되나, 이들에 제한되는 것은 아니다. 이는 천연 생성물, 합성 화합물, 또는 화학적 화합물, 또는 둘 이상의 물질의 조합물일 수 있다. 달리 명시되지 않는 한, "작용제", "물질", 및 "화합물"이라는 용어들은 본원에서 상호교환가능하게 사용된다.

"시스트론"이라는 용어는 단일 폴리펩티드 또는 단백질을 코딩하는 DNA 단위를 의미한다. "전사 단위"라는 용어는 RNA의 합성이 일어나는 DNA의 분절을 지칭한다.

"DNA 백신"이라는 용어는 숙주 세포 또는 조직 내로 도입되어 거기에서 세포에 의해 발현되어 전령 리보핵산 (mRNA) 분자를 생성할 수 잇는 DNA를 지칭하며, 상기 mRNA 분자는 그 후 번역되어 상기 DNA에 의해 코딩되는 백신 항원을 생성한다.

"관심 유전자"라는 말은 생산 조절 대상인 단백질 산물 (관심 단백질)을 코딩하는 시스트론, 오픈 리딩 프레임 (ORF), 또는 폴리뉴클레오티드 서열을 포함하도록 의도된 것이다. 관심 유전자의 예로는, 치료 단백질, 영양적 단백질 및 산업적으로 유용한 단백질을 코딩하는 유전자를 들 수 있다. 관심 유전자에는 또한 리포터 유전자 또는 선별 마커 유전자, 예컨대 증강된 녹색 형광 단백질 (EGFP), 루시페라제 유전자 (레닐라 (Renilla) 또는 포티누스 (Photinus))가 포함될 수 있다.

발현은 DNA로부터 폴리펩티드가 생성되는 과정이다. 이 과정은 유전자의 mRNA로의 전사 및 이 mRNA의 폴리펩티드로의 후속적 번역을 수반한다.

본원에 사용된 "내인성"이라는 용어는 야생형 숙주에서 보통 발견되는 유전자를 지칭하며, "외인성"이라는 용어는 야생형 숙주에서 보통 발견되지 않는 유전자를 지칭한다.

"숙주 세포"는 이종성 폴리뉴클레오티드 서열이 도입될 예정이거나 도입된 살아있는 세포를 지칭한다. 살아있는 세포는 배양된 세포 및 살아있는 유기체 내의 세포 둘 모두를 포함한다. 이종성 폴리뉴클레오티드 서열을 세포 내로 도입하는 수단은 익히 공지되어 있으며, 예컨대, 트랜스펙션, 전기천공, 인산칼슘 침전, 미세주입, 형질전환, 바이러스 감염 등이 있다. 보통, 세포 내로 도입되는 이종성 폴리뉴클레오티드 서열은 복제가능 발현 벡터 또는 클로닝 벡터이다. 일부 실시양태에서, 숙주 세포는 그의 염색체 상에 또는 게놈 내에 목적하는 유전자가 편입되도록 조작될 수 있다. 본 방법의 실시에 이용되어 숙주로 기능할 수 있는 다수의 숙주 세포 (예컨대, CHO 세포)는 당업계에 익히 공지되어 있다. 예컨대, 문헌 [Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press (3^rd ed., 2001)]; 및 [Brent et al., Current Protocols in Molecular Biology, John Wiley & Sons, Inc. (Ringbou ed., 2003)]을 참고할 수 있다. 일부 실시양태에서, 숙주 세포는 진핵 세포이다.

"유도제"라는 용어는 유도성 번역 조절 요소로부터 번역을 실시하게 하는 화학적, 생물학적 또는 물리적 작용제를 지칭하는데 사용된다. 유도제에의 노출에 반응하여, 상기 요소로부터의 번역은 일반적으로 새로이 (de novo) 개시되거나 또는 기저 또는 구성적 발현 수준을 초과하도록 증가된다. 유도제는, 예를 들어, 세포가 노출되는 스트레스 조건, 예를 들어, 열 또는 저온 쇼크, 독성제, 예컨대 중금속 이온, 또는 영양소의 부족, 호르몬, 성장 인자 등이거나; 또는 세포의 성장 또는 분화 상태에 영향을 미치는 화합물, 예컨대 호르몬 또는 성장 인자일 수 있다.

"단리 또는 정제된 폴리뉴클레오티드"라는 어구는 유기체의 천연 발생 게놈 내에서 바로 인접해 있는 서열로부터 양 말단이 분리된 폴리뉴클레오티드 서열 (예컨대, DNA)의 조각을 포함하는 것으로 의도되었다. 정제된 폴리뉴클레오티드는 이중 또는 단일 가닥의 올리고뉴클레오티드; 벡터 내로 편입된 폴리뉴클레오티드 절편; 진핵 또는 원핵 유기체의 게놈 내로 삽입된 절편; 또는 프로브로 사용된 절편일 수 있다. "실질적으로 순수한"이라는 어구는 폴리뉴클레오티드에 대해 언급될 때, 해당 분자가, 전형적으로는, 샘플의 적어도 85 퍼센트 또는 그 이상의 비율을 차지하도록 다른 동반된 생물학적 구성요소들로부터 분리된 것을 의미한다.

"뉴클레오티드 서열," "핵산 서열," "핵산," 또는 "폴리뉴클레오티드 서열"이라는 용어는 단일-가닥 또는 이중-가닥 형태의 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 중합체를 지칭하며, 달리 한정되지 않는 한, 천연 발생 뉴클레오티드와 유사한 방식으로 핵산에 혼성화하는 천연 뉴클레오티드의 공지된 유사체를 포괄한다. 핵산 서열은, 예컨대, 원핵 서열, 진핵 mRNA 서열, 진핵 mRNA로부터의 cDNA 서열, 진핵 DNA (예컨대, 포유동물 DNA)로부터의 게놈 DNA 서열, 및 합성 DNA 또는 RNA 서열일 수 있으나, 이들에 제한되는 것은 아니다.

"프로모터"라는 용어는 전사가 개시되는 서열로서 전사를 지휘할 수 있는 핵산 서열을 의미한다. 다양한 프로모터 서열이 당업계에 공지되어 있다. 예를 들어, 그러한 요소에는, TATA-박스, CCAAT-박스, 박테리오파지 RNA 중합효소 특이적 프로모터 (예컨대, T7, SP6, 및 T3 프로모터), SP1 부위, 및 고리형 AMP 반응 요소가 포함될 수 있으나, 이들에 제한되는 것은 아니다. 프로모터가 유도성 타입인 경우, 이의 활성은 유도제에 반응하여 증가한다.

5' 선도자 또는 비번역 영역 (5' 선도자, 5' 선도 서열 또는 5' UTR)은 전령 RNA (mRNA) 및 이를 코딩하는 DNA의 특정 구획이다. 이는 +1 위치 (전사가 시작되는 곳)에서 시작되고, 코딩 영역의 시작 코돈 (전형적으로 AUG) 바로 앞에서 끝이 난다. 박테리아에서는, 이는 샤인-달가르노 서열로 공지되어 있는 리보솜 결합 부위 (RBS)를 함유할 수도 있다. 5' 선도 서열은 길이가 뉴클레오티드 부재 (희귀 선도자 부재 메시지에서)에서부터 1,000개 초과 뉴클레오티드까지의 범위이다. 3' UTR은 훨씬 더 긴 경향이 있다 (수 킬로베이스 길이까지임).

"작동가능하게 연결된" 또는 "작동가능하게 결합된"이라는 용어는 유전자 요소들이 그들의 정상적 기능을 수행할 수 있는 방식으로 연결된 유전자 요소들 간의 기능적 연결을 지칭한다. 예를 들어, 유전자가 프로모터에 작동가능하게 연결된 것은, 유전자의 전사가 상기 프로모터의 제어 하에 있고, 생성된 전사체가 상기 유전자에 의해 정상적으로 코딩되는 단백질로 올바르게 번역되는 경우에 해당한다. 유사하게, 번역 인핸서 요소가 관심 유전자에 작동가능하게 결합된 것은, 상기 요소가 상기 유전자로부터 전사되는 mRNA의 상향 조절된 번역을 가능하게 하는 경우에 해당한다.

방향성 결찰에 적합하도록 개조된 뉴클레오티드 서열, 예컨대, 폴리링커(polylinker)는 벡터 내로의 폴리뉴클레오티드 서열의 방향성 결찰을 위한 부위 또는 수단을 제공하는 발현 벡터의 영역이다. 전형적으로, 방향성 폴리링커는 2 이상의 제한 효소 인식 서열, 또는 제한 부위를 나타내는 뉴클레오티드 서열이다. 제한효소 절단시, 해당 두 부위는 폴리뉴클레오티드 서열이 발현 벡터에 결찰될 수 있는 접착 말단을 생성한다. 일 실시양태에서, 상기 두 제한 부위는, 제한효소 절단시, 상보적이지 않아서 그로 인해 카세트 내로의 폴리뉴클레오티드 서열의 방향성 삽입을 가능하게 하는 접착 말단을 제공한다. 예를 들어, 방향성 결찰에 적합하도록 개조된 뉴클레오티드 서열은 다중의 방향성 클로닝 수단을 나타내는 뉴클레오티드 서열을 함유할 수 있다. 방향성 결찰에 적합하도록 개조된 뉴클레오티드 서열이 다수의 제한 부위를 나타내는 경우, 이는 다중 클로닝 부위로 지칭된다.

치료를 위한 "대상체"라는 용어는 포유동물로 분류되는 임의의 동물, 예컨대, 인간 및 비-인간 포유동물을 지칭한다. 비-인간 동물의 예로는, 개, 고양이, 소, 말, 양, 돼지, 염소, 토끼 등이 있다. 특별히 언급되는 경우를 제외하고는, "환자" 또는 "대상체"라는 용어는 본원에서 상호교환가능하게 사용된다. 일 실시양태에서, 대상체는 인간이다.

전사 인자는 전사를 개시 또는 조절하는데 필요한 임의의 폴리펩티드를 지칭한다. 예를 들어, 그러한 인자로는, 이들에 제한되는 것은 아니나, c-Myc, c-Fos, c-Jun, CREB, cEts, GATA, GAL4, GAL4/Vp16, c-Myb, MyoD, NF-κB, 박테리오파지-특이적 RNA 중합효소, Hif-1, 및 TRE가 있다. 상기와 같은 인자를 코딩하는 서열의 예로는, 이들에 제한되는 것은 아니나, GenBank 등록 번호 K02276 (c-Myc), K00650 (c-fos), BC002981 (c-jun), M27691 (CREB), X14798 (cEts), M77810 (GATA), K01486 (GAL4), AY136632 (GAL4/Vp16), M95584 (c-Myb), M84918 (MyoD), 2006293A (NF-κB), NP 853568 (SP6 RNA 중합효소), AAB28111 (T7 RNA 중합효소), NP 523301 (T3 RNA 중합효소), AF364604 (HIF-1), 및 X63547 (TRE)이 있다.

"실질적으로 동일한" 핵산 또는 아미노산 서열은 본원에 기재된 익히 공지된 프로그램 중 하나 (예컨대, BLAST)를 이용하여 표준 매개변수를 사용하여 측정시 기준 서열에 대해 90% 이상의 서열 동일성을 갖는 서열을 포함하는 핵산 또는 아미노산 서열을 지칭한다. 서열 동일성은 95% 이상, 98% 이상, 및 99% 이상일 수 있다. 일부 실시양태에서, 대상 서열은 기준 서열과 비교하여 길이가 대략 동일한데, 즉, 대략 동일한 수의 연속한 아미노산 잔기 (폴리펩티드 서열의 경우) 또는 뉴클레오티드 잔기 (폴리뉴클레오티드 서열의 경우)로 이루어진다.

서열 동일성은 당업계에 공지된 다양한 방법으로 용이하게 측정할 수 있다. 예를 들어, BLASTN 프로그램 (뉴클레오티드 서열의 경우)은 디폴트로서 단어 길이 (W) 11, 기대값 (E) 10, M=5, N=-4, 및 양쪽 가닥의 비교를 사용한다. 아미노산 서열의 경우, BLASTP 프로그램은 디폴트로서 단어 길이 (W) 3, 기대값 (E) 10, 및 BLOSUM62 측정 행렬을 사용한다 (문헌 [Henikoff & Henikoff, Proc. Natl. Acad. Sci. USA 89:10915 (1989)] 참고). 서열 동일성의 백분율은 2개의 최적 정렬된 서열을 일정 비교 범위에 걸쳐 비교함으로써 결정되는데, 여기서 비교 범위 내의 폴리뉴클레오티드 서열의 부분은 상기 두 서열의 최적 정렬을 위해서 (부가 또는 결실을 포함하지 않은) 기준 서열과 비교하여 부가 또는 결실 (즉, 갭(gap))을 포함할 수도 있다. 상기 백분율은 동일한 핵산 염기 또는 아미노산 잔기가 두 서열 모두에서 나타나는 위치의 수를 측정하여 매칭되는 위치의 수를 산출하고, 이 매칭되는 위치의 수를 비교 범위 내의 총 위치의 수로 나눈 후, 결과치에 100을 곱하여 서열 동일성의 백분율을 산출함으로써 계산된다.

"치료하다" 또는 "완화시키다"라는 용어는 화합물 또는 작용제를 대상체에 투여하여 질병 (예컨대, 심장 기능이상)의 증상, 합병증, 또는 생화학적 징후의 발생을 예방 또는 지연시켜, 증상을 완화시키거나 또는 질병, 병태, 또는 장애의 더 이상의 발달을 정지 또는 억제시키는 것을 포함한다. 치료를 요하는 대상체에는 질병 또는 장애를 이미 앓고 있는 환자뿐 아니라, 장애를 갖기 쉬운 환자 또는 장애가 예방되어야 하는 환자가 포함된다.

치료는 증상에 대한 예방적 억제 또는 완화 (질병의 발생을 예방 또는 지연시키거나, 또는 그의 임상적 또는 준임상적 증상의 발현을 예방하기 위한 것) 또는 질병의 발현 후의 증상에 대한 치료적 억제 또는 완화일 수 있다. 심장 구조변형 (cardiac remodeling) 및/또는 심부전의 치료에서, 치료제는 상기 질병의 병리를 직접적으로 감소시키거나, 또는 상기 질병이 다른 치료제에 의한 치료에 더욱 영향을 받게 되도록 하는 것일 수 있다.

"벡터" 또는 "구조물"이라는 용어는 이들에 작동가능하게 연결된 유전자/유전자 산물의 발현이 예측가능하게 제어될 수 있도록 일정한 구성 패턴으로 배열된 폴리뉴클레오티드 서열 요소를 지칭한다. 전형적으로, 이들은 외래 DNA를 숙주 세포 내로 도입시켜 그의 복제 및/또는 전사를 촉진시키기 위해 외래 DNA의 분절을 내부로 스플라이싱할 수 있는 전달성 폴리뉴클레오티드 서열 (예컨대, 플라스미드 또는 바이러스)이다.

클로닝 벡터는, 숙주 세포 내에서 자율적으로 복제될 수 있으며 하나 또는 소수의 제한 효소 인식 부위를 갖는 것을 특징으로 하는 DNA 서열 (전형적으로 플라스미드 또는 파지)이다. 외래 DNA 절편의 복제 및 클로닝을 일으키기 위해, 이 절편을 벡터 내의 상기 인식 부위로 스플라이싱할 수 있다. 벡터는 형질전환된 세포의 식별에 사용하기에 적합한 하나 이상의 마커를 함유할 수 있다. 예를 들어, 마커는 테트라사이클린 또는 암피실린 저항성을 제공할 수 있다.

발현 벡터는 클로닝 벡터와 유사하지만, 숙주 내로의 형질전환 후에, 내부에 클로닝된 DNA의 발현을 유도할 수 있다. 클로닝된 DNA는 보통 프로모터 또는 인핸서와 같은 특정 조절 서열의 제어 하에 놓이게 된다(즉, 이들에 작동가능하게 연결되어 있음). 프로모터 서열은 구성적이거나, 유도성이거나 또는 억제성일 수 있다.

"개시 코돈" 또는 "개시 삼중자(triplet)"는 시스트론 내의 단백질 합성이 시작되는 위치이다. 이는 일반적으로 코딩 서열의 5' 말단에 위치해 있다. 진핵 mRNA에서, 개시 코돈은 전형적으로 아미노산 메티오닌 (Met)을 코딩하는 3개의 뉴클레오티드 (아데닌, 우라실, 및 구아닌 (AUG) 뉴클레오티드)로 이루어진다. 박테리아에서는, 개시 코돈이 또한 전형적으로 AUG이지만, 이 코돈은 변형 메티오닌 (N-포르밀메티오닌 (fMet))을 코딩한다. 진핵생물 및 박테리아 둘 모두에서 AUG 이외의 뉴클레오티드 삼중자가 간혹 개시 코돈으로 사용되기도 한다.

"하류 개시 코돈"은 진정한 개시 코돈의 하류에, 전형적으로는 해당 유전자의 코딩 영역 내에 위치하는 개시 코돈을 지칭한다. "상류 개시 코돈"은 진정한 개시 코돈의 상류에 5' 선도자 영역에 위치하는 개시 코돈을 지칭한다.

본원에 사용된 바, "하류" 및 "상류"라는 언급은 진정한 개시 코돈과 비교한 위치를 지칭한다. 예를 들어, 어떤 mRNA 서열 상의 상류 코돈은 상기 서열 내의 또 다른 위치 (예컨대 진정한 개시 코돈)에 대해 mRNA 서열의 5'-말단 쪽에 있는 코돈이며, 하류 코돈은 상기 서열 내의 또 다른 위치에 대해 mRNA 서열의 3'-말단 쪽에 있는 코돈을 지칭한다.

본원에 사용된 바, "진정한 개시 코돈" 또는 "1차 개시 코돈"은 생산 조절 대상인 코딩된 관심 단백질의 코딩 서열의 첫번째 아미노산을 코딩하는 시스트론의 개시 코돈을 지칭한다. "2차 개시 코돈"은 코딩된 관심 단백질에 있어서 상기 1차 또는 진정한 개시 코돈이 아닌 개시 코돈을 지칭한다. 2차 개시 코돈은 일반적으로 1차 또는 진정한 개시 코돈의 하류에 있으며, 코딩 서열 내에 위치한다.

본원에 사용된 바, "단백질 발현의 증가"란, 하나 이상의 2차 개시 코돈이 변이된 변형 mRNA의 번역이 하나 이상의 2차 개시 코돈이 변이되지 않은 야생형 mRNA로부터 수득되는 폴리펩티드 농도에 비해 적어도 약 5%, 적어도 약 10%, 적어도 약 20%, 적어도 약 30%, 적어도 약 40%, 적어도 약 50% 또는 그 이상인 폴리펩티드 농도를 생성하는 것을 지칭한다. 단백질 발현의 증가는 또한 변이된 mRNA의 단백질 발현이 야생형 mRNA에 비해 1.5배, 2배, 3배, 5배, 10배 또는 그 이상인 것을 지칭할 수 있다.

본원에 사용된 바, "리보솜 동원 부위"는 코딩된 단백질의 번역 개시 전에 리보솜 소단위체가 결합하는 mRNA 내의 부위를 지칭한다. 리보솜 동원 부위는 캡 구조, mRNA의 5' 말단에서 발견되는 변형 뉴클레오티드 (m⁷G 캡-구조), 및 mRNA 내에 함유된 내부 리보솜 유입 부위 (IRES)로 일컬어지는 서열을 포함할 수 있다. 여타의 리보솜 동원 부위는, Gtx 호메오도메인 mRNA로부터의 9-뉴클레오티드 서열을 포함할 수 있다. 리보솜 동원 부위는 보통 진정한 개시 코돈의 상류에 존재하나, 또한 진정한 개시 코돈의 하류에 존재할 수도 있다.

본원에 사용된 바, "사용빈도 편향"은 동일 아미노산을 코딩하는 여러 코돈 중 하나에 대해 유기체가 나타내는 특정 선호도를 지칭한다. 사용빈도 편향을 변경시키는 것은 본래의 코돈보다 더 높거나 더 낮은 선호도로 동일 아미노산에 대한 다른 코돈을 사용하도록 유도하는 변이를 지칭한다.

본원에 사용된 바, "전장 단백질"은 해당 단백질을 코딩하는 유전자에 의해 코딩되는 본질적으로 모든 아미노산을 포함하는 단백질을 지칭한다. 살아있는 세포의 일부 단백질에는 교묘한 변형이 존재하여 상기 단백질이 실제로는 약간의 변경을 가진 일군의 밀접하게 관련된 단백질이라는 것이 당업자에게 알려져 있다. 예를 들어, 전부는 아니지만 일부 단백질에서는, a) 아미노산이 아미노-말단으로부터 제거되어 있고/있거나, b) 분자량을 증가시킬 수 있는 화학적 기가 부가되어 있다. 코딩된 대부분의 박테리아 단백질은 그의 아미노-말단에 메티오닌 및 알라닌 잔기를 함유하며; 이들 잔기 중 하나 또는 둘 모두는 흔히 박테리아 세포 내의 단백질의 활성 형태에서는 제거되어 있다. 이러한 유형의 변형은 전형적으로 이질적이어서 모든 변형이 모든 분자에 일어나는 것은 아니다. 즉, 천연 "전장" 분자는 동일 아미노산 서열에서 출발하지만 변형되는 방식이 약간 상이한 일 부류의 분자들이다. "전장 단백질"이라는 용어는 이러한 일 부류의 분자들을 모두 포괄한다.

본원에 사용된 바, "구출" 또는 "변형"이란 코딩 영역으로부터의 대부분 내지 모든 2차 개시 코돈을 제거하는 뉴클레오티드 변경을 지칭한다. "부분적 변형"이란 2차 개시 코돈의 모든 가능한 변이의 하위 집합을 코딩 영역으로부터 제거하는 뉴클레오티드 변경을 지칭한다.

III. 하류 개시 코돈을 통한 리보솜 방향전환의 감소

상기 언급한 바와 같이, 5' 선도자 내에 함유된 특징들이 번역 효율에 영향을 미칠 수 있다는 것이 익히 공지되어 있다. 예를 들어, 상류 AUG 코돈으로 지칭되는 5' 선도자 내의 AUG 코돈은 유전자, 뉴클레오티드 환경, 및 세포 상태에 따라 단백질 합성에 긍정적이거나 부정적인 영향을 미칠 수 있다. 상류 AUG 코돈은 진정한 개시 코돈으로부터 리보솜을 방향전환시킴으로써 번역 개시를 억제할 수 있다(문헌 [Meijer et al., "Translational Control of the Xenopus laevis Connexin-41 5'-Untranslated Region by Three Upstream Open Reading Frames" J. Biol. Chem. 275(40):30787-30793 (2000)]). 예를 들어, 문헌 [Meijer et al.]에서의 도 6 및 8은 5' 선도 서열 내의 상류 AUG 코돈의 리보솜 방향전환 효과를 제시한다.

다수의 종에서 AUG/ATG가 통상적인 번역 개시 코돈이지만, 번역은 생체내에서 간혹 또한 ACG, GUG/GTG, UUG/TTG, CUG/CTG, AUA/ATA, AUC/ATC, 및 AUU/ATT를 비롯한 다른 상류 코돈에서 개시될 수 있다는 것이 알려져 있다. 예를 들어, 마우스 디하이드로폴레이트 리덕타제 (dhfr)의 개시 코돈을 ACG로 변이시켰을 때 포유동물 리보솜은 AUG가 아닌 삼중자에서 번역을 개시할 수 있는 것으로 나타났다 (문헌 [Peabody, D.S. (1987) J. Biol. Chem. 262, 11847-11851]). 피바디(Peabody)에 의한 또 다른 연구에서는, dhfr의 변이 개시 코돈 AUG (GUG, UUG, CUG, AUA, AUC 및 AUU)가 모두 외관상 정상적인 dhfr의 합성을 유도할 수 있었던 것으로 나타났다 (문헌 [Peabody, D. S. (1989) J. Biol. Chem. 264, 5031-5035]).

번역 개시의 고정 및 군집화 모델은 번역이 접근가능한 개시 코돈에서 시작할 수 있음을 가정하고, 연구를 통해 개시 코돈이 리보솜 동원 부위 (캡 또는 IRES)의 하류에서 거리-의존성 방식으로 사용될 수 있음을 보여주었다 (문헌 [Chappell et al. "Ribosomal tethering and clustering as mechanisms for translation initiation" PNAS USA 103(48):18077-82 2006] 참조). 이는 코딩 서열에서 추정상의 개시 코돈이 또한 이용될 수 있음을 시사한다. 하류 개시 코돈 또는 2차 개시 부위에서의 번역 개시는 리보솜에 대해 진정한 개시 코돈 또는 1차 개시 부위와 경쟁하여 코딩된 단백질의 발현을 저하시킬 수 있다. 예컨대 이들 2차 개시 부위를 비-개시 코돈으로 변이시킴으로써 2차 개시 부위의 이용가능성을 감소시키는 것은 리보솜에 대한 1차 개시 부위의 이용가능성 및 보다 효율적인 코딩 단백질 발현을 증가시킨다.

본 방법은 개선되고 보다 효율적인 단백질 발현을 허용하며, 번역 장치에 대한 다양한 개시 코돈간의 경쟁을 감소시킨다. 코딩된 단백질과 동일한 리딩 프레임 내에 있는 코딩 서열에서 하류 개시 코돈을 제거함으로써, 기능 변경 가능성이 있는 말단절단된 단백질의 생성이 제거될 것이다. 또한, 코딩 서열에 대해 아웃-오브-프레임으로 존재하는 하류 개시 코돈을 제거함으로써, 다양한 펩티드 (이중 일부는 세포 생리학 또는 단백질 생성에 대해 부정적인 영향을 가질 수 있음)의 생성이 또한 제거될 것이다. 이러한 이점은 DNA 백신 또는 유전자 치료법에서의 적용에 특히 중요할 수 있다.

하류 개시 코돈의 직접적 변이는 코딩된 아미노산 서열이 변경되지 않은 채로 남아있도록 일어날 수 있다. 이는 유전자 코드가 퇴화되고 대부분의 아미노산이 2 이상의 코돈에 의해 코딩되기 때문에 다수의 경우에서 가능하다. 유일한 예외는 단지 각각 하나의 코돈 AUG 및 UGG에 의해 코딩되는 메티오닌 및 트립토판이다. 또한, 아미노산 서열을 변경하는 하류 개시 코돈의 변이를 고려할 수 있다. 이러한 경우, 아미노산 서열 변경의 효과를 평가할 수 있다. 별법으로, 아미노산 서열이 변경되지 않은 채로 남아있는 경우, 추정상의 개시 코돈 측면에 있는 뉴클레오티드가 종종 변이되어 개시 코돈의 효율을 감소시킬 수 있다. AUG 코돈의 경우, 이는 마릴린 코작(Marilyn Kozak)에 의해 확립된 뉴클레오티드 환경 규칙 (우수한 환경 중에 있는 AUG는 AUG가 +1, +2, +3으로 넘버링되는 경우 위치 -3에서 퓨린 및 +4에서 G를 함유함을 기술함)에 따라 수행될 수 있다 (문헌 [Kozak, M. (1984) Nature 308, 241-246] 참조).

비-AUG 코돈의 경우, 유사한 규칙이 위치 +5 및 +6의 뉴클레오티드로부터의 추가 결정인자와 함께 적용되는 것처럼 보인다. 변이를 디자인하는데 있어서, 코돈 사용빈도 편향은, 예컨대 야생형 코돈과 유사한 코돈 편향을 갖는 변이된 코돈을 도입함으로써 다수의 경우에서 비교적 변경되지 않은 채로 남아있을 수 있다. 상이한 유기체가 상이한 코돈 사용 빈도를 갖는 한, 상이한 유기체로부터의 세포에서의 발현에 대한 특이적 변이는 그에 따라 변할 것이다.

본원에 개시된 방법은 진핵 세포에 제한되는 것이 아니라 박테리아에도 적용됨을 이해해야 한다. 박테리아 번역 개시가 진핵생물의 경우와 상이한 것으로 생각되지만, 여전히 리보솜 동원은 소위 샤인-달가르노 서열을 포함하는 mRNA에서의 시스-요소를 통해 일어난다. 박테리아에서 비-AUG 개시 코돈은 ACG, GUG, UUG, CUG, AUA, AUC, 및 AUU를 포함한다.

일 실시양태에서, 하류 개시 코돈을 통해 리보솜 방향전환을 감소시킴으로써 단백질 합성을 증진시키는 코딩 서열에 대한 변형이 개시된다. 이들 코돈은 AUG/ATG 및 세포에서 개시 코돈으로서 기능하는 것으로 알려진 다른 뉴클레오티드 삼중자 코돈, 예를 들어 ACG, GUG/GTG, UUG/TTG, CUG/CTG, AUA/ATA, AUC/ATC, 및 AUU/ATT (이에 제한되지 않음)를 포함할 수 있다. 일 실시양태에서, 하류 개시 코돈은 변이된다. 단백질 생성을 증가시키기 위한 mRNA 코딩 서열의 재구조화는 모든 하류 개시 코돈을 변이시키는 것을 포함할 수 있거나 또는 하류 개시 코돈의 단지 일부만을 변이시키는 것을 포함할 수 있다. 또다른 실시양태에서, 측면 뉴클레오티드는 덜 유리한 뉴클레오티드 환경으로 변이된다. 일 실시양태에서, 신호 펩티드 내 ATG 코돈은 ATC 코돈으로 변이되어 메티오닌을 이소류신으로 치환할 수 있다. 또다른 실시양태에서, 신호 펩티드 내 CTG 코돈은 CTC로 변이될 수 있다. 또다른 실시양태에서, ATG 코돈은 ATC 코돈으로 변이되어 메티오닌 (M)을 이소류신 (I)으로 아미노산 치환할 수 있고, CTG 코돈은 CTC로 변이될 수 있다. 또다른 실시양태에서, ATG 코돈은 ATC 코돈으로 변이될 수 있고, CTG 코돈은 CTC 코돈으로 변이될 수 있고, 개시자 AUG의 환경은 개시자의 3' 코돈을 CCC에서 GCT로 변화시켜 프롤린 (P)을 아르기닌 (R)으로 아미노산 치환함으로써 개선될 수 있다. 다른 실시양태에서, 하나 이상의 AUG 및 CUG 코돈이 제거될 수 있는 변형이 신호 펩티드에 대해 이루어질 수 있다. 잠재적 개시 코돈 대부분의 제거, 신호 펩티드의 ATG 및 CTG의 제거, ATG, CTG 및 ACG 코돈의 제거로 인한 글루탐산 (E)에서 글루타민 (Q)로의 아미노산 치환 또는 히스티딘 (H)에서 아르기닌 (R)으로의 아미노산 치환에 의한 변형된 신호 펩티드를 포함하는 변형이 이루어질 수 있다.

분자 생물학에서의 표준 기술을 사용하여 변이된 핵산 서열을 생성할 수 있다. 이러한 기술은 다양한 핵산 조작 기술, 핵산 이동 프로토콜, 핵산 증폭 프로토콜 및 당업계에 공지된 다른 분자 생물학 기술을 포함한다. 예를 들어, 올리고뉴클레오티드 매개된 부위-지정 돌연변이를 사용하여 관심 유전자 내에 점 변이를 도입할 수 있다. 또한, 원하는 변이를 갖도록 합성된 올리고뉴클레오티드를 사용하여 변형된 서열을 합성을 통해 생성할 수 있다. 이들 접근법을 사용하여 한 부위에 또는 코딩 영역 전체에 걸쳐 변이를 도입할 수 있다. 별법으로, 동종 재조합을 사용하여 관심 표적 서열 내에 변이 또는 이종 서열을 도입할 수 있다. 핵산 이동 프로토콜은 염화칼슘 형질전환/트랜스펙션, 전기천공, 리포좀 매개된 핵산 이동, N-[1-(2,3-디올로일옥시)프로필]-N,N,N-트리메틸암모늄 메틸술페이트 매개된 형질전환 등을 포함한다. 별법의 돌연변이 프로토콜에서, 특정 유전자 내 점 변이는 또한 양성 선택 압력을 사용하여 선택될 수 있다. 예컨대, 문헌 [Current Techniques in Molecular Biology, (Ed. Ausubel, et al.)]을 참조한다. 핵산 증폭 프로토콜은 중합효소 연쇄 반응 (PCR)을 포함하나 이에 제한되지 않는다. 플라스미드, 벡터, 프로모터 및 다른 조절 서열과 같은 핵산 도구의 사용은 각종 바이러스 및 세포 유기체에 대한 업계에 널리 공지되어 있다. 추가로, 각종 핵산 도구는 ATCC를 포함하는 다수의 상이한 공급원 및 다수의 시판처로부터 입수가능하다. 당업자는 당업계의 지식 및 디자인 선택에 따라 임의의 특정 바이러스 또는 세포 유기체의 유전적 변형을 위한 적절한 도구 및 방법을 용이하게 선택할 수 있을 것이다. 단백질 발현은 또한 다양한 표준 방법을 사용하여 측정할 수 있다. 이러한 방법에는 웨스턴 블롯 분석, ELISA, 대사 라벨링 및 효소 활성 측정이 포함되나, 이들에 제한되는 것은 아니다.

IV. miRNA-매개성 하향-조절의 회피

마이크로RNA는 일반적으로 음성 유전자 조절자로서 기능하는 풍부한 부류의 소형 비코딩 RNA이다. 일 실시양태에서, miRNA-매개성 하향-조절을 회피하기 위해 5' 선도자, 코딩 서열 및 3' UTR을 포함하는 mRNA 서열에 대해 변형이 이루어질 수 있다. 이러한 변형은 mRNA 또는 초기의 펩티드 안정성을 변경할 수 있고, 단백질 합성 및 번역 효율을 증진시킬 수 있다.

MiRNA는 일반적으로 리보핵단백질 복합체의 구성요소인 21 내지 23개 뉴클레오티드의 RNA일 수 있다. miRNA는 mRNA에 대한 염기쌍 형성에 의해 mRNA 안정성 또는 단백질 합성에 영향을 미칠 수 있다. miRNA는 일반적으로 mRNA의 3' UTR 내 결합 부위에 염기쌍을 형성함으로써 그의 효과를 매개한다. 그러나, miRNA는 코딩 서열 및 5' 선도 서열 내에 함유된 결합 부위로부터 유사한 억제 효과를 갖는 것으로 나타났다. 염기쌍 형성은 miRNA의 2 내지 8개 뉴클레오티드로 이루어진 소위 "시드 서열"을 통해 일어난다. 인간에는 1,000개가 넘는 상이한 miRNA가 존재할 수 있다.

miRNA-매개성 억제를 회피하기 위한 mRNA의 재구조화는 mRNA 내의 모든 시드 서열을 변이시키는 것을 포함할 수 있다. 상기 기재된 개시 코돈 변이와 마찬가지로, 상기 변이는 코딩된 아미노산 서열이 변경되지 않은 채로 남아 개시 코돈, 희귀 코돈 또는 다른 miRNA 시드 서열을 도입하지 않도록 작용함을 보장할 수 있다.

컴퓨터 프로그램을 사용하여 관심 세포 유형, 예컨대 차이니즈 햄스터(Chinese hamster) 난소 세포에서의 발현을 위한 설치류 세포, 또는 인간 세포주에서의 발현이나 DNA 백신에의 적용을 위한 인간 세포에 따라 mRNA 서열을 재구조화할 수 있다. 이 프로그램은 개시 코돈을 제외한 잠재적 개시 코돈을 제거하기 위해 mRNA를 재코딩할 수 있다. 코딩 서열에서의 인-프레임 AUG 코돈의 경우, 이들 하류 개시 코돈의 환경은 가능한 경우 약화될 수 있다. 변이는 관심 세포주에 대한 코돈 편향에 따라 수행될 수 있으며, 예컨대 인간 코돈 편향 정보는 인간 세포주에 대해 사용될 수 있고, 사카로마이세스 세레비시애(Saccharomyces cerevisiae) 코돈 편향 정보는 이 효모에 대해 사용될 수 있고, 이.콜라이(E.coli) 코돈 편향 정보는 이 박테리아에 대해 사용될 수 있다. 고등 진핵 mRNA에서, 재코딩된 mRNA는 관심 유기체에서 모든 공지의 시드 서열에 대해, 예컨대 인간 세포주의 경우 인간 시드 서열에 대해 조사될 수 있다. 시드 서열은 1) 아미노산 서열을 파괴하지 않고, 2) 변이된 코돈의 사용빈도 편향을 극적으로 변경시키지 않고, 3) 새로운 추정상의 개시 코돈을 도입하지 않아야 한다는 것을 고려하면서 변이시킬 수 있다.

본 명세서는 다수의 특정 설명을 함유하고 그의 바람직한 실시양태를 참조로 기재되었지만, 이들은 청구된 방법이나 청구될 수 있는 것의 범위에 대한 제한으로서 해석되어서는 안되며, 오히려 특정 실시양태에 특이적인 특징의 기재로서 해석되어야 한다. 당업자는 기재된 대상의 의미를 벗어나지 않으면서 형태 및 세부사항에 다양한 변화가 이루어질 수 있음을 이해할 것이다. 본 명세서에서 각각의 실시양태와 관련하여 기재된 특정 특징은 또한 하나의 실시양태와 조합되어 수행될 수도 있다. 반대로, 하나의 실시양태와 관련하여 기재된 다양한 특징 또한 다수의 실시양태에서 별개로 또는 임의의 적합한 하위-조합으로 수행될 수 있다. 게다가, 특징들이 특정 조합으로, 그리고 심지어 최초로 청구된 그 자체로 작용하는 것처럼 상기에 기재되어 있을 수 있지만, 청구된 조합으로부터의 하나 이상의 특징들이 일부 경우에서 그 조합으로부터 제거될 수 있고, 청구된 조합이 하위-조합 또는 하위-조합의 변형을 지향할 수 있다. 대상의 범위는 하기 특허청구범위에 의해 정의된다.

본 명세서에 인용된 모든 공보, 데이타베이스, GenBank 서열, 특허 및 특허출원은 이들 각각이 구체적 및 개별적으로 참조로 포함되는 것으로 명시된 것처럼 본원에 참조로 포함된다.

실시예

하기 실시예는 추가의 예시로서 제공되며, 범위가 이에 제한되지 않는다. 다른 변형은 당업자에게 자명할 것이며, 첨부된 특허청구범위에 포함된다.

실시예 1: mRNA 전사체 내 다수 번역 개시 부위의 변형

mRNA 전사체의 5'-UTR 및 코딩 영역 내 다수 번역 개시 부위의 존재는, 예를 들어 진정한 또는 입증된 번역 개시자 코돈으로부터 리보솜을 전환시킴으로써 번역 효율을 감소시킨다. 별법으로, 또는 추가로, 진정한 또는 입증된 번역 개시자 코돈 하류의 다수 번역 개시 부위의 존재는 전장 단백질의 번역 효율을 감소시키는 하나 이상의 단백질 이소형의 번역 개시를 유도한다. 상업적으로 가치있는 인간 단백질을 코딩하는 mRNA 전사체의 번역 효율을 개선하기 위해, 진정한 또는 입증된 번역 개시자 코돈 상류 및 하류의 모든 리딩 프레임 내 잠재적 번역 개시 부위를 변이시켜 이들 부위를 제거한다. 이러한 방법의 바람직한 측면에서, mRNA 서열은 변경되지만 이에 따라 코딩된 아미노산은 동일하게 유지된다. 별법으로, 유사한 물성을 갖는 아미노산으로 치환되는 보존적 변화가 유도된다.

표준 번역 개시 코돈은 AUG/ATG이다. 다른 확인된 개시자 코돈으로는 ACG, GUG/GTG, UUG/TTG, CUG/CTG, AUA/ATA, AUC/ATC, 및 AUU/ATT가 포함되나, 이들에 제한되는 것은 아니다.

세포내 단백질: 클로람페니콜 아세틸 트랜스퍼라제 (CAT)

클로람페니콜은 50S 리보솜 소단위체에 결합하여 펩티드 결합 형성을 방지함으로써 박테리아 단백질 합성을 방해하는 항생제이다. 저항성 유전자 (cat)는, 상기 항생제의 2개의 히드록실기 중 하나 또는 둘 다를 아세틸화함으로써 그 약물을 아세틸화하여 그를 불활성화시키는 아세틸 트랜스퍼라제 효소를 코딩한다. CAT의 비변형된 오픈 리딩 프레임은 113개의 잠재적 개시 코돈 (진정한 개시 코돈을 포함하는 20개 ATG, 8개 ATC, 8개 ACG, 12개 GTG, 8개 TTG, 11개 CTG, 6개 AGG, 10개 AAG, 16개 ATA, 및 14개 ATT 코돈 포함) (서열 120)을 함유한다. 서열 121은 전부 변형된 CAT ORF이고, 서열 122는 부분적으로 변형된 (단지 일부의 잠재적 변형만이 이루어진) CAT ORF이다.

도 1A 내지 1B에는, CAT 시스트론 (CAT) 및 부분적으로 변형된 CAT 시스트론 (mCAT)을 함유하는 박테리아 발현 구조물을 생성하고 이를 이. 콜라이 박테리아 균주 DH5α에서 시험한 것이 도시되어 있다. DH5α 세포를 CAT 및 mCAT 발현 구조물로 형질전환하고, LB/암피실린 플레이트에 도말하였다. 배양액을 단일 콜로니부터 얻고, 배양액의 A₆₀₀을 측정하여 결정시 대수 성장에 도달할 때까지 220 rpm으로 진탕하면서 37℃ LB/암피실린 (약 50μg/ml)에서 배양하였다. 이어서, 배양액을 LB/암피실린에 의해 비교가능한 A₆₀₀으로 희석하였다. CAT 발현 구조물로 형질전환된 DH5α 세포로부터 유래된 배양액의 A₆₀₀은 0.3인 반면, mCAT 발현 구조물로 형질전환된 세포로부터 유래된 배양액의 A₆₀₀은 0.25였다. CAT 및 mCAT 플라스미드 내에 함유된 lac 오페론을 통해 이소프로필 β-D-1-티오갈락토피라노시드 (IPTG, 최종 농도 0.4 mM)를 도입하여 클로람페니콜 아세틸트랜스퍼라제 발현을 유도하였다. 각각의 배양액 3 밀리리터를 클로람페니콜을 함유하는 깨끗한 튜브에 옮겨 최종 농도 20, 40, 80, 160, 320, 640, 1280, 및 2560 μg/ml를 생성하였다. 배양액을 37℃에서 220 rpm으로 진탕하면서 인큐베이션하고, 각 배양액의 A₆₀₀을 1시간 간격으로 측정하였다.

도 1A 내지 1B는 CAT (마름모꼴) 및 mCAT (정사각형) 발현 구조물로 형질전환된 DH5α 세포의 배양액의 생장 곡선을 도시한다. IPTG (최종 농도 0.4 mM)를 첨가하여 클로람페니콜 아세틸 트랜스퍼라제 발현을 유도하고, 3 밀리리터의 IPTG를 함유하는 배양액을 클로람페니콜을 함유하는 깨끗한 튜브에 첨가하여 최종 농도 0, 40, 80, 160, 320, 640, 1280, 및 2560 μg/ml를 생성하였다. 배양액을 37℃에서 220 rpm으로 진탕하면서 인큐베이션하고, 각 배양의 A₆₀₀을 일정시간에 걸쳐 측정하였다. 320 및 640 μg/ml 클로람페니콜의 존재하에 성장한 배양액의 결과가 도시되어 있다. X-축은 시간 (시)을 나타내고, Y-축은 (출발 A₆₀₀에 대해) 표준화된 A₆₀₀을 나타낸다.

상기 결과는 mCAT 발현 구조물로 형질전환된 박테리아가 CAT 발현 구조물로 형질전환된 박테리아보다 모든 농도에서 보다 양호하게 성장하였음을 보여주었다. 도 1A 내지 1B에 도시된 바와 같이, 클로람페니콜의 고농도 (320 및 640 μg/ml)에서, 변형된 CAT를 갖는 세포는 여전히 성장하였으나, 야생형 CAT를 갖는 세포는 성장하지 못했다. 이들 결과는, 보다 기능성인 클로람페니콜 아세틸트랜스퍼라제 효소가 mCAT 구조물로부터 발현되어 이 발현 구조물로 형질전환된 박테리아가 상기 항생제의 존재하에서 보다 잘 성장하도록 함을 나타낸다.

CAT 및 mCAT 발현 구조물로 형질전환된 DH5α 세포로부터 합성된 클로람페니콜 아세틸트랜스퍼라제 효소의 상대량을 결정하기 위해, IPTG에 의한 유도 후 5, 30, 60 및 90분에서 세포 추출물에 대한 웨스턴 블롯 분석을 수행하였다. 각 시점에서의 배양액 50 μl를 원심분리하고, 박테리아 펠렛을 TE 완충액 30 μl 및 4 x SDS 겔 로딩 완충액 10 μl에 재현탁시켰다. 샘플을 95℃에서 3분 동안 가열하고, 10％ 비스-트리스/SDS 폴리아크릴아미드 겔 상에 로딩하였다. 단백질을 PVDF 멤브레인에 옮기고, 항-CAT 항체로 탐침하였다. 도 2는 IPTG 유도 후 다양한 시점에서 CAT (C) 및 mCAT (mCAT) 발현 구조물로 형질전환된 DH5α 세포로부터의 용해물의 웨스턴 블롯 분석이다. 결과는, 시험된 모든 시점에서 mCAT 발현 구조물 (mC)로 형질전환된 DH5α 세포에서 클로람페니콜 아세틸트랜스퍼라제 단백질 (19kDa 마커 위)의 양이 실질적으로 증가함을 보여주었다.

또한, 포유동물 세포에서 클로람페니콜 아세틸트랜스퍼라제 ORF의 분석을 수행하였다. CMV 프로모터를 함유하는 포유동물 발현 구조물 내로 CAT ORF 및 부분적으로 변형된 CAT ORF를 클로닝하고, 차이니즈 햄스터 난소 (DG44) 세포 내로의 일시적 트랜스펙션에 의해 시험하였다. 요컨대, 각각의 발현 구조물 0.5 μg 및 β-갈락토시다제 리포터 단백질을 발현하는 코-트랜스펙션 대조군 플라스미드 (pCMVβ, 클론테크(Clontech)) 20 ng을 푸젠(Fugene) 6 (로슈(Roche)) 트랜스펙션 시약을 사용하여 제조자 설명서에 따라 100,000개의 DG44 세포 내로 트랜스펙션하였다. 트랜스펙션 후 24시간에, 세포를 용해 완충액 250 μl로 용해시켰다. Lac Z 리포터 검정을 수행하여 샘플 간 동등한 트랜스펙션 효율을 보장하였다. 용해물 30 μl를 4 x SDS 겔 로딩 완충액 10 μl에 첨가하였다. 샘플을 72℃에서 10분 동안 가열하고, 10％ 비스-트리스/SDS 폴리아미드 겔 상에 로딩하였다. 단백질을 PVDF 멤브레인에 옮기고, α-CAT 항체로 탐침하였다.

도 3은 야생형 (CAT) 및 변형된 CAT 발현 구조물로 형질전환된 DG44 세포로부터의 추출물에 대한 웨스턴 블롯 분석을 도시한다. 세포 추출물을 1 x MOPS/SDS 내 10％ 비스-트리스 겔 상에서 분별하고, PVDF 멤브레인에 옮기고, 항-CAT 항체로 탐침하였다. 트랜스펙션 효율이 동일한 세포로부터의 추출물을 이용하여 실험을 3중으로 수행하였다.

야생형 (CAT)을 갖는 3개의 트랜스펙션물과 변형된 CAT를 갖는 3개의 트랜스펙션물을 비교하였다. CAT 단백질 (19kDa 마커 위)의 양은 변형된 구조물로 트랜스펙션된 세포에서 실질적으로 증가하였다. 결과는 CAT 단백질 (19kDa 마커 위)의 양이 mCAT 구조물로 트랜스펙션된 DG44 세포에서 실질적으로 증가함을 보여주었다. 생성된 mRNA 전사체 내 다수 번역 개시 부위의 제거에 의한 CAT ORF의 변형은, 이 기술이 포유동물 및 박테리아 세포 외에도 수많은 유기체에서 실제적으로 사용될 수 있음을 입증하였다.

분비된 단백질

이 기술의 유용성을 분비된 단백질을 이용하여 또한 조사하였다. 포유동물 발현 구조물을 호모 사피엔스(Homo sapiens) CD5 분자 (CD5), mRNA 내에 코딩되는 신호 펩티드에 대해 생성하였다. CMV 프로모터에 의해 전사가 조종되고 티로글로불린 단백질에 대한 항체의 경쇄를 코딩하는 ORF의 5'-말단에 cd5 신호 펩티드가 위치하는 포유동물 발현 구조물을 생성하였다 (cd5-1, 서열 123). CD5 신호 펩티드 서열은 3개의 ATG, 1개의 TTG 및 3개의 CTG 코돈을 포함하는 7개의 잠재적 개시 코돈을 함유한다. 일련의 발현 구조물을 생성하였다. 하나의 변형에서, cd5 신호 펩티드 내 ATG 코돈을 ATC 코돈으로 변화시켜 메티오닌을 이소류신으로 치환하였다 (cd5-2, 서열 124). 또다른 변형에서, cd5 신호 펩티드 내 CTG 코돈을 CTC로 변화시켰다 (cd5-3, 서열 125). 또다른 변형에서, ATG 코돈을 ATC 코돈으로 변이시켜 메티오닌 (M)을 이소류신 (I)으로 아미노산 치환하고, CTG 코돈을 CTC로 변화시켰다 (cd5-4, 서열 126). 또다른 변형에서, ATG 코돈을 ATC 코돈으로 변화시켜 메티오닌 (M)을 이소류신 (I)으로 아미노산 치환하고, CTG 코돈을 CTC 코돈으로 변화시키고, 3' 코돈을 CCC에서 GCT로 변화시켜 프롤린 (P)을 아르기닌 (R)으로 아미노산 치환함으로써 개시자 AUG의 환경을 개선시켰다 (cd5-5, 서열 127).

이어서, 이들 구조물을 차이니즈 햄스터 난소 (DG44) 세포 내로의 일시적 트랜스펙션에 의해 시험하였다. 요컨대, 각각의 발현 구조물 0.5 μg 및 β-갈락토시다제 리포터 단백질을 발현하는 코-트랜스펙션 대조군 플라스미드 (pCMVβ, 클론테크) 20 ng을 푸젠 6 (로슈) 트랜스펙션 시약을 사용하여 제조자 설명서에 따라 100,000개의 DG44 세포 내로 트랜스펙션하였다. 트랜스펙션 후 24시간에, 세포를 용해 완충액 250 μl로 용해시켰다. Lac Z 리포터 검정을 수행하여 샘플 간 동등한 트랜스펙션 효율을 보장하였다. 상청액 30 μl를 4 x SDS 겔 로딩 완충액 10 μl에 첨가하였다. 샘플을 72℃에서 10분 동안 가열하고, 10％ 비스-트리스/SDS 폴리아크릴아미드 겔 상에 로딩하였다. 단백질을 PVDF 멤브레인에 옮기고, α-카파 경쇄 항체로 탐침하였다.

도 4는 야생형 (cd5-1) 및 변형된 cd5 신호 펩티드 α-티로글로불린 경쇄 발현 구조물 (cd5-2 내지 cd5-5)로 형질전환된 DG44 세포로부터의 상청액의 웨스턴 블롯 분석을 도시한다. 세포 추출물을 1 x MOPS/SDS 내 10％ 비스-트리스 겔 상에서 분획화하고, PVDF 멤브레인에 옮기고, α-카파 경쇄 항체로 탐침하였다. 트랜스펙션 효율이 동일한 세포로부터의 상청액을 이용하여 실험을 수행하였다. 결과는, 세포의 상청액 중 분비된 항체 경쇄 생성물 (28 kDa 위)의 수준이 신호 펩티드에서 CTG 코돈이 결핍된 발현 구조물 (cd5-3)에 대해 실질적으로 증가하였음을 보여준다. 또한, CTG, ATG 코돈이 결핍되어 있으며 신호 펩티드에서 진정한 개시 코돈 주위의 뉴클레오티드 환경이 개선된 (전부 구출된) 발현 구조물은 상청액 중 단백질 생성물의 수준이 실질적으로 증가하였다.

경쇄 신호 펩티드 1을 함유하는 Thy-1 가변 경쇄 ORF (서열 128)는 진정한 개시 코돈을 포함하는 8개 ATG, 15개 ATC, 6개 ACG, 14개 GTG, 4개 TTG, 26개 CTG, 16개 AGG, 10개 AAG, 3개 ATA, 및 2개 ATT 코돈을 포함하는 104개의 잠재적 개시 코돈을 함유한다. 신호 펩티드에서 AUG 및 CUG 코돈을 제거하는 변형을 행하였다 (서열 129). 경쇄 신호 펩티드 2를 함유하는 Thy-1 가변 경쇄 ORF (서열 130)는 진정한 개시 코돈을 포함하는 7개 ATG, 16개 ATC, 6개 ACG, 13개 GTG, 4개 TTG, 27개 CTG, 15개 AGG, 10개 AAG, 4개 ATA, 및 2개 ATT 코돈을 포함하는 104개의 잠재적 개시 코돈을 함유한다. 중쇄 신호 펩티드 1을 함유하는 Thy-1 가변 중쇄 ORF는 진정한 개시 코돈을 포함하는 18개 ATG, 14개 ATC, 18개 ACG, 42개 GTG, 7개 TTG, 43개 CTG, 43개 AGG, 33개 AAG, 5개 ATA, 및 2개 ATT 코돈을 포함하는 225개의 잠재적 개시 코돈을 함유한다 (서열 131). 신호 펩티드에서 AUG 및 CUG 코돈을 제거함으로써 변형을 수행하였다 (서열 132). 중쇄 신호 펩티드 2를 함유하는 Thy-1 가변 중쇄 ORF는 진정한 개시 코돈을 포함하는 18개 ATG, 14개 ATC, 18개 ACG, 43개 GTG, 9개 TTG, 41개 CTG, 43개 AGG, 33개 AAG, 5개 ATA, 및 3개 ATT 코돈을 포함하는 227개의 잠재적 개시 코돈을 함유한다 (서열 133).

신호 펩티드를 CD5 신호 펩티드로 대체한 Thy-1 가변 경쇄 ORF (서열 137)는 진정한 개시 코돈을 포함하는 8 ATG, 15 ATC, 6 ACG, 13 GTG, 5 TTG, 27 CTG, 14 AGG, 10 AAG, 3 ATA, 및 2 ATT 코돈을 포함하는 104개의 잠재적 개시 코돈을 함유한다. ATG 코돈을 ATC 코돈으로 변화시켜 메티오닌 (M)을 이소류신 (I)으로 아미노산 치환하는 변형을 행하였다 (서열 138). 또한, CTG 코돈을 CTC 코돈을 변화시키는 변형을 행하였다 (서열 139). ATG 코돈을 ATC 코돈으로 변이시켜 메티오닌 (M)을 이소류신 (I)으로 아미노산 치환하고 CTG 코돈을 CTC 코돈으로 변화시키는 또다른 변형을 행하였다 (서열 140). ATG 코돈을 ATC 코돈으로 변화시켜 메티오닌 (M)을 이소류신 (I)으로 아미노산 치환하고, CTG 코돈을 CTC 코돈으로 변화시키고, 3' 코돈을 CCC에서 GCT로 변화시켜 프롤린 (P)을 아르기닌 (R)으로 아미노산 치환함으로써 개시자 AUG의 환경을 개선시키는 또다른 변형을 행하였다 (서열 141).

다른 유기체로부터의 신호 펩티드를 마찬가지로 변이시켰다 (표 1 참조). 효모 및 포유동물 세포에서 기능하는 신호 펩티드에 대한 DNA 서열을 분석하고, 변이시켜 변이된 버젼을 생성하였다 (서열 145 내지 서열 156). 단백질에서 제거된 신호 펩티드에서, 인-프레임 ATG 코돈이 예컨대 ATT 또는 ATC로 변이되어 또다른 소수성 아미노산인 이소류신을 코딩할 수 있다는 것이 이해되어야 한다. 인간 모노클로날 항체로부터의 경쇄와 인-프레임(in frame)으로 융합된 이들 신호 서열을 함유하는 DNA 구조물을 생성할 수 있다. 여러 유기체 (예컨대 피치아 파스토리스(Pichia pastoris) 및 포유동물 세포주)에서의 발현시, 단백질 겔 및 웨스턴 검정을 사용하여 인간 경쇄 항체의 발현 수준을 체크할 수 있다.

HcRed 1

HcRed1은 최대 여기 및 방출이 각각 558 nm 및 618 nm +/- 4 nm에서 일어나는 원적외 형광 단백질을 코딩한다. 산호초 헤테락티스 크리스파(Heteractis crispa)로부터의 비형광 색소단백질에 대한 변이유발에 의해 HcRed1을 생성하였다. 이어서, HcRed1 코딩 서열을 포유동물 세포에서의 보다 많은 발현을 위해 인간 코돈-최적화하였다. 이 ORF는 진정한 개시 코돈을 포함하는 9개 ATG, 8개 ATC, 12개 ACG, 16개 GTG, 21개 CTG, 18개 AGG, 및 15개 AAG 코돈을 포함하는 99개의 잠재적 개시 코돈을 함유한다 (서열 134). HcRed1 ORF의 전부 및 부분 변형을 생성하였다 (각각 서열 135 및 서열 136).

에리스로포이에틴 (EPO)

인간 에리스로포이에틴 (EPO)은 귀한 치료제이다. 본원에 기재된 방법을 사용하여, 인간 EPO (이 단백질은 하기에 제공되며 GenBank 등록번호 NM_000799로 입수가능함)를 코딩하는 mRNA 서열을 최적화하여 이 mRNA 전사체 내의 다수 번역 개시 부위를 제거한다.

예시적인 인간 에리스로포이에틴 (EPO) 단백질은 하기 mRNA 전사체에 의해 코딩되며, 여기서 성숙 펩티드를 코딩하는 서열은 밑줄 표시되고, 모든 3개의 리딩 프레임 내 모든 잠재적 번역 개시 출발 부위는 볼드체로 표시되고, 메티오닌에 상응하는 표준 개시자 코돈은 대문자 표시되고, 티미딘 (t)이 우라실 (u)로 대체된다 (서열 111):

생성된 아미노산 서열을 보존하기 위해, 가능한 경우 침묵 또는 보존적 치환이 이루어진다. 단지 각각 하나의 코돈 (aug/atg) 및 (ugg/tgg)에 의해서만 코딩되는 메티오닌 및 트립토판의 경우에, 치환은 메티오닌 또는 트립토판을 코딩하는 서열을 유사한 물성의 아미노산을 코딩하는 서열로 대체한다. 보존적 아미노산 치환이 이루어지는 경우 중요하게 고려되는 물성으로는 측쇄 기하구조, 크기 및 분지; 소수성; 극성; 산성; 방향족 대 지방족 구조; 및 반 데르 발스(Van der Waals) 부피가 포함되나, 이들에 제한되는 것은 아니다. 예를 들어, 아미노산 류신 또는 이소류신이 메티오닌 대신 사용될 수 있는데, 이들 아미노산은 모두 유사하게 소수성, 비-극성이고 등가의 반 데르 발스 부피를 차지하기 때문이다. 따라서, 메티오닌을 류신 또는 이소류신으로 치환하는 것은 단백질 폴딩(folding)에 영향을 미치지 않을 것이다. 류신은 메티오닌 치환을 위한 바람직한 아미노산이다. 별법으로, 아미노산 티로신 또는 페닐알라닌이 트립토판 대신 사용될 수 있는데, 이들 아미노산은 모두 유사하게 방향족이고 등가의 반 데르 발스 부피를 차지하기 때문이다.

하기 서열은 인간 에리스로포이에틴 (EPO)을 코딩하는 변형된 mRNA 전사체의 예이며, 여기서 코딩 영역 내에 입증된 개시자 메티오닌 (뉴클레오티드 182 내지 184에 의해 코딩됨) 상류의 모든 잠재적 번역 개시 출발 부위 및 입증된 개시자 메티오닌 하류의 잠재적 번역 개시 출발 부위는 변이된다 (변이는 이탤릭체임) (서열 113).

에리스로포이에틴에 대한 비변형 오픈 리딩 프레임은 88개의 잠재적 개시 코돈을 함유한다 (진정한 개시 코돈을 포함하는 8개 ATG, 5개 ATC, 4개 ACG, 7개 GTG, 3개 TTG, 32개 CTG, 14개 AGG, 10개 AAG, 3개 ATA, 및 2개 ATT 코돈) (서열 112). 잠재적 개시 코돈 대부분의 제거에 의해 변형된 신호 펩티드 (서열 116), 신호 펩티드의 ATG 및 CTG의 제거에 의해 변형된 신호 펩티드 (서열 211), ATG, CTG 및 ACG 코돈의 제거로 인한 글루탐산 (E)에서 글루타민 (Q)으로의 아미노산 치환에 의해 변형된 신호 펩티드 (서열 118) 또는 히스티딘 (H)에서 아르기닌 (R)으로의 아미노산 치환에 의해 변형된 신호 펩티드 (서열 119)를 포함하는 변형이 이루어졌다.

실시예 2: mRNA 전사체 내 miRNA 결합 부위의 변형

표적 mRNA 전사체에 대한 마이크로RNA (miRNA)의 결합은 표적 mRNA 전사체의 분해를 유도하거나 표적 mRNA 전사체의 번역을 방지함으로써 번역 효율을 감소시킨다. 상업적으로 가치있는 인간 단백질을 코딩하는 mRNA 전사체의 번역 효율을 개선하기 위해, 표적 mRNA의 5' 선도 서열, 5' 비번역 영역 (UTR) 서열, 코딩 서열 및 3' 비번역 영역 (UTR) 서열 내의 모든 공지된 또는 예상된 miRNA 결합 부위가 먼저 확인하고, 이어서 변이 또는 변경시켜 miRNA 결합을 억제한다.

본 방법의 바람직한 측면에서, 성숙 miRNA 서열의 첫번째 8개 5'- 뉴클레오티드를 포함하는 시드 서열은 특이적으로 표적화된다. 시드 서열은 성숙 miRNA 서열의 5' 뉴클레오티드 1 내지 7 또는 2 내지 8을 포함한다. 따라서, 시드 서열은 본 방법의 목적을 위해 두 대안을 모두 포함한다. miRNA 시드 서열은 왓슨-크릭(Watson-Crick) 염기쌍 형성 규칙에 따라 결합하는 miRNA의 유일한 부분이기 때문에 기능적으로 중요하다. miRNA의 시드 서열 영역 내 결합의 절대적 상보성 없이, miRNA가 그의 표적 mRNA에 결합하는 것은 일어나지 않는다. 그러나, 대부분의 뉴클레오티드 쌍 형성과 달리, miRNA의 시드 서열은 구아닌 뉴클레오티드가 우라실 뉴클레오티드와 쌍을 형성하도록 (G:U 동요(wobble)로 공지됨) 표적 mRNA와 쌍을 형성할 수 있다.

예를 들어, 인간 에리스로포이에틴 (EPO)은 충분한 양으로 생산하기에 곤란한 귀한 치료제이다. 본 방법을 사용하여, 본 단백질 (GenBank 등록 번호 NM_000799)을 코딩하는 mRAN 서열의 서열을 최적화하여 miRNA 하향 조절을 억제한다. 픽타 웹 인터페이스(PicTar Web Interface) (pictar.mdc_berlin.de/cgi-bin/PicTar_vertebrate.cgi로 공중이 이용가능함)는 인간 miRNA hsa-miR-328 및 hsa-miR-122a가 인간 EPO를 코딩하는 mRNA를 표적화함을 예상하였다 (이들 miRNA의 성숙 및 시드 서열은 하기 표 2에 제공됨). 따라서, 예를 들어 uggagugu의 시드 서열을 갖는 hsa-miR-122a의 경우, hsa-miR-122a가 더이상 결합하지 않도록 하나 이상의 뉴클레오티드가 변이되고, 또다른 공지의 miRNA의 시드 서열은 생성되지 않는다. 결합을 방지하는 하나의 가능한 변이 hsa-miR-122a 시드 서열은 "uagagugu"이다. 이 변이된 시드 서열은 예를 들어 하기 표 2에 나타나지 않기 때문에 또다른 공지의 miRNA에 속할 가능성이 낮다.

유사하게, 픽타 웹 인터페이스는 인간 miRNA hsa-miR-149, hsa-let7f, hsa-let7c, hsa-let7b, hsa-let7g, hsa-let7a, hsa-miR-98, hsa-let7i, hsa-let7e 및 hsa-miR-26b가 인간 인터페론 베타 2 (또한 IL-6로서 공지됨, Genbank 등록 번호 NM_000600)를 코딩하는 mRNA를 표적화함을 예상하였다 (이들 miRNA의 성숙 및 시드 서열은 하기 표 2에 제공됨).

또한, miRNA 결합 부위는 1000개 미만의 염기 쌍 중 임의의 서열을 생어 인스티튜트(Sanger Institute)의 MiRNA:서열 데이타베이스 (microrna.sanger.ac.uk/sequences/search.shtml으로 공중이 이용가능함)에 입력함으로써 확인할 수 있다.

miR-183 결합 서열 (서열 59)을 변이시키고 (서열 142), 또한 FLAG 태그를 함유하는 CAT 유전자 (서열 143)에서와 같은 리포터 유전자의 코딩 서열 내로 삽입한다. 이로써 miR-183 결합 서열의 변이가 이루어진 항-FLAG 태그 항체 (서열 144)를 사용하여 웨스턴 블롯 분석에 의해 세포에서의 발현을 평가할 수 있다.

SEQUENCE LISTING <110> The Scripps Research Institute Mauro, Vincent P. Chappell, Stephen A. Zhou, Wei Edelman, Gerald M. <120> REENGINEERING MRNA PRIMARY STRUCTURE FOR ENHANCED PROTEIN PRODUCTION <130> 37651-503001WO / TSRI 1358.1 PCT / PRM0016P <150> US 61/155,049 <151> 2009-02-24 <160> 156 <170> PatentIn version 3.5 <210> 1 <211> 22 <212> RNA <213> human <400> 1 ugagguagua gguuguauag uu 22 <210> 2 <211> 22 <212> RNA <213> human <400> 2 ugagguagua gguugugugg uu 22 <210> 3 <211> 22 <212> RNA <213> human <400> 3 ugagguagua gguuguaugg uu 22 <210> 4 <211> 22 <212> RNA <213> human <400> 4 agagguagua gguugcauag uu 22 <210> 5 <211> 22 <212> RNA <213> human <400> 5 ugagguagga gguuguauag uu 22 <210> 6 <211> 22 <212> RNA <213> human <400> 6 ugagguagua gauuguauag uu 22 <210> 7 <211> 22 <212> RNA <213> human <400> 7 ugagguagua guuuguacag uu 22 <210> 8 <211> 22 <212> RNA <213> human <400> 8 ugagguagua guuugugcug uu 22 <210> 9 <211> 22 <212> RNA <213> human <400> 9 uggaauguaa agaaguaugu au 22 <210> 10 <211> 22 <212> RNA <213> human <400> 10 aacccguaga uccgaacuug ug 22 <210> 11 <211> 21 <212> RNA <213> human <400> 11 uacaguacug ugauaacuga a 21 <210> 12 <211> 23 <212> RNA <213> human <400> 12 agcagcauug uacagggcua uga 23 <210> 13 <211> 23 <212> RNA <213> human <400> 13 ucaaaugcuc agacuccugu ggu 23 <210> 14 <211> 23 <212> RNA <213> human <400> 14 aaaagugcuu acagugcagg uag 23 <210> 15 <211> 21 <212> RNA <213> human <400> 15 uaaagugcug acagugcaga u 21 <210> 16 <211> 23 <212> RNA <213> human <400> 16 agcagcauug uacagggcua uca 23 <210> 17 <211> 22 <212> RNA <213> human <400> 17 uggacggaga acugauaagg gu 22 <210> 18 <211> 23 <212> RNA <213> human <400> 18 uacccuguag aaccgaauuu gug 23 <210> 19 <211> 22 <212> RNA <213> human <400> 19 uggaguguga caaugguguu ug 22 <210> 20 <211> 20 <212> RNA <213> human <400> 20 uaaggcacgc ggugaaugcc 20 <210> 21 <211> 24 <212> RNA <213> human <400> 21 ucccugagac ccuuuaaccu guga 24 <210> 22 <211> 22 <212> RNA <213> human <400> 22 ucccugagac ccuaacuugu ga 22 <210> 23 <211> 22 <212> RNA <213> human <400> 23 ucguaccgug aguaauaaug cg 22 <210> 24 <211> 22 <212> RNA <213> human <400> 24 cugaagcuca gagggcucug au 22 <210> 25 <211> 21 <212> RNA <213> human <400> 25 ucacagugaa ccggucucuu u 21 <210> 26 <211> 21 <212> RNA <213> human <400> 26 cuuuuugcgg ucugggcuug c 21 <210> 27 <211> 22 <212> RNA <213> human <400> 27 cagugcaaug uuaaaagggc au 22 <210> 28 <211> 22 <212> RNA <213> human <400> 28 cagugcaaug augaaagggc au 22 <210> 29 <211> 22 <212> RNA <213> human <400> 29 uaacagucua cagccauggu cg 22 <210> 30 <211> 22 <212> RNA <213> human <400> 30 uuuggucccc uucaaccagc ug 22 <210> 31 <211> 22 <212> RNA <213> human <400> 31 uuuggucccc uucaaccagc ua 22 <210> 32 <211> 22 <212> RNA <213> human <400> 32 ugugacuggu ugaccagagg gg 22 <210> 33 <211> 23 <212> RNA <213> human <400> 33 uauggcuuuu uauuccuaug uga 23 <210> 34 <211> 23 <212> RNA <213> human <400> 34 uauggcuuuu cauuccuaug uga 23 <210> 35 <211> 23 <212> RNA <213> human <400> 35 acuccauuug uuuugaugau gga 23 <210> 36 <211> 23 <212> RNA <213> human <400> 36 uuauugcuua agaauacgcg uag 23 <210> 37 <211> 23 <212> RNA <213> human <400> 37 agcugguguu gugaaucagg ccg 23 <210> 38 <211> 22 <212> RNA <213> human <400> 38 ucuacagugc acgugucucc ag 22 <210> 39 <211> 22 <212> RNA <213> human <400> 39 cagugguuuu acccuauggu ag 22 <210> 40 <211> 22 <212> RNA <213> human <400> 40 uaacacuguc ugguaaagau gg 22 <210> 41 <211> 21 <212> RNA <213> Human <400> 41 cauaaaguag aaagcacuac u 21 <210> 42 <211> 21 <212> RNA <213> human <400> 42 ugagaugaag cacuguagcu c 21 <210> 43 <211> 20 <212> RNA <213> human <400> 43 uacaguauag augauguacu 20 <210> 44 <211> 23 <212> RNA <213> human <400> 44 guccaguuuu cccaggaauc ccu 23 <210> 45 <211> 22 <212> RNA <213> human <400> 45 ugagaacuga auuccauggg uu 22 <210> 46 <211> 20 <212> RNA <213> human <400> 46 guguguggaa augcuucugc 20 <210> 47 <211> 22 <212> RNA <213> human <400> 47 ucagugcacu acagaacuuu gu 22 <210> 48 <211> 22 <212> RNA <213> human <400> 48 ucagugcauc acagaacuuu gu 22 <210> 49 <211> 23 <212> RNA <213> human <400> 49 ucuggcuccg ugucuucacu ccc 23 <210> 50 <211> 22 <212> RNA <213> human <400> 50 ucucccaacc cuuguaccag ug 22 <210> 51 <211> 21 <212> RNA <213> human <400> 51 ucgaggagcu cacagucuag u 21 <210> 52 <211> 21 <212> RNA <213> human <400> 52 ucagugcaug acagaacuug g 21 <210> 53 <211> 22 <212> RNA <213> human <400> 53 uugcauaguc acaaaaguga uc 22 <210> 54 <211> 22 <212> RNA <213> human <400> 54 uagguuaucc guguugccuu cg 22 <210> 55 <211> 23 <212> RNA <213> human <400> 55 uuaaugcuaa ucgugauagg ggu 23 <210> 56 <211> 22 <212> RNA <213> human <400> 56 uagcagcaca uaaugguuug ug 22 <210> 57 <211> 22 <212> RNA <213> human <400> 57 uagcagcaca ucaugguuua ca 22 <210> 58 <211> 22 <212> RNA <213> human <400> 58 uagcagcacg uaaauauugg cg 22 <210> 59 <211> 24 <212> RNA <213> human <400> 59 aaagcgaauu cucacaggcc auca 24 <210> 60 <211> 23 <212> RNA <213> human <400> 60 caaagugcuu acagugcagg uag 23 <210> 61 <211> 23 <212> RNA <213> human <400> 61 uaaggugcau cuagugcaga uag 23 <210> 62 <211> 23 <212> RNA <213> human <400> 62 aacauucaac gcugucggug agu 23 <210> 63 <211> 23 <212> RNA <213> human <400> 63 aacauucauu gcugucggug ggu 23 <210> 64 <211> 22 <212> RNA <213> human <400> 64 aaccaucgac cguugagugg ac 22 <210> 65 <211> 24 <212> RNA <213> human <400> 65 uuuggcaaug guagaacuca cacu 24 <210> 66 <211> 22 <212> RNA <213> human <400> 66 uauggcacug guagaauuca cu 22 <210> 67 <211> 22 <212> RNA <213> human <400> 67 uggacggaga acugauaagg gu 22 <210> 68 <211> 22 <212> RNA <213> human <400> 68 uggagagaaa ggcaguuccu ga 22 <210> 69 <211> 22 <212> RNA <213> human <400> 69 caaagaauuc uccuuuuggg cu 22 <210> 70 <211> 22 <212> RNA <213> human <400> 70 ucgugucuug uguugcagcc gg 22 <210> 71 <211> 21 <212> RNA <213> human <400> 71 caucccuugc augguggagg g 21 <210> 72 <211> 22 <212> RNA <213> human <400> 72 ugauauguuu gauauauuag gu 22 <210> 73 <211> 23 <212> RNA <213> human <400> 73 caacggaauc ccaaaagcag cug 23 <210> 74 <211> 21 <212> RNA <213> human <400> 74 cugaccuaug aauugacagc c 21 <210> 75 <211> 22 <212> RNA <213> human <400> 75 ugggucuuug cgggcgagau ga 22 <210> 76 <211> 22 <212> RNA <213> human <400> 76 uguaacagca acuccaugug ga 22 <210> 77 <211> 21 <212> RNA <213> human <400> 77 uagcagcaca gaaauauugg c 21 <210> 78 <211> 22 <212> RNA <213> human <400> 78 uagguaguuu cauguuguug gg 22 <210> 79 <211> 22 <212> RNA <213> human <400> 79 uagguaguuu ccuguuguug gg 22 <210> 80 <211> 22 <212> RNA <213> human <400> 80 uucaccaccu ucuccaccca gc 22 <210> 81 <211> 22 <212> RNA <213> human <400> 81 gguccagagg ggagauaggu uc 22 <210> 82 <211> 23 <212> RNA <213> human <400> 82 cccaguguuc agacuaccug uuc 23 <210> 83 <211> 23 <212> RNA <213> human <400> 83 cccaguguuu agacuaucug uuc 23 <210> 84 <211> 22 <212> RNA <213> human <400> 84 aguuuugcau aguugcacua ca 22 <210> 85 <211> 23 <212> RNA <213> human <400> 85 ugugcaaauc caugcaaaac uga 23 <210> 86 <211> 23 <212> RNA <213> human <400> 86 uaaagugcuu auagugcagg uag 23 <210> 87 <211> 22 <212> RNA <213> human <400> 87 uaacacuguc ugguaacgau gu 22 <210> 88 <211> 22 <212> RNA <213> human <400> 88 uaauacugcc ugguaaugau ga 22 <210> 89 <211> 23 <212> RNA <213> human <400> 89 uaauacugcc ggguaaugau gga 23 <210> 90 <211> 22 <212> RNA <213> human <400> 90 gugaaauguu uaggaccacu ag 22 <210> 91 <211> 22 <212> RNA <213> human <400> 91 uucccuuugu cauccuaugc cu 22 <210> 92 <211> 22 <212> RNA <213> human <400> 92 uccuucauuc caccggaguc ug 22 <210> 93 <211> 22 <212> RNA <213> human <400> 93 uggaauguaa ggaagugugu gg 22 <210> 94 <211> 22 <212> RNA <213> human <400> 94 auaagacgag caaaaagcuu gu 22 <210> 95 <211> 22 <212> RNA <213> human <400> 95 uagcuuauca gacugauguu ga 22 <210> 96 <211> 22 <212> RNA <213> human <400> 96 cugugcgugu gacagcggcu ga 22 <210> 97 <211> 22 <212> RNA <213> human <400> 97 uucccuuugu cauccuucgc cu 22 <210> 98 <211> 21 <212> RNA <213> human <400> 98 uaacagucuc cagucacggc c 21 <210> 99 <211> 22 <212> RNA <213> human <400> 99 acagcaggca cagacaggca gu 22 <210> 100 <211> 21 <212> RNA <213> human <400> 100 augaccuaug aauugacaga c 21 <210> 101 <211> 22 <212> RNA <213> human <400> 101 uaaucucagc uggcaacugu ga 22 <210> 102 <211> 23 <212> RNA <213> human <400> 102 uacugcauca ggaacugauu gga 23 <210> 103 <211> 21 <212> RNA <213> human <400> 103 uugugcuuga ucuaaccaug u 21 <210> 104 <211> 21 <212> RNA <213> human <400> 104 ugauugucca aacgcaauuc u 21 <210> 105 <211> 22 <212> RNA <213> human <400> 105 aagcugccag uugaagaacu gu 22 <210> 106 <211> 21 <212> RNA <213> human <400> 106 ccacaccgua ucugacacuu u 21 <210> 107 <211> 23 <212> RNA <213> human <400> 107 agcuacauug ucugcugggu uuc 23 <210> 108 <211> 21 <212> RNA <213> human <400> 108 agcuacaucu ggcuacuggg u 21 <210> 109 <211> 22 <212> RNA <213> human <400> 109 ugucaguuug ucaaauaccc ca 22 <210> 110 <211> 21 <212> RNA <213> human <400> 110 caagucacua gugguuccgu u 21 <210> 111 <211> 1340 <212> DNA <213> Human <220> <223> EPO <400> 111 cccggagccg gaccggggcc accgcgcccg ctctgctccg acaccgcgcc ccctggacag 60 ccgccctctc ctccaggccc gtggggctgg ccctgcaccg ccgagcttcc cgggatgagg 120 gcccccggtg tggtcacccg gcgcgcccca ggtcgctgag ggaccccggc caggcgcgga 180 gatgggggtg cacgaatgtc ctgcctggct gtggcttctc ctgtccctgc tgtcgctccc 240 tctgggcctc ccagtcctgg gcgccccacc acgcctcatc tgtgacagcc gagtcctgga 300 gaggtacctc ttggaggcca aggaggccga gaatatcacg acgggctgtg ctgaacactg 360 cagcttgaat gagaatatca ctgtcccaga caccaaagtt aatttctatg cctggaagag 420 gatggaggtc gggcagcagg ccgtagaagt ctggcagggc ctggccctgc tgtcggaagc 480 tgtcctgcgg ggccaggccc tgttggtcaa ctcttcccag ccgtgggagc ccctgcagct 540 gcatgtggat aaagccgtca gtggccttcg cagcctcacc actctgcttc gggctctggg 600 agcccagaag gaagccatct cccctccaga tgcggcctca gctgctccac tccgaacaat 660 cactgctgac actttccgca aactcttccg agtctactcc aatttcctcc ggggaaagct 720 gaagctgtac acaggggagg cctgcaggac aggggacaga tgaccaggtg tgtccacctg 780 ggcatatcca ccacctccct caccaacatt gcttgtgcca caccctcccc cgccactcct 840 gaaccccgtc gaggggctct cagctcagcg ccagcctgtc ccatggacac tccagtgcca 900 gcaatgacat ctcaggggcc agaggaactg tccagagagc aactctgaga tctaaggatg 960 tcacagggcc aacttgaggg cccagagcag gaagcattca gagagcagct ttaaactcag 1020 ggacagagcc atgctgggaa gacgcctgag ctcactcggc accctgcaaa atttgatgcc 1080 aggacacgct ttggaggcga tttacctgtt ttcgcaccta ccatcaggga caggatgacc 1140 tggagaactt aggtggcaag ctgtgacttc tccaggtctc acgggcatgg gcactccctt 1200 ggtggcaaga gcccccttga caccggggtg gtgggaacca tgaagacagg atgggggctg 1260 gcctctggct ctcatggggt ccaagttttg tgtattcttc aacctcattg acaagaactg 1320 aaaccaccaa aaaaaaaaaa 1340 <210> 112 <211> 582 <212> DNA <213> human <220> <223> EPO ORF <400> 112 atgggggtgc acgaatgtcc tgcctggctg tggcttctcc tgtccctgct gtcgctccct 60 ctgggcctcc cagtcctggg cgccccacca cgcctcatct gtgacagccg agtcctggag 120 aggtacctct tggaggccaa ggaggccgag aatatcacga cgggctgtgc tgaacactgc 180 agcttgaatg agaatatcac tgtcccagac accaaagtta atttctatgc ctggaagagg 240 atggaggtcg ggcagcaggc cgtagaagtc tggcagggcc tggccctgct gtcggaagct 300 gtcctgcggg gccaggccct gttggtcaac tcttcccagc cgtgggagcc cctgcagctg 360 catgtggata aagccgtcag tggccttcgc agcctcacca ctctgcttcg ggctctggga 420 gcccagaagg aagccatctc ccctccagat gcggcctcag ctgctccact ccgaacaatc 480 actgctgaca ctttccgcaa actcttccga gtctactcca atttcctccg gggaaagctg 540 aagctgtaca caggggaggc ctgcaggaca ggggacagat ga 582 <210> 113 <211> 1340 <212> DNA <213> human <220> <223> EPO modified <400> 113 cccggagccg gaccggggcc accgcgcccg ctctactccg acaccgcgcc ccctagacag 60 ccgccctctc ctccaggccc gtagggctag ccctacaccg ccgagcttcc cgggttaagg 120 gcccccggtc tagtcacccg gcgcgcccca ggtcgctaag ggaccccggc caggcgcgga 180 gatgggggta cacaattatc ctacctagct ctagcttctc ctatccctac tatcgctccc 240 tctaggcctc ccagtcctag gcgccccacc acacctcctc tttaacagcc gagtcctaga 300 gaggtacctc ttagaggcca aggaggccga gaatatcacg acgggctgtg ctgaacactg 360 cagcttgatt aagattttaa ctatcccaga caccaaagtt attatcttta cctagaagag 420 gttagaggtc gggcagcagg ccgtagaagt ctagcagggc ctagccctac tatcggaagc 480 tgtcctacgg ggccaggccc tattagtcaa ctcttcccag ccgtaggagc ccctacagct 540 gcctctagtt aaagccgtca gtagccttcg cagcctcacc actctacttc gggctctagg 600 agcccagaag gaagccctct cccctccagt tacggcctca gctactccac tccgaacaat 660 cactactaac actttccgca aactcttccg agtctactcc aatatcctcc ggggaaagct 720 gaagctatac acaggggagg cctacaggac aggggacagt taaccagttt tatccaccta 780 ggcttttaca ccacctccct caccaactta ccttttacca caccctcccc cgccactcct 840 gaaccccgtc gaggggctct cagctcagcg ccagcctatc ccttagacac tccagtacca 900 gcattaactt atcaggggcc agaggaacta tccagagagc aactctaagt tataaggtta 960 tcacagggcc aacttaaggg cccagagcag gaagcttaca gagagcagct ttaaactcag 1020 ggacagagcc ttactaggaa gacacctaag ctcactcggc accctacaaa ttttattacc 1080 aggacacact ttagaggcgt tatacctatt ttcgcaccta ccttaaggga caggttaacc 1140 tggagaactt aggtagcaag ctctcacttc tccaggtctc acaggcttag gcactccctt 1200 ggtagcaaga gcccccttaa caccggggta gtaggaacct taaagacagg ttaggggcta 1260 gcctctagct ctcttagggt ccaagttctt tatttacttc aacctcttac acaagaacta 1320 aaaccaccaa aaaaaaaaaa 1340 <210> 114 <211> 21 <212> RNA <213> human <400> 114 uucaaguaau ucaggauagg u 21 <210> 115 <211> 582 <212> DNA <213> human <220> <223> EPO ORF modified <400> 115 atgggggtcc acgagtgtcc cgcttggctt tggcttctcc tctccctcct ctcgctccct 60 ctcggcctcc cagtcctcgg cgccccaccc cgcctcattt gcgacagccg agtcctcgag 120 aggtacctcc tagaggccaa ggaggccgag aacatcacaa ctggttgcgc cgaacattgc 180 agccttaacg agaacatcac agtcccagac accaaagtta acttctacgc ttggaagcgg 240 atggaggtcg ggcagcaggc cgtagaggtt tggcagggcc tcgccctcct ctcggaagcc 300 gtcctccggg gccaggccct cctagtcaac tcttcccagc cgtgggagcc cctccagctc 360 cacgtcgaca aagccgtcag cggccttcgc agcctcacca ctctccttcg ggctctcgga 420 gcccagaagg aagccatctc ccctccagac gcggcctcag ccgctccact ccgaacaatc 480 acagccgaca ctttccgcaa actcttccga gtctactcca acttcctccg gggaaagctc 540 aagctctaca caggggaggc ttgcaggaca ggggaccgtt ga 582 <210> 116 <211> 582 <212> DNA <213> human <220> <223> EPO ORF modified signal peptide <400> 116 atgggggtcc acgagtgtcc cgcttggctt tggcttctcc tctccctcct ctcgctccct 60 ctcggcctcc cagtcctcgg cgccccacca cgcctcatct gtgacagccg agtcctggag 120 aggtacctct tggaggccaa ggaggccgag aatatcacga cgggctgtgc tgaacactgc 180 agcttgaatg agaatatcac tgtcccagac accaaagtta atttctatgc ctggaagagg 240 atggaggtcg ggcagcaggc cgtagaagtc tggcagggcc tggccctgct gtcggaagct 300 gtcctgcggg gccaggccct gttggtcaac tcttcccagc cgtgggagcc cctgcagctg 360 catgtggata aagccgtcag tggccttcgc agcctcacca ctctgcttcg ggctctggga 420 gcccagaagg aagccatctc ccctccagat gcggcctcag ctgctccact ccgaacaatc 480 actgctgaca ctttccgcaa actcttccga gtctactcca atttcctccg gggaaagctg 540 aagctgtaca caggggaggc ctgcaggaca ggggacagat ga 582 <210> 117 <211> 582 <212> DNA <213> human <220> <223> EPO ORF modified signal peptide <400> 117 atgggggtgc acgagtgtcc cgcttggctt tggcttctcc tctccctcct ctcgctccct 60 ctcggcctcc cagtcctcgg cgccccacca cgcctcatct gtgacagccg agtcctggag 120 aggtacctct tggaggccaa ggaggccgag aatatcacga cgggctgtgc tgaacactgc 180 agcttgaatg agaatatcac tgtcccagac accaaagtta atttctatgc ctggaagagg 240 atggaggtcg ggcagcaggc cgtagaagtc tggcagggcc tggccctgct gtcggaagct 300 gtcctgcggg gccaggccct gttggtcaac tcttcccagc cgtgggagcc cctgcagctg 360 catgtggata aagccgtcag tggccttcgc agcctcacca ctctgcttcg ggctctggga 420 gcccagaagg aagccatctc ccctccagat gcggcctcag ctgctccact ccgaacaatc 480 actgctgaca ctttccgcaa actcttccga gtctactcca atttcctccg gggaaagctg 540 aagctgtaca caggggaggc ctgcaggaca ggggacagat ga 582 <210> 118 <211> 582 <212> DNA <213> human <220> <223> EPO ORF modified signal peptide <400> 118 atgggggtgc accagtgtcc cgcttggctt tggcttctcc tctccctcct ctcgctccct 60 ctcggcctcc cagtcctcgg cgccccacca cgcctcatct gtgacagccg agtcctggag 120 aggtacctct tggaggccaa ggaggccgag aatatcacga cgggctgtgc tgaacactgc 180 agcttgaatg agaatatcac tgtcccagac accaaagtta atttctatgc ctggaagagg 240 atggaggtcg ggcagcaggc cgtagaagtc tggcagggcc tggccctgct gtcggaagct 300 gtcctgcggg gccaggccct gttggtcaac tcttcccagc cgtgggagcc cctgcagctg 360 catgtggata aagccgtcag tggccttcgc agcctcacca ctctgcttcg ggctctggga 420 gcccagaagg aagccatctc ccctccagat gcggcctcag ctgctccact ccgaacaatc 480 actgctgaca ctttccgcaa actcttccga gtctactcca atttcctccg gggaaagctg 540 aagctgtaca caggggaggc ctgcaggaca ggggacagat ga 582 <210> 119 <211> 582 <212> DNA <213> human <220> <223> EPO ORF modified signal peptide <400> 119 atgggggtga gggagtgtcc cgcttggctt tggcttctcc tctccctcct ctcgctccct 60 ctcggcctcc cagtcctcgg cgccccacca cgcctcatct gtgacagccg agtcctggag 120 aggtacctct tggaggccaa ggaggccgag aatatcacga cgggctgtgc tgaacactgc 180 agcttgaatg agaatatcac tgtcccagac accaaagtta atttctatgc ctggaagagg 240 atggaggtcg ggcagcaggc cgtagaagtc tggcagggcc tggccctgct gtcggaagct 300 gtcctgcggg gccaggccct gttggtcaac tcttcccagc cgtgggagcc cctgcagctg 360 catgtggata aagccgtcag tggccttcgc agcctcacca ctctgcttcg ggctctggga 420 gcccagaagg aagccatctc ccctccagat gcggcctcag ctgctccact ccgaacaatc 480 actgctgaca ctttccgcaa actcttccga gtctactcca atttcctccg gggaaagctg 540 aagctgtaca caggggaggc ctgcaggaca ggggacagat ga 582 <210> 120 <211> 660 <212> DNA <213> E. coli <220> <223> Reporter vector pCAT<R>3-Control vector <400> 120 atggagaaaa aaatcactgg atataccacc gttgatatat cccaatggca tcgtaaagaa 60 cattttgagg catttcagtc agttgctcaa tgtacctata accagaccgt tcagctggat 120 attacggcct ttttaaagac cgtaaagaaa aataagcaca agttttatcc ggcctttatt 180 cacattcttg cccgcctgat gaatgctcat ccggaattcc gtatggcaat gaaagacggt 240 gagctggtga tatgggatag tgttcaccct tgttacaccg ttttccatga gcaaactgaa 300 acgttttcat cgctctggag tgaataccac gacgatttcc ggcagtttct acacatatat 360 tcgcaagatg tggcgtgtta cggtgaaaac ctggcctatt tccctaaagg gtttattgag 420 aatatgtttt tcgtctcagc caatccctgg gtgagtttca ccagttttga tttaaacgtg 480 gccaatatgg acaacttctt cgcccccgtt ttcaccatgg gcaaatatta tacgcaaggc 540 gacaaggtgc tgatgccgct ggcgattcag gttcatcatg ccgtttgtga tggcttccat 600 gtcggcagaa tgcttaatga attacaacag tactgcgatg agtggcaggg cggggcgtaa 660 <210> 121 <211> 660 <212> DNA <213> E. coli <220> <223> modified reporter vector pCAT<R>3-Control vector <400> 121 atggagaaaa aaatcacagg ctataccacc gtcgacataa gccagtggca ccgtaaagaa 60 cacttcgagg cttttcagtc agtcgctcag tgtacctaca accagaccgt tcagctcgac 120 atcacagcct ttttaaaaac cgtaaaaaaa aacaaacaca agttttaccc ggcctttatc 180 cacatcctcg cccgcctgat gaacgctcac ccggagttcc gtatggcaat gaaagacggg 240 gagctcgtca tctgggacag cgttcacccc tgttacaccg ttttccacga gcaaacagaa 300 actttttctt cgctttggtc agagtaccac gacgacttcc ggcagtttct acacatctac 360 tcgcaagacg tcgcctgtta cggggaaaac ctcgcctact tccctaaagg gtttatcgag 420 aacatgtttt tcgtctcagc caacccctgg gtcagtttca ccagtttcga cttaaacgta 480 gccaacatgg acaacttctt cgcccccgtt ttcaccatgg gcaagtacta cactcaaggc 540 gacaaagtcc tcatgccgct cgcgatccag gttcaccacg ccgtctgcga cggcttccac 600 gtcggccgga tgcttaacga gttacaacag tactgcgacg agtggcaggg cggggcgtaa 660 <210> 122 <211> 660 <212> DNA <213> E. coli <220> <223> partially modified reporter vector pCAT<R>3-Control vector <400> 122 atggagaaaa aaatcacagg ctataccacc gtcgacataa gccagtggca ccgtaaagaa 60 cacttcgagg cttttcagtc agtcgctcag tgtacctaca accagaccgt tcagctggat 120 attacggcct ttttaaagac cgtaaagaaa aataagcaca agttttatcc ggcctttatt 180 cacattcttg cccgcctgat gaatgctcat ccggaattcc gtatggcaat gaaagacggt 240 gagctggtga tatgggatag tgttcaccct tgttacaccg ttttccatga gcaaactgaa 300 acgttttcat cgctctggag tgaataccac gacgatttcc ggcagtttct acacatatat 360 tcgcaagatg tggcgtgtta cggtgaaaac ctggcctatt tccctaaagg gtttattgag 420 aatatgtttt tcgtctcagc caatccctgg gtgagtttca ccagttttga tttaaacgtg 480 gccaatatgg acaacttctt cgcccccgtt ttcaccatgg gcaaatatta tacgcaaggc 540 gacaaggtgc tgatgccgct ggcgattcag gttcatcatg ccgtttgtga tggcttccat 600 gtcggcagaa tgcttaatga attacaacag tactgcgatg agtggcaggg cggggcgtaa 660 <210> 123 <211> 65 <212> DNA <213> human <220> <223> CD5 signal peptide sequence <400> 123 atgcccatgg ggtctctgca accgctggcc accttgtacc tgctggggat gctggtcgct 60 tccgt 65 <210> 124 <211> 65 <212> DNA <213> human <220> <223> CD5 signal peptide sequence modified <400> 124 atgcccatcg ggtctctgca accgctggcc accttgtacc tgctggggat cctggtcgct 60 tccgt 65 <210> 125 <211> 65 <212> DNA <213> human <220> <223> CD5 signal peptide sequence modified <400> 125 atgcccatgg ggtctctcca accgctcgcc accttgtacc tcctcgggat gctcgtcgct 60 tccgt 65 <210> 126 <211> 65 <212> DNA <213> human <220> <223> CD5 signal peptide sequence modified <400> 126 atgcccatcg ggtctctcca accgctcgcc accttgtacc tcctcgggat cctcgtcgct 60 tccgt 65 <210> 127 <211> 65 <212> DNA <213> human <220> <223> CD5 signal peptide sequence modified <400> 127 atggctatcg ggtctctcca accgctcgcc accttgtacc tcctcgggat cctcgtcgct 60 tccgt 65 <210> 128 <211> 738 <212> DNA <213> human <220> <223> Anti Thy-VL ORF containing light chain signal peptide 1 <400> 128 atggacatga gggtccccgc tcagctcctg gggctcctgc tgctctggct cccaggtgcc 60 agatgtgata tcctcgtgat gacccagtct ccagtcaccc tgtctttgtc ttcaggggaa 120 agagccaccc tctcctgcag ggccagtcag agtattagta actccttagc ctggtaccaa 180 cagaaacctg gcctggctcc caggctcctc atctatgatg catccaacag ggccactggc 240 gtcccagcca ggttcagtgg cagtgggtct gggacagact tcaatctcac catcagcagc 300 ttcaatctca ccatcagcag cctagaccct gaagatgttg cagtgtatta ctgtcaccag 360 cgtagcaact ggcctccttt cactttcggc ggagggacca aggtggagat caaacgtacg 420 gtggctgcac catctgtctt catcttcccg ccatctgatg agcagttgaa atctggaact 480 gcctctgttg tgtgcctgct gaataacttc tatcccagag aggccaaagt acagtggaag 540 gtggataacg ccctccaatc gggtaactcc caggagagtg tcacagagca ggacagcaag 600 gacagcacct acagcctcag cagcaccctg acgctgagca aagcagacta cgagaaacac 660 aaagtctacg cctgcgaagt cacccatcag ggcctgagct cgcccgtcac aaagagcttc 720 aacaggggag agtgttag 738 <210> 129 <211> 738 <212> DNA <213> human <220> <223> Anti Thy-VL ORF containing light chain signal peptide 1mod <400> 129 atggacatca gggtccccgc tcagctcctc gggctcctcc tcctttggct cccaggtgcc 60 aggtgtgata tcctcgtgat gacccagtct ccagtcaccc tgtctttgtc ttcaggggaa 120 agagccaccc tctcctgcag ggccagtcag agtattagta actccttagc ctggtaccaa 180 cagaaacctg gcctggctcc caggctcctc atctatgatg catccaacag ggccactggc 240 gtcccagcca ggttcagtgg cagtgggtct gggacagact tcaatctcac catcagcagc 300 ttcaatctca ccatcagcag cctagaccct gaagatgttg cagtgtatta ctgtcaccag 360 cgtagcaact ggcctccttt cactttcggc ggagggacca aggtggagat caaacgtacg 420 gtggctgcac catctgtctt catcttcccg ccatctgatg agcagttgaa atctggaact 480 gcctctgttg tgtgcctgct gaataacttc tatcccagag aggccaaagt acagtggaag 540 gtggataacg ccctccaatc gggtaactcc caggagagtg tcacagagca ggacagcaag 600 gacagcacct acagcctcag cagcaccctg acgctgagca aagcagacta cgagaaacac 660 aaagtctacg cctgcgaagt cacccatcag ggcctgagct cgcccgtcac aaagagcttc 720 aacaggggag agtgttag 738 <210> 130 <211> 732 <212> DNA <213> human <220> <223> Anti Thy-VL ORF containing light chain signal peptide 2 <400> 130 atgagggtcc ccgcgctgct cctggggctg ctaatgctct ggatacctgg atctagtgca 60 gatatcctcg tgatgaccca gtctccagtc accctgtctt tgtcttcagg ggaaagagcc 120 accctctcct gcagggccag tcagagtatt agtaactcct tagcctggta ccaacagaaa 180 cctggcctgg ctcccaggct cctcatctat gatgcatcca acagggccac tggcgtccca 240 gccaggttca gtggcagtgg gtctgggaca gacttcaatc tcaccatcag cagcttcaat 300 ctcaccatca gcagcctaga ccctgaagat gttgcagtgt attactgtca ccagcgtagc 360 aactggcctc ctttcacttt cggcggaggg accaaggtgg agatcaaacg tacggtggct 420 gcaccatctg tcttcatctt cccgccatct gatgagcagt tgaaatctgg aactgcctct 480 gttgtgtgcc tgctgaataa cttctatccc agagaggcca aagtacagtg gaaggtggat 540 aacgccctcc aatcgggtaa ctcccaggag agtgtcacag agcaggacag caaggacagc 600 acctacagcc tcagcagcac cctgacgctg agcaaagcag actacgagaa acacaaagtc 660 tacgcctgcg aagtcaccca tcagggcctg agctcgcccg tcacaaagag cttcaacagg 720 ggagagtgtt ag 732 <210> 131 <211> 1640 <212> DNA <213> human <220> <223> Anti Thy-VH containing heavy chain signal peptide 1 <400> 131 atggactgga cctggaggtt cctctttgtg gtggcagcag ctacaggtgt ccagtcccag 60 gtgcaattgc tcgaggagtc gggggctgag ttgaagaagc ctggggcctc agtgaaggtc 120 tcctgcaagg cttctggata caccttcacc gcctactaca tacactgggt gcgtcaggcc 180 cctggacaag ggcttgagtg gatgggatgg atcaacccta acagtggtgg cacaaactat 240 gcacagaagt ttcagggcag ggtcaccatg accagggaca cgtccagcag cacagcctac 300 atggacctga gcaggctgac atctgacgac acggccgtct attactgtgc gcgagaaaat 360 ggtcctttaa acaccgcctt cttctacggt ttggacgtct ggggccaagg gacactagtc 420 accgtctcct cagcctccac caagggccca tcggtcttcc ccctggcacc ctcctccaag 480 agcacctctg ggggcacagc ggccctgggc tgcctggtca aggactactt ccccgaaccg 540 gtgacggtgt cgtggaactc aggcgccctg accagcggcg tgcacacctt cccggctgtc 600 ctacagtcct caggactcta ctccctcagc agcgtggtga ccgtgccctc cagcagcttg 660 ggcacccaga cctacatctg caacgtgaat cacaagccca gcaacaccaa ggtcgacaag 720 aaagttgagc ccaaatcttc tgacaaaact cacacatgcc caccgtgccc aggtaagcca 780 gcccaggcct cgccctccag ctcaaggcgg gacaggtgcc ctagagtagc ctgcatccag 840 ggacaggccc cagccgggtg ctgacacgtc cacctccatc tcttcctcag cacctgaact 900 cctgggggga ccgtcagtct tcctcttccc cccaaaaccc aaggacaccc tcatgatctc 960 ccggacccct gaggtcacat gcgtggtggt ggacgtgagc cacgaagacc ctgaggtcaa 1020 gttcaactgg tacgtggacg gcgtggaggt gcataatgcc aagacaaagc cgcgggagga 1080 gcagtacaac agcacgtacc gtgtggtcag cgtcctcacc gtcctgcacc aggactggct 1140 gaatggcaag gagtacaagt gcaaggtctc caacaaagcc ctcccagccc ccatcgagaa 1200 aaccatctcc aaagccaaag gtgggacccg tggggtgcga gggccacatg gacagaggcc 1260 ggctcggccc accctctgcc ctgagagtga ccgctgtacc aacctctgtc cctacagggc 1320 agccccgaga accacaggtg tacaccctgc ccccatcacg ggaggagatg accaagaacc 1380 aggtcagcct gacctgcctg gtcaaaggct tctatcccag cgacatcgcc gtggagtggg 1440 agagcaatgg gcagccggag aacaactaca agaccacgcc tcccgtgctg gactccgacg 1500 gctccttctt cctctatagc aagctcaccg tggacaagag caggtggcag caggggaacg 1560 tcttctcatg ctccgtgatg catgaggctc tgcacaacca ctacacgcag aagagcctct 1620 ccctgtcccc gggtaaataa 1640 <210> 132 <211> 1640 <212> DNA <213> human <220> <223> Anti Thy-VH containing heavy chain signal peptide 1 mod <400> 132 atggattgga cttggaggtt cctctttgtg gtggcagcag ctacaggtgt ccagtcccag 60 gtgcaattgc tcgaggagtc gggggctgag ttgaagaagc ctggggcctc agtgaaggtc 120 tcctgcaagg cttctggata caccttcacc gcctactaca tacactgggt gcgtcaggcc 180 cctggacaag ggcttgagtg gatgggatgg atcaacccta acagtggtgg cacaaactat 240 gcacagaagt ttcagggcag ggtcaccatg accagggaca cgtccagcag cacagcctac 300 atggacctga gcaggctgac atctgacgac acggccgtct attactgtgc gcgagaaaat 360 ggtcctttaa acaccgcctt cttctacggt ttggacgtct ggggccaagg gacactagtc 420 accgtctcct cagcctccac caagggccca tcggtcttcc ccctggcacc ctcctccaag 480 agcacctctg ggggcacagc ggccctgggc tgcctggtca aggactactt ccccgaaccg 540 gtgacggtgt cgtggaactc aggcgccctg accagcggcg tgcacacctt cccggctgtc 600 ctacagtcct caggactcta ctccctcagc agcgtggtga ccgtgccctc cagcagcttg 660 ggcacccaga cctacatctg caacgtgaat cacaagccca gcaacaccaa ggtcgacaag 720 aaagttgagc ccaaatcttc tgacaaaact cacacatgcc caccgtgccc aggtaagcca 780 gcccaggcct cgccctccag ctcaaggcgg gacaggtgcc ctagagtagc ctgcatccag 840 ggacaggccc cagccgggtg ctgacacgtc cacctccatc tcttcctcag cacctgaact 900 cctgggggga ccgtcagtct tcctcttccc cccaaaaccc aaggacaccc tcatgatctc 960 ccggacccct gaggtcacat gcgtggtggt ggacgtgagc cacgaagacc ctgaggtcaa 1020 gttcaactgg tacgtggacg gcgtggaggt gcataatgcc aagacaaagc cgcgggagga 1080 gcagtacaac agcacgtacc gtgtggtcag cgtcctcacc gtcctgcacc aggactggct 1140 gaatggcaag gagtacaagt gcaaggtctc caacaaagcc ctcccagccc ccatcgagaa 1200 aaccatctcc aaagccaaag gtgggacccg tggggtgcga gggccacatg gacagaggcc 1260 ggctcggccc accctctgcc ctgagagtga ccgctgtacc aacctctgtc cctacagggc 1320 agccccgaga accacaggtg tacaccctgc ccccatcacg ggaggagatg accaagaacc 1380 aggtcagcct gacctgcctg gtcaaaggct tctatcccag cgacatcgcc gtggagtggg 1440 agagcaatgg gcagccggag aacaactaca agaccacgcc tcccgtgctg gactccgacg 1500 gctccttctt cctctatagc aagctcaccg tggacaagag caggtggcag caggggaacg 1560 tcttctcatg ctccgtgatg catgaggctc tgcacaacca ctacacgcag aagagcctct 1620 ccctgtcccc gggtaaataa 1640 <210> 133 <211> 1640 <212> DNA <213> human <220> <223> Anti Thy-VH containing heavy chain signal peptide 2 <400> 133 atggattgga cttggaggtt cctctttgtg gtggcagcag ctacaggtgt ccagtcccag 60 gtgcaattgc tcgaggagtc gggggctgag ttgaagaagc ctggggcctc agtgaaggtc 120 tcctgcaagg cttctggata caccttcacc gcctactaca tacactgggt gcgtcaggcc 180 cctggacaag ggcttgagtg gatgggatgg atcaacccta acagtggtgg cacaaactat 240 gcacagaagt ttcagggcag ggtcaccatg accagggaca cgtccagcag cacagcctac 300 atggacctga gcaggctgac atctgacgac acggccgtct attactgtgc gcgagaaaat 360 ggtcctttaa acaccgcctt cttctacggt ttggacgtct ggggccaagg gacactagtc 420 accgtctcct cagcctccac caagggccca tcggtcttcc ccctggcacc ctcctccaag 480 agcacctctg ggggcacagc ggccctgggc tgcctggtca aggactactt ccccgaaccg 540 gtgacggtgt cgtggaactc aggcgccctg accagcggcg tgcacacctt cccggctgtc 600 ctacagtcct caggactcta ctccctcagc agcgtggtga ccgtgccctc cagcagcttg 660 ggcacccaga cctacatctg caacgtgaat cacaagccca gcaacaccaa ggtcgacaag 720 aaagttgagc ccaaatcttc tgacaaaact cacacatgcc caccgtgccc aggtaagcca 780 gcccaggcct cgccctccag ctcaaggcgg gacaggtgcc ctagagtagc ctgcatccag 840 ggacaggccc cagccgggtg ctgacacgtc cacctccatc tcttcctcag cacctgaact 900 cctgggggga ccgtcagtct tcctcttccc cccaaaaccc aaggacaccc tcatgatctc 960 ccggacccct gaggtcacat gcgtggtggt ggacgtgagc cacgaagacc ctgaggtcaa 1020 gttcaactgg tacgtggacg gcgtggaggt gcataatgcc aagacaaagc cgcgggagga 1080 gcagtacaac agcacgtacc gtgtggtcag cgtcctcacc gtcctgcacc aggactggct 1140 gaatggcaag gagtacaagt gcaaggtctc caacaaagcc ctcccagccc ccatcgagaa 1200 aaccatctcc aaagccaaag gtgggacccg tggggtgcga gggccacatg gacagaggcc 1260 ggctcggccc accctctgcc ctgagagtga ccgctgtacc aacctctgtc cctacagggc 1320 agccccgaga accacaggtg tacaccctgc ccccatcacg ggaggagatg accaagaacc 1380 aggtcagcct gacctgcctg gtcaaaggct tctatcccag cgacatcgcc gtggagtggg 1440 agagcaatgg gcagccggag aacaactaca agaccacgcc tcccgtgctg gactccgacg 1500 gctccttctt cctctatagc aagctcaccg tggacaagag caggtggcag caggggaacg 1560 tcttctcatg ctccgtgatg catgaggctc tgcacaacca ctacacgcag aagagcctct 1620 ccctgtcccc gggtaaataa 1640 <210> 134 <211> 687 <212> DNA <213> Artificial sequence <220> <223> HcRed1 ORF Reef Coral - human codon optimized <400> 134 atggtgagcg gcctgctgaa ggagagtatg cgcatcaaga tgtacatgga gggcaccgtg 60 aacggccact acttcaagtg cgagggcgag ggcgacggca accccttcgc cggcacccag 120 agcatgagaa tccacgtgac cgagggcgcc cccctgccct tcgccttcga catcctggcc 180 ccctgctgcg agtacggcag caggaccttc gtgcaccaca ccgccgagat ccccgacttc 240 ttcaagcaga gcttccccga gggcttcacc tgggagagaa ccaccaccta cgaggacggc 300 ggcatcctga ccgcccacca ggacaccagc ctggagggca actgcctgat ctacaaggtg 360 aaggtgcacg gcaccaactt ccccgccgac ggccccgtga tgaagaacaa gagcggcggc 420 tgggagccca gcaccgaggt ggtgtacccc gagaacggcg tgctgtgcgg ccggaacgtg 480 atggccctga aggtgggcga ccggcacctg atctgccacc actacaccag ctaccggagc 540 aagaaggccg tgcgcgccct gaccatgccc ggcttccact tcaccgacat ccggctccag 600 atgctgcgga agaagaagga cgagtacttc gagctgtacg aggccagcgt ggcccggtac 660 agcgacctgc ccgagaaggc caactga 687 <210> 135 <211> 687 <212> DNA <213> Artificial sequence <220> <223> HcRed1 ORF modified Reef Coral - human codon optimized <400> 135 atggtcagcg gcctcctcaa agagtccatg cgcattaaaa tgtacatgga gggcaccgtc 60 aacggccact acttcaagtg cgagggcgag ggcgacggca accccttcgc cggcacccag 120 tctatgcgga tccacgtcac cgagggcgcc cccctcccct tcgccttcga catcctcgcc 180 ccttgttgcg agtacggcag cagaaccttc gtccaccaca ccgccgagat ccccgacttc 240 ttcaaacaga gcttccccga gggcttcact tgggagagaa ccaccaccta cgaggacggc 300 ggcatcctca ccgcccacca ggacaccagc ctcgagggca actgcctcat ctacaaggtc 360 aaagtccacg gcaccaactt ccccgccgac ggccccgtca tgaaaaacaa aagcggcggt 420 tgggagccca gcaccgaggt cgtctacccc gagaacggcg tcctttgcgg ccggaacgtc 480 atggccctca aagtcggcga ccggcacctc atttgccacc actacaccag ctaccggagc 540 aaaaaagccg tccgcgccct caccatgccc ggcttccact tcaccgacat ccggctccag 600 atgctccgga aaaaaaaaga cgagtacttc gagctctacg aggccagcgt ggcccggtac 660 agcgacctcc ccgagaaagc caattga 687 <210> 136 <211> 687 <212> DNA <213> artificial sequence <220> <223> HcRed1 ORF partially modified Reef Coral - human codon optimized <400> 136 atggtcagcg gcctcctcaa agagtccatg cgcattaaaa tgtacatgga gggcaccgtc 60 aacggccact acttcaagtg cgagggcgag ggcgacggca accccttcgc cggcacccag 120 agcatgagaa tccacgtgac cgagggcgcc cccctgccct tcgccttcga catcctggcc 180 ccctgctgcg agtacggcag caggaccttc gtgcaccaca ccgccgagat ccccgacttc 240 ttcaagcaga gcttccccga gggcttcacc tgggagagaa ccaccaccta cgaggacggc 300 ggcatcctga ccgcccacca ggacaccagc ctggagggca actgcctgat ctacaaggtg 360 aaggtgcacg gcaccaactt ccccgccgac ggccccgtga tgaagaacaa gagcggcggc 420 tgggagccca gcaccgaggt ggtgtacccc gagaacggcg tgctgtgcgg ccggaacgtg 480 atggccctga aggtgggcga ccggcacctg atctgccacc actacaccag ctaccggagc 540 aagaaggccg tgcgcgccct gaccatgccc ggcttccact tcaccgacat ccggctccag 600 atgctgcgga agaagaagga cgagtacttc gagctgtacg aggccagcgt ggcccggtac 660 agcgacctgc ccgagaaggc caactga 687 <210> 137 <211> 744 <212> DNA <213> human <220> <223> Mutated Anti-Thy VL ORF with CD5 signal peptide <400> 137 atgcccatgg ggtctctgca accgctggcc accttgtacc tgctggggat gctggtcgct 60 tccgtgctag cggatatcct cgtgatgacc cagtctccag tcaccctgtc tttgtcttca 120 ggggaaagag ccaccctctc ctgcagggcc agtcagagta ttagtaactc cttagcctgg 180 taccaacaga aacctggcct ggctcccagg ctcctcatct atgatgcatc caacagggcc 240 actggcgtcc cagccaggtt cagtggcagt gggtctggga cagacttcaa tctcaccatc 300 agcagcttca atctcaccat cagcagccta gaccctgaag atgttgcagt gtattactgt 360 caccagcgta gcaactggcc tcctttcact ttcggcggag ggaccaaggt ggagatcaaa 420 cgtacggtgg ctgcaccatc tgtcttcatc ttcccgccat ctgatgagca gttgaaatct 480 ggaactgcct ctgttgtgtg cctgctgaat aacttctatc ccagagaggc caaagtacag 540 tggaaggtgg ataacgccct ccaatcgggt aactcccagg agagtgtcac agagcaggac 600 agcaaggaca gcacctacag cctcagcagc accctgacgc tgagcaaagc agactacgag 660 aaacacaaag tctacgcctg cgaagtcacc catcagggcc tgagctcgcc cgtcacaaag 720 agcttcaaca ggggagagtg ttag 744 <210> 138 <211> 744 <212> DNA <213> human <220> <223> Mutated Anti-Thy VL ORF with CD5 signal peptide <400> 138 atgcccatcg ggtctctgca accgctggcc accttgtacc tgctggggat cctggtcgct 60 tccgtgctag cggatatcct cgtgatgacc cagtctccag tcaccctgtc tttgtcttca 120 ggggaaagag ccaccctctc ctgcagggcc agtcagagta ttagtaactc cttagcctgg 180 taccaacaga aacctggcct ggctcccagg ctcctcatct atgatgcatc caacagggcc 240 actggcgtcc cagccaggtt cagtggcagt gggtctggga cagacttcaa tctcaccatc 300 agcagcttca atctcaccat cagcagccta gaccctgaag atgttgcagt gtattactgt 360 caccagcgta gcaactggcc tcctttcact ttcggcggag ggaccaaggt ggagatcaaa 420 cgtacggtgg ctgcaccatc tgtcttcatc ttcccgccat ctgatgagca gttgaaatct 480 ggaactgcct ctgttgtgtg cctgctgaat aacttctatc ccagagaggc caaagtacag 540 tggaaggtgg ataacgccct ccaatcgggt aactcccagg agagtgtcac agagcaggac 600 agcaaggaca gcacctacag cctcagcagc accctgacgc tgagcaaagc agactacgag 660 aaacacaaag tctacgcctg cgaagtcacc catcagggcc tgagctcgcc cgtcacaaag 720 agcttcaaca ggggagagtg ttag 744 <210> 139 <211> 744 <212> DNA <213> human <220> <223> Mutated Anti-Thy VL ORF with CD5 signal peptide <400> 139 atgcccatgg ggtctctcca accgctcgcc accttgtacc tcctcgggat gctcgtcgct 60 tccgtgctag cggatatcct cgtgatgacc cagtctccag tcaccctgtc tttgtcttca 120 ggggaaagag ccaccctctc ctgcagggcc agtcagagta ttagtaactc cttagcctgg 180 taccaacaga aacctggcct ggctcccagg ctcctcatct atgatgcatc caacagggcc 240 actggcgtcc cagccaggtt cagtggcagt gggtctggga cagacttcaa tctcaccatc 300 agcagcttca atctcaccat cagcagccta gaccctgaag atgttgcagt gtattactgt 360 caccagcgta gcaactggcc tcctttcact ttcggcggag ggaccaaggt ggagatcaaa 420 cgtacggtgg ctgcaccatc tgtcttcatc ttcccgccat ctgatgagca gttgaaatct 480 ggaactgcct ctgttgtgtg cctgctgaat aacttctatc ccagagaggc caaagtacag 540 tggaaggtgg ataacgccct ccaatcgggt aactcccagg agagtgtcac agagcaggac 600 agcaaggaca gcacctacag cctcagcagc accctgacgc tgagcaaagc agactacgag 660 aaacacaaag tctacgcctg cgaagtcacc catcagggcc tgagctcgcc cgtcacaaag 720 agcttcaaca ggggagagtg ttag 744 <210> 140 <211> 744 <212> DNA <213> human <220> <223> Mutated Anti-Thy VL ORF with CD5 signal peptide <400> 140 atgcccatcg ggtctctcca accgctcgcc accttgtacc tcctcgggat cctcgtcgct 60 tccgtgctag cggatatcct cgtgatgacc cagtctccag tcaccctgtc tttgtcttca 120 ggggaaagag ccaccctctc ctgcagggcc agtcagagta ttagtaactc cttagcctgg 180 taccaacaga aacctggcct ggctcccagg ctcctcatct atgatgcatc caacagggcc 240 actggcgtcc cagccaggtt cagtggcagt gggtctggga cagacttcaa tctcaccatc 300 agcagcttca atctcaccat cagcagccta gaccctgaag atgttgcagt gtattactgt 360 caccagcgta gcaactggcc tcctttcact ttcggcggag ggaccaaggt ggagatcaaa 420 cgtacggtgg ctgcaccatc tgtcttcatc ttcccgccat ctgatgagca gttgaaatct 480 ggaactgcct ctgttgtgtg cctgctgaat aacttctatc ccagagaggc caaagtacag 540 tggaaggtgg ataacgccct ccaatcgggt aactcccagg agagtgtcac agagcaggac 600 agcaaggaca gcacctacag cctcagcagc accctgacgc tgagcaaagc agactacgag 660 aaacacaaag tctacgcctg cgaagtcacc catcagggcc tgagctcgcc cgtcacaaag 720 agcttcaaca ggggagagtg ttag 744 <210> 141 <211> 744 <212> DNA <213> human <220> <223> Mutated Anti-Thy VL ORF with CD5 signal peptide <400> 141 atggctatcg ggtctctcca accgctcgcc accttgtacc tcctcgggat cctcgtcgct 60 tccgtgctag cggatatcct cgtgatgacc cagtctccag tcaccctgtc tttgtcttca 120 ggggaaagag ccaccctctc ctgcagggcc agtcagagta ttagtaactc cttagcctgg 180 taccaacaga aacctggcct ggctcccagg ctcctcatct atgatgcatc caacagggcc 240 actggcgtcc cagccaggtt cagtggcagt gggtctggga cagacttcaa tctcaccatc 300 agcagcttca atctcaccat cagcagccta gaccctgaag atgttgcagt gtattactgt 360 caccagcgta gcaactggcc tcctttcact ttcggcggag ggaccaaggt ggagatcaaa 420 cgtacggtgg ctgcaccatc tgtcttcatc ttcccgccat ctgatgagca gttgaaatct 480 ggaactgcct ctgttgtgtg cctgctgaat aacttctatc ccagagaggc caaagtacag 540 tggaaggtgg ataacgccct ccaatcgggt aactcccagg agagtgtcac agagcaggac 600 agcaaggaca gcacctacag cctcagcagc accctgacgc tgagcaaagc agactacgag 660 aaacacaaag tctacgcctg cgaagtcacc catcagggcc tgagctcgcc cgtcacaaag 720 agcttcaaca ggggagagtg ttag 744 <210> 142 <211> 24 <212> RNA <213> human <220> <223> Mutated miR-183 binding sequence <400> 142 aaagcggaua cucacuggac acca 24 <210> 143 <211> 756 <212> DNA <213> Artificial sequence <220> <223> miR-183 CAT FLAG sequence <400> 143 atggagaaaa aaatcacagg atataccacc gttgatatat cccaatggca tcgtaaagaa 60 cattttcagg catttcagtc agttgctcaa tgtacctata accagaccgt tcagctggat 120 attacggcct ttttaaagac cgtaaagaaa aataagcaca agttttatcc ggcctttatt 180 cacattcttg cccgcctgat gaatgctcat ccggaaaagc gaattctcac aggccatcat 240 ccggaactcc gtatggcaat gaaagacggt gagctggtga tatgggatag tgttcaccct 300 tgttacaccg ttttccatga gcaaactgaa acgttttcat cgctctggag tgaataccac 360 gacgatttcc ggcagtttct acacatatat tcgcaagatg tggcgtgtta cggtgaaaac 420 ctggcctatt tccctaaagg gtttattgag aatatgtttt tcgtctcagc caatccctgg 480 gtgagtttca ccagttttga tttaaacgtg gccaatatgg acaacttctt cgcccccgtt 540 ttcacgatgg gcaaatatta tacgcaaggc gacaaggtgc tgatgccgct ggcgattcag 600 gttcatcatg ccgtttgtga tggcttccat gtcggcagaa tgcttaatga attacaacag 660 tactgcgatg agtggcaggg cggggcggac tacaaagacc atgacggtga ttataaagat 720 catgacatcg attacaagga tgacgatgac aagtaa 756 <210> 144 <211> 756 <212> DNA <213> Artificial sequence <220> <223> Mutated miR-183 CAT FLAG sequence <400> 144 atggagaaaa aaatcacagg atataccacc gttgatatat cccaatggca tcgtaaagaa 60 cattttcagg catttcagtc agttgctcaa tgtacctata accagaccgt tcagctggat 120 attacggcct ttttaaagac cgtaaagaaa aataagcaca agttttatcc ggcctttatt 180 cacattcttg cccgcctgat gaatgctcat ccggaaaagc ggatactcac tggacaccat 240 ccggaactcc gtatggcaat gaaagacggt gagctggtga tatgggatag tgttcaccct 300 tgttacaccg ttttccatga gcaaactgaa acgttttcat cgctctggag tgaataccac 360 gacgatttcc ggcagtttct acacatatat tcgcaagatg tggcgtgtta cggtgaaaac 420 ctggcctatt tccctaaagg gtttattgag aatatgtttt tcgtctcagc caatccctgg 480 gtgagtttca ccagttttga tttaaacgtg gccaatatgg acaacttctt cgcccccgtt 540 ttcacgatgg gcaaatatta tacgcaaggc gacaaggtgc tgatgccgct ggcgattcag 600 gttcatcatg ccgtttgtga tggcttccat gtcggcagaa tgcttaatga attacaacag 660 tactgcgatg agtggcaggg cggggcggac tacaaagacc atgacggtga ttataaagat 720 catgacatcg attacaagga tgacgatgac aagtaa 756 <210> 145 <211> 93 <212> DNA <213> Pichia pastoris <220> <223> Kar2 signal peptide <400> 145 atgctgtcgt taaaaccatc ttggctgact ttggcggcat taatgtatgc catgctattg 60 gtcgtagtgc catttgctaa acctgttaga gct 93 <210> 146 <211> 93 <212> DNA <213> pichia pastoris <220> <223> Rescue version of signal peptide <400> 146 atgctctcgt taaaaccatc ttggctcact ttggcggcat taatttacgc catcctattg 60 gtcgtagtgc catttgctaa acccgttaga gct 93 <210> 147 <211> 78 <212> DNA <213> Gallus gallus <220> <223> Lysozyme signal sequence <400> 147 atgctgggta agaaggaccc aatgtgtctt gttttggtct tgttgggatt gactgctttg 60 ttgggtatct gtcaaggt 78 <210> 148 <211> 78 <212> DNA <213> Gallus gallus <220> <223> Rescue version signal sequence <400> 148 atgctcggta agaacgaccc aatttgtctt gttttggtct tgttgggatt gaccgctttg 60 ttgggtattt gtcaaggt 78 <210> 149 <211> 69 <212> DNA <213> human <220> <223> granulocyte colony-stimulating factor receptor precursor <400> 149 atgaggctgg gaaactgcag cctgacttgg gctgccctga tcatcctgct gctccccgga 60 agtctggag 69 <210> 150 <211> 69 <212> DNA <213> human <220> <223> Rescue version signal sequence <400> 150 atgaggcttg gaaattgtag cctcacttgg gccgccctca tcatcctcct tctccccgga 60 agtctcgag 69 <210> 151 <211> 70 <212> DNA <213> human <220> <223> calcitonin receptor precursor signal sequence <400> 151 atgaggacat ttacaagccg gtgcttggca ctgtttcttc ttctaaatca cccaacccca 60 attcttcctg 70 <210> 152 <211> 70 <212> DNA <213> human <220> <223> Rescue version signal sequence <400> 152 atgaggacat ttacaagccg ttgcttggca ctctttcttc ttctaaatca cccaacccca 60 attcttcccg 70 <210> 153 <211> 69 <212> DNA <213> human <220> <223> Cell adhesion molecule 3 precursor <400> 153 atggccccag ccgcctcgct cctgctcctg ctcctgctgt tcgcctgctg ctgggcgccc 60 ggcggggcc 69 <210> 154 <211> 69 <212> DNA <213> human <220> <223> Rescue version signal sequence <400> 154 atggccccag ccgcctcgct ccttctcctt ctccttctct ttgcttgttg ttgggcgccc 60 ggcggggcc 69 <210> 155 <211> 66 <212> DNA <213> human <220> <223> HLA class I histocompatibility antigen signal sequence <400> 155 atggtcgcgc cccgaaccct cctcctgcta ctctcggggg ccctggccct gacccagacc 60 tgggcg 66 <210> 156 <211> 66 <212> DNA <213> human <220> <223> Rescue version signal sequence <400> 156 atggtcgcgc cccgaaccgt cctccttctt ctctcggcgg ccctcgccct taccgagact 60 tgggcc 66

Claims

a) 이하를 포함하는 폴리뉴클레오티드를 제공하는 단계:
i) 전장 단백질에 대한 코딩 서열;
ii) 상기 코딩 서열의 상류에 존재하는 1차 개시 코돈; 및
iii) 상기 코딩 서열 내에 위치한 하나 이상의 2차 개시 코돈; 및
b) 하나 이상의 2차 개시 코돈을 변이시키되, 이때 이 변이가 하나 이상의 2차 개시 코돈에서 단백질 합성 개시의 감소를 초래하여 1차 개시 코돈으로부터의 리보솜 방향전환을 감소시키는 것인 단계
를 포함하고, 이로써 전장 단백질 발현 효율이 증가되는 것인, 전장 단백질 발현 효율의 향상 방법.
제1항에 있어서, 하나 이상의 2차 개시 코돈을 변이시키는 단계가, 아미노산 서열은 변경되지 않은 채 남아있도록 하나 이상의 뉴클레오티드를 변이시키는 것을 포함하는 것인 방법.
제1항에 있어서, 하나 이상의 2차 개시 코돈이 코딩 서열과 동일한 리딩 프레임(reading frame)으로 존재하는 것인 방법.
제1항에 있어서, 하나 이상의 2차 개시 코돈이 코딩 서열에 대해 아웃-오브-프레임(out-of-frame)으로 존재하는 것인 방법.
제1항에 있어서, 하나 이상의 2차 개시 코돈이 리보솜 동원 부위로부터 하나 이상의 뉴클레오티드 상류 또는 하류에 위치하는 것인 방법.
제5항에 있어서, 리보솜 동원 부위가 캡 (cap) 또는 IRES를 포함하는 것인 방법.
제1항에 있어서, 하나 이상의 2차 개시 코돈이 AUG, ACG, GUG, UUG, CUG, AUA, AUC 및 AUU로 이루어진 군으로부터 선택되는 것인 방법.
제1항에 있어서, 코딩 서열 내의 2 이상의 2차 개시 코돈이 변이되는 것인 방법.
제1항에 있어서, 코딩 서열 내의 모든 2차 개시 코돈이 변이되는 것인 방법.
제1항에 있어서, 하나 이상의 2차 개시 코돈을 변이시키는 단계가 덜 유리한 뉴클레오티드 환경이 되도록 측면 (flanking) 뉴클레오티드를 변이시키는 것을 포함하는 것인 방법.
제1항에 있어서, 하나 이상의 2차 개시 코돈을 변이시키는 단계가 새로운 개시 코돈을 도입하지 않는 것인 방법.
제1항에 있어서, 하나 이상의 2차 개시 코돈을 변이시키는 단계가 변이된 코돈의 사용빈도 편향 (usage bias)을 변경시키지 않는 것인 방법.
제1항에 있어서, 전장 코딩된 단백질 이외의 말단절단된(truncated) 단백질, 폴리펩티드, 또는 펩티드의 생성을 감소시키는 단계를 추가로 포함하는 방법.
제1항에 있어서, 하나 이상의 2차 개시 코돈을 변이시키는 단계가 miRNA 시드 (seed) 서열, 스플라이스 공여 부위, 스플라이스 수용 부위, 또는 mRNA 탈안정화 요소를 도입하지 않는 것인 방법.
a) 전장 단백질에 대한 코딩 서열 및 상기 코딩 서열 내에 위치한 하나 이상의 miRNA 결합 부위를 포함하는 폴리뉴클레오티드 서열을 제공하는 단계; 및
b) 하나 이상의 miRNA 결합 부위를 변이시키되, 이 때 이 변이가 하나 이상의 miRNA 결합 부위에서 miRNA 결합의 감소를 초래하여, miRNA-매개성 단백질 번역 하향 조절을 감소시키고, 이로써 전장 단백질 발현 효율이 증가하는 것인 단계
를 포함하는, 전장 단백질 발현 효율의 향상 방법.
제15항에 있어서, 하나 이상의 miRNA 결합 부위를 변이시키는 단계가, 아미노산 서열은 변경되지 않은 채 남아있도록 하나 이상의 뉴클레오티드를 변이시키는 것을 포함하는 것인 방법.
제15항에 있어서, 하나 이상의 miRNA 결합 부위를 변이시키는 단계가 miRNA 시드 서열 내의 하나 이상의 뉴클레오티드를 변이시키는 것을 포함하는 것인 방법.
제15항에 있어서, 하나 이상의 miRNA 결합 부위를 변이시키는 단계가, 폴리뉴클레오티드 서열 내로 개시 코돈이 도입되지 않도록 하나 이상의 뉴클레오티드를 변이시키는 것을 포함하는 것인 방법.
제15항에 있어서, 하나 이상의 miRNA 결합 부위를 변이시키는 단계가, 폴리뉴클레오티드 서열 내로 희귀 코돈이 도입되지 않도록 하나 이상의 뉴클레오티드를 변이시키는 것을 포함하는 것인 방법.
제15항에 있어서, 하나 이상의 miRNA 결합 부위를 변이시키는 단계가, 폴리뉴클레오티드 서열 내로 추가적인 miRNA 시드 서열이 도입되지 않도록 하나 이상의 뉴클레오티드를 변이시키는 것을 포함하는 것인 방법.
제15항에 있어서, 하나 이상의 miRNA 결합 부위가 코딩 서열 내에 위치하는 것인 방법.
제15항에 있어서, 하나 이상의 miRNA 결합 부위가 3' 비번역 영역 내에 위치하는 것인 방법.
제15항에 있어서, 하나 이상의 miRNA 결합 부위가 5' 선도 서열 내에 위치하는 것인 방법.