KR20150016941A

KR20150016941A - 다중 면역 스크리닝 분석

Info

Publication number: KR20150016941A
Application number: KR1020147031586A
Authority: KR
Inventors: 진- 클로드 마누구에라; 제시카 반홈위젠; 필립 데스프레스; 실비 파울로우스
Original assignee: 앵스띠뛰 파스퇴르
Priority date: 2012-05-04
Filing date: 2013-05-03
Publication date: 2015-02-13
Also published as: KR102049623B1; US20170276672A1; WO2013083847A3; CA2857998A1; JP6351571B2; AU2012350229B2; US10197562B2; SG11201407167RA; CN104114697A; MX349562B; WO2013083847A2; CN104704117B; US9638692B2; US20180038852A1; EP2788478B1; WO2013164476A1; KR20140113937A; BR112014013745A2; CA2872127A1; MX2014006870A

Abstract

본 발명은 병원체의 조기 검출, 병인체의 정확한 확인 및 개선된 질병 감시를 위한 키트 및 분석 방법을 제공한다. 더욱 구체적으로, 본 발명은 감염된 환자의 생물학적 유체 중의 다양한 감염성 병원체에 대한 항체의 신속하고 동시적인 검출을 이끄는 면역분석을 기술한다. 이러한 면역분석은 AGT 효소의 기질로 미리 코팅된 식별가능한 고체 지지체(예: 형광 마이크로구) 상에 AGT 효소 및 바이러스 항원을 포함하는 융합 단백질을 공유적이고 지향적으로 커플링시키는 것을 포함한다. 이러한 커플링은 AGT 효소의 기질에 대한 AGT 효소의 비가역적 반응에 의해 중재된다. 이렇게 수득된 항원-커플링된 마이크로구는, 표준 아민 커플링 공정에 따라 생성된 항원-커플링된 마이크로구에 비해, 특이적 항체의 포획을 증진시킨다. 본 발명의 방법은 다중 능력을 갖고, 생물학적 샘플의 양을 최소화하며, 종래의 ELISA 또는 방사선-면역침전 분석에 비해 표적 항체에 대한 민감도 및 특이성을 개선한다.

Description

다중 면역 스크리닝 분석 {MULTIPLEX IMMUNO SCREENING ASSAY}

세균, 바이러스(예: 바이러스 출혈열(VHFs)) 및 기생충 등의 병원성 작용물질에 의해 유발된 감염성 질환은 질병의 중증도, 높은 치사율, 특정 매개물의 인간간 전염성 및 이들 대부분에 대한 효과적인 치료의 결여 때문에 중요한 공중 건강 문제를 갖는다.

전염병의 구제는, 시기적절하게 적합한 규정을 확정하고 실행하기 위해, 매개물의 신속한 검출 및 정확한 확인에 결정적으로 의존한다. 이러한 맥락에서, 발생의 조기 검출, 병인체의 정확한 확인 및 개선된 질병 감시를 위한 수단을 생산하고 유효화 하는 것이 필수적이다.

이러한 점에서, 체액 중의 항체의 검출은 바이러스 유발된 질환, 감염성 생물에 의해 유발된 기타 질환 및 자가면역 질환의 진단 및 암의 검출에 중요한 부분을 구성한다. 사실, 특정의 항체는, 이들의 존재가 병원체의 발생과 관련이 있는 것으로 알려져 있으므로, 진단시 마커로서 사용할 수 있고 예후 및 치료를 가능하게 한다. 이는 특히 바이러스 항원을 전적으로 표적화하는 항체에 해당한다.

항체의 존재를 검출하는 최근의 방법은 면역형광 현미경법, 화학발광 분석, 웨스턴 블롯팅, 방사성 면역-침전 분석(RIP) 및 ELISA와 같은 다양한 기술을 포함한다. 수개의 항체를 동시에 병행 검출하는 것은, 캘리브레이터 및 항체가 동일 조건 하에서 분석되기 때문에, 각각의 분석들, 예를 들어, ELISA 간에 존재하는 매트릭스 효과를 최소화하는데 특히 유용하다; 따라서, 이는 동일 샘플 내에 존재하는 다수의 항체를 측정하기 위한 비교 결과를 제공할 것이다. 한 가지 이러한 분석은 비드에 결합된 항원을 사용하는 루미넥스 다중 분석이다(Pickering et al., Clinical and Diagnostic Laboratory Immunology 9: 872-876(2002)).

그러나, 병원체와 관련된 항체의 직접적 확인을 복잡하게 하는 것은, 일반적인 혈청은 다량의 천연 항체를 포함하고 이들 항체는 복잡한 염색 패턴으로 그들 자신을 나타낸다는 것이다(Avrameas S. Immunol. Today 1991). 이들 천연 항체의 존재는 "자가-면역 노이즈", 즉 천연 발생 자가항체의 복잡한 배경으로부터 질병-관련 항체의 구별을 복잡하게 할 수 있다. 문헌(Anderson et al., Methods Mol. Biol. 723:227-238(2011))에서 서술한 바와 같이, 교차(cross-talk) 및 간섭은 다중 분석과의 관련성이 있다.

다중 분석에서 비드에 직접 인간 항체의 결합은 또한 문제로서 보고되어 있다(Tainsky et al., Biomarker Insights 2:261-267(2007); Waterboer et al., J. Immunol Methods 309:200-204(2006)).

더욱이, 포지티브 샘플과 대조군 샘플 사이의 낮은 차이는 다중 분석의 유용성을 제한할 수 있다(Burbelo et al., Exp. Rev Vaccines, 9:567-578(2010)).

또 다른 문제는 ELISA 및 다중 분석이 동일한 결과를 제공할 필요가 없다는 것이다. 예를 들면, 픽커링 등(Pickering et al., 2002)은, 다양한 바이러스 및 세균 항원에 대한 보호 항체를 측정할 경우, 2개 분석 사이의 다수의 모순을 지적했다. 이는 항원이 기질에 부착하는 방법과 관련한 항원성의 변화를 반영할 수 있다. 문헌(Ambrosino et al., Malaria Journal 9:317(2010). Similarly, Cham et al., Malaria Journal 7:108(2008))은 일부 샘플이 ELISA 및 비드-기반 분석 측정치 사이에 현저한 차이를 나타냈음을 보고했고, 이중 일부는 보다 높은 ELISA 측정치를 가졌다. 이는, 단백질이 표면 또는 구에 결합되는 경우, 재조합 단백질의 상이한 부분이 항체에 의해 접근가능하다는 사실에 기인할 수 있다(Id.)

상업적 적용(즉, 키트)을 위한 충분한 양의 항원의 제조가 또한 필요할 수 있다(Burbelo et al., Exp. Rev Vaccines, 9:567-578(2010)).

앞서 살펴본 바와 같이, 항체-발생 질병의 분자적 진단을 위한 대용량처리, 비용-효과 및 정확성에 추가의 개선을 제공할 수 있는 취급가능한 시스템 및 방법이 필요하다. 본 발명은 이러한 요구 및 기타 요구를 충족시킨다.

본 발명은 항원에 대한 지향 항원 커플링 공정을 사용하여 보다 높은 민감도 및 특이성을 갖는 생물학적 샘플에서 다중 항원을 동시 스크리닝하는 것을 가능하게 한다. 본 발명자들은 생물학적 유체에서 다양한 질병, 특히 아르보바이러스 질환 및 VHFs에 의해 생성되는 수개의 항체를 신속하고 동시에 검출하는 면역분석을 개발하고 입증하였다.

도 1은 키메라 AGT-항원 단백질의 기질-코팅된 마이크로구에 대한 지향적(oriented) 커플링을 나타낸다. 커플링의 제1 단계는 AGT 기질 BG-PEG-NH2를 아민 커플링에 의해 활성화된 마이크로구에 커플링시키는 것으로 이루어진다. 제2 단계는 기질-코팅된 마이크로구를 AGT(예를 들어, SNAP 돌연변이체)를 포함하는 융합 단백질과 접촉시키는 것으로 이루어지며, 상기 효소를 이의 BG-PEG-NH2 기질, 즉 마이크로구에 공유적으로 부착시키기 위한 것이다.
도 2는 항-SNAP 항체에 의한 키메라 SNAP-바이러스 항원 단백질(SNAP-DV1.EDIII, SNAP-DV2.EDIII, SNAP.DV3.EDIII, SNAP.DV4.EDIII, SNAP-WNV.EDIII, SNAP-YF.EDIII, SNAP-JE.EDIII, SNAP-ZIKA.EDIII)의 커플링 효율을 도시한다.
도 3은 hAGT 단백질의 기질을 통해(본 발명의 커플링) 또는 표준 아민 커플링 공정, 예를 들어, Bio-Plex 아민 커플링 키트(BIORAD)를 통해 커플링된 마이크로구에 접합된 키메라 SNAP-DV2.EDIII 단백질에 대한 정제된 모노클로날 항-DV2 항체의 검출을 위한 면역분석 실험의 민감도를 비교한다.
도 4는 마이크로구에 접합된 키메라 SNAP-DV1.EDIII 단백질에 대한 정제된 모노클로날 항-DV1 항체의 검출을 위해 일중(singleplex) 포맷으로 수행되거나 마이크로구에 커플링된 다른 키메라 SNAP-바이러스 Ags 단백질(SNAP-DV2.EDIII, SNAP.DV3.EDIII, SNAP.DV4.EDIII, SNAP-WNV.EDIII, SNAP-YF.EDIII, SNAP-JE.EDIII, SNAP-TBE.EDIII)과 함께 다중 포맷으로 수행된 면역분석 실험의 민감도를 비교한다.
도 5는 마이크로구에 커플링된 키메라 SNAP-바이러스 Ags 단백질(SNAP-DV1.EDIII, SNAP-DV2.EDIII, SNAP.DV3.EDIII, SNAP.DV4.EDIII, SNAP-WNV.EDIII, SNAP-YF.EDIII, SNAP-JE.EDIII, SNAP-TBE.EDIII)에 대한 정제된 모노클로날 항-WNV 항체 희석물의 검출을 위한 다중 면역분석 실험의 반응성 및 특이성을 도시한다.
도 6은, 마이크로구에 커플링된 키메라 SNAP-바이러스 Ags 단백질(SNAP-DV1.EDIII, SNAP-DV2.EDIII, SNAP.DV3.EDIII, SNAP.DV4.EDIII, SNAP-WNV.EDIII, SNAP-YF.EDIII, SNAP-JE.EDIII, SNAP-WSL.EDIII, SNAP-ROCIO.EDIII, SNAP-MVE.EDIII, SNAP-SLE.EDIII, SNAP-ZIKA.EDIII)에 대한 다중 면역분석으로, DV3에 대한 마우스 폴리클로날 혈청에서 항-DV3 IgG 검출의 반응성 및 특이성(A) 및 YF에 대한 마우스 폴리클로날 혈청에서 항-YF IgG 검출의 반응성 및 특이성(B)을 도시한다.
도 7은, 마이크로구에 커플링된 키메라 SNAP-바이러스 Ags 단백질(SNAP-DV1.EDIII, SNAP-DV2.EDIII, SNAP.DV3.EDIII, SNAP.DV4.EDIII, SNAP-WNV.EDIII, SNAP-YF.EDIII, SNAP-JE.EDIII, SNAP-WSL.EDIII, SNAP-ROCIO.EDIII, SNAP-MVE.EDIII, SNAP-SLE.EDIII, SNAP-ZIKA.EDIII, SNAP-TBE.EDIII)에 대한 다중 면역분석으로, 인간 환자의 DV1-감염된 혈청에서 항-DV1 IgM 검출의 반응성 및 특이성(A) 및 항-DV1 IgG 검출의 반응성 및 특이성(B)을 도시한다.
도 8은 pDeSNAPuniv 카세트의 구조를 도시한다.
도 9는 pDeSNAPuniv/SBV.N 카세트의 구조를 도시한다.
도 10A는 Cd²⁺로 10일 동안 유도되거나 (+) 비유도된 (-) S2/SNAP-SBV.N 세포의 상등액에 대해 수행된 면역블롯 분석을 도시한다. 분비되는 키메라 단백질 SNAP-SBV.N(이론적 MW 50 kDa)을 항-His_tag 항체를 사용하여 소정량의 고도로 정제된 키메라 단백질 SNAP-TOS.N(이론적 MW 49 kDa)과 비교하여 검출하였다. 도 10B는 10일 동안 유도된 S2/SNAP+SBV.N 세포로부터 분비되는 SNAP+SBV.N 단백질의 최종 정제 단계에 상응하는 크기-배제 크로마토그래피 컬럼의 각 분획물에 대한 단백질의 직접 가시화(PAGE-SDS의 코마시 블루 염색)을 도시한다.
도 11은 본 발명의 항원-코팅된 마이크로구를 포함하는 디바이스의 일예를 도시한다.
도 12A 내지 12F는 SARS 바이러스 N 유전자를 함유하는 SNAP 작제물의 코딩 뉴클레오타이드(서열번호 154) 및 아미노산 서열(서열번호 155)를 나타낸다.
도 13A 내지 13D는 SARS 바이러스 S 유전자 수용체 결합 도메인을 함유하는 SNAP 작제물의 코딩 뉴클레오타이드(서열번호 156) 및 아미노산 서열(서열번호 157)을 나타낸다.
도 14A 내지 14D는 인간 코로나바이러스 N 유전자를 함유하는 SNAP 작제물의 코딩 뉴클레오타이드(서열번호 158) 및 아미노산 서열(서열번호 159)을 나타낸다.
도 15A 내지 15G는 인간 코로나바이러스 S1 유전자를 함유하는 SNAP 작제물의 코딩 뉴클레오타이드(서열번호 160) 및 아미노산 서열(서열번호 161)을 나타낸다.
도 16A 내지 16D는 인간 코로나바이러스 S1 유전자 수용체 결합 도메인(RBD)를 함유하는 SNAP 작제물의 코딩 뉴클레오타이드(서열번호 162) 및 아미노산 서열(서열번호 163)을 나타낸다.
도 17A 내지 17D는 렙토스피라증의 LruA 유전자를 함유하는 SNAP 작제물의 코딩 뉴클레오티드(서열번호 164) 및 아미노산 서열(서열번호 165)을 나타낸다.
도 18A 내지 18D는 렙토스피라증의 LruB 유전자를 함유하는 SNAP 작제물의 코딩 뉴클레오타이드(서열번호 166) 및 아미노산 서열(서열번호 167)을 나타낸다.
도 19A 내지 19D는 렙토스피라증의 LipL32 유전자를 함유하는 SNAP 작제물의 코딩 뉴클레오타이드(서열번호 168) 및 아미노산 서열(서열번호 169)을 나타낸다.
도 20A 내지 20F는 E형 간염의 C 유전자를 함유하는 SNAP 작제물의 코딩 뉴클레오타이드(서열번호 170) 및 아미노산 서열(서열번호 171)을 나타낸다.
도 21A 내지 21E는 E형 간염의 C 유전자의 코어 서열을 함유하는 SNAP 작제물의 코딩 뉴클레오타이드(서열번호 172) 및 아미노산 서열(서열번호 173)을 나타낸다.
도 22A 내지 22C는 C형 간염의 C 유전자를 함유하는 SNAP 작제물의 코딩 뉴클레오타이드(서열번호 174) 및 아미노산 서열(서열번호 175)을 나타낸다.
도 23A 내지 23D는 C형 간염의 C 유전자의 코어 서열을 함유하는 SNAP 작제물의 코딩 뉴클레오타이드(서열번호 176) 및 아미노산 서열(서열번호 177)을 나타낸다.
도 24A 내지 24C는 쉬말렌베르그 바이러스로부터 NS 단백질을 인코딩하는 서열을 함유하는 SNAP 작제물의 코딩 뉴클레오타이드(서열번호 178) 및 아미노산 서열(서열번호 179)을 나타낸다.
도 25A 및 25B는 본 발명의 키트에 포함되는 항원-커플링된 마이크로구의 유리한 조합을 나타낸다.

최소 항원을 사용하여 소량의 항체를 검출하기 위한 최적 민감도 및 특이성를 달성하기 위해, 지향적 항원 커플링 공정이 개발되었다. 이러한 지향적 항원 커플링 공정은 AGT 효소와 효소의 활성 부위 시스테인에 벤질 그룹을 전달함으로써 AGT 효소와 비가역적으로 반용하는 이의 기질인 O6-벤질구아닌 유도체 간의 공유적 상호작용에 기초한다. 따라서, 다수의 표적 항원이 AGT 효소 부분에 융합될 수 있으며, 그 결과 생물학적 샘플 중에 존재하는 항체에 대한 포획 시약으로 사용될 수 있는 상이한 키메라 융합 단백질(이하 [AGT- 항원] 융합 단백질이라 칭함)을 생성한다. 본 발명자들은 이들 융합 단백질을 특이적 AGT-기질 상호작용에 의해 고체 지지체에 결합시키는 경우 이러한 항체 포획이 예상치 않게 증진된다는 것을 밝혔다.

실시예에서 기술되는 바와 같이, 본 발명자들은 지향적 항원 커플링 공정으로 다수의 상이한 항원-코팅된 형광 마이크로구를 생성하였다. 16개의 정제된 키메라 [AGT-항원] 융합 단백질과 커플링시킨 16개의 상이한 마이크로구 세트를 뎅기 혈청형 1 내지 4, 웨스트 나일, 황열, 일본 뇌염, 진드기-매개 뇌염, 세이트-루이스 뇌염, 머레이 계곡 뇌염, 베셀스브론, 지카, 리시오(Ricio), 우수투(Usutu), 리프트 계곡 열 및 치쿤구니아(chikungunya) 바이러스의 상이한 단백질에 대해 특이적인 16개의 혈청 항체의 적정에 사용하였다. 예상치 않게, 이들 16개의 상이한 마이크로구 세트를 검출의 민감도 및 특이성에 영향을 끼치지 않으면서 단일 샘플에서 혼합하였다(참조: 도 5). 이러한 시스템의 생성은, 한 세트의 항원-커플링된 마이크로구(약 1.25 x 10⁶개 마이크로구)(이러한 세트는 1000개의 개별 분석을 수행하는데 충분하다)를 생성하는데 단지 매우 소량의 재조합 항원(< 50 ㎍)이 필요하므로, 매우 시간-효과적이고 비용-효과적이다.

결과적으로, 본 발명은, 키메라 융합 단백질, 즉 AGT-항원에 커플링되는 AGT 기질에 대한 고체 지지체, 바람직하게는 표지된 마이크로입자 (microparticle)의 지향적 항원 커플링에 기반한 다중 분석을 수행하는 방법 및 키트를 포함한다. 이러한 지향적 커플링은 생물학적 샘플에서 항원과 항체의 증가된 상호작용을 가능하게 한다. AGT-기질로 코팅된 고체 지지체는 이들 면역분석에서 AGT 효소의 효소적 활성을 통해 AGT-항원과 커플링될 수 있다.

6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT, 또는 ATase 또는 MGMT로서 공지되어 있고, 이하 "AGT"로서 지칭됨)는 IUBMB 효소 명명법에서 EC 2.1.1.63으로 번호가 부여되어 있다. 이는 세포에서의 기능이 알킬화된 DNA를 수복하는 것인 207개 아미노산 잔기의 6-알킬구아닌-DNA-알킬트랜스퍼라제 DNA 수복 효소이다. 보다 정확하게는, AGT는 S_N2 반응 중의 메틸 그룹을 반응성 시스테인 잔기(Cys 145)로 비가역적으로 전이시킴으로써 DNA에서 O⁶-메틸화된 구아닌에 작용한다. 최근, 다수의 O6-벤질구아닌 유도체는 이들의 벤질 그룹을 AGT 효소의 활성 부위 시스테인으로 전이시킴으로써 상기 효소와 비가역적으로 반응하는 것으로 밝혀졌다(참조: Damoiseaux et al., ChemBiochem., 2001, WO 2004/031404 및 WO 2005/085470). 따라서, AGT-항원은 이러한 효소적 반응을 통해 AGT 기질에 커플링될 수 있다.

AGT-항원에 커플링된 고체 지지체는 면역글로불린을 함유하는 생물학적 샘플과 함께 항온처리할 수 있다. 면역글로불린이 고체 지지체에 결합된 후, 면역글로불린에 효과적으로 결합한 고체 지지체의 검출이 달성될 수 있다. 면역글로불린-코팅된 고체 지지체(들)의 동정은 환자를 감염시키는 병원체의 진단을 가능하게 한다(각각의 고체 지지체는 정의된 병원성 항원과 일치하기 때문임). 이러한 검출 단계는 임의의 통상의 수단에 의해, 예를 들면, 표지된 검출 항체를 사용함으로써 및 고체 지지체의 성질을 동정함으로써 수행된다.

유리하게는, 본 발명의 방법은 발병된 환자에서 항체의 존재의 검출만을 포함하지만, 이들 항체의 동일성에 대한 지식이 요구되지 않는다.

다중 표적 항체를 검출하는 방법

본 발명은 생물학적 샘플에서 적어도 2개의 표적 항체를 검출하는 방법에 관한 것이다. 본 발명은 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 20, 25, 30, 40, 50, 100개 등의 상이한 표적 항체의 존재 또는 부재를 검출하는 것을 포함한다. 따라서, 본 발명은 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 20, 25, 30, 40, 50, 100개 등의 고체 지지체를 포함하는 방법, 및 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 20, 25, 30, 40, 50, 100개 등의 상이한 에피토프를 포함하는 방법을 포함한다. 상기 방법은, 생물학적 샘플의 첨가 전에 함께 혼합된, 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 20, 25, 30, 40, 50, 100개 등의 고체 지지체를 포함할 수 있다. 에피토프는 표적 항체에 의해 인지될 수 있다.

한 가지 실시형태에서, 상기 방법은

(a) 적어도 2개의 고체 지지체의 혼합물을 생물학적 샘플과 접촉시키는 단계로서, 여기서 상기 고체 지지체 중의 적어도 하나는 AGT 기질에 공유 커플링된 제1 AGT-항원 융합 단백질을 포함하고, 상기 고체 지지체 중의 적어도 하나는 AGT 기질에 공유 결합된 제2-AGT-항원 융합 단백질을 포함하는 단계,

(b) 제1 AGT-항원에 대한 항체의 결합의 존재 또는 부재를 검출하는 단계; 및

(c) 제2 AGT-항원에 대한 항체의 결합의 존재 또는 부재를 검출하는 단계를 포함한다.

한 가지 실시형태에서, 상기 방법은

(a) 적어도 10개의 고체 지지체의 혼합물을 생물학적 샘플과 접촉시키는 단계로서,

제1 고체 지지체는 AGT 기질과 공유적으로 커플링 (covalently coupling)된 제1 AGT-항원 융합 단백질을 포함하고,

제2 고체 지지체는 AGT 기질과 공유적으로 커플링된 제2 AGT-항원 융합 단백질을 포함하고,

제3 고체 지지체는 AGT 기질과 공유적으로 커플링된 제3 AGT-항원 융합 단백질을 포함하고,

제4 고체 지지체는 AGT 기질과 공유적으로 커플링된 제4 AGT-항원 융합 단백질을 포함하고,

제5 고체 지지체는 AGT 기질과 공유적으로 커플링된 제5 AGT-항원 융합 단백질을 포함하고,

제6 고체 지지체는 AGT 기질과 공유적으로 커플링된 제6 AGT-항원 융합 단백질을 포함하고,

제7 고체 지지체는 AGT 기질과 공유적으로 커플링된 제7 AGT-항원 융합 단백질을 포함하고,

제8 고체 지지체는 AGT 기질과 공유적으로 커플링된 제8 AGT-항원 융합 단백질을 포함하고,

제9 고체 지지체는 AGT 기질과 공유적으로 커플링된 제9 AGT-항원 융합 단백질을 포함하고,

제10 고체 지지체는 AGT 기질과 공유적으로 커플링된 제10 AGT-항원 융합 단백질을 포함하는 단계, 및

(b) 각각의 AGT-항원에 대한 항체의 결합의 존재 또는 부재를 검출하는 단계를 포함한다.

한 가지 실시형태에서, 상기 방법은

(a) O6-알킬구아닌-DNA 알킬트랜스퍼라제 활성을 갖는 AGT 폴리펩타이드 및 제1 표적 항체에 의해 인지되는 제1 에피토프를 포함하는 제1 융합 단백질에 공유적으로 커플링된 AGT 기질을 포함하는 제1 고체 지지체를 생물학적 샘플과 접촉시키는 단계,

(b) O6-알킬구아닌-DNA 알킬트랜스퍼라제 활성을 갖는 AGT 폴리펩타이드 및 제2 표적 항체에 의해서는 인지되나 상기 제1 표적 항체에 의해서는 인지되지 않는 제2 에피토프를 포함하는 제2 융합 단백질에 공유적으로 커플링된 AGT 기질을 포함하는 제2 고체 지지체를 생물학적 샘플과 접촉시키는 단계, 및

(c) 2개의 표적 항체의 존재 또는 부재를 검출하는 단계를 포함한다.

바람직하게는, 제1 및 제2 등의 고체 지지체는 마이크로구이다. 가장 바람직하게는, 마이크로구는 표지되어 있다. 바람직하게는, 제1 및 제2 고체 지지체는 상이한 표지로 표지되어 있다.

본 발명은 피험자로부터의 생물학적 샘플에 존재하는 적어도 2개의 상이한 표적 항체를 검출하기 위한 시험관내 분석 방법에 관한 것으로서, 상기 방법은

(a) 하기를 포함하는 제1 융합 단백질을 제공하는 단계:

- 제1 표적 항체에 의해 인지되는 제1 에피토프를 포함하는 폴리펩타이드 및

- O6-알킬구아닌-DNA 알킬트랜스퍼라제 활성을 갖는 AGT 폴리펩타이드,

(b) 상기 제1 융합 단백질을 상기 AGT 폴리펩타이드의 기질과 공유적으로 커플링된 제1 고체 지지체와 접촉시키는 단계,

(c) 제1 표적 항체에 의해 인지되는 제1 에피토프와 공유적으로 커플링된 제1 고체 지지체를 수득하는 단계,

(d) 하기를 포함하는 제2 융합 단백질을 제공하는 단계:

- 제2 표적 항체에 의해서는 인지되나 상기 제1 표적 항체에 의해서는 인지되지 않는 제2 에피토프를 포함하는 폴리펩타이드 및

(e) 상기 제2 융합 단백질을 상기 AGT 폴리펩타이드 기질과 공유적으로 커플링된 제2 고체 지지체와 접촉시키는 단계,

(f) 제2 표적 항체에 의해서는 인지되나 상기 제1 표적 항체에 의해서는 인지되지 않는 제2 에피토프와 공유적으로 커플링된 제2 고체 지지체를 수득하는 단계,

(g) 상기 생물학적 샘플을 단계(c) 및 (f)에서 수득된 제1 및 제2 고체 지지체와 접촉시키는 단계, 및

(h) 상기 적어도 2개의 표적 항체의 존재를 검출하는 단계를 포함한다.

하기에서 사용되는 용어 "항체", "융합 단백질", "에피토프", "항원", "AGT 폴리펩타이드", "고체 지지체" 등은 분명히 당해 기술 분야에서 통상적으로는, 즉, 광의적으로 이해되어야 한다. 특히, 이들 용어는 특정한 단일 분자뿐만 아니라 다수의 상기 분자들을 포함한다. 예를 들어, 용어 "고체 지지체"는 다수의 동일한 고체 지지체의 서브세트를 포함하고, 용어 "마이크로입자"는 다수의 동일한 마이크로입자의 서브세트를 포함하고, 용어 "융합 단백질"은 다수의 동일한 단일 단백질 분자를 포함한다. 본 발명과 관련하여, 고체 지지체는 다수의 동일한 융합 단백질(융합 단백질은 AGT 폴리펩타이드와는 별개로 동일한 항원을 포함한다) 및 따라서 동일한 에피토프를 가지므로, 고체 지지체 상에서 검출될 항체가 명확히 식별될 수 있다는 것이 주목할 만하다.

본원에서 사용되는 용어 "융합 단백질"은 단백질을 함유하는 폴리펩타이드 또는 적어도 2개의 폴리펩타이드의 인위적 연결을 통해 형성되는 폴리펩타이드를 의미한다(참조: http://en.wikipedia.org/wiki/peptide). 본 발명의 면역분석에서, 융합 단백질은 AGT 폴리펩타이드 및 하나 이상의 에피토프를 포함하는 항원을 포함한다. 융합 단백질은 융합 유전자의 유전자 조작(http://en.wikipedia.org/wiki/Genetic_engineering)을 통해 수득될 수 있다. 이는 전형적으로 제1 단백질을 인코딩하는 cDNA 서열(참조: http://en.wikipedia.org/wiki/CDNA)로부터 정지 코돈(참조: http://en.wikipedia.org/wiki/Codon)을 제거한 후 결합(참조: http://en.wikipedia.org/wiki/Ligase) 또는 오버랩 연장 PCR(참조: http://en.wikipedia.org/wiki/PCR)을 통해 프레임(참조: http://en.wikipedia.org/wiki/Reading_frame) 내에 제2 단백질의 cDNA 서열을 추가하는 것을 포함한다. 따라서, 이러한 DNA 서열은 단일 단백질로서 세포(참조: http://en.wikipedia.org/wiki/Cell_(biology))에 의해 발현될 것이다(참조: http://en.wikipedia.org/wiki/Protein_expression). 단백질은 최초 단백질 둘다의 전체 서열 또는 단지 일부를 포함하도록 조작될 수 있다. 2개의 실체가 단백질인 경우, 링커(또는 "스페이서") 펩타이드가 추가될 수 있으며, 이것이 단백질이 독립적으로 폴딩하고 예상하는 바와 같이 거동하도록 할 것 같다. 특히, 본 발명의 융합 단백질은 AGT DNA 서열의 N-말단 또는 C-말단 측에 부착되는 에피토프 또는 항원 인코딩 서열과 함께 프레임 내에 AGT 인코딩 서열을 포함하는 벡터를 제공함으로써 수득될 수 있다. 이들 벡터는 유박테리아를 포함하는 원핵생물 숙주, 예를 들어, 이. 콜라이 세균, 또는 진핵생물 숙주, 예를 들어, 효로, 곤충 세포 또는 포유동물 세포에 도입될 수 있으며, 재조합 융합 단백질은 적합한 조건 하에서 생성될 수 있다. 대표적인 작제는 본원의 실시예에서 기술된다.

본원에서 사용되는 용어 "항체"는 모노클로날 항체, 폴리클로날 항체 및 키메라 항체를 포함하고자 한다. 바람직하게는, 본 발명의 면역분석으로 검출될 항체는 질병에 걸린 환자의 생물학적 샘플에 존재하고 상이한 B 세포 공급원으로부터 생성된 폴리클로날 항체이다. 이에, 이들은 병원성 항원에 의해 제시되는 상이한 에피토프를 인지한다(달리, 모노클로날 항체는 단일 세포주로부터 유도되며 동일한 에피토프를 인지한다).

항체(또는 "면역글로불린")은 디설파이드 결합에 의해 서로 연결된 적어도 2개의 중쇄(H) 및 2개의 경쇄(L)를 포함하는 당단백질이다. 각각의 중쇄는 중쇄 가변 영역(또는 도메인)(HCVR 또는 VH로 약칭함) 및 중쇄 불변 영역을 포함한다. 중쇄 불변 영역은 3개의 도메인인 CH1, CH2 및 CH3를 포함한다. 각각의 경쇄는 경쇄 가변 영역(LCVR 또는 VL로 약칭됨) 및 경쇄 불변 영역을 포함한다. 경쇄 불변 영역은 하나의 도메인인 CL을 포함한다. VH 및 VL 영역은, 항원의 에피토프 결합에 주로 관여하며 프레임 영역(FR)이라 불리는 보다 보존된 영역으로 사이에 간격을 둔, "상보성 결정 영역"(CDR)" 또는 "과가변 영역"이라 불리는 과가변성 영역으로 더욱 세분될 수 있다. 각각의 VH 및 VL은 3개의 CDR 및 4개의 FR로 구성되고, 이들은 아미노-말단부터 카복시-말단으로 FR1, CDR1, FR2, CDR2, FR3, CDR3, FR4의 순으로 배열된다. 중쇄 및 경쇄의 가변 영역은 항원과 상호작용하는 결합 도메인을 포함한다. 항체의 불변 영역은 면역계의 다양한 세포(예: 이펙터 세포) 및 전형적 보체계의 제1 성분(Clq)을 포함하는 숙주 조직 또는 인자들에 대한 면역글로불린의 결합을 중개할 수 있다.

항체는 상이한 이소형(즉, IgA, IgD, IgE, IgG 또는 IgM)일 수 있다. IgG 및 IgM 유형 항체 모두 본 발명의 방법으로 검출될 수 있다. 주목할 만한 것으로서, 이들 이소형은 디설파이드 결합으로 연결되는 2개의 동일한 중쇄 및 2개의 동일한 경쇄로 구성된다. 중요하게도, IgM 항체는 다수의 면역글로불린이 주로 펜타머 및 헥사머와 같이 디설파이드 결합으로 함께 공유적으로 연결된 중합체를 형성하므로, 이들은 (이들의 펜타머 형태에서) 약 900 kDa의 분자 매쓰를 갖는다. 각각의 모노머가 2개의 항원 결합 부위를 갖기 때문에, 펜타머 IgM은 10개의 결합 부위를 갖는다. 그러나, 통상적으로, IgM 항체는, 대부분의 항원의 큰 크기가 가까운 부위에 결합하는 것을 방해하기 때문에, 동시에 10개의 항원을 결합할 수 없다. IgM은 중합체성 특성 때문에, 높은 친화력을 갖는다. 상이한 이소형의 항체(예: IgG 또는 IgM)은, 항체 반응이 항원/감염에 대한 초기 또는 후기 반응인지와 같이 항체 반응의 일시적 식별을 가능하게 하는, 동일한 항원으로 검출할 수 있다. 이는 감염 또는 항원에 대한 노출의 타이밍에 관한 정보를 제공할 수 있다.

항체 단편도 또한 본 발명의 방법으로 검출될 수 있다. 이 용어는 Fab, Fab', F(ab')2, scFv, dsFv, ds-scFv, 다이머, 미니바디, 디아바디 및 이의 멀티머 및 이특이적 항체 단편을 포함하고자 한다.

모노클로날 항체가, 예를 들어, 고체 지지체에 결합된 면역글로불린을 검출하기 위해 본 발명의 면역분석에 사용될 수 있다. 본원에서 사용되는 "모노클로날 항체"는 균질한 항체군으로부터 생성되는 항체를 정의한다. 보다 특히, 일 항체군의 개별 항체는 최소한으로 발견될 수 있는 소수의 가능한 천연-발생 돌연변이를 제외하고는 동일하다. 달리, 모노클로날 항체는 단일 세포 클론(예를 들어, 하이브리도마, 균질 항체를 인코딩하는 DNA 분자로 형질감염된 진핵생물 숙주 세포, 균질 항체를 인코딩하는 DNA 분자로 형질감염된 원핵생물 숙주 세포 등)의 성장으로부터 생성되는 균질 항체로 이루어지고, 일반적으로 단지 하나의 부류 및 아부류의 중쇄 및 단지 하나의 유형의 경쇄로 특징지어진다. 모노클로날 항체는 고도로 특이적이며, 단일 항원에 대해 지시된다. 또한, 통상적으로 다양한 결정자에 대해 지시되는 다양한 항체를 포함하는 폴리클로날 항체의 제조와는 반대로, 각각의 모노클로날 항체는 항원의 단일 에피토프에 대해 지시된다.

본원에서 용어 "항원"은 면역계가 이 물질에 대해 항체를 생성하도록 하는 물질을 의미한다. "면역원성" 항원은 단독으로 주사시 적응 면역 반응을 자극할 수 있는 특정 유형의 항원이다. 분자적 수준에서, 항원은 항체의 항원-결합 부위에 "결합"하는 능력으로 특징지어진다.

본 발명과 관련하여, 항체는, 이러한 항체가 항원(또는 에피토프)에 대해 10⁵ M^-1초과, 바람직하게는 10⁶ M^-1초과, 더욱 바람직하게는 10⁷ M^-1초과의 친화성 상수 K_a(이는 역 해리 상수, 즉, 1/K_d이다)를 갖는 경우, 정의된 항원(또는 에피토프)에 "결합"하거나 상기 항원(또는 에피토프)을 "인식"한다고 말한다. 이러한 친화성은, 예를 들어, 평형 투석에 의하거나 형광 퀀칭에 의해 측정될 수 있으며, 이 두 기술은 모두 당해 기술 분야에서 통상적으로 이용된다.

본 발명의 방법은, 예를 들면, 알레르기 항원(allergen)의 검출에서 단백질, 핵산, 항체, 면역 반응, 폴리사카라이드 등의 검출을 위해 기타 기술과 결합할 수 있다.

다중 면역분석에 사용하기 위한 항원

본 발명과 관련하여, 항원 또는 에피토프는 단백질, 지단백질, 폴리사카라이드 및 당단백질을 포함한다. 상기 단백질은 바이러스, 세균, 기생충, 동물 및 진균 단백질, 예를 들어, 알부민, 파상풍 변성독소, 디프테리아 변성독소, 백일해 변성독소, 세균 외막 단백질(수막구균 외막 단백질 포함), RSV-F 단백질, 말라리아 유도된 펩타이드, B-락토글로불린 B, 아프로티니, 오브알부민, 리소자임, 선형 펩타이드, 올리고펩타이드 등을 포함한다. 항원 및 에피토프는 암, 사이토킨, 알레르기 항원 및 에피토프를 포함한다. 항원은 자가면역 질환에 관여하는 항원일 수 있다.

항원은 종양 관련 항원, 예를 들면, 알파페토단백질(AFP, http://en.wikipedia.org/wiki/Alphafetoprotein), 암배 항원(CEA), CA 15-3, CA27-29, CA 125, CA 19-9, 칼레피닌, 전립선 특이적 항원(PSA), MUC-1(http://en.wikipedia.org/wiki/MUC1), 상피 막 단백질(EMA), 상피 종양 항원(ETA), 티로시나제(http://en.wikipedia.org/wiki/Tyrosinase), 흑색종-관련 항원(MAGE), TAA 복합체, SSX2 또는 NERCMSL, ras(http://en.wikipedia.org/wiki/Ras_subfamily), P53, CD34, CD99, CD117, 크로모그라닌, 사이토케라틴, 데스민, 인자 VIII(http://en.wikipedia.org/wiki/Factor_VIII), CD31(http://en.wikipedia.org/wiki/CD31), FL1(http://en.wikipedia.org/wiki/FL1), GFAP, GCDFP-15, HMB-45, hCG, 인히빈, 케라틴, PTPRC(CD45), MART-1, MyoD1, MSA, NSE, PLAP, S100 단백질, SMA, 시냅토피신, 티로글로불린, 갑상선 전사 인자-1, 종양 M2-PK 및 비멘틴일 수 있다.

항원은 암 바이오마커, 예를 들면, 안지오포이에틴-2, sCD40L, EGF, 엔도글린, sFASL, HB-EGF, IGFBP-1, IL-6, IL-8, IL-18, PAI-1, PLGF, TGF-α, TNF-α, uPA, VEGF-A, VEGF-C, VEGF-D, sEGFR, FGF-기본, 폴리스타틴, G-CSF, HGF, sHER-2/neu, sIL-6Rα, 렙틴, 오스테오폰틴, PECAM-1, PDGF-AB/BB, 프로락틴, SCF, sTIE-2, sVEGFR-1 및 sVEGFR-2일 수 있다.

항원은 신장 독성 마커, 예를 들면, 칼빈딘, 클루스테린, GST-π, IL-18, KIM-1, MCP-1, 알부민, B2M, 시스타틴 C, NGAL, 오스테오폰틴 및 TFF3일 수 있다.

항원은 사이토킨, 케모킨 및 성장 인자, 예를 들면, TGF-β1, TGF-β2, TGF-β3, IL-1β IL-1ra, IL-2, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-12(p70), IL-13, IL-15, IL-17, 염기성 FGF, 에오탁신, G-CSF, GM-CSF, IFN-γ, IP-10, MCP-1(MCAF), MIP-1α, MIP-1β, PDGF-BB, RANTES, TNF-α, VEGF, IL-1α, IL-2Rα, IL-3, IL-12(p40), IL-16, IL-18, CTACK, GRO-α, HGF, IFN-α2, LIF, MCP-3, M-CSF, MIF, MIG, β-NGF, SCF, SCGF-β, SDF-1α, TNF-β 및 TRAIL일 수 있다.

상기 항원은 또한 합텐 및 저분자량 분자를 포함하는 다른 부분, 예를 들어, 사카라이드, 올리고사카라이드, 폴리사카라이드, 펩타이드, 뮤신, 독소 및 알레르기 항원(꽃가루, 달걀 흰자)일 수 있다.

상기 항원은 알레르기 항원, 예를 들어, 식품, 풀, 나무, 잡초, 곤충, 곰팡이, 표피 또는 먼지 진드기 알레르기 항원일 수 있다. 항원은 동물, 갑각류, 밀크(참조: http://en.wikipedia.org/wiki/Milk), 대두(참조: http://en.wikipedia.org/wiki/Soy), 난(참조: http://en.wikipedia.org/wiki/Egg_(food)), 밀(참조: http://en.wikipedia.org/wiki/Wheat), 땅콩(참조: http://en.wikipedia.org/wiki/Peanuts), 나무 견과류(참조: http://en.wikipedia.org/wiki/Tree_nuts), 어류(참조: http://en.wikipedia.org/wiki/Fish) 또는 종자 알레르기 항원일 수 있다.

항원은 자가면역 질환에 관여할 수 있고, 바람직하게는 인간 항원이다. 바람직한 항원은 티로글로불린, 갑상선 퍼옥시다제, 류마토이드 인자(IgA, IgG, IgM), 시트룰린화 펩타이드, 히스티딜-tRNA 합성효소(Jo-1), PM-Scl, 보체, 보체 성분 C4c 및 C3c; 전체 보체(CH50), Sm/RNP, SS-A 및 -B(Sjogren a 및 b), Scl-70, 토포이소머라제, 리보솜 P 단백질, 액틴, 조직 트랜스글루타미나제, 미엘로퍼옥시다제, 프로테이나제-3, M-형 포스포리파제 A, 간 신장 마이크로좀 항원 타입-1(항-LKM1), 항-간 시토졸 타입 1(항-LC1), SMA, 피루베이트 데하이드로게나제 복합체 E2 아단위, 핵 모공 gp210, 핵 바디 sp100, 고이동성 그룹 박스 1, 콜라겐, 콜라겐 타입 II, 콜라겐 타입 IV, 콜라겐 VII, hLAMP-2, 전위 의존성 칼륨 채널(VGKC), N-메틸-D-아스파르트산 수용체(NMDAR), Hu, Yo, Ri, Ma 1/2, CRMP-5, 암피피신, 열 충격 단백질(HSPs), HSP60, 응고 인자 VIII, 증식 세포 핵 항원(PCNA), DNA 폴리머라제, 레코베린, α-에놀라제, 트랜스두신-α, 미엘린 염기성 단백질(MBP), 인자 VIII(FVIII), 인자 IX(FIX), 아밀로이드 β 펩타이드(Aβ), 미엘린 올리고덴드로사이트 글리코단백질(MOG; see www.discoverymedicine.com/category/species-and-cell-types/human/brain/oligodendrocyte/), 미멜린 염기성 단백질(MBP), 과립구 마크로파지-콜로니 자극 인자(GM-CSF), 인터페론(IFN)-γ, 인터류킨-(IL)-6, IL-17A, IL-17F, IL-22, 히스톤 H1,사이토크롬 P450, 미엘린, 아쿠아포린-4(AQP-4), Ro, La, 근육-특이적 키나제(MuSK), 액티닌-α4, α-에놀라제, 신장 인자 2, 글루타메이트 수용체(NR2), 라미닌, 미오신, smD1, PM-Scl, 피브릴라린, RNA 폴리머라제 I, NOR), Scl-70, 사이클린 I 및 II, 간-특이적 단백질, 포르미미노트랜스퍼라제-사이클로데아미나제(LC-1), 가용성 간 항원/간-췌장 항원(SLA/LP), 데스모글레인 1 또는 3, 엔보플라킨, BP180 단백질, BP230 단백질, 미엘린-관련 글리코단백질, 글루탐산 데카복실라제(GAD), 티로신 포스파타제(IA2), 인슐린, H+/K+-ATPase, 엘라스타제, 카텝신 G, 칵토페린, BPI, rPAg1(CUZD1) 및 rPAg2(GP2), 포스포리파제 A2 수용체, 글리아딘-유사 융합 펩타이드, 글루탐산 데카복실라제(GAD65), 및 티로트로핀 수용체 항원일 수 있다.

상기 항원은 독소, 예를 들어, 보툴리늄 신경독소, 클로스트리듐 퍼프린겐스 엡실론 독소, 리신, 삭시톡소, 쉬가톡소, 테트로도독소, 스타필로코쿠스 엔테로독소 등을 인용할 수 있다. 무신도 또한 당해 기술 분야에 널리 알려져 있다. MUC5AC, MUC5B 및 MUC2가 그의 예이다. 특히, 이들은 천연-발생 폴리사카라이드, 예를 들어, 그룹 B 스트렙토코쿠스 및 뉴모코쿠스 캡슐 폴리사카라이드(III형 포함), 슈도모나스 아에루기노사(Pseudomonas aeruginosa) 뮤코엑소폴리사카라이드, 및 캡슐 폴리사카라이드(피셔 I형 포함), 및 해모필루스 인플루엔재(Haemophilus influenzae) 폴리사카리이드일 수 있다.

바람직한 실시형태에서, 상기 항원 또는 에피토프는 하기로 이루어진 그룹으로부터 선택되는 바이러스에 의해 발현된다: 인플루엔자 바이러스, A형 간염 바이러스, B형 간염 바이러스, C형 간염 바이러스, E형 간염 바이러스, G형 간염 바이러스, HIV 바이러스, 황열 바이러스, 뎅기 바이러스, 일본 뇌염 바이러스, 진드기-매개 뇌염 바이러스, 누수투 또는 웨스트 나일 바이러스, 리프트 계곡 열 또는 토스카나 바이러스, 치쿤구니아 바이러스, 옴스크 출혈열 바이러스, 알크후마 출혈열 바이러스, 키아사누르 삼림병 바이러스, 베네주엘라 말 뇌염 바이러스, 동부 말 뇌염 바이러스, 서부 말 뇌염 바이러스, 로스 리버 바이러스, 마야로 바이러스, 호흡기 합포체 바이러스, 로시오 바이러스, 홍역 바이러스, 머레이 계곡 뇌염 바이러스, 베셀스브론 바이러스, 지카 바이러스, 림프구 무도수막염(lymphocytic choreomeningitis) 바이러스, 에볼라 바이러스, 마르부르그 바이러스, 크리미아-콩고 출혈 열 바이러스, 리사 바이러스, 주닌(Junin) 바이러스, 마추포(Machupo) 바이러스(http://en.wikipedia.org/wiki/Machupo_virus), 사비아(Sabia) 바이러스, 구아나리토(Guanarito) 바이러스, 유행성 이하선염 바이러스, 광견병 바이러스, 루벨라(rubella) 바이러스, 수두 대상 포진 바이러스, 단순 포진 1형 및 2형 바이러스, 더욱 일반적으로 알파바이러스, 아데노바이러스, 한타바이러스, 에코바이러스, 로타바이러스, 플라비바이러스, 리노바이러스, 오쏘부냐바이러스(orthobunyavirus), 폴리오바이러스, 폭스바이러스(예를 들어, 천연두(http://en.wikipedia.org/wiki/Smallpox), 원두, 블랙폭스 또는 카나리아 두창), 오쏘믹소바이러스(예를 들어, 인플루엔자바이러스 A, 인플루엔자바이러스 B, 인플루엔자바이러스 C, http://en.wikipedia.org/wiki/Influenza_A_virus; http://en.wikipedia.org/wiki/Influenzavirus_B; http://en.wikipedia.org/wiki/Influenzavirus_C), 피코나바이러스(예를 들어, 구제역 바이러스, FMDV, http://en.wikipedia.org/wiki/Picornavirus), 인간 파보바이러스, 엔테로바이러스, 코로나바이러스(예를 들어, SARS 또는 인간 베타코로나바이러스), 인간 파필로마바이러스, 헤르페스 바이러스, 인간 시토메갈로바이러스, 엡스테인-바르 바이러스, 파라믹소바이러스(http://en.wikipedia.org/wiki/Paramyxovirus), 예를 들어, 1, 2 및 3형의 파라인플루엔재 바이러스, 또는 임의의 확인된 바이러스.

바람직한 실시형태에서, 상기 항원 또는 에피토프는 하기로 이루어진 그룹으로부터 선택되는 과에 속하는 바이러스에 의해 발현된다: 플라비비리대(뎅기 바이러스, 황열 바이러스, 웨스트 나일 바이러스, 일본 뇌염 바이러스, 진드기-매개 뇌염 바이러스, C형 간염 바이러스), 토가비리대(치쿤구니아 바이러스, 로스 강 바이러스, 마야로 바이러스, 서부 말 뇌염 바이러스, 동부 말 뇌염 바이러스, 베네주엘라 말 뇌염 바이러스), 부냐비리대(크리미아-콩고 출혈 열 바이러스, 리프트 계곡 열 바이러스, 쉬말렌베르그 바이러스), 칼리시비리대(E형 간염 바이러스), 아레나비리대(라사 바이러스) 및 필로비리대(에볼라 바이러스, 마르부르그 바이러스).

또 다른 바람직한 실시형태에서, 상기 항원 또는 에피토프는 기생 원생동물, 예를 들어, 레이슈마니아(Leishmania) 속으로부터의 것, 또는 톡소플라스마 곤디( Toxoplasma Gondii), 엔타모에바 히스톨리티카(Entamoeba histolytica), 플라스 모듐 팔시파룸(Plasmodium falciparum)(예를 들어, MSP1(19)+ AMA-1(III) 항원, 별개로 또는 동시-발현됨), 뉴모시스티스 카리니(Pneumocystis carinii), 크립토스포리디움(Kryptosporidium), 나에글레리아 포우레리(Naegleria fowleri)(http://en.wikipedia.org/wiki/Naegleria_fowleri), 또는 기아르 디아 람블리아)(Giardia lamblia), 벌레(예: 트리파노소마 크루지(Trypanosoma cryzi), 선충, 촌충 또는 흡충), 또는 절지동물(예: 갑각류, 곤충, 거미류)에 의해 발현된다.

또 다른 바람직한 실시형태에서, 상기 항원 또는 에피토프는, 예를 들어, 살모넬라(Salmonella), 쉬겔라(Shigella), 스트렙토코쿠스(Streptococcus), 스타필로코쿠스(Staphylococcus), 미코플라스마(Mycoplasma), 디프테리애(Diphteriae), 렙토스피로사(Leptospirosa), 리케챠(Rickettsia) 또는 에쉐리키아(Escherichia)의 속의 감염성 세균에 의해 발현된다. 추가의 바람직한 실시형태에서, 상기 세균은 트레포네마 팔리둠(Treponema pallidum )(http://en.wikipedia.org/wiki/Treponema_pallidum), 헬리코박터 필로리(Helicobacter pylori), 캄필로박터 제주니(Campylobacter jejuni), 보렐리아 부르그도르페리(Borrelia burgdorferi), 레기오넬라 뉴모필라(Legionella pneumophila), 예르시니아 페스티스(Yersinia pestis), 예르시니아 엔테로콜리티카(Yersinia enterocolitica), 브루셀라 아보르투스(Brucella abortus), 부르크홀데리아 말레이(Burkholderia mallei)(http://en.wikipedia.org/wiki/Burkholderia_mallei), 브르크홀데리아 슈도말레이(Burkholderia pseudomallei)(http://en.wikipedia.org/wiki/Burkholderia_pseudomallei), 클라미디아 뉴모니아(Chlamydia pneumonia), 프란시셀라 투라렌시스(Francisella tularensis), 마이코플라스마 뉴모니아(Mycoplasma pneumonia), 에이치. 인플루엔자에(H. influenzae), 에스. 뉴모니아에(S. pneumoniae), 클레브시엘라 뉴모니아에(Klebsiella pneumoniae), 에스. 아우레우스(S. aureus), 바실루스 안트라시스(Bacillus anthracis), 클로스트리디움 보툴리눔(Clostridium botulinum)(http://en.wikipedia.org/wiki/Clostridium_botulinum), 클로스트리디움 퍼프린겐스(Clostridium perfringens)(http://en.wikipedia.org/wiki/Clostridium_perfringens), 리스테리아 모노사이토게네스(Listeria monocytogenes), 보르데텔라 퍼투시스(Bordetella pertussis), 클로스트리디움 테타니(Clostridium tetani), 네이세리아 메닝기티디스(Neisseria meningitidis)(http://en.wikipedia.org/wiki/Neisseria_meningitidis), 에스. 에피더미디스(S. epidermidis), 엔. 메닌기디티스(N. meningiditis), 슈도모나스 아에루기노사(Pseudomonas aeruginosa), 클라미디아 트라초마티스(Chlamydia trachomatis), 미코박테리움 투버쿨로시스(Mycobacterium tuberculosis), 콕시엘라 부르네티(Coxiella burnetii), 릭케트시아 프로바제키(Rickettsia prowazekii)(http://en.wikipedia.org/wiki/Rickettsia_prowazekii), 클라미디아 시타시(Chlamydia psittaci)(http://en.wikipedia.org/wiki/Chlamydia_psittaci), 렙토스피로사 인테로간스(Leptospirosa interrogans) 및 이. 콜라이(E.coli)(예를 들어, 이. 콜라이 O157:H7(http://en.wikipedia.org/wiki/Escherichia_coli_O157:H7)) 중에서 선택되는 종에 속한다.

또 다른 바람직한 실시형태에서, 상기 항원 또는 에피토프는 진균 또는 효모에 의해, 예를 들어, 칸디다( Candida), 아스퍼질루스(Aspergillus), 크립토코쿠스( Cryptococcus), 히스토플라스마(Histoplasma), 뉴모시스티스(Pneumocystis) 또는 스타치보트리스(Stachybotrys)의 종으로부터 발현된다.

항원 또는 에피토프는 프리온 단백질(PrPc)로부터 유래할 수 있다.

에피토프는 특이적 면역글로불린, 예를 들어, IgD, IgG1, IgG2, IgG3, IgG4, IgA, IgM, IgE, 또는 IgG 등으로부터 유래할 수 있다.

항원은 통상적으로 특이적 항체에 대해 상호작용의 관점에서 작용할 수 있는 수개의 표면 특징을 나타낸다. 이러한 구별되는 분자적 특징이 에피토프를 구성한다. 따라서, 본원에서 사용되는 용어 "에피토프"는 항원의 특정한 분자 표면 특징, 예를 들어, 하나 이상의 항체에 의해 결합될 수 있는 항원의 단편을 나타낸다. 따라서, 분자적 수준에서, 에피토프는 특이적 항체에 의해 인지되고 결합되는 항원의 특정 분자적 표면 특징(예를 들어, 항원의 단편)에 상응한다. 본 발명과 관련하여, "융합 단백질"은 표적 항체에 의해 인지되는 하나 이상의 에피토프를 포함한다. 바람직하게는, 상기 융합 단백질은 수개의 에피토프(http://en.wikipedia.org/wiki/Epitope)를 포함하는 전체 항원을 포함한다. 이들 에피토프는 선형 또는 입체형태적(conformational) 에피토프일 수 있다. 본원에서 사용되는 바와 같이, 선형(또는 순차적) 에피토프는 항체(http://en.wikipedia.org/wiki/Antibody), 아미노산(http://en.wikipedia.org/wiki/Amino_acid)의 선형 서열 또는 일차 구조(http://en.wikipedia.org/wiki/Primary_structure)에 의해 인지되는 에피토프이다. 이와는 반대로, 입체형태적 에피토프(http://en.wikipedia.org/wiki/Conformational_epitope)는 이의 특이적 3차원 모양에 의해 인지된다. 바람직하게는, 본 발명의 융합 단백질은 대부분의 폴리클로날 항체가 인지하는 바와 같이 입체형태적 에피토프를 포함한다.

그러나, 이러한 항원이 교차-반응성 에피토프, 즉, 에피토프에 결합될 비-특이적 항체에 의해 인지되는 에피토프를 나타내지는 않는다는 것이 중요하다. 만약 이러한 경우, 본 발명의 특이성이 감소될 것이다.

바람직한 실시형태에서, 상기 에피토프는 바이러스 단백질, 바람직하게는 EDIII 단백질 상에 존재하고, 이는 뎅기 바이러스 1, 뎅기 바이러스 2, 뎅기 바이러스 3, 뎅기 바이러스 4, 웨스 나일 바이러스, 황열 바이러스, 일본 뇌염 바이러스, 지카 바이러스, 베셀스브론 바이러스, 로시오 바이러스, 머레이 뇌염 바이러스, 세인트-루이스 뇌염 바이러스, 유전형 1의 일본 뇌염 바이러스, 유전형 2의 일본 뇌염 바이러스, 유전형 4의 일본 뇌염 바이러스, 유전형 5의 일본 뇌염 바이러스 및 라벤스버그 바이러스로 이루어진 그룹으로부터 선택된다.

더욱 바람직한 실시형태에서, 상기 에피토프는 하기로 이루어진 그룹으로부터 선택되는 바이러스 단백질 상에 존재한다: 서열번호 3의 뎅기 바이러스 1의 EDIII 단백질, 서열번호 4의 뎅기 바이러스 2의 EDIII 단백질, 서열번호 5의 뎅기 바이러스 3의 EDIII 단백질, 서열번호 6의 뎅기 바이러스 4의 EDIII 단백질, 서열번호 7의 웨스트 나일 바이러스의 EDIII 단백질, 서열번호 8의 황열 바이러스의 EDIII 단백질, 서열번호 9의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 10의 지카 바이러스의 EDIII 단백질, 서열번호 11의 베셀스브론 바이러스의 EDIII 단백질, 서열번호 12의 로시오 바이러스의 EDIII 단백질, 서열번호 13의 머레이 뇌염 바이러스의 EDIII 단백질, 서열번호 14의 세인트-루이스 뇌염 바이러스의 EDIII 단백질, 서열번호 54에 의해 인코딩되는 유전형 1의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 55에 의해 인코딩되는 유전형 2의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 56에 의해 인코딩되는 유전형 4의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 57에 의해 인코딩되는 유전형 5의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 58에 의해 인코딩되는 라벤스버그 바이러스의 EDIII 단백질, 및 HIV1, HIV2, B형 간염 바이러스, C형 간염 바이러스, E형 간염 바이러스, 웨스트-나일 바이러스 및 HPV 16, 18, 31, 33, 35, 39, 45, 51, 52, 56, 58, 59, 66 및 68와 같은 종양 HPV 스트레인의 바이러스 단백질.

바람직한 실시형태에서, 본 발명의 방법에서 사용되는 융합 단백질에서 hAGT 효소와 융합되는 제1 및 제2 에피토프(또는 항원)는 동일한 분류 수준에 속한다. 즉, 이들은 동일한 과(예: 플라비비리대 과, 부냐비리대 과, 아레나비리대 과 또는 필로비리대 과) 또는 속 또는 종에 속하나 상이한 혈청형을 갖는다. 달리, 상기 제1 및 제2 에피토프는 긴밀히 관련된, 예를 들어, 동일한 과, 속 또는 종에 속하나 뎅기 바이러스 1, 2, 3, 또는 4와 같이 상이한 혈청형을 갖는, 바이러스에 의해 발현될 수 있다.

달리, 또 다른 바람직한 실시형태에서, 상기 제1 및 제2 에피토프(또는 항원)는 비관련된 생물학적 과, 속 또는 종에 속한다.

에피토프는 바이러스 에피토프일 수 있다. 바람직하게는, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 에피토프가 바이러스 에피토프로부터 선택된다. 바람직하게는, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 에피토프가 뎅기 바이러스(혈청형 1, 2, 3 또는 4), 웨스트 나일 바이러스, 황열 바이러스, 일본 뇌염 바이러스, 진드기-매개 뇌염 바이러스, 세인트-루이스 뇌염 바이러스, 머레이 계곡 뇌염 바이러스, 베셀스브론 바이러스, 지카 바이러스, 로시오 바이러스, 우수투 바이러스, 리프트 계곡 열 바이러스 및 치쿤구니아 바이러스 에피토프로부터 선택된다. 보다 바람직하게는, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 에피토프가 뎅기 바이러스(혈청형 1, 2, 3 또는 4), 웨스트 나일 바이러스, 황열 바이러스, 일본 뇌염 바이러스, 진드기-매개 뇌염 바이러스, 세인트-루이스 뇌염 바이러스, 머레이 계곡 뇌염 바이러스, 베셀스브론 바이러스, 지카 바이러스, 로시오 바이러스, 우수투 바이러스, 리프트 계곡 열 바이러스, 치쿤구니아 바이러스, SARS 코로나바이러스, 인간 코로나바이러스, C형 간염 바이러스(HCV), E형 간염 바이러스(HEV) 또는 쉬말렌베르그 바이러스 에피토프로부터 선택된다.

바람직하게는, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 에피토프는 뎅기 바이러스(혈청형 1, 2, 3 또는 4), 웨스트 나일 바이러스, 황열 바이러스, 일본 뇌염 바이러스, 진드기-매개 뇌염 바이러스, 세인트-루이스 뇌염 바이러스, 머레이 계곡 뇌염 바이러스, 베셀스브론 바이러스, 지카 바이러스, 로시오 바이러스, 우수투 바이러스, 리프트 계곡 열 바이러스, 치쿤구니아 바이러스, SARS 코로나바이러스, 인간 코로나바이러스, C형 간염 바이러스(HCV), E형 간염 바이러스(HEV), 쉬말렌베르그 바이러스, HIV1, HIV2, B형 간염 바이러스 및 HPV 에피토프로부터 선택된다. 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 에피토프는 달리는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 상술된 바이러스의 임의의 그룹으로부터 선택될 수 있다.

바람직하게는, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 에피토프는 플라비리대 ( Flaviviridae) 에피토프로부터 선택된다. 바람직하게는, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 에피토프는 토가비리대 ( Togaviridae) 에피토프로부터 선택된다. 바람직하게는, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 에피토프는 분야비리대( Bunyaviridae) 에피토프로부터 선택된다. 바람직하게는, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 에피토프는 칼리시비리대( Caliciviridae) 에피토프로부터 선택된다. 바람직하게는, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 에피토프는 아레나비리대( Arenaviridae) 에피토프로부터 선택된다. 바람직하게는, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 에피토프는 필로비리대( Filoviridae) 에피토프로부터 선택된다. 바람직하게는, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 에피토프는 폭스비리대( Poxviridae) 에피토프로부터 선택된다.

에피토프는 세균 에피토프일 수 있다. 바람직하게는, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 에피토프는 세균 에피토프로부터 선택된다. 바람직하게는, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 에피토프는 트레포네마 팔리둠(Treponema pallidum)(http://en.wikipedia.org/wiki/Treponema_pallidum), 헬리코박터 필로리(Helicobacter pylori), 캄필로박터 제주니(Campylobacter jejuni), 보렐리아 부르그도르페리(Borrelia burgdorferi), 레지오넬라 뉴모필라(Legionella pneumophila), 예르시니아 페스티스(Yersinia pestis)(http://en.wikipedia.org/wiki/Yersinia_pestis), 예르시니아 엔테로콜리티카(Yersinia enterocolitica), 브루셀라 아보르투스(Brucella abortus), 부르크홀데리아 말레이(Burkholderia mallei), 부르크홀데리아 슈도말레이(Burkholderia pseudomallei), 클라미디아 뉴모니아(Chlamydia pneumonia), 프란시셀라 툴라렌시스(Francisella tularensis), 마이코플라스마 뉴모니아(Mycoplasma pneumonia), 에이치. 인플루엔자(H. influenzae), 에스. 뉴모니아에(S. pneumoniae), 클레브시엘라 뉴모니아에(Klebsiella pneumoniae), 에스. 아우레우스(S. aureus), 바실루스 안트라시스(Bacillus anthracis), 클로스트리디움 보툴리눔(Clostridium botulinum), 클로스트리디움 퍼프린겐스(Clostridium perfringens), 리스테리아 모노시토게네스(Listeria monocytogenes), 보르데텔라 퍼투시스(Bordetella pertussis), 클로스트리디움 테타니(Clostridium tetani), 네이세리아 메닝기티디스(Neisseria meningitidis), 에스. 에피데르미디스(S. epidermidis), 엔. 메닝기디티스(N. meningiditis), 슈도모나스 에루기노사(Pseudomonas aeruginosa), 클라미디아 트라코마티스(Chlamydia trachomatis), 마이코박테리움 투베르쿨로시스(Mycobacterium tuberculosis), 콕시엘라 부르네티(Coxiella burnetii), 릭켓시아 프로와제키(Rickettsia prowazekii), 클라미디아 시타시(Chlamydia psittaci), 렙토스피로사 인테로간스(Leptospirosa interrogans) 및 이. 콜라이(E.coli)(예를 들어, 이. 콜라이, O157:H7) 에피토프로부터 선택된다. 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 에피토프는 달리는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 상술된 세균의 임의의 그룹으로부터 선택될 수 있다.

바람직하게는, 적어도 1, 2, 3 또는 4개의 에피토프는 렙토스피라 에피토프, 가장 바람직하게는 LruA, LruB, HbpA 또는 LipL32 에피토프로부터 선택된다.

일부 실시형태에서, 제1 또는 제2 융합 단백질은 서열번호 3 내지 14 및 54 내지 58 중의 어느 하나에 의해 인코딩된 적어도 하나의 아미노산 서열, 또는 이의 적어도 10, 15, 20, 25, 30, 40, 50, 60, 100, 200 또는 300개의 연속 아미노산을 포함한다.

일부 실시형태에서, 제1 또는 제2 융합 단백질은 서열번호 155, 157, 159, 161, 163, 165, 167, 171, 173, 175, 177 및 179 중의 어느 하나에 의해 인코딩된 하나 이상의 아미노산 서열, 또는 이의 적어도 10, 15, 20, 25, 30, 40, 50, 60, 100, 200 또는 300개의 연속 아미노산을 포함한다.

일부 실시형태에서, 제1 또는 제2 융합 단백질은 서열번호 3 내지 14 및 54 내지 58 중의 어느 하나에 의해 인코딩된 하나 이상의 아미노산 서열을 포함하고/하거나 서열번호 155, 157, 159, 161, 163, 165, 167, 171, 173, 175, 177 및 179로부터 선택된 하나 이상의 아미노산 서열, 또는 이의 적어도 10, 15, 20, 25, 30, 40, 50, 60, 100, 200 또는 300개의 연속 아미노산을 포함한다.

일부 실시형태에서, 제1 또는 제2 융합 단백질은 SARS 코로나바이러스의 돌연변이된 N 단백질, SARS 코로나바이러스의 S 단백질의 RBD, 인간 베타코로나바이러스의 N 단백질, 인간 베타코로나바이러스의 S1 단백질, 인간 베타코로나바이러스의 S 단백질의 RBD, C형 간염(HCV) 바이러스의 돌연변이된 C 단백질, HEV 코어 항원, HCV 코어 항원, HCV 코어 항원의 짧은 형태, 쉬말렌베르그 바이러스의 NS 단백질로부터 선택된 하나 이상의 아미노산 서열을 포함한다.

일부 실시형태에서, 제1 또는 제2 융합 단백질은 도 12 내지 16 및 21 내지 24에 도시된 바이러스 아미노산 서열의 적어도 10, 15, 20, 25, 30, 40, 50, 60, 100, 200 또는 300개의 연속 아미노산을 포함한다.

일부 실시형태에서, 제1 또는 제2 융합 단백질은 LruA, LruB 또는 LipL32 단백질로부터 선택된 적어도 하나의 아미노산 서열을 포함한다. 바람직하게는, 제1 또는 제2 융합 단백질은 도 17, 18 또는 19에 도시된 LruA, LruB 또는 LipL32 아미노산 서열의 적어도 10, 15, 20, 25, 30, 40, 50, 60, 100, 200 또는 300개의 연속 아미노산을 포함한다.

일부 실시형태에서, 상기 에피토프는 도 17, 18 또는 19에 도시된 서열의 적어도 10, 15, 20, 25, 30, 40, 50, 60, 100, 200 또는 300개의 보존적 LruA, LruB 또는 LipL32 아미노산을 포함한다.

본 발명의 면역분석은 공지 또는 미지인 다수의 항체를 동시에 검출할 수 있다. 본원에서 "다수"란 적어도 5개, 바람직하게는 적어도 15개, 더욱 바람직하게는 적어도 50개, 더욱더 바람직하게는 적어도 100개의 항체이다. 따라서, 바람직한 실시형태에서, 본 발명의 분석 방법은 피험자로부터의 생물학적 샘플 중의 적어도 5개, 바람직하게는 적어도 15개, 더욱 바람직하게는 적어도 50개, 더욱더 바람직하게는 적어도 100개의 표적 항체를 검출하는데 이용된다. 절차가 항체의 특성에 의거하지 않고 항체의 존재를 검출하는 것에 의거하기 때문에, 특정의 항체가 적절히 특징화 되는지 여부는 본 발명의 방법과 관련이 없다.

본 발명의 바람직한 실시형태에서, 상기 제1 및 제2 고체 지지체와 커플링되는 제1 및 제2 융합 단백질은 하기로 이루어진 그룹으로부터 선택된다:

- 서열번호 21(융합 단백질 [SNAP-DEN1.EDIII]에 상응)

- 서열번호 42(융합 단백질 [SNAP-SBV.N]에 상응)

- 서열번호 49(융합 단백질 [SNAP-EV71.VP1]에 상응)

- 서열번호 51(융합 단백질 [JE.sE-SNAP]에 상응)

- 서열번호 53(융합 단백질 [SNAP-JE-1.EDIII]에 상응)

- 서열번호 60(융합 단백질 [SNAP- JE-2.EDIII]에 상응)

- 서열번호 62(융합 단백질 [SNAP- JE-4.EDIII]에 상응)

- 서열번호 64(융합 단백질 [SNAP- JE-5.EDIII]에 상응)

- 서열번호 66(융합 단백질 [SNAP- RabV.EDIII]에 상응)

- 서열번호 68(융합 단백질 [SNAP- 플라비바이러스.EDIII]에 상응)

- 서열번호 70(융합 단백질 [RR.sE2-SNAP]에 상응)

- 서열번호 72(융합 단백질 [MAY.sE2-SNAP]에 상응)

- 서열번호 74(융합 단백질 [WEE.sE2-SNAP]에 상응)

- 서열번호 76(융합 단백질 [EEE.sE2-SNAP]에 상응)

- 서열번호 78(융합 단백질 [VEE.sE2-SNAP]에 상응)

- 서열번호 80(융합 단백질 [SNAP- AKA.N]에 상응)

- 서열번호 82(융합 단백질 [SNAP- AIN.N]에 상응)

- 서열번호 84(융합 단백질 [SNAP- SHA.N]에 상응)

- 서열번호 86(융합 단백질 [SNAP- huCOV.N]에 상응)

- 서열번호 88(융합 단백질 [SNAP- huCOV.S]에 상응)

- 서열번호 90(융합 단백질 [SNAP- HCV.C]에 상응)

- 서열번호 92(융합 단백질 [SNAP- MSP+AMA]에 상응)

- 서열번호 94(융합 단백질 [SNAP- HbpA1]에 상응)

- 서열번호 96(융합 단백질 [SNAP- MUB40]에 상응)

- 서열번호 98(융합 단백질 [SNAP- moCLEC5A]에 상응)

- 서열번호 100(융합 단백질 [SNAP- huCLEC5A]에 상응)

- 서열번호 102(융합 단백질 [SNAP- cxVAGO]에 상응)

- 서열번호 104(융합 단백질 [SNAP- aaVAGO]에 상응)

- 서열번호 109(융합 단백질 [SNAP- CCHF.N]에 상응)

- 서열번호 111(융합 단백질 [SNAP- EBO.N]에 상응)

- 서열번호 113(융합 단백질 [SNAP- MAR.N]에 상응)

- 서열번호 115(융합 단백질 [SNAP- LAS.N]에 상응)

- 서열번호 117(융합 단백질 [SNAP- JUN.N]에 상응)

- 서열번호 119(융합 단백질 [SNAP- MAC.N]에 상응)

- 서열번호 121(융합 단백질 [SNAP- GUA.N]에 상응)

- 서열번호 123(융합 단백질 [SNAP- SAB.N]에 상응)

- 서열번호 125(융합 단백질 [SNAP- OMSK.EDIII]에 상응)

- 서열번호 127(융합 단백질 [SNAP- KYA.EDIII]에 상응)

- 서열번호 129(융합 단백질 [SNAP- ALK.EDIII]에 상응)

- 서열번호 131(융합 단백질 [LAS.ectoGP1-SNAP]에 상응)

- 서열번호 133(융합 단백질 [JUN.ectoGP1-SNAP]에 상응)

- 서열번호 135(융합 단백질 [MAC.ectoGP1-SNAP]에 상응)

- 서열번호 137(융합 단백질 [GUA.ectoGP1-SNAP]에 상응)

- 서열번호 139(융합 단백질 [SAB.ectoGP1-SNAP]에 상응)

- 서열번호 141(융합 단백질 [LAS.ectoGP2-SNAP]에 상응)

- 서열번호 143(융합 단백질 [JUN.ectoGP2-SNAP]에 상응)

- 서열번호 145(융합 단백질 [MAC.ectoGP2-SNAP]에 상응)

- 서열번호 147(융합 단백질 [GUA.ectoGP2-SNAP]에 상응)

- 서열번호 149(융합 단백질 [SAB.ectoGP2-SNAP]에 상응), 및

- 서열번호 151((융합 단백질 [SNAP- HEV.C]에 상응).

따라서, 본 발명의 시험관내 방법으로 바이러스, 세균, 효모 또는 진균-매개된 감염인 표적 질환(들)을 검출할 수 있다. 바람직하게는, 상기 바이러스 감염은 파필로마바이러스 또는 플라비비리대(뎅기 바이러스, 황열 바이러스, 웨스트 나일 바이러스, 일본 뇌염 바이러스, 진드기-매개 뇌염 바이러스, C형 간염 바이러스), 토가비리대(치쿤구니아 바이러스, 로스 강 바이러스, 마야로 바이러스, 서부 말 뇌염 바이러스, 동부 말 뇌염 바이러스, 베네주엘라 말 뇌염 바이러스), 부냐비리대(크리미아-콩고 출혈 열 바이러스, 리프트 계곡 열 바이러스, 쉬말렌베르그 바이러스), 칼리시비리대(E형 간염 바이러스), 아레나비리대(라사 http://en.wikipedia.org/wiki/Lassa_virus) 및 필로비리대(에볼라 http://en.wikipedia.org/wiki/Ebola_virus, 마르부르그 http://en.wikipedia.org/wiki/Marburg_virus)의 과로부터의 RNA 바이러스에 의해 유발된다. 바람직하게는, 상기 세균 감염은 렙토스피로사 인테로간스에 의해 유발된다. 바람직하게는, 상기 감염은 플라스모듐 팔시파룸에 의해 유발된다.

본원에서 사용되는 용어 "생물학적 샘플"은 환자로부터 수득되고 항체를 포함할 수 있는 임의의 샘플을 말한다. 바람직하게는, 상기 생물학적 샘플은 생물학적 유체, 예를 들어 비여과 생물학적 유체, 예를 들어 소변, 뇌척수액, 늑막액, 윤활액, 복막액, 양수, 위액, 혈액, 혈청, 혈장, 림프액, 간질액, 타액, 생리학적 분비물, 눈물, 점액, 땀, 젖, 정액(semen, seminal fluid), 질 분비물, 궤양 및 다른 표면 발진으로부터의 유체, 수포 및 농양이다. 또한, 생물학적 샘플은 또한 항체를 포함할 수 있는 정상적, 악성 및 의심되는 조직 또는 임의의 다른 신체 구성물의 생검을 포함한 조직의 추출물을 말한다. 상기 생물학적 샘플은 사용 전에, 예를 들어, 혈액으로부터 혈장을 준비하고 점성 유체를 희석시키는 등과 같이 전처리될 수 있으며; 처리 방법은 여과, 증류, 농축, 간섭 화합물의 불활성화, 및 시약 첨가를 포함할 수 있다. 바람직한 실시형태에서, 상기 생물학적 샘플은 전혈, 혈청, 혈장, 소변, 정액, 뇌척수액 및 타액으로부터 선택된다.

AGT 폴리펩타이드

O⁶-알킬구아닌-DNA 알킬트랜스퍼라제 활성을 갖는 임의의 폴리펩타이드를 본 발명의 방법에 사용할 수 있다. 본 발명의 목적 상, 이들 폴리펩타이드는 "AGT 폴리펩타이드"로 지칭될 것이다.

AGT는 이의 기질인 O⁶-알킬구아닌-DNA로부터의 알킬 그룹을 이의 시스테인 부분에 비가역적으로 전달한다. AGT와 신속히 반응하는 기질 동족체는 O⁶-벤질-구아닌이고, 이차 속도 상수는 약 10³ sec^-1 M^-1이다.

본 발명과 관련하여, 폴리펩타이드가 O⁶-알킬구아닌-포함 분자로부터의 알킬 그룹을 그 자신의 시스테인 부분에 비가역적으로 전달할 수 있는 경우, 이 폴리펩타이드를 "O⁶-알킬구아닌-DNA 알킬트랜스퍼라제 활성"(또는 "AGT 활성")을 갖는다고 한다. 상기 폴리펩타이드의 "O⁶-알킬구아닌-DNA 알킬트랜스퍼라제 활성"은, 예를 들어, 공지된 표지된 O⁶-벤질-구아닌 유도체를 접촉시키고, 상기 표지가 시험되는 폴리펩타이드에 전달되는 것을 모니터링함으로써 측정될 수 있다. 분석이 세포에서(in cellulo) 또는 세포 추출물에서 수행되는 경우, 숙주 세포의 내인성 AGT의 반응이 조절되어야 하며, 이렇게 함으로써 내인성 AGT가 상기 폴리펩타이드를 방해하지 않는다. 따라서, 공지된 AGT-결핍 세포주가 바람직하게 사용된다. AGT 활성을 확인하는 분석은 널리 알려져 있다. 수개의 O⁶-벤질-구아닌 유도체가 시판된다(O⁶-벤질-구아닌은, 예를 들어, Santa Cruz biotechnology에 의해 공급되며, 형광-표지된 O⁶-벤질-구아닌 유도체는 New England Biolabs NEB에 의해 입수될 수 있다). 이들 분석 중 일부가 WO 2005/085470 및 WO 2004/031405에 기술되어 있다.

본 발명과 관련하여, AGT 폴리펩타이드의 "촉매 도메인"은 효소의 활성 부위, 또는, 달리, 이의 기질인 O⁶-알킬구아닌-DNA로부터의 알킬 그룹을 반응성 시스테인 부분으로 전달하는 효소의 부분에 상응한다. 활성 부위에서 O⁶-벤질구아닌과 결합하는 hAGT의 구조에서, 4개의 아미노산이 벤질 환에 가까이 있거나(Pro140, Ser159, Gly160), 핵염기의 N9와 접촉될 수 있다(Asn157). 위치 Pro140 및 Gly160에서의 돌연변이는 hAGT와 O⁶-벤질구아닌와의 반응에 영향을 끼치는 것으로 이전에 밝혀졌으며(Xu-Welliver et al., Biochemical Pharmacology 1999), 위치 140에서의 프롤린은 벤질 환과의 상호작용에 필수적인 것으로 믿어지며, 돌연변이 Gly160Trp은 O⁶-벤질구아닌에 대한 hAGT의 반응성을 증가시키는 것으로 알려져 있다.

바람직한 실시형태에서, O⁶-알킬구아닌-DNA 알킬트랜스퍼라제 활성을 갖는 AGT 폴리펩타이드는 서열번호 1의 인간 AGT 폴리펩타이드(NP_002403.2), NP_032624.1(서열번호 18)로 확인되는 마우스 AGT, NP_036993.1(서열번호 19)로 확인되는 래트 MGMT 또는 O⁶-알킬구아닌-DNA 알킬트랜스퍼라제 활성을 갖는 이의 상동성 서열이다.

본원에서 사용되는 용어 "상동성"은 서열 유사성을 갖는 서열을 말한다. 용어 "서열 유사성"은 이의 모든 문법적 형태에서 핵산 또는 아미노산 서열 간의 동일성 또는 상응 정도를 말한다. 본 발명과 관련하여, 2개의 아미노산 서열은 적어도 약 80%, 달리 적어도 약 81%, 달리 적어도 약 82%, 달리 적어도 약 83%, 달리 적어도 약 84%, 달리 적어도 약 85%, 달리 적어도 약 86%, 달리 적어도 약 87%, 달리 적어도 약 88%, 달리 적어도 약 89%, 달리 적어도 약 90%, 달리 적어도 약 91%, 달리 적어도 약 92　%, 달리 적어도 약 93%, 달리 적어도 약 94%, 달리 적어도 약 95%, 달리 적어도 약 96%, 달리 적어도 약 97%, 달리 적어도 약 98%, 달리 적어도 약 99%의 아미노산이 유사한 경우 "상동성"이다. 바람직하게는, 유사하거나 상동성인 폴리펩타이드 서열은 Needleman 및 Wunsch의 알고리즘을 이용하여 확인된다.

바람직하게는, AGT 효소에 대한 상동성 서열은 서열번호 1과 적어도 64% 아미노산 서열 동일성, 바람직하게는 적어도 약 65% 아미노산 서열 동일성, 달리 적어도 약 66% 아미노산 서열 동일성, 달리 적어도 약 67% 아미노산 서열 동일성, 달리 적어도 약 68% 아미노산 서열 동일성, 달리 적어도 약 69% 아미노산 서열 동일성, 달리 적어도 약 70% 아미노산 서열 동일성, 달리 적어도 약 71% 아미노산 서열 동일성, 달리 적어도 약 72% 아미노산 서열 동일성, 달리 적어도 약 73% 아미노산 서열 동일성, 달리 적어도 약 74% 아미노산 서열 동일성, 달리 적어도 약 75% 아미노산 서열 동일성, 달리 적어도 약 76% 아미노산 서열 동일성, 달리 적어도 약 77% 아미노산 서열 동일성, 달리 적어도 약 78% 아미노산 서열 동일성, 달리 적어도 약 79% 아미노산 서열 동일성, 달리 적어도 80% 아미노산 동일성, 달리 적어도 약 81　% 아미노산 서열 동일성, 달리 적어도 약 82% 아미노산 서열 동일성, 달리 적어도 약 83% 아미노산 서열 동일성, 달리 적어도 약 84% 아미노산 서열 동일성, 달리 적어도 약 85% 아미노산 서열 동일성, 달리 적어도 약 86% 아미노산 서열 동일성, 달리 적어도 약 87% 아미노산 서열 동일성, 달리 적어도 약 88% 아미노산 서열 동일성, 달리 적어도 약 89% 아미노산 서열 동일성, 달리 적어도 약 90% 아미노산 서열 동일성, 달리 적어도 약 91% 아미노산 서열 동일성, 달리 적어도 약 92% 아미노산 서열 동일성, 달리 적어도 약 93% 아미노산 서열 동일성, 달리 적어도 약 94% 아미노산 서열 동일성, 달리 적어도 약 95% 아미노산 서열 동일성, 달리 적어도 약 96% 아미노산 서열 동일성, 달리 적어도 약 97% 아미노산 서열 동일성, 달리 적어도 약 98% 아미노산 서열 동일성 및 달리 적어도 약 99　% 아미노산 서열 동일성을 갖는다. 바람직한 실시형태에서, 서열번호 1의 상동성 서열은 서열번호 1에 대해 적어도 64%, 바람직하게는 70%, 더욱 바람직하게는 80% 동일하다.

바람직한 실시형태에서, 상기 상동성 폴리펩타이드는 서열번호 1의 hAGT 폴리펩타이드의 단편 또는 돌연변이체로서 O⁶-알킬구아닌-DNA 알킬트랜스퍼라제 활성을 갖는다.

상기 단편은 적어도 50개, 바람직하게는 100개, 더욱 바람직하게는 150개 아미노산의 크기를 가질 수 있으며, 적어도, AGT 효소의 O⁶-알킬구아닌-DNA 알킬트랜스퍼라제 활성에 중요한, 상기 정의된 바와 같은 AGT 폴리펩타이드의 "촉매 도메인"을 포함한다. 이들 단편은 당업자에 의해 알려진 일반적 기술을 이용하여 수득될 수 있다.

천연 AGT로부터 유도되는 상이한 돌연변이체 효소가 문헌(Lim A. et al, 1996; Daniels D.S. et al, 2000; Juillerat A. et al, 2003, WO 2005/085470, WO 2004/031405)에 기재되어 있다. 특히, 아미노산 182에서 절두된 돌연변이 Cys62Ala, Lys125Ala, Ala127Thr, Arg128Ala, Gly131Lys, Gly132Thr, Met134Leu, Arg135Ser, Cys150Ser, Asn157Gly, Ser159Glu를 포함하는 20 kDa의 돌연변이체 단백질이 수득되었다(WO 2005/085470에서 이른바 "AGT26" 돌연변이체라 불리고, 또한 WO 2006/114409에서는 "SNAP 26"이라 불림). 이러한 특정 돌연변이체 "SNAP26"은 증강된 표지 활성을 갖는 것으로 밝혀졌다.

본 발명과 관련하여, 더욱 바람직한 AGT 폴리펩타이드의 서열은 WO 2005/085470에 기술된 돌연변이를 포함하며, 돌연변이 위치는 서열번호 1을 고려하여 쉽게 이동될 수 있으며, SNAP26의 출발 메티오닌 부분은 서열번호 1의 위치 32에 있는 메티오닌 부분에 상응한다(따라서, 서열번호 1에 상응하는 것을 얻기 위해서는 WO 2005/085470에 기술된 위치에 31개의 아미노산이 추가되어야 한다).

바람직한 실시형태에서, 본 발명에 유용한 AGT 상동성 서열은, 1 내지 30개, 바람직하게는 6 내지 25개, 특히 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개 또는 23개 아미노산이 다른 아미노산으로 치환되고/되거나 1 내지 40개, 바람직하게는 1 내지 20개, 특히 10 내지 20개의 아미노산, 더욱 바람직하게는 15개 아미노산이 C-말단에서 결실된, 서열번호 1의 천연 AGT 서열에 상응한다.

더욱 바람직한 실시형태에서, AGT 상동성 서열은 서열번호 1과 비교하여 하기의 돌연변이를 포함한다:

(A) Lys31이 Arg로 대체, 또는 Met32이 Ser로 대체, 또는 Cys93이 Ala로 대체, 또는 Lys156이 Ala로 대체, 또는 Ala158이 Thr로 대체, 또는 Arg159이 Ala로 대체, 또는 Gly162이 Lys로 대체, 또는 Gly163이 Thr로 대체, 또는 Met165이 Leu로 대체, 또는 Arg166이 Ser로 대체, 또는 Cys181이 Ser로 대체, 또는 Asn188이 Gly로 대체, 또는 Ser190이 Glu로 대체, 또는 Gly214이 Pro로 대체, 또는 Ser215이 Ala로 대체, 또는 Ser216이 Gly로 대체, 또는 Gly217이 Ile로 대체, 또는 Leu218이 Gly로 대체, 또는 Gly220이 Pro로 대체, 또는 Ala221이 Gly로 대체, 또는 Trp222이 Ser로 대체, 또는

(B) Lys31-Met32이 Arg-Ser로 대체, 또는 Ala158-Arg159이 Thr-Ala로 대체, 또는 Gly162-Gly163이 Lys-Thr로 대체, 또는 Met165-Arg166이 Leu-Ser로 대체, 또는 Gly162-Gly163/Met165-Arg166이 Lys-Thr/Leu-Ser로 대체, 또는 Asn188/Ser190이 Gly/Glu로 대체, 또는 Gly214-Ser215-Ser216-Gly217-Leu218이 Pro-Ala-Gly-Ile-Gly로 대체, 또는 Gly220-Ala221-Trp222이 Pro-Gly-Ser로 대체(바람직하게는, 상기(A)에서 인용되는 임의의 다른 아미노산 대체와 조합됨), 또는

(C) Leu223 이후 절두됨(아미노산 224-238이 결실됨)(바람직하게는, 상기 (A) 또는 (B)에서 인용되는 임의의 다른 아미노산 대체와 조합됨).

바람직한 AGT 상동성 서열은 Leu223 이후 절두되는 것들이다.

바람직한 AGT 상동성 서열은 변형(B) 중 2개가 존재하고, 임의로, Leu223 이후 절두되는 것들이다.

바람직한 AGT 상동성 서열은 변형(B) 중 3개가 존재하고, 임의로, Leu223 이후 절두되는 것들이다.

바람직한 AGT 상동성 서열은 변형(B) 중 4개가 존재하고, 임의로, Leu223 이후 절두되는 것들이다.

바람직한 AGT 상동성 서열은 변형(B) 중 5개가 존재하고, 임의로, Leu223 이후 절두되는 것들이다.

바람직한 AGT 상동성 서열은 변형(B) 중 6개가 존재하고, 임으로, Leu223 이후 절두되는 것들이다.

다른 바람직한 AGT 상동성 서열은 (A)에 기술되는 변형 중에서 선택되는 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개 또는 20개 돌연변이의 조합을 포함하고, 임의로, Leu223 이후 절두되는 것들이다.

더욱더 바람직한 실시형태에서, 본 발명의 AGT 폴리펩타이드는, hAGT 효소에 상동성이고 서열번호 1과 비교하여 돌연변이 Lys31Arg, Met32Ser, Cys93Ala, Lys156Ala, Ala158Thr, Arg159Ala, Gly162Lys, Gly163Thr, Met165Leu, Arg166Ser, Cys181Ser, Asn188Gly, Ser190Glu, Gly214Pro, Ser215Ala, Ser216Gly, Gly217Ile, Leu218Gly, Gly220Pro, Ala221Gly, Trp222Ser를 포함하고 Leu223 후 절두된, 서열번호 2의 SNAP 돌연변이체이다. 서열번호 2의 SNAP 돌연변이체는 인간 6-메틸구아닌-DNA-메틸트랜스라제(NP_002403.2, 서열번호 1)의 아미노산 서열과 77% 상동성 및 마우스 6-메틸구아닌-DNA-메틸트랜스라제(NP_032624.1, 서열번호 18)의 아미노산 서열과 70% 상동성을 갖는다.

더욱더 바람직한 실시형태에서, AGT 효소는, O⁶-알킬구아닌-DNA 알킬트랜스퍼라제 활성을 갖는, 서열번호 2의 SNAP 돌연변이체 단백질 또는 이의 상동체이다. 바람직하게는, SNAP 돌연변이체 단백질에 대한 상기 상동성 서열은, 적어도, 서열번호 2의 SNAP 돌연변이체 단백질에 대해 80% 초과, 바람직하게는 81% 초과, 더욱 바람직하게는 82% 초과, 더욱 바람직하게는 83% 초과, 더욱 바람직하게는 84% 초과, 더욱 바람직하게는 85% 초과, 바람직하게는 86% 초과, 더욱 바람직하게는 87% 초과, 더욱 바람직하게는 88% 초과, 더욱 바람직하게는 89% 초과, 더욱 바람직하게는 90% 초과, 더욱 바람직하게는 91% 초과, 더욱 바람직하게는 92% 초과, 더욱 바람직하게는 93% 초과, 더욱 바람직하게는 94% 초과, 더욱 바람직하게는 95% 초과, 더욱 바람직하게는 96% 초과, 더욱더 바람직하게는 97% 초과로 동일하고, 상술된 바와 같은 O⁶-알킬구아닌-DNA 알킬트랜스퍼라제 활성을 갖는다.

O⁶-알킬구아닌-DNA 알킬트랜스퍼라제 활성을 갖는 상기 상동성 폴리펩타이드는 당업자에게 알려진 단백질 조작 기술 및/또는 새로운 O⁶-알킬구아닌-DNA 알킬트랜스퍼라제를 생성하고 선택하기 위한 분자적 발전을 이용하여 생성될 수있다. 이러한 기술은, 예를 들어, 서열 내에의 임의의 위치에 변이를 도입하기 위한 표적된 돌연변이유발, 파아지 디스플레이 방법, 포화 돌연변이유발, 에러 유발 PCR, 포화 돌연변이유발 및/또는 에러 유발 PCR 후 이용되는 DNA 셔플링, 또는 수개의 종으로부터의 유전자를 이용하는 패밀리 셔플링이다.

가장 바람직한 실시형태에서, 본 발명의 방법에서 사용되는 AGT 폴리펩타이드는 서열번호 2의 SNAP 돌연변이체이다.

AGT 기질

AGT 효소는 이의 기질인 O⁶-알킬구아닌-DNA로부터 알킬 그룹을 이의 시스테인 부분 중 하나에 비가역적으로 전달한다. 그러나, 벤질 환의 C4에서 O⁶-벤질구아닌의 치환은 O⁶-벤질구아닌 유도체에 대한 AGT의 반응성에 유의하게 영향을 끼치지 않는다. 이러한 특성은 벤질 환의 C4에 부착된 표지를 AGT에 전달하는데 이용되었다(참조: WO 2004/031404 및 WO 2005/085470).

벤질 그룹을 AGT 효소의 활성 부위 시스테인에 전달함으로써 AGT 효소와 반응하는 다수의 O⁶-벤질구아닌 유도체가 알려져 있다(참조: Damoiseaux et al., ChemBiochem., 2001, WO 2004/031404 및 WO 2005/085470).

바람직한 실시형태에서, 본 발명의 방법에 사용되는 AGT 기질은 하기 화학식 I의 O⁶ 벤질 구아닌 유도체이다:

［화학식 I］

R1-X-CH₂-R3-R4-Y

상기 식 중,

- R1은 AGT 폴리펩타이드에 의해 기질로서 인지되는 그룹, 예를 들어, 1 내지 5개의 질소 원자를 포함하는 헤테로방향족 그룹, 바람직하게는 하기 화학식의 푸린 라디칼이고:

(상기 식 중, R5는 수소, 할로겐, 예를 들어, 클로로 또는 브로모, 트리플루오로메틸 또는 하이드록시이고, R6는 수소, 하이드록시 또는 비치환 또는 치환된 아미노이고, R2는 수소, 1 내지 10개의 탄소 원자를 갖는 알킬 또는 사카라이드 부분이다),

- X는 산소 또는 황 원자, 바람직하게는 산소 원자이고,

- R3은 방향족 또는 헤테로방향족 그룹, 또는 CH₂에 연결된 이중 결합을 갖는, 임의로 치환된 불포화된 알킬, 사이클로알킬 또는 헤테로사이클릴 그룹, 바람직하게는 페닐, 예를 들어, 파라 또는 메타 위치에서 R4에 의해 치환된 페닐이고,

- R4는 링커 부분이고,

- Y는 반응 그룹,바람직하게는 아미노 그룹이다.

바람직한 실시형태에서, 상기 링커 부분 R₄는 가요성 링커(flexible linker)이다. 링커 단위는 가상적인 적용과 관련하여, 즉, AGT를 포함하는 융합 단백질에 기질을 전달하는데 선택된다. 링커는 AGT와의 반응을 방해하지 않으며, 표적 항체의 반응도 방해하지 않는다.

예를 들어, 이는

(a) 하나 이상의 탄소 원자가 산소에 의해 대체되고, 특히, 모든 세번째 탄소 원자가 산소, 예를 들어 1 내지 5개의 에틸렌옥시 단위를 갖는 폴리에틸렌옥시 그룹에 의해 대체되고;

(b) 하나 이상의 탄소 원자가 수소 원자를 수반하는 질소로 대체되고, 인접 탄소 원자가 옥소에 의해 대체되며(아미드 작용기 -NH-CO-로 대표됨);

(c) 하나 이상의 탄소 원자가 산소에 대체되고, 인접 탄소 원자가 옥소로 치환되며(에스테르 작용기 -O-CO-로 대표됨);

(d) 2개의 인접 탄소 원자 사이의 결합이 이중 또는 삼중 결합이고(작용기 -CH=CH- 또는 -C≡C-로 대표됨);

(e) 하나 이상의 탄소 원자가 페닐렌, 포화 또는 불포화된 사이클로알킬렌, 포화 또는 불포화된 비사이클로알킬렌, 가교된 헤테로방향족 또는 가교된 포화 또는 불포화 헤테로사이클릴 그룹으로 대체되고;

(f) 2개의 인접한 탄소 원자가 디설파이드 결합 -S-S-에 의해 대체되는, 1 내지 20개의 탄소 원자, 바람직하게는 5개 내지 15개의 탄소 원자를 갖는 직쇄 또는 측쇄 알킬렌 그룹이거나, 임으로 치환체를 포함하는, 상기 (a) 내지 (f)에서 정의되는 바와 같은, 적어도 2개, 특히, 2개 또는 3개의 알킬렌 및/또는 변형된 알킬렌 그룹의 조합일 수 있다.

고려되는 치환체는, 예를 들어, 알킬, 예를 들어, 메틸, 저급 알콕시, 예를 들어, 메톡시, 저급 아실옥시, 예를 들어, 아세톡시 또는 할로겐, 예를 들어, 클로로이다.

바람직한 실시형태에서, R4는 1 내지 8개의 에틸렌옥시 단위를 갖고, 인접 탄소 원자가 옥소로 치환되는 수소 원자를 수반하는 1 내지 4개의 질소 원자를 추가로 포함하는(아미드 작용기 -NH-CO-로 대표됨), 폴리에틸렌옥시 그룹이다.

더욱 바람직한 실시형태에서, R4는 -CH₂-NH-CO-NH-[C₂H₄-O]_n-이고, n은 1 내지 8, 바람직하게는 2 내지 6, 가장 바람직하게는 3이다.

바람직한 실시형태에서, 상기 반응성 그룹은 고체 지지체에 기질의 부착 및 결합을 용이하게 하는 작용 그룹이다. 이러한 작용 그룹은 당해 기술 분야에 널리 알려져 있다. 이들은 아민, 활성화된 에스테르, 아크릴아미드, 아실 아지드, 아실 할라이드, 아실 니트릴, 알데하이드, 케톤, 알킬 할라이드, 무수물, 아릴 할라이드, 아지리딘, 보로네이트, 활성화된 카복실산, 카보디이미드, 디아조알칸, 에폭사이드, 할로아세타미드, 할로플라티네이트, 할로트리아진, 이미도 에스테르, 이소시아네이트, 이소티오시아네이트, 말레이미드, 포스포르아미다이트, 솔릴 할라이드, 설포네이트 에스테르 및 설포닐 할라이드를 포함한다. 바람직하게는, 아민 그룹 -NH₂이다.

반대측에서, 고체 지지체는 이러한 반응성 그룹에 상응하는 상보적 그룹으로 작용화되어야 한다. 이들 반응성 그룹 각각에 상응하는 상보적 그룹은 당해 기술 분야에 널리 알려져 있다. 이들은, 예를 들어, WO 2010/107433의 표 1에 나타나 있다.

바람직한 실시형태에서, 본 발명에 사용되는 AGT 기질은 하기 화합물이다:

또 다른 바람직한 실시형태에서, 본 발명의 방법에 사용되는 AGT 기질은 하기 화학식을 갖는 "SNAP-cell®505"로 표시되는 형광 링커이다:

이러한 벤질구아닌 유도체는 SNAP 도메인과의 특이적 상호작용을 위한 벤질 푸린 그룹(구아닌)뿐만 아니라 마이크로구 표현에의 공유적 커플링을 위한 하나의 유리 아민 그룹을 갖는다. 이는 New England BioLabs에 의해 시판되고 있으며, 본 발명의 마이크로입자의 표면에 성공적으로 커플링되었다.

본 발명의 기질은 일반적으로 당해 기술 분야에 공지된 표준 방법으로 제조된다. 특정한 방법은, 예를 들어, 특허원 WO 2005/085470에 기재되어 있다.

고체 지지체에 대한 AGT 기질의 커플링

본 발명은 고체 지지체에 공유적으로 커플링시킨 AGT 기질을 포함한다. 본 발명과 관련하여, AGT 기질은 상기 고체 지지체에 영구적으로 부착되는 경우 고체 지지체에 "공유적으로 커플링"되며, 시간이 경과에 따라 탁착되거나 이탈되지 않을 것이다. 본 발명에 따라, AGT 기질은 장기간 저장, 예를 들어, 통상적으로 6개월 이하의 저장 동안 부착되어 있는 상태로 남아 있는 경우 상기 고체 지지체에 영구적으로 부착된다. 지금까지 다수의 커플링 공정이 기술되어 왔다. AGT 기질이 고체 지지체에 영구적으로 부착되는 한, 이들 커플링 공정 중 임의의 공정을 본 발명의 면역분석에 사용할 수 있다.

고체 지지체에 대한 AGT-항원 융합 단백질의 커플링

본 발명은 추가로 하기 2개 단계를 포함하는 고체 지지체에 항원을 커플링시키는 방법을 포함한다: i) 고체 표면을 AGT 기질(예를 들어, BG-PEG-아미노)로 코팅 및 ii) 앵커로서 AGT를 사용하여 키메라 [AGT-항원] 융합 단배질의 고정화(참조: 도 1). 상기 AGT 기질로 코팅하기 전에, 고체 표면은 AGT 기질이 고체 표면에 공유적으로 부착되도록 바람직하게는 최적화된 2단계 카보디이미드 공정(Kufer SK, Eur. Biophys.J. 2005)을 사용하여 유리하게 작용화시킬 수 있다. 이들 단계가 수행되면, 고체 표면은 키메라 [AGT-항원] 융합 단백질에 비가역적으로 결합되는 AGT 기질을 포함한다. 이 반응의 높은 특이성 때문에, 융합 단백질은 AGT 효소의 시스테인-함유 도메인을 통해 배타적으로 커플링되고, 이에 의해 항원과의 상호작용을 위해 접근가능한 항원을 잔류시킨다.

이러한 커플링 공정은 고체 지지체 상에 지향적 방식으로 항원의 결합을 가능하게 하기 때문에 매우 유리하다. 또한, 이 항원 커플링 공정은, 면역글로불린 G 및 잠재적으로 면역글로불린 M의 포획 효율을 증가시키도록, 고체 표면 상에서 다량체성 항원 조직화를 유리하게 수득할 수 있게 한다. 결과적으로, 본원의 실시예 부분에서 개발된 항원 커플링된 마이크로구는, 표준 비지향적 아민 커플링 공정에 의해 생성된 항원-커플링된 마이크로구와 비교하여, 특이적 항체의 향상된 포획을 나타냈다(참조: 하기 실험 부분 및 도 3). 마지막으로, 이러한 항원 커플링 공정은 항원-접합된 마이크로구의 고도 커플링 효율 및 장기간 안정성(4℃에서 6개월 이상)을 수득할 수 있게 한다.

본 발명의 면역분석에서, 공유적 커플링은, 바람직하게는, (이는 상술된 바와 같은 반응성 그룹 Y를 포함한다.) AGT 기질을 WO 2010/107433(이의 기술이 본원에 참조로 포함됨)의 표 1에 기술되는 것들과 같은 상보적 그룹으로 미리 작용화된 고체 지지체와 접촉시킴으로써 수행된다.

따라서, 바람직한 실시형태에서, 본 발명의 방법은, AGT 기질과 접촉 전, AGT 기질의 반응성 그룹에 대해 상보적인 그룹으로 작용화된 고체 지지체를 사용한다.

AGT 기질을 고체 지지체의 표면에 공유적으로 커플링시키기 위한 바람직한 통상의 공정은 카보디이미드 반응에 기초하고, 수용성 카보디이미드를 사용한다. 이러한 공정에 따라, 고체 지지체는 반응성 아민- 또는 설프하이드릴-포함 AGT 기질의 부착에 이용가능한 표면 카복실 그룹을 갖는다. 따라서, 이러한 바람직한 실시형태에서, 본 발명의 방법은 AGT 기질과 접촉 전 표면 카복실 그룹으로 작용화된 고체 지지체를 사용한다.

이러한 경우, 본 발명의 방법의 제1 단계는 고체 지지체를 코팅하는 카복실 그룹을 활성화시키는 것이다. 이러한 활성화는 통상적으로 소위 "활성화 완충액", 예를 들어, 50 mg/mL EDAC 용액 또는 50 mg/mL S-NHS 용액을 가함으로써 수행된다. 이들 용액은 시판된다. 고체 지지체의 활성화는 통상적으로 제조자의 지시에 따라 수분(예: 5분 내지 30분) 동안 실온에서 상기 지지체를 활성화 완충액과 함께 인큐베이션함으로써 수행된다.

중요하게도, AGT 기질의 고체 지지체에의 공유적 커플링은 AGT 기질 용해도 및 비드의 통합성(내부 형광색소)이 보존되도록 특정 조건 하에 수행되어야 한다. 본 발명자들은 AGT 기질이 0 내지 20%의 디메틸설폭사이드(DMSO)를 포함하는 "공유적 커플링" 완충액에 현탁되어야 한다는 것을 관측하였다. 특히, 본 발명자들은 20%를 초과하는 DMSO 농도가 본 발명의 방법의 검출 단계에 영향을 끼칠 수 있다는 것을 관측하였다. 바람직하게는, 상기 완충액은 0 내지 20%의 DMSO, 더욱 바람직하게는 10% 내지 20%의 DMSO를 포함하는 PBS 완충액이다.

유리하게는, AGT 기질에 공유적으로 부착되지 않은 고체 지지체 상의 비특정 부위는 임의의 통상적인 수단, 예를 들어, 1%의 소혈청 알부민(BSA) 또는 임의의 포화 단백질(예: 카제인)을 포함하는 차단 완충액을 사용하여 추가로 차단될 수 있다.

일단 본 발명의 고체 지지체가 (바람직하게는 카보디이미드 공유 결합을 통해) AGT 기질과 공유적으로 커플링되면, 고체 지지체는 표적 항체에 의해 특이적으로 인지되는 에피토프를 상기 지지체에 커플링시키도록 본 발명의 융합 단백질과 접촉된다.

이러한 커플링 단계는 특정 조건 하에서 다시 수행되어야 한다. 실제로, AGT 효소의 촉매 부위 및 융합 단백질에 의해 수반되는 항원/에피토프의 입체형태적 구조는 커플링 공정 동안 보존되어야 한다. 본 발명자들은 융합 단백질이 커플링에 효과적이도록 디티오트레이톨(DTT)-포함 완충액, 바람직하게는 PBS/DTT 완충액 중에 현탁되어야 한다는 것을 확인하였다. 유리하게는, 상기 커플링 완충액은 tween 20을 포함한다. 실제로, 본 발명자들은 커플링 매질에 tween 20을 첨가하는 것이 비드 응집을 피하는 것을 돕는다는 것을 관측하였다. 바람직하게는, 커플링 완충액은 0,02% tween 20을 포함한다. 더욱 바람직하게는, 본 발명의 공유적 커플링 완충액은 0,02% tween 20 및 1 mM DTT를 포함하는 pH 7.4의 PBS 완충액이다.

다른 커플링 조건은 통상적인 것이다. 바람직하게는, AGT 기질의 공유적 커플링 및 융합 단백질의 고체 지지체에 대한 커플링은 실온에서 수행된다. 고체 지지체가 형광 표지되는 경우, 상기 공정은 더욱 바람직하게는 암흑 속에서 수행된다.

본 발명은 O⁶-알킬구아닌-DNA 알킬트랜스퍼라제 활성을 갖는 AGT 폴리펩타이드를 작용화된 고체 지지체 상에 공유적으로 커플링시키는 방법을 포함하고, 상기 방법은

a) 상기 작용화된 고체 지지체를 활성화시키는 단계,

b) 0 내지 20%의 DMSO를 포함하는 완충액 중에 현탁된, AGT 폴리펩타이드의 기질을 상기 기질이 상기 지지체에 공유적으로 부착되기에 적합한 조건에서 첨가하는 단계, 및

c) 상기 AGT 폴리펩타이드를 PBS/DTT 완충액 중의 단계 b)의 기질-코팅된 지지체와 접촉시키는 단계를 포함하고,

비결합된 분자는 단계 b) 및 c) 이후 세척 제거된다.

세척은 임의의 종류의 적합한 세척 완충액을 사용하여 수행될 수 있다. 이러한 완충액은 통상적으로 당업자에 의해 사용되며, 본원에서 추가로 상세히 기술할 필요가 없다. 바람직하게는, PBS 완충액이 사용된다.

본원에서 사용되는 "적합한 조건"은 통상의 것이다. 바람직하게는, AGT 기질의 공유적 커플링은 실온에서, 고체 지지체가 형광 표지되는 경우, 암흑 속에서 수행된다.

고체 지지체의 작용화는 (상술된 바와 같은) 임의의 통상의 수단에 의해 수행될 수 있다. 상기 작용화된 고체 지지체의 활성화도 상응하게 수행된다. 바람직한 실시형태에서, 상기 고체 지지체는 표면 카복실 그룹으로 작용화되고, 통상의 활성화 완충액, 예를 들어, 50 mg/mL EDAC 용액 또는 50 mg/mL S-NHS 용액으로 더욱 활성화된다.

바람직한 실시형태에서, DTT는 PBS/DTT 완충액 중 1 mM의 농도이다.

본 발명은 또한 상기 방법에 의해 수득되는 고체 지지체 및 본 발명의 면역분석에서의 고체 지지체의 용도에 관한 것이다.

이때, 상기 고체 지지체는, 예를 들어, 0.5 g/L 아지드화나트륨, 0.1% BSA, 0.02% tween 20 및/또는 1 mM DTT를 포함하는, 통상의 저장 완충액 중에 저장될 수 있다.

이들 모든 커플링 단계들은 바람직하게는 살아있는 세포가 없는 완충액 중에서 시험관내에서 수행되므로 내인성 AGT 효소와의 반응을 고려할 필요가 없으며, 따라서 (외인성) AGT 융합 단백질의 반응은 고도로 특이적이다.

고체 지지체

본 발명의 방법에 사용될 수 있는 고체 지지체는, 서로 특이적으로 식별될 수 있는 한, 임의의 종류의 것, 예를 들어, 시험관, 미세역가 웰 (microtiter well), 시트, 비드, 칩 및/또는 마이크로입자일 수 있다. 이러한 식별은, 예를 들어, 고체 지지체가 공간 상 떨어져 있거나 (예: 미세역가판 (microtiter plate)에서의 웰 또는 칩 상의 상이한 위치) 상이하게 표지되는 경우, 가능하다. 따라서, "고체 지지체"는 광의로, 즉, (플레이트 또는 바이오칩의 경우) 전체 고체 지지체의 구분된 작은 부분 또는 공통의 검출가능한 특성을 공유하는 다수의 동일한 마이크로입자(본원에서 마이크로입자 "서브세트"라 칭함)를 나타내는 것으로 이해되어야 한다.

바람직한 실시형태에서, 본 발명의 면역분석에 사용된 고체 지지체는, 고체 지지체에 의해 포함된 항원을 정확하게 결정할 수 있도록, 본질적으로 식별가능해야 한다. 이어서, 항원-커플링된 및 식별가능한 고체 지지체는 특이적 인간 면역글로불린을 위한 포착 시약으로서 사용되고, 따라서 환자의 생물학적 샘플과 접촉된다.

바람직한 실시형태에서, 본 발명에 사용되는 고체 지지체는 이들의 특정한 위치, 크기, 직경, 중량, 입도측정 및/또는 표지화에 의해 특이적으로 식별될 수 있다. 이러한 표지는, 예를 들어, 형광색소, 형광단, 발색단, 방사성동위원소, 질량 태그(mass tag) 또는 당해 기술 분야에 알려진 임의의 종류의 검출가능한 택이다.

본 발명에 사용되는 고체 지지체는 임의의 물질, 예를 들어, 폴리스티렌, 셀룰로즈, 니트로셀룰로즈, 유리, 세라믹, 수지, 고무, 플라스틱, 실리카, 실리콘, 금속 및/또는 중합체로 제조될 수 있다. 중합체성 물질은 브롬화된 폴리스티렌, 폴리아크릴산, 폴리아크릴로니트릴, 폴리아미드, 폴리아크릴아미드, 폴리아크롤레인, 폴리부타디엔, 폴리카프롤락톤, 폴리카보네이트, 폴리에스테르, 폴리에틸렌, 폴리에틸렌 테레프탈레이트, 폴리디메틸실록산, 폴리이소프렌, 폴리우레탄, 폴리비닐아세테이트, 폴리비닐클로라이드, 폴리비닐피리딘, 폴리비닐벤질클로라이드, 폴리비닐톨루엔, 폴리비닐리덴 클로라이드, 폴리디비닐벤젠, 폴리메틸메타크릴레이트, 폴리락타이드, 폴리글리콜라이드, 폴리(락타이드-코-글리콜라이드), 폴리안하이드라이드, 폴리오르토에스테르, 폴리포스파젠, 폴리포소파제, 폴리설폰, 또는 허용가능한 이의 조합을 포함한다. 이들 지지체 대부분은 시판된다. 예를 들어, 폴리스티렌, 폴리아크릴아미드, 폴리아크릴레이트 또는 라텍스와 같은 합성 중합체로부터의 비드는 Bio-Rad Laboratories(Richmond, Calif.) 및 LKB Produkter(Stockholm, Sweden)와 같은 다수의 공급원으로부터 시판된다. 아가로즈, 가교-결합된 아가로즈, 글로불린, 데옥시리보즈 핵산 및 리포좀과 같은 천연 고분자 및 입자로부터 형성된 비드가 Bio-Rad Laboratories, Pharmacia(Piscataway, NJ) 및 IBF(France)와 같은 공급원으로부터 시판된다. 폴리아크릴아미드 및 아가로즈의 공중합체로부터 형성되는 비드가 IBF 및 Pharmacia와 같은 공급원으로부터 시판된다.

중합체성 지지체가 사용되는 경우, 카복실 그룹을 포함하는 모노머를 중합체에 포함시킴으로써 카복실 그룹이 고체 지지체의 표면에 추가될 수 있다(예: 아크릴산, 메타크릴산, 이타콘산 등). 달리, 상술된 바와 같이, 카복실 그룹으로 전환될 수 있는 다른 전구체 반응성 그룹을 갖는 중합체에 대한 추가의 화학적 반응에 의해 (예를 들어, 말산 무수물과 같은 무수물의 가수분해에 의해, 또는 표면 메틸롤 또는 알데하이드 말단 그룹의 산화에 의해) 카복실 그룹이 상기 지지체에 추가될 수 있다.

바람직한 실시형태에서, 본 발명에 사용되는 고체 지지체는 마이크로입자이다. 상기 마이크로입자는 바람직하게는 1 mm 미만의 직경, 바람직하게는 약 0.1 내지 약 1,000 ㎛의 직경을 갖는다. 마이크로입자가 임의의 크기를 가질 수 있지만, 바람직한 크기는 1 내지 100 ㎛이고, 더욱 바람직하게는 2 내지 50 ㎛, 더욱 바람직하게는 3 내지 25 ㎛, 및 더욱더 바람직하게는 약 6 내지 12 ㎛ 이다. 마이크로입자는 임의의 규칙적인 모양을 갖는 물질로 제조된다. 바람직한 모양은 구형이다. 그러나, 임의의 다른 모양의 입자도 이러한 변수가 본 발명의 특성에 중요하지 않으므로 본 발명에 사용될 수 있다. 입자의 모양은, 예를 들어, 고분해 슬릿-스캐닝 방법으로, 유동 세포측정에 의해 식별되는 추가의 차별 변수로서 사용될 수 있다.

본원에서 용어 "마이크로입자", "마이크로구" 또는 "마이크로비드"는 이들이 본질적으로 마이크로미터 범위에 속하는 전체 직경을 갖는 작은 입자를 말하기 때문에 상호교환적으로 사용되고 동등한 의미를 갖는다. 용어 "나노구", "나노입자" 또는 "나노비드"는 본질적으로 나노미터 범위에 속하는 전체 크기를 갖는 작은 입자를 말한다. 본원에서 사용되는 일반 용어인 입자, 구 또는 비드는 본 발명의 방법에서 고체 지지체로서 효과적으로 사용될 수 있는 마이크로입자 및 나노입자 모두를 말한다.

본 발명과 관련하여, 마이크로입자의 일 "서브세트"는 동일한 특성을 갖고 동일한 에피토프로 코팅된 다수의 동일한 마이크로입자에 상응한다. 중요하게도, 마이크로입자 서브세트 각각은 하나 이상의 특성 (예: 위치, 크기, 직경, 중량, 입도측정 및/또는 표지화)에 의해 마이크로입자군의 다른 서브세트로부터 구별되어야 한다.

바람직한 실시형태에서, 상이한 마이크로입자 서브세트는 이들이 (예를 들어, 형광색소, 형광단, 발색단, 방사성동위원소, 질량 태그 또는 당해 기술 분야에 공지된 임의의 종류의 검출가능한 택으로) 상이하게 표지되기 때문에 구별될 수 있다.

더욱 바람직한 실시형태에서, 상이한 마이크로입자 서브세트는, US 5,736,330, US 5,981,180, US 6,057,107, US 6,268,222, US 6,449,562, US 6,514,295, US 6,524,793 및 US 6,528,165에서 제시되는 바와 같이, 이들이 상이하게 형광 표지되기 때문에 구별될 수 있다. 더욱 정확히, 이들 상이한 서브세트는 상이한 형광 염료 및/또는 상이한 농도의 하나 이상의 형광 염료로 염색될 수 있다. 따라서, 상이한 서브세트는 각각의 마이크로입자가 속하는 서브세트를 결정하기 위해 (즉, 서브세트에 따라 마이크로입자를 분류하기 위해) 측정되고 측정 시스템으로서 사용될 수 있는 상이한 형광 특징(예: 상이한 형광 파장(들), 상이한 형광 강도 등)을 가질 수 있다.

바람직한 실시형태에서, 본 발명에 사용되는 마이크로입자는, 본원에서 참조로서 도입되는 EP 1　204　869에 기재되는 바와 같이, 형광 염료로 내부적으로 표지된다.

이들 마이크로입자는 또한 자석 또는 초상자성, 상자성 및 강자성 금속 산화물로 이루어진 그룹 중에서 선택되는 자기적으로 반응하는 금속 산화물을 포함할 수 있다. 자성 비드는, 예를 들어, Dynal Inc.(Great Neck, NY)와 같은 공급원으로부터 시판되거나, 예를 들어, U.S. 4,358,388; US 4,654,267; US 4,774,265; US 5,320,944; 및 US 5,356,713에 기술되는 바와 같은 당해 기술 분야의 공지된 방법으로 제조될 수 있다. 바람직한 실시형태에서, 본 발명에 사용되는 고체 지지체는 자성을 띤다.

더욱 바람직한 실시형태에서, 본 발명에 사용되는 고체 지지체는, 상표명 MagPlex으로 Luminex Corp에 의해 시판되는 것과 같이, 리간드의 공유적 커플링을 위해 표면 카복실 그룹을 포함하는 작용성 중합체 외부 코트에 캡슐화된(encapsulated) 자철광(magnetite)을 갖는 형광 염료로 내부적으로 표지된 마이크로입자이다.

또한, 스펙트럼으로 구분되는 영역으로 칼라 코드화된 카복실화된 폴리스티렌 마이크로입자인 MicroPlex 마이크로구(Luminex 시판)를 사용할 수도 있다. 이들 영역은 하나의 단일 샘플 용적으로부터 동시에 100개 이하의 상이한 분석물에 대한 조사를 가능하게 하는 xMAP 기구에 의해 신속하게 구별될 수 있다.

또한, 혈청 분석시 비-특이적 결합이 감소되도록 최적화된 MicroPlex 마이크로구의 특정 제형인 SeroMAP 마이크로구(Luminex 시판)를 사용할 수도 있다.

결합된 항체의 검출

본 발명은 에피토프 및 따라서 검출가능한 고체 지지체에 결합된 항체의 존재를 검출하는 것을 포함한다. 마이크로입자의 어떤 서브세트에 항체가 결합되었는가를 분석함으로써, 어떤 항체가 생물학적 샘플에 존재하고 이로써 시험된 피험자가 어떤 병원체에 의해 감염되었는가를 쉽게 추론할 수 있다.

임의의 공지된 기술을 이용하여 고체 지지체에 결합된 항체의 존재를 검출할 수 있다. 예를 들어, 하기 실시예에 기재되는 바와 같이, 피험자 면역글로불린의 불변부를 특이적으로 인지하는 표지된 제2 항체가 사용될 수 있다. 항체에 커플링된 고체 지지체와 커플링되지 않은 고체 지지체를 구분하도록 검출-항체의 표지화는 고체 지지체의 표지화과 달라야 한다는 것을 주목하는 것이 중요하다.

달리, 감염된 동물 또는 인간으로부터의 혈청에 존재하는 면역글로불린은 1-단계 항체 표지화 프로토콜을 이용하여 (Lightning-Link^TM R-피코에리트린 접합 키트 - Innova Biosciences) R-피코에리트린 (R-PE)에 직접적으로 접합될 수 있다. 전체 공정을 위한 실제 시간은 통상적으로 20 내지 30초이고, 100%의 회수율로 소량의 면역글로불린 표지화를 가능하게 한다. 이러한 공정은 다중-면역분석 실험에서 접합된 항-종 항체 및 스트렙트아비딘-R-피코에리트린과 같은 제2 시약을 필요로 하지 않는다.

형광 염료로 내부적으로 표지된 마이크로입자가 사용되는 경우, 형광 검출 기구에는 마이크로구의 유형을 검출하기 위한 제1 레이저 및 특정 검출 항체에 접합된 형광단을 여기시킴으로써 포획된 IgM 또는 IgG 의 정량화를 가능하게 하는 제2 레이저가 구비되어야 한다.

이러한 접근은, 이의 광범위한 다중화 능력 및 낮은 검출 한계로 인해, 종래의 ELISA 측정에 비해 실질적인 비용 및 샘플 절약을 제공한다. 또한, 선택된 마이크로구 세트는 MagPix(Luminex Corporation)와 같은 저렴하고 소형이며 강력한 형광 검출 시스템에 적용가능하다.

이러한 실시형태에서, 본 발명의 방법은 유동 분석 수단을 사용함으로써 웰 당 100개 유형 이하의 커플링된 마이크로구를 동시에 분석할 수 있으며, 현재 사용되는 시스템 및 방법의 민감도 보다 약 수 개의 자릿수가 클 것으로 예상되는 대단히 증강된 민감도를 제공한다.

흥미롭게도, 본 발명의 방법은 인간 또는 동물 개체에서 다수의 감염을 진단하도록 대용량처리 혈청 스크리닝을 수행하는 것을 가능하게 한다.

다중 면역분석 키트

본 발명은 다중 항원에 대한 항체의 검출에 사용하기에 적합한 키트를 포함한다. 본원에 기재된 항원 또는 에피토프 중의 어느 하나를 키트에 도입할 수 있다.

본 발명은 바이러스, 세균, 기생충, 동물, 프리온, 효모 및 진균 단백질을 검출하기 위한 키트를 포함한다.

상기 키트는 적어도 2개의 고체 지지체를 포함한다. 본 바명은 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 20, 25, 30, 40, 50, 100개 등의 고체 지지체를 포함하는 키트, 및 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 20, 25, 30, 40, 50, 100개 등의 상이한 에피토프를 포함하는 키트를 포함한다. 키트는 함께 혼합된 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 20, 25, 30, 40, 50, 100개 등의 고체 지지체를 포함한다. 에피토프는 표적 항체에 의해 인지될 수 있다.

한 가지 실시형태에서, 키트는 본 발명의 방법의 단계(c)에서 수득된 제1 고체 지지체(여기서, 상기 지지체는 AGT 기질에 공유적으로 커플링된 제1 AGT-항원 융합 단백질을 포함한다.) 및 AGT 기질에 공유적으로 커플링된 제2 AGT-항원 융합 단백질을 포함하는 제2 고체 지지체를 포함한다.

한 가지 실시형태에서, 키트는

AGT 기질에 공유적으로 커플링된 제1 AGT-항원 융합 단백질을 포함하는 제1 고체 지지체,

AGT 기질에 공유적으로 커플링된 제2 AGT-항원 융합 단백질을 포함하는 제2 고체 지지체,

AGT 기질에 공유적으로 커플링된 제3 AGT-항원 융합 단백질을 포함하는 제3 고체 지지체,

AGT 기질에 공유적으로 커플링된 제4 AGT-항원 융합 단백질을 포함하는 제4 고체 지지체,

AGT 기질에 공유적으로 커플링된 제5 AGT-항원 융합 단백질을 포함하는 제5 고체 지지체,

AGT 기질에 공유적으로 커플링된 제6 AGT-항원 융합 단백질을 포함하는 제6 고체 지지체,

AGT 기질에 공유적으로 커플링된 제7 AGT-항원 융합 단백질을 포함하는 제7 고체 지지체,

AGT 기질에 공유적으로 커플링된 제8 AGT-항원 융합 단백질을 포함하는 제8 고체 지지체,

AGT 기질에 공유적으로 커플링된 제9 AGT-항원 융합 단백질을 포함하는 제9 고체 지지체 및

AGT 기질에 공유적으로 커플링된 제10 AGT-항원 융합 단백질을 포함하는 제10 고체 지지체를 포함한다.

다른 실시형태에서, 키트는 AGT 기질에 공유적으로 커플링된 2, 3, 4, 5, 6, 7, 8, 9, 11, 12, 13, 14, 15, 16, 20, 25, 30, 40, 50 또는 100개 AGT-항원 융합 단백질을 포함하는 2, 3, 4, 5, 6, 7, 8, 9, 11, 12, 13, 14, 15, 16, 20, 25, 30, 40, 50 또는 100개 고체 지지체를 포함할 수 있다.

- 한 가지 실시형태에서, 키트는 제1 표적 항체에 의해 인지되는 제1 에피토프와 공유적으로 커플링되는 제1 고체 지지체,

제2 표적 항체에 의해서는 인지되나 상기 제1 표적 항체에 의해서는 인지되지 않는 제2 에피토프와 공유적으로 커플링되는 제2 고체 지지체를 포함하고,

상기 적어도 2개의 고체 지지체는 서로로부터 특이적으로 식별될 수 있으며 2개의 상이한 표적 항체의 검출을 가능하게 한다.

바람직한 실시형태에서, 본 발명은 생물학적 샘플 중의 적어도 2개의 표적 항체의 검출을 위한 키트를 포함하고, 상기 키트는

(a) O6-알킬구아닌-DNA 알킬트랜스퍼라제 활성을 갖는 AGT 폴리펩타이드 및 제1 표적 항체에 의해서는 인지되는 제1 에피토프를 포함하는 제1 융합 단백질에 공유적으로 커플링되는 AGT 기질을 포함하는 제1 고체 지지체, 및

b) O6-알킬구아닌-DNA 알킬트랜스퍼라제 활성을 갖는 AGT 폴리펩타이드 및 제2 표적 항체에 의해서는 인지되나 상기 제1 표적 항체에 의해서는 인지되지 않는 제2 에피토프를 포함하는 제2 융합 단백질에 공유적으로 커플링되는 AGT 기질을 포함하는 제2 고체 지지체를 포함한다.

바람직한 실시형태에서, 키트는 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 20, 25, 30, 40, 50, 100개 등의 상이한 바이러스 에피토프를 포함한다.

바람직한 실시형태에서, 키트는 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 20, 25, 30, 40, 50, 100개 등의 상이한 베균 에피토프를 포함한다.

키트는 바이러스, 세균 및/또는 기생충에 특이적일 수 있다.

키트는 바이러스 또는 세균 부류에 특이적일 수 있거나, 유사하게 관련된 임상 증상(즉, 소아기 질환, 호흡 또는 출혈성 증후군 등)에 기초할 수 있다.

키트는 면역글루불린에 특이적일 수 있고, 여기서 키트는 IgG1, IgG2, IgG3, IgG4, IgA, IgM, IgE 및 IgG 합계로부터 선택된 적어도 2, 3, 4 또는 5개 면역글로불린에 대한 항체를 검출한다.

키트는 바이오테러(bioterrorism) 병원체에 특이적일 수 있고, 여기서 키트는 프란시셀라 툴라렌시스(Francisella tularensis), 바실루스 안트라시스(Bacillus anthracis), 클로스트리디움 보툴리눔(Clostridium botulinum), 예르시니아 페스티스(Yersinia pestis), 천연두(Smallpox), 마르부르그 바이러스, 에볼라 바이러스, 라사 바이러스 및 마추포 바이러스 단백질로부터 선택된 적어도 2, 3, 4 또는 5개 단백질을 검출한다.

키트는 플루 바이러스에 특이적일 수 있고, 여기서 키트는 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 상이한 인플루엔자 또는 SARS 단백질에 대한 항체를 검출한다.

키트는 폭스바이러스에 특이적일 수 있고, 여기서 키트는 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 상이한 폭스바이러스에 대한 항체를 검출한다. 폭스바이러스는 오르소폭스(천연두 바이러스/바리올라, 백시니아 바이러스(http://en.wikipedia.org/wiki/Vaccinia), 우두 바이러스(http://en.wikipedia.org/wiki/Cowpox), 또는 원숭이 천연두 바이러스 http://en.wikipedia.org/wiki/Monkeypox), 파라폭스(orf 바이러스, 가성 우두, 소 구진성 내구염 바이러스), 야타폭스(타나폭스 바이러스(http://en.wikipedia.org/wiki/Tanapox), 야바 원숭이 종양 바이러스(http://en.wikipedia.org/wiki/Yaba_monkey_tumor_virus)) 또는 몰루시폭스(http://en.wikipedia.org/wiki/Molluscum_contagiosum)일 수 있다.

본 발명은 암 및 종양 항원, 신장 독성 마커, 사이토킨, 케모킨, 성장 인자, 자가면역 질환과 관여하는 항원 및 면역글로불린을 포함하는 인간 단백질에 대한 항체를 검출하기 위한 키트를 포함한다.

본 발명은 알레르기 항원에 대한 항체를 검출하기 위한 키트를 포함한다.

바람직한 실시형태에서, 적어도 하나의 에피토프는 바이러스 에피토프이다. 바람직한 실시형태에서, 상기 제1 및/또는 제2 에피토프는 하기로 이루어진 그룹 중에서 선택되는 바이러스 단백질 상에 존재한다: 서열번호 3의 뎅기 바이러스 1의 EDIII 단백질, 서열번호 4의 뎅기 바이러스 2의 EDIII 단백질, 서열번호 5의 뎅기 바이러스 3의 EDIII 단백질, 서열번호 6의 뎅기 바이러스 4의 EDIII 단백질, 서열번호 7의 웨스트 나일 바이러스의 EDIII 단백질, 서열번호 8의 황열 바이러스의 EDIII 단백질, 서열번호 9의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 10의 지카 바이러스의 EDIII 단백질, 서열번호 11의 베셀스브론 바이러스의 EDIII 단백질, 서열번호 12의 로시오 바이러스의 EDIII 단백질, 서열번호 13의 머레이 뇌염 바이러스의 EDIII 단백질, 서열번호 14의 세인트-루이스 뇌염 바이러스의 EDIII 단백질, 서열번호 54에 의해 인코딩되는 유전형 1의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 55에 의해 인코딩되는 유전형 2의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 56에 의해 인코딩되는 유전형 4의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 57에 의해 인코딩되는 유전형 5의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 58에 의해 인코딩되는 라벤스버그 바이러스의 EDIII 단백질, 및 HIV1, HIV2, B형 간염 바이러스, C형 간염 바이러스, E형 간염 바이러스, 웨스트-나일 바이러스 및 HPV 16, 18, 31, 33, 35, 39, 45, 51, 52, 56, 58, 59, 66 및 68와 같은 종양 HPV 스트레인의 바이러스 단백질.

바람직하게는, 이러한 키트는 또한 고체 지지체에 결합된 적어도 2개의 표적 항체를 검출하기 위한 수단을 포함한다. 상기 수단은 더욱 바람직하게는 표적 항체의 불변부를 인지하는 제2 항체이다. 상기 제2 항체는 표지될 수 있으며, 단 표지가 고체 지지체 상에 존재하는 것과 동일하지 않아야 한다. 그러나, 감염성 병원체(들)에 관한 정보가 항체에 결합된 고체 지지체의 확인에 의해서만 제공되기 때문에, 고체 지지체(들)에 결합된 항체를 검출하는데 사용되는 모든 제2 항체에 대해 동일한 표지를 이용할 수 있다.

본 발명의 키트는 세척 완충액, 필수 플라스틱웨어 등과 같이 표준 시약으로 인정되는 기타 성분들을 포함할 수 있다.

바람직한 실시형태에서, 본 발명의 키트는, 예를 들어, 상술된 바와 같은 마이크로입자의 서브세트인, 적어도 10개, 바람직하게는 적어도 50개, 더욱 바람직하게는 적어도 100개의 상이하게 커플링된 고체 지지체를 포함한다.

더욱 바람직한 실시형태에서, 상기 고체 지지체는 마이크로구, 예를 들어, 표면 카복실 그룹을 포함하는 작용성 중합체 외부 코트에 캡슐화된 자철광을 갖는 형광 염료로 내부적으로 표지된 마이크로구이다.

또 다른 바람직한 실시형태에서, 본 발명의 키트 중의 상기 고체 지지체는 하나 이상의 단일 구획(single compartment)에서 함께 혼합된다.

유리하게는, 본 발명의 키트는 통상의 지지체(들), 예를 들어, 상술된 바와 같은 상이한 항원-코팅된 마이크로입자 서브세트를 포함하는 미세역가판을 포함한다. 바람직한 실시형태에서, 상기 마이크로입자 서브세트는 하나 이상의 구획(예: 웰 또는 튜브)에서 함께 혼합된다. 이러한 디바이스가 도 11에 도시되어 있다.

본 발명의 키트는 또한 상기한 항원-코팅된 마이크로입자 서브세트를 포함하는 수용체(예: 튜브)를 포함할 수 있다.

본 발명은 또한 피험자의 생물학적 샘플로부터의 적어도 2개, 바람직하게는 적어도 10개, 더욱 바람직하게는 적어도 50개, 더욱더 바람직하게는 적어도 100개의 표적 항체를 검출하기 위한 본 발명의 키트의 용도에 관한 것이다.

바람직한 실시형태에서, 본 발명의 키트는 동일한 지역의 풍토병적 바이러스 또는 기생충에 의한 감염시 생성되는 적어도 2개, 바람직하게는 적어도 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 20, 25, 30, 40, 50 또는 100개의 표적 항체를 검출하는데 사용된다. 예를 들어, 본 발명의 키트는 아프리카 지역에서 특이적인 바이러스 또는 기생충의 항원, 예를 들어, 뎅기 바이러스 1형, 2형, 3형, 4형, 황열 바이러스, 웨스트-나일 바이러스, 우수투 바이러스, 지카 바이러스, 베셀스보론 바이러스, 샤몬다 바이러스, 리프트 계곡 열 바이러스, 치쿤구니아 바이러스, 크리미아-콩고 출혈 열 바이러스, 에볼라 바이러스, 마르부르그 바이러스, 리사 바이러스, C형 간염 바이러스, E형 간염 바이러스, 엔테로바이러스 71, 플라스모듐 팔시파룸 또는 렙토스피라 인테로간스(Leptospira interrogans)로 코팅된 마이크로입자를 포함할 수있다.

도 25는 의도되는 지역(아시아, 유럽, 아메리카, 오세아니아 또는 아프리카)에 따라 본 발명의 키트에 포함될 수 있는 항원-커플링된 마이크로구 조합에 대한 예를 기술한다.

달리, 본 발명의 키트는 특정 증상(플루-유사, 뇌염 또는 출혈 열)을 유발하거나 특정 동물을 감염시키는 바이러스 또는 기생충의 진단을 가능하게 하는 항원-커플링된 마이크로구를 포함하므로, 각각의 환자/동물에 따라 조정될 수 있다.

도 25는 환자 또는 동물의 증상에 따라 본 발명의 키트에 포함될 수 있는 항원-커플링된 마이크로구 조합의 예를 기술한다.

국립 보거 기관에 의해 제시되는 항원 조합을 포함하는 키트도 또한 분명히 본 발명에 포함된다.

특히, 본 발명의 키트는 하기로 이루어진 그룹으로부터 선택되는 적어도 2개의 융합 단백질로 코팅된 적어도 2개의 고체 지지체를 포함한다: 서열번호 21, 서열번호 42, 서열번호 49, 서열번호 51, 서열번호 53, 서열번호 60, 서열번호 62, 서열번호 64, 서열번호 66, 서열번호 68, 서열번호 70, 서열번호 72, 서열번호 74, 서열번호 76, 서열번호 78, 서열번호 80, 서열번호 82, 서열번호 84, 서열번호 86, 서열번호 88, 서열번호 90, 서열번호 92, 서열번호 94, 서열번호 96, 서열번호 98, 서열번호 100, 서열번호 102, 서열번호 104, 서열번호 109, 서열번호 111, 서열번호 113, 서열번호 115, 서열번호 117, 서열번호 119, 서열번호 121, 서열번호 123, 서열번호 125, 서열번호 127, 서열번호 129, 서열번호 131, 서열번호 133, 서열번호 135, 서열번호 137, 서열번호 139, 서열번호 141, 서열번호 143, 서열번호 145, 서열번호 147, 서열번호 149 및 서열번호 151.

바람직한 실시형태에서, 본 발명의 키트는 상기 융합 단백질로 코팅된 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 20, 25, 30, 40, 50 또는 100개의 고체 지지체의 조합을 포함한다.

더욱 바람직한 실시형태에서, 본 발명의 키트는 식품의약청에 의해 권장되는 바와 같은 항원, 즉, HBV, HCV, HIV1, HIV2 및 웨스트 나일 바이러스로부터의 항원을 포함하는 적어도 5개의 상이한 융합 단백질로 코팅된 적어도 5개의 고체 지지체의 조합(예: 마이크로구 서브세트)을 포함한다.

한 가지 실시형태에서, 본 발명은 키트를 제조하는 방법을 포함하고, 상기 방법은

(a) 제1 표적 항체에 의해 인지되는 제1 AGT-항원 융합 단백질을 제공하는 단계,

(b) 상기 제1 AGT-항원 융합 단백질을 상기 AGT-항원 융합 단백질의 기질과 공유적으로 커플링된 제1 고체 지지체와 접촉시키는 단계,

(c) 제1 AGT-항원 융합 단백질과 공유적으로 커플링된 제1 상기 지지체를 수득하는 단계,

(d) 제2 표적 항체에 의해 인지되나 상기 제1 표적 항체에 의해 인지되지 않는 제2 AGT-항원 융합 단백질을 제공하는 단계,

(e) 상기 제2 AGT-항원 융합 단백질을 상기 AGT-항원 융합 단백질과 공유적으로 커플링된 제2 고체 지지체와 접촉시키는 단계, 및

(f) 제2 AGT-항원 융합 단백질과 공유적으로 커플링된 제2 고체 지지체를 수득하는 단계를 포함하고,

상기 제1 및 제2 고체 지지체는 서로로부터 특이적으로 식별할 수 있다.

한 가지 실시형태에서, AGT-항원 융합 단백질과 공유적으로 커플링된 고체 지지체는 함께 혼합되어 있다.

상기 단계 (a) 내지 (c)는, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 20, 25, 30, 40, 50 또는 100개의 상이한 AGT-항원 융합 단백질과 공유적으로 커플링된 적어도 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 20, 25, 30, 40, 50 또는 100개의 고체 지지체를 생성하기 위해, 적어도 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 20, 25, 30, 40, 50 또는 100개의 상이한 AGT-항원 융합 단백질로 반복할 수 있다.

또 다른 양상에서, 본 발명은, 적어도 제1 및 제2 고체 지지체를 포함하는 상기 정의되는 바와 같은 본 발명의 키트를 제조하는 방법에 관한 것으로서, 상기 방법은

(a) 하기를 포함하는 하나 이상의 제1 융합 단백질을 제공하는 단계:

(d) 하기를 포함하는 하나 이상의 제2 융합 단백질을 제공하는 단계:

(e) 상기 제2 융합 단백질을 상기 AGT 폴리펩타이드 기질과 공유적으로 커플링된 제2 고체 지지체와 접촉시키는 단계, 및

(f) 제2 표적 항체에 의해서는 인지되나 상기 제1 표적 항체에 의해서는 인지되지 않는 제2 에피토프와 공유적으로 커플링된 제2 고체 지지체를 수득하는 단계를 포함하고,

상기 적어도 제1 및 제2 고체 지지체는 서로 특이적으로 식별될 수 있으며,본 발명의 상기 키트는 적어도 상기 제1 및 제2 고체 지지체를 포함한다.

또 다른 양상에서, 본 발명은, 각각의 고체 지지체가 여기 후 상이하고 식별가능한 파장을 방출하는, 상기 정의된 바와 같은, 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 60, 70, 80, 90 또는 96개의 고체 지지체를 포함하는, 다중 면역 스크리닝 분석에 관한 것이다.

또 다른 양상에서, 본 발명은 다중 면역 스크리닝 분석 방법에 관한 것으로서, 상기 방법은

a) 하나 또는 수개의 생물학적 샘플(들)을, 각각의 고체 지지체가 여기 후 상이하고 식별가능한 파장을 방출하는, 상기 정의된 바와 같은, 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 60, 70, 80, 90 또는 96개의 고체 지지체와 접촉시키는 단계, 및

b) 표적 항체의 존재 또는 부재를 검출하는 단계를 포함한다.

바람직한 실시형태에서, 상기 표적 항체는 WHO 또는 FDA 지침에 따라 혈액 뱅크에서 검출되는 바이러스, 예를 들어, HBV, HCV, HIV1, HIV2 및 WNV 중에서 선택되는 바이러스로부터의 항원에 특이적이다.

또 다른 바람직한 실시형태에서, 상기 표적 항체는 HPV 16, 18, 31, 33, 35, 39, 45, 51, 52, 56, 58, 59, 66 및 68과 같은 종양 HPV 스트레인에 대해 특이적이다.

또 다른 바람직한 실시형태에서, 상기 표적 항체 각각은 검출 표지로 표지된다.

또 다른 양상에서, 본 발명은 상기 정의된 바와 같은 본 발명의 키트를 제작하는 방법을 수행하기 위한 장치에 관한 것으로서, 상기 장치는 고체 지지체로부터 방출되는 광원 및 표적 항체 또는 표적 항체에 결합된 표지된 항체로부터 방출되는 광원을 검출하기 위한 전문적 디바이스 및 고체 지지체와 표적 항체와의 결합을 확인하여 분석 샘플 중 항원, 세균, 바이러스 또는 기생충의 존재 또는 부재를 나타내기 위한 계산 또는 컴퓨터 디바이스를 포함한다.

또 다른 양상에서, 본 발명은 피험자에서 하나 이상의 표적 항체의 합성을 유도하는 것으로 알려진 하나 이상의 표적 질환을 진단하기 위한 시험관내 진단 방법에 관한 것으로서, 상기 방법은 본 발명의 면역분석 방법을 수행하는 것을 포함하며, 하나 이상의 표적 항체의 양이 대조값 보다 높은 경우 상기 피험자가 하나 이상의 표적 질환을 앓는 것으로 진단된다.

이러한 진단 방법은 바람직하게는 진단이 필요한 피험자에서 2개, 바람직하게는 3개, 더욱 바람직하게는 4개의 표적 질환의 진단을 가능하게 한다. 그러나, 이러한 수는 제한적인 것이 아니어서, 본 발명의 검출 방법으로 100개의 상이한 항체를 검출할 수 있는 한 실제로 100개 이하의 표적 질환을 진단할 수 있다.

바람직한 실시형태에서, 상기한 하나 이상의 표적 질환은 바이러스, 세균, 효모 또는 진균-매개된 감염, 바람직하게는 파필로마바이러스 또는 플라비비리대(뎅기 바이러스, 황열 바이러스, 웨스트 나일 바이러스, 일본 뇌염 바이러스, 진드기-매개 뇌염, 바이러스, C형 간염 바이러스), 토가비리대(치쿤구니아 바이러스, 로스 강 바이러스, 마야로 바이러스, 서부 말 뇌염 바이러스, 동부 말 뇌염 바이러스, 베네주엘라 말 뇌염 바이러스), 부냐비리대(크리미아-콩고 출혈 열 바이러스, 리프트 계곡 열 바이러스, 쉬말렌베르그 바이러스), 칼리시비리대(E형 간염 바이러스), 아레나비리대(라사 바이러스) 및 필로비리대(에볼라 바이러스, 마르부르그 바이러스)의 과로부터의 RNA 바이러스에 의해 유발되는 바이러스 감염, 렙토스피로사 인테로간스에 의해 유발되는 세균 감염, 또는 플라스모듐 팔시파룸에 의해 유발되는 감염이다.

바람직한 실시형태에서, 상기 시험관내 방법은 상기 피험자에서 적어도 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 15개, 더욱 바람직하게는 적어도 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40 또는 45개, 더욱 바람직하게는 적어도 50, 60, 70, 80 또는 90개, 및 더욱더 바람직하게는 적어도 100개의 바이러스 및/또는 세균 및/또는 기생충 감염을 진단하는데 사용된다.

바람직한 실시형태에서, 상기 방법에 사용되는 대조값은 표적 질환을 앓지 않는 피험자, 바람직하게는 건강한 피험자로부터의 샘플에서의 상기 표적 항체의 양을 나타낸다.

본 발명의 방법은 동물에서 감염을 진단하는데 사용될 수 있다.

특히, 이들은 동물 질환을 진단하는데 사용될 수 있으며, 또한 천연적으로 감염된 동물을 백신접종된 동물과 구별하기 위한 DIVA(Differentiating Infected from Vaccinated Animals: 백신접종된 동물로부터 감염된 동물의 구별) 접근에 이용될 수 있다. 새로운 백신을 보완하는 DIVA 전략은 통상의 전략(시험, 도살 조사 및 식육 검사)과 나란히 표적화된 제어 전략으로서 백신접종의 이행을 가능하게 한다. 또한, 증가된 시험 민감도는 불필요하게 도살될 수 있는 그룻-양성 동물의 수를 감소시킴으로써 주요한 경제적 이득을 가질 것이다. 마지막으로, 개선된 민감도는, 특히 새로운 진단 분석이 이용되는 경우, 심지어 백신접종의 부재하에서도 질병 구제에 대한 경제적 부담감을 감소시키는데 추가의 이점을 가질 것이다.

바람직한 실시형태에서, 본 발명의 방법은 인간 개체에 적용된다.

본 발명은 피험자에서 적어도 2개의 표적 질환을 진단하기 위한 본 발명의 키트의 용도에 관한 것으로서, 상기 표적 질환은 파필로마바이러스 또는 플라비비리대(뎅기 바이러스, 황열 바이러스, 웨스트 나일 바이러스, 일본 뇌염 바이러스, 진드기-매개 뇌염 바이러스, C형 간염 바이러스), 토가비리대(치쿤구니아 바이러스, 로스 강 바이러스, 마야로 바이러스, 서부 말 뇌염 바이러스, 동부 말 뇌염 바이러스, 베네주엘라 말 뇌염 바이러스), 부냐비리대(크리미아-콩고 출혈 열 바이러스, 리프트 계곡 열 바이러스, 쉬말렌베르그 바이러스), 칼리시비리대(E형 간염 바이러스), 아레나비리대(라사 바이러스) 및 필로비리대(에볼라 바이러스, 마르부르그 바이러스)의 과로부터의 RNA 바이러스에 의해 유발되는 바이러스 감염, 렙토스피로사 인테로간스에 의해 유발되는 세균 감염, 또는 플라스모듐 팔시파룸에 의해 유발되는 감염이다.

새로이 부각되고 있는 아르보바이러스가 최근에 서열분석되었으며, 독일, 베네룩스 및 프랑스에서 소에 영향을 끼친다. 이러한 바이러스는 쉬말렌베르그 바이러스(SBV)라 불리며, 부냐비리대 과의 오쏘부냐 바이러스 속의 심부(Simbu) 혈청그룹에 속하는 아카반 바이러스에 관련된다. 쉬말렌베르그 바이러스의 바이러스 게놈은 S, L 및 M으로 알려진 3개의 단일-가닥 RNA 절편을 포함한다. S 절편은 N 핵단백질 및 NS 비-구조 단백질을 인코딩한다. N 핵단백질은 상이한 부냐바이러스와 항원 결정자를 공유한다. 쉬말렌베르그 바이러스의 BH80/11-4 스트레인의 3개의 RNA 바이러스 서열이 번호 HE649913.1, HE649914.1 및 HE649912.1로 입수가능하다.

AGT 융합 단백질의 생산을 증가시키기 위한 AGT의 사용

본 발명자들은 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)와 SBV N 단백질과의 키메라 단백질로서의 융합이, 특히 S2 세포와 같은 무척추동물 세포에서 재조합 N 단백질의 생성을 크게 개선한다는 것을 관측하였다.

본 발명자들은 처음으로 숙주 세포, 특히 비-척추동물 세포에서 SBV로부터의 N 핵단백질의 생성을 증강시키기 위한 AGT 효소(EC 2.1.1.63) 또는 이의 돌연변이체, 이의 촉매 도메인 또는 이의 아단편의 이용을 제안한다. 증강 효과는 숙주 세포가 적어도 i) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, ii) AGT 효소 또는 이의 돌연변이체, 촉매 도메인 또는 아단편, 및 iii) SBV의 N 핵단백질을 포함하는 융합 폴리펩타이드를 발현하는 경우 관측된다. 증강 효과를 위해, AGT 효소는 직접적으로나 간접적으로 (스페이서 및 다른 아미노산이 도입될 수 있다) 관심 단백질에 물리적으로 연결되어야 한다. 특정 이론에 구애됨이 없이, AGT 효소가, 예를 들어, 숙주 세포로부터 분비를 용이하게 하고 합성된 융합 단백질을 숙주 세포의 상등액에서 안정화시키거나 이의 합성 및 숙주 세포로부터의 분비 동안 및 후 대사되는 것을 방지함으로써 샤페론 단백질로 작용한다고 생각된다. 또한, AGT는 AGT의 스캐폴딩 역활과 양립할 수 있는 α 나선(Wibley J.E.A. et al, 2000)을 포함하는 3D 구형 구조를 갖는 것으로 관측되었다.

본 발명과 관련하여, "숙주" 세포는 재조합 단백질을 생성하는데 사용될 수 있는 임의의 세포, 예를 들어, "비-척추동물"(또는 무척추동물) 세포, 척추동물 세포, 식물 세포, 효모 세포 또는 원핵생물 세포이다. 이들은, 바람직하게는, 비-척추동물 및 척추동물 세포이다.

비-척추동물(무척추동물로도 알려짐)은 상이한 문을 포함하며, 가장 유명한 것은 곤충(Insect), 거미(Arachnida), 연체동물(Mollusca), 환형동물(Annelida), 만각류 동물(Cirripedia), 방사대칭동물(Radiata), 강장동물(Coelenterata) 및 적충류(Infusoria)이다. 이들은 현재 바다수세미 및 편형동물과 같은 단순 유기체로부터 절지동물 및 연체동물과 같은 복잡한 동물까지 30개 이하의 문으로 분류된다. 본 발명과 관련하여, 비-척추동물 세포는 바람직하게는 곤충 세포, 예를 들어, 초파리(Drosophila) 또는 모기(Mosquito) 세포, 더욱 바람직하게는 초파리 S2 세포이다.

숙주 세포주로서 유용한 척추동물 유기체로부터 유도되는 세포의 예는 비-인간 배아 줄기 세포 또는 이의 유도체, 예를 들어, 조류 EBX 세포; SV40 서열로 형질전환된 원숭이 신장 CVI 세포주(COS-7, ATCC CRL 1651); 인간 배아 신장 세포주(293); 베이비 햄스터 신장 세포(BHK, ATCC CCL 10); 차이니즈 햄스터 난소 세포(CHO); 마우스 세르톨리 세포 [TM4]; 원숭이 신장 세포(CVI, ATCC CCL 70); 아프리카 녹색 원숭이 신장 세포(VERO-76, ATCC CRL-1587); 인간 경부 암 세포(HeLa, ATCC CCL 2); 개 신장 세포(MDCK, ATCC CCL 34); 버팔로 래트 간 세포(BRL 3A, ATCC CRL 1442); 인간 폐 세포(W138, ATCC CCL 75 ); 인간 간 세포(Hep G2, HB 8065); 마우스 유방 암 세포(MMT 060562, ATCC CCL51); 래트 간암 세포 [HTC, Ml.5]; YB2/O(ATCC n℃RL1662); NIH3T3; HEK 및 TRI 세포를 포함한다. 본 발명과 관련하여, 척추동물 세포는 바람직하게는 EBX, CHO, YB2/O, COS, HEK, NIH3T3 세포 또는 이의 유도체이다.

본 발명과 관련하여 사용될 수 있는 식물 세포는 토바코 컬티바스(tobacco cultivars) 브라이트 엘로우 2(BY2) 및 니코티아나 타바쿰(Nicotiana tabaccum) 1(NT-1)이다.

본 발명과 관련하여 사용될 수 있는 효모 세포는 사카로마이세스 세레비지애( Saccharomyces cerevisiae), 쉬조사카로마이세스 폼베( Schizosaccharomyces pombe) 및 한세눌라 폴리모파( Hansenula polymorpha), 및 피치아 파스토리스( Pichia pastoris) 및 피치아 메타놀리카( Pichia methanolica)와 같은 메틸로트로픽(methylotropic) 효모이다.

본 발명과 관련하여 사용될 수 있는 원핵생물 세포는 이. 콜라이 세균 또는 바실루스 서브틸리스(Bacillus subtilis) 세균이다.

또 다른 양상에서, 본 발명은, a) 숙주 세포에서 기능성인 분비 시그널 펩타이드, b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 서열번호 16의 SBV의 N 핵단백질을 인코딩하는 뉴클레오타이드 서열을 포함하는, 숙주 세포에서 SBV로부터의 N 핵단백질(SBV.N)를 발현시키기 위한 벡터에 관한 것이다.

SBV로부터의 N 핵단백질은 하기에서 "이종 단백질", "관심 단백질","키메라 단백질" 또는 "재조합 단백질"로 불릴것이다.

용어 "벡터"는 외래 유전자의 DNA 또는 RNA 서열이 숙주 세포에 도입되어 이를 형질전환시키고 도입된 서열의 발현을 증진시킬 수 있는 비히클을 의미한다. 본원에서 이해되는 바와 같이, 벡터는 핵산 분자, 예를 들어, 플라스미드, 파아지 및 바이러스이다. 이들은 하기에서 상세히 기술된다. 플라스미드, 코스미드, YAC 또는 바이러스 벡터의 어떠한 유형도 관심 단백질의 발현이 요구되는 숙주 세포로 도입될 수 있는 재조합 핵산 작제물을 제조하는데 사용될 수 있다. 특정 유형의 숙주 세포에서의 관심 단백질의 발현이 요구되는 경우, 목적하는 세포 유형 또는 조직 유형을 선택적으로 감염시키는 바이러스 벡터가 사용될 수 있다. 또한, 유전자 요법(즉, 숙주 유기체로 핵산 분자를 전달할 수 있는 유전자 요법)에 사용하기 위한 벡터가 본 발명에 중요하다.

예를 들어, 바이러스 벡터는 렌티바이러스, 레트로바이러스, 헤르페스 바이러스, 아데노바이러스, 아데노-관련 바이러스, 백시니아 바이러스, 배큘로바이러스 및 바람직한 세포 굴성을 갖는 다른 재조합 바이러스 벡터를 포함한다. 바이러스 벡터를 작제하고 사용하는 방법은 당해 기술 분야에 알려져 있다(참조:, Miller and Rosman, BioTechniques, 7:980-990, 1992).

본 발명에 실제로 바람직한 바이러스 벡터는 척추동물 및 비-척추동물 세포에 사용하기에 매우 적합한 것들이다.

비-척추동물 세포에 대해, 바람직한 벡터는 아르보바이러스 벡터이고, 웨스트 나일 바이러스 벡터가 특히 바람직하며, 이들은 절지동물 벡터이다. 비-척추동물 세포에서 효과적으로 발현되는 것으로 알려진 다른 벡터는 배큘로바이러스이다.

척추동물 세포에 대해, 렌티바이러스, AAV, 배큘로바이러스 및 아데노바이러스 벡터가 바람직하다. 포유동물 숙주 세포에서의 발현에 적합한 벡터는 또한 비-바이러스(예: 플라스미드 DNA) 기원의 것일 수 있다. 적합한 플라스미드 벡터는 pREP4, pCEP4(Invitrogen), pCI(Promega), pCDM8 및 pMT2PC, pVAX 및 pgWiz를 포함하고 이로 제한되지 않는다.

원핵생물 세포에 대해, 플라스미드, 박테리오파아지 및 코스미드 벡터가 바람직하다. 원핵생물 시스템에 사용하기에 적합한 벡터는 pBR322(Gibco BRL), pUC(Gibco BRL), pBluescript(Stratagene), p Poly, pTrc; pET 11d; pIN; 및 pGEX 벡터를 포함하고 이로 제한되지 않는다.

식물 세포에 대해, 플라스미드 발현 벡터, 예를 들어, Ti 플라스미드 및 바이러스 발현 벡터, 예를 들어, 콜리플라워 모자이크 바이러스(CaMV) 및 담배 모자이크 바이러스 TMV가 바람직하다.

3가지 유형의 벡터: 인테그레이션(integration) 벡터(YIp), 에피솜 플라스미드(YEp) 및 센트로메릭(centromeric) 플라스미드(YCp)를 사용하는 효모 세포에서의 재조합 단백질의 발현이 수행될 수 있다: 효모(예: 에스. 세레비지애)에서의 발현을 위한 적합한 벡터는 pYepSec1, pMFa, pJRY88, pYES2(Invitrogen Corporation, San Diego, Calif.) 및 pTEF-MF(Dualsystems Biotech Product code: P03303)을 포함하고 이로 제한되지 않는다.

유전자 요법에 사용될 수 있는 벡터는 당해 기술 분야에 널리 알려져 있다. 이들은, 예를 들어, 렌티바이러스, 레트로바이러스, 아데노바이러스, 폭스바이러스, 헤르페스 바이러스, 홍역 바이러스, 포미(foamy) 바이러스 또는 아데노-관련 바이러스(AAV)이다. 바이러스 벡터는 복제-적격 벡터이거나 복제-결함 또는 복제-손상되도록 유전적으로 장애를 가질 수 있다. 바람직한 유전자 요법 벡터는 WO 99/055892, US 6,682,507 및 WO 01/27300에 기술되어 있는 바와 같은 DNA Flap 벡터이다.

발현 생성물, 예를 들어, RNA, 폴리펩타이드, 단백질 또는 효소를 "인코딩"하는 서열은, 발현시, 상기 RNA, 폴리펩타이드, 단백질 또는 효소를 생성하는 뉴클레오타이드 서열이다: 즉, 상기 뉴클레오타이드 서열은 상기 RNA를 "인코딩"하거나 상기 폴리펩타이드, 단백질 또는 효소에 대한 아미노산 서열을 인코딩한다.

본 발명의 벡터는 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인을 인코딩하는 뉴클레오타이드 서열을 포함한다. 이들 폴리펩타이드는 상기에 정의되었다. 바람직하게는, 상기 AGT 돌연변이체는 서열번호 2의 SNAP 효소이고, 예를 들어, 서열번호 15 또는 서열번호 31에 의해 인코딩되며, 후자는 51%의 G/C 함량을 갖는다.

바람직하게는, 본 발명의 뉴클레오타이드 발현 벡터는 관심 단백질을 인코딩하는 이종 DNA 서열의 인-프레임 삽입을 가능하게 하는 클로닝 부위를 추가로 포함한다.

본 발명에서 용어 "분비 시그널 펩타이드"는 N 핵단백질의 숙주 세포 외부로의 수송을 지시하는 짧은 (3 내지 60개 아미노산 길이) 펩타이드를 나타낸다.

본 발명에 적합한 분비 시그널의 예는 교배 인자 (MF) 알파(US 5,879,926); 인버타제(WO　84/01153); PHO5(DK 3614/83); YAP3(효모 아스파틱 프로테아제 3; WO 95/02059); 및 BAR1(WO 87/02670)의 시그널 펩타이드 서열을 포함하고 이로 제한되지 않는다.

본 발명과 관련하여, 이러한 분비 시그널 펩타이드는 바람직하게는 비-척추동물 세포 또는 척추동물 세포 또는 이둘 모두에서 기능성이다.

곤충 세포에서 기능성인 분비 시그널 펩타이드의 예는 곤충 ssBiP(서열번호 37)(예를 들어, 서열번호 22의 DNA 서열에 의해 인코딩됨), 서열번호 24의 BiP-유사 펩타이드 시그널(예를 들어, 서열번호 23의 DNA 서열에 의해 인코딩됨), 서열번호 153의 BiP-유사 펩타이드 시그널(예를 들어, 서열번호 152의 DNA 서열에 의해 암호됨) 및 아르보바이러스, 예를 들어, 웨스트-나일 바이러스의 외피 E 단백질(서열번호 38)에 존재하는 임의의 펩타이드 시그널이다.

흥미롭게도, 서열번호 24의 상기 BiP-유사 펩타이드 시그널은 비-척추동물 및 척추동물 세포 모두에서 기능성이다. 이러한 BiP-유사 시그널은, 마지막 글리신 아미노산이 뎅기 바이러스의 E 단백질의 개열 부위에 상응하는 아미노산 서열 Pro Thr Ala Leu Ala(서열번호 39)으로 대체된 서열번호 37의 BiP 펩타이드 시그널에 상응한다. 따라서, BiP-유사 시그널은 일단 단백질이 해독되고 숙주 세포의 상등액에 분비되면 유리하게 개열될 것이다.

다양한 분비 시그널이 또한 효모 숙주 세포, 예를 들어 에스. 세레비지애에서의 발현에 이용가능하다. 이들은 프리프로-알파 인자, HSp150, PHO1, SUC2, KILM1(킬러 독소 1형) 및 GGP1을 포함한다.

클로닝 부위는 관심 단백질을 인코딩하는 유전자를 발현 시스템으로 클로닝 하는 것을 용이하게 하는 서열이다. 이는 제한 부위, 또는 제한 인지 부위, 즉, 제한 효소에 인지되는 뉴클레오타이드의 특정 서열을 포함하는 DNA 분자 상의 위치를 포함한다(예를 들어, 도면 참조). (제한 효소가 통상적으로 호모이량체로서 결합하기 때문에) 이들은 일반적으로 팔린드롬(palindromic) 서열이며, 특정 제한 효소는 이의 인지 부위 내 또는 근방의 2개의 뉴클레오타이드 사이의 서열을 개열할 수 있다. 클로닝 부위는 당업자에게 널리 알려져 있다.

본 발명의 바람직한 실시형태에서, 상기 AGT 효소를 인코딩하는 DNA 서열은 관심의 이종 단백질을 인코딩하는 DNA 서열의 5' 또는 3', 바람직하게는 5'에 위치된다. 따라서, AGT 효소는 관심의 이종 단백질/폴리펩타이드에 직접적으로나 간접적으로 연결되며, 바람직하게는 관심의 이종 단백질/폴리펩타이드의 N-말단에 위치된다. 펩타이드 시그널, AGT 효소 또는 이의 돌연변이체 또는 촉매 도메인 및 관심의 재조합 단백질을 포함하는 융합 폴리펩타이드를 인코딩하는 DNA 서열은 펩타이드 시그널이 기능성인 것과 동일한 숙주 세포에서 기능성인 유도성 프로모터과 작동적으로 연결될 수 있다.

더욱 바람직하게는, 본 발명의 벡터에서, 상기 개방 판독 프레임은 펩타이드 시그널이 기능성인 것과 동일한 숙주 세포에서 기능성인 유도성 프로모터와 작동적으로 연결된다.

인코딩 서열은, RNA 폴리머라제가 인코딩 서열을 RNA로 전사시킨 후, (RNA가 인트론을 포함하는 경우) 트랜스-RNA 스플라이싱되고, 인코딩 서열이 단백질을 인코딩하는 경우, 단백질로 해독되는 경우, 세포 내의 발현 조절 서열(즉, 전사 및 해독 조절 서열)과 "작동적으로 연결"된다.

"프로모터"는, 이로부터 하부에 (즉, 이중-가닥 DNA의 센스 가닥에 대해 3' 방향으로) 작동적으로 연결된 DNA의 전사가 개시될 수 있는 뉴클레오타이드의 서열이다. (편리하게는, 예를 들어, 뉴클레아제 S1을 사용한 매핑에 의해 발견되는) 전사 개시 부위 및 RNA 폴리머라제의 결합에 중요한 단백질 결합 도메인(컨센서스 서열)이 프로모터 서열 내에서 발견될 것이다.

본 발명과 관련하여 유전자 발현을 조절하는데 사용될 수 있는 프로모터는, 예를 들어, 비-척추동물 세포 또는 척추동물 세포에서 기능성인 것이다. 예를 들어, 비-척추동물 세포에 대해, 메탈로티오네인 유전자의 조절 서열이 사용될 수 있다(Brinster et al., Nature , 296:39-42, 1982).

바람직하게는, 본 발명의 벡터에 존재하는 유도성 프로모터는 곤충 세포, 더욱 바람직하게는 초파리 세포에서 프로모터 활성을 갖는다. 예를 들어, CuSO₄와 같은 금속의 존재 하에서 유전자의 고수준 전사를 지시하는, 드로소필라 메탈로티오네인(Drosophila metallothionein) 프로모터 pMT(Lastowski-Perry et al, J. Biol . Chem. 260:1527(1985))이다. 달리, 구성적 프로모터로서 금속 첨가를 필요로 하지 않는 초파리 액틴 5C 유전자 프로모터가 사용될 수 있다(B.J.Bond et al, Mol . 세포. Biol. 6:2080(1986)). 다른 공지된 초파리 프로모터는, 예를 들어, 유도성 열쇽(Hsp70) 및 COPIA LTR 프로모터를 포함한다. SV40 조기 프로모터는 초파리 메틸로티오네인 프로모터 보다 낮은 발현 수준을 제공한다.

바람직하게는, 본 발명의 벡터에 존재하는 유도성 프로모터는 드로소필라 멜 라노가스터( Drosophila melanogaster) 세포, 바람직하게는 초파리 S2 세포에서 프로모터 활성을 갖는다. 예를 들어, 문헌(Lastowski-Perry et al, J. Biol . Chem. 260: 1527 (1985))에 상세히 기술된 메탈로티오네인 프로모터이다.

포유동물 세포에서의 구성적 발현에 적합한 프로모터는 시토메갈로바이러스(CMV) 전 초기(immediate early) 프로모터, 아데노바이러스 주요 후기(major late) 프로모터, 포스포글리세로 키나제(PGK) 프로모터 및 단순 포진 바이러스(HSV)-1의 티미딘 키나제(TK) 프로모터를 포함한다. 외부에서 공급되는 화합물에 의해 조절되는 유도성 진핵생물 프로모터는 아연-유도성 메탈로티오네인(MT) 프로모터, 덱사메타손(Dex)-유도성 마우스 유방암 바이러스(MMTV) 프로모터, T7 폴리머라제 프로모터 시스템(WO 98/10088), 엑디손 곤충 프로모터, 테트라사이클린-억제성 프로모터, 테트라사이클린-유도성 프로모터, RU486-유도성 프로모터 및 라파마이신-유도성 프로모터를 포함하며 이로 제한되지 않는다.

바람직하게는, 본 발명의 벡터에 존재하는 프로모터는 포유동물 세포, 바람직하게는 HeLa 세포에서 프로모터 활성을 갖는다. 예를 들어, SV 40 프로모터이다.

다양한 효모 프로모터가 효모 숙주 세포에서의 단백질 발현에 이용가능하다. ADH2, SUC2와 같은 일부 프로모터는 발현시 유도성이고, GAPDH와 같은 다른 프로모터는 발현시 구성적이다. 효모에서의 발현에 적합한 다른 프로모터는 TEF, PGK, MF alpha, CYC-1, GAL-1, GAL4, GAL10, PHO5, 글리세르알데하이드-3-포스페이트 디하이드로게나제(GAP 또는 GAPDH) 및 알콜 디하이드로게나제(ADH) 프로모터를 포함하고 이에 제한되지 않는다.

식물 세포에 사용하기 위해, 가장 일반적으로 사용되는 프로모터는 콜리플라워 모자이크 바이러스(CaMV) 35S 프로모터 또는 이의 증강된 버젼이나, 다수의 대체적 프로모터, 예를 들어, 하이브리드(ocs)3mas 프로모터 또는 옥수수 및 아라비도스프시스 탈리아나( Arabidospsis thaliana)로부터의 유비퀴틴 프로모터가 사용될 수 있다. 이러한 구성적 프로모터와는 반대로, 라이스 α-아밀라제 RAmy3D 프로모터는 슈가 결핍에 의해 유도된다(Hellwig S et al., Nat. Biotechnol.2004; 22(11):1415-22).

이. 콜라이 숙주 세포에서의 발현에 적합한 프로모터는 박테리오파아지 람다 pL 프로모터, lac, TRP 및 IPTG-유도성 pTAC 프로모터를 포함하고 이로 제한되지 않는다.

분비 시그널 펩타이드 및 유도성 프로모터는 동일한 숙주 세포에서 기능성이다.

더욱 바람직하게는, 분비 시그널 펩타이드 및 유도성 프로모터는 초파리 S2 세포 및 척추동물 세포 모두에서 기능성이다.

프로모터에 적용되는 용어 "유도성"은 당업자에 의해 널리 이해된다. 본질적으로, 유도성 프로모터 조절 하에서의 발현은 적용된 자극에 반응하여 "발동(switched on)"되거나 증가된다. 자극의 특성은 프로모터 간에 다양하다. 일부 유도성 프로모터는 적합한 자극의 부재 하에서 적거나 검출 불가능한 수준의 발현을 야기한다(또는 발현을 야기하지 않는다). 다른 유도성 프로모터는 자극의 부재 하에서 검출가능한 구성적 발현을 야기한다. 발현이 자극의 부재 하에서 어떠한 수준이든, 임의의 유도성 프로모터로부터의 발현은 정확한 자극의 존재시 증가된다.

일단 적합한 벡터가 작제되고 선택된 숙주 세포, 바람직하게는, 초파리 세포주로 형질감염되면, 이종 단백질의 발현은 유도성 프로모터에 대한 적합한 유도제의 첨가에 의해 유도된다. 예를 들어, 카드뮴 또는 구리가 Hsp70 프로모터에 대한 유도제이다. 구성적 프로모터, 예를 들어, 액틴 5C 프로모터에 대해서는, 발현에 어떠한 유도제도 필요하지 않다.

본 발명의 또 다른 실시형태에서, 뉴클레오타이드 발현 벡터는, 바람직하게는 AGT 효소 또는 이의 촉매 도메인과 목적 재조합 단백질 사이에 위치되는, 하나 이상의 펩타이드 개열 부위를 인코딩한다.

펩타이드 개열 부위는 하나 이상의 프로테아제 효소(예를 들어, 특히 세린 프로테아제, 시스테인 프로테아제)에 의해 인지되는 아미노산 서열이다. 펩타이드 개열 부위의 예는 서열번호 40(AspAspAspAspLys/Asp)의 엔테로키나제 개열 부위이다. 엔테로키나제는 불활성 트립시노겐을 이 서열의 C-말단에서의 개열으로 활성 트립신으로 전환시키는 것으로 알려진 세린 프로테아제 효소(EC 3.4.21.9)이다: Val--(Asp)₄--Lys--Ile--Val~ (트립시노겐) -> Val--(Asp)₄--Lys (헥사펩타이드) + Ile--Val~ (트립신). 엔테로키나제는 Lys 앞에 4개의 Asp가 선행되고 프롤린 부분이 뛰따르지 않는 경우 리신 이후를 개열한다.

또 다른 유용한 펩타이드 개열 부위는 이른바 "TEV 프로테아제"의 개열 부위로서, 서열번호 32의 아미노산 서열(pro-TEV1) 또는 서열번호 33의 아미노산 서열(pro-TEV2)을 갖는다(각각 Glu Asn Leu Tyr Phe Gln Ser 또는 Gly). 이러한 개열 부위는, 예를 들어, 서열번호 29 및 30에 의해 인코딩될 수 있다. TEV 프로테아제는 담배 에치 바이러스(tobacco etch virus)에 의해 인코딩되는 핵 포함 단백질의 27 kDa 촉매 도메인에 대한 일반명이다. 이는 시판된다(Invitrogen).

뎅기 바이러스 혈청형 1의 막 전구체 prM으로부터의 개열 부위(서열번호 39)도 또한 본 발명의 벡터에 사용될 수 있다.

또 다른 실시형태에서, 본 발명이 뉴클레오타이드 발현 벡터는, 바람직하게는 (펩타이드 시그널, AGT 단백질 또는 이의 상동체 및 재조합 단백질을 포함하는) 본 발명의 융합 폴리펩타이드에서 재조합 단백질의 C-말단에 위치되는, 표지를 추가로 인코딩한다. 본 발명과 관련하여, "표지"는 숙주 세포의 조 용해물로부터 폴리펩타이드의 회수를 용이하게 하기 위한 것으로서, 바람직하게는 형광 단백질, 폴리-히스티딘(poly-his) 또는 폴리-히스티딘-글리신(poly-his-gly) 택; flu HA 택; c-myc tag 단순 포진 바이러스 당단백질 D(gD) 택, Flag-펩타이드, 알파-투불린 에피토프, 또는 T7 유전자 10 단백질 펩타이드 택을 포함하는 그룹 중에서 선택된다. 그러나, 임의의 다른 표지도 사용될 수 있다. 본 발명의 바람직한 실시형태에서, 벡터는 서열번호 27을 갖는 헥사-히스티딘 택을 인코딩하는 서열번호 28의 DNA을 포함한다.

또 다른 실시형태에서, 본 발명의 뉴클레오타이드 발현 벡터는, 바람직하게는 AGT 효소(또는 이의 촉매 도메인)와 관심 재조합 단백질 사이 및/또는 관심 재조합 단백질과 표지 사이에 위치되는, 스페이서 서열(들)을 추가로 인코딩한다. 본 발명과 관련하여, 스페이서 서열은 2개의 연결된 폴리펩타이드가 공간적으로 떨어지게 하는 (이로써 이들 폴리펩타이드는 간접적으로 연결된다) 적어도 3개의 아미노산을 포함하는 아미노산 서열이다. 이러한 스페이서는, 예를 들어, 아미노산 서열 글리신-글리신-글리신-세린(GGGS, 서열번호 25)일 수 있고, 이를 인코딩하는 DNA 스페이서 서열은 서열번호 26일 수 있다. 본 발명과 관련하여, 이러한 DNA 서열은 이하에서 "DNA 스페이서 서열"이라 지칭되며, AGT 또는 이의 촉매 도메인과, 바람직하게는 펩타이드 개열 부위를 인코딩하는 DNA서열로부터 상부에 있는, 재조합 DNA 서열 사이에 위치된다.

SNAP 카세트 및 항원 발현

본원에서 사용되는 용어 "pDeSNAPUniv"는 단일 개방 판독 프레임에 5'로부터 3'로 하기를 인코딩하는 DNA 카세트를 지칭한다:

a) 분비 시그널 펩타이드,

b) 서열번호 1의 AGT 단백질 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 특히 서열번호 2의 SNAP 돌연변이체,

c) 하나 이상의 펩타이드 개열 부위,

d) 하나 이상의 표지, 및

e) 하나 이상의 스페이서 서열.

이러한 pDeSNAPUniv DNA 카세트는, 유리하게는 서열번호 24의 BiP-유사 펩타이드 시그널 또는 서열번호 37의 ssBiP 펩타이드 시그널인 분비 시그널, 서열번호 2의 SNAP 돌연변이체, 유리하게는 서열번호 27의 His-택인 표지, 유리하게는 서열번호 32의 pro-TEV 또는 서열번호 33의 pro-TEV인 펩타이드 개열 부위, 및/또는 유리하게는 서열번호 25의 아미노산 서열을 갖는 스페이서를 인코딩한다.

더욱 바람직하게는, pDeSNAPUniv DNA 카세트는 5'로부터 3'로 BiP-유사 분비 시그널을 인코딩하는 서열번호 23의 서열, SNAP 돌연변이체를 인코딩하는 서열번호 15 또는 31, 서열번호 26의 스페이서 서열, 서열번호 29의 펩타이드 개열 부위 pro-TEV, 서열번호 30의 펩타이드 개열 부위 pro-TEV, 서열번호 26의 스페이서 서열 및 His-택 표지를 인코딩하는 서열번호 28의 서열을 포함한다(pDeSNAPUniv 카세트의 구조를 도시하는 도 8 참조). 이러한 pDeSNAPUniv DNA 카세트는, 예를 들어, 서열번호 34이다.

이러한 "pDeSNAPUniv" 카세트는 이종 단백질을 생성하기 위해 숙주 세포를 형질감염하는데 사용되는 모든 종류의 벡터, 즉 척추동물 벡터(예: pcDNA3 또는 pCI-neo 벡터) 및 비-척추동물 벡터(예: Invitrogen으로부터의 DES 시스템에 유용한 pMT/BiP/V5-HisA)에 삽입될 수 있으므로, "보편적"인 것으로 여겨진다. 이러한 보편적 서열을 포함하는 플라스미드의 예는 서열번호 43(pDeSNAP Univ 카세트를 포함하는 Invitrogen으로부터의 pMT/BiP/V5-HisA), 서열번호 44(pDeSNAP Univ 카세트를 포함하는 Invitrogen으로부터의 pUC57) 또는 서열번호 45(pDeSNAP Univ 카세트를 포함하는 Invitrogen으로부터의 pcDNA3)이다.

상기 보편적 서열을 포함하는 또 다른 플라스미드의 예는 5'로부터 3'로 오르기아 슈도쓰가타(Orgyia pseudotsugata) 멀티캡시드 핵단백질 바이러스-전 초기 2 프로모터(OpIE2SP)의 구성적 프로모터, 서열번호 152의 BiP-유사 시그널 펩타이드, 서열번호 31의 SNAP-유사 서열, 서열번호 26의 스페이서 서열, 서열번호 29의 pro-TEV1, 및 서열번호 106의 C-말단 펩타이드 택을 포함하는 pUC57 플라스미드인 서열번호 105이다.

일단 SBV.N과 같은 관심 단백질의 이종 서열이 이러한 벡터에 클로닝되면, 벡터는 유리하게는 관심 단백질을 다량으로 생성하도록 척추동물 또는 비-척추동물에 형질감염될 수 있다.

바람직한 실시형태에서, 본 발명의 벡터는 이른바 "pDeSNAP Univ/SBV.N 카세트", 즉, SBV의 N 핵단백질의 서열이 삽입된 pDeSNAPUniv DNA 카세트를 포함하고, 상기 pDeSNAP Univ/SBV.N 카세트는 단일 개방 판독 프레임에 5'로부터 3'로 하기를 인코딩하는 뉴클레오타이드 서열을 포함한다:

a) 분비 시그널 펩타이드,

c) 하나 이상의 펩타이드 개열 부위,

d) 서열번호 16의 SBV의 N 핵단백질,

e) 하나 이상의 표지, 및

f) 하나 이상의 스페이서 서열.

이러한 pDeSNAP Univ/SBV.N DNA 카세트는 유리하게는 서열번호 24의 BiP-유사 펩타이드 시그널 또는 서열번호 37의 ssBiP 펩타이드 시그널인 분비 시그널 펩타이드, 서열번호 2의 SNAP 돌연변이체, 서열번호 16의 SBV의 N 핵단백질, 유리하게는 서열번호 27의 His-택인 표지, 유리하게는 서열번호 32의 pro-TEV 또는 서열번호 33의 pro-TEV인 펩타이드 개열 부위, 및/또는 유리하게는 서열번호 25의 아미노산 서열을 갖는 스페이서 서열을 인코딩한다.

더욱 바람직하게는, pDeSNAP Univ/SBV.N DNA 카세트는 5'로부터 3'로 BiP-유사 분비 시그널을 인코딩하는 서열번호 23의 서열 또는 ssBiP 분비 시그널을 인코딩하는 서열번호 22, SNAP 돌연변이체를 인코딩하는 서열번호 15 또는 31, 서열번호 26의 스페이서 서열, 서열번호 29의 펩타이드 개열 부위 pro-TEV1, SBV의 N 핵단백질을 인코딩하는 서열번호 17의 서열, 서열번호 30의 펩타이드 개열 부위 pro-TEV2, 서열번호 26의 스페이서 서열 및 His-택 표지를 인코딩하는 서열번호 28의 서열을 포함한다.

더욱더 바람직하게는, pDeSNAP Univ/SBV.N DNA 카세트는 5'로부터 3'로 BiP 시그널을 인코딩하는 서열번호 22의 서열, SNAP 돌연변이체를 인코딩하는 서열번호 31, 서열번호 26의 스페이서 서열, 서열번호 29의 펩타이드 개열 부위 pro-TEV1, SBV의 N 핵단백질을 인코딩하는 서열번호 17의 서열, 서열번호 30의 펩타이드 개열 부위 pro-TEV2, 서열번호 26의 스페이서 서열 및 His-택 표지를 인코딩하는 서열번호 28의 서열을 포함한다. 이러한 pDeSNAP Univ/SBV.N 카세트는, 예를 들어, 서열번호 35이다.

달리, pDeSNAP Univ/SBV.N DNA 카세트는 5'로부터 3'로 BiP-유사 분비 시그널을 인코딩하는 서열번호 23의 서열, SNAP 돌연변이체를 인코딩하는 서열번호 31, 서열번호 26의 스페이서 서열, 서열번호 29의 펩타이드 개열 부위 pro-TEV1, SBV의 N 핵단백질을 인코딩하는 서열번호 17의 서열, 서열번호 30의 펩타이드 개열 부위 pro-TEV2, 서열번호 26의 스페이서 서열 및 His-택 표지를 인코딩하는 서열번호 28의 서열을 포함할 수 있다. 이러한 pDeSNAP Univ/SBV.N 카세트는, 예를 들어, 서열번호 36이다(이의 구조가 도 9에 도시되어 있다).

따라서, 바람직한 실시형태에서, 본 발명의 벡터는 서열번호 35의 뉴클레오타이드 서열 또는 서열번호 36의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/SBV.N 카세트를 포함한다.

더욱 정확히, 서열번호 35의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/SBV.N 카세트는 하기를 포함한다:

- 서열번호 22의 곤충 BiP 서열,

- 서열번호 31의 SNAP-유사 서열,

- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제1 DNA 서열,

- 서열 ENLYFQS(서열번호 32)의 pro-TEV1 개열 부위를 인코딩하는 서열번호 29의 DNA 서열,

- 서열번호 17의 SBV.N DNA 서열(내부 EcoRV 부위가 결실되고 2개의 EcoRV 및 XmaI 부위가 맨 끝에 첨가된, 천연 SBV.N 서열에 상응),

- 서열 ENLYFQG(서열번호 33)의 pro-TEV2 개열 부위를 인코딩하는 서열번호 30의 DNA 서열,

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

서열번호 36의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/SBV.N 카세트는 하기를 포함한다(도 9 참조):

- 서열번호 23의 곤충 BiP-유사 서열,

- 서열번호 31의 SNAP-유사 서열,

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

흥미롭게도, 서열번호 36의 pDeSNAP Univ/SBV.N 카세트 뉴클레오타이드 서열은 또한 AGT의 상부에 NheI 부위, BiP-유사 서열과 SNAP-유사 서열 사이에 BglII 부위, 및 정지 코돈 하부에 위치된 AgeI 부위 및 HindIII 부위를 포함한다.

본 발명의 벡터는, 예를 들어, 서열번호 17의 SBV.N DNA 서열이 삽입된 서열번호 43(pDeSNAP Univ 카세트를 포함하는 Invitrogen으로부터의 pMT/BiP/V5-HisA 플라스미드), 서열번호 17의 SBV.N DNA 서열이 삽입된 서열번호 44(pDeSNAP Univ 카세트를 포함하는 Invitrogen으로부터의 pUC57 플라스미드) 또는 서열번호 17의 SBV.N DNA 서열이 삽입된 서열번호 45(pDeSNAP Univ 카세트를 포함하는 Invitrogen으로부터의 pcDNA3 플라스미드)이다.

본 발명의 벡터는 또한 파스퇴르 인스티튜트 국립 미생물 배양센터 [the Centre National de Culture et de Microorganismes(CNCM), Institut Pasteur(25 rue du Docteur Roux, 75724 Paris cedex 15, France)]에 2012년 4월 24일자로 기탁 번호 CNCM I-4616으로 기탁된 S2에 제공된다.

또 다른 양상에서, 본 발명은 본 발명의 벡터, 바람직하게는 서열번호 35 또는 서열번호 36의 뉴클레오타이드 서열을 포함하는 벡터로 안정하게 형질감염되는 재조합 세포에 관한 것이다.

바람직하게는, 본 발명의 이러한 양상에서, 상기 재조합 세포는 비-척추동물 세포, 바람직하게는 곤충 세포, 더욱 바람직하게는 S2 세포이다.

비-척추동물 세포는 곤충(Insect), 거미(Arachnida), 갑각류 동물(Crustacea), 연체동물(Mollusca), 환형동물(Annelida), 만각류 동물(Cirripedia), 방사대칭동물(Radiata), 강장동물(Coelenterata) 및 적충류(Infusoria) 중의 임의의 동물일 수 있다. 본 발명과 관려하여, 비-척추동물은 바람직하게는 곤충 세포, 예를 들어, 초파리 또는 모기 세포이다. 이들은 더욱 바람직하게는 초파리 S2 세포이다. 이러한 경우, 본 발명의 발현 벡터는, 예를 들어, 서열번호 35를 포함한다.

초파리 S2 세포는 널리 알려져 있다. 이들은 실온(24±1℃)에서 현탁 배양으로 유지될 수 있기 때문에 고수율 단백질 생산에 특히 적합하다. 배양 배지는 5 내지 10%(v/v)의 열-불활성화된 우태혈청 혈청(FBS)으로 보충된 M₃이다. 본 발명의 바람직한 실시형태에서, 배양 배지는 5% FBS를 포함한다. 세포는 유도 후 혈청-비함유 배지에서 배양된다. S2 세포는 이러한 배지에서 현탁 배양으로, 예를 들어, 250 mL 내지 2000 mL 스피너 플라스크에서 50 내지 60 rpm의 교반과 함께 성장될 수 있다. 세포 밀도는 통상적으로 10⁶ 내지 10⁷개/mL로 유지된다.

바람직한 실시형태에서, 본 발명의 재조합 세포는 파스퇴르 인스티튜트 국립 미생물 배양센터 [the Centre National de Culture et de Microorganismes(CNCM), Institut Pasteur(25 rue du Docteur Roux, 75724 Paris cedex 15, France)]에 2012년 4월 24일자로 기탁 번호 CNCM I-4616으로 기탁된 S2 세포이다.

또 다른 바람직한 실시형태에서, 상기 재조합 세포는 척추동물 세포이다.

바람직하게는, 상기 척추동물 재조합 세포는 포유동물 세포, 바람직하게는 CHO, YB2/O, COS, HEK, NIH3T3, HeLa 세포 또는 이의 유도체이다. 더욱 바람직하게는, 본 발명의 발현 벡터는 서열번호 36을 포함한다.

본 발명의 또 다른 양상에서, 상기 재조합 세포는 본 발명의 발현 벡터, 바람직하게는 서열번호 35 또는 36을 포함하는 발현 벡터를 증폭 및 정제하는데 사용된다.

이러한 목적 상, 본 발명의 뉴클레오타이드 발현 벡터는 선별 마커를 인코딩하는 유전자 및/또는 터미네이터 서열을 포함한다. 작제물에 포함될 수 있는 선별 마커 유전자는 통상적으로 항생제(예: 블라스티시딘, 암피실린, 카나마이신, 하이그로마이신, 푸로마이신, 클로람페니콜)에 대한 내성과 같은 선별가능한 표현형을 제공하는 것들이다.

발현 벡터를 제조하는 방법은 당해 기술 분야에 널리 알려져 있다.

또 다른 양상에서, 본 발명의 재조합 세포는 쉬말렌베르그 바이러스의 N 핵단백질을 다량으로 생성하도록 사용된다.

따라서, 특정 실시형태에서, 본 발명은 또한 쉬말렌베르그 바이러스의 N 핵단백질을 제조하는 방법에 관한 것으로서, 상기 방법은 하기 단계를 포함한다:

(a) 예를 들어, 서열번호 35 또는 36의 DNA 서열을 포함하는 본 발명의 벡터를 수득하는 단계,

(b) 단계 (a)에서 수득된 폴리뉴클레오타이드를 사용하여 숙주 세포(바람직하게는, 곤충 세포 또는 포유동물 세포)를 형질감염하는 단계,

(c) 단계 (b)에서 수득된 상기 폴리뉴클레오타이드를 발현시켜 쉬말렌베르그 바이러스의 N 핵단백질을 생성하는 단계,

(d) 임의로, AGT 폴리펩타이드를 개열하는 단계,

(e) 쉬말렌베르그 바이러스의 N 핵단백질을 회수하는 단계,

(f) 임의로, 쉬말렌베르그 바이러스의 N 핵단백질을 정제하는 단계.

본 발명의 방법의 상이한 단계들을 수행하기 위해서, 당해 기술 분야의 통상의 분자 생물학, 미생물학 및 재조합 DNA 기술을 이용할 수 있다. 이러한 기술은 문헌에 충분히 설명되어 있다. 예를 들어, 하기 문헌을 참조한다: Sambrook, Fitsch & Maniatis, Molecular Cloning: A Laboratory Manual, 제2 Edition (1989) Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (본원에서 "Sambrook et al., 1989"로 언급됨); DNA Cloning: A Practical Approach, Volumes I 및 II (D. N. Glover ed. 1985); Oligonucleotide Synthesis (M. J. Gait ed. 1984); Nucleic Acid Hybridization(B. D. Hames & S. J. Higgins, eds. 1984); Animal Cell Culture (R. I. Freshney, ed. 1986); Immobilized Cells and Enzymes (IRL Press, 1986); B. E. Perbal, A Practical Guide to Molecular Cloning (1984); F. M. Ausubel et al. (eds.), Current Protocols in Molecular Biology, John Wiley & Sons, Inc. (1994).

용어 "형질감염"은, 숙주 세포가 도입된 유전자 또는 서열을 발현시켜 쉬말렌베르그 바이러스의 N 핵단백질을 생성하도록, 외래 핵산을 진핵생물 숙주 세포로 도입하는 것을 의미한다. 도입된 DNA 또는 RNA를 수용하고 발현시키는 숙주 세포는 "형질감염되며", 이러한 숙주 세포가 "트랜스펙턴트" 또는 "클론"이다. 숙주 세포에 도입된 DNA 또는 RNA는 숙주 세포와 동일한 속 또는 종의 세포 또는 상이한 속 또는 종의 세포를 포함하는 임의의 공급원으로부터의 것일 수 있다.

본 발명과 관련하여, 폴리뉴클레오타이드를 사용한 숙주 세포의 형질감염은 당해 기술 분야의 고전적인 방법, 예를 들어, 형질감염, 감염 또는 전기천공으로 수행될 수 있다. 또 다른 실시형태에서, 본 발명의 벡터는 (네이키드 (naked) DNA로서) 리포펙션에 의해 또는 다른 형질감염 촉진제(펩타이드, 중합체 등)를 사용하여 생체내에서 도입될 수 있다. 합성 양이온 지질을 사용하여 마커를 인코딩하는 유전자의 생체내 형질감염을 위한 리포좀을 제조할 수 있다(Felgner et al., Proc. Natl. Acad. Sci. U.S.A., 84:7413-7417, 1987). 핵산 전달에 유용한 지질 화합물과 조성물이 WO 95/18863, WO 96/17823 및 U.S. 5,459,127에 기술되어 있다. 지질은 표적화를 위한 다른 분자에 화학적으로 커플링될 수 있다(참조:, Mackey et al., Proc. Natl. Acad. Sci. U.S.A., 85:8027-8031, 1988). 표적 펩타이드, 예를 들어, 호르몬 또는 신경전달자 및 단백질, 예를 들어, 항체, 또는 비-펩타이드 분자를 화학적으로 리포좀에 커플링시킬 수 있었다. 또한, 다른 분자, 예를 들어, 양이온성 올리고펩타이드(참조: WO 95/21931), DNA 결합 단백질로부터 유도되는 펩타이드(참조: WO 96/25508), 또는 양이온성 중합체(참조: WO 95/21931)도 핵산의 생체내 형질감염을 용이하게 하는데 유용하다. 또한, 벡터를 생체내에서 네이키드 DNA 플라스미드로서 도입할 수 있다. 유전자 요법을 위한 네이키드 DNA 벡터는 당해 기술 분야의 공지된 방법, 예를 들어, 전기천공, 마이크로주입, 세포 융합, DEAE 덱스트란, 인산칼슘 침전, 유전자총 사용, DNA 벡터 이동자 사용에 의해 목적하는 숙주 세포로 도입될 수 있다(참조:, Wu et al., J. Biol. Chem., 267:963-967, 1992; Wu and Wu, J. Biol. Chem., 263:14621-14624, 1988; Williams et al., Proc. Natl. Acad. Sci. U.S.A., 88:2726-2730, 1991).

본원에서 폴리뉴클레오타이드의 "발현을 가능하게 하는"이란 표현은 벡터에 존재하는 조절 서열의 자극(예: 유도성 프로모터를 활성화시키는 자극) 및 모든 필요한 성분이 폴리뉴클레오타이드의 해독이 일어나기에 충분한 양으로 존재한다는 것을 의미한다.

필요한 경우, AGT/SNAP 폴리펩타이드는, 재조합 세포의 상등액에 또는 재조합 세포내로 정의된 개열 부위를 갖는 프로테아제를 부가함으로써 생성된 융합 단백질로부터 개열될 수 있다. 예를 들어, 서열번호 35 또는 36의 pDeSNAP Univ 카세트를 포함하는 벡터를 사용하는 경우, 재조합 세포의 상등액에 TEV 프로테아제를 부가함으로써 pro-TEV 개열 부위 ENLKYFQ/G(S)가 개열된다. 달리, AGT/SNAP 폴리펩타이드는 SBV로부터의 N 핵단백질의 수명을 증진시키도록 유지될 수 있다.

또한, 당업자는 발현되거나 분비되는 단백질 또는 폴리펩타이드가 당해 숙주 세포를 유지시키거나 성장시키기 위해 사용된 배양 배지에서 검출될 수 있다는 것을 알 수 있을 것이다. 배양 배지는 공지된 공정, 예를 들어, 원심분리 또는 여과에 의해 숙주 세포로부터 분리될 수 있다. 이어서, 단백질 또는 폴리펩타이드는 이에 대해 공지된 특성을 이용하여 세포-비함유 배양 배지에서 검출될 수 있다. 이러한 특성은 단백질 또는 폴리펩타이드의 상이한 면역학적, 효소적 또는 물리적 특성을 포함할 수 있다. 예를 들어, 단백질 또는 폴리펩타이드가 독특한 효소 활성을 갖는 경우, 숙주 세포에 의해 사용된 배양 배지 상에서 효소 활성 분석이 수행될 수 있다. 또한, 소정의 단백질 또는 폴리펩타이드에 대해 반응적인 항체가 이용가능한 경우, 이러한 항체를 사용하여 (예를 들어, 문헌(Harlowe, et al., 1988, Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory Press)에서와 같이) 임의의 공지된 면역학적 분석으로 단백질 또는 폴리펩타이드를 검출할 수 있다

SBV로부터의 핵단백질 N 의 회수는, 제조용(preparative) 디스크-겔 전기영동, 등전점 포커싱, HPLC, 역상 HPLC, 겔 여과, 이온 교환 및 분배 크로마토그래피, 침전 및 염석 크로마토그래피, 추출, 향류 분배 등을 포함하고 이로 제한되지 않는 당해 기술 분야의 널리 공지된 방법으로 수행된다. 표지는 적합한 고체상 매트릭스 상에서의 크로마토그래피로 숙주 세포의 조 용해물로부터 폴리펩타이드의 회수를 용이하게 할 것이므로, 표지와 연결된 본 발명의 재조합 시스템으로 관심 단백질을 생성하는 것이 바람직하다. 달리, 단백질 또는 이로부터 유도된 펩타이드에 대해 생성된 항체를 회수 시약으로 사용할 수 있다.

본 발명자들은 본 발명의 방법으로 생성되는 융합 단백질이 일반적으로 추가로 정제될 필요가 없다는 것을 발견하였다. 그러나, 필요한 경우, 추가의 정제 단계 (g)가 수행될 수 있다.

정제된 물질은 처음에 관련된 세포성 성분을 약 50% 미만, 바람직하게는 약 75% 미만, 가장 바람직하게는 약 90% 미만으로 포함할 수 있다. 용어 "실질적으로 순수한"은 당해 기술 분야에 공지된 통상의 정제 기술을 이용하여 달성될 수 있는 최고의 순도를 나타낸다.

본 발명의 일 실시형태에서, 본 발명의 방법은 회수된 세포 배양 상등액 중의 적어도 40 mg/L, 바람직하게는 적어도 50 mg/L, 더욱 바람직하게는 적어도 60 mg/L의 실질적으로 순수한 쉬말렌베르그 바이러스(SBV)의 N 핵단백질을 수득하는 것을 가능하게 한다.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 서열번호 16의 쉬말렌베르그 바이러스의 N 핵단백질을 포함하는 융합 폴리펩타이드에 관한 것이다.

이러한 융합 폴리펩타이드에서, AGT 효소는 바람직하게는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다.

이러한 융합 폴리펩타이드 바람직하게는 상기 정의된 바와 같은 표지를 추가로 포함한다. 이러한 표지는 바람직하게는 폴리-히스티딘 표지이며, 바람직하게는 쉬말렌베리그 바이러스의 N 핵단백질의 C 말단에 위치된다.

본 발명의 융합 폴리펩타이드의 예는 서열번호 41(BiPlike/SNAP/SBV.N/Histag 융합 단백질에 상응) 또는 서열번호 46(ssBiP/SNAP/SBV.N/Histag 융합 단백질에 상응) 또는 서열번호 42(SNAP/SBV.N 융합 단백질에 상응)의 아미노산 서열이다.

본 발명은, 서열번호 178의 뉴클레오타이드 서열을 갖고/갖거나 서열번호 179의 아미노산 서열을 인코딩하는 DeSNAPuniv-쉬말렌베르그 NS 단백질 카세트를 포함하는 벡터를 포함한다. 상기 벡터는 SNAP의 시그널 펩타이드, SNAP 서열, pro-TEV 부위, 또는 도 24에 도시된 수말렌베르그 바이러스의 NS 단백질을 인코딩하는 DNA 서열, 또는 이의 적어도 10, 15, 20, 25, 30, 40, 50, 60, 100, 200 또는 300개의 연속 아미노산을 단독으로 또는 조합하여 포함한다.

마지막으로, 키메라 단백질 SNAP-SBV. N는 생물학적 유체, 예를 들어, 혈액, 혈청, 타액 등에서 쉬말렌베르그 바이러스에 의한 감염의 검출 또는 상기 바이러스에 특이적인 항체의 검출을 위한 진단제로서 유용할 수 있다.

따라서, 또 다른 양상에서, 본 발명은 또한, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 병원성 또는 비-병원성 미생물의 존재를 확인하기 위한 본 발명의 임의의 방법에 의해 수득되는 융합 단백질 [SNAP- SBV. N]의 용도에 관한 것이다.

또 다른 양상에서, 본 발명은 또한 관심 항원, 예를 들어, 관심의 바이러스 또는 세균 항원, 미생물 펩타이드 및/또는 폴리펩타이드와 프레임 내에 융합된 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인을 포함하는 특정 관심의 융합 단백질을 발현하는 벡터에 관한 것이다. 이들 벡터가 하기에서 상세히 기술된다.

에코바이러스 항원

또 다른 양상에서, 본 발명은 숙주 세포에서 에코바이러스 항원, 예를 들어, 엔테로바이러스 71(피코나비리대)의 VP1 단백질을 발현시키기 위한 벡터에 관한 것이다. 특히, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 엔테로바이러스 71(EV71, 예를 들어, 문헌(Kolpe A.B. et al, Virus Research 2012) 참조)의 VP1 단백질을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.

바람직한 실시형태에서, 이 벡터는 이른바 "pDeSNAP Univ/EV71.VP1 카세트", 즉, EV71 바이러스 스트레인 JL-AFP-EV71-07-03(Genebank#JQ715713)으로부터의 VP1 단백질을 인코딩하는 서열번호 47의 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이 벡터는 하기를 포함하는 서열번호 48의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/EV71.VP1 카세트를 포함한다:

- 서열번호 22의 곤충 BiP 서열,

- 서열번호 31의 SNAP-유사 서열,

- EV71 바이러스 스트레인 JL-AFP-EV71-07-03(Genebank#JQ715713)로부터의 VP1 단백질을 인코딩하는 서열번호 47의 DNA 서열,

- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제2 DNA 서열,

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) EV71 바이러스로부터의 VP1 단백질을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 49의 아미노산 서열(SNAP-유사/proTEV1/EV71.VP1/proTEV2/Histag 융합 단백질에 상응)이다. 고도(30mg/l)의 이러한 단백질은 S2의 유도 후에 생성되었다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석에서,생물학적 샘플 중의 엔테로바이러스 71의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- EV71.VP1]의 용도에 관한 것이다.

플라비바이러스 항원

또 다른 양상에서, 본 발명은 숙주 세포에서 특정 플라비바이러스 항원을 발현시키기 위한 벡터에 관한 것이다.

바람직한 실시형태에서, 상기 플라비바이러스 항원은 일본 뇌염으로부터의 가용성 E 단백질(sE)(JEV.sE)이다. 보다 특히, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 일본 뇌염 바이러스로부터의 sE 단백질을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/JEV.sE 카세트, 즉 일본 뇌염 바이러스(JEV)로부터의 가용성 E 단백질(sE)을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 5'로부터 3'까지 하기를 포함하는 서열번호 50의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/JEV.sE 카세트를 포함한다:

- 서열번호 22의 곤충 BiP 서열,

- JEV 스트레인 SA-14(Genbank#M55506)으로부터의 prM/M 서열을 인코딩하는 DNA 서열,

- JEV 스트레인 SA-14(Genbank#M55506)으로부터의 E[1-395] 서열을 인코딩하는 DNA 서열,

- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 DNA 서열,

- 서열번호 31의 SNAP-유사 서열,

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 일본 뇌염 바이러스로부터의 가용성 E 단백질(sE)(JEV.sE)을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 51의 아미노산 서열(JEV.sE/SNAP-유사/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 일본 뇌염 바이러스(JEV)의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-JEV.sE]의 용도에 관한 것이다.

바람직한 실시형태에서, 상기 플라비바이러스 항원은 일본 뇌염 바이러스 유전형 1(JE-1.EDIII), 유전형 2(JE-2.EDIII), 유전형 4(JE-4.EDIII), 또는 유전형 5(JE-5.EDIII)로부터의 외피 E 단백질의 도메인 III(EDIII 단백질)이다.

또 다른 양상에서, 본 발명은 따라서 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 일본 뇌염 바이러스 유전형 1(JE-1.EDIII), 유전형 2(JE-3.EDIII), 유전형 4(JE-4.EDIII), 또는 유전형 5(JE-5.EDIII)로부터의 EDIII 단백질을 인코딩하는 뉴클레오타이드 서열을 포함하는, 숙주 세포에서 일본 뇌염 바이러스 유전형 1(JE-1.EDIII), 유전형 2(JE-2.EDIII), 유전형 4(JE-4.EDIII), 또는 유전형 5(JE-5.EDIII)로부터의 외피 E 단백질의 도메인 III(EDIII 단백질)을 발현시키기위한 벡터에 관한 것이다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/JE-I.EDIII 카세트", 즉, 일본 뇌염 바이러스 유전형 1로부터의 외피 E 단백질의 도메인 III(EDIII 단백질)(JE-1.EDIII)를 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 52이 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/ JE-1.EDIII 카세트를 포함한다:

- 서열번호 23의 곤충 BiP-유사 서열,

- 서열번호 31의 SNAP-유사 서열,

- 일본 뇌염 바이러스 유전형 1(Genebank#AY377577)로부터의 외피 E 단백질의 도메인 III(EDIII 단백질)를 인코딩하는 서열번호 54의 DNA서열,

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/JE-2.EDIII 카세트", 즉, 일본 뇌염 바이러스 유전형 2로부터의 외피 E 단백질의 도메인 III(EDIII 단백질)(JE-2.EDIII)의 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 59의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/ JE-2.EDIII 카세트를 포함한다:

- 서열번호 23의 곤충 BiP-유사 서열,

- 서열번호 31의 SNAP-유사 서열,

- 일본 뇌염 바이러스 유전형 2(Genebank#L-43566)로부터의 외피 E 단백질의 도메인 III(EDIII 단백질)를 인코딩하는 서열번호 55의 DNA서열,

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/JE-4.EDIII 카세트", 즉, 일본 뇌염 바이러스 유전형 4로부터의 외피 E 단백질의 도메인 III(EDIII 단백질)(JE-4.EDIII)의 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 61의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/ JE-4.EDIII 카세트를 포함한다:

- 서열번호 23의 곤충 BiP-유사 서열,

- 서열번호 31의 SNAP-유사 서열,

- 일본 뇌염 바이러스 유전형 4(Genebank#U70408)로부터의 외피 E 단백질의 도메인 III(EDIII 단백질)를 인코딩하는 서열번호 56의 DNA 서열,

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/JE-5.EDIII 카세트", 즉, 일본 뇌염 바이러스 유전형 5로부터의 외피 E 단백질의 도메인 III(EDIII 단백질)(JE-5.EDIII)를 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 63의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/ JE-5.EDIII 카세트를 포함한다:

- 서열번호 23의 곤충 BiP-유사 서열,

- 서열번호 31의 SNAP-유사 서열,

- 일본 뇌염 바이러스 유전형 5(Genebank#JN587258)로부터의 외피 E 단백질의 도메인 III(EDIII 단백질)을 인코딩하는 서열번호 57의 DNA서열,

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) JE-1, JE-2, JE-4, 또는 JE-5 바이러스로부터의 EDIII 단백질을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 53의 아미노산 서열(SNAP-유사/JE-1.EDIII/Histag 융합 단백질에 상응), 서열번호 60의 아미노산 서열(SNAP-유사/JE-2.EDIII/Histag 융합 단백질에 상응) 서열번호 62의 아미노산 서열(SNAP-유사/JE-4.EDIII/Histag 융합 단백질에 상응) 또는 서열번호 64(SNAP-유사/JE-5.EDIII/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 유전형 1, 2, 4 또는 5의 일본 뇌염 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- JE-1.EDIII], [SNAP- JE-2.EDIII], [SNAP- JE-4.EDIII] 또는 [SNAP- JE-5.EDIII]의 용도에 관한 것이다.

또 다른 양상에서, 본 발명은 숙주 세포에서 라벤스버그 바이러스(RabV)로부터의 외피 E 단백질의 도메인 III(EDIII 단백질)을 발현시키기 위한 벡터에 관한 것으로, a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 라벤스버그 바이러스(RabV)로부터의 외피 E 단백질의 도메인 III(EDIII 단백질)를 인코딩하는 뉴클레오타이드 서열을 포함한다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/RabV.EDIII 카세트", 즉, 라벤스버그 바이러스로부터의 EDIII 단백질의 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 65의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/ RabV.EDIII 카세트를 포함한다:

- 서열번호 23의 곤충 BiP-유사 서열,

- 서열번호 31의 SNAP-유사 서열,

- 라벤스버그 바이러스(Genebank#AY65264)로부터의 외피 E 단백질의 도메인 III(EDIII 단백질)을 인코딩하는 서열번호 58의 DNA 서열,

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 라벤스버그 바이러스로부터의 EDIII 단백질을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 66의 아미노산 서열 (SNAP-유사/RabV.EDIII/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 라벤스버그 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- RabV.EDIII]의 용도에 관한 것이다.

알파바이러스 항원

또 다른 양상에서, 본 발명은 숙주 세포에서 특정 알파바이러스 항원, 예를 들어, 로스 강 바이러스로부터의 가용성 E2 단백질(RR.sE2) 또는 마야로 바이러스로부터의 가용성 E2 단백질(MAY.sE2)를 발현시키기 위한 벡터에 관한 것이다.

특히, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 로스 강 바이러스로부터의 sE2 단백질을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/RR.sE2 카세트", 즉, 로스 강 바이러스로부터의 sE2 유전자의 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 69의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/ RR.sE2 카세트를 포함한다:

- 서열번호 22의 곤충 BiP 서열,

- 로스 강 바이러스 스트레인 QML1(Genbank#GQ433354)의 sE2 단백질을 인코딩하는 DNA 서열,

- 서열번호 31의 SNAP-유사 서열,

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 로스 강 바이러스로부터의 sE2 단백질을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 70의 아미노산 서열(RR.sE2/SNAP-유사/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 로스 강 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- RR.sE2]의 용도에 관한 것이다.

본 발명은 또한 숙주 세포에서 마야로 바이러스로부터의 가용성 E2 단백질(MAY.sE2)을 발현시키기 위한 벡터에 관한 것으로, a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 마야로 바이러스로부터의 sE2 단백질을 인코딩하는 뉴클레오타이드 서열을 포함한다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/MAY.sE2 카세트", 즉, 마야로 바이러스로부터의 sE2 유전자의 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 71의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/MAY.sE2 카세트를 포함한다:

- 서열번호 22의 곤충 BiP 서열,

- 마야로 바이러스 스트레인 IQD2668(Genbank#DQ487429.1)의 수정된 sE2 단백질(E2-S203C)을 인코딩하는 DNA 서열,

- 서열번호 31의 SNAP-유사 서열,

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 마야로 바이러스로부터의 sE2 단백질(MAY.sE2)을 포함하는 융합 단백질에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 72의 아미노산 서열(MAY.sE2/SNAP-유사/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 마야로 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- MAY.sE2]의 용도에 관한 것이다.

말 뇌염 바이러스 항원

또 다른 양상에서, 본 발명은 숙주 세포에서 특정 말 뇌염 바이러스 항원, 예를 들어, 서부 말 뇌염 바이러스로부터의 가용성 E2 단백질(WEE.sE2), 동부 말 뇌염 바이러스로부터의 가용성 E2 단백질(EEE.sE2) 또는 베네주엘라 말 뇌염 바이러스로부터의 가용성 E2 단백질(VEE.sE2)을 발현시키 위한 벡터에 관한 것이다.

특히, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 서부 말 뇌염 바이러스로부터의 가용성 E2 단백질을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/ WEE.sE2 카세트", 즉, 서부 말 뇌염으로부터의 sE2 유전자의 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 73의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/ WEE.sE2 카세트를 포함한다:

- 서열번호 22의 곤충 BiP 서열,

- 서부 말 뇌염 바이러스 스트레인(Genbank#NC00390808)으로부터의 sE2 단백질을 인코딩하는 DNA 서열,

- 서열번호 31의 SNAP-유사 서열,

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) WEE 바이러스의 sE2 단백질을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 74의 아미노산 서열(WEE.sE2/SNAP-유사/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 서부 말 뇌염 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- WEE.sE2]의 용도에 관한 것이다.

또 다른 실시형태에서, 본 발명은 숙주 세포에서 동부 말 뇌염 바이러스로부터의 가용성 E2 단백질(EEE.sE2)을 발현시키기 위한 벡터에 관한 것으로서, a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 동부 말 뇌염 바이러스로부터의 가용성 E2 단백질을 인코딩하는 뉴클레오타이드 서열을 포함한다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/ EEE.sE2 카세트", 즉, 동부 말 뇌염 바이러스로부터의 sE2 유전자의 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 75의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/ EEE.sE2 카세트를 포함한다:

- 서열번호 22의 곤충 BiP 서열,

- 동부 말 뇌염 바이러스 스트레인(Genbank#EF151502)으로부터의 sE2 단백질을 인코딩하는 DNA 서열,

- 서열번호 31의 SNAP-유사 서열,

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) EEE 바이러스로부터의 sE2 단백질을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 76의 아미노산 서열(EEE.sE2/SNAP-유사/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 동부 말 뇌염 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- EEE.sE2]의 용도에 관한 것이다.

또 다른 실시형태에서, 본 발명은 숙주 세포에서 베네주엘라 말 뇌염 바이러스로부터의 가용성 E2 단백질(VEE.sE2)을 발현시키기 위한 벡터에 관한 것으로서, a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 베네주엘라 말 뇌염 바이러스로부터의 가용성 E2 단백질을 인코딩하는 뉴클레오타이드 서열을 포함한다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/ VEE.sE2 카세트", 즉, 베네주엘라 말 뇌염 바이러스로부터의 sE2 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 77의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/ VEE.sE2 카세트를 포함한다:

- 서열번호 22의 곤충 BiP 서열,

- 베네주엘라 말 뇌염 바이러스 스트레인(Genbank#AY973944)으로부터의 sE2 단백질을 인코딩하는 DNA 서열,

- 서열번호 31의 SNAP-유사 서열,

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) VEE 바이러스로부터의 sE2 단백질을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 78의 아미노산 서열(VEE.sE2/SNAP-유사/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 베네주엘라 말 뇌염 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- VEE.sE2]의 용도에 관한 것이다.

오쏘부냐바이러스 항원

또 다른 양상에서, 본 발명은 숙주 세포에서 특정 오쏘부냐바이러스 항원, 특히 아카반 바이러스로부터의 핵단백질 N(AKA.N), 아이노 바이러스의 핵단백질 N(AIN.N) 또는 샤몬다 바이러스의 핵단백질 N(SHA.N)을 발현시키기 위한 벡터에 관한 것이다.

특히, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 아카반 바이러스로부터의 핵단백질 N을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/AKA.N 카세트", 즉, 아카반 바이러스로부터의 핵 단백질 N을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 79의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/ AKA.N 카세트를 포함한다:

- 서열번호 22의 곤충 BiP 서열,

- 서열번호 31의 SNAP-유사 서열,

- 아카반 바이러스의 천연 N 핵단백질을 인코딩하는 DNA 서열,

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 아카반 바이러스로부터의 N 핵단백질을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 80의 아미노산 서열(SNAP-유사/proTEV1/AKA.N/pro-TEV2/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 아카반 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- AKA.N]의 용도에 관한 것이다.

또 다른 실시형태에서, 본 발명은 숙주 세포에서 아이노 바이러스로부터의 핵단백질 N(AIN.N)을 발현시키기 위한 벡터에 관한 것으로서, a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 아이노 바이러스로부터의 핵단백질 N을 인코딩하는 뉴클레오타이드 서열을 포함한다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/AIN.N 카세트", 즉, 아이노 바이러스로부터의 핵단백질 N을 암호호하는 유전자의 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 81의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/AIN.N 카세트를 포함한다:

- 서열번호 22의 곤충 BiP 서열,

- 서열번호 31의 SNAP-유사 서열,

- 아이노 바이러스로부터의 천연 N 핵단백질을 인코딩하는 DNA 서열,

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 아이노 바이러스로부터의 N 핵단백질을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 82의 아미노산 서열(SNAP-유사/proTEV1/AIN.N/pro-TEV2/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 아이노 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- AIN.N]의 용도에 관한 것이다.

또 다른 실시형태에서, 본 발명은 숙주 세포에서 샤몬다 바이러스로부터의 핵단백질 N(SHA.N)을 발현시키기 위한 벡터에 관한 것으로서, a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 샤몬다 바이러스로부터의 핵단백질 N을 인코딩하는 뉴클레오타이드 서열을 포함한다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/SHA.N 카세트", 즉, 샤몬다 바이러스로부터의 핵단백질 N을 인코딩하는 유전자의 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 83의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/SHA.N 카세트를 포함한다:

- 서열번호 22의 곤충 BiP 서열,

- 서열번호 31의 SNAP-유사 서열,

- 샤몬다 바이러스로부터의 천연 N 핵단백질을 인코딩하는 DNA 서열,

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 샤몬다 바이러스로부터의 N 핵단백질을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 84의 아미노산 서열(SNAP-유사/proTEV1/SHA.N/pro-TEV2/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 샤몬다 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- SHA.N]의 용도에 관한 것이다.

베타코로나바이러스 항원

또 다른 양상에서, 본 발명은 숙주 세포에서 특정 베타코로나바이러스 항원, 예를 들어, 인간 베타코로나바이러스로부터의 핵단백질 N(huCOV.N) 또는 인간 베타코로나바이러스로부터의 단백질 S(huCOV.S)를 발현시키기위한 벡터에 관한 것이다.

특히, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 인간 베타코로나바이러스로부터의 핵단백질 N을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/huCOV.N 카세트", 즉, 인간 베타코로나 바이러스로부터의 핵단백질 N을 인코딩하는 유전자의 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 85의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/huCOV.N 카세트를 포함한다:

- 서열번호 22의 곤충 BiP 서열,

- 서열번호 31의 SNAP-유사 서열,

- 인간 베타코로나바이러스 2cEMC/2012(Genbank#JX869059)로부터의 유전자 N을 인코딩하는 DNA 서열,

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 인간 베타코로나바이러스로부터의 핵단백질 N을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 86의 아미노산 서열 (SNAP-유사/proTEV1/huCOV.N/proTEV2/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 인간 베타코로나 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- huCOV.N]의 용도에 관한 것이다.

또 다른 실시형태에서, 본 발명은 숙주 세포에서 인간 베타코로나바이러스로부터의 스파이크 S 단백질의 가용성 형태(huCOV.S)를 발현시키기 위한 벡터에 관한 것으로서, a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 인간 베타코로나바이러스로부터의 스파이크 S 단백질의 가용성 형태를 인코딩하는 뉴클레오타이드 서열을 포함한다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/huCOV.S 카세트", 즉, 인간 베타코로나 바이러스로부터의 유전자 S의 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 87의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/huCOV.S 카세트를 포함한다:

- 서열번호 22의 곤충 BiP 서열,

- 인간 베타코로나바이러스 2cEMC/2012(Genbank#JX869059)로부터의 유전자 S를 인코딩하는 DNA 서열,

- 서열번호 31의 SNAP-유사 서열,

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 실시형태에서, 벡터는 서열번호 154의 뉴클레오타이드 서열을 갖고/갖거나 서열번호 155의 아미노산 서열을 인코딩하는 DeSNAPuniv-SARS 바이러스 N 단백질 카세트를 포함한다. 벡터는 SNAP의 시그널 펩타이드, SNAP 서열, pro-TEV 부위, 또는 도 12에 도시된 SARS 코로나바이러스의 돌연변이된 단백질을 인코딩하는 DNA 서열, 또는 이의 적어도 10, 15, 20, 25, 30, 40, 50, 60, 100, 200 또는 300개의 연속 아미노산을 단독으로 또는 조합하여 포함한다.

또 다른 실시형태에서, 벡터는 서열번호 156의 뉴클레오타이드 서열을 갖고/갖거나 서열번호 157의 아미노산 서열을 인코딩하는 DeSNAP+SARS S-RDB 카세트를 포함한다. 벡터는 SNAP의 시그널 펩타이드, SNAP 서열, pro-TEV 부위, 또는 도 13에 도시된 SARS 바이러스의 S 단백질의 수용체 결합 도메인을 인코딩하는 DNA 서열, 또는 이의 적어도 10, 15, 20, 25, 30, 40, 50, 60, 100, 200 또는 300개의 연속 아미노산을 단독으로 또는 조합하여 포함한다.

또 다른 실시형태에서, 또 다른 실시형태에서, 벡터는 서열번호 158의 뉴클레오타이드 서열을 갖고/갖거나 서열번호 159의 아미노산 서열을 인코딩하는 DeSNAPuniv-huCOV.N(인간 코로나바이러스) 카세트를 포함한다. 벡터는 SNAP의 시그널 펩타이드, SNAP 서열, pro-TEV 부위, 또는 도 14에 도시된 인간 베타코로나바이러스의 유전자 N을 인코딩하는 DNA 서열, 또는 이의 적어도 10, 15, 20, 25, 30, 40, 50, 60, 100, 200 또는 300개의 연속 아미노산을 단독으로 또는 조합하여 포함한다.

또 다른 실시형태에서, 벡터는 서열번호 160의 뉴클레오타이드 서열을 갖고/갖거나 서열번호 161의 아미노산 서열을 인코딩하는 -huCOV.S1+DeSNAP(인간 코로나바이러스) 카세트를 포함한다. 벡터는 키메라 단백질의 시그널 펩타이드, SNAP 서열, 또는 도 15에 도시된 인간 베타코로나바이러스의 유전자 S1을 인코딩하는 DNA 서열, 또는 이의 적어도 10, 15, 20, 25, 30, 40, 50, 60, 100, 200 또는 300개의 연속 아미노산을 단독으로 또는 조합하여 포함한다.

또 다른 실시형태에서, 벡터는 서열번호 162의 뉴클레오타이드 서열을 갖고/갖거나 서열번호 163의 아미노산 서열을 인코딩하는 DeSNAPuniv-huCoV.S-RDB 카세트를 포함한다. 벡터는 키메라 단백질의 시그널 펩타이드, SNAP 서열, pro-TEV 부위, 또는 도 16에 도시된 인간 베타코로나바이러스의 S 단백질의 RBD를 인코딩하는 DNA 서열, 또는 이의 적어도 10, 15, 20, 25, 30, 40, 50, 60, 100, 200 또는 300개의 연속 아미노산을 단독으로 또는 조합하여 포함한다.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 인간 베타코로나바이러스로부터의 스파이크 S 단백질의 가용성 형태를 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 88의 아미노산 서열(huCOV.S/SNAP-유사/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 인간 베타코로나 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- huCOV.S]의 용도에 관한 것이다.

헤파시바이러스 항원

또 다른 양상에서, 본 발명은 숙주 세포에서 특정 헤파시바이러스 항원, 예를 들어, C형 간염 바이러스로부터의 단백질 C(HCV.C) 또는 E형 간염 바이러스로부터의 단백질 C(HEV.C)를 발현시키기 위한 벡터에 관한 것이다.

하나의 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) C형 간염 바이러스로부터의 단백질 C를 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/HCV.C 카세트", 즉, C형 간염 바이러스로부터의 단백질 C의 유전자의 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 89의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/HCV.C 카세트를 포함한다:

- 서열번호 22의 곤충 BiP 서열,

- 서열번호 31의 SNAP-유사 서열,

- C형 간염 바이러스 유전형 1b(스트레인 TCHM-R2/03)로부터의 C 단백질을 인코딩하는 DNA 서열 ,

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 실시형태에서, 벡터는 서열번호 170의 뉴클레오타이드 서열을 갖고/갖거나 서열번호 171의 아미노산 서열을 인코딩하는 DeSNAPuniv-HEV.C 카세트를 포함한다. 벡터는 SNAP의 시그널 펩타이드, SNAP 서열, pro-TEV 부위, 또는 도 20에 도시된 E형 간염 바이러스의 돌연변이된 C 단백질을 인코딩하는 DNA 서열, 또는 이의 적어도 10, 15, 20, 25, 30, 40, 50, 60, 100, 200 또는 300개의 연속 아미노산을 단독으로 또는 조합하여 포함한다.

또 다른 실시형태에서, 벡터는 서열번호 172의 뉴클레오타이드 서열을 갖고/갖거나 서열번호 173의 아미노산 서열을 인코딩하는 DeSNAPuniv-HEV.C 단백질 중심 도메인 카세트를 포함한다. 벡터는 SNAP의 시그널 펩타이드, SNAP 서열, pro-TEV 부위, 또는 도 21에 도시된 HEV 코어 항원을 인코딩하는 DNA 서열, 또는 이의 적어도 10, 15, 20, 25, 30, 40, 50, 60, 100, 200 또는 300개의 연속 아미노산을 단독으로 또는 조합하여 포함한다.

또 다른 실시형태에서, 또 다른 실시형태에서, 벡터는 서열번호 174의 뉴클레오타이드 서열을 갖고/갖거나 서열번호 175의 아미노산 서열을 인코딩하는 DeSNAPuniv-HCV 코어 항원 카세트를 포함한다. 벡터는 SNAP의 시그널 펩타이드, SNAP 서열, pro-TEV 부위, 또는 도 22에 도시된 HCV 코어 항원을 인코딩하는 DNA 서열, 또는 이의 적어도 10, 15, 20, 25, 30, 40, 50, 60, 100, 200 또는 300개의 연속 아미노산을 단독으로 또는 조합하여 포함한다.

또 다른 실시형태에서, 벡터는 서열번호 176의 뉴클레오타이드 서열을 갖고/갖거나 서열번호 177의 아미노산 서열을 인코딩하는 DeSNAPuniv-짧은 HCV 코어(C) 카세트를 포함한다. 벡터는 SNAP의 시그널 펩타이드, SNAP 서열, pro-TEV 부위, 또는 도 23에 도시된 HCV 코어 단백질의 짧은 형태를 인코딩하는 DNA 서열, 또는 이의 적어도 10, 15, 20, 25, 30, 40, 50, 60, 100, 200 또는 300개의 연속 아미노산을 단독으로 또는 조합하여 포함한다.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) C형 간염 바이러스로부터의 단백질 C(HCV.C)를 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는(상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 90의 아미노산 서열(SNAP-유사/proTEV1/HCV.C/proTEV2/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 C형 간염 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- HCV.C]의 용도에 관한 것이다.

또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) E형 간염 바이러스의 단백질 C(HEV.C)를 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/HEV.C 카세트", 즉, E형 간염 바이러스로부터의 단백질 C의 유전자의 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 150의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/HEV.C 카세트를 포함한다:

- 서열번호 23의 곤충 BiP-유사 서열,

- 서열번호 31의 SNAP-유사 서열,

- E형 간염 바이러스(Genbank#AB29196)로부터의 C 단백질을 인코딩하는 DNA 서열,

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) E형 간염 바이러스로부터의 단백질 C(HEV.C)를 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 151의 아미노산 서열(SNAP-유사/proTEV1/HEV.C/proTEV2/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 E형 간염 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- HEV.C]의 용도에 관한 것이다.

말라리아 항원

또 다른 양상에서, 본 발명은 숙주 세포에서 특정 말라리아 항원, 예를 들어, 플라스모듐 팔시파룸으로부터의 MSP-1 및 AMA-1 단백질(MSP-1+AMA-1)(참조: Pan W. et al, The Journal of Immunology, 2004)을 발현시키기 위한 벡터에 관한 것이다.

특히, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 기생충 플라스모듐 팔시파룸으로부터의 MSP-1 및 AMA-1 단백질을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/MSP-1+AMA-1카세트", 즉, 기생충 플라스모듐 팔시파룸으로부터의 MSP-1 및 AMA-1 단백질을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 91의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/MSP-1+AMA-1카세트를 포함한다:

- 서열번호 22의 곤충 BiP 서열,

- 서열번호 31의 SNAP-유사 서열,

- 플라스모듐 팔시파룸으로부터의 MSP-1(19) 서열(50% G+C)을 인코딩하는 DNA 서열,

- 플라스모듐 팔시파룸으로부터의 AMA-1(III) 서열(50% G+C)을 인코딩하는 DNA 서열,

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 플라스모듐 팔시파룸으로부터의 MSP-1+AMA-1 단백질을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 92의 아미노산 서열(SNAP-유사/MSP-1/proTEV2/AMA-1/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 기생충 플라스모듐 팔시파룸의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- MSP-1+AMA-1]의 용도에 관한 것이다.

렙토스피로시스 항원

또 다른 양상에서, 본 발명은 숙주 세포에서 특정 렙토스피로시스 항원, 예를 들어, 렙토스피라 세균의 HbpA, LruA, LruB 또는 LipL32 단백질(참조: Sivakolundu S. et al, Journal of Medical Microbiology, 2012)을 발현시키기 위한 벡터에 관한 것이다. 바람직한 벡터는 SNAP-Lru A 및 SNAP-Lru B이다. 특히 바람직한 것은 이들 벡터를 함유하는 S2 세포주이다. S2/SNAP-Lru A 및 S2/SNAP-Lru B 세포주는 2013년 5월 2일자로 콜렉션 네션날레 드 컬쳐 드 마이크로오르가니즘 [the Collection Nationale de Cultures de Microorganismes(CNCM)), 25, Rue du Docteur Roux, 75724 Paris Cedex 15, France]에 각각 기탁번호 CNCM I-4745 및 CNCM I-4746으로 기탁되었다.

특히, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 렙토스피라 인테로간스 세균으로부터의 HbpA 단백질을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/HbpA 카세트", 즉, 렙토스피라 세균으로부터의 HbpA 단백질을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 93의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/HbpA 카세트를 포함한다:

- 서열번호 22의 곤충 BiP 서열,

- 서열번호 31의 SNAP-유사 서열,

- 렙토스피라 인테로간스 혈청형 Lai str.56601(Genbank#AA51750.1)로부터의 HbpA(TonB-의존적 외막 수용체 또는 LB191)의 변형된 단축 형태를 인코딩하는 DNA 서열,

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 실시형태에서, 벡터는 서열번호 164의 뉴클레오타이드 서열을 갖고/갖거나 서열번호 165의 아미노산 서열을 인코딩하는 DeSNAPuniv-짧은 LruA(렙토스피라증) 카세트를 포함한다. 벡터는 SNAP의 시그널 펩타이드, SNAP 서열, pro-TEV 부위, 또는 도 17에 도시된 LruA의 변형된 짧은 형태를 인코딩하는 DNA 서열, 또는 이의 적어도 10, 15, 20, 25, 30, 40, 50, 60, 100, 200 또는 300개의 연속 아미노산을 단독으로 또는 조합하여 포함한다.

또 다른 실시형태에서, 벡터는 서열번호 166의 뉴클레오타이드 서열을 갖고/갖거나 서열번호 167의 아미노산 서열을 인코딩하는 DeSNAPuniv-짧은 LruB(렙토스피라증) 카세트를 포함한다. 벡터는 SNAP의 시그널 펩타이드, SNAP 서열, pro-TEV 부위, 또는 도 18에 도시된 LruB의 변형된 짧은 형태를 인코딩하는 DNA 서열, 또는 이의 적어도 10, 15, 20, 25, 30, 40, 50, 60, 100, 200 또는 300개의 연속 아미노산을 단독으로 또는 조합하여 포함한다.

또 다른 실시형태에서, 또 다른 실시형태에서, 벡터는 서열번호 168의 뉴클레오타이드 서열을 갖고/갖거나 서열번호 169의 아미노산 서열을 인코딩하는 DeSNAPuniv-LipL2(렙토스피라증) 카세트를 포함한다. 벡터는 SNAP의 시그널 펩타이드, SNAP 서열, pro-TEV 부위, 또는 도 19에 도시된 LipL32의 변형된 짧은 형태를 인코딩하는 DNA 서열, 또는 이의 적어도 10, 15, 20, 25, 30, 40, 50, 60, 100, 200 또는 300개의 연속 아미노산을 단독으로 또는 조합하여 포함한다.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 렙토스피라 인테로간스 세균으로부터의 HbpA 단백질을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 94의 아미노산 서열(SNAP-유사/proTEV1/HbpA/proTEV2/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 렙토스피라 세균의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-HbpA]의 용도에 관한 것이다.

미생물성 펩타이드

또 다른 양상에서, 본 발명은 숙주 세포에서 미생물성 펩타이드, 예를 들어, 미생물성 펩타이드 MUB-40를 발현시키기 위한 벡터에 관한 것이다.

특히, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) MUB-40 펩타이드를 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/MUB40 카세트", 즉, MUB40 펩타이드를 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 95의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/MUB40 카세트를 포함한다:

- 서열번호 22의 곤충 BiP 서열,

- 서열번호 31의 SNAP-유사 서열,

- MUB-40 펩타이드를 인코딩하는 DNA 서열,

- 서열 ENLYFQG(서열번호 33)의 pro-TEV2 개열 부위를 인코딩하는 서열번호 30의 DNA 서열, 및

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) MUB 40 펩타이드를 포함하는 융합 폴레펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 96의 아미노산 서열(SNAP-유사/proTEV1/MUB40/proTEV2/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 리간드의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-MUB40]의 용도에 관한 것이다.

플라비바이러스 발병에 관여되는 렉틴

또 다른 양상에서, 본 발명은 숙주 세포에서 플라비바이러스 발병에 관여되는 특정 렉틴, 예를 들어, C형 유사 렉틴의 마우스 또는 인간 가용성 형태(CLEC5A)를 발현시키기 위한 벡터에 관한 것이다.

특히, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 마우스 CLEC5A(mo-CLEC5A) 또는 인간 CLEC5A(hu-CLEC5A)를 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/mo-CLEC5A 카세트", 즉, C형 유사 렉틱의 마우스 가용성 형태를 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 97의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/mo-CLEC5A 카세트를 포함한다:

- 서열번호 22의 곤충 BiP 서열,

- 서열번호 31의 SNAP-유사 서열,

- C형 유사 렉틴의 마우스 가용성 형태(CLEC5A)를 인코딩하는 DNA 서열,

- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제2 DNA 서열, 및

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/hu-CLEC5A 카세트", 즉, C형 유사 렉틴의 인간 가용성 형태를 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 99의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/hu-CLEC5A 카세트를 포함한다:

- 서열번호 22의 곤충 BiP 서열,

- 서열번호 31의 SNAP-유사 서열,

- C형 유사 렉틴의 인간 가용성 형태(CLEC5A)를 인코딩하는 DNA 서열,

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) C형 유사 렉틴의 마우스 또는 인간 가용성 형태(CLEC5A)를 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는(상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 98의 아미노산 서열(SNAP-유사/proTEV1/mo-CLEC5A/proTEV2/Histag 융합 단백질에 상응) 또는 서열번호 100(SNAP-유사/proTEV1/hu-CLEC5A/proTEV2/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 플라비 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-mo-CLEC5A] 또는 [SNAP-hu-CLEC5A]의 용도에 관한 것이다.

항-플라비바이러스 모기 단백질

또 다른 양상에서, 본 발명은 숙주 세포에서 특정 항바이러스 모기 단백질, 예를 들어, 쿨렉스(Culex) 종으로부터의 VAGO 단백질(cxVAGO) 또는 아에데스(Aedes) 종으로부터의 VAGO 단백질(aaVAGO)을 발현시키기 위한 벡터에 관한 것이다.

특히, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 아에데스 알보픽투스(Aedes albopictus) 모기로부터의 VAGO 단백질을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/aaVAGO 카세트", 즉, 아에데스 알보픽투스 모기로부터의 VAGO 단백질을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 103의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/aaVAGO 카세트를 포함한다:

- 서열번호 152의 곤충 BiP-유사 서열,

- 서열번호 31의 SNAP-유사 서열,

- 아에데스 알보픽투스 모기로부터의 VAGO 단백질을 인코딩하는 DNA 서열, 및

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 아에데스 알보픽투스 모기로부터의 VAGO 단백질을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 104의 아미노산 서열(SNAP-유사/aaVAGO/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 리간드의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-aaVAGO]의 용도에 관한 것이다.

또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 쿨렉스 퀸퀘파시아투스(Culex quinquefasciatus) 모기로부터의 VAGO 단백질을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/cxVAGO 카세트", 즉, 쿨렉스 퀸퀘파시아투스 모기로부터의 VAGO 단백질을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 101의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/cxVAGO 카세트를 포함한다:

- 서열번호 152의 곤충 BiP-유사 서열,

- 서열번호 31의 SNAP-유사 서열,

- 쿨렉스 퀸퀘파시아투스 모기로부터의 VAGO 단백질을 인코딩하는 DNA 서열, 및

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 쿨렉스 퀸퀘파시아투스 모기로부터의 VAGO 단백질을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 102의 아미노산 서열(SNAP-유사/cxVAGO/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 리간드의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-cxVAGO]의 용도에 관한 것이다.

바이러스 출혈 열 항원

또 다른 양상에서, 본 발명은 하기와 같은 특정 바이러스 출혈 열 항원을 발현시키기 위한 벡터에 관한 것이다:

- 크리미아-콩고 바이러스로부터의 핵단백질 N(CCHF.N), 에볼라 바이러스로부터의 핵단백질 N(EBO.N), 마르부르그 바이러스로부터의 핵단백질 N(MAR.N), 라사 바이러스로부터의 핵단백질 N(LAS.N), 주닌 바이러스로부터의 핵단백질 N(JUN.N), 마추포 바이러스로부터의 핵단백질 N(MAC.N), 사비아 바이러스로부터의 핵단백질 N(SAB.N), 또는 구아나리토 바이러스로부터의 핵단백질 N(GUA.N),

- 라사 바이러스로부터의 GP1의 엑토도메인(LAS.ectoGP1), 주닌 바이러스로부터의 GP1의 엑토도메인(JUN.ectoGP1), 마추포 바이러스로부터의 GP1의 엑토도메인(MAC.ectoGP1), 사비아 바이러스로부터의 GP1의 엑토도메인(SAB.ectoGP1), 또는 구아나리토 바이러스로부터의 GP1의 엑토도메인(GUA.ectoGP1),

- 라사 바이러스로부터의 GP2의 엑토도메인(LAS.ectoGP2), 주닌 바이러스로부터의 GP2의 엑토도메인(JUN.ectoGP2), 마추포 바이러스로부터의 GP2의 엑토도메인(MAC.ectoGP2), 사비아 바이러스로부터의 GP2의 엑토도메인(SAB.ectoGP2), 또는 구아나리토 바이러스로부터의 GP2의 엑토도메인(GUA.ectoGP2),

- 옴스크 바이러스로부터의 외피 단백질의 도메인 III(OMSK.EDIII), 카샤누르(Kasyanur) 바이러스로부터의 외피 단백질의 도메인 III(KAS.EDIII), 또는 알쿠르마(Alkhurma) 바이러스로부터의 외피 단백질의 도메인 III(ALK.EDIII).

특히, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 크리미아-콩고 바이러스로부터의 핵단백질 N(CCHF.N)을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/CCHF.N 카세트", 즉, 크리미아-콩고 바이러스로부터의 핵단백질 N을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 108의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/CCHF.N 카세트를 포함한다:

- 서열번호 22의 곤충 BiP 서열,

- 서열번호 31의 SNAP-유사 서열,

- 크리미아-콩고 바이러스로부터의 핵단백질 N을 인코딩하는 DNA 서열,

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 크리미아-콩고 바이러스로부터의 핵단백질 N을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 109의 아미노산 서열 (SNAP-유사/proTEV1/CCHF.N/proTEV2/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 크리미아-콩고 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- CCHF.N]의 용도에 관한 것이다.

또 다른 실시형태에서, 본 발명은 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 에볼라 바이러스로부터의 핵단백질 N(EBO.N)을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/EBO.N 카세트", 즉, 에볼라 바이러스로부터의 핵단백질 N을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 110의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/EBO.N 카세트를 포함한다:

- 서열번호 22의 곤충 BiP 서열,

- 서열번호 31의 SNAP-유사 서열,

- 에볼라 바이러스(Genbank#NC_002549)로부터의 핵단백질 N,

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 에볼라 바이러스로부터의 핵단백질 N을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 111의 아미노산 서열(SNAP-유사/proTEV1/EBO.N/proTEV2/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 에볼라 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- EBO.N]의 용도에 관한 것이다.

또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 마르부르그 바이러스의 핵단백질 N(MAR.N)을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/MAR.N 카세트", 즉, 마르부르그 바이러스로부터의 핵단백질 N을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 112의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/MAR.N 카세트를 포함한다:

- 서열번호 22의 곤충 BiP 서열,

- 서열번호 31의 SNAP-유사 서열,

- 마르부르그 바이러스(Genbank#NC_001608)의 핵단백질 N을 인코딩하는 DNA 서열,

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 마르부르그 바이러스의 핵단백질 N을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 113의 아미노산 서열(SNAP-유사/proTEV1/MAR.N /proTEV2/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 마르부르그 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-MAR.N]의 용도에 관한 것이다.

또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 라사 바이러스의 핵단백질 N(LAS.N)을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/LAS.N 카세트", 즉, 리사 바이러스로부터의 핵단백질 N을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 114의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/LAS.N 카세트를 포함한다:

- 서열번호 22의 곤충 BiP 서열,

- 서열번호 31의 SNAP-유사 서열,

- 라사 바이러스(Genbank#NC_004296)의 핵단백질 N,

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 라사 바이러스의 핵단백질 N을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 115의 아미노산 서열(SNAP-유사/proTEV1/LAS.N/proTEV2/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 라사 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-LAS.N]의 용도에 관한 것이다.

또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 주닌 바이러스로부터의 핵단백질 N(JUN.N)을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/JUN.N 카세트", 즉, 주닌 바이러스로부터의 핵단백질 N을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 116의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/JUN.N 카세트를 포함한다:

- 서열번호 22의 곤충 BiP 서열,

- 서열번호 31의 SNAP-유사 서열,

- 주닌 바이러스로(Genbank#NC_005081)부터의 핵단백질 N을 인코딩하는 DNA 서열,

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 주닌 바이러스로부터의 핵단백질 N을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 117의 아미노산 서열 (SNAP-유사/proTEV1/JUN.N/proTEV2/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 주닌 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-JUN.N]의 용도에 관한 것이다.

또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 마추포 바이러스로부터의 핵단백질 N(MAC.N)을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/MAC.N 카세트", 즉, 마추포 바이러스로부터의 핵단백질 N을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 118의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/MAC.N 카세트를 포함한다:

- 서열번호 22의 곤충 BiP 서열,

- 서열번호 31의 SNAP-유사 서열,

- 마추포 바이러스(Genbank#NC_005078)로부터의 핵단백질 N을 인코딩하는 DNA 서열,

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 마추포 바이러스로부터의 핵단백질 N를 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 119의 아미노산 서열(SNAP-유사/proTEV1/MAC.N/proTEV2/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 마추포 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-MAC.N]의 용도에 관한 것이다.

또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 구아나리토 바이러스로부터는 핵단백질 N(GUA.N)를 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/GUA.N 카세트", 즉, 구아나리코 바이러스로부터의 핵단백질 N을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 120의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/GUA.N 카세트를 포함한다:

- 서열번호 22의 곤충 BiP 서열,

- 서열번호 31의 SNAP-유사 서열,

- 구아나리토 바이러스(Genbank#NC_005077)로부터의 핵단백질 N을 인코딩하는 DNA 서열,

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 구아나리토 바이러스로부터의 핵단백질 N을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 121의 아미노산 서열(SNAP-유사/proTEV1/GUA.N/proTEV2/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 구아나리토 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-GUA.N]의 용도에 관한 것이다.

또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 사비아 바이러스로부터의 핵단백질 N(SAB.N)을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/SAB.N 카세트", 즉, 사비아 바이러스로부터의 핵단백질 N을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 122의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/SAB.N 카세트를 포함한다:

- 서열번호 22의 곤충 BiP 서열,

- 서열번호 31의 SNAP-유사 서열,

- 사비아 바이러스(Genbank#NC_006317)로부터의 핵단백질 N을 인코딩하는 DNA 서열,

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 사비아 바이러스로부터의 핵단백질 N을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 123의 아미노산 서열(SNAP-유사/proTEV1/SAB.N/proTEV2/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 사비아 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-SAB.N]의 용도에 관한 것이다.

또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 옴스크 바이러스로부터의 외피 단백질 E의 도메인 III(OMSK.EDIII)를 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/OMSK.EDIII 카세트", 즉, 옴스크 바이러스로부터의 EDIII 단백질을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 124의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/OMSK.EDIII 카세트를 포함한다:

- 서열번호 152의 곤충 BiP-유사 서열,

- 서열번호 31의 SNAP-유사 서열,

- 옴스크 바이러스(Genbank#NC_005062)로부터의 EDIII 단백질을 인코딩하는 DNA 서열,

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 옴스크 바이러스로부터의 EDIII 단백질을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는(상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 125의 아미노산 서열(SNAP-유사/OMSK.EDIII/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 옴스크 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-OMSK.EDIII]의 용도에 관한 것이다.

또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 카샤누르 숲 질환 바이러스로부터의 외피 단백질 E의 도메인 III(KYA.EDIII)를 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/KYA.EDIII 카세트", 즉, 캬사누르 숲 질환 바이러스로부터의 EDIII 단백질을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 126의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/KYA.EDIII 카세트를 포함한다:

- 서열번호 152의 곤충 BiP-유사 서열,

- 서열번호 31의 SNAP-유사 서열,

- 카샤누르 숲 질환 바이러스(Genbank#JF416958)로부터의 EDIII 단백질을 인코딩하는 DNA 서열,

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 카샤누르 숲 질환 바이러스로부터의 EDIII 단백질을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 127의 아미노산 서열(SNAP-유사/KYA.EDIII/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 캬사누르 숲 질환 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-KYA.EDIII]의 용도에 관한 것이다.

또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 알쿠르마 바이러스로부터의 외피 단백질 E의 도메인 III(ALK.EDIII)를 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/ALK.EDIII 카세트", 즉, 알쿠르마 바이러스로부터의 EDIII 단백질을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 128의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/ALK.EDIII 카세트를 포함한다:

- 서열번호 152의 곤충 BiP-유사 서열,

- 서열번호 31의 SNAP-유사 서열,

- 알쿠르마 바이러스(Genbank#NC_004355)로부터의 EDIII 단백질을 인코딩하는 DNA 서열,

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 알쿠르마 바이러스로부터의 EDIII 단백질을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 129의 아미노산 서열(SNAP-유사/ALK.EDIII/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 알쿠르마 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-ALK.EDIII]의 용도에 관한 것이다.

또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 리사 바이러스로부터의 당단백질 GP1 엑토도메인(LAS.ectoGP1)을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/LAS.ectoGP1 카세트", 즉, 라사 바이러스로부터의 당단백질 GP1 엑토도메인을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 130의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/LAS.ectoGP1 카세트를 포함한다:

- 서열번호 22의 곤충 BiP 서열,

- 리사 바이러스(Genbank#NC_004296)로부터의 당단백질 GP1 엑토도메인을 인코딩하는 DNA 서열,

- 서열번호 31의 SNAP-유사 서열, 및

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 리사 바이러스로부터의 당단백질 GP1 엑토도메인을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 131의 아미노산 서열(SNAP-유사/ LAS.ectoGP1/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 라사 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- LAS.ectoGP1]의 용도에 관한 것이다.

또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 주닌 바이러스로부터의 당단백질 GP1 엑토도메인(JUN.ectoGP1)을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/JUN.ectoGP1 카세트", 즉, 주닌 바이러스로부터의 당단백질 GP1 엑토 도메인을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 132의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/JUN.ectoGP1 카세트를 포함한다:

- 서열번호 22의 곤충 BiP 서열,

- 주닌 바이러스(Genbank#NC_005081)로부터의 당단백질 GP1 엑토도메인을 인코딩하는 DNA 서열,

- 서열번호 31의 SNAP-유사 서열, 및

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 주닌 바이러스로부터의 당단백질 GP1 엑토도메인을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 133의 아미노산 서열(SNAP-유사/ JUN.ectoGP1/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 주닌의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- JUN.ectoGP1]의 용도에 관한 것이다.

또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 마추포 바이러스로부터의 당단백질 GP1 엑토도메인(MAC.ectoGP1)을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/MAC.ectoGP1 카세트", 즉, 마추포 바이러스로부터의 당단백질 GP1 엑토 도메인을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 134의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/MAC.ectoGP1 카세트를 포함한다:

- 서열번호 22의 곤충 BiP 서열,

- 마추포 바이러스(Genbank#NC_005078)로부터의 당단백질 GP1 엑토도메인을 인코딩하는 DNA 서열,

- 서열번호 31의 SNAP-유사 서열, 및

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 마추포 바이러스로부터의 당단백질 GP1 엑토도메인을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 135의 아미노산 서열(SNAP-유사/ MAC.ectoGP1/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 마추포 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-MAC.ectoGP1]의 용도에 관한 것이다.

또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 구아나리토 바이러스로부터의 당단백질 GP1 엑토도메인(GUA.ectoGP1)을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/GUA.ectoGP1 카세트", 즉, 구아나리토 바이러스로부터의 당단백질 GP1 엑토도메인을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 136의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/GUA.ectoGP1 카세트를 포함한다:

- 서열번호 22의 곤충 BiP 서열,

- 구아나리토 바이러스(Genbank#NC_005077)로부터의 당단백질 GP1 엑토도메인을 인코딩하는 DNA 서열,

- 서열번호 31의 SNAP-유사 서열, 및

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 구아나리토 바이러스로부터의 당단백질 GP1 엑토도메인을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 137의 아미노산 서열(SNAP-유사/ GUA.ectoGP1/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 구아나리토 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-GUA.ectoGP1]의 용도에 관한 것이다.

또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 사비아 바이러스로부터의 당단백질 GP1 엑토도메인(SAB.ectoGP1)을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/SAB.ectoGP1 카세트", 즉, 사비아 바이러스로부터의 당단백질 GP1 엑토도메인을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 138의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/SAB.ectoGP1 카세트를 포함한다:

- 서열번호 22의 곤충 BiP 서열,

- 사비아 바이러스(Genbank#NC_006317)로부터의 당단백질 GP1 엑토도메인을 인코딩하는 DNA 서열,

- 서열번호 31의 SNAP-유사 서열, 및

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 사비아 바이러스로부터의 당단백질 GP1 엑토도메인을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 139의 아미노산 서열(SNAP-유사/ SAB.ectoGP1/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 사비아 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-SAB.ectoGP1]의 용도에 관한 것이다.

또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 라사 바이러스로부터의 당단백질 GP2 엑토도메인(LAS.ectoGP2)을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/LAS.ectoGP2 카세트", 즉, 라사 바이러스로부터의 당단백질 GP2 엑토도메인을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 140의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/LAS.ectoGP2 카세트를 포함한다:

- 서열번호 22의 곤충 BiP 서열,

- 라사 바이러스로부터의 당단백질 GP2 엑토도메인을 인코딩하는 DNA 서열(Genbank#NC_004296),

- 서열번호 31의 SNAP-유사 서열, 및

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 라사 바이러스로부터의 당단백질 GP2 엑토도메인을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 141의 아미노산 서열(SNAP-유사/ LAS.ectoGP2/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 라사 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-LAS.ectoGP2]의 용도에 관한 것이다.

또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 주닌 바이러스로부터의 당단백질 GP2 엑토도메인(JUN.ectoGP2)을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/JUN.ectoGP2 카세트", 즉, 주닌 바이러스로부터의 당단백질 GP2 엑토도메인을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 142의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/JUN.ectoGP2 카세트를 포함한다:

- 서열번호 22의 곤충 BiP 서열,

- 주닌 바이러스(Genbank#NC_005081)로부터의 당단백질 GP2 엑토도메인을 인코딩하는 DNA 서열,

- 서열번호 31의 SNAP-유사 서열, 및

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 주닌 바이러스로부터의 당단백질 GP2 엑토도메인을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 143의 아미노산 서열(SNAP-유사/ JUN.ectoGP2/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 주닌의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-JUN.ectoGP2]의 용도에 관한 것이다.

또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 마추포 바이러스로부터의 당단백질 GP2 엑토도메인(MAC.ectoGP2)을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/MAC.ectoGP2 카세트", 즉, 마추포 바이러스로부터의 당단백질 GP2 엑토도메인을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 144의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/MAC.ectoGP2 카세트를 포함한다:

- 서열번호 22의 곤충 BiP 서열,

- 마추포 바이러스 (Genbank#NC_005078)로부터의 당단백질 GP2 엑토도메인을 인코딩하는 DNA 서열,

- 서열번호 31의 SNAP-유사 서열, 및

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 마추포 바이러스로부터의 당단백질 GP2 엑토도메인을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 145의 아미노산 서열(SNAP-유사/ MAC.ectoGP2/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 마추포 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-MAC.ectoGP2]의 용도에 관한 것이다.

또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 구아나리토 바이러스로부터의 당단백질 GP2 엑토도메인(GUA.ectoGP2)을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/GUA.ectoGP2 카세트", 즉, 구아나리토 바이러스로부터의 당단백질 GP2 엑토도메인을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 146의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/GUA.ectoGP2 카세트를 포함한다:

- 서열번호 22의 곤충 BiP 서열,

- 구아나리토 바이러스(Genbank#NC_005077)로부터의 당단백질 GP2 엑토도메인을 인코딩하는 DNA 서열,

- 서열번호 31의 SNAP-유사 서열, 및

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 구아나리토 바이러스로부터의 당단백질 GP2 엑토도메인을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 147의 아미노산 서열(SNAP-유사/ GUA.ectoGP2/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 구아나리토 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-GUA.ectoGP2]의 용도에 관한 것이다.

또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 사비아 바이러스로부터의 당단백질 GP2 엑토도메인(SAB.ectoGP2)을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.

바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/SAB.ectoGP2 카세트", 즉, 사비아 바이러스로부터의 당단백질 GP2 엑토도메인을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.

바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 148의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/MAC.ectoGP2 카세트를 포함한다:

- 서열번호 22의 곤충 BiP 서열,

- 사비아 바이러스(Genbank#NC_006317)로부터의 당단백질 GP2 엑토도메인을 인코딩하는 DNA 서열,

- 서열번호 31의 SNAP-유사 서열, 및

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 사비아 바이러스로부터의 당단백질 GP2 엑토도메인을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 149의 아미노산 서열(SNAP-유사/ SAB.ectoGP2/Histag 융합 단백질에 상응)이다.

따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 사비아 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-SAB.ectoGP2]의 용도에 관한 것이다.

실시예

본 발명과 관련하여, 생물학적 유체 중의 아르보바이러스에 대한 항체의 신속하고 동시적인 검출을 위해 다중 비드-기반 면역분석법을 개발하였다.

이 시스템은 xMAP 기술(Luminex corporation)에 기초하고 특이적 인간 면역글로불린에 대한 포획 시약으로서 항원-코팅된 마이크로구의 혼합물을 사용한다. 상이한 세트의 마이크로구(Magplex, Luminex corporation)를 정제된 AGT 융합 단백질, 즉, SNAP-택을 갖는 바이러스 재조합 단백질: sSNAP-DV1.EDIII, sSNAP-DV2.EDIII, sSNAP-DV3.EDIII, sSNAP-DV4.EDIII, sSNAP-WN.EDIII, sSNAP-JE.EDIII, sSNAP-USU.EDIII, sSNAP-TBE.EDIII, sSNAP-YF.EDIII, sSNAP-MVE.EDIII, sSNAP-Rocio.EDIII, sSNAP-WSL.EDIII, sSNAP-ZIKA.EDIII, SNAP-DV1ectoM, sSNAP-N.RVF, sSNAP-N.TOS, 및 CHIK.sE2-SNAP와 커플링시켰다. 재조합 항원을 링커로서 AGT 단백질의 기질((BG-PEG-NH2, New England Biolabs)을 사용하여 카복실 마이크로구 표면에 공유적으로 커플링시킴으로써, 표준 아민 커플링 공정과 비교하여, 항체 포획 효율을 증진시켰다.

항-SNAP-택 항체 및 특이적 마우스 모노클로날 항체를 사용하는 기술적 확인으로 커플링 효율을 입증하고 장기간 항원 안정성(6개월 이하)을 입증하였다. 이러한 적용은 임의의 펩타이드 또는 폴리펩타이드가 비드 코팅 및 후속적 항체 포획에 사용될 수 있기 때문에 바이러스 항원에 대해서만 제한되는 것은 아니다.

I. 재료 및 방법

1. 하기 완충액 및 용액을 사용하였다:

a) PBS 완충액: 100 mL의 10X PBS, pH 7.4, 1 L 멸균 H₂O 중,

b) SNAP 커플링 완충액(PBS-DTT) : 100 mL의 10 X PBS, pH 7.4, 0.5 mL 10% 트윈 20, 1　mL의 1.0 M DTT, 1 L 멸균 H₂O 중,

c) 차단 / 분석 완충액(PBS-B): PBS, 1% BSA, pH 7.4, 1 L 멸균 H₂O 중,

d) 저장 완충액(PBS-TBN): 100 mL의 10X PBS, 1 g의 BSA, 2 mL의 10% 트윈 20, 500 mg의 아지드화나트륨, 1 mL의 1.0M DTT, 1 L 멸균 H₂O 중,

e) 기질 용액(4 mg/mL): 2 mg의 BG-PEG-NH₂, DMSO 200 μL,

f) 활성화 용액(EDAC /SNHS): 50 mg/mL의 EDAC 용액 또는 50 mg/mL의 SNSHS, 증류수 중.

2. 하기 물질을 사용하였다:

2.1. MagPlex Luminex 마이크로구: MC 100XX-ID(여기서, XX는 형광 영역이다), XX는, 도 7B에서 도시되는 바와 같이, 예를 들어, 26, 27, 28, 29, 34, 35, 36, 37, 45, 52, 53, 63, 64일 수 있다.

2.2. hAGT 기질: PEG-BG-NH₂(NEB S9150S)

2.3. 융합 단백질 SNAP-바이러스 EDIII　:

AGT 및 바이러스 EDIII 부분을 포함하는 융합 단백질의 생성은 당업자에게 널리 알려져 있다. AGT 효소가 융합 단백질에서 활성인 한, 모든 공지된 합성법이 이러한 목적에 이용될 수 있다.

본 실시예에서는 서열번호 2의 AGT 돌연변이체 SNAP가 사용되었으며, SNAP-바이러스 EDIII 융합 단백질이 생성되었다.

초파리 S2 유도성 발현 시스템(DES, Invitrogen)이 비-척추동물에서 플라비바이러스로부터의 각각의 EDIII를 다량 생성하기 위해 선택되었으며, 플라스미드 pMT/BiP/V5-HisA(Invitrogen)가 사용되었다.

이 플라스미드 하기를 포함한다:

- 메탈로티오네인 프로모터 pMT,

- 서열번호 22의 곤충 ssBiP 서열,

- Bgl II 및 Age I 제한 부위,

- AgeI 제한 부위의 하부에 위치되는 His₆택을 인코딩하는 서열번호 28의 DNA, 및

- AgeI 제한 부위와 His₆택을 인코딩하는 DNA 사이에 위치되는 서열번호 26의 DNA 스페이서 서열.

플라비바이러스 WN, USU, JE, TBE, DEN-1 내지 DEN-4, YF, Rocio, MVE, Zika, SLE, 및 WSL로부터의 E 단백질의 전장 도메인 III를 인코딩하는 합성 유전자가 서열번호 3 내지 서열번호 14에 열거되어 있다. EDIII 아미노산 서열을 SNAP 단백질의 C-말단에 프레임 내에 융합시켰으며, 양쪽 부분은 링커 GGGS(서열번호 25)에 의해 분리되었다. SNAP-EDIII를 플라스미드 pMT/BiP/V5-Histag(Invitrogen)에 삽입하여 플라스미드 pMT/BiP/SNAP/EDIII/Histag을 생성하였다.

분비되는 SNAP-EDIII-His₆ 융합 단백질의 발현을 유도할 수 있는 생성된 플라스미드 pMT/BiP/SNAP-EDIII-Histag을 선별 마커 pCo-Blast와 함께 S2 세포에 공동-형질감염시켜 블라스티시딘에 대해 내성을 나타내는 안정한 S2/sSNAP-ED III- Histag 세포주를 생성하였다.

스피너(1000 ml)에서 성장된 안정한 S2 세포주를 중금속 카드뮴(Cd²⁺)으로 10일 동안 자극하고, 세포외 배지로부터의 단백질을 농축하고 정제하였다.

중금속 카드뮴으로 10일 동안 유도한 후 분비되는 SNAP-태깅된 EDIII 단백질의 축적이 안정한 S2/sSNAP-EDIII-Histag 세포의 상등액에서 관측되었다.

서열번호 21의 SNAP-DEN1.EDIII, 서열번호 X의 SNAP-DEN2.EDIII, 서열번호 X의 SNAP-DEN3.EDIII, 서열번호 X의 SNAP-DEN4.EDIII, 서열번호 X의 SNAP-WN.EDIII, 서열번호 X의 SNAP-JE.EDIII, 서열번호 X의 SNAP-YF.EDIII, 서열번호 X의 SNAP-MVE.EDIII, 서열번호 X의 SNAP-Rocio.EDIII, 서열번호 X의 SNAP-WSL.EDIII, 서열번호 X의 SNAP-ZIKA.EDIII, 서열번호 X의 SNAP-SLE.EDIII 단백질이 생성되었다.

3.항원-커플링된 비드의 제조

항원-커플링된 비드의 생성은 하기 2단계를 포함하였다: 마이크로구 표면을 O⁶-벤질구아닌 유도체(BG-PEG-아미노)로 작용화시키는 단계 및 키메라 SNAP-바이러스 Ag 단백질을 앵커로서 BG-PEG-아미노를 사용하여 공유적 고정화시키는 단계(도 1). 카복실 마이크로구 표면을 최적화된 2-단계 카보디이미드 공정을 이용하여 BG-PEG-아미노 기질로 공유적으로 코팅하였다(Wong et al Journal of Clinical Microbiology 42(1): 65-72, 2004). 이어서, 벤질 그룹을 SNAP 단백질의 시스테인의 활성 부위 시스테인에 전달시킴으로써 커플링된 BG-PEG-아미노 화합물을 키메라 SNAP-바이러스 Ag 단백질에 비가역적으로 연결시켰다. 이러한 반응의 높은 특이성 때문에, 융합 단백질은 전적으로 SNAP 도메인을 통해 커플링되며, 바이러스 항원은 항체와의 상호작용에 사용가능하게 된다.

3.1. 먼저, 시판 비드를 제조자의 지침에 따라(EDAC 및 SNHS 활성화 용액을 사용하여) 활성화시키고, PBS 완충액에서 세척하였다. 모든 단계는 제조자의 지침에 따라 형광 퀀칭을 막도록 암흑 속에서 수행하였다.

약 1.25 x 10⁶개의 비드가 각각의 커플링 공정에 사용되었다.

3.2. 이어서, DMSO 용액 중의 AGT 기질 PEG-BG-NH₂을 실온에서 밤새 활성화된 비드 상에 부가한 후, PBS 완충액으로 세척하였다.

3.3. 이어서, 결합되지 않은 카복실 부위를 실온에서 30분 동안 차단 완충액으로 차단한 후, 비드를 SNAP 커플링 완충액으로 세척하였다.

3.4. SNAP 커플링 완충액(100 ㎛/mL)에 현탁된 SNAP-EDIII 단백질을 실온에서 2시간 동안 상기에서 수득된 비드와 함께 인큐베이션한 후, SNAP 커플링 완충액으로 1회 및 저장 완충액(PBS-TBN)으로 3회 세척하였다.

4. 마이크로구 형광 면역분석

상이한 SNAP-바이러스 Ag와 접합된 비드 세트를 볼텍스로 혼합하여 비드를 완전히 분산시켰다. 비드 밀도를 100개 비드/μL로 조절한 후, 25 μL의 비드 세트 각각 (2500개 마이크로구 포함)을 96-웰 미세역가판(Bio-Plex Pro 평저 플레이트, BioRad)으로 일중 분석을 위해 개별 웰에 옮기거나 다중 분석을 위해 동일한 웰에서 혼합하였다. 마이크로구를 자성 비드(BioPlex Pro Wash Station, BioRad)를 위한 마이크로플레이트 세척 스테이션을 이용하여 100 μL 세척 완충액(BioPlex 세척 완충액, BioRad)으로 2회 세척하였다. 샘플(항체 또는 혈청)을 분석 완충액(PBS-BSA)에 희석시키고, 50 μL의 생성 용액을 접합된 비드를 포함하는 시험 웰에 가하였다. 30분 동안 판상 쉐이커 상에서 암흑 속에서 인큐베이션한 후, 플레이트를 이전과 같이 세척하였다. 이어서, 형광색소-표지된 제2 항체를 분석 완충액(PBS-BSA)에 2 μg/mL로 희석시키고, 50 μL의 생성 용액을 접합된 비드를 포함하는 시험 웰에 가하였다. 30분 동안 판상 쉐이커 상에서 암흑 속에서 인큐베이션한 후, 플레이트를 3회 세척하였다. 마지막으로, 스트렙트아비딘-피코에리트린(SAPE, Invitrogen Molecular Probes)을 분석 완충액(PBS-BSA)에 2 μg/ml로 희석시킨 후, 50 μL의 생성 용액을 마이크로플레이트 웰에 가하였다. 웰 내용물을 125 μL 분석 완충액에 재현탁시키기 전, 플레이트를 10분 동안 플레이트 쉐이커 상에서 암흑 속에서 인큐베이션하고 이전과 같이 세척하였다. 각각의 마이크로구에 결합된 검출 항체의 중간 형광 강도(MFI)를 이중-레이저 유동 분석기(BioPlex 200 기구, BioRad)를 사용하여 웰 당 50개 마이크로구의 유동 분석으로 평가하였다. 형광 검출 기구는 비드의 유형을 검출하기 위한 제1 레이저 및 특정 검출 항체에 접합된 형광단(레드-피코에리트린)을 여기시킴으로써 포획된 IgM 또는 IgG를 정량하기 위한 제2 레이저가 구비된다.

4.1. 항원 커플링의 확인

항원 커플링은 항원-커플링된 마이크로구를 토끼 항-SNAP-택 폴리클로날 항체(GenScript)의 희석물로 시험함으로써 확인되었다. 형광 면역분석은 상술된 바와 같이 일중 포맷으로 수행되었다. 4000 ng/mL로 개시하여 3.9 ng/mL로 종결되는 항-SNAP 항체의 2배 희석 시리즈를 PBS-BSA에서 수행하고, 각각의 희석물을 비드를 포함하는 시험 웰에 가하였다. 바이오틴-접합된 염소 항-토끼 IgG(2 ㎍/mL, 50 μL PBS-BSA 중)를 결합된 항-SNAP 항체를 검출하기 위한 제2 항체로서 사용하였다.

도 2는 키메라 SNAP-바이러스 항원 단백질(SNAP-DV1.EDIII, SNAP-DV2.EDIII, SNAP.DV3.EDIII, SNAP.DV4.EDIII, SNAP-WNV.EDIII, SNAP-YF.EDIII, SNAP-JE.EDIII, SNAP-TBE.EDIII)에 커플링된 8개의 상이한 세트의 마이크로구 상에서의 항-SNAP 항체 검출에 대해 관측된 형광 결과를 도시한다.

4.2. 특이적 항체의 검출

정제된 모노클로날 마우스 항체(항-WNV, 항-DV1 및 항-DV2) 및 폴리클로날 마우스 혈청(항-DV3, 항-DV4, 항-YF 및 항-JE) 또는 인간 혈청(항-DV1)을 사용하여 항원-접합된 마이크로구에 의한 특이적 항체의 포획 및 검출을 평가하였다. 형광 면역분석을 상술된 바와 같이 일중 및 다중 포맷으로 수행하였다. 400 ng/mL로 개시하여 0.1 ng/mL로 종결되는 마우스 모노클로날 항체의 4배 희석 시리즈 및 1:25로 개시하여 1:102400으로 종결되는 마우스 및 인간 혈청의 4배 희석 시리즈를 PBS-BSA에서 수행하고, 각각의 희석물을 비드를 포함하는 시험 웰에 가하였다. 바이오틴-접합된 염소 항-마우스 IgG(2 ㎍/mL, 50 μL PBS-BSA 중)를 결합된 모노클로날 및 폴리클로날 마우스 항체를 검출하기 위한 제2 항체로 사용하였다. 바이오틴-접합된 염소 항-인간 IgM(2 ㎍/mL, 50 μL PBS-BSA 중) 또는 바이오틴-접합된 염소 항-인간 IgG(2 ㎍/mL, 50 μL PBS-BSA 중)를 사용하여 각각 인간 혈청 중의 결합된 IgM 또는 IgG 항체를 검출하였다.

도 3은 hAGT 단백질의 기질을 통해 (본 발명의 커플링) 또는 Bio-Plex 아민 커플링 키트(BIORAD)를 통해 커플링된 마이크로구에 접합된 키메라 SNAP-DV2.EDIII 단백질에 대한 정제된 모노클로날 항-DV2 항체의 검출을 위한 면역분석 실험의 민감도를 비교한다.

도 4는 마이크로구에 접합된 키메라 SNAP-DV1.EDIII 단백질에 대한 정제된 모노클로날 항-DV1 항체의 검출을 위해 일중 포맷으로 수행되거나 마이크로구에 커플링된 다른 키메라 SNAP-바이러스 Ag 단백질(SNAP-DV2.EDIII, SNAP.DV3.EDIII, SNAP.DV4.EDIII, SNAP-WNV, SNAP-YF, SNAP-JE, SNAP-TBE)과 함께 다중 포맷으로 수행된 면역분석 실험의 민감도를 비교한다.

도 5는 마이크로구에 커플링된 키메라 SNAP-바이러스 Ag 단백질(SNAP-DV1.EDIII, SNAP-DV2.EDIII, SNAP.DV3.EDIII, SNAP.DV4.EDIII, SNAP-WNV, SNAP-YF, SNAP-JE, SNAP-TBE)에 대한 정제된 모노클로날 항-WNV 항체 희석물의 검출을 위한 다중 면역분석 실험의 반응성 및 특이성을 도시한다.

도 6은, 마이크로구에 커플링된 키메라 SNAP-바이러스 Ag 단백질(SNAP-DV1.EDIII, SNAP-DV2.EDIII, SNAP.DV3.EDIII, SNAP.DV4.EDIII, SNAP-WNV, SNAP-YF, SNAP-JE, SNAP-WSL, SNAP-ROCIO, SNAP-MVE, SNAP-SLE, SNAP-ZIKA)에 대한 다중 면역분석으로, DV3에 대한 마우스 폴리클로날 혈청에서 항-DV3 IgG 검출의 반응성 및 특이성(A) 및 YF에 대한 마우스 폴리클로날 혈청에서 항-YF IgG 검출의 반응성 및 특이성(B)을 도시한다.

도 7은, 마이크로구에 커플링된 키메라 SNAP-바이러스 Ag 단백질(SNAP-DV1.EDIII, SNAP-DV2.EDIII, SNAP.DV3.EDIII, SNAP.DV4.EDIII, SNAP-WNV, SNAP-YF, SNAP-JE, SNAP-WSL, SNAP-ROCIO, SNAP-MVE, SNAP-SLE, SNAP-ZIKA, SNAP-TBE)에 대한 다중 면역분석으로, 인간 환자의 DV1-감염된 혈청에서 항-DV1 IgM 검출의 반응성 및 특이성(A) 및 항-DV1 IgG 검출의 반응성 및 특이성(B)을 도시한다.

II. 결과

본 발명의 시스템은 특이적 인간 면역글로불린에 대한 포획 시약으로서 항원-코팅된 Magplex 마이크로구(Luminex Corporation)의 혼합물을 사용한다. 내부적으로 칼라-코드화된 마이크로구의 각각의 세트를 특정 재조합 항원에 커플링시키고, 소량의 샘플 용적으로 다른 유형의 마이크로구들과 함께 혼합하였다. 이러한 시스템의 능력은 사실상 유동 분석 기구를 사용하여 웰당 100개 유형 이하의 커플링된 마이크로구를 동시에 분석할 수 있다는 것이다. 형광 검출 기구는 비드의 유형을 검출하기 위한 제1 레이저 및 특정 검출 항체에 접합된 형광단(레드-피코에리트린)을 여기시킴으로써 포획된 IgM 또는 IgG를 정량하기 위한 제2 레이저가 구비된다. 이러한 접근은 광범위한 다중화 능력 및 낮은 검출 한도를 갖기 때문에 종래의 ELISA 측정에 비해 비용 및 샘플이 상당히 절감된다.

본 실시예에서는, 16개의 상이한 마이크로구 세트가 정제된 키메라 SNAP-바이러스 Ag 단백질에 커플링되었으며, 뎅기 혈청형 1 내지 4, 웨스트 나일, 황열, 일본 뇌염, 진드기-매개 뇌염, 세인트-루이스 뇌염, 머레이 계곡 뇌염, 베셀스브론, 지카, 로시오, 우수투, 리프트 계곡 열 및 치쿤구니아 바이러스에 특이적인 혈청 항체를 적정하였다. 1000개의 개별 분석을 수행하기에 충분한 한 세트의 항원-커플링된 마이크로구(약 1.25 x 10⁶개 마이크로구)를 생성하는데 단지 매우 소량의 재조합 항원(< 50㎍)이 필요하므로 이 시스템의 제조는 시간 및 비용에 있어 매우 효과적이다. 또한, 선택된 세트의 마이크로구는 MagPix(Luminex Corporation)와 같이 저렴하고 소형이며 강력한 형광 검출 시스템에 적합하다.

항-SNAP 항체를 사용한 항원 커플링의 평가(도 2)는 커플링 효율을 입증하였으며, 결합된 항원의 상대적 양이 상이한 커플링된 마이크로구 세트 간에 유사하다는 것을 증명하였다. 정제된 마우스 항체를 사용한 항체 포획 및 검출 평가는, 표준 아민 커플링 공정으로 수득된 항원-커플링된 마이크로구와 비교하여, 생성된 항원-커플링된 마이크로구에 의한 특이적 항체의 증진된 포획을 입증하였다(도 3). 또한, 이는 상기 방법의 낮은 검출 한계를 입증하였으며, 다중화가 항체 검출에 영향을 끼치지 않는다는 것을 증명하였다(도 4). 또한, 항원-접합된 마이크로구는, 4℃(> 6개월)에서 저장하는 경우, 장기간 안정성을 나타내었다. 마지막으로, 다중 면역분석에서 커플링된 마이크로구 세트 각각의 특이성이 정제된 모노클로날 항체(도 5), 폴리클로날 마우스 혈청 중의 IgG 항체(도 6A-B) 및 감염된 인간으로부터의 폴리클로날 혈청 중의 IgM 및 IgG 항체 모두 (도 7)에 대해 입증되었다.

이러한 접근은 광범위한 다중화 능력 (웰당 100개 유형 이하의 커플링된 마이크로구) 및 낮은 검출 한도를 갖기 때문에 종래의 ELISA 측정에 비해 비용 및 샘플이 상당히 절감된다.

III. SNAP와 쉬말렌베르그 바이러스의 N 핵단백질을 포함하는 융합 단백질의 생성

1.융합 단백질 SNAP-SBV.N을 인코딩하는 벡터의 작제

SNAP와 쉬말렌베르그 바이러스의 N 핵단백질을 포함하는 키메라 융합 단백질을 하기와 같이 수득하였다:

제1 단계에서, BH80/11-4 스트레인의 N 핵단백질 및 NSs 단백질을 인코딩하는 S 절편의 개방 판독 프레임의 서열을 이의 5' 말단에 EcoRV 제한 부위 및 3' 말단에 XmaI 제한 부위를 삽입함으로써 돌연변이시켰다. 또한, 294T 뉴클레오타이드를 294A로 돌연변이시킴으로써 내부 EcoRV 제한 부위를 제거시켰다. 이러한 돌연변이된 서열이 서열번호 17에 나타나있다.

이어서, 이러한 돌연변이된 서열을 서열번호 34의 pDeSNAP Univ 카세트의 EcoRV 및 XmaI 제한 부위에 삽입하여 서열번호 36의 "pDeSNAP Univ/SBV.N" DNA 카세트를 생성하였다.

이른바 "pDeSNAP Univ/SBV.N" DNA 카세트는 하기를 포함한다(참조: 도 9 및 서열번호 36):

- 서열번호 23의 곤충 BiP-유사 서열,

- 서열번호 31의 SNAP-유사 서열,

- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.

이러한 카세트는 또한 ATG의 상부에 NheI 부위, BiP-유사 서열과 SNAP-유사 서열 사이에 BglII 부위, 및 AgeI 부위 및 HindIII 부위(이들 모두 정지 코돈 하부에 위치된다)를 포함한다.

pDeSNAPUniv/SBV.N 카세트(참조: 도 9)의 BglII과 AgeI 제한 부위 사이에 포함된 서열을 효소적 분해로 개열한 후, pMT/BiP/V5-A 플라스미드(Invitrogen)에 클로닝하여 pMT/BiP/SNAP-SBV.N 벡터를 생성하였다. 이러한 벡터를 사용하여 SNAP-SBV.N 융합 단백질을 분비하는 안정한 S2 세포를 생성하였다.

이어서, pDeSNAPUniv/SBV.N 카세트의 NheI와 NotI 제한 부위 사이에 포함된 서열을 pcDNA3 플라스미드(Invitrogen)에 클로닝하여 pcDNA3/SNAP-SBV.N 벡터를 생성하였다. 이어서, 이 벡터를 사용하여 SNAP-SBV.N 융합 단백질을 분비하는 안정한 포유동물 세포를 생성하였다.

2. 융합 단백질 SNAP-SBV.N의 생성

분비되는 융합 단백질로서 SNAP-태깅된 SBV.N 단백질을 생성하는 생성 플라스미드 pMT/BiP/SNAP-SBV.N를 선별 마커 pCo-Blast와 함께 S2 세포로 공동-형질감염하여 블라스티시딘에 대해 내성을 나타내는 안정한 S2/SNAP-SBV.N 세포주를 생성하였다.

이 세포주는 파스퇴르 인스티튜트 국립 미생물 배양센터 [the Collection Nationale de Cultures de Microorganismes(CNCM) of the Institut Pasteur (25 rue du Docteur Roux, 75724 PARIS CEDEX 15, France)]에 기탁 번호 CNCM I-4616으로 기탁되었다.

스피너(1000 ml)에서 성장된 안정한 S2 세포주를 중금속 카드뮴(Cd²⁺)으로 10일 동안 자극하였다.

중금속 카드뮴으로 10일 동안 유도한 후 분비되는 SNAP-SBV.N 단백질의 축적이 S2/SNAP-SBV.N 세포의 상등액에서 관측되었다.

Cd² ⁺으로 10일 동안 유도된 S2/SNAP-SBV.N 세포의 상등액 4 mL로부터의 0.01 mL를 항-Histag 항체(희석율 1:1,000)를 사용하여 면역블롯 분석으로 시험하였다(참조: 도 10).

키메라 단백질 SNAP-SBV.N을 SNAP-TOS.N 키메라 단백질(SNAP와 플레보바이러스인 토스카나 바이러스로부터의 N 핵단백질을 포함하는 융합 단백질)의 정의된 양과 비교하였다.

10일 동안 유도된 S2/SNAP+SBV.N 세포로부터의 정제된 SNAP-SBV.N의 생성은 세포 배양물 L 당 18 mg이었다(도 10B).

참고문헌 목록

Avrameas S. Immunol. Today 1991 May;12(5):154-9.

Zimmerman CW, Electrophoresis 1995; Jun;16(6):941-7.

Kim H-J. The Journal of Veterinary Medical Science, 2011

Damoiseaux et al., ChemBiochem. 4:285-287, 2001

Xu-Welliver et al., Biochemical Pharmacology 58: 1279-85, 1999

Lim A. et al, EMBO J. 15: 4050-4060, 1996;

Daniels D.S. et al, EMBO J. 19: 1719-1730, 2000;

Juillerat A. et al, Chemistry & Biology, vol.10, 313-317, 2003

Wong et al Journal of Clinical Microbiology 42, no. 1 (Jan 2004): 65-72

Wibley J.E.A. et al, 2000

Felgner et al., Proc. Natl. Acad. Sci. U.S.A., 84:7413-7417, 1987

Mackey et al., Proc. Natl. Acad. Sci. U.S.A., 85:8027-8031, 1988

Wu et al., J. Biol. Chem., 267:963-967, 1992;

Wu and Wu, J. Biol . Chem., 263:14621-14624, 1988;

Williams et al., Proc. Natl. Acad. Sci. U.S.A., 88:2726-2730, 1991

Kolpe A.B. et al, Virus Research 2012; 168:64-72

Pan W. et al, The Journal of Immunology, 2004), 172:6167-6174

Sivakolundu S. et al, Journal of Medical Microbiology, 2012

꼴렉시용 나시오날레 드 꿀뚜레드 미끄로오르가니스메 (CNDM)

CNCMI-4745

20130502

CNCMI-4746

20130502

SEQUENCE LISTING <110> INSTITUT PASTEUR <120> MULTIPLEX IMMUNO SCREENING ASSAY <130> IPA141114-FR <150> US 61/642,924 <151> 2012-05-04 <150> PCT/EP2012/074986 <151> 2012-12-10 <160> 179 <170> KopatentIn 2.0 <210> 1 <211> 238 <212> PRT <213> homo sapiens <400> 1 Met Leu Gly Gln Pro Ala Pro Leu Glu Arg Phe Ala Ser Arg Arg Pro 1 5 10 15 Gln Val Leu Ala Val Arg Thr Val Cys Asp Leu Val Leu Gly Lys Met 20 25 30 Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly 35 40 45 Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu 50 55 60 Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro 65 70 75 80 Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Cys Thr Ala Trp 85 90 95 Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val 100 105 110 Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln 115 120 125 Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser 130 135 140 Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Lys Ala Ala Arg Ala 145 150 155 160 Val Gly Gly Ala Met Arg Gly Asn Pro Val Pro Ile Leu Ile Pro Cys 165 170 175 His Arg Val Val Cys Ser Ser Gly Ala Val Gly Asn Tyr Ser Gly Gly 180 185 190 Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly 195 200 205 Lys Pro Gly Leu Gly Gly Ser Ser Gly Leu Ala Gly Ala Trp Leu Lys 210 215 220 Gly Ala Gly Ala Thr Ser Gly Ser Pro Pro Ala Gly Arg Asn 225 230 235 <210> 2 <211> 193 <212> PRT <213> artificial <220> <223> Amino acid sequence of SNAP <400> 2 Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro 1 5 10 15 Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile 20 25 30 Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro 35 40 45 Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr 50 55 60 Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe 65 70 75 80 Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr 85 90 95 Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val 100 105 110 Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr 115 120 125 Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile 130 135 140 Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu 145 150 155 160 Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg 165 170 175 Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser 180 185 190 Leu <210> 3 <211> 404 <212> DNA <213> Dengue virus 1 <400> 3 taggcgcgcc agggtccctg gagggaggtg gcgggtctct gactttaaaa gggatgtcat 60 atgtgatgtg cacaggctca tttaagctag agaaggaagt ggctgagacc cagcatggaa 120 ctgtcctagt gcaggttaaa tacgaaggaa cagatgcgcc atgcaagatc cccttttcga 180 cccaagatga gaaaggagtg acccagaatg ggagattgat aacagccaat cccatagtta 240 ctgacaaaga aaaaccaatc aacattgaga cagaaccacc ttttggtgag agctacatca 300 tagtaggggc aggtgaaaaa gctttgaaac taagctggtt caagaaagga agcagcatag 360 ggaaaggagg tggccatcac catcaccatc actgatgacc ggtt 404 <210> 4 <211> 404 <212> DNA <213> Dengue virus 2 <400> 4 taggcgcgcc agggtccctg gagggaggtg gcgggtctct acagctcaaa ggaatgtcat 60 attctatgtg tacaggaaag tttaaagttg tgaaggaaat agcagaaaca caacatggaa 120 caatagttct cagagtacaa tatgaagggg acggttctcc gtgcaagatc ccttttgaaa 180 taatggattt ggaaaaaaga catgtcttag gtcgcttgat cacagtcaac ccaattgtta 240 cagaaataga cagcccagtc aacatagaag cagaacctcc attcggagac agctacatca 300 ttataggagt agaaccggga caactgaagc tcagctggtt taagaaagga agttccattg 360 gccaaggagg tggccatcac catcaccatc actgatgacc ggtt 404 <210> 5 <211> 401 <212> DNA <213> Dengue virus 3 <400> 5 taggcgcgcc agggtccctg gagggaggtg gcgggtctga actcaagggg atgagctatg 60 caatgtgctt gaataccttt gtgttgaaga aagaagtctc cgaaacgcag catgggacaa 120 tactcattaa ggttgagtac aaaggggaag atgcaccttg caagattcct ttctccacag 180 aggatggaca agggaaagcc cacaatggta gactgatcac agccaaccca gtggttacta 240 agaaggagga gcctgtcaac attgaggctg aacctccttt tggggaaagc aacatagtga 300 ttggagttgg agacaaagcc ttgaaaatta actggtacaa gaagggaagc tcgattggga 360 agggaggtgg ccatcaccat caccatcact gatgaccggt t 401 <210> 6 <211> 401 <212> DNA <213> Dengue virus 4 <400> 6 taggcgcgcc agggtccctg gagggaggtg gcgggtctag aatcaaggga atgtcataca 60 cgatgtgctc aggaaagttc tcaattgaca aagagatggc agaaacacag catgggacaa 120 cagtggtgaa agtcaagtat gaaggtgctg gagctccgtg taaagtcccc atagagatac 180 gagatgtaaa taaggaaaaa gtggttgggc gtgtcatctc atccacccct ctagctgaga 240 ataccaacag tgtgaccaac atagaactgg aacccccctt tggggacagt tacatagtca 300 taggtgttgg gaacagtgca ttgacactcc attggttcag gaaaggaagt tctattggca 360 agggaggtgg ccatcaccat caccatcact gatgaccggt t 401 <210> 7 <211> 398 <212> DNA <213> West Nile Virus <400> 7 taggcgcgcc aggaggtggc gggtctcagt tgaagggaac aacctatggc gtctgttcaa 60 aggctttcaa gtttcttggg actcccgcag acacaggtca cggcactgtg gtgttggaat 120 tgcagtacac tggcacggat ggaccttgca aagttcctat ctcgtcagtg gcttcattga 180 acgacctaac gccagtgggc agattggtca ctgtcaaccc ttttgtttca gtggccacgg 240 ccaacgctaa ggtcctgatt gaattggaac caccctttgg agactcatac atagtggtgg 300 gcagaggaga acaacagatc aatcaccatt ggcacaagtc tggaagcagc attggcaaag 360 gaggtggcca tcaccatcac catcactgat gaccggtt 398 <210> 8 <211> 410 <212> DNA <213> Yellow fever virus <400> 8 taggcgcgcc agggtccctg gagggaggtg gcgggtcttc agctttgaca ctcaagggga 60 catcctacaa aatgtgcact gacaaaatgt cttttgtcaa gaacccaact gacactggcc 120 atggcactgt tgtgatgcag gtgaaagtgc caaaaggagc cccctgcaag attccagtga 180 tagtagctga tgatcttaca gcggcaatca ataaaggcat tttggttaca gttaacccca 240 tcgcctcaac caatgatgat gaagtgctga ttgaggtgaa cccacctttt ggagacagct 300 acattatcgt tgggacagga gattcacgtc tcacttacca gtggcacaaa gagggaagct 360 caataggaaa gggaggtggc catcaccatc accatcactg atgaccggtt 410 <210> 9 <211> 410 <212> DNA <213> Japanese encephalitis virus <400> 9 taggcgcgcc agggtccctg gagggaggtg gcgggtctgc tctgaaaggc acaacctatg 60 gcatgtgtac agaaaaattc tcgttcgcga aaaatccggc ggacactggt cacggaacag 120 ttgtcattga actctcctac tctgggagtg atggcccctg caaaattccg attgtctccg 180 tcgcgagcct caatgacatg actcctgttg ggcggctggt gacagtgaac ccctttgtcg 240 cggcttccag tgccaactca aaggtgctgg tcgagatgga accccccttc ggagactcct 300 atatcgtggt tggaagggga gacaagcaga tcaaccacca ttggcacaga gctggaagca 360 cgctgggcaa gggaggtggc catcaccatc accatcactg atgaccggtt 410 <210> 10 <211> 397 <212> DNA <213> Zika virus <400> 10 gcgcgccagg aggtggcggg tctcttagat tgaagggcgt gtcatactcc ttgtgtaccg 60 cagcgttcac attcaccaag atcccggctg aaacactgca cgggacagtc acagtggagg 120 tacagtacgc agggacagat ggaccctgca aggttccagc tcagatggcg gtggacatgc 180 aaactctgac cccagttggg aggctgataa ccgctaaccc tgtaatcact gaaagcactg 240 agaactctaa gatgatgctg gaacttgatc caccatttgg ggactcttac attgtcatag 300 gagtcgggga gaagaagatc acccatcact ggcacaggag tggcagcacc attggaaaag 360 gaggtggcca tcaccatcac catcactgat gaccggt 397 <210> 11 <211> 385 <212> DNA <213> Wesselbron virus <400> 11 gcgcgccagg aggtggcggg ctcatcctga aaggttcaac ctactcaatg tgcaaaagag 60 ggatgtcctt tgctaagcaa ccagttgaga cagaccatgg aacagcagtg atgcagataa 120 aagttacaac tggagctccg tgcagaattc cagtgattgc agcagattcc atggcgggaa 180 cagaaaaccg tggaagcgtc atcacaacca atcctattgc tgcgtcaaac aatgatgaag 240 tgttggtgga gatcagtcca ccatttggag agagttacat catcgttggt aatggagatg 300 ataaacttac ataccactgg caaagatcag gaagcaccat cgggaatgga ggtggccatc 360 accatcacca tcactgatga ccggt 385 <210> 12 <211> 397 <212> DNA <213> Rocio virus <400> 12 gcgcgccagg aggtggcggg tctctcaaaa tcaaagggtc aacatacctg atgtgcaagg 60 acaaatttgc ttttgccaag aacccagttg acacaggaca cggcacaatc gtgacggagg 120 tacagtacgc tggttctgat gggccatgca ggattccaat caccatgacc gagaacctac 180 atgatctcac tcccatcgga cgattggtga cggtcaatcc atttgttccc tcatccgaga 240 cggcacaaaa aattttgatt gaactcgagc ccccctttgg gacatccttc atactggtgg 300 gtacaggtcc caaccaggtg aaataccagt ggcataagtc tggtagtgtg atcggaaaag 360 gaggtggcca tcaccatcac catcactgat gaccggt 397 <210> 13 <211> 397 <212> DNA <213> Murray encephalitis virus <400> 13 gcgcgccagg aggtggcggg tctttgaaac tgaaaggaac cacttatggg atgtgcacag 60 aaaaatttac tttctcaaag aatccagccg acaccggaca tggcacggta gtactagaac 120 tgcagtacac cgggagtgat ggaccatgca aaattccaat atcctctgta gcaagtctca 180 atgacatgac gcctgtcgga agaatggtga cagctaatcc atatgtagct tcatcaactg 240 ccaatgctaa agttctggtg gagattgaac cacccttcgg agactcatac attgtggtag 300 gcaggggaga caagcagatc aatcaccact ggcataagga gggtagttca attggcaaag 360 gaggtggcca tcaccatcac catcactgat gaccggt 397 <210> 14 <211> 397 <212> DNA <213> Saint-Louis encephalitis virus <400> 14 gcgcgccagg aggtggcggg tctgttaaaa tcaaggggac gacatatggt atgtgtgact 60 ctgctttcac cttcagcaag aaccctgctg acacagggca tgggacagtg atcgtggaac 120 tgcagtacac tggaagcaac ggaccatgcc gggttcccat ttctgtgact gcaaacctca 180 tggacttgac accagttgga agactggtca cggtcaatcc ctttattagc acagggggag 240 cgaacaacaa ggtcatgatc gaagttgaac caccctttgg cgactcttac atcgtcgtcg 300 gaagaggcac cacccagatc aactaccact ggcacaaaga gggaagcagc attgggaagg 360 gaggtggcca tcaccatcac catcactgat gaccggt 397 <210> 15 <211> 579 <212> DNA <213> artificial <220> <223> DNA encoding original SNAP (normal G/C content) <400> 15 agatctgaca aagactgcga aatgaagcgc accaccctgg atagccctct gggcaagctg 60 gaactgtctg ggtgcgaaca gggcctgcac gagatcaagc tgctgggcaa aggaacatct 120 gccgccgacg ccgtggaagt gcctgcccca gccgccgtgc tgggcggacc agagccactg 180 atgcaggcca ccgcctggct caacgcctac tttcaccagc ctgaggccat cgaggagttc 240 cctgtgccag ccctgcacca cccagtgttc cagcaggaga gctttacccg ccaggtgctg 300 tggaaactgc tgaaagtggt gaagttcgga gaggtcatca gctaccagca gctggccgcc 360 ctggccggca atcccgccgc caccgccgcc gtgaaaaccg ccctgagcgg aaatcccgtg 420 cccattctga tcccctgcca ccgggtggtg tctagctctg gcgccgtggg gggctacgag 480 ggcgggctcg ccgtgaaaga gtggctgctg gcccacgagg gccacagact gggcaagcct 540 gggctgggtc ctgcaggtat aggcgcgcca gggtcccta 579 <210> 16 <211> 235 <212> PRT <213> artificial <220> <223> mutated N protein of schmallenberg virus <400> 16 Asp Ile Ser Ser Gln Phe Ile Phe Glu Asp Val Pro Gln Arg Asn Ala 1 5 10 15 Ala Thr Phe Asn Pro Glu Val Gly Tyr Val Ala Phe Ile Gly Lys Tyr 20 25 30 Gly Gln Gln Leu Asn Phe Gly Val Ala Arg Val Phe Phe Leu Asn Gln 35 40 45 Lys Lys Ala Lys Met Val Leu His Lys Thr Ala Gln Pro Ser Val Asp 50 55 60 Leu Thr Phe Gly Gly Val Lys Phe Thr Val Val Asn Asn His Phe Pro 65 70 75 80 Gln Tyr Val Ser Asn Pro Val Pro Asp Asn Ala Ile Thr Leu His Arg 85 90 95 Met Ser Gly Tyr Leu Ala Arg Trp Ile Ala Asp Thr Cys Lys Ala Ser 100 105 110 Val Leu Lys Leu Ala Glu Ala Ser Ala Gln Ile Val Met Pro Leu Ala 115 120 125 Glu Val Lys Gly Cys Thr Trp Ala Asp Gly Tyr Thr Met Tyr Leu Gly 130 135 140 Phe Ala Pro Gly Ala Glu Met Phe Leu Asp Ala Phe Asp Phe Tyr Pro 145 150 155 160 Leu Val Ile Glu Met His Arg Val Leu Lys Asp Asn Met Asp Val Asn 165 170 175 Phe Met Lys Lys Val Leu Arg Gln Arg Tyr Gly Thr Met Thr Ala Glu 180 185 190 Glu Trp Met Thr Gln Lys Ile Thr Glu Ile Lys Ala Ala Phe Asn Ser 195 200 205 Val Gly Gln Leu Ala Trp Ala Lys Ser Gly Phe Ser Pro Ala Ala Arg 210 215 220 Thr Phe Leu Gln Gln Phe Gly Ile Asn Ile Pro 225 230 235 <210> 17 <211> 707 <212> DNA <213> artificial <220> <223> Mutated DNA sequence encoding the N protein of schmallenberg virus <400> 17 gatatctcaa gccaattcat ttttgaagat gtaccacaac ggaatgcagc tacatttaac 60 ccggaggtcg ggtatgtggc atttattggt aagtatgggc aacaactcaa cttcggtgtt 120 gctagagtct tcttcctcaa ccagaagaag gccaagatgg tcctacataa gacggcacaa 180 ccaagtgtcg atcttacttt tggtggggtc aaatttacag tggttaataa ccattttccc 240 caatatgtct caaatcctgt gccagacaat gccattacac ttcacaggat gtcaggttat 300 ctagcacgtt ggattgctga tacatgcaag gctagtgtcc tcaaactagc tgaagctagt 360 gctcagattg tcatgcccct tgctgaggtt aagggatgca cctgggccga tggttataca 420 atgtatcttg gatttgcacc tggggccgaa atgttccttg atgcttttga cttctatcca 480 ctagttattg aaatgcatag ggtcctcaag gacaatatgg atgtaaattt tatgaaaaaa 540 gtcctccgcc aacgctatgg aacaatgact gctgaagaat ggatgactca gaaaataaca 600 gaaataaaag ctgcttttaa ttctgttgga cagcttgcct gggccaaatc tggattctct 660 cctgctgcta gaaccttctt gcagcaattc ggtatcaaca tcccggg 707 <210> 18 <211> 211 <212> PRT <213> mus musculus <400> 18 Met Ala Glu Thr Cys Lys Met Lys Tyr Ser Val Leu Asp Ser Pro Leu 1 5 10 15 Gly Lys Met Glu Leu Ser Gly Cys Glu Arg Gly Leu His Gly Ile Arg 20 25 30 Leu Leu Ser Gly Lys Thr Pro Asn Thr Asp Pro Thr Glu Ala Pro Ala 35 40 45 Thr Pro Glu Val Leu Gly Gly Pro Glu Gly Val Pro Glu Pro Leu Val 50 55 60 Gln Cys Thr Ala Trp Leu Glu Ala Tyr Phe Arg Glu Pro Ala Ala Thr 65 70 75 80 Glu Gly Leu Pro Leu Pro Ala Leu His His Pro Val Phe Gln Gln Asp 85 90 95 Ser Phe Thr Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe 100 105 110 Gly Glu Thr Val Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro 115 120 125 Lys Ala Ala Arg Ala Val Gly Gly Ala Met Arg Ser Asn Pro Val Pro 130 135 140 Ile Leu Ile Pro Cys His Arg Val Val Arg Ser Asp Gly Ala Ile Gly 145 150 155 160 His Tyr Ser Gly Gly Gly Gln Ala Val Lys Glu Trp Leu Leu Ala His 165 170 175 Glu Gly Ile Pro Thr Gly Gln Pro Ala Ser Lys Gly Leu Gly Leu Thr 180 185 190 Gly Thr Trp Leu Lys Ser Ser Phe Glu Ser Thr Ser Ser Glu Pro Ser 195 200 205 Gly Arg Asn 210 <210> 19 <211> 209 <212> PRT <213> Rattus norvegicus <400> 19 Met Ala Glu Ile Cys Lys Met Lys Tyr Thr Val Leu Asp Ser Pro Leu 1 5 10 15 Gly Lys Ile Glu Leu Ser Gly Cys Glu Arg Gly Leu His Gly Ile Arg 20 25 30 Phe Leu Ser Gly Lys Thr Pro Asn Thr Asp Pro Thr Glu Ala Pro Ala 35 40 45 Cys Pro Glu Val Leu Gly Gly Pro Glu Gly Val Pro Glu Pro Leu Val 50 55 60 Gln Cys Thr Ala Trp Leu Glu Ala Tyr Phe His Glu Pro Ala Ala Thr 65 70 75 80 Glu Gly Leu Pro Leu Pro Ala Leu His His Pro Val Phe Gln Gln Asp 85 90 95 Ser Phe Thr Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe 100 105 110 Gly Glu Met Val Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro 115 120 125 Lys Ala Ala Arg Ala Val Gly Gly Ala Met Arg Ser Asn Pro Val Pro 130 135 140 Ile Leu Ile Pro Cys His Arg Val Ile Arg Ser Asp Gly Ala Ile Gly 145 150 155 160 Asn Tyr Ser Gly Gly Gly Gln Thr Val Lys Glu Trp Leu Leu Ala His 165 170 175 Glu Gly Ile Pro Thr Gly Gln Pro Ala Ser Lys Gly Leu Gly Leu Ile 180 185 190 Gly Ser Trp Leu Lys Pro Ser Phe Glu Ser Ser Ser Pro Lys Pro Ser 195 200 205 Gly <210> 20 <211> 963 <212> DNA <213> artificial <220> <223> DNA sequence coding for SNAP - linker - DEN1 EDIII - linker- Histag <400> 20 agatctgaca aagactgcga aatgaagcgc accaccctgg atagccctct gggcaagctg 60 gaactgtctg ggtgcgaaca gggcctgcac gagatcaagc tgctgggcaa aggaacatct 120 gccgccgacg ccgtggaagt gcctgcccca gccgccgtgc tgggcggacc agagccactg 180 atgcaggcca ccgcctggct caacgcctac tttcaccagc ctgaggccat cgaggagttc 240 cctgtgccag ccctgcacca cccagtgttc cagcaggaga gctttacccg ccaggtgctg 300 tggaaactgc tgaaagtggt gaagttcgga gaggtcatca gctaccagca gctggccgcc 360 ctggccggca atcccgccgc caccgccgcc gtgaaaaccg ccctgagcgg aaatcccgtg 420 cccattctga tcccctgcca ccgggtggtg tctagctctg gcgccgtggg gggctacgag 480 ggcgggctcg ccgtgaaaga gtggctgctg gcccacgagg gccacagact gggcaagcct 540 gggctgggtc ctgcaggtat aggcgcgcca gggtccctgg agggaggtgg cgggtctctg 600 actttaaaag ggatgtcata tgtgatgtgc acaggctcat ttaagctaga gaaggaagtg 660 gctgagaccc agcatggaac tgtcctagtg caggttaaat acgaaggaac agatgcgcca 720 tgcaagatcc ccttttcgac ccaagatgag aaaggagtga cccagaatgg gagattgata 780 acagccaatc ccatagttac tgacaaagaa aaaccaatca acattgagac agaaccacct 840 tttggtgaga gctacatcat agtaggggca ggtgaaaaag ctttgaaact aagctggttc 900 aagaaaggaa gcagcatagg gaaaggaggt ggccatcacc atcaccatca ctgatgaccg 960 gtt 963 <210> 21 <211> 316 <212> PRT <213> artificial <220> <223> SNAP - linker - DEN1 EDIII - linker- Histag <400> 21 Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro 1 5 10 15 Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile 20 25 30 Lys Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala 35 40 45 Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala 50 55 60 Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro 65 70 75 80 Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg 85 90 95 Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile 100 105 110 Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala 115 120 125 Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro 130 135 140 Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly 145 150 155 160 Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu 165 170 175 Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu 180 185 190 Glu Gly Gly Gly Gly Ser Leu Thr Leu Lys Gly Met Ser Tyr Val Met 195 200 205 Cys Thr Gly Ser Phe Lys Leu Glu Lys Glu Val Ala Glu Thr Gln His 210 215 220 Gly Thr Val Leu Val Gln Val Lys Tyr Glu Gly Thr Asp Ala Pro Cys 225 230 235 240 Lys Ile Pro Phe Ser Thr Gln Asp Glu Lys Gly Val Thr Gln Asn Gly 245 250 255 Arg Leu Ile Thr Ala Asn Pro Ile Val Thr Asp Lys Glu Lys Pro Ile 260 265 270 Asn Ile Glu Thr Glu Pro Pro Phe Gly Glu Ser Tyr Ile Ile Val Gly 275 280 285 Ala Gly Glu Lys Ala Leu Lys Leu Ser Trp Phe Lys Lys Gly Ser Ser 290 295 300 Ile Gly Lys Gly Gly Gly His His His His His His 305 310 315 <210> 22 <211> 54 <212> DNA <213> artificial <220> <223> DNA sequence encoding the ssBiP sequence <400> 22 atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cggg 54 <210> 23 <211> 66 <212> DNA <213> artificial <220> <223> DNA artificial encoding BiP-like signal = insect ssBiP signal peptide + cleavage site DEN1prM signal sequence <400> 23 atgaaactat gtattctact tgcagttgtt gcgttcgtag gattgtcctt acctacagct 60 ctggca 66 <210> 24 <211> 22 <212> PRT <213> artificial <220> <223> BiP-like signal = insect ssBiP signal peptide + cleavage site DEN1prM signal sequence <400> 24 Met Lys Leu Cys Ile Leu Leu Ala Val Val Ala Phe Val Gly Leu Ser 1 5 10 15 Leu Pro Thr Ala Leu Ala 20 <210> 25 <211> 4 <212> PRT <213> artificial <220> <223> Amino acid sequence of the spacer <400> 25 Gly Gly Gly Ser 1 <210> 26 <211> 12 <212> DNA <213> artificial <220> <223> DNA sequence of the spacer <400> 26 ggtggcggat ct 12 <210> 27 <211> 6 <212> PRT <213> artificial <220> <223> Amino acid sequence of HIS TAG <400> 27 His His His His His His 1 5 <210> 28 <211> 18 <212> DNA <213> artificial <220> <223> DNA sequence encoding His Tag <400> 28 catcatcatc atcatcat 18 <210> 29 <211> 21 <212> DNA <213> artificial <220> <223> DNA encoding pro-TEV cleavage site 1 <400> 29 gaaaacctgt acttccagag c 21 <210> 30 <211> 21 <212> DNA <213> artificial <220> <223> DNA encoding pro-TEV cleavage site 2 <400> 30 gagaatctat attttcaagg g 21 <210> 31 <211> 530 <212> DNA <213> artificial <220> <223> SNAP-like sequence G/C low content <400> 31 gacaaagact gcgaaatgaa aagaactaca ttggattcac cacttgggaa gttggaactg 60 agtggatgcg agcaaggatt gcatgaaatt aagctactgg gaaaaggaac ttctgctgct 120 gatgcagttg aagttccagc accagcagct gttcttggag gtcctgagcc cctcatgcaa 180 gccacagcct ggcttaacgc atatttccac cagcctgagg ccattgagga atttccagtc 240 cccgcccttc accatcctgt gtttcagcag gagagcttca cccgccaggt cctgtggaaa 300 ttgctgaagg tggtcaagtt tggtgaagtg atttcatatc agcaacttgc tgcattggcc 360 ggtaaccccg cagctacagc tgccgtgaaa actgctctca gcggaaatcc tgtgcccatc 420 ctgatccctt gtcacagagt cgtttcatct tccggagctg taggtggcta tgaaggagga 480 ctggcagtta aggagtggct gctggctcat gaaggtcata gacttggaaa 530 <210> 32 <211> 7 <212> PRT <213> artificial <220> <223> Pro-TEV cleavage site 1 <400> 32 Glu Asn Leu Tyr Phe Gln Ser 1 5 <210> 33 <211> 7 <212> PRT <213> artificial <220> <223> Pro-TEV cleavage site 2 <400> 33 Glu Asn Leu Tyr Phe Gln Gly 1 5 <210> 34 <211> 798 <212> DNA <213> artificial <220> <223> Cassette DNA pDeSNAP Univ (BIPlike - SNAPlike- proTEV/Histag) <400> 34 gatcgcgagc tagcaccatg aaactatgta ttctacttgc agttgttgcg ttcgtaggat 60 tgtccttacc tacagctctg gcaagatctg acaaagactg cgaaatgaaa agaactacat 120 tggattcacc acttgggaag ttggaactga gtggatgcga gcaaggattg catgaaatta 180 agctactggg aaaaggaact tctgctgctg atgcagttga agttccagca ccagcagctg 240 ttcttggagg tcctgagccc ctcatgcaag ccacagcctg gcttaacgca tatttccacc 300 agcctgaggc cattgaggaa tttccagtcc ccgcccttca ccatcctgtg tttcagcagg 360 agagcttcac ccgccaggtc ctgtggaaat tgctgaaggt ggtcaagttt ggtgaagtga 420 tttcatatca gcaacttgct gcattggccg gtaaccccgc agctacagct gccgtgaaaa 480 ctgctctcag cggaaatcct gtgcccatcc tgatcccttg tcacagagtc gtttcatctt 540 ccggagctgt aggtggctat gaaggaggac tggcagttaa ggagtggctg ctggctcatg 600 aaggtcatag acttggaaag cctgggctgg gtcctgctgg tataggcgcg ccagggtccc 660 taggtggcgg atccgaaaac ctgtacttcc agagcgatat cggaggtgga ggcccgggag 720 agaatctata ttttcaaggg cccggcggag gtagtcacca tcatcaccat cactaatgac 780 cggtgcggcc gcaagctt 798 <210> 35 <211> 1439 <212> DNA <213> artificial <220> <223> Cassette DNA pDeSNAP Univ +SBV.N (ssBIP - SNAPlike- SBV.N- proTEV/Histag) <400> 35 atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60 gacaaagact gcgaaatgaa aagaactaca ttggattcac cacttgggaa gttggaactg 120 agtggatgcg agcaaggatt gcatgaaatt aagctactgg gaaaaggaac ttctgctgct 180 gatgcagttg aagttccagc accagcagct gttcttggag gtcctgagcc cctcatgcaa 240 gccacagcct ggcttaacgc atatttccac cagcctgagg ccattgagga atttccagtc 300 cccgcccttc accatcctgt gtttcagcag gagagcttca cccgccaggt cctgtggaaa 360 ttgctgaagg tggtcaagtt tggtgaagtg atttcatatc agcaacttgc tgcattggcc 420 ggtaaccccg cagctacagc tgccgtgaaa actgctctca gcggaaatcc tgtgcccatc 480 ctgatccctt gtcacagagt cgtttcatct tccggagctg taggtggcta tgaaggagga 540 ctggcagtta aggagtggct gctggctcat gaaggtcata gacttggaaa gcctgggctg 600 ggtcctgctg gtataggcgc gccagggtcc ctaggtggcg gatccgaaaa cctgtacttc 660 cagagcgata tctcaagcca attcattttt gaagatgtac cacaacggaa tgcagctaca 720 tttaacccgg aggtcgggta tgtggcattt attggtaagt atgggcaaca actcaacttc 780 ggtgttgcta gagtcttctt cctcaaccag aagaaggcca agatggtcct acataagacg 840 gcacaaccaa gtgtcgatct tacttttggt ggggtcaaat ttacagtggt taataaccat 900 tttccccaat atgtctcaaa tcctgtgcca gacaatgcca ttacacttca caggatgtca 960 ggttatctag cacgttggat tgctgataca tgcaaggcta gtgtcctcaa actagctgaa 1020 gctagtgctc agattgtcat gccccttgct gaggttaagg gatgcacctg ggccgatggt 1080 tatacaatgt atcttggatt tgcacctggg gccgaaatgt tccttgatgc ttttgacttc 1140 tatccactag ttattgaaat gcatagggtc ctcaaggaca atatggatgt aaattttatg 1200 aaaaaagtcc tccgccaacg ctatggaaca atgactgctg aagaatggat gactcagaaa 1260 ataacagaaa taaaagctgc ttttaattct gttggacagc ttgcctgggc caaatctgga 1320 ttctctcctg ctgctagaac cttcttgcag caattcggta tcaacatccc gggagagaat 1380 ctatattttc aagggcccgg cggaggtagt caccatcatc accatcacta atgaccggt 1439 <210> 36 <211> 1480 <212> DNA <213> artificial <220> <223> Cassette DNA pDeSNAP Univ +SBV.N (BIPlike - SNAPlike-SBV.N -proTEV/Histag) <400> 36 tcgcgagcta gcaccatgaa actatgtatt ctacttgcag ttgttgcgtt cgtaggattg 60 tccttaccta cagctctggc aagatctgac aaagactgcg aaatgaaaag aactacattg 120 gattcaccac ttgggaagtt ggaactgagt ggatgcgagc aaggattgca tgaaattaag 180 ctactgggaa aaggaacttc tgctgctgat gcagttgaag ttccagcacc agcagctgtt 240 cttggaggtc ctgagcccct catgcaagcc acagcctggc ttaacgcata tttccaccag 300 cctgaggcca ttgaggaatt tccagtcccc gcccttcacc atcctgtgtt tcagcaggag 360 agcttcaccc gccaggtcct gtggaaattg ctgaaggtgg tcaagtttgg tgaagtgatt 420 tcatatcagc aacttgctgc attggccggt aaccccgcag ctacagctgc cgtgaaaact 480 gctctcagcg gaaatcctgt gcccatcctg atcccttgtc acagagtcgt ttcatcttcc 540 ggagctgtag gtggctatga aggaggactg gcagttaagg agtggctgct ggctcatgaa 600 ggtcatagac ttggaaagcc tgggctgggt cctgctggta taggcgcgcc agggtcccta 660 ggtggcggat ccgaaaacct gtacttccag agcgatatct caagccaatt catttttgaa 720 gatgtaccac aacggaatgc agctacattt aacccggagg tcgggtatgt ggcatttatt 780 ggtaagtatg ggcaacaact caacttcggt gttgctagag tcttcttcct caaccagaag 840 aaggccaaga tggtcctaca taagacggca caaccaagtg tcgatcttac ttttggtggg 900 gtcaaattta cagtggttaa taaccatttt ccccaatatg tctcaaatcc tgtgccagac 960 aatgccatta cacttcacag gatgtcaggt tatctagcac gttggattgc tgatacatgc 1020 aaggctagtg tcctcaaact agctgaagct agtgctcaga ttgtcatgcc ccttgctgag 1080 gttaagggat gcacctgggc cgatggttat acaatgtatc ttggatttgc acctggggcc 1140 gaaatgttcc ttgatgcttt tgacttctat ccactagtta ttgaaatgca tagggtcctc 1200 aaggacaata tggatgtaaa ttttatgaaa aaagtcctcc gccaacgcta tggaacaatg 1260 actgctgaag aatggatgac tcagaaaata acagaaataa aagctgcttt taattctgtt 1320 ggacagcttg cctgggccaa atctggattc tctcctgctg ctagaacctt cttgcagcaa 1380 ttcggtatca acatcccggg agagaatcta tattttcaag ggcccggcgg aggtagtcac 1440 catcatcacc atcactaatg accggtgcgg ccgcaagctt 1480 <210> 37 <211> 18 <212> PRT <213> artificial <220> <223> Amino acid sequence of the ssBiP sequence <400> 37 Met Lys Leu Cys Ile Leu Leu Ala Val Val Ala Phe Val Gly Leu Ser 1 5 10 15 Leu Gly <210> 38 <211> 17 <212> PRT <213> West Nile virus strain IS-98-ST1 <400> 38 Met Val Val Phe Val Val Leu Leu Leu Leu Val Ala Pro Ala Tyr Ser 1 5 10 15 Leu <210> 39 <211> 5 <212> PRT <213> Dengue virus <400> 39 Pro Thr Ala Leu Ala 1 5 <210> 40 <211> 6 <212> PRT <213> artificial <220> <223> Cleavage site of enterokinase <400> 40 Asp Asp Asp Asp Lys Asp 1 5 <210> 41 <211> 480 <212> PRT <213> artificial <220> <223> Amino acid sequence of BiPlike+SNAPlike+proTEV+SBV.N+proTEV+Histag <400> 41 Met Lys Leu Cys Ile Leu Leu Ala Val Val Ala Phe Val Gly Leu Ser 1 5 10 15 Leu Pro Thr Ala Leu Ala Arg Ser Asp Lys Asp Cys Glu Met Lys Arg 20 25 30 Thr Thr Leu Asp Ser Pro Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu 35 40 45 Gln Gly Leu His Glu Ile Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala 50 55 60 Asp Ala Val Glu Val Pro Ala Pro Ala Ala Val Leu Gly Gly Pro Glu 65 70 75 80 Pro Leu Met Gln Ala Thr Ala Trp Leu Asn Ala Tyr Phe His Gln Pro 85 90 95 Glu Ala Ile Glu Glu Phe Pro Val Pro Ala Leu His His Pro Val Phe 100 105 110 Gln Gln Glu Ser Phe Thr Arg Gln Val Leu Trp Lys Leu Leu Lys Val 115 120 125 Val Lys Phe Gly Glu Val Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala 130 135 140 Gly Asn Pro Ala Ala Thr Ala Ala Val Lys Thr Ala Leu Ser Gly Asn 145 150 155 160 Pro Val Pro Ile Leu Ile Pro Cys His Arg Val Val Ser Ser Ser Gly 165 170 175 Ala Val Gly Gly Tyr Glu Gly Gly Leu Ala Val Lys Glu Trp Leu Leu 180 185 190 Ala His Glu Gly His Arg Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly 195 200 205 Ile Gly Ala Pro Gly Ser Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe 210 215 220 Gln Ser Asp Ile Ser Ser Gln Phe Ile Phe Glu Asp Val Pro Gln Arg 225 230 235 240 Asn Ala Ala Thr Phe Asn Pro Glu Val Gly Tyr Val Ala Phe Ile Gly 245 250 255 Lys Tyr Gly Gln Gln Leu Asn Phe Gly Val Ala Arg Val Phe Phe Leu 260 265 270 Asn Gln Lys Lys Ala Lys Met Val Leu His Lys Thr Ala Gln Pro Ser 275 280 285 Val Asp Leu Thr Phe Gly Gly Val Lys Phe Thr Val Val Asn Asn His 290 295 300 Phe Pro Gln Tyr Val Ser Asn Pro Val Pro Asp Asn Ala Ile Thr Leu 305 310 315 320 His Arg Met Ser Gly Tyr Leu Ala Arg Trp Ile Ala Asp Thr Cys Lys 325 330 335 Ala Ser Val Leu Lys Leu Ala Glu Ala Ser Ala Gln Ile Val Met Pro 340 345 350 Leu Ala Glu Val Lys Gly Cys Thr Trp Ala Asp Gly Tyr Thr Met Tyr 355 360 365 Leu Gly Phe Ala Pro Gly Ala Glu Met Phe Leu Asp Ala Phe Asp Phe 370 375 380 Tyr Pro Leu Val Ile Glu Met His Arg Val Leu Lys Asp Asn Met Asp 385 390 395 400 Val Asn Phe Met Lys Lys Val Leu Arg Gln Arg Tyr Gly Thr Met Thr 405 410 415 Ala Glu Glu Trp Met Thr Gln Lys Ile Thr Glu Ile Lys Ala Ala Phe 420 425 430 Asn Ser Val Gly Gln Leu Ala Trp Ala Lys Ser Gly Phe Ser Pro Ala 435 440 445 Ala Arg Thr Phe Leu Gln Gln Phe Gly Ile Asn Ile Pro Gly Glu Asn 450 455 460 Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser His His His His His His 465 470 475 480 <210> 42 <211> 438 <212> PRT <213> artificial <220> <223> Amino acid sequence of the fusion protein SNAP+SCHM.N (without BiPlike + HisTag <400> 42 Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro 1 5 10 15 Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile 20 25 30 Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro 35 40 45 Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr 50 55 60 Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe 65 70 75 80 Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr 85 90 95 Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val 100 105 110 Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr 115 120 125 Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile 130 135 140 Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu 145 150 155 160 Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg 165 170 175 Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser 180 185 190 Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Ser Ser 195 200 205 Gln Phe Ile Phe Glu Asp Val Pro Gln Arg Asn Ala Ala Thr Phe Asn 210 215 220 Pro Glu Val Gly Tyr Val Ala Phe Ile Gly Lys Tyr Gly Gln Gln Leu 225 230 235 240 Asn Phe Gly Val Ala Arg Val Phe Phe Leu Asn Gln Lys Lys Ala Lys 245 250 255 Met Val Leu His Lys Thr Ala Gln Pro Ser Val Asp Leu Thr Phe Gly 260 265 270 Gly Val Lys Phe Thr Val Val Asn Asn His Phe Pro Gln Tyr Val Ser 275 280 285 Asn Pro Val Pro Asp Asn Ala Ile Thr Leu His Arg Met Ser Gly Tyr 290 295 300 Leu Ala Arg Trp Ile Ala Asp Thr Cys Lys Ala Ser Val Leu Lys Leu 305 310 315 320 Ala Glu Ala Ser Ala Gln Ile Val Met Pro Leu Ala Glu Val Lys Gly 325 330 335 Cys Thr Trp Ala Asp Gly Tyr Thr Met Tyr Leu Gly Phe Ala Pro Gly 340 345 350 Ala Glu Met Phe Leu Asp Ala Phe Asp Phe Tyr Pro Leu Val Ile Glu 355 360 365 Met His Arg Val Leu Lys Asp Asn Met Asp Val Asn Phe Met Lys Lys 370 375 380 Val Leu Arg Gln Arg Tyr Gly Thr Met Thr Ala Glu Glu Trp Met Thr 385 390 395 400 Gln Lys Ile Thr Glu Ile Lys Ala Ala Phe Asn Ser Val Gly Gln Leu 405 410 415 Ala Trp Ala Lys Ser Gly Phe Ser Pro Ala Ala Arg Thr Phe Leu Gln 420 425 430 Gln Phe Gly Ile Asn Ile 435 <210> 43 <211> 4194 <212> DNA <213> artificial <220> <223> pMT/BiP/SNAP-Histag avec cassette DeSNAP Univ <400> 43 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300 tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 tttcccagtc acgacgttgt aaaacgacgg ccagtgccag tgaattttaa cgttgcagga 420 caggatgtgg tgcccgatgt gactagctct ttgctgcagg ccgtcctatc ctctggttcc 480 gataagagac ccagaactcc ggccccccac cgcccaccgc cacccccata catatgtggt 540 acgcaagtaa gagtgcctgc gcatgcccca tgtgccccac caagagtttt gcatcccata 600 caagtcccca aagtggagaa ccgaaccaat tcttcgcggg cagaacaaaa gcttctgcac 660 acgtctccac tcgaatttgg agccggccgg cgtgtgcaaa agaggtgaat cgaacgaaag 720 acccgtgtgt aaagccgcgt ttccaaaatg tataaaaccg agagcatctg gccaatgtgc 780 atcagttgtg gtcagcagca aaatcaagtg aatcatctca gtgcaactaa aggggggatc 840 cgatctcaat atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct 900 cgggagatct gacaaagact gcgaaatgaa aagaactaca ttggattcac cacttgggaa 960 gttggaactg agtggatgcg agcaaggatt gcatgaaatt aagctactgg gaaaaggaac 1020 ttctgctgct gatgcagttg aagttccagc accagcagct gttcttggag gtcctgagcc 1080 cctcatgcaa gccacagcct ggcttaacgc atatttccac cagcctgagg ccattgagga 1140 atttccagtc cccgcccttc accatcctgt gtttcagcag gagagcttca cccgccaggt 1200 cctgtggaaa ttgctgaagg tggtcaagtt tggtgaagtg atttcatatc agcaacttgc 1260 tgcattggcc ggtaaccccg cagctacagc tgccgtgaaa actgctctca gcggaaatcc 1320 tgtgcccatc ctgatccctt gtcacagagt cgtttcatct tccggagctg taggtggcta 1380 tgaaggagga ctggcagtta aggagtggct gctggctcat gaaggtcata gacttggaaa 1440 gcctgggctg ggtcctgctg gtataggcgc gccagggtcc ctaggtggcg gatccgaaaa 1500 cctgtacttc cagagcgata tcggaggtgg aggcccggga gagaatctat attttcaagg 1560 gcccggcgga ggtagtcacc atcatcacca tcactaatga ccggtcatca tcaccatcac 1620 cattgagttt aaacccgctg atcagcctcg actgtgcctt ctaaggcctg agctcgctga 1680 tcagcctcga tcgaggatcc agacatgata agatacattg atgagtttgg acaaaccaca 1740 actagaatgc agtgaaaaaa atgctttatt tgtgaaattt gtgatgctat tgctttattt 1800 gtaaccatta taagctgcaa taaacaagtt aacaacaaca attgcattca ttttatgttt 1860 caggttcagg gggaggtgtg ggaggttttt taaagcaagt aaaacctcta caaatgtggt 1920 atggctgatt atgatcagtc gacctgcagg catgcaagct tggcgtaatc atggtcatag 1980 ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc 2040 ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc 2100 tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa 2160 cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg 2220 ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg 2280 ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag 2340 gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac 2400 gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga 2460 taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt 2520 accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc 2580 tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc 2640 cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta 2700 agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat 2760 gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca 2820 gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct 2880 tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt 2940 acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct 3000 cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc 3060 acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa 3120 acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta 3180 tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc 3240 ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat 3300 ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta 3360 tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt 3420 aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt 3480 ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg 3540 ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc 3600 gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc 3660 gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg 3720 cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga 3780 actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta 3840 ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct 3900 tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag 3960 ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca atattattga 4020 agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat 4080 aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc 4140 attattatca tgacattaac ctataaaaat aggcgtatca cgaggccctt tcgt 4194 <210> 44 <211> 3458 <212> DNA <213> artificial <220> <223> pUC57 with DeSNAP Univ cassette <400> 44 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300 tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cgagctcggt acctcgcgaa 420 tgcatctaga tcgagctagc accatgaaac tatgtattct acttgcagtt gttgcgttcg 480 taggattgtc cttacctaca gctctggcaa gatctgacaa agactgcgaa atgaaaagaa 540 ctacattgga ttcaccactt gggaagttgg aactgagtgg atgcgagcaa ggattgcatg 600 aaattaagct actgggaaaa ggaacttctg ctgctgatgc agttgaagtt ccagcaccag 660 cagctgttct tggaggtcct gagcccctca tgcaagccac agcctggctt aacgcatatt 720 tccaccagcc tgaggccatt gaggaatttc cagtccccgc ccttcaccat cctgtgtttc 780 agcaggagag cttcacccgc caggtcctgt ggaaattgct gaaggtggtc aagtttggtg 840 aagtgatttc atatcagcaa cttgctgcat tggccggtaa ccccgcagct acagctgccg 900 tgaaaactgc tctcagcgga aatcctgtgc ccatcctgat cccttgtcac agagtcgttt 960 catcttccgg agctgtaggt ggctatgaag gaggactggc agttaaggag tggctgctgg 1020 ctcatgaagg tcatagactt ggaaagcctg ggctgggtcc tgctggtata ggcgcgccag 1080 ggtccctagg tggcggatcc gaaaacctgt acttccagag cgatatcgga ggtggaggcc 1140 cgggagagaa tctatatttt caagggcccg gcggaggtag tcaccatcat caccatcact 1200 aatgaccggt gcggccgcaa gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa 1260 ttgttatccg ctcacaattc cacacaacat acgagccgga agcataaagt gtaaagcctg 1320 gggtgcctaa tgagtgagct aactcacatt aattgcgttg cgctcactgc ccgctttcca 1380 gtcgggaaac ctgtcgtgcc agctgcatta atgaatcggc caacgcgcgg ggagaggcgg 1440 tttgcgtatt gggcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg 1500 gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg 1560 ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa 1620 ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 1680 acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 1740 tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 1800 ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 1860 ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 1920 ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 1980 actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 2040 gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc 2100 tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 2160 caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 2220 atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 2280 acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa 2340 ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta 2400 ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt 2460 tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag 2520 tgctgcaatg ataccgcgag acccacgctc accggctcca gatttatcag caataaacca 2580 gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc 2640 tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt 2700 tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag 2760 ctccggttcc caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt 2820 tagctccttc ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat 2880 ggttatggca gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt 2940 gactggtgag tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc 3000 ttgcccggcg tcaatacggg ataataccgc gccacatagc agaactttaa aagtgctcat 3060 cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag 3120 ttcgatgtaa cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt 3180 ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg 3240 gaaatgttga atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta 3300 ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc 3360 gcgcacattt ccccgaaaag tgccacctga cgtctaagaa accattatta tcatgacatt 3420 aacctataaa aataggcgta tcacgaggcc ctttcgtc 3458 <210> 45 <211> 6365 <212> DNA <213> artificial <220> <223> pcDNA3 with DeSNAP Univ cassette <400> 45 gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60 ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120 cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180 ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240 gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480 atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540 atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600 tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720 aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780 gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840 ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gctggctagc 900 accatgaaac tatgtattct acttgcagtt gttgcgttcg taggattgtc cttacctaca 960 gctctggcaa gatctgacaa agactgcgaa atgaaaagaa ctacattgga ttcaccactt 1020 gggaagttgg aactgagtgg atgcgagcaa ggattgcatg aaattaagct actgggaaaa 1080 ggaacttctg ctgctgatgc agttgaagtt ccagcaccag cagctgttct tggaggtcct 1140 gagcccctca tgcaagccac agcctggctt aacgcatatt tccaccagcc tgaggccatt 1200 gaggaatttc cagtccccgc ccttcaccat cctgtgtttc agcaggagag cttcacccgc 1260 caggtcctgt ggaaattgct gaaggtggtc aagtttggtg aagtgatttc atatcagcaa 1320 cttgctgcat tggccggtaa ccccgcagct acagctgccg tgaaaactgc tctcagcgga 1380 aatcctgtgc ccatcctgat cccttgtcac agagtcgttt catcttccgg agctgtaggt 1440 ggctatgaag gaggactggc agttaaggag tggctgctgg ctcatgaagg tcatagactt 1500 ggaaagcctg ggctgggtcc tgctggtata ggcgcgccag ggtccctagg tggcggatcc 1560 gaaaacctgt acttccagag cgatatcgga ggtggaggcc cgggagagaa tctatatttt 1620 caagggcccg gcggaggtag tcaccatcat caccatcact aatgaccggt gcggccgcaa 1680 gcttggtacc gagctcggat ccactagtcc agtgtggtgg aattctgcag atatccagca 1740 cagtggcggc cgctcgagtc tagagggccc gtttaaaccc gctgatcagc ctcgactgtg 1800 ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt gaccctggaa 1860 ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt 1920 aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga ggattgggaa 1980 gacaatagca ggcatgctgg ggatgcggtg ggctctatgg cttctgaggc ggaaagaacc 2040 agctggggct ctagggggta tccccacgcg ccctgtagcg gcgcattaag cgcggcgggt 2100 gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg ccctagcgcc cgctcctttc 2160 gctttcttcc cttcctttct cgccacgttc gccggctttc cccgtcaagc tctaaatcgg 2220 gggctccctt tagggttccg atttagtgct ttacggcacc tcgaccccaa aaaacttgat 2280 tagggtgatg gttcacgtag tgggccatcg ccctgataga cggtttttcg ccctttgacg 2340 ttggagtcca cgttctttaa tagtggactc ttgttccaaa ctggaacaac actcaaccct 2400 atctcggtct attcttttga tttataaggg attttgccga tttcggccta ttggttaaaa 2460 aatgagctga tttaacaaaa atttaacgcg aattaattct gtggaatgtg tgtcagttag 2520 ggtgtggaaa gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt 2580 agtcagcaac caggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca 2640 tgcatctcaa ttagtcagca accatagtcc cgcccctaac tccgcccatc ccgcccctaa 2700 ctccgcccag ttccgcccat tctccgcccc atggctgact aatttttttt atttatgcag 2760 aggccgaggc cgcctctgcc tctgagctat tccagaagta gtgaggaggc ttttttggag 2820 gcctaggctt ttgcaaaaag ctcccgggag cttgtatatc cattttcgga tctgatcagc 2880 acgtgatgaa aaagcctgaa ctcaccgcga cgtctgtcga gaagtttctg atcgaaaagt 2940 tcgacagcgt ctccgacctg atgcagctct cggagggcga agaatctcgt gctttcagct 3000 tcgatgtagg agggcgtgga tatgtcctgc gggtaaatag ctgcgccgat ggtttctaca 3060 aagatcgtta tgtttatcgg cactttgcat cggccgcgct cccgattccg gaagtgcttg 3120 acattgggga attcagcgag agcctgacct attgcatctc ccgccgtgca cagggtgtca 3180 cgttgcaaga cctgcctgaa accgaactgc ccgctgttct gcagccggtc gcggaggcca 3240 tggatgcgat cgctgcggcc gatcttagcc agacgagcgg gttcggccca ttcggaccgc 3300 aaggaatcgg tcaatacact acatggcgtg atttcatatg cgcgattgct gatccccatg 3360 tgtatcactg gcaaactgtg atggacgaca ccgtcagtgc gtccgtcgcg caggctctcg 3420 atgagctgat gctttgggcc gaggactgcc ccgaagtccg gcacctcgtg cacgcggatt 3480 tcggctccaa caatgtcctg acggacaatg gccgcataac agcggtcatt gactggagcg 3540 aggcgatgtt cggggattcc caatacgagg tcgccaacat cttcttctgg aggccgtggt 3600 tggcttgtat ggagcagcag acgcgctact tcgagcggag gcatccggag cttgcaggat 3660 cgccgcggct ccgggcgtat atgctccgca ttggtcttga ccaactctat cagagcttgg 3720 ttgacggcaa tttcgatgat gcagcttggg cgcagggtcg atgcgacgca atcgtccgat 3780 ccggagccgg gactgtcggg cgtacacaaa tcgcccgcag aagcgcggcc gtctggaccg 3840 atggctgtgt agaagtactc gccgatagtg gaaaccgacg ccccagcact cgtccgaggg 3900 caaaggaata gcacgtgcta cgagatttcg attccaccgc cgccttctat gaaaggttgg 3960 gcttcggaat cgttttccgg gacgccggct ggatgatcct ccagcgcggg gatctcatgc 4020 tggagttctt cgcccacccc aacttgttta ttgcagctta taatggttac aaataaagca 4080 atagcatcac aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt 4140 ccaaactcat caatgtatct tatcatgtct gtataccgtc gacctctagc tagagcttgg 4200 cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta tccgctcaca attccacaca 4260 acatacgagc cggaagcata aagtgtaaag cctggggtgc ctaatgagtg agctaactca 4320 cattaattgc gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc 4380 attaatgaat cggccaacgc gcggggagag gcggtttgcg tattgggcgc tcttccgctt 4440 cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact 4500 caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag 4560 caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata 4620 ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc 4680 cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg 4740 ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc 4800 tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg 4860 gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc 4920 ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga 4980 ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg 5040 gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt accttcggaa 5100 aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt ttttttgttt 5160 gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta 5220 cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagattat 5280 caaaaaggat cttcacctag atccttttaa attaaaaatg aagttttaaa tcaatctaaa 5340 gtatatatga gtaaacttgg tctgacagtt accaatgctt aatcagtgag gcacctatct 5400 cagcgatctg tctatttcgt tcatccatag ttgcctgact ccccgtcgtg tagataacta 5460 cgatacggga gggcttacca tctggcccca gtgctgcaat gataccgcga gacccacgct 5520 caccggctcc agatttatca gcaataaacc agccagccgg aagggccgag cgcagaagtg 5580 gtcctgcaac tttatccgcc tccatccagt ctattaattg ttgccgggaa gctagagtaa 5640 gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt 5700 cacgctcgtc gtttggtatg gcttcattca gctccggttc ccaacgatca aggcgagtta 5760 catgatcccc catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca 5820 gaagtaagtt ggccgcagtg ttatcactca tggttatggc agcactgcat aattctctta 5880 ctgtcatgcc atccgtaaga tgcttttctg tgactggtga gtactcaacc aagtcattct 5940 gagaatagtg tatgcggcga ccgagttgct cttgcccggc gtcaatacgg gataataccg 6000 cgccacatag cagaacttta aaagtgctca tcattggaaa acgttcttcg gggcgaaaac 6060 tctcaaggat cttaccgctg ttgagatcca gttcgatgta acccactcgt gcacccaact 6120 gatcttcagc atcttttact ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa 6180 atgccgcaaa aaagggaata agggcgacac ggaaatgttg aatactcata ctcttccttt 6240 ttcaatatta ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat 6300 gtatttagaa aaataaacaa ataggggttc cgcgcacatt tccccgaaaa gtgccacctg 6360 acgtc 6365 <210> 46 <211> 476 <212> PRT <213> artificial <220> <223> Amino acid sequence of ssBiP+SNAPlike+proTEV+SBV.N+proTEV+Histag (encoded by SEQ ID NO:35) <400> 46 Met Lys Leu Cys Ile Leu Leu Ala Val Val Ala Phe Val Gly Leu Ser 1 5 10 15 Leu Gly Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp 20 25 30 Ser Pro Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His 35 40 45 Glu Ile Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu 50 55 60 Val Pro Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln 65 70 75 80 Ala Thr Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu 85 90 95 Glu Phe Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser 100 105 110 Phe Thr Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly 115 120 125 Glu Val Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala 130 135 140 Ala Thr Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile 145 150 155 160 Leu Ile Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly 165 170 175 Tyr Glu Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly 180 185 190 His Arg Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro 195 200 205 Gly Ser Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile 210 215 220 Ser Ser Gln Phe Ile Phe Glu Asp Val Pro Gln Arg Asn Ala Ala Thr 225 230 235 240 Phe Asn Pro Glu Val Gly Tyr Val Ala Phe Ile Gly Lys Tyr Gly Gln 245 250 255 Gln Leu Asn Phe Gly Val Ala Arg Val Phe Phe Leu Asn Gln Lys Lys 260 265 270 Ala Lys Met Val Leu His Lys Thr Ala Gln Pro Ser Val Asp Leu Thr 275 280 285 Phe Gly Gly Val Lys Phe Thr Val Val Asn Asn His Phe Pro Gln Tyr 290 295 300 Val Ser Asn Pro Val Pro Asp Asn Ala Ile Thr Leu His Arg Met Ser 305 310 315 320 Gly Tyr Leu Ala Arg Trp Ile Ala Asp Thr Cys Lys Ala Ser Val Leu 325 330 335 Lys Leu Ala Glu Ala Ser Ala Gln Ile Val Met Pro Leu Ala Glu Val 340 345 350 Lys Gly Cys Thr Trp Ala Asp Gly Tyr Thr Met Tyr Leu Gly Phe Ala 355 360 365 Pro Gly Ala Glu Met Phe Leu Asp Ala Phe Asp Phe Tyr Pro Leu Val 370 375 380 Ile Glu Met His Arg Val Leu Lys Asp Asn Met Asp Val Asn Phe Met 385 390 395 400 Lys Lys Val Leu Arg Gln Arg Tyr Gly Thr Met Thr Ala Glu Glu Trp 405 410 415 Met Thr Gln Lys Ile Thr Glu Ile Lys Ala Ala Phe Asn Ser Val Gly 420 425 430 Gln Leu Ala Trp Ala Lys Ser Gly Phe Ser Pro Ala Ala Arg Thr Phe 435 440 445 Leu Gln Gln Phe Gly Ile Asn Ile Pro Gly Glu Asn Leu Tyr Phe Gln 450 455 460 Gly Pro Gly Gly Gly Ser His His His His His His 465 470 475 <210> 47 <211> 891 <212> DNA <213> artificial <220> <223> Modified DNA sequence encoding enterovirus 71 VP1 (strain JL-AFP-EV71-07-03) <400> 47 ggagataggg tggcagacgt gattgaaagt tccaaaggaa atagtgtgag cagagccctc 60 actcaagctc taccagcacc cacaggtcag aacacacagg tgagcagtca tcgactggat 120 acaggcaagg ttccagcact ccaagctgct gaaattggag catcatcaaa tgctagtgat 180 gagagcatga tcgagacacg ctgtgttctt aactcgcata gcacagctga gaccactctt 240 gatagtttct tcagcagagc ggggttagtt ggagagattg atctccctct tgaaggcaca 300 actaacccaa atggttatgc caactgggac atagatataa caggttacgc gcaaatgcgt 360 agaaaggtgg agctattcac ctacatgcgc tttgatgcag agttcacttt tgttgcgtgc 420 acacccaccg gggaagttgt cccacaattg ctccaataca tgtttgtgcc acctggagcc 480 cctaagccag attccaggga atccctcgca tggcaaactg ccaccaaccc ctcagttttt 540 gtcaagctgt cagaccctcc agcacaagtt tcagtaccat tcatgtcacc tgcgagtgct 600 taccaatggt tttatgacgg ttatcccaca ttcggagaac acaaacagga gaaggatctc 660 gaatatgggg catgtcctaa caacatgatg ggcacgttct cagtgcggac tgtagggacc 720 tccaagtcca agtacccttt agtggttagg atttacatga gaatgaagca cgtcagggcg 780 tggatacctc gcccgatgcg caaccaaaac tacctattca aagccaaccc aaattatgct 840 ggcaactcca ttaagccaac tggtaccagt cgcacagcga tcactactct c 891 <210> 48 <211> 1643 <212> DNA <213> artificial <220> <223> DNA Sequence of chimeric DeSNAPuniv-EV71.VP1 (ssBiP-SNAPlike- proTEVcleavage site - modified EV71-VP1-proTEVcleavage site -Histag) for expression in S2 cells <400> 48 atgaagttat gcatattact ggccgtcgtg gtggcctttg ttggcctctc gctcgggaga 60 tctagatctg acaaagactg cgaaatgaaa agaactacat tggattcacc acttgggaag 120 ttggaactga gtggatgcga gcaaggattg catgaaatta agctactggg aaaaggaact 180 tctgctgctg atgcagttga agttccagca ccagcagctg ttcttggagg tcctgagccc 240 ctcatgcaag ccacagcctg gcttaacgca tatttccacc agcctgaggc cattgaggaa 300 tttccagtcc ccgcccttca ccatcctgtg tttcagcagg agagcttcac ccgccaggtc 360 ctgtggaaat tgctgaaggt ggtcaagttt ggtgaagtga tttcatatca gcaacttgct 420 gcattggccg gtaaccccgc agctacagct gccgtgaaaa ctgctctcag cggaaatcct 480 gtgcccatcc tgatcccttg tcacagagtc gtttcatctt ccggagctgt aggtggctat 540 gaaggaggac tggcagttaa ggagtggctg ctggctcatg aaggtcatag acttggaaag 600 cctgggctgg gtcctgctgg tataggcgcg ccagggtccc taggtggcgg atccgaaaac 660 ctgtacttcc agagcgatat cggagatagg gtggcagacg tgattgaaag ttccaaagga 720 aatagtgtga gcagagccct cactcaagct ctaccagcac ccacaggtca gaacacacag 780 gtgagcagtc atcgactgga tacaggcaag gttccagcac tccaagctgc tgaaattgga 840 gcatcatcaa atgctagtga tgagagcatg atcgagacac gctgtgttct taactcgcat 900 agcacagctg agaccactct tgatagtttc ttcagcagag cggggttagt tggagagatt 960 gatctccctc ttgaaggcac aactaaccca aatggttatg ccaactggga catagatata 1020 acaggttacg cgcaaatgcg tagaaaggtg gagctattca cctacatgcg ctttgatgca 1080 gagttcactt ttgttgcgtg cacacccacc ggggaagttg tcccacaatt gctccaatac 1140 atgtttgtgc cacctggagc ccctaagcca gattccaggg aatccctcgc atggcaaact 1200 gccaccaacc cctcagtttt tgtcaagctg tcagaccctc cagcacaagt ttcagtacca 1260 ttcatgtcac ctgcgagtgc ttaccaatgg ttttatgacg gttatcccac attcggagaa 1320 cacaaacagg agaaggatct cgaatatggg gcatgtccta acaacatgat gggcacgttc 1380 tcagtgcgga ctgtagggac ctccaagtcc aagtaccctt tagtggttag gatttacatg 1440 agaatgaagc acgtcagggc gtggatacct cgcccgatgc gcaaccaaaa ctacctattc 1500 aaagccaacc caaattatgc tggcaactcc attaagccaa ctggtaccag tcgcacagcg 1560 atcactactc tcccgggaga gaatctatat tttcaagggc ccggcggagg tagtcaccat 1620 catcaccatc actaatgacc ggt 1643 <210> 49 <211> 523 <212> PRT <213> artificial <220> <223> Amino acid sequence of fusion protein [SNAPlike - proTEV - VP1 EV71 - proTEV- Histag] <400> 49 Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro 1 5 10 15 Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile 20 25 30 Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro 35 40 45 Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr 50 55 60 Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe 65 70 75 80 Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr 85 90 95 Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val 100 105 110 Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr 115 120 125 Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile 130 135 140 Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu 145 150 155 160 Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg 165 170 175 Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser 180 185 190 Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Gly Asp 195 200 205 Arg Val Ala Asp Val Ile Glu Ser Ser Lys Gly Asn Ser Val Ser Arg 210 215 220 Ala Leu Thr Gln Ala Leu Pro Ala Pro Thr Gly Gln Asn Thr Gln Val 225 230 235 240 Ser Ser His Arg Leu Asp Thr Gly Lys Val Pro Ala Leu Gln Ala Ala 245 250 255 Glu Ile Gly Ala Ser Ser Asn Ala Ser Asp Glu Ser Met Ile Glu Thr 260 265 270 Arg Cys Val Leu Asn Ser His Ser Thr Ala Glu Thr Thr Leu Asp Ser 275 280 285 Phe Phe Ser Arg Ala Gly Leu Val Gly Glu Ile Asp Leu Pro Leu Glu 290 295 300 Gly Thr Thr Asn Pro Asn Gly Tyr Ala Asn Trp Asp Ile Asp Ile Thr 305 310 315 320 Gly Tyr Ala Gln Met Arg Arg Lys Val Glu Leu Phe Thr Tyr Met Arg 325 330 335 Phe Asp Ala Glu Phe Thr Phe Val Ala Cys Thr Pro Thr Gly Glu Val 340 345 350 Val Pro Gln Leu Leu Gln Tyr Met Phe Val Pro Pro Gly Ala Pro Lys 355 360 365 Pro Asp Ser Arg Glu Ser Leu Ala Trp Gln Thr Ala Thr Asn Pro Ser 370 375 380 Val Phe Val Lys Leu Ser Asp Pro Pro Ala Gln Val Ser Val Pro Phe 385 390 395 400 Met Ser Pro Ala Ser Ala Tyr Gln Trp Phe Tyr Asp Gly Tyr Pro Thr 405 410 415 Phe Gly Glu His Lys Gln Glu Lys Asp Leu Glu Tyr Gly Ala Cys Pro 420 425 430 Asn Asn Met Met Gly Thr Phe Ser Val Arg Thr Val Gly Thr Ser Lys 435 440 445 Ser Lys Tyr Pro Leu Val Val Arg Ile Tyr Met Arg Met Lys His Val 450 455 460 Arg Ala Trp Ile Pro Arg Pro Met Arg Asn Gln Asn Tyr Leu Phe Lys 465 470 475 480 Ala Asn Pro Asn Tyr Ala Gly Asn Ser Ile Lys Pro Thr Gly Thr Ser 485 490 495 Arg Thr Ala Ile Thr Thr Leu Pro Gly Glu Asn Leu Tyr Phe Gln Gly 500 505 510 Pro Gly Gly Gly Ser His His His His His His 515 520 <210> 50 <211> 2386 <212> DNA <213> artificial <220> <223> DNA Sequence encoding chimeric DeSNAPuniv-JE. -sE (ssBiP- sE from JEV strain SA-14 -SNAPlike) for expression in S2 cells <400> 50 atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60 atgaagttgt cgaatttcca ggggaagctt ttgatgacca tcaacaacac ggacattgca 120 gacgttatcg tgattcccac ctcaaaagga gagaacagat gctgggtccg ggcaatcgac 180 gtcggctaca tgtgtgagga cactatcacg tacgaatgtc ctaagcttac catgggcaat 240 gatccagagg atgtggattg ctggtgtgac aaccaagaag tctacgtcca atatggacgg 300 tgcacgcgga ccaggcattc caagcgaagc aggagatccg tgtcggtcca aacacatggg 360 gagagttcac tagtgaataa aaaagaggct tggctggatt caacgaaagc cacacgatat 420 ctcatgaaaa ctgagaactg gatcataagg aatcctggct atgctttcct ggcggcggta 480 cttggctgga tgcttggcag taacaacggt caacgcgtgg tatttaccat cctcctgctg 540 ttggtcgctc cggcttacag ttttaattgt ctgggaatgg gcaatcgtga cttcatagaa 600 ggagccagtg gagccacttg ggtggacttg gtgctagaag gagatagctg cttgacaatc 660 atggcaaacg acaaaccaac attggacgtc cgcatgatta acatcgaagc tagccaactt 720 gctgaggtca gaagttactg ctatcatgct tcagtcactg acatctcgac ggtggctcgg 780 tgccccacga ctggagaagc tcacaacgag aagcgagctg atagtagcta tgtgtgcaaa 840 caaggcttca ctgaccgtgg gtggggcaac ggatgtggac ttttcgggaa gggaagcatt 900 gacacatgtg caaaattctc ctgcaccagt aaagcgattg ggagaacaat ccagccagaa 960 aacatcaaat acgaagttgg catttttgtg catggaacca ccacttcgga aaaccatggg 1020 aattattcag cgcaagttgg ggcgtcccag gcggcaaagt ttacagtaac acccaatgct 1080 ccttcgataa ccctcaaact tggtgactac ggagaagtca cactggactg tgagccaagg 1140 agtggactga acactgaagc gttttacgtc atgaccgtgg ggtcaaagtc atttctggtc 1200 catagggagt ggtttcatga cctcgctctc ccctggacgt ccccttcgag cacagcgtgg 1260 agaaacagag aactcctcat ggaatttgaa ggggcgcacg ccacaaaaca gtccgttgtt 1320 gctcttgggt cacaggaagg aggcctccat caggcgttgg caggagccat cgtggtggag 1380 tactcaagct cagtgaagtt aacatcaggc cacctgaaat gtaggctgaa aatggacaaa 1440 ctggctctga aaggcacaac ctatggcatg tgtacagaaa aattctcgtt cgcgaaaaat 1500 ccggcggaca ctggtcacgg aacagttgtc attgaactct cctactctgg gagtgatggc 1560 tcctgcaaaa ttccgattgt ttccgttgcg agcctcaatg acatgacccc cgttgggcgg 1620 ctggtgacag tgaacccctt cgtcgcgact tccagtgcca actcaaaggt gctggtcgag 1680 atggaacccc ccttcggaga ctcctacatc gtagttggaa ggggagacaa gcagatcaac 1740 caccattggc acaaagctgg gcggccgcac ggcggaggta gcaaagactg cgaaatgaag 1800 cgcaccaccc tggatagccc tctgggcaag ctggaactgt ctgggtgcga acagggcctg 1860 cacgagatca agctgctggg caaaggaaca tctgccgccg acgccgtgga agtgcctgcc 1920 ccagccgccg tgctgggcgg accagagcca ctgatgcagg ccaccgcctg gctcaacgcc 1980 tactttcacc agcctgaggc catcgaggag ttccctgtgc cagccctgca ccacccagtg 2040 ttccagcagg agagctttac ccgccaggtg ctgtggaaac tgctgaaagt ggtgaagttc 2100 ggagaggtca tcagctacca gcagctggcc gccctggccg gcaatcccgc cgccaccgcc 2160 gccgtgaaaa ccgccctgag cggaaatccc gtgcccattc tgatcccctg ccaccgggtg 2220 gtgtctagct ctggcgccgt ggggggctac gagggcgggc tcgccgtgaa agagtggctg 2280 ctggcccacg agggccacag actgggcaag cctgggctgg gtcctgcagg tataggcgcg 2340 ccagggtccc tggagcatca tcatcatcat cattgatgac gggccc 2386 <210> 51 <211> 773 <212> PRT <213> artificial <220> <223> Amino acid Sequence of fusion protein [sE from JEV strain SA-14 - SNAPlike - Histag] <400> 51 Arg Ser Met Lys Leu Ser Asn Phe Gln Gly Lys Leu Leu Met Thr Ile 1 5 10 15 Asn Asn Thr Asp Ile Ala Asp Val Ile Val Ile Pro Thr Ser Lys Gly 20 25 30 Glu Asn Arg Cys Trp Val Arg Ala Ile Asp Val Gly Tyr Met Cys Glu 35 40 45 Asp Thr Ile Thr Tyr Glu Cys Pro Lys Leu Thr Met Gly Asn Asp Pro 50 55 60 Glu Asp Val Asp Cys Trp Cys Asp Asn Gln Glu Val Tyr Val Gln Tyr 65 70 75 80 Gly Arg Cys Thr Arg Thr Arg His Ser Lys Arg Ser Arg Arg Ser Val 85 90 95 Ser Val Gln Thr His Gly Glu Ser Ser Leu Val Asn Lys Lys Glu Ala 100 105 110 Trp Leu Asp Ser Thr Lys Ala Thr Arg Tyr Leu Met Lys Thr Glu Asn 115 120 125 Trp Ile Ile Arg Asn Pro Gly Tyr Ala Phe Leu Ala Ala Val Leu Gly 130 135 140 Trp Met Leu Gly Ser Asn Asn Gly Gln Arg Val Val Phe Thr Ile Leu 145 150 155 160 Leu Leu Leu Val Ala Pro Ala Tyr Ser Phe Asn Cys Leu Gly Met Gly 165 170 175 Asn Arg Asp Phe Ile Glu Gly Ala Ser Gly Ala Thr Trp Val Asp Leu 180 185 190 Val Leu Glu Gly Asp Ser Cys Leu Thr Ile Met Ala Asn Asp Lys Pro 195 200 205 Thr Leu Asp Val Arg Met Ile Asn Ile Glu Ala Ser Gln Leu Ala Glu 210 215 220 Val Arg Ser Tyr Cys Tyr His Ala Ser Val Thr Asp Ile Ser Thr Val 225 230 235 240 Ala Arg Cys Pro Thr Thr Gly Glu Ala His Asn Glu Lys Arg Ala Asp 245 250 255 Ser Ser Tyr Val Cys Lys Gln Gly Phe Thr Asp Arg Gly Trp Gly Asn 260 265 270 Gly Cys Gly Leu Phe Gly Lys Gly Ser Ile Asp Thr Cys Ala Lys Phe 275 280 285 Ser Cys Thr Ser Lys Ala Ile Gly Arg Thr Ile Gln Pro Glu Asn Ile 290 295 300 Lys Tyr Glu Val Gly Ile Phe Val His Gly Thr Thr Thr Ser Glu Asn 305 310 315 320 His Gly Asn Tyr Ser Ala Gln Val Gly Ala Ser Gln Ala Ala Lys Phe 325 330 335 Thr Val Thr Pro Asn Ala Pro Ser Ile Thr Leu Lys Leu Gly Asp Tyr 340 345 350 Gly Glu Val Thr Leu Asp Cys Glu Pro Arg Ser Gly Leu Asn Thr Glu 355 360 365 Ala Phe Tyr Val Met Thr Val Gly Ser Lys Ser Phe Leu Val His Arg 370 375 380 Glu Trp Phe His Asp Leu Ala Leu Pro Trp Thr Ser Pro Ser Ser Thr 385 390 395 400 Ala Trp Arg Asn Arg Glu Leu Leu Met Glu Phe Glu Gly Ala His Ala 405 410 415 Thr Lys Gln Ser Val Val Ala Leu Gly Ser Gln Glu Gly Gly Leu His 420 425 430 Gln Ala Leu Ala Gly Ala Ile Val Val Glu Tyr Ser Ser Ser Val Lys 435 440 445 Leu Thr Ser Gly His Leu Lys Cys Arg Leu Lys Met Asp Lys Leu Ala 450 455 460 Leu Lys Gly Thr Thr Tyr Gly Met Cys Thr Glu Lys Phe Ser Phe Ala 465 470 475 480 Lys Asn Pro Ala Asp Thr Gly His Gly Thr Val Val Ile Glu Leu Ser 485 490 495 Tyr Ser Gly Ser Asp Gly Ser Cys Lys Ile Pro Ile Val Ser Val Ala 500 505 510 Ser Leu Asn Asp Met Thr Pro Val Gly Arg Leu Val Thr Val Asn Pro 515 520 525 Phe Val Ala Thr Ser Ser Ala Asn Ser Lys Val Leu Val Glu Met Glu 530 535 540 Pro Pro Phe Gly Asp Ser Tyr Ile Val Val Gly Arg Gly Asp Lys Gln 545 550 555 560 Ile Asn His His Trp His Lys Ala Gly Arg Pro His Gly Gly Gly Ser 565 570 575 Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly Lys 580 585 590 Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu Leu 595 600 605 Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro Ala 610 615 620 Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp Leu 625 630 635 640 Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val Pro 645 650 655 Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln Val 660 665 670 Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser Tyr 675 680 685 Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala Val 690 695 700 Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys His 705 710 715 720 Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly Leu 725 730 735 Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly Lys 740 745 750 Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Glu His 755 760 765 His His His His His 770 <210> 52 <211> 1020 <212> DNA <213> artificial <220> <223> DNA Sequence encoding the fusion protein BiPlike-SNAPlike-EDIII from Japanese encephalitis virus genotype I cloned into pMT/BiP/SNAP for expression in S2 cells <400> 52 atgaaactat gtattctact tgcagttgtt gcgttcgtag gattgtcctt aagatctgac 60 aaagactgcg aaatgaaaag aactacattg gattcaccac ttgggaagtt ggaactgagt 120 ggatgcgagc aaggattgca tgaaattaag ctactgggaa aaggaacttc tgctgctgat 180 gcagttgaag ttccagcacc agcagctgtt cttggaggtc ctgagcccct catgcaagcc 240 acagcctggc ttaacgcata tttccaccag cctgaggcca ttgaggaatt tccagtcccc 300 gcccttcacc atcctgtgtt tcagcaggag agcttcaccc gccaggtcct gtggaaattg 360 ctgaaggtgg tcaagtttgg tgaagtgatt tcatatcagc aacttgctgc attggccggt 420 aaccccgcag ctacagctgc cgtgaaaact gctctcagcg gaaatcctgt gcccatcctg 480 atcccttgtc acagagtcgt ttcatcttcc ggagctgtag gtggctatga aggaggactg 540 gcagttaagg agtggctgct ggctcatgaa ggtcatagac ttggaaagcc tgggctgggt 600 cctgctggta taggcgcgcc agggtccctg gagggaggtg gcgggtctgc tctgaagggc 660 acgacttacg gcatgtgtac agaaaaattc tcgttcgcga aaaatccagc ggacacaggc 720 catggaacag ttgtcattga gctcacatac tctggaagcg atggtccctg taaaattccg 780 attgtctcag tcgcgagttt aaacgacatg acccctgtgg ggaggctggt aacagtaaac 840 cccttcgtcg cgacatctag ctccaactca aaggtgctgg ttgagatgga acctcccttc 900 ggagactctt acatcgtggt tggaagaggg gataagcaga ttaaccatca ctggcacaaa 960 gctggaagca cgctgggtaa aggaggtggc catcaccatc accatcactg atgaccggtt 1020 <210> 53 <211> 319 <212> PRT <213> artificial <220> <223> Amino acid Sequence of the fusion protein SNAPlike-EDIII from Japanese encephalitis virus genotype I - Histag <400> 53 Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro 1 5 10 15 Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile 20 25 30 Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro 35 40 45 Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr 50 55 60 Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe 65 70 75 80 Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr 85 90 95 Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val 100 105 110 Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr 115 120 125 Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile 130 135 140 Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu 145 150 155 160 Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg 165 170 175 Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser 180 185 190 Leu Glu Gly Gly Gly Gly Ser Ala Leu Lys Gly Thr Thr Tyr Gly Met 195 200 205 Cys Thr Glu Lys Phe Ser Phe Ala Lys Asn Pro Ala Asp Thr Gly His 210 215 220 Gly Thr Val Val Ile Glu Leu Thr Tyr Ser Gly Ser Asp Gly Pro Cys 225 230 235 240 Lys Ile Pro Ile Val Ser Val Ala Ser Leu Asn Asp Met Thr Pro Val 245 250 255 Gly Arg Leu Val Thr Val Asn Pro Phe Val Ala Thr Ser Ser Ser Asn 260 265 270 Ser Lys Val Leu Val Glu Met Glu Pro Pro Phe Gly Asp Ser Tyr Ile 275 280 285 Val Val Gly Arg Gly Asp Lys Gln Ile Asn His His Trp His Lys Ala 290 295 300 Gly Ser Thr Leu Gly Lys Gly Gly Gly His His His His His His 305 310 315 <210> 54 <211> 406 <212> DNA <213> artificial <220> <223> DNA sequence encoding Domain III of envelope E protein from Japanese encephalitis virus of genotype 1 (JE-1.EDIII) <400> 54 gcgcgccagg gtccctggag ggaggtggcg ggtctgctct gaagggcacg acttacggca 60 tgtgtacaga aaaattctcg ttcgcgaaaa atccagcgga cacaggccat ggaacagttg 120 tcattgagct cacatactct ggaagcgatg gtccctgtaa aattccgatt gtctcagtcg 180 cgagtttaaa cgacatgacc cctgtgggga ggctggtaac agtaaacccc ttcgtcgcga 240 catctagctc caactcaaag gtgctggttg agatggaacc tcccttcgga gactcttaca 300 tcgtggttgg aagaggggat aagcagatta accatcactg gcacaaagct ggaagcacgc 360 tgggtaaagg aggtggccat caccatcacc atcactgatg accggt 406 <210> 55 <211> 406 <212> DNA <213> artificial <220> <223> DNA sequence encoding Domain III of envelope E protein from Japanese encephalitis virus of genotype 2 (JE-2.EDIII) <400> 55 gcgcgccagg gtccctggag ggaggtggcg ggtctgctct gaaaggcaca acctatggta 60 tgtgcacaga aaactcctcg ttccgaaaaa atccagcgga cacaggccat ggaacagttg 120 tcattgagct cacatactct gggagtgatg gtccctgtaa gattccaaat gtctccgttg 180 cgagcctgaa tgacatgacc cctgtaggga ggctggtaac agtaaacccc tttgtcgcga 240 catccagcgc caactcaaaa gtgctggttg aaatggaacc cccttttgga gattcttaca 300 tcgtggtcgg aagaggtgac aagcagatca atcatcactg gcacaaagct ggaagcacgc 360 tgggcaaagg aggtggccat caccatcacc atcactgatg accggt 406 <210> 56 <211> 406 <212> DNA <213> artificial <220> <223> DNA sequence encoding Domain III of envelope E protein from Japanese encephalitis virus of genotype 4 (JE-4.EDIII) <400> 56 gcgcgccagg gtccctggag ggaggtggcg ggtctgctct gaaaggcaca acctatggaa 60 tgtgcacaga aaagttctcg tttgcaaaga atccagcaga cactggtcat ggaacagttg 120 tcattgaact cctgtattct ggaagtgacg gcccctgtaa catcccaatt gtctcagtgg 180 tcagtctaaa cgacatgact ccagttggaa ggttggtgac agtgaacccc ttcgttgcca 240 catccagttc caattcaaag gtcttagttg agatggaacc tccttttgga gactcctaca 300 ttgtggtcgg gagaggagaa aaacaaatca accaccactg gcacaaacct ggaagcacat 360 tgggcaaagg aggtggccat caccatcacc atcactgatg accggt 406 <210> 57 <211> 406 <212> DNA <213> artificial <220> <223> DNA sequence encoding Domain III of envelope E protein from Japanese encephalitis virus of genotype 5 (JE-5.EDIII) <400> 57 gcgcgccagg gtccctggag ggaggtggcg ggtctgcgtt gaaagggacc acctatggta 60 tgtgcacaga gaagttctct ttttccaaga atccagctga cactggtcat ggtacggttg 120 tcatagaatt gcagtacacc ggcactgacg gaccttgcaa gatacccatc tcttcggtgg 180 ccagtctgaa tgatttaact ccagttggta gattggtgac agtcaatcct tttgttgcca 240 catccaccgc caattcgaag gttttggtag aattggaacc accatttgga gattcattca 300 ttgttgtcgg aagaggagat aagcagatca atcaccattg gcacaaggct ggcagttcac 360 tgggaaaggg aggtggccat caccatcacc atcactgatg accggt 406 <210> 58 <211> 394 <212> DNA <213> artificial <220> <223> DNA sequence of Domain III encoding envelope E protein from Rabensburg virus (RabV.EDIII) <400> 58 gcgcgccagg aggtggcggg tctcagctca aaggaacgac ctatggagta tgcgcaaaag 60 ccttcaagtt ttctgggaat ccagctgaca cagggcatgg caccgtggtc ttagagttgc 120 aatacaccgg aaccgatggt ccttgtaagg tgcctgtctc ttccgtggct tcactcaacg 180 acctaactcc cgttgggaga ctggtgacag tgaatccctt tgttgctgca gctactgcta 240 attcaaaggt tctgatagaa ctggaacctc cattcggtga ctcatacatt gtggtaggta 300 gaggagaaca ccagataaac caccattggc acaagtctgg aagcagtatt ggaaagggag 360 gtggccatca ccatcaccat cactgatgac cggt 394 <210> 59 <211> 1020 <212> DNA <213> artificial <220> <223> DNA Sequence encoding the fusion protein BiPlike -SNAPlike-EDIII from Japanese encephalitis virus genotype 2 cloned into pMT/BiP/SNAP for expression in S2 cells <400> 59 atgaaactat gtattctact tgcagttgtt gcgttcgtag gattgtcctt aagatctgac 60 aaagactgcg aaatgaaaag aactacattg gattcaccac ttgggaagtt ggaactgagt 120 ggatgcgagc aaggattgca tgaaattaag ctactgggaa aaggaacttc tgctgctgat 180 gcagttgaag ttccagcacc agcagctgtt cttggaggtc ctgagcccct catgcaagcc 240 acagcctggc ttaacgcata tttccaccag cctgaggcca ttgaggaatt tccagtcccc 300 gcccttcacc atcctgtgtt tcagcaggag agcttcaccc gccaggtcct gtggaaattg 360 ctgaaggtgg tcaagtttgg tgaagtgatt tcatatcagc aacttgctgc attggccggt 420 aaccccgcag ctacagctgc cgtgaaaact gctctcagcg gaaatcctgt gcccatcctg 480 atcccttgtc acagagtcgt ttcatcttcc ggagctgtag gtggctatga aggaggactg 540 gcagttaagg agtggctgct ggctcatgaa ggtcatagac ttggaaagcc tgggctgggt 600 cctgctggta taggcgcgcc agggtccctg gagggaggtg gcgggtctgc tctgaaaggc 660 acaacctatg gtatgtgcac agaaaactcc tcgttccgaa aaaatccagc ggacacaggc 720 catggaacag ttgtcattga gctcacatac tctgggagtg atggtccctg taagattcca 780 aatgtctccg ttgcgagcct gaatgacatg acccctgtag ggaggctggt aacagtaaac 840 ccctttgtcg cgacatccag cgccaactca aaagtgctgg ttgaaatgga accccctttt 900 ggagattctt acatcgtggt cggaagaggt gacaagcaga tcaatcatca ctggcacaaa 960 gctggaagca cgctgggcaa aggaggtggc catcaccatc accatcactg atgaccggtt 1020 <210> 60 <211> 319 <212> PRT <213> artificial <220> <223> Amino acid Sequence of the fusion protein SNAPlike-EDIII from Japanese encephalitis virus genotype 2 - Histag <400> 60 Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro 1 5 10 15 Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile 20 25 30 Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro 35 40 45 Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr 50 55 60 Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe 65 70 75 80 Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr 85 90 95 Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val 100 105 110 Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr 115 120 125 Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile 130 135 140 Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu 145 150 155 160 Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg 165 170 175 Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser 180 185 190 Leu Glu Gly Gly Gly Gly Ser Ala Leu Lys Gly Thr Thr Tyr Gly Met 195 200 205 Cys Thr Glu Asn Ser Ser Phe Arg Lys Asn Pro Ala Asp Thr Gly His 210 215 220 Gly Thr Val Val Ile Glu Leu Thr Tyr Ser Gly Ser Asp Gly Pro Cys 225 230 235 240 Lys Ile Pro Asn Val Ser Val Ala Ser Leu Asn Asp Met Thr Pro Val 245 250 255 Gly Arg Leu Val Thr Val Asn Pro Phe Val Ala Thr Ser Ser Ala Asn 260 265 270 Ser Lys Val Leu Val Glu Met Glu Pro Pro Phe Gly Asp Ser Tyr Ile 275 280 285 Val Val Gly Arg Gly Asp Lys Gln Ile Asn His His Trp His Lys Ala 290 295 300 Gly Ser Thr Leu Gly Lys Gly Gly Gly His His His His His His 305 310 315 <210> 61 <211> 1020 <212> DNA <213> artificial <220> <223> DNA Sequence encoding the fusion protein BiPlike -SNAPlike-EDIII from Japanese encephalitis virus genotype 4 cloned into pMT/BiP/SNAP for expression in S2 cells <400> 61 atgaaactat gtattctact tgcagttgtt gcgttcgtag gattgtcctt aagatctgac 60 aaagactgcg aaatgaaaag aactacattg gattcaccac ttgggaagtt ggaactgagt 120 ggatgcgagc aaggattgca tgaaattaag ctactgggaa aaggaacttc tgctgctgat 180 gcagttgaag ttccagcacc agcagctgtt cttggaggtc ctgagcccct catgcaagcc 240 acagcctggc ttaacgcata tttccaccag cctgaggcca ttgaggaatt tccagtcccc 300 gcccttcacc atcctgtgtt tcagcaggag agcttcaccc gccaggtcct gtggaaattg 360 ctgaaggtgg tcaagtttgg tgaagtgatt tcatatcagc aacttgctgc attggccggt 420 aaccccgcag ctacagctgc cgtgaaaact gctctcagcg gaaatcctgt gcccatcctg 480 atcccttgtc acagagtcgt ttcatcttcc ggagctgtag gtggctatga aggaggactg 540 gcagttaagg agtggctgct ggctcatgaa ggtcatagac ttggaaagcc tgggctgggt 600 cctgctggta taggcgcgcc agggtccctg gagggaggtg gcgggtctgc tctgaaaggc 660 acaacctatg gaatgtgcac agaaaagttc tcgtttgcaa agaatccagc agacactggt 720 catggaacag ttgtcattga actcctgtat tctggaagtg acggcccctg taacatccca 780 attgtctcag tggtcagtct aaacgacatg actccagttg gaaggttggt gacagtgaac 840 cccttcgttg ccacatccag ttccaattca aaggtcttag ttgagatgga acctcctttt 900 ggagactcct acattgtggt cgggagagga gaaaaacaaa tcaaccacca ctggcacaaa 960 cctggaagca cattgggcaa aggaggtggc catcaccatc accatcactg atgaccggtt 1020 <210> 62 <211> 319 <212> PRT <213> artificial <220> <223> Amino acid Sequence of the fusion protein SNAPlike-EDIII from Japanese encephalitis virus genotype 4 - Histag <400> 62 Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro 1 5 10 15 Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile 20 25 30 Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro 35 40 45 Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr 50 55 60 Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe 65 70 75 80 Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr 85 90 95 Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val 100 105 110 Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr 115 120 125 Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile 130 135 140 Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu 145 150 155 160 Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg 165 170 175 Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser 180 185 190 Leu Glu Gly Gly Gly Gly Ser Ala Leu Lys Gly Thr Thr Tyr Gly Met 195 200 205 Cys Thr Glu Lys Phe Ser Phe Ala Lys Asn Pro Ala Asp Thr Gly His 210 215 220 Gly Thr Val Val Ile Glu Leu Leu Tyr Ser Gly Ser Asp Gly Pro Cys 225 230 235 240 Asn Ile Pro Ile Val Ser Val Val Ser Leu Asn Asp Met Thr Pro Val 245 250 255 Gly Arg Leu Val Thr Val Asn Pro Phe Val Ala Thr Ser Ser Ser Asn 260 265 270 Ser Lys Val Leu Val Glu Met Glu Pro Pro Phe Gly Asp Ser Tyr Ile 275 280 285 Val Val Gly Arg Gly Glu Lys Gln Ile Asn His His Trp His Lys Pro 290 295 300 Gly Ser Thr Leu Gly Lys Gly Gly Gly His His His His His His 305 310 315 <210> 63 <211> 1020 <212> DNA <213> artificial <220> <223> DNA Sequence encoding the fusion protein BiPlike -SNAPlike-EDIII from Japanese encephalitis virus genotype 5 cloned into pMT/BiP/SNAP for expression in S2 cells <400> 63 atgaaactat gtattctact tgcagttgtt gcgttcgtag gattgtcctt aagatctgac 60 aaagactgcg aaatgaaaag aactacattg gattcaccac ttgggaagtt ggaactgagt 120 ggatgcgagc aaggattgca tgaaattaag ctactgggaa aaggaacttc tgctgctgat 180 gcagttgaag ttccagcacc agcagctgtt cttggaggtc ctgagcccct catgcaagcc 240 acagcctggc ttaacgcata tttccaccag cctgaggcca ttgaggaatt tccagtcccc 300 gcccttcacc atcctgtgtt tcagcaggag agcttcaccc gccaggtcct gtggaaattg 360 ctgaaggtgg tcaagtttgg tgaagtgatt tcatatcagc aacttgctgc attggccggt 420 aaccccgcag ctacagctgc cgtgaaaact gctctcagcg gaaatcctgt gcccatcctg 480 atcccttgtc acagagtcgt ttcatcttcc ggagctgtag gtggctatga aggaggactg 540 gcagttaagg agtggctgct ggctcatgaa ggtcatagac ttggaaagcc tgggctgggt 600 cctgctggta taggcgcgcc agggtccctg gagggaggtg gcgggtctgc gttgaaaggg 660 accacctatg gtatgtgcac agagaagttc tctttttcca agaatccagc tgacactggt 720 catggtacgg ttgtcataga attgcagtac accggcactg acggaccttg caagataccc 780 atctcttcgg tggccagtct gaatgattta actccagttg gtagattggt gacagtcaat 840 ccttttgttg ccacatccac cgccaattcg aaggttttgg tagaattgga accaccattt 900 ggagattcat tcattgttgt cggaagagga gataagcaga tcaatcacca ttggcacaag 960 gctggcagtt cactgggaaa gggaggtggc catcaccatc accatcactg atgaccggtt 1020 <210> 64 <211> 319 <212> PRT <213> artificial <220> <223> Amino acid Sequence of the fusion protein SNAPlike-EDIII from Japanese encephalitis virus genotype 5 - Histag <400> 64 Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro 1 5 10 15 Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile 20 25 30 Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro 35 40 45 Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr 50 55 60 Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe 65 70 75 80 Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr 85 90 95 Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val 100 105 110 Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr 115 120 125 Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile 130 135 140 Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu 145 150 155 160 Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg 165 170 175 Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser 180 185 190 Leu Glu Gly Gly Gly Gly Ser Ala Leu Lys Gly Thr Thr Tyr Gly Met 195 200 205 Cys Thr Glu Lys Phe Ser Phe Ser Lys Asn Pro Ala Asp Thr Gly His 210 215 220 Gly Thr Val Val Ile Glu Leu Gln Tyr Thr Gly Thr Asp Gly Pro Cys 225 230 235 240 Lys Ile Pro Ile Ser Ser Val Ala Ser Leu Asn Asp Leu Thr Pro Val 245 250 255 Gly Arg Leu Val Thr Val Asn Pro Phe Val Ala Thr Ser Thr Ala Asn 260 265 270 Ser Lys Val Leu Val Glu Leu Glu Pro Pro Phe Gly Asp Ser Phe Ile 275 280 285 Val Val Gly Arg Gly Asp Lys Gln Ile Asn His His Trp His Lys Ala 290 295 300 Gly Ser Ser Leu Gly Lys Gly Gly Gly His His His His His His 305 310 315 <210> 65 <211> 1008 <212> DNA <213> artificial <220> <223> DNA Sequence encoding the fusion protein BiPlike -SNAPlike-EDIII from Rabensburg virus cloned into pMT/BiP/SNAP for expression in S2 cells <400> 65 atgaaactat gtattctact tgcagttgtt gcgttcgtag gattgtcctt aagatctgac 60 aaagactgcg aaatgaaaag aactacattg gattcaccac ttgggaagtt ggaactgagt 120 ggatgcgagc aaggattgca tgaaattaag ctactgggaa aaggaacttc tgctgctgat 180 gcagttgaag ttccagcacc agcagctgtt cttggaggtc ctgagcccct catgcaagcc 240 acagcctggc ttaacgcata tttccaccag cctgaggcca ttgaggaatt tccagtcccc 300 gcccttcacc atcctgtgtt tcagcaggag agcttcaccc gccaggtcct gtggaaattg 360 ctgaaggtgg tcaagtttgg tgaagtgatt tcatatcagc aacttgctgc attggccggt 420 aaccccgcag ctacagctgc cgtgaaaact gctctcagcg gaaatcctgt gcccatcctg 480 atcccttgtc acagagtcgt ttcatcttcc ggagctgtag gtggctatga aggaggactg 540 gcagttaagg agtggctgct ggctcatgaa ggtcatagac ttggaaagcc tgggctgggt 600 cctgctggta taggcgcgcc aggaggtggc gggtctcagc tcaaaggaac gacctatgga 660 gtatgcgcaa aagccttcaa gttttctggg aatccagctg acacagggca tggcaccgtg 720 gtcttagagt tgcaatacac cggaaccgat ggtccttgta aggtgcctgt ctcttccgtg 780 gcttcactca acgacctaac tcccgttggg agactggtga cagtgaatcc ctttgttgct 840 gcagctactg ctaattcaaa ggttctgata gaactggaac ctccattcgg tgactcatac 900 attgtggtag gtagaggaga acaccagata aaccaccatt ggcacaagtc tggaagcagt 960 attggaaagg gaggtggcca tcaccatcac catcactgat gaccggtt 1008 <210> 66 <211> 314 <212> PRT <213> artificial <220> <223> Amino acid Sequence of the fusion protein SNAPlike-EDIII from Rabensburg virus - Histag <400> 66 Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro 1 5 10 15 Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile 20 25 30 Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro 35 40 45 Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr 50 55 60 Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe 65 70 75 80 Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr 85 90 95 Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val 100 105 110 Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr 115 120 125 Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile 130 135 140 Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu 145 150 155 160 Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg 165 170 175 Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Gly 180 185 190 Gly Gly Ser Gln Leu Lys Gly Thr Thr Tyr Gly Val Cys Ala Lys Ala 195 200 205 Phe Lys Phe Ser Gly Asn Pro Ala Asp Thr Gly His Gly Thr Val Val 210 215 220 Leu Glu Leu Gln Tyr Thr Gly Thr Asp Gly Pro Cys Lys Val Pro Val 225 230 235 240 Ser Ser Val Ala Ser Leu Asn Asp Leu Thr Pro Val Gly Arg Leu Val 245 250 255 Thr Val Asn Pro Phe Val Ala Ala Ala Thr Ala Asn Ser Lys Val Leu 260 265 270 Ile Glu Leu Glu Pro Pro Phe Gly Asp Ser Tyr Ile Val Val Gly Arg 275 280 285 Gly Glu His Gln Ile Asn His His Trp His Lys Ser Gly Ser Ser Ile 290 295 300 Gly Lys Gly Gly Gly His His His His His 305 310 <210> 67 <211> 977 <212> DNA <213> artificial <220> <223> DNA Sequence encoding the fusion protein ssBiP-SNAPlike-EDIII from an insect flavivirus virus cloned into pMT/BiP/SNAP for expression in S2 cells <400> 67 atgaaactat gtattctact tgcagttgtt gcgttcgtag gattgtcctt aagatctgac 60 aaagactgcg aaatgaaaag aactacattg gattcaccac ttgggaagtt ggaactgagt 120 ggatgcgagc aaggattgca tgaaattaag ctactgggaa aaggaacttc tgctgctgat 180 gcagttgaag ttccagcacc agcagctgtt cttggaggtc ctgagcccct catgcaagcc 240 acagcctggc ttaacgcata tttccaccag cctgaggcca ttgaggaatt tccagtcccc 300 gcccttcacc atcctgtgtt tcagcaggag agcttcaccc gccaggtcct gtggaaattg 360 ctgaaggtgg tcaagtttgg tgaagtgatt tcatatcagc aacttgctgc attggccggt 420 aaccccgcag ctacagctgc cgtgaaaact gctctcagcg gaaatcctgt gcccatcctg 480 atcccttgtc acagagtcgt ttcatcttcc ggagctgtag gtggctatga aggaggactg 540 gcagttaagg agtggctgct ggctcatgaa ggtcatagac ttggaaagcc tgggctgggt 600 cctgctggta taggcgcgcc aggaggtggc ggggaagcgc agacagtgtt ctctcaatcc 660 ccttgggggt tcgaaggaat agcggagata acactaaaag aggcccaaaa gagcatttgt 720 tcactacctt tgtcttgtgt gggctgtagc ttgttgtctt ccaaggtcgt tttccttgag 780 acaacaacga aagctgccgt ccacgttgga tgtgggaatg gaacttctgt tctaacagtt 840 ggaactactc ctgtgagtat cgactgtgta gtaacgcccc tgtcgcaggt gtggaggctc 900 gtgtcgcacg tcaccggaag atacaccaaa cttgggtttg gaggtggcca tcaccatcac 960 catcactgat gaccggt 977 <210> 68 <211> 305 <212> PRT <213> artificial <220> <223> Amino acid Sequence of the fusion protein SNAPlike-EDIII from a insect flavivirus - Histag <400> 68 Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro 1 5 10 15 Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile 20 25 30 Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro 35 40 45 Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr 50 55 60 Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe 65 70 75 80 Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr 85 90 95 Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val 100 105 110 Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr 115 120 125 Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile 130 135 140 Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu 145 150 155 160 Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg 165 170 175 Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Gly 180 185 190 Gly Gly Glu Ala Gln Thr Val Phe Ser Gln Ser Pro Trp Gly Phe Glu 195 200 205 Gly Ile Ala Glu Ile Thr Leu Lys Glu Ala Gln Lys Ser Ile Cys Ser 210 215 220 Leu Pro Leu Ser Cys Val Gly Cys Ser Leu Leu Ser Ser Lys Val Val 225 230 235 240 Phe Leu Glu Thr Thr Thr Lys Ala Ala Val His Val Gly Cys Gly Asn 245 250 255 Gly Thr Ser Val Leu Thr Val Gly Thr Thr Pro Val Ser Ile Asp Cys 260 265 270 Val Val Thr Pro Leu Ser Gln Val Trp Arg Leu Val Ser His Val Thr 275 280 285 Gly Arg Tyr Thr Lys Leu Gly Phe Gly Gly Gly His His His His His 290 295 300 His 305 <210> 69 <211> 1783 <212> DNA <213> artificial <220> <223> DNA sequence encoding ssBiP-sE2 from Ross River virus strain QML-1 -SNAPlike-Histag for expression in S2 cells <400> 69 atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60 agtgtaacag agcacttcaa tgtgtataag gctactagac catacctagc acattgcgct 120 gattgcgggg acgggtactt ctgctatagc ccagttgcca tcgagaagat ccgagatgag 180 gcgtctgatg gcatgctcaa gatccaagtc tccgcccaaa taggtctgga caaggcaggc 240 acccacgccc acacgaagct ccgatatatg gctggtcacg atgttcagga atctaagaga 300 gattccttga gggtgtacac gtccgcagcg tgctccatac atgggacgat gggacacttc 360 atcgtcgcac actgtccacc aggcgactac ctcaaggttt cgttcgagga cgcagattcg 420 cacgtgaagg catgtaaggt ccaatacaag cacaatccat tgccggtggg tagagagaag 480 ttcgtggtta gaccacactt tggcgtagag ctgccatgca cctcatacca gctgacaacg 540 gctcccaccg acgaggagat tgacatgcat acaccgccag atataccgga tcgcaccctg 600 ctatcacaga cggcgggcaa cgtcaaaata acagcaggcg gcaggactat caggtacaat 660 tgtacctgcg gccgtgacaa cgtaggcact accagtactg acaagaccat caacacatgc 720 aagattgacc aatgccatgc tgccgtcacc agccatgaca aatggcaatt tacctctcca 780 tttgttccca gggctgatca gacagctagg aaaggcaagg tacacgttcc gttccctctg 840 actaacgtca cctgccgagt gccgttggct cgagcgccgg atgtcaccta tggtaagaag 900 gaggtgaccc tgagattaca cccagatcat ccgacactct tctcctatag gagtttagga 960 gccgaaccgc acccgtacga ggaatgggtt gacaagttct ctgagcgcat catcccagtg 1020 acggaagaag ggattgaata ccagtggggc aacaacccgc cggtccgcct gtgggcgcaa 1080 ctgacgaccg agggcaaacc ccatggatgg ccacatgaaa tcattcagta ctattatgga 1140 ctataccccg ccgccacgcg gccgcacggc ggaggtagca aagactgcga aatgaagcgc 1200 accaccctgg atagccctct gggcaagctg gaactgtctg ggtgcgaaca gggcctgcac 1260 gagatcaagc tgctgggcaa aggaacatct gccgccgacg ccgtggaagt gcctgcccca 1320 gccgccgtgc tgggcggacc agagccactg atgcaggcca ccgcctggct caacgcctac 1380 tttcaccagc ctgaggccat cgaggagttc cctgtgccag ccctgcacca cccagtgttc 1440 cagcaggaga gctttacccg ccaggtgctg tggaaactgc tgaaagtggt gaagttcgga 1500 gaggtcatca gctaccagca gctggccgcc ctggccggca atcccgccgc caccgccgcc 1560 gtgaaaaccg ccctgagcgg aaatcccgtg cccattctga tcccctgcca ccgggtggtg 1620 tctagctctg gcgccgtggg gggctacgag ggcgggctcg ccgtgaaaga gtggctgctg 1680 gcccacgagg gccacagact gggcaagcct gggctgggtc ctgcaggtat aggcgcgcca 1740 gggtccctgg agcatcatca tcatcatcat tgatgacggg ccc 1783 <210> 70 <211> 572 <212> PRT <213> artificial <220> <223> Amino acid sequence of the fusion protein [sE2 from Ross River virus strain QML-1 -SNAPlike-Histag] <400> 70 Arg Ser Ser Val Thr Glu His Phe Asn Val Tyr Lys Ala Thr Arg Pro 1 5 10 15 Tyr Leu Ala His Cys Ala Asp Cys Gly Asp Gly Tyr Phe Cys Tyr Ser 20 25 30 Pro Val Ala Ile Glu Lys Ile Arg Asp Glu Ala Ser Asp Gly Met Leu 35 40 45 Lys Ile Gln Val Ser Ala Gln Ile Gly Leu Asp Lys Ala Gly Thr His 50 55 60 Ala His Thr Lys Leu Arg Tyr Met Ala Gly His Asp Val Gln Glu Ser 65 70 75 80 Lys Arg Asp Ser Leu Arg Val Tyr Thr Ser Ala Ala Cys Ser Ile His 85 90 95 Gly Thr Met Gly His Phe Ile Val Ala His Cys Pro Pro Gly Asp Tyr 100 105 110 Leu Lys Val Ser Phe Glu Asp Ala Asp Ser His Val Lys Ala Cys Lys 115 120 125 Val Gln Tyr Lys His Asn Pro Leu Pro Val Gly Arg Glu Lys Phe Val 130 135 140 Val Arg Pro His Phe Gly Val Glu Leu Pro Cys Thr Ser Tyr Gln Leu 145 150 155 160 Thr Thr Ala Pro Thr Asp Glu Glu Ile Asp Met His Thr Pro Pro Asp 165 170 175 Ile Pro Asp Arg Thr Leu Leu Ser Gln Thr Ala Gly Asn Val Lys Ile 180 185 190 Thr Ala Gly Gly Arg Thr Ile Arg Tyr Asn Cys Thr Cys Gly Arg Asp 195 200 205 Asn Val Gly Thr Thr Ser Thr Asp Lys Thr Ile Asn Thr Cys Lys Ile 210 215 220 Asp Gln Cys His Ala Ala Val Thr Ser His Asp Lys Trp Gln Phe Thr 225 230 235 240 Ser Pro Phe Val Pro Arg Ala Asp Gln Thr Ala Arg Lys Gly Lys Val 245 250 255 His Val Pro Phe Pro Leu Thr Asn Val Thr Cys Arg Val Pro Leu Ala 260 265 270 Arg Ala Pro Asp Val Thr Tyr Gly Lys Lys Glu Val Thr Leu Arg Leu 275 280 285 His Pro Asp His Pro Thr Leu Phe Ser Tyr Arg Ser Leu Gly Ala Glu 290 295 300 Pro His Pro Tyr Glu Glu Trp Val Asp Lys Phe Ser Glu Arg Ile Ile 305 310 315 320 Pro Val Thr Glu Glu Gly Ile Glu Tyr Gln Trp Gly Asn Asn Pro Pro 325 330 335 Val Arg Leu Trp Ala Gln Leu Thr Thr Glu Gly Lys Pro His Gly Trp 340 345 350 Pro His Glu Ile Ile Gln Tyr Tyr Tyr Gly Leu Tyr Pro Ala Ala Thr 355 360 365 Arg Pro His Gly Gly Gly Ser Lys Asp Cys Glu Met Lys Arg Thr Thr 370 375 380 Leu Asp Ser Pro Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly 385 390 395 400 Leu His Glu Ile Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala 405 410 415 Val Glu Val Pro Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu 420 425 430 Met Gln Ala Thr Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala 435 440 445 Ile Glu Glu Phe Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln 450 455 460 Glu Ser Phe Thr Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys 465 470 475 480 Phe Gly Glu Val Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn 485 490 495 Pro Ala Ala Thr Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val 500 505 510 Pro Ile Leu Ile Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val 515 520 525 Gly Gly Tyr Glu Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His 530 535 540 Glu Gly His Arg Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly 545 550 555 560 Ala Pro Gly Ser Leu Glu His His His His His His 565 570 <210> 71 <211> 1783 <212> DNA <213> artificial <220> <223> DNA sequence encoding ssBiP-sE2 from Mayaro virus strain IQD2668 -SNAPlike-Histag for expression in S2 cells <400> 71 atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60 agtgtaacag agcacttcaa tgtgtataag gctactagac catacctagc acattgcgct 120 gattgcgggg acgggtactt ctgctatagc ccagttgcca tcgagaagat ccgagatgag 180 gcgtctgatg gcatgctcaa gatccaagtc tccgcccaaa taggtctgga caaggcaggc 240 acccacgccc acacgaagct ccgatatatg gctggtcacg atgttcagga atctaagaga 300 gattccttga gggtgtacac gtccgcagcg tgctccatac atgggacgat gggacacttc 360 atcgtcgcac actgtccacc aggcgactac ctcaaggttt cgttcgagga cgcagattcg 420 cacgtgaagg catgtaaggt ccaatacaag cacaatccat tgccggtggg tagagagaag 480 ttcgtggtta gaccacactt tggcgtagag ctgccatgca cctcatacca gctgacaacg 540 gctcccaccg acgaggagat tgacatgcat acaccgccag atataccgga tcgcaccctg 600 ctatcacaga cggcgggcaa cgtcaaaata acagcaggcg gcaggactat caggtacaat 660 tgtacctgcg gccgtgacaa cgtaggcact accagtactg acaagaccat caacacatgc 720 aagattgacc aatgccatgc tgccgtcacc agccatgaca aatggcaatt tacctctcca 780 tttgttccca gggctgatca gacagctagg aaaggcaagg tacacgttcc gttccctctg 840 actaacgtca cctgccgagt gccgttggct cgagcgccgg atgtcaccta tggtaagaag 900 gaggtgaccc tgagattaca cccagatcat ccgacactct tctcctatag gagtttagga 960 gccgaaccgc acccgtacga ggaatgggtt gacaagttct ctgagcgcat catcccagtg 1020 acggaagaag ggattgaata ccagtggggc aacaacccgc cggtccgcct gtgggcgcaa 1080 ctgacgaccg agggcaaacc ccatggatgg ccacatgaaa tcattcagta ctattatgga 1140 ctataccccg ccgccacgcg gccgcacggc ggaggtagca aagactgcga aatgaagcgc 1200 accaccctgg atagccctct gggcaagctg gaactgtctg ggtgcgaaca gggcctgcac 1260 gagatcaagc tgctgggcaa aggaacatct gccgccgacg ccgtggaagt gcctgcccca 1320 gccgccgtgc tgggcggacc agagccactg atgcaggcca ccgcctggct caacgcctac 1380 tttcaccagc ctgaggccat cgaggagttc cctgtgccag ccctgcacca cccagtgttc 1440 cagcaggaga gctttacccg ccaggtgctg tggaaactgc tgaaagtggt gaagttcgga 1500 gaggtcatca gctaccagca gctggccgcc ctggccggca atcccgccgc caccgccgcc 1560 gtgaaaaccg ccctgagcgg aaatcccgtg cccattctga tcccctgcca ccgggtggtg 1620 tctagctctg gcgccgtggg gggctacgag ggcgggctcg ccgtgaaaga gtggctgctg 1680 gcccacgagg gccacagact gggcaagcct gggctgggtc ctgcaggtat aggcgcgcca 1740 gggtccctgg agcatcatca tcatcatcat tgatgacggg ccc 1783 <210> 72 <211> 572 <212> PRT <213> artificial <220> <223> Amino acid sequence of the fusion protein [sE2 from Mayaro virus strain IQD2668 -SNAPlike-Histag] <400> 72 Arg Ser Ser Val Thr Glu His Phe Asn Val Tyr Lys Ala Thr Arg Pro 1 5 10 15 Tyr Leu Ala His Cys Ala Asp Cys Gly Asp Gly Tyr Phe Cys Tyr Ser 20 25 30 Pro Val Ala Ile Glu Lys Ile Arg Asp Glu Ala Ser Asp Gly Met Leu 35 40 45 Lys Ile Gln Val Ser Ala Gln Ile Gly Leu Asp Lys Ala Gly Thr His 50 55 60 Ala His Thr Lys Leu Arg Tyr Met Ala Gly His Asp Val Gln Glu Ser 65 70 75 80 Lys Arg Asp Ser Leu Arg Val Tyr Thr Ser Ala Ala Cys Ser Ile His 85 90 95 Gly Thr Met Gly His Phe Ile Val Ala His Cys Pro Pro Gly Asp Tyr 100 105 110 Leu Lys Val Ser Phe Glu Asp Ala Asp Ser His Val Lys Ala Cys Lys 115 120 125 Val Gln Tyr Lys His Asn Pro Leu Pro Val Gly Arg Glu Lys Phe Val 130 135 140 Val Arg Pro His Phe Gly Val Glu Leu Pro Cys Thr Ser Tyr Gln Leu 145 150 155 160 Thr Thr Ala Pro Thr Asp Glu Glu Ile Asp Met His Thr Pro Pro Asp 165 170 175 Ile Pro Asp Arg Thr Leu Leu Ser Gln Thr Ala Gly Asn Val Lys Ile 180 185 190 Thr Ala Gly Gly Arg Thr Ile Arg Tyr Asn Cys Thr Cys Gly Arg Asp 195 200 205 Asn Val Gly Thr Thr Ser Thr Asp Lys Thr Ile Asn Thr Cys Lys Ile 210 215 220 Asp Gln Cys His Ala Ala Val Thr Ser His Asp Lys Trp Gln Phe Thr 225 230 235 240 Ser Pro Phe Val Pro Arg Ala Asp Gln Thr Ala Arg Lys Gly Lys Val 245 250 255 His Val Pro Phe Pro Leu Thr Asn Val Thr Cys Arg Val Pro Leu Ala 260 265 270 Arg Ala Pro Asp Val Thr Tyr Gly Lys Lys Glu Val Thr Leu Arg Leu 275 280 285 His Pro Asp His Pro Thr Leu Phe Ser Tyr Arg Ser Leu Gly Ala Glu 290 295 300 Pro His Pro Tyr Glu Glu Trp Val Asp Lys Phe Ser Glu Arg Ile Ile 305 310 315 320 Pro Val Thr Glu Glu Gly Ile Glu Tyr Gln Trp Gly Asn Asn Pro Pro 325 330 335 Val Arg Leu Trp Ala Gln Leu Thr Thr Glu Gly Lys Pro His Gly Trp 340 345 350 Pro His Glu Ile Ile Gln Tyr Tyr Tyr Gly Leu Tyr Pro Ala Ala Thr 355 360 365 Arg Pro His Gly Gly Gly Ser Lys Asp Cys Glu Met Lys Arg Thr Thr 370 375 380 Leu Asp Ser Pro Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly 385 390 395 400 Leu His Glu Ile Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala 405 410 415 Val Glu Val Pro Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu 420 425 430 Met Gln Ala Thr Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala 435 440 445 Ile Glu Glu Phe Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln 450 455 460 Glu Ser Phe Thr Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys 465 470 475 480 Phe Gly Glu Val Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn 485 490 495 Pro Ala Ala Thr Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val 500 505 510 Pro Ile Leu Ile Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val 515 520 525 Gly Gly Tyr Glu Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His 530 535 540 Glu Gly His Arg Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly 545 550 555 560 Ala Pro Gly Ser Leu Glu His His His His His His 565 570 <210> 73 <211> 1786 <212> DNA <213> artificial <220> <223> DNA sequence encoding ssBiP-sE2 from Western Equine Encephalitis virus -SNAPlike-Histag for expression in S2 cells <400> 73 atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60 agcattaccg atgacttcac actgaccagt ccctacctgg ggttctgccc gtattgcaga 120 cactcaacgc cgtgtttcag cccaataaaa attgagaacg tgtgggacga atctgatgat 180 ggatcgatta gaatccaggt ctcggcacaa ttcggctaca atcaggcagg cactgcggat 240 gtcaccaaat tccgttacat gtctttcgac cacgaccatg acatcaagga agacagtatg 300 gagaaaatag ctatcagcac atctggaccc tgccgtcgtc ttggccacaa agggtacttc 360 ctgttagctc aatgtcctcc aggtgacagt gtaaccgtca gtatcacgag cggagcatct 420 gagaattcat gcaccgtgga gaaaaagatc aggaggaagt ttgtcggtag agaggagtac 480 ttgttcccac ccgtccatgg aaagctggta aagtgccacg tttacgatca cttgaaggag 540 acgtctgccg ggtacataac catgcacagg ccaggcccac acgcgtataa gtcctatctg 600 gaggaagcgt caggcgaagt gtacattaaa ccaccttctg gcaagaacgt cacctacgaa 660 tgtaagtgtg gcgactacag cacaggtatc gtgagcacgc gaacgaagat gaacggctgc 720 actaaagcaa aacagtgcat tgcctacaag agcgaccaaa cgaaatgggt cttcaactcg 780 ccggatctta ttaggcacac agaccactca gtgcaaggta aattgcacat tccattccgc 840 ttgacaccga cagtctgccc ggttccgtta gctcacacgc ctacagtcac gaagtggttc 900 aaaggcatca ccctccacct gactgcaatg cgaccaacat tgctgacaac gagaaaattg 960 gggctgcgag cagacgcaac agcagaatgg attacagggt ctacatccag gaatttttct 1020 gtggggcgag aagggctgga gtacgtatgg ggtaaccatg aaccagtcag agtctgggcc 1080 caggagtcgg caccaggcga cccacatgga tggccgcatg agatcatcat ccactattat 1140 catcggcatc cagtctacac gcggccgcac ggcggaggta gcaaagactg cgaaatgaag 1200 cgcaccaccc tggatagccc tctgggcaag ctggaactgt ctgggtgcga acagggcctg 1260 cacgagatca agctgctggg caaaggaaca tctgccgccg acgccgtgga agtgcctgcc 1320 ccagccgccg tgctgggcgg accagagcca ctgatgcagg ccaccgcctg gctcaacgcc 1380 tactttcacc agcctgaggc catcgaggag ttccctgtgc cagccctgca ccacccagtg 1440 ttccagcagg agagctttac ccgccaggtg ctgtggaaac tgctgaaagt ggtgaagttc 1500 ggagaggtca tcagctacca gcagctggcc gccctggccg gcaatcccgc cgccaccgcc 1560 gccgtgaaaa ccgccctgag cggaaatccc gtgcccattc tgatcccctg ccaccgggtg 1620 gtgtctagct ctggcgccgt ggggggctac gagggcgggc tcgccgtgaa agagtggctg 1680 ctggcccacg agggccacag actgggcaag cctgggctgg gtcctgcagg tataggcgcg 1740 ccagggtccc tggagcatca tcatcatcat cattgatgac gggccc 1786 <210> 74 <211> 573 <212> PRT <213> artificial <220> <223> Amino acid sequence of the fusion protein [sE2 from Western Equine Encephalitis -SNAPlike-Histag] <400> 74 Arg Ser Ser Ile Thr Asp Asp Phe Thr Leu Thr Ser Pro Tyr Leu Gly 1 5 10 15 Phe Cys Pro Tyr Cys Arg His Ser Thr Pro Cys Phe Ser Pro Ile Lys 20 25 30 Ile Glu Asn Val Trp Asp Glu Ser Asp Asp Gly Ser Ile Arg Ile Gln 35 40 45 Val Ser Ala Gln Phe Gly Tyr Asn Gln Ala Gly Thr Ala Asp Val Thr 50 55 60 Lys Phe Arg Tyr Met Ser Phe Asp His Asp His Asp Ile Lys Glu Asp 65 70 75 80 Ser Met Glu Lys Ile Ala Ile Ser Thr Ser Gly Pro Cys Arg Arg Leu 85 90 95 Gly His Lys Gly Tyr Phe Leu Leu Ala Gln Cys Pro Pro Gly Asp Ser 100 105 110 Val Thr Val Ser Ile Thr Ser Gly Ala Ser Glu Asn Ser Cys Thr Val 115 120 125 Glu Lys Lys Ile Arg Arg Lys Phe Val Gly Arg Glu Glu Tyr Leu Phe 130 135 140 Pro Pro Val His Gly Lys Leu Val Lys Cys His Val Tyr Asp His Leu 145 150 155 160 Lys Glu Thr Ser Ala Gly Tyr Ile Thr Met His Arg Pro Gly Pro His 165 170 175 Ala Tyr Lys Ser Tyr Leu Glu Glu Ala Ser Gly Glu Val Tyr Ile Lys 180 185 190 Pro Pro Ser Gly Lys Asn Val Thr Tyr Glu Cys Lys Cys Gly Asp Tyr 195 200 205 Ser Thr Gly Ile Val Ser Thr Arg Thr Lys Met Asn Gly Cys Thr Lys 210 215 220 Ala Lys Gln Cys Ile Ala Tyr Lys Ser Asp Gln Thr Lys Trp Val Phe 225 230 235 240 Asn Ser Pro Asp Leu Ile Arg His Thr Asp His Ser Val Gln Gly Lys 245 250 255 Leu His Ile Pro Phe Arg Leu Thr Pro Thr Val Cys Pro Val Pro Leu 260 265 270 Ala His Thr Pro Thr Val Thr Lys Trp Phe Lys Gly Ile Thr Leu His 275 280 285 Leu Thr Ala Met Arg Pro Thr Leu Leu Thr Thr Arg Lys Leu Gly Leu 290 295 300 Arg Ala Asp Ala Thr Ala Glu Trp Ile Thr Gly Ser Thr Ser Arg Asn 305 310 315 320 Phe Ser Val Gly Arg Glu Gly Leu Glu Tyr Val Trp Gly Asn His Glu 325 330 335 Pro Val Arg Val Trp Ala Gln Glu Ser Ala Pro Gly Asp Pro His Gly 340 345 350 Trp Pro His Glu Ile Ile Ile His Tyr Tyr His Arg His Pro Val Tyr 355 360 365 Thr Arg Pro His Gly Gly Gly Ser Lys Asp Cys Glu Met Lys Arg Thr 370 375 380 Thr Leu Asp Ser Pro Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln 385 390 395 400 Gly Leu His Glu Ile Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp 405 410 415 Ala Val Glu Val Pro Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro 420 425 430 Leu Met Gln Ala Thr Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu 435 440 445 Ala Ile Glu Glu Phe Pro Val Pro Ala Leu His His Pro Val Phe Gln 450 455 460 Gln Glu Ser Phe Thr Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val 465 470 475 480 Lys Phe Gly Glu Val Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly 485 490 495 Asn Pro Ala Ala Thr Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro 500 505 510 Val Pro Ile Leu Ile Pro Cys His Arg Val Val Ser Ser Ser Gly Ala 515 520 525 Val Gly Gly Tyr Glu Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala 530 535 540 His Glu Gly His Arg Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile 545 550 555 560 Gly Ala Pro Gly Ser Leu Glu His His His His His His 565 570 <210> 75 <211> 1786 <212> DNA <213> artificial <220> <223> DNA sequence encoding ssBiP-sE2 from Eastern Equine Encephalitis virus -SNAPlike-Histag for expression in S2 cells <400> 75 atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60 gatttggaca ctcatttcac ccagtataag ttggcacgcc cgtatattgc tgattgccct 120 aactgtgggc atagtcggtg cgacagccct atagctatag aagaagtcag aggggatgcg 180 cacgcaggag tcatccgcat ccagacatca gctatgttcg gtctgaagac ggatggagtc 240 gatttggcct acatgagttt catgaacggc aaaacgcaga aatcaataaa gatcgacaac 300 ctgcatgtgc gcacctcagc cccttgttcc ctcgtgtcgc accacggcta ttacatcctg 360 gctcaatgcc caccagggga cacggttaca gttgggtttc acgacgggcc taaccgccat 420 acgtgcacag ttgcccataa ggtagaattc aggccagtgg gtagagagaa ataccgtcac 480 ccacctgaac atggagttga attaccgtgt aaccgttaca ctcacaagcg tgcagaccaa 540 ggacactatg ttgagatgca tcaacccggg ctagttgccg accactctct ccttagcatc 600 cacagtgcca aggtgaaaat tacggtaccg agcggcgccc aagtgaaata ctactgcaag 660 tgcccagatg tacgagaggg aattaccagc agcgaccata caaccacctg cacggatgtc 720 aaacaatgca gggcttacct gattgacaac aaaaaatggg tgtacaactc tggaagactg 780 cctcgaggag agggcgacac ttttaaagga aaacttcatg tgccctttgt gcctgttaag 840 gccaagtgca tcgccacgct ggcaccggag cctctagttg agcacaaaca ccgcaccctg 900 attttacacc tgcacccgga ccatccgacc ttgctgacga ccaggtcact tggaagtgat 960 gcaaatccaa ctcgacaatg gattgagcga ccaacaactg tcaatttcac agtcaccgga 1020 gaagggttgg agtatacctg gggaaaccat ccaccaaaaa gagtatgggc tcaagagtca 1080 ggagaaggga atccacatgg atggccgcac gaagtggtag tctattacta caacaggtac 1140 ccgttaacca caattatcgg gcggccgcac ggcggaggta gcaaagactg cgaaatgaag 1200 cgcaccaccc tggatagccc tctgggcaag ctggaactgt ctgggtgcga acagggcctg 1260 cacgagatca agctgctggg caaaggaaca tctgccgccg acgccgtgga agtgcctgcc 1320 ccagccgccg tgctgggcgg accagagcca ctgatgcagg ccaccgcctg gctcaacgcc 1380 tactttcacc agcctgaggc catcgaggag ttccctgtgc cagccctgca ccacccagtg 1440 ttccagcagg agagctttac ccgccaggtg ctgtggaaac tgctgaaagt ggtgaagttc 1500 ggagaggtca tcagctacca gcagctggcc gccctggccg gcaatcccgc cgccaccgcc 1560 gccgtgaaaa ccgccctgag cggaaatccc gtgcccattc tgatcccctg ccaccgggtg 1620 gtgtctagct ctggcgccgt ggggggctac gagggcgggc tcgccgtgaa agagtggctg 1680 ctggcccacg agggccacag actgggcaag cctgggctgg gtcctgcagg tataggcgcg 1740 ccagggtccc tggagcatca tcatcatcat cattgatgac gggccc 1786 <210> 76 <211> 573 <212> PRT <213> artificial <220> <223> Amino acid sequence of the fusion protein [sE2 from Eastern Equine Encephalitis -SNAPlike-Histag] <400> 76 Arg Ser Asp Leu Asp Thr His Phe Thr Gln Tyr Lys Leu Ala Arg Pro 1 5 10 15 Tyr Ile Ala Asp Cys Pro Asn Cys Gly His Ser Arg Cys Asp Ser Pro 20 25 30 Ile Ala Ile Glu Glu Val Arg Gly Asp Ala His Ala Gly Val Ile Arg 35 40 45 Ile Gln Thr Ser Ala Met Phe Gly Leu Lys Thr Asp Gly Val Asp Leu 50 55 60 Ala Tyr Met Ser Phe Met Asn Gly Lys Thr Gln Lys Ser Ile Lys Ile 65 70 75 80 Asp Asn Leu His Val Arg Thr Ser Ala Pro Cys Ser Leu Val Ser His 85 90 95 His Gly Tyr Tyr Ile Leu Ala Gln Cys Pro Pro Gly Asp Thr Val Thr 100 105 110 Val Gly Phe His Asp Gly Pro Asn Arg His Thr Cys Thr Val Ala His 115 120 125 Lys Val Glu Phe Arg Pro Val Gly Arg Glu Lys Tyr Arg His Pro Pro 130 135 140 Glu His Gly Val Glu Leu Pro Cys Asn Arg Tyr Thr His Lys Arg Ala 145 150 155 160 Asp Gln Gly His Tyr Val Glu Met His Gln Pro Gly Leu Val Ala Asp 165 170 175 His Ser Leu Leu Ser Ile His Ser Ala Lys Val Lys Ile Thr Val Pro 180 185 190 Ser Gly Ala Gln Val Lys Tyr Tyr Cys Lys Cys Pro Asp Val Arg Glu 195 200 205 Gly Ile Thr Ser Ser Asp His Thr Thr Thr Cys Thr Asp Val Lys Gln 210 215 220 Cys Arg Ala Tyr Leu Ile Asp Asn Lys Lys Trp Val Tyr Asn Ser Gly 225 230 235 240 Arg Leu Pro Arg Gly Glu Gly Asp Thr Phe Lys Gly Lys Leu His Val 245 250 255 Pro Phe Val Pro Val Lys Ala Lys Cys Ile Ala Thr Leu Ala Pro Glu 260 265 270 Pro Leu Val Glu His Lys His Arg Thr Leu Ile Leu His Leu His Pro 275 280 285 Asp His Pro Thr Leu Leu Thr Thr Arg Ser Leu Gly Ser Asp Ala Asn 290 295 300 Pro Thr Arg Gln Trp Ile Glu Arg Pro Thr Thr Val Asn Phe Thr Val 305 310 315 320 Thr Gly Glu Gly Leu Glu Tyr Thr Trp Gly Asn His Pro Pro Lys Arg 325 330 335 Val Trp Ala Gln Glu Ser Gly Glu Gly Asn Pro His Gly Trp Pro His 340 345 350 Glu Val Val Val Tyr Tyr Tyr Asn Arg Tyr Pro Leu Thr Thr Ile Ile 355 360 365 Gly Arg Pro His Gly Gly Gly Ser Lys Asp Cys Glu Met Lys Arg Thr 370 375 380 Thr Leu Asp Ser Pro Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln 385 390 395 400 Gly Leu His Glu Ile Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp 405 410 415 Ala Val Glu Val Pro Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro 420 425 430 Leu Met Gln Ala Thr Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu 435 440 445 Ala Ile Glu Glu Phe Pro Val Pro Ala Leu His His Pro Val Phe Gln 450 455 460 Gln Glu Ser Phe Thr Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val 465 470 475 480 Lys Phe Gly Glu Val Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly 485 490 495 Asn Pro Ala Ala Thr Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro 500 505 510 Val Pro Ile Leu Ile Pro Cys His Arg Val Val Ser Ser Ser Gly Ala 515 520 525 Val Gly Gly Tyr Glu Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala 530 535 540 His Glu Gly His Arg Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile 545 550 555 560 Gly Ala Pro Gly Ser Leu Glu His His His His His His 565 570 <210> 77 <211> 1792 <212> DNA <213> artificial <220> <223> DNA sequence encoding ssBiP-sE2 from Venezuelan Equine Encephalitis virus -SNAPlike-Histag for expression in S2 cells <400> 77 atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60 agatcttcta ccgaggagct gtttaaggag tataagctaa cgcgccctta catggccaga 120 tgcatcagat gtgccgttgg gagctgccat agtccaatag caattgaggc agtgaagagc 180 gacgggcacg acggctatgt tagacttcag acttcctcgc agtatggcct ggattcctct 240 ggcaacttaa agggaaggac tatgcggtat gatatgcacg ggaccattga agagatacca 300 ctacatcaag tgtcactcca cacatctcgc ccgtgtcaca ttgtggatgg gcatggttat 360 tttctgcttg ctaggtgccc ggcaggggac tccatcacca tggaatttaa gaaaggttca 420 gtcacacact cctgctcagt gccgtatgaa gtgaaattta atcctgtagg cagagaactc 480 tacactcatc caccagaaca cggagcagag caagcgtgcc aagtctacgc gcacgatgca 540 cagaacagag gagcttatgt cgagatgcac ctcccgggct cagaagtgga cagcagtttg 600 atttccttga gcggcagttc agtcaccgtg acacctcctg tcgggactag cgccttggtg 660 aaatgcaagt gcggcggcac aaagatctcc gaaaccatca acaaggcaaa acagttcagc 720 cagtgcacaa agaaggagca gtgcagagca tatcgactgc agaatgacaa gtgggtgtat 780 aattctgaca aactgcccaa agcagcggga gccaccctaa aaggaaaact acacgtcccg 840 ttcttgctgg cagacggcaa atgcaccgtg cctctagcac cggaacctat gataaccttc 900 ggtttccgat cagtgtcact gaaactgcac cctaagaatc ccacatatct gaccactcgc 960 caacttgctg atgagcctca ttacacgcac gagctcatat ctgaaccagc tgttaggaat 1020 tttaccgtca ctgaaaaggg gtgggagttt gtatggggaa accatccgcc gaaaaggttt 1080 tgggcacagg aaacagcacc cggaaatcca catgggctgc cacatgaggt gataactcat 1140 tattaccaca gataccctat gtccacgcgg ccgcacggcg gaggtagcaa agactgcgaa 1200 atgaagcgca ccaccctgga tagccctctg ggcaagctgg aactgtctgg gtgcgaacag 1260 ggcctgcacg agatcaagct gctgggcaaa ggaacatctg ccgccgacgc cgtggaagtg 1320 cctgccccag ccgccgtgct gggcggacca gagccactga tgcaggccac cgcctggctc 1380 aacgcctact ttcaccagcc tgaggccatc gaggagttcc ctgtgccagc cctgcaccac 1440 ccagtgttcc agcaggagag ctttacccgc caggtgctgt ggaaactgct gaaagtggtg 1500 aagttcggag aggtcatcag ctaccagcag ctggccgccc tggccggcaa tcccgccgcc 1560 accgccgccg tgaaaaccgc cctgagcgga aatcccgtgc ccattctgat cccctgccac 1620 cgggtggtgt ctagctctgg cgccgtgggg ggctacgagg gcgggctcgc cgtgaaagag 1680 tggctgctgg cccacgaggg ccacagactg ggcaagcctg ggctgggtcc tgcaggtata 1740 ggcgcgccag ggtccctgga gcatcatcat catcatcatt gatgacgggc cc 1792 <210> 78 <211> 575 <212> PRT <213> artificial <220> <223> Amino acid sequence of the fusion protein [sE2 from Venezuelan Equine Encephalitis -SNAPlike-Histag] <400> 78 Arg Ser Arg Ser Ser Thr Glu Glu Leu Phe Lys Glu Tyr Lys Leu Thr 1 5 10 15 Arg Pro Tyr Met Ala Arg Cys Ile Arg Cys Ala Val Gly Ser Cys His 20 25 30 Ser Pro Ile Ala Ile Glu Ala Val Lys Ser Asp Gly His Asp Gly Tyr 35 40 45 Val Arg Leu Gln Thr Ser Ser Gln Tyr Gly Leu Asp Ser Ser Gly Asn 50 55 60 Leu Lys Gly Arg Thr Met Arg Tyr Asp Met His Gly Thr Ile Glu Glu 65 70 75 80 Ile Pro Leu His Gln Val Ser Leu His Thr Ser Arg Pro Cys His Ile 85 90 95 Val Asp Gly His Gly Tyr Phe Leu Leu Ala Arg Cys Pro Ala Gly Asp 100 105 110 Ser Ile Thr Met Glu Phe Lys Lys Gly Ser Val Thr His Ser Cys Ser 115 120 125 Val Pro Tyr Glu Val Lys Phe Asn Pro Val Gly Arg Glu Leu Tyr Thr 130 135 140 His Pro Pro Glu His Gly Ala Glu Gln Ala Cys Gln Val Tyr Ala His 145 150 155 160 Asp Ala Gln Asn Arg Gly Ala Tyr Val Glu Met His Leu Pro Gly Ser 165 170 175 Glu Val Asp Ser Ser Leu Ile Ser Leu Ser Gly Ser Ser Val Thr Val 180 185 190 Thr Pro Pro Val Gly Thr Ser Ala Leu Val Lys Cys Lys Cys Gly Gly 195 200 205 Thr Lys Ile Ser Glu Thr Ile Asn Lys Ala Lys Gln Phe Ser Gln Cys 210 215 220 Thr Lys Lys Glu Gln Cys Arg Ala Tyr Arg Leu Gln Asn Asp Lys Trp 225 230 235 240 Val Tyr Asn Ser Asp Lys Leu Pro Lys Ala Ala Gly Ala Thr Leu Lys 245 250 255 Gly Lys Leu His Val Pro Phe Leu Leu Ala Asp Gly Lys Cys Thr Val 260 265 270 Pro Leu Ala Pro Glu Pro Met Ile Thr Phe Gly Phe Arg Ser Val Ser 275 280 285 Leu Lys Leu His Pro Lys Asn Pro Thr Tyr Leu Thr Thr Arg Gln Leu 290 295 300 Ala Asp Glu Pro His Tyr Thr His Glu Leu Ile Ser Glu Pro Ala Val 305 310 315 320 Arg Asn Phe Thr Val Thr Glu Lys Gly Trp Glu Phe Val Trp Gly Asn 325 330 335 His Pro Pro Lys Arg Phe Trp Ala Gln Glu Thr Ala Pro Gly Asn Pro 340 345 350 His Gly Leu Pro His Glu Val Ile Thr His Tyr Tyr His Arg Tyr Pro 355 360 365 Met Ser Thr Arg Pro His Gly Gly Gly Ser Lys Asp Cys Glu Met Lys 370 375 380 Arg Thr Thr Leu Asp Ser Pro Leu Gly Lys Leu Glu Leu Ser Gly Cys 385 390 395 400 Glu Gln Gly Leu His Glu Ile Lys Leu Leu Gly Lys Gly Thr Ser Ala 405 410 415 Ala Asp Ala Val Glu Val Pro Ala Pro Ala Ala Val Leu Gly Gly Pro 420 425 430 Glu Pro Leu Met Gln Ala Thr Ala Trp Leu Asn Ala Tyr Phe His Gln 435 440 445 Pro Glu Ala Ile Glu Glu Phe Pro Val Pro Ala Leu His His Pro Val 450 455 460 Phe Gln Gln Glu Ser Phe Thr Arg Gln Val Leu Trp Lys Leu Leu Lys 465 470 475 480 Val Val Lys Phe Gly Glu Val Ile Ser Tyr Gln Gln Leu Ala Ala Leu 485 490 495 Ala Gly Asn Pro Ala Ala Thr Ala Ala Val Lys Thr Ala Leu Ser Gly 500 505 510 Asn Pro Val Pro Ile Leu Ile Pro Cys His Arg Val Val Ser Ser Ser 515 520 525 Gly Ala Val Gly Gly Tyr Glu Gly Gly Leu Ala Val Lys Glu Trp Leu 530 535 540 Leu Ala His Glu Gly His Arg Leu Gly Lys Pro Gly Leu Gly Pro Ala 545 550 555 560 Gly Ile Gly Ala Pro Gly Ser Leu Glu His His His His His His 565 570 575 <210> 79 <211> 1442 <212> DNA <213> artificial <220> <223> DNA sequence encoding ssBiP- SNAPlike-Akabane N protein-proTEV cleavage site-Histag for expression in S2 cells <400> 79 atgaagttat gcatattact ggccgtcgtg gtggcctttg ttggcctctc gctcgggaga 60 tctgacaaag actgcgaaat gaaaagaact acattggatt caccacttgg gaagttggaa 120 ctgagtggat gcgagcaagg attgcatgaa attaagctac tgggaaaagg aacttctgct 180 gctgatgcag ttgaagttcc agcaccagca gctgttcttg gaggtcctga gcccctcatg 240 caagccacag cctggcttaa cgcatatttc caccagcctg aggccattga ggaatttcca 300 gtccccgccc ttcaccatcc tgtgtttcag caggagagct tcacccgcca ggtcctgtgg 360 aaattgctga aggtggtcaa gtttggtgaa gtgatttcat atcagcaact tgctgcattg 420 gccggtaacc ccgcagctac agctgccgtg aaaactgctc tcagcggaaa tcctgtgccc 480 atcctgatcc cttgtcacag agtcgtttca tcttccggag ctgtaggtgg ctatgaagga 540 ggactggcag ttaaggagtg gctgctggct catgaaggtc atagacttgg aaagcctggg 600 ctgggtcctg ctggtatagg cgcgccaggg tccctaggtg gcggatccga aaacctgtac 660 ttccagagcg atatcgcaaa tcaatttatt ttcaacgatg ttccacaacg gaatgcagct 720 acatttaatc cggatgcagg gtatgtggca tttatcagta agtatgggca gcagctcaac 780 tttactgttg ctagagtctt cttcctcaac cagaagaagg ccaagatggt cttacataag 840 acgccacaac caagtgtcga tcttactttt gcaggggtca aatttacagt ggttaataac 900 cattttcccc agtatactgc aaatccggtg tcagacactg cctttacgct ccatcgcatc 960 tcgggctact tagctcgatg ggttgctgag cagtgcaagg ctaatcagat caaacttgca 1020 gaggcagctg ctacaatcgt aatgccgctg gctgaagtga agggctgcac ctggagtgat 1080 gggtacgcaa tgtacctagg ctttgcccct ggtgctgaga tgtttctgga aacctttgag 1140 ttttacccat tggttattga catgcaccgt gtgataaagg atgggatgga tgtcaacttc 1200 atgaggaagg tcttacgcca gagatatggg cagctgactg cagaagaatg gatgacatct 1260 aagttggacg cagtcaaggc tgcatttagc tcagttgccc aaatatcctg ggccaaatct 1320 ggcttctcac ctgcagctag agctttcctg gctcaatttg gtattcagat cccgggagag 1380 aatctatatt ttcaagggcc cggcggaggt agtcaccatc atcaccatca ctaatgaccg 1440 gt 1442 <210> 80 <211> 458 <212> PRT <213> artificial <220> <223> Amino acid sequence of fusion protein [SNAPlike-Akabane N protein-Histag] <400> 80 Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro 1 5 10 15 Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile 20 25 30 Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro 35 40 45 Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr 50 55 60 Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe 65 70 75 80 Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr 85 90 95 Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val 100 105 110 Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr 115 120 125 Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile 130 135 140 Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu 145 150 155 160 Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg 165 170 175 Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser 180 185 190 Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Ala Asn 195 200 205 Gln Phe Ile Phe Asn Asp Val Pro Gln Arg Asn Ala Ala Thr Phe Asn 210 215 220 Pro Asp Ala Gly Tyr Val Ala Phe Ile Ser Lys Tyr Gly Gln Gln Leu 225 230 235 240 Asn Phe Thr Val Ala Arg Val Phe Phe Leu Asn Gln Lys Lys Ala Lys 245 250 255 Met Val Leu His Lys Thr Pro Gln Pro Ser Val Asp Leu Thr Phe Ala 260 265 270 Gly Val Lys Phe Thr Val Val Asn Asn His Phe Pro Gln Tyr Thr Ala 275 280 285 Asn Pro Val Ser Asp Thr Ala Phe Thr Leu His Arg Ile Ser Gly Tyr 290 295 300 Leu Ala Arg Trp Val Ala Glu Gln Cys Lys Ala Asn Gln Ile Lys Leu 305 310 315 320 Ala Glu Ala Ala Ala Thr Ile Val Met Pro Leu Ala Glu Val Lys Gly 325 330 335 Cys Thr Trp Ser Asp Gly Tyr Ala Met Tyr Leu Gly Phe Ala Pro Gly 340 345 350 Ala Glu Met Phe Leu Glu Thr Phe Glu Phe Tyr Pro Leu Val Ile Asp 355 360 365 Met His Arg Val Ile Lys Asp Gly Met Asp Val Asn Phe Met Arg Lys 370 375 380 Val Leu Arg Gln Arg Tyr Gly Gln Leu Thr Ala Glu Glu Trp Met Thr 385 390 395 400 Ser Lys Leu Asp Ala Val Lys Ala Ala Phe Ser Ser Val Ala Gln Ile 405 410 415 Ser Trp Ala Lys Ser Gly Phe Ser Pro Ala Ala Arg Ala Phe Leu Ala 420 425 430 Gln Phe Gly Ile Gln Ile Pro Gly Glu Asn Leu Tyr Phe Gln Gly Pro 435 440 445 Gly Gly Gly Ser His His His His His His 450 455 <210> 81 <211> 1451 <212> DNA <213> artificial <220> <223> DNA sequence encoding ssBiP- SNAPlike-Aino N protein-proTEV cleavage site-Histag for expression in S2 cells <400> 81 atgaagttat gcatattact ggccgtcgtg gtggcctttg ttggcctctc gctcgggaga 60 tctagatctg acaaagactg cgaaatgaaa agaactacat tggattcacc acttgggaag 120 ttggaactga gtggatgcga gcaaggattg catgaaatta agctactggg aaaaggaact 180 tctgctgctg atgcagttga agttccagca ccagcagctg ttcttggagg tcctgagccc 240 ctcatgcaag ccacagcctg gcttaacgca tatttccacc agcctgaggc cattgaggaa 300 tttccagtcc ccgcccttca ccatcctgtg tttcagcagg agagcttcac ccgccaggtc 360 ctgtggaaat tgctgaaggt ggtcaagttt ggtgaagtga tttcatatca gcaacttgct 420 gcattggccg gtaaccccgc agctacagct gccgtgaaaa ctgctctcag cggaaatcct 480 gtgcccatcc tgatcccttg tcacagagtc gtttcatctt ccggagctgt aggtggctat 540 gaaggaggac tggcagttaa ggagtggctg ctggctcatg aaggtcatag acttggaaag 600 cctgggctgg gtcctgctgg tataggcgcg ccagggtccc taggtggcgg atccgaaaac 660 ctgtacttcc agagcgatat cgcaaaccaa tttattttcc aagatgttcc tcaacggaat 720 ctcgctacat ttaacccgga ggtcgggtat gtggcattta ttgctaaaca tgggtcccaa 780 ctcaatttcg ataccgttag agtcttcttc ctcaatcaga agaaggccaa gatggtgctc 840 agtaagacgg cacaaccaag tgttgatctt acatttggtg gcatcaaatt tacactggtt 900 aataaccatt ttccccaata cacagcaaat cctgtgccag acactgccct cactctccac 960 cgtctctcag gttatctagc aaaatgggtt gcagaccaat gcaaaacaaa tcagattaaa 1020 ctggctgagg ccatggaaaa aattgtcatg ccacttgctg aagtgaaagg ttgcacctgg 1080 actgaaggac tgactatgta tctgggattt gcaccaggcg ctgaaatgtt tttagaaaca 1140 tttgagttct accctttggt tattgacatg cacagagtgc tgaaagatgg aatggatgtc 1200 aactttatga gaaaggtcct tcgccagcgc tatggcacat tgactgcaga acagtggatg 1260 actcaaaaaa tagatgctgt ccgtgcagcc ttcaatgctg ttgggcagct aagttgggct 1320 aaatcaggat tctcaccagc tgccagagcc ttccttgccc aattcggcat aaacatgatc 1380 ccgggagaga atctatattt tcaagggccc ggcggaggta gtcaccatca tcaccatcac 1440 taatgaccgg t 1451 <210> 82 <211> 459 <212> PRT <213> artificial <220> <223> Amino acid sequence of fusion protein [SNAPlike-Aino N protein-Histag] <400> 82 Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro 1 5 10 15 Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile 20 25 30 Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro 35 40 45 Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr 50 55 60 Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe 65 70 75 80 Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr 85 90 95 Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val 100 105 110 Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr 115 120 125 Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile 130 135 140 Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu 145 150 155 160 Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg 165 170 175 Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser 180 185 190 Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Ala Asn 195 200 205 Gln Phe Ile Phe Gln Asp Val Pro Gln Arg Asn Leu Ala Thr Phe Asn 210 215 220 Pro Glu Val Gly Tyr Val Ala Phe Ile Ala Lys His Gly Ser Gln Leu 225 230 235 240 Asn Phe Asp Thr Val Arg Val Phe Phe Leu Asn Gln Lys Lys Ala Lys 245 250 255 Met Val Leu Ser Lys Thr Ala Gln Pro Ser Val Asp Leu Thr Phe Gly 260 265 270 Gly Ile Lys Phe Thr Leu Val Asn Asn His Phe Pro Gln Tyr Thr Ala 275 280 285 Asn Pro Val Pro Asp Thr Ala Leu Thr Leu His Arg Leu Ser Gly Tyr 290 295 300 Leu Ala Lys Trp Val Ala Asp Gln Cys Lys Thr Asn Gln Ile Lys Leu 305 310 315 320 Ala Glu Ala Met Glu Lys Ile Val Met Pro Leu Ala Glu Val Lys Gly 325 330 335 Cys Thr Trp Thr Glu Gly Leu Thr Met Tyr Leu Gly Phe Ala Pro Gly 340 345 350 Ala Glu Met Phe Leu Glu Thr Phe Glu Phe Tyr Pro Leu Val Ile Asp 355 360 365 Met His Arg Val Leu Lys Asp Gly Met Asp Val Asn Phe Met Arg Lys 370 375 380 Val Leu Arg Gln Arg Tyr Gly Thr Leu Thr Ala Glu Gln Trp Met Thr 385 390 395 400 Gln Lys Ile Asp Ala Val Arg Ala Ala Phe Asn Ala Val Gly Gln Leu 405 410 415 Ser Trp Ala Lys Ser Gly Phe Ser Pro Ala Ala Arg Ala Phe Leu Ala 420 425 430 Gln Phe Gly Ile Asn Met Ile Pro Gly Glu Asn Leu Tyr Phe Gln Gly 435 440 445 Pro Gly Gly Gly Ser His His His His His His 450 455 <210> 83 <211> 1448 <212> DNA <213> artificial <220> <223> DNA sequence encoding ssBiP - SNAPlike-Shamonda N protein-proTEV cleavage site-Histag for expression in S2 cells <400> 83 atgaagttat gcatattact ggccgtcgtg gtggcctttg ttggcctctc gctcgggaga 60 tctagatctg acaaagactg cgaaatgaaa agaactacat tggattcacc acttgggaag 120 ttggaactga gtggatgcga gcaaggattg catgaaatta agctactggg aaaaggaact 180 tctgctgctg atgcagttga agttccagca ccagcagctg ttcttggagg tcctgagccc 240 ctcatgcaag ccacagcctg gcttaacgca tatttccacc agcctgaggc cattgaggaa 300 tttccagtcc ccgcccttca ccatcctgtg tttcagcagg agagcttcac ccgccaggtc 360 ctgtggaaat tgctgaaggt ggtcaagttt ggtgaagtga tttcatatca gcaacttgct 420 gcattggccg gtaaccccgc agctacagct gccgtgaaaa ctgctctcag cggaaatcct 480 gtgcccatcc tgatcccttg tcacagagtc gtttcatctt ccggagctgt aggtggctat 540 gaaggaggac tggcagttaa ggagtggctg ctggctcatg aaggtcatag acttggaaag 600 cctgggctgg gtcctgctgg tataggcgcg ccagggtccc taggtggcgg atccgaaaac 660 ctgtacttcc agagcgatat ctcaagccaa ttcatttttg aagatgtacc acaacggaat 720 gcagctacat ttaacccgga aggtgggtat gtggcattta ttggtaagta tgggcaacaa 780 ctcaatttcg gggttgctaa agtcttcttc ctcaaccaga agaaggccaa aatggtccta 840 cataagacgg gacaaccaag tgtcgatctt acttttggtg gggtcaaatt cacagtggtt 900 aataaccatt ttccccaata tgtctcaaat cctgtgccag acaatgccat tacacttcac 960 aggatgtcag gttatctagc acgctggatt gctgatacat gcaaggctag tgtcctcaaa 1020 ctagctgaag ctagtgctca aattgtcatg ccccttgctg aggttaaggg atgtacctgg 1080 gctgatggtt atacaatgta tcttggattt gcacctgggg ccgaaatgtt ccttgatgct 1140 tttgattttt atccgctagt tatcgaaatg catagggtcc ttaaggacaa tatggatgta 1200 aattttatga aaaaagtcct ccgccaacgc tatggaacaa tgactgctga agaatggatg 1260 actcagaaaa taccagaaat aaaggctgct ttcaattctg ttggacaact tgcctgggct 1320 aaatctggat tctctcctgc tgctagaact ttcttgcagc aatttggtat caacatcccg 1380 ggagagaatc tatattttca agggcccggc ggaggtagtc accatcatca ccatcactaa 1440 tgaccggt 1448 <210> 84 <211> 458 <212> PRT <213> artificial <220> <223> Amino acid sequence of fusion protein [SNAPlike-Shamonda N protein-Histag] <400> 84 Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro 1 5 10 15 Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile 20 25 30 Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro 35 40 45 Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr 50 55 60 Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe 65 70 75 80 Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr 85 90 95 Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val 100 105 110 Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr 115 120 125 Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile 130 135 140 Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu 145 150 155 160 Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg 165 170 175 Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser 180 185 190 Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Ser Ser 195 200 205 Gln Phe Ile Phe Glu Asp Val Pro Gln Arg Asn Ala Ala Thr Phe Asn 210 215 220 Pro Glu Gly Gly Tyr Val Ala Phe Ile Gly Lys Tyr Gly Gln Gln Leu 225 230 235 240 Asn Phe Gly Val Ala Lys Val Phe Phe Leu Asn Gln Lys Lys Ala Lys 245 250 255 Met Val Leu His Lys Thr Gly Gln Pro Ser Val Asp Leu Thr Phe Gly 260 265 270 Gly Val Lys Phe Thr Val Val Asn Asn His Phe Pro Gln Tyr Val Ser 275 280 285 Asn Pro Val Pro Asp Asn Ala Ile Thr Leu His Arg Met Ser Gly Tyr 290 295 300 Leu Ala Arg Trp Ile Ala Asp Thr Cys Lys Ala Ser Val Leu Lys Leu 305 310 315 320 Ala Glu Ala Ser Ala Gln Ile Val Met Pro Leu Ala Glu Val Lys Gly 325 330 335 Cys Thr Trp Ala Asp Gly Tyr Thr Met Tyr Leu Gly Phe Ala Pro Gly 340 345 350 Ala Glu Met Phe Leu Asp Ala Phe Asp Phe Tyr Pro Leu Val Ile Glu 355 360 365 Met His Arg Val Leu Lys Asp Asn Met Asp Val Asn Phe Met Lys Lys 370 375 380 Val Leu Arg Gln Arg Tyr Gly Thr Met Thr Ala Glu Glu Trp Met Thr 385 390 395 400 Gln Lys Ile Pro Glu Ile Lys Ala Ala Phe Asn Ser Val Gly Gln Leu 405 410 415 Ala Trp Ala Lys Ser Gly Phe Ser Pro Ala Ala Arg Thr Phe Leu Gln 420 425 430 Gln Phe Gly Ile Asn Ile Pro Gly Glu Asn Leu Tyr Phe Gln Gly Pro 435 440 445 Gly Gly Gly Ser His His His His His His 450 455 <210> 85 <211> 1991 <212> DNA <213> artificial <220> <223> DNA sequence encoding ssBiP -SNAPlike-proTEV cleavage site-N protein from human betacoronavirus strain 2cEMC/2012- Histag for expression in S2 cells <400> 85 atgaagttat gcatattact ggccgtcgtg gtggcctttg ttggcctctc gctcgggaga 60 tctagatctg acaaagactg cgaaatgaaa agaactacat tggattcacc acttgggaag 120 ttggaactga gtggatgcga gcaaggattg catgaaatta agctactggg aaaaggaact 180 tctgctgctg atgcagttga agttccagca ccagcagctg ttcttggagg tcctgagccc 240 ctcatgcaag ccacagcctg gcttaacgca tatttccacc agcctgaggc cattgaggaa 300 tttccagtcc ccgcccttca ccatcctgtg tttcagcagg agagcttcac ccgccaggtc 360 ctgtggaaat tgctgaaggt ggtcaagttt ggtgaagtga tttcatatca gcaacttgct 420 gcattggccg gtaaccccgc agctacagct gccgtgaaaa ctgctctcag cggaaatcct 480 gtgcccatcc tgatcccttg tcacagagtc gtttcatctt ccggagctgt aggtggctat 540 gaaggaggac tggcagttaa ggagtggctg ctggctcatg aaggtcatag acttggaaag 600 cctgggctgg gtcctgctgg tataggcgcg ccagggtccc taggtggcgg atccgaaaac 660 ctgtacttcc agagcgatat cgcatcccct gctgcacctc gtgctgtttc ctttgccgat 720 aacaatgata taacaaatac aaacctatct cgaggtagag gacgtaatcc aaaaccacga 780 gctgcaccaa ataacactgt ctcttggtac actgggctta cccaacacgg gaaagtccct 840 cttacctttc cacctgggca gggtgtacct cttaatgcca attctacccc tgcgcaaaat 900 gctgggtatt ggcggagaca ggacagaaaa attaataccg ggaatggaat taagcaactg 960 gctcccaggt ggtacttcta ctacactgga actggacccg aagcagcact cccattccgg 1020 gctgttaagg atggcatcgt ttgggtccat gaagatggcg ccactgatgc tccttcaact 1080 tttgggacgc ggaaccctaa caatgattca gctattgtta cacaattcgc gcccggtact 1140 aaacttccta aaaacttcca cattgagggg actggaggca atagtcaatc atcttcaaga 1200 gcctctagct taagcagaaa ctcttccagg tctagttcac aaggttcaag atcaggaaac 1260 tctacccgcg gcacttctcc aggtccatct ggaatcggag cagtaggagg tgatctactt 1320 taccttgatc ttctgaacag actacaagcc cttgagtctg gcaaagtaaa gcaatcgcag 1380 ccaaaagtaa tcactaagaa agatgctgct gctgctaaaa ataagatgcg ccacaagcgc 1440 acttccacca aaagtttcaa catggtgcag gcttttggtc ttcgcggacc aggagacctc 1500 cagggaaact ttggtgatct tcaattgaat aaactcggca ctgaggaccc acgttggccc 1560 caaattgctg agcttgctcc tacagccagt gcttttatgg gtatgtcgca atttaaactt 1620 acccatcaga acaatgatga tcatggcaac cctgtgtact tccttcggta cagtggagcc 1680 attaaacttg acccaaagaa tcccaactac aataagtggt tggagcttct tgagcaaaat 1740 attgatgcct acaaaacctt ccctaagaag gaaaagaaac aaaaggcacc aaaagaagaa 1800 tcaacagacc aaatgtctga acctccaaag gagcagcgtg tgcaaggtag catcactcag 1860 cgcactcgca cccgtccaag tgttcagcct ggtccaatga ttgatgttaa cactgatggc 1920 ccgggagaga atctatattt tcaagggccc ggcggaggta gtcaccatca tcaccatcac 1980 taatgaccgg t 1991 <210> 86 <211> 639 <212> PRT <213> artificial <220> <223> Amino acid sequence of fusion protein [SNAPlike-proTEV-COV N protein-Histag] <400> 86 Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro 1 5 10 15 Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile 20 25 30 Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro 35 40 45 Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr 50 55 60 Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe 65 70 75 80 Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr 85 90 95 Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val 100 105 110 Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr 115 120 125 Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile 130 135 140 Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu 145 150 155 160 Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg 165 170 175 Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser 180 185 190 Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Ala Ser 195 200 205 Pro Ala Ala Pro Arg Ala Val Ser Phe Ala Asp Asn Asn Asp Ile Thr 210 215 220 Asn Thr Asn Leu Ser Arg Gly Arg Gly Arg Asn Pro Lys Pro Arg Ala 225 230 235 240 Ala Pro Asn Asn Thr Val Ser Trp Tyr Thr Gly Leu Thr Gln His Gly 245 250 255 Lys Val Pro Leu Thr Phe Pro Pro Gly Gln Gly Val Pro Leu Asn Ala 260 265 270 Asn Ser Thr Pro Ala Gln Asn Ala Gly Tyr Trp Arg Arg Gln Asp Arg 275 280 285 Lys Ile Asn Thr Gly Asn Gly Ile Lys Gln Leu Ala Pro Arg Trp Tyr 290 295 300 Phe Tyr Tyr Thr Gly Thr Gly Pro Glu Ala Ala Leu Pro Phe Arg Ala 305 310 315 320 Val Lys Asp Gly Ile Val Trp Val His Glu Asp Gly Ala Thr Asp Ala 325 330 335 Pro Ser Thr Phe Gly Thr Arg Asn Pro Asn Asn Asp Ser Ala Ile Val 340 345 350 Thr Gln Phe Ala Pro Gly Thr Lys Leu Pro Lys Asn Phe His Ile Glu 355 360 365 Gly Thr Gly Gly Asn Ser Gln Ser Ser Ser Arg Ala Ser Ser Leu Ser 370 375 380 Arg Asn Ser Ser Arg Ser Ser Ser Gln Gly Ser Arg Ser Gly Asn Ser 385 390 395 400 Thr Arg Gly Thr Ser Pro Gly Pro Ser Gly Ile Gly Ala Val Gly Gly 405 410 415 Asp Leu Leu Tyr Leu Asp Leu Leu Asn Arg Leu Gln Ala Leu Glu Ser 420 425 430 Gly Lys Val Lys Gln Ser Gln Pro Lys Val Ile Thr Lys Lys Asp Ala 435 440 445 Ala Ala Ala Lys Asn Lys Met Arg His Lys Arg Thr Ser Thr Lys Ser 450 455 460 Phe Asn Met Val Gln Ala Phe Gly Leu Arg Gly Pro Gly Asp Leu Gln 465 470 475 480 Gly Asn Phe Gly Asp Leu Gln Leu Asn Lys Leu Gly Thr Glu Asp Pro 485 490 495 Arg Trp Pro Gln Ile Ala Glu Leu Ala Pro Thr Ala Ser Ala Phe Met 500 505 510 Gly Met Ser Gln Phe Lys Leu Thr His Gln Asn Asn Asp Asp His Gly 515 520 525 Asn Pro Val Tyr Phe Leu Arg Tyr Ser Gly Ala Ile Lys Leu Asp Pro 530 535 540 Lys Asn Pro Asn Tyr Asn Lys Trp Leu Glu Leu Leu Glu Gln Asn Ile 545 550 555 560 Asp Ala Tyr Lys Thr Phe Pro Lys Lys Glu Lys Lys Gln Lys Ala Pro 565 570 575 Lys Glu Glu Ser Thr Asp Gln Met Ser Glu Pro Pro Lys Glu Gln Arg 580 585 590 Val Gln Gly Ser Ile Thr Gln Arg Thr Arg Thr Arg Pro Ser Val Gln 595 600 605 Pro Gly Pro Met Ile Asp Val Asn Thr Asp Gly Pro Gly Glu Asn Leu 610 615 620 Tyr Phe Gln Gly Pro Gly Gly Gly Ser His His His His His His 625 630 635 <210> 87 <211> 4465 <212> DNA <213> artificial <220> <223> DNA sequence encoding ssBiP- S protein from human betacoronavirus strain 2cEMC/2012- SNAPlike - Histag for expression in S2 cells <400> 87 atgaagttat gcatattact ggccgtcgtg gtggcctttg ttggcctctc gctcgggaga 60 tctagatctg tagggccaga ttctgttaag tctgcttgta ttgaggttga tatacaacag 120 actttctttg ataaaacttg gcctaggcca attgatgttt ctaaggctga cggtattata 180 taccctcaag gccgtacata ttctaacata actatcactt atcaaggtct ttttccctat 240 cagggagacc atggtgatat gtatgtttac tctgcaggac atgctacagg cacaactcca 300 caaaagttgt ttgtagctaa ctattctcag gacgtcaaac agtttgctaa tgggtttgtc 360 gtccgtatag gagcagctgc caattccact ggcactgtta ttattagccc atctaccagc 420 gctactatac gaaaaattta ccctgctttt atgctgggtt cttcagttgg taatttctca 480 gatggtaaaa tgggccgctt cttcaatcat actctagttc ttttgcccga tggatgtggc 540 actttactta gagcttttta ttgtattcta gagcctcgct ctggaaatca ttgtcctgct 600 ggcaattcct atacttcttt tgccacttat cacactcctg caacagattg ttctgatggc 660 aattacaatc gtaatgccag tctgaactct tttaaggagt attttaattt acgtaactgc 720 acctttatgt acacttataa cattaccgaa gatgagattt tagagtggtt tggcattaca 780 caaactgctc aaggtgttca cctcttctca tctcggtatg ttgatttgta cggcggcaat 840 atgtttcaat ttgccacctt gcctgtttat gatactatta agtattattc tatcattcct 900 cacagtattc gttctatcca aagtgataga aaggcttggg ctgccttcta cgtatataaa 960 cttcaaccgt taactttcct gttggatttt tctgttgatg gttatatacg cagagctata 1020 gactgtggtt ttaatgattt gtcacaactc cactgctcat atgaatcctt cgatgttgaa 1080 tctggagttt attcagtttc gtctttcgaa gcaaaacctt ctggctcagt tgtggaacag 1140 gctgaaggtg ttgaatgtga tttttcacct cttctgtctg gcacacctcc tcaggtttat 1200 aatttcaagc gtttggtttt taccaattgc aattataatc ttaccaaatt gctttcactt 1260 ttttctgtga atgattttac ttgtagtcaa atatctccag cagcaattgc aagcaactgt 1320 tattcttcac tgattttgga ttacttttca tacccactta gtatgaaatc cgatctcagt 1380 gttagttctg ctggtccaat atcccagttt aattataaac agtccttttc taatcccaca 1440 tgtttgattt tagcgactgt tcctcataac cttactacta ttactaagcc tcttaagtac 1500 agctatatta acaagtgctc tcgtcttctt tctgatgatc gtactgaagt acctcagtta 1560 gtgaacgcta atcaatactc accctgtgta tccattgtcc catccactgt gtgggaagac 1620 ggtgattatt ataggaaaca actatctcca cttgaaggtg gtggctggct tgttgctagt 1680 ggctcaactg ttgccatgac tgagcaatta cagatgggct ttggtattac agttcaatat 1740 ggtacagaca ccaatagtgt ttgccccaag ctggaatttg ctaatgacac aaaaattgcc 1800 tctcaattag gcaattgcgt ggaatattcc ctctatggtg tttcgggccg tggtgttttt 1860 cagaattgca cagctgtagg tgttcgacag cagcgctttg tttatgatgc gtaccagaat 1920 ttagttggct attattctga tgatggcaac tactactgtt tgcgtgcttg tgttagtgtt 1980 cctgtttctg tcatctatga taaagaaact aaaacccacg ctactctatt tggtagtgtt 2040 gcatgtgaac acatttcttc taccatgtct caatactccc gttctacgcg atcaatgctt 2100 aaacggcgag attctacata tggccccctt cagacacctg ttggttgtgt cctaggactt 2160 gttaattcct ctttgttcgt agaggactgc aagttgcctc ttggtcaatc tctctgtgct 2220 cttcctgaca cacctagtac tctcacacct cgcagtgtgc gctctgttcc aggtgaaatg 2280 cgcttggcat ccattgcttt taatcatcct attcaggttg atcaacttaa tagtagttat 2340 tttaaattaa gtatacccac taatttttcc tttggtgtga ctcaggagta cattcagaca 2400 accattcaga aagttactgt tgattgtaaa cagtacgttt gcaatggttt ccagaagtgt 2460 gagcaattac tgcgcgagta tggccagttt tgttccaaaa taaaccaggc tctccatggt 2520 gccaatttac gccaggatga ttctgtacgt aatttgtttg cgagcgtgaa aagctctcaa 2580 tcatctccta tcataccagg ttttggaggt gactttaatt tgacacttct agaacctgtt 2640 tctatatcta ctggcagtcg tagtgcacgt agtgctattg aggatttgct atttgacaaa 2700 gtcactatag ctgatcctgg ttatatgcaa ggttacgatg attgcatgca gcaaggtcca 2760 gcatcagctc gtgatcttat ttgtgctcaa tatgtggctg gttacaaagt attacctcct 2820 cttatggatg ttaatatgga agccgcgtat acttcatctt tgcttggcag catagcaggt 2880 gttggctgga ctgctggctt atcctccttt gctgctattc catttgcaca gagtatcttt 2940 tataggttaa acggtgttgg cattactcaa caggttcttt cagagaacca aaagctcatt 3000 gccaataagt ttaatcaggc tctgggagct atgcaaacag gcttcactac aactaatgaa 3060 gcctttcaga aggttcagga tgctgtgaac aacaatgcac aggctctatc caaattagcg 3120 agcgagctat ctaatacttt tggtgctatt tccgcctcta ttggagacat catacaacgt 3180 cttgatgttc tcgaacagga cgcccaaata gacagactta ttaatggccg tttgacaaca 3240 ctaaatgctt ttgttgcaca gcagcttgtt cgttccgaat cagctgctct ttccgctcaa 3300 ttggctaaag ataaagtcaa tgagtgtgtc aaggcacaat ccaagcgttc tggattttgc 3360 ggtcaaggca cacatatagt gtcctttgtt gtaaatgccc ctaatggcct ttacttcatg 3420 catgttggtt attaccctag caaccacatt gaggttgttt ctgcttatgg tctttgcgat 3480 gcagctaacc ctactaattg tatagcccct gttaatggct actttattaa aactaataac 3540 actaggattg ttgatgagtg gtcatatact ggctcgtcct tctatgcacc tgagcccatt 3600 acctccctta atactaagta tgttgcacca caggtgacat accaaaacat ttctactaac 3660 ctccctcctc ctcttctcgg caattccacc gggattgact tccaagatga gttggatgag 3720 tttttcaaaa atgttagcac cagtatacct aattttggtt ccctaacaca gattaatact 3780 acattactcg atcttaccta cgagatgttg tctcttcaac aagttgttaa agcccttaag 3840 cggccgcacg gcggaggtag caaagactgc gaaatgaagc gcaccaccct ggatagccct 3900 ctgggcaagc tggaactgtc tgggtgcgaa cagggcctgc acgagatcaa gctgctgggc 3960 aaaggaacat ctgccgccga cgccgtggaa gtgcctgccc cagccgccgt gctgggcgga 4020 ccagagccac tgatgcaggc caccgcctgg ctcaacgcct actttcacca gcctgaggcc 4080 atcgaggagt tccctgtgcc agccctgcac cacccagtgt tccagcagga gagctttacc 4140 cgccaggtgc tgtggaaact gctgaaagtg gtgaagttcg gagaggtcat cagctaccag 4200 cagctggccg ccctggccgg caatcccgcc gccaccgccg ccgtgaaaac cgccctgagc 4260 ggaaatcccg tgcccattct gatcccctgc caccgggtgg tgtctagctc tggcgccgtg 4320 gggggctacg agggcgggct cgccgtgaaa gagtggctgc tggcccacga gggccacaga 4380 ctgggcaagc ctgggctggg tcctgcaggt ataggcgcgc cagggtccct ggagcatcat 4440 catcatcatc attgatgacg ggccc 4465 <210> 88 <211> 1463 <212> PRT <213> artificial <220> <223> Amino acid sequence of fusion protein [huCOV.S protein -SNAPlike-Histag] <400> 88 Arg Ser Val Gly Pro Asp Ser Val Lys Ser Ala Cys Ile Glu Val Asp 1 5 10 15 Ile Gln Gln Thr Phe Phe Asp Lys Thr Trp Pro Arg Pro Ile Asp Val 20 25 30 Ser Lys Ala Asp Gly Ile Ile Tyr Pro Gln Gly Arg Thr Tyr Ser Asn 35 40 45 Ile Thr Ile Thr Tyr Gln Gly Leu Phe Pro Tyr Gln Gly Asp His Gly 50 55 60 Asp Met Tyr Val Tyr Ser Ala Gly His Ala Thr Gly Thr Thr Pro Gln 65 70 75 80 Lys Leu Phe Val Ala Asn Tyr Ser Gln Asp Val Lys Gln Phe Ala Asn 85 90 95 Gly Phe Val Val Arg Ile Gly Ala Ala Ala Asn Ser Thr Gly Thr Val 100 105 110 Ile Ile Ser Pro Ser Thr Ser Ala Thr Ile Arg Lys Ile Tyr Pro Ala 115 120 125 Phe Met Leu Gly Ser Ser Val Gly Asn Phe Ser Asp Gly Lys Met Gly 130 135 140 Arg Phe Phe Asn His Thr Leu Val Leu Leu Pro Asp Gly Cys Gly Thr 145 150 155 160 Leu Leu Arg Ala Phe Tyr Cys Ile Leu Glu Pro Arg Ser Gly Asn His 165 170 175 Cys Pro Ala Gly Asn Ser Tyr Thr Ser Phe Ala Thr Tyr His Thr Pro 180 185 190 Ala Thr Asp Cys Ser Asp Gly Asn Tyr Asn Arg Asn Ala Ser Leu Asn 195 200 205 Ser Phe Lys Glu Tyr Phe Asn Leu Arg Asn Cys Thr Phe Met Tyr Thr 210 215 220 Tyr Asn Ile Thr Glu Asp Glu Ile Leu Glu Trp Phe Gly Ile Thr Gln 225 230 235 240 Thr Ala Gln Gly Val His Leu Phe Ser Ser Arg Tyr Val Asp Leu Tyr 245 250 255 Gly Gly Asn Met Phe Gln Phe Ala Thr Leu Pro Val Tyr Asp Thr Ile 260 265 270 Lys Tyr Tyr Ser Ile Ile Pro His Ser Ile Arg Ser Ile Gln Ser Asp 275 280 285 Arg Lys Ala Trp Ala Ala Phe Tyr Val Tyr Lys Leu Gln Pro Leu Thr 290 295 300 Phe Leu Leu Asp Phe Ser Val Asp Gly Tyr Ile Arg Arg Ala Ile Asp 305 310 315 320 Cys Gly Phe Asn Asp Leu Ser Gln Leu His Cys Ser Tyr Glu Ser Phe 325 330 335 Asp Val Glu Ser Gly Val Tyr Ser Val Ser Ser Phe Glu Ala Lys Pro 340 345 350 Ser Gly Ser Val Val Glu Gln Ala Glu Gly Val Glu Cys Asp Phe Ser 355 360 365 Pro Leu Leu Ser Gly Thr Pro Pro Gln Val Tyr Asn Phe Lys Arg Leu 370 375 380 Val Phe Thr Asn Cys Asn Tyr Asn Leu Thr Lys Leu Leu Ser Leu Phe 385 390 395 400 Ser Val Asn Asp Phe Thr Cys Ser Gln Ile Ser Pro Ala Ala Ile Ala 405 410 415 Ser Asn Cys Tyr Ser Ser Leu Ile Leu Asp Tyr Phe Ser Tyr Pro Leu 420 425 430 Ser Met Lys Ser Asp Leu Ser Val Ser Ser Ala Gly Pro Ile Ser Gln 435 440 445 Phe Asn Tyr Lys Gln Ser Phe Ser Asn Pro Thr Cys Leu Ile Leu Ala 450 455 460 Thr Val Pro His Asn Leu Thr Thr Ile Thr Lys Pro Leu Lys Tyr Ser 465 470 475 480 Tyr Ile Asn Lys Cys Ser Arg Leu Leu Ser Asp Asp Arg Thr Glu Val 485 490 495 Pro Gln Leu Val Asn Ala Asn Gln Tyr Ser Pro Cys Val Ser Ile Val 500 505 510 Pro Ser Thr Val Trp Glu Asp Gly Asp Tyr Tyr Arg Lys Gln Leu Ser 515 520 525 Pro Leu Glu Gly Gly Gly Trp Leu Val Ala Ser Gly Ser Thr Val Ala 530 535 540 Met Thr Glu Gln Leu Gln Met Gly Phe Gly Ile Thr Val Gln Tyr Gly 545 550 555 560 Thr Asp Thr Asn Ser Val Cys Pro Lys Leu Glu Phe Ala Asn Asp Thr 565 570 575 Lys Ile Ala Ser Gln Leu Gly Asn Cys Val Glu Tyr Ser Leu Tyr Gly 580 585 590 Val Ser Gly Arg Gly Val Phe Gln Asn Cys Thr Ala Val Gly Val Arg 595 600 605 Gln Gln Arg Phe Val Tyr Asp Ala Tyr Gln Asn Leu Val Gly Tyr Tyr 610 615 620 Ser Asp Asp Gly Asn Tyr Tyr Cys Leu Arg Ala Cys Val Ser Val Pro 625 630 635 640 Val Ser Val Ile Tyr Asp Lys Glu Thr Lys Thr His Ala Thr Leu Phe 645 650 655 Gly Ser Val Ala Cys Glu His Ile Ser Ser Thr Met Ser Gln Tyr Ser 660 665 670 Arg Ser Thr Arg Ser Met Leu Lys Arg Arg Asp Ser Thr Tyr Gly Pro 675 680 685 Leu Gln Thr Pro Val Gly Cys Val Leu Gly Leu Val Asn Ser Ser Leu 690 695 700 Phe Val Glu Asp Cys Lys Leu Pro Leu Gly Gln Ser Leu Cys Ala Leu 705 710 715 720 Pro Asp Thr Pro Ser Thr Leu Thr Pro Arg Ser Val Arg Ser Val Pro 725 730 735 Gly Glu Met Arg Leu Ala Ser Ile Ala Phe Asn His Pro Ile Gln Val 740 745 750 Asp Gln Leu Asn Ser Ser Tyr Phe Lys Leu Ser Ile Pro Thr Asn Phe 755 760 765 Ser Phe Gly Val Thr Gln Glu Tyr Ile Gln Thr Thr Ile Gln Lys Val 770 775 780 Thr Val Asp Cys Lys Gln Tyr Val Cys Asn Gly Phe Gln Lys Cys Glu 785 790 795 800 Gln Leu Leu Arg Glu Tyr Gly Gln Phe Cys Ser Lys Ile Asn Gln Ala 805 810 815 Leu His Gly Ala Asn Leu Arg Gln Asp Asp Ser Val Arg Asn Leu Phe 820 825 830 Ala Ser Val Lys Ser Ser Gln Ser Ser Pro Ile Ile Pro Gly Phe Gly 835 840 845 Gly Asp Phe Asn Leu Thr Leu Leu Glu Pro Val Ser Ile Ser Thr Gly 850 855 860 Ser Arg Ser Ala Arg Ser Ala Ile Glu Asp Leu Leu Phe Asp Lys Val 865 870 875 880 Thr Ile Ala Asp Pro Gly Tyr Met Gln Gly Tyr Asp Asp Cys Met Gln 885 890 895 Gln Gly Pro Ala Ser Ala Arg Asp Leu Ile Cys Ala Gln Tyr Val Ala 900 905 910 Gly Tyr Lys Val Leu Pro Pro Leu Met Asp Val Asn Met Glu Ala Ala 915 920 925 Tyr Thr Ser Ser Leu Leu Gly Ser Ile Ala Gly Val Gly Trp Thr Ala 930 935 940 Gly Leu Ser Ser Phe Ala Ala Ile Pro Phe Ala Gln Ser Ile Phe Tyr 945 950 955 960 Arg Leu Asn Gly Val Gly Ile Thr Gln Gln Val Leu Ser Glu Asn Gln 965 970 975 Lys Leu Ile Ala Asn Lys Phe Asn Gln Ala Leu Gly Ala Met Gln Thr 980 985 990 Gly Phe Thr Thr Thr Asn Glu Ala Phe Gln Lys Val Gln Asp Ala Val 995 1000 1005 Asn Asn Asn Ala Gln Ala Leu Ser Lys Leu Ala Ser Glu Leu Ser 1010 1015 1020 Asn Thr Phe Gly Ala Ile Ser Ala Ser Ile Gly Asp Ile Ile Gln 1025 1030 1035 Arg Leu Asp Val Leu Glu Gln Asp Ala Gln Ile Asp Arg Leu Ile 1040 1045 1050 Asn Gly Arg Leu Thr Thr Leu Asn Ala Phe Val Ala Gln Gln Leu 1055 1060 1065 Val Arg Ser Glu Ser Ala Ala Leu Ser Ala Gln Leu Ala Lys Asp 1070 1075 1080 Lys Val Asn Glu Cys Val Lys Ala Gln Ser Lys Arg Ser Gly Phe 1085 1090 1095 Cys Gly Gln Gly Thr His Ile Val Ser Phe Val Val Asn Ala Pro 1100 1105 1110 Asn Gly Leu Tyr Phe Met His Val Gly Tyr Tyr Pro Ser Asn His 1115 1120 1125 Ile Glu Val Val Ser Ala Tyr Gly Leu Cys Asp Ala Ala Asn Pro 1130 1135 1140 Thr Asn Cys Ile Ala Pro Val Asn Gly Tyr Phe Ile Lys Thr Asn 1145 1150 1155 Asn Thr Arg Ile Val Asp Glu Trp Ser Tyr Thr Gly Ser Ser Phe 1160 1165 1170 Tyr Ala Pro Glu Pro Ile Thr Ser Leu Asn Thr Lys Tyr Val Ala 1175 1180 1185 Pro Gln Val Thr Tyr Gln Asn Ile Ser Thr Asn Leu Pro Pro Pro 1190 1195 1200 Leu Leu Gly Asn Ser Thr Gly Ile Asp Phe Gln Asp Glu Leu Asp 1205 1210 1215 Glu Phe Phe Lys Asn Val Ser Thr Ser Ile Pro Asn Phe Gly Ser 1220 1225 1230 Leu Thr Gln Ile Asn Thr Thr Leu Leu Asp Leu Thr Tyr Glu Met 1235 1240 1245 Leu Ser Leu Gln Gln Val Val Lys Ala Leu Lys Arg Pro His Gly 1250 1255 1260 Gly Gly Ser Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser 1265 1270 1275 Pro Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His 1280 1285 1290 Glu Ile Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val 1295 1300 1305 Glu Val Pro Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu 1310 1315 1320 Met Gln Ala Thr Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu 1325 1330 1335 Ala Ile Glu Glu Phe Pro Val Pro Ala Leu His His Pro Val Phe 1340 1345 1350 Gln Gln Glu Ser Phe Thr Arg Gln Val Leu Trp Lys Leu Leu Lys 1355 1360 1365 Val Val Lys Phe Gly Glu Val Ile Ser Tyr Gln Gln Leu Ala Ala 1370 1375 1380 Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala Val Lys Thr Ala Leu 1385 1390 1395 Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys His Arg Val Val 1400 1405 1410 Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly Leu Ala Val 1415 1420 1425 Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly Lys Pro 1430 1435 1440 Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Glu His 1445 1450 1455 His His His His His 1460 <210> 89 <211> 1325 <212> DNA <213> artificial <220> <223> DNA sequence encoding ssBiP - SNAPlike -proTEV- C protein from hepatitis C virus strain TCHM-R2/03 of genotype 1b - -proTEV - Histag for expression in S2 cells <400> 89 atgaagttat gcatattact ggccgtcgtg gtggcctttg ttggcctctc gctcgggaga 60 tctagatctg acaaagactg cgaaatgaaa agaactacat tggattcacc acttgggaag 120 ttggaactga gtggatgcga gcaaggattg catgaaatta agctactggg aaaaggaact 180 tctgctgctg atgcagttga agttccagca ccagcagctg ttcttggagg tcctgagccc 240 ctcatgcaag ccacagcctg gcttaacgca tatttccacc agcctgaggc cattgaggaa 300 tttccagtcc ccgcccttca ccatcctgtg tttcagcagg agagcttcac ccgccaggtc 360 ctgtggaaat tgctgaaggt ggtcaagttt ggtgaagtga tttcatatca gcaacttgct 420 gcattggccg gtaaccccgc agctacagct gccgtgaaaa ctgctctcag cggaaatcct 480 gtgcccatcc tgatcccttg tcacagagtc gtttcatctt ccggagctgt aggtggctat 540 gaaggaggac tggcagttaa ggagtggctg ctggctcatg aaggtcatag acttggaaag 600 cctgggctgg gtcctgctgg tataggcgcg ccagggtccc taggtggcgg atccgaaaac 660 ctgtacttcc agagcgatat cagtacaaat cctaaacctc aaagaaaaac taaacgaaat 720 actaatcgtc gtccacaaga tgttaagttt ccgggaggag gacaaattgt tggtggagtt 780 tacctattgc cgcgaagagg tcctcgttta ggtgttcgag caactagaaa aacttctgaa 840 cgatcacaac ctcgtggaag acgacaacct attcctaagg ctcgtcagcc tgaaggtaga 900 gcttgggctc agcctggtta tccttggcct ctatatggta atgaaggaat gggttgggca 960 ggatggctac tatcacctcg tggttctcga cctagttggg gtgcaaatga ccctcgacga 1020 agatcacgta atttaggtaa ggtaattgat acacttacat gtggttttgc tgatcttatg 1080 ggatatattc cactagtagg tgctccacta ggtggagctg caagagttct tgcacatggt 1140 gtacgagttc ttgaagatgg agtgaactat gcaacaggta atcttcctgg atgttcattt 1200 tctatttttc tattagcttt gctatcatgt ctgactattc cagcttcagc tggcccggga 1260 gagaatctat attttcaagg gcccggcgga ggtagtcacc atcatcacca tcactaatga 1320 ccggt 1325 <210> 90 <211> 417 <212> PRT <213> artificial <220> <223> Amino acid sequence of fusion protein [SNAPlike-proTEV-C protein of HCV-proTEV-Histag] <400> 90 Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro 1 5 10 15 Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile 20 25 30 Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro 35 40 45 Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr 50 55 60 Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe 65 70 75 80 Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr 85 90 95 Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val 100 105 110 Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr 115 120 125 Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile 130 135 140 Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu 145 150 155 160 Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg 165 170 175 Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser 180 185 190 Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Ser Thr 195 200 205 Asn Pro Lys Pro Gln Arg Lys Thr Lys Arg Asn Thr Asn Arg Arg Pro 210 215 220 Gln Asp Val Lys Phe Pro Gly Gly Gly Gln Ile Val Gly Gly Val Tyr 225 230 235 240 Leu Leu Pro Arg Arg Gly Pro Arg Leu Gly Val Arg Ala Thr Arg Lys 245 250 255 Thr Ser Glu Arg Ser Gln Pro Arg Gly Arg Arg Gln Pro Ile Pro Lys 260 265 270 Ala Arg Gln Pro Glu Gly Arg Ala Trp Ala Gln Pro Gly Tyr Pro Trp 275 280 285 Pro Leu Tyr Gly Asn Glu Gly Met Gly Trp Ala Gly Trp Leu Leu Ser 290 295 300 Pro Arg Gly Ser Arg Pro Ser Trp Gly Ala Asn Asp Pro Arg Arg Arg 305 310 315 320 Ser Arg Asn Leu Gly Lys Val Ile Asp Thr Leu Thr Cys Gly Phe Ala 325 330 335 Asp Leu Met Gly Tyr Ile Pro Leu Val Gly Ala Pro Leu Gly Gly Ala 340 345 350 Ala Arg Val Leu Ala His Gly Val Arg Val Leu Glu Asp Gly Val Asn 355 360 365 Tyr Ala Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile Phe Leu Leu 370 375 380 Ala Leu Leu Ser Cys Leu Thr Ile Pro Ala Ser Ala Gly Pro Gly Glu 385 390 395 400 Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser His His His His His 405 410 415 His <210> 91 <211> 1376 <212> DNA <213> artificial <220> <223> DNA sequence encoding ssBiP- SNAPlike - MSP1(19) antigen from Plasmodium falciparum - proTEV - AMA-1(III) antigen from Plasmodium falciparum - Histag for expression in S2 cells <400> 91 atgaagttat gcatattact ggccgtcgtg gtggcctttg ttggcctctc gctcgggaga 60 tctagatctg acaaagactg cgaaatgaaa agaactacat tggattcacc acttgggaag 120 ttggaactga gtggatgcga gcaaggattg catgaaatta agctactggg aaaaggaact 180 tctgctgctg atgcagttga agttccagca ccagcagctg ttcttggagg tcctgagccc 240 ctcatgcaag ccacagcctg gcttaacgca tatttccacc agcctgaggc cattgaggaa 300 tttccagtcc ccgcccttca ccatcctgtg tttcagcagg agagcttcac ccgccaggtc 360 ctgtggaaat tgctgaaggt ggtcaagttt ggtgaagtga tttcatatca gcaacttgct 420 gcattggccg gtaaccccgc agctacagct gccgtgaaaa ctgctctcag cggaaatcct 480 gtgcccatcc tgatcccttg tcacagagtc gtttcatctt ccggagctgt aggtggctat 540 gaaggaggac tggcagttaa ggagtggctg ctggctcatg aaggtcatag acttggaaag 600 cctgggctgg gtcctgctgg tataggcgcg ccagggtccc taggtggcgg atccgaaaac 660 ctgtacttcc agagcgatat caaacaatgt ccacaaaatt ctggatgttt cagacattta 720 gatgaaagag aagaatgtaa atgtttatta aattacaaac aagaaggtga taaatgtgtt 780 gaaaatccaa atcttacttg taacgaaaat aatggtggat gtgatgcaga tgccaaatgt 840 accgaagaag attcaggcag caacggaaag aaaatcacat gtgaatgtac taaacctgat 900 tcttatccac ttttcgatgg tattttcgga ggtggctctg agaatctata ttttcaaggg 960 cccggtggag gcgaagttga aaacaatttt ccatgttcat tatataaaga tgaaataatg 1020 aaagaaatcg aaagagaatc aaaacgaatt aaattaaatg ataatgatga tgaagggaat 1080 aaaaaaatta tagctccaag aatttttatt tcagatgata aagacagttt aaaatgccca 1140 tgtgaccctg aaatggtaag taatagtaca tgtcgtttct ttgtatgtaa atgtgtagaa 1200 agaagggcag aagtaacatc aaataatgaa gttgtagtta aagaagaata taaagatgaa 1260 tatgcagata ttcctgaaca taaaccaact tatgataaaa tgctcccggg agagaatcta 1320 tattttcaag ggcccggcgg aggtagtcac catcatcacc atcactaatg accggt 1376 <210> 92 <211> 434 <212> PRT <213> artificial <220> <223> Amino acid sequence of fusion protein [SNAPlike-MSP1-proTEV-AMA1-Histag] <400> 92 Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro 1 5 10 15 Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile 20 25 30 Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro 35 40 45 Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr 50 55 60 Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe 65 70 75 80 Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr 85 90 95 Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val 100 105 110 Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr 115 120 125 Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile 130 135 140 Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu 145 150 155 160 Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg 165 170 175 Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser 180 185 190 Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Lys Gln 195 200 205 Cys Pro Gln Asn Ser Gly Cys Phe Arg His Leu Asp Glu Arg Glu Glu 210 215 220 Cys Lys Cys Leu Leu Asn Tyr Lys Gln Glu Gly Asp Lys Cys Val Glu 225 230 235 240 Asn Pro Asn Leu Thr Cys Asn Glu Asn Asn Gly Gly Cys Asp Ala Asp 245 250 255 Ala Lys Cys Thr Glu Glu Asp Ser Gly Ser Asn Gly Lys Lys Ile Thr 260 265 270 Cys Glu Cys Thr Lys Pro Asp Ser Tyr Pro Leu Phe Asp Gly Ile Phe 275 280 285 Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly Glu 290 295 300 Val Glu Asn Asn Phe Pro Cys Ser Leu Tyr Lys Asp Glu Ile Met Lys 305 310 315 320 Glu Ile Glu Arg Glu Ser Lys Arg Ile Lys Leu Asn Asp Asn Asp Asp 325 330 335 Glu Gly Asn Lys Lys Ile Ile Ala Pro Arg Ile Phe Ile Ser Asp Asp 340 345 350 Lys Asp Ser Leu Lys Cys Pro Cys Asp Pro Glu Met Val Ser Asn Ser 355 360 365 Thr Cys Arg Phe Phe Val Cys Lys Cys Val Glu Arg Arg Ala Glu Val 370 375 380 Thr Ser Asn Asn Glu Val Val Val Lys Glu Glu Tyr Lys Asp Glu Tyr 385 390 395 400 Ala Asp Ile Pro Glu His Lys Pro Thr Tyr Asp Lys Met Leu Pro Gly 405 410 415 Glu Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser His His His His 420 425 430 His His <210> 93 <211> 2195 <212> DNA <213> artificial <220> <223> DNA sequence encoding ssBiP- SNAPlike -proTEV- modified short form of HbpA from Leptospira interrogans serovar Lai str.56601 - proTEV- Histag for expression in S2 cells <400> 93 atgaagttat gcatattact ggccgtcgtg gtggcctttg ttggcctctc gctcgggaga 60 tctagatctg acaaagactg cgaaatgaaa agaactacat tggattcacc acttgggaag 120 ttggaactga gtggatgcga gcaaggattg catgaaatta agctactggg aaaaggaact 180 tctgctgctg atgcagttga agttccagca ccagcagctg ttcttggagg tcctgagccc 240 ctcatgcaag ccacagcctg gcttaacgca tatttccacc agcctgaggc cattgaggaa 300 tttccagtcc ccgcccttca ccatcctgtg tttcagcagg agagcttcac ccgccaggtc 360 ctgtggaaat tgctgaaggt ggtcaagttt ggtgaagtga tttcatatca gcaacttgct 420 gcattggccg gtaaccccgc agctacagct gccgtgaaaa ctgctctcag cggaaatcct 480 gtgcccatcc tgatcccttg tcacagagtc gtttcatctt ccggagctgt aggtggctat 540 gaaggaggac tggcagttaa ggagtggctg ctggctcatg aaggtcatag acttggaaag 600 cctgggctgg gtcctgctgg tataggcgcg ccagggtccc taggtggcgg atccgaaaac 660 ctgtacttcc agagcgatat cttcaacacc acggccaaca tgggcttcag gaacgagtac 720 gtgagcggcg cggtgtccgc aggttacaat aagaaccccg gctacaggtt ggtcccaaac 780 tctcaggcga ctactgggaa cgcctatcag gacttgaaca cgggcatcaa cctgaccttc 840 aacccggacg gcaagttcaa ggggaagacg aggattctct accagcacag ggaccagaac 900 ggggtggacg tgacccagtc caaggccgtc ttcgaccgga acaacaagac gcacgacttc 960 ttggcgacgg ggtcgttgga gtacgggtta gggaagagga acttgatctc cttcaggggg 1020 aacatctcca agtgggagaa caagtactac aacaaccaga gggggtcgga cgagttggac 1080 gtgaagcagt tgaactcgga gttgacgtcg caggggaccg tgcagttgga catggaggcc 1140 tctgagaagc acttcatcac tgtaggtgcg gagtccttcg cgaacgagtt ggagtcggac 1200 cgcttgcaga gcaggtacgt gtacaggacg aggaaggcgg tgttcttcca ggacgagtgg 1260 accgtgtccc ggtcgccgag gattcgggtg gtgccaggag tgaggtacga cgacgactcg 1320 cagttcggga accagacgac gccgaagctg gcggcccggt acgacatatt gcagaacttg 1380 gtgtggaggg cgagctacgg gaggggatta cggccgccga gcttgcagga gttgtacctg 1440 cggttcgaga acccggccgt gggttacgtg gtggagggta acccgaactt gaagccggag 1500 cggtcgatca cgatcaactc ggacttggag tacagcccgt tcagcttctt gacgttctcc 1560 ttgagcgtgt accggaacga catcatcaac ctgatccagt acaagttcga ctcgaacaag 1620 gggagggagt tcgcggagtt ccagctgcag aacatcgcga aggcgtacac gagaggagga 1680 gagttcggcg tgcagtacag gttcttgaag tacttcacgc tggagttggg gtacaaccac 1740 acggacacga gggacctgag ctcggacagg ccgttggagg gcagggcgct gcaccaggcg 1800 tcggcgaact tcatctacaa ctcgcccgga ggattccaat tcaacctgag gggcaagcac 1860 ttggacaaga ggccgttcta cagctcgacc aacaacctgt cggcggccgg acaggactac 1920 atccccagcg aggtgaagtt gaacgagaac ccgcccgtga tctacgggaa gccgttcacg 1980 atcttgaacg tgaggatcga gcagaagttc ttcaacaagc acttcgcgct gttcttgggc 2040 gtggacaact tgctcaacca gtacgagctg gcgtacaacc ccacgcggcc gaggttctac 2100 tacggcggct tctcggccca gttcccggga gagaatctat attttcaagg gcccggcgga 2160 ggtagtcacc atcatcacca tcactaatga ccggt 2195 <210> 94 <211> 707 <212> PRT <213> artificial <220> <223> Amino acid sequence of fusion protein [SNAPlike-proTEV-HbPA1-proTEV-Histag] <400> 94 Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro 1 5 10 15 Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile 20 25 30 Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro 35 40 45 Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr 50 55 60 Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe 65 70 75 80 Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr 85 90 95 Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val 100 105 110 Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr 115 120 125 Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile 130 135 140 Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu 145 150 155 160 Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg 165 170 175 Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser 180 185 190 Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Phe Asn 195 200 205 Thr Thr Ala Asn Met Gly Phe Arg Asn Glu Tyr Val Ser Gly Ala Val 210 215 220 Ser Ala Gly Tyr Asn Lys Asn Pro Gly Tyr Arg Leu Val Pro Asn Ser 225 230 235 240 Gln Ala Thr Thr Gly Asn Ala Tyr Gln Asp Leu Asn Thr Gly Ile Asn 245 250 255 Leu Thr Phe Asn Pro Asp Gly Lys Phe Lys Gly Lys Thr Arg Ile Leu 260 265 270 Tyr Gln His Arg Asp Gln Asn Gly Val Asp Val Thr Gln Ser Lys Ala 275 280 285 Val Phe Asp Arg Asn Asn Lys Thr His Asp Phe Leu Ala Thr Gly Ser 290 295 300 Leu Glu Tyr Gly Leu Gly Lys Arg Asn Leu Ile Ser Phe Arg Gly Asn 305 310 315 320 Ile Ser Lys Trp Glu Asn Lys Tyr Tyr Asn Asn Gln Arg Gly Ser Asp 325 330 335 Glu Leu Asp Val Lys Gln Leu Asn Ser Glu Leu Thr Ser Gln Gly Thr 340 345 350 Val Gln Leu Asp Met Glu Ala Ser Glu Lys His Phe Ile Thr Val Gly 355 360 365 Ala Glu Ser Phe Ala Asn Glu Leu Glu Ser Asp Arg Leu Gln Ser Arg 370 375 380 Tyr Val Tyr Arg Thr Arg Lys Ala Val Phe Phe Gln Asp Glu Trp Thr 385 390 395 400 Val Ser Arg Ser Pro Arg Ile Arg Val Val Pro Gly Val Arg Tyr Asp 405 410 415 Asp Asp Ser Gln Phe Gly Asn Gln Thr Thr Pro Lys Leu Ala Ala Arg 420 425 430 Tyr Asp Ile Leu Gln Asn Leu Val Trp Arg Ala Ser Tyr Gly Arg Gly 435 440 445 Leu Arg Pro Pro Ser Leu Gln Glu Leu Tyr Leu Arg Phe Glu Asn Pro 450 455 460 Ala Val Gly Tyr Val Val Glu Gly Asn Pro Asn Leu Lys Pro Glu Arg 465 470 475 480 Ser Ile Thr Ile Asn Ser Asp Leu Glu Tyr Ser Pro Phe Ser Phe Leu 485 490 495 Thr Phe Ser Leu Ser Val Tyr Arg Asn Asp Ile Ile Asn Leu Ile Gln 500 505 510 Tyr Lys Phe Asp Ser Asn Lys Gly Arg Glu Phe Ala Glu Phe Gln Leu 515 520 525 Gln Asn Ile Ala Lys Ala Tyr Thr Arg Gly Gly Glu Phe Gly Val Gln 530 535 540 Tyr Arg Phe Leu Lys Tyr Phe Thr Leu Glu Leu Gly Tyr Asn His Thr 545 550 555 560 Asp Thr Arg Asp Leu Ser Ser Asp Arg Pro Leu Glu Gly Arg Ala Leu 565 570 575 His Gln Ala Ser Ala Asn Phe Ile Tyr Asn Ser Pro Gly Gly Phe Gln 580 585 590 Phe Asn Leu Arg Gly Lys His Leu Asp Lys Arg Pro Phe Tyr Ser Ser 595 600 605 Thr Asn Asn Leu Ser Ala Ala Gly Gln Asp Tyr Ile Pro Ser Glu Val 610 615 620 Lys Leu Asn Glu Asn Pro Pro Val Ile Tyr Gly Lys Pro Phe Thr Ile 625 630 635 640 Leu Asn Val Arg Ile Glu Gln Lys Phe Phe Asn Lys His Phe Ala Leu 645 650 655 Phe Leu Gly Val Asp Asn Leu Leu Asn Gln Tyr Glu Leu Ala Tyr Asn 660 665 670 Pro Thr Arg Pro Arg Phe Tyr Tyr Gly Gly Phe Ser Ala Gln Phe Pro 675 680 685 Gly Glu Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser His His His 690 695 700 His His His 705 <210> 95 <211> 968 <212> DNA <213> artificial <220> <223> DNA sequence encoding ssBiP- SNAPlike -proTEV- MUB40 - proTEV- Histag for expression in S2 cells <400> 95 atgaagttat gcatattact ggccgtcgtg gtggcctttg ttggcctctc gctcgggaga 60 tcttcgcgag ctagcaccat gaaactatgt attctacttg cagttgttgc gttcgtagga 120 ttgtccttac ctacagctct ggcaagatct gacaaagact gcgaaatgaa aagaactaca 180 ttggattcac cacttgggaa gttggaactg agtggatgcg agcaaggatt gcatgaaatt 240 aagctactgg gaaaaggaac ttctgctgct gatgcagttg aagttccagc accagcagct 300 gttcttggag gtcctgagcc cctcatgcaa gccacagcct ggcttaacgc atatttccac 360 cagcctgagg ccattgagga atttccagtc cccgcccttc accatcctgt gtttcagcag 420 gagagcttca cccgccaggt cctgtggaaa ttgctgaagg tggtcaagtt tggtgaagtg 480 atttcatatc agcaacttgc tgcattggcc ggtaaccccg cagctacagc tgccgtgaaa 540 actgctctca gcggaaatcc tgtgcccatc ctgatccctt gtcacagagt cgtttcatct 600 tccggagctg taggtggcta tgaaggagga ctggcagtta aggagtggct gctggctcat 660 gaaggtcata gacttggaaa gcctgggctg ggtcctgctg gtataggcgc gccagggtcc 720 ctaggtggcg gatccgaaaa cctgtacttc cagagcgata tcacggctga aggcatcaag 780 aagtttgaag gcgacggtta tgaactgttc aaggacaact tcccagctgg tgagaagttc 840 gataacgatg acaccaacga tcaattctac acggtaatct tcaagcacca tcgtggcccg 900 ggagagaatc tatattttca agggcccggc ggaggtagtc accatcatca ccatcactaa 960 tgaccggt 968 <210> 96 <211> 298 <212> PRT <213> artificial <220> <223> Amino acid sequence of fusion protein [SNAPlike-proTEV-MUB40-proTEV-Histag] <400> 96 Ser Arg Ala Ser Thr Met Lys Leu Cys Ile Leu Leu Ala Val Val Ala 1 5 10 15 Phe Val Gly Leu Ser Leu Pro Thr Ala Leu Ala Arg Ser Asp Lys Asp 20 25 30 Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly Lys Leu Glu 35 40 45 Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu Leu Gly Lys 50 55 60 Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro Ala Ala Val 65 70 75 80 Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp Leu Asn Ala 85 90 95 Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val Pro Ala Leu 100 105 110 His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln Val Leu Trp 115 120 125 Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser Tyr Gln Gln 130 135 140 Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala Val Lys Thr 145 150 155 160 Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys His Arg Val 165 170 175 Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly Leu Ala Val 180 185 190 Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly Lys Pro Gly 195 200 205 Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Gly Gly Gly Ser 210 215 220 Glu Asn Leu Tyr Phe Gln Ser Asp Ile Thr Ala Glu Gly Ile Lys Lys 225 230 235 240 Phe Glu Gly Asp Gly Tyr Glu Leu Phe Lys Asp Asn Phe Pro Ala Gly 245 250 255 Glu Lys Phe Asp Asn Asp Asp Thr Asn Asp Gln Phe Tyr Thr Val Ile 260 265 270 Phe Lys His His Arg Gly Pro Gly Glu Asn Leu Tyr Phe Gln Gly Pro 275 280 285 Gly Gly Gly Ser His His His His His His 290 295 <210> 97 <211> 1238 <212> DNA <213> artificial <220> <223> DNA sequence encoding ssBiP- SNAPlike -proTEV- soluble form of mouse C-type like lectin (CLEC5A) - proTEV- Histag for expression in S2 cells <400> 97 atgaagttat gcatattact ggccgtcgtg gtggcctttg ttggcctctc gctcgggaga 60 tctagatctg acaaagactg cgaaatgaaa agaactacat tggattcacc acttgggaag 120 ttggaactga gtggatgcga gcaaggattg catgaaatta agctactggg aaaaggaact 180 tctgctgctg atgcagttga agttccagca ccagcagctg ttcttggagg tcctgagccc 240 ctcatgcaag ccacagcctg gcttaacgca tatttccacc agcctgaggc cattgaggaa 300 tttccagtcc ccgcccttca ccatcctgtg tttcagcagg agagcttcac ccgccaggtc 360 ctgtggaaat tgctgaaggt ggtcaagttt ggtgaagtga tttcatatca gcaacttgct 420 gcattggccg gtaaccccgc agctacagct gccgtgaaaa ctgctctcag cggaaatcct 480 gtgcccatcc tgatcccttg tcacagagtc gtttcatctt ccggagctgt aggtggctat 540 gaaggaggac tggcagttaa ggagtggctg ctggctcatg aaggtcatag acttggaaag 600 cctgggctgg gtcctgctgg tataggcgcg ccagggtccc taggtggcgg atccgaaaac 660 ctgtacttcc agagcgatat cgtttttggc aaaagtaatg atggcttcgt ccccacggag 720 agctacggaa ccactagtgt gcagaatgtc tcacaaatct ttgggagaaa tgacgaaagt 780 accatgccta caaggagcta tggaacagtc tgtcccagaa actgggattt tcaccaagga 840 aaatgctttt tcttctcctt ctccgaatca ccttggaaag acagcatgga ttattgtgca 900 acacaagggt ccacactggc aattgtcaac actccagaga aactgaagta tcttcaggac 960 atagctggta ttgagaatta ctttattggt ttggtacgtc agcctggaga gaaaaagtgg 1020 cgctggatca acaactctgt gttcaatggc aatgttacca atcaggacca gaacttcgac 1080 tgtgtcacta taggtctgac gaagacatat gatgctgcat catgtgaagt cagctatcgc 1140 tggatctgcg aaatgaatgc caaaggcccg ggagagaatc tatattttca agggcccggc 1200 ggaggtagtc accatcatca ccatcactaa tgaccggt 1238 <210> 98 <211> 388 <212> PRT <213> artificial <220> <223> Amino acid sequence of fusion protein [SNAPlike-proTEV-moCLEC5A-proTEV-Histag] <400> 98 Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro 1 5 10 15 Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile 20 25 30 Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro 35 40 45 Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr 50 55 60 Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe 65 70 75 80 Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr 85 90 95 Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val 100 105 110 Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr 115 120 125 Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile 130 135 140 Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu 145 150 155 160 Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg 165 170 175 Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser 180 185 190 Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Val Phe 195 200 205 Gly Lys Ser Asn Asp Gly Phe Val Pro Thr Glu Ser Tyr Gly Thr Thr 210 215 220 Ser Val Gln Asn Val Ser Gln Ile Phe Gly Arg Asn Asp Glu Ser Thr 225 230 235 240 Met Pro Thr Arg Ser Tyr Gly Thr Val Cys Pro Arg Asn Trp Asp Phe 245 250 255 His Gln Gly Lys Cys Phe Phe Phe Ser Phe Ser Glu Ser Pro Trp Lys 260 265 270 Asp Ser Met Asp Tyr Cys Ala Thr Gln Gly Ser Thr Leu Ala Ile Val 275 280 285 Asn Thr Pro Glu Lys Leu Lys Tyr Leu Gln Asp Ile Ala Gly Ile Glu 290 295 300 Asn Tyr Phe Ile Gly Leu Val Arg Gln Pro Gly Glu Lys Lys Trp Arg 305 310 315 320 Trp Ile Asn Asn Ser Val Phe Asn Gly Asn Val Thr Asn Gln Asp Gln 325 330 335 Asn Phe Asp Cys Val Thr Ile Gly Leu Thr Lys Thr Tyr Asp Ala Ala 340 345 350 Ser Cys Glu Val Ser Tyr Arg Trp Ile Cys Glu Met Asn Ala Lys Gly 355 360 365 Pro Gly Glu Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser His His 370 375 380 His His His His 385 <210> 99 <211> 1229 <212> DNA <213> artificial <220> <223> DNA sequence encoding ssBiP- SNAPlike -proTEV- soluble form of human C-type like lectin (CLEC5A) - proTEV- Histag for expression in S2 cells <400> 99 atgaagttat gcatattact ggccgtcgtg gtggcctttg ttggcctctc gctcgggaga 60 tctagatctg acaaagactg cgaaatgaaa agaactacat tggattcacc acttgggaag 120 ttggaactga gtggatgcga gcaaggattg catgaaatta agctactggg aaaaggaact 180 tctgctgctg atgcagttga agttccagca ccagcagctg ttcttggagg tcctgagccc 240 ctcatgcaag ccacagcctg gcttaacgca tatttccacc agcctgaggc cattgaggaa 300 tttccagtcc ccgcccttca ccatcctgtg tttcagcagg agagcttcac ccgccaggtc 360 ctgtggaaat tgctgaaggt ggtcaagttt ggtgaagtga tttcatatca gcaacttgct 420 gcattggccg gtaaccccgc agctacagct gccgtgaaaa ctgctctcag cggaaatcct 480 gtgcccatcc tgatcccttg tcacagagtc gtttcatctt ccggagctgt aggtggctat 540 gaaggaggac tggcagttaa ggagtggctg ctggctcatg aaggtcatag acttggaaag 600 cctgggctgg gtcctgctgg tataggcgcg ccagggtccc taggtggcgg atccgaaaac 660 ctgtacttcc agagcgatat ctttaacaaa agtaacgatg gtttcaccac caccaggagc 720 tatggaacag tctcacagat ttttgggagc agttccccaa gtcccaacgg cttcattacc 780 acaaggagct atggaacagt ctgccccaaa gactgggaat tttatcaagc aagatgtttt 840 ttcttatcca cttctgaatc atcttggaat gaaagcaggg acttttgcaa aggaaaaggc 900 tccacattgg caattgtcaa cacgccagag aaactgaagt ttcttcagga cataactgat 960 gctgagaagt attttattgg cttaatttac catcgtgaag agaaaaggtg gcgttggatc 1020 aacaactctg tgttcaatgg caatgttacc aatcagaatc agaatttcaa ctgtgcgacc 1080 attggcctaa caaagacatt tgatgctgca tcatgtgaca tcagctaccg caggatctgt 1140 gagaagaatg ccaaaggccc gggagagaat ctatattttc aagggcccgg cggaggtagt 1200 caccatcatc accatcacta atgaccggt 1229 <210> 100 <211> 385 <212> PRT <213> artificial <220> <223> Amino acid sequence of fusion protein [SNAPlike-proTEV-huCLEC5A-proTEV-Histag] <400> 100 Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro 1 5 10 15 Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile 20 25 30 Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro 35 40 45 Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr 50 55 60 Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe 65 70 75 80 Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr 85 90 95 Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val 100 105 110 Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr 115 120 125 Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile 130 135 140 Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu 145 150 155 160 Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg 165 170 175 Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser 180 185 190 Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Phe Asn 195 200 205 Lys Ser Asn Asp Gly Phe Thr Thr Thr Arg Ser Tyr Gly Thr Val Ser 210 215 220 Gln Ile Phe Gly Ser Ser Ser Pro Ser Pro Asn Gly Phe Ile Thr Thr 225 230 235 240 Arg Ser Tyr Gly Thr Val Cys Pro Lys Asp Trp Glu Phe Tyr Gln Ala 245 250 255 Arg Cys Phe Phe Leu Ser Thr Ser Glu Ser Ser Trp Asn Glu Ser Arg 260 265 270 Asp Phe Cys Lys Gly Lys Gly Ser Thr Leu Ala Ile Val Asn Thr Pro 275 280 285 Glu Lys Leu Lys Phe Leu Gln Asp Ile Thr Asp Ala Glu Lys Tyr Phe 290 295 300 Ile Gly Leu Ile Tyr His Arg Glu Glu Lys Arg Trp Arg Trp Ile Asn 305 310 315 320 Asn Ser Val Phe Asn Gly Asn Val Thr Asn Gln Asn Gln Asn Phe Asn 325 330 335 Cys Ala Thr Ile Gly Leu Thr Lys Thr Phe Asp Ala Ala Ser Cys Asp 340 345 350 Ile Ser Tyr Arg Arg Ile Cys Glu Lys Asn Ala Lys Gly Pro Gly Glu 355 360 365 Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser His His His His His 370 375 380 His 385 <210> 101 <211> 962 <212> DNA <213> artificial <220> <223> DNA sequence encoding BiPlike- SNAPlike- cxVAGO protein from Culex quinquefasciatus - Histag for expression in S2 cells <400> 101 atgaaactat gtattctact tgcagttgtt gcgttcgtag gattgtcctt aagatctgac 60 aaagactgcg aaatgaaaag aactacattg gattcaccac ttgggaagtt ggaactgagt 120 ggatgcgagc aaggattgca tgaaattaag ctactgggaa aaggaacttc tgctgctgat 180 gcagttgaag ttccagcacc agcagctgtt cttggaggtc ctgagcccct catgcaagcc 240 acagcctggc ttaacgcata tttccaccag cctgaggcca ttgaggaatt tccagtcccc 300 gcccttcacc atcctgtgtt tcagcaggag agcttcaccc gccaggtcct gtggaaattg 360 ctgaaggtgg tcaagtttgg tgaagtgatt tcatatcagc aacttgctgc attggccggt 420 aaccccgcag ctacagctgc cgtgaaaact gctctcagcg gaaatcctgt gcccatcctg 480 atcccttgtc acagagtcgt ttcatcttcc ggagctgtag gtggctatga aggaggactg 540 gcagttaagg agtggctgct ggctcatgaa ggtcatagac ttggaaagcc tgggctgggt 600 cctgctggta taggcgcgcc agggtccctg gagggaggtg gcgggtctga agccgttcta 660 caaaatgccg agcatccaga ttaccctgga aagtgttacg acgaaggtac gcagaccgtt 720 gtagctcccc tagaaagtgc gaagctacca aaatcgtgta caaaggtatt ctgctcgact 780 aacctttcac tgacctatac tacgtgtggg tcagtacttg tcaatgaccc gcactgcgag 840 aagatcgaac aagacctgac taaagacttc ccagagtgct gtcacaagta taaatgtgaa 900 ctggagggag tagtcacgta ccacggaggt ggccatcacc atcaccatca ctgatgaccg 960 gt 962 <210> 102 <211> 300 <212> PRT <213> artificial <220> <223> Amino acid sequence of fusion protein [SNAPlike-cxVAGO-Histag] <400> 102 Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro 1 5 10 15 Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile 20 25 30 Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro 35 40 45 Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr 50 55 60 Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe 65 70 75 80 Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr 85 90 95 Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val 100 105 110 Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr 115 120 125 Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile 130 135 140 Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu 145 150 155 160 Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg 165 170 175 Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser 180 185 190 Leu Glu Gly Gly Gly Gly Ser Glu Ala Val Leu Gln Asn Ala Glu His 195 200 205 Pro Asp Tyr Pro Gly Lys Cys Tyr Asp Glu Gly Thr Gln Thr Val Val 210 215 220 Ala Pro Leu Glu Ser Ala Lys Leu Pro Lys Ser Cys Thr Lys Val Phe 225 230 235 240 Cys Ser Thr Asn Leu Ser Leu Thr Tyr Thr Thr Cys Gly Ser Val Leu 245 250 255 Val Asn Asp Pro His Cys Glu Lys Ile Glu Gln Asp Leu Thr Lys Asp 260 265 270 Phe Pro Glu Cys Cys His Lys Tyr Lys Cys Glu Leu Glu Gly Val Val 275 280 285 Thr Tyr His Gly Gly Gly His His His His His His 290 295 300 <210> 103 <211> 962 <212> DNA <213> artificial <220> <223> DNA sequence encoding BiPlike- SNAPlike- aaVAGO protein from Aedes albopictus - Histag for expression in S2 cells <400> 103 atgaaactat gtattctact tgcagttgtt gcgttcgtag gattgtcctt aagatctgac 60 aaagactgcg aaatgaaaag aactacattg gattcaccac ttgggaagtt ggaactgagt 120 ggatgcgagc aaggattgca tgaaattaag ctactgggaa aaggaacttc tgctgctgat 180 gcagttgaag ttccagcacc agcagctgtt cttggaggtc ctgagcccct catgcaagcc 240 acagcctggc ttaacgcata tttccaccag cctgaggcca ttgaggaatt tccagtcccc 300 gcccttcacc atcctgtgtt tcagcaggag agcttcaccc gccaggtcct gtggaaattg 360 ctgaaggtgg tcaagtttgg tgaagtgatt tcatatcagc aacttgctgc attggccggt 420 aaccccgcag ctacagctgc cgtgaaaact gctctcagcg gaaatcctgt gcccatcctg 480 atcccttgtc acagagtcgt ttcatcttcc ggagctgtag gtggctatga aggaggactg 540 gcagttaagg agtggctgct ggctcatgaa ggtcatagac ttggaaagcc tgggctgggt 600 cctgctggta taggcgcgcc agggtccctg gagggaggtg gcgggtctac ggctatcttc 660 ccaaattcgg agaacaaaga tttcccaggc gaatgctatg acacggagac taagattcat 720 ttcaagccag gggaaaatcg tcaacgacct ggcaactgtg aagagatgtc atgcggaact 780 gacttctcga ttcacttttt cggatgcgga ctagctatac tagacgatga cccggattgc 840 gagatcccag ttcaggattt cacaaaggac acgcagtgtt gccataagta caagtgtgtg 900 cgtaacggtg aagtcaatta cattggaggt ggccatcacc atcaccatca ctgatgaccg 960 gt 962 <210> 104 <211> 300 <212> PRT <213> artificial <220> <223> Amino acid sequence of fusion protein [SNAPlike-aaVAGO-Histag] <400> 104 Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro 1 5 10 15 Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile 20 25 30 Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro 35 40 45 Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr 50 55 60 Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe 65 70 75 80 Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr 85 90 95 Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val 100 105 110 Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr 115 120 125 Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile 130 135 140 Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu 145 150 155 160 Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg 165 170 175 Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser 180 185 190 Leu Glu Gly Gly Gly Gly Ser Thr Ala Ile Phe Pro Asn Ser Glu Asn 195 200 205 Lys Asp Phe Pro Gly Glu Cys Tyr Asp Thr Glu Thr Lys Ile His Phe 210 215 220 Lys Pro Gly Glu Asn Arg Gln Arg Pro Gly Asn Cys Glu Glu Met Ser 225 230 235 240 Cys Gly Thr Asp Phe Ser Ile His Phe Phe Gly Cys Gly Leu Ala Ile 245 250 255 Leu Asp Asp Asp Pro Asp Cys Glu Ile Pro Val Gln Asp Phe Thr Lys 260 265 270 Asp Thr Gln Cys Cys His Lys Tyr Lys Cys Val Arg Asn Gly Glu Val 275 280 285 Asn Tyr Ile Gly Gly Gly His His His His His His 290 295 300 <210> 105 <211> 4108 <212> DNA <213> artificial <220> <223> DNA sequence of OpIE2SP-SNAP cloned into pUC57 for constitutive expression of secreted chimeric SNAP-target protein in invertebrate cells <400> 105 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300 tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 tttcccagtc acgacgttgt aaaacgacgg ccagtggaat tctcatgatg ataaacaatg 420 tatggtgcta atgttgcttc aacaacaatt ctgttgaact gtgttttcat gtttgccaac 480 aagcaccttt atactcggtg gcctccccac caccaacttt tttgcactgc aaaaaaacac 540 gcttttgcac gcgggcccat acatagtaca aactctacgt ttcgtagact attttacata 600 aatagtctac accgttgtat acgctccaaa tacactacca cacattgaac ctttttgcag 660 tgcaaaaaag tacgtgtcgg cagtcacgta ggccggcctt atcgggtcgc gtcctgtcac 720 gtacgaatca cattatcgga ccggacgagt gttgtcttat cgtgacagga cgccagcttc 780 ctgtgttgct aaccgcagcc ggacgcaact ccttatcgga acaggacgcg cctccatatc 840 agccgcgcgt tatctcatgc gcgtgaccgg acacgaggcg cccgtcccgc ttatcgcgcc 900 tataaataca gcccgcaacg atctggtaaa cacagttgaa cagcatctgt tcgaaggatc 960 cttgatcgag ctagcatgaa actatgtatt ctacttgcag ttgttgcgtt cgtaggattg 1020 tccttaagat ctgacaaaga ctgcgaaatg aaaagaacta cattggattc accacttggg 1080 aagttggaac tgagtggatg cgagcaagga ttgcatgaaa ttaagctact gggaaaagga 1140 acttctgctg ctgatgcagt tgaagttcca gcaccagcag ctgttcttgg aggtcctgag 1200 cccctcatgc aagccacagc ctggcttaac gcatatttcc accagcctga ggccattgag 1260 gaatttccag tccccgccct tcaccatcct gtgtttcagc aggagagctt cacccgccag 1320 gtcctgtgga aattgctgaa ggtggtcaag tttggtgaag tgatttcata tcagcaactt 1380 gctgcattgg ccggtaaccc cgcagctaca gctgccgtga aaactgctct cagcggaaat 1440 cctgtgccca tcctgatccc ttgtcacaga gtcgtttcat cttccggagc tgtaggtggc 1500 tatgaaggag gactggcagt taaggagtgg ctgctggctc atgaaggtca tagacttgga 1560 aagcctgggc tgggtcctgc tggtataggc gcgccagggt ccctaggtgg cggatccgaa 1620 aacctgtact tccagagcga tatcggaggt ggaggcccgg gaggtggcgg aagtgactat 1680 aaagatgacg acgataagtg ataagcggcc gcaaaaccgg ttgagtttat ctgactaaat 1740 cttagtttgt attgtcatgt tttaatacaa tatgttatgt ttaaatatgt ttttaataaa 1800 ttttataaaa taatttcaac ttttattgta acaacattgt ccatttacac actcctttca 1860 agcgcgtgaa gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg 1920 ctcacaattc cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa 1980 tgagtgagct aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac 2040 ctgtcgtgcc agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt 2100 gggcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga 2160 gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca 2220 ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg 2280 ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt 2340 cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc 2400 ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct 2460 tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc ggtgtaggtc 2520 gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta 2580 tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca 2640 gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag 2700 tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc tctgctgaag 2760 ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt 2820 agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa 2880 gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg 2940 attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga 3000 agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta 3060 atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc 3120 cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg 3180 ataccgcgag acccacgctc accggctcca gatttatcag caataaacca gccagccgga 3240 agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt 3300 tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt 3360 gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc 3420 caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc 3480 ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca 3540 gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag 3600 tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg 3660 tcaatacggg ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa 3720 cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa 3780 cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga 3840 gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga 3900 atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta ttgtctcatg 3960 agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt 4020 ccccgaaaag tgccacctga cgtctaagaa accattatta tcatgacatt aacctataaa 4080 aataggcgta tcacgaggcc ctttcgtc 4108 <210> 106 <211> 24 <212> DNA <213> artificial <220> <223> DNA sequence of C-term peptide tag of OpIE2SP-SNAP <400> 106 gactataaag atgacgacga taag 24 <210> 107 <211> 8 <212> PRT <213> artificial <220> <223> Amino acid sequence of C-term peptide tag of OpIE2SP-SNAP <400> 107 Asp Tyr Lys Asp Asp Asp Asp Lys 1 5 <210> 108 <211> 2200 <212> DNA <213> artificial <220> <223> DNA sequence encoding ssBiP-SNAPlike-proTEV1-N nucleoprotein of the Crimean-Congo hemorragic fever virus-proTEV2-Histag for expression in S2 cells <400> 108 atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60 gacaaagact gcgaaatgaa aagaactaca ttggattcac cacttgggaa gttggaactg 120 agtggatgcg agcaaggatt gcatgaaatt aagctactgg gaaaaggaac ttctgctgct 180 gatgcagttg aagttccagc accagcagct gttcttggag gtcctgagcc cctcatgcaa 240 gccacagcct ggcttaacgc atatttccac cagcctgagg ccattgagga atttccagtc 300 cccgcccttc accatcctgt gtttcagcag gagagcttca cccgccaggt cctgtggaaa 360 ttgctgaagg tggtcaagtt tggtgaagtg atttcatatc agcaacttgc tgcattggcc 420 ggtaaccccg cagctacagc tgccgtgaaa actgctctca gcggaaatcc tgtgcccatc 480 ctgatccctt gtcacagagt cgtttcatct tccggagctg taggtggcta tgaaggagga 540 ctggcagtta aggagtggct gctggctcat gaaggtcata gacttggaaa gcctgggctg 600 ggtcctgctg gtataggcgc gccagggtcc ctaggtggcg gatccgaaaa cctgtacttc 660 cagagcgata tcgaaaacaa gatcgaggtg aataacaaag atgagatgaa caggtggttt 720 gaagagttca aaaaaggaaa tggacttgtg gacaccttca caaactccta ttccttttgc 780 gagagtgttc ccaatttgga caggtttgtg tttcagatgg ccagtgccac cgatgatgca 840 cagaaggact ccatctacgc atctgctctg gtggaggcaa caaagttttg tgcacctata 900 tatgagtgcg catgggttag ctccactggc attgtaaaaa agggacttga atggttcgag 960 aaaaatgcag gaaccattaa gtcctgggat gaaagttata ctgagctaaa ggtcgacgtc 1020 ccgaaaatag agcagcttac gggttaccaa caagctgcct tgaagtggag aaaagacata 1080 ggtttccgtg tcaatgccaa cacagcagct ctgagcaaca aagtcctcgc agaatacaaa 1140 gtccctggtg agattgtgat gtctgtcaaa gagatgctgt cagacatgat taggagaagg 1200 aacctgattc taaacagggg tggtgatgag aacccacgtg gcccagtgag ccatgagcat 1260 gtagactggt gcagggagtt tgtcaaaggc aaatacatca tggccttcaa cccaccatgg 1320 ggggacatca acaagtcagg ccgttcagga atagcacttg ttgcaacagg ccttgctaag 1380 cttgcagaga ctgaaggaaa gggaatattt gatgaagcca aaaagactgt ggaggccctc 1440 aacgggtatc tggacaagca taaggacgaa gttgatagag caagcgccga cagcatgata 1500 acaaaccttc ttaagcatat tgccaaggca caggagctct ataaaaattc atctgcactt 1560 cgtgcacaaa gcgcacagat tgacactgct ttcagctcat actattggct ttacaaggct 1620 ggcgtgactc ctgaaacctt cccgacggtg tcacagttcc tctttgagct agggaaacag 1680 ccaagaggta ccaagaaaat gaagaaggct cttctgagca ccccaatgaa gtgggggaag 1740 aagctttatg agctctttgc cgatgattct ttccagcaga acaggattta catgcatcct 1800 gccgtgctta cagctggtag aatcagtgaa atgggagtct gctttgggac aatccctgtg 1860 gccaatcctg atgatgctgc ccaaggatct ggacacacta agtctattct caacctccgt 1920 accaacactg agaccaataa tccgtgtgcc aaaaccatcg tcaagctatt tgaagttcaa 1980 aaaacagggt tcaacattca ggacatggac atagtggcct ctgagcactt gctacaccaa 2040 tcccttgttg gcaagcaatc cccattccag aacgcctaca acgtcaaggg caatgccacc 2100 agtgctaaca tcatcccggg agagaatcta tattttcaag ggcccggcgg aggtagtcac 2160 catcatcacc atcactaatg accggtgcgg ccgcaagctt 2200 <210> 109 <211> 707 <212> PRT <213> artificial <220> <223> Amino acid sequence of fusion protein [SNAPlike-proTEV1-CCHF.N-proTEV2-Histag] <400> 109 Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro 1 5 10 15 Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile 20 25 30 Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro 35 40 45 Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr 50 55 60 Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe 65 70 75 80 Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr 85 90 95 Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val 100 105 110 Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr 115 120 125 Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile 130 135 140 Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu 145 150 155 160 Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg 165 170 175 Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser 180 185 190 Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Glu Asn 195 200 205 Lys Ile Glu Val Asn Asn Lys Asp Glu Met Asn Arg Trp Phe Glu Glu 210 215 220 Phe Lys Lys Gly Asn Gly Leu Val Asp Thr Phe Thr Asn Ser Tyr Ser 225 230 235 240 Phe Cys Glu Ser Val Pro Asn Leu Asp Arg Phe Val Phe Gln Met Ala 245 250 255 Ser Ala Thr Asp Asp Ala Gln Lys Asp Ser Ile Tyr Ala Ser Ala Leu 260 265 270 Val Glu Ala Thr Lys Phe Cys Ala Pro Ile Tyr Glu Cys Ala Trp Val 275 280 285 Ser Ser Thr Gly Ile Val Lys Lys Gly Leu Glu Trp Phe Glu Lys Asn 290 295 300 Ala Gly Thr Ile Lys Ser Trp Asp Glu Ser Tyr Thr Glu Leu Lys Val 305 310 315 320 Asp Val Pro Lys Ile Glu Gln Leu Thr Gly Tyr Gln Gln Ala Ala Leu 325 330 335 Lys Trp Arg Lys Asp Ile Gly Phe Arg Val Asn Ala Asn Thr Ala Ala 340 345 350 Leu Ser Asn Lys Val Leu Ala Glu Tyr Lys Val Pro Gly Glu Ile Val 355 360 365 Met Ser Val Lys Glu Met Leu Ser Asp Met Ile Arg Arg Arg Asn Leu 370 375 380 Ile Leu Asn Arg Gly Gly Asp Glu Asn Pro Arg Gly Pro Val Ser His 385 390 395 400 Glu His Val Asp Trp Cys Arg Glu Phe Val Lys Gly Lys Tyr Ile Met 405 410 415 Ala Phe Asn Pro Pro Trp Gly Asp Ile Asn Lys Ser Gly Arg Ser Gly 420 425 430 Ile Ala Leu Val Ala Thr Gly Leu Ala Lys Leu Ala Glu Thr Glu Gly 435 440 445 Lys Gly Ile Phe Asp Glu Ala Lys Lys Thr Val Glu Ala Leu Asn Gly 450 455 460 Tyr Leu Asp Lys His Lys Asp Glu Val Asp Arg Ala Ser Ala Asp Ser 465 470 475 480 Met Ile Thr Asn Leu Leu Lys His Ile Ala Lys Ala Gln Glu Leu Tyr 485 490 495 Lys Asn Ser Ser Ala Leu Arg Ala Gln Ser Ala Gln Ile Asp Thr Ala 500 505 510 Phe Ser Ser Tyr Tyr Trp Leu Tyr Lys Ala Gly Val Thr Pro Glu Thr 515 520 525 Phe Pro Thr Val Ser Gln Phe Leu Phe Glu Leu Gly Lys Gln Pro Arg 530 535 540 Gly Thr Lys Lys Met Lys Lys Ala Leu Leu Ser Thr Pro Met Lys Trp 545 550 555 560 Gly Lys Lys Leu Tyr Glu Leu Phe Ala Asp Asp Ser Phe Gln Gln Asn 565 570 575 Arg Ile Tyr Met His Pro Ala Val Leu Thr Ala Gly Arg Ile Ser Glu 580 585 590 Met Gly Val Cys Phe Gly Thr Ile Pro Val Ala Asn Pro Asp Asp Ala 595 600 605 Ala Gln Gly Ser Gly His Thr Lys Ser Ile Leu Asn Leu Arg Thr Asn 610 615 620 Thr Glu Thr Asn Asn Pro Cys Ala Lys Thr Ile Val Lys Leu Phe Glu 625 630 635 640 Val Gln Lys Thr Gly Phe Asn Ile Gln Asp Met Asp Ile Val Ala Ser 645 650 655 Glu His Leu Leu His Gln Ser Leu Val Gly Lys Gln Ser Pro Phe Gln 660 665 670 Asn Ala Tyr Asn Val Lys Gly Asn Ala Thr Ser Ala Asn Ile Ile Pro 675 680 685 Gly Glu Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser His His His 690 695 700 His His His 705 <210> 110 <211> 2974 <212> DNA <213> artificial <220> <223> DNA sequence encoding ssBiP-SNAPlike-proTEV1-N nucleoprotein of the Ebola virus-proTEV2-Histag for expression in S2 cells <400> 110 atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60 gacaaagact gcgaaatgaa aagaactaca ttggattcac cacttgggaa gttggaactg 120 agtggatgcg agcaaggatt gcatgaaatt aagctactgg gaaaaggaac ttctgctgct 180 gatgcagttg aagttccagc accagcagct gttcttggag gtcctgagcc cctcatgcaa 240 gccacagcct ggcttaacgc atatttccac cagcctgagg ccattgagga atttccagtc 300 cccgcccttc accatcctgt gtttcagcag gagagcttca cccgccaggt cctgtggaaa 360 ttgctgaagg tggtcaagtt tggtgaagtg atttcatatc agcaacttgc tgcattggcc 420 ggtaaccccg cagctacagc tgccgtgaaa actgctctca gcggaaatcc tgtgcccatc 480 ctgatccctt gtcacagagt cgtttcatct tccggagctg taggtggcta tgaaggagga 540 ctggcagtta aggagtggct gctggctcat gaaggtcata gacttggaaa gcctgggctg 600 ggtcctgctg gtataggcgc gccagggtcc ctaggtggcg gatccgaaaa cctgtacttc 660 cagagcgata tcgattctcg tcctcagaaa atctggatgg cgccgagtct cactgaatct 720 gacatggatt accacaaaat cttgacagca ggtctgtccg ttcaacaggg gattgttcgg 780 caaagagtca tcccagtgta tcaagtaaac aatcttgaag aaatttgcca acttatcata 840 caggcctttg aagcaggtgt tgattttcaa gagagtgcgg acagtttcct tctcatgctt 900 tgtcttcatc atgcgtacca gggagattac aaacttttct tggaaagtgg cgcagtcaag 960 tatttggaag ggcacgggtt ccgttttgaa gtcaagaagc gtgatggagt gaagcgcctt 1020 gaggaattgc tgccagcagt atctagtgga aaaaacatta agagaacact tgctgccatg 1080 ccggaagagg agacaactga agctaatgcc ggtcagtttc tctcctttgc aagtctattc 1140 cttccgaaat tggtagtagg agaaaaggct tgccttgaga aggttcaaag gcaaattcaa 1200 gtacatgcag agcaaggact gatacaatat ccaacagctt ggcaatcagt aggacacatg 1260 atggtgattt tccgtttgat gcgaacaaat tttctgatca aatttctcct aatacaccaa 1320 gggatgcaca tggttgccgg gcatgatgcc aacgatgctg tgatttcaaa ttcagtggct 1380 caagctcgtt tttcaggctt attgattgtc aaaacagtac ttgatcatat cctacaaaag 1440 acagaacgag gagttcgtct ccatcctctt gcaaggaccg ccaaggtaaa aaatgaggtg 1500 aactccttta aggctgcact cagctccctg gccaagcatg gagagtatgc tcctttcgcc 1560 cgacttttga acctttctgg agtaaataat cttgagcatg gtcttttccc tcaactatcg 1620 gcaattgcac tcggagtcgc cacagcacac gggagtaccc tcgcaggagt aaatgttgga 1680 gaacagtatc aacaactcag agaggctgcc actgaggctg agaagcaact ccaacaatat 1740 gcagagtctc gcgaacttga ccatcttgga cttgatgatc aggaaaagaa aattcttatg 1800 aacttccatc agaaaaagaa cgaaatcagc ttccagcaaa caaacgctat ggtaactcta 1860 agaaaagagc gcctggccaa gctgacagaa gctatcactg ctgcgtcact gcccaaaaca 1920 agtggacatt acgatgatga tgacgacatt ccctttccag gacccatcaa tgatgacgac 1980 aatcctggcc atcaagatga tgatccgact gactcacagg atacgaccat tcccgatgtg 2040 gtggttgatc ccgatgatgg aagctacggc gaataccaga gttactcgga aaacggcatg 2100 aatgcaccag atgacttggt cctattcgat ctggacgagg acgacgagga cactaagcca 2160 gtgcctaata gatcgaccaa gggtggacaa cagaagaaca gtcaaaaggg ccagcatata 2220 gagggcagac agacacaatc caggccaatt caaaatgtcc caggccctca cagaacaatc 2280 caccacgcca gtgcgccact cacggacaat gacagaagaa atgaaccctc cggctcaacc 2340 agccctcgca tgctgacacc aattaacgaa gaggcagacc cactggacga tgccgacgac 2400 gagacgtcta gccttccgcc cttggagtca gatgatgaag agcaggacag ggacggaact 2460 tccaaccgca cacccactgt cgccccaccg gctcccgtat acagagatca ctctgaaaag 2520 aaagaactcc cgcaagacga gcaacaagat caggaccaca ctcaagaggc caggaaccag 2580 gacagtgaca acacccagtc agaacactct tttgaggaga tgtatcgcca cattctaaga 2640 tcacaggggc catttgatgc tgttttgtat tatcatatga tgaaggatga gcctgtagtt 2700 ttcagtacca gtgatggcaa agagtacacg tatccagact cccttgaaga ggaatatcca 2760 ccatggctca ctgaaaaaga ggctatgaat gaagagaata gatttgttac attggatggt 2820 caacaatttt attggccggt gatgaatcac aagaataaat tcatggcaat cctgcaacat 2880 catcagggcc cgggagagaa tctatatttt caagggcccg gcggaggtag tcaccatcat 2940 caccatcact aatgaccggt gcggccgcaa gctt 2974 <210> 111 <211> 965 <212> PRT <213> artificial <220> <223> Amino acid sequence of fusion protein [SNAPlike-proTEV1-EBO.N-proTEV2-Histag] <400> 111 Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro 1 5 10 15 Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile 20 25 30 Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro 35 40 45 Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr 50 55 60 Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe 65 70 75 80 Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr 85 90 95 Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val 100 105 110 Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr 115 120 125 Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile 130 135 140 Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu 145 150 155 160 Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg 165 170 175 Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser 180 185 190 Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Asp Ser 195 200 205 Arg Pro Gln Lys Ile Trp Met Ala Pro Ser Leu Thr Glu Ser Asp Met 210 215 220 Asp Tyr His Lys Ile Leu Thr Ala Gly Leu Ser Val Gln Gln Gly Ile 225 230 235 240 Val Arg Gln Arg Val Ile Pro Val Tyr Gln Val Asn Asn Leu Glu Glu 245 250 255 Ile Cys Gln Leu Ile Ile Gln Ala Phe Glu Ala Gly Val Asp Phe Gln 260 265 270 Glu Ser Ala Asp Ser Phe Leu Leu Met Leu Cys Leu His His Ala Tyr 275 280 285 Gln Gly Asp Tyr Lys Leu Phe Leu Glu Ser Gly Ala Val Lys Tyr Leu 290 295 300 Glu Gly His Gly Phe Arg Phe Glu Val Lys Lys Arg Asp Gly Val Lys 305 310 315 320 Arg Leu Glu Glu Leu Leu Pro Ala Val Ser Ser Gly Lys Asn Ile Lys 325 330 335 Arg Thr Leu Ala Ala Met Pro Glu Glu Glu Thr Thr Glu Ala Asn Ala 340 345 350 Gly Gln Phe Leu Ser Phe Ala Ser Leu Phe Leu Pro Lys Leu Val Val 355 360 365 Gly Glu Lys Ala Cys Leu Glu Lys Val Gln Arg Gln Ile Gln Val His 370 375 380 Ala Glu Gln Gly Leu Ile Gln Tyr Pro Thr Ala Trp Gln Ser Val Gly 385 390 395 400 His Met Met Val Ile Phe Arg Leu Met Arg Thr Asn Phe Leu Ile Lys 405 410 415 Phe Leu Leu Ile His Gln Gly Met His Met Val Ala Gly His Asp Ala 420 425 430 Asn Asp Ala Val Ile Ser Asn Ser Val Ala Gln Ala Arg Phe Ser Gly 435 440 445 Leu Leu Ile Val Lys Thr Val Leu Asp His Ile Leu Gln Lys Thr Glu 450 455 460 Arg Gly Val Arg Leu His Pro Leu Ala Arg Thr Ala Lys Val Lys Asn 465 470 475 480 Glu Val Asn Ser Phe Lys Ala Ala Leu Ser Ser Leu Ala Lys His Gly 485 490 495 Glu Tyr Ala Pro Phe Ala Arg Leu Leu Asn Leu Ser Gly Val Asn Asn 500 505 510 Leu Glu His Gly Leu Phe Pro Gln Leu Ser Ala Ile Ala Leu Gly Val 515 520 525 Ala Thr Ala His Gly Ser Thr Leu Ala Gly Val Asn Val Gly Glu Gln 530 535 540 Tyr Gln Gln Leu Arg Glu Ala Ala Thr Glu Ala Glu Lys Gln Leu Gln 545 550 555 560 Gln Tyr Ala Glu Ser Arg Glu Leu Asp His Leu Gly Leu Asp Asp Gln 565 570 575 Glu Lys Lys Ile Leu Met Asn Phe His Gln Lys Lys Asn Glu Ile Ser 580 585 590 Phe Gln Gln Thr Asn Ala Met Val Thr Leu Arg Lys Glu Arg Leu Ala 595 600 605 Lys Leu Thr Glu Ala Ile Thr Ala Ala Ser Leu Pro Lys Thr Ser Gly 610 615 620 His Tyr Asp Asp Asp Asp Asp Ile Pro Phe Pro Gly Pro Ile Asn Asp 625 630 635 640 Asp Asp Asn Pro Gly His Gln Asp Asp Asp Pro Thr Asp Ser Gln Asp 645 650 655 Thr Thr Ile Pro Asp Val Val Val Asp Pro Asp Asp Gly Ser Tyr Gly 660 665 670 Glu Tyr Gln Ser Tyr Ser Glu Asn Gly Met Asn Ala Pro Asp Asp Leu 675 680 685 Val Leu Phe Asp Leu Asp Glu Asp Asp Glu Asp Thr Lys Pro Val Pro 690 695 700 Asn Arg Ser Thr Lys Gly Gly Gln Gln Lys Asn Ser Gln Lys Gly Gln 705 710 715 720 His Ile Glu Gly Arg Gln Thr Gln Ser Arg Pro Ile Gln Asn Val Pro 725 730 735 Gly Pro His Arg Thr Ile His His Ala Ser Ala Pro Leu Thr Asp Asn 740 745 750 Asp Arg Arg Asn Glu Pro Ser Gly Ser Thr Ser Pro Arg Met Leu Thr 755 760 765 Pro Ile Asn Glu Glu Ala Asp Pro Leu Asp Asp Ala Asp Asp Glu Thr 770 775 780 Ser Ser Leu Pro Pro Leu Glu Ser Asp Asp Glu Glu Gln Asp Arg Asp 785 790 795 800 Gly Thr Ser Asn Arg Thr Pro Thr Val Ala Pro Pro Ala Pro Val Tyr 805 810 815 Arg Asp His Ser Glu Lys Lys Glu Leu Pro Gln Asp Glu Gln Gln Asp 820 825 830 Gln Asp His Thr Gln Glu Ala Arg Asn Gln Asp Ser Asp Asn Thr Gln 835 840 845 Ser Glu His Ser Phe Glu Glu Met Tyr Arg His Ile Leu Arg Ser Gln 850 855 860 Gly Pro Phe Asp Ala Val Leu Tyr Tyr His Met Met Lys Asp Glu Pro 865 870 875 880 Val Val Phe Ser Thr Ser Asp Gly Lys Glu Tyr Thr Tyr Pro Asp Ser 885 890 895 Leu Glu Glu Glu Tyr Pro Pro Trp Leu Thr Glu Lys Glu Ala Met Asn 900 905 910 Glu Glu Asn Arg Phe Val Thr Leu Asp Gly Gln Gln Phe Tyr Trp Pro 915 920 925 Val Met Asn His Lys Asn Lys Phe Met Ala Ile Leu Gln His His Gln 930 935 940 Gly Pro Gly Glu Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser His 945 950 955 960 His His His His His 965 <210> 112 <211> 2842 <212> DNA <213> artificial <220> <223> DNA sequence encoding ssBiP-SNAPlike-proTEV1-N nucleoprotein of the Marburg virus-proTEV2-Histag for expression in S2 cells <400> 112 atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60 gacaaagact gcgaaatgaa aagaactaca ttggattcac cacttgggaa gttggaactg 120 agtggatgcg agcaaggatt gcatgaaatt aagctactgg gaaaaggaac ttctgctgct 180 gatgcagttg aagttccagc accagcagct gttcttggag gtcctgagcc cctcatgcaa 240 gccacagcct ggcttaacgc atatttccac cagcctgagg ccattgagga atttccagtc 300 cccgcccttc accatcctgt gtttcagcag gagagcttca cccgccaggt cctgtggaaa 360 ttgctgaagg tggtcaagtt tggtgaagtg atttcatatc agcaacttgc tgcattggcc 420 ggtaaccccg cagctacagc tgccgtgaaa actgctctca gcggaaatcc tgtgcccatc 480 ctgatccctt gtcacagagt cgtttcatct tccggagctg taggtggcta tgaaggagga 540 ctggcagtta aggagtggct gctggctcat gaaggtcata gacttggaaa gcctgggctg 600 ggtcctgctg gtataggcgc gccagggtcc ctaggtggcg gatccgaaaa cctgtacttc 660 cagagcgata tcgatttaca cagtttgttg gagttgggta caaaacccac tgcccctcat 720 gttcgtaata agaaagtgat attatttgac acaaatcatc aggttagtat ctgtaatcag 780 ataatagatg caataaactc agggattgat cttggtgatc tcctagaagg gggtttgctg 840 acgttgtgtg ttgagcatta ctataattct gataaggata aattcaacac aagtcctatc 900 gcgaagtact tacgtgatgc gggctatgaa tttgatgtca tcaagaatgc agatgcaacc 960 cgctttctgg atgtgattcc taatgaacct cattacagcc ctttaattct agcccttaag 1020 acattggaaa gtactgaatc tcagaggggg agaattgggc tctttttatc attttgcagt 1080 cttttcctcc caaaacttgt cgtcggagac cgagctagta tcgaaaaggc tttaagacaa 1140 gtaacagtgc atcaagaaca ggggatcgtc acatacccta atcattggct taccacaggc 1200 cacatgaaag taattttcgg gattttgagg tccagcttca ttttaaagtt tgtgttgatt 1260 catcaaggag taaatttggt gacaggtcat gatgcctatg acagtatcat tagtaattca 1320 gtaggtcaaa ctagattctc aggacttctt atcgtgaaaa cagttctgga gttcatcttg 1380 caaaaaactg attcaggggt gacactacat cctttggtgc ggacctccaa agtaaaaaat 1440 gaagttgcta gtttcaagca ggcgttgagc aacctagccc gacatgggga atacgcacca 1500 tttgcacggg ttctgaattt atcagggatt aacaacctcg aacatggact ctatcctcag 1560 ctttcagcaa ttgcgctggg tgtggcaaca gcacacggca gtacattggc tggtgtcaat 1620 gttggcgaac aatatcaaca actacgagag gcggcacatg atgcggaagt aaaactacaa 1680 aggcgacatg aacatcagga aattcaagct attgccgagg atgacgagga aaggaagata 1740 ttagaacaat tccaccttca gaaaactgaa atcacacaca gtcagacact agccgtcctc 1800 agccagaaac gagaaaaatt agctcgtctc gctgcagaaa ttgaaaacaa tattgtggaa 1860 gatcagggat ttaagcaatc acagaatcgg gtgtcacagt cgtttttgaa tgaccctaca 1920 cctgtggaag taacggttca agccaggccc atgaatcgac caactgctct gcctccccca 1980 gttgacgaca agattgagca tgaatctaca gaagatagct cttcttcaag tagctttgtt 2040 gacttgaatg atccatttgc actgctgaat gaggacgagg atactcttga tgacagtgtc 2100 atgatccccg gcacaacatc gagagaattt caagggattc ctgaaccgcc aagacaatcc 2160 caagacctca ataacagcca aggaaagcag gaagatgaat ccacaaatcc gattaagaaa 2220 cagtttctga gataccaaga attgcctcct gttcaagagg atgatgaatc ggaatacaca 2280 actgactctc aagaaagcat cgaccaacca ggttccgaca atgaacaagg agttgatctt 2340 ccacctcctc cgttgtacgc tcaggaaaaa agacaggacc caatacagca cccagcagca 2400 aaccctcaag atcccttcgg cagtattggt gatgtaaatg gtgacatctt agaacctata 2460 agatcacctt cttcaccatc tgctcctcag gaagacacaa ggatgaggga agcctatgaa 2520 ttgtcgcctg atttcacaaa tgatgaggat aatcagcaga attggccaca aagagtggtg 2580 acaaagaagg gtagaacttt cctttatcct aatgatcttc tgcaaacaaa tcctccagag 2640 tcacttataa cagccctcgt tgaggaatac caaaatcctg tctcagctaa ggagcttcaa 2700 gcagattggc ccgacatgtc atttgatgaa aggagacatg ttgcgatgaa cttgggcccg 2760 ggagagaatc tatattttca agggcccggc ggaggtagtc accatcatca ccatcactaa 2820 tgaccggtgc ggccgcaagc tt 2842 <210> 113 <211> 921 <212> PRT <213> artificial <220> <223> Amino acid sequence of fusion protein [SNAPlike-proTEV1-EBO.N-proTEV2-Histag] <400> 113 Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro 1 5 10 15 Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile 20 25 30 Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro 35 40 45 Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr 50 55 60 Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe 65 70 75 80 Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr 85 90 95 Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val 100 105 110 Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr 115 120 125 Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile 130 135 140 Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu 145 150 155 160 Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg 165 170 175 Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser 180 185 190 Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Asp Leu 195 200 205 His Ser Leu Leu Glu Leu Gly Thr Lys Pro Thr Ala Pro His Val Arg 210 215 220 Asn Lys Lys Val Ile Leu Phe Asp Thr Asn His Gln Val Ser Ile Cys 225 230 235 240 Asn Gln Ile Ile Asp Ala Ile Asn Ser Gly Ile Asp Leu Gly Asp Leu 245 250 255 Leu Glu Gly Gly Leu Leu Thr Leu Cys Val Glu His Tyr Tyr Asn Ser 260 265 270 Asp Lys Asp Lys Phe Asn Thr Ser Pro Ile Ala Lys Tyr Leu Arg Asp 275 280 285 Ala Gly Tyr Glu Phe Asp Val Ile Lys Asn Ala Asp Ala Thr Arg Phe 290 295 300 Leu Asp Val Ile Pro Asn Glu Pro His Tyr Ser Pro Leu Ile Leu Ala 305 310 315 320 Leu Lys Thr Leu Glu Ser Thr Glu Ser Gln Arg Gly Arg Ile Gly Leu 325 330 335 Phe Leu Ser Phe Cys Ser Leu Phe Leu Pro Lys Leu Val Val Gly Asp 340 345 350 Arg Ala Ser Ile Glu Lys Ala Leu Arg Gln Val Thr Val His Gln Glu 355 360 365 Gln Gly Ile Val Thr Tyr Pro Asn His Trp Leu Thr Thr Gly His Met 370 375 380 Lys Val Ile Phe Gly Ile Leu Arg Ser Ser Phe Ile Leu Lys Phe Val 385 390 395 400 Leu Ile His Gln Gly Val Asn Leu Val Thr Gly His Asp Ala Tyr Asp 405 410 415 Ser Ile Ile Ser Asn Ser Val Gly Gln Thr Arg Phe Ser Gly Leu Leu 420 425 430 Ile Val Lys Thr Val Leu Glu Phe Ile Leu Gln Lys Thr Asp Ser Gly 435 440 445 Val Thr Leu His Pro Leu Val Arg Thr Ser Lys Val Lys Asn Glu Val 450 455 460 Ala Ser Phe Lys Gln Ala Leu Ser Asn Leu Ala Arg His Gly Glu Tyr 465 470 475 480 Ala Pro Phe Ala Arg Val Leu Asn Leu Ser Gly Ile Asn Asn Leu Glu 485 490 495 His Gly Leu Tyr Pro Gln Leu Ser Ala Ile Ala Leu Gly Val Ala Thr 500 505 510 Ala His Gly Ser Thr Leu Ala Gly Val Asn Val Gly Glu Gln Tyr Gln 515 520 525 Gln Leu Arg Glu Ala Ala His Asp Ala Glu Val Lys Leu Gln Arg Arg 530 535 540 His Glu His Gln Glu Ile Gln Ala Ile Ala Glu Asp Asp Glu Glu Arg 545 550 555 560 Lys Ile Leu Glu Gln Phe His Leu Gln Lys Thr Glu Ile Thr His Ser 565 570 575 Gln Thr Leu Ala Val Leu Ser Gln Lys Arg Glu Lys Leu Ala Arg Leu 580 585 590 Ala Ala Glu Ile Glu Asn Asn Ile Val Glu Asp Gln Gly Phe Lys Gln 595 600 605 Ser Gln Asn Arg Val Ser Gln Ser Phe Leu Asn Asp Pro Thr Pro Val 610 615 620 Glu Val Thr Val Gln Ala Arg Pro Met Asn Arg Pro Thr Ala Leu Pro 625 630 635 640 Pro Pro Val Asp Asp Lys Ile Glu His Glu Ser Thr Glu Asp Ser Ser 645 650 655 Ser Ser Ser Ser Phe Val Asp Leu Asn Asp Pro Phe Ala Leu Leu Asn 660 665 670 Glu Asp Glu Asp Thr Leu Asp Asp Ser Val Met Ile Pro Gly Thr Thr 675 680 685 Ser Arg Glu Phe Gln Gly Ile Pro Glu Pro Pro Arg Gln Ser Gln Asp 690 695 700 Leu Asn Asn Ser Gln Gly Lys Gln Glu Asp Glu Ser Thr Asn Pro Ile 705 710 715 720 Lys Lys Gln Phe Leu Arg Tyr Gln Glu Leu Pro Pro Val Gln Glu Asp 725 730 735 Asp Glu Ser Glu Tyr Thr Thr Asp Ser Gln Glu Ser Ile Asp Gln Pro 740 745 750 Gly Ser Asp Asn Glu Gln Gly Val Asp Leu Pro Pro Pro Pro Leu Tyr 755 760 765 Ala Gln Glu Lys Arg Gln Asp Pro Ile Gln His Pro Ala Ala Asn Pro 770 775 780 Gln Asp Pro Phe Gly Ser Ile Gly Asp Val Asn Gly Asp Ile Leu Glu 785 790 795 800 Pro Ile Arg Ser Pro Ser Ser Pro Ser Ala Pro Gln Glu Asp Thr Arg 805 810 815 Met Arg Glu Ala Tyr Glu Leu Ser Pro Asp Phe Thr Asn Asp Glu Asp 820 825 830 Asn Gln Gln Asn Trp Pro Gln Arg Val Val Thr Lys Lys Gly Arg Thr 835 840 845 Phe Leu Tyr Pro Asn Asp Leu Leu Gln Thr Asn Pro Pro Glu Ser Leu 850 855 860 Ile Thr Ala Leu Val Glu Glu Tyr Gln Asn Pro Val Ser Ala Lys Glu 865 870 875 880 Leu Gln Ala Asp Trp Pro Asp Met Ser Phe Asp Glu Arg Arg His Val 885 890 895 Ala Met Asn Leu Gly Pro Gly Glu Asn Leu Tyr Phe Gln Gly Pro Gly 900 905 910 Gly Gly Ser His His His His His His 915 920 <210> 114 <211> 2461 <212> DNA <213> artificial <220> <223> DNA sequence encoding ssBiP-SNAPlike-proTEV1-N nucleoprotein of the Lassa virus-proTEV2-Histag for expression in S2 cells <400> 114 atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60 gacaaagact gcgaaatgaa aagaactaca ttggattcac cacttgggaa gttggaactg 120 agtggatgcg agcaaggatt gcatgaaatt aagctactgg gaaaaggaac ttctgctgct 180 gatgcagttg aagttccagc accagcagct gttcttggag gtcctgagcc cctcatgcaa 240 gccacagcct ggcttaacgc atatttccac cagcctgagg ccattgagga atttccagtc 300 cccgcccttc accatcctgt gtttcagcag gagagcttca cccgccaggt cctgtggaaa 360 ttgctgaagg tggtcaagtt tggtgaagtg atttcatatc agcaacttgc tgcattggcc 420 ggtaaccccg cagctacagc tgccgtgaaa actgctctca gcggaaatcc tgtgcccatc 480 ctgatccctt gtcacagagt cgtttcatct tccggagctg taggtggcta tgaaggagga 540 ctggcagtta aggagtggct gctggctcat gaaggtcata gacttggaaa gcctgggctg 600 ggtcctgctg gtataggcgc gccagggtcc ctaggtggcg gatccgaaaa cctgtacttc 660 cagagcgata tcagtgcctc aaaggaaata aaatcctttt tgtggacaca atctttgagg 720 agggaattat ctggttactg ctccaacatc aaactacagg tggtgaaaga tgcccaggct 780 cttttacatg gacttgactt ctccgaagtc agtaatgttc aacggttgat gcgcaaggag 840 agaagggatg acaatgattt gaaacggttg agggacctaa atcaagcggt caacaatctt 900 gttgaattaa aatcaactca acaaaagagt atactgagag ttgggactct aacctcagat 960 gacttattaa tcttagccgc tgacctagag aagttaaagt caaaggtgat cagaacagaa 1020 aggccattaa gtgcaggtgt ctatatgggc aacctaagct cacagcaact tgaccaaaga 1080 agagctctcc tgaatatgat aggaatgagt ggtggtaatc aaggggctcg ggctgggaga 1140 gatggagtgg tgagagtttg ggatgtgaaa aatgcagagt tgctcaataa tcagttcggg 1200 accatgccaa gtctgacact ggcatgtctg acaaaacagg ggcaggttga cttgaatgat 1260 gcagtacaag cattgacaga tttgggtttg atctacacag caaagtatcc caacacttca 1320 gacttagaca ggctgactca aagtcatccc atcctaaata tgattgacac caagaaaagc 1380 tctttgaata tctcaggtta taattttagc ttgggtgcag ctgtgaaggc aggagcttgc 1440 atgctggatg gtggcaatat gttggagaca atcaaggtgt cacctcagac aatggatggt 1500 atcctcaaat ccattttaaa ggtcaagaag gctcttggaa tgttcatttc agacacccct 1560 ggtgaaagga atccttatga aaacatactc tacaagattt gtttgtcagg agatggatgg 1620 ccatatattg catcaagaac ctcaataaca ggaagggcct gggaaaacac tgtcgttgat 1680 ctggaatcag atgggaagcc acagaaagct gacagcaaca attccagtaa atccctgcag 1740 tcggcagggt ttaccgctgg gcttacctat tctcagctga tgaccctcaa ggatgcaatg 1800 ctgcaacttg acccaaatgc taagacctgg atggacattg aaggaagacc tgaagatcca 1860 gtggaaattg ccctctatca accaagttca ggctgctaca tacacttctt ccgtgaacct 1920 actgatttaa agcagttcaa gcaggatgct aagtactcac atgggattga tgtcacagac 1980 ctcttcgcta cacaaccggg cttgaccagt gctgtcattg atgcactccc ccggaatatg 2040 gtcattacct gtcaggggtc cgatgacata aggaaactcc ttgaatcaca aggaagaaaa 2100 gacattaaac taattgatat tgccctcagc aaaactgatt ccaggaagta tgaaaatgca 2160 gtctgggacc agtataaaga cttatgccac atgcacacag gtgtcgttgt tgaaaagaag 2220 aaaagaggcg gtaaagagga aataacccct cactgtgcac taatggactg catcatgttt 2280 gatgcagcag tgtcaggagg actgaacaca tcggttttga gagcagtgct gcccagagat 2340 atggtgttca gaacatcgac acctagagtc gttctcccgg gagagaatct atattttcaa 2400 gggcccggcg gaggtagtca ccatcatcac catcactaat gaccggtgcg gccgcaagct 2460 t 2461 <210> 115 <211> 794 <212> PRT <213> artificial <220> <223> Amino acid sequence of fusion protein [SNAPlike-proTEV1-LAS.N-proTEV2-Histag] <400> 115 Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro 1 5 10 15 Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile 20 25 30 Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro 35 40 45 Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr 50 55 60 Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe 65 70 75 80 Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr 85 90 95 Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val 100 105 110 Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr 115 120 125 Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile 130 135 140 Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu 145 150 155 160 Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg 165 170 175 Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser 180 185 190 Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Ser Ala 195 200 205 Ser Lys Glu Ile Lys Ser Phe Leu Trp Thr Gln Ser Leu Arg Arg Glu 210 215 220 Leu Ser Gly Tyr Cys Ser Asn Ile Lys Leu Gln Val Val Lys Asp Ala 225 230 235 240 Gln Ala Leu Leu His Gly Leu Asp Phe Ser Glu Val Ser Asn Val Gln 245 250 255 Arg Leu Met Arg Lys Glu Arg Arg Asp Asp Asn Asp Leu Lys Arg Leu 260 265 270 Arg Asp Leu Asn Gln Ala Val Asn Asn Leu Val Glu Leu Lys Ser Thr 275 280 285 Gln Gln Lys Ser Ile Leu Arg Val Gly Thr Leu Thr Ser Asp Asp Leu 290 295 300 Leu Ile Leu Ala Ala Asp Leu Glu Lys Leu Lys Ser Lys Val Ile Arg 305 310 315 320 Thr Glu Arg Pro Leu Ser Ala Gly Val Tyr Met Gly Asn Leu Ser Ser 325 330 335 Gln Gln Leu Asp Gln Arg Arg Ala Leu Leu Asn Met Ile Gly Met Ser 340 345 350 Gly Gly Asn Gln Gly Ala Arg Ala Gly Arg Asp Gly Val Val Arg Val 355 360 365 Trp Asp Val Lys Asn Ala Glu Leu Leu Asn Asn Gln Phe Gly Thr Met 370 375 380 Pro Ser Leu Thr Leu Ala Cys Leu Thr Lys Gln Gly Gln Val Asp Leu 385 390 395 400 Asn Asp Ala Val Gln Ala Leu Thr Asp Leu Gly Leu Ile Tyr Thr Ala 405 410 415 Lys Tyr Pro Asn Thr Ser Asp Leu Asp Arg Leu Thr Gln Ser His Pro 420 425 430 Ile Leu Asn Met Ile Asp Thr Lys Lys Ser Ser Leu Asn Ile Ser Gly 435 440 445 Tyr Asn Phe Ser Leu Gly Ala Ala Val Lys Ala Gly Ala Cys Met Leu 450 455 460 Asp Gly Gly Asn Met Leu Glu Thr Ile Lys Val Ser Pro Gln Thr Met 465 470 475 480 Asp Gly Ile Leu Lys Ser Ile Leu Lys Val Lys Lys Ala Leu Gly Met 485 490 495 Phe Ile Ser Asp Thr Pro Gly Glu Arg Asn Pro Tyr Glu Asn Ile Leu 500 505 510 Tyr Lys Ile Cys Leu Ser Gly Asp Gly Trp Pro Tyr Ile Ala Ser Arg 515 520 525 Thr Ser Ile Thr Gly Arg Ala Trp Glu Asn Thr Val Val Asp Leu Glu 530 535 540 Ser Asp Gly Lys Pro Gln Lys Ala Asp Ser Asn Asn Ser Ser Lys Ser 545 550 555 560 Leu Gln Ser Ala Gly Phe Thr Ala Gly Leu Thr Tyr Ser Gln Leu Met 565 570 575 Thr Leu Lys Asp Ala Met Leu Gln Leu Asp Pro Asn Ala Lys Thr Trp 580 585 590 Met Asp Ile Glu Gly Arg Pro Glu Asp Pro Val Glu Ile Ala Leu Tyr 595 600 605 Gln Pro Ser Ser Gly Cys Tyr Ile His Phe Phe Arg Glu Pro Thr Asp 610 615 620 Leu Lys Gln Phe Lys Gln Asp Ala Lys Tyr Ser His Gly Ile Asp Val 625 630 635 640 Thr Asp Leu Phe Ala Thr Gln Pro Gly Leu Thr Ser Ala Val Ile Asp 645 650 655 Ala Leu Pro Arg Asn Met Val Ile Thr Cys Gln Gly Ser Asp Asp Ile 660 665 670 Arg Lys Leu Leu Glu Ser Gln Gly Arg Lys Asp Ile Lys Leu Ile Asp 675 680 685 Ile Ala Leu Ser Lys Thr Asp Ser Arg Lys Tyr Glu Asn Ala Val Trp 690 695 700 Asp Gln Tyr Lys Asp Leu Cys His Met His Thr Gly Val Val Val Glu 705 710 715 720 Lys Lys Lys Arg Gly Gly Lys Glu Glu Ile Thr Pro His Cys Ala Leu 725 730 735 Met Asp Cys Ile Met Phe Asp Ala Ala Val Ser Gly Gly Leu Asn Thr 740 745 750 Ser Val Leu Arg Ala Val Leu Pro Arg Asp Met Val Phe Arg Thr Ser 755 760 765 Thr Pro Arg Val Val Leu Pro Gly Glu Asn Leu Tyr Phe Gln Gly Pro 770 775 780 Gly Gly Gly Ser His His His His His His 785 790 <210> 116 <211> 2446 <212> DNA <213> artificial <220> <223> DNA sequence encoding ssBiP-SNAPlike-proTEV1-N nucleoprotein of the Junin virus-proTEV2-Histag for expression in S2 cells <400> 116 atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60 gacaaagact gcgaaatgaa aagaactaca ttggattcac cacttgggaa gttggaactg 120 agtggatgcg agcaaggatt gcatgaaatt aagctactgg gaaaaggaac ttctgctgct 180 gatgcagttg aagttccagc accagcagct gttcttggag gtcctgagcc cctcatgcaa 240 gccacagcct ggcttaacgc atatttccac cagcctgagg ccattgagga atttccagtc 300 cccgcccttc accatcctgt gtttcagcag gagagcttca cccgccaggt cctgtggaaa 360 ttgctgaagg tggtcaagtt tggtgaagtg atttcatatc agcaacttgc tgcattggcc 420 ggtaaccccg cagctacagc tgccgtgaaa actgctctca gcggaaatcc tgtgcccatc 480 ctgatccctt gtcacagagt cgtttcatct tccggagctg taggtggcta tgaaggagga 540 ctggcagtta aggagtggct gctggctcat gaaggtcata gacttggaaa gcctgggctg 600 ggtcctgctg gtataggcgc gccagggtcc ctaggtggcg gatccgaaaa cctgtacttc 660 cagagcgata tcgcacactc caaggaggtt cctagcttta gatggactca gtccttaagg 720 agaggtttga gccaattcac tcagactgtc aagtcagatg ttttgaagga cgccaagcta 780 attgctgaca gcatcgactt caaccaagtg gcacaggtgc agcgggcact cagaaagact 840 aaaaaggggg aagaagacct caataagttg agggacctga ataaagaggt tgacagactc 900 atgtccatga ggagtgttca acgaaacaca gttttcaagg tgggtgatct ggggagggat 960 gaactgatgg agttggcgtc tgaccttgag aaattaaaaa acaagataag aagagcagag 1020 acaggctctc agggggttta catgggtaac ttgtcccagt cacaacttgc taaaagatca 1080 gagatattga gaacactggg atttcaacag caagggactg ggggaaatgg tgtggtgagg 1140 atatgggatg ttaaagaccc ttcaaagcta aacaatcagt ttggctctgt tcctgcattg 1200 acaattgcat gcatgactgt tcaaggaggt gagacaatga acagtgtcat acaggcttta 1260 acctcacttg ggcttctata cactgtgaag tatccaaact taagtgacct tgacagactg 1320 actcaggaac atgactgcct tcagattgtg actaaagatg aaagctccat caatatttct 1380 ggttacaact tcagtctttc agctgcagta aaggctggag catctattct tgatggtgga 1440 aacatgttgg aaacaatcag agtcacccca gaaaacttct cttccctcat aaaatcaacc 1500 attcaggtta aacgaagaga aggcatgttt attgatgaga aaccaggcaa tagaaatcct 1560 tatgaaaacc ttttgtacaa actttgtctt tctggcgatg gttggcctta tattggttca 1620 agatcacaaa tcacaggcag gtcatgggac aacacaagta ttgatctgac aaggaaacca 1680 gttgctggtc ctagacagcc ggaaaaaaac ggtcagaatt tgagattggc taacttgaca 1740 gagatacaag aagctgtcat cagagaggca gtggggaaac tcgaccccac caacaccctt 1800 tggctcgaca ttgaaggacc agccactgac cctgttgaga tggcattatt ccaacctgca 1860 ggtaagcagt acattcactg cttcagaaaa ccacatgatg agaaagggtt taaaaatggt 1920 agcagacact ctcacggcat cttaatgaag gacatagaag atgcaatgcc aggagttctt 1980 agttacgtga tcggcttgct gcctccagac atggttgtga ctactcaagg ttccgatgac 2040 atcaggaagt tgtttgacct ccatggaaga agggatctta aactggttga tgttaagctc 2100 acatctgaac aagccaggca gtttgatcaa caggtctggg agaaatatgg tcacttatgc 2160 aaatatcaca atggagtggt tgtcaataag aaaaagaggg aaaaggatac tcccttcaag 2220 ttggcctcca gtgaaccaca ctgtgctctg ctagactgca taatgtttca gtcagtgcta 2280 gatgggaagc tctatgagga ggaacctaca cctctattac caccgagctt gctgttcctc 2340 ccgaaggcag cctatgcact cccgggagag aatctatatt ttcaagggcc cggcggaggt 2400 agtcaccatc atcaccatca ctaatgaccg gtgcggccgc aagctt 2446 <210> 117 <211> 789 <212> PRT <213> artificial <220> <223> Aa sequence of fusion protein [SNAPlike-proTEV1-JUN.N-proTEV2-Histag] <400> 117 Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro 1 5 10 15 Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile 20 25 30 Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro 35 40 45 Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr 50 55 60 Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe 65 70 75 80 Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr 85 90 95 Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val 100 105 110 Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr 115 120 125 Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile 130 135 140 Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu 145 150 155 160 Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg 165 170 175 Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser 180 185 190 Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Ala His 195 200 205 Ser Lys Glu Val Pro Ser Phe Arg Trp Thr Gln Ser Leu Arg Arg Gly 210 215 220 Leu Ser Gln Phe Thr Gln Thr Val Lys Ser Asp Val Leu Lys Asp Ala 225 230 235 240 Lys Leu Ile Ala Asp Ser Ile Asp Phe Asn Gln Val Ala Gln Val Gln 245 250 255 Arg Ala Leu Arg Lys Thr Lys Lys Gly Glu Glu Asp Leu Asn Lys Leu 260 265 270 Arg Asp Leu Asn Lys Glu Val Asp Arg Leu Met Ser Met Arg Ser Val 275 280 285 Gln Arg Asn Thr Val Phe Lys Val Gly Asp Leu Gly Arg Asp Glu Leu 290 295 300 Met Glu Leu Ala Ser Asp Leu Glu Lys Leu Lys Asn Lys Ile Arg Arg 305 310 315 320 Ala Glu Thr Gly Ser Gln Gly Val Tyr Met Gly Asn Leu Ser Gln Ser 325 330 335 Gln Leu Ala Lys Arg Ser Glu Ile Leu Arg Thr Leu Gly Phe Gln Gln 340 345 350 Gln Gly Thr Gly Gly Asn Gly Val Val Arg Ile Trp Asp Val Lys Asp 355 360 365 Pro Ser Lys Leu Asn Asn Gln Phe Gly Ser Val Pro Ala Leu Thr Ile 370 375 380 Ala Cys Met Thr Val Gln Gly Gly Glu Thr Met Asn Ser Val Ile Gln 385 390 395 400 Ala Leu Thr Ser Leu Gly Leu Leu Tyr Thr Val Lys Tyr Pro Asn Leu 405 410 415 Ser Asp Leu Asp Arg Leu Thr Gln Glu His Asp Cys Leu Gln Ile Val 420 425 430 Thr Lys Asp Glu Ser Ser Ile Asn Ile Ser Gly Tyr Asn Phe Ser Leu 435 440 445 Ser Ala Ala Val Lys Ala Gly Ala Ser Ile Leu Asp Gly Gly Asn Met 450 455 460 Leu Glu Thr Ile Arg Val Thr Pro Glu Asn Phe Ser Ser Leu Ile Lys 465 470 475 480 Ser Thr Ile Gln Val Lys Arg Arg Glu Gly Met Phe Ile Asp Glu Lys 485 490 495 Pro Gly Asn Arg Asn Pro Tyr Glu Asn Leu Leu Tyr Lys Leu Cys Leu 500 505 510 Ser Gly Asp Gly Trp Pro Tyr Ile Gly Ser Arg Ser Gln Ile Thr Gly 515 520 525 Arg Ser Trp Asp Asn Thr Ser Ile Asp Leu Thr Arg Lys Pro Val Ala 530 535 540 Gly Pro Arg Gln Pro Glu Lys Asn Gly Gln Asn Leu Arg Leu Ala Asn 545 550 555 560 Leu Thr Glu Ile Gln Glu Ala Val Ile Arg Glu Ala Val Gly Lys Leu 565 570 575 Asp Pro Thr Asn Thr Leu Trp Leu Asp Ile Glu Gly Pro Ala Thr Asp 580 585 590 Pro Val Glu Met Ala Leu Phe Gln Pro Ala Gly Lys Gln Tyr Ile His 595 600 605 Cys Phe Arg Lys Pro His Asp Glu Lys Gly Phe Lys Asn Gly Ser Arg 610 615 620 His Ser His Gly Ile Leu Met Lys Asp Ile Glu Asp Ala Met Pro Gly 625 630 635 640 Val Leu Ser Tyr Val Ile Gly Leu Leu Pro Pro Asp Met Val Val Thr 645 650 655 Thr Gln Gly Ser Asp Asp Ile Arg Lys Leu Phe Asp Leu His Gly Arg 660 665 670 Arg Asp Leu Lys Leu Val Asp Val Lys Leu Thr Ser Glu Gln Ala Arg 675 680 685 Gln Phe Asp Gln Gln Val Trp Glu Lys Tyr Gly His Leu Cys Lys Tyr 690 695 700 His Asn Gly Val Val Val Asn Lys Lys Lys Arg Glu Lys Asp Thr Pro 705 710 715 720 Phe Lys Leu Ala Ser Ser Glu Pro His Cys Ala Leu Leu Asp Cys Ile 725 730 735 Met Phe Gln Ser Val Leu Asp Gly Lys Leu Tyr Glu Glu Glu Pro Thr 740 745 750 Pro Leu Leu Pro Pro Ser Leu Leu Phe Leu Pro Lys Ala Ala Tyr Ala 755 760 765 Leu Pro Gly Glu Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser His 770 775 780 His His His His His 785 <210> 118 <211> 2446 <212> DNA <213> artificial <220> <223> DNA sequence encoding ssBiP-SNAPlike-proTEV1-N nucleoprotein of the Machupo virus-proTEV2-Histag for expression in S2 cells <400> 118 atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60 gacaaagact gcgaaatgaa aagaactaca ttggattcac cacttgggaa gttggaactg 120 agtggatgcg agcaaggatt gcatgaaatt aagctactgg gaaaaggaac ttctgctgct 180 gatgcagttg aagttccagc accagcagct gttcttggag gtcctgagcc cctcatgcaa 240 gccacagcct ggcttaacgc atatttccac cagcctgagg ccattgagga atttccagtc 300 cccgcccttc accatcctgt gtttcagcag gagagcttca cccgccaggt cctgtggaaa 360 ttgctgaagg tggtcaagtt tggtgaagtg atttcatatc agcaacttgc tgcattggcc 420 ggtaaccccg cagctacagc tgccgtgaaa actgctctca gcggaaatcc tgtgcccatc 480 ctgatccctt gtcacagagt cgtttcatct tccggagctg taggtggcta tgaaggagga 540 ctggcagtta aggagtggct gctggctcat gaaggtcata gacttggaaa gcctgggctg 600 ggtcctgctg gtataggcgc gccagggtcc ctaggtggcg gatccgaaaa cctgtacttc 660 cagagcgata tcgctcactc caaggaaatt cccagctttc ggtggactca gtcactgaga 720 agaggcctga gtcagttcac ccacactgtg aaaacagatg tgttgaaaga tgccaagctc 780 atagctgaca gcatcgactt caaccaggtt tcacaagtgc agagggctct cagaaagaac 840 aaaaggggtg aagaggatct gaacaagctg agggatttaa acaaagaagt ggataggctc 900 atgtctatga aaagcatcca gaaaaacacc atattcaaga ttggtgatct ggggagagat 960 gaattgatgg agcttgcatc agacttggaa aaactgaaga acaagataaa gaggactgag 1020 tcaggtcccc aagggctgta catgggtaat ttgtcacagc tgcaactgac aaagaggtca 1080 gaaatcttga agaccctggg attccaacag cagagaggtg ctggaaatgg tgtggttaga 1140 atctgggatg tctcagatcc atcaaaactg aataatcagt ttggttccat gccagctctc 1200 acaatcgctt gtatgactgt ccagggtgga gaaacgatga atagtgtggt ccaagcgttg 1260 acatctctgg gcctgttata cactgttaaa tatccgaatt taaatgacct tgacaagcta 1320 acactagagc acgaatgctt gcagatcgta actaaggacg agagctccat caacatctct 1380 ggctataact tcagtctgtc agctgctgtg aaagctggcg cctcaatact tgacggtggg 1440 aacatgctgg aaacaattag ggtcactcct gataatttct ccagcttgat taaatcaact 1500 ctgcaagtca agcgaaaaga ggggatgttt atagacgaga aacctgggaa tcgaaatcct 1560 tatgagaacc ttctgtataa attgtgtctc tcaggtgacg ggtggcctta cattggttcc 1620 agatcacaaa ttcttgggag gtcttgggac aacacaagtg ttgatctaac aaagaaacct 1680 caagttggac cgagacaacc cgagaaaaac ggtcagaatc taagactagc aaacctgact 1740 gaaatgcaag aagcagtgat taaagaggct gtaaagaagt tagaccccac taatacactg 1800 tggcttgaca ttgaagggcc tccaacagac cctgtggaat tggcactata tcagccagcc 1860 aacaagcatt atattcattg ttttagaaag ccacatgatg agaagggctt caaaaatggc 1920 agcagacatt cacatggcat cttgatgcaa gacatcgagg atgcaatgcc aggagtatta 1980 agttatgtaa taggtttact accacaagat atggtgatta caactcaagg ttctgacgac 2040 ataaggaaac ttttagacat tcatggacgg aaggatttaa agctggtaga tgtgaaactc 2100 acatctgatc aagcaagact ctatgatcag caaatttggg agaagtttgg acatctttgc 2160 aaacatcata atggagttgt tgtcaacaag aaaaagagag aaaaagactc tccattcaaa 2220 ttgagttctg gtgaacctca ctgtgctctg ttggattgta tcatgtatca atcagtgatg 2280 gatggcaaaa tggtagatga agaaccagtg gcacttttac ctctcagcct tctatttcta 2340 cccaaggcag cctttgcact cccgggagag aatctatatt ttcaagggcc cggcggaggt 2400 agtcaccatc atcaccatca ctaatgaccg gtgcggccgc aagctt 2446 <210> 119 <211> 789 <212> PRT <213> artificial <220> <223> Amino acid sequence of fusion protein [SNAPlike-proTEV1-MAC.N-proTEV2-Histag] <400> 119 Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro 1 5 10 15 Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile 20 25 30 Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro 35 40 45 Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr 50 55 60 Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe 65 70 75 80 Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr 85 90 95 Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val 100 105 110 Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr 115 120 125 Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile 130 135 140 Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu 145 150 155 160 Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg 165 170 175 Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser 180 185 190 Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Ala His 195 200 205 Ser Lys Glu Ile Pro Ser Phe Arg Trp Thr Gln Ser Leu Arg Arg Gly 210 215 220 Leu Ser Gln Phe Thr His Thr Val Lys Thr Asp Val Leu Lys Asp Ala 225 230 235 240 Lys Leu Ile Ala Asp Ser Ile Asp Phe Asn Gln Val Ser Gln Val Gln 245 250 255 Arg Ala Leu Arg Lys Asn Lys Arg Gly Glu Glu Asp Leu Asn Lys Leu 260 265 270 Arg Asp Leu Asn Lys Glu Val Asp Arg Leu Met Ser Met Lys Ser Ile 275 280 285 Gln Lys Asn Thr Ile Phe Lys Ile Gly Asp Leu Gly Arg Asp Glu Leu 290 295 300 Met Glu Leu Ala Ser Asp Leu Glu Lys Leu Lys Asn Lys Ile Lys Arg 305 310 315 320 Thr Glu Ser Gly Pro Gln Gly Leu Tyr Met Gly Asn Leu Ser Gln Leu 325 330 335 Gln Leu Thr Lys Arg Ser Glu Ile Leu Lys Thr Leu Gly Phe Gln Gln 340 345 350 Gln Arg Gly Ala Gly Asn Gly Val Val Arg Ile Trp Asp Val Ser Asp 355 360 365 Pro Ser Lys Leu Asn Asn Gln Phe Gly Ser Met Pro Ala Leu Thr Ile 370 375 380 Ala Cys Met Thr Val Gln Gly Gly Glu Thr Met Asn Ser Val Val Gln 385 390 395 400 Ala Leu Thr Ser Leu Gly Leu Leu Tyr Thr Val Lys Tyr Pro Asn Leu 405 410 415 Asn Asp Leu Asp Lys Leu Thr Leu Glu His Glu Cys Leu Gln Ile Val 420 425 430 Thr Lys Asp Glu Ser Ser Ile Asn Ile Ser Gly Tyr Asn Phe Ser Leu 435 440 445 Ser Ala Ala Val Lys Ala Gly Ala Ser Ile Leu Asp Gly Gly Asn Met 450 455 460 Leu Glu Thr Ile Arg Val Thr Pro Asp Asn Phe Ser Ser Leu Ile Lys 465 470 475 480 Ser Thr Leu Gln Val Lys Arg Lys Glu Gly Met Phe Ile Asp Glu Lys 485 490 495 Pro Gly Asn Arg Asn Pro Tyr Glu Asn Leu Leu Tyr Lys Leu Cys Leu 500 505 510 Ser Gly Asp Gly Trp Pro Tyr Ile Gly Ser Arg Ser Gln Ile Leu Gly 515 520 525 Arg Ser Trp Asp Asn Thr Ser Val Asp Leu Thr Lys Lys Pro Gln Val 530 535 540 Gly Pro Arg Gln Pro Glu Lys Asn Gly Gln Asn Leu Arg Leu Ala Asn 545 550 555 560 Leu Thr Glu Met Gln Glu Ala Val Ile Lys Glu Ala Val Lys Lys Leu 565 570 575 Asp Pro Thr Asn Thr Leu Trp Leu Asp Ile Glu Gly Pro Pro Thr Asp 580 585 590 Pro Val Glu Leu Ala Leu Tyr Gln Pro Ala Asn Lys His Tyr Ile His 595 600 605 Cys Phe Arg Lys Pro His Asp Glu Lys Gly Phe Lys Asn Gly Ser Arg 610 615 620 His Ser His Gly Ile Leu Met Gln Asp Ile Glu Asp Ala Met Pro Gly 625 630 635 640 Val Leu Ser Tyr Val Ile Gly Leu Leu Pro Gln Asp Met Val Ile Thr 645 650 655 Thr Gln Gly Ser Asp Asp Ile Arg Lys Leu Leu Asp Ile His Gly Arg 660 665 670 Lys Asp Leu Lys Leu Val Asp Val Lys Leu Thr Ser Asp Gln Ala Arg 675 680 685 Leu Tyr Asp Gln Gln Ile Trp Glu Lys Phe Gly His Leu Cys Lys His 690 695 700 His Asn Gly Val Val Val Asn Lys Lys Lys Arg Glu Lys Asp Ser Pro 705 710 715 720 Phe Lys Leu Ser Ser Gly Glu Pro His Cys Ala Leu Leu Asp Cys Ile 725 730 735 Met Tyr Gln Ser Val Met Asp Gly Lys Met Val Asp Glu Glu Pro Val 740 745 750 Ala Leu Leu Pro Leu Ser Leu Leu Phe Leu Pro Lys Ala Ala Phe Ala 755 760 765 Leu Pro Gly Glu Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser His 770 775 780 His His His His His 785 <210> 120 <211> 2434 <212> DNA <213> artificial <220> <223> DNA sequence encoding ssBiP-SNAPlike-proTEV1-N nucleoprotein of the Guanarito virus-proTEV2-Histag for expression in S2 cells <400> 120 atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60 gacaaagact gcgaaatgaa aagaactaca ttggattcac cacttgggaa gttggaactg 120 agtggatgcg agcaaggatt gcatgaaatt aagctactgg gaaaaggaac ttctgctgct 180 gatgcagttg aagttccagc accagcagct gttcttggag gtcctgagcc cctcatgcaa 240 gccacagcct ggcttaacgc atatttccac cagcctgagg ccattgagga atttccagtc 300 cccgcccttc accatcctgt gtttcagcag gagagcttca cccgccaggt cctgtggaaa 360 ttgctgaagg tggtcaagtt tggtgaagtg atttcatatc agcaacttgc tgcattggcc 420 ggtaaccccg cagctacagc tgccgtgaaa actgctctca gcggaaatcc tgtgcccatc 480 ctgatccctt gtcacagagt cgtttcatct tccggagctg taggtggcta tgaaggagga 540 ctggcagtta aggagtggct gctggctcat gaaggtcata gacttggaaa gcctgggctg 600 ggtcctgctg gtataggcgc gccagggtcc ctaggtggcg gatccgaaaa cctgtacttc 660 cagagcgata tcgctcactc caaagaaatc cccagcttcc gctggactca atctctaagg 720 agagaactag ggatgttcac agaaccaacc aaatcaagtg ttcttaatga tgcaaagctc 780 attgcagact cccttgattt cacacaagtt tctcaagttc aaagactcct acgtaagtcc 840 aaacgaggag acactgatct tgataaactt agggacttaa ataaagaagt tgatagactg 900 atgagcatga aaagtgttca gaacaacaca gttctgaaag ttggtgattt gggcaaagat 960 gaattaatgg acttggcctc tgacctagaa aaactaaaga agaagattgg agatagggaa 1020 agcaatagtc caaggatgta catgggaaac ttgacgcagt cacaattgga aaaaagagca 1080 gggattctta gaaccctggg attccaacaa caaagggggg ctgcaggtgg ggttgtcagg 1140 ttgtgggatg tatctgatcc ctccaaactg aataaccaat ttggttcaat gccagctctt 1200 accattgcct gcatgacagt tcagggagga gaaacaatga acaatgttgt gcaggcacta 1260 acatcacttg gtcttctcta cactgtcaaa tatcccaatc ttgatgacct ggaaaaacta 1320 actttagaac acgactgcct acagattata acaaaggatg agagtgcact caacatatct 1380 ggttataact tcagtctttc agctgctgta aaagctggtg catcacttat agatggtggc 1440 aacatgctgg agacaataaa agtcacaccc aacaacttct cttctattgt caaggccgca 1500 ttgaacgtca aaagaagaga aggcatgttc atagatgaga gaccgggcaa tagaaaccct 1560 tatgagaacc ttctctacaa gctgtgtttg tctggggagg gttggccata tattggatca 1620 aggtcacaaa tactcgggag gtcttgggac aacacaagtg tcgatttaaa tgcaagacct 1680 gtaacaggtc cccgagctcc tgaaaagaat ggacaaaata tcagactatc aaatctttct 1740 gaaatgcaag aagcgatcgt aaaggaagca atgaggaaat tagattcatc agacacaatc 1800 tggatggaca ttgaaggccc gccaactgat cctgtggagt tggcagtttt ccaaccttct 1860 tcaggaaact atgtacactg tttcagaaaa cctcatgatg agaaaggttt taaaaatgga 1920 agtaggcact cacacggcat actattaaag gaccttgaag atgctcaacc tggtctattg 1980 agttacgtca ttggcttatt gccacagggt tcagttatca ctgttcaagg ggcagatgac 2040 atcaaaaagc tattcgacat acatggaagg aaagatttaa aacttgttga tgtcagactg 2100 actggggaac agtccagaat ttttgaacag gaagtttggg aaaaatttgg ccacctctgc 2160 agagcacaca atggtgtcat tgttcctaag aagaaaaaca aggaggctaa ctccacgaag 2220 gagccacact gtgctcttct cgattgcatc atgtttcagt ctgttcttga tggtcatctt 2280 cccgacacca ttcccattca actgctacca aacacattag tgttccaagc caagagcgca 2340 tttgtgatcc cgggagagaa tctatatttt caagggcccg gcggaggtag tcaccatcat 2400 caccatcact aatgaccggt gcggccgcaa gctt 2434 <210> 121 <211> 785 <212> PRT <213> artificial <220> <223> Amino acid sequence of fusion protein [SNAPlike-proTEV1-GUA.N-proTEV2-Histag] <400> 121 Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro 1 5 10 15 Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile 20 25 30 Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro 35 40 45 Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr 50 55 60 Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe 65 70 75 80 Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr 85 90 95 Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val 100 105 110 Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr 115 120 125 Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile 130 135 140 Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu 145 150 155 160 Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg 165 170 175 Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser 180 185 190 Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Ala His 195 200 205 Ser Lys Glu Ile Pro Ser Phe Arg Trp Thr Gln Ser Leu Arg Arg Glu 210 215 220 Leu Gly Met Phe Thr Glu Pro Thr Lys Ser Ser Val Leu Asn Asp Ala 225 230 235 240 Lys Leu Ile Ala Asp Ser Leu Asp Phe Thr Gln Val Ser Gln Val Gln 245 250 255 Arg Leu Leu Arg Lys Ser Lys Arg Gly Asp Thr Asp Leu Asp Lys Leu 260 265 270 Arg Asp Leu Asn Lys Glu Val Asp Arg Leu Met Ser Met Lys Ser Val 275 280 285 Gln Asn Asn Thr Val Leu Lys Val Gly Asp Leu Gly Lys Asp Glu Leu 290 295 300 Met Asp Leu Ala Ser Asp Leu Glu Lys Leu Lys Lys Lys Ile Gly Asp 305 310 315 320 Arg Glu Ser Asn Ser Pro Arg Met Tyr Met Gly Asn Leu Thr Gln Ser 325 330 335 Gln Leu Glu Lys Arg Ala Gly Ile Leu Arg Thr Leu Gly Phe Gln Gln 340 345 350 Gln Arg Gly Ala Ala Gly Gly Val Val Arg Leu Trp Asp Val Ser Asp 355 360 365 Pro Ser Lys Leu Asn Asn Gln Phe Gly Ser Met Pro Ala Leu Thr Ile 370 375 380 Ala Cys Met Thr Val Gln Gly Gly Glu Thr Met Asn Asn Val Val Gln 385 390 395 400 Ala Leu Thr Ser Leu Gly Leu Leu Tyr Thr Val Lys Tyr Pro Asn Leu 405 410 415 Asp Asp Leu Glu Lys Leu Thr Leu Glu His Asp Cys Leu Gln Ile Ile 420 425 430 Thr Lys Asp Glu Ser Ala Leu Asn Ile Ser Gly Tyr Asn Phe Ser Leu 435 440 445 Ser Ala Ala Val Lys Ala Gly Ala Ser Leu Ile Asp Gly Gly Asn Met 450 455 460 Leu Glu Thr Ile Lys Val Thr Pro Asn Asn Phe Ser Ser Ile Val Lys 465 470 475 480 Ala Ala Leu Asn Val Lys Arg Arg Glu Gly Met Phe Ile Asp Glu Arg 485 490 495 Pro Gly Asn Arg Asn Pro Tyr Glu Asn Leu Leu Tyr Lys Leu Cys Leu 500 505 510 Ser Gly Glu Gly Trp Pro Tyr Ile Gly Ser Arg Ser Gln Ile Leu Gly 515 520 525 Arg Ser Trp Asp Asn Thr Ser Val Asp Leu Asn Ala Arg Pro Val Thr 530 535 540 Gly Pro Arg Ala Pro Glu Lys Asn Gly Gln Asn Ile Arg Leu Ser Asn 545 550 555 560 Leu Ser Glu Met Gln Glu Ala Ile Val Lys Glu Ala Met Arg Lys Leu 565 570 575 Asp Ser Ser Asp Thr Ile Trp Met Asp Ile Glu Gly Pro Pro Thr Asp 580 585 590 Pro Val Glu Leu Ala Val Phe Gln Pro Ser Ser Gly Asn Tyr Val His 595 600 605 Cys Phe Arg Lys Pro His Asp Glu Lys Gly Phe Lys Asn Gly Ser Arg 610 615 620 His Ser His Gly Ile Leu Leu Lys Asp Leu Glu Asp Ala Gln Pro Gly 625 630 635 640 Leu Leu Ser Tyr Val Ile Gly Leu Leu Pro Gln Gly Ser Val Ile Thr 645 650 655 Val Gln Gly Ala Asp Asp Ile Lys Lys Leu Phe Asp Ile His Gly Arg 660 665 670 Lys Asp Leu Lys Leu Val Asp Val Arg Leu Thr Gly Glu Gln Ser Arg 675 680 685 Ile Phe Glu Gln Glu Val Trp Glu Lys Phe Gly His Leu Cys Arg Ala 690 695 700 His Asn Gly Val Ile Val Pro Lys Lys Lys Asn Lys Glu Ala Asn Ser 705 710 715 720 Thr Lys Glu Pro His Cys Ala Leu Leu Asp Cys Ile Met Phe Gln Ser 725 730 735 Val Leu Asp Gly His Leu Pro Asp Thr Ile Pro Ile Gln Leu Leu Pro 740 745 750 Asn Thr Leu Val Phe Gln Ala Lys Ser Ala Phe Val Ile Pro Gly Glu 755 760 765 Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser His His His His His 770 775 780 His 785 <210> 122 <211> 2440 <212> DNA <213> artificial <220> <223> DNA sequence encoding ssBiP-SNAPlike-proTEV1-N nucleoprotein of the Sabia virus-proTEV2-Histag for expression in S2 cells <400> 122 atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60 gacaaagact gcgaaatgaa aagaactaca ttggattcac cacttgggaa gttggaactg 120 agtggatgcg agcaaggatt gcatgaaatt aagctactgg gaaaaggaac ttctgctgct 180 gatgcagttg aagttccagc accagcagct gttcttggag gtcctgagcc cctcatgcaa 240 gccacagcct ggcttaacgc atatttccac cagcctgagg ccattgagga atttccagtc 300 cccgcccttc accatcctgt gtttcagcag gagagcttca cccgccaggt cctgtggaaa 360 ttgctgaagg tggtcaagtt tggtgaagtg atttcatatc agcaacttgc tgcattggcc 420 ggtaaccccg cagctacagc tgccgtgaaa actgctctca gcggaaatcc tgtgcccatc 480 ctgatccctt gtcacagagt cgtttcatct tccggagctg taggtggcta tgaaggagga 540 ctggcagtta aggagtggct gctggctcat gaaggtcata gacttggaaa gcctgggctg 600 ggtcctgctg gtataggcgc gccagggtcc ctaggtggcg gatccgaaaa cctgtacttc 660 cagagcgata tcagcaactc aaaggaaatc cccagcttca gatggactca atccctgaga 720 agagggctca gtgagttcac aacacccgtg aagaccgatg ttctgaggga tgccaaaatg 780 atacttgatg gtcttgattt caatcaagtc tctcttgttc aaagaatcct tagaaagtct 840 aaaaggaatg atggtgatct tgataaactg agagacctaa ataaagaagt ggacaacctg 900 atgagcatga agagttccca aagagacaca atcttaaaac ttggtgatct caacaaatct 960 gaactgatgg atcttgcatc agacctggag aaactgaaaa gaaaagttgg acaaacagaa 1020 agatcagcct caggaggtgt gtacctggga aacctttccc aatcacagct caccaaaagg 1080 tctgatcttt taaggaaact tggttttcaa cagcagcaag tgaggtctcc aggggttgta 1140 aggatttggg acgtagctga tccgaacagg ctgaataatc aatttggatc tgtccctgca 1200 ctgacaatcg cttgtatgac taaacaaagt gacaatacca tgggggatgt tgttcaggca 1260 ctaacatctt tgggacttct ttatacagtt aagttcccca acctgattga cctagaaaaa 1320 cttacagcag aacatgactg tcttcaaata gtgactaaag atgagagcgg cttgaacatc 1380 tcaggatata actatagtct ttctgcagct gttaaagctg gtgcaacgct tctggatggt 1440 ggtaacatgc tggaaaccat aaggatcact cctgacaact tttctcagat cataaagaca 1500 accctatcca taaagaaaaa ggaaggcatg tttgtagatg agaaacctgg aaatagaaac 1560 ccttatgaaa accttctgta caaaatctgc ctttcaggag aaggttggcc ttacattggc 1620 tccagatccc agatcaaggg taggtcatgg gaaaacacca ctgttgattt aagcacaaag 1680 ccccaacaag ggccgagaac accagaaaag gcaggtcaga acattagact ctcccacttg 1740 actgagttgc aagagtcagt tgtgagagag gcaatgggta agattgaccc aactctgaca 1800 acatggattg acattgaggg taccagtaat gatccggttg aattagcatt gtaccaacca 1860 gacacaggta attatatcct ctgttatagg aaaccacatg atgagaaggg gttcaaaaat 1920 ggtagcaggc attcacatgg gatgttgcta aaggacctag aatctgcaca gccaggcttg 1980 ctcagctatg ttatagggct ccttcctcaa aacatggtcc tcaccaccca aggttcagat 2040 gatataaggc gcttagtaga tacacacggt cgcaaagact taaagattgt cgacattaaa 2100 ttggcatctg aacaggcgag aaagtttgag gagccaatct ggtcagattt tggtcacctc 2160 tgtaagaaac acaatggagt tattgtgcca aagaaaaaga aagacaaaga catcccacag 2220 tcctcagagc cacactgtgc cctacttgat tgtctaatgt ttcagtcagc catagcaggc 2280 caaccacctc aaaccaaact ggaaggttta ttgcctgatg cattgctctt cacactggag 2340 gcagcattca ccatcccggg agagaatcta tattttcaag ggcccggcgg aggtagtcac 2400 catcatcacc atcactaatg accggtgcgg ccgcaagctt 2440 <210> 123 <211> 787 <212> PRT <213> artificial <220> <223> Amino acid sequence of fusion protein [SNAPlike-proTEV1-SAB.N-proTEV2-Histag] <400> 123 Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro 1 5 10 15 Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile 20 25 30 Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro 35 40 45 Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr 50 55 60 Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe 65 70 75 80 Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr 85 90 95 Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val 100 105 110 Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr 115 120 125 Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile 130 135 140 Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu 145 150 155 160 Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg 165 170 175 Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser 180 185 190 Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Ser Asn 195 200 205 Ser Lys Glu Ile Pro Ser Phe Arg Trp Thr Gln Ser Leu Arg Arg Gly 210 215 220 Leu Ser Glu Phe Thr Thr Pro Val Lys Thr Asp Val Leu Arg Asp Ala 225 230 235 240 Lys Met Ile Leu Asp Gly Leu Asp Phe Asn Gln Val Ser Leu Val Gln 245 250 255 Arg Ile Leu Arg Lys Ser Lys Arg Asn Asp Gly Asp Leu Asp Lys Leu 260 265 270 Arg Asp Leu Asn Lys Glu Val Asp Asn Leu Met Ser Met Lys Ser Ser 275 280 285 Gln Arg Asp Thr Ile Leu Lys Leu Gly Asp Leu Asn Lys Ser Glu Leu 290 295 300 Met Asp Leu Ala Ser Asp Leu Glu Lys Leu Lys Arg Lys Val Gly Gln 305 310 315 320 Thr Glu Arg Ser Ala Ser Gly Gly Val Tyr Leu Gly Asn Leu Ser Gln 325 330 335 Ser Gln Leu Thr Lys Arg Ser Asp Leu Leu Arg Lys Leu Gly Phe Gln 340 345 350 Gln Gln Gln Val Arg Ser Pro Gly Val Val Arg Ile Trp Asp Val Ala 355 360 365 Asp Pro Asn Arg Leu Asn Asn Gln Phe Gly Ser Val Pro Ala Leu Thr 370 375 380 Ile Ala Cys Met Thr Lys Gln Ser Asp Asn Thr Met Gly Asp Val Val 385 390 395 400 Gln Ala Leu Thr Ser Leu Gly Leu Leu Tyr Thr Val Lys Phe Pro Asn 405 410 415 Leu Ile Asp Leu Glu Lys Leu Thr Ala Glu His Asp Cys Leu Gln Ile 420 425 430 Val Thr Lys Asp Glu Ser Gly Leu Asn Ile Ser Gly Tyr Asn Tyr Ser 435 440 445 Leu Ser Ala Ala Val Lys Ala Gly Ala Thr Leu Leu Asp Gly Gly Asn 450 455 460 Met Leu Glu Thr Ile Arg Ile Thr Pro Asp Asn Phe Ser Gln Ile Ile 465 470 475 480 Lys Thr Thr Leu Ser Ile Lys Lys Lys Glu Gly Met Phe Val Asp Glu 485 490 495 Lys Pro Gly Asn Arg Asn Pro Tyr Glu Asn Leu Leu Tyr Lys Ile Cys 500 505 510 Leu Ser Gly Glu Gly Trp Pro Tyr Ile Gly Ser Arg Ser Gln Ile Lys 515 520 525 Gly Arg Ser Trp Glu Asn Thr Thr Val Asp Leu Ser Thr Lys Pro Gln 530 535 540 Gln Gly Pro Arg Thr Pro Glu Lys Ala Gly Gln Asn Ile Arg Leu Ser 545 550 555 560 His Leu Thr Glu Leu Gln Glu Ser Val Val Arg Glu Ala Met Gly Lys 565 570 575 Ile Asp Pro Thr Leu Thr Thr Trp Ile Asp Ile Glu Gly Thr Ser Asn 580 585 590 Asp Pro Val Glu Leu Ala Leu Tyr Gln Pro Asp Thr Gly Asn Tyr Ile 595 600 605 Leu Cys Tyr Arg Lys Pro His Asp Glu Lys Gly Phe Lys Asn Gly Ser 610 615 620 Arg His Ser His Gly Met Leu Leu Lys Asp Leu Glu Ser Ala Gln Pro 625 630 635 640 Gly Leu Leu Ser Tyr Val Ile Gly Leu Leu Pro Gln Asn Met Val Leu 645 650 655 Thr Thr Gln Gly Ser Asp Asp Ile Arg Arg Leu Val Asp Thr His Gly 660 665 670 Arg Lys Asp Leu Lys Ile Val Asp Ile Lys Leu Ala Ser Glu Gln Ala 675 680 685 Arg Lys Phe Glu Glu Pro Ile Trp Ser Asp Phe Gly His Leu Cys Lys 690 695 700 Lys His Asn Gly Val Ile Val Pro Lys Lys Lys Lys Asp Lys Asp Ile 705 710 715 720 Pro Gln Ser Ser Glu Pro His Cys Ala Leu Leu Asp Cys Leu Met Phe 725 730 735 Gln Ser Ala Ile Ala Gly Gln Pro Pro Gln Thr Lys Leu Glu Gly Leu 740 745 750 Leu Pro Asp Ala Leu Leu Phe Thr Leu Glu Ala Ala Phe Thr Ile Pro 755 760 765 Gly Glu Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser His His His 770 775 780 His His His 785 <210> 124 <211> 992 <212> DNA <213> artificial <220> <223> DNA sequence encoding BiPlike-SNAPlike- EDIII protein of the Omsk virus-Histag for expression in S2 cells <400> 124 atgaaactat gtattctact tgcagttgtt gcgttcgtag gattgtcctt aagatctgac 60 aaagactgcg aaatgaaaag aactacattg gattcaccac ttgggaagtt ggaactgagt 120 ggatgcgagc aaggattgca tgaaattaag ctactgggaa aaggaacttc tgctgctgat 180 gcagttgaag ttccagcacc agcagctgtt cttggaggtc ctgagcccct catgcaagcc 240 acagcctggc ttaacgcata tttccaccag cctgaggcca ttgaggaatt tccagtcccc 300 gcccttcacc atcctgtgtt tcagcaggag agcttcaccc gccaggtcct gtggaaattg 360 ctgaaggtgg tcaagtttgg tgaagtgatt tcatatcagc aacttgctgc attggccggt 420 aaccccgcag ctacagctgc cgtgaaaact gctctcagcg gaaatcctgt gcccatcctg 480 atcccttgtc acagagtcgt ttcatcttcc ggagctgtag gtggctatga aggaggactg 540 gcagttaagg agtggctgct ggctcatgaa ggtcatagac ttggaaagcc tgggctgggt 600 cctgctggta taggcgcgcc aggaggtggc gggctggaaa aactcaagat gaagggtctt 660 acctatacaa tgtgcgacaa ggcaaagttc acgtggaaaa gagctcccac agacagtggg 720 cacgacacag ttgtcatgga agtcgctttc tctggaacaa agccttgcag aatacccgtc 780 agggctgtgg cacatggttc cccagatgtg gatgtggcca tgctcataac gccaaatcca 840 acaatcgaaa acaatggagg tggctttata gagatgcagc tccccccagg agacaacatc 900 atctatgttg gggaactaaa acaccagtgg ttccagaagg ggagtagcat tggcggaggt 960 ggccatcacc atcaccatca ctgatgaccg gt 992 <210> 125 <211> 310 <212> PRT <213> artificial <220> <223> Amino acid sequence of fusion protein [SNAPlike-OMSK.EDIII-Histag] <400> 125 Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro 1 5 10 15 Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile 20 25 30 Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro 35 40 45 Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr 50 55 60 Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe 65 70 75 80 Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr 85 90 95 Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val 100 105 110 Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr 115 120 125 Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile 130 135 140 Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu 145 150 155 160 Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg 165 170 175 Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Gly 180 185 190 Gly Gly Leu Glu Lys Leu Lys Met Lys Gly Leu Thr Tyr Thr Met Cys 195 200 205 Asp Lys Ala Lys Phe Thr Trp Lys Arg Ala Pro Thr Asp Ser Gly His 210 215 220 Asp Thr Val Val Met Glu Val Ala Phe Ser Gly Thr Lys Pro Cys Arg 225 230 235 240 Ile Pro Val Arg Ala Val Ala His Gly Ser Pro Asp Val Asp Val Ala 245 250 255 Met Leu Ile Thr Pro Asn Pro Thr Ile Glu Asn Asn Gly Gly Gly Phe 260 265 270 Ile Glu Met Gln Leu Pro Pro Gly Asp Asn Ile Ile Tyr Val Gly Glu 275 280 285 Leu Lys His Gln Trp Phe Gln Lys Gly Ser Ser Ile Gly Gly Gly Gly 290 295 300 His His His His His His 305 310 <210> 126 <211> 992 <212> DNA <213> artificial <220> <223> DNA sequence encoding BiPlike-SNAPlike- EDIII protein of the Kyasanur Forest Disease virus-Histag for expression in S2 cells <400> 126 atgaaactat gtattctact tgcagttgtt gcgttcgtag gattgtcctt aagatctgac 60 aaagactgcg aaatgaaaag aactacattg gattcaccac ttgggaagtt ggaactgagt 120 ggatgcgagc aaggattgca tgaaattaag ctactgggaa aaggaacttc tgctgctgat 180 gcagttgaag ttccagcacc agcagctgtt cttggaggtc ctgagcccct catgcaagcc 240 acagcctggc ttaacgcata tttccaccag cctgaggcca ttgaggaatt tccagtcccc 300 gcccttcacc atcctgtgtt tcagcaggag agcttcaccc gccaggtcct gtggaaattg 360 ctgaaggtgg tcaagtttgg tgaagtgatt tcatatcagc aacttgctgc attggccggt 420 aaccccgcag ctacagctgc cgtgaaaact gctctcagcg gaaatcctgt gcccatcctg 480 atcccttgtc acagagtcgt ttcatcttcc ggagctgtag gtggctatga aggaggactg 540 gcagttaagg agtggctgct ggctcatgaa ggtcatagac ttggaaagcc tgggctgggt 600 cctgctggta taggcgcgcc aggaggtggc gggcttgaaa aacttaagat gaaagggatg 660 acatacacgg tttgtgaggg atcaaaattt gcttggaaaa ggccgccaac cgacagtgga 720 catgataccg tagtcatgga ggtgacttac accgggagca agccatgcag aataccagtg 780 agagccgtgg cccatggaga acccaatgtt aacgtggcaa gtctaataac cccaaaccca 840 tccatggaaa caactggagg agggttcgtt gagctacagc taccaccagg agacaacatc 900 atctatgttg gtgagctgag ccaccagtgg tttcagaagg gcagcacaat tggcggaggt 960 ggccatcacc atcaccatca ctgatgaccg gt 992 <210> 127 <211> 310 <212> PRT <213> artificial <220> <223> Amino acid sequence of fusion protein [SNAPlike-KYA.EDIII-Histag] <400> 127 Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro 1 5 10 15 Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile 20 25 30 Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro 35 40 45 Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr 50 55 60 Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe 65 70 75 80 Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr 85 90 95 Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val 100 105 110 Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr 115 120 125 Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile 130 135 140 Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu 145 150 155 160 Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg 165 170 175 Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Gly 180 185 190 Gly Gly Leu Glu Lys Leu Lys Met Lys Gly Met Thr Tyr Thr Val Cys 195 200 205 Glu Gly Ser Lys Phe Ala Trp Lys Arg Pro Pro Thr Asp Ser Gly His 210 215 220 Asp Thr Val Val Met Glu Val Thr Tyr Thr Gly Ser Lys Pro Cys Arg 225 230 235 240 Ile Pro Val Arg Ala Val Ala His Gly Glu Pro Asn Val Asn Val Ala 245 250 255 Ser Leu Ile Thr Pro Asn Pro Ser Met Glu Thr Thr Gly Gly Gly Phe 260 265 270 Val Glu Leu Gln Leu Pro Pro Gly Asp Asn Ile Ile Tyr Val Gly Glu 275 280 285 Leu Ser His Gln Trp Phe Gln Lys Gly Ser Thr Ile Gly Gly Gly Gly 290 295 300 His His His His His His 305 310 <210> 128 <211> 992 <212> DNA <213> artificial <220> <223> DNA sequence encoding BiPlike-SNAPlike- EDIII protein of the Alkhumra virus-Histag for expression in S2 cells <400> 128 atgaaactat gtattctact tgcagttgtt gcgttcgtag gattgtcctt aagatctgac 60 aaagactgcg aaatgaaaag aactacattg gattcaccac ttgggaagtt ggaactgagt 120 ggatgcgagc aaggattgca tgaaattaag ctactgggaa aaggaacttc tgctgctgat 180 gcagttgaag ttccagcacc agcagctgtt cttggaggtc ctgagcccct catgcaagcc 240 acagcctggc ttaacgcata tttccaccag cctgaggcca ttgaggaatt tccagtcccc 300 gcccttcacc atcctgtgtt tcagcaggag agcttcaccc gccaggtcct gtggaaattg 360 ctgaaggtgg tcaagtttgg tgaagtgatt tcatatcagc aacttgctgc attggccggt 420 aaccccgcag ctacagctgc cgtgaaaact gctctcagcg gaaatcctgt gcccatcctg 480 atcccttgtc acagagtcgt ttcatcttcc ggagctgtag gtggctatga aggaggactg 540 gcagttaagg agtggctgct ggctcatgaa ggtcatagac ttggaaagcc tgggctgggt 600 cctgctggta taggcgcgcc aggaggtggc gggcttgaaa aactcaagat gaaaggaatg 660 acatacacgg tctgtgaggg atcaaagttt gcttggaaga ggccgccaac cgacagtggg 720 catgacactg tggtcatgga agtgacttac actgggagca agccatgcag aataccagtg 780 agagccgtgg cccatggaga acctaatgtc aatgtagcta gcctgataac tccaaatcca 840 tccatggaga caactggagg aggtttcgtt gaactgcagc tgccaccagg agacaacatc 900 atctatgttg gtgagctgag tcaccagtgg tttcagaagg gtagtacaat aggcggaggt 960 ggccatcacc atcaccatca ctgatgaccg gt 992 <210> 129 <211> 310 <212> PRT <213> artificial <220> <223> Amino acid sequence of fusion protein [SNAPlike-ALK.EDIII-Histag] <400> 129 Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro 1 5 10 15 Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile 20 25 30 Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro 35 40 45 Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr 50 55 60 Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe 65 70 75 80 Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr 85 90 95 Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val 100 105 110 Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr 115 120 125 Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile 130 135 140 Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu 145 150 155 160 Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg 165 170 175 Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Gly 180 185 190 Gly Gly Leu Glu Lys Leu Lys Met Lys Gly Met Thr Tyr Thr Val Cys 195 200 205 Glu Gly Ser Lys Phe Ala Trp Lys Arg Pro Pro Thr Asp Ser Gly His 210 215 220 Asp Thr Val Val Met Glu Val Thr Tyr Thr Gly Ser Lys Pro Cys Arg 225 230 235 240 Ile Pro Val Arg Ala Val Ala His Gly Glu Pro Asn Val Asn Val Ala 245 250 255 Ser Leu Ile Thr Pro Asn Pro Ser Met Glu Thr Thr Gly Gly Gly Phe 260 265 270 Val Glu Leu Gln Leu Pro Pro Gly Asp Asn Ile Ile Tyr Val Gly Glu 275 280 285 Leu Ser His Gln Trp Phe Gln Lys Gly Ser Thr Ile Gly Gly Gly Gly 290 295 300 His His His His His His 305 310 <210> 130 <211> 1288 <212> DNA <213> artificial <220> <223> DNA sequence encoding ssBiP- Glycoprotein GP1 from Lassa virus- SNAPlike-Histag for expression in S2 cells <400> 130 atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60 accagtctgt acaagggggt gtacgagctt cagactctgg aactgaacat ggagacactc 120 aacatgacca tgcctctctc ctgcacaaag aacaacagtc atcattacat aatggtgggc 180 aatgagacag gactggaact gaccttgacc aacacgagca tcatcaatca caagttctgc 240 aacctgtctg atgcccacaa gaagaacctc tacgaccacg ctctgatgag cataatctca 300 actttccact tgtccatccc caacttcaac cagtacgagg caatgagctg cgatttcaat 360 gggggcaaga tcagtgtgca gtacaacctg agtcacagct acgctgggga tgcagccaac 420 cattgtggca ctgtggcaaa cggtgtgttg cagactttca tgaggatggc ttggggcggg 480 agctacatcg ctcttgactc aggccgtggc aactgggact gtatcatgac tagttaccaa 540 tacctgataa tccagaacac aacctgggaa gatcactgcc aattctccag accatctccc 600 atcggctacc tcgggctcct ctcacaaagg actagagata tttacatcag tagaagattg 660 ctgcggccgc acggcggagg tagcaaagac tgcgaaatga agcgcaccac cctggatagc 720 cctctgggca agctggaact gtctgggtgc gaacagggcc tgcacgagat caagctgctg 780 ggcaaaggaa catctgccgc cgacgccgtg gaagtgcctg ccccagccgc cgtgctgggc 840 ggaccagagc cactgatgca ggccaccgcc tggctcaacg cctactttca ccagcctgag 900 gccatcgagg agttccctgt gccagccctg caccacccag tgttccagca ggagagcttt 960 acccgccagg tgctgtggaa actgctgaaa gtggtgaagt tcggagaggt catcagctac 1020 cagcagctgg ccgccctggc cggcaatccc gccgccaccg ccgccgtgaa aaccgccctg 1080 agcggaaatc ccgtgcccat tctgatcccc tgccaccggg tggtgtctag ctctggcgcc 1140 gtggggggct acgagggcgg gctcgccgtg aaagagtggc tgctggccca cgagggccac 1200 agactgggca agcctgggct gggtcctgca ggtataggcg cgccagggtc cctggagcat 1260 catcatcatc atcattgatg acgggccc 1288 <210> 131 <211> 407 <212> PRT <213> artificial <220> <223> Amino acid sequence of fusion protein [LAS.ectoGP1- SNAPlike-Histag] <400> 131 Arg Ser Thr Ser Leu Tyr Lys Gly Val Tyr Glu Leu Gln Thr Leu Glu 1 5 10 15 Leu Asn Met Glu Thr Leu Asn Met Thr Met Pro Leu Ser Cys Thr Lys 20 25 30 Asn Asn Ser His His Tyr Ile Met Val Gly Asn Glu Thr Gly Leu Glu 35 40 45 Leu Thr Leu Thr Asn Thr Ser Ile Ile Asn His Lys Phe Cys Asn Leu 50 55 60 Ser Asp Ala His Lys Lys Asn Leu Tyr Asp His Ala Leu Met Ser Ile 65 70 75 80 Ile Ser Thr Phe His Leu Ser Ile Pro Asn Phe Asn Gln Tyr Glu Ala 85 90 95 Met Ser Cys Asp Phe Asn Gly Gly Lys Ile Ser Val Gln Tyr Asn Leu 100 105 110 Ser His Ser Tyr Ala Gly Asp Ala Ala Asn His Cys Gly Thr Val Ala 115 120 125 Asn Gly Val Leu Gln Thr Phe Met Arg Met Ala Trp Gly Gly Ser Tyr 130 135 140 Ile Ala Leu Asp Ser Gly Arg Gly Asn Trp Asp Cys Ile Met Thr Ser 145 150 155 160 Tyr Gln Tyr Leu Ile Ile Gln Asn Thr Thr Trp Glu Asp His Cys Gln 165 170 175 Phe Ser Arg Pro Ser Pro Ile Gly Tyr Leu Gly Leu Leu Ser Gln Arg 180 185 190 Thr Arg Asp Ile Tyr Ile Ser Arg Arg Leu Leu Arg Pro His Gly Gly 195 200 205 Gly Ser Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu 210 215 220 Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys 225 230 235 240 Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala 245 250 255 Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala 260 265 270 Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro 275 280 285 Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg 290 295 300 Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile 305 310 315 320 Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala 325 330 335 Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro 340 345 350 Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly 355 360 365 Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu 370 375 380 Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu 385 390 395 400 Glu His His His His His His 405 <210> 132 <211> 1264 <212> DNA <213> artificial <220> <223> DNA sequence encoding ssBiP- Glycoprotein GP1 from Junin virus- SNAPlike-Histag for expression in S2 cells <400> 132 atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60 gaggaggctt tcaagatcgg cctgcacacc gagttccaga cggtgtcctt ctcgatggtg 120 ggcctcttct ccaacaaccc acacgacctg cctttgttgt gtaccttgaa caagagccat 180 ctgtacatta aggggggcaa cgcttcattc cagatcagct tcgacgacat cgcggtgttg 240 ttgccacagt acgacgttat catccagcac ccagcagaca tgagctggtg ctccaagagt 300 gatgatcaga tttggttgtc tcagtggttc atgaatgctg tgggacatga ttggcaccta 360 gacccaccat tcctgtgtag gaaccgtaca aagacagaag gcttcatctt ccaagtcaac 420 acctccaaga ctggtgttaa tgaaaattat gctaagaagt tcaagactgg catgcaccac 480 ttgtatagag agtaccctga ctcttgcccg aacggcaagc tgtgcttaat gaaggcacaa 540 cctaccagtt ggcctctcca atgtccactc gaccacgtca acacattaca cttccttaca 600 agaggcaaga acattcagct tccaaggagg tccttgaagc ggccgcacgg cggaggtagc 660 aaagactgcg aaatgaagcg caccaccctg gatagccctc tgggcaagct ggaactgtct 720 gggtgcgaac agggcctgca cgagatcaag ctgctgggca aaggaacatc tgccgccgac 780 gccgtggaag tgcctgcccc agccgccgtg ctgggcggac cagagccact gatgcaggcc 840 accgcctggc tcaacgccta ctttcaccag cctgaggcca tcgaggagtt ccctgtgcca 900 gccctgcacc acccagtgtt ccagcaggag agctttaccc gccaggtgct gtggaaactg 960 ctgaaagtgg tgaagttcgg agaggtcatc agctaccagc agctggccgc cctggccggc 1020 aatcccgccg ccaccgccgc cgtgaaaacc gccctgagcg gaaatcccgt gcccattctg 1080 atcccctgcc accgggtggt gtctagctct ggcgccgtgg ggggctacga gggcgggctc 1140 gccgtgaaag agtggctgct ggcccacgag ggccacagac tgggcaagcc tgggctgggt 1200 cctgcaggta taggcgcgcc agggtccctg gagcatcatc atcatcatca ttgatgacgg 1260 gccc 1264 <210> 133 <211> 399 <212> PRT <213> artificial <220> <223> Amino acid sequence of fusion protein [JUN.ectoGP1- SNAPlike-Histag] <400> 133 Arg Ser Glu Glu Ala Phe Lys Ile Gly Leu His Thr Glu Phe Gln Thr 1 5 10 15 Val Ser Phe Ser Met Val Gly Leu Phe Ser Asn Asn Pro His Asp Leu 20 25 30 Pro Leu Leu Cys Thr Leu Asn Lys Ser His Leu Tyr Ile Lys Gly Gly 35 40 45 Asn Ala Ser Phe Gln Ile Ser Phe Asp Asp Ile Ala Val Leu Leu Pro 50 55 60 Gln Tyr Asp Val Ile Ile Gln His Pro Ala Asp Met Ser Trp Cys Ser 65 70 75 80 Lys Ser Asp Asp Gln Ile Trp Leu Ser Gln Trp Phe Met Asn Ala Val 85 90 95 Gly His Asp Trp His Leu Asp Pro Pro Phe Leu Cys Arg Asn Arg Thr 100 105 110 Lys Thr Glu Gly Phe Ile Phe Gln Val Asn Thr Ser Lys Thr Gly Val 115 120 125 Asn Glu Asn Tyr Ala Lys Lys Phe Lys Thr Gly Met His His Leu Tyr 130 135 140 Arg Glu Tyr Pro Asp Ser Cys Pro Asn Gly Lys Leu Cys Leu Met Lys 145 150 155 160 Ala Gln Pro Thr Ser Trp Pro Leu Gln Cys Pro Leu Asp His Val Asn 165 170 175 Thr Leu His Phe Leu Thr Arg Gly Lys Asn Ile Gln Leu Pro Arg Arg 180 185 190 Ser Leu Lys Arg Pro His Gly Gly Gly Ser Lys Asp Cys Glu Met Lys 195 200 205 Arg Thr Thr Leu Asp Ser Pro Leu Gly Lys Leu Glu Leu Ser Gly Cys 210 215 220 Glu Gln Gly Leu His Glu Ile Lys Leu Leu Gly Lys Gly Thr Ser Ala 225 230 235 240 Ala Asp Ala Val Glu Val Pro Ala Pro Ala Ala Val Leu Gly Gly Pro 245 250 255 Glu Pro Leu Met Gln Ala Thr Ala Trp Leu Asn Ala Tyr Phe His Gln 260 265 270 Pro Glu Ala Ile Glu Glu Phe Pro Val Pro Ala Leu His His Pro Val 275 280 285 Phe Gln Gln Glu Ser Phe Thr Arg Gln Val Leu Trp Lys Leu Leu Lys 290 295 300 Val Val Lys Phe Gly Glu Val Ile Ser Tyr Gln Gln Leu Ala Ala Leu 305 310 315 320 Ala Gly Asn Pro Ala Ala Thr Ala Ala Val Lys Thr Ala Leu Ser Gly 325 330 335 Asn Pro Val Pro Ile Leu Ile Pro Cys His Arg Val Val Ser Ser Ser 340 345 350 Gly Ala Val Gly Gly Tyr Glu Gly Gly Leu Ala Val Lys Glu Trp Leu 355 360 365 Leu Ala His Glu Gly His Arg Leu Gly Lys Pro Gly Leu Gly Pro Ala 370 375 380 Gly Ile Gly Ala Pro Gly Ser Leu Glu His His His His His His 385 390 395 <210> 134 <211> 1297 <212> DNA <213> artificial <220> <223> DNA sequence encoding ssBiP- Glycoprotein GP1 from Machupo virus- SNAPlike-Histag for expression in S2 cells <400> 134 atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60 gacggcacat tcaagatcgg cctgcacacg gagttccagt cagtcaccct caccatgcag 120 agacttttgg ctaaccattc aaacgagctc ccgtctctct gcatgctgaa caacagtttc 180 tattatatga ggggaggtgt gaacaccttc ctgatccgtg tttctgatat ttcagtcctc 240 atgaaggagt acgatgtatc aatctacgag ccagaggacc tcggaaactg tctgaacaag 300 tctgactcaa gctgggctat ccattggttc tcaaacgctt tgggacatga ctggctgatg 360 gaccctccaa tgctctgtag aaacaagaca aagaaggagg gatctaacat ccaattcaac 420 atcagcaagg ctgatgatgc cagagtgtat ggaaagaaga tcagaaacgg tatgaggcat 480 ctcttcaggg gcttccatga cccgtgtgag gaagggaagg tgtgctacct gaccatcaac 540 cagtgtggtg accccagttc cttcgactac tgtggcgtga accatctgtc caagtgtcag 600 ttcgaccatg tgaacaccct gcatttcctg gtgagaagta agacacatct caacttcgag 660 aggtctttga agcggccgca cggcggaggt agcaaagact gcgaaatgaa gcgcaccacc 720 ctggatagcc ctctgggcaa gctggaactg tctgggtgcg aacagggcct gcacgagatc 780 aagctgctgg gcaaaggaac atctgccgcc gacgccgtgg aagtgcctgc cccagccgcc 840 gtgctgggcg gaccagagcc actgatgcag gccaccgcct ggctcaacgc ctactttcac 900 cagcctgagg ccatcgagga gttccctgtg ccagccctgc accacccagt gttccagcag 960 gagagcttta cccgccaggt gctgtggaaa ctgctgaaag tggtgaagtt cggagaggtc 1020 atcagctacc agcagctggc cgccctggcc ggcaatcccg ccgccaccgc cgccgtgaaa 1080 accgccctga gcggaaatcc cgtgcccatt ctgatcccct gccaccgggt ggtgtctagc 1140 tctggcgccg tggggggcta cgagggcggg ctcgccgtga aagagtggct gctggcccac 1200 gagggccaca gactgggcaa gcctgggctg ggtcctgcag gtataggcgc gccagggtcc 1260 ctggagcatc atcatcatca tcattgatga cgggccc 1297 <210> 135 <211> 410 <212> PRT <213> artificial <220> <223> Amino acid sequence of fusion protein [MAC.ectoGP1- SNAPlike-Histag] <400> 135 Arg Ser Asp Gly Thr Phe Lys Ile Gly Leu His Thr Glu Phe Gln Ser 1 5 10 15 Val Thr Leu Thr Met Gln Arg Leu Leu Ala Asn His Ser Asn Glu Leu 20 25 30 Pro Ser Leu Cys Met Leu Asn Asn Ser Phe Tyr Tyr Met Arg Gly Gly 35 40 45 Val Asn Thr Phe Leu Ile Arg Val Ser Asp Ile Ser Val Leu Met Lys 50 55 60 Glu Tyr Asp Val Ser Ile Tyr Glu Pro Glu Asp Leu Gly Asn Cys Leu 65 70 75 80 Asn Lys Ser Asp Ser Ser Trp Ala Ile His Trp Phe Ser Asn Ala Leu 85 90 95 Gly His Asp Trp Leu Met Asp Pro Pro Met Leu Cys Arg Asn Lys Thr 100 105 110 Lys Lys Glu Gly Ser Asn Ile Gln Phe Asn Ile Ser Lys Ala Asp Asp 115 120 125 Ala Arg Val Tyr Gly Lys Lys Ile Arg Asn Gly Met Arg His Leu Phe 130 135 140 Arg Gly Phe His Asp Pro Cys Glu Glu Gly Lys Val Cys Tyr Leu Thr 145 150 155 160 Ile Asn Gln Cys Gly Asp Pro Ser Ser Phe Asp Tyr Cys Gly Val Asn 165 170 175 His Leu Ser Lys Cys Gln Phe Asp His Val Asn Thr Leu His Phe Leu 180 185 190 Val Arg Ser Lys Thr His Leu Asn Phe Glu Arg Ser Leu Lys Arg Pro 195 200 205 His Gly Gly Gly Ser Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp 210 215 220 Ser Pro Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His 225 230 235 240 Glu Ile Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu 245 250 255 Val Pro Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln 260 265 270 Ala Thr Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu 275 280 285 Glu Phe Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser 290 295 300 Phe Thr Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly 305 310 315 320 Glu Val Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala 325 330 335 Ala Thr Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile 340 345 350 Leu Ile Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly 355 360 365 Tyr Glu Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly 370 375 380 His Arg Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro 385 390 395 400 Gly Ser Leu Glu His His His His His His 405 410 <210> 136 <211> 1246 <212> DNA <213> artificial <220> <223> DNA sequence encoding ssBiP- Glycoprotein GP1 from Guanarito virus- SNAPlike-Histag for expression in S2 cells <400> 136 atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60 ttcaaggttg gtcatcatac gaacttcgag tcgttcacgg ttaagctggg aggtgtcttc 120 catgaattgc cttcgctgtg tagggtcaac aactcctaca gtctgatcag gctctcccat 180 aacagtaacc aggcattgtc ggttgagtac gtggatgtgc accctgtcct ctgttcgtcc 240 agtccaacca tcctcgacaa ctacacgcaa tgtatcaagg gctcgccaga gttcgattgg 300 attctcgggt ggacgatcaa gggattggga catgacttct tgagagatcc aagaatctgc 360 tgtgagccta agaagacgac taacgctgag ttcacgttcc aattgaactt gacggatagt 420 cctgagaccc atcactacag gagcaagatt gaggtaggca tccgacactt gttcgggaac 480 tacatcacca acgatagcta ctcgaagatg tccgtggtta tgaggaacac cacctgggaa 540 ggtcaatgct cgaacagtca tgtgaacacg ctgagattcc tcgttaagaa cgcaggttac 600 ctcgttggaa ggaagccact gcggccgcac ggcggaggta gcaaagactg cgaaatgaag 660 cgcaccaccc tggatagccc tctgggcaag ctggaactgt ctgggtgcga acagggcctg 720 cacgagatca agctgctggg caaaggaaca tctgccgccg acgccgtgga agtgcctgcc 780 ccagccgccg tgctgggcgg accagagcca ctgatgcagg ccaccgcctg gctcaacgcc 840 tactttcacc agcctgaggc catcgaggag ttccctgtgc cagccctgca ccacccagtg 900 ttccagcagg agagctttac ccgccaggtg ctgtggaaac tgctgaaagt ggtgaagttc 960 ggagaggtca tcagctacca gcagctggcc gccctggccg gcaatcccgc cgccaccgcc 1020 gccgtgaaaa ccgccctgag cggaaatccc gtgcccattc tgatcccctg ccaccgggtg 1080 gtgtctagct ctggcgccgt ggggggctac gagggcgggc tcgccgtgaa agagtggctg 1140 ctggcccacg agggccacag actgggcaag cctgggctgg gtcctgcagg tataggcgcg 1200 ccagggtccc tggagcatca tcatcatcat cattgatgac gggccc 1246 <210> 137 <211> 393 <212> PRT <213> artificial <220> <223> Amino acid sequence of fusion protein [GUA.ectoGP1- SNAPlike-Histag] <400> 137 Arg Ser Phe Lys Val Gly His His Thr Asn Phe Glu Ser Phe Thr Val 1 5 10 15 Lys Leu Gly Gly Val Phe His Glu Leu Pro Ser Leu Cys Arg Val Asn 20 25 30 Asn Ser Tyr Ser Leu Ile Arg Leu Ser His Asn Ser Asn Gln Ala Leu 35 40 45 Ser Val Glu Tyr Val Asp Val His Pro Val Leu Cys Ser Ser Ser Pro 50 55 60 Thr Ile Leu Asp Asn Tyr Thr Gln Cys Ile Lys Gly Ser Pro Glu Phe 65 70 75 80 Asp Trp Ile Leu Gly Trp Thr Ile Lys Gly Leu Gly His Asp Phe Leu 85 90 95 Arg Asp Pro Arg Ile Cys Cys Glu Pro Lys Lys Thr Thr Asn Ala Glu 100 105 110 Phe Thr Phe Gln Leu Asn Leu Thr Asp Ser Pro Glu Thr His His Tyr 115 120 125 Arg Ser Lys Ile Glu Val Gly Ile Arg His Leu Phe Gly Asn Tyr Ile 130 135 140 Thr Asn Asp Ser Tyr Ser Lys Met Ser Val Val Met Arg Asn Thr Thr 145 150 155 160 Trp Glu Gly Gln Cys Ser Asn Ser His Val Asn Thr Leu Arg Phe Leu 165 170 175 Val Lys Asn Ala Gly Tyr Leu Val Gly Arg Lys Pro Leu Arg Pro His 180 185 190 Gly Gly Gly Ser Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser 195 200 205 Pro Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu 210 215 220 Ile Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val 225 230 235 240 Pro Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala 245 250 255 Thr Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu 260 265 270 Phe Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe 275 280 285 Thr Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu 290 295 300 Val Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala 305 310 315 320 Thr Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu 325 330 335 Ile Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr 340 345 350 Glu Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His 355 360 365 Arg Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly 370 375 380 Ser Leu Glu His His His His His His 385 390 <210> 138 <211> 1273 <212> DNA <213> artificial <220> <223> DNA sequence encoding ssBiP- Glycoprotein GP1 from Sabia virus- SNAPlike-Histag for expression in S2 cells <400> 138 atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60 ttcagaatcg gaaggagcac agaattgcag aacatcacgt tcgatatgtt gaaggtgttc 120 gaggaccacc ccacatcctg catggtgaac cattccacct actacgtcca tgagaacaag 180 aacgccactt ggtgtctgga ggtgtccgtg actgatgtta ccctgctcat ggctgaacat 240 gatcgtcaag tcctcaacaa cctgtcgaac tgtgtgcacc ctgcagtcga gcacagaagc 300 aggatggttg gcttgctgga gtggatcttc agagccctga agtacgactt caaccatgat 360 ccaacaccgt tgtgtcagaa gcagacttcg acagtgaacg agacacgtgt gcagatcaac 420 atcactgagg ggttcgggtc ccacgggttc gaagatacca tcctccagag actcggggtt 480 ctgttcggtt cgagaattgc attctcgaac atccaggact tgggtaagaa gaggttcttg 540 ttgatcagga actcgacttg gaagaaccaa tgcgagatga accatgtgaa ctccatgcac 600 ttgatgttgg cgaacgctgg tcgctcgtcc ggttcgagaa gaccactgcg gccgcacggc 660 ggaggtagca aagactgcga aatgaagcgc accaccctgg atagccctct gggcaagctg 720 gaactgtctg ggtgcgaaca gggcctgcac gagatcaagc tgctgggcaa aggaacatct 780 gccgccgacg ccgtggaagt gcctgcccca gccgccgtgc tgggcggacc agagccactg 840 atgcaggcca ccgcctggct caacgcctac tttcaccagc ctgaggccat cgaggagttc 900 cctgtgccag ccctgcacca cccagtgttc cagcaggaga gctttacccg ccaggtgctg 960 tggaaactgc tgaaagtggt gaagttcgga gaggtcatca gctaccagca gctggccgcc 1020 ctggccggca atcccgccgc caccgccgcc gtgaaaaccg ccctgagcgg aaatcccgtg 1080 cccattctga tcccctgcca ccgggtggtg tctagctctg gcgccgtggg gggctacgag 1140 ggcgggctcg ccgtgaaaga gtggctgctg gcccacgagg gccacagact gggcaagcct 1200 gggctgggtc ctgcaggtat aggcgcgcca gggtccctgg agcatcatca tcatcatcat 1260 tgatgacggg ccc 1273 <210> 139 <211> 396 <212> PRT <213> artificial <220> <223> Amino acid sequence of fusion protein [SAB.ectoGP1- SNAPlike-Histag] <400> 139 Arg Ser Thr Glu Leu Gln Asn Ile Thr Phe Asp Met Leu Lys Val Phe 1 5 10 15 Glu Asp His Pro Thr Ser Cys Met Val Asn His Ser Thr Tyr Tyr Val 20 25 30 His Glu Asn Lys Asn Ala Thr Trp Cys Leu Glu Val Ser Val Thr Asp 35 40 45 Val Thr Leu Leu Met Ala Glu His Asp Arg Gln Val Leu Asn Asn Leu 50 55 60 Ser Asn Cys Val His Pro Ala Val Glu His Arg Ser Arg Met Val Gly 65 70 75 80 Leu Leu Glu Trp Ile Phe Arg Ala Leu Lys Tyr Asp Phe Asn His Asp 85 90 95 Pro Thr Pro Leu Cys Gln Lys Gln Thr Ser Thr Val Asn Glu Thr Arg 100 105 110 Val Gln Ile Asn Ile Thr Glu Gly Phe Gly Ser His Gly Phe Glu Asp 115 120 125 Thr Ile Leu Gln Arg Leu Gly Val Leu Phe Gly Ser Arg Ile Ala Phe 130 135 140 Ser Asn Ile Gln Asp Leu Gly Lys Lys Arg Phe Leu Leu Ile Arg Asn 145 150 155 160 Ser Thr Trp Lys Asn Gln Cys Glu Met Asn His Val Asn Ser Met His 165 170 175 Leu Met Leu Ala Asn Ala Gly Arg Ser Ser Gly Ser Arg Arg Pro Leu 180 185 190 Arg Pro His Gly Gly Gly Ser Lys Asp Cys Glu Met Lys Arg Thr Thr 195 200 205 Leu Asp Ser Pro Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly 210 215 220 Leu His Glu Ile Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala 225 230 235 240 Val Glu Val Pro Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu 245 250 255 Met Gln Ala Thr Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala 260 265 270 Ile Glu Glu Phe Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln 275 280 285 Glu Ser Phe Thr Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys 290 295 300 Phe Gly Glu Val Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn 305 310 315 320 Pro Ala Ala Thr Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val 325 330 335 Pro Ile Leu Ile Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val 340 345 350 Gly Gly Tyr Glu Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His 355 360 365 Glu Gly His Arg Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly 370 375 380 Ala Pro Gly Ser Leu Glu His His His His His His 385 390 395 <210> 140 <211> 1189 <212> DNA <213> artificial <220> <223> DNA sequence encoding ssBiP- Glycoprotein GP2 from Lassa virus- SNAPlike-Histag for expression in S2 cells <400> 140 atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60 ggcacattca catggacact gtcggattct gaaggtaagg acacaccagg gggatactgt 120 ctgaccaggt ggatgctgat cgaggctgaa ctgaagtgct tcgggaacac agctgtggcg 180 aagtgtaacg agaagcatga tgaggagttc tgtgacatgc tgaggctgtt cgacttcaac 240 aagcaagcca tccagaggtt gaaggctgaa gcacagatga gcatccagtt gatcaacaag 300 gcagtgaatg ccttgatcaa cgaccaactg atcatgaaga accatctgcg ggacatcatg 360 ggtatcccat actgtaacta cagcaagtac tggtacctca accacacaac tactgggaga 420 acatcgctgc ccaagtgttg gctggtgtcg aacggttcgt acttgaacga gacccacttc 480 tccgatgaca tcgaacaaca agctgacaac atgatcactg agatgttgca gaaggagtac 540 atggagaggc aggggaagac accgcggccg cacggcggag gtagcaaaga ctgcgaaatg 600 aagcgcacca ccctggatag ccctctgggc aagctggaac tgtctgggtg cgaacagggc 660 ctgcacgaga tcaagctgct gggcaaagga acatctgccg ccgacgccgt ggaagtgcct 720 gccccagccg ccgtgctggg cggaccagag ccactgatgc aggccaccgc ctggctcaac 780 gcctactttc accagcctga ggccatcgag gagttccctg tgccagccct gcaccaccca 840 gtgttccagc aggagagctt tacccgccag gtgctgtgga aactgctgaa agtggtgaag 900 ttcggagagg tcatcagcta ccagcagctg gccgccctgg ccggcaatcc cgccgccacc 960 gccgccgtga aaaccgccct gagcggaaat cccgtgccca ttctgatccc ctgccaccgg 1020 gtggtgtcta gctctggcgc cgtggggggc tacgagggcg ggctcgccgt gaaagagtgg 1080 ctgctggccc acgagggcca cagactgggc aagcctgggc tgggtcctgc aggtataggc 1140 gcgccagggt ccctggagca tcatcatcat catcattgat gacgggccc 1189 <210> 141 <211> 374 <212> PRT <213> artificial <220> <223> Amino acid sequence of fusion protein [LAS.ectoGP2- SNAPlike-Histag] <400> 141 Arg Ser Gly Thr Phe Thr Trp Thr Leu Ser Asp Ser Glu Gly Lys Asp 1 5 10 15 Thr Pro Gly Gly Tyr Cys Leu Thr Arg Trp Met Leu Ile Glu Ala Glu 20 25 30 Leu Lys Cys Phe Gly Asn Thr Ala Val Ala Lys Cys Asn Glu Lys His 35 40 45 Asp Glu Glu Phe Cys Asp Met Leu Arg Leu Phe Asp Phe Asn Lys Gln 50 55 60 Ala Ile Gln Arg Leu Lys Ala Glu Ala Gln Met Ser Ile Gln Leu Ile 65 70 75 80 Asn Lys Ala Val Asn Ala Leu Ile Asn Asp Gln Leu Ile Met Lys Asn 85 90 95 His Leu Arg Asp Ile Met Gly Ile Pro Tyr Cys Asn Tyr Ser Lys Tyr 100 105 110 Trp Tyr Leu Asn His Thr Thr Thr Gly Arg Thr Ser Leu Pro Lys Cys 115 120 125 Trp Leu Val Ser Asn Gly Ser Tyr Leu Asn Glu Thr His Phe Ser Asp 130 135 140 Asp Ile Glu Gln Gln Ala Asp Asn Met Ile Thr Glu Met Leu Gln Lys 145 150 155 160 Glu Tyr Met Glu Arg Gln Gly Lys Thr Pro Arg Pro His Gly Gly Gly 165 170 175 Ser Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly 180 185 190 Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu 195 200 205 Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro 210 215 220 Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp 225 230 235 240 Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val 245 250 255 Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln 260 265 270 Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser 275 280 285 Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala 290 295 300 Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys 305 310 315 320 His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly 325 330 335 Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly 340 345 350 Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Glu 355 360 365 His His His His His His 370 <210> 142 <211> 1189 <212> DNA <213> artificial <220> <223> DNA sequence encoding ssBiP- Glycoprotein GP2 from Junin virus- SNAPlike-Histag for expression in S2 cells <400> 142 atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60 gcattcttct cctggtcgtt gacagactca tccggcaagg atacccctgg aggctactgc 120 ctggaagagt ggatgctcgt ggcagccaag atgaagtgct tcggcaacac tgctgtggcc 180 aagtgcaact tgaaccatga ctcggagttc tgtgacatgt tgaggctgtt cgattacaac 240 aagaacgcta tcaagaccct gaacgatgag actaagaagc aagtgaacct gatggggcag 300 acaatcaacg ccctgatctc ggacaacttg ttgatgaaga acaagatcag ggaactgatg 360 agtgtccctt actgcaacta cacgaagttc tggtacgtca accacacact ctccggacaa 420 cactcgttgc caaggtgctg gttgatcaag aacaacagct acttgaacat ctccgacttc 480 cgtaacgact ggatcttgga gagtgacttc ttgatctccg agatgctgag caaggagtac 540 tcggacaggc agggtaagac tccgcggccg cacggcggag gtagcaaaga ctgcgaaatg 600 aagcgcacca ccctggatag ccctctgggc aagctggaac tgtctgggtg cgaacagggc 660 ctgcacgaga tcaagctgct gggcaaagga acatctgccg ccgacgccgt ggaagtgcct 720 gccccagccg ccgtgctggg cggaccagag ccactgatgc aggccaccgc ctggctcaac 780 gcctactttc accagcctga ggccatcgag gagttccctg tgccagccct gcaccaccca 840 gtgttccagc aggagagctt tacccgccag gtgctgtgga aactgctgaa agtggtgaag 900 ttcggagagg tcatcagcta ccagcagctg gccgccctgg ccggcaatcc cgccgccacc 960 gccgccgtga aaaccgccct gagcggaaat cccgtgccca ttctgatccc ctgccaccgg 1020 gtggtgtcta gctctggcgc cgtggggggc tacgagggcg ggctcgccgt gaaagagtgg 1080 ctgctggccc acgagggcca cagactgggc aagcctgggc tgggtcctgc aggtataggc 1140 gcgccagggt ccctggagca tcatcatcat catcattgat gacgggccc 1189 <210> 143 <211> 374 <212> PRT <213> artificial <220> <223> Amino acid sequence of fusion protein [JUN.ectoGP2- SNAPlike-Histag] <400> 143 Arg Ser Gly Thr Phe Thr Trp Thr Leu Ser Asp Ser Glu Gly Lys Asp 1 5 10 15 Thr Pro Gly Gly Tyr Cys Leu Thr Arg Trp Met Leu Ile Glu Ala Glu 20 25 30 Leu Lys Cys Phe Gly Asn Thr Ala Val Ala Lys Cys Asn Glu Lys His 35 40 45 Asp Glu Glu Phe Cys Asp Met Leu Arg Leu Phe Asp Phe Asn Lys Gln 50 55 60 Ala Ile Gln Arg Leu Lys Ala Glu Ala Gln Met Ser Ile Gln Leu Ile 65 70 75 80 Asn Lys Ala Val Asn Ala Leu Ile Asn Asp Gln Leu Ile Met Lys Asn 85 90 95 His Leu Arg Asp Ile Met Gly Ile Pro Tyr Cys Asn Tyr Ser Lys Tyr 100 105 110 Trp Tyr Leu Asn His Thr Thr Thr Gly Arg Thr Ser Leu Pro Lys Cys 115 120 125 Trp Leu Val Ser Asn Gly Ser Tyr Leu Asn Glu Thr His Phe Ser Asp 130 135 140 Asp Ile Glu Gln Gln Ala Asp Asn Met Ile Thr Glu Met Leu Gln Lys 145 150 155 160 Glu Tyr Met Glu Arg Gln Gly Lys Thr Pro Arg Pro His Gly Gly Gly 165 170 175 Ser Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly 180 185 190 Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu 195 200 205 Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro 210 215 220 Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp 225 230 235 240 Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val 245 250 255 Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln 260 265 270 Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser 275 280 285 Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala 290 295 300 Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys 305 310 315 320 His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly 325 330 335 Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly 340 345 350 Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Glu 355 360 365 His His His His His His 370 <210> 144 <211> 1189 <212> DNA <213> artificial <220> <223> DNA sequence encoding ssBiP-Glycoprotein GP2 from Machupo virus- SNAPlike-Histag for expression in S2 cells <400> 144 atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60 gcattcttct catggtcgct gaccgactcc tccggcaagg acatgccagg aggttactgt 120 ctggaggaat ggatgttgat cgcagccaag atgaagtgct tcggcaacac cgctgtcgct 180 aagtgtaacc agaaccatga ctcagagttc tgtgatatgc tgaggctatt cgactacaac 240 aagaacgcaa tcaagaccct caacgatgaa tcgaagaagg agatcaacct gctaagccag 300 accgtgaacg ccttgatctc ggataacttg ttaatgaaga acaagatcaa ggagctaatg 360 agcatccctt actgtaatta cacgaagttc tggtacgtca accataccct gacagggcag 420 cacacgctgc caaggtgttg gttgatcagg aacggaagtt acctcaacac ctcggagttc 480 aggaacgact ggatcttgga gagtgatcac ctcatctcgg agatgttgag taaggaatac 540 gctgagaggc aaggcaagac cccgcggccg cacggcggag gtagcaaaga ctgcgaaatg 600 aagcgcacca ccctggatag ccctctgggc aagctggaac tgtctgggtg cgaacagggc 660 ctgcacgaga tcaagctgct gggcaaagga acatctgccg ccgacgccgt ggaagtgcct 720 gccccagccg ccgtgctggg cggaccagag ccactgatgc aggccaccgc ctggctcaac 780 gcctactttc accagcctga ggccatcgag gagttccctg tgccagccct gcaccaccca 840 gtgttccagc aggagagctt tacccgccag gtgctgtgga aactgctgaa agtggtgaag 900 ttcggagagg tcatcagcta ccagcagctg gccgccctgg ccggcaatcc cgccgccacc 960 gccgccgtga aaaccgccct gagcggaaat cccgtgccca ttctgatccc ctgccaccgg 1020 gtggtgtcta gctctggcgc cgtggggggc tacgagggcg ggctcgccgt gaaagagtgg 1080 ctgctggccc acgagggcca cagactgggc aagcctgggc tgggtcctgc aggtataggc 1140 gcgccagggt ccctggagca tcatcatcat catcattgat gacgggccc 1189 <210> 145 <211> 374 <212> PRT <213> artificial <220> <223> Amino acid sequence of fusion protein [MAC.ectoGP2- SNAPlike-Histag] <400> 145 Arg Ser Ala Phe Phe Ser Trp Ser Leu Thr Asp Ser Ser Gly Lys Asp 1 5 10 15 Met Pro Gly Gly Tyr Cys Leu Glu Glu Trp Met Leu Ile Ala Ala Lys 20 25 30 Met Lys Cys Phe Gly Asn Thr Ala Val Ala Lys Cys Asn Gln Asn His 35 40 45 Asp Ser Glu Phe Cys Asp Met Leu Arg Leu Phe Asp Tyr Asn Lys Asn 50 55 60 Ala Ile Lys Thr Leu Asn Asp Glu Ser Lys Lys Glu Ile Asn Leu Leu 65 70 75 80 Ser Gln Thr Val Asn Ala Leu Ile Ser Asp Asn Leu Leu Met Lys Asn 85 90 95 Lys Ile Lys Glu Leu Met Ser Ile Pro Tyr Cys Asn Tyr Thr Lys Phe 100 105 110 Trp Tyr Val Asn His Thr Leu Thr Gly Gln His Thr Leu Pro Arg Cys 115 120 125 Trp Leu Ile Arg Asn Gly Ser Tyr Leu Asn Thr Ser Glu Phe Arg Asn 130 135 140 Asp Trp Ile Leu Glu Ser Asp His Leu Ile Ser Glu Met Leu Ser Lys 145 150 155 160 Glu Tyr Ala Glu Arg Gln Gly Lys Thr Pro Arg Pro His Gly Gly Gly 165 170 175 Ser Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly 180 185 190 Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu 195 200 205 Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro 210 215 220 Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp 225 230 235 240 Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val 245 250 255 Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln 260 265 270 Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser 275 280 285 Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala 290 295 300 Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys 305 310 315 320 His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly 325 330 335 Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly 340 345 350 Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Glu 355 360 365 His His His His His His 370 <210> 146 <211> 1189 <212> DNA <213> artificial <220> <223> DNA sequence encoding ssBiP-Glycoprotein GP2 from Guanarito virus- SNAPlike-Histag for expression in S2 cells <400> 146 atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60 gcattcttca gttggtcgct gtctgacccg aagggtaatg acatgccagg tggttactgt 120 ctggagaggt ggatgttggt cgctggggac ttgaagtgct tcggcaacac agctgtcgcc 180 aagtgtaact tgaaccatga ttccgagttc tgtgacatgt tgaggctgtt cgacttcaac 240 aagaacgcca tcgagaagct gaacaaccag actaagactg ctgtcaacat gttgactcac 300 tcgatcaaca gtctgatctc cgataacttg ttgatgagga acaagctgaa ggagattttg 360 aaggtcccat actgcaacta cacaagattc tggtacatca accacacgaa gtccggcgag 420 cactcgctgc ctcggtgttg gctggtcagt aacggttcct acttgaacga gagtgacttc 480 aggaacgagt ggatcttgga gagtgatcac ctgatcgcag agatgttgag caaggaatac 540 caagataggc aggggaagac tccgcggccg cacggcggag gtagcaaaga ctgcgaaatg 600 aagcgcacca ccctggatag ccctctgggc aagctggaac tgtctgggtg cgaacagggc 660 ctgcacgaga tcaagctgct gggcaaagga acatctgccg ccgacgccgt ggaagtgcct 720 gccccagccg ccgtgctggg cggaccagag ccactgatgc aggccaccgc ctggctcaac 780 gcctactttc accagcctga ggccatcgag gagttccctg tgccagccct gcaccaccca 840 gtgttccagc aggagagctt tacccgccag gtgctgtgga aactgctgaa agtggtgaag 900 ttcggagagg tcatcagcta ccagcagctg gccgccctgg ccggcaatcc cgccgccacc 960 gccgccgtga aaaccgccct gagcggaaat cccgtgccca ttctgatccc ctgccaccgg 1020 gtggtgtcta gctctggcgc cgtggggggc tacgagggcg ggctcgccgt gaaagagtgg 1080 ctgctggccc acgagggcca cagactgggc aagcctgggc tgggtcctgc aggtataggc 1140 gcgccagggt ccctggagca tcatcatcat catcattgat gacgggccc 1189 <210> 147 <211> 374 <212> PRT <213> artificial <220> <223> Amino acid sequence of fusion protein [GUA.ectoGP2- SNAPlike-Histag] <400> 147 Arg Ser Ala Phe Phe Ser Trp Ser Leu Ser Asp Pro Lys Gly Asn Asp 1 5 10 15 Met Pro Gly Gly Tyr Cys Leu Glu Arg Trp Met Leu Val Ala Gly Asp 20 25 30 Leu Lys Cys Phe Gly Asn Thr Ala Val Ala Lys Cys Asn Leu Asn His 35 40 45 Asp Ser Glu Phe Cys Asp Met Leu Arg Leu Phe Asp Phe Asn Lys Asn 50 55 60 Ala Ile Glu Lys Leu Asn Asn Gln Thr Lys Thr Ala Val Asn Met Leu 65 70 75 80 Thr His Ser Ile Asn Ser Leu Ile Ser Asp Asn Leu Leu Met Arg Asn 85 90 95 Lys Leu Lys Glu Ile Leu Lys Val Pro Tyr Cys Asn Tyr Thr Arg Phe 100 105 110 Trp Tyr Ile Asn His Thr Lys Ser Gly Glu His Ser Leu Pro Arg Cys 115 120 125 Trp Leu Val Ser Asn Gly Ser Tyr Leu Asn Glu Ser Asp Phe Arg Asn 130 135 140 Glu Trp Ile Leu Glu Ser Asp His Leu Ile Ala Glu Met Leu Ser Lys 145 150 155 160 Glu Tyr Gln Asp Arg Gln Gly Lys Thr Pro Arg Pro His Gly Gly Gly 165 170 175 Ser Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly 180 185 190 Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu 195 200 205 Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro 210 215 220 Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp 225 230 235 240 Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val 245 250 255 Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln 260 265 270 Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser 275 280 285 Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala 290 295 300 Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys 305 310 315 320 His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly 325 330 335 Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly 340 345 350 Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Glu 355 360 365 His His His His His His 370 <210> 148 <211> 1189 <212> DNA <213> artificial <220> <223> DNA sequence encoding ssBiP-Glycoprotein GP2 from Sabia virus- SNAPlike-Histag for expression in S2 cells <400> 148 atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60 ggcatcttct cctggacgat cacggatgca gtgggcaacg acatgcctgg tggttactgt 120 ctggagagat ggatgctggt gacgtcggat cttaagtgct tcggcaacac ggcactggcg 180 aagtgtaacc tcgaccacga ttcggagttc tgtgacatgt tgaagttgtt cgagttcaac 240 aagaaggcga tcgagacatt gaacgacaac acgaagaaca aggtgaactt gctgacccac 300 tcgatcaacg cattgatctc cgacaacttg ctgatgaaga accgactcaa ggaattgttg 360 aacacgcctt actgtaacta caccaagttc tggtatgtca accacacggc atccggggag 420 cactcattgc cacggtgctg gctggttagg aacaatagct acttgaacga gagtgagttc 480 aggaatgatt ggatcatcga gagtgatcac ttgttgtccg agatgctcaa caaggaatac 540 atcgatagac agggcaagac gccgcggccg cacggcggag gtagcaaaga ctgcgaaatg 600 aagcgcacca ccctggatag ccctctgggc aagctggaac tgtctgggtg cgaacagggc 660 ctgcacgaga tcaagctgct gggcaaagga acatctgccg ccgacgccgt ggaagtgcct 720 gccccagccg ccgtgctggg cggaccagag ccactgatgc aggccaccgc ctggctcaac 780 gcctactttc accagcctga ggccatcgag gagttccctg tgccagccct gcaccaccca 840 gtgttccagc aggagagctt tacccgccag gtgctgtgga aactgctgaa agtggtgaag 900 ttcggagagg tcatcagcta ccagcagctg gccgccctgg ccggcaatcc cgccgccacc 960 gccgccgtga aaaccgccct gagcggaaat cccgtgccca ttctgatccc ctgccaccgg 1020 gtggtgtcta gctctggcgc cgtggggggc tacgagggcg ggctcgccgt gaaagagtgg 1080 ctgctggccc acgagggcca cagactgggc aagcctgggc tgggtcctgc aggtataggc 1140 gcgccagggt ccctggagca tcatcatcat catcattgat gacgggccc 1189 <210> 149 <211> 374 <212> PRT <213> artificial <220> <223> Amino acid sequence of fusion protein [SAB.ectoGP2- SNAPlike-Histag] <400> 149 Arg Ser Gly Ile Phe Ser Trp Thr Ile Thr Asp Ala Val Gly Asn Asp 1 5 10 15 Met Pro Gly Gly Tyr Cys Leu Glu Arg Trp Met Leu Val Thr Ser Asp 20 25 30 Leu Lys Cys Phe Gly Asn Thr Ala Leu Ala Lys Cys Asn Leu Asp His 35 40 45 Asp Ser Glu Phe Cys Asp Met Leu Lys Leu Phe Glu Phe Asn Lys Lys 50 55 60 Ala Ile Glu Thr Leu Asn Asp Asn Thr Lys Asn Lys Val Asn Leu Leu 65 70 75 80 Thr His Ser Ile Asn Ala Leu Ile Ser Asp Asn Leu Leu Met Lys Asn 85 90 95 Arg Leu Lys Glu Leu Leu Asn Thr Pro Tyr Cys Asn Tyr Thr Lys Phe 100 105 110 Trp Tyr Val Asn His Thr Ala Ser Gly Glu His Ser Leu Pro Arg Cys 115 120 125 Trp Leu Val Arg Asn Asn Ser Tyr Leu Asn Glu Ser Glu Phe Arg Asn 130 135 140 Asp Trp Ile Ile Glu Ser Asp His Leu Leu Ser Glu Met Leu Asn Lys 145 150 155 160 Glu Tyr Ile Asp Arg Gln Gly Lys Thr Pro Arg Pro His Gly Gly Gly 165 170 175 Ser Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly 180 185 190 Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu 195 200 205 Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro 210 215 220 Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp 225 230 235 240 Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val 245 250 255 Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln 260 265 270 Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser 275 280 285 Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala 290 295 300 Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys 305 310 315 320 His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly 325 330 335 Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly 340 345 350 Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Glu 355 360 365 His His His His His His 370 <210> 150 <211> 2774 <212> DNA <213> artificial <220> <223> DNA sequence encoding BiPlike- SNAPlike-proTEV1-C protein of Hepatitis E virus- proTEV2-Histag for expression in S2 cells <400> 150 atgaaactat gtattctact tgcagttgtt gcgttcgtag gattgtcctt acctacagct 60 ctggcaagat ctgacaaaga ctgcgaaatg aaaagaacta cattggattc accacttggg 120 aagttggaac tgagtggatg cgagcaagga ttgcatgaaa ttaagctact gggaaaagga 180 acttctgctg ctgatgcagt tgaagttcca gcaccagcag ctgttcttgg aggtcctgag 240 cccctcatgc aagccacagc ctggcttaac gcatatttcc accagcctga ggccattgag 300 gaatttccag tccccgccct tcaccatcct gtgtttcagc aggagagctt cacccgccag 360 gtcctgtgga aattgctgaa ggtggtcaag tttggtgaag tgatttcata tcagcaactt 420 gctgcattgg ccggtaaccc cgcagctaca gctgccgtga aaactgctct cagcggaaat 480 cctgtgccca tcctgatccc ttgtcacaga gtcgtttcat cttccggagc tgtaggtggc 540 tatgaaggag gactggcagt taaggagtgg ctgctggctc atgaaggtca tagacttgga 600 aagcctgggc tgggtcctgc tggtataggc gcgccagggt ccctaggtgg cggatccgaa 660 aacctgtact tccagagcga tatcaataac atgttctttt gctctgtgca tggagatgcc 720 accatgcgct ctcgggcttt tctgtttttg ttcctcgtgt ttctgcctat gctgcccgcg 780 ccaccggccg gtcagccgtc tggccgccgc cgcgggcggc gcagcggcgg tgccggcggt 840 ggtttctggg gtgaccggat tgattctcag cccttcgccc tcccctatat tcatccaacc 900 aaccccttcg cacctgacat tccagccgca gccggggctg gagctcgccc tcggcagcca 960 gcccgcccac tcggctccgc ttggcgtgac caatcccagc gccccgccac ttccgcccgt 1020 cgtcgatctg ccccagctgg ggcttcgccg ctgactgctg tggccccggc ccccgatact 1080 gttcctgttc ccgatgtcga ttctcgcggc gctatattac gccgccagta taatttatca 1140 acatccccgc taacatctac tattgccact ggtactaacc ttgttctata tgctgctccg 1200 ctgagccctt tgcttccgct ccaagatgga actaacactc acattatggc cactgaagca 1260 tcaaattatg cccagtaccg tgttgtccgc gctaccatcc ggtaccgtcc gcttgtgccg 1320 aacgctgtcg gcggatacgc tatatctatc tctttctggc ctcagacaac tactaccccg 1380 acatctgtgg acatgaactc tatcacctcc acggatgtcc gaatccttgt ccagcctggt 1440 attgcttcag aacttgtgat ccccagtgag cgcctgcatt atcgtaacca aggctggcgc 1500 tctgttgaga cctctggtgt tgcggaggag gaggcgacct ccggccttgt catgctttgc 1560 atccacggat cacctgtaaa ttcttacacc aatacgcctt atactggtgc ccttggcttg 1620 cttgatttcg cactcgagct cgagttccgc aatttgacac ctggtaacac gaacacacgt 1680 gtttcccgct actcgagtag tgcgcgccac aagctacgcc gagggcctga tggcactgct 1740 gagttaacta cgactgctgc tacacgcttt atgaaggacc ttcattttac agggactaat 1800 ggagttggtg aagtcggtcg tggtatagcg ctaactctgt tcaaccttgc tgatacgctt 1860 ctcggcgggc tcccgacaga attgatttcg tcggctggtg gtcagctatt ttattctcgc 1920 cccgtcgtct cagccaatgg cgagccgacg gtgaagctct acacttcagt cgagaacgct 1980 cagcaggata agggtatagc tatcccacat gatattgatc ttggtgagtc ccgtgttgtc 2040 attcaggatt atgataacca acatgagcag gatcgtccca ccccttctcc tgctccctct 2100 cggccttttt ctgtccttcg tgctaatgat gtgctatggc tttcacttac agcagctgag 2160 tatgatcaga ctacctatgg ctcctctact aatcccatgt atgtctctga taccgtgaca 2220 tttgtcaatg ttgctactgg tgcccagggg gtatctcgct ctctggactg gtctaaagtc 2280 acccttgatg ggcgcccact tatgactatc cagcagtatt ctaagacttt ctttgttctg 2340 cccctccgtg gcaagctctc cttctgggag gccggtacca ctaaggccgg ctacccttat 2400 aattataata ctactgccag tgaccagatt ttaattgaga atgcagctgg tcaccgtgta 2460 tgcatctcaa cctacactac taatcttgga tctggccctg tttctatttc tgctgtcggt 2520 gtcctcgcac ctcactctgc gttggccgct ttagaggaca ctgttgacta tcctgctcgt 2580 gctcacactt ttgatgattt ctgccctgag tgccgtacac tcggccttca gggttgtgct 2640 ttccaatcaa ctgttgctga gctacagcgt cttaaaatga aggtgggtaa aactcgggag 2700 tacccgggag agaatctata ttttcaaggg cccggcggag gtagtcacca tcatcaccat 2760 cactaatgac cggt 2774 <210> 151 <211> 899 <212> PRT <213> artificial <220> <223> Aa sequence of fusion protein [SNAPlike-proTEV1-HEV.C-proTEV2-Histag] <400> 151 Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro 1 5 10 15 Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile 20 25 30 Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro 35 40 45 Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr 50 55 60 Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe 65 70 75 80 Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr 85 90 95 Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val 100 105 110 Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr 115 120 125 Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile 130 135 140 Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu 145 150 155 160 Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg 165 170 175 Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser 180 185 190 Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Asn Asn 195 200 205 Met Phe Phe Cys Ser Val His Gly Asp Ala Thr Met Arg Ser Arg Ala 210 215 220 Phe Leu Phe Leu Phe Leu Val Phe Leu Pro Met Leu Pro Ala Pro Pro 225 230 235 240 Ala Gly Gln Pro Ser Gly Arg Arg Arg Gly Arg Arg Ser Gly Gly Ala 245 250 255 Gly Gly Gly Phe Trp Gly Asp Arg Ile Asp Ser Gln Pro Phe Ala Leu 260 265 270 Pro Tyr Ile His Pro Thr Asn Pro Phe Ala Pro Asp Ile Pro Ala Ala 275 280 285 Ala Gly Ala Gly Ala Arg Pro Arg Gln Pro Ala Arg Pro Leu Gly Ser 290 295 300 Ala Trp Arg Asp Gln Ser Gln Arg Pro Ala Thr Ser Ala Arg Arg Arg 305 310 315 320 Ser Ala Pro Ala Gly Ala Ser Pro Leu Thr Ala Val Ala Pro Ala Pro 325 330 335 Asp Thr Val Pro Val Pro Asp Val Asp Ser Arg Gly Ala Ile Leu Arg 340 345 350 Arg Gln Tyr Asn Leu Ser Thr Ser Pro Leu Thr Ser Thr Ile Ala Thr 355 360 365 Gly Thr Asn Leu Val Leu Tyr Ala Ala Pro Leu Ser Pro Leu Leu Pro 370 375 380 Leu Gln Asp Gly Thr Asn Thr His Ile Met Ala Thr Glu Ala Ser Asn 385 390 395 400 Tyr Ala Gln Tyr Arg Val Val Arg Ala Thr Ile Arg Tyr Arg Pro Leu 405 410 415 Val Pro Asn Ala Val Gly Gly Tyr Ala Ile Ser Ile Ser Phe Trp Pro 420 425 430 Gln Thr Thr Thr Thr Pro Thr Ser Val Asp Met Asn Ser Ile Thr Ser 435 440 445 Thr Asp Val Arg Ile Leu Val Gln Pro Gly Ile Ala Ser Glu Leu Val 450 455 460 Ile Pro Ser Glu Arg Leu His Tyr Arg Asn Gln Gly Trp Arg Ser Val 465 470 475 480 Glu Thr Ser Gly Val Ala Glu Glu Glu Ala Thr Ser Gly Leu Val Met 485 490 495 Leu Cys Ile His Gly Ser Pro Val Asn Ser Tyr Thr Asn Thr Pro Tyr 500 505 510 Thr Gly Ala Leu Gly Leu Leu Asp Phe Ala Leu Glu Leu Glu Phe Arg 515 520 525 Asn Leu Thr Pro Gly Asn Thr Asn Thr Arg Val Ser Arg Tyr Ser Ser 530 535 540 Ser Ala Arg His Lys Leu Arg Arg Gly Pro Asp Gly Thr Ala Glu Leu 545 550 555 560 Thr Thr Thr Ala Ala Thr Arg Phe Met Lys Asp Leu His Phe Thr Gly 565 570 575 Thr Asn Gly Val Gly Glu Val Gly Arg Gly Ile Ala Leu Thr Leu Phe 580 585 590 Asn Leu Ala Asp Thr Leu Leu Gly Gly Leu Pro Thr Glu Leu Ile Ser 595 600 605 Ser Ala Gly Gly Gln Leu Phe Tyr Ser Arg Pro Val Val Ser Ala Asn 610 615 620 Gly Glu Pro Thr Val Lys Leu Tyr Thr Ser Val Glu Asn Ala Gln Gln 625 630 635 640 Asp Lys Gly Ile Ala Ile Pro His Asp Ile Asp Leu Gly Glu Ser Arg 645 650 655 Val Val Ile Gln Asp Tyr Asp Asn Gln His Glu Gln Asp Arg Pro Thr 660 665 670 Pro Ser Pro Ala Pro Ser Arg Pro Phe Ser Val Leu Arg Ala Asn Asp 675 680 685 Val Leu Trp Leu Ser Leu Thr Ala Ala Glu Tyr Asp Gln Thr Thr Tyr 690 695 700 Gly Ser Ser Thr Asn Pro Met Tyr Val Ser Asp Thr Val Thr Phe Val 705 710 715 720 Asn Val Ala Thr Gly Ala Gln Gly Val Ser Arg Ser Leu Asp Trp Ser 725 730 735 Lys Val Thr Leu Asp Gly Arg Pro Leu Met Thr Ile Gln Gln Tyr Ser 740 745 750 Lys Thr Phe Phe Val Leu Pro Leu Arg Gly Lys Leu Ser Phe Trp Glu 755 760 765 Ala Gly Thr Thr Lys Ala Gly Tyr Pro Tyr Asn Tyr Asn Thr Thr Ala 770 775 780 Ser Asp Gln Ile Leu Ile Glu Asn Ala Ala Gly His Arg Val Cys Ile 785 790 795 800 Ser Thr Tyr Thr Thr Asn Leu Gly Ser Gly Pro Val Ser Ile Ser Ala 805 810 815 Val Gly Val Leu Ala Pro His Ser Ala Leu Ala Ala Leu Glu Asp Thr 820 825 830 Val Asp Tyr Pro Ala Arg Ala His Thr Phe Asp Asp Phe Cys Pro Glu 835 840 845 Cys Arg Thr Leu Gly Leu Gln Gly Cys Ala Phe Gln Ser Thr Val Ala 850 855 860 Glu Leu Gln Arg Leu Lys Met Lys Val Gly Lys Thr Arg Glu Tyr Pro 865 870 875 880 Gly Glu Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser His His His 885 890 895 His His His <210> 152 <211> 51 <212> DNA <213> artificial <220> <223> DNA encoding biPlike sequence <400> 152 atgaaactat gtattctact tgcagttgtt gcgttcgtag gattgtcctt a 51 <210> 153 <211> 17 <212> PRT <213> artificial <220> <223> Amino acid of BIPlike sequence <400> 153 Met Lys Leu Cys Ile Leu Leu Ala Val Val Ala Phe Val Gly Leu Ser 1 5 10 15 Leu <210> 154 <211> 2047 <212> DNA <213> Artificial Sequence <220> <223> nucleotide sequence of a SNAP construct containing the SARS virus N gene <400> 154 tcgcgagcta gcaccatgaa actatgtatt ctacttgcag ttgttgcgtt cgtaggattg 60 tccttaccta cagctctggc aagatctgac aaagactgcg aaatgaaaag aactacattg 120 gattcaccac ttgggaagtt ggaactgagt ggatgcgagc aaggattgca tgaaattaag 180 ctactgggaa aaggaacttc tgctgctgat gcagttgaag ttccagcacc agcagctgtt 240 cttggaggtc ctgagcccct catgcaagcc acagcctggc ttaacgcata tttccaccag 300 cctgaggcca ttgaggaatt tccagtcccc gcccttcacc atcctgtgtt tcagcaggag 360 agcttcaccc gccaggtcct gtggaaattg ctgaaggtgg tcaagtttgg tgaagtgatt 420 tcatatcagc aacttgctgc attggccggt aaccccgcag ctacagctgc cgtgaaaact 480 gctctcagcg gaaatcctgt gcccatcctg atcccttgtc acagagtcgt ttcatcttcc 540 ggagctgtag gtggctatga aggaggactg gcagttaagg agtggctgct ggctcatgaa 600 ggtcatagac ttggaaagcc tgggctgggt cctgctggta taggcgcgcc agggtcccta 660 ggtggcggat ccgaaaacct gtacttccag agcgatatct ctgataatgg accccaatca 720 aaccaacgta gtgcccctcg cattacattt ggtggaccta cagattcaac tgacaataac 780 cagaatggag gtcgcaatgg tgcaaggcca aagcagcgcc gacctcaagg tttacctaat 840 aatactgcgt cttggttcac agctctcact cagcatggca aggaggaact tagattccct 900 cgaggccagg gcgttccaat caacaccaat agtggtccag atgaccaaat tggctactac 960 cgaagagcta cccgacgagt tcgtggtggt gacggcaaaa tgaaggagct cagccctaga 1020 tggtacttct attacctagg aactggccca gaagcctcac ttccttacgg cgctaacaag 1080 gaaggcatcg tatgggttgc aactgaggga gccttgaata cacctaagga ccacattggc 1140 acccgcaatc ctaataacaa tgctgccacc gtgctacaac ttcctcaagg aacaacattg 1200 cctaagggct tctacgcaga gggaagcaga ggcggcagtc aagcctcttc tcgctcctca 1260 tcacgtagtc gcggtaattc aagaaattca actcctggca gcagtagggg aaattctcct 1320 gctcgaatgg ccagcggagg tggtgaaact gccctcgcgc tattgctgct agacagattg 1380 aaccagcttg agagcaaagt ttctggtaag ggccagcaac agcagggcca aactgtcact 1440 aagaagtctg ctgctgaggc atctaagaag cctcgccaaa agcgtactgc cacaaagcag 1500 tacaacgtca ctcaagcatt cggcagacgt ggtccagaac agacccaggg aaatttcggt 1560 gaccaagacc taatcagaca gggaactgat tacaagcatt ggccgcagat tgcacagttc 1620 gctccaagtg cctctgcatt cttcggaatg tcacgcattg gcatggaagt cacaccttcg 1680 ggaacatggc tgacttatca tggagccatt aagttggatg acaaggaccc acagttcaag 1740 gacaacgtca tactgctgaa caagcacatt gacgcataca aaacattccc accaacagag 1800 cctaagaagg acaagaagaa gaagactgat gaagctcagc ctttgccgca gagacaaaag 1860 aagcagccca ctgtgactct tcttcctgcg gctgacatgg atgatttctc cagacaactt 1920 cagaattcca tgagtggagc ttctgctgat tcaactcagg ccccgggaga gaatctatat 1980 tttcaagggc ccggcggagg tagtcaccat catcaccatc actaatgacc ggtgcggccg 2040 caagctt 2047 <210> 155 <211> 674 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of a SNAP construct containing the SARS virus N gene <400> 155 Ser Arg Ala Ser Thr Met Lys Leu Cys Ile Leu Leu Ala Val Val Ala 1 5 10 15 Phe Val Gly Leu Ser Leu Pro Thr Ala Leu Ala Arg Ser Asp Lys Asp 20 25 30 Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly Lys Leu Glu 35 40 45 Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu Leu Gly Lys 50 55 60 Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro Ala Ala Val 65 70 75 80 Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp Leu Asn Ala 85 90 95 Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val Pro Ala Leu 100 105 110 His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln Val Leu Trp 115 120 125 Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser Tyr Gln Gln 130 135 140 Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala Val Lys Thr 145 150 155 160 Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys His Arg Val 165 170 175 Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly Leu Ala Val 180 185 190 Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly Lys Pro Gly 195 200 205 Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Gly Gly Gly Ser 210 215 220 Glu Asn Leu Tyr Phe Gln Ser Asp Ile Ser Asp Asn Gly Pro Gln Ser 225 230 235 240 Asn Gln Arg Ser Ala Pro Arg Ile Thr Phe Gly Gly Pro Thr Asp Ser 245 250 255 Thr Asp Asn Asn Gln Asn Gly Gly Arg Asn Gly Ala Arg Pro Lys Gln 260 265 270 Arg Arg Pro Gln Gly Leu Pro Asn Asn Thr Ala Ser Trp Phe Thr Ala 275 280 285 Leu Thr Gln His Gly Lys Glu Glu Leu Arg Phe Pro Arg Gly Gln Gly 290 295 300 Val Pro Ile Asn Thr Asn Ser Gly Pro Asp Asp Gln Ile Gly Tyr Tyr 305 310 315 320 Arg Arg Ala Thr Arg Arg Val Arg Gly Gly Asp Gly Lys Met Lys Glu 325 330 335 Leu Ser Pro Arg Trp Tyr Phe Tyr Tyr Leu Gly Thr Gly Pro Glu Ala 340 345 350 Ser Leu Pro Tyr Gly Ala Asn Lys Glu Gly Ile Val Trp Val Ala Thr 355 360 365 Glu Gly Ala Leu Asn Thr Pro Lys Asp His Ile Gly Thr Arg Asn Pro 370 375 380 Asn Asn Asn Ala Ala Thr Val Leu Gln Leu Pro Gln Gly Thr Thr Leu 385 390 395 400 Pro Lys Gly Phe Tyr Ala Glu Gly Ser Arg Gly Gly Ser Gln Ala Ser 405 410 415 Ser Arg Ser Ser Ser Arg Ser Arg Gly Asn Ser Arg Asn Ser Thr Pro 420 425 430 Gly Ser Ser Arg Gly Asn Ser Pro Ala Arg Met Ala Ser Gly Gly Gly 435 440 445 Glu Thr Ala Leu Ala Leu Leu Leu Leu Asp Arg Leu Asn Gln Leu Glu 450 455 460 Ser Lys Val Ser Gly Lys Gly Gln Gln Gln Gln Gly Gln Thr Val Thr 465 470 475 480 Lys Lys Ser Ala Ala Glu Ala Ser Lys Lys Pro Arg Gln Lys Arg Thr 485 490 495 Ala Thr Lys Gln Tyr Asn Val Thr Gln Ala Phe Gly Arg Arg Gly Pro 500 505 510 Glu Gln Thr Gln Gly Asn Phe Gly Asp Gln Asp Leu Ile Arg Gln Gly 515 520 525 Thr Asp Tyr Lys His Trp Pro Gln Ile Ala Gln Phe Ala Pro Ser Ala 530 535 540 Ser Ala Phe Phe Gly Met Ser Arg Ile Gly Met Glu Val Thr Pro Ser 545 550 555 560 Gly Thr Trp Leu Thr Tyr His Gly Ala Ile Lys Leu Asp Asp Lys Asp 565 570 575 Pro Gln Phe Lys Asp Asn Val Ile Leu Leu Asn Lys His Ile Asp Ala 580 585 590 Tyr Lys Thr Phe Pro Pro Thr Glu Pro Lys Lys Asp Lys Lys Lys Lys 595 600 605 Thr Asp Glu Ala Gln Pro Leu Pro Gln Arg Gln Lys Lys Gln Pro Thr 610 615 620 Val Thr Leu Leu Pro Ala Ala Asp Met Asp Asp Phe Ser Arg Gln Leu 625 630 635 640 Gln Asn Ser Met Ser Gly Ala Ser Ala Asp Ser Thr Gln Ala Pro Gly 645 650 655 Glu Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser His His His His 660 665 670 His His <210> 156 <211> 1357 <212> DNA <213> Artificial Sequence <220> <223> Nucleotide sequence of a SNAP construct containing the SARS virus S gene receptor binding domain <400> 156 tcgcgagcta gcaccatgaa actatgtatt ctacttgcag ttgttgcgtt cgtaggattg 60 tccttaccta cagctctggc aagatctgac aaagactgcg aaatgaaaag aactacattg 120 gattcaccac ttgggaagtt ggaactgagt ggatgcgagc aaggattgca tgaaattaag 180 ctactgggaa aaggaacttc tgctgctgat gcagttgaag ttccagcacc agcagctgtt 240 cttggaggtc ctgagcccct catgcaagcc acagcctggc ttaacgcata tttccaccag 300 cctgaggcca ttgaggaatt tccagtcccc gcccttcacc atcctgtgtt tcagcaggag 360 agcttcaccc gccaggtcct gtggaaattg ctgaaggtgg tcaagtttgg tgaagtgatt 420 tcatatcagc aacttgctgc attggccggt aaccccgcag ctacagctgc cgtgaaaact 480 gctctcagcg gaaatcctgt gcccatcctg atcccttgtc acagagtcgt ttcatcttcc 540 ggagctgtag gtggctatga aggaggactg gcagttaagg agtggctgct ggctcatgaa 600 ggtcatagac ttggaaagcc tgggctgggt cctgctggta taggcgcgcc agggtcccta 660 ggtggcggat ccgaaaacct gtacttccag agcgatatca ccaacctctg tcctttcggt 720 gaagtgttta acgccactaa gttccccagc gtttacgctt gggagcgtaa gaaaatctca 780 aattgcgtgg ccgactactc tgtgctctac aacagcactt tcttttccac cttcaagtgt 840 tacggagttt ccgctacaaa gctgaacgac ctgtgcttca gcaacgtgta cgctgatagc 900 tttgtggtca agggagacga tgttcgccag attgcccctg gacagaccgg cgttatcgct 960 gactacaact ataaactgcc agacgatttc atgggctgtg tcctggcctg gaacactcgt 1020 aatatcgacg ctaccagtac aggaaactac aattacaagt accgttacct gcgccacggt 1080 aagttgaggc cattcgaacg cgacatctca aacgtccctt tctcccctga cggtaagcca 1140 tgtacacccc ctgccctgaa ctgctactgg ccactcaacg actacggttt ctataccaca 1200 actggcatcg gctaccaacc ctacagagtc gttgtgctct ctttcgagtt gctcaacgct 1260 cctgccacag tcccgggaga gaatctatat tttcaagggc ccggcggagg tagtcaccat 1320 catcaccatc actaatgacc ggtgcggccg caagctt 1357 <210> 157 <211> 444 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of a SNAP construct containing the SARS virus S gene receptor binding domain. <400> 157 Ser Arg Ala Ser Thr Met Lys Leu Cys Ile Leu Leu Ala Val Val Ala 1 5 10 15 Phe Val Gly Leu Ser Leu Pro Thr Ala Leu Ala Arg Ser Asp Lys Asp 20 25 30 Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly Lys Leu Glu 35 40 45 Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu Leu Gly Lys 50 55 60 Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro Ala Ala Val 65 70 75 80 Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp Leu Asn Ala 85 90 95 Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val Pro Ala Leu 100 105 110 His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln Val Leu Trp 115 120 125 Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser Tyr Gln Gln 130 135 140 Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala Val Lys Thr 145 150 155 160 Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys His Arg Val 165 170 175 Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly Leu Ala Val 180 185 190 Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly Lys Pro Gly 195 200 205 Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Gly Gly Gly Ser 210 215 220 Glu Asn Leu Tyr Phe Gln Ser Asp Ile Thr Asn Leu Cys Pro Phe Gly 225 230 235 240 Glu Val Phe Asn Ala Thr Lys Phe Pro Ser Val Tyr Ala Trp Glu Arg 245 250 255 Lys Lys Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser 260 265 270 Thr Phe Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Ala Thr Lys Leu 275 280 285 Asn Asp Leu Cys Phe Ser Asn Val Tyr Ala Asp Ser Phe Val Val Lys 290 295 300 Gly Asp Asp Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Val Ile Ala 305 310 315 320 Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Met Gly Cys Val Leu Ala 325 330 335 Trp Asn Thr Arg Asn Ile Asp Ala Thr Ser Thr Gly Asn Tyr Asn Tyr 340 345 350 Lys Tyr Arg Tyr Leu Arg His Gly Lys Leu Arg Pro Phe Glu Arg Asp 355 360 365 Ile Ser Asn Val Pro Phe Ser Pro Asp Gly Lys Pro Cys Thr Pro Pro 370 375 380 Ala Leu Asn Cys Tyr Trp Pro Leu Asn Asp Tyr Gly Phe Tyr Thr Thr 385 390 395 400 Thr Gly Ile Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu 405 410 415 Leu Leu Asn Ala Pro Ala Thr Val Pro Gly Glu Asn Leu Tyr Phe Gln 420 425 430 Gly Pro Gly Gly Gly Ser His His His His His His 435 440 <210> 158 <211> 2023 <212> DNA <213> Artificial Sequence <220> <223> Nucleotide sequence of a SNAP construct containing the human coronavirus N gene <400> 158 tcgcgagcta gcaccatgaa actatgtatt ctacttgcag ttgttgcgtt cgtaggattg 60 tccttaccta cagctctggc aagatctgac aaagactgcg aaatgaaaag aactacattg 120 gattcaccac ttgggaagtt ggaactgagt ggatgcgagc aaggattgca tgaaattaag 180 ctactgggaa aaggaacttc tgctgctgat gcagttgaag ttccagcacc agcagctgtt 240 cttggaggtc ctgagcccct catgcaagcc acagcctggc ttaacgcata tttccaccag 300 cctgaggcca ttgaggaatt tccagtcccc gcccttcacc atcctgtgtt tcagcaggag 360 agcttcaccc gccaggtcct gtggaaattg ctgaaggtgg tcaagtttgg tgaagtgatt 420 tcatatcagc aacttgctgc attggccggt aaccccgcag ctacagctgc cgtgaaaact 480 gctctcagcg gaaatcctgt gcccatcctg atcccttgtc acagagtcgt ttcatcttcc 540 ggagctgtag gtggctatga aggaggactg gcagttaagg agtggctgct ggctcatgaa 600 ggtcatagac ttggaaagcc tgggctgggt cctgctggta taggcgcgcc agggtcccta 660 ggtggcggat ccgaaaacct gtacttccag agcgatatcg catcccctgc tgcacctcgt 720 gctgtttcct ttgccgataa caatgatata acaaatacaa acctatctcg aggtagagga 780 cgtaatccaa aaccacgagc tgcaccaaat aacactgtct cttggtacac tgggcttacc 840 caacacggga aagtccctct tacctttcca cctgggcagg gtgtacctct taatgccaat 900 tctacccctg cgcaaaatgc tgggtattgg cggagacagg acagaaaaat taataccggg 960 aatggaatta agcaactggc tcccaggtgg tacttctact acactggaac tggacccgaa 1020 gcagcactcc cattccgggc tgttaaggat ggcatcgttt gggtccatga agatggcgcc 1080 actgatgctc cttcaacttt tgggacgcgg aaccctaaca atgattcagc tattgttaca 1140 caattcgcgc ccggtactaa acttcctaaa aacttccaca ttgaggggac tggaggcaat 1200 agtcaatcat cttcaagagc ctctagctta agcagaaact cttccaggtc tagttcacaa 1260 ggttcaagat caggaaactc tacccgcggc acttctccag gtccatctgg aatcggagca 1320 gtaggaggtg atctacttta ccttgatctt ctgaacagac tacaagccct tgagtctggc 1380 aaagtaaagc aatcgcagcc aaaagtaatc actaagaaag atgctgctgc tgctaaaaat 1440 aagatgcgcc acaagcgcac ttccaccaaa agtttcaaca tggtgcaggc ttttggtctt 1500 cgcggaccag gagacctcca gggaaacttt ggtgatcttc aattgaataa actcggcact 1560 gaggacccac gttggcccca aattgctgag cttgctccta cagccagtgc ttttatgggt 1620 atgtcgcaat ttaaacttac ccatcagaac aatgatgatc atggcaaccc tgtgtacttc 1680 cttcggtaca gtggagccat taaacttgac ccaaagaatc ccaactacaa taagtggttg 1740 gagcttcttg agcaaaatat tgatgcctac aaaaccttcc ctaagaagga aaagaaacaa 1800 aaggcaccaa aagaagaatc aacagaccaa atgtctgaac ctccaaagga gcagcgtgtg 1860 caaggtagca tcactcagcg cactcgcacc cgtccaagtg ttcagcctgg tccaatgatt 1920 gatgttaaca ctgatggccc gggagagaat ctatattttc aagggcccgg cggaggtagt 1980 caccatcatc accatcacta atgaccggtg cggccgcaag ctt 2023 <210> 159 <211> 666 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of a SNAP construct containing the human coronavirus N gene. <400> 159 Ser Arg Ala Ser Thr Met Lys Leu Cys Ile Leu Leu Ala Val Val Ala 1 5 10 15 Phe Val Gly Leu Ser Leu Pro Thr Ala Leu Ala Arg Ser Asp Lys Asp 20 25 30 Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly Lys Leu Glu 35 40 45 Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu Leu Gly Lys 50 55 60 Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro Ala Ala Val 65 70 75 80 Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp Leu Asn Ala 85 90 95 Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val Pro Ala Leu 100 105 110 His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln Val Leu Trp 115 120 125 Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser Tyr Gln Gln 130 135 140 Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala Val Lys Thr 145 150 155 160 Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys His Arg Val 165 170 175 Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly Leu Ala Val 180 185 190 Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly Lys Pro Gly 195 200 205 Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Gly Gly Gly Ser 210 215 220 Glu Asn Leu Tyr Phe Gln Ser Asp Ile Ala Ser Pro Ala Ala Pro Arg 225 230 235 240 Ala Val Ser Phe Ala Asp Asn Asn Asp Ile Thr Asn Thr Asn Leu Ser 245 250 255 Arg Gly Arg Gly Arg Asn Pro Lys Pro Arg Ala Ala Pro Asn Asn Thr 260 265 270 Val Ser Trp Tyr Thr Gly Leu Thr Gln His Gly Lys Val Pro Leu Thr 275 280 285 Phe Pro Pro Gly Gln Gly Val Pro Leu Asn Ala Asn Ser Thr Pro Ala 290 295 300 Gln Asn Ala Gly Tyr Trp Arg Arg Gln Asp Arg Lys Ile Asn Thr Gly 305 310 315 320 Asn Gly Ile Lys Gln Leu Ala Pro Arg Trp Tyr Phe Tyr Tyr Thr Gly 325 330 335 Thr Gly Pro Glu Ala Ala Leu Pro Phe Arg Ala Val Lys Asp Gly Ile 340 345 350 Val Trp Val His Glu Asp Gly Ala Thr Asp Ala Pro Ser Thr Phe Gly 355 360 365 Thr Arg Asn Pro Asn Asn Asp Ser Ala Ile Val Thr Gln Phe Ala Pro 370 375 380 Gly Thr Lys Leu Pro Lys Asn Phe His Ile Glu Gly Thr Gly Gly Asn 385 390 395 400 Ser Gln Ser Ser Ser Arg Ala Ser Ser Leu Ser Arg Asn Ser Ser Arg 405 410 415 Ser Ser Ser Gln Gly Ser Arg Ser Gly Asn Ser Thr Arg Gly Thr Ser 420 425 430 Pro Gly Pro Ser Gly Ile Gly Ala Val Gly Gly Asp Leu Leu Tyr Leu 435 440 445 Asp Leu Leu Asn Arg Leu Gln Ala Leu Glu Ser Gly Lys Val Lys Gln 450 455 460 Ser Gln Pro Lys Val Ile Thr Lys Lys Asp Ala Ala Ala Ala Lys Asn 465 470 475 480 Lys Met Arg His Lys Arg Thr Ser Thr Lys Ser Phe Asn Met Val Gln 485 490 495 Ala Phe Gly Leu Arg Gly Pro Gly Asp Leu Gln Gly Asn Phe Gly Asp 500 505 510 Leu Gln Leu Asn Lys Leu Gly Thr Glu Asp Pro Arg Trp Pro Gln Ile 515 520 525 Ala Glu Leu Ala Pro Thr Ala Ser Ala Phe Met Gly Met Ser Gln Phe 530 535 540 Lys Leu Thr His Gln Asn Asn Asp Asp His Gly Asn Pro Val Tyr Phe 545 550 555 560 Leu Arg Tyr Ser Gly Ala Ile Lys Leu Asp Pro Lys Asn Pro Asn Tyr 565 570 575 Asn Lys Trp Leu Glu Leu Leu Glu Gln Asn Ile Asp Ala Tyr Lys Thr 580 585 590 Phe Pro Lys Lys Glu Lys Lys Gln Lys Ala Pro Lys Glu Glu Ser Thr 595 600 605 Asp Gln Met Ser Glu Pro Pro Lys Glu Gln Arg Val Gln Gly Ser Ile 610 615 620 Thr Gln Arg Thr Arg Thr Arg Pro Ser Val Gln Pro Gly Pro Met Ile 625 630 635 640 Asp Val Asn Thr Asp Gly Pro Gly Glu Asn Leu Tyr Phe Gln Gly Pro 645 650 655 Gly Gly Gly Ser His His His His His His 660 665 <210> 160 <211> 3055 <212> DNA <213> Artificial Sequence <220> <223> Nucleotide sequence of a SNAP construct containing the human coronavirus S1 gene. <400> 160 atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60 gtagggccag attctgttaa gtctgcttgt attgaggttg atatacaaca gactttcttt 120 gataaaactt ggcctaggcc aattgatgtt tctaaggctg acggtattat ataccctcaa 180 ggccgtacat attctaacat aactatcact tatcaaggtc tttttcccta tcagggagac 240 catggtgata tgtatgttta ctctgcagga catgctacag gcacaactcc acaaaagttg 300 tttgtagcta actattctca ggacgtcaaa cagtttgcta atgggtttgt cgtccgtata 360 ggagcagctg ccaattccac tggcactgtt attattagcc catctaccag cgctactata 420 cgaaaaattt accctgcttt tatgctgggt tcttcagttg gtaatttctc agatggtaaa 480 atgggccgct tcttcaatca tactctagtt cttttgcccg atggatgtgg cactttactt 540 agagcttttt attgtattct agagcctcgc tctggaaatc attgtcctgc tggcaattcc 600 tatacttctt ttgccactta tcacactcct gcaacagatt gttctgatgg caattacaat 660 cgtaatgcca gtctgaactc ttttaaggag tattttaatt tacgtaactg cacctttatg 720 tacacttata acattaccga agatgagatt ttagagtggt ttggcattac acaaactgct 780 caaggtgttc acctcttctc atctcggtat gttgatttgt acggcggcaa tatgtttcaa 840 tttgccacct tgcctgttta tgatactatt aagtattatt ctatcattcc tcacagtatt 900 cgttctatcc aaagtgatag aaaggcttgg gctgccttct acgtatataa acttcaaccg 960 ttaactttcc tgttggattt ttctgttgat ggttatatac gcagagctat agactgtggt 1020 tttaatgatt tgtcacaact ccactgctca tatgaatcct tcgatgttga atctggagtt 1080 tattcagttt cgtctttcga agcaaaacct tctggctcag ttgtggaaca ggctgaaggt 1140 gttgaatgtg atttttcacc tcttctgtct ggcacacctc ctcaggttta taatttcaag 1200 cgtttggttt ttaccaattg caattataat cttaccaaat tgctttcact tttttctgtg 1260 aatgatttta cttgtagtca aatatctcca gcagcaattg caagcaactg ttattcttca 1320 ctgattttgg attacttttc atacccactt agtatgaaat ccgatctcag tgttagttct 1380 gctggtccaa tatcccagtt taattataaa cagtcctttt ctaatcccac atgtttgatt 1440 ttagcgactg ttcctcataa ccttactact attactaagc ctcttaagta cagctatatt 1500 aacaagtgct ctcgtcttct ttctgatgat cgtactgaag tacctcagtt agtgaacgct 1560 aatcaatact caccctgtgt atccattgtc ccatccactg tgtgggaaga cggtgattat 1620 tataggaaac aactatctcc acttgaaggt ggtggctggc ttgttgctag tggctcaact 1680 gttgccatga ctgagcaatt acagatgggc tttggtatta cagttcaata tggtacagac 1740 accaatagtg tttgccccaa gctggaattt gctaatgaca caaaaattgc ctctcaatta 1800 ggcaattgcg tggaatattc cctctatggt gtttcgggcc gtggtgtttt tcagaattgc 1860 acagctgtag gtgttcgaca gcagcgcttt gtttatgatg cgtaccagaa tttagttggc 1920 tattattctg atgatggcaa ctactactgt ttgcgtgctt gtgttagtgt tcctgtttct 1980 gtcatctatg ataaagaaac taaaacccac gctactctat ttggtagtgt tgcatgtgaa 2040 cacatttctt ctaccatgtc tcaatactcc cgttctacgc gatcaatgct taaacggcga 2100 gattctacat atggccccct tcagacacct gttggttgtg tcctaggact tgttaattcc 2160 tctttgttcg tagaggactg caagttgcct cttggtcaat ctctctgtgc tcttcctgac 2220 acacctagta ctctcacacc tcgcagtgtg cgctctgttc caggtgaaat gcgcttggca 2280 tccattgctt ttaatcatcc tattcaggtt gatcaactta atagtagtta ttttaaatta 2340 agtataccca ctaatttttc ctttggtgtg actcaggagt acattcagac aaccattcag 2400 aaagttactg ttgattgtaa acagtacgcg cggccgcacg gcggaggtag caaagactgc 2460 gaaatgaagc gcaccaccct ggatagccct ctgggcaagc tggaactgtc tgggtgcgaa 2520 cagggcctgc acgagatcaa gctgctgggc aaaggaacat ctgccgccga cgccgtggaa 2580 gtgcctgccc cagccgccgt gctgggcgga ccagagccac tgatgcaggc caccgcctgg 2640 ctcaacgcct actttcacca gcctgaggcc atcgaggagt tccctgtgcc agccctgcac 2700 cacccagtgt tccagcagga gagctttacc cgccaggtgc tgtggaaact gctgaaagtg 2760 gtgaagttcg gagaggtcat cagctaccag cagctggccg ccctggccgg caatcccgcc 2820 gccaccgccg ccgtgaaaac cgccctgagc ggaaatcccg tgcccattct gatcccctgc 2880 caccgggtgg tgtctagctc tggcgccgtg gggggctacg agggcgggct cgccgtgaaa 2940 gagtggctgc tggcccacga gggccacaga ctgggcaagc ctgggctggg tcctgcaggt 3000 ataggcgcgc cagggtccct ggagcatcat catcatcatc attgatgacg ggccc 3055 <210> 161 <211> 1014 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of a SNAP construct containing the human coronavirus S1 gene. <400> 161 Met Lys Leu Cys Ile Leu Leu Ala Val Val Ala Phe Val Gly Leu Ser 1 5 10 15 Leu Gly Arg Ser Val Gly Pro Asp Ser Val Lys Ser Ala Cys Ile Glu 20 25 30 Val Asp Ile Gln Gln Thr Phe Phe Asp Lys Thr Trp Pro Arg Pro Ile 35 40 45 Asp Val Ser Lys Ala Asp Gly Ile Ile Tyr Pro Gln Gly Arg Thr Tyr 50 55 60 Ser Asn Ile Thr Ile Thr Tyr Gln Gly Leu Phe Pro Tyr Gln Gly Asp 65 70 75 80 His Gly Asp Met Tyr Val Tyr Ser Ala Gly His Ala Thr Gly Thr Thr 85 90 95 Pro Gln Lys Leu Phe Val Ala Asn Tyr Ser Gln Asp Val Lys Gln Phe 100 105 110 Ala Asn Gly Phe Val Val Arg Ile Gly Ala Ala Ala Asn Ser Thr Gly 115 120 125 Thr Val Ile Ile Ser Pro Ser Thr Ser Ala Thr Ile Arg Lys Ile Tyr 130 135 140 Pro Ala Phe Met Leu Gly Ser Ser Val Gly Asn Phe Ser Asp Gly Lys 145 150 155 160 Met Gly Arg Phe Phe Asn His Thr Leu Val Leu Leu Pro Asp Gly Cys 165 170 175 Gly Thr Leu Leu Arg Ala Phe Tyr Cys Ile Leu Glu Pro Arg Ser Gly 180 185 190 Asn His Cys Pro Ala Gly Asn Ser Tyr Thr Ser Phe Ala Thr Tyr His 195 200 205 Thr Pro Ala Thr Asp Cys Ser Asp Gly Asn Tyr Asn Arg Asn Ala Ser 210 215 220 Leu Asn Ser Phe Lys Glu Tyr Phe Asn Leu Arg Asn Cys Thr Phe Met 225 230 235 240 Tyr Thr Tyr Asn Ile Thr Glu Asp Glu Ile Leu Glu Trp Phe Gly Ile 245 250 255 Thr Gln Thr Ala Gln Gly Val His Leu Phe Ser Ser Arg Tyr Val Asp 260 265 270 Leu Tyr Gly Gly Asn Met Phe Gln Phe Ala Thr Leu Pro Val Tyr Asp 275 280 285 Thr Ile Lys Tyr Tyr Ser Ile Ile Pro His Ser Ile Arg Ser Ile Gln 290 295 300 Ser Asp Arg Lys Ala Trp Ala Ala Phe Tyr Val Tyr Lys Leu Gln Pro 305 310 315 320 Leu Thr Phe Leu Leu Asp Phe Ser Val Asp Gly Tyr Ile Arg Arg Ala 325 330 335 Ile Asp Cys Gly Phe Asn Asp Leu Ser Gln Leu His Cys Ser Tyr Glu 340 345 350 Ser Phe Asp Val Glu Ser Gly Val Tyr Ser Val Ser Ser Phe Glu Ala 355 360 365 Lys Pro Ser Gly Ser Val Val Glu Gln Ala Glu Gly Val Glu Cys Asp 370 375 380 Phe Ser Pro Leu Leu Ser Gly Thr Pro Pro Gln Val Tyr Asn Phe Lys 385 390 395 400 Arg Leu Val Phe Thr Asn Cys Asn Tyr Asn Leu Thr Lys Leu Leu Ser 405 410 415 Leu Phe Ser Val Asn Asp Phe Thr Cys Ser Gln Ile Ser Pro Ala Ala 420 425 430 Ile Ala Ser Asn Cys Tyr Ser Ser Leu Ile Leu Asp Tyr Phe Ser Tyr 435 440 445 Pro Leu Ser Met Lys Ser Asp Leu Ser Val Ser Ser Ala Gly Pro Ile 450 455 460 Ser Gln Phe Asn Tyr Lys Gln Ser Phe Ser Asn Pro Thr Cys Leu Ile 465 470 475 480 Leu Ala Thr Val Pro His Asn Leu Thr Thr Ile Thr Lys Pro Leu Lys 485 490 495 Tyr Ser Tyr Ile Asn Lys Cys Ser Arg Leu Leu Ser Asp Asp Arg Thr 500 505 510 Glu Val Pro Gln Leu Val Asn Ala Asn Gln Tyr Ser Pro Cys Val Ser 515 520 525 Ile Val Pro Ser Thr Val Trp Glu Asp Gly Asp Tyr Tyr Arg Lys Gln 530 535 540 Leu Ser Pro Leu Glu Gly Gly Gly Trp Leu Val Ala Ser Gly Ser Thr 545 550 555 560 Val Ala Met Thr Glu Gln Leu Gln Met Gly Phe Gly Ile Thr Val Gln 565 570 575 Tyr Gly Thr Asp Thr Asn Ser Val Cys Pro Lys Leu Glu Phe Ala Asn 580 585 590 Asp Thr Lys Ile Ala Ser Gln Leu Gly Asn Cys Val Glu Tyr Ser Leu 595 600 605 Tyr Gly Val Ser Gly Arg Gly Val Phe Gln Asn Cys Thr Ala Val Gly 610 615 620 Val Arg Gln Gln Arg Phe Val Tyr Asp Ala Tyr Gln Asn Leu Val Gly 625 630 635 640 Tyr Tyr Ser Asp Asp Gly Asn Tyr Tyr Cys Leu Arg Ala Cys Val Ser 645 650 655 Val Pro Val Ser Val Ile Tyr Asp Lys Glu Thr Lys Thr His Ala Thr 660 665 670 Leu Phe Gly Ser Val Ala Cys Glu His Ile Ser Ser Thr Met Ser Gln 675 680 685 Tyr Ser Arg Ser Thr Arg Ser Met Leu Lys Arg Arg Asp Ser Thr Tyr 690 695 700 Gly Pro Leu Gln Thr Pro Val Gly Cys Val Leu Gly Leu Val Asn Ser 705 710 715 720 Ser Leu Phe Val Glu Asp Cys Lys Leu Pro Leu Gly Gln Ser Leu Cys 725 730 735 Ala Leu Pro Asp Thr Pro Ser Thr Leu Thr Pro Arg Ser Val Arg Ser 740 745 750 Val Pro Gly Glu Met Arg Leu Ala Ser Ile Ala Phe Asn His Pro Ile 755 760 765 Gln Val Asp Gln Leu Asn Ser Ser Tyr Phe Lys Leu Ser Ile Pro Thr 770 775 780 Asn Phe Ser Phe Gly Val Thr Gln Glu Tyr Ile Gln Thr Thr Ile Gln 785 790 795 800 Lys Val Thr Val Asp Cys Lys Gln Tyr Ala Arg Pro His Gly Gly Gly 805 810 815 Ser Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly 820 825 830 Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu 835 840 845 Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro 850 855 860 Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp 865 870 875 880 Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val 885 890 895 Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln 900 905 910 Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser 915 920 925 Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala 930 935 940 Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys 945 950 955 960 His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly 965 970 975 Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly 980 985 990 Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Glu 995 1000 1005 His His His His His His 1010 <210> 162 <211> 1369 <212> DNA <213> Artificial Sequence <220> <223> Nucleotide sequence of a SNAP construct containing the human coronavirus S1 gene receptor binding domain (RBD) <400> 162 tcgcgagcta gcaccatgaa actatgtatt ctacttgcag ttgttgcgtt cgtaggattg 60 tccttaccta cagctctggc aagatctgac aaagactgcg aaatgaaaag aactacattg 120 gattcaccac ttgggaagtt ggaactgagt ggatgcgagc aaggattgca tgaaattaag 180 ctactgggaa aaggaacttc tgctgctgat gcagttgaag ttccagcacc agcagctgtt 240 cttggaggtc ctgagcccct catgcaagcc acagcctggc ttaacgcata tttccaccag 300 cctgaggcca ttgaggaatt tccagtcccc gcccttcacc atcctgtgtt tcagcaggag 360 agcttcaccc gccaggtcct gtggaaattg ctgaaggtgg tcaagtttgg tgaagtgatt 420 tcatatcagc aacttgctgc attggccggt aaccccgcag ctacagctgc cgtgaaaact 480 gctctcagcg gaaatcctgt gcccatcctg atcccttgtc acagagtcgt ttcatcttcc 540 ggagctgtag gtggctatga aggaggactg gcagttaagg agtggctgct ggctcatgaa 600 ggtcatagac ttggaaagcc tgggctgggt cctgctggta taggcgcgcc agggtcccta 660 ggtggcggat ccgaaaacct gtacttccag agcgatatct tgttgcgtgc tttctactgc 720 atcctcgaac ctcgttctgg taaccactgt cctgccggaa atagctacac tagcttcgcc 780 acttaccaca cacccgccac tgactgtagt gacggcaact acaatcgtaa cgcctccttg 840 aactctttta aggagtactt caacctgcgc aactgtacct tcatgtacac ttacaacatt 900 accgaagacg aaatcctcga gtggttcggc atcacacaga cagctcaggg agtccacctc 960 ttctcaagca ggtacgtgga cctctatggt ggtaacatgt ttcaattcgc cacactgcca 1020 gtctacgata ccatcaagta ttactccatc atcccacact caatccgctc tatccaaagc 1080 gaccgcaagg cctgggctgc tttttacgtg tacaagctgc agcctctgac cttcctgctg 1140 gatttctccg tggacggcta cattagacgt gctatcgatt gcggtttcaa cgacctgtca 1200 caactccatt gctcatacga atctttcgac gttgagagcg gagtgtactc cgtttccagc 1260 ttcgaggcta aacccagtgg ctccccggga gagaatctat attttcaagg gcccggcgga 1320 ggtagtcacc atcatcacca tcactaatga ccggtgcggc cgcaagctt 1369 <210> 163 <211> 448 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of a SNAP construct containing the human coronavirus S1 gene receptor binding domain (RBD) <400> 163 Ser Arg Ala Ser Thr Met Lys Leu Cys Ile Leu Leu Ala Val Val Ala 1 5 10 15 Phe Val Gly Leu Ser Leu Pro Thr Ala Leu Ala Arg Ser Asp Lys Asp 20 25 30 Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly Lys Leu Glu 35 40 45 Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu Leu Gly Lys 50 55 60 Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro Ala Ala Val 65 70 75 80 Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp Leu Asn Ala 85 90 95 Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val Pro Ala Leu 100 105 110 His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln Val Leu Trp 115 120 125 Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser Tyr Gln Gln 130 135 140 Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala Val Lys Thr 145 150 155 160 Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys His Arg Val 165 170 175 Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly Leu Ala Val 180 185 190 Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly Lys Pro Gly 195 200 205 Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Gly Gly Gly Ser 210 215 220 Glu Asn Leu Tyr Phe Gln Ser Asp Ile Leu Leu Arg Ala Phe Tyr Cys 225 230 235 240 Ile Leu Glu Pro Arg Ser Gly Asn His Cys Pro Ala Gly Asn Ser Tyr 245 250 255 Thr Ser Phe Ala Thr Tyr His Thr Pro Ala Thr Asp Cys Ser Asp Gly 260 265 270 Asn Tyr Asn Arg Asn Ala Ser Leu Asn Ser Phe Lys Glu Tyr Phe Asn 275 280 285 Leu Arg Asn Cys Thr Phe Met Tyr Thr Tyr Asn Ile Thr Glu Asp Glu 290 295 300 Ile Leu Glu Trp Phe Gly Ile Thr Gln Thr Ala Gln Gly Val His Leu 305 310 315 320 Phe Ser Ser Arg Tyr Val Asp Leu Tyr Gly Gly Asn Met Phe Gln Phe 325 330 335 Ala Thr Leu Pro Val Tyr Asp Thr Ile Lys Tyr Tyr Ser Ile Ile Pro 340 345 350 His Ser Ile Arg Ser Ile Gln Ser Asp Arg Lys Ala Trp Ala Ala Phe 355 360 365 Tyr Val Tyr Lys Leu Gln Pro Leu Thr Phe Leu Leu Asp Phe Ser Val 370 375 380 Asp Gly Tyr Ile Arg Arg Ala Ile Asp Cys Gly Phe Asn Asp Leu Ser 385 390 395 400 Gln Leu His Cys Ser Tyr Glu Ser Phe Asp Val Glu Ser Gly Val Tyr 405 410 415 Ser Val Ser Ser Phe Glu Ala Lys Pro Ser Gly Ser Pro Gly Glu Asn 420 425 430 Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser His His His His His His 435 440 445 <210> 164 <211> 2095 <212> DNA <213> Artificial Sequence <220> <223> Nucleotide sequence of a SNAP construct containing the LruA gene of Leptospirosis <400> 164 tcgcgagcta gcaccatgaa actatgtatt ctacttgcag ttgttgcgtt cgtaggattg 60 tccttaccta cagctctggc aagatctgac aaagactgcg aaatgaaaag aactacattg 120 gattcaccac ttgggaagtt ggaactgagt ggatgcgagc aaggattgca tgaaattaag 180 ctactgggaa aaggaacttc tgctgctgat gcagttgaag ttccagcacc agcagctgtt 240 cttggaggtc ctgagcccct catgcaagcc acagcctggc ttaacgcata tttccaccag 300 cctgaggcca ttgaggaatt tccagtcccc gcccttcacc atcctgtgtt tcagcaggag 360 agcttcaccc gccaggtcct gtggaaattg ctgaaggtgg tcaagtttgg tgaagtgatt 420 tcatatcagc aacttgctgc attggccggt aaccccgcag ctacagctgc cgtgaaaact 480 gctctcagcg gaaatcctgt gcccatcctg atcccttgtc acagagtcgt ttcatcttcc 540 ggagctgtag gtggctatga aggaggactg gcagttaagg agtggctgct ggctcatgaa 600 ggtcatagac ttggaaagcc tgggctgggt cctgctggta taggcgcgcc agggtcccta 660 ggtggcggat ccgaaaacct gtacttccag agcgatatcg gagctgagct tcctattgag 720 gagttaagtg atgcaaagaa ctcgatcaca agagctaagt ctgcaggtgc tgaaaagtat 780 gctccttcag agttagagga ggcccgtaag aacttactca cagctcatca gaaggcttcg 840 gaggagaatc ttacagagac taagaagtcc gcgttgtatg caagagcaaa ggctttagac 900 gcttccgaga agtccttccc ttcttctgtt gatgatgcac gtaaggagtc cagctcttca 960 atcgagtctg cagaggaggc ctatgcttct cagcttgctt ctgagcctta taatacttct 1020 gtacagcttc gcaaggaggg tgattctcta cgcgagactg ctgaccgcac tttagagtcg 1080 tatccgaagg agtccggaga tgacgcaaag ctgaggatga gattagcagc attcgatcag 1140 tatgaggctt ctcgtcagaa gtatgcggat tctaagaagg ccgcagacga gtccaaggta 1200 ttagctcttt ctcagaagca gcagctaatc gattcttttg cagacataga taagaatcta 1260 aatgatgcag ataagtatgc agagggaaag gacccggagg tttccgagac tagaaatcgt 1320 ctcgattcct ctaagtccaa gatagaggag gggaagatca aggagggata ttccgagata 1380 gatgatattc gtaagaagtc cggcgagctt gttgctaaga atattaagat ttacgcagag 1440 aagcagaagg aacttgcaaa gcaaagcgta gcatctgcga ctacaaggtt agcttccttc 1500 gatcgaaata agatcaattc ctctagagat tttcaggttt cttaccagag agcagaggag 1560 aaccttaagg cagctgagga gtcgagagta gctgcagagg atctatattc ttcggagaag 1620 tacgaggatt ctatttcgcg ttctgaggag gcaattcgcc tttccagaat cgtagtagac 1680 caggccactg agttggccga gagaatagag agaaaggcaa cgactgataa gatcgctggt 1740 cgtgatacaa agaccgaagg gaataagaat actaagaacc agtccacaac cgaaggcaag 1800 aactcttcat ctaagattgg agaggatggt ttaccggagg gttggaagcg ttatgtggtt 1860 cggaagaagg ttcctgcaga ttgtctttgg agaatcgcaa aggataagag acattatgga 1920 acttctaagc tctggagaag aatctacgag gcaaaccgaa acaagatcaa gaacccaaac 1980 ttgatttatc cgaagcaggt attattaatc ccgggagaga atctatattt tcaagggccc 2040 ggcggaggta gtcaccatca tcaccatcac taatgaccgg tgcggccgca agctt 2095 <210> 165 <211> 690 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of a SNAP construct containing the LruA gene of Leptospirosis <400> 165 Ser Arg Ala Ser Thr Met Lys Leu Cys Ile Leu Leu Ala Val Val Ala 1 5 10 15 Phe Val Gly Leu Ser Leu Pro Thr Ala Leu Ala Arg Ser Asp Lys Asp 20 25 30 Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly Lys Leu Glu 35 40 45 Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu Leu Gly Lys 50 55 60 Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro Ala Ala Val 65 70 75 80 Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp Leu Asn Ala 85 90 95 Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val Pro Ala Leu 100 105 110 His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln Val Leu Trp 115 120 125 Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser Tyr Gln Gln 130 135 140 Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala Val Lys Thr 145 150 155 160 Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys His Arg Val 165 170 175 Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly Leu Ala Val 180 185 190 Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly Lys Pro Gly 195 200 205 Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Gly Gly Gly Ser 210 215 220 Glu Asn Leu Tyr Phe Gln Ser Asp Ile Gly Ala Glu Leu Pro Ile Glu 225 230 235 240 Glu Leu Ser Asp Ala Lys Asn Ser Ile Thr Arg Ala Lys Ser Ala Gly 245 250 255 Ala Glu Lys Tyr Ala Pro Ser Glu Leu Glu Glu Ala Arg Lys Asn Leu 260 265 270 Leu Thr Ala His Gln Lys Ala Ser Glu Glu Asn Leu Thr Glu Thr Lys 275 280 285 Lys Ser Ala Leu Tyr Ala Arg Ala Lys Ala Leu Asp Ala Ser Glu Lys 290 295 300 Ser Phe Pro Ser Ser Val Asp Asp Ala Arg Lys Glu Ser Ser Ser Ser 305 310 315 320 Ile Glu Ser Ala Glu Glu Ala Tyr Ala Ser Gln Leu Ala Ser Glu Pro 325 330 335 Tyr Asn Thr Ser Val Gln Leu Arg Lys Glu Gly Asp Ser Leu Arg Glu 340 345 350 Thr Ala Asp Arg Thr Leu Glu Ser Tyr Pro Lys Glu Ser Gly Asp Asp 355 360 365 Ala Lys Leu Arg Met Arg Leu Ala Ala Phe Asp Gln Tyr Glu Ala Ser 370 375 380 Arg Gln Lys Tyr Ala Asp Ser Lys Lys Ala Ala Asp Glu Ser Lys Val 385 390 395 400 Leu Ala Leu Ser Gln Lys Gln Gln Leu Ile Asp Ser Phe Ala Asp Ile 405 410 415 Asp Lys Asn Leu Asn Asp Ala Asp Lys Tyr Ala Glu Gly Lys Asp Pro 420 425 430 Glu Val Ser Glu Thr Arg Asn Arg Leu Asp Ser Ser Lys Ser Lys Ile 435 440 445 Glu Glu Gly Lys Ile Lys Glu Gly Tyr Ser Glu Ile Asp Asp Ile Arg 450 455 460 Lys Lys Ser Gly Glu Leu Val Ala Lys Asn Ile Lys Ile Tyr Ala Glu 465 470 475 480 Lys Gln Lys Glu Leu Ala Lys Gln Ser Val Ala Ser Ala Thr Thr Arg 485 490 495 Leu Ala Ser Phe Asp Arg Asn Lys Ile Asn Ser Ser Arg Asp Phe Gln 500 505 510 Val Ser Tyr Gln Arg Ala Glu Glu Asn Leu Lys Ala Ala Glu Glu Ser 515 520 525 Arg Val Ala Ala Glu Asp Leu Tyr Ser Ser Glu Lys Tyr Glu Asp Ser 530 535 540 Ile Ser Arg Ser Glu Glu Ala Ile Arg Leu Ser Arg Ile Val Val Asp 545 550 555 560 Gln Ala Thr Glu Leu Ala Glu Arg Ile Glu Arg Lys Ala Thr Thr Asp 565 570 575 Lys Ile Ala Gly Arg Asp Thr Lys Thr Glu Gly Asn Lys Asn Thr Lys 580 585 590 Asn Gln Ser Thr Thr Glu Gly Lys Asn Ser Ser Ser Lys Ile Gly Glu 595 600 605 Asp Gly Leu Pro Glu Gly Trp Lys Arg Tyr Val Val Arg Lys Lys Val 610 615 620 Pro Ala Asp Cys Leu Trp Arg Ile Ala Lys Asp Lys Arg His Tyr Gly 625 630 635 640 Thr Ser Lys Leu Trp Arg Arg Ile Tyr Glu Ala Asn Arg Asn Lys Ile 645 650 655 Lys Asn Pro Asn Leu Ile Tyr Pro Lys Gln Val Leu Leu Ile Pro Gly 660 665 670 Glu Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser His His His His 675 680 685 His His 690 <210> 166 <211> 1711 <212> DNA <213> Artificial Sequence <220> <223> Nucleotide sequence of a SNAP construct containing the LruB gene of Leptospirosis. <400> 166 tcgcgagcta gcaccatgaa actatgtatt ctacttgcag ttgttgcgtt cgtaggattg 60 tccttaccta cagctctggc aagatctgac aaagactgcg aaatgaaaag aactacattg 120 gattcaccac ttgggaagtt ggaactgagt ggatgcgagc aaggattgca tgaaattaag 180 ctactgggaa aaggaacttc tgctgctgat gcagttgaag ttccagcacc agcagctgtt 240 cttggaggtc ctgagcccct catgcaagcc acagcctggc ttaacgcata tttccaccag 300 cctgaggcca ttgaggaatt tccagtcccc gcccttcacc atcctgtgtt tcagcaggag 360 agcttcaccc gccaggtcct gtggaaattg ctgaaggtgg tcaagtttgg tgaagtgatt 420 tcatatcagc aacttgctgc attggccggt aaccccgcag ctacagctgc cgtgaaaact 480 gctctcagcg gaaatcctgt gcccatcctg atcccttgtc acagagtcgt ttcatcttcc 540 ggagctgtag gtggctatga aggaggactg gcagttaagg agtggctgct ggctcatgaa 600 ggtcatagac ttggaaagcc tgggctgggt cctgctggta taggcgcgcc agggtcccta 660 ggtggcggat ccgaaaacct gtacttccag agcgatatcc aacccactgc gacaagagct 720 caagtcgtag atcgttatct tcaactcggc tacgaatcct acgatcagag ctataaagac 780 gcagtcgctt ttcagaccgc agtcacagcc tttgctgcca ataacaaccc gaccgcagcg 840 gatcatatca atcttaagaa tttatacgta gtagcaagag cttcttattt aactacggaa 900 gcatttcgtt tttcatctgg accgatagac aacgtagaca ttttaggttg tggaagtaat 960 gcggatggtt ccggagacga agaatgcgaa ggactgatta acggatggcc gttagacgaa 1020 agcgcgattg ataattatat agcaaatgca ggaaatgcaa caacttatgc agccatccta 1080 gctacaaatg gagatgcaaa cgcaaataac gcagatgatc aagacgatga gacagcgctt 1140 acggtcggtt ggcacgccat cgaatatata ctctggggtc aggatctatt taacggagga 1200 atcaatcaaa tttcaggaca acgtaatata gctgatctta caggagcttc tccaggaaca 1260 gttggaggca gaagaagagc ttatatgaaa gcagttacgg acggactggt tcttcagcta 1320 aaattgattc gagatcaatt tgaagacggt gccagatatt cggatggact taaatccaat 1380 cctgacgcag cggtcactta tatctttcaa ggacttggta aattcatcgc tggagaatgg 1440 ggaggagaaa gacttaccgg aacttttggt ggacagcagg aggaggagca ttcttgtttt 1500 agcgatacta caaaggctga cttctattac aacgcacaga gtgtgttgaa catttggaac 1560 ggatcttacg aattgaagaa gggaaccgta acttccacgg gtccgggttt aaagaatctt 1620 tttggcccgg gagagaatct atattttcaa gggcccggcg gaggtagtca ccatcatcac 1680 catcactaat gaccggtgcg gccgcaagct t 1711 <210> 167 <211> 562 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of a SNAP construct containing the LruB gene of Leptospirosis. <400> 167 Ser Arg Ala Ser Thr Met Lys Leu Cys Ile Leu Leu Ala Val Val Ala 1 5 10 15 Phe Val Gly Leu Ser Leu Pro Thr Ala Leu Ala Arg Ser Asp Lys Asp 20 25 30 Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly Lys Leu Glu 35 40 45 Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu Leu Gly Lys 50 55 60 Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro Ala Ala Val 65 70 75 80 Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp Leu Asn Ala 85 90 95 Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val Pro Ala Leu 100 105 110 His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln Val Leu Trp 115 120 125 Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser Tyr Gln Gln 130 135 140 Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala Val Lys Thr 145 150 155 160 Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys His Arg Val 165 170 175 Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly Leu Ala Val 180 185 190 Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly Lys Pro Gly 195 200 205 Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Gly Gly Gly Ser 210 215 220 Glu Asn Leu Tyr Phe Gln Ser Asp Ile Gln Pro Thr Ala Thr Arg Ala 225 230 235 240 Gln Val Val Asp Arg Tyr Leu Gln Leu Gly Tyr Glu Ser Tyr Asp Gln 245 250 255 Ser Tyr Lys Asp Ala Val Ala Phe Gln Thr Ala Val Thr Ala Phe Ala 260 265 270 Ala Asn Asn Asn Pro Thr Ala Ala Asp His Ile Asn Leu Lys Asn Leu 275 280 285 Tyr Val Val Ala Arg Ala Ser Tyr Leu Thr Thr Glu Ala Phe Arg Phe 290 295 300 Ser Ser Gly Pro Ile Asp Asn Val Asp Ile Leu Gly Cys Gly Ser Asn 305 310 315 320 Ala Asp Gly Ser Gly Asp Glu Glu Cys Glu Gly Leu Ile Asn Gly Trp 325 330 335 Pro Leu Asp Glu Ser Ala Ile Asp Asn Tyr Ile Ala Asn Ala Gly Asn 340 345 350 Ala Thr Thr Tyr Ala Ala Ile Leu Ala Thr Asn Gly Asp Ala Asn Ala 355 360 365 Asn Asn Ala Asp Asp Gln Asp Asp Glu Thr Ala Leu Thr Val Gly Trp 370 375 380 His Ala Ile Glu Tyr Ile Leu Trp Gly Gln Asp Leu Phe Asn Gly Gly 385 390 395 400 Ile Asn Gln Ile Ser Gly Gln Arg Asn Ile Ala Asp Leu Thr Gly Ala 405 410 415 Ser Pro Gly Thr Val Gly Gly Arg Arg Arg Ala Tyr Met Lys Ala Val 420 425 430 Thr Asp Gly Leu Val Leu Gln Leu Lys Leu Ile Arg Asp Gln Phe Glu 435 440 445 Asp Gly Ala Arg Tyr Ser Asp Gly Leu Lys Ser Asn Pro Asp Ala Ala 450 455 460 Val Thr Tyr Ile Phe Gln Gly Leu Gly Lys Phe Ile Ala Gly Glu Trp 465 470 475 480 Gly Gly Glu Arg Leu Thr Gly Thr Phe Gly Gly Gln Gln Glu Glu Glu 485 490 495 His Ser Cys Phe Ser Asp Thr Thr Lys Ala Asp Phe Tyr Tyr Asn Ala 500 505 510 Gln Ser Val Leu Asn Ile Trp Asn Gly Ser Tyr Glu Leu Lys Lys Gly 515 520 525 Thr Val Thr Ser Thr Gly Pro Gly Leu Lys Asn Leu Phe Gly Pro Gly 530 535 540 Glu Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser His His His His 545 550 555 560 His His <210> 168 <211> 1513 <212> DNA <213> Artificial Sequence <220> <223> Nucleotide sequence of a SNAP construct containing the LipL32 gene of Leptospirosis. <400> 168 tcgcgagcta gcaccatgaa actatgtatt ctacttgcag ttgttgcgtt cgtaggattg 60 tccttaccta cagctctggc aagatctgac aaagactgcg aaatgaaaag aactacattg 120 gattcaccac ttgggaagtt ggaactgagt ggatgcgagc aaggattgca tgaaattaag 180 ctactgggaa aaggaacttc tgctgctgat gcagttgaag ttccagcacc agcagctgtt 240 cttggaggtc ctgagcccct catgcaagcc acagcctggc ttaacgcata tttccaccag 300 cctgaggcca ttgaggaatt tccagtcccc gcccttcacc atcctgtgtt tcagcaggag 360 agcttcaccc gccaggtcct gtggaaattg ctgaaggtgg tcaagtttgg tgaagtgatt 420 tcatatcagc aacttgctgc attggccggt aaccccgcag ctacagctgc cgtgaaaact 480 gctctcagcg gaaatcctgt gcccatcctg atcccttgtc acagagtcgt ttcatcttcc 540 ggagctgtag gtggctatga aggaggactg gcagttaagg agtggctgct ggctcatgaa 600 ggtcatagac ttggaaagcc tgggctgggt cctgctggta taggcgcgcc agggtcccta 660 ggtggcggat ccgaaaacct gtacttccag agcgatatca ttaccgcttg tggtgctttc 720 ggtggtctgc caagcctaaa aagctctttt gttctgagcg aggacacaat cccagggaca 780 aacgaaaccg taaaaacgtt acttccctac ggatctgtga tcaactatta cggatacgta 840 aagccaggac aagcgccgga cggtttagtc gatggaaaca aaaaagcata ctatctctat 900 gtttggattc ctgccgtaat cgctgaaatg ggagttcgta tgatttcccc aacaggcgaa 960 atcggtgagc caggcgacgg agacttagta agcgacgctt tcaaagcggc taccccagaa 1020 gaaaaatcaa tgccacattg gtttgatact tggattcgtg tagaaagaat gtcggcgatt 1080 atgcctgacc aaatcgccaa agctgcgaaa gcaaaaccag ttcaaaaatt ggacgatgat 1140 gatgatggtg acgatactta taaagaagag agacacaaca agtacaactc tcttactaga 1200 atcaagatcc ctaatcctcc aaaatctttt gacgatctga aaaacatcga cactaaaaaa 1260 cttttagtaa gaggtcttta cagaatttct ttcactacct acaaaccagg tgaagtgaaa 1320 ggatctttcg ttgcatctgt tggtctgctt ttcccaccag gtattccagg tgtgagcccg 1380 ctgatccact caaatcctga agaattgcaa aaacaagcta tcgctgcccc gggagagaat 1440 ctatattttc aagggcccgg cggaggtagt caccatcatc accatcacta atgaccggtg 1500 cggccgcaag ctt 1513 <210> 169 <211> 496 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of a SNAP construct containing the LipL32 gene of Leptospirosis. <400> 169 Ser Arg Ala Ser Thr Met Lys Leu Cys Ile Leu Leu Ala Val Val Ala 1 5 10 15 Phe Val Gly Leu Ser Leu Pro Thr Ala Leu Ala Arg Ser Asp Lys Asp 20 25 30 Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly Lys Leu Glu 35 40 45 Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu Leu Gly Lys 50 55 60 Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro Ala Ala Val 65 70 75 80 Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp Leu Asn Ala 85 90 95 Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val Pro Ala Leu 100 105 110 His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln Val Leu Trp 115 120 125 Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser Tyr Gln Gln 130 135 140 Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala Val Lys Thr 145 150 155 160 Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys His Arg Val 165 170 175 Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly Leu Ala Val 180 185 190 Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly Lys Pro Gly 195 200 205 Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Gly Gly Gly Ser 210 215 220 Glu Asn Leu Tyr Phe Gln Ser Asp Ile Ile Thr Ala Cys Gly Ala Phe 225 230 235 240 Gly Gly Leu Pro Ser Leu Lys Ser Ser Phe Val Leu Ser Glu Asp Thr 245 250 255 Ile Pro Gly Thr Asn Glu Thr Val Lys Thr Leu Leu Pro Tyr Gly Ser 260 265 270 Val Ile Asn Tyr Tyr Gly Tyr Val Lys Pro Gly Gln Ala Pro Asp Gly 275 280 285 Leu Val Asp Gly Asn Lys Lys Ala Tyr Tyr Leu Tyr Val Trp Ile Pro 290 295 300 Ala Val Ile Ala Glu Met Gly Val Arg Met Ile Ser Pro Thr Gly Glu 305 310 315 320 Ile Gly Glu Pro Gly Asp Gly Asp Leu Val Ser Asp Ala Phe Lys Ala 325 330 335 Ala Thr Pro Glu Glu Lys Ser Met Pro His Trp Phe Asp Thr Trp Ile 340 345 350 Arg Val Glu Arg Met Ser Ala Ile Met Pro Asp Gln Ile Ala Lys Ala 355 360 365 Ala Lys Ala Lys Pro Val Gln Lys Leu Asp Asp Asp Asp Asp Gly Asp 370 375 380 Asp Thr Tyr Lys Glu Glu Arg His Asn Lys Tyr Asn Ser Leu Thr Arg 385 390 395 400 Ile Lys Ile Pro Asn Pro Pro Lys Ser Phe Asp Asp Leu Lys Asn Ile 405 410 415 Asp Thr Lys Lys Leu Leu Val Arg Gly Leu Tyr Arg Ile Ser Phe Thr 420 425 430 Thr Tyr Lys Pro Gly Glu Val Lys Gly Ser Phe Val Ala Ser Val Gly 435 440 445 Leu Leu Phe Pro Pro Gly Ile Pro Gly Val Ser Pro Leu Ile His Ser 450 455 460 Asn Pro Glu Glu Leu Gln Lys Gln Ala Ile Ala Ala Pro Gly Glu Asn 465 470 475 480 Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser His His His His His His 485 490 495 <210> 170 <211> 2803 <212> DNA <213> Artificial Sequence <220> <223> Nucleotide sequence of a SNAP construct containing the C gene of Hepatitis E <400> 170 tcgcgagcta gcaccatgaa actatgtatt ctacttgcag ttgttgcgtt cgtaggattg 60 tccttaccta cagctctggc aagatctgac aaagactgcg aaatgaaaag aactacattg 120 gattcaccac ttgggaagtt ggaactgagt ggatgcgagc aaggattgca tgaaattaag 180 ctactgggaa aaggaacttc tgctgctgat gcagttgaag ttccagcacc agcagctgtt 240 cttggaggtc ctgagcccct catgcaagcc acagcctggc ttaacgcata tttccaccag 300 cctgaggcca ttgaggaatt tccagtcccc gcccttcacc atcctgtgtt tcagcaggag 360 agcttcaccc gccaggtcct gtggaaattg ctgaaggtgg tcaagtttgg tgaagtgatt 420 tcatatcagc aacttgctgc attggccggt aaccccgcag ctacagctgc cgtgaaaact 480 gctctcagcg gaaatcctgt gcccatcctg atcccttgtc acagagtcgt ttcatcttcc 540 ggagctgtag gtggctatga aggaggactg gcagttaagg agtggctgct ggctcatgaa 600 ggtcatagac ttggaaagcc tgggctgggt cctgctggta taggcgcgcc agggtcccta 660 ggtggcggat ccgaaaacct gtacttccag agcgatatca ataacatgtt cttttgctct 720 gtgcatggag atgccaccat gcgctctcgg gctttcctgt tcttgttcct cgtgtttctg 780 cctatgctgc cagcgccacc agccggtcag ccttctggcc gacgtcgagg tcgacgtagc 840 ggaggtgcag gtggtggttt ctggggtgac cgtattgatt ctcagccatt cgctctccct 900 tatattcatc caaccaaccc attcgcacct gacattccag ccgcagctgg tgctggagct 960 cgacctcggc agccagcccg cccactcggc tccgcttggc gtgaccaatc ccagcgccca 1020 gccacttccg cacgtcgtcg atctgcacca gctggagctt cgccactgac tgctgtggca 1080 cctgctccag atactgttcc tgttcctgat gtcgattctc gaggtgctat attacgacgt 1140 cagtataatt tatcaacatc accgctaaca tctactattg ccactggtac taaccttgtt 1200 ctatatgctg ctccgctgag ccctttgcta ccactccaag atggaactaa cactcacatt 1260 atggccactg aagcatcaaa ttatgcccag taccgtgttg tccgcgctac catccggtac 1320 cgtccgcttg tgccgaacgc tgtcggcgga tacgctatat ctatctcttt ctggcctcag 1380 acaactacta ccccgacatc tgtggacatg aactctatca cctccacgga tgtccgaatc 1440 cttgtccagc ctggtattgc ttcagaactt gtgatcccca gtgagcgcct gcattatcgt 1500 aaccaaggct ggcgctctgt tgagacctct ggtgttgcgg aggaggaggc gacctccggc 1560 cttgtcatgc tttgcatcca cggatcacct gtaaattctt acaccaatac gccttatact 1620 ggtgcccttg gcttgcttga tttcgcactc gagctcgagt tccgcaattt gacacctggt 1680 aacacgaaca cacgtgtttc ccgctactcg agtagtgcac gacacaagct acgccgagga 1740 cctgatggca ctgctgagtt aactacgact gctgctacac gctttatgaa ggaccttcat 1800 tttacaggga ctaatggagt tggtgaagtc ggtcgtggta tagcgctaac tctgttcaac 1860 cttgctgata cgcttctcgg tggactcccg acagaattga tttcgtcggc tggtggtcag 1920 ctattctatt ctcgccccgt cgtctcagcc aatggcgagc caacggtgaa gctctacact 1980 tcagtcgaga acgctcagca ggataagggt atagctatcc cacatgatat tgatcttggt 2040 gagtcccgtg ttgtcattca ggattatgat aaccaacatg agcaggatcg tccaactcct 2100 tctcctgctc catctcgacc tttatctgtc cttcgtgcta atgatgtgct atggctttca 2160 cttacagcag ctgagtatga tcagactacc tatggctcct ctactaatcc aatgtatgtc 2220 tctgataccg tgacatttgt caatgttgct actggtgccc agggtgtatc tcgctctctg 2280 gactggtcta aagtcaccct tgatggacga ccacttatga ctatccagca gtattctaag 2340 actttctttg ttctgccact acgtggcaag ctctccttct gggaggccgg taccactaag 2400 gccggctacc cttataatta taatactact gccagtgacc agattttaat tgagaatgca 2460 gctggtcacc gtgtatgcat ctcaacctac actactaatc ttggatctgg ccctgtttct 2520 atttctgctg tcggtgtcct cgcacctcac tctgcgttgg ccgctttaga ggacactgtt 2580 gactatcctg ctcgtgctca cacttttgat gatttctgcc ctgagtgccg tacactcggc 2640 cttcagggtt gtgctttcca atcaactgtt gctgagctac agcgtcttaa aatgaaggtg 2700 ggtaaaactc gggagtaccc gggagagaat ctatattttc aagggcccgg cggaggtagt 2760 caccatcatc accatcacta atgaccggtg cggccgcaag ctt 2803 <210> 171 <211> 926 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of a SNAP construct containing the C gene of Hepatitis E <400> 171 Ser Arg Ala Ser Thr Met Lys Leu Cys Ile Leu Leu Ala Val Val Ala 1 5 10 15 Phe Val Gly Leu Ser Leu Pro Thr Ala Leu Ala Arg Ser Asp Lys Asp 20 25 30 Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly Lys Leu Glu 35 40 45 Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu Leu Gly Lys 50 55 60 Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro Ala Ala Val 65 70 75 80 Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp Leu Asn Ala 85 90 95 Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val Pro Ala Leu 100 105 110 His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln Val Leu Trp 115 120 125 Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser Tyr Gln Gln 130 135 140 Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala Val Lys Thr 145 150 155 160 Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys His Arg Val 165 170 175 Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly Leu Ala Val 180 185 190 Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly Lys Pro Gly 195 200 205 Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Gly Gly Gly Ser 210 215 220 Glu Asn Leu Tyr Phe Gln Ser Asp Ile Asn Asn Met Phe Phe Cys Ser 225 230 235 240 Val His Gly Asp Ala Thr Met Arg Ser Arg Ala Phe Leu Phe Leu Phe 245 250 255 Leu Val Phe Leu Pro Met Leu Pro Ala Pro Pro Ala Gly Gln Pro Ser 260 265 270 Gly Arg Arg Arg Gly Arg Arg Ser Gly Gly Ala Gly Gly Gly Phe Trp 275 280 285 Gly Asp Arg Ile Asp Ser Gln Pro Phe Ala Leu Pro Tyr Ile His Pro 290 295 300 Thr Asn Pro Phe Ala Pro Asp Ile Pro Ala Ala Ala Gly Ala Gly Ala 305 310 315 320 Arg Pro Arg Gln Pro Ala Arg Pro Leu Gly Ser Ala Trp Arg Asp Gln 325 330 335 Ser Gln Arg Pro Ala Thr Ser Ala Arg Arg Arg Ser Ala Pro Ala Gly 340 345 350 Ala Ser Pro Leu Thr Ala Val Ala Pro Ala Pro Asp Thr Val Pro Val 355 360 365 Pro Asp Val Asp Ser Arg Gly Ala Ile Leu Arg Arg Gln Tyr Asn Leu 370 375 380 Ser Thr Ser Pro Leu Thr Ser Thr Ile Ala Thr Gly Thr Asn Leu Val 385 390 395 400 Leu Tyr Ala Ala Pro Leu Ser Pro Leu Leu Pro Leu Gln Asp Gly Thr 405 410 415 Asn Thr His Ile Met Ala Thr Glu Ala Ser Asn Tyr Ala Gln Tyr Arg 420 425 430 Val Val Arg Ala Thr Ile Arg Tyr Arg Pro Leu Val Pro Asn Ala Val 435 440 445 Gly Gly Tyr Ala Ile Ser Ile Ser Phe Trp Pro Gln Thr Thr Thr Thr 450 455 460 Pro Thr Ser Val Asp Met Asn Ser Ile Thr Ser Thr Asp Val Arg Ile 465 470 475 480 Leu Val Gln Pro Gly Ile Ala Ser Glu Leu Val Ile Pro Ser Glu Arg 485 490 495 Leu His Tyr Arg Asn Gln Gly Trp Arg Ser Val Glu Thr Ser Gly Val 500 505 510 Ala Glu Glu Glu Ala Thr Ser Gly Leu Val Met Leu Cys Ile His Gly 515 520 525 Ser Pro Val Asn Ser Tyr Thr Asn Thr Pro Tyr Thr Gly Ala Leu Gly 530 535 540 Leu Leu Asp Phe Ala Leu Glu Leu Glu Phe Arg Asn Leu Thr Pro Gly 545 550 555 560 Asn Thr Asn Thr Arg Val Ser Arg Tyr Ser Ser Ser Ala Arg His Lys 565 570 575 Leu Arg Arg Gly Pro Asp Gly Thr Ala Glu Leu Thr Thr Thr Ala Ala 580 585 590 Thr Arg Phe Met Lys Asp Leu His Phe Thr Gly Thr Asn Gly Val Gly 595 600 605 Glu Val Gly Arg Gly Ile Ala Leu Thr Leu Phe Asn Leu Ala Asp Thr 610 615 620 Leu Leu Gly Gly Leu Pro Thr Glu Leu Ile Ser Ser Ala Gly Gly Gln 625 630 635 640 Leu Phe Tyr Ser Arg Pro Val Val Ser Ala Asn Gly Glu Pro Thr Val 645 650 655 Lys Leu Tyr Thr Ser Val Glu Asn Ala Gln Gln Asp Lys Gly Ile Ala 660 665 670 Ile Pro His Asp Ile Asp Leu Gly Glu Ser Arg Val Val Ile Gln Asp 675 680 685 Tyr Asp Asn Gln His Glu Gln Asp Arg Pro Thr Pro Ser Pro Ala Pro 690 695 700 Ser Arg Pro Leu Ser Val Leu Arg Ala Asn Asp Val Leu Trp Leu Ser 705 710 715 720 Leu Thr Ala Ala Glu Tyr Asp Gln Thr Thr Tyr Gly Ser Ser Thr Asn 725 730 735 Pro Met Tyr Val Ser Asp Thr Val Thr Phe Val Asn Val Ala Thr Gly 740 745 750 Ala Gln Gly Val Ser Arg Ser Leu Asp Trp Ser Lys Val Thr Leu Asp 755 760 765 Gly Arg Pro Leu Met Thr Ile Gln Gln Tyr Ser Lys Thr Phe Phe Val 770 775 780 Leu Pro Leu Arg Gly Lys Leu Ser Phe Trp Glu Ala Gly Thr Thr Lys 785 790 795 800 Ala Gly Tyr Pro Tyr Asn Tyr Asn Thr Thr Ala Ser Asp Gln Ile Leu 805 810 815 Ile Glu Asn Ala Ala Gly His Arg Val Cys Ile Ser Thr Tyr Thr Thr 820 825 830 Asn Leu Gly Ser Gly Pro Val Ser Ile Ser Ala Val Gly Val Leu Ala 835 840 845 Pro His Ser Ala Leu Ala Ala Leu Glu Asp Thr Val Asp Tyr Pro Ala 850 855 860 Arg Ala His Thr Phe Asp Asp Phe Cys Pro Glu Cys Arg Thr Leu Gly 865 870 875 880 Leu Gln Gly Cys Ala Phe Gln Ser Thr Val Ala Glu Leu Gln Arg Leu 885 890 895 Lys Met Lys Val Gly Lys Thr Arg Glu Tyr Pro Gly Glu Asn Leu Tyr 900 905 910 Phe Gln Gly Pro Gly Gly Gly Ser His His His His His His 915 920 925 <210> 172 <211> 2395 <212> DNA <213> Artificial Sequence <220> <223> Nucleotide sequence of a SNAP construct containing the core sequence of the C gene of Hepatitis E <400> 172 tcgcgagcta gcaccatgaa actatgtatt ctacttgcag ttgttgcgtt cgtaggattg 60 tccttaccta cagctctggc aagatctgac aaagactgcg aaatgaaaag aactacattg 120 gattcaccac ttgggaagtt ggaactgagt ggatgcgagc aaggattgca tgaaattaag 180 ctactgggaa aaggaacttc tgctgctgat gcagttgaag ttccagcacc agcagctgtt 240 cttggaggtc ctgagcccct catgcaagcc acagcctggc ttaacgcata tttccaccag 300 cctgaggcca ttgaggaatt tccagtcccc gcccttcacc atcctgtgtt tcagcaggag 360 agcttcaccc gccaggtcct gtggaaattg ctgaaggtgg tcaagtttgg tgaagtgatt 420 tcatatcagc aacttgctgc attggccggt aaccccgcag ctacagctgc cgtgaaaact 480 gctctcagcg gaaatcctgt gcccatcctg atcccttgtc acagagtcgt ttcatcttcc 540 ggagctgtag gtggctatga aggaggactg gcagttaagg agtggctgct ggctcatgaa 600 ggtcatagac ttggaaagcc tgggctgggt cctgctggta taggcgcgcc agggtcccta 660 ggtggcggat ccgaaaacct gtacttccag agcgatatcg ctggtgctgg agctcgacct 720 cggcagccag cccgcccact cggctccgct tggcgtgacc aatcccagcg cccagccact 780 tccgcacgtc gtcgatctgc accagctgga gcttcgccac tgactgctgt ggcacctgct 840 ccagatactg ttcctgttcc tgatgtcgat tctcgaggtg ctatattacg acgtcagtat 900 aatttatcaa catcaccgct aacatctact attgccactg gtactaacct tgttctatat 960 gctgctccgc tgagcccttt gctaccactc caagatggaa ctaacactca cattatggcc 1020 actgaagcat caaattatgc ccagtaccgt gttgtccgcg ctaccatccg gtaccgtccg 1080 cttgtgccga acgctgtcgg cggatacgct atatctatct ctttctggcc tcagacaact 1140 actaccccga catctgtgga catgaactct atcacctcca cggatgtccg aatccttgtc 1200 cagcctggta ttgcttcaga acttgtgatc cccagtgagc gcctgcatta tcgtaaccaa 1260 ggctggcgct ctgttgagac ctctggtgtt gcggaggagg aggcgacctc cggccttgtc 1320 atgctttgca tccacggatc acctgtaaat tcttacacca atacgcctta tactggtgcc 1380 cttggcttgc ttgatttcgc actcgagctc gagttccgca atttgacacc tggtaacacg 1440 aacacacgtg tttcccgcta ctcgagtagt gcacgacaca agctacgccg aggacctgat 1500 ggcactgctg agttaactac gactgctgct acacgcttta tgaaggacct tcattttaca 1560 gggactaatg gagttggtga agtcggtcgt ggtatagcgc taactctgtt caaccttgct 1620 gatacgcttc tcggtggact cccgacagaa ttgatttcgt cggctggtgg tcagctattc 1680 tattctcgcc ccgtcgtctc agccaatggc gagccaacgg tgaagctcta cacttcagtc 1740 gagaacgctc agcaggataa gggtatagct atcccacatg atattgatct tggtgagtcc 1800 cgtgttgtca ttcaggatta tgataaccaa catgagcagg atcgtccaac tccttctcct 1860 gctccatctc gacctttatc tgtccttcgt gctaatgatg tgctatggct ttcacttaca 1920 gcagctgagt atgatcagac tacctatggc tcctctacta atccaatgta tgtctctgat 1980 accgtgacat ttgtcaatgt tgctactggt gcccagggtg tatctcgctc tctggactgg 2040 tctaaagtca cccttgatgg acgaccactt atgactatcc agcagtattc taagactttc 2100 tttgttctgc cactacgtgg caagctctcc ttctgggagg ccggtaccac taaggccggc 2160 tacccttata attataatac tactgccagt gaccagattt taattgagaa tgcagctggt 2220 caccgtgtat gcatctcaac ctacactact aatcttggat ctggccctgt ttctatttct 2280 gctgtcggtg tcctcgcacc tcactctgcc ccgggagaga atctatattt tcaagggccc 2340 ggcggaggta gtcaccatca tcaccatcac taatgaccgg tgcggccgca agctt 2395 <210> 173 <211> 790 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of a SNAP construct containing the core sequence of the C gene of Hepatitis E <400> 173 Ser Arg Ala Ser Thr Met Lys Leu Cys Ile Leu Leu Ala Val Val Ala 1 5 10 15 Phe Val Gly Leu Ser Leu Pro Thr Ala Leu Ala Arg Ser Asp Lys Asp 20 25 30 Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly Lys Leu Glu 35 40 45 Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu Leu Gly Lys 50 55 60 Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro Ala Ala Val 65 70 75 80 Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp Leu Asn Ala 85 90 95 Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val Pro Ala Leu 100 105 110 His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln Val Leu Trp 115 120 125 Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser Tyr Gln Gln 130 135 140 Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala Val Lys Thr 145 150 155 160 Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys His Arg Val 165 170 175 Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly Leu Ala Val 180 185 190 Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly Lys Pro Gly 195 200 205 Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Gly Gly Gly Ser 210 215 220 Glu Asn Leu Tyr Phe Gln Ser Asp Ile Ala Gly Ala Gly Ala Arg Pro 225 230 235 240 Arg Gln Pro Ala Arg Pro Leu Gly Ser Ala Trp Arg Asp Gln Ser Gln 245 250 255 Arg Pro Ala Thr Ser Ala Arg Arg Arg Ser Ala Pro Ala Gly Ala Ser 260 265 270 Pro Leu Thr Ala Val Ala Pro Ala Pro Asp Thr Val Pro Val Pro Asp 275 280 285 Val Asp Ser Arg Gly Ala Ile Leu Arg Arg Gln Tyr Asn Leu Ser Thr 290 295 300 Ser Pro Leu Thr Ser Thr Ile Ala Thr Gly Thr Asn Leu Val Leu Tyr 305 310 315 320 Ala Ala Pro Leu Ser Pro Leu Leu Pro Leu Gln Asp Gly Thr Asn Thr 325 330 335 His Ile Met Ala Thr Glu Ala Ser Asn Tyr Ala Gln Tyr Arg Val Val 340 345 350 Arg Ala Thr Ile Arg Tyr Arg Pro Leu Val Pro Asn Ala Val Gly Gly 355 360 365 Tyr Ala Ile Ser Ile Ser Phe Trp Pro Gln Thr Thr Thr Thr Pro Thr 370 375 380 Ser Val Asp Met Asn Ser Ile Thr Ser Thr Asp Val Arg Ile Leu Val 385 390 395 400 Gln Pro Gly Ile Ala Ser Glu Leu Val Ile Pro Ser Glu Arg Leu His 405 410 415 Tyr Arg Asn Gln Gly Trp Arg Ser Val Glu Thr Ser Gly Val Ala Glu 420 425 430 Glu Glu Ala Thr Ser Gly Leu Val Met Leu Cys Ile His Gly Ser Pro 435 440 445 Val Asn Ser Tyr Thr Asn Thr Pro Tyr Thr Gly Ala Leu Gly Leu Leu 450 455 460 Asp Phe Ala Leu Glu Leu Glu Phe Arg Asn Leu Thr Pro Gly Asn Thr 465 470 475 480 Asn Thr Arg Val Ser Arg Tyr Ser Ser Ser Ala Arg His Lys Leu Arg 485 490 495 Arg Gly Pro Asp Gly Thr Ala Glu Leu Thr Thr Thr Ala Ala Thr Arg 500 505 510 Phe Met Lys Asp Leu His Phe Thr Gly Thr Asn Gly Val Gly Glu Val 515 520 525 Gly Arg Gly Ile Ala Leu Thr Leu Phe Asn Leu Ala Asp Thr Leu Leu 530 535 540 Gly Gly Leu Pro Thr Glu Leu Ile Ser Ser Ala Gly Gly Gln Leu Phe 545 550 555 560 Tyr Ser Arg Pro Val Val Ser Ala Asn Gly Glu Pro Thr Val Lys Leu 565 570 575 Tyr Thr Ser Val Glu Asn Ala Gln Gln Asp Lys Gly Ile Ala Ile Pro 580 585 590 His Asp Ile Asp Leu Gly Glu Ser Arg Val Val Ile Gln Asp Tyr Asp 595 600 605 Asn Gln His Glu Gln Asp Arg Pro Thr Pro Ser Pro Ala Pro Ser Arg 610 615 620 Pro Leu Ser Val Leu Arg Ala Asn Asp Val Leu Trp Leu Ser Leu Thr 625 630 635 640 Ala Ala Glu Tyr Asp Gln Thr Thr Tyr Gly Ser Ser Thr Asn Pro Met 645 650 655 Tyr Val Ser Asp Thr Val Thr Phe Val Asn Val Ala Thr Gly Ala Gln 660 665 670 Gly Val Ser Arg Ser Leu Asp Trp Ser Lys Val Thr Leu Asp Gly Arg 675 680 685 Pro Leu Met Thr Ile Gln Gln Tyr Ser Lys Thr Phe Phe Val Leu Pro 690 695 700 Leu Arg Gly Lys Leu Ser Phe Trp Glu Ala Gly Thr Thr Lys Ala Gly 705 710 715 720 Tyr Pro Tyr Asn Tyr Asn Thr Thr Ala Ser Asp Gln Ile Leu Ile Glu 725 730 735 Asn Ala Ala Gly His Arg Val Cys Ile Ser Thr Tyr Thr Thr Asn Leu 740 745 750 Gly Ser Gly Pro Val Ser Ile Ser Ala Val Gly Val Leu Ala Pro His 755 760 765 Ser Ala Pro Gly Glu Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser 770 775 780 His His His His His His 785 790 <210> 174 <211> 1195 <212> DNA <213> Artificial Sequence <220> <223> Nucleotide sequence of a SNAP construct containing the C gene of Hepatitis C <400> 174 tcgcgagcta gcaccatgaa actatgtatt ctacttgcag ttgttgcgtt cgtaggattg 60 tccttaccta cagctctggc aagatctgac aaagactgcg aaatgaaaag aactacattg 120 gattcaccac ttgggaagtt ggaactgagt ggatgcgagc aaggattgca tgaaattaag 180 ctactgggaa aaggaacttc tgctgctgat gcagttgaag ttccagcacc agcagctgtt 240 cttggaggtc ctgagcccct catgcaagcc acagcctggc ttaacgcata tttccaccag 300 cctgaggcca ttgaggaatt tccagtcccc gcccttcacc atcctgtgtt tcagcaggag 360 agcttcaccc gccaggtcct gtggaaattg ctgaaggtgg tcaagtttgg tgaagtgatt 420 tcatatcagc aacttgctgc attggccggt aaccccgcag ctacagctgc cgtgaaaact 480 gctctcagcg gaaatcctgt gcccatcctg atcccttgtc acagagtcgt ttcatcttcc 540 ggagctgtag gtggctatga aggaggactg gcagttaagg agtggctgct ggctcatgaa 600 ggtcatagac ttggaaagcc tgggctgggt cctgctggta taggcgcgcc agggtcccta 660 ggtggcggat ccgaaaacct gtacttccag agcgatatcg gagtttacct attgccgcga 720 agaggtcctc gtttaggtgt tcgagcaact agaaagactt ctgaacgatc acaacctcgt 780 ggaagacgac aacctatttt taaggctcgt cgtcctgaag gtagaactat ggctcagcct 840 ggttatccta tgcctctata tggtaatgaa ggatgcggta atgcaggaat gctactatca 900 cctcgtggtt ctcgacctag ttggggtcct actgaccctc gacgaagatc acgtaattta 960 ggtagagtaa ttgatacact tacatgtggt tttgctgatc ttatgggata tattccacta 1020 gtaggtgctc cactaggtgg agctgcaaga gctcttgcac atggtgtacg agttcttgaa 1080 gatggagtga actatgcaac aggtaatctc ccgggagaga atctatattt tcaagggccc 1140 ggcggaggta gtcaccatca tcaccatcac taatgaccgg tgcggccgca agctt 1195 <210> 175 <211> 390 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of a SNAP construct containing the C gene of Hepatitis C. <400> 175 Ser Arg Ala Ser Thr Met Lys Leu Cys Ile Leu Leu Ala Val Val Ala 1 5 10 15 Phe Val Gly Leu Ser Leu Pro Thr Ala Leu Ala Arg Ser Asp Lys Asp 20 25 30 Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly Lys Leu Glu 35 40 45 Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu Leu Gly Lys 50 55 60 Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro Ala Ala Val 65 70 75 80 Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp Leu Asn Ala 85 90 95 Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val Pro Ala Leu 100 105 110 His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln Val Leu Trp 115 120 125 Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser Tyr Gln Gln 130 135 140 Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala Val Lys Thr 145 150 155 160 Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys His Arg Val 165 170 175 Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly Leu Ala Val 180 185 190 Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly Lys Pro Gly 195 200 205 Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Gly Gly Gly Ser 210 215 220 Glu Asn Leu Tyr Phe Gln Ser Asp Ile Gly Val Tyr Leu Leu Pro Arg 225 230 235 240 Arg Gly Pro Arg Leu Gly Val Arg Ala Thr Arg Lys Thr Ser Glu Arg 245 250 255 Ser Gln Pro Arg Gly Arg Arg Gln Pro Ile Phe Lys Ala Arg Arg Pro 260 265 270 Glu Gly Arg Thr Met Ala Gln Pro Gly Tyr Pro Met Pro Leu Tyr Gly 275 280 285 Asn Glu Gly Cys Gly Asn Ala Gly Met Leu Leu Ser Pro Arg Gly Ser 290 295 300 Arg Pro Ser Trp Gly Pro Thr Asp Pro Arg Arg Arg Ser Arg Asn Leu 305 310 315 320 Gly Arg Val Ile Asp Thr Leu Thr Cys Gly Phe Ala Asp Leu Met Gly 325 330 335 Tyr Ile Pro Leu Val Gly Ala Pro Leu Gly Gly Ala Ala Arg Ala Leu 340 345 350 Ala His Gly Val Arg Val Leu Glu Asp Gly Val Asn Tyr Ala Thr Gly 355 360 365 Asn Leu Pro Gly Glu Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser 370 375 380 His His His His His His 385 390 <210> 176 <211> 1288 <212> DNA <213> Artificial Sequence <220> <223> Nucleotide sequence of a SNAP construct containing the core sequence of the C gene of Hepatitis C <400> 176 tcgcgagcta gcaccatgaa actatgtatt ctacttgcag ttgttgcgtt cgtaggattg 60 tccttaccta cagctctggc aagatctgac aaagactgcg aaatgaaaag aactacattg 120 gattcaccac ttgggaagtt ggaactgagt ggatgcgagc aaggattgca tgaaattaag 180 ctactgggaa aaggaacttc tgctgctgat gcagttgaag ttccagcacc agcagctgtt 240 cttggaggtc ctgagcccct catgcaagcc acagcctggc ttaacgcata tttccaccag 300 cctgaggcca ttgaggaatt tccagtcccc gcccttcacc atcctgtgtt tcagcaggag 360 agcttcaccc gccaggtcct gtggaaattg ctgaaggtgg tcaagtttgg tgaagtgatt 420 tcatatcagc aacttgctgc attggccggt aaccccgcag ctacagctgc cgtgaaaact 480 gctctcagcg gaaatcctgt gcccatcctg atcccttgtc acagagtcgt ttcatcttcc 540 ggagctgtag gtggctatga aggaggactg gcagttaagg agtggctgct ggctcatgaa 600 ggtcatagac ttggaaagcc tgggctgggt cctgctggta taggcgcgcc agggtcccta 660 ggtggcggat ccgaaaacct gtacttccag agcgatatca gtacgaatcc taagcctcaa 720 cgtaagacta agcgcaatac taatcgtcgt ccacaagatg ttaagtttcc gggtggcggt 780 caaattgttg gtggagttta cctattgccg cgaagaggtc ctcgtttagg tgttcgagca 840 actagaaaga cttctgaacg atcacaacct cgtggaagac gacaacctat ttttaaggct 900 cgtcgtcctg aaggtagaac tatggctcag cctggttatc ctatgcctct atatggtaat 960 gaaggatgcg gtaatgcagg aatgctacta tcacctcgtg gttctcgacc tagttggggt 1020 cctactgacc ctcgacgaag atcacgtaat ttaggtagag taattgatac acttacatgt 1080 ggttttgctg atcttatggg atatattcca ctagtaggtg ctccactagg tggagctgca 1140 agagctcttg cacatggtgt acgagttctt gaagatggag tgaactatgc aacaggtaat 1200 ctcccgggag agaatctata ttttcaaggg cccggcggag gtagtcacca tcatcaccat 1260 cactaatgac cggtgcggcc gcaagctt 1288 <210> 177 <211> 421 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of a SNAP construct containing the core sequence of the C gene of Hepatitis C <400> 177 Ser Arg Ala Ser Thr Met Lys Leu Cys Ile Leu Leu Ala Val Val Ala 1 5 10 15 Phe Val Gly Leu Ser Leu Pro Thr Ala Leu Ala Arg Ser Asp Lys Asp 20 25 30 Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly Lys Leu Glu 35 40 45 Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu Leu Gly Lys 50 55 60 Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro Ala Ala Val 65 70 75 80 Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp Leu Asn Ala 85 90 95 Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val Pro Ala Leu 100 105 110 His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln Val Leu Trp 115 120 125 Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser Tyr Gln Gln 130 135 140 Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala Val Lys Thr 145 150 155 160 Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys His Arg Val 165 170 175 Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly Leu Ala Val 180 185 190 Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly Lys Pro Gly 195 200 205 Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Gly Gly Gly Ser 210 215 220 Glu Asn Leu Tyr Phe Gln Ser Asp Ile Ser Thr Asn Pro Lys Pro Gln 225 230 235 240 Arg Lys Thr Lys Arg Asn Thr Asn Arg Arg Pro Gln Asp Val Lys Phe 245 250 255 Pro Gly Gly Gly Gln Ile Val Gly Gly Val Tyr Leu Leu Pro Arg Arg 260 265 270 Gly Pro Arg Leu Gly Val Arg Ala Thr Arg Lys Thr Ser Glu Arg Ser 275 280 285 Gln Pro Arg Gly Arg Arg Gln Pro Ile Phe Lys Ala Arg Arg Pro Glu 290 295 300 Gly Arg Thr Met Ala Gln Pro Gly Tyr Pro Met Pro Leu Tyr Gly Asn 305 310 315 320 Glu Gly Cys Gly Asn Ala Gly Met Leu Leu Ser Pro Arg Gly Ser Arg 325 330 335 Pro Ser Trp Gly Pro Thr Asp Pro Arg Arg Arg Ser Arg Asn Leu Gly 340 345 350 Arg Val Ile Asp Thr Leu Thr Cys Gly Phe Ala Asp Leu Met Gly Tyr 355 360 365 Ile Pro Leu Val Gly Ala Pro Leu Gly Gly Ala Ala Arg Ala Leu Ala 370 375 380 His Gly Val Arg Val Leu Glu Asp Gly Val Asn Tyr Ala Thr Gly Asn 385 390 395 400 Leu Pro Gly Glu Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser His 405 410 415 His His His His His 420 <210> 178 <211> 1054 <212> DNA <213> Artificial Sequence <220> <223> Nucleotide sequence of a SNAP construct containing sequences encoding the NSs protein from Schmallenberg virus <400> 178 tcgcgagcta gcaccatgaa actatgtatt ctacttgcag ttgttgcgtt cgtaggattg 60 tccttaccta cagctctggc aagatctgac aaagactgcg aaatgaaaag aactacattg 120 gattcaccac ttgggaagtt ggaactgagt ggatgcgagc aaggattgca tgaaattaag 180 ctactgggaa aaggaacttc tgctgctgat gcagttgaag ttccagcacc agcagctgtt 240 cttggaggtc ctgagcccct catgcaagcc acagcctggc ttaacgcata tttccaccag 300 cctgaggcca ttgaggaatt tccagtcccc gcccttcacc atcctgtgtt tcagcaggag 360 agcttcaccc gccaggtcct gtggaaattg ctgaaggtgg tcaagtttgg tgaagtgatt 420 tcatatcagc aacttgctgc attggccggt aaccccgcag ctacagctgc cgtgaaaact 480 gctctcagcg gaaatcctgt gcccatcctg atcccttgtc acagagtcgt ttcatcttcc 540 ggagctgtag gtggctatga aggaggactg gcagttaagg agtggctgct ggctcatgaa 600 ggtcatagac ttggaaagcc tgggctgggt cctgctggta taggcgcgcc agggtcccta 660 ggtggcggat ccgaaaacct gtacttccag agcgatatct accacaacgg aatgcagcta 720 catttaaccc ggaggtcggg tatgtggcat ttattggtaa gtatgggcaa caactcaact 780 tcggtgttgc tagagtcttc ttcctcaacc agaagaaggc caagatggtc ctacataaga 840 cggcacaacc aagtgtcgat cttacttttg gtggggtcaa atttacagtg gttaataacc 900 attttcccca atatgtctca aatcctgtgc cagacaatgc cattacactt cacaggatgt 960 caggttatcc cgggagagaa tctatatttt caagggcccg gcggaggtag tcaccatcat 1020 caccatcact aatgaccggt gcggccgcaa gctt 1054 <210> 179 <211> 343 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of a SNAP construct containing sequences encoding the NSs protein from Schmallenberg virus <400> 179 Ser Arg Ala Ser Thr Met Lys Leu Cys Ile Leu Leu Ala Val Val Ala 1 5 10 15 Phe Val Gly Leu Ser Leu Pro Thr Ala Leu Ala Arg Ser Asp Lys Asp 20 25 30 Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly Lys Leu Glu 35 40 45 Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu Leu Gly Lys 50 55 60 Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro Ala Ala Val 65 70 75 80 Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp Leu Asn Ala 85 90 95 Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val Pro Ala Leu 100 105 110 His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln Val Leu Trp 115 120 125 Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser Tyr Gln Gln 130 135 140 Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala Val Lys Thr 145 150 155 160 Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys His Arg Val 165 170 175 Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly Leu Ala Val 180 185 190 Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly Lys Pro Gly 195 200 205 Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Gly Gly Gly Ser 210 215 220 Glu Asn Leu Tyr Phe Gln Ser Asp Ile Tyr His Asn Gly Met Gln Leu 225 230 235 240 His Leu Thr Arg Arg Ser Gly Met Trp His Leu Leu Val Ser Met Gly 245 250 255 Asn Asn Ser Thr Ser Val Leu Leu Glu Ser Ser Ser Ser Thr Arg Arg 260 265 270 Arg Pro Arg Trp Ser Tyr Ile Arg Arg His Asn Gln Val Ser Ile Leu 275 280 285 Leu Leu Val Gly Ser Asn Leu Gln Trp Leu Ile Thr Ile Phe Pro Asn 290 295 300 Met Ser Gln Ile Leu Cys Gln Thr Met Pro Leu His Phe Thr Gly Cys 305 310 315 320 Gln Val Ile Pro Gly Glu Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly 325 330 335 Ser His His His His His His 340

Claims

피험자로부터의 생물학적 샘플에 존재하는 적어도 2개의 상이한 표적 항체를 검출하기 위한 시험관내 분석 방법으로서, 상기 방법은
(a) 적어도 2개의 고체 지지체의 혼합물을 생물학적 샘플과 접촉시키는 단계로서, 상기 고체 지지체 중의 적어도 하나는 AGT 기질에 공유적으로 커플링 (covalently coupling)된 제1 AGT-항원 융합 단백질을 포함하고, 상기 고체 지지체 중의 적어도 하나는 AGT 기질에 공유적으로 커플링된 제2 AGT-항원 융합 단백질을 포함하는 단계,
(b) 제1 AGT-항원에 대한 항체의 결합의 존재 또는 부재를 검출하는 단계; 및
(c) 제2 AGT-항원에 대한 항체의 결합의 존재 또는 부재를 검출하는 단계를 포함하는, 시험관내 분석 방법.
제1항에 있어서, 적어도 5개의 고체 지지체의 혼합물을 피험자로부터의 생물학적 샘플과 접촉시키는 것을 포함하는, 분석 방법.
제1항에 있어서, 적어도 10개의 고체 지지체를 피험자로부터의 생물학적 샘플과 접촉시키는 것을 포함하는, 분석 방법.
제1항에 있어서, 적어도 15개의 고체 지지체의 혼합물을 피험자로부터의 생물학적 샘플과 접촉시키는 것을 포함하는, 분석 방법.
제1항 내지 제4항 중 어느 한 항에 있어서, 상기 AGT-항원 융합 단백질 둘 다가 서열번호 2의 SNAP 돌연변이체를 포함하는, 분석 방법.
제1항 내지 제5항 중 어느 한 항에 있어서, 상기 고체 지지체가 이들의 특정 위치, 크기, 직경, 중량, 입도측정 또는 표지화에 의해 특이적으로 식별될 수 있는, 분석 방법.
제1항 내지 제6항 중 어느 한 항에 있어서, 상기 고체 지지체가 형광색소, 발색단, 방사성동위원소 및/또는 질량 태그(mass tag)에 의해 표지되는, 분석 방법.
제1항 내지 제7항 중 어느 한 항에 있어서, 상기 고체 지지체가 마이크로입자 (microparticle)로 제조되는, 분석 방법.
제1항 내지 제8항 중 어느 한 항에 있어서, 상기 고체 지지체가 자석인, 분석 방법.
제1항 내지 제9항 중 어느 한 항에 있어서, 상기 고체 지지체가 형광 염료로 내부 표지된 마이크로입자인, 분석 방법.
제1항 내지 제10항 중 어느 한 항에 있어서, 각각의 상기 고체 지지체가 여기 후에 상이하고 식별가능한 파장을 방사하는, 분석 방법.
제1항 내지 제11항 중 어느 한 항에 있어서, 상기 제1 또는 제2 AGT-항원 융합 단백질이 서열번호 3의 뎅기 바이러스 1의 EDIII 단백질, 서열번호 4의 뎅기 바이러스 2의 EDIII 단백질, 서열번호 5의 뎅기 바이러스 3의 EDIII 단백질, 서열번호 6의 뎅기 바이러스 4의 EDIII 단백질, 서열번호 7의 웨스트 나일 바이러스의 EDIII 단백질, 서열번호 8의 황열 바이러스의 EDIII 단백질, 서열번호 9의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 10의 지카 바이러스의 EDIII 단백질, 서열번호 11의 베셀스브론 바이러스의 EDIII 단백질, 서열번호 12의 로시오 바이러스의 EDIII 단백질, 서열번호 13의 머레이 뇌염 바이러스의 EDIII 단백질, 서열번호 14의 세인트-루이스 뇌염 바이러스의 EDIII 단백질, 서열번호 54에 의해 인코딩되는 유전형 1의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 55에 의해 인코딩되는 유전형 2의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 56에 의해 인코딩되는 유전형 4의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 57에 의해 인코딩되는 유전형 5의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 58에 의해 인코딩되는 라벤스버그 바이러스의 EDIII 단백질의 적어도 30개의 연속적 아미노산을 포함하는, 분석 방법.
제1항 내지 제12항 중 어느 한 항에 있어서, 상기 제1 또는 제2 AGT-항원 융합 단백질이 HIV1, HIV2, B형 간염 바이러스, C형 간염 바이러스, E형 간염 바이러스, 웨스트-나일 바이러스 및 종양 HPV 스트레인, HPV 16, 18, 31, 33, 35, 39, 45, 51, 52, 56, 58, 59, 66 및 68의 바이러스 단백질의 적어도 20개의 연속적 아미노산을 포함하는, 분석 방법.
제1항 내지 제13항 중 어느 한 항에 있어서, 상기 제1 또는 제2 AGT-항원 융합 단백질이 서열번호 21, 서열번호 42, 서열번호 49, 서열번호 51, 서열번호 53, 서열번호 60, 서열번호 62, 서열번호 64, 서열번호 66, 서열번호 68, 서열번호 70, 서열번호 72, 서열번호 74, 서열번호 76, 서열번호 78, 서열번호 80, 서열번호 82, 서열번호 84, 서열번호 86, 서열번호 88, 서열번호 90, 서열번호 92, 서열번호 94, 서열번호 96, 서열번호 98, 서열번호 100, 서열번호 102, 서열번호 104, 서열번호 109, 서열번호 111, 서열번호 113, 서열번호 115, 서열번호 117, 서열번호 119, 서열번호 121, 서열번호 123, 서열번호 125, 서열번호 127, 서열번호 129, 서열번호 131, 서열번호 133, 서열번호 135, 서열번호 137, 서열번호 139, 서열번호 141, 서열번호 143, 서열번호 145, 서열번호 147, 서열번호 149 및 서열번호 151로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함하는, 분석 방법.
제1항 내지 제14항 중 어느 한 항에 있어서, 상기 제1 또는 제2 AGT-항원 융합 단백질이 서열번호 155, 157, 159, 161, 163, 165, 167, 171, 173, 175, 177 및 179의 적어도 30개의 연속적 아미노산을 포함하는, 분석 방법.
제1항 내지 제15항 중 어느 한 항에 있어서, 상기 제1 또는 제2 AGT-항원 융합 단백질이 서열번호 155, 157, 159, 161, 163, 165, 167, 171, 173, 175, 177 및 179의 아미노산 서열을 포함하는, 분석 방법.
제1항 내지 제16항 중 어느 한 항에 있어서, 상기 생물학적 샘플이 혈청 또는 혈장인, 분석 방법.
피험자로부터의 생물학적 샘플에 존재하는 적어도 2개의 상이한 표적 항체를 검출하기 위한 키트로서,
(a) AGT 기질에 공유적으로 커플링된 제1 AGT-항원 융합 단백질을 포함하는 제1 고체 지지체 및
(b) AGT 기질에 공유적으로 커플링된 제2 AGT-항원 융합 단백질을 포함하는 제2 고체 지지체를 포함하는, 키트.
제18항에 있어서, AGT 기질에 공유적으로 커플링된 상이한 AGT-항원 융합 단백질에 각각 커플링된 적어도 5개의 고체 지지체를 포함하는, 키트.
제19항에 있어서, AGT 기질에 공유적으로 커플링된 상이한 AGT-항원 융합 단백질에 각각 커플링된 적어도 10개의 고체 지지체를 포함하는, 키트.
제20항에 있어서, AGT 기질에 공유적으로 커플링된 상이한 AGT-항원 융합 단백질에 각각 커플링된 적어도 15개의 고체 지지체를 포함하는, 키트.
제18항 내지 제21항 중 어느 한 항에 있어서, 상기 고체 지지체가 마이크로입자인, 키트.
제18항 내지 제22항 중 어느 한 항에 있어서, 상기 고체 지지체가 적어도 하나의 단일 구획에서 함께 혼합되는, 키트.
제18항 내지 제23항 중 어느 한 항에 있어서, 상기 고체 지지체가 미세역가판 (microtiter plate)의 적어도 하나의 웰 또는 적어도 하나의 튜브에서 함께 혼합되는 마이크로입자인, 키트.
제18항 내지 제24항 중 어느 한 항에 있어서, 상기 고체 지지체에 결합되는 적어도 2개의 표적 항체를 검출하기 위한 표지된 제2 항체를 추가로 포함하는, 키트.
제18항 내지 제25항 중 어느 한 항에 있어서, 상기 제1 또는 제2 AGT-항원 융합 단백질이 서열번호 3의 뎅기 바이러스 1의 EDIII 단백질, 서열번호 4의 뎅기 바이러스 2의 EDIII 단백질, 서열번호 5의 뎅기 바이러스 3의 EDIII 단백질, 서열번호 6의 뎅기 바이러스 4의 EDIII 단백질, 서열번호 7의 웨스트 나일 바이러스의 EDIII 단백질, 서열번호 8의 황열 바이러스의 EDIII 단백질, 서열번호 9의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 10의 지카 바이러스의 EDIII 단백질, 서열번호 11의 베셀스브론 바이러스의 EDIII 단백질, 서열번호 12의 로시오 바이러스의 EDIII 단백질, 서열번호 13의 머레이 뇌염 바이러스의 EDIII 단백질, 서열번호 14의 세인트-루이스 뇌염 바이러스의 EDIII 단백질, 서열번호 54에 의해 인코딩되는 유전형 1의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 55에 의해 인코딩되는 유전형 2의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 56에 의해 인코딩되는 유전형 4의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 57에 의해 인코딩되는 유전형 5의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 58에 의해 인코딩되는 라벤스버그 바이러스의 EDIII 단백질의 적어도 30개의 연속적 아미노산을 포함하는, 키트.
제18항 내지 제26항 중 어느 한 항에 있어서, 상기 제1 또는 제2 AGT-항원 융합 단백질이 HIV1, HIV2, B형 간염 바이러스, C형 간염 바이러스, E형 간염 바이러스, 웨스트-나일 바이러스 및 종양 HPV 스트레인, HPV 16, 18, 31, 33, 35, 39, 45, 51, 52, 56, 58, 59, 66 및 68의 바이러스 단백질의 적어도 20개 연속적 아미노산을 포함하는, 키트.
제18항 내지 제27항 중 어느 한 항에 있어서, 상기 제1 또는 제2 AGT-항원 융합 단백질이 서열번호 21, 서열번호 42, 서열번호 49, 서열번호 51, 서열번호 53, 서열번호 60, 서열번호 62, 서열번호 64, 서열번호 66, 서열번호 68, 서열번호 70, 서열번호 72, 서열번호 74, 서열번호 76, 서열번호 78, 서열번호 80, 서열번호 82, 서열번호 84, 서열번호 86, 서열번호 88, 서열번호 90, 서열번호 92, 서열번호 94, 서열번호 96, 서열번호 98, 서열번호 100, 서열번호 102, 서열번호 104, 서열번호 109, 서열번호 111, 서열번호 113, 서열번호 115, 서열번호 117, 서열번호 119, 서열번호 121, 서열번호 123, 서열번호 125, 서열번호 127, 서열번호 129, 서열번호 131, 서열번호 133, 서열번호 135, 서열번호 137, 서열번호 139, 서열번호 141, 서열번호 143, 서열번호 145, 서열번호 147, 서열번호 149 및 서열번호 151로 이루어진 그룹으로부터 선택되는 아미노산 서열을 포함하는, 키트.
제18항 내지 제28항 중 어느 한 항에 있어서, 상기 제1 또는 제2 AGT-항원 융합 단백질이 서열번호 155, 157, 159, 161, 163, 165, 167, 171, 173, 175, 177 및 179의 적어도 30개의 연속적 아미노산을 포함하는, 키트.
제18항 내지 제29항 중 어느 한 항에 있어서, 상기 제1 또는 제2 AGT-항원 융합 단백질이 서열번호 155, 157, 159, 161, 163, 165, 167, 171, 173, 175, 177 및 179의 아미노산 서열을 포함하는, 키트.
피험자로부터의 생물학적 샘플에서 적어도 2개의 표적 항체를 검출하기 위한, 제18항 내지 제30항 중 어느 한 항에 따른 키트의 용도.
피험자에서 파필로마바이러스 또는 뎅기 바이러스, 황열 바이러스, 웨스트 나일 바이러스, 일본 뇌염 바이러스, 진드기-매개 뇌염 바이러스, C형 간염 바이러스, 치쿤구니아 바이러스, 로스 강 바이러스, 마야로 바이러스, 서부 말 뇌염 바이러스, 동부 말 뇌염 바이러스, 베네주엘라 말 뇌염 바이러스, 크리미아-콩고 출혈 열 바이러스, 리프트 계곡 열 바이러스, 쉬말렌베르그 바이러스, E형 간염 바이러스, 라사 바이러스, 에볼라 바이러스, 마르부르그 바이러스에 의해 유발되는 바이러스 감염; 렙토스피로사 인테로간스에 의해 유발되는 세균 감염; 또는 플라스모듐 팔시파룸에 의해 유발되는 감염인 적어도 2개의 표적 질환을 진단하기 위한, 제18항 내지 제31항 중 어느 한 항에 따른 키트의 용도.
피험자에서 적어도 하나의 표적 항체의 합성을 유도하는 것으로 알려진 하나 이상의 표적 질환을 진단하기 위한 시험관내 진단 방법으로서, 상기 방법은 제1항 내지 제17항 중 어느 한 항에 따른 분석 방법을 수행하는 것을 포함하고, 하나 이상의 표적 항체의 양이 대조치 보다 높은 경우 상기 피험자가 적어도 하나의 표적 질환을 앓는 것으로 진단되는, 시험관내 진단 방법.
키트를 제조하는 방법으로서, 상기 방법은
(a) 제1 표적 항체에 의해 인지되는 제1 AGT-항원 융합 단백질을 제공하는 단계,
(b) 상기 제1 AGT-항원 융합 단백질을, 상기 AGT-항원 융합 단백질의 기질과 공유적으로 커플링된 제1 고체 지지체와 접촉시키는 단계,
(c) 제1 AGT-항원 융합 단백질과 공유적으로 커플링된 제1 고체 지지체를 수득하는 단계,
(d) 제2 표적 항체에 의해서는 인지되나 상기 제1 표적 항체에 의해서는 인지되지 않는 제2 AGT-항원 융합 단백질을 제공하는 단계,
(e) 상기 제2 AGT-항원 융합 단백질을, 상기 AGT-항원 융합 단백질의 기질과 공유적으로 커플링된 제2 고체 지지체와 접촉시키는 단계, 및
(f) 제2 AGT-항원 융합 단백질과 공유적으로 커플링된 제2 고체 지지체를 수득하는 단계를 포함하고,
상기 제1 및 제2 고체 지지체는 서로 특이적으로 식별될 수 있는, 방법.
제34항에 있어서, AGT-항원 융합 단백질과 공유적으로 커플링된 고체 지지체를 함께 혼합하는 것을 추가로 포함하는, 방법.
제34항 또는 제35항에 있어서, 5개의 상이한 AGT-항원 융합 단백질과 공유적으로 커플링된 적어도 5개의 고체 지지체를 생성하기 위해 적어도 5개의 AGT-항원 융합 단백질로 단계 (a) 내지 (c)를 수행하는 것을 추가로 포함하는, 방법.
제34항 또는 제35항에 있어서, 10개의 상이한 AGT-항원 융합 단백질과 공유적으로 커플링된 적어도 10개의 고체 지지체를 생성하기 위해 적어도 10개의 AGT-항원 융합 단백질로 단계 (a) 내지 (c)를 수행하는 것을 추가로 포함하는, 방법.
제34항 또는 제35항에 있어서, 15개의 상이한 AGT-항원 융합 단백질과 공유적으로 커플링된 적어도 15개의 고체 지지체를 생성하기 위해 적어도 15개의 AGT-항원 융합 단백질로 단계 (a) 내지 (c)를 수행하는 것을 추가로 포함하는, 방법.