KR20150016941A - 다중 면역 스크리닝 분석 - Google Patents
다중 면역 스크리닝 분석 Download PDFInfo
- Publication number
- KR20150016941A KR20150016941A KR1020147031586A KR20147031586A KR20150016941A KR 20150016941 A KR20150016941 A KR 20150016941A KR 1020147031586 A KR1020147031586 A KR 1020147031586A KR 20147031586 A KR20147031586 A KR 20147031586A KR 20150016941 A KR20150016941 A KR 20150016941A
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- virus
- agt
- protein
- sequence
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/543—Immunoassay; Biospecific binding assay; Materials therefor with an insoluble carrier for immobilising immunochemicals
- G01N33/54306—Solid-phase reaction mechanisms
-
- G—PHYSICS
- G02—OPTICS
- G02B—OPTICAL ELEMENTS, SYSTEMS OR APPARATUS
- G02B27/00—Optical systems or apparatus not provided for by any of the groups G02B1/00 - G02B26/00, G02B30/00
- G02B27/01—Head-up displays
- G02B27/017—Head mounted
- G02B27/0172—Head mounted characterised by optical features
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/543—Immunoassay; Biospecific binding assay; Materials therefor with an insoluble carrier for immobilising immunochemicals
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/543—Immunoassay; Biospecific binding assay; Materials therefor with an insoluble carrier for immobilising immunochemicals
- G01N33/54313—Immunoassay; Biospecific binding assay; Materials therefor with an insoluble carrier for immobilising immunochemicals the carrier being characterised by its particulate form
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/543—Immunoassay; Biospecific binding assay; Materials therefor with an insoluble carrier for immobilising immunochemicals
- G01N33/54353—Immunoassay; Biospecific binding assay; Materials therefor with an insoluble carrier for immobilising immunochemicals with ligand attached to the carrier via a chemical coupling agent
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/564—Immunoassay; Biospecific binding assay; Materials therefor for pre-existing immune complex or autoimmune disease, i.e. systemic lupus erythematosus, rheumatoid arthritis, multiple sclerosis, rheumatoid factors or complement components C1-C9
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/569—Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
- G01N33/56983—Viruses
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6803—General methods of protein analysis not limited to specific proteins or families of proteins
- G01N33/6845—Methods of identifying protein-protein interactions in protein mixtures
-
- G—PHYSICS
- G02—OPTICS
- G02B—OPTICAL ELEMENTS, SYSTEMS OR APPARATUS
- G02B27/00—Optical systems or apparatus not provided for by any of the groups G02B1/00 - G02B26/00, G02B30/00
- G02B27/0081—Optical systems or apparatus not provided for by any of the groups G02B1/00 - G02B26/00, G02B30/00 with means for altering, e.g. enlarging, the entrance or exit pupil
-
- G—PHYSICS
- G02—OPTICS
- G02B—OPTICAL ELEMENTS, SYSTEMS OR APPARATUS
- G02B27/00—Optical systems or apparatus not provided for by any of the groups G02B1/00 - G02B26/00, G02B30/00
- G02B27/42—Diffraction optics, i.e. systems including a diffractive element being designed for providing a diffractive effect
- G02B27/4272—Diffraction optics, i.e. systems including a diffractive element being designed for providing a diffractive effect having plural diffractive elements positioned sequentially along the optical path
-
- G—PHYSICS
- G02—OPTICS
- G02B—OPTICAL ELEMENTS, SYSTEMS OR APPARATUS
- G02B5/00—Optical elements other than lenses
- G02B5/18—Diffraction gratings
- G02B5/1814—Diffraction gratings structurally combined with one or more further optical elements, e.g. lenses, mirrors, prisms or other diffraction gratings
-
- G—PHYSICS
- G02—OPTICS
- G02B—OPTICAL ELEMENTS, SYSTEMS OR APPARATUS
- G02B6/00—Light guides; Structural details of arrangements comprising light guides and other optical elements, e.g. couplings
- G02B6/0001—Light guides; Structural details of arrangements comprising light guides and other optical elements, e.g. couplings specially adapted for lighting devices or systems
- G02B6/0011—Light guides; Structural details of arrangements comprising light guides and other optical elements, e.g. couplings specially adapted for lighting devices or systems the light guides being planar or of plate-like form
- G02B6/0013—Means for improving the coupling-in of light from the light source into the light guide
- G02B6/0015—Means for improving the coupling-in of light from the light source into the light guide provided on the surface of the light guide or in the bulk of it
- G02B6/0016—Grooves, prisms, gratings, scattering particles or rough surfaces
-
- G—PHYSICS
- G02—OPTICS
- G02B—OPTICAL ELEMENTS, SYSTEMS OR APPARATUS
- G02B6/00—Light guides; Structural details of arrangements comprising light guides and other optical elements, e.g. couplings
- G02B6/0001—Light guides; Structural details of arrangements comprising light guides and other optical elements, e.g. couplings specially adapted for lighting devices or systems
- G02B6/0011—Light guides; Structural details of arrangements comprising light guides and other optical elements, e.g. couplings specially adapted for lighting devices or systems the light guides being planar or of plate-like form
- G02B6/0033—Means for improving the coupling-out of light from the light guide
- G02B6/0035—Means for improving the coupling-out of light from the light guide provided on the surface of the light guide or in the bulk of it
- G02B6/0038—Linear indentations or grooves, e.g. arc-shaped grooves or meandering grooves, extending over the full length or width of the light guide
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T19/00—Manipulating 3D models or images for computer graphics
- G06T19/006—Mixed reality
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2333/00—Assays involving biological materials from specific organisms or of a specific nature
- G01N2333/005—Assays involving biological materials from specific organisms or of a specific nature from viruses
- G01N2333/08—RNA viruses
- G01N2333/18—Togaviridae; Flaviviridae
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2333/00—Assays involving biological materials from specific organisms or of a specific nature
- G01N2333/005—Assays involving biological materials from specific organisms or of a specific nature from viruses
- G01N2333/08—RNA viruses
- G01N2333/18—Togaviridae; Flaviviridae
- G01N2333/183—Flaviviridae, e.g. pestivirus, mucosal disease virus, bovine viral diarrhoea virus, classical swine fever virus (hog cholera virus) or border disease virus
- G01N2333/185—Flaviviruses or Group B arboviruses, e.g. yellow fever virus, japanese encephalitis, tick-borne encephalitis, dengue
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2469/00—Immunoassays for the detection of microorganisms
- G01N2469/20—Detection of antibodies in sample from host which are directed against antigens from microorganisms
-
- G—PHYSICS
- G02—OPTICS
- G02B—OPTICAL ELEMENTS, SYSTEMS OR APPARATUS
- G02B27/00—Optical systems or apparatus not provided for by any of the groups G02B1/00 - G02B26/00, G02B30/00
- G02B27/01—Head-up displays
- G02B27/0101—Head-up displays characterised by optical features
- G02B2027/0123—Head-up displays characterised by optical features comprising devices increasing the field of view
- G02B2027/0125—Field-of-view increase by wavefront division
-
- G—PHYSICS
- G02—OPTICS
- G02B—OPTICAL ELEMENTS, SYSTEMS OR APPARATUS
- G02B27/00—Optical systems or apparatus not provided for by any of the groups G02B1/00 - G02B26/00, G02B30/00
- G02B27/01—Head-up displays
- G02B27/017—Head mounted
- G02B27/0172—Head mounted characterised by optical features
- G02B2027/0174—Head mounted characterised by optical features holographic
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Immunology (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Molecular Biology (AREA)
- Hematology (AREA)
- Chemical & Material Sciences (AREA)
- Biomedical Technology (AREA)
- Urology & Nephrology (AREA)
- General Physics & Mathematics (AREA)
- Pathology (AREA)
- Microbiology (AREA)
- Cell Biology (AREA)
- Biotechnology (AREA)
- Food Science & Technology (AREA)
- Medicinal Chemistry (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Optics & Photonics (AREA)
- Virology (AREA)
- Rehabilitation Therapy (AREA)
- Bioinformatics & Computational Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Rheumatology (AREA)
- Tropical Medicine & Parasitology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Engineering & Computer Science (AREA)
- Computer Graphics (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Peptides Or Proteins (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Materials By The Use Of Chemical Reactions (AREA)
- Immobilizing And Processing Of Enzymes And Microorganisms (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
본 발명은 병원체의 조기 검출, 병인체의 정확한 확인 및 개선된 질병 감시를 위한 키트 및 분석 방법을 제공한다. 더욱 구체적으로, 본 발명은 감염된 환자의 생물학적 유체 중의 다양한 감염성 병원체에 대한 항체의 신속하고 동시적인 검출을 이끄는 면역분석을 기술한다. 이러한 면역분석은 AGT 효소의 기질로 미리 코팅된 식별가능한 고체 지지체(예: 형광 마이크로구) 상에 AGT 효소 및 바이러스 항원을 포함하는 융합 단백질을 공유적이고 지향적으로 커플링시키는 것을 포함한다. 이러한 커플링은 AGT 효소의 기질에 대한 AGT 효소의 비가역적 반응에 의해 중재된다. 이렇게 수득된 항원-커플링된 마이크로구는, 표준 아민 커플링 공정에 따라 생성된 항원-커플링된 마이크로구에 비해, 특이적 항체의 포획을 증진시킨다. 본 발명의 방법은 다중 능력을 갖고, 생물학적 샘플의 양을 최소화하며, 종래의 ELISA 또는 방사선-면역침전 분석에 비해 표적 항체에 대한 민감도 및 특이성을 개선한다.
Description
세균, 바이러스(예: 바이러스 출혈열(VHFs)) 및 기생충 등의 병원성 작용물질에 의해 유발된 감염성 질환은 질병의 중증도, 높은 치사율, 특정 매개물의 인간간 전염성 및 이들 대부분에 대한 효과적인 치료의 결여 때문에 중요한 공중 건강 문제를 갖는다.
전염병의 구제는, 시기적절하게 적합한 규정을 확정하고 실행하기 위해, 매개물의 신속한 검출 및 정확한 확인에 결정적으로 의존한다. 이러한 맥락에서, 발생의 조기 검출, 병인체의 정확한 확인 및 개선된 질병 감시를 위한 수단을 생산하고 유효화 하는 것이 필수적이다.
이러한 점에서, 체액 중의 항체의 검출은 바이러스 유발된 질환, 감염성 생물에 의해 유발된 기타 질환 및 자가면역 질환의 진단 및 암의 검출에 중요한 부분을 구성한다. 사실, 특정의 항체는, 이들의 존재가 병원체의 발생과 관련이 있는 것으로 알려져 있으므로, 진단시 마커로서 사용할 수 있고 예후 및 치료를 가능하게 한다. 이는 특히 바이러스 항원을 전적으로 표적화하는 항체에 해당한다.
항체의 존재를 검출하는 최근의 방법은 면역형광 현미경법, 화학발광 분석, 웨스턴 블롯팅, 방사성 면역-침전 분석(RIP) 및 ELISA와 같은 다양한 기술을 포함한다. 수개의 항체를 동시에 병행 검출하는 것은, 캘리브레이터 및 항체가 동일 조건 하에서 분석되기 때문에, 각각의 분석들, 예를 들어, ELISA 간에 존재하는 매트릭스 효과를 최소화하는데 특히 유용하다; 따라서, 이는 동일 샘플 내에 존재하는 다수의 항체를 측정하기 위한 비교 결과를 제공할 것이다. 한 가지 이러한 분석은 비드에 결합된 항원을 사용하는 루미넥스 다중 분석이다(Pickering et al., Clinical and Diagnostic Laboratory Immunology 9: 872-876(2002)).
그러나, 병원체와 관련된 항체의 직접적 확인을 복잡하게 하는 것은, 일반적인 혈청은 다량의 천연 항체를 포함하고 이들 항체는 복잡한 염색 패턴으로 그들 자신을 나타낸다는 것이다(Avrameas S. Immunol. Today 1991). 이들 천연 항체의 존재는 "자가-면역 노이즈", 즉 천연 발생 자가항체의 복잡한 배경으로부터 질병-관련 항체의 구별을 복잡하게 할 수 있다. 문헌(Anderson et al., Methods Mol. Biol. 723:227-238(2011))에서 서술한 바와 같이, 교차(cross-talk) 및 간섭은 다중 분석과의 관련성이 있다.
다중 분석에서 비드에 직접 인간 항체의 결합은 또한 문제로서 보고되어 있다(Tainsky et al., Biomarker Insights 2:261-267(2007); Waterboer et al., J. Immunol Methods 309:200-204(2006)).
더욱이, 포지티브 샘플과 대조군 샘플 사이의 낮은 차이는 다중 분석의 유용성을 제한할 수 있다(Burbelo et al., Exp. Rev Vaccines, 9:567-578(2010)).
또 다른 문제는 ELISA 및 다중 분석이 동일한 결과를 제공할 필요가 없다는 것이다. 예를 들면, 픽커링 등(Pickering et al., 2002)은, 다양한 바이러스 및 세균 항원에 대한 보호 항체를 측정할 경우, 2개 분석 사이의 다수의 모순을 지적했다. 이는 항원이 기질에 부착하는 방법과 관련한 항원성의 변화를 반영할 수 있다. 문헌(Ambrosino et al., Malaria Journal 9:317(2010). Similarly, Cham et al., Malaria Journal 7:108(2008))은 일부 샘플이 ELISA 및 비드-기반 분석 측정치 사이에 현저한 차이를 나타냈음을 보고했고, 이중 일부는 보다 높은 ELISA 측정치를 가졌다. 이는, 단백질이 표면 또는 구에 결합되는 경우, 재조합 단백질의 상이한 부분이 항체에 의해 접근가능하다는 사실에 기인할 수 있다(Id.)
상업적 적용(즉, 키트)을 위한 충분한 양의 항원의 제조가 또한 필요할 수 있다(Burbelo et al., Exp. Rev Vaccines, 9:567-578(2010)).
앞서 살펴본 바와 같이, 항체-발생 질병의 분자적 진단을 위한 대용량처리, 비용-효과 및 정확성에 추가의 개선을 제공할 수 있는 취급가능한 시스템 및 방법이 필요하다. 본 발명은 이러한 요구 및 기타 요구를 충족시킨다.
본 발명은 항원에 대한 지향 항원 커플링 공정을 사용하여 보다 높은 민감도 및 특이성을 갖는 생물학적 샘플에서 다중 항원을 동시 스크리닝하는 것을 가능하게 한다. 본 발명자들은 생물학적 유체에서 다양한 질병, 특히 아르보바이러스 질환 및 VHFs에 의해 생성되는 수개의 항체를 신속하고 동시에 검출하는 면역분석을 개발하고 입증하였다.
도 1은 키메라 AGT-항원 단백질의 기질-코팅된 마이크로구에 대한 지향적(oriented) 커플링을 나타낸다. 커플링의 제1 단계는 AGT 기질 BG-PEG-NH2를 아민 커플링에 의해 활성화된 마이크로구에 커플링시키는 것으로 이루어진다. 제2 단계는 기질-코팅된 마이크로구를 AGT(예를 들어, SNAP 돌연변이체)를 포함하는 융합 단백질과 접촉시키는 것으로 이루어지며, 상기 효소를 이의 BG-PEG-NH2 기질, 즉 마이크로구에 공유적으로 부착시키기 위한 것이다.
도 2는 항-SNAP 항체에 의한 키메라 SNAP-바이러스 항원 단백질(SNAP-DV1.EDIII, SNAP-DV2.EDIII, SNAP.DV3.EDIII, SNAP.DV4.EDIII, SNAP-WNV.EDIII, SNAP-YF.EDIII, SNAP-JE.EDIII, SNAP-ZIKA.EDIII)의 커플링 효율을 도시한다.
도 3은 hAGT 단백질의 기질을 통해(본 발명의 커플링) 또는 표준 아민 커플링 공정, 예를 들어, Bio-Plex 아민 커플링 키트(BIORAD)를 통해 커플링된 마이크로구에 접합된 키메라 SNAP-DV2.EDIII 단백질에 대한 정제된 모노클로날 항-DV2 항체의 검출을 위한 면역분석 실험의 민감도를 비교한다.
도 4는 마이크로구에 접합된 키메라 SNAP-DV1.EDIII 단백질에 대한 정제된 모노클로날 항-DV1 항체의 검출을 위해 일중(singleplex) 포맷으로 수행되거나 마이크로구에 커플링된 다른 키메라 SNAP-바이러스 Ags 단백질(SNAP-DV2.EDIII, SNAP.DV3.EDIII, SNAP.DV4.EDIII, SNAP-WNV.EDIII, SNAP-YF.EDIII, SNAP-JE.EDIII, SNAP-TBE.EDIII)과 함께 다중 포맷으로 수행된 면역분석 실험의 민감도를 비교한다.
도 5는 마이크로구에 커플링된 키메라 SNAP-바이러스 Ags 단백질(SNAP-DV1.EDIII, SNAP-DV2.EDIII, SNAP.DV3.EDIII, SNAP.DV4.EDIII, SNAP-WNV.EDIII, SNAP-YF.EDIII, SNAP-JE.EDIII, SNAP-TBE.EDIII)에 대한 정제된 모노클로날 항-WNV 항체 희석물의 검출을 위한 다중 면역분석 실험의 반응성 및 특이성을 도시한다.
도 6은, 마이크로구에 커플링된 키메라 SNAP-바이러스 Ags 단백질(SNAP-DV1.EDIII, SNAP-DV2.EDIII, SNAP.DV3.EDIII, SNAP.DV4.EDIII, SNAP-WNV.EDIII, SNAP-YF.EDIII, SNAP-JE.EDIII, SNAP-WSL.EDIII, SNAP-ROCIO.EDIII, SNAP-MVE.EDIII, SNAP-SLE.EDIII, SNAP-ZIKA.EDIII)에 대한 다중 면역분석으로, DV3에 대한 마우스 폴리클로날 혈청에서 항-DV3 IgG 검출의 반응성 및 특이성(A) 및 YF에 대한 마우스 폴리클로날 혈청에서 항-YF IgG 검출의 반응성 및 특이성(B)을 도시한다.
도 7은, 마이크로구에 커플링된 키메라 SNAP-바이러스 Ags 단백질(SNAP-DV1.EDIII, SNAP-DV2.EDIII, SNAP.DV3.EDIII, SNAP.DV4.EDIII, SNAP-WNV.EDIII, SNAP-YF.EDIII, SNAP-JE.EDIII, SNAP-WSL.EDIII, SNAP-ROCIO.EDIII, SNAP-MVE.EDIII, SNAP-SLE.EDIII, SNAP-ZIKA.EDIII, SNAP-TBE.EDIII)에 대한 다중 면역분석으로, 인간 환자의 DV1-감염된 혈청에서 항-DV1 IgM 검출의 반응성 및 특이성(A) 및 항-DV1 IgG 검출의 반응성 및 특이성(B)을 도시한다.
도 8은 pDeSNAPuniv 카세트의 구조를 도시한다.
도 9는 pDeSNAPuniv/SBV.N 카세트의 구조를 도시한다.
도 10A는 Cd2+로 10일 동안 유도되거나 (+) 비유도된 (-) S2/SNAP-SBV.N 세포의 상등액에 대해 수행된 면역블롯 분석을 도시한다. 분비되는 키메라 단백질 SNAP-SBV.N(이론적 MW 50 kDa)을 항-Histag 항체를 사용하여 소정량의 고도로 정제된 키메라 단백질 SNAP-TOS.N(이론적 MW 49 kDa)과 비교하여 검출하였다. 도 10B는 10일 동안 유도된 S2/SNAP+SBV.N 세포로부터 분비되는 SNAP+SBV.N 단백질의 최종 정제 단계에 상응하는 크기-배제 크로마토그래피 컬럼의 각 분획물에 대한 단백질의 직접 가시화(PAGE-SDS의 코마시 블루 염색)을 도시한다.
도 11은 본 발명의 항원-코팅된 마이크로구를 포함하는 디바이스의 일예를 도시한다.
도 12A 내지 12F는 SARS 바이러스 N 유전자를 함유하는 SNAP 작제물의 코딩 뉴클레오타이드(서열번호 154) 및 아미노산 서열(서열번호 155)를 나타낸다.
도 13A 내지 13D는 SARS 바이러스 S 유전자 수용체 결합 도메인을 함유하는 SNAP 작제물의 코딩 뉴클레오타이드(서열번호 156) 및 아미노산 서열(서열번호 157)을 나타낸다.
도 14A 내지 14D는 인간 코로나바이러스 N 유전자를 함유하는 SNAP 작제물의 코딩 뉴클레오타이드(서열번호 158) 및 아미노산 서열(서열번호 159)을 나타낸다.
도 15A 내지 15G는 인간 코로나바이러스 S1 유전자를 함유하는 SNAP 작제물의 코딩 뉴클레오타이드(서열번호 160) 및 아미노산 서열(서열번호 161)을 나타낸다.
도 16A 내지 16D는 인간 코로나바이러스 S1 유전자 수용체 결합 도메인(RBD)를 함유하는 SNAP 작제물의 코딩 뉴클레오타이드(서열번호 162) 및 아미노산 서열(서열번호 163)을 나타낸다.
도 17A 내지 17D는 렙토스피라증의 LruA 유전자를 함유하는 SNAP 작제물의 코딩 뉴클레오티드(서열번호 164) 및 아미노산 서열(서열번호 165)을 나타낸다.
도 18A 내지 18D는 렙토스피라증의 LruB 유전자를 함유하는 SNAP 작제물의 코딩 뉴클레오타이드(서열번호 166) 및 아미노산 서열(서열번호 167)을 나타낸다.
도 19A 내지 19D는 렙토스피라증의 LipL32 유전자를 함유하는 SNAP 작제물의 코딩 뉴클레오타이드(서열번호 168) 및 아미노산 서열(서열번호 169)을 나타낸다.
도 20A 내지 20F는 E형 간염의 C 유전자를 함유하는 SNAP 작제물의 코딩 뉴클레오타이드(서열번호 170) 및 아미노산 서열(서열번호 171)을 나타낸다.
도 21A 내지 21E는 E형 간염의 C 유전자의 코어 서열을 함유하는 SNAP 작제물의 코딩 뉴클레오타이드(서열번호 172) 및 아미노산 서열(서열번호 173)을 나타낸다.
도 22A 내지 22C는 C형 간염의 C 유전자를 함유하는 SNAP 작제물의 코딩 뉴클레오타이드(서열번호 174) 및 아미노산 서열(서열번호 175)을 나타낸다.
도 23A 내지 23D는 C형 간염의 C 유전자의 코어 서열을 함유하는 SNAP 작제물의 코딩 뉴클레오타이드(서열번호 176) 및 아미노산 서열(서열번호 177)을 나타낸다.
도 24A 내지 24C는 쉬말렌베르그 바이러스로부터 NS 단백질을 인코딩하는 서열을 함유하는 SNAP 작제물의 코딩 뉴클레오타이드(서열번호 178) 및 아미노산 서열(서열번호 179)을 나타낸다.
도 25A 및 25B는 본 발명의 키트에 포함되는 항원-커플링된 마이크로구의 유리한 조합을 나타낸다.
도 2는 항-SNAP 항체에 의한 키메라 SNAP-바이러스 항원 단백질(SNAP-DV1.EDIII, SNAP-DV2.EDIII, SNAP.DV3.EDIII, SNAP.DV4.EDIII, SNAP-WNV.EDIII, SNAP-YF.EDIII, SNAP-JE.EDIII, SNAP-ZIKA.EDIII)의 커플링 효율을 도시한다.
도 3은 hAGT 단백질의 기질을 통해(본 발명의 커플링) 또는 표준 아민 커플링 공정, 예를 들어, Bio-Plex 아민 커플링 키트(BIORAD)를 통해 커플링된 마이크로구에 접합된 키메라 SNAP-DV2.EDIII 단백질에 대한 정제된 모노클로날 항-DV2 항체의 검출을 위한 면역분석 실험의 민감도를 비교한다.
도 4는 마이크로구에 접합된 키메라 SNAP-DV1.EDIII 단백질에 대한 정제된 모노클로날 항-DV1 항체의 검출을 위해 일중(singleplex) 포맷으로 수행되거나 마이크로구에 커플링된 다른 키메라 SNAP-바이러스 Ags 단백질(SNAP-DV2.EDIII, SNAP.DV3.EDIII, SNAP.DV4.EDIII, SNAP-WNV.EDIII, SNAP-YF.EDIII, SNAP-JE.EDIII, SNAP-TBE.EDIII)과 함께 다중 포맷으로 수행된 면역분석 실험의 민감도를 비교한다.
도 5는 마이크로구에 커플링된 키메라 SNAP-바이러스 Ags 단백질(SNAP-DV1.EDIII, SNAP-DV2.EDIII, SNAP.DV3.EDIII, SNAP.DV4.EDIII, SNAP-WNV.EDIII, SNAP-YF.EDIII, SNAP-JE.EDIII, SNAP-TBE.EDIII)에 대한 정제된 모노클로날 항-WNV 항체 희석물의 검출을 위한 다중 면역분석 실험의 반응성 및 특이성을 도시한다.
도 6은, 마이크로구에 커플링된 키메라 SNAP-바이러스 Ags 단백질(SNAP-DV1.EDIII, SNAP-DV2.EDIII, SNAP.DV3.EDIII, SNAP.DV4.EDIII, SNAP-WNV.EDIII, SNAP-YF.EDIII, SNAP-JE.EDIII, SNAP-WSL.EDIII, SNAP-ROCIO.EDIII, SNAP-MVE.EDIII, SNAP-SLE.EDIII, SNAP-ZIKA.EDIII)에 대한 다중 면역분석으로, DV3에 대한 마우스 폴리클로날 혈청에서 항-DV3 IgG 검출의 반응성 및 특이성(A) 및 YF에 대한 마우스 폴리클로날 혈청에서 항-YF IgG 검출의 반응성 및 특이성(B)을 도시한다.
도 7은, 마이크로구에 커플링된 키메라 SNAP-바이러스 Ags 단백질(SNAP-DV1.EDIII, SNAP-DV2.EDIII, SNAP.DV3.EDIII, SNAP.DV4.EDIII, SNAP-WNV.EDIII, SNAP-YF.EDIII, SNAP-JE.EDIII, SNAP-WSL.EDIII, SNAP-ROCIO.EDIII, SNAP-MVE.EDIII, SNAP-SLE.EDIII, SNAP-ZIKA.EDIII, SNAP-TBE.EDIII)에 대한 다중 면역분석으로, 인간 환자의 DV1-감염된 혈청에서 항-DV1 IgM 검출의 반응성 및 특이성(A) 및 항-DV1 IgG 검출의 반응성 및 특이성(B)을 도시한다.
도 8은 pDeSNAPuniv 카세트의 구조를 도시한다.
도 9는 pDeSNAPuniv/SBV.N 카세트의 구조를 도시한다.
도 10A는 Cd2+로 10일 동안 유도되거나 (+) 비유도된 (-) S2/SNAP-SBV.N 세포의 상등액에 대해 수행된 면역블롯 분석을 도시한다. 분비되는 키메라 단백질 SNAP-SBV.N(이론적 MW 50 kDa)을 항-Histag 항체를 사용하여 소정량의 고도로 정제된 키메라 단백질 SNAP-TOS.N(이론적 MW 49 kDa)과 비교하여 검출하였다. 도 10B는 10일 동안 유도된 S2/SNAP+SBV.N 세포로부터 분비되는 SNAP+SBV.N 단백질의 최종 정제 단계에 상응하는 크기-배제 크로마토그래피 컬럼의 각 분획물에 대한 단백질의 직접 가시화(PAGE-SDS의 코마시 블루 염색)을 도시한다.
도 11은 본 발명의 항원-코팅된 마이크로구를 포함하는 디바이스의 일예를 도시한다.
도 12A 내지 12F는 SARS 바이러스 N 유전자를 함유하는 SNAP 작제물의 코딩 뉴클레오타이드(서열번호 154) 및 아미노산 서열(서열번호 155)를 나타낸다.
도 13A 내지 13D는 SARS 바이러스 S 유전자 수용체 결합 도메인을 함유하는 SNAP 작제물의 코딩 뉴클레오타이드(서열번호 156) 및 아미노산 서열(서열번호 157)을 나타낸다.
도 14A 내지 14D는 인간 코로나바이러스 N 유전자를 함유하는 SNAP 작제물의 코딩 뉴클레오타이드(서열번호 158) 및 아미노산 서열(서열번호 159)을 나타낸다.
도 15A 내지 15G는 인간 코로나바이러스 S1 유전자를 함유하는 SNAP 작제물의 코딩 뉴클레오타이드(서열번호 160) 및 아미노산 서열(서열번호 161)을 나타낸다.
도 16A 내지 16D는 인간 코로나바이러스 S1 유전자 수용체 결합 도메인(RBD)를 함유하는 SNAP 작제물의 코딩 뉴클레오타이드(서열번호 162) 및 아미노산 서열(서열번호 163)을 나타낸다.
도 17A 내지 17D는 렙토스피라증의 LruA 유전자를 함유하는 SNAP 작제물의 코딩 뉴클레오티드(서열번호 164) 및 아미노산 서열(서열번호 165)을 나타낸다.
도 18A 내지 18D는 렙토스피라증의 LruB 유전자를 함유하는 SNAP 작제물의 코딩 뉴클레오타이드(서열번호 166) 및 아미노산 서열(서열번호 167)을 나타낸다.
도 19A 내지 19D는 렙토스피라증의 LipL32 유전자를 함유하는 SNAP 작제물의 코딩 뉴클레오타이드(서열번호 168) 및 아미노산 서열(서열번호 169)을 나타낸다.
도 20A 내지 20F는 E형 간염의 C 유전자를 함유하는 SNAP 작제물의 코딩 뉴클레오타이드(서열번호 170) 및 아미노산 서열(서열번호 171)을 나타낸다.
도 21A 내지 21E는 E형 간염의 C 유전자의 코어 서열을 함유하는 SNAP 작제물의 코딩 뉴클레오타이드(서열번호 172) 및 아미노산 서열(서열번호 173)을 나타낸다.
도 22A 내지 22C는 C형 간염의 C 유전자를 함유하는 SNAP 작제물의 코딩 뉴클레오타이드(서열번호 174) 및 아미노산 서열(서열번호 175)을 나타낸다.
도 23A 내지 23D는 C형 간염의 C 유전자의 코어 서열을 함유하는 SNAP 작제물의 코딩 뉴클레오타이드(서열번호 176) 및 아미노산 서열(서열번호 177)을 나타낸다.
도 24A 내지 24C는 쉬말렌베르그 바이러스로부터 NS 단백질을 인코딩하는 서열을 함유하는 SNAP 작제물의 코딩 뉴클레오타이드(서열번호 178) 및 아미노산 서열(서열번호 179)을 나타낸다.
도 25A 및 25B는 본 발명의 키트에 포함되는 항원-커플링된 마이크로구의 유리한 조합을 나타낸다.
최소 항원을 사용하여 소량의 항체를 검출하기 위한 최적 민감도 및 특이성를 달성하기 위해, 지향적 항원 커플링 공정이 개발되었다. 이러한 지향적 항원 커플링 공정은 AGT 효소와 효소의 활성 부위 시스테인에 벤질 그룹을 전달함으로써 AGT 효소와 비가역적으로 반용하는 이의 기질인 O6-벤질구아닌 유도체 간의 공유적 상호작용에 기초한다. 따라서, 다수의 표적 항원이 AGT 효소 부분에 융합될 수 있으며, 그 결과 생물학적 샘플 중에 존재하는 항체에 대한 포획 시약으로 사용될 수 있는 상이한 키메라 융합 단백질(이하 [AGT- 항원] 융합 단백질이라 칭함)을 생성한다. 본 발명자들은 이들 융합 단백질을 특이적 AGT-기질 상호작용에 의해 고체 지지체에 결합시키는 경우 이러한 항체 포획이 예상치 않게 증진된다는 것을 밝혔다.
실시예에서 기술되는 바와 같이, 본 발명자들은 지향적 항원 커플링 공정으로 다수의 상이한 항원-코팅된 형광 마이크로구를 생성하였다. 16개의 정제된 키메라 [AGT-항원] 융합 단백질과 커플링시킨 16개의 상이한 마이크로구 세트를 뎅기 혈청형 1 내지 4, 웨스트 나일, 황열, 일본 뇌염, 진드기-매개 뇌염, 세이트-루이스 뇌염, 머레이 계곡 뇌염, 베셀스브론, 지카, 리시오(Ricio), 우수투(Usutu), 리프트 계곡 열 및 치쿤구니아(chikungunya) 바이러스의 상이한 단백질에 대해 특이적인 16개의 혈청 항체의 적정에 사용하였다. 예상치 않게, 이들 16개의 상이한 마이크로구 세트를 검출의 민감도 및 특이성에 영향을 끼치지 않으면서 단일 샘플에서 혼합하였다(참조: 도 5). 이러한 시스템의 생성은, 한 세트의 항원-커플링된 마이크로구(약 1.25 x 106개 마이크로구)(이러한 세트는 1000개의 개별 분석을 수행하는데 충분하다)를 생성하는데 단지 매우 소량의 재조합 항원(< 50 ㎍)이 필요하므로, 매우 시간-효과적이고 비용-효과적이다.
결과적으로, 본 발명은, 키메라 융합 단백질, 즉 AGT-항원에 커플링되는 AGT 기질에 대한 고체 지지체, 바람직하게는 표지된 마이크로입자 (microparticle)의 지향적 항원 커플링에 기반한 다중 분석을 수행하는 방법 및 키트를 포함한다. 이러한 지향적 커플링은 생물학적 샘플에서 항원과 항체의 증가된 상호작용을 가능하게 한다. AGT-기질로 코팅된 고체 지지체는 이들 면역분석에서 AGT 효소의 효소적 활성을 통해 AGT-항원과 커플링될 수 있다.
6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT, 또는 ATase 또는 MGMT로서 공지되어 있고, 이하 "AGT"로서 지칭됨)는 IUBMB 효소 명명법에서 EC 2.1.1.63으로 번호가 부여되어 있다. 이는 세포에서의 기능이 알킬화된 DNA를 수복하는 것인 207개 아미노산 잔기의 6-알킬구아닌-DNA-알킬트랜스퍼라제 DNA 수복 효소이다. 보다 정확하게는, AGT는 SN2 반응 중의 메틸 그룹을 반응성 시스테인 잔기(Cys 145)로 비가역적으로 전이시킴으로써 DNA에서 O6-메틸화된 구아닌에 작용한다. 최근, 다수의 O6-벤질구아닌 유도체는 이들의 벤질 그룹을 AGT 효소의 활성 부위 시스테인으로 전이시킴으로써 상기 효소와 비가역적으로 반응하는 것으로 밝혀졌다(참조: Damoiseaux et al., ChemBiochem., 2001, WO 2004/031404 및 WO 2005/085470). 따라서, AGT-항원은 이러한 효소적 반응을 통해 AGT 기질에 커플링될 수 있다.
AGT-항원에 커플링된 고체 지지체는 면역글로불린을 함유하는 생물학적 샘플과 함께 항온처리할 수 있다. 면역글로불린이 고체 지지체에 결합된 후, 면역글로불린에 효과적으로 결합한 고체 지지체의 검출이 달성될 수 있다. 면역글로불린-코팅된 고체 지지체(들)의 동정은 환자를 감염시키는 병원체의 진단을 가능하게 한다(각각의 고체 지지체는 정의된 병원성 항원과 일치하기 때문임). 이러한 검출 단계는 임의의 통상의 수단에 의해, 예를 들면, 표지된 검출 항체를 사용함으로써 및 고체 지지체의 성질을 동정함으로써 수행된다.
유리하게는, 본 발명의 방법은 발병된 환자에서 항체의 존재의 검출만을 포함하지만, 이들 항체의 동일성에 대한 지식이 요구되지 않는다.
다중 표적 항체를 검출하는 방법
본 발명은 생물학적 샘플에서 적어도 2개의 표적 항체를 검출하는 방법에 관한 것이다. 본 발명은 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 20, 25, 30, 40, 50, 100개 등의 상이한 표적 항체의 존재 또는 부재를 검출하는 것을 포함한다. 따라서, 본 발명은 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 20, 25, 30, 40, 50, 100개 등의 고체 지지체를 포함하는 방법, 및 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 20, 25, 30, 40, 50, 100개 등의 상이한 에피토프를 포함하는 방법을 포함한다. 상기 방법은, 생물학적 샘플의 첨가 전에 함께 혼합된, 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 20, 25, 30, 40, 50, 100개 등의 고체 지지체를 포함할 수 있다. 에피토프는 표적 항체에 의해 인지될 수 있다.
한 가지 실시형태에서, 상기 방법은
(a) 적어도 2개의 고체 지지체의 혼합물을 생물학적 샘플과 접촉시키는 단계로서, 여기서 상기 고체 지지체 중의 적어도 하나는 AGT 기질에 공유 커플링된 제1 AGT-항원 융합 단백질을 포함하고, 상기 고체 지지체 중의 적어도 하나는 AGT 기질에 공유 결합된 제2-AGT-항원 융합 단백질을 포함하는 단계,
(b) 제1 AGT-항원에 대한 항체의 결합의 존재 또는 부재를 검출하는 단계; 및
(c) 제2 AGT-항원에 대한 항체의 결합의 존재 또는 부재를 검출하는 단계를 포함한다.
한 가지 실시형태에서, 상기 방법은
(a) 적어도 10개의 고체 지지체의 혼합물을 생물학적 샘플과 접촉시키는 단계로서,
제1 고체 지지체는 AGT 기질과 공유적으로 커플링 (covalently coupling)된 제1 AGT-항원 융합 단백질을 포함하고,
제2 고체 지지체는 AGT 기질과 공유적으로 커플링된 제2 AGT-항원 융합 단백질을 포함하고,
제3 고체 지지체는 AGT 기질과 공유적으로 커플링된 제3 AGT-항원 융합 단백질을 포함하고,
제4 고체 지지체는 AGT 기질과 공유적으로 커플링된 제4 AGT-항원 융합 단백질을 포함하고,
제5 고체 지지체는 AGT 기질과 공유적으로 커플링된 제5 AGT-항원 융합 단백질을 포함하고,
제6 고체 지지체는 AGT 기질과 공유적으로 커플링된 제6 AGT-항원 융합 단백질을 포함하고,
제7 고체 지지체는 AGT 기질과 공유적으로 커플링된 제7 AGT-항원 융합 단백질을 포함하고,
제8 고체 지지체는 AGT 기질과 공유적으로 커플링된 제8 AGT-항원 융합 단백질을 포함하고,
제9 고체 지지체는 AGT 기질과 공유적으로 커플링된 제9 AGT-항원 융합 단백질을 포함하고,
제10 고체 지지체는 AGT 기질과 공유적으로 커플링된 제10 AGT-항원 융합 단백질을 포함하는 단계, 및
(b) 각각의 AGT-항원에 대한 항체의 결합의 존재 또는 부재를 검출하는 단계를 포함한다.
한 가지 실시형태에서, 상기 방법은
(a) O6-알킬구아닌-DNA 알킬트랜스퍼라제 활성을 갖는 AGT 폴리펩타이드 및 제1 표적 항체에 의해 인지되는 제1 에피토프를 포함하는 제1 융합 단백질에 공유적으로 커플링된 AGT 기질을 포함하는 제1 고체 지지체를 생물학적 샘플과 접촉시키는 단계,
(b) O6-알킬구아닌-DNA 알킬트랜스퍼라제 활성을 갖는 AGT 폴리펩타이드 및 제2 표적 항체에 의해서는 인지되나 상기 제1 표적 항체에 의해서는 인지되지 않는 제2 에피토프를 포함하는 제2 융합 단백질에 공유적으로 커플링된 AGT 기질을 포함하는 제2 고체 지지체를 생물학적 샘플과 접촉시키는 단계, 및
(c) 2개의 표적 항체의 존재 또는 부재를 검출하는 단계를 포함한다.
바람직하게는, 제1 및 제2 등의 고체 지지체는 마이크로구이다. 가장 바람직하게는, 마이크로구는 표지되어 있다. 바람직하게는, 제1 및 제2 고체 지지체는 상이한 표지로 표지되어 있다.
본 발명은 피험자로부터의 생물학적 샘플에 존재하는 적어도 2개의 상이한 표적 항체를 검출하기 위한 시험관내 분석 방법에 관한 것으로서, 상기 방법은
(a) 하기를 포함하는 제1 융합 단백질을 제공하는 단계:
- 제1 표적 항체에 의해 인지되는 제1 에피토프를 포함하는 폴리펩타이드 및
- O6-알킬구아닌-DNA 알킬트랜스퍼라제 활성을 갖는 AGT 폴리펩타이드,
(b) 상기 제1 융합 단백질을 상기 AGT 폴리펩타이드의 기질과 공유적으로 커플링된 제1 고체 지지체와 접촉시키는 단계,
(c) 제1 표적 항체에 의해 인지되는 제1 에피토프와 공유적으로 커플링된 제1 고체 지지체를 수득하는 단계,
(d) 하기를 포함하는 제2 융합 단백질을 제공하는 단계:
- 제2 표적 항체에 의해서는 인지되나 상기 제1 표적 항체에 의해서는 인지되지 않는 제2 에피토프를 포함하는 폴리펩타이드 및
- O6-알킬구아닌-DNA 알킬트랜스퍼라제 활성을 갖는 AGT 폴리펩타이드,
(e) 상기 제2 융합 단백질을 상기 AGT 폴리펩타이드 기질과 공유적으로 커플링된 제2 고체 지지체와 접촉시키는 단계,
(f) 제2 표적 항체에 의해서는 인지되나 상기 제1 표적 항체에 의해서는 인지되지 않는 제2 에피토프와 공유적으로 커플링된 제2 고체 지지체를 수득하는 단계,
(g) 상기 생물학적 샘플을 단계(c) 및 (f)에서 수득된 제1 및 제2 고체 지지체와 접촉시키는 단계, 및
(h) 상기 적어도 2개의 표적 항체의 존재를 검출하는 단계를 포함한다.
하기에서 사용되는 용어 "항체", "융합 단백질", "에피토프", "항원", "AGT 폴리펩타이드", "고체 지지체" 등은 분명히 당해 기술 분야에서 통상적으로는, 즉, 광의적으로 이해되어야 한다. 특히, 이들 용어는 특정한 단일 분자뿐만 아니라 다수의 상기 분자들을 포함한다. 예를 들어, 용어 "고체 지지체"는 다수의 동일한 고체 지지체의 서브세트를 포함하고, 용어 "마이크로입자"는 다수의 동일한 마이크로입자의 서브세트를 포함하고, 용어 "융합 단백질"은 다수의 동일한 단일 단백질 분자를 포함한다. 본 발명과 관련하여, 고체 지지체는 다수의 동일한 융합 단백질(융합 단백질은 AGT 폴리펩타이드와는 별개로 동일한 항원을 포함한다) 및 따라서 동일한 에피토프를 가지므로, 고체 지지체 상에서 검출될 항체가 명확히 식별될 수 있다는 것이 주목할 만하다.
본원에서 사용되는 용어 "융합 단백질"은 단백질을 함유하는 폴리펩타이드 또는 적어도 2개의 폴리펩타이드의 인위적 연결을 통해 형성되는 폴리펩타이드를 의미한다(참조: http://en.wikipedia.org/wiki/peptide). 본 발명의 면역분석에서, 융합 단백질은 AGT 폴리펩타이드 및 하나 이상의 에피토프를 포함하는 항원을 포함한다. 융합 단백질은 융합 유전자의 유전자 조작(http://en.wikipedia.org/wiki/Genetic_engineering)을 통해 수득될 수 있다. 이는 전형적으로 제1 단백질을 인코딩하는 cDNA 서열(참조: http://en.wikipedia.org/wiki/CDNA)로부터 정지 코돈(참조: http://en.wikipedia.org/wiki/Codon)을 제거한 후 결합(참조: http://en.wikipedia.org/wiki/Ligase) 또는 오버랩 연장 PCR(참조: http://en.wikipedia.org/wiki/PCR)을 통해 프레임(참조: http://en.wikipedia.org/wiki/Reading_frame) 내에 제2 단백질의 cDNA 서열을 추가하는 것을 포함한다. 따라서, 이러한 DNA 서열은 단일 단백질로서 세포(참조: http://en.wikipedia.org/wiki/Cell_(biology))에 의해 발현될 것이다(참조: http://en.wikipedia.org/wiki/Protein_expression). 단백질은 최초 단백질 둘다의 전체 서열 또는 단지 일부를 포함하도록 조작될 수 있다. 2개의 실체가 단백질인 경우, 링커(또는 "스페이서") 펩타이드가 추가될 수 있으며, 이것이 단백질이 독립적으로 폴딩하고 예상하는 바와 같이 거동하도록 할 것 같다. 특히, 본 발명의 융합 단백질은 AGT DNA 서열의 N-말단 또는 C-말단 측에 부착되는 에피토프 또는 항원 인코딩 서열과 함께 프레임 내에 AGT 인코딩 서열을 포함하는 벡터를 제공함으로써 수득될 수 있다. 이들 벡터는 유박테리아를 포함하는 원핵생물 숙주, 예를 들어, 이. 콜라이 세균, 또는 진핵생물 숙주, 예를 들어, 효로, 곤충 세포 또는 포유동물 세포에 도입될 수 있으며, 재조합 융합 단백질은 적합한 조건 하에서 생성될 수 있다. 대표적인 작제는 본원의 실시예에서 기술된다.
본원에서 사용되는 용어 "항체"는 모노클로날 항체, 폴리클로날 항체 및 키메라 항체를 포함하고자 한다. 바람직하게는, 본 발명의 면역분석으로 검출될 항체는 질병에 걸린 환자의 생물학적 샘플에 존재하고 상이한 B 세포 공급원으로부터 생성된 폴리클로날 항체이다. 이에, 이들은 병원성 항원에 의해 제시되는 상이한 에피토프를 인지한다(달리, 모노클로날 항체는 단일 세포주로부터 유도되며 동일한 에피토프를 인지한다).
항체(또는 "면역글로불린")은 디설파이드 결합에 의해 서로 연결된 적어도 2개의 중쇄(H) 및 2개의 경쇄(L)를 포함하는 당단백질이다. 각각의 중쇄는 중쇄 가변 영역(또는 도메인)(HCVR 또는 VH로 약칭함) 및 중쇄 불변 영역을 포함한다. 중쇄 불변 영역은 3개의 도메인인 CH1, CH2 및 CH3를 포함한다. 각각의 경쇄는 경쇄 가변 영역(LCVR 또는 VL로 약칭됨) 및 경쇄 불변 영역을 포함한다. 경쇄 불변 영역은 하나의 도메인인 CL을 포함한다. VH 및 VL 영역은, 항원의 에피토프 결합에 주로 관여하며 프레임 영역(FR)이라 불리는 보다 보존된 영역으로 사이에 간격을 둔, "상보성 결정 영역"(CDR)" 또는 "과가변 영역"이라 불리는 과가변성 영역으로 더욱 세분될 수 있다. 각각의 VH 및 VL은 3개의 CDR 및 4개의 FR로 구성되고, 이들은 아미노-말단부터 카복시-말단으로 FR1, CDR1, FR2, CDR2, FR3, CDR3, FR4의 순으로 배열된다. 중쇄 및 경쇄의 가변 영역은 항원과 상호작용하는 결합 도메인을 포함한다. 항체의 불변 영역은 면역계의 다양한 세포(예: 이펙터 세포) 및 전형적 보체계의 제1 성분(Clq)을 포함하는 숙주 조직 또는 인자들에 대한 면역글로불린의 결합을 중개할 수 있다.
항체는 상이한 이소형(즉, IgA, IgD, IgE, IgG 또는 IgM)일 수 있다. IgG 및 IgM 유형 항체 모두 본 발명의 방법으로 검출될 수 있다. 주목할 만한 것으로서, 이들 이소형은 디설파이드 결합으로 연결되는 2개의 동일한 중쇄 및 2개의 동일한 경쇄로 구성된다. 중요하게도, IgM 항체는 다수의 면역글로불린이 주로 펜타머 및 헥사머와 같이 디설파이드 결합으로 함께 공유적으로 연결된 중합체를 형성하므로, 이들은 (이들의 펜타머 형태에서) 약 900 kDa의 분자 매쓰를 갖는다. 각각의 모노머가 2개의 항원 결합 부위를 갖기 때문에, 펜타머 IgM은 10개의 결합 부위를 갖는다. 그러나, 통상적으로, IgM 항체는, 대부분의 항원의 큰 크기가 가까운 부위에 결합하는 것을 방해하기 때문에, 동시에 10개의 항원을 결합할 수 없다. IgM은 중합체성 특성 때문에, 높은 친화력을 갖는다. 상이한 이소형의 항체(예: IgG 또는 IgM)은, 항체 반응이 항원/감염에 대한 초기 또는 후기 반응인지와 같이 항체 반응의 일시적 식별을 가능하게 하는, 동일한 항원으로 검출할 수 있다. 이는 감염 또는 항원에 대한 노출의 타이밍에 관한 정보를 제공할 수 있다.
항체 단편도 또한 본 발명의 방법으로 검출될 수 있다. 이 용어는 Fab, Fab', F(ab')2, scFv, dsFv, ds-scFv, 다이머, 미니바디, 디아바디 및 이의 멀티머 및 이특이적 항체 단편을 포함하고자 한다.
모노클로날 항체가, 예를 들어, 고체 지지체에 결합된 면역글로불린을 검출하기 위해 본 발명의 면역분석에 사용될 수 있다. 본원에서 사용되는 "모노클로날 항체"는 균질한 항체군으로부터 생성되는 항체를 정의한다. 보다 특히, 일 항체군의 개별 항체는 최소한으로 발견될 수 있는 소수의 가능한 천연-발생 돌연변이를 제외하고는 동일하다. 달리, 모노클로날 항체는 단일 세포 클론(예를 들어, 하이브리도마, 균질 항체를 인코딩하는 DNA 분자로 형질감염된 진핵생물 숙주 세포, 균질 항체를 인코딩하는 DNA 분자로 형질감염된 원핵생물 숙주 세포 등)의 성장으로부터 생성되는 균질 항체로 이루어지고, 일반적으로 단지 하나의 부류 및 아부류의 중쇄 및 단지 하나의 유형의 경쇄로 특징지어진다. 모노클로날 항체는 고도로 특이적이며, 단일 항원에 대해 지시된다. 또한, 통상적으로 다양한 결정자에 대해 지시되는 다양한 항체를 포함하는 폴리클로날 항체의 제조와는 반대로, 각각의 모노클로날 항체는 항원의 단일 에피토프에 대해 지시된다.
본원에서 용어 "항원"은 면역계가 이 물질에 대해 항체를 생성하도록 하는 물질을 의미한다. "면역원성" 항원은 단독으로 주사시 적응 면역 반응을 자극할 수 있는 특정 유형의 항원이다. 분자적 수준에서, 항원은 항체의 항원-결합 부위에 "결합"하는 능력으로 특징지어진다.
본 발명과 관련하여, 항체는, 이러한 항체가 항원(또는 에피토프)에 대해 105 M-1 초과, 바람직하게는 106 M-1 초과, 더욱 바람직하게는 107 M-1 초과의 친화성 상수 Ka(이는 역 해리 상수, 즉, 1/Kd이다)를 갖는 경우, 정의된 항원(또는 에피토프)에 "결합"하거나 상기 항원(또는 에피토프)을 "인식"한다고 말한다. 이러한 친화성은, 예를 들어, 평형 투석에 의하거나 형광 퀀칭에 의해 측정될 수 있으며, 이 두 기술은 모두 당해 기술 분야에서 통상적으로 이용된다.
본 발명의 방법은, 예를 들면, 알레르기 항원(allergen)의 검출에서 단백질, 핵산, 항체, 면역 반응, 폴리사카라이드 등의 검출을 위해 기타 기술과 결합할 수 있다.
다중 면역분석에 사용하기 위한 항원
본 발명과 관련하여, 항원 또는 에피토프는 단백질, 지단백질, 폴리사카라이드 및 당단백질을 포함한다. 상기 단백질은 바이러스, 세균, 기생충, 동물 및 진균 단백질, 예를 들어, 알부민, 파상풍 변성독소, 디프테리아 변성독소, 백일해 변성독소, 세균 외막 단백질(수막구균 외막 단백질 포함), RSV-F 단백질, 말라리아 유도된 펩타이드, B-락토글로불린 B, 아프로티니, 오브알부민, 리소자임, 선형 펩타이드, 올리고펩타이드 등을 포함한다. 항원 및 에피토프는 암, 사이토킨, 알레르기 항원 및 에피토프를 포함한다. 항원은 자가면역 질환에 관여하는 항원일 수 있다.
항원은 종양 관련 항원, 예를 들면, 알파페토단백질(AFP, http://en.wikipedia.org/wiki/Alphafetoprotein), 암배 항원(CEA), CA 15-3, CA27-29, CA 125, CA 19-9, 칼레피닌, 전립선 특이적 항원(PSA), MUC-1(http://en.wikipedia.org/wiki/MUC1), 상피 막 단백질(EMA), 상피 종양 항원(ETA), 티로시나제(http://en.wikipedia.org/wiki/Tyrosinase), 흑색종-관련 항원(MAGE), TAA 복합체, SSX2 또는 NERCMSL, ras(http://en.wikipedia.org/wiki/Ras_subfamily), P53, CD34, CD99, CD117, 크로모그라닌, 사이토케라틴, 데스민, 인자 VIII(http://en.wikipedia.org/wiki/Factor_VIII), CD31(http://en.wikipedia.org/wiki/CD31), FL1(http://en.wikipedia.org/wiki/FL1), GFAP, GCDFP-15, HMB-45, hCG, 인히빈, 케라틴, PTPRC(CD45), MART-1, MyoD1, MSA, NSE, PLAP, S100 단백질, SMA, 시냅토피신, 티로글로불린, 갑상선 전사 인자-1, 종양 M2-PK 및 비멘틴일 수 있다.
항원은 암 바이오마커, 예를 들면, 안지오포이에틴-2, sCD40L, EGF, 엔도글린, sFASL, HB-EGF, IGFBP-1, IL-6, IL-8, IL-18, PAI-1, PLGF, TGF-α, TNF-α, uPA, VEGF-A, VEGF-C, VEGF-D, sEGFR, FGF-기본, 폴리스타틴, G-CSF, HGF, sHER-2/neu, sIL-6Rα, 렙틴, 오스테오폰틴, PECAM-1, PDGF-AB/BB, 프로락틴, SCF, sTIE-2, sVEGFR-1 및 sVEGFR-2일 수 있다.
항원은 신장 독성 마커, 예를 들면, 칼빈딘, 클루스테린, GST-π, IL-18, KIM-1, MCP-1, 알부민, B2M, 시스타틴 C, NGAL, 오스테오폰틴 및 TFF3일 수 있다.
항원은 사이토킨, 케모킨 및 성장 인자, 예를 들면, TGF-β1, TGF-β2, TGF-β3, IL-1β IL-1ra, IL-2, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-12(p70), IL-13, IL-15, IL-17, 염기성 FGF, 에오탁신, G-CSF, GM-CSF, IFN-γ, IP-10, MCP-1(MCAF), MIP-1α, MIP-1β, PDGF-BB, RANTES, TNF-α, VEGF, IL-1α, IL-2Rα, IL-3, IL-12(p40), IL-16, IL-18, CTACK, GRO-α, HGF, IFN-α2, LIF, MCP-3, M-CSF, MIF, MIG, β-NGF, SCF, SCGF-β, SDF-1α, TNF-β 및 TRAIL일 수 있다.
상기 항원은 또한 합텐 및 저분자량 분자를 포함하는 다른 부분, 예를 들어, 사카라이드, 올리고사카라이드, 폴리사카라이드, 펩타이드, 뮤신, 독소 및 알레르기 항원(꽃가루, 달걀 흰자)일 수 있다.
상기 항원은 알레르기 항원, 예를 들어, 식품, 풀, 나무, 잡초, 곤충, 곰팡이, 표피 또는 먼지 진드기 알레르기 항원일 수 있다. 항원은 동물, 갑각류, 밀크(참조: http://en.wikipedia.org/wiki/Milk), 대두(참조: http://en.wikipedia.org/wiki/Soy), 난(참조: http://en.wikipedia.org/wiki/Egg_(food)), 밀(참조: http://en.wikipedia.org/wiki/Wheat), 땅콩(참조: http://en.wikipedia.org/wiki/Peanuts), 나무 견과류(참조: http://en.wikipedia.org/wiki/Tree_nuts), 어류(참조: http://en.wikipedia.org/wiki/Fish) 또는 종자 알레르기 항원일 수 있다.
항원은 자가면역 질환에 관여할 수 있고, 바람직하게는 인간 항원이다. 바람직한 항원은 티로글로불린, 갑상선 퍼옥시다제, 류마토이드 인자(IgA, IgG, IgM), 시트룰린화 펩타이드, 히스티딜-tRNA 합성효소(Jo-1), PM-Scl, 보체, 보체 성분 C4c 및 C3c; 전체 보체(CH50), Sm/RNP, SS-A 및 -B(Sjogren a 및 b), Scl-70, 토포이소머라제, 리보솜 P 단백질, 액틴, 조직 트랜스글루타미나제, 미엘로퍼옥시다제, 프로테이나제-3, M-형 포스포리파제 A, 간 신장 마이크로좀 항원 타입-1(항-LKM1), 항-간 시토졸 타입 1(항-LC1), SMA, 피루베이트 데하이드로게나제 복합체 E2 아단위, 핵 모공 gp210, 핵 바디 sp100, 고이동성 그룹 박스 1, 콜라겐, 콜라겐 타입 II, 콜라겐 타입 IV, 콜라겐 VII, hLAMP-2, 전위 의존성 칼륨 채널(VGKC), N-메틸-D-아스파르트산 수용체(NMDAR), Hu, Yo, Ri, Ma 1/2, CRMP-5, 암피피신, 열 충격 단백질(HSPs), HSP60, 응고 인자 VIII, 증식 세포 핵 항원(PCNA), DNA 폴리머라제, 레코베린, α-에놀라제, 트랜스두신-α, 미엘린 염기성 단백질(MBP), 인자 VIII(FVIII), 인자 IX(FIX), 아밀로이드 β 펩타이드(Aβ), 미엘린 올리고덴드로사이트 글리코단백질(MOG; see www.discoverymedicine.com/category/species-and-cell-types/human/brain/oligodendrocyte/), 미멜린 염기성 단백질(MBP), 과립구 마크로파지-콜로니 자극 인자(GM-CSF), 인터페론(IFN)-γ, 인터류킨-(IL)-6, IL-17A, IL-17F, IL-22, 히스톤 H1,사이토크롬 P450, 미엘린, 아쿠아포린-4(AQP-4), Ro, La, 근육-특이적 키나제(MuSK), 액티닌-α4, α-에놀라제, 신장 인자 2, 글루타메이트 수용체(NR2), 라미닌, 미오신, smD1, PM-Scl, 피브릴라린, RNA 폴리머라제 I, NOR), Scl-70, 사이클린 I 및 II, 간-특이적 단백질, 포르미미노트랜스퍼라제-사이클로데아미나제(LC-1), 가용성 간 항원/간-췌장 항원(SLA/LP), 데스모글레인 1 또는 3, 엔보플라킨, BP180 단백질, BP230 단백질, 미엘린-관련 글리코단백질, 글루탐산 데카복실라제(GAD), 티로신 포스파타제(IA2), 인슐린, H+/K+-ATPase, 엘라스타제, 카텝신 G, 칵토페린, BPI, rPAg1(CUZD1) 및 rPAg2(GP2), 포스포리파제 A2 수용체, 글리아딘-유사 융합 펩타이드, 글루탐산 데카복실라제(GAD65), 및 티로트로핀 수용체 항원일 수 있다.
상기 항원은 독소, 예를 들어, 보툴리늄 신경독소, 클로스트리듐 퍼프린겐스 엡실론 독소, 리신, 삭시톡소, 쉬가톡소, 테트로도독소, 스타필로코쿠스 엔테로독소 등을 인용할 수 있다. 무신도 또한 당해 기술 분야에 널리 알려져 있다. MUC5AC, MUC5B 및 MUC2가 그의 예이다. 특히, 이들은 천연-발생 폴리사카라이드, 예를 들어, 그룹 B 스트렙토코쿠스 및 뉴모코쿠스 캡슐 폴리사카라이드(III형 포함), 슈도모나스 아에루기노사(Pseudomonas aeruginosa) 뮤코엑소폴리사카라이드, 및 캡슐 폴리사카라이드(피셔 I형 포함), 및 해모필루스 인플루엔재(Haemophilus influenzae) 폴리사카리이드일 수 있다.
바람직한 실시형태에서, 상기 항원 또는 에피토프는 하기로 이루어진 그룹으로부터 선택되는 바이러스에 의해 발현된다: 인플루엔자 바이러스, A형 간염 바이러스, B형 간염 바이러스, C형 간염 바이러스, E형 간염 바이러스, G형 간염 바이러스, HIV 바이러스, 황열 바이러스, 뎅기 바이러스, 일본 뇌염 바이러스, 진드기-매개 뇌염 바이러스, 누수투 또는 웨스트 나일 바이러스, 리프트 계곡 열 또는 토스카나 바이러스, 치쿤구니아 바이러스, 옴스크 출혈열 바이러스, 알크후마 출혈열 바이러스, 키아사누르 삼림병 바이러스, 베네주엘라 말 뇌염 바이러스, 동부 말 뇌염 바이러스, 서부 말 뇌염 바이러스, 로스 리버 바이러스, 마야로 바이러스, 호흡기 합포체 바이러스, 로시오 바이러스, 홍역 바이러스, 머레이 계곡 뇌염 바이러스, 베셀스브론 바이러스, 지카 바이러스, 림프구 무도수막염(lymphocytic choreomeningitis) 바이러스, 에볼라 바이러스, 마르부르그 바이러스, 크리미아-콩고 출혈 열 바이러스, 리사 바이러스, 주닌(Junin) 바이러스, 마추포(Machupo) 바이러스(http://en.wikipedia.org/wiki/Machupo_virus), 사비아(Sabia) 바이러스, 구아나리토(Guanarito) 바이러스, 유행성 이하선염 바이러스, 광견병 바이러스, 루벨라(rubella) 바이러스, 수두 대상 포진 바이러스, 단순 포진 1형 및 2형 바이러스, 더욱 일반적으로 알파바이러스, 아데노바이러스, 한타바이러스, 에코바이러스, 로타바이러스, 플라비바이러스, 리노바이러스, 오쏘부냐바이러스(orthobunyavirus), 폴리오바이러스, 폭스바이러스(예를 들어, 천연두(http://en.wikipedia.org/wiki/Smallpox), 원두, 블랙폭스 또는 카나리아 두창), 오쏘믹소바이러스(예를 들어, 인플루엔자바이러스 A, 인플루엔자바이러스 B, 인플루엔자바이러스 C, http://en.wikipedia.org/wiki/Influenza_A_virus; http://en.wikipedia.org/wiki/Influenzavirus_B; http://en.wikipedia.org/wiki/Influenzavirus_C), 피코나바이러스(예를 들어, 구제역 바이러스, FMDV, http://en.wikipedia.org/wiki/Picornavirus), 인간 파보바이러스, 엔테로바이러스, 코로나바이러스(예를 들어, SARS 또는 인간 베타코로나바이러스), 인간 파필로마바이러스, 헤르페스 바이러스, 인간 시토메갈로바이러스, 엡스테인-바르 바이러스, 파라믹소바이러스(http://en.wikipedia.org/wiki/Paramyxovirus), 예를 들어, 1, 2 및 3형의 파라인플루엔재 바이러스, 또는 임의의 확인된 바이러스.
바람직한 실시형태에서, 상기 항원 또는 에피토프는 하기로 이루어진 그룹으로부터 선택되는 과에 속하는 바이러스에 의해 발현된다: 플라비비리대(뎅기 바이러스, 황열 바이러스, 웨스트 나일 바이러스, 일본 뇌염 바이러스, 진드기-매개 뇌염 바이러스, C형 간염 바이러스), 토가비리대(치쿤구니아 바이러스, 로스 강 바이러스, 마야로 바이러스, 서부 말 뇌염 바이러스, 동부 말 뇌염 바이러스, 베네주엘라 말 뇌염 바이러스), 부냐비리대(크리미아-콩고 출혈 열 바이러스, 리프트 계곡 열 바이러스, 쉬말렌베르그 바이러스), 칼리시비리대(E형 간염 바이러스), 아레나비리대(라사 바이러스) 및 필로비리대(에볼라 바이러스, 마르부르그 바이러스).
또 다른 바람직한 실시형태에서, 상기 항원 또는 에피토프는 기생 원생동물, 예를 들어, 레이슈마니아(Leishmania) 속으로부터의 것, 또는 톡소플라스마 곤디( Toxoplasma Gondii), 엔타모에바 히스톨리티카(Entamoeba histolytica), 플라스 모듐 팔시파룸(Plasmodium falciparum)(예를 들어, MSP1(19)+ AMA-1(III) 항원, 별개로 또는 동시-발현됨), 뉴모시스티스 카리니(Pneumocystis carinii), 크립토스포리디움(Kryptosporidium), 나에글레리아 포우레리(Naegleria fowleri)(http://en.wikipedia.org/wiki/Naegleria_fowleri), 또는 기아르 디아 람블리아)(Giardia lamblia), 벌레(예: 트리파노소마 크루지(Trypanosoma cryzi), 선충, 촌충 또는 흡충), 또는 절지동물(예: 갑각류, 곤충, 거미류)에 의해 발현된다.
또 다른 바람직한 실시형태에서, 상기 항원 또는 에피토프는, 예를 들어, 살모넬라(Salmonella), 쉬겔라(Shigella), 스트렙토코쿠스(Streptococcus), 스타필로코쿠스(Staphylococcus), 미코플라스마(Mycoplasma), 디프테리애(Diphteriae), 렙토스피로사(Leptospirosa), 리케챠(Rickettsia) 또는 에쉐리키아(Escherichia)의 속의 감염성 세균에 의해 발현된다. 추가의 바람직한 실시형태에서, 상기 세균은 트레포네마 팔리둠(Treponema pallidum )(http://en.wikipedia.org/wiki/Treponema_pallidum), 헬리코박터 필로리(Helicobacter pylori), 캄필로박터 제주니(Campylobacter jejuni), 보렐리아 부르그도르페리(Borrelia burgdorferi), 레기오넬라 뉴모필라(Legionella pneumophila), 예르시니아 페스티스(Yersinia pestis), 예르시니아 엔테로콜리티카(Yersinia enterocolitica), 브루셀라 아보르투스(Brucella abortus), 부르크홀데리아 말레이(Burkholderia mallei)(http://en.wikipedia.org/wiki/Burkholderia_mallei), 브르크홀데리아 슈도말레이(Burkholderia pseudomallei)(http://en.wikipedia.org/wiki/Burkholderia_pseudomallei), 클라미디아 뉴모니아(Chlamydia pneumonia), 프란시셀라 투라렌시스(Francisella tularensis), 마이코플라스마 뉴모니아(Mycoplasma pneumonia), 에이치. 인플루엔자에(H. influenzae), 에스. 뉴모니아에(S. pneumoniae), 클레브시엘라 뉴모니아에(Klebsiella pneumoniae), 에스. 아우레우스(S. aureus), 바실루스 안트라시스(Bacillus anthracis), 클로스트리디움 보툴리눔(Clostridium botulinum)(http://en.wikipedia.org/wiki/Clostridium_botulinum), 클로스트리디움 퍼프린겐스(Clostridium perfringens)(http://en.wikipedia.org/wiki/Clostridium_perfringens), 리스테리아 모노사이토게네스(Listeria monocytogenes), 보르데텔라 퍼투시스(Bordetella pertussis), 클로스트리디움 테타니(Clostridium tetani), 네이세리아 메닝기티디스(Neisseria meningitidis)(http://en.wikipedia.org/wiki/Neisseria_meningitidis), 에스. 에피더미디스(S. epidermidis), 엔. 메닌기디티스(N. meningiditis), 슈도모나스 아에루기노사(Pseudomonas aeruginosa), 클라미디아 트라초마티스(Chlamydia trachomatis), 미코박테리움 투버쿨로시스(Mycobacterium tuberculosis), 콕시엘라 부르네티(Coxiella burnetii), 릭케트시아 프로바제키(Rickettsia prowazekii)(http://en.wikipedia.org/wiki/Rickettsia_prowazekii), 클라미디아 시타시(Chlamydia psittaci)(http://en.wikipedia.org/wiki/Chlamydia_psittaci), 렙토스피로사 인테로간스(Leptospirosa interrogans) 및 이. 콜라이(E.coli)(예를 들어, 이. 콜라이 O157:H7(http://en.wikipedia.org/wiki/Escherichia_coli_O157:H7)) 중에서 선택되는 종에 속한다.
또 다른 바람직한 실시형태에서, 상기 항원 또는 에피토프는 진균 또는 효모에 의해, 예를 들어, 칸디다( Candida), 아스퍼질루스(Aspergillus), 크립토코쿠스( Cryptococcus), 히스토플라스마(Histoplasma), 뉴모시스티스(Pneumocystis) 또는 스타치보트리스(Stachybotrys)의 종으로부터 발현된다.
항원 또는 에피토프는 프리온 단백질(PrPc)로부터 유래할 수 있다.
에피토프는 특이적 면역글로불린, 예를 들어, IgD, IgG1, IgG2, IgG3, IgG4, IgA, IgM, IgE, 또는 IgG 등으로부터 유래할 수 있다.
항원은 통상적으로 특이적 항체에 대해 상호작용의 관점에서 작용할 수 있는 수개의 표면 특징을 나타낸다. 이러한 구별되는 분자적 특징이 에피토프를 구성한다. 따라서, 본원에서 사용되는 용어 "에피토프"는 항원의 특정한 분자 표면 특징, 예를 들어, 하나 이상의 항체에 의해 결합될 수 있는 항원의 단편을 나타낸다. 따라서, 분자적 수준에서, 에피토프는 특이적 항체에 의해 인지되고 결합되는 항원의 특정 분자적 표면 특징(예를 들어, 항원의 단편)에 상응한다. 본 발명과 관련하여, "융합 단백질"은 표적 항체에 의해 인지되는 하나 이상의 에피토프를 포함한다. 바람직하게는, 상기 융합 단백질은 수개의 에피토프(http://en.wikipedia.org/wiki/Epitope)를 포함하는 전체 항원을 포함한다. 이들 에피토프는 선형 또는 입체형태적(conformational) 에피토프일 수 있다. 본원에서 사용되는 바와 같이, 선형(또는 순차적) 에피토프는 항체(http://en.wikipedia.org/wiki/Antibody), 아미노산(http://en.wikipedia.org/wiki/Amino_acid)의 선형 서열 또는 일차 구조(http://en.wikipedia.org/wiki/Primary_structure)에 의해 인지되는 에피토프이다. 이와는 반대로, 입체형태적 에피토프(http://en.wikipedia.org/wiki/Conformational_epitope)는 이의 특이적 3차원 모양에 의해 인지된다. 바람직하게는, 본 발명의 융합 단백질은 대부분의 폴리클로날 항체가 인지하는 바와 같이 입체형태적 에피토프를 포함한다.
그러나, 이러한 항원이 교차-반응성 에피토프, 즉, 에피토프에 결합될 비-특이적 항체에 의해 인지되는 에피토프를 나타내지는 않는다는 것이 중요하다. 만약 이러한 경우, 본 발명의 특이성이 감소될 것이다.
바람직한 실시형태에서, 상기 에피토프는 바이러스 단백질, 바람직하게는 EDIII 단백질 상에 존재하고, 이는 뎅기 바이러스 1, 뎅기 바이러스 2, 뎅기 바이러스 3, 뎅기 바이러스 4, 웨스 나일 바이러스, 황열 바이러스, 일본 뇌염 바이러스, 지카 바이러스, 베셀스브론 바이러스, 로시오 바이러스, 머레이 뇌염 바이러스, 세인트-루이스 뇌염 바이러스, 유전형 1의 일본 뇌염 바이러스, 유전형 2의 일본 뇌염 바이러스, 유전형 4의 일본 뇌염 바이러스, 유전형 5의 일본 뇌염 바이러스 및 라벤스버그 바이러스로 이루어진 그룹으로부터 선택된다.
더욱 바람직한 실시형태에서, 상기 에피토프는 하기로 이루어진 그룹으로부터 선택되는 바이러스 단백질 상에 존재한다: 서열번호 3의 뎅기 바이러스 1의 EDIII 단백질, 서열번호 4의 뎅기 바이러스 2의 EDIII 단백질, 서열번호 5의 뎅기 바이러스 3의 EDIII 단백질, 서열번호 6의 뎅기 바이러스 4의 EDIII 단백질, 서열번호 7의 웨스트 나일 바이러스의 EDIII 단백질, 서열번호 8의 황열 바이러스의 EDIII 단백질, 서열번호 9의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 10의 지카 바이러스의 EDIII 단백질, 서열번호 11의 베셀스브론 바이러스의 EDIII 단백질, 서열번호 12의 로시오 바이러스의 EDIII 단백질, 서열번호 13의 머레이 뇌염 바이러스의 EDIII 단백질, 서열번호 14의 세인트-루이스 뇌염 바이러스의 EDIII 단백질, 서열번호 54에 의해 인코딩되는 유전형 1의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 55에 의해 인코딩되는 유전형 2의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 56에 의해 인코딩되는 유전형 4의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 57에 의해 인코딩되는 유전형 5의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 58에 의해 인코딩되는 라벤스버그 바이러스의 EDIII 단백질, 및 HIV1, HIV2, B형 간염 바이러스, C형 간염 바이러스, E형 간염 바이러스, 웨스트-나일 바이러스 및 HPV 16, 18, 31, 33, 35, 39, 45, 51, 52, 56, 58, 59, 66 및 68와 같은 종양 HPV 스트레인의 바이러스 단백질.
바람직한 실시형태에서, 본 발명의 방법에서 사용되는 융합 단백질에서 hAGT 효소와 융합되는 제1 및 제2 에피토프(또는 항원)는 동일한 분류 수준에 속한다. 즉, 이들은 동일한 과(예: 플라비비리대 과, 부냐비리대 과, 아레나비리대 과 또는 필로비리대 과) 또는 속 또는 종에 속하나 상이한 혈청형을 갖는다. 달리, 상기 제1 및 제2 에피토프는 긴밀히 관련된, 예를 들어, 동일한 과, 속 또는 종에 속하나 뎅기 바이러스 1, 2, 3, 또는 4와 같이 상이한 혈청형을 갖는, 바이러스에 의해 발현될 수 있다.
달리, 또 다른 바람직한 실시형태에서, 상기 제1 및 제2 에피토프(또는 항원)는 비관련된 생물학적 과, 속 또는 종에 속한다.
에피토프는 바이러스 에피토프일 수 있다. 바람직하게는, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 에피토프가 바이러스 에피토프로부터 선택된다. 바람직하게는, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 에피토프가 뎅기 바이러스(혈청형 1, 2, 3 또는 4), 웨스트 나일 바이러스, 황열 바이러스, 일본 뇌염 바이러스, 진드기-매개 뇌염 바이러스, 세인트-루이스 뇌염 바이러스, 머레이 계곡 뇌염 바이러스, 베셀스브론 바이러스, 지카 바이러스, 로시오 바이러스, 우수투 바이러스, 리프트 계곡 열 바이러스 및 치쿤구니아 바이러스 에피토프로부터 선택된다. 보다 바람직하게는, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 에피토프가 뎅기 바이러스(혈청형 1, 2, 3 또는 4), 웨스트 나일 바이러스, 황열 바이러스, 일본 뇌염 바이러스, 진드기-매개 뇌염 바이러스, 세인트-루이스 뇌염 바이러스, 머레이 계곡 뇌염 바이러스, 베셀스브론 바이러스, 지카 바이러스, 로시오 바이러스, 우수투 바이러스, 리프트 계곡 열 바이러스, 치쿤구니아 바이러스, SARS 코로나바이러스, 인간 코로나바이러스, C형 간염 바이러스(HCV), E형 간염 바이러스(HEV) 또는 쉬말렌베르그 바이러스 에피토프로부터 선택된다.
바람직하게는, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 에피토프는 뎅기 바이러스(혈청형 1, 2, 3 또는 4), 웨스트 나일 바이러스, 황열 바이러스, 일본 뇌염 바이러스, 진드기-매개 뇌염 바이러스, 세인트-루이스 뇌염 바이러스, 머레이 계곡 뇌염 바이러스, 베셀스브론 바이러스, 지카 바이러스, 로시오 바이러스, 우수투 바이러스, 리프트 계곡 열 바이러스, 치쿤구니아 바이러스, SARS 코로나바이러스, 인간 코로나바이러스, C형 간염 바이러스(HCV), E형 간염 바이러스(HEV), 쉬말렌베르그 바이러스, HIV1, HIV2, B형 간염 바이러스 및 HPV 에피토프로부터 선택된다. 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 에피토프는 달리는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 상술된 바이러스의 임의의 그룹으로부터 선택될 수 있다.
바람직하게는, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 에피토프는 플라비리대 ( Flaviviridae) 에피토프로부터 선택된다. 바람직하게는, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 에피토프는 토가비리대 ( Togaviridae) 에피토프로부터 선택된다. 바람직하게는, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 에피토프는 분야비리대( Bunyaviridae) 에피토프로부터 선택된다. 바람직하게는, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 에피토프는 칼리시비리대( Caliciviridae) 에피토프로부터 선택된다. 바람직하게는, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 에피토프는 아레나비리대( Arenaviridae) 에피토프로부터 선택된다. 바람직하게는, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 에피토프는 필로비리대( Filoviridae) 에피토프로부터 선택된다. 바람직하게는, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 에피토프는 폭스비리대( Poxviridae) 에피토프로부터 선택된다.
에피토프는 세균 에피토프일 수 있다. 바람직하게는, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 에피토프는 세균 에피토프로부터 선택된다. 바람직하게는, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 에피토프는 트레포네마 팔리둠(Treponema pallidum)(http://en.wikipedia.org/wiki/Treponema_pallidum), 헬리코박터 필로리(Helicobacter pylori), 캄필로박터 제주니(Campylobacter jejuni), 보렐리아 부르그도르페리(Borrelia burgdorferi), 레지오넬라 뉴모필라(Legionella pneumophila), 예르시니아 페스티스(Yersinia pestis)(http://en.wikipedia.org/wiki/Yersinia_pestis), 예르시니아 엔테로콜리티카(Yersinia enterocolitica), 브루셀라 아보르투스(Brucella abortus), 부르크홀데리아 말레이(Burkholderia mallei), 부르크홀데리아 슈도말레이(Burkholderia pseudomallei), 클라미디아 뉴모니아(Chlamydia pneumonia), 프란시셀라 툴라렌시스(Francisella tularensis), 마이코플라스마 뉴모니아(Mycoplasma pneumonia), 에이치. 인플루엔자(H. influenzae), 에스. 뉴모니아에(S. pneumoniae), 클레브시엘라 뉴모니아에(Klebsiella pneumoniae), 에스. 아우레우스(S. aureus), 바실루스 안트라시스(Bacillus anthracis), 클로스트리디움 보툴리눔(Clostridium botulinum), 클로스트리디움 퍼프린겐스(Clostridium perfringens), 리스테리아 모노시토게네스(Listeria monocytogenes), 보르데텔라 퍼투시스(Bordetella pertussis), 클로스트리디움 테타니(Clostridium tetani), 네이세리아 메닝기티디스(Neisseria meningitidis), 에스. 에피데르미디스(S. epidermidis), 엔. 메닝기디티스(N. meningiditis), 슈도모나스 에루기노사(Pseudomonas aeruginosa), 클라미디아 트라코마티스(Chlamydia trachomatis), 마이코박테리움 투베르쿨로시스(Mycobacterium tuberculosis), 콕시엘라 부르네티(Coxiella burnetii), 릭켓시아 프로와제키(Rickettsia prowazekii), 클라미디아 시타시(Chlamydia psittaci), 렙토스피로사 인테로간스(Leptospirosa interrogans) 및 이. 콜라이(E.coli)(예를 들어, 이. 콜라이, O157:H7) 에피토프로부터 선택된다. 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 에피토프는 달리는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 상술된 세균의 임의의 그룹으로부터 선택될 수 있다.
바람직하게는, 적어도 1, 2, 3 또는 4개의 에피토프는 렙토스피라 에피토프, 가장 바람직하게는 LruA, LruB, HbpA 또는 LipL32 에피토프로부터 선택된다.
일부 실시형태에서, 제1 또는 제2 융합 단백질은 서열번호 3 내지 14 및 54 내지 58 중의 어느 하나에 의해 인코딩된 적어도 하나의 아미노산 서열, 또는 이의 적어도 10, 15, 20, 25, 30, 40, 50, 60, 100, 200 또는 300개의 연속 아미노산을 포함한다.
일부 실시형태에서, 제1 또는 제2 융합 단백질은 서열번호 155, 157, 159, 161, 163, 165, 167, 171, 173, 175, 177 및 179 중의 어느 하나에 의해 인코딩된 하나 이상의 아미노산 서열, 또는 이의 적어도 10, 15, 20, 25, 30, 40, 50, 60, 100, 200 또는 300개의 연속 아미노산을 포함한다.
일부 실시형태에서, 제1 또는 제2 융합 단백질은 서열번호 3 내지 14 및 54 내지 58 중의 어느 하나에 의해 인코딩된 하나 이상의 아미노산 서열을 포함하고/하거나 서열번호 155, 157, 159, 161, 163, 165, 167, 171, 173, 175, 177 및 179로부터 선택된 하나 이상의 아미노산 서열, 또는 이의 적어도 10, 15, 20, 25, 30, 40, 50, 60, 100, 200 또는 300개의 연속 아미노산을 포함한다.
일부 실시형태에서, 제1 또는 제2 융합 단백질은 SARS 코로나바이러스의 돌연변이된 N 단백질, SARS 코로나바이러스의 S 단백질의 RBD, 인간 베타코로나바이러스의 N 단백질, 인간 베타코로나바이러스의 S1 단백질, 인간 베타코로나바이러스의 S 단백질의 RBD, C형 간염(HCV) 바이러스의 돌연변이된 C 단백질, HEV 코어 항원, HCV 코어 항원, HCV 코어 항원의 짧은 형태, 쉬말렌베르그 바이러스의 NS 단백질로부터 선택된 하나 이상의 아미노산 서열을 포함한다.
일부 실시형태에서, 제1 또는 제2 융합 단백질은 도 12 내지 16 및 21 내지 24에 도시된 바이러스 아미노산 서열의 적어도 10, 15, 20, 25, 30, 40, 50, 60, 100, 200 또는 300개의 연속 아미노산을 포함한다.
일부 실시형태에서, 제1 또는 제2 융합 단백질은 LruA, LruB 또는 LipL32 단백질로부터 선택된 적어도 하나의 아미노산 서열을 포함한다. 바람직하게는, 제1 또는 제2 융합 단백질은 도 17, 18 또는 19에 도시된 LruA, LruB 또는 LipL32 아미노산 서열의 적어도 10, 15, 20, 25, 30, 40, 50, 60, 100, 200 또는 300개의 연속 아미노산을 포함한다.
일부 실시형태에서, 상기 에피토프는 도 17, 18 또는 19에 도시된 서열의 적어도 10, 15, 20, 25, 30, 40, 50, 60, 100, 200 또는 300개의 보존적 LruA, LruB 또는 LipL32 아미노산을 포함한다.
본 발명의 면역분석은 공지 또는 미지인 다수의 항체를 동시에 검출할 수 있다. 본원에서 "다수"란 적어도 5개, 바람직하게는 적어도 15개, 더욱 바람직하게는 적어도 50개, 더욱더 바람직하게는 적어도 100개의 항체이다. 따라서, 바람직한 실시형태에서, 본 발명의 분석 방법은 피험자로부터의 생물학적 샘플 중의 적어도 5개, 바람직하게는 적어도 15개, 더욱 바람직하게는 적어도 50개, 더욱더 바람직하게는 적어도 100개의 표적 항체를 검출하는데 이용된다. 절차가 항체의 특성에 의거하지 않고 항체의 존재를 검출하는 것에 의거하기 때문에, 특정의 항체가 적절히 특징화 되는지 여부는 본 발명의 방법과 관련이 없다.
본 발명의 바람직한 실시형태에서, 상기 제1 및 제2 고체 지지체와 커플링되는 제1 및 제2 융합 단백질은 하기로 이루어진 그룹으로부터 선택된다:
- 서열번호 21(융합 단백질 [SNAP-DEN1.EDIII]에 상응)
- 서열번호 42(융합 단백질 [SNAP-SBV.N]에 상응)
- 서열번호 49(융합 단백질 [SNAP-EV71.VP1]에 상응)
- 서열번호 51(융합 단백질 [JE.sE-SNAP]에 상응)
- 서열번호 53(융합 단백질 [SNAP-JE-1.EDIII]에 상응)
- 서열번호 60(융합 단백질 [SNAP- JE-2.EDIII]에 상응)
- 서열번호 62(융합 단백질 [SNAP- JE-4.EDIII]에 상응)
- 서열번호 64(융합 단백질 [SNAP- JE-5.EDIII]에 상응)
- 서열번호 66(융합 단백질 [SNAP- RabV.EDIII]에 상응)
- 서열번호 68(융합 단백질 [SNAP- 플라비바이러스.EDIII]에 상응)
- 서열번호 70(융합 단백질 [RR.sE2-SNAP]에 상응)
- 서열번호 72(융합 단백질 [MAY.sE2-SNAP]에 상응)
- 서열번호 74(융합 단백질 [WEE.sE2-SNAP]에 상응)
- 서열번호 76(융합 단백질 [EEE.sE2-SNAP]에 상응)
- 서열번호 78(융합 단백질 [VEE.sE2-SNAP]에 상응)
- 서열번호 80(융합 단백질 [SNAP- AKA.N]에 상응)
- 서열번호 82(융합 단백질 [SNAP- AIN.N]에 상응)
- 서열번호 84(융합 단백질 [SNAP- SHA.N]에 상응)
- 서열번호 86(융합 단백질 [SNAP- huCOV.N]에 상응)
- 서열번호 88(융합 단백질 [SNAP- huCOV.S]에 상응)
- 서열번호 90(융합 단백질 [SNAP- HCV.C]에 상응)
- 서열번호 92(융합 단백질 [SNAP- MSP+AMA]에 상응)
- 서열번호 94(융합 단백질 [SNAP- HbpA1]에 상응)
- 서열번호 96(융합 단백질 [SNAP- MUB40]에 상응)
- 서열번호 98(융합 단백질 [SNAP- moCLEC5A]에 상응)
- 서열번호 100(융합 단백질 [SNAP- huCLEC5A]에 상응)
- 서열번호 102(융합 단백질 [SNAP- cxVAGO]에 상응)
- 서열번호 104(융합 단백질 [SNAP- aaVAGO]에 상응)
- 서열번호 109(융합 단백질 [SNAP- CCHF.N]에 상응)
- 서열번호 111(융합 단백질 [SNAP- EBO.N]에 상응)
- 서열번호 113(융합 단백질 [SNAP- MAR.N]에 상응)
- 서열번호 115(융합 단백질 [SNAP- LAS.N]에 상응)
- 서열번호 117(융합 단백질 [SNAP- JUN.N]에 상응)
- 서열번호 119(융합 단백질 [SNAP- MAC.N]에 상응)
- 서열번호 121(융합 단백질 [SNAP- GUA.N]에 상응)
- 서열번호 123(융합 단백질 [SNAP- SAB.N]에 상응)
- 서열번호 125(융합 단백질 [SNAP- OMSK.EDIII]에 상응)
- 서열번호 127(융합 단백질 [SNAP- KYA.EDIII]에 상응)
- 서열번호 129(융합 단백질 [SNAP- ALK.EDIII]에 상응)
- 서열번호 131(융합 단백질 [LAS.ectoGP1-SNAP]에 상응)
- 서열번호 133(융합 단백질 [JUN.ectoGP1-SNAP]에 상응)
- 서열번호 135(융합 단백질 [MAC.ectoGP1-SNAP]에 상응)
- 서열번호 137(융합 단백질 [GUA.ectoGP1-SNAP]에 상응)
- 서열번호 139(융합 단백질 [SAB.ectoGP1-SNAP]에 상응)
- 서열번호 141(융합 단백질 [LAS.ectoGP2-SNAP]에 상응)
- 서열번호 143(융합 단백질 [JUN.ectoGP2-SNAP]에 상응)
- 서열번호 145(융합 단백질 [MAC.ectoGP2-SNAP]에 상응)
- 서열번호 147(융합 단백질 [GUA.ectoGP2-SNAP]에 상응)
- 서열번호 149(융합 단백질 [SAB.ectoGP2-SNAP]에 상응), 및
- 서열번호 151((융합 단백질 [SNAP- HEV.C]에 상응).
따라서, 본 발명의 시험관내 방법으로 바이러스, 세균, 효모 또는 진균-매개된 감염인 표적 질환(들)을 검출할 수 있다. 바람직하게는, 상기 바이러스 감염은 파필로마바이러스 또는 플라비비리대(뎅기 바이러스, 황열 바이러스, 웨스트 나일 바이러스, 일본 뇌염 바이러스, 진드기-매개 뇌염 바이러스, C형 간염 바이러스), 토가비리대(치쿤구니아 바이러스, 로스 강 바이러스, 마야로 바이러스, 서부 말 뇌염 바이러스, 동부 말 뇌염 바이러스, 베네주엘라 말 뇌염 바이러스), 부냐비리대(크리미아-콩고 출혈 열 바이러스, 리프트 계곡 열 바이러스, 쉬말렌베르그 바이러스), 칼리시비리대(E형 간염 바이러스), 아레나비리대(라사 http://en.wikipedia.org/wiki/Lassa_virus) 및 필로비리대(에볼라 http://en.wikipedia.org/wiki/Ebola_virus, 마르부르그 http://en.wikipedia.org/wiki/Marburg_virus)의 과로부터의 RNA 바이러스에 의해 유발된다. 바람직하게는, 상기 세균 감염은 렙토스피로사 인테로간스에 의해 유발된다. 바람직하게는, 상기 감염은 플라스모듐 팔시파룸에 의해 유발된다.
본원에서 사용되는 용어 "생물학적 샘플"은 환자로부터 수득되고 항체를 포함할 수 있는 임의의 샘플을 말한다. 바람직하게는, 상기 생물학적 샘플은 생물학적 유체, 예를 들어 비여과 생물학적 유체, 예를 들어 소변, 뇌척수액, 늑막액, 윤활액, 복막액, 양수, 위액, 혈액, 혈청, 혈장, 림프액, 간질액, 타액, 생리학적 분비물, 눈물, 점액, 땀, 젖, 정액(semen, seminal fluid), 질 분비물, 궤양 및 다른 표면 발진으로부터의 유체, 수포 및 농양이다. 또한, 생물학적 샘플은 또한 항체를 포함할 수 있는 정상적, 악성 및 의심되는 조직 또는 임의의 다른 신체 구성물의 생검을 포함한 조직의 추출물을 말한다. 상기 생물학적 샘플은 사용 전에, 예를 들어, 혈액으로부터 혈장을 준비하고 점성 유체를 희석시키는 등과 같이 전처리될 수 있으며; 처리 방법은 여과, 증류, 농축, 간섭 화합물의 불활성화, 및 시약 첨가를 포함할 수 있다. 바람직한 실시형태에서, 상기 생물학적 샘플은 전혈, 혈청, 혈장, 소변, 정액, 뇌척수액 및 타액으로부터 선택된다.
AGT 폴리펩타이드
O6-알킬구아닌-DNA 알킬트랜스퍼라제 활성을 갖는 임의의 폴리펩타이드를 본 발명의 방법에 사용할 수 있다. 본 발명의 목적 상, 이들 폴리펩타이드는 "AGT 폴리펩타이드"로 지칭될 것이다.
AGT는 이의 기질인 O6-알킬구아닌-DNA로부터의 알킬 그룹을 이의 시스테인 부분에 비가역적으로 전달한다. AGT와 신속히 반응하는 기질 동족체는 O6-벤질-구아닌이고, 이차 속도 상수는 약 103 sec-1 M-1이다.
본 발명과 관련하여, 폴리펩타이드가 O6-알킬구아닌-포함 분자로부터의 알킬 그룹을 그 자신의 시스테인 부분에 비가역적으로 전달할 수 있는 경우, 이 폴리펩타이드를 "O6-알킬구아닌-DNA 알킬트랜스퍼라제 활성"(또는 "AGT 활성")을 갖는다고 한다. 상기 폴리펩타이드의 "O6-알킬구아닌-DNA 알킬트랜스퍼라제 활성"은, 예를 들어, 공지된 표지된 O6-벤질-구아닌 유도체를 접촉시키고, 상기 표지가 시험되는 폴리펩타이드에 전달되는 것을 모니터링함으로써 측정될 수 있다. 분석이 세포에서(in cellulo) 또는 세포 추출물에서 수행되는 경우, 숙주 세포의 내인성 AGT의 반응이 조절되어야 하며, 이렇게 함으로써 내인성 AGT가 상기 폴리펩타이드를 방해하지 않는다. 따라서, 공지된 AGT-결핍 세포주가 바람직하게 사용된다. AGT 활성을 확인하는 분석은 널리 알려져 있다. 수개의 O6-벤질-구아닌 유도체가 시판된다(O6-벤질-구아닌은, 예를 들어, Santa Cruz biotechnology에 의해 공급되며, 형광-표지된 O6-벤질-구아닌 유도체는 New England Biolabs NEB에 의해 입수될 수 있다). 이들 분석 중 일부가 WO 2005/085470 및 WO 2004/031405에 기술되어 있다.
본 발명과 관련하여, AGT 폴리펩타이드의 "촉매 도메인"은 효소의 활성 부위, 또는, 달리, 이의 기질인 O6-알킬구아닌-DNA로부터의 알킬 그룹을 반응성 시스테인 부분으로 전달하는 효소의 부분에 상응한다. 활성 부위에서 O6-벤질구아닌과 결합하는 hAGT의 구조에서, 4개의 아미노산이 벤질 환에 가까이 있거나(Pro140, Ser159, Gly160), 핵염기의 N9와 접촉될 수 있다(Asn157). 위치 Pro140 및 Gly160에서의 돌연변이는 hAGT와 O6-벤질구아닌와의 반응에 영향을 끼치는 것으로 이전에 밝혀졌으며(Xu-Welliver et al., Biochemical Pharmacology 1999), 위치 140에서의 프롤린은 벤질 환과의 상호작용에 필수적인 것으로 믿어지며, 돌연변이 Gly160Trp은 O6-벤질구아닌에 대한 hAGT의 반응성을 증가시키는 것으로 알려져 있다.
바람직한 실시형태에서, O6-알킬구아닌-DNA 알킬트랜스퍼라제 활성을 갖는 AGT 폴리펩타이드는 서열번호 1의 인간 AGT 폴리펩타이드(NP_002403.2), NP_032624.1(서열번호 18)로 확인되는 마우스 AGT, NP_036993.1(서열번호 19)로 확인되는 래트 MGMT 또는 O6-알킬구아닌-DNA 알킬트랜스퍼라제 활성을 갖는 이의 상동성 서열이다.
본원에서 사용되는 용어 "상동성"은 서열 유사성을 갖는 서열을 말한다. 용어 "서열 유사성"은 이의 모든 문법적 형태에서 핵산 또는 아미노산 서열 간의 동일성 또는 상응 정도를 말한다. 본 발명과 관련하여, 2개의 아미노산 서열은 적어도 약 80%, 달리 적어도 약 81%, 달리 적어도 약 82%, 달리 적어도 약 83%, 달리 적어도 약 84%, 달리 적어도 약 85%, 달리 적어도 약 86%, 달리 적어도 약 87%, 달리 적어도 약 88%, 달리 적어도 약 89%, 달리 적어도 약 90%, 달리 적어도 약 91%, 달리 적어도 약 92 %, 달리 적어도 약 93%, 달리 적어도 약 94%, 달리 적어도 약 95%, 달리 적어도 약 96%, 달리 적어도 약 97%, 달리 적어도 약 98%, 달리 적어도 약 99%의 아미노산이 유사한 경우 "상동성"이다. 바람직하게는, 유사하거나 상동성인 폴리펩타이드 서열은 Needleman 및 Wunsch의 알고리즘을 이용하여 확인된다.
바람직하게는, AGT 효소에 대한 상동성 서열은 서열번호 1과 적어도 64% 아미노산 서열 동일성, 바람직하게는 적어도 약 65% 아미노산 서열 동일성, 달리 적어도 약 66% 아미노산 서열 동일성, 달리 적어도 약 67% 아미노산 서열 동일성, 달리 적어도 약 68% 아미노산 서열 동일성, 달리 적어도 약 69% 아미노산 서열 동일성, 달리 적어도 약 70% 아미노산 서열 동일성, 달리 적어도 약 71% 아미노산 서열 동일성, 달리 적어도 약 72% 아미노산 서열 동일성, 달리 적어도 약 73% 아미노산 서열 동일성, 달리 적어도 약 74% 아미노산 서열 동일성, 달리 적어도 약 75% 아미노산 서열 동일성, 달리 적어도 약 76% 아미노산 서열 동일성, 달리 적어도 약 77% 아미노산 서열 동일성, 달리 적어도 약 78% 아미노산 서열 동일성, 달리 적어도 약 79% 아미노산 서열 동일성, 달리 적어도 80% 아미노산 동일성, 달리 적어도 약 81 % 아미노산 서열 동일성, 달리 적어도 약 82% 아미노산 서열 동일성, 달리 적어도 약 83% 아미노산 서열 동일성, 달리 적어도 약 84% 아미노산 서열 동일성, 달리 적어도 약 85% 아미노산 서열 동일성, 달리 적어도 약 86% 아미노산 서열 동일성, 달리 적어도 약 87% 아미노산 서열 동일성, 달리 적어도 약 88% 아미노산 서열 동일성, 달리 적어도 약 89% 아미노산 서열 동일성, 달리 적어도 약 90% 아미노산 서열 동일성, 달리 적어도 약 91% 아미노산 서열 동일성, 달리 적어도 약 92% 아미노산 서열 동일성, 달리 적어도 약 93% 아미노산 서열 동일성, 달리 적어도 약 94% 아미노산 서열 동일성, 달리 적어도 약 95% 아미노산 서열 동일성, 달리 적어도 약 96% 아미노산 서열 동일성, 달리 적어도 약 97% 아미노산 서열 동일성, 달리 적어도 약 98% 아미노산 서열 동일성 및 달리 적어도 약 99 % 아미노산 서열 동일성을 갖는다. 바람직한 실시형태에서, 서열번호 1의 상동성 서열은 서열번호 1에 대해 적어도 64%, 바람직하게는 70%, 더욱 바람직하게는 80% 동일하다.
바람직한 실시형태에서, 상기 상동성 폴리펩타이드는 서열번호 1의 hAGT 폴리펩타이드의 단편 또는 돌연변이체로서 O6-알킬구아닌-DNA 알킬트랜스퍼라제 활성을 갖는다.
상기 단편은 적어도 50개, 바람직하게는 100개, 더욱 바람직하게는 150개 아미노산의 크기를 가질 수 있으며, 적어도, AGT 효소의 O6-알킬구아닌-DNA 알킬트랜스퍼라제 활성에 중요한, 상기 정의된 바와 같은 AGT 폴리펩타이드의 "촉매 도메인"을 포함한다. 이들 단편은 당업자에 의해 알려진 일반적 기술을 이용하여 수득될 수 있다.
천연 AGT로부터 유도되는 상이한 돌연변이체 효소가 문헌(Lim A. et al, 1996; Daniels D.S. et al, 2000; Juillerat A. et al, 2003, WO 2005/085470, WO 2004/031405)에 기재되어 있다. 특히, 아미노산 182에서 절두된 돌연변이 Cys62Ala, Lys125Ala, Ala127Thr, Arg128Ala, Gly131Lys, Gly132Thr, Met134Leu, Arg135Ser, Cys150Ser, Asn157Gly, Ser159Glu를 포함하는 20 kDa의 돌연변이체 단백질이 수득되었다(WO 2005/085470에서 이른바 "AGT26" 돌연변이체라 불리고, 또한 WO 2006/114409에서는 "SNAP 26"이라 불림). 이러한 특정 돌연변이체 "SNAP26"은 증강된 표지 활성을 갖는 것으로 밝혀졌다.
본 발명과 관련하여, 더욱 바람직한 AGT 폴리펩타이드의 서열은 WO 2005/085470에 기술된 돌연변이를 포함하며, 돌연변이 위치는 서열번호 1을 고려하여 쉽게 이동될 수 있으며, SNAP26의 출발 메티오닌 부분은 서열번호 1의 위치 32에 있는 메티오닌 부분에 상응한다(따라서, 서열번호 1에 상응하는 것을 얻기 위해서는 WO 2005/085470에 기술된 위치에 31개의 아미노산이 추가되어야 한다).
바람직한 실시형태에서, 본 발명에 유용한 AGT 상동성 서열은, 1 내지 30개, 바람직하게는 6 내지 25개, 특히 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개 또는 23개 아미노산이 다른 아미노산으로 치환되고/되거나 1 내지 40개, 바람직하게는 1 내지 20개, 특히 10 내지 20개의 아미노산, 더욱 바람직하게는 15개 아미노산이 C-말단에서 결실된, 서열번호 1의 천연 AGT 서열에 상응한다.
더욱 바람직한 실시형태에서, AGT 상동성 서열은 서열번호 1과 비교하여 하기의 돌연변이를 포함한다:
(A) Lys31이 Arg로 대체, 또는 Met32이 Ser로 대체, 또는 Cys93이 Ala로 대체, 또는 Lys156이 Ala로 대체, 또는 Ala158이 Thr로 대체, 또는 Arg159이 Ala로 대체, 또는 Gly162이 Lys로 대체, 또는 Gly163이 Thr로 대체, 또는 Met165이 Leu로 대체, 또는 Arg166이 Ser로 대체, 또는 Cys181이 Ser로 대체, 또는 Asn188이 Gly로 대체, 또는 Ser190이 Glu로 대체, 또는 Gly214이 Pro로 대체, 또는 Ser215이 Ala로 대체, 또는 Ser216이 Gly로 대체, 또는 Gly217이 Ile로 대체, 또는 Leu218이 Gly로 대체, 또는 Gly220이 Pro로 대체, 또는 Ala221이 Gly로 대체, 또는 Trp222이 Ser로 대체, 또는
(B) Lys31-Met32이 Arg-Ser로 대체, 또는 Ala158-Arg159이 Thr-Ala로 대체, 또는 Gly162-Gly163이 Lys-Thr로 대체, 또는 Met165-Arg166이 Leu-Ser로 대체, 또는 Gly162-Gly163/Met165-Arg166이 Lys-Thr/Leu-Ser로 대체, 또는 Asn188/Ser190이 Gly/Glu로 대체, 또는 Gly214-Ser215-Ser216-Gly217-Leu218이 Pro-Ala-Gly-Ile-Gly로 대체, 또는 Gly220-Ala221-Trp222이 Pro-Gly-Ser로 대체(바람직하게는, 상기(A)에서 인용되는 임의의 다른 아미노산 대체와 조합됨), 또는
(C) Leu223 이후 절두됨(아미노산 224-238이 결실됨)(바람직하게는, 상기 (A) 또는 (B)에서 인용되는 임의의 다른 아미노산 대체와 조합됨).
바람직한 AGT 상동성 서열은 Leu223 이후 절두되는 것들이다.
바람직한 AGT 상동성 서열은 변형(B) 중 2개가 존재하고, 임의로, Leu223 이후 절두되는 것들이다.
바람직한 AGT 상동성 서열은 변형(B) 중 3개가 존재하고, 임의로, Leu223 이후 절두되는 것들이다.
바람직한 AGT 상동성 서열은 변형(B) 중 4개가 존재하고, 임의로, Leu223 이후 절두되는 것들이다.
바람직한 AGT 상동성 서열은 변형(B) 중 5개가 존재하고, 임의로, Leu223 이후 절두되는 것들이다.
바람직한 AGT 상동성 서열은 변형(B) 중 6개가 존재하고, 임으로, Leu223 이후 절두되는 것들이다.
다른 바람직한 AGT 상동성 서열은 (A)에 기술되는 변형 중에서 선택되는 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개 또는 20개 돌연변이의 조합을 포함하고, 임의로, Leu223 이후 절두되는 것들이다.
더욱더 바람직한 실시형태에서, 본 발명의 AGT 폴리펩타이드는, hAGT 효소에 상동성이고 서열번호 1과 비교하여 돌연변이 Lys31Arg, Met32Ser, Cys93Ala, Lys156Ala, Ala158Thr, Arg159Ala, Gly162Lys, Gly163Thr, Met165Leu, Arg166Ser, Cys181Ser, Asn188Gly, Ser190Glu, Gly214Pro, Ser215Ala, Ser216Gly, Gly217Ile, Leu218Gly, Gly220Pro, Ala221Gly, Trp222Ser를 포함하고 Leu223 후 절두된, 서열번호 2의 SNAP 돌연변이체이다. 서열번호 2의 SNAP 돌연변이체는 인간 6-메틸구아닌-DNA-메틸트랜스라제(NP_002403.2, 서열번호 1)의 아미노산 서열과 77% 상동성 및 마우스 6-메틸구아닌-DNA-메틸트랜스라제(NP_032624.1, 서열번호 18)의 아미노산 서열과 70% 상동성을 갖는다.
더욱더 바람직한 실시형태에서, AGT 효소는, O6-알킬구아닌-DNA 알킬트랜스퍼라제 활성을 갖는, 서열번호 2의 SNAP 돌연변이체 단백질 또는 이의 상동체이다. 바람직하게는, SNAP 돌연변이체 단백질에 대한 상기 상동성 서열은, 적어도, 서열번호 2의 SNAP 돌연변이체 단백질에 대해 80% 초과, 바람직하게는 81% 초과, 더욱 바람직하게는 82% 초과, 더욱 바람직하게는 83% 초과, 더욱 바람직하게는 84% 초과, 더욱 바람직하게는 85% 초과, 바람직하게는 86% 초과, 더욱 바람직하게는 87% 초과, 더욱 바람직하게는 88% 초과, 더욱 바람직하게는 89% 초과, 더욱 바람직하게는 90% 초과, 더욱 바람직하게는 91% 초과, 더욱 바람직하게는 92% 초과, 더욱 바람직하게는 93% 초과, 더욱 바람직하게는 94% 초과, 더욱 바람직하게는 95% 초과, 더욱 바람직하게는 96% 초과, 더욱더 바람직하게는 97% 초과로 동일하고, 상술된 바와 같은 O6-알킬구아닌-DNA 알킬트랜스퍼라제 활성을 갖는다.
O6-알킬구아닌-DNA 알킬트랜스퍼라제 활성을 갖는 상기 상동성 폴리펩타이드는 당업자에게 알려진 단백질 조작 기술 및/또는 새로운 O6-알킬구아닌-DNA 알킬트랜스퍼라제를 생성하고 선택하기 위한 분자적 발전을 이용하여 생성될 수있다. 이러한 기술은, 예를 들어, 서열 내에의 임의의 위치에 변이를 도입하기 위한 표적된 돌연변이유발, 파아지 디스플레이 방법, 포화 돌연변이유발, 에러 유발 PCR, 포화 돌연변이유발 및/또는 에러 유발 PCR 후 이용되는 DNA 셔플링, 또는 수개의 종으로부터의 유전자를 이용하는 패밀리 셔플링이다.
가장 바람직한 실시형태에서, 본 발명의 방법에서 사용되는 AGT 폴리펩타이드는 서열번호 2의 SNAP 돌연변이체이다.
AGT 기질
AGT 효소는 이의 기질인 O6-알킬구아닌-DNA로부터 알킬 그룹을 이의 시스테인 부분 중 하나에 비가역적으로 전달한다. 그러나, 벤질 환의 C4에서 O6-벤질구아닌의 치환은 O6-벤질구아닌 유도체에 대한 AGT의 반응성에 유의하게 영향을 끼치지 않는다. 이러한 특성은 벤질 환의 C4에 부착된 표지를 AGT에 전달하는데 이용되었다(참조: WO 2004/031404 및 WO 2005/085470).
벤질 그룹을 AGT 효소의 활성 부위 시스테인에 전달함으로써 AGT 효소와 반응하는 다수의 O6-벤질구아닌 유도체가 알려져 있다(참조: Damoiseaux et al., ChemBiochem., 2001, WO 2004/031404 및 WO 2005/085470).
바람직한 실시형태에서, 본 발명의 방법에 사용되는 AGT 기질은 하기 화학식 I의 O6 벤질 구아닌 유도체이다:
[화학식 I]
R1-X-CH2-R3-R4-Y
상기 식 중,
- R1은 AGT 폴리펩타이드에 의해 기질로서 인지되는 그룹, 예를 들어, 1 내지 5개의 질소 원자를 포함하는 헤테로방향족 그룹, 바람직하게는 하기 화학식의 푸린 라디칼이고:
(상기 식 중, R5는 수소, 할로겐, 예를 들어, 클로로 또는 브로모, 트리플루오로메틸 또는 하이드록시이고, R6는 수소, 하이드록시 또는 비치환 또는 치환된 아미노이고, R2는 수소, 1 내지 10개의 탄소 원자를 갖는 알킬 또는 사카라이드 부분이다),
- X는 산소 또는 황 원자, 바람직하게는 산소 원자이고,
- R3은 방향족 또는 헤테로방향족 그룹, 또는 CH2에 연결된 이중 결합을 갖는, 임의로 치환된 불포화된 알킬, 사이클로알킬 또는 헤테로사이클릴 그룹, 바람직하게는 페닐, 예를 들어, 파라 또는 메타 위치에서 R4에 의해 치환된 페닐이고,
- R4는 링커 부분이고,
- Y는 반응 그룹,바람직하게는 아미노 그룹이다.
바람직한 실시형태에서, 상기 링커 부분 R4는 가요성 링커(flexible linker)이다. 링커 단위는 가상적인 적용과 관련하여, 즉, AGT를 포함하는 융합 단백질에 기질을 전달하는데 선택된다. 링커는 AGT와의 반응을 방해하지 않으며, 표적 항체의 반응도 방해하지 않는다.
예를 들어, 이는
(a) 하나 이상의 탄소 원자가 산소에 의해 대체되고, 특히, 모든 세번째 탄소 원자가 산소, 예를 들어 1 내지 5개의 에틸렌옥시 단위를 갖는 폴리에틸렌옥시 그룹에 의해 대체되고;
(b) 하나 이상의 탄소 원자가 수소 원자를 수반하는 질소로 대체되고, 인접 탄소 원자가 옥소에 의해 대체되며(아미드 작용기 -NH-CO-로 대표됨);
(c) 하나 이상의 탄소 원자가 산소에 대체되고, 인접 탄소 원자가 옥소로 치환되며(에스테르 작용기 -O-CO-로 대표됨);
(d) 2개의 인접 탄소 원자 사이의 결합이 이중 또는 삼중 결합이고(작용기 -CH=CH- 또는 -C≡C-로 대표됨);
(e) 하나 이상의 탄소 원자가 페닐렌, 포화 또는 불포화된 사이클로알킬렌, 포화 또는 불포화된 비사이클로알킬렌, 가교된 헤테로방향족 또는 가교된 포화 또는 불포화 헤테로사이클릴 그룹으로 대체되고;
(f) 2개의 인접한 탄소 원자가 디설파이드 결합 -S-S-에 의해 대체되는, 1 내지 20개의 탄소 원자, 바람직하게는 5개 내지 15개의 탄소 원자를 갖는 직쇄 또는 측쇄 알킬렌 그룹이거나, 임으로 치환체를 포함하는, 상기 (a) 내지 (f)에서 정의되는 바와 같은, 적어도 2개, 특히, 2개 또는 3개의 알킬렌 및/또는 변형된 알킬렌 그룹의 조합일 수 있다.
고려되는 치환체는, 예를 들어, 알킬, 예를 들어, 메틸, 저급 알콕시, 예를 들어, 메톡시, 저급 아실옥시, 예를 들어, 아세톡시 또는 할로겐, 예를 들어, 클로로이다.
바람직한 실시형태에서, R4는 1 내지 8개의 에틸렌옥시 단위를 갖고, 인접 탄소 원자가 옥소로 치환되는 수소 원자를 수반하는 1 내지 4개의 질소 원자를 추가로 포함하는(아미드 작용기 -NH-CO-로 대표됨), 폴리에틸렌옥시 그룹이다.
더욱 바람직한 실시형태에서, R4는 -CH2-NH-CO-NH-[C2H4-O]n-이고, n은 1 내지 8, 바람직하게는 2 내지 6, 가장 바람직하게는 3이다.
바람직한 실시형태에서, 상기 반응성 그룹은 고체 지지체에 기질의 부착 및 결합을 용이하게 하는 작용 그룹이다. 이러한 작용 그룹은 당해 기술 분야에 널리 알려져 있다. 이들은 아민, 활성화된 에스테르, 아크릴아미드, 아실 아지드, 아실 할라이드, 아실 니트릴, 알데하이드, 케톤, 알킬 할라이드, 무수물, 아릴 할라이드, 아지리딘, 보로네이트, 활성화된 카복실산, 카보디이미드, 디아조알칸, 에폭사이드, 할로아세타미드, 할로플라티네이트, 할로트리아진, 이미도 에스테르, 이소시아네이트, 이소티오시아네이트, 말레이미드, 포스포르아미다이트, 솔릴 할라이드, 설포네이트 에스테르 및 설포닐 할라이드를 포함한다. 바람직하게는, 아민 그룹 -NH2이다.
반대측에서, 고체 지지체는 이러한 반응성 그룹에 상응하는 상보적 그룹으로 작용화되어야 한다. 이들 반응성 그룹 각각에 상응하는 상보적 그룹은 당해 기술 분야에 널리 알려져 있다. 이들은, 예를 들어, WO 2010/107433의 표 1에 나타나 있다.
바람직한 실시형태에서, 본 발명에 사용되는 AGT 기질은 하기 화합물이다:
또 다른 바람직한 실시형태에서, 본 발명의 방법에 사용되는 AGT 기질은 하기 화학식을 갖는 "SNAP-cell®505"로 표시되는 형광 링커이다:
이러한 벤질구아닌 유도체는 SNAP 도메인과의 특이적 상호작용을 위한 벤질 푸린 그룹(구아닌)뿐만 아니라 마이크로구 표현에의 공유적 커플링을 위한 하나의 유리 아민 그룹을 갖는다. 이는 New England BioLabs에 의해 시판되고 있으며, 본 발명의 마이크로입자의 표면에 성공적으로 커플링되었다.
본 발명의 기질은 일반적으로 당해 기술 분야에 공지된 표준 방법으로 제조된다. 특정한 방법은, 예를 들어, 특허원 WO 2005/085470에 기재되어 있다.
고체 지지체에 대한 AGT 기질의 커플링
본 발명은 고체 지지체에 공유적으로 커플링시킨 AGT 기질을 포함한다. 본 발명과 관련하여, AGT 기질은 상기 고체 지지체에 영구적으로 부착되는 경우 고체 지지체에 "공유적으로 커플링"되며, 시간이 경과에 따라 탁착되거나 이탈되지 않을 것이다. 본 발명에 따라, AGT 기질은 장기간 저장, 예를 들어, 통상적으로 6개월 이하의 저장 동안 부착되어 있는 상태로 남아 있는 경우 상기 고체 지지체에 영구적으로 부착된다. 지금까지 다수의 커플링 공정이 기술되어 왔다. AGT 기질이 고체 지지체에 영구적으로 부착되는 한, 이들 커플링 공정 중 임의의 공정을 본 발명의 면역분석에 사용할 수 있다.
고체 지지체에 대한 AGT-항원 융합 단백질의 커플링
본 발명은 추가로 하기 2개 단계를 포함하는 고체 지지체에 항원을 커플링시키는 방법을 포함한다: i) 고체 표면을 AGT 기질(예를 들어, BG-PEG-아미노)로 코팅 및 ii) 앵커로서 AGT를 사용하여 키메라 [AGT-항원] 융합 단배질의 고정화(참조: 도 1). 상기 AGT 기질로 코팅하기 전에, 고체 표면은 AGT 기질이 고체 표면에 공유적으로 부착되도록 바람직하게는 최적화된 2단계 카보디이미드 공정(Kufer SK, Eur. Biophys.J. 2005)을 사용하여 유리하게 작용화시킬 수 있다. 이들 단계가 수행되면, 고체 표면은 키메라 [AGT-항원] 융합 단백질에 비가역적으로 결합되는 AGT 기질을 포함한다. 이 반응의 높은 특이성 때문에, 융합 단백질은 AGT 효소의 시스테인-함유 도메인을 통해 배타적으로 커플링되고, 이에 의해 항원과의 상호작용을 위해 접근가능한 항원을 잔류시킨다.
이러한 커플링 공정은 고체 지지체 상에 지향적 방식으로 항원의 결합을 가능하게 하기 때문에 매우 유리하다. 또한, 이 항원 커플링 공정은, 면역글로불린 G 및 잠재적으로 면역글로불린 M의 포획 효율을 증가시키도록, 고체 표면 상에서 다량체성 항원 조직화를 유리하게 수득할 수 있게 한다. 결과적으로, 본원의 실시예 부분에서 개발된 항원 커플링된 마이크로구는, 표준 비지향적 아민 커플링 공정에 의해 생성된 항원-커플링된 마이크로구와 비교하여, 특이적 항체의 향상된 포획을 나타냈다(참조: 하기 실험 부분 및 도 3). 마지막으로, 이러한 항원 커플링 공정은 항원-접합된 마이크로구의 고도 커플링 효율 및 장기간 안정성(4℃에서 6개월 이상)을 수득할 수 있게 한다.
본 발명의 면역분석에서, 공유적 커플링은, 바람직하게는, (이는 상술된 바와 같은 반응성 그룹 Y를 포함한다.) AGT 기질을 WO 2010/107433(이의 기술이 본원에 참조로 포함됨)의 표 1에 기술되는 것들과 같은 상보적 그룹으로 미리 작용화된 고체 지지체와 접촉시킴으로써 수행된다.
따라서, 바람직한 실시형태에서, 본 발명의 방법은, AGT 기질과 접촉 전, AGT 기질의 반응성 그룹에 대해 상보적인 그룹으로 작용화된 고체 지지체를 사용한다.
AGT 기질을 고체 지지체의 표면에 공유적으로 커플링시키기 위한 바람직한 통상의 공정은 카보디이미드 반응에 기초하고, 수용성 카보디이미드를 사용한다. 이러한 공정에 따라, 고체 지지체는 반응성 아민- 또는 설프하이드릴-포함 AGT 기질의 부착에 이용가능한 표면 카복실 그룹을 갖는다. 따라서, 이러한 바람직한 실시형태에서, 본 발명의 방법은 AGT 기질과 접촉 전 표면 카복실 그룹으로 작용화된 고체 지지체를 사용한다.
이러한 경우, 본 발명의 방법의 제1 단계는 고체 지지체를 코팅하는 카복실 그룹을 활성화시키는 것이다. 이러한 활성화는 통상적으로 소위 "활성화 완충액", 예를 들어, 50 mg/mL EDAC 용액 또는 50 mg/mL S-NHS 용액을 가함으로써 수행된다. 이들 용액은 시판된다. 고체 지지체의 활성화는 통상적으로 제조자의 지시에 따라 수분(예: 5분 내지 30분) 동안 실온에서 상기 지지체를 활성화 완충액과 함께 인큐베이션함으로써 수행된다.
중요하게도, AGT 기질의 고체 지지체에의 공유적 커플링은 AGT 기질 용해도 및 비드의 통합성(내부 형광색소)이 보존되도록 특정 조건 하에 수행되어야 한다. 본 발명자들은 AGT 기질이 0 내지 20%의 디메틸설폭사이드(DMSO)를 포함하는 "공유적 커플링" 완충액에 현탁되어야 한다는 것을 관측하였다. 특히, 본 발명자들은 20%를 초과하는 DMSO 농도가 본 발명의 방법의 검출 단계에 영향을 끼칠 수 있다는 것을 관측하였다. 바람직하게는, 상기 완충액은 0 내지 20%의 DMSO, 더욱 바람직하게는 10% 내지 20%의 DMSO를 포함하는 PBS 완충액이다.
유리하게는, AGT 기질에 공유적으로 부착되지 않은 고체 지지체 상의 비특정 부위는 임의의 통상적인 수단, 예를 들어, 1%의 소혈청 알부민(BSA) 또는 임의의 포화 단백질(예: 카제인)을 포함하는 차단 완충액을 사용하여 추가로 차단될 수 있다.
일단 본 발명의 고체 지지체가 (바람직하게는 카보디이미드 공유 결합을 통해) AGT 기질과 공유적으로 커플링되면, 고체 지지체는 표적 항체에 의해 특이적으로 인지되는 에피토프를 상기 지지체에 커플링시키도록 본 발명의 융합 단백질과 접촉된다.
이러한 커플링 단계는 특정 조건 하에서 다시 수행되어야 한다. 실제로, AGT 효소의 촉매 부위 및 융합 단백질에 의해 수반되는 항원/에피토프의 입체형태적 구조는 커플링 공정 동안 보존되어야 한다. 본 발명자들은 융합 단백질이 커플링에 효과적이도록 디티오트레이톨(DTT)-포함 완충액, 바람직하게는 PBS/DTT 완충액 중에 현탁되어야 한다는 것을 확인하였다. 유리하게는, 상기 커플링 완충액은 tween 20을 포함한다. 실제로, 본 발명자들은 커플링 매질에 tween 20을 첨가하는 것이 비드 응집을 피하는 것을 돕는다는 것을 관측하였다. 바람직하게는, 커플링 완충액은 0,02% tween 20을 포함한다. 더욱 바람직하게는, 본 발명의 공유적 커플링 완충액은 0,02% tween 20 및 1 mM DTT를 포함하는 pH 7.4의 PBS 완충액이다.
다른 커플링 조건은 통상적인 것이다. 바람직하게는, AGT 기질의 공유적 커플링 및 융합 단백질의 고체 지지체에 대한 커플링은 실온에서 수행된다. 고체 지지체가 형광 표지되는 경우, 상기 공정은 더욱 바람직하게는 암흑 속에서 수행된다.
본 발명은 O6-알킬구아닌-DNA 알킬트랜스퍼라제 활성을 갖는 AGT 폴리펩타이드를 작용화된 고체 지지체 상에 공유적으로 커플링시키는 방법을 포함하고, 상기 방법은
a) 상기 작용화된 고체 지지체를 활성화시키는 단계,
b) 0 내지 20%의 DMSO를 포함하는 완충액 중에 현탁된, AGT 폴리펩타이드의 기질을 상기 기질이 상기 지지체에 공유적으로 부착되기에 적합한 조건에서 첨가하는 단계, 및
c) 상기 AGT 폴리펩타이드를 PBS/DTT 완충액 중의 단계 b)의 기질-코팅된 지지체와 접촉시키는 단계를 포함하고,
비결합된 분자는 단계 b) 및 c) 이후 세척 제거된다.
세척은 임의의 종류의 적합한 세척 완충액을 사용하여 수행될 수 있다. 이러한 완충액은 통상적으로 당업자에 의해 사용되며, 본원에서 추가로 상세히 기술할 필요가 없다. 바람직하게는, PBS 완충액이 사용된다.
본원에서 사용되는 "적합한 조건"은 통상의 것이다. 바람직하게는, AGT 기질의 공유적 커플링은 실온에서, 고체 지지체가 형광 표지되는 경우, 암흑 속에서 수행된다.
고체 지지체의 작용화는 (상술된 바와 같은) 임의의 통상의 수단에 의해 수행될 수 있다. 상기 작용화된 고체 지지체의 활성화도 상응하게 수행된다. 바람직한 실시형태에서, 상기 고체 지지체는 표면 카복실 그룹으로 작용화되고, 통상의 활성화 완충액, 예를 들어, 50 mg/mL EDAC 용액 또는 50 mg/mL S-NHS 용액으로 더욱 활성화된다.
바람직한 실시형태에서, DTT는 PBS/DTT 완충액 중 1 mM의 농도이다.
본 발명은 또한 상기 방법에 의해 수득되는 고체 지지체 및 본 발명의 면역분석에서의 고체 지지체의 용도에 관한 것이다.
이때, 상기 고체 지지체는, 예를 들어, 0.5 g/L 아지드화나트륨, 0.1% BSA, 0.02% tween 20 및/또는 1 mM DTT를 포함하는, 통상의 저장 완충액 중에 저장될 수 있다.
이들 모든 커플링 단계들은 바람직하게는 살아있는 세포가 없는 완충액 중에서 시험관내에서 수행되므로 내인성 AGT 효소와의 반응을 고려할 필요가 없으며, 따라서 (외인성) AGT 융합 단백질의 반응은 고도로 특이적이다.
고체 지지체
본 발명의 방법에 사용될 수 있는 고체 지지체는, 서로 특이적으로 식별될 수 있는 한, 임의의 종류의 것, 예를 들어, 시험관, 미세역가 웰 (microtiter well), 시트, 비드, 칩 및/또는 마이크로입자일 수 있다. 이러한 식별은, 예를 들어, 고체 지지체가 공간 상 떨어져 있거나 (예: 미세역가판 (microtiter plate)에서의 웰 또는 칩 상의 상이한 위치) 상이하게 표지되는 경우, 가능하다. 따라서, "고체 지지체"는 광의로, 즉, (플레이트 또는 바이오칩의 경우) 전체 고체 지지체의 구분된 작은 부분 또는 공통의 검출가능한 특성을 공유하는 다수의 동일한 마이크로입자(본원에서 마이크로입자 "서브세트"라 칭함)를 나타내는 것으로 이해되어야 한다.
바람직한 실시형태에서, 본 발명의 면역분석에 사용된 고체 지지체는, 고체 지지체에 의해 포함된 항원을 정확하게 결정할 수 있도록, 본질적으로 식별가능해야 한다. 이어서, 항원-커플링된 및 식별가능한 고체 지지체는 특이적 인간 면역글로불린을 위한 포착 시약으로서 사용되고, 따라서 환자의 생물학적 샘플과 접촉된다.
바람직한 실시형태에서, 본 발명에 사용되는 고체 지지체는 이들의 특정한 위치, 크기, 직경, 중량, 입도측정 및/또는 표지화에 의해 특이적으로 식별될 수 있다. 이러한 표지는, 예를 들어, 형광색소, 형광단, 발색단, 방사성동위원소, 질량 태그(mass tag) 또는 당해 기술 분야에 알려진 임의의 종류의 검출가능한 택이다.
본 발명에 사용되는 고체 지지체는 임의의 물질, 예를 들어, 폴리스티렌, 셀룰로즈, 니트로셀룰로즈, 유리, 세라믹, 수지, 고무, 플라스틱, 실리카, 실리콘, 금속 및/또는 중합체로 제조될 수 있다. 중합체성 물질은 브롬화된 폴리스티렌, 폴리아크릴산, 폴리아크릴로니트릴, 폴리아미드, 폴리아크릴아미드, 폴리아크롤레인, 폴리부타디엔, 폴리카프롤락톤, 폴리카보네이트, 폴리에스테르, 폴리에틸렌, 폴리에틸렌 테레프탈레이트, 폴리디메틸실록산, 폴리이소프렌, 폴리우레탄, 폴리비닐아세테이트, 폴리비닐클로라이드, 폴리비닐피리딘, 폴리비닐벤질클로라이드, 폴리비닐톨루엔, 폴리비닐리덴 클로라이드, 폴리디비닐벤젠, 폴리메틸메타크릴레이트, 폴리락타이드, 폴리글리콜라이드, 폴리(락타이드-코-글리콜라이드), 폴리안하이드라이드, 폴리오르토에스테르, 폴리포스파젠, 폴리포소파제, 폴리설폰, 또는 허용가능한 이의 조합을 포함한다. 이들 지지체 대부분은 시판된다. 예를 들어, 폴리스티렌, 폴리아크릴아미드, 폴리아크릴레이트 또는 라텍스와 같은 합성 중합체로부터의 비드는 Bio-Rad Laboratories(Richmond, Calif.) 및 LKB Produkter(Stockholm, Sweden)와 같은 다수의 공급원으로부터 시판된다. 아가로즈, 가교-결합된 아가로즈, 글로불린, 데옥시리보즈 핵산 및 리포좀과 같은 천연 고분자 및 입자로부터 형성된 비드가 Bio-Rad Laboratories, Pharmacia(Piscataway, NJ) 및 IBF(France)와 같은 공급원으로부터 시판된다. 폴리아크릴아미드 및 아가로즈의 공중합체로부터 형성되는 비드가 IBF 및 Pharmacia와 같은 공급원으로부터 시판된다.
중합체성 지지체가 사용되는 경우, 카복실 그룹을 포함하는 모노머를 중합체에 포함시킴으로써 카복실 그룹이 고체 지지체의 표면에 추가될 수 있다(예: 아크릴산, 메타크릴산, 이타콘산 등). 달리, 상술된 바와 같이, 카복실 그룹으로 전환될 수 있는 다른 전구체 반응성 그룹을 갖는 중합체에 대한 추가의 화학적 반응에 의해 (예를 들어, 말산 무수물과 같은 무수물의 가수분해에 의해, 또는 표면 메틸롤 또는 알데하이드 말단 그룹의 산화에 의해) 카복실 그룹이 상기 지지체에 추가될 수 있다.
바람직한 실시형태에서, 본 발명에 사용되는 고체 지지체는 마이크로입자이다. 상기 마이크로입자는 바람직하게는 1 mm 미만의 직경, 바람직하게는 약 0.1 내지 약 1,000 ㎛의 직경을 갖는다. 마이크로입자가 임의의 크기를 가질 수 있지만, 바람직한 크기는 1 내지 100 ㎛이고, 더욱 바람직하게는 2 내지 50 ㎛, 더욱 바람직하게는 3 내지 25 ㎛, 및 더욱더 바람직하게는 약 6 내지 12 ㎛ 이다. 마이크로입자는 임의의 규칙적인 모양을 갖는 물질로 제조된다. 바람직한 모양은 구형이다. 그러나, 임의의 다른 모양의 입자도 이러한 변수가 본 발명의 특성에 중요하지 않으므로 본 발명에 사용될 수 있다. 입자의 모양은, 예를 들어, 고분해 슬릿-스캐닝 방법으로, 유동 세포측정에 의해 식별되는 추가의 차별 변수로서 사용될 수 있다.
본원에서 용어 "마이크로입자", "마이크로구" 또는 "마이크로비드"는 이들이 본질적으로 마이크로미터 범위에 속하는 전체 직경을 갖는 작은 입자를 말하기 때문에 상호교환적으로 사용되고 동등한 의미를 갖는다. 용어 "나노구", "나노입자" 또는 "나노비드"는 본질적으로 나노미터 범위에 속하는 전체 크기를 갖는 작은 입자를 말한다. 본원에서 사용되는 일반 용어인 입자, 구 또는 비드는 본 발명의 방법에서 고체 지지체로서 효과적으로 사용될 수 있는 마이크로입자 및 나노입자 모두를 말한다.
본 발명과 관련하여, 마이크로입자의 일 "서브세트"는 동일한 특성을 갖고 동일한 에피토프로 코팅된 다수의 동일한 마이크로입자에 상응한다. 중요하게도, 마이크로입자 서브세트 각각은 하나 이상의 특성 (예: 위치, 크기, 직경, 중량, 입도측정 및/또는 표지화)에 의해 마이크로입자군의 다른 서브세트로부터 구별되어야 한다.
바람직한 실시형태에서, 상이한 마이크로입자 서브세트는 이들이 (예를 들어, 형광색소, 형광단, 발색단, 방사성동위원소, 질량 태그 또는 당해 기술 분야에 공지된 임의의 종류의 검출가능한 택으로) 상이하게 표지되기 때문에 구별될 수 있다.
더욱 바람직한 실시형태에서, 상이한 마이크로입자 서브세트는, US 5,736,330, US 5,981,180, US 6,057,107, US 6,268,222, US 6,449,562, US 6,514,295, US 6,524,793 및 US 6,528,165에서 제시되는 바와 같이, 이들이 상이하게 형광 표지되기 때문에 구별될 수 있다. 더욱 정확히, 이들 상이한 서브세트는 상이한 형광 염료 및/또는 상이한 농도의 하나 이상의 형광 염료로 염색될 수 있다. 따라서, 상이한 서브세트는 각각의 마이크로입자가 속하는 서브세트를 결정하기 위해 (즉, 서브세트에 따라 마이크로입자를 분류하기 위해) 측정되고 측정 시스템으로서 사용될 수 있는 상이한 형광 특징(예: 상이한 형광 파장(들), 상이한 형광 강도 등)을 가질 수 있다.
바람직한 실시형태에서, 본 발명에 사용되는 마이크로입자는, 본원에서 참조로서 도입되는 EP 1 204 869에 기재되는 바와 같이, 형광 염료로 내부적으로 표지된다.
이들 마이크로입자는 또한 자석 또는 초상자성, 상자성 및 강자성 금속 산화물로 이루어진 그룹 중에서 선택되는 자기적으로 반응하는 금속 산화물을 포함할 수 있다. 자성 비드는, 예를 들어, Dynal Inc.(Great Neck, NY)와 같은 공급원으로부터 시판되거나, 예를 들어, U.S. 4,358,388; US 4,654,267; US 4,774,265; US 5,320,944; 및 US 5,356,713에 기술되는 바와 같은 당해 기술 분야의 공지된 방법으로 제조될 수 있다. 바람직한 실시형태에서, 본 발명에 사용되는 고체 지지체는 자성을 띤다.
더욱 바람직한 실시형태에서, 본 발명에 사용되는 고체 지지체는, 상표명 MagPlex으로 Luminex Corp에 의해 시판되는 것과 같이, 리간드의 공유적 커플링을 위해 표면 카복실 그룹을 포함하는 작용성 중합체 외부 코트에 캡슐화된(encapsulated) 자철광(magnetite)을 갖는 형광 염료로 내부적으로 표지된 마이크로입자이다.
또한, 스펙트럼으로 구분되는 영역으로 칼라 코드화된 카복실화된 폴리스티렌 마이크로입자인 MicroPlex 마이크로구(Luminex 시판)를 사용할 수도 있다. 이들 영역은 하나의 단일 샘플 용적으로부터 동시에 100개 이하의 상이한 분석물에 대한 조사를 가능하게 하는 xMAP 기구에 의해 신속하게 구별될 수 있다.
또한, 혈청 분석시 비-특이적 결합이 감소되도록 최적화된 MicroPlex 마이크로구의 특정 제형인 SeroMAP 마이크로구(Luminex 시판)를 사용할 수도 있다.
결합된 항체의 검출
본 발명은 에피토프 및 따라서 검출가능한 고체 지지체에 결합된 항체의 존재를 검출하는 것을 포함한다. 마이크로입자의 어떤 서브세트에 항체가 결합되었는가를 분석함으로써, 어떤 항체가 생물학적 샘플에 존재하고 이로써 시험된 피험자가 어떤 병원체에 의해 감염되었는가를 쉽게 추론할 수 있다.
임의의 공지된 기술을 이용하여 고체 지지체에 결합된 항체의 존재를 검출할 수 있다. 예를 들어, 하기 실시예에 기재되는 바와 같이, 피험자 면역글로불린의 불변부를 특이적으로 인지하는 표지된 제2 항체가 사용될 수 있다. 항체에 커플링된 고체 지지체와 커플링되지 않은 고체 지지체를 구분하도록 검출-항체의 표지화는 고체 지지체의 표지화과 달라야 한다는 것을 주목하는 것이 중요하다.
달리, 감염된 동물 또는 인간으로부터의 혈청에 존재하는 면역글로불린은 1-단계 항체 표지화 프로토콜을 이용하여 (Lightning-LinkTM R-피코에리트린 접합 키트 - Innova Biosciences) R-피코에리트린 (R-PE)에 직접적으로 접합될 수 있다. 전체 공정을 위한 실제 시간은 통상적으로 20 내지 30초이고, 100%의 회수율로 소량의 면역글로불린 표지화를 가능하게 한다. 이러한 공정은 다중-면역분석 실험에서 접합된 항-종 항체 및 스트렙트아비딘-R-피코에리트린과 같은 제2 시약을 필요로 하지 않는다.
형광 염료로 내부적으로 표지된 마이크로입자가 사용되는 경우, 형광 검출 기구에는 마이크로구의 유형을 검출하기 위한 제1 레이저 및 특정 검출 항체에 접합된 형광단을 여기시킴으로써 포획된 IgM 또는 IgG 의 정량화를 가능하게 하는 제2 레이저가 구비되어야 한다.
이러한 접근은, 이의 광범위한 다중화 능력 및 낮은 검출 한계로 인해, 종래의 ELISA 측정에 비해 실질적인 비용 및 샘플 절약을 제공한다. 또한, 선택된 마이크로구 세트는 MagPix(Luminex Corporation)와 같은 저렴하고 소형이며 강력한 형광 검출 시스템에 적용가능하다.
이러한 실시형태에서, 본 발명의 방법은 유동 분석 수단을 사용함으로써 웰 당 100개 유형 이하의 커플링된 마이크로구를 동시에 분석할 수 있으며, 현재 사용되는 시스템 및 방법의 민감도 보다 약 수 개의 자릿수가 클 것으로 예상되는 대단히 증강된 민감도를 제공한다.
흥미롭게도, 본 발명의 방법은 인간 또는 동물 개체에서 다수의 감염을 진단하도록 대용량처리 혈청 스크리닝을 수행하는 것을 가능하게 한다.
다중 면역분석 키트
본 발명은 다중 항원에 대한 항체의 검출에 사용하기에 적합한 키트를 포함한다. 본원에 기재된 항원 또는 에피토프 중의 어느 하나를 키트에 도입할 수 있다.
본 발명은 바이러스, 세균, 기생충, 동물, 프리온, 효모 및 진균 단백질을 검출하기 위한 키트를 포함한다.
상기 키트는 적어도 2개의 고체 지지체를 포함한다. 본 바명은 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 20, 25, 30, 40, 50, 100개 등의 고체 지지체를 포함하는 키트, 및 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 20, 25, 30, 40, 50, 100개 등의 상이한 에피토프를 포함하는 키트를 포함한다. 키트는 함께 혼합된 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 20, 25, 30, 40, 50, 100개 등의 고체 지지체를 포함한다. 에피토프는 표적 항체에 의해 인지될 수 있다.
한 가지 실시형태에서, 키트는 본 발명의 방법의 단계(c)에서 수득된 제1 고체 지지체(여기서, 상기 지지체는 AGT 기질에 공유적으로 커플링된 제1 AGT-항원 융합 단백질을 포함한다.) 및 AGT 기질에 공유적으로 커플링된 제2 AGT-항원 융합 단백질을 포함하는 제2 고체 지지체를 포함한다.
한 가지 실시형태에서, 키트는
AGT 기질에 공유적으로 커플링된 제1 AGT-항원 융합 단백질을 포함하는 제1 고체 지지체,
AGT 기질에 공유적으로 커플링된 제2 AGT-항원 융합 단백질을 포함하는 제2 고체 지지체,
AGT 기질에 공유적으로 커플링된 제3 AGT-항원 융합 단백질을 포함하는 제3 고체 지지체,
AGT 기질에 공유적으로 커플링된 제4 AGT-항원 융합 단백질을 포함하는 제4 고체 지지체,
AGT 기질에 공유적으로 커플링된 제5 AGT-항원 융합 단백질을 포함하는 제5 고체 지지체,
AGT 기질에 공유적으로 커플링된 제6 AGT-항원 융합 단백질을 포함하는 제6 고체 지지체,
AGT 기질에 공유적으로 커플링된 제7 AGT-항원 융합 단백질을 포함하는 제7 고체 지지체,
AGT 기질에 공유적으로 커플링된 제8 AGT-항원 융합 단백질을 포함하는 제8 고체 지지체,
AGT 기질에 공유적으로 커플링된 제9 AGT-항원 융합 단백질을 포함하는 제9 고체 지지체 및
AGT 기질에 공유적으로 커플링된 제10 AGT-항원 융합 단백질을 포함하는 제10 고체 지지체를 포함한다.
다른 실시형태에서, 키트는 AGT 기질에 공유적으로 커플링된 2, 3, 4, 5, 6, 7, 8, 9, 11, 12, 13, 14, 15, 16, 20, 25, 30, 40, 50 또는 100개 AGT-항원 융합 단백질을 포함하는 2, 3, 4, 5, 6, 7, 8, 9, 11, 12, 13, 14, 15, 16, 20, 25, 30, 40, 50 또는 100개 고체 지지체를 포함할 수 있다.
- 한 가지 실시형태에서, 키트는 제1 표적 항체에 의해 인지되는 제1 에피토프와 공유적으로 커플링되는 제1 고체 지지체,
제2 표적 항체에 의해서는 인지되나 상기 제1 표적 항체에 의해서는 인지되지 않는 제2 에피토프와 공유적으로 커플링되는 제2 고체 지지체를 포함하고,
상기 적어도 2개의 고체 지지체는 서로로부터 특이적으로 식별될 수 있으며 2개의 상이한 표적 항체의 검출을 가능하게 한다.
바람직한 실시형태에서, 본 발명은 생물학적 샘플 중의 적어도 2개의 표적 항체의 검출을 위한 키트를 포함하고, 상기 키트는
(a) O6-알킬구아닌-DNA 알킬트랜스퍼라제 활성을 갖는 AGT 폴리펩타이드 및 제1 표적 항체에 의해서는 인지되는 제1 에피토프를 포함하는 제1 융합 단백질에 공유적으로 커플링되는 AGT 기질을 포함하는 제1 고체 지지체, 및
b) O6-알킬구아닌-DNA 알킬트랜스퍼라제 활성을 갖는 AGT 폴리펩타이드 및 제2 표적 항체에 의해서는 인지되나 상기 제1 표적 항체에 의해서는 인지되지 않는 제2 에피토프를 포함하는 제2 융합 단백질에 공유적으로 커플링되는 AGT 기질을 포함하는 제2 고체 지지체를 포함한다.
바람직한 실시형태에서, 키트는 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 20, 25, 30, 40, 50, 100개 등의 상이한 바이러스 에피토프를 포함한다.
바람직한 실시형태에서, 키트는 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 20, 25, 30, 40, 50, 100개 등의 상이한 베균 에피토프를 포함한다.
키트는 바이러스, 세균 및/또는 기생충에 특이적일 수 있다.
키트는 바이러스 또는 세균 부류에 특이적일 수 있거나, 유사하게 관련된 임상 증상(즉, 소아기 질환, 호흡 또는 출혈성 증후군 등)에 기초할 수 있다.
키트는 면역글루불린에 특이적일 수 있고, 여기서 키트는 IgG1, IgG2, IgG3, IgG4, IgA, IgM, IgE 및 IgG 합계로부터 선택된 적어도 2, 3, 4 또는 5개 면역글로불린에 대한 항체를 검출한다.
키트는 바이오테러(bioterrorism) 병원체에 특이적일 수 있고, 여기서 키트는 프란시셀라 툴라렌시스(Francisella tularensis), 바실루스 안트라시스(Bacillus anthracis), 클로스트리디움 보툴리눔(Clostridium botulinum), 예르시니아 페스티스(Yersinia pestis), 천연두(Smallpox), 마르부르그 바이러스, 에볼라 바이러스, 라사 바이러스 및 마추포 바이러스 단백질로부터 선택된 적어도 2, 3, 4 또는 5개 단백질을 검출한다.
키트는 플루 바이러스에 특이적일 수 있고, 여기서 키트는 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 상이한 인플루엔자 또는 SARS 단백질에 대한 항체를 검출한다.
키트는 폭스바이러스에 특이적일 수 있고, 여기서 키트는 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개의 상이한 폭스바이러스에 대한 항체를 검출한다. 폭스바이러스는 오르소폭스(천연두 바이러스/바리올라, 백시니아 바이러스(http://en.wikipedia.org/wiki/Vaccinia), 우두 바이러스(http://en.wikipedia.org/wiki/Cowpox), 또는 원숭이 천연두 바이러스 http://en.wikipedia.org/wiki/Monkeypox), 파라폭스(orf 바이러스, 가성 우두, 소 구진성 내구염 바이러스), 야타폭스(타나폭스 바이러스(http://en.wikipedia.org/wiki/Tanapox), 야바 원숭이 종양 바이러스(http://en.wikipedia.org/wiki/Yaba_monkey_tumor_virus)) 또는 몰루시폭스(http://en.wikipedia.org/wiki/Molluscum_contagiosum)일 수 있다.
본 발명은 암 및 종양 항원, 신장 독성 마커, 사이토킨, 케모킨, 성장 인자, 자가면역 질환과 관여하는 항원 및 면역글로불린을 포함하는 인간 단백질에 대한 항체를 검출하기 위한 키트를 포함한다.
본 발명은 알레르기 항원에 대한 항체를 검출하기 위한 키트를 포함한다.
바람직한 실시형태에서, 적어도 하나의 에피토프는 바이러스 에피토프이다. 바람직한 실시형태에서, 상기 제1 및/또는 제2 에피토프는 하기로 이루어진 그룹 중에서 선택되는 바이러스 단백질 상에 존재한다: 서열번호 3의 뎅기 바이러스 1의 EDIII 단백질, 서열번호 4의 뎅기 바이러스 2의 EDIII 단백질, 서열번호 5의 뎅기 바이러스 3의 EDIII 단백질, 서열번호 6의 뎅기 바이러스 4의 EDIII 단백질, 서열번호 7의 웨스트 나일 바이러스의 EDIII 단백질, 서열번호 8의 황열 바이러스의 EDIII 단백질, 서열번호 9의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 10의 지카 바이러스의 EDIII 단백질, 서열번호 11의 베셀스브론 바이러스의 EDIII 단백질, 서열번호 12의 로시오 바이러스의 EDIII 단백질, 서열번호 13의 머레이 뇌염 바이러스의 EDIII 단백질, 서열번호 14의 세인트-루이스 뇌염 바이러스의 EDIII 단백질, 서열번호 54에 의해 인코딩되는 유전형 1의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 55에 의해 인코딩되는 유전형 2의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 56에 의해 인코딩되는 유전형 4의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 57에 의해 인코딩되는 유전형 5의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 58에 의해 인코딩되는 라벤스버그 바이러스의 EDIII 단백질, 및 HIV1, HIV2, B형 간염 바이러스, C형 간염 바이러스, E형 간염 바이러스, 웨스트-나일 바이러스 및 HPV 16, 18, 31, 33, 35, 39, 45, 51, 52, 56, 58, 59, 66 및 68와 같은 종양 HPV 스트레인의 바이러스 단백질.
바람직하게는, 이러한 키트는 또한 고체 지지체에 결합된 적어도 2개의 표적 항체를 검출하기 위한 수단을 포함한다. 상기 수단은 더욱 바람직하게는 표적 항체의 불변부를 인지하는 제2 항체이다. 상기 제2 항체는 표지될 수 있으며, 단 표지가 고체 지지체 상에 존재하는 것과 동일하지 않아야 한다. 그러나, 감염성 병원체(들)에 관한 정보가 항체에 결합된 고체 지지체의 확인에 의해서만 제공되기 때문에, 고체 지지체(들)에 결합된 항체를 검출하는데 사용되는 모든 제2 항체에 대해 동일한 표지를 이용할 수 있다.
본 발명의 키트는 세척 완충액, 필수 플라스틱웨어 등과 같이 표준 시약으로 인정되는 기타 성분들을 포함할 수 있다.
바람직한 실시형태에서, 본 발명의 키트는, 예를 들어, 상술된 바와 같은 마이크로입자의 서브세트인, 적어도 10개, 바람직하게는 적어도 50개, 더욱 바람직하게는 적어도 100개의 상이하게 커플링된 고체 지지체를 포함한다.
더욱 바람직한 실시형태에서, 상기 고체 지지체는 마이크로구, 예를 들어, 표면 카복실 그룹을 포함하는 작용성 중합체 외부 코트에 캡슐화된 자철광을 갖는 형광 염료로 내부적으로 표지된 마이크로구이다.
또 다른 바람직한 실시형태에서, 본 발명의 키트 중의 상기 고체 지지체는 하나 이상의 단일 구획(single compartment)에서 함께 혼합된다.
유리하게는, 본 발명의 키트는 통상의 지지체(들), 예를 들어, 상술된 바와 같은 상이한 항원-코팅된 마이크로입자 서브세트를 포함하는 미세역가판을 포함한다. 바람직한 실시형태에서, 상기 마이크로입자 서브세트는 하나 이상의 구획(예: 웰 또는 튜브)에서 함께 혼합된다. 이러한 디바이스가 도 11에 도시되어 있다.
본 발명의 키트는 또한 상기한 항원-코팅된 마이크로입자 서브세트를 포함하는 수용체(예: 튜브)를 포함할 수 있다.
본 발명은 또한 피험자의 생물학적 샘플로부터의 적어도 2개, 바람직하게는 적어도 10개, 더욱 바람직하게는 적어도 50개, 더욱더 바람직하게는 적어도 100개의 표적 항체를 검출하기 위한 본 발명의 키트의 용도에 관한 것이다.
바람직한 실시형태에서, 본 발명의 키트는 동일한 지역의 풍토병적 바이러스 또는 기생충에 의한 감염시 생성되는 적어도 2개, 바람직하게는 적어도 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 20, 25, 30, 40, 50 또는 100개의 표적 항체를 검출하는데 사용된다. 예를 들어, 본 발명의 키트는 아프리카 지역에서 특이적인 바이러스 또는 기생충의 항원, 예를 들어, 뎅기 바이러스 1형, 2형, 3형, 4형, 황열 바이러스, 웨스트-나일 바이러스, 우수투 바이러스, 지카 바이러스, 베셀스보론 바이러스, 샤몬다 바이러스, 리프트 계곡 열 바이러스, 치쿤구니아 바이러스, 크리미아-콩고 출혈 열 바이러스, 에볼라 바이러스, 마르부르그 바이러스, 리사 바이러스, C형 간염 바이러스, E형 간염 바이러스, 엔테로바이러스 71, 플라스모듐 팔시파룸 또는 렙토스피라 인테로간스(Leptospira interrogans)로 코팅된 마이크로입자를 포함할 수있다.
도 25는 의도되는 지역(아시아, 유럽, 아메리카, 오세아니아 또는 아프리카)에 따라 본 발명의 키트에 포함될 수 있는 항원-커플링된 마이크로구 조합에 대한 예를 기술한다.
달리, 본 발명의 키트는 특정 증상(플루-유사, 뇌염 또는 출혈 열)을 유발하거나 특정 동물을 감염시키는 바이러스 또는 기생충의 진단을 가능하게 하는 항원-커플링된 마이크로구를 포함하므로, 각각의 환자/동물에 따라 조정될 수 있다.
도 25는 환자 또는 동물의 증상에 따라 본 발명의 키트에 포함될 수 있는 항원-커플링된 마이크로구 조합의 예를 기술한다.
국립 보거 기관에 의해 제시되는 항원 조합을 포함하는 키트도 또한 분명히 본 발명에 포함된다.
특히, 본 발명의 키트는 하기로 이루어진 그룹으로부터 선택되는 적어도 2개의 융합 단백질로 코팅된 적어도 2개의 고체 지지체를 포함한다: 서열번호 21, 서열번호 42, 서열번호 49, 서열번호 51, 서열번호 53, 서열번호 60, 서열번호 62, 서열번호 64, 서열번호 66, 서열번호 68, 서열번호 70, 서열번호 72, 서열번호 74, 서열번호 76, 서열번호 78, 서열번호 80, 서열번호 82, 서열번호 84, 서열번호 86, 서열번호 88, 서열번호 90, 서열번호 92, 서열번호 94, 서열번호 96, 서열번호 98, 서열번호 100, 서열번호 102, 서열번호 104, 서열번호 109, 서열번호 111, 서열번호 113, 서열번호 115, 서열번호 117, 서열번호 119, 서열번호 121, 서열번호 123, 서열번호 125, 서열번호 127, 서열번호 129, 서열번호 131, 서열번호 133, 서열번호 135, 서열번호 137, 서열번호 139, 서열번호 141, 서열번호 143, 서열번호 145, 서열번호 147, 서열번호 149 및 서열번호 151.
바람직한 실시형태에서, 본 발명의 키트는 상기 융합 단백질로 코팅된 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 20, 25, 30, 40, 50 또는 100개의 고체 지지체의 조합을 포함한다.
더욱 바람직한 실시형태에서, 본 발명의 키트는 식품의약청에 의해 권장되는 바와 같은 항원, 즉, HBV, HCV, HIV1, HIV2 및 웨스트 나일 바이러스로부터의 항원을 포함하는 적어도 5개의 상이한 융합 단백질로 코팅된 적어도 5개의 고체 지지체의 조합(예: 마이크로구 서브세트)을 포함한다.
한 가지 실시형태에서, 본 발명은 키트를 제조하는 방법을 포함하고, 상기 방법은
(a) 제1 표적 항체에 의해 인지되는 제1 AGT-항원 융합 단백질을 제공하는 단계,
(b) 상기 제1 AGT-항원 융합 단백질을 상기 AGT-항원 융합 단백질의 기질과 공유적으로 커플링된 제1 고체 지지체와 접촉시키는 단계,
(c) 제1 AGT-항원 융합 단백질과 공유적으로 커플링된 제1 상기 지지체를 수득하는 단계,
(d) 제2 표적 항체에 의해 인지되나 상기 제1 표적 항체에 의해 인지되지 않는 제2 AGT-항원 융합 단백질을 제공하는 단계,
(e) 상기 제2 AGT-항원 융합 단백질을 상기 AGT-항원 융합 단백질과 공유적으로 커플링된 제2 고체 지지체와 접촉시키는 단계, 및
(f) 제2 AGT-항원 융합 단백질과 공유적으로 커플링된 제2 고체 지지체를 수득하는 단계를 포함하고,
상기 제1 및 제2 고체 지지체는 서로로부터 특이적으로 식별할 수 있다.
한 가지 실시형태에서, AGT-항원 융합 단백질과 공유적으로 커플링된 고체 지지체는 함께 혼합되어 있다.
상기 단계 (a) 내지 (c)는, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 20, 25, 30, 40, 50 또는 100개의 상이한 AGT-항원 융합 단백질과 공유적으로 커플링된 적어도 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 20, 25, 30, 40, 50 또는 100개의 고체 지지체를 생성하기 위해, 적어도 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 20, 25, 30, 40, 50 또는 100개의 상이한 AGT-항원 융합 단백질로 반복할 수 있다.
또 다른 양상에서, 본 발명은, 적어도 제1 및 제2 고체 지지체를 포함하는 상기 정의되는 바와 같은 본 발명의 키트를 제조하는 방법에 관한 것으로서, 상기 방법은
(a) 하기를 포함하는 하나 이상의 제1 융합 단백질을 제공하는 단계:
- 제1 표적 항체에 의해 인지되는 제1 에피토프를 포함하는 폴리펩타이드 및
- O6-알킬구아닌-DNA 알킬트랜스퍼라제 활성을 갖는 AGT 폴리펩타이드,
(b) 상기 제1 융합 단백질을 상기 AGT 폴리펩타이드의 기질과 공유적으로 커플링된 제1 고체 지지체와 접촉시키는 단계,
(c) 제1 표적 항체에 의해 인지되는 제1 에피토프와 공유적으로 커플링된 제1 고체 지지체를 수득하는 단계,
(d) 하기를 포함하는 하나 이상의 제2 융합 단백질을 제공하는 단계:
- 제2 표적 항체에 의해서는 인지되나 상기 제1 표적 항체에 의해서는 인지되지 않는 제2 에피토프를 포함하는 폴리펩타이드 및
- O6-알킬구아닌-DNA 알킬트랜스퍼라제 활성을 갖는 AGT 폴리펩타이드,
(e) 상기 제2 융합 단백질을 상기 AGT 폴리펩타이드 기질과 공유적으로 커플링된 제2 고체 지지체와 접촉시키는 단계, 및
(f) 제2 표적 항체에 의해서는 인지되나 상기 제1 표적 항체에 의해서는 인지되지 않는 제2 에피토프와 공유적으로 커플링된 제2 고체 지지체를 수득하는 단계를 포함하고,
상기 적어도 제1 및 제2 고체 지지체는 서로 특이적으로 식별될 수 있으며,본 발명의 상기 키트는 적어도 상기 제1 및 제2 고체 지지체를 포함한다.
또 다른 양상에서, 본 발명은, 각각의 고체 지지체가 여기 후 상이하고 식별가능한 파장을 방출하는, 상기 정의된 바와 같은, 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 60, 70, 80, 90 또는 96개의 고체 지지체를 포함하는, 다중 면역 스크리닝 분석에 관한 것이다.
또 다른 양상에서, 본 발명은 다중 면역 스크리닝 분석 방법에 관한 것으로서, 상기 방법은
a) 하나 또는 수개의 생물학적 샘플(들)을, 각각의 고체 지지체가 여기 후 상이하고 식별가능한 파장을 방출하는, 상기 정의된 바와 같은, 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 60, 70, 80, 90 또는 96개의 고체 지지체와 접촉시키는 단계, 및
b) 표적 항체의 존재 또는 부재를 검출하는 단계를 포함한다.
바람직한 실시형태에서, 상기 표적 항체는 WHO 또는 FDA 지침에 따라 혈액 뱅크에서 검출되는 바이러스, 예를 들어, HBV, HCV, HIV1, HIV2 및 WNV 중에서 선택되는 바이러스로부터의 항원에 특이적이다.
또 다른 바람직한 실시형태에서, 상기 표적 항체는 HPV 16, 18, 31, 33, 35, 39, 45, 51, 52, 56, 58, 59, 66 및 68과 같은 종양 HPV 스트레인에 대해 특이적이다.
또 다른 바람직한 실시형태에서, 상기 표적 항체 각각은 검출 표지로 표지된다.
또 다른 양상에서, 본 발명은 상기 정의된 바와 같은 본 발명의 키트를 제작하는 방법을 수행하기 위한 장치에 관한 것으로서, 상기 장치는 고체 지지체로부터 방출되는 광원 및 표적 항체 또는 표적 항체에 결합된 표지된 항체로부터 방출되는 광원을 검출하기 위한 전문적 디바이스 및 고체 지지체와 표적 항체와의 결합을 확인하여 분석 샘플 중 항원, 세균, 바이러스 또는 기생충의 존재 또는 부재를 나타내기 위한 계산 또는 컴퓨터 디바이스를 포함한다.
또 다른 양상에서, 본 발명은 피험자에서 하나 이상의 표적 항체의 합성을 유도하는 것으로 알려진 하나 이상의 표적 질환을 진단하기 위한 시험관내 진단 방법에 관한 것으로서, 상기 방법은 본 발명의 면역분석 방법을 수행하는 것을 포함하며, 하나 이상의 표적 항체의 양이 대조값 보다 높은 경우 상기 피험자가 하나 이상의 표적 질환을 앓는 것으로 진단된다.
이러한 진단 방법은 바람직하게는 진단이 필요한 피험자에서 2개, 바람직하게는 3개, 더욱 바람직하게는 4개의 표적 질환의 진단을 가능하게 한다. 그러나, 이러한 수는 제한적인 것이 아니어서, 본 발명의 검출 방법으로 100개의 상이한 항체를 검출할 수 있는 한 실제로 100개 이하의 표적 질환을 진단할 수 있다.
바람직한 실시형태에서, 상기한 하나 이상의 표적 질환은 바이러스, 세균, 효모 또는 진균-매개된 감염, 바람직하게는 파필로마바이러스 또는 플라비비리대(뎅기 바이러스, 황열 바이러스, 웨스트 나일 바이러스, 일본 뇌염 바이러스, 진드기-매개 뇌염, 바이러스, C형 간염 바이러스), 토가비리대(치쿤구니아 바이러스, 로스 강 바이러스, 마야로 바이러스, 서부 말 뇌염 바이러스, 동부 말 뇌염 바이러스, 베네주엘라 말 뇌염 바이러스), 부냐비리대(크리미아-콩고 출혈 열 바이러스, 리프트 계곡 열 바이러스, 쉬말렌베르그 바이러스), 칼리시비리대(E형 간염 바이러스), 아레나비리대(라사 바이러스) 및 필로비리대(에볼라 바이러스, 마르부르그 바이러스)의 과로부터의 RNA 바이러스에 의해 유발되는 바이러스 감염, 렙토스피로사 인테로간스에 의해 유발되는 세균 감염, 또는 플라스모듐 팔시파룸에 의해 유발되는 감염이다.
바람직한 실시형태에서, 상기 시험관내 방법은 상기 피험자에서 적어도 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 15개, 더욱 바람직하게는 적어도 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40 또는 45개, 더욱 바람직하게는 적어도 50, 60, 70, 80 또는 90개, 및 더욱더 바람직하게는 적어도 100개의 바이러스 및/또는 세균 및/또는 기생충 감염을 진단하는데 사용된다.
바람직한 실시형태에서, 상기 방법에 사용되는 대조값은 표적 질환을 앓지 않는 피험자, 바람직하게는 건강한 피험자로부터의 샘플에서의 상기 표적 항체의 양을 나타낸다.
본 발명의 방법은 동물에서 감염을 진단하는데 사용될 수 있다.
특히, 이들은 동물 질환을 진단하는데 사용될 수 있으며, 또한 천연적으로 감염된 동물을 백신접종된 동물과 구별하기 위한 DIVA(Differentiating Infected from Vaccinated Animals: 백신접종된 동물로부터 감염된 동물의 구별) 접근에 이용될 수 있다. 새로운 백신을 보완하는 DIVA 전략은 통상의 전략(시험, 도살 조사 및 식육 검사)과 나란히 표적화된 제어 전략으로서 백신접종의 이행을 가능하게 한다. 또한, 증가된 시험 민감도는 불필요하게 도살될 수 있는 그룻-양성 동물의 수를 감소시킴으로써 주요한 경제적 이득을 가질 것이다. 마지막으로, 개선된 민감도는, 특히 새로운 진단 분석이 이용되는 경우, 심지어 백신접종의 부재하에서도 질병 구제에 대한 경제적 부담감을 감소시키는데 추가의 이점을 가질 것이다.
바람직한 실시형태에서, 본 발명의 방법은 인간 개체에 적용된다.
본 발명은 피험자에서 적어도 2개의 표적 질환을 진단하기 위한 본 발명의 키트의 용도에 관한 것으로서, 상기 표적 질환은 파필로마바이러스 또는 플라비비리대(뎅기 바이러스, 황열 바이러스, 웨스트 나일 바이러스, 일본 뇌염 바이러스, 진드기-매개 뇌염 바이러스, C형 간염 바이러스), 토가비리대(치쿤구니아 바이러스, 로스 강 바이러스, 마야로 바이러스, 서부 말 뇌염 바이러스, 동부 말 뇌염 바이러스, 베네주엘라 말 뇌염 바이러스), 부냐비리대(크리미아-콩고 출혈 열 바이러스, 리프트 계곡 열 바이러스, 쉬말렌베르그 바이러스), 칼리시비리대(E형 간염 바이러스), 아레나비리대(라사 바이러스) 및 필로비리대(에볼라 바이러스, 마르부르그 바이러스)의 과로부터의 RNA 바이러스에 의해 유발되는 바이러스 감염, 렙토스피로사 인테로간스에 의해 유발되는 세균 감염, 또는 플라스모듐 팔시파룸에 의해 유발되는 감염이다.
새로이 부각되고 있는 아르보바이러스가 최근에 서열분석되었으며, 독일, 베네룩스 및 프랑스에서 소에 영향을 끼친다. 이러한 바이러스는 쉬말렌베르그 바이러스(SBV)라 불리며, 부냐비리대 과의 오쏘부냐 바이러스 속의 심부(Simbu) 혈청그룹에 속하는 아카반 바이러스에 관련된다. 쉬말렌베르그 바이러스의 바이러스 게놈은 S, L 및 M으로 알려진 3개의 단일-가닥 RNA 절편을 포함한다. S 절편은 N 핵단백질 및 NS 비-구조 단백질을 인코딩한다. N 핵단백질은 상이한 부냐바이러스와 항원 결정자를 공유한다. 쉬말렌베르그 바이러스의 BH80/11-4 스트레인의 3개의 RNA 바이러스 서열이 번호 HE649913.1, HE649914.1 및 HE649912.1로 입수가능하다.
AGT 융합 단백질의 생산을 증가시키기 위한 AGT의 사용
본 발명자들은 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)와 SBV N 단백질과의 키메라 단백질로서의 융합이, 특히 S2 세포와 같은 무척추동물 세포에서 재조합 N 단백질의 생성을 크게 개선한다는 것을 관측하였다.
본 발명자들은 처음으로 숙주 세포, 특히 비-척추동물 세포에서 SBV로부터의 N 핵단백질의 생성을 증강시키기 위한 AGT 효소(EC 2.1.1.63) 또는 이의 돌연변이체, 이의 촉매 도메인 또는 이의 아단편의 이용을 제안한다. 증강 효과는 숙주 세포가 적어도 i) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, ii) AGT 효소 또는 이의 돌연변이체, 촉매 도메인 또는 아단편, 및 iii) SBV의 N 핵단백질을 포함하는 융합 폴리펩타이드를 발현하는 경우 관측된다. 증강 효과를 위해, AGT 효소는 직접적으로나 간접적으로 (스페이서 및 다른 아미노산이 도입될 수 있다) 관심 단백질에 물리적으로 연결되어야 한다. 특정 이론에 구애됨이 없이, AGT 효소가, 예를 들어, 숙주 세포로부터 분비를 용이하게 하고 합성된 융합 단백질을 숙주 세포의 상등액에서 안정화시키거나 이의 합성 및 숙주 세포로부터의 분비 동안 및 후 대사되는 것을 방지함으로써 샤페론 단백질로 작용한다고 생각된다. 또한, AGT는 AGT의 스캐폴딩 역활과 양립할 수 있는 α 나선(Wibley J.E.A. et al, 2000)을 포함하는 3D 구형 구조를 갖는 것으로 관측되었다.
본 발명과 관련하여, "숙주" 세포는 재조합 단백질을 생성하는데 사용될 수 있는 임의의 세포, 예를 들어, "비-척추동물"(또는 무척추동물) 세포, 척추동물 세포, 식물 세포, 효모 세포 또는 원핵생물 세포이다. 이들은, 바람직하게는, 비-척추동물 및 척추동물 세포이다.
비-척추동물(무척추동물로도 알려짐)은 상이한 문을 포함하며, 가장 유명한 것은 곤충(Insect), 거미(Arachnida), 연체동물(Mollusca), 환형동물(Annelida), 만각류 동물(Cirripedia), 방사대칭동물(Radiata), 강장동물(Coelenterata) 및 적충류(Infusoria)이다. 이들은 현재 바다수세미 및 편형동물과 같은 단순 유기체로부터 절지동물 및 연체동물과 같은 복잡한 동물까지 30개 이하의 문으로 분류된다. 본 발명과 관련하여, 비-척추동물 세포는 바람직하게는 곤충 세포, 예를 들어, 초파리(Drosophila) 또는 모기(Mosquito) 세포, 더욱 바람직하게는 초파리 S2 세포이다.
숙주 세포주로서 유용한 척추동물 유기체로부터 유도되는 세포의 예는 비-인간 배아 줄기 세포 또는 이의 유도체, 예를 들어, 조류 EBX 세포; SV40 서열로 형질전환된 원숭이 신장 CVI 세포주(COS-7, ATCC CRL 1651); 인간 배아 신장 세포주(293); 베이비 햄스터 신장 세포(BHK, ATCC CCL 10); 차이니즈 햄스터 난소 세포(CHO); 마우스 세르톨리 세포 [TM4]; 원숭이 신장 세포(CVI, ATCC CCL 70); 아프리카 녹색 원숭이 신장 세포(VERO-76, ATCC CRL-1587); 인간 경부 암 세포(HeLa, ATCC CCL 2); 개 신장 세포(MDCK, ATCC CCL 34); 버팔로 래트 간 세포(BRL 3A, ATCC CRL 1442); 인간 폐 세포(W138, ATCC CCL 75 ); 인간 간 세포(Hep G2, HB 8065); 마우스 유방 암 세포(MMT 060562, ATCC CCL51); 래트 간암 세포 [HTC, Ml.5]; YB2/O(ATCC n℃RL1662); NIH3T3; HEK 및 TRI 세포를 포함한다. 본 발명과 관련하여, 척추동물 세포는 바람직하게는 EBX, CHO, YB2/O, COS, HEK, NIH3T3 세포 또는 이의 유도체이다.
본 발명과 관련하여 사용될 수 있는 식물 세포는 토바코 컬티바스(tobacco cultivars) 브라이트 엘로우 2(BY2) 및 니코티아나 타바쿰(Nicotiana tabaccum) 1(NT-1)이다.
본 발명과 관련하여 사용될 수 있는 효모 세포는 사카로마이세스 세레비지애( Saccharomyces cerevisiae), 쉬조사카로마이세스 폼베( Schizosaccharomyces pombe) 및 한세눌라 폴리모파( Hansenula polymorpha), 및 피치아 파스토리스( Pichia pastoris) 및 피치아 메타놀리카( Pichia methanolica)와 같은 메틸로트로픽(methylotropic) 효모이다.
본 발명과 관련하여 사용될 수 있는 원핵생물 세포는 이. 콜라이 세균 또는 바실루스 서브틸리스(Bacillus subtilis) 세균이다.
또 다른 양상에서, 본 발명은, a) 숙주 세포에서 기능성인 분비 시그널 펩타이드, b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 서열번호 16의 SBV의 N 핵단백질을 인코딩하는 뉴클레오타이드 서열을 포함하는, 숙주 세포에서 SBV로부터의 N 핵단백질(SBV.N)를 발현시키기 위한 벡터에 관한 것이다.
SBV로부터의 N 핵단백질은 하기에서 "이종 단백질", "관심 단백질","키메라 단백질" 또는 "재조합 단백질"로 불릴것이다.
용어 "벡터"는 외래 유전자의 DNA 또는 RNA 서열이 숙주 세포에 도입되어 이를 형질전환시키고 도입된 서열의 발현을 증진시킬 수 있는 비히클을 의미한다. 본원에서 이해되는 바와 같이, 벡터는 핵산 분자, 예를 들어, 플라스미드, 파아지 및 바이러스이다. 이들은 하기에서 상세히 기술된다. 플라스미드, 코스미드, YAC 또는 바이러스 벡터의 어떠한 유형도 관심 단백질의 발현이 요구되는 숙주 세포로 도입될 수 있는 재조합 핵산 작제물을 제조하는데 사용될 수 있다. 특정 유형의 숙주 세포에서의 관심 단백질의 발현이 요구되는 경우, 목적하는 세포 유형 또는 조직 유형을 선택적으로 감염시키는 바이러스 벡터가 사용될 수 있다. 또한, 유전자 요법(즉, 숙주 유기체로 핵산 분자를 전달할 수 있는 유전자 요법)에 사용하기 위한 벡터가 본 발명에 중요하다.
예를 들어, 바이러스 벡터는 렌티바이러스, 레트로바이러스, 헤르페스 바이러스, 아데노바이러스, 아데노-관련 바이러스, 백시니아 바이러스, 배큘로바이러스 및 바람직한 세포 굴성을 갖는 다른 재조합 바이러스 벡터를 포함한다. 바이러스 벡터를 작제하고 사용하는 방법은 당해 기술 분야에 알려져 있다(참조:, Miller and Rosman, BioTechniques, 7:980-990, 1992).
본 발명에 실제로 바람직한 바이러스 벡터는 척추동물 및 비-척추동물 세포에 사용하기에 매우 적합한 것들이다.
비-척추동물 세포에 대해, 바람직한 벡터는 아르보바이러스 벡터이고, 웨스트 나일 바이러스 벡터가 특히 바람직하며, 이들은 절지동물 벡터이다. 비-척추동물 세포에서 효과적으로 발현되는 것으로 알려진 다른 벡터는 배큘로바이러스이다.
척추동물 세포에 대해, 렌티바이러스, AAV, 배큘로바이러스 및 아데노바이러스 벡터가 바람직하다. 포유동물 숙주 세포에서의 발현에 적합한 벡터는 또한 비-바이러스(예: 플라스미드 DNA) 기원의 것일 수 있다. 적합한 플라스미드 벡터는 pREP4, pCEP4(Invitrogen), pCI(Promega), pCDM8 및 pMT2PC, pVAX 및 pgWiz를 포함하고 이로 제한되지 않는다.
원핵생물 세포에 대해, 플라스미드, 박테리오파아지 및 코스미드 벡터가 바람직하다. 원핵생물 시스템에 사용하기에 적합한 벡터는 pBR322(Gibco BRL), pUC(Gibco BRL), pBluescript(Stratagene), p Poly, pTrc; pET 11d; pIN; 및 pGEX 벡터를 포함하고 이로 제한되지 않는다.
식물 세포에 대해, 플라스미드 발현 벡터, 예를 들어, Ti 플라스미드 및 바이러스 발현 벡터, 예를 들어, 콜리플라워 모자이크 바이러스(CaMV) 및 담배 모자이크 바이러스 TMV가 바람직하다.
3가지 유형의 벡터: 인테그레이션(integration) 벡터(YIp), 에피솜 플라스미드(YEp) 및 센트로메릭(centromeric) 플라스미드(YCp)를 사용하는 효모 세포에서의 재조합 단백질의 발현이 수행될 수 있다: 효모(예: 에스. 세레비지애)에서의 발현을 위한 적합한 벡터는 pYepSec1, pMFa, pJRY88, pYES2(Invitrogen Corporation, San Diego, Calif.) 및 pTEF-MF(Dualsystems Biotech Product code: P03303)을 포함하고 이로 제한되지 않는다.
유전자 요법에 사용될 수 있는 벡터는 당해 기술 분야에 널리 알려져 있다. 이들은, 예를 들어, 렌티바이러스, 레트로바이러스, 아데노바이러스, 폭스바이러스, 헤르페스 바이러스, 홍역 바이러스, 포미(foamy) 바이러스 또는 아데노-관련 바이러스(AAV)이다. 바이러스 벡터는 복제-적격 벡터이거나 복제-결함 또는 복제-손상되도록 유전적으로 장애를 가질 수 있다. 바람직한 유전자 요법 벡터는 WO 99/055892, US 6,682,507 및 WO 01/27300에 기술되어 있는 바와 같은 DNA Flap 벡터이다.
발현 생성물, 예를 들어, RNA, 폴리펩타이드, 단백질 또는 효소를 "인코딩"하는 서열은, 발현시, 상기 RNA, 폴리펩타이드, 단백질 또는 효소를 생성하는 뉴클레오타이드 서열이다: 즉, 상기 뉴클레오타이드 서열은 상기 RNA를 "인코딩"하거나 상기 폴리펩타이드, 단백질 또는 효소에 대한 아미노산 서열을 인코딩한다.
본 발명의 벡터는 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인을 인코딩하는 뉴클레오타이드 서열을 포함한다. 이들 폴리펩타이드는 상기에 정의되었다. 바람직하게는, 상기 AGT 돌연변이체는 서열번호 2의 SNAP 효소이고, 예를 들어, 서열번호 15 또는 서열번호 31에 의해 인코딩되며, 후자는 51%의 G/C 함량을 갖는다.
바람직하게는, 본 발명의 뉴클레오타이드 발현 벡터는 관심 단백질을 인코딩하는 이종 DNA 서열의 인-프레임 삽입을 가능하게 하는 클로닝 부위를 추가로 포함한다.
본 발명에서 용어 "분비 시그널 펩타이드"는 N 핵단백질의 숙주 세포 외부로의 수송을 지시하는 짧은 (3 내지 60개 아미노산 길이) 펩타이드를 나타낸다.
본 발명에 적합한 분비 시그널의 예는 교배 인자 (MF) 알파(US 5,879,926); 인버타제(WO 84/01153); PHO5(DK 3614/83); YAP3(효모 아스파틱 프로테아제 3; WO 95/02059); 및 BAR1(WO 87/02670)의 시그널 펩타이드 서열을 포함하고 이로 제한되지 않는다.
본 발명과 관련하여, 이러한 분비 시그널 펩타이드는 바람직하게는 비-척추동물 세포 또는 척추동물 세포 또는 이둘 모두에서 기능성이다.
곤충 세포에서 기능성인 분비 시그널 펩타이드의 예는 곤충 ssBiP(서열번호 37)(예를 들어, 서열번호 22의 DNA 서열에 의해 인코딩됨), 서열번호 24의 BiP-유사 펩타이드 시그널(예를 들어, 서열번호 23의 DNA 서열에 의해 인코딩됨), 서열번호 153의 BiP-유사 펩타이드 시그널(예를 들어, 서열번호 152의 DNA 서열에 의해 암호됨) 및 아르보바이러스, 예를 들어, 웨스트-나일 바이러스의 외피 E 단백질(서열번호 38)에 존재하는 임의의 펩타이드 시그널이다.
흥미롭게도, 서열번호 24의 상기 BiP-유사 펩타이드 시그널은 비-척추동물 및 척추동물 세포 모두에서 기능성이다. 이러한 BiP-유사 시그널은, 마지막 글리신 아미노산이 뎅기 바이러스의 E 단백질의 개열 부위에 상응하는 아미노산 서열 Pro Thr Ala Leu Ala(서열번호 39)으로 대체된 서열번호 37의 BiP 펩타이드 시그널에 상응한다. 따라서, BiP-유사 시그널은 일단 단백질이 해독되고 숙주 세포의 상등액에 분비되면 유리하게 개열될 것이다.
다양한 분비 시그널이 또한 효모 숙주 세포, 예를 들어 에스. 세레비지애에서의 발현에 이용가능하다. 이들은 프리프로-알파 인자, HSp150, PHO1, SUC2, KILM1(킬러 독소 1형) 및 GGP1을 포함한다.
클로닝 부위는 관심 단백질을 인코딩하는 유전자를 발현 시스템으로 클로닝 하는 것을 용이하게 하는 서열이다. 이는 제한 부위, 또는 제한 인지 부위, 즉, 제한 효소에 인지되는 뉴클레오타이드의 특정 서열을 포함하는 DNA 분자 상의 위치를 포함한다(예를 들어, 도면 참조). (제한 효소가 통상적으로 호모이량체로서 결합하기 때문에) 이들은 일반적으로 팔린드롬(palindromic) 서열이며, 특정 제한 효소는 이의 인지 부위 내 또는 근방의 2개의 뉴클레오타이드 사이의 서열을 개열할 수 있다. 클로닝 부위는 당업자에게 널리 알려져 있다.
본 발명의 바람직한 실시형태에서, 상기 AGT 효소를 인코딩하는 DNA 서열은 관심의 이종 단백질을 인코딩하는 DNA 서열의 5' 또는 3', 바람직하게는 5'에 위치된다. 따라서, AGT 효소는 관심의 이종 단백질/폴리펩타이드에 직접적으로나 간접적으로 연결되며, 바람직하게는 관심의 이종 단백질/폴리펩타이드의 N-말단에 위치된다. 펩타이드 시그널, AGT 효소 또는 이의 돌연변이체 또는 촉매 도메인 및 관심의 재조합 단백질을 포함하는 융합 폴리펩타이드를 인코딩하는 DNA 서열은 펩타이드 시그널이 기능성인 것과 동일한 숙주 세포에서 기능성인 유도성 프로모터과 작동적으로 연결될 수 있다.
더욱 바람직하게는, 본 발명의 벡터에서, 상기 개방 판독 프레임은 펩타이드 시그널이 기능성인 것과 동일한 숙주 세포에서 기능성인 유도성 프로모터와 작동적으로 연결된다.
인코딩 서열은, RNA 폴리머라제가 인코딩 서열을 RNA로 전사시킨 후, (RNA가 인트론을 포함하는 경우) 트랜스-RNA 스플라이싱되고, 인코딩 서열이 단백질을 인코딩하는 경우, 단백질로 해독되는 경우, 세포 내의 발현 조절 서열(즉, 전사 및 해독 조절 서열)과 "작동적으로 연결"된다.
"프로모터"는, 이로부터 하부에 (즉, 이중-가닥 DNA의 센스 가닥에 대해 3' 방향으로) 작동적으로 연결된 DNA의 전사가 개시될 수 있는 뉴클레오타이드의 서열이다. (편리하게는, 예를 들어, 뉴클레아제 S1을 사용한 매핑에 의해 발견되는) 전사 개시 부위 및 RNA 폴리머라제의 결합에 중요한 단백질 결합 도메인(컨센서스 서열)이 프로모터 서열 내에서 발견될 것이다.
본 발명과 관련하여 유전자 발현을 조절하는데 사용될 수 있는 프로모터는, 예를 들어, 비-척추동물 세포 또는 척추동물 세포에서 기능성인 것이다. 예를 들어, 비-척추동물 세포에 대해, 메탈로티오네인 유전자의 조절 서열이 사용될 수 있다(Brinster et al., Nature , 296:39-42, 1982).
바람직하게는, 본 발명의 벡터에 존재하는 유도성 프로모터는 곤충 세포, 더욱 바람직하게는 초파리 세포에서 프로모터 활성을 갖는다. 예를 들어, CuSO4와 같은 금속의 존재 하에서 유전자의 고수준 전사를 지시하는, 드로소필라 메탈로티오네인(Drosophila metallothionein) 프로모터 pMT(Lastowski-Perry et al, J. Biol . Chem. 260:1527(1985))이다. 달리, 구성적 프로모터로서 금속 첨가를 필요로 하지 않는 초파리 액틴 5C 유전자 프로모터가 사용될 수 있다(B.J.Bond et al, Mol . 세포. Biol. 6:2080(1986)). 다른 공지된 초파리 프로모터는, 예를 들어, 유도성 열쇽(Hsp70) 및 COPIA LTR 프로모터를 포함한다. SV40 조기 프로모터는 초파리 메틸로티오네인 프로모터 보다 낮은 발현 수준을 제공한다.
바람직하게는, 본 발명의 벡터에 존재하는 유도성 프로모터는 드로소필라 멜 라노가스터( Drosophila melanogaster) 세포, 바람직하게는 초파리 S2 세포에서 프로모터 활성을 갖는다. 예를 들어, 문헌(Lastowski-Perry et al, J. Biol . Chem. 260: 1527 (1985))에 상세히 기술된 메탈로티오네인 프로모터이다.
포유동물 세포에서의 구성적 발현에 적합한 프로모터는 시토메갈로바이러스(CMV) 전 초기(immediate early) 프로모터, 아데노바이러스 주요 후기(major late) 프로모터, 포스포글리세로 키나제(PGK) 프로모터 및 단순 포진 바이러스(HSV)-1의 티미딘 키나제(TK) 프로모터를 포함한다. 외부에서 공급되는 화합물에 의해 조절되는 유도성 진핵생물 프로모터는 아연-유도성 메탈로티오네인(MT) 프로모터, 덱사메타손(Dex)-유도성 마우스 유방암 바이러스(MMTV) 프로모터, T7 폴리머라제 프로모터 시스템(WO 98/10088), 엑디손 곤충 프로모터, 테트라사이클린-억제성 프로모터, 테트라사이클린-유도성 프로모터, RU486-유도성 프로모터 및 라파마이신-유도성 프로모터를 포함하며 이로 제한되지 않는다.
바람직하게는, 본 발명의 벡터에 존재하는 프로모터는 포유동물 세포, 바람직하게는 HeLa 세포에서 프로모터 활성을 갖는다. 예를 들어, SV 40 프로모터이다.
다양한 효모 프로모터가 효모 숙주 세포에서의 단백질 발현에 이용가능하다. ADH2, SUC2와 같은 일부 프로모터는 발현시 유도성이고, GAPDH와 같은 다른 프로모터는 발현시 구성적이다. 효모에서의 발현에 적합한 다른 프로모터는 TEF, PGK, MF alpha, CYC-1, GAL-1, GAL4, GAL10, PHO5, 글리세르알데하이드-3-포스페이트 디하이드로게나제(GAP 또는 GAPDH) 및 알콜 디하이드로게나제(ADH) 프로모터를 포함하고 이에 제한되지 않는다.
식물 세포에 사용하기 위해, 가장 일반적으로 사용되는 프로모터는 콜리플라워 모자이크 바이러스(CaMV) 35S 프로모터 또는 이의 증강된 버젼이나, 다수의 대체적 프로모터, 예를 들어, 하이브리드(ocs)3mas 프로모터 또는 옥수수 및 아라비도스프시스 탈리아나( Arabidospsis thaliana)로부터의 유비퀴틴 프로모터가 사용될 수 있다. 이러한 구성적 프로모터와는 반대로, 라이스 α-아밀라제 RAmy3D 프로모터는 슈가 결핍에 의해 유도된다(Hellwig S et al., Nat. Biotechnol.2004; 22(11):1415-22).
이. 콜라이 숙주 세포에서의 발현에 적합한 프로모터는 박테리오파아지 람다 pL 프로모터, lac, TRP 및 IPTG-유도성 pTAC 프로모터를 포함하고 이로 제한되지 않는다.
분비 시그널 펩타이드 및 유도성 프로모터는 동일한 숙주 세포에서 기능성이다.
더욱 바람직하게는, 분비 시그널 펩타이드 및 유도성 프로모터는 초파리 S2 세포 및 척추동물 세포 모두에서 기능성이다.
프로모터에 적용되는 용어 "유도성"은 당업자에 의해 널리 이해된다. 본질적으로, 유도성 프로모터 조절 하에서의 발현은 적용된 자극에 반응하여 "발동(switched on)"되거나 증가된다. 자극의 특성은 프로모터 간에 다양하다. 일부 유도성 프로모터는 적합한 자극의 부재 하에서 적거나 검출 불가능한 수준의 발현을 야기한다(또는 발현을 야기하지 않는다). 다른 유도성 프로모터는 자극의 부재 하에서 검출가능한 구성적 발현을 야기한다. 발현이 자극의 부재 하에서 어떠한 수준이든, 임의의 유도성 프로모터로부터의 발현은 정확한 자극의 존재시 증가된다.
일단 적합한 벡터가 작제되고 선택된 숙주 세포, 바람직하게는, 초파리 세포주로 형질감염되면, 이종 단백질의 발현은 유도성 프로모터에 대한 적합한 유도제의 첨가에 의해 유도된다. 예를 들어, 카드뮴 또는 구리가 Hsp70 프로모터에 대한 유도제이다. 구성적 프로모터, 예를 들어, 액틴 5C 프로모터에 대해서는, 발현에 어떠한 유도제도 필요하지 않다.
본 발명의 또 다른 실시형태에서, 뉴클레오타이드 발현 벡터는, 바람직하게는 AGT 효소 또는 이의 촉매 도메인과 목적 재조합 단백질 사이에 위치되는, 하나 이상의 펩타이드 개열 부위를 인코딩한다.
펩타이드 개열 부위는 하나 이상의 프로테아제 효소(예를 들어, 특히 세린 프로테아제, 시스테인 프로테아제)에 의해 인지되는 아미노산 서열이다. 펩타이드 개열 부위의 예는 서열번호 40(AspAspAspAspLys/Asp)의 엔테로키나제 개열 부위이다. 엔테로키나제는 불활성 트립시노겐을 이 서열의 C-말단에서의 개열으로 활성 트립신으로 전환시키는 것으로 알려진 세린 프로테아제 효소(EC 3.4.21.9)이다: Val--(Asp)4--Lys--Ile--Val~ (트립시노겐) -> Val--(Asp)4--Lys (헥사펩타이드) + Ile--Val~ (트립신). 엔테로키나제는 Lys 앞에 4개의 Asp가 선행되고 프롤린 부분이 뛰따르지 않는 경우 리신 이후를 개열한다.
또 다른 유용한 펩타이드 개열 부위는 이른바 "TEV 프로테아제"의 개열 부위로서, 서열번호 32의 아미노산 서열(pro-TEV1) 또는 서열번호 33의 아미노산 서열(pro-TEV2)을 갖는다(각각 Glu Asn Leu Tyr Phe Gln Ser 또는 Gly). 이러한 개열 부위는, 예를 들어, 서열번호 29 및 30에 의해 인코딩될 수 있다. TEV 프로테아제는 담배 에치 바이러스(tobacco etch virus)에 의해 인코딩되는 핵 포함 단백질의 27 kDa 촉매 도메인에 대한 일반명이다. 이는 시판된다(Invitrogen).
뎅기 바이러스 혈청형 1의 막 전구체 prM으로부터의 개열 부위(서열번호 39)도 또한 본 발명의 벡터에 사용될 수 있다.
또 다른 실시형태에서, 본 발명이 뉴클레오타이드 발현 벡터는, 바람직하게는 (펩타이드 시그널, AGT 단백질 또는 이의 상동체 및 재조합 단백질을 포함하는) 본 발명의 융합 폴리펩타이드에서 재조합 단백질의 C-말단에 위치되는, 표지를 추가로 인코딩한다. 본 발명과 관련하여, "표지"는 숙주 세포의 조 용해물로부터 폴리펩타이드의 회수를 용이하게 하기 위한 것으로서, 바람직하게는 형광 단백질, 폴리-히스티딘(poly-his) 또는 폴리-히스티딘-글리신(poly-his-gly) 택; flu HA 택; c-myc tag 단순 포진 바이러스 당단백질 D(gD) 택, Flag-펩타이드, 알파-투불린 에피토프, 또는 T7 유전자 10 단백질 펩타이드 택을 포함하는 그룹 중에서 선택된다. 그러나, 임의의 다른 표지도 사용될 수 있다. 본 발명의 바람직한 실시형태에서, 벡터는 서열번호 27을 갖는 헥사-히스티딘 택을 인코딩하는 서열번호 28의 DNA을 포함한다.
또 다른 실시형태에서, 본 발명의 뉴클레오타이드 발현 벡터는, 바람직하게는 AGT 효소(또는 이의 촉매 도메인)와 관심 재조합 단백질 사이 및/또는 관심 재조합 단백질과 표지 사이에 위치되는, 스페이서 서열(들)을 추가로 인코딩한다. 본 발명과 관련하여, 스페이서 서열은 2개의 연결된 폴리펩타이드가 공간적으로 떨어지게 하는 (이로써 이들 폴리펩타이드는 간접적으로 연결된다) 적어도 3개의 아미노산을 포함하는 아미노산 서열이다. 이러한 스페이서는, 예를 들어, 아미노산 서열 글리신-글리신-글리신-세린(GGGS, 서열번호 25)일 수 있고, 이를 인코딩하는 DNA 스페이서 서열은 서열번호 26일 수 있다. 본 발명과 관련하여, 이러한 DNA 서열은 이하에서 "DNA 스페이서 서열"이라 지칭되며, AGT 또는 이의 촉매 도메인과, 바람직하게는 펩타이드 개열 부위를 인코딩하는 DNA서열로부터 상부에 있는, 재조합 DNA 서열 사이에 위치된다.
SNAP 카세트 및 항원 발현
본원에서 사용되는 용어 "pDeSNAPUniv"는 단일 개방 판독 프레임에 5'로부터 3'로 하기를 인코딩하는 DNA 카세트를 지칭한다:
a) 분비 시그널 펩타이드,
b) 서열번호 1의 AGT 단백질 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 특히 서열번호 2의 SNAP 돌연변이체,
c) 하나 이상의 펩타이드 개열 부위,
d) 하나 이상의 표지, 및
e) 하나 이상의 스페이서 서열.
이러한 pDeSNAPUniv DNA 카세트는, 유리하게는 서열번호 24의 BiP-유사 펩타이드 시그널 또는 서열번호 37의 ssBiP 펩타이드 시그널인 분비 시그널, 서열번호 2의 SNAP 돌연변이체, 유리하게는 서열번호 27의 His-택인 표지, 유리하게는 서열번호 32의 pro-TEV 또는 서열번호 33의 pro-TEV인 펩타이드 개열 부위, 및/또는 유리하게는 서열번호 25의 아미노산 서열을 갖는 스페이서를 인코딩한다.
더욱 바람직하게는, pDeSNAPUniv DNA 카세트는 5'로부터 3'로 BiP-유사 분비 시그널을 인코딩하는 서열번호 23의 서열, SNAP 돌연변이체를 인코딩하는 서열번호 15 또는 31, 서열번호 26의 스페이서 서열, 서열번호 29의 펩타이드 개열 부위 pro-TEV, 서열번호 30의 펩타이드 개열 부위 pro-TEV, 서열번호 26의 스페이서 서열 및 His-택 표지를 인코딩하는 서열번호 28의 서열을 포함한다(pDeSNAPUniv 카세트의 구조를 도시하는 도 8 참조). 이러한 pDeSNAPUniv DNA 카세트는, 예를 들어, 서열번호 34이다.
이러한 "pDeSNAPUniv" 카세트는 이종 단백질을 생성하기 위해 숙주 세포를 형질감염하는데 사용되는 모든 종류의 벡터, 즉 척추동물 벡터(예: pcDNA3 또는 pCI-neo 벡터) 및 비-척추동물 벡터(예: Invitrogen으로부터의 DES 시스템에 유용한 pMT/BiP/V5-HisA)에 삽입될 수 있으므로, "보편적"인 것으로 여겨진다. 이러한 보편적 서열을 포함하는 플라스미드의 예는 서열번호 43(pDeSNAP Univ 카세트를 포함하는 Invitrogen으로부터의 pMT/BiP/V5-HisA), 서열번호 44(pDeSNAP Univ 카세트를 포함하는 Invitrogen으로부터의 pUC57) 또는 서열번호 45(pDeSNAP Univ 카세트를 포함하는 Invitrogen으로부터의 pcDNA3)이다.
상기 보편적 서열을 포함하는 또 다른 플라스미드의 예는 5'로부터 3'로 오르기아 슈도쓰가타(Orgyia pseudotsugata) 멀티캡시드 핵단백질 바이러스-전 초기 2 프로모터(OpIE2SP)의 구성적 프로모터, 서열번호 152의 BiP-유사 시그널 펩타이드, 서열번호 31의 SNAP-유사 서열, 서열번호 26의 스페이서 서열, 서열번호 29의 pro-TEV1, 및 서열번호 106의 C-말단 펩타이드 택을 포함하는 pUC57 플라스미드인 서열번호 105이다.
일단 SBV.N과 같은 관심 단백질의 이종 서열이 이러한 벡터에 클로닝되면, 벡터는 유리하게는 관심 단백질을 다량으로 생성하도록 척추동물 또는 비-척추동물에 형질감염될 수 있다.
바람직한 실시형태에서, 본 발명의 벡터는 이른바 "pDeSNAP Univ/SBV.N 카세트", 즉, SBV의 N 핵단백질의 서열이 삽입된 pDeSNAPUniv DNA 카세트를 포함하고, 상기 pDeSNAP Univ/SBV.N 카세트는 단일 개방 판독 프레임에 5'로부터 3'로 하기를 인코딩하는 뉴클레오타이드 서열을 포함한다:
a) 분비 시그널 펩타이드,
b) 서열번호 1의 AGT 단백질 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 특히 서열번호 2의 SNAP 돌연변이체,
c) 하나 이상의 펩타이드 개열 부위,
d) 서열번호 16의 SBV의 N 핵단백질,
e) 하나 이상의 표지, 및
f) 하나 이상의 스페이서 서열.
이러한 pDeSNAP Univ/SBV.N DNA 카세트는 유리하게는 서열번호 24의 BiP-유사 펩타이드 시그널 또는 서열번호 37의 ssBiP 펩타이드 시그널인 분비 시그널 펩타이드, 서열번호 2의 SNAP 돌연변이체, 서열번호 16의 SBV의 N 핵단백질, 유리하게는 서열번호 27의 His-택인 표지, 유리하게는 서열번호 32의 pro-TEV 또는 서열번호 33의 pro-TEV인 펩타이드 개열 부위, 및/또는 유리하게는 서열번호 25의 아미노산 서열을 갖는 스페이서 서열을 인코딩한다.
더욱 바람직하게는, pDeSNAP Univ/SBV.N DNA 카세트는 5'로부터 3'로 BiP-유사 분비 시그널을 인코딩하는 서열번호 23의 서열 또는 ssBiP 분비 시그널을 인코딩하는 서열번호 22, SNAP 돌연변이체를 인코딩하는 서열번호 15 또는 31, 서열번호 26의 스페이서 서열, 서열번호 29의 펩타이드 개열 부위 pro-TEV1, SBV의 N 핵단백질을 인코딩하는 서열번호 17의 서열, 서열번호 30의 펩타이드 개열 부위 pro-TEV2, 서열번호 26의 스페이서 서열 및 His-택 표지를 인코딩하는 서열번호 28의 서열을 포함한다.
더욱더 바람직하게는, pDeSNAP Univ/SBV.N DNA 카세트는 5'로부터 3'로 BiP 시그널을 인코딩하는 서열번호 22의 서열, SNAP 돌연변이체를 인코딩하는 서열번호 31, 서열번호 26의 스페이서 서열, 서열번호 29의 펩타이드 개열 부위 pro-TEV1, SBV의 N 핵단백질을 인코딩하는 서열번호 17의 서열, 서열번호 30의 펩타이드 개열 부위 pro-TEV2, 서열번호 26의 스페이서 서열 및 His-택 표지를 인코딩하는 서열번호 28의 서열을 포함한다. 이러한 pDeSNAP Univ/SBV.N 카세트는, 예를 들어, 서열번호 35이다.
달리, pDeSNAP Univ/SBV.N DNA 카세트는 5'로부터 3'로 BiP-유사 분비 시그널을 인코딩하는 서열번호 23의 서열, SNAP 돌연변이체를 인코딩하는 서열번호 31, 서열번호 26의 스페이서 서열, 서열번호 29의 펩타이드 개열 부위 pro-TEV1, SBV의 N 핵단백질을 인코딩하는 서열번호 17의 서열, 서열번호 30의 펩타이드 개열 부위 pro-TEV2, 서열번호 26의 스페이서 서열 및 His-택 표지를 인코딩하는 서열번호 28의 서열을 포함할 수 있다. 이러한 pDeSNAP Univ/SBV.N 카세트는, 예를 들어, 서열번호 36이다(이의 구조가 도 9에 도시되어 있다).
따라서, 바람직한 실시형태에서, 본 발명의 벡터는 서열번호 35의 뉴클레오타이드 서열 또는 서열번호 36의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/SBV.N 카세트를 포함한다.
더욱 정확히, 서열번호 35의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/SBV.N 카세트는 하기를 포함한다:
- 서열번호 22의 곤충 BiP 서열,
- 서열번호 31의 SNAP-유사 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제1 DNA 서열,
- 서열 ENLYFQS(서열번호 32)의 pro-TEV1 개열 부위를 인코딩하는 서열번호 29의 DNA 서열,
- 서열번호 17의 SBV.N DNA 서열(내부 EcoRV 부위가 결실되고 2개의 EcoRV 및 XmaI 부위가 맨 끝에 첨가된, 천연 SBV.N 서열에 상응),
- 서열 ENLYFQG(서열번호 33)의 pro-TEV2 개열 부위를 인코딩하는 서열번호 30의 DNA 서열,
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
서열번호 36의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/SBV.N 카세트는 하기를 포함한다(도 9 참조):
- 서열번호 23의 곤충 BiP-유사 서열,
- 서열번호 31의 SNAP-유사 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제1 DNA 서열,
- 서열 ENLYFQS(서열번호 32)의 pro-TEV1 개열 부위를 인코딩하는 서열번호 29의 DNA 서열,
- 서열번호 17의 SBV.N DNA 서열(내부 EcoRV 부위가 결실되고 2개의 EcoRV 및 XmaI 부위가 맨 끝에 첨가된, 천연 SBV.N 서열에 상응),
- 서열 ENLYFQG(서열번호 33)의 pro-TEV2 개열 부위를 인코딩하는 서열번호 30의 DNA 서열,
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
흥미롭게도, 서열번호 36의 pDeSNAP Univ/SBV.N 카세트 뉴클레오타이드 서열은 또한 AGT의 상부에 NheI 부위, BiP-유사 서열과 SNAP-유사 서열 사이에 BglII 부위, 및 정지 코돈 하부에 위치된 AgeI 부위 및 HindIII 부위를 포함한다.
본 발명의 벡터는, 예를 들어, 서열번호 17의 SBV.N DNA 서열이 삽입된 서열번호 43(pDeSNAP Univ 카세트를 포함하는 Invitrogen으로부터의 pMT/BiP/V5-HisA 플라스미드), 서열번호 17의 SBV.N DNA 서열이 삽입된 서열번호 44(pDeSNAP Univ 카세트를 포함하는 Invitrogen으로부터의 pUC57 플라스미드) 또는 서열번호 17의 SBV.N DNA 서열이 삽입된 서열번호 45(pDeSNAP Univ 카세트를 포함하는 Invitrogen으로부터의 pcDNA3 플라스미드)이다.
본 발명의 벡터는 또한 파스퇴르 인스티튜트 국립 미생물 배양센터 [the Centre National de Culture et de Microorganismes(CNCM), Institut Pasteur(25 rue du Docteur Roux, 75724 Paris cedex 15, France)]에 2012년 4월 24일자로 기탁 번호 CNCM I-4616으로 기탁된 S2에 제공된다.
또 다른 양상에서, 본 발명은 본 발명의 벡터, 바람직하게는 서열번호 35 또는 서열번호 36의 뉴클레오타이드 서열을 포함하는 벡터로 안정하게 형질감염되는 재조합 세포에 관한 것이다.
바람직하게는, 본 발명의 이러한 양상에서, 상기 재조합 세포는 비-척추동물 세포, 바람직하게는 곤충 세포, 더욱 바람직하게는 S2 세포이다.
비-척추동물 세포는 곤충(Insect), 거미(Arachnida), 갑각류 동물(Crustacea), 연체동물(Mollusca), 환형동물(Annelida), 만각류 동물(Cirripedia), 방사대칭동물(Radiata), 강장동물(Coelenterata) 및 적충류(Infusoria) 중의 임의의 동물일 수 있다. 본 발명과 관려하여, 비-척추동물은 바람직하게는 곤충 세포, 예를 들어, 초파리 또는 모기 세포이다. 이들은 더욱 바람직하게는 초파리 S2 세포이다. 이러한 경우, 본 발명의 발현 벡터는, 예를 들어, 서열번호 35를 포함한다.
초파리 S2 세포는 널리 알려져 있다. 이들은 실온(24±1℃)에서 현탁 배양으로 유지될 수 있기 때문에 고수율 단백질 생산에 특히 적합하다. 배양 배지는 5 내지 10%(v/v)의 열-불활성화된 우태혈청 혈청(FBS)으로 보충된 M3이다. 본 발명의 바람직한 실시형태에서, 배양 배지는 5% FBS를 포함한다. 세포는 유도 후 혈청-비함유 배지에서 배양된다. S2 세포는 이러한 배지에서 현탁 배양으로, 예를 들어, 250 mL 내지 2000 mL 스피너 플라스크에서 50 내지 60 rpm의 교반과 함께 성장될 수 있다. 세포 밀도는 통상적으로 106 내지 107개/mL로 유지된다.
바람직한 실시형태에서, 본 발명의 재조합 세포는 파스퇴르 인스티튜트 국립 미생물 배양센터 [the Centre National de Culture et de Microorganismes(CNCM), Institut Pasteur(25 rue du Docteur Roux, 75724 Paris cedex 15, France)]에 2012년 4월 24일자로 기탁 번호 CNCM I-4616으로 기탁된 S2 세포이다.
또 다른 바람직한 실시형태에서, 상기 재조합 세포는 척추동물 세포이다.
바람직하게는, 상기 척추동물 재조합 세포는 포유동물 세포, 바람직하게는 CHO, YB2/O, COS, HEK, NIH3T3, HeLa 세포 또는 이의 유도체이다. 더욱 바람직하게는, 본 발명의 발현 벡터는 서열번호 36을 포함한다.
본 발명의 또 다른 양상에서, 상기 재조합 세포는 본 발명의 발현 벡터, 바람직하게는 서열번호 35 또는 36을 포함하는 발현 벡터를 증폭 및 정제하는데 사용된다.
이러한 목적 상, 본 발명의 뉴클레오타이드 발현 벡터는 선별 마커를 인코딩하는 유전자 및/또는 터미네이터 서열을 포함한다. 작제물에 포함될 수 있는 선별 마커 유전자는 통상적으로 항생제(예: 블라스티시딘, 암피실린, 카나마이신, 하이그로마이신, 푸로마이신, 클로람페니콜)에 대한 내성과 같은 선별가능한 표현형을 제공하는 것들이다.
발현 벡터를 제조하는 방법은 당해 기술 분야에 널리 알려져 있다.
또 다른 양상에서, 본 발명의 재조합 세포는 쉬말렌베르그 바이러스의 N 핵단백질을 다량으로 생성하도록 사용된다.
따라서, 특정 실시형태에서, 본 발명은 또한 쉬말렌베르그 바이러스의 N 핵단백질을 제조하는 방법에 관한 것으로서, 상기 방법은 하기 단계를 포함한다:
(a) 예를 들어, 서열번호 35 또는 36의 DNA 서열을 포함하는 본 발명의 벡터를 수득하는 단계,
(b) 단계 (a)에서 수득된 폴리뉴클레오타이드를 사용하여 숙주 세포(바람직하게는, 곤충 세포 또는 포유동물 세포)를 형질감염하는 단계,
(c) 단계 (b)에서 수득된 상기 폴리뉴클레오타이드를 발현시켜 쉬말렌베르그 바이러스의 N 핵단백질을 생성하는 단계,
(d) 임의로, AGT 폴리펩타이드를 개열하는 단계,
(e) 쉬말렌베르그 바이러스의 N 핵단백질을 회수하는 단계,
(f) 임의로, 쉬말렌베르그 바이러스의 N 핵단백질을 정제하는 단계.
본 발명의 방법의 상이한 단계들을 수행하기 위해서, 당해 기술 분야의 통상의 분자 생물학, 미생물학 및 재조합 DNA 기술을 이용할 수 있다. 이러한 기술은 문헌에 충분히 설명되어 있다. 예를 들어, 하기 문헌을 참조한다: Sambrook, Fitsch & Maniatis, Molecular Cloning: A Laboratory Manual, 제2 Edition (1989) Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (본원에서 "Sambrook et al., 1989"로 언급됨); DNA Cloning: A Practical Approach, Volumes I 및 II (D. N. Glover ed. 1985); Oligonucleotide Synthesis (M. J. Gait ed. 1984); Nucleic Acid Hybridization(B. D. Hames & S. J. Higgins, eds. 1984); Animal Cell Culture (R. I. Freshney, ed. 1986); Immobilized Cells and Enzymes (IRL Press, 1986); B. E. Perbal, A Practical Guide to Molecular Cloning (1984); F. M. Ausubel et al. (eds.), Current Protocols in Molecular Biology, John Wiley & Sons, Inc. (1994).
용어 "형질감염"은, 숙주 세포가 도입된 유전자 또는 서열을 발현시켜 쉬말렌베르그 바이러스의 N 핵단백질을 생성하도록, 외래 핵산을 진핵생물 숙주 세포로 도입하는 것을 의미한다. 도입된 DNA 또는 RNA를 수용하고 발현시키는 숙주 세포는 "형질감염되며", 이러한 숙주 세포가 "트랜스펙턴트" 또는 "클론"이다. 숙주 세포에 도입된 DNA 또는 RNA는 숙주 세포와 동일한 속 또는 종의 세포 또는 상이한 속 또는 종의 세포를 포함하는 임의의 공급원으로부터의 것일 수 있다.
본 발명과 관련하여, 폴리뉴클레오타이드를 사용한 숙주 세포의 형질감염은 당해 기술 분야의 고전적인 방법, 예를 들어, 형질감염, 감염 또는 전기천공으로 수행될 수 있다. 또 다른 실시형태에서, 본 발명의 벡터는 (네이키드 (naked) DNA로서) 리포펙션에 의해 또는 다른 형질감염 촉진제(펩타이드, 중합체 등)를 사용하여 생체내에서 도입될 수 있다. 합성 양이온 지질을 사용하여 마커를 인코딩하는 유전자의 생체내 형질감염을 위한 리포좀을 제조할 수 있다(Felgner et al., Proc. Natl. Acad. Sci. U.S.A., 84:7413-7417, 1987). 핵산 전달에 유용한 지질 화합물과 조성물이 WO 95/18863, WO 96/17823 및 U.S. 5,459,127에 기술되어 있다. 지질은 표적화를 위한 다른 분자에 화학적으로 커플링될 수 있다(참조:, Mackey et al., Proc. Natl. Acad. Sci. U.S.A., 85:8027-8031, 1988). 표적 펩타이드, 예를 들어, 호르몬 또는 신경전달자 및 단백질, 예를 들어, 항체, 또는 비-펩타이드 분자를 화학적으로 리포좀에 커플링시킬 수 있었다. 또한, 다른 분자, 예를 들어, 양이온성 올리고펩타이드(참조: WO 95/21931), DNA 결합 단백질로부터 유도되는 펩타이드(참조: WO 96/25508), 또는 양이온성 중합체(참조: WO 95/21931)도 핵산의 생체내 형질감염을 용이하게 하는데 유용하다. 또한, 벡터를 생체내에서 네이키드 DNA 플라스미드로서 도입할 수 있다. 유전자 요법을 위한 네이키드 DNA 벡터는 당해 기술 분야의 공지된 방법, 예를 들어, 전기천공, 마이크로주입, 세포 융합, DEAE 덱스트란, 인산칼슘 침전, 유전자총 사용, DNA 벡터 이동자 사용에 의해 목적하는 숙주 세포로 도입될 수 있다(참조:, Wu et al., J. Biol. Chem., 267:963-967, 1992; Wu and Wu, J. Biol. Chem., 263:14621-14624, 1988; Williams et al., Proc. Natl. Acad. Sci. U.S.A., 88:2726-2730, 1991).
본원에서 폴리뉴클레오타이드의 "발현을 가능하게 하는"이란 표현은 벡터에 존재하는 조절 서열의 자극(예: 유도성 프로모터를 활성화시키는 자극) 및 모든 필요한 성분이 폴리뉴클레오타이드의 해독이 일어나기에 충분한 양으로 존재한다는 것을 의미한다.
필요한 경우, AGT/SNAP 폴리펩타이드는, 재조합 세포의 상등액에 또는 재조합 세포내로 정의된 개열 부위를 갖는 프로테아제를 부가함으로써 생성된 융합 단백질로부터 개열될 수 있다. 예를 들어, 서열번호 35 또는 36의 pDeSNAP Univ 카세트를 포함하는 벡터를 사용하는 경우, 재조합 세포의 상등액에 TEV 프로테아제를 부가함으로써 pro-TEV 개열 부위 ENLKYFQ/G(S)가 개열된다. 달리, AGT/SNAP 폴리펩타이드는 SBV로부터의 N 핵단백질의 수명을 증진시키도록 유지될 수 있다.
또한, 당업자는 발현되거나 분비되는 단백질 또는 폴리펩타이드가 당해 숙주 세포를 유지시키거나 성장시키기 위해 사용된 배양 배지에서 검출될 수 있다는 것을 알 수 있을 것이다. 배양 배지는 공지된 공정, 예를 들어, 원심분리 또는 여과에 의해 숙주 세포로부터 분리될 수 있다. 이어서, 단백질 또는 폴리펩타이드는 이에 대해 공지된 특성을 이용하여 세포-비함유 배양 배지에서 검출될 수 있다. 이러한 특성은 단백질 또는 폴리펩타이드의 상이한 면역학적, 효소적 또는 물리적 특성을 포함할 수 있다. 예를 들어, 단백질 또는 폴리펩타이드가 독특한 효소 활성을 갖는 경우, 숙주 세포에 의해 사용된 배양 배지 상에서 효소 활성 분석이 수행될 수 있다. 또한, 소정의 단백질 또는 폴리펩타이드에 대해 반응적인 항체가 이용가능한 경우, 이러한 항체를 사용하여 (예를 들어, 문헌(Harlowe, et al., 1988, Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory Press)에서와 같이) 임의의 공지된 면역학적 분석으로 단백질 또는 폴리펩타이드를 검출할 수 있다
SBV로부터의 핵단백질 N 의 회수는, 제조용(preparative) 디스크-겔 전기영동, 등전점 포커싱, HPLC, 역상 HPLC, 겔 여과, 이온 교환 및 분배 크로마토그래피, 침전 및 염석 크로마토그래피, 추출, 향류 분배 등을 포함하고 이로 제한되지 않는 당해 기술 분야의 널리 공지된 방법으로 수행된다. 표지는 적합한 고체상 매트릭스 상에서의 크로마토그래피로 숙주 세포의 조 용해물로부터 폴리펩타이드의 회수를 용이하게 할 것이므로, 표지와 연결된 본 발명의 재조합 시스템으로 관심 단백질을 생성하는 것이 바람직하다. 달리, 단백질 또는 이로부터 유도된 펩타이드에 대해 생성된 항체를 회수 시약으로 사용할 수 있다.
본 발명자들은 본 발명의 방법으로 생성되는 융합 단백질이 일반적으로 추가로 정제될 필요가 없다는 것을 발견하였다. 그러나, 필요한 경우, 추가의 정제 단계 (g)가 수행될 수 있다.
정제된 물질은 처음에 관련된 세포성 성분을 약 50% 미만, 바람직하게는 약 75% 미만, 가장 바람직하게는 약 90% 미만으로 포함할 수 있다. 용어 "실질적으로 순수한"은 당해 기술 분야에 공지된 통상의 정제 기술을 이용하여 달성될 수 있는 최고의 순도를 나타낸다.
본 발명의 일 실시형태에서, 본 발명의 방법은 회수된 세포 배양 상등액 중의 적어도 40 mg/L, 바람직하게는 적어도 50 mg/L, 더욱 바람직하게는 적어도 60 mg/L의 실질적으로 순수한 쉬말렌베르그 바이러스(SBV)의 N 핵단백질을 수득하는 것을 가능하게 한다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 서열번호 16의 쉬말렌베르그 바이러스의 N 핵단백질을 포함하는 융합 폴리펩타이드에 관한 것이다.
이러한 융합 폴리펩타이드에서, AGT 효소는 바람직하게는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다.
이러한 융합 폴리펩타이드 바람직하게는 상기 정의된 바와 같은 표지를 추가로 포함한다. 이러한 표지는 바람직하게는 폴리-히스티딘 표지이며, 바람직하게는 쉬말렌베리그 바이러스의 N 핵단백질의 C 말단에 위치된다.
본 발명의 융합 폴리펩타이드의 예는 서열번호 41(BiPlike/SNAP/SBV.N/Histag 융합 단백질에 상응) 또는 서열번호 46(ssBiP/SNAP/SBV.N/Histag 융합 단백질에 상응) 또는 서열번호 42(SNAP/SBV.N 융합 단백질에 상응)의 아미노산 서열이다.
본 발명은, 서열번호 178의 뉴클레오타이드 서열을 갖고/갖거나 서열번호 179의 아미노산 서열을 인코딩하는 DeSNAPuniv-쉬말렌베르그 NS 단백질 카세트를 포함하는 벡터를 포함한다. 상기 벡터는 SNAP의 시그널 펩타이드, SNAP 서열, pro-TEV 부위, 또는 도 24에 도시된 수말렌베르그 바이러스의 NS 단백질을 인코딩하는 DNA 서열, 또는 이의 적어도 10, 15, 20, 25, 30, 40, 50, 60, 100, 200 또는 300개의 연속 아미노산을 단독으로 또는 조합하여 포함한다.
마지막으로, 키메라 단백질 SNAP-SBV. N는 생물학적 유체, 예를 들어, 혈액, 혈청, 타액 등에서 쉬말렌베르그 바이러스에 의한 감염의 검출 또는 상기 바이러스에 특이적인 항체의 검출을 위한 진단제로서 유용할 수 있다.
따라서, 또 다른 양상에서, 본 발명은 또한, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 병원성 또는 비-병원성 미생물의 존재를 확인하기 위한 본 발명의 임의의 방법에 의해 수득되는 융합 단백질 [SNAP- SBV. N]의 용도에 관한 것이다.
또 다른 양상에서, 본 발명은 또한 관심 항원, 예를 들어, 관심의 바이러스 또는 세균 항원, 미생물 펩타이드 및/또는 폴리펩타이드와 프레임 내에 융합된 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인을 포함하는 특정 관심의 융합 단백질을 발현하는 벡터에 관한 것이다. 이들 벡터가 하기에서 상세히 기술된다.
에코바이러스 항원
또 다른 양상에서, 본 발명은 숙주 세포에서 에코바이러스 항원, 예를 들어, 엔테로바이러스 71(피코나비리대)의 VP1 단백질을 발현시키기 위한 벡터에 관한 것이다. 특히, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 엔테로바이러스 71(EV71, 예를 들어, 문헌(Kolpe A.B. et al, Virus Research 2012) 참조)의 VP1 단백질을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.
바람직한 실시형태에서, 이 벡터는 이른바 "pDeSNAP Univ/EV71.VP1 카세트", 즉, EV71 바이러스 스트레인 JL-AFP-EV71-07-03(Genebank#JQ715713)으로부터의 VP1 단백질을 인코딩하는 서열번호 47의 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이 벡터는 하기를 포함하는 서열번호 48의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/EV71.VP1 카세트를 포함한다:
- 서열번호 22의 곤충 BiP 서열,
- 서열번호 31의 SNAP-유사 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제1 DNA 서열,
- 서열 ENLYFQS(서열번호 32)의 pro-TEV1 개열 부위를 인코딩하는 서열번호 29의 DNA 서열,
- EV71 바이러스 스트레인 JL-AFP-EV71-07-03(Genebank#JQ715713)로부터의 VP1 단백질을 인코딩하는 서열번호 47의 DNA 서열,
- 서열 ENLYFQG(서열번호 33)의 pro-TEV2 개열 부위를 인코딩하는 서열번호 30의 DNA 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제2 DNA 서열,
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) EV71 바이러스로부터의 VP1 단백질을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 49의 아미노산 서열(SNAP-유사/proTEV1/EV71.VP1/proTEV2/Histag 융합 단백질에 상응)이다. 고도(30mg/l)의 이러한 단백질은 S2의 유도 후에 생성되었다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석에서,생물학적 샘플 중의 엔테로바이러스 71의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- EV71.VP1]의 용도에 관한 것이다.
플라비바이러스 항원
또 다른 양상에서, 본 발명은 숙주 세포에서 특정 플라비바이러스 항원을 발현시키기 위한 벡터에 관한 것이다.
바람직한 실시형태에서, 상기 플라비바이러스 항원은 일본 뇌염으로부터의 가용성 E 단백질(sE)(JEV.sE)이다. 보다 특히, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 일본 뇌염 바이러스로부터의 sE 단백질을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/JEV.sE 카세트, 즉 일본 뇌염 바이러스(JEV)로부터의 가용성 E 단백질(sE)을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 5'로부터 3'까지 하기를 포함하는 서열번호 50의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/JEV.sE 카세트를 포함한다:
- 서열번호 22의 곤충 BiP 서열,
- JEV 스트레인 SA-14(Genbank#M55506)으로부터의 prM/M 서열을 인코딩하는 DNA 서열,
- JEV 스트레인 SA-14(Genbank#M55506)으로부터의 E[1-395] 서열을 인코딩하는 DNA 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 DNA 서열,
- 서열번호 31의 SNAP-유사 서열,
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 일본 뇌염 바이러스로부터의 가용성 E 단백질(sE)(JEV.sE)을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 51의 아미노산 서열(JEV.sE/SNAP-유사/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 일본 뇌염 바이러스(JEV)의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-JEV.sE]의 용도에 관한 것이다.
바람직한 실시형태에서, 상기 플라비바이러스 항원은 일본 뇌염 바이러스 유전형 1(JE-1.EDIII), 유전형 2(JE-2.EDIII), 유전형 4(JE-4.EDIII), 또는 유전형 5(JE-5.EDIII)로부터의 외피 E 단백질의 도메인 III(EDIII 단백질)이다.
또 다른 양상에서, 본 발명은 따라서 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 일본 뇌염 바이러스 유전형 1(JE-1.EDIII), 유전형 2(JE-3.EDIII), 유전형 4(JE-4.EDIII), 또는 유전형 5(JE-5.EDIII)로부터의 EDIII 단백질을 인코딩하는 뉴클레오타이드 서열을 포함하는, 숙주 세포에서 일본 뇌염 바이러스 유전형 1(JE-1.EDIII), 유전형 2(JE-2.EDIII), 유전형 4(JE-4.EDIII), 또는 유전형 5(JE-5.EDIII)로부터의 외피 E 단백질의 도메인 III(EDIII 단백질)을 발현시키기위한 벡터에 관한 것이다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/JE-I.EDIII 카세트", 즉, 일본 뇌염 바이러스 유전형 1로부터의 외피 E 단백질의 도메인 III(EDIII 단백질)(JE-1.EDIII)를 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 52이 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/ JE-1.EDIII 카세트를 포함한다:
- 서열번호 23의 곤충 BiP-유사 서열,
- 서열번호 31의 SNAP-유사 서열,
- 일본 뇌염 바이러스 유전형 1(Genebank#AY377577)로부터의 외피 E 단백질의 도메인 III(EDIII 단백질)를 인코딩하는 서열번호 54의 DNA서열,
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/JE-2.EDIII 카세트", 즉, 일본 뇌염 바이러스 유전형 2로부터의 외피 E 단백질의 도메인 III(EDIII 단백질)(JE-2.EDIII)의 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 59의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/ JE-2.EDIII 카세트를 포함한다:
- 서열번호 23의 곤충 BiP-유사 서열,
- 서열번호 31의 SNAP-유사 서열,
- 일본 뇌염 바이러스 유전형 2(Genebank#L-43566)로부터의 외피 E 단백질의 도메인 III(EDIII 단백질)를 인코딩하는 서열번호 55의 DNA서열,
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/JE-4.EDIII 카세트", 즉, 일본 뇌염 바이러스 유전형 4로부터의 외피 E 단백질의 도메인 III(EDIII 단백질)(JE-4.EDIII)의 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 61의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/ JE-4.EDIII 카세트를 포함한다:
- 서열번호 23의 곤충 BiP-유사 서열,
- 서열번호 31의 SNAP-유사 서열,
- 일본 뇌염 바이러스 유전형 4(Genebank#U70408)로부터의 외피 E 단백질의 도메인 III(EDIII 단백질)를 인코딩하는 서열번호 56의 DNA 서열,
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/JE-5.EDIII 카세트", 즉, 일본 뇌염 바이러스 유전형 5로부터의 외피 E 단백질의 도메인 III(EDIII 단백질)(JE-5.EDIII)를 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 63의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/ JE-5.EDIII 카세트를 포함한다:
- 서열번호 23의 곤충 BiP-유사 서열,
- 서열번호 31의 SNAP-유사 서열,
- 일본 뇌염 바이러스 유전형 5(Genebank#JN587258)로부터의 외피 E 단백질의 도메인 III(EDIII 단백질)을 인코딩하는 서열번호 57의 DNA서열,
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) JE-1, JE-2, JE-4, 또는 JE-5 바이러스로부터의 EDIII 단백질을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 53의 아미노산 서열(SNAP-유사/JE-1.EDIII/Histag 융합 단백질에 상응), 서열번호 60의 아미노산 서열(SNAP-유사/JE-2.EDIII/Histag 융합 단백질에 상응) 서열번호 62의 아미노산 서열(SNAP-유사/JE-4.EDIII/Histag 융합 단백질에 상응) 또는 서열번호 64(SNAP-유사/JE-5.EDIII/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 유전형 1, 2, 4 또는 5의 일본 뇌염 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- JE-1.EDIII], [SNAP- JE-2.EDIII], [SNAP- JE-4.EDIII] 또는 [SNAP- JE-5.EDIII]의 용도에 관한 것이다.
또 다른 양상에서, 본 발명은 숙주 세포에서 라벤스버그 바이러스(RabV)로부터의 외피 E 단백질의 도메인 III(EDIII 단백질)을 발현시키기 위한 벡터에 관한 것으로, a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 라벤스버그 바이러스(RabV)로부터의 외피 E 단백질의 도메인 III(EDIII 단백질)를 인코딩하는 뉴클레오타이드 서열을 포함한다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/RabV.EDIII 카세트", 즉, 라벤스버그 바이러스로부터의 EDIII 단백질의 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 65의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/ RabV.EDIII 카세트를 포함한다:
- 서열번호 23의 곤충 BiP-유사 서열,
- 서열번호 31의 SNAP-유사 서열,
- 라벤스버그 바이러스(Genebank#AY65264)로부터의 외피 E 단백질의 도메인 III(EDIII 단백질)을 인코딩하는 서열번호 58의 DNA 서열,
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 라벤스버그 바이러스로부터의 EDIII 단백질을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 66의 아미노산 서열 (SNAP-유사/RabV.EDIII/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 라벤스버그 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- RabV.EDIII]의 용도에 관한 것이다.
알파바이러스 항원
또 다른 양상에서, 본 발명은 숙주 세포에서 특정 알파바이러스 항원, 예를 들어, 로스 강 바이러스로부터의 가용성 E2 단백질(RR.sE2) 또는 마야로 바이러스로부터의 가용성 E2 단백질(MAY.sE2)를 발현시키기 위한 벡터에 관한 것이다.
특히, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 로스 강 바이러스로부터의 sE2 단백질을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/RR.sE2 카세트", 즉, 로스 강 바이러스로부터의 sE2 유전자의 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 69의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/ RR.sE2 카세트를 포함한다:
- 서열번호 22의 곤충 BiP 서열,
- 로스 강 바이러스 스트레인 QML1(Genbank#GQ433354)의 sE2 단백질을 인코딩하는 DNA 서열,
- 서열번호 31의 SNAP-유사 서열,
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 로스 강 바이러스로부터의 sE2 단백질을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 70의 아미노산 서열(RR.sE2/SNAP-유사/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 로스 강 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- RR.sE2]의 용도에 관한 것이다.
본 발명은 또한 숙주 세포에서 마야로 바이러스로부터의 가용성 E2 단백질(MAY.sE2)을 발현시키기 위한 벡터에 관한 것으로, a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 마야로 바이러스로부터의 sE2 단백질을 인코딩하는 뉴클레오타이드 서열을 포함한다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/MAY.sE2 카세트", 즉, 마야로 바이러스로부터의 sE2 유전자의 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 71의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/MAY.sE2 카세트를 포함한다:
- 서열번호 22의 곤충 BiP 서열,
- 마야로 바이러스 스트레인 IQD2668(Genbank#DQ487429.1)의 수정된 sE2 단백질(E2-S203C)을 인코딩하는 DNA 서열,
- 서열번호 31의 SNAP-유사 서열,
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 마야로 바이러스로부터의 sE2 단백질(MAY.sE2)을 포함하는 융합 단백질에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 72의 아미노산 서열(MAY.sE2/SNAP-유사/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 마야로 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- MAY.sE2]의 용도에 관한 것이다.
말 뇌염 바이러스 항원
또 다른 양상에서, 본 발명은 숙주 세포에서 특정 말 뇌염 바이러스 항원, 예를 들어, 서부 말 뇌염 바이러스로부터의 가용성 E2 단백질(WEE.sE2), 동부 말 뇌염 바이러스로부터의 가용성 E2 단백질(EEE.sE2) 또는 베네주엘라 말 뇌염 바이러스로부터의 가용성 E2 단백질(VEE.sE2)을 발현시키 위한 벡터에 관한 것이다.
특히, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 서부 말 뇌염 바이러스로부터의 가용성 E2 단백질을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/ WEE.sE2 카세트", 즉, 서부 말 뇌염으로부터의 sE2 유전자의 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 73의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/ WEE.sE2 카세트를 포함한다:
- 서열번호 22의 곤충 BiP 서열,
- 서부 말 뇌염 바이러스 스트레인(Genbank#NC00390808)으로부터의 sE2 단백질을 인코딩하는 DNA 서열,
- 서열번호 31의 SNAP-유사 서열,
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) WEE 바이러스의 sE2 단백질을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 74의 아미노산 서열(WEE.sE2/SNAP-유사/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 서부 말 뇌염 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- WEE.sE2]의 용도에 관한 것이다.
또 다른 실시형태에서, 본 발명은 숙주 세포에서 동부 말 뇌염 바이러스로부터의 가용성 E2 단백질(EEE.sE2)을 발현시키기 위한 벡터에 관한 것으로서, a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 동부 말 뇌염 바이러스로부터의 가용성 E2 단백질을 인코딩하는 뉴클레오타이드 서열을 포함한다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/ EEE.sE2 카세트", 즉, 동부 말 뇌염 바이러스로부터의 sE2 유전자의 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 75의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/ EEE.sE2 카세트를 포함한다:
- 서열번호 22의 곤충 BiP 서열,
- 동부 말 뇌염 바이러스 스트레인(Genbank#EF151502)으로부터의 sE2 단백질을 인코딩하는 DNA 서열,
- 서열번호 31의 SNAP-유사 서열,
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) EEE 바이러스로부터의 sE2 단백질을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 76의 아미노산 서열(EEE.sE2/SNAP-유사/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 동부 말 뇌염 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- EEE.sE2]의 용도에 관한 것이다.
또 다른 실시형태에서, 본 발명은 숙주 세포에서 베네주엘라 말 뇌염 바이러스로부터의 가용성 E2 단백질(VEE.sE2)을 발현시키기 위한 벡터에 관한 것으로서, a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 베네주엘라 말 뇌염 바이러스로부터의 가용성 E2 단백질을 인코딩하는 뉴클레오타이드 서열을 포함한다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/ VEE.sE2 카세트", 즉, 베네주엘라 말 뇌염 바이러스로부터의 sE2 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 77의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/ VEE.sE2 카세트를 포함한다:
- 서열번호 22의 곤충 BiP 서열,
- 베네주엘라 말 뇌염 바이러스 스트레인(Genbank#AY973944)으로부터의 sE2 단백질을 인코딩하는 DNA 서열,
- 서열번호 31의 SNAP-유사 서열,
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) VEE 바이러스로부터의 sE2 단백질을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 78의 아미노산 서열(VEE.sE2/SNAP-유사/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 베네주엘라 말 뇌염 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- VEE.sE2]의 용도에 관한 것이다.
오쏘부냐바이러스 항원
또 다른 양상에서, 본 발명은 숙주 세포에서 특정 오쏘부냐바이러스 항원, 특히 아카반 바이러스로부터의 핵단백질 N(AKA.N), 아이노 바이러스의 핵단백질 N(AIN.N) 또는 샤몬다 바이러스의 핵단백질 N(SHA.N)을 발현시키기 위한 벡터에 관한 것이다.
특히, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 아카반 바이러스로부터의 핵단백질 N을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/AKA.N 카세트", 즉, 아카반 바이러스로부터의 핵 단백질 N을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 79의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/ AKA.N 카세트를 포함한다:
- 서열번호 22의 곤충 BiP 서열,
- 서열번호 31의 SNAP-유사 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제1 DNA 서열,
- 서열 ENLYFQS(서열번호 32)의 pro-TEV1 개열 부위를 인코딩하는 서열번호 29의 DNA 서열,
- 아카반 바이러스의 천연 N 핵단백질을 인코딩하는 DNA 서열,
- 서열 ENLYFQG(서열번호 33)의 pro-TEV2 개열 부위를 인코딩하는 서열번호 30의 DNA 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제2 DNA 서열,
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 아카반 바이러스로부터의 N 핵단백질을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 80의 아미노산 서열(SNAP-유사/proTEV1/AKA.N/pro-TEV2/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 아카반 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- AKA.N]의 용도에 관한 것이다.
또 다른 실시형태에서, 본 발명은 숙주 세포에서 아이노 바이러스로부터의 핵단백질 N(AIN.N)을 발현시키기 위한 벡터에 관한 것으로서, a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 아이노 바이러스로부터의 핵단백질 N을 인코딩하는 뉴클레오타이드 서열을 포함한다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/AIN.N 카세트", 즉, 아이노 바이러스로부터의 핵단백질 N을 암호호하는 유전자의 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 81의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/AIN.N 카세트를 포함한다:
- 서열번호 22의 곤충 BiP 서열,
- 서열번호 31의 SNAP-유사 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제1 DNA 서열,
- 서열 ENLYFQS(서열번호 32)의 pro-TEV1 개열 부위를 인코딩하는 서열번호 29의 DNA 서열,
- 아이노 바이러스로부터의 천연 N 핵단백질을 인코딩하는 DNA 서열,
- 서열 ENLYFQG(서열번호 33)의 pro-TEV2 개열 부위를 인코딩하는 서열번호 30의 DNA 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제2 DNA 서열,
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 아이노 바이러스로부터의 N 핵단백질을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 82의 아미노산 서열(SNAP-유사/proTEV1/AIN.N/pro-TEV2/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 아이노 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- AIN.N]의 용도에 관한 것이다.
또 다른 실시형태에서, 본 발명은 숙주 세포에서 샤몬다 바이러스로부터의 핵단백질 N(SHA.N)을 발현시키기 위한 벡터에 관한 것으로서, a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 샤몬다 바이러스로부터의 핵단백질 N을 인코딩하는 뉴클레오타이드 서열을 포함한다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/SHA.N 카세트", 즉, 샤몬다 바이러스로부터의 핵단백질 N을 인코딩하는 유전자의 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 83의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/SHA.N 카세트를 포함한다:
- 서열번호 22의 곤충 BiP 서열,
- 서열번호 31의 SNAP-유사 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제1 DNA 서열,
- 서열 ENLYFQS(서열번호 32)의 pro-TEV1 개열 부위를 인코딩하는 서열번호 29의 DNA 서열,
- 샤몬다 바이러스로부터의 천연 N 핵단백질을 인코딩하는 DNA 서열,
- 서열 ENLYFQG(서열번호 33)의 pro-TEV2 개열 부위를 인코딩하는 서열번호 30의 DNA 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제2 DNA 서열,
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 샤몬다 바이러스로부터의 N 핵단백질을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 84의 아미노산 서열(SNAP-유사/proTEV1/SHA.N/pro-TEV2/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 샤몬다 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- SHA.N]의 용도에 관한 것이다.
베타코로나바이러스 항원
또 다른 양상에서, 본 발명은 숙주 세포에서 특정 베타코로나바이러스 항원, 예를 들어, 인간 베타코로나바이러스로부터의 핵단백질 N(huCOV.N) 또는 인간 베타코로나바이러스로부터의 단백질 S(huCOV.S)를 발현시키기위한 벡터에 관한 것이다.
특히, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 인간 베타코로나바이러스로부터의 핵단백질 N을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/huCOV.N 카세트", 즉, 인간 베타코로나 바이러스로부터의 핵단백질 N을 인코딩하는 유전자의 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 85의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/huCOV.N 카세트를 포함한다:
- 서열번호 22의 곤충 BiP 서열,
- 서열번호 31의 SNAP-유사 서열,
- 서열 ENLYFQS(서열번호 32)의 pro-TEV1 개열 부위를 인코딩하는 서열번호 29의 DNA 서열,
- 인간 베타코로나바이러스 2cEMC/2012(Genbank#JX869059)로부터의 유전자 N을 인코딩하는 DNA 서열,
- 서열 ENLYFQG(서열번호 33)의 pro-TEV2 개열 부위를 인코딩하는 서열번호 30의 DNA 서열,
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 인간 베타코로나바이러스로부터의 핵단백질 N을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 86의 아미노산 서열 (SNAP-유사/proTEV1/huCOV.N/proTEV2/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 인간 베타코로나 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- huCOV.N]의 용도에 관한 것이다.
또 다른 실시형태에서, 본 발명은 숙주 세포에서 인간 베타코로나바이러스로부터의 스파이크 S 단백질의 가용성 형태(huCOV.S)를 발현시키기 위한 벡터에 관한 것으로서, a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 인간 베타코로나바이러스로부터의 스파이크 S 단백질의 가용성 형태를 인코딩하는 뉴클레오타이드 서열을 포함한다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/huCOV.S 카세트", 즉, 인간 베타코로나 바이러스로부터의 유전자 S의 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 87의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/huCOV.S 카세트를 포함한다:
- 서열번호 22의 곤충 BiP 서열,
- 인간 베타코로나바이러스 2cEMC/2012(Genbank#JX869059)로부터의 유전자 S를 인코딩하는 DNA 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 DNA 서열,
- 서열번호 31의 SNAP-유사 서열,
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 실시형태에서, 벡터는 서열번호 154의 뉴클레오타이드 서열을 갖고/갖거나 서열번호 155의 아미노산 서열을 인코딩하는 DeSNAPuniv-SARS 바이러스 N 단백질 카세트를 포함한다. 벡터는 SNAP의 시그널 펩타이드, SNAP 서열, pro-TEV 부위, 또는 도 12에 도시된 SARS 코로나바이러스의 돌연변이된 단백질을 인코딩하는 DNA 서열, 또는 이의 적어도 10, 15, 20, 25, 30, 40, 50, 60, 100, 200 또는 300개의 연속 아미노산을 단독으로 또는 조합하여 포함한다.
또 다른 실시형태에서, 벡터는 서열번호 156의 뉴클레오타이드 서열을 갖고/갖거나 서열번호 157의 아미노산 서열을 인코딩하는 DeSNAP+SARS S-RDB 카세트를 포함한다. 벡터는 SNAP의 시그널 펩타이드, SNAP 서열, pro-TEV 부위, 또는 도 13에 도시된 SARS 바이러스의 S 단백질의 수용체 결합 도메인을 인코딩하는 DNA 서열, 또는 이의 적어도 10, 15, 20, 25, 30, 40, 50, 60, 100, 200 또는 300개의 연속 아미노산을 단독으로 또는 조합하여 포함한다.
또 다른 실시형태에서, 또 다른 실시형태에서, 벡터는 서열번호 158의 뉴클레오타이드 서열을 갖고/갖거나 서열번호 159의 아미노산 서열을 인코딩하는 DeSNAPuniv-huCOV.N(인간 코로나바이러스) 카세트를 포함한다. 벡터는 SNAP의 시그널 펩타이드, SNAP 서열, pro-TEV 부위, 또는 도 14에 도시된 인간 베타코로나바이러스의 유전자 N을 인코딩하는 DNA 서열, 또는 이의 적어도 10, 15, 20, 25, 30, 40, 50, 60, 100, 200 또는 300개의 연속 아미노산을 단독으로 또는 조합하여 포함한다.
또 다른 실시형태에서, 벡터는 서열번호 160의 뉴클레오타이드 서열을 갖고/갖거나 서열번호 161의 아미노산 서열을 인코딩하는 -huCOV.S1+DeSNAP(인간 코로나바이러스) 카세트를 포함한다. 벡터는 키메라 단백질의 시그널 펩타이드, SNAP 서열, 또는 도 15에 도시된 인간 베타코로나바이러스의 유전자 S1을 인코딩하는 DNA 서열, 또는 이의 적어도 10, 15, 20, 25, 30, 40, 50, 60, 100, 200 또는 300개의 연속 아미노산을 단독으로 또는 조합하여 포함한다.
또 다른 실시형태에서, 벡터는 서열번호 162의 뉴클레오타이드 서열을 갖고/갖거나 서열번호 163의 아미노산 서열을 인코딩하는 DeSNAPuniv-huCoV.S-RDB 카세트를 포함한다. 벡터는 키메라 단백질의 시그널 펩타이드, SNAP 서열, pro-TEV 부위, 또는 도 16에 도시된 인간 베타코로나바이러스의 S 단백질의 RBD를 인코딩하는 DNA 서열, 또는 이의 적어도 10, 15, 20, 25, 30, 40, 50, 60, 100, 200 또는 300개의 연속 아미노산을 단독으로 또는 조합하여 포함한다.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 인간 베타코로나바이러스로부터의 스파이크 S 단백질의 가용성 형태를 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 88의 아미노산 서열(huCOV.S/SNAP-유사/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 인간 베타코로나 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- huCOV.S]의 용도에 관한 것이다.
헤파시바이러스 항원
또 다른 양상에서, 본 발명은 숙주 세포에서 특정 헤파시바이러스 항원, 예를 들어, C형 간염 바이러스로부터의 단백질 C(HCV.C) 또는 E형 간염 바이러스로부터의 단백질 C(HEV.C)를 발현시키기 위한 벡터에 관한 것이다.
하나의 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) C형 간염 바이러스로부터의 단백질 C를 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/HCV.C 카세트", 즉, C형 간염 바이러스로부터의 단백질 C의 유전자의 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 89의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/HCV.C 카세트를 포함한다:
- 서열번호 22의 곤충 BiP 서열,
- 서열번호 31의 SNAP-유사 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제1 DNA 서열,
- 서열 ENLYFQS(서열번호 32)의 pro-TEV1 개열 부위를 인코딩하는 서열번호 29의 DNA 서열,
- C형 간염 바이러스 유전형 1b(스트레인 TCHM-R2/03)로부터의 C 단백질을 인코딩하는 DNA 서열 ,
- 서열 ENLYFQG(서열번호 33)의 pro-TEV2 개열 부위를 인코딩하는 서열번호 30의 DNA 서열,
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 실시형태에서, 벡터는 서열번호 170의 뉴클레오타이드 서열을 갖고/갖거나 서열번호 171의 아미노산 서열을 인코딩하는 DeSNAPuniv-HEV.C 카세트를 포함한다. 벡터는 SNAP의 시그널 펩타이드, SNAP 서열, pro-TEV 부위, 또는 도 20에 도시된 E형 간염 바이러스의 돌연변이된 C 단백질을 인코딩하는 DNA 서열, 또는 이의 적어도 10, 15, 20, 25, 30, 40, 50, 60, 100, 200 또는 300개의 연속 아미노산을 단독으로 또는 조합하여 포함한다.
또 다른 실시형태에서, 벡터는 서열번호 172의 뉴클레오타이드 서열을 갖고/갖거나 서열번호 173의 아미노산 서열을 인코딩하는 DeSNAPuniv-HEV.C 단백질 중심 도메인 카세트를 포함한다. 벡터는 SNAP의 시그널 펩타이드, SNAP 서열, pro-TEV 부위, 또는 도 21에 도시된 HEV 코어 항원을 인코딩하는 DNA 서열, 또는 이의 적어도 10, 15, 20, 25, 30, 40, 50, 60, 100, 200 또는 300개의 연속 아미노산을 단독으로 또는 조합하여 포함한다.
또 다른 실시형태에서, 또 다른 실시형태에서, 벡터는 서열번호 174의 뉴클레오타이드 서열을 갖고/갖거나 서열번호 175의 아미노산 서열을 인코딩하는 DeSNAPuniv-HCV 코어 항원 카세트를 포함한다. 벡터는 SNAP의 시그널 펩타이드, SNAP 서열, pro-TEV 부위, 또는 도 22에 도시된 HCV 코어 항원을 인코딩하는 DNA 서열, 또는 이의 적어도 10, 15, 20, 25, 30, 40, 50, 60, 100, 200 또는 300개의 연속 아미노산을 단독으로 또는 조합하여 포함한다.
또 다른 실시형태에서, 벡터는 서열번호 176의 뉴클레오타이드 서열을 갖고/갖거나 서열번호 177의 아미노산 서열을 인코딩하는 DeSNAPuniv-짧은 HCV 코어(C) 카세트를 포함한다. 벡터는 SNAP의 시그널 펩타이드, SNAP 서열, pro-TEV 부위, 또는 도 23에 도시된 HCV 코어 단백질의 짧은 형태를 인코딩하는 DNA 서열, 또는 이의 적어도 10, 15, 20, 25, 30, 40, 50, 60, 100, 200 또는 300개의 연속 아미노산을 단독으로 또는 조합하여 포함한다.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) C형 간염 바이러스로부터의 단백질 C(HCV.C)를 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는(상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 90의 아미노산 서열(SNAP-유사/proTEV1/HCV.C/proTEV2/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 C형 간염 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- HCV.C]의 용도에 관한 것이다.
또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) E형 간염 바이러스의 단백질 C(HEV.C)를 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/HEV.C 카세트", 즉, E형 간염 바이러스로부터의 단백질 C의 유전자의 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 150의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/HEV.C 카세트를 포함한다:
- 서열번호 23의 곤충 BiP-유사 서열,
- 서열번호 31의 SNAP-유사 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제1 DNA 서열,
- 서열 ENLYFQS(서열번호 32)의 pro-TEV1 개열 부위를 인코딩하는 서열번호 29의 DNA 서열,
- E형 간염 바이러스(Genbank#AB29196)로부터의 C 단백질을 인코딩하는 DNA 서열,
- 서열 ENLYFQG(서열번호 33)의 pro-TEV2 개열 부위를 인코딩하는 서열번호 30의 DNA 서열,
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) E형 간염 바이러스로부터의 단백질 C(HEV.C)를 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 151의 아미노산 서열(SNAP-유사/proTEV1/HEV.C/proTEV2/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 E형 간염 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- HEV.C]의 용도에 관한 것이다.
말라리아 항원
또 다른 양상에서, 본 발명은 숙주 세포에서 특정 말라리아 항원, 예를 들어, 플라스모듐 팔시파룸으로부터의 MSP-1 및 AMA-1 단백질(MSP-1+AMA-1)(참조: Pan W. et al, The Journal of Immunology, 2004)을 발현시키기 위한 벡터에 관한 것이다.
특히, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 기생충 플라스모듐 팔시파룸으로부터의 MSP-1 및 AMA-1 단백질을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/MSP-1+AMA-1카세트", 즉, 기생충 플라스모듐 팔시파룸으로부터의 MSP-1 및 AMA-1 단백질을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 91의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/MSP-1+AMA-1카세트를 포함한다:
- 서열번호 22의 곤충 BiP 서열,
- 서열번호 31의 SNAP-유사 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제1 DNA 서열,
- 플라스모듐 팔시파룸으로부터의 MSP-1(19) 서열(50% G+C)을 인코딩하는 DNA 서열,
- 서열 ENLYFQG(서열번호 33)의 pro-TEV2 개열 부위를 인코딩하는 서열번호 30의 DNA 서열,
- 플라스모듐 팔시파룸으로부터의 AMA-1(III) 서열(50% G+C)을 인코딩하는 DNA 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제2 DNA 서열,
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 플라스모듐 팔시파룸으로부터의 MSP-1+AMA-1 단백질을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 92의 아미노산 서열(SNAP-유사/MSP-1/proTEV2/AMA-1/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 기생충 플라스모듐 팔시파룸의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- MSP-1+AMA-1]의 용도에 관한 것이다.
렙토스피로시스 항원
또 다른 양상에서, 본 발명은 숙주 세포에서 특정 렙토스피로시스 항원, 예를 들어, 렙토스피라 세균의 HbpA, LruA, LruB 또는 LipL32 단백질(참조: Sivakolundu S. et al, Journal of Medical Microbiology, 2012)을 발현시키기 위한 벡터에 관한 것이다. 바람직한 벡터는 SNAP-Lru A 및 SNAP-Lru B이다. 특히 바람직한 것은 이들 벡터를 함유하는 S2 세포주이다. S2/SNAP-Lru A 및 S2/SNAP-Lru B 세포주는 2013년 5월 2일자로 콜렉션 네션날레 드 컬쳐 드 마이크로오르가니즘 [the Collection Nationale de Cultures de Microorganismes(CNCM)), 25, Rue du Docteur Roux, 75724 Paris Cedex 15, France]에 각각 기탁번호 CNCM I-4745 및 CNCM I-4746으로 기탁되었다.
특히, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 렙토스피라 인테로간스 세균으로부터의 HbpA 단백질을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/HbpA 카세트", 즉, 렙토스피라 세균으로부터의 HbpA 단백질을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 93의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/HbpA 카세트를 포함한다:
- 서열번호 22의 곤충 BiP 서열,
- 서열번호 31의 SNAP-유사 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제1 DNA 서열,
- 서열 ENLYFQS(서열번호 32)의 pro-TEV1 개열 부위를 인코딩하는 서열번호 29의 DNA 서열,
- 렙토스피라 인테로간스 혈청형 Lai str.56601(Genbank#AA51750.1)로부터의 HbpA(TonB-의존적 외막 수용체 또는 LB191)의 변형된 단축 형태를 인코딩하는 DNA 서열,
- 서열 ENLYFQG(서열번호 33)의 pro-TEV2 개열 부위를 인코딩하는 서열번호 30의 DNA 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제2 DNA 서열,
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 실시형태에서, 벡터는 서열번호 164의 뉴클레오타이드 서열을 갖고/갖거나 서열번호 165의 아미노산 서열을 인코딩하는 DeSNAPuniv-짧은 LruA(렙토스피라증) 카세트를 포함한다. 벡터는 SNAP의 시그널 펩타이드, SNAP 서열, pro-TEV 부위, 또는 도 17에 도시된 LruA의 변형된 짧은 형태를 인코딩하는 DNA 서열, 또는 이의 적어도 10, 15, 20, 25, 30, 40, 50, 60, 100, 200 또는 300개의 연속 아미노산을 단독으로 또는 조합하여 포함한다.
또 다른 실시형태에서, 벡터는 서열번호 166의 뉴클레오타이드 서열을 갖고/갖거나 서열번호 167의 아미노산 서열을 인코딩하는 DeSNAPuniv-짧은 LruB(렙토스피라증) 카세트를 포함한다. 벡터는 SNAP의 시그널 펩타이드, SNAP 서열, pro-TEV 부위, 또는 도 18에 도시된 LruB의 변형된 짧은 형태를 인코딩하는 DNA 서열, 또는 이의 적어도 10, 15, 20, 25, 30, 40, 50, 60, 100, 200 또는 300개의 연속 아미노산을 단독으로 또는 조합하여 포함한다.
또 다른 실시형태에서, 또 다른 실시형태에서, 벡터는 서열번호 168의 뉴클레오타이드 서열을 갖고/갖거나 서열번호 169의 아미노산 서열을 인코딩하는 DeSNAPuniv-LipL2(렙토스피라증) 카세트를 포함한다. 벡터는 SNAP의 시그널 펩타이드, SNAP 서열, pro-TEV 부위, 또는 도 19에 도시된 LipL32의 변형된 짧은 형태를 인코딩하는 DNA 서열, 또는 이의 적어도 10, 15, 20, 25, 30, 40, 50, 60, 100, 200 또는 300개의 연속 아미노산을 단독으로 또는 조합하여 포함한다.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 렙토스피라 인테로간스 세균으로부터의 HbpA 단백질을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 94의 아미노산 서열(SNAP-유사/proTEV1/HbpA/proTEV2/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 렙토스피라 세균의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-HbpA]의 용도에 관한 것이다.
미생물성 펩타이드
또 다른 양상에서, 본 발명은 숙주 세포에서 미생물성 펩타이드, 예를 들어, 미생물성 펩타이드 MUB-40를 발현시키기 위한 벡터에 관한 것이다.
특히, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) MUB-40 펩타이드를 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/MUB40 카세트", 즉, MUB40 펩타이드를 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 95의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/MUB40 카세트를 포함한다:
- 서열번호 22의 곤충 BiP 서열,
- 서열번호 31의 SNAP-유사 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제1 DNA 서열,
- 서열 ENLYFQS(서열번호 32)의 pro-TEV1 개열 부위를 인코딩하는 서열번호 29의 DNA 서열,
- MUB-40 펩타이드를 인코딩하는 DNA 서열,
- 서열 ENLYFQG(서열번호 33)의 pro-TEV2 개열 부위를 인코딩하는 서열번호 30의 DNA 서열, 및
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) MUB 40 펩타이드를 포함하는 융합 폴레펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 96의 아미노산 서열(SNAP-유사/proTEV1/MUB40/proTEV2/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 리간드의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-MUB40]의 용도에 관한 것이다.
플라비바이러스 발병에 관여되는 렉틴
또 다른 양상에서, 본 발명은 숙주 세포에서 플라비바이러스 발병에 관여되는 특정 렉틴, 예를 들어, C형 유사 렉틴의 마우스 또는 인간 가용성 형태(CLEC5A)를 발현시키기 위한 벡터에 관한 것이다.
특히, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 마우스 CLEC5A(mo-CLEC5A) 또는 인간 CLEC5A(hu-CLEC5A)를 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/mo-CLEC5A 카세트", 즉, C형 유사 렉틱의 마우스 가용성 형태를 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 97의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/mo-CLEC5A 카세트를 포함한다:
- 서열번호 22의 곤충 BiP 서열,
- 서열번호 31의 SNAP-유사 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제1 DNA 서열,
- 서열 ENLYFQS(서열번호 32)의 pro-TEV1 개열 부위를 인코딩하는 서열번호 29의 DNA 서열,
- C형 유사 렉틴의 마우스 가용성 형태(CLEC5A)를 인코딩하는 DNA 서열,
- 서열 ENLYFQG(서열번호 33)의 pro-TEV2 개열 부위를 인코딩하는 서열번호 30의 DNA 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제2 DNA 서열, 및
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/hu-CLEC5A 카세트", 즉, C형 유사 렉틴의 인간 가용성 형태를 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 99의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/hu-CLEC5A 카세트를 포함한다:
- 서열번호 22의 곤충 BiP 서열,
- 서열번호 31의 SNAP-유사 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제1 DNA 서열,
- 서열 ENLYFQS(서열번호 32)의 pro-TEV1 개열 부위를 인코딩하는 서열번호 29의 DNA 서열,
- C형 유사 렉틴의 인간 가용성 형태(CLEC5A)를 인코딩하는 DNA 서열,
- 서열 ENLYFQG(서열번호 33)의 pro-TEV2 개열 부위를 인코딩하는 서열번호 30의 DNA 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제2 DNA 서열, 및
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) C형 유사 렉틴의 마우스 또는 인간 가용성 형태(CLEC5A)를 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는(상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 98의 아미노산 서열(SNAP-유사/proTEV1/mo-CLEC5A/proTEV2/Histag 융합 단백질에 상응) 또는 서열번호 100(SNAP-유사/proTEV1/hu-CLEC5A/proTEV2/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 플라비 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-mo-CLEC5A] 또는 [SNAP-hu-CLEC5A]의 용도에 관한 것이다.
항-플라비바이러스 모기 단백질
또 다른 양상에서, 본 발명은 숙주 세포에서 특정 항바이러스 모기 단백질, 예를 들어, 쿨렉스(Culex) 종으로부터의 VAGO 단백질(cxVAGO) 또는 아에데스(Aedes) 종으로부터의 VAGO 단백질(aaVAGO)을 발현시키기 위한 벡터에 관한 것이다.
특히, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 아에데스 알보픽투스(Aedes albopictus) 모기로부터의 VAGO 단백질을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/aaVAGO 카세트", 즉, 아에데스 알보픽투스 모기로부터의 VAGO 단백질을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 103의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/aaVAGO 카세트를 포함한다:
- 서열번호 152의 곤충 BiP-유사 서열,
- 서열번호 31의 SNAP-유사 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 DNA 서열,
- 아에데스 알보픽투스 모기로부터의 VAGO 단백질을 인코딩하는 DNA 서열, 및
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 아에데스 알보픽투스 모기로부터의 VAGO 단백질을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 104의 아미노산 서열(SNAP-유사/aaVAGO/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 리간드의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-aaVAGO]의 용도에 관한 것이다.
또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 쿨렉스 퀸퀘파시아투스(Culex quinquefasciatus) 모기로부터의 VAGO 단백질을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/cxVAGO 카세트", 즉, 쿨렉스 퀸퀘파시아투스 모기로부터의 VAGO 단백질을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 101의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/cxVAGO 카세트를 포함한다:
- 서열번호 152의 곤충 BiP-유사 서열,
- 서열번호 31의 SNAP-유사 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 DNA 서열,
- 쿨렉스 퀸퀘파시아투스 모기로부터의 VAGO 단백질을 인코딩하는 DNA 서열, 및
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 쿨렉스 퀸퀘파시아투스 모기로부터의 VAGO 단백질을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 102의 아미노산 서열(SNAP-유사/cxVAGO/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 리간드의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-cxVAGO]의 용도에 관한 것이다.
바이러스 출혈 열 항원
또 다른 양상에서, 본 발명은 하기와 같은 특정 바이러스 출혈 열 항원을 발현시키기 위한 벡터에 관한 것이다:
- 크리미아-콩고 바이러스로부터의 핵단백질 N(CCHF.N), 에볼라 바이러스로부터의 핵단백질 N(EBO.N), 마르부르그 바이러스로부터의 핵단백질 N(MAR.N), 라사 바이러스로부터의 핵단백질 N(LAS.N), 주닌 바이러스로부터의 핵단백질 N(JUN.N), 마추포 바이러스로부터의 핵단백질 N(MAC.N), 사비아 바이러스로부터의 핵단백질 N(SAB.N), 또는 구아나리토 바이러스로부터의 핵단백질 N(GUA.N),
- 라사 바이러스로부터의 GP1의 엑토도메인(LAS.ectoGP1), 주닌 바이러스로부터의 GP1의 엑토도메인(JUN.ectoGP1), 마추포 바이러스로부터의 GP1의 엑토도메인(MAC.ectoGP1), 사비아 바이러스로부터의 GP1의 엑토도메인(SAB.ectoGP1), 또는 구아나리토 바이러스로부터의 GP1의 엑토도메인(GUA.ectoGP1),
- 라사 바이러스로부터의 GP2의 엑토도메인(LAS.ectoGP2), 주닌 바이러스로부터의 GP2의 엑토도메인(JUN.ectoGP2), 마추포 바이러스로부터의 GP2의 엑토도메인(MAC.ectoGP2), 사비아 바이러스로부터의 GP2의 엑토도메인(SAB.ectoGP2), 또는 구아나리토 바이러스로부터의 GP2의 엑토도메인(GUA.ectoGP2),
- 옴스크 바이러스로부터의 외피 단백질의 도메인 III(OMSK.EDIII), 카샤누르(Kasyanur) 바이러스로부터의 외피 단백질의 도메인 III(KAS.EDIII), 또는 알쿠르마(Alkhurma) 바이러스로부터의 외피 단백질의 도메인 III(ALK.EDIII).
특히, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 크리미아-콩고 바이러스로부터의 핵단백질 N(CCHF.N)을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/CCHF.N 카세트", 즉, 크리미아-콩고 바이러스로부터의 핵단백질 N을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 108의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/CCHF.N 카세트를 포함한다:
- 서열번호 22의 곤충 BiP 서열,
- 서열번호 31의 SNAP-유사 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제1 DNA 서열,
- 서열 ENLYFQS(서열번호 32)의 pro-TEV1 개열 부위를 인코딩하는 서열번호 29의 DNA 서열,
- 크리미아-콩고 바이러스로부터의 핵단백질 N을 인코딩하는 DNA 서열,
- 서열 ENLYFQG(서열번호 33)의 pro-TEV2 개열 부위를 인코딩하는 서열번호 30의 DNA 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제2 DNA 서열,
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 크리미아-콩고 바이러스로부터의 핵단백질 N을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 109의 아미노산 서열 (SNAP-유사/proTEV1/CCHF.N/proTEV2/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 크리미아-콩고 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- CCHF.N]의 용도에 관한 것이다.
또 다른 실시형태에서, 본 발명은 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 에볼라 바이러스로부터의 핵단백질 N(EBO.N)을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/EBO.N 카세트", 즉, 에볼라 바이러스로부터의 핵단백질 N을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 110의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/EBO.N 카세트를 포함한다:
- 서열번호 22의 곤충 BiP 서열,
- 서열번호 31의 SNAP-유사 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제1 DNA 서열,
- 서열 ENLYFQS(서열번호 32)의 pro-TEV1 개열 부위를 인코딩하는 서열번호 29의 DNA 서열,
- 에볼라 바이러스(Genbank#NC_002549)로부터의 핵단백질 N,
- 서열 ENLYFQG(서열번호 33)의 pro-TEV2 개열 부위를 인코딩하는 서열번호 30의 DNA 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제2 DNA 서열,
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 에볼라 바이러스로부터의 핵단백질 N을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 111의 아미노산 서열(SNAP-유사/proTEV1/EBO.N/proTEV2/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 에볼라 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- EBO.N]의 용도에 관한 것이다.
또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 마르부르그 바이러스의 핵단백질 N(MAR.N)을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/MAR.N 카세트", 즉, 마르부르그 바이러스로부터의 핵단백질 N을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 112의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/MAR.N 카세트를 포함한다:
- 서열번호 22의 곤충 BiP 서열,
- 서열번호 31의 SNAP-유사 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제1 DNA 서열,
- 서열 ENLYFQS(서열번호 32)의 pro-TEV1 개열 부위를 인코딩하는 서열번호 29의 DNA 서열,
- 마르부르그 바이러스(Genbank#NC_001608)의 핵단백질 N을 인코딩하는 DNA 서열,
- 서열 ENLYFQG(서열번호 33)의 pro-TEV2 개열 부위를 인코딩하는 서열번호 30의 DNA 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제2 DNA 서열,
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 마르부르그 바이러스의 핵단백질 N을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 113의 아미노산 서열(SNAP-유사/proTEV1/MAR.N /proTEV2/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 마르부르그 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-MAR.N]의 용도에 관한 것이다.
또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 라사 바이러스의 핵단백질 N(LAS.N)을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/LAS.N 카세트", 즉, 리사 바이러스로부터의 핵단백질 N을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 114의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/LAS.N 카세트를 포함한다:
- 서열번호 22의 곤충 BiP 서열,
- 서열번호 31의 SNAP-유사 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제1 DNA 서열,
- 서열 ENLYFQS(서열번호 32)의 pro-TEV1 개열 부위를 인코딩하는 서열번호 29의 DNA 서열,
- 라사 바이러스(Genbank#NC_004296)의 핵단백질 N,
- 서열 ENLYFQG(서열번호 33)의 pro-TEV2 개열 부위를 인코딩하는 서열번호 30의 DNA 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제2 DNA 서열,
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 라사 바이러스의 핵단백질 N을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 115의 아미노산 서열(SNAP-유사/proTEV1/LAS.N/proTEV2/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 라사 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-LAS.N]의 용도에 관한 것이다.
또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 주닌 바이러스로부터의 핵단백질 N(JUN.N)을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/JUN.N 카세트", 즉, 주닌 바이러스로부터의 핵단백질 N을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 116의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/JUN.N 카세트를 포함한다:
- 서열번호 22의 곤충 BiP 서열,
- 서열번호 31의 SNAP-유사 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제1 DNA 서열,
- 서열 ENLYFQS(서열번호 32)의 pro-TEV1 개열 부위를 인코딩하는 서열번호 29의 DNA 서열,
- 주닌 바이러스로(Genbank#NC_005081)부터의 핵단백질 N을 인코딩하는 DNA 서열,
- 서열 ENLYFQG(서열번호 33)의 pro-TEV2 개열 부위를 인코딩하는 서열번호 30의 DNA 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제2 DNA 서열,
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 주닌 바이러스로부터의 핵단백질 N을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 117의 아미노산 서열 (SNAP-유사/proTEV1/JUN.N/proTEV2/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 주닌 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-JUN.N]의 용도에 관한 것이다.
또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 마추포 바이러스로부터의 핵단백질 N(MAC.N)을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/MAC.N 카세트", 즉, 마추포 바이러스로부터의 핵단백질 N을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 118의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/MAC.N 카세트를 포함한다:
- 서열번호 22의 곤충 BiP 서열,
- 서열번호 31의 SNAP-유사 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제1 DNA 서열,
- 서열 ENLYFQS(서열번호 32)의 pro-TEV1 개열 부위를 인코딩하는 서열번호 29의 DNA 서열,
- 마추포 바이러스(Genbank#NC_005078)로부터의 핵단백질 N을 인코딩하는 DNA 서열,
- 서열 ENLYFQG(서열번호 33)의 pro-TEV2 개열 부위를 인코딩하는 서열번호 30의 DNA 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제2 DNA 서열,
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 마추포 바이러스로부터의 핵단백질 N를 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 119의 아미노산 서열(SNAP-유사/proTEV1/MAC.N/proTEV2/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 마추포 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-MAC.N]의 용도에 관한 것이다.
또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 구아나리토 바이러스로부터는 핵단백질 N(GUA.N)를 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/GUA.N 카세트", 즉, 구아나리코 바이러스로부터의 핵단백질 N을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 120의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/GUA.N 카세트를 포함한다:
- 서열번호 22의 곤충 BiP 서열,
- 서열번호 31의 SNAP-유사 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제1 DNA 서열,
- 서열 ENLYFQS(서열번호 32)의 pro-TEV1 개열 부위를 인코딩하는 서열번호 29의 DNA 서열,
- 구아나리토 바이러스(Genbank#NC_005077)로부터의 핵단백질 N을 인코딩하는 DNA 서열,
- 서열 ENLYFQG(서열번호 33)의 pro-TEV2 개열 부위를 인코딩하는 서열번호 30의 DNA 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제2 DNA 서열,
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 구아나리토 바이러스로부터의 핵단백질 N을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 121의 아미노산 서열(SNAP-유사/proTEV1/GUA.N/proTEV2/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 구아나리토 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-GUA.N]의 용도에 관한 것이다.
또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 사비아 바이러스로부터의 핵단백질 N(SAB.N)을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/SAB.N 카세트", 즉, 사비아 바이러스로부터의 핵단백질 N을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 122의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/SAB.N 카세트를 포함한다:
- 서열번호 22의 곤충 BiP 서열,
- 서열번호 31의 SNAP-유사 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제1 DNA 서열,
- 서열 ENLYFQS(서열번호 32)의 pro-TEV1 개열 부위를 인코딩하는 서열번호 29의 DNA 서열,
- 사비아 바이러스(Genbank#NC_006317)로부터의 핵단백질 N을 인코딩하는 DNA 서열,
- 서열 ENLYFQG(서열번호 33)의 pro-TEV2 개열 부위를 인코딩하는 서열번호 30의 DNA 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제2 DNA 서열,
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 사비아 바이러스로부터의 핵단백질 N을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 123의 아미노산 서열(SNAP-유사/proTEV1/SAB.N/proTEV2/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 사비아 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-SAB.N]의 용도에 관한 것이다.
또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 옴스크 바이러스로부터의 외피 단백질 E의 도메인 III(OMSK.EDIII)를 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/OMSK.EDIII 카세트", 즉, 옴스크 바이러스로부터의 EDIII 단백질을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 124의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/OMSK.EDIII 카세트를 포함한다:
- 서열번호 152의 곤충 BiP-유사 서열,
- 서열번호 31의 SNAP-유사 서열,
- 옴스크 바이러스(Genbank#NC_005062)로부터의 EDIII 단백질을 인코딩하는 DNA 서열,
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 옴스크 바이러스로부터의 EDIII 단백질을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는(상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 125의 아미노산 서열(SNAP-유사/OMSK.EDIII/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 옴스크 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-OMSK.EDIII]의 용도에 관한 것이다.
또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 카샤누르 숲 질환 바이러스로부터의 외피 단백질 E의 도메인 III(KYA.EDIII)를 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/KYA.EDIII 카세트", 즉, 캬사누르 숲 질환 바이러스로부터의 EDIII 단백질을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 126의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/KYA.EDIII 카세트를 포함한다:
- 서열번호 152의 곤충 BiP-유사 서열,
- 서열번호 31의 SNAP-유사 서열,
- 카샤누르 숲 질환 바이러스(Genbank#JF416958)로부터의 EDIII 단백질을 인코딩하는 DNA 서열,
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 카샤누르 숲 질환 바이러스로부터의 EDIII 단백질을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 127의 아미노산 서열(SNAP-유사/KYA.EDIII/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 캬사누르 숲 질환 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-KYA.EDIII]의 용도에 관한 것이다.
또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 알쿠르마 바이러스로부터의 외피 단백질 E의 도메인 III(ALK.EDIII)를 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/ALK.EDIII 카세트", 즉, 알쿠르마 바이러스로부터의 EDIII 단백질을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 128의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/ALK.EDIII 카세트를 포함한다:
- 서열번호 152의 곤충 BiP-유사 서열,
- 서열번호 31의 SNAP-유사 서열,
- 알쿠르마 바이러스(Genbank#NC_004355)로부터의 EDIII 단백질을 인코딩하는 DNA 서열,
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 알쿠르마 바이러스로부터의 EDIII 단백질을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 129의 아미노산 서열(SNAP-유사/ALK.EDIII/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 알쿠르마 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-ALK.EDIII]의 용도에 관한 것이다.
또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 리사 바이러스로부터의 당단백질 GP1 엑토도메인(LAS.ectoGP1)을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/LAS.ectoGP1 카세트", 즉, 라사 바이러스로부터의 당단백질 GP1 엑토도메인을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 130의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/LAS.ectoGP1 카세트를 포함한다:
- 서열번호 22의 곤충 BiP 서열,
- 리사 바이러스(Genbank#NC_004296)로부터의 당단백질 GP1 엑토도메인을 인코딩하는 DNA 서열,
- 서열번호 31의 SNAP-유사 서열, 및
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 리사 바이러스로부터의 당단백질 GP1 엑토도메인을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 131의 아미노산 서열(SNAP-유사/ LAS.ectoGP1/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 라사 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- LAS.ectoGP1]의 용도에 관한 것이다.
또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 주닌 바이러스로부터의 당단백질 GP1 엑토도메인(JUN.ectoGP1)을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/JUN.ectoGP1 카세트", 즉, 주닌 바이러스로부터의 당단백질 GP1 엑토 도메인을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 132의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/JUN.ectoGP1 카세트를 포함한다:
- 서열번호 22의 곤충 BiP 서열,
- 주닌 바이러스(Genbank#NC_005081)로부터의 당단백질 GP1 엑토도메인을 인코딩하는 DNA 서열,
- 서열번호 31의 SNAP-유사 서열, 및
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 주닌 바이러스로부터의 당단백질 GP1 엑토도메인을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 133의 아미노산 서열(SNAP-유사/ JUN.ectoGP1/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 주닌의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP- JUN.ectoGP1]의 용도에 관한 것이다.
또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 마추포 바이러스로부터의 당단백질 GP1 엑토도메인(MAC.ectoGP1)을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/MAC.ectoGP1 카세트", 즉, 마추포 바이러스로부터의 당단백질 GP1 엑토 도메인을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 134의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/MAC.ectoGP1 카세트를 포함한다:
- 서열번호 22의 곤충 BiP 서열,
- 마추포 바이러스(Genbank#NC_005078)로부터의 당단백질 GP1 엑토도메인을 인코딩하는 DNA 서열,
- 서열번호 31의 SNAP-유사 서열, 및
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 마추포 바이러스로부터의 당단백질 GP1 엑토도메인을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 135의 아미노산 서열(SNAP-유사/ MAC.ectoGP1/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 마추포 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-MAC.ectoGP1]의 용도에 관한 것이다.
또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 구아나리토 바이러스로부터의 당단백질 GP1 엑토도메인(GUA.ectoGP1)을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/GUA.ectoGP1 카세트", 즉, 구아나리토 바이러스로부터의 당단백질 GP1 엑토도메인을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 136의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/GUA.ectoGP1 카세트를 포함한다:
- 서열번호 22의 곤충 BiP 서열,
- 구아나리토 바이러스(Genbank#NC_005077)로부터의 당단백질 GP1 엑토도메인을 인코딩하는 DNA 서열,
- 서열번호 31의 SNAP-유사 서열, 및
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 구아나리토 바이러스로부터의 당단백질 GP1 엑토도메인을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 137의 아미노산 서열(SNAP-유사/ GUA.ectoGP1/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 구아나리토 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-GUA.ectoGP1]의 용도에 관한 것이다.
또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 사비아 바이러스로부터의 당단백질 GP1 엑토도메인(SAB.ectoGP1)을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/SAB.ectoGP1 카세트", 즉, 사비아 바이러스로부터의 당단백질 GP1 엑토도메인을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 138의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/SAB.ectoGP1 카세트를 포함한다:
- 서열번호 22의 곤충 BiP 서열,
- 사비아 바이러스(Genbank#NC_006317)로부터의 당단백질 GP1 엑토도메인을 인코딩하는 DNA 서열,
- 서열번호 31의 SNAP-유사 서열, 및
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 사비아 바이러스로부터의 당단백질 GP1 엑토도메인을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 139의 아미노산 서열(SNAP-유사/ SAB.ectoGP1/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 사비아 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-SAB.ectoGP1]의 용도에 관한 것이다.
또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 라사 바이러스로부터의 당단백질 GP2 엑토도메인(LAS.ectoGP2)을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/LAS.ectoGP2 카세트", 즉, 라사 바이러스로부터의 당단백질 GP2 엑토도메인을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 140의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/LAS.ectoGP2 카세트를 포함한다:
- 서열번호 22의 곤충 BiP 서열,
- 라사 바이러스로부터의 당단백질 GP2 엑토도메인을 인코딩하는 DNA 서열(Genbank#NC_004296),
- 서열번호 31의 SNAP-유사 서열, 및
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 라사 바이러스로부터의 당단백질 GP2 엑토도메인을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 141의 아미노산 서열(SNAP-유사/ LAS.ectoGP2/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 라사 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-LAS.ectoGP2]의 용도에 관한 것이다.
또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 주닌 바이러스로부터의 당단백질 GP2 엑토도메인(JUN.ectoGP2)을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/JUN.ectoGP2 카세트", 즉, 주닌 바이러스로부터의 당단백질 GP2 엑토도메인을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 142의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/JUN.ectoGP2 카세트를 포함한다:
- 서열번호 22의 곤충 BiP 서열,
- 주닌 바이러스(Genbank#NC_005081)로부터의 당단백질 GP2 엑토도메인을 인코딩하는 DNA 서열,
- 서열번호 31의 SNAP-유사 서열, 및
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 주닌 바이러스로부터의 당단백질 GP2 엑토도메인을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 143의 아미노산 서열(SNAP-유사/ JUN.ectoGP2/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 주닌의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-JUN.ectoGP2]의 용도에 관한 것이다.
또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 마추포 바이러스로부터의 당단백질 GP2 엑토도메인(MAC.ectoGP2)을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/MAC.ectoGP2 카세트", 즉, 마추포 바이러스로부터의 당단백질 GP2 엑토도메인을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 144의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/MAC.ectoGP2 카세트를 포함한다:
- 서열번호 22의 곤충 BiP 서열,
- 마추포 바이러스 (Genbank#NC_005078)로부터의 당단백질 GP2 엑토도메인을 인코딩하는 DNA 서열,
- 서열번호 31의 SNAP-유사 서열, 및
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 마추포 바이러스로부터의 당단백질 GP2 엑토도메인을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 145의 아미노산 서열(SNAP-유사/ MAC.ectoGP2/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 마추포 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-MAC.ectoGP2]의 용도에 관한 것이다.
또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 구아나리토 바이러스로부터의 당단백질 GP2 엑토도메인(GUA.ectoGP2)을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/GUA.ectoGP2 카세트", 즉, 구아나리토 바이러스로부터의 당단백질 GP2 엑토도메인을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 146의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/GUA.ectoGP2 카세트를 포함한다:
- 서열번호 22의 곤충 BiP 서열,
- 구아나리토 바이러스(Genbank#NC_005077)로부터의 당단백질 GP2 엑토도메인을 인코딩하는 DNA 서열,
- 서열번호 31의 SNAP-유사 서열, 및
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 구아나리토 바이러스로부터의 당단백질 GP2 엑토도메인을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 147의 아미노산 서열(SNAP-유사/ GUA.ectoGP2/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 구아나리토 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-GUA.ectoGP2]의 용도에 관한 것이다.
또 다른 실시형태에서, 본 발명은 a) 상기 숙주 세포에서 기능성인 분비 시그널 펩타이드, 및 b) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT) 또는 이의 돌연변이체, 단편 또는 촉매 도메인, 및 c) 사비아 바이러스로부터의 당단백질 GP2 엑토도메인(SAB.ectoGP2)을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터에 관한 것이다.
바람직한 실시형태에서, 이러한 벡터는 이른바 "pDeSNAP Univ/SAB.ectoGP2 카세트", 즉, 사비아 바이러스로부터의 당단백질 GP2 엑토도메인을 인코딩하는 서열이 삽입된 상기 정의된 바와 같은 pDeSNAPUniv DNA 카세트를 포함한다.
바람직한 실시형태에서, 이러한 벡터는 하기를 포함하는 서열번호 148의 뉴클레오타이드 서열을 갖는 pDeSNAP Univ/MAC.ectoGP2 카세트를 포함한다:
- 서열번호 22의 곤충 BiP 서열,
- 사비아 바이러스(Genbank#NC_006317)로부터의 당단백질 GP2 엑토도메인을 인코딩하는 DNA 서열,
- 서열번호 31의 SNAP-유사 서열, 및
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
또 다른 양상에서, 본 발명은 상기 벡터로 안정하게 형질감염된 재조합 세포에 관한 것이다.
또 다른 양상에서, 본 발명은 a) 6-알킬구아닌-DNA-알킬트랜스퍼라제 효소(AGT)(EC 2.1.1.63) 또는 이의 돌연변이체 또는 촉매 도메인 및 b) 사비아 바이러스로부터의 당단백질 GP2 엑토도메인을 포함하는 융합 폴리펩타이드에 관한 것이다. 이러한 융합 폴리펩타이드에서, 상기 AGT 효소는 서열번호 2의 단백질 또는 (상기 정의된 바와 같은) 이의 상동체이다. 이러한 융합 폴리펩타이드는, 예를 들어, 서열번호 149의 아미노산 서열(SNAP-유사/ SAB.ectoGP2/Histag 융합 단백질에 상응)이다.
따라서, 또 다른 양상에서, 본 발명은, 예를 들어, 본 발명의 면역분석으로 생물학적 샘플 중의 사비아 바이러스의 존재를 확인하기 위한 이러한 융합 단백질 [SNAP-SAB.ectoGP2]의 용도에 관한 것이다.
실시예
본 발명과 관련하여, 생물학적 유체 중의 아르보바이러스에 대한 항체의 신속하고 동시적인 검출을 위해 다중 비드-기반 면역분석법을 개발하였다.
이 시스템은 xMAP 기술(Luminex corporation)에 기초하고 특이적 인간 면역글로불린에 대한 포획 시약으로서 항원-코팅된 마이크로구의 혼합물을 사용한다. 상이한 세트의 마이크로구(Magplex, Luminex corporation)를 정제된 AGT 융합 단백질, 즉, SNAP-택을 갖는 바이러스 재조합 단백질: sSNAP-DV1.EDIII, sSNAP-DV2.EDIII, sSNAP-DV3.EDIII, sSNAP-DV4.EDIII, sSNAP-WN.EDIII, sSNAP-JE.EDIII, sSNAP-USU.EDIII, sSNAP-TBE.EDIII, sSNAP-YF.EDIII, sSNAP-MVE.EDIII, sSNAP-Rocio.EDIII, sSNAP-WSL.EDIII, sSNAP-ZIKA.EDIII, SNAP-DV1ectoM, sSNAP-N.RVF, sSNAP-N.TOS, 및 CHIK.sE2-SNAP와 커플링시켰다. 재조합 항원을 링커로서 AGT 단백질의 기질((BG-PEG-NH2, New England Biolabs)을 사용하여 카복실 마이크로구 표면에 공유적으로 커플링시킴으로써, 표준 아민 커플링 공정과 비교하여, 항체 포획 효율을 증진시켰다.
항-SNAP-택 항체 및 특이적 마우스 모노클로날 항체를 사용하는 기술적 확인으로 커플링 효율을 입증하고 장기간 항원 안정성(6개월 이하)을 입증하였다. 이러한 적용은 임의의 펩타이드 또는 폴리펩타이드가 비드 코팅 및 후속적 항체 포획에 사용될 수 있기 때문에 바이러스 항원에 대해서만 제한되는 것은 아니다.
I.
재료 및 방법
1. 하기 완충액 및 용액을 사용하였다:
a) PBS 완충액: 100 mL의 10X PBS, pH 7.4, 1 L 멸균 H2O 중,
b) SNAP 커플링 완충액(PBS-DTT) : 100 mL의 10 X PBS, pH 7.4, 0.5 mL 10% 트윈 20, 1 mL의 1.0 M DTT, 1 L 멸균 H2O 중,
c) 차단 / 분석 완충액(PBS-B): PBS, 1% BSA, pH 7.4, 1 L 멸균 H2O 중,
d) 저장 완충액(PBS-TBN): 100 mL의 10X PBS, 1 g의 BSA, 2 mL의 10% 트윈 20, 500 mg의 아지드화나트륨, 1 mL의 1.0M DTT, 1 L 멸균 H2O 중,
e) 기질 용액(4 mg/mL): 2 mg의 BG-PEG-NH2, DMSO 200 μL,
f) 활성화 용액(EDAC /SNHS): 50 mg/mL의 EDAC 용액 또는 50 mg/mL의 SNSHS, 증류수 중.
2. 하기 물질을 사용하였다:
2.1. MagPlex Luminex 마이크로구: MC 100XX-ID(여기서, XX는 형광 영역이다), XX는, 도 7B에서 도시되는 바와 같이, 예를 들어, 26, 27, 28, 29, 34, 35, 36, 37, 45, 52, 53, 63, 64일 수 있다.
2.2. hAGT 기질: PEG-BG-NH2(NEB S9150S)
2.3. 융합 단백질 SNAP-바이러스 EDIII :
AGT 및 바이러스 EDIII 부분을 포함하는 융합 단백질의 생성은 당업자에게 널리 알려져 있다. AGT 효소가 융합 단백질에서 활성인 한, 모든 공지된 합성법이 이러한 목적에 이용될 수 있다.
본 실시예에서는 서열번호 2의 AGT 돌연변이체 SNAP가 사용되었으며, SNAP-바이러스 EDIII 융합 단백질이 생성되었다.
초파리 S2 유도성 발현 시스템(DES, Invitrogen)이 비-척추동물에서 플라비바이러스로부터의 각각의 EDIII를 다량 생성하기 위해 선택되었으며, 플라스미드 pMT/BiP/V5-HisA(Invitrogen)가 사용되었다.
이 플라스미드 하기를 포함한다:
- 메탈로티오네인 프로모터 pMT,
- 서열번호 22의 곤충 ssBiP 서열,
- Bgl II 및 Age I 제한 부위,
- AgeI 제한 부위의 하부에 위치되는 His6택을 인코딩하는 서열번호 28의 DNA, 및
- AgeI 제한 부위와 His6택을 인코딩하는 DNA 사이에 위치되는 서열번호 26의 DNA 스페이서 서열.
플라비바이러스 WN, USU, JE, TBE, DEN-1 내지 DEN-4, YF, Rocio, MVE, Zika, SLE, 및 WSL로부터의 E 단백질의 전장 도메인 III를 인코딩하는 합성 유전자가 서열번호 3 내지 서열번호 14에 열거되어 있다. EDIII 아미노산 서열을 SNAP 단백질의 C-말단에 프레임 내에 융합시켰으며, 양쪽 부분은 링커 GGGS(서열번호 25)에 의해 분리되었다. SNAP-EDIII를 플라스미드 pMT/BiP/V5-Histag(Invitrogen)에 삽입하여 플라스미드 pMT/BiP/SNAP/EDIII/Histag을 생성하였다.
분비되는 SNAP-EDIII-His6 융합 단백질의 발현을 유도할 수 있는 생성된 플라스미드 pMT/BiP/SNAP-EDIII-Histag을 선별 마커 pCo-Blast와 함께 S2 세포에 공동-형질감염시켜 블라스티시딘에 대해 내성을 나타내는 안정한 S2/sSNAP-ED III- Histag 세포주를 생성하였다.
스피너(1000 ml)에서 성장된 안정한 S2 세포주를 중금속 카드뮴(Cd2+)으로 10일 동안 자극하고, 세포외 배지로부터의 단백질을 농축하고 정제하였다.
중금속 카드뮴으로 10일 동안 유도한 후 분비되는 SNAP-태깅된 EDIII 단백질의 축적이 안정한 S2/sSNAP-EDIII-Histag 세포의 상등액에서 관측되었다.
서열번호 21의 SNAP-DEN1.EDIII, 서열번호 X의 SNAP-DEN2.EDIII, 서열번호 X의 SNAP-DEN3.EDIII, 서열번호 X의 SNAP-DEN4.EDIII, 서열번호 X의 SNAP-WN.EDIII, 서열번호 X의 SNAP-JE.EDIII, 서열번호 X의 SNAP-YF.EDIII, 서열번호 X의 SNAP-MVE.EDIII, 서열번호 X의 SNAP-Rocio.EDIII, 서열번호 X의 SNAP-WSL.EDIII, 서열번호 X의 SNAP-ZIKA.EDIII, 서열번호 X의 SNAP-SLE.EDIII 단백질이 생성되었다.
3.항원-커플링된 비드의 제조
항원-커플링된 비드의 생성은 하기 2단계를 포함하였다: 마이크로구 표면을 O6-벤질구아닌 유도체(BG-PEG-아미노)로 작용화시키는 단계 및 키메라 SNAP-바이러스 Ag 단백질을 앵커로서 BG-PEG-아미노를 사용하여 공유적 고정화시키는 단계(도 1). 카복실 마이크로구 표면을 최적화된 2-단계 카보디이미드 공정을 이용하여 BG-PEG-아미노 기질로 공유적으로 코팅하였다(Wong et al Journal of Clinical Microbiology 42(1): 65-72, 2004). 이어서, 벤질 그룹을 SNAP 단백질의 시스테인의 활성 부위 시스테인에 전달시킴으로써 커플링된 BG-PEG-아미노 화합물을 키메라 SNAP-바이러스 Ag 단백질에 비가역적으로 연결시켰다. 이러한 반응의 높은 특이성 때문에, 융합 단백질은 전적으로 SNAP 도메인을 통해 커플링되며, 바이러스 항원은 항체와의 상호작용에 사용가능하게 된다.
3.1. 먼저, 시판 비드를 제조자의 지침에 따라(EDAC 및 SNHS 활성화 용액을 사용하여) 활성화시키고, PBS 완충액에서 세척하였다. 모든 단계는 제조자의 지침에 따라 형광 퀀칭을 막도록 암흑 속에서 수행하였다.
약 1.25 x 106개의 비드가 각각의 커플링 공정에 사용되었다.
3.2. 이어서, DMSO 용액 중의 AGT 기질 PEG-BG-NH2을 실온에서 밤새 활성화된 비드 상에 부가한 후, PBS 완충액으로 세척하였다.
3.3. 이어서, 결합되지 않은 카복실 부위를 실온에서 30분 동안 차단 완충액으로 차단한 후, 비드를 SNAP 커플링 완충액으로 세척하였다.
3.4. SNAP 커플링 완충액(100 ㎛/mL)에 현탁된 SNAP-EDIII 단백질을 실온에서 2시간 동안 상기에서 수득된 비드와 함께 인큐베이션한 후, SNAP 커플링 완충액으로 1회 및 저장 완충액(PBS-TBN)으로 3회 세척하였다.
4. 마이크로구 형광 면역분석
상이한 SNAP-바이러스 Ag와 접합된 비드 세트를 볼텍스로 혼합하여 비드를 완전히 분산시켰다. 비드 밀도를 100개 비드/μL로 조절한 후, 25 μL의 비드 세트 각각 (2500개 마이크로구 포함)을 96-웰 미세역가판(Bio-Plex Pro 평저 플레이트, BioRad)으로 일중 분석을 위해 개별 웰에 옮기거나 다중 분석을 위해 동일한 웰에서 혼합하였다. 마이크로구를 자성 비드(BioPlex Pro Wash Station, BioRad)를 위한 마이크로플레이트 세척 스테이션을 이용하여 100 μL 세척 완충액(BioPlex 세척 완충액, BioRad)으로 2회 세척하였다. 샘플(항체 또는 혈청)을 분석 완충액(PBS-BSA)에 희석시키고, 50 μL의 생성 용액을 접합된 비드를 포함하는 시험 웰에 가하였다. 30분 동안 판상 쉐이커 상에서 암흑 속에서 인큐베이션한 후, 플레이트를 이전과 같이 세척하였다. 이어서, 형광색소-표지된 제2 항체를 분석 완충액(PBS-BSA)에 2 μg/mL로 희석시키고, 50 μL의 생성 용액을 접합된 비드를 포함하는 시험 웰에 가하였다. 30분 동안 판상 쉐이커 상에서 암흑 속에서 인큐베이션한 후, 플레이트를 3회 세척하였다. 마지막으로, 스트렙트아비딘-피코에리트린(SAPE, Invitrogen Molecular Probes)을 분석 완충액(PBS-BSA)에 2 μg/ml로 희석시킨 후, 50 μL의 생성 용액을 마이크로플레이트 웰에 가하였다. 웰 내용물을 125 μL 분석 완충액에 재현탁시키기 전, 플레이트를 10분 동안 플레이트 쉐이커 상에서 암흑 속에서 인큐베이션하고 이전과 같이 세척하였다. 각각의 마이크로구에 결합된 검출 항체의 중간 형광 강도(MFI)를 이중-레이저 유동 분석기(BioPlex 200 기구, BioRad)를 사용하여 웰 당 50개 마이크로구의 유동 분석으로 평가하였다. 형광 검출 기구는 비드의 유형을 검출하기 위한 제1 레이저 및 특정 검출 항체에 접합된 형광단(레드-피코에리트린)을 여기시킴으로써 포획된 IgM 또는 IgG를 정량하기 위한 제2 레이저가 구비된다.
4.1. 항원 커플링의 확인
항원 커플링은 항원-커플링된 마이크로구를 토끼 항-SNAP-택 폴리클로날 항체(GenScript)의 희석물로 시험함으로써 확인되었다. 형광 면역분석은 상술된 바와 같이 일중 포맷으로 수행되었다. 4000 ng/mL로 개시하여 3.9 ng/mL로 종결되는 항-SNAP 항체의 2배 희석 시리즈를 PBS-BSA에서 수행하고, 각각의 희석물을 비드를 포함하는 시험 웰에 가하였다. 바이오틴-접합된 염소 항-토끼 IgG(2 ㎍/mL, 50 μL PBS-BSA 중)를 결합된 항-SNAP 항체를 검출하기 위한 제2 항체로서 사용하였다.
도 2는 키메라 SNAP-바이러스 항원 단백질(SNAP-DV1.EDIII, SNAP-DV2.EDIII, SNAP.DV3.EDIII, SNAP.DV4.EDIII, SNAP-WNV.EDIII, SNAP-YF.EDIII, SNAP-JE.EDIII, SNAP-TBE.EDIII)에 커플링된 8개의 상이한 세트의 마이크로구 상에서의 항-SNAP 항체 검출에 대해 관측된 형광 결과를 도시한다.
4.2. 특이적 항체의 검출
정제된 모노클로날 마우스 항체(항-WNV, 항-DV1 및 항-DV2) 및 폴리클로날 마우스 혈청(항-DV3, 항-DV4, 항-YF 및 항-JE) 또는 인간 혈청(항-DV1)을 사용하여 항원-접합된 마이크로구에 의한 특이적 항체의 포획 및 검출을 평가하였다. 형광 면역분석을 상술된 바와 같이 일중 및 다중 포맷으로 수행하였다. 400 ng/mL로 개시하여 0.1 ng/mL로 종결되는 마우스 모노클로날 항체의 4배 희석 시리즈 및 1:25로 개시하여 1:102400으로 종결되는 마우스 및 인간 혈청의 4배 희석 시리즈를 PBS-BSA에서 수행하고, 각각의 희석물을 비드를 포함하는 시험 웰에 가하였다. 바이오틴-접합된 염소 항-마우스 IgG(2 ㎍/mL, 50 μL PBS-BSA 중)를 결합된 모노클로날 및 폴리클로날 마우스 항체를 검출하기 위한 제2 항체로 사용하였다. 바이오틴-접합된 염소 항-인간 IgM(2 ㎍/mL, 50 μL PBS-BSA 중) 또는 바이오틴-접합된 염소 항-인간 IgG(2 ㎍/mL, 50 μL PBS-BSA 중)를 사용하여 각각 인간 혈청 중의 결합된 IgM 또는 IgG 항체를 검출하였다.
도 3은 hAGT 단백질의 기질을 통해 (본 발명의 커플링) 또는 Bio-Plex 아민 커플링 키트(BIORAD)를 통해 커플링된 마이크로구에 접합된 키메라 SNAP-DV2.EDIII 단백질에 대한 정제된 모노클로날 항-DV2 항체의 검출을 위한 면역분석 실험의 민감도를 비교한다.
도 4는 마이크로구에 접합된 키메라 SNAP-DV1.EDIII 단백질에 대한 정제된 모노클로날 항-DV1 항체의 검출을 위해 일중 포맷으로 수행되거나 마이크로구에 커플링된 다른 키메라 SNAP-바이러스 Ag 단백질(SNAP-DV2.EDIII, SNAP.DV3.EDIII, SNAP.DV4.EDIII, SNAP-WNV, SNAP-YF, SNAP-JE, SNAP-TBE)과 함께 다중 포맷으로 수행된 면역분석 실험의 민감도를 비교한다.
도 5는 마이크로구에 커플링된 키메라 SNAP-바이러스 Ag 단백질(SNAP-DV1.EDIII, SNAP-DV2.EDIII, SNAP.DV3.EDIII, SNAP.DV4.EDIII, SNAP-WNV, SNAP-YF, SNAP-JE, SNAP-TBE)에 대한 정제된 모노클로날 항-WNV 항체 희석물의 검출을 위한 다중 면역분석 실험의 반응성 및 특이성을 도시한다.
도 6은, 마이크로구에 커플링된 키메라 SNAP-바이러스 Ag 단백질(SNAP-DV1.EDIII, SNAP-DV2.EDIII, SNAP.DV3.EDIII, SNAP.DV4.EDIII, SNAP-WNV, SNAP-YF, SNAP-JE, SNAP-WSL, SNAP-ROCIO, SNAP-MVE, SNAP-SLE, SNAP-ZIKA)에 대한 다중 면역분석으로, DV3에 대한 마우스 폴리클로날 혈청에서 항-DV3 IgG 검출의 반응성 및 특이성(A) 및 YF에 대한 마우스 폴리클로날 혈청에서 항-YF IgG 검출의 반응성 및 특이성(B)을 도시한다.
도 7은, 마이크로구에 커플링된 키메라 SNAP-바이러스 Ag 단백질(SNAP-DV1.EDIII, SNAP-DV2.EDIII, SNAP.DV3.EDIII, SNAP.DV4.EDIII, SNAP-WNV, SNAP-YF, SNAP-JE, SNAP-WSL, SNAP-ROCIO, SNAP-MVE, SNAP-SLE, SNAP-ZIKA, SNAP-TBE)에 대한 다중 면역분석으로, 인간 환자의 DV1-감염된 혈청에서 항-DV1 IgM 검출의 반응성 및 특이성(A) 및 항-DV1 IgG 검출의 반응성 및 특이성(B)을 도시한다.
II.
결과
본 발명의 시스템은 특이적 인간 면역글로불린에 대한 포획 시약으로서 항원-코팅된 Magplex 마이크로구(Luminex Corporation)의 혼합물을 사용한다. 내부적으로 칼라-코드화된 마이크로구의 각각의 세트를 특정 재조합 항원에 커플링시키고, 소량의 샘플 용적으로 다른 유형의 마이크로구들과 함께 혼합하였다. 이러한 시스템의 능력은 사실상 유동 분석 기구를 사용하여 웰당 100개 유형 이하의 커플링된 마이크로구를 동시에 분석할 수 있다는 것이다. 형광 검출 기구는 비드의 유형을 검출하기 위한 제1 레이저 및 특정 검출 항체에 접합된 형광단(레드-피코에리트린)을 여기시킴으로써 포획된 IgM 또는 IgG를 정량하기 위한 제2 레이저가 구비된다. 이러한 접근은 광범위한 다중화 능력 및 낮은 검출 한도를 갖기 때문에 종래의 ELISA 측정에 비해 비용 및 샘플이 상당히 절감된다.
본 실시예에서는, 16개의 상이한 마이크로구 세트가 정제된 키메라 SNAP-바이러스 Ag 단백질에 커플링되었으며, 뎅기 혈청형 1 내지 4, 웨스트 나일, 황열, 일본 뇌염, 진드기-매개 뇌염, 세인트-루이스 뇌염, 머레이 계곡 뇌염, 베셀스브론, 지카, 로시오, 우수투, 리프트 계곡 열 및 치쿤구니아 바이러스에 특이적인 혈청 항체를 적정하였다. 1000개의 개별 분석을 수행하기에 충분한 한 세트의 항원-커플링된 마이크로구(약 1.25 x 106개 마이크로구)를 생성하는데 단지 매우 소량의 재조합 항원(< 50㎍)이 필요하므로 이 시스템의 제조는 시간 및 비용에 있어 매우 효과적이다. 또한, 선택된 세트의 마이크로구는 MagPix(Luminex Corporation)와 같이 저렴하고 소형이며 강력한 형광 검출 시스템에 적합하다.
항-SNAP 항체를 사용한 항원 커플링의 평가(도 2)는 커플링 효율을 입증하였으며, 결합된 항원의 상대적 양이 상이한 커플링된 마이크로구 세트 간에 유사하다는 것을 증명하였다. 정제된 마우스 항체를 사용한 항체 포획 및 검출 평가는, 표준 아민 커플링 공정으로 수득된 항원-커플링된 마이크로구와 비교하여, 생성된 항원-커플링된 마이크로구에 의한 특이적 항체의 증진된 포획을 입증하였다(도 3). 또한, 이는 상기 방법의 낮은 검출 한계를 입증하였으며, 다중화가 항체 검출에 영향을 끼치지 않는다는 것을 증명하였다(도 4). 또한, 항원-접합된 마이크로구는, 4℃(> 6개월)에서 저장하는 경우, 장기간 안정성을 나타내었다. 마지막으로, 다중 면역분석에서 커플링된 마이크로구 세트 각각의 특이성이 정제된 모노클로날 항체(도 5), 폴리클로날 마우스 혈청 중의 IgG 항체(도 6A-B) 및 감염된 인간으로부터의 폴리클로날 혈청 중의 IgM 및 IgG 항체 모두 (도 7)에 대해 입증되었다.
이러한 접근은 광범위한 다중화 능력 (웰당 100개 유형 이하의 커플링된 마이크로구) 및 낮은 검출 한도를 갖기 때문에 종래의 ELISA 측정에 비해 비용 및 샘플이 상당히 절감된다.
III.
SNAP와 쉬말렌베르그 바이러스의 N 핵단백질을 포함하는 융합 단백질의 생성
1.융합 단백질 SNAP-SBV.N을 인코딩하는 벡터의 작제
SNAP와 쉬말렌베르그 바이러스의 N 핵단백질을 포함하는 키메라 융합 단백질을 하기와 같이 수득하였다:
제1 단계에서, BH80/11-4 스트레인의 N 핵단백질 및 NSs 단백질을 인코딩하는 S 절편의 개방 판독 프레임의 서열을 이의 5' 말단에 EcoRV 제한 부위 및 3' 말단에 XmaI 제한 부위를 삽입함으로써 돌연변이시켰다. 또한, 294T 뉴클레오타이드를 294A로 돌연변이시킴으로써 내부 EcoRV 제한 부위를 제거시켰다. 이러한 돌연변이된 서열이 서열번호 17에 나타나있다.
이어서, 이러한 돌연변이된 서열을 서열번호 34의 pDeSNAP Univ 카세트의 EcoRV 및 XmaI 제한 부위에 삽입하여 서열번호 36의 "pDeSNAP Univ/SBV.N" DNA 카세트를 생성하였다.
이른바 "pDeSNAP Univ/SBV.N" DNA 카세트는 하기를 포함한다(참조: 도 9 및 서열번호 36):
- 서열번호 23의 곤충 BiP-유사 서열,
- 서열번호 31의 SNAP-유사 서열,
- 스페이서 서열 GGGS(서열번호 25)을 인코딩하는 서열번호 26의 제1 DNA 서열,
- 서열 ENLYFQS(서열번호 32)의 pro-TEV1 개열 부위를 인코딩하는 서열번호 29의 DNA 서열,
- 서열번호 17의 SBV.N DNA 서열(내부 EcoRV 부위가 결실되고 2개의 EcoRV 및 XmaI 부위가 맨 끝에 첨가된, 천연 SBV.N 서열에 상응),
- 서열 ENLYFQG(서열번호 33)의 pro-TEV2 개열 부위를 인코딩하는 서열번호 30의 DNA 서열,
- HisTag 서열을 인코딩하는 서열번호 28의 DNA 서열.
이러한 카세트는 또한 ATG의 상부에 NheI 부위, BiP-유사 서열과 SNAP-유사 서열 사이에 BglII 부위, 및 AgeI 부위 및 HindIII 부위(이들 모두 정지 코돈 하부에 위치된다)를 포함한다.
pDeSNAPUniv/SBV.N 카세트(참조: 도 9)의 BglII과 AgeI 제한 부위 사이에 포함된 서열을 효소적 분해로 개열한 후, pMT/BiP/V5-A 플라스미드(Invitrogen)에 클로닝하여 pMT/BiP/SNAP-SBV.N 벡터를 생성하였다. 이러한 벡터를 사용하여 SNAP-SBV.N 융합 단백질을 분비하는 안정한 S2 세포를 생성하였다.
이어서, pDeSNAPUniv/SBV.N 카세트의 NheI와 NotI 제한 부위 사이에 포함된 서열을 pcDNA3 플라스미드(Invitrogen)에 클로닝하여 pcDNA3/SNAP-SBV.N 벡터를 생성하였다. 이어서, 이 벡터를 사용하여 SNAP-SBV.N 융합 단백질을 분비하는 안정한 포유동물 세포를 생성하였다.
2. 융합 단백질 SNAP-SBV.N의 생성
분비되는 융합 단백질로서 SNAP-태깅된 SBV.N 단백질을 생성하는 생성 플라스미드 pMT/BiP/SNAP-SBV.N를 선별 마커 pCo-Blast와 함께 S2 세포로 공동-형질감염하여 블라스티시딘에 대해 내성을 나타내는 안정한 S2/SNAP-SBV.N 세포주를 생성하였다.
이 세포주는 파스퇴르 인스티튜트 국립 미생물 배양센터 [the Collection Nationale de Cultures de Microorganismes(CNCM) of the Institut Pasteur (25 rue du Docteur Roux, 75724 PARIS CEDEX 15, France)]에 기탁 번호 CNCM I-4616으로 기탁되었다.
스피너(1000 ml)에서 성장된 안정한 S2 세포주를 중금속 카드뮴(Cd2+)으로 10일 동안 자극하였다.
중금속 카드뮴으로 10일 동안 유도한 후 분비되는 SNAP-SBV.N 단백질의 축적이 S2/SNAP-SBV.N 세포의 상등액에서 관측되었다.
Cd2 +으로 10일 동안 유도된 S2/SNAP-SBV.N 세포의 상등액 4 mL로부터의 0.01 mL를 항-Histag 항체(희석율 1:1,000)를 사용하여 면역블롯 분석으로 시험하였다(참조: 도 10).
키메라 단백질 SNAP-SBV.N을 SNAP-TOS.N 키메라 단백질(SNAP와 플레보바이러스인 토스카나 바이러스로부터의 N 핵단백질을 포함하는 융합 단백질)의 정의된 양과 비교하였다.
10일 동안 유도된 S2/SNAP+SBV.N 세포로부터의 정제된 SNAP-SBV.N의 생성은 세포 배양물 L 당 18 mg이었다(도 10B).
참고문헌 목록
Avrameas S. Immunol. Today 1991 May;12(5):154-9.
Zimmerman CW, Electrophoresis 1995; Jun;16(6):941-7.
Kim H-J. The Journal of Veterinary Medical Science, 2011
Damoiseaux et al., ChemBiochem. 4:285-287, 2001
Xu-Welliver et al., Biochemical Pharmacology 58: 1279-85, 1999
Lim A. et al, EMBO J. 15: 4050-4060, 1996;
Daniels D.S. et al, EMBO J. 19: 1719-1730, 2000;
Juillerat A. et al, Chemistry & Biology, vol.10, 313-317, 2003
Wong et al Journal of Clinical Microbiology 42, no. 1 (Jan 2004): 65-72
Wibley J.E.A. et al, 2000
Felgner et al., Proc. Natl. Acad. Sci. U.S.A., 84:7413-7417, 1987
Mackey et al., Proc. Natl. Acad. Sci. U.S.A., 85:8027-8031, 1988
Wu et al., J. Biol. Chem., 267:963-967, 1992;
Wu and Wu, J. Biol . Chem., 263:14621-14624, 1988;
Williams et al., Proc. Natl. Acad. Sci. U.S.A., 88:2726-2730, 1991
Kolpe A.B. et al, Virus Research 2012; 168:64-72
Pan W. et al, The Journal of Immunology, 2004), 172:6167-6174
Sivakolundu S. et al, Journal of Medical Microbiology, 2012
SEQUENCE LISTING
<110> INSTITUT PASTEUR
<120> MULTIPLEX IMMUNO SCREENING ASSAY
<130> IPA141114-FR
<150> US 61/642,924
<151> 2012-05-04
<150> PCT/EP2012/074986
<151> 2012-12-10
<160> 179
<170> KopatentIn 2.0
<210> 1
<211> 238
<212> PRT
<213> homo sapiens
<400> 1
Met Leu Gly Gln Pro Ala Pro Leu Glu Arg Phe Ala Ser Arg Arg Pro
1 5 10 15
Gln Val Leu Ala Val Arg Thr Val Cys Asp Leu Val Leu Gly Lys Met
20 25 30
Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly
35 40 45
Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu
50 55 60
Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro
65 70 75 80
Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Cys Thr Ala Trp
85 90 95
Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val
100 105 110
Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln
115 120 125
Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser
130 135 140
Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Lys Ala Ala Arg Ala
145 150 155 160
Val Gly Gly Ala Met Arg Gly Asn Pro Val Pro Ile Leu Ile Pro Cys
165 170 175
His Arg Val Val Cys Ser Ser Gly Ala Val Gly Asn Tyr Ser Gly Gly
180 185 190
Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly
195 200 205
Lys Pro Gly Leu Gly Gly Ser Ser Gly Leu Ala Gly Ala Trp Leu Lys
210 215 220
Gly Ala Gly Ala Thr Ser Gly Ser Pro Pro Ala Gly Arg Asn
225 230 235
<210> 2
<211> 193
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of SNAP
<400> 2
Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro
1 5 10 15
Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile
20 25 30
Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro
35 40 45
Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr
50 55 60
Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe
65 70 75 80
Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr
85 90 95
Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val
100 105 110
Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr
115 120 125
Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile
130 135 140
Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu
145 150 155 160
Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg
165 170 175
Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser
180 185 190
Leu
<210> 3
<211> 404
<212> DNA
<213> Dengue virus 1
<400> 3
taggcgcgcc agggtccctg gagggaggtg gcgggtctct gactttaaaa gggatgtcat 60
atgtgatgtg cacaggctca tttaagctag agaaggaagt ggctgagacc cagcatggaa 120
ctgtcctagt gcaggttaaa tacgaaggaa cagatgcgcc atgcaagatc cccttttcga 180
cccaagatga gaaaggagtg acccagaatg ggagattgat aacagccaat cccatagtta 240
ctgacaaaga aaaaccaatc aacattgaga cagaaccacc ttttggtgag agctacatca 300
tagtaggggc aggtgaaaaa gctttgaaac taagctggtt caagaaagga agcagcatag 360
ggaaaggagg tggccatcac catcaccatc actgatgacc ggtt 404
<210> 4
<211> 404
<212> DNA
<213> Dengue virus 2
<400> 4
taggcgcgcc agggtccctg gagggaggtg gcgggtctct acagctcaaa ggaatgtcat 60
attctatgtg tacaggaaag tttaaagttg tgaaggaaat agcagaaaca caacatggaa 120
caatagttct cagagtacaa tatgaagggg acggttctcc gtgcaagatc ccttttgaaa 180
taatggattt ggaaaaaaga catgtcttag gtcgcttgat cacagtcaac ccaattgtta 240
cagaaataga cagcccagtc aacatagaag cagaacctcc attcggagac agctacatca 300
ttataggagt agaaccggga caactgaagc tcagctggtt taagaaagga agttccattg 360
gccaaggagg tggccatcac catcaccatc actgatgacc ggtt 404
<210> 5
<211> 401
<212> DNA
<213> Dengue virus 3
<400> 5
taggcgcgcc agggtccctg gagggaggtg gcgggtctga actcaagggg atgagctatg 60
caatgtgctt gaataccttt gtgttgaaga aagaagtctc cgaaacgcag catgggacaa 120
tactcattaa ggttgagtac aaaggggaag atgcaccttg caagattcct ttctccacag 180
aggatggaca agggaaagcc cacaatggta gactgatcac agccaaccca gtggttacta 240
agaaggagga gcctgtcaac attgaggctg aacctccttt tggggaaagc aacatagtga 300
ttggagttgg agacaaagcc ttgaaaatta actggtacaa gaagggaagc tcgattggga 360
agggaggtgg ccatcaccat caccatcact gatgaccggt t 401
<210> 6
<211> 401
<212> DNA
<213> Dengue virus 4
<400> 6
taggcgcgcc agggtccctg gagggaggtg gcgggtctag aatcaaggga atgtcataca 60
cgatgtgctc aggaaagttc tcaattgaca aagagatggc agaaacacag catgggacaa 120
cagtggtgaa agtcaagtat gaaggtgctg gagctccgtg taaagtcccc atagagatac 180
gagatgtaaa taaggaaaaa gtggttgggc gtgtcatctc atccacccct ctagctgaga 240
ataccaacag tgtgaccaac atagaactgg aacccccctt tggggacagt tacatagtca 300
taggtgttgg gaacagtgca ttgacactcc attggttcag gaaaggaagt tctattggca 360
agggaggtgg ccatcaccat caccatcact gatgaccggt t 401
<210> 7
<211> 398
<212> DNA
<213> West Nile Virus
<400> 7
taggcgcgcc aggaggtggc gggtctcagt tgaagggaac aacctatggc gtctgttcaa 60
aggctttcaa gtttcttggg actcccgcag acacaggtca cggcactgtg gtgttggaat 120
tgcagtacac tggcacggat ggaccttgca aagttcctat ctcgtcagtg gcttcattga 180
acgacctaac gccagtgggc agattggtca ctgtcaaccc ttttgtttca gtggccacgg 240
ccaacgctaa ggtcctgatt gaattggaac caccctttgg agactcatac atagtggtgg 300
gcagaggaga acaacagatc aatcaccatt ggcacaagtc tggaagcagc attggcaaag 360
gaggtggcca tcaccatcac catcactgat gaccggtt 398
<210> 8
<211> 410
<212> DNA
<213> Yellow fever virus
<400> 8
taggcgcgcc agggtccctg gagggaggtg gcgggtcttc agctttgaca ctcaagggga 60
catcctacaa aatgtgcact gacaaaatgt cttttgtcaa gaacccaact gacactggcc 120
atggcactgt tgtgatgcag gtgaaagtgc caaaaggagc cccctgcaag attccagtga 180
tagtagctga tgatcttaca gcggcaatca ataaaggcat tttggttaca gttaacccca 240
tcgcctcaac caatgatgat gaagtgctga ttgaggtgaa cccacctttt ggagacagct 300
acattatcgt tgggacagga gattcacgtc tcacttacca gtggcacaaa gagggaagct 360
caataggaaa gggaggtggc catcaccatc accatcactg atgaccggtt 410
<210> 9
<211> 410
<212> DNA
<213> Japanese encephalitis virus
<400> 9
taggcgcgcc agggtccctg gagggaggtg gcgggtctgc tctgaaaggc acaacctatg 60
gcatgtgtac agaaaaattc tcgttcgcga aaaatccggc ggacactggt cacggaacag 120
ttgtcattga actctcctac tctgggagtg atggcccctg caaaattccg attgtctccg 180
tcgcgagcct caatgacatg actcctgttg ggcggctggt gacagtgaac ccctttgtcg 240
cggcttccag tgccaactca aaggtgctgg tcgagatgga accccccttc ggagactcct 300
atatcgtggt tggaagggga gacaagcaga tcaaccacca ttggcacaga gctggaagca 360
cgctgggcaa gggaggtggc catcaccatc accatcactg atgaccggtt 410
<210> 10
<211> 397
<212> DNA
<213> Zika virus
<400> 10
gcgcgccagg aggtggcggg tctcttagat tgaagggcgt gtcatactcc ttgtgtaccg 60
cagcgttcac attcaccaag atcccggctg aaacactgca cgggacagtc acagtggagg 120
tacagtacgc agggacagat ggaccctgca aggttccagc tcagatggcg gtggacatgc 180
aaactctgac cccagttggg aggctgataa ccgctaaccc tgtaatcact gaaagcactg 240
agaactctaa gatgatgctg gaacttgatc caccatttgg ggactcttac attgtcatag 300
gagtcgggga gaagaagatc acccatcact ggcacaggag tggcagcacc attggaaaag 360
gaggtggcca tcaccatcac catcactgat gaccggt 397
<210> 11
<211> 385
<212> DNA
<213> Wesselbron virus
<400> 11
gcgcgccagg aggtggcggg ctcatcctga aaggttcaac ctactcaatg tgcaaaagag 60
ggatgtcctt tgctaagcaa ccagttgaga cagaccatgg aacagcagtg atgcagataa 120
aagttacaac tggagctccg tgcagaattc cagtgattgc agcagattcc atggcgggaa 180
cagaaaaccg tggaagcgtc atcacaacca atcctattgc tgcgtcaaac aatgatgaag 240
tgttggtgga gatcagtcca ccatttggag agagttacat catcgttggt aatggagatg 300
ataaacttac ataccactgg caaagatcag gaagcaccat cgggaatgga ggtggccatc 360
accatcacca tcactgatga ccggt 385
<210> 12
<211> 397
<212> DNA
<213> Rocio virus
<400> 12
gcgcgccagg aggtggcggg tctctcaaaa tcaaagggtc aacatacctg atgtgcaagg 60
acaaatttgc ttttgccaag aacccagttg acacaggaca cggcacaatc gtgacggagg 120
tacagtacgc tggttctgat gggccatgca ggattccaat caccatgacc gagaacctac 180
atgatctcac tcccatcgga cgattggtga cggtcaatcc atttgttccc tcatccgaga 240
cggcacaaaa aattttgatt gaactcgagc ccccctttgg gacatccttc atactggtgg 300
gtacaggtcc caaccaggtg aaataccagt ggcataagtc tggtagtgtg atcggaaaag 360
gaggtggcca tcaccatcac catcactgat gaccggt 397
<210> 13
<211> 397
<212> DNA
<213> Murray encephalitis virus
<400> 13
gcgcgccagg aggtggcggg tctttgaaac tgaaaggaac cacttatggg atgtgcacag 60
aaaaatttac tttctcaaag aatccagccg acaccggaca tggcacggta gtactagaac 120
tgcagtacac cgggagtgat ggaccatgca aaattccaat atcctctgta gcaagtctca 180
atgacatgac gcctgtcgga agaatggtga cagctaatcc atatgtagct tcatcaactg 240
ccaatgctaa agttctggtg gagattgaac cacccttcgg agactcatac attgtggtag 300
gcaggggaga caagcagatc aatcaccact ggcataagga gggtagttca attggcaaag 360
gaggtggcca tcaccatcac catcactgat gaccggt 397
<210> 14
<211> 397
<212> DNA
<213> Saint-Louis encephalitis virus
<400> 14
gcgcgccagg aggtggcggg tctgttaaaa tcaaggggac gacatatggt atgtgtgact 60
ctgctttcac cttcagcaag aaccctgctg acacagggca tgggacagtg atcgtggaac 120
tgcagtacac tggaagcaac ggaccatgcc gggttcccat ttctgtgact gcaaacctca 180
tggacttgac accagttgga agactggtca cggtcaatcc ctttattagc acagggggag 240
cgaacaacaa ggtcatgatc gaagttgaac caccctttgg cgactcttac atcgtcgtcg 300
gaagaggcac cacccagatc aactaccact ggcacaaaga gggaagcagc attgggaagg 360
gaggtggcca tcaccatcac catcactgat gaccggt 397
<210> 15
<211> 579
<212> DNA
<213> artificial
<220>
<223> DNA encoding original SNAP (normal G/C content)
<400> 15
agatctgaca aagactgcga aatgaagcgc accaccctgg atagccctct gggcaagctg 60
gaactgtctg ggtgcgaaca gggcctgcac gagatcaagc tgctgggcaa aggaacatct 120
gccgccgacg ccgtggaagt gcctgcccca gccgccgtgc tgggcggacc agagccactg 180
atgcaggcca ccgcctggct caacgcctac tttcaccagc ctgaggccat cgaggagttc 240
cctgtgccag ccctgcacca cccagtgttc cagcaggaga gctttacccg ccaggtgctg 300
tggaaactgc tgaaagtggt gaagttcgga gaggtcatca gctaccagca gctggccgcc 360
ctggccggca atcccgccgc caccgccgcc gtgaaaaccg ccctgagcgg aaatcccgtg 420
cccattctga tcccctgcca ccgggtggtg tctagctctg gcgccgtggg gggctacgag 480
ggcgggctcg ccgtgaaaga gtggctgctg gcccacgagg gccacagact gggcaagcct 540
gggctgggtc ctgcaggtat aggcgcgcca gggtcccta 579
<210> 16
<211> 235
<212> PRT
<213> artificial
<220>
<223> mutated N protein of schmallenberg virus
<400> 16
Asp Ile Ser Ser Gln Phe Ile Phe Glu Asp Val Pro Gln Arg Asn Ala
1 5 10 15
Ala Thr Phe Asn Pro Glu Val Gly Tyr Val Ala Phe Ile Gly Lys Tyr
20 25 30
Gly Gln Gln Leu Asn Phe Gly Val Ala Arg Val Phe Phe Leu Asn Gln
35 40 45
Lys Lys Ala Lys Met Val Leu His Lys Thr Ala Gln Pro Ser Val Asp
50 55 60
Leu Thr Phe Gly Gly Val Lys Phe Thr Val Val Asn Asn His Phe Pro
65 70 75 80
Gln Tyr Val Ser Asn Pro Val Pro Asp Asn Ala Ile Thr Leu His Arg
85 90 95
Met Ser Gly Tyr Leu Ala Arg Trp Ile Ala Asp Thr Cys Lys Ala Ser
100 105 110
Val Leu Lys Leu Ala Glu Ala Ser Ala Gln Ile Val Met Pro Leu Ala
115 120 125
Glu Val Lys Gly Cys Thr Trp Ala Asp Gly Tyr Thr Met Tyr Leu Gly
130 135 140
Phe Ala Pro Gly Ala Glu Met Phe Leu Asp Ala Phe Asp Phe Tyr Pro
145 150 155 160
Leu Val Ile Glu Met His Arg Val Leu Lys Asp Asn Met Asp Val Asn
165 170 175
Phe Met Lys Lys Val Leu Arg Gln Arg Tyr Gly Thr Met Thr Ala Glu
180 185 190
Glu Trp Met Thr Gln Lys Ile Thr Glu Ile Lys Ala Ala Phe Asn Ser
195 200 205
Val Gly Gln Leu Ala Trp Ala Lys Ser Gly Phe Ser Pro Ala Ala Arg
210 215 220
Thr Phe Leu Gln Gln Phe Gly Ile Asn Ile Pro
225 230 235
<210> 17
<211> 707
<212> DNA
<213> artificial
<220>
<223> Mutated DNA sequence encoding the N protein of schmallenberg
virus
<400> 17
gatatctcaa gccaattcat ttttgaagat gtaccacaac ggaatgcagc tacatttaac 60
ccggaggtcg ggtatgtggc atttattggt aagtatgggc aacaactcaa cttcggtgtt 120
gctagagtct tcttcctcaa ccagaagaag gccaagatgg tcctacataa gacggcacaa 180
ccaagtgtcg atcttacttt tggtggggtc aaatttacag tggttaataa ccattttccc 240
caatatgtct caaatcctgt gccagacaat gccattacac ttcacaggat gtcaggttat 300
ctagcacgtt ggattgctga tacatgcaag gctagtgtcc tcaaactagc tgaagctagt 360
gctcagattg tcatgcccct tgctgaggtt aagggatgca cctgggccga tggttataca 420
atgtatcttg gatttgcacc tggggccgaa atgttccttg atgcttttga cttctatcca 480
ctagttattg aaatgcatag ggtcctcaag gacaatatgg atgtaaattt tatgaaaaaa 540
gtcctccgcc aacgctatgg aacaatgact gctgaagaat ggatgactca gaaaataaca 600
gaaataaaag ctgcttttaa ttctgttgga cagcttgcct gggccaaatc tggattctct 660
cctgctgcta gaaccttctt gcagcaattc ggtatcaaca tcccggg 707
<210> 18
<211> 211
<212> PRT
<213> mus musculus
<400> 18
Met Ala Glu Thr Cys Lys Met Lys Tyr Ser Val Leu Asp Ser Pro Leu
1 5 10 15
Gly Lys Met Glu Leu Ser Gly Cys Glu Arg Gly Leu His Gly Ile Arg
20 25 30
Leu Leu Ser Gly Lys Thr Pro Asn Thr Asp Pro Thr Glu Ala Pro Ala
35 40 45
Thr Pro Glu Val Leu Gly Gly Pro Glu Gly Val Pro Glu Pro Leu Val
50 55 60
Gln Cys Thr Ala Trp Leu Glu Ala Tyr Phe Arg Glu Pro Ala Ala Thr
65 70 75 80
Glu Gly Leu Pro Leu Pro Ala Leu His His Pro Val Phe Gln Gln Asp
85 90 95
Ser Phe Thr Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe
100 105 110
Gly Glu Thr Val Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro
115 120 125
Lys Ala Ala Arg Ala Val Gly Gly Ala Met Arg Ser Asn Pro Val Pro
130 135 140
Ile Leu Ile Pro Cys His Arg Val Val Arg Ser Asp Gly Ala Ile Gly
145 150 155 160
His Tyr Ser Gly Gly Gly Gln Ala Val Lys Glu Trp Leu Leu Ala His
165 170 175
Glu Gly Ile Pro Thr Gly Gln Pro Ala Ser Lys Gly Leu Gly Leu Thr
180 185 190
Gly Thr Trp Leu Lys Ser Ser Phe Glu Ser Thr Ser Ser Glu Pro Ser
195 200 205
Gly Arg Asn
210
<210> 19
<211> 209
<212> PRT
<213> Rattus norvegicus
<400> 19
Met Ala Glu Ile Cys Lys Met Lys Tyr Thr Val Leu Asp Ser Pro Leu
1 5 10 15
Gly Lys Ile Glu Leu Ser Gly Cys Glu Arg Gly Leu His Gly Ile Arg
20 25 30
Phe Leu Ser Gly Lys Thr Pro Asn Thr Asp Pro Thr Glu Ala Pro Ala
35 40 45
Cys Pro Glu Val Leu Gly Gly Pro Glu Gly Val Pro Glu Pro Leu Val
50 55 60
Gln Cys Thr Ala Trp Leu Glu Ala Tyr Phe His Glu Pro Ala Ala Thr
65 70 75 80
Glu Gly Leu Pro Leu Pro Ala Leu His His Pro Val Phe Gln Gln Asp
85 90 95
Ser Phe Thr Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe
100 105 110
Gly Glu Met Val Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro
115 120 125
Lys Ala Ala Arg Ala Val Gly Gly Ala Met Arg Ser Asn Pro Val Pro
130 135 140
Ile Leu Ile Pro Cys His Arg Val Ile Arg Ser Asp Gly Ala Ile Gly
145 150 155 160
Asn Tyr Ser Gly Gly Gly Gln Thr Val Lys Glu Trp Leu Leu Ala His
165 170 175
Glu Gly Ile Pro Thr Gly Gln Pro Ala Ser Lys Gly Leu Gly Leu Ile
180 185 190
Gly Ser Trp Leu Lys Pro Ser Phe Glu Ser Ser Ser Pro Lys Pro Ser
195 200 205
Gly
<210> 20
<211> 963
<212> DNA
<213> artificial
<220>
<223> DNA sequence coding for SNAP - linker - DEN1 EDIII - linker-
Histag
<400> 20
agatctgaca aagactgcga aatgaagcgc accaccctgg atagccctct gggcaagctg 60
gaactgtctg ggtgcgaaca gggcctgcac gagatcaagc tgctgggcaa aggaacatct 120
gccgccgacg ccgtggaagt gcctgcccca gccgccgtgc tgggcggacc agagccactg 180
atgcaggcca ccgcctggct caacgcctac tttcaccagc ctgaggccat cgaggagttc 240
cctgtgccag ccctgcacca cccagtgttc cagcaggaga gctttacccg ccaggtgctg 300
tggaaactgc tgaaagtggt gaagttcgga gaggtcatca gctaccagca gctggccgcc 360
ctggccggca atcccgccgc caccgccgcc gtgaaaaccg ccctgagcgg aaatcccgtg 420
cccattctga tcccctgcca ccgggtggtg tctagctctg gcgccgtggg gggctacgag 480
ggcgggctcg ccgtgaaaga gtggctgctg gcccacgagg gccacagact gggcaagcct 540
gggctgggtc ctgcaggtat aggcgcgcca gggtccctgg agggaggtgg cgggtctctg 600
actttaaaag ggatgtcata tgtgatgtgc acaggctcat ttaagctaga gaaggaagtg 660
gctgagaccc agcatggaac tgtcctagtg caggttaaat acgaaggaac agatgcgcca 720
tgcaagatcc ccttttcgac ccaagatgag aaaggagtga cccagaatgg gagattgata 780
acagccaatc ccatagttac tgacaaagaa aaaccaatca acattgagac agaaccacct 840
tttggtgaga gctacatcat agtaggggca ggtgaaaaag ctttgaaact aagctggttc 900
aagaaaggaa gcagcatagg gaaaggaggt ggccatcacc atcaccatca ctgatgaccg 960
gtt 963
<210> 21
<211> 316
<212> PRT
<213> artificial
<220>
<223> SNAP - linker - DEN1 EDIII - linker- Histag
<400> 21
Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro
1 5 10 15
Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile
20 25 30
Lys Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala
35 40 45
Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala
50 55 60
Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro
65 70 75 80
Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg
85 90 95
Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile
100 105 110
Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala
115 120 125
Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro
130 135 140
Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly
145 150 155 160
Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu
165 170 175
Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu
180 185 190
Glu Gly Gly Gly Gly Ser Leu Thr Leu Lys Gly Met Ser Tyr Val Met
195 200 205
Cys Thr Gly Ser Phe Lys Leu Glu Lys Glu Val Ala Glu Thr Gln His
210 215 220
Gly Thr Val Leu Val Gln Val Lys Tyr Glu Gly Thr Asp Ala Pro Cys
225 230 235 240
Lys Ile Pro Phe Ser Thr Gln Asp Glu Lys Gly Val Thr Gln Asn Gly
245 250 255
Arg Leu Ile Thr Ala Asn Pro Ile Val Thr Asp Lys Glu Lys Pro Ile
260 265 270
Asn Ile Glu Thr Glu Pro Pro Phe Gly Glu Ser Tyr Ile Ile Val Gly
275 280 285
Ala Gly Glu Lys Ala Leu Lys Leu Ser Trp Phe Lys Lys Gly Ser Ser
290 295 300
Ile Gly Lys Gly Gly Gly His His His His His His
305 310 315
<210> 22
<211> 54
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding the ssBiP sequence
<400> 22
atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cggg 54
<210> 23
<211> 66
<212> DNA
<213> artificial
<220>
<223> DNA artificial encoding BiP-like signal = insect ssBiP signal
peptide + cleavage site DEN1prM signal sequence
<400> 23
atgaaactat gtattctact tgcagttgtt gcgttcgtag gattgtcctt acctacagct 60
ctggca 66
<210> 24
<211> 22
<212> PRT
<213> artificial
<220>
<223> BiP-like signal = insect ssBiP signal peptide + cleavage site
DEN1prM signal sequence
<400> 24
Met Lys Leu Cys Ile Leu Leu Ala Val Val Ala Phe Val Gly Leu Ser
1 5 10 15
Leu Pro Thr Ala Leu Ala
20
<210> 25
<211> 4
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of the spacer
<400> 25
Gly Gly Gly Ser
1
<210> 26
<211> 12
<212> DNA
<213> artificial
<220>
<223> DNA sequence of the spacer
<400> 26
ggtggcggat ct 12
<210> 27
<211> 6
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of HIS TAG
<400> 27
His His His His His His
1 5
<210> 28
<211> 18
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding His Tag
<400> 28
catcatcatc atcatcat 18
<210> 29
<211> 21
<212> DNA
<213> artificial
<220>
<223> DNA encoding pro-TEV cleavage site 1
<400> 29
gaaaacctgt acttccagag c 21
<210> 30
<211> 21
<212> DNA
<213> artificial
<220>
<223> DNA encoding pro-TEV cleavage site 2
<400> 30
gagaatctat attttcaagg g 21
<210> 31
<211> 530
<212> DNA
<213> artificial
<220>
<223> SNAP-like sequence G/C low content
<400> 31
gacaaagact gcgaaatgaa aagaactaca ttggattcac cacttgggaa gttggaactg 60
agtggatgcg agcaaggatt gcatgaaatt aagctactgg gaaaaggaac ttctgctgct 120
gatgcagttg aagttccagc accagcagct gttcttggag gtcctgagcc cctcatgcaa 180
gccacagcct ggcttaacgc atatttccac cagcctgagg ccattgagga atttccagtc 240
cccgcccttc accatcctgt gtttcagcag gagagcttca cccgccaggt cctgtggaaa 300
ttgctgaagg tggtcaagtt tggtgaagtg atttcatatc agcaacttgc tgcattggcc 360
ggtaaccccg cagctacagc tgccgtgaaa actgctctca gcggaaatcc tgtgcccatc 420
ctgatccctt gtcacagagt cgtttcatct tccggagctg taggtggcta tgaaggagga 480
ctggcagtta aggagtggct gctggctcat gaaggtcata gacttggaaa 530
<210> 32
<211> 7
<212> PRT
<213> artificial
<220>
<223> Pro-TEV cleavage site 1
<400> 32
Glu Asn Leu Tyr Phe Gln Ser
1 5
<210> 33
<211> 7
<212> PRT
<213> artificial
<220>
<223> Pro-TEV cleavage site 2
<400> 33
Glu Asn Leu Tyr Phe Gln Gly
1 5
<210> 34
<211> 798
<212> DNA
<213> artificial
<220>
<223> Cassette DNA pDeSNAP Univ (BIPlike - SNAPlike- proTEV/Histag)
<400> 34
gatcgcgagc tagcaccatg aaactatgta ttctacttgc agttgttgcg ttcgtaggat 60
tgtccttacc tacagctctg gcaagatctg acaaagactg cgaaatgaaa agaactacat 120
tggattcacc acttgggaag ttggaactga gtggatgcga gcaaggattg catgaaatta 180
agctactggg aaaaggaact tctgctgctg atgcagttga agttccagca ccagcagctg 240
ttcttggagg tcctgagccc ctcatgcaag ccacagcctg gcttaacgca tatttccacc 300
agcctgaggc cattgaggaa tttccagtcc ccgcccttca ccatcctgtg tttcagcagg 360
agagcttcac ccgccaggtc ctgtggaaat tgctgaaggt ggtcaagttt ggtgaagtga 420
tttcatatca gcaacttgct gcattggccg gtaaccccgc agctacagct gccgtgaaaa 480
ctgctctcag cggaaatcct gtgcccatcc tgatcccttg tcacagagtc gtttcatctt 540
ccggagctgt aggtggctat gaaggaggac tggcagttaa ggagtggctg ctggctcatg 600
aaggtcatag acttggaaag cctgggctgg gtcctgctgg tataggcgcg ccagggtccc 660
taggtggcgg atccgaaaac ctgtacttcc agagcgatat cggaggtgga ggcccgggag 720
agaatctata ttttcaaggg cccggcggag gtagtcacca tcatcaccat cactaatgac 780
cggtgcggcc gcaagctt 798
<210> 35
<211> 1439
<212> DNA
<213> artificial
<220>
<223> Cassette DNA pDeSNAP Univ +SBV.N (ssBIP - SNAPlike- SBV.N-
proTEV/Histag)
<400> 35
atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60
gacaaagact gcgaaatgaa aagaactaca ttggattcac cacttgggaa gttggaactg 120
agtggatgcg agcaaggatt gcatgaaatt aagctactgg gaaaaggaac ttctgctgct 180
gatgcagttg aagttccagc accagcagct gttcttggag gtcctgagcc cctcatgcaa 240
gccacagcct ggcttaacgc atatttccac cagcctgagg ccattgagga atttccagtc 300
cccgcccttc accatcctgt gtttcagcag gagagcttca cccgccaggt cctgtggaaa 360
ttgctgaagg tggtcaagtt tggtgaagtg atttcatatc agcaacttgc tgcattggcc 420
ggtaaccccg cagctacagc tgccgtgaaa actgctctca gcggaaatcc tgtgcccatc 480
ctgatccctt gtcacagagt cgtttcatct tccggagctg taggtggcta tgaaggagga 540
ctggcagtta aggagtggct gctggctcat gaaggtcata gacttggaaa gcctgggctg 600
ggtcctgctg gtataggcgc gccagggtcc ctaggtggcg gatccgaaaa cctgtacttc 660
cagagcgata tctcaagcca attcattttt gaagatgtac cacaacggaa tgcagctaca 720
tttaacccgg aggtcgggta tgtggcattt attggtaagt atgggcaaca actcaacttc 780
ggtgttgcta gagtcttctt cctcaaccag aagaaggcca agatggtcct acataagacg 840
gcacaaccaa gtgtcgatct tacttttggt ggggtcaaat ttacagtggt taataaccat 900
tttccccaat atgtctcaaa tcctgtgcca gacaatgcca ttacacttca caggatgtca 960
ggttatctag cacgttggat tgctgataca tgcaaggcta gtgtcctcaa actagctgaa 1020
gctagtgctc agattgtcat gccccttgct gaggttaagg gatgcacctg ggccgatggt 1080
tatacaatgt atcttggatt tgcacctggg gccgaaatgt tccttgatgc ttttgacttc 1140
tatccactag ttattgaaat gcatagggtc ctcaaggaca atatggatgt aaattttatg 1200
aaaaaagtcc tccgccaacg ctatggaaca atgactgctg aagaatggat gactcagaaa 1260
ataacagaaa taaaagctgc ttttaattct gttggacagc ttgcctgggc caaatctgga 1320
ttctctcctg ctgctagaac cttcttgcag caattcggta tcaacatccc gggagagaat 1380
ctatattttc aagggcccgg cggaggtagt caccatcatc accatcacta atgaccggt 1439
<210> 36
<211> 1480
<212> DNA
<213> artificial
<220>
<223> Cassette DNA pDeSNAP Univ +SBV.N (BIPlike - SNAPlike-SBV.N
-proTEV/Histag)
<400> 36
tcgcgagcta gcaccatgaa actatgtatt ctacttgcag ttgttgcgtt cgtaggattg 60
tccttaccta cagctctggc aagatctgac aaagactgcg aaatgaaaag aactacattg 120
gattcaccac ttgggaagtt ggaactgagt ggatgcgagc aaggattgca tgaaattaag 180
ctactgggaa aaggaacttc tgctgctgat gcagttgaag ttccagcacc agcagctgtt 240
cttggaggtc ctgagcccct catgcaagcc acagcctggc ttaacgcata tttccaccag 300
cctgaggcca ttgaggaatt tccagtcccc gcccttcacc atcctgtgtt tcagcaggag 360
agcttcaccc gccaggtcct gtggaaattg ctgaaggtgg tcaagtttgg tgaagtgatt 420
tcatatcagc aacttgctgc attggccggt aaccccgcag ctacagctgc cgtgaaaact 480
gctctcagcg gaaatcctgt gcccatcctg atcccttgtc acagagtcgt ttcatcttcc 540
ggagctgtag gtggctatga aggaggactg gcagttaagg agtggctgct ggctcatgaa 600
ggtcatagac ttggaaagcc tgggctgggt cctgctggta taggcgcgcc agggtcccta 660
ggtggcggat ccgaaaacct gtacttccag agcgatatct caagccaatt catttttgaa 720
gatgtaccac aacggaatgc agctacattt aacccggagg tcgggtatgt ggcatttatt 780
ggtaagtatg ggcaacaact caacttcggt gttgctagag tcttcttcct caaccagaag 840
aaggccaaga tggtcctaca taagacggca caaccaagtg tcgatcttac ttttggtggg 900
gtcaaattta cagtggttaa taaccatttt ccccaatatg tctcaaatcc tgtgccagac 960
aatgccatta cacttcacag gatgtcaggt tatctagcac gttggattgc tgatacatgc 1020
aaggctagtg tcctcaaact agctgaagct agtgctcaga ttgtcatgcc ccttgctgag 1080
gttaagggat gcacctgggc cgatggttat acaatgtatc ttggatttgc acctggggcc 1140
gaaatgttcc ttgatgcttt tgacttctat ccactagtta ttgaaatgca tagggtcctc 1200
aaggacaata tggatgtaaa ttttatgaaa aaagtcctcc gccaacgcta tggaacaatg 1260
actgctgaag aatggatgac tcagaaaata acagaaataa aagctgcttt taattctgtt 1320
ggacagcttg cctgggccaa atctggattc tctcctgctg ctagaacctt cttgcagcaa 1380
ttcggtatca acatcccggg agagaatcta tattttcaag ggcccggcgg aggtagtcac 1440
catcatcacc atcactaatg accggtgcgg ccgcaagctt 1480
<210> 37
<211> 18
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of the ssBiP sequence
<400> 37
Met Lys Leu Cys Ile Leu Leu Ala Val Val Ala Phe Val Gly Leu Ser
1 5 10 15
Leu Gly
<210> 38
<211> 17
<212> PRT
<213> West Nile virus strain IS-98-ST1
<400> 38
Met Val Val Phe Val Val Leu Leu Leu Leu Val Ala Pro Ala Tyr Ser
1 5 10 15
Leu
<210> 39
<211> 5
<212> PRT
<213> Dengue virus
<400> 39
Pro Thr Ala Leu Ala
1 5
<210> 40
<211> 6
<212> PRT
<213> artificial
<220>
<223> Cleavage site of enterokinase
<400> 40
Asp Asp Asp Asp Lys Asp
1 5
<210> 41
<211> 480
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of
BiPlike+SNAPlike+proTEV+SBV.N+proTEV+Histag
<400> 41
Met Lys Leu Cys Ile Leu Leu Ala Val Val Ala Phe Val Gly Leu Ser
1 5 10 15
Leu Pro Thr Ala Leu Ala Arg Ser Asp Lys Asp Cys Glu Met Lys Arg
20 25 30
Thr Thr Leu Asp Ser Pro Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu
35 40 45
Gln Gly Leu His Glu Ile Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala
50 55 60
Asp Ala Val Glu Val Pro Ala Pro Ala Ala Val Leu Gly Gly Pro Glu
65 70 75 80
Pro Leu Met Gln Ala Thr Ala Trp Leu Asn Ala Tyr Phe His Gln Pro
85 90 95
Glu Ala Ile Glu Glu Phe Pro Val Pro Ala Leu His His Pro Val Phe
100 105 110
Gln Gln Glu Ser Phe Thr Arg Gln Val Leu Trp Lys Leu Leu Lys Val
115 120 125
Val Lys Phe Gly Glu Val Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala
130 135 140
Gly Asn Pro Ala Ala Thr Ala Ala Val Lys Thr Ala Leu Ser Gly Asn
145 150 155 160
Pro Val Pro Ile Leu Ile Pro Cys His Arg Val Val Ser Ser Ser Gly
165 170 175
Ala Val Gly Gly Tyr Glu Gly Gly Leu Ala Val Lys Glu Trp Leu Leu
180 185 190
Ala His Glu Gly His Arg Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly
195 200 205
Ile Gly Ala Pro Gly Ser Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe
210 215 220
Gln Ser Asp Ile Ser Ser Gln Phe Ile Phe Glu Asp Val Pro Gln Arg
225 230 235 240
Asn Ala Ala Thr Phe Asn Pro Glu Val Gly Tyr Val Ala Phe Ile Gly
245 250 255
Lys Tyr Gly Gln Gln Leu Asn Phe Gly Val Ala Arg Val Phe Phe Leu
260 265 270
Asn Gln Lys Lys Ala Lys Met Val Leu His Lys Thr Ala Gln Pro Ser
275 280 285
Val Asp Leu Thr Phe Gly Gly Val Lys Phe Thr Val Val Asn Asn His
290 295 300
Phe Pro Gln Tyr Val Ser Asn Pro Val Pro Asp Asn Ala Ile Thr Leu
305 310 315 320
His Arg Met Ser Gly Tyr Leu Ala Arg Trp Ile Ala Asp Thr Cys Lys
325 330 335
Ala Ser Val Leu Lys Leu Ala Glu Ala Ser Ala Gln Ile Val Met Pro
340 345 350
Leu Ala Glu Val Lys Gly Cys Thr Trp Ala Asp Gly Tyr Thr Met Tyr
355 360 365
Leu Gly Phe Ala Pro Gly Ala Glu Met Phe Leu Asp Ala Phe Asp Phe
370 375 380
Tyr Pro Leu Val Ile Glu Met His Arg Val Leu Lys Asp Asn Met Asp
385 390 395 400
Val Asn Phe Met Lys Lys Val Leu Arg Gln Arg Tyr Gly Thr Met Thr
405 410 415
Ala Glu Glu Trp Met Thr Gln Lys Ile Thr Glu Ile Lys Ala Ala Phe
420 425 430
Asn Ser Val Gly Gln Leu Ala Trp Ala Lys Ser Gly Phe Ser Pro Ala
435 440 445
Ala Arg Thr Phe Leu Gln Gln Phe Gly Ile Asn Ile Pro Gly Glu Asn
450 455 460
Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser His His His His His His
465 470 475 480
<210> 42
<211> 438
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of the fusion protein SNAP+SCHM.N (without
BiPlike + HisTag
<400> 42
Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro
1 5 10 15
Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile
20 25 30
Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro
35 40 45
Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr
50 55 60
Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe
65 70 75 80
Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr
85 90 95
Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val
100 105 110
Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr
115 120 125
Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile
130 135 140
Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu
145 150 155 160
Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg
165 170 175
Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser
180 185 190
Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Ser Ser
195 200 205
Gln Phe Ile Phe Glu Asp Val Pro Gln Arg Asn Ala Ala Thr Phe Asn
210 215 220
Pro Glu Val Gly Tyr Val Ala Phe Ile Gly Lys Tyr Gly Gln Gln Leu
225 230 235 240
Asn Phe Gly Val Ala Arg Val Phe Phe Leu Asn Gln Lys Lys Ala Lys
245 250 255
Met Val Leu His Lys Thr Ala Gln Pro Ser Val Asp Leu Thr Phe Gly
260 265 270
Gly Val Lys Phe Thr Val Val Asn Asn His Phe Pro Gln Tyr Val Ser
275 280 285
Asn Pro Val Pro Asp Asn Ala Ile Thr Leu His Arg Met Ser Gly Tyr
290 295 300
Leu Ala Arg Trp Ile Ala Asp Thr Cys Lys Ala Ser Val Leu Lys Leu
305 310 315 320
Ala Glu Ala Ser Ala Gln Ile Val Met Pro Leu Ala Glu Val Lys Gly
325 330 335
Cys Thr Trp Ala Asp Gly Tyr Thr Met Tyr Leu Gly Phe Ala Pro Gly
340 345 350
Ala Glu Met Phe Leu Asp Ala Phe Asp Phe Tyr Pro Leu Val Ile Glu
355 360 365
Met His Arg Val Leu Lys Asp Asn Met Asp Val Asn Phe Met Lys Lys
370 375 380
Val Leu Arg Gln Arg Tyr Gly Thr Met Thr Ala Glu Glu Trp Met Thr
385 390 395 400
Gln Lys Ile Thr Glu Ile Lys Ala Ala Phe Asn Ser Val Gly Gln Leu
405 410 415
Ala Trp Ala Lys Ser Gly Phe Ser Pro Ala Ala Arg Thr Phe Leu Gln
420 425 430
Gln Phe Gly Ile Asn Ile
435
<210> 43
<211> 4194
<212> DNA
<213> artificial
<220>
<223> pMT/BiP/SNAP-Histag avec cassette DeSNAP Univ
<400> 43
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgccag tgaattttaa cgttgcagga 420
caggatgtgg tgcccgatgt gactagctct ttgctgcagg ccgtcctatc ctctggttcc 480
gataagagac ccagaactcc ggccccccac cgcccaccgc cacccccata catatgtggt 540
acgcaagtaa gagtgcctgc gcatgcccca tgtgccccac caagagtttt gcatcccata 600
caagtcccca aagtggagaa ccgaaccaat tcttcgcggg cagaacaaaa gcttctgcac 660
acgtctccac tcgaatttgg agccggccgg cgtgtgcaaa agaggtgaat cgaacgaaag 720
acccgtgtgt aaagccgcgt ttccaaaatg tataaaaccg agagcatctg gccaatgtgc 780
atcagttgtg gtcagcagca aaatcaagtg aatcatctca gtgcaactaa aggggggatc 840
cgatctcaat atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct 900
cgggagatct gacaaagact gcgaaatgaa aagaactaca ttggattcac cacttgggaa 960
gttggaactg agtggatgcg agcaaggatt gcatgaaatt aagctactgg gaaaaggaac 1020
ttctgctgct gatgcagttg aagttccagc accagcagct gttcttggag gtcctgagcc 1080
cctcatgcaa gccacagcct ggcttaacgc atatttccac cagcctgagg ccattgagga 1140
atttccagtc cccgcccttc accatcctgt gtttcagcag gagagcttca cccgccaggt 1200
cctgtggaaa ttgctgaagg tggtcaagtt tggtgaagtg atttcatatc agcaacttgc 1260
tgcattggcc ggtaaccccg cagctacagc tgccgtgaaa actgctctca gcggaaatcc 1320
tgtgcccatc ctgatccctt gtcacagagt cgtttcatct tccggagctg taggtggcta 1380
tgaaggagga ctggcagtta aggagtggct gctggctcat gaaggtcata gacttggaaa 1440
gcctgggctg ggtcctgctg gtataggcgc gccagggtcc ctaggtggcg gatccgaaaa 1500
cctgtacttc cagagcgata tcggaggtgg aggcccggga gagaatctat attttcaagg 1560
gcccggcgga ggtagtcacc atcatcacca tcactaatga ccggtcatca tcaccatcac 1620
cattgagttt aaacccgctg atcagcctcg actgtgcctt ctaaggcctg agctcgctga 1680
tcagcctcga tcgaggatcc agacatgata agatacattg atgagtttgg acaaaccaca 1740
actagaatgc agtgaaaaaa atgctttatt tgtgaaattt gtgatgctat tgctttattt 1800
gtaaccatta taagctgcaa taaacaagtt aacaacaaca attgcattca ttttatgttt 1860
caggttcagg gggaggtgtg ggaggttttt taaagcaagt aaaacctcta caaatgtggt 1920
atggctgatt atgatcagtc gacctgcagg catgcaagct tggcgtaatc atggtcatag 1980
ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc 2040
ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc 2100
tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa 2160
cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg 2220
ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg 2280
ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag 2340
gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac 2400
gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga 2460
taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt 2520
accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc 2580
tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc 2640
cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta 2700
agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat 2760
gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca 2820
gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct 2880
tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt 2940
acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct 3000
cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc 3060
acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa 3120
acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta 3180
tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc 3240
ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat 3300
ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta 3360
tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt 3420
aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt 3480
ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg 3540
ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc 3600
gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc 3660
gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg 3720
cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga 3780
actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta 3840
ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct 3900
tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag 3960
ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca atattattga 4020
agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat 4080
aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc 4140
attattatca tgacattaac ctataaaaat aggcgtatca cgaggccctt tcgt 4194
<210> 44
<211> 3458
<212> DNA
<213> artificial
<220>
<223> pUC57 with DeSNAP Univ cassette
<400> 44
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cgagctcggt acctcgcgaa 420
tgcatctaga tcgagctagc accatgaaac tatgtattct acttgcagtt gttgcgttcg 480
taggattgtc cttacctaca gctctggcaa gatctgacaa agactgcgaa atgaaaagaa 540
ctacattgga ttcaccactt gggaagttgg aactgagtgg atgcgagcaa ggattgcatg 600
aaattaagct actgggaaaa ggaacttctg ctgctgatgc agttgaagtt ccagcaccag 660
cagctgttct tggaggtcct gagcccctca tgcaagccac agcctggctt aacgcatatt 720
tccaccagcc tgaggccatt gaggaatttc cagtccccgc ccttcaccat cctgtgtttc 780
agcaggagag cttcacccgc caggtcctgt ggaaattgct gaaggtggtc aagtttggtg 840
aagtgatttc atatcagcaa cttgctgcat tggccggtaa ccccgcagct acagctgccg 900
tgaaaactgc tctcagcgga aatcctgtgc ccatcctgat cccttgtcac agagtcgttt 960
catcttccgg agctgtaggt ggctatgaag gaggactggc agttaaggag tggctgctgg 1020
ctcatgaagg tcatagactt ggaaagcctg ggctgggtcc tgctggtata ggcgcgccag 1080
ggtccctagg tggcggatcc gaaaacctgt acttccagag cgatatcgga ggtggaggcc 1140
cgggagagaa tctatatttt caagggcccg gcggaggtag tcaccatcat caccatcact 1200
aatgaccggt gcggccgcaa gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa 1260
ttgttatccg ctcacaattc cacacaacat acgagccgga agcataaagt gtaaagcctg 1320
gggtgcctaa tgagtgagct aactcacatt aattgcgttg cgctcactgc ccgctttcca 1380
gtcgggaaac ctgtcgtgcc agctgcatta atgaatcggc caacgcgcgg ggagaggcgg 1440
tttgcgtatt gggcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg 1500
gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg 1560
ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa 1620
ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 1680
acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 1740
tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 1800
ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 1860
ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 1920
ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 1980
actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 2040
gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc 2100
tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 2160
caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 2220
atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 2280
acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa 2340
ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta 2400
ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt 2460
tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag 2520
tgctgcaatg ataccgcgag acccacgctc accggctcca gatttatcag caataaacca 2580
gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc 2640
tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt 2700
tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag 2760
ctccggttcc caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt 2820
tagctccttc ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat 2880
ggttatggca gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt 2940
gactggtgag tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc 3000
ttgcccggcg tcaatacggg ataataccgc gccacatagc agaactttaa aagtgctcat 3060
cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag 3120
ttcgatgtaa cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt 3180
ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg 3240
gaaatgttga atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta 3300
ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc 3360
gcgcacattt ccccgaaaag tgccacctga cgtctaagaa accattatta tcatgacatt 3420
aacctataaa aataggcgta tcacgaggcc ctttcgtc 3458
<210> 45
<211> 6365
<212> DNA
<213> artificial
<220>
<223> pcDNA3 with DeSNAP Univ cassette
<400> 45
gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60
ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120
cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180
ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240
gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300
tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360
cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420
attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480
atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540
atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600
tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720
aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780
gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840
ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gctggctagc 900
accatgaaac tatgtattct acttgcagtt gttgcgttcg taggattgtc cttacctaca 960
gctctggcaa gatctgacaa agactgcgaa atgaaaagaa ctacattgga ttcaccactt 1020
gggaagttgg aactgagtgg atgcgagcaa ggattgcatg aaattaagct actgggaaaa 1080
ggaacttctg ctgctgatgc agttgaagtt ccagcaccag cagctgttct tggaggtcct 1140
gagcccctca tgcaagccac agcctggctt aacgcatatt tccaccagcc tgaggccatt 1200
gaggaatttc cagtccccgc ccttcaccat cctgtgtttc agcaggagag cttcacccgc 1260
caggtcctgt ggaaattgct gaaggtggtc aagtttggtg aagtgatttc atatcagcaa 1320
cttgctgcat tggccggtaa ccccgcagct acagctgccg tgaaaactgc tctcagcgga 1380
aatcctgtgc ccatcctgat cccttgtcac agagtcgttt catcttccgg agctgtaggt 1440
ggctatgaag gaggactggc agttaaggag tggctgctgg ctcatgaagg tcatagactt 1500
ggaaagcctg ggctgggtcc tgctggtata ggcgcgccag ggtccctagg tggcggatcc 1560
gaaaacctgt acttccagag cgatatcgga ggtggaggcc cgggagagaa tctatatttt 1620
caagggcccg gcggaggtag tcaccatcat caccatcact aatgaccggt gcggccgcaa 1680
gcttggtacc gagctcggat ccactagtcc agtgtggtgg aattctgcag atatccagca 1740
cagtggcggc cgctcgagtc tagagggccc gtttaaaccc gctgatcagc ctcgactgtg 1800
ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt gaccctggaa 1860
ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt 1920
aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga ggattgggaa 1980
gacaatagca ggcatgctgg ggatgcggtg ggctctatgg cttctgaggc ggaaagaacc 2040
agctggggct ctagggggta tccccacgcg ccctgtagcg gcgcattaag cgcggcgggt 2100
gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg ccctagcgcc cgctcctttc 2160
gctttcttcc cttcctttct cgccacgttc gccggctttc cccgtcaagc tctaaatcgg 2220
gggctccctt tagggttccg atttagtgct ttacggcacc tcgaccccaa aaaacttgat 2280
tagggtgatg gttcacgtag tgggccatcg ccctgataga cggtttttcg ccctttgacg 2340
ttggagtcca cgttctttaa tagtggactc ttgttccaaa ctggaacaac actcaaccct 2400
atctcggtct attcttttga tttataaggg attttgccga tttcggccta ttggttaaaa 2460
aatgagctga tttaacaaaa atttaacgcg aattaattct gtggaatgtg tgtcagttag 2520
ggtgtggaaa gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt 2580
agtcagcaac caggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca 2640
tgcatctcaa ttagtcagca accatagtcc cgcccctaac tccgcccatc ccgcccctaa 2700
ctccgcccag ttccgcccat tctccgcccc atggctgact aatttttttt atttatgcag 2760
aggccgaggc cgcctctgcc tctgagctat tccagaagta gtgaggaggc ttttttggag 2820
gcctaggctt ttgcaaaaag ctcccgggag cttgtatatc cattttcgga tctgatcagc 2880
acgtgatgaa aaagcctgaa ctcaccgcga cgtctgtcga gaagtttctg atcgaaaagt 2940
tcgacagcgt ctccgacctg atgcagctct cggagggcga agaatctcgt gctttcagct 3000
tcgatgtagg agggcgtgga tatgtcctgc gggtaaatag ctgcgccgat ggtttctaca 3060
aagatcgtta tgtttatcgg cactttgcat cggccgcgct cccgattccg gaagtgcttg 3120
acattgggga attcagcgag agcctgacct attgcatctc ccgccgtgca cagggtgtca 3180
cgttgcaaga cctgcctgaa accgaactgc ccgctgttct gcagccggtc gcggaggcca 3240
tggatgcgat cgctgcggcc gatcttagcc agacgagcgg gttcggccca ttcggaccgc 3300
aaggaatcgg tcaatacact acatggcgtg atttcatatg cgcgattgct gatccccatg 3360
tgtatcactg gcaaactgtg atggacgaca ccgtcagtgc gtccgtcgcg caggctctcg 3420
atgagctgat gctttgggcc gaggactgcc ccgaagtccg gcacctcgtg cacgcggatt 3480
tcggctccaa caatgtcctg acggacaatg gccgcataac agcggtcatt gactggagcg 3540
aggcgatgtt cggggattcc caatacgagg tcgccaacat cttcttctgg aggccgtggt 3600
tggcttgtat ggagcagcag acgcgctact tcgagcggag gcatccggag cttgcaggat 3660
cgccgcggct ccgggcgtat atgctccgca ttggtcttga ccaactctat cagagcttgg 3720
ttgacggcaa tttcgatgat gcagcttggg cgcagggtcg atgcgacgca atcgtccgat 3780
ccggagccgg gactgtcggg cgtacacaaa tcgcccgcag aagcgcggcc gtctggaccg 3840
atggctgtgt agaagtactc gccgatagtg gaaaccgacg ccccagcact cgtccgaggg 3900
caaaggaata gcacgtgcta cgagatttcg attccaccgc cgccttctat gaaaggttgg 3960
gcttcggaat cgttttccgg gacgccggct ggatgatcct ccagcgcggg gatctcatgc 4020
tggagttctt cgcccacccc aacttgttta ttgcagctta taatggttac aaataaagca 4080
atagcatcac aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt 4140
ccaaactcat caatgtatct tatcatgtct gtataccgtc gacctctagc tagagcttgg 4200
cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta tccgctcaca attccacaca 4260
acatacgagc cggaagcata aagtgtaaag cctggggtgc ctaatgagtg agctaactca 4320
cattaattgc gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc 4380
attaatgaat cggccaacgc gcggggagag gcggtttgcg tattgggcgc tcttccgctt 4440
cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact 4500
caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag 4560
caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata 4620
ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc 4680
cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg 4740
ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc 4800
tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg 4860
gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc 4920
ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga 4980
ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg 5040
gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt accttcggaa 5100
aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt ttttttgttt 5160
gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta 5220
cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagattat 5280
caaaaaggat cttcacctag atccttttaa attaaaaatg aagttttaaa tcaatctaaa 5340
gtatatatga gtaaacttgg tctgacagtt accaatgctt aatcagtgag gcacctatct 5400
cagcgatctg tctatttcgt tcatccatag ttgcctgact ccccgtcgtg tagataacta 5460
cgatacggga gggcttacca tctggcccca gtgctgcaat gataccgcga gacccacgct 5520
caccggctcc agatttatca gcaataaacc agccagccgg aagggccgag cgcagaagtg 5580
gtcctgcaac tttatccgcc tccatccagt ctattaattg ttgccgggaa gctagagtaa 5640
gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt 5700
cacgctcgtc gtttggtatg gcttcattca gctccggttc ccaacgatca aggcgagtta 5760
catgatcccc catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca 5820
gaagtaagtt ggccgcagtg ttatcactca tggttatggc agcactgcat aattctctta 5880
ctgtcatgcc atccgtaaga tgcttttctg tgactggtga gtactcaacc aagtcattct 5940
gagaatagtg tatgcggcga ccgagttgct cttgcccggc gtcaatacgg gataataccg 6000
cgccacatag cagaacttta aaagtgctca tcattggaaa acgttcttcg gggcgaaaac 6060
tctcaaggat cttaccgctg ttgagatcca gttcgatgta acccactcgt gcacccaact 6120
gatcttcagc atcttttact ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa 6180
atgccgcaaa aaagggaata agggcgacac ggaaatgttg aatactcata ctcttccttt 6240
ttcaatatta ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat 6300
gtatttagaa aaataaacaa ataggggttc cgcgcacatt tccccgaaaa gtgccacctg 6360
acgtc 6365
<210> 46
<211> 476
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of ssBiP+SNAPlike+proTEV+SBV.N+proTEV+Histag
(encoded by SEQ ID NO:35)
<400> 46
Met Lys Leu Cys Ile Leu Leu Ala Val Val Ala Phe Val Gly Leu Ser
1 5 10 15
Leu Gly Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp
20 25 30
Ser Pro Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His
35 40 45
Glu Ile Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu
50 55 60
Val Pro Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln
65 70 75 80
Ala Thr Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu
85 90 95
Glu Phe Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser
100 105 110
Phe Thr Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly
115 120 125
Glu Val Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala
130 135 140
Ala Thr Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile
145 150 155 160
Leu Ile Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly
165 170 175
Tyr Glu Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly
180 185 190
His Arg Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro
195 200 205
Gly Ser Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile
210 215 220
Ser Ser Gln Phe Ile Phe Glu Asp Val Pro Gln Arg Asn Ala Ala Thr
225 230 235 240
Phe Asn Pro Glu Val Gly Tyr Val Ala Phe Ile Gly Lys Tyr Gly Gln
245 250 255
Gln Leu Asn Phe Gly Val Ala Arg Val Phe Phe Leu Asn Gln Lys Lys
260 265 270
Ala Lys Met Val Leu His Lys Thr Ala Gln Pro Ser Val Asp Leu Thr
275 280 285
Phe Gly Gly Val Lys Phe Thr Val Val Asn Asn His Phe Pro Gln Tyr
290 295 300
Val Ser Asn Pro Val Pro Asp Asn Ala Ile Thr Leu His Arg Met Ser
305 310 315 320
Gly Tyr Leu Ala Arg Trp Ile Ala Asp Thr Cys Lys Ala Ser Val Leu
325 330 335
Lys Leu Ala Glu Ala Ser Ala Gln Ile Val Met Pro Leu Ala Glu Val
340 345 350
Lys Gly Cys Thr Trp Ala Asp Gly Tyr Thr Met Tyr Leu Gly Phe Ala
355 360 365
Pro Gly Ala Glu Met Phe Leu Asp Ala Phe Asp Phe Tyr Pro Leu Val
370 375 380
Ile Glu Met His Arg Val Leu Lys Asp Asn Met Asp Val Asn Phe Met
385 390 395 400
Lys Lys Val Leu Arg Gln Arg Tyr Gly Thr Met Thr Ala Glu Glu Trp
405 410 415
Met Thr Gln Lys Ile Thr Glu Ile Lys Ala Ala Phe Asn Ser Val Gly
420 425 430
Gln Leu Ala Trp Ala Lys Ser Gly Phe Ser Pro Ala Ala Arg Thr Phe
435 440 445
Leu Gln Gln Phe Gly Ile Asn Ile Pro Gly Glu Asn Leu Tyr Phe Gln
450 455 460
Gly Pro Gly Gly Gly Ser His His His His His His
465 470 475
<210> 47
<211> 891
<212> DNA
<213> artificial
<220>
<223> Modified DNA sequence encoding enterovirus 71 VP1 (strain
JL-AFP-EV71-07-03)
<400> 47
ggagataggg tggcagacgt gattgaaagt tccaaaggaa atagtgtgag cagagccctc 60
actcaagctc taccagcacc cacaggtcag aacacacagg tgagcagtca tcgactggat 120
acaggcaagg ttccagcact ccaagctgct gaaattggag catcatcaaa tgctagtgat 180
gagagcatga tcgagacacg ctgtgttctt aactcgcata gcacagctga gaccactctt 240
gatagtttct tcagcagagc ggggttagtt ggagagattg atctccctct tgaaggcaca 300
actaacccaa atggttatgc caactgggac atagatataa caggttacgc gcaaatgcgt 360
agaaaggtgg agctattcac ctacatgcgc tttgatgcag agttcacttt tgttgcgtgc 420
acacccaccg gggaagttgt cccacaattg ctccaataca tgtttgtgcc acctggagcc 480
cctaagccag attccaggga atccctcgca tggcaaactg ccaccaaccc ctcagttttt 540
gtcaagctgt cagaccctcc agcacaagtt tcagtaccat tcatgtcacc tgcgagtgct 600
taccaatggt tttatgacgg ttatcccaca ttcggagaac acaaacagga gaaggatctc 660
gaatatgggg catgtcctaa caacatgatg ggcacgttct cagtgcggac tgtagggacc 720
tccaagtcca agtacccttt agtggttagg atttacatga gaatgaagca cgtcagggcg 780
tggatacctc gcccgatgcg caaccaaaac tacctattca aagccaaccc aaattatgct 840
ggcaactcca ttaagccaac tggtaccagt cgcacagcga tcactactct c 891
<210> 48
<211> 1643
<212> DNA
<213> artificial
<220>
<223> DNA Sequence of chimeric DeSNAPuniv-EV71.VP1 (ssBiP-SNAPlike-
proTEVcleavage site - modified EV71-VP1-proTEVcleavage site
-Histag) for expression in S2 cells
<400> 48
atgaagttat gcatattact ggccgtcgtg gtggcctttg ttggcctctc gctcgggaga 60
tctagatctg acaaagactg cgaaatgaaa agaactacat tggattcacc acttgggaag 120
ttggaactga gtggatgcga gcaaggattg catgaaatta agctactggg aaaaggaact 180
tctgctgctg atgcagttga agttccagca ccagcagctg ttcttggagg tcctgagccc 240
ctcatgcaag ccacagcctg gcttaacgca tatttccacc agcctgaggc cattgaggaa 300
tttccagtcc ccgcccttca ccatcctgtg tttcagcagg agagcttcac ccgccaggtc 360
ctgtggaaat tgctgaaggt ggtcaagttt ggtgaagtga tttcatatca gcaacttgct 420
gcattggccg gtaaccccgc agctacagct gccgtgaaaa ctgctctcag cggaaatcct 480
gtgcccatcc tgatcccttg tcacagagtc gtttcatctt ccggagctgt aggtggctat 540
gaaggaggac tggcagttaa ggagtggctg ctggctcatg aaggtcatag acttggaaag 600
cctgggctgg gtcctgctgg tataggcgcg ccagggtccc taggtggcgg atccgaaaac 660
ctgtacttcc agagcgatat cggagatagg gtggcagacg tgattgaaag ttccaaagga 720
aatagtgtga gcagagccct cactcaagct ctaccagcac ccacaggtca gaacacacag 780
gtgagcagtc atcgactgga tacaggcaag gttccagcac tccaagctgc tgaaattgga 840
gcatcatcaa atgctagtga tgagagcatg atcgagacac gctgtgttct taactcgcat 900
agcacagctg agaccactct tgatagtttc ttcagcagag cggggttagt tggagagatt 960
gatctccctc ttgaaggcac aactaaccca aatggttatg ccaactggga catagatata 1020
acaggttacg cgcaaatgcg tagaaaggtg gagctattca cctacatgcg ctttgatgca 1080
gagttcactt ttgttgcgtg cacacccacc ggggaagttg tcccacaatt gctccaatac 1140
atgtttgtgc cacctggagc ccctaagcca gattccaggg aatccctcgc atggcaaact 1200
gccaccaacc cctcagtttt tgtcaagctg tcagaccctc cagcacaagt ttcagtacca 1260
ttcatgtcac ctgcgagtgc ttaccaatgg ttttatgacg gttatcccac attcggagaa 1320
cacaaacagg agaaggatct cgaatatggg gcatgtccta acaacatgat gggcacgttc 1380
tcagtgcgga ctgtagggac ctccaagtcc aagtaccctt tagtggttag gatttacatg 1440
agaatgaagc acgtcagggc gtggatacct cgcccgatgc gcaaccaaaa ctacctattc 1500
aaagccaacc caaattatgc tggcaactcc attaagccaa ctggtaccag tcgcacagcg 1560
atcactactc tcccgggaga gaatctatat tttcaagggc ccggcggagg tagtcaccat 1620
catcaccatc actaatgacc ggt 1643
<210> 49
<211> 523
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of fusion protein [SNAPlike - proTEV - VP1
EV71 - proTEV- Histag]
<400> 49
Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro
1 5 10 15
Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile
20 25 30
Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro
35 40 45
Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr
50 55 60
Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe
65 70 75 80
Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr
85 90 95
Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val
100 105 110
Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr
115 120 125
Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile
130 135 140
Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu
145 150 155 160
Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg
165 170 175
Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser
180 185 190
Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Gly Asp
195 200 205
Arg Val Ala Asp Val Ile Glu Ser Ser Lys Gly Asn Ser Val Ser Arg
210 215 220
Ala Leu Thr Gln Ala Leu Pro Ala Pro Thr Gly Gln Asn Thr Gln Val
225 230 235 240
Ser Ser His Arg Leu Asp Thr Gly Lys Val Pro Ala Leu Gln Ala Ala
245 250 255
Glu Ile Gly Ala Ser Ser Asn Ala Ser Asp Glu Ser Met Ile Glu Thr
260 265 270
Arg Cys Val Leu Asn Ser His Ser Thr Ala Glu Thr Thr Leu Asp Ser
275 280 285
Phe Phe Ser Arg Ala Gly Leu Val Gly Glu Ile Asp Leu Pro Leu Glu
290 295 300
Gly Thr Thr Asn Pro Asn Gly Tyr Ala Asn Trp Asp Ile Asp Ile Thr
305 310 315 320
Gly Tyr Ala Gln Met Arg Arg Lys Val Glu Leu Phe Thr Tyr Met Arg
325 330 335
Phe Asp Ala Glu Phe Thr Phe Val Ala Cys Thr Pro Thr Gly Glu Val
340 345 350
Val Pro Gln Leu Leu Gln Tyr Met Phe Val Pro Pro Gly Ala Pro Lys
355 360 365
Pro Asp Ser Arg Glu Ser Leu Ala Trp Gln Thr Ala Thr Asn Pro Ser
370 375 380
Val Phe Val Lys Leu Ser Asp Pro Pro Ala Gln Val Ser Val Pro Phe
385 390 395 400
Met Ser Pro Ala Ser Ala Tyr Gln Trp Phe Tyr Asp Gly Tyr Pro Thr
405 410 415
Phe Gly Glu His Lys Gln Glu Lys Asp Leu Glu Tyr Gly Ala Cys Pro
420 425 430
Asn Asn Met Met Gly Thr Phe Ser Val Arg Thr Val Gly Thr Ser Lys
435 440 445
Ser Lys Tyr Pro Leu Val Val Arg Ile Tyr Met Arg Met Lys His Val
450 455 460
Arg Ala Trp Ile Pro Arg Pro Met Arg Asn Gln Asn Tyr Leu Phe Lys
465 470 475 480
Ala Asn Pro Asn Tyr Ala Gly Asn Ser Ile Lys Pro Thr Gly Thr Ser
485 490 495
Arg Thr Ala Ile Thr Thr Leu Pro Gly Glu Asn Leu Tyr Phe Gln Gly
500 505 510
Pro Gly Gly Gly Ser His His His His His His
515 520
<210> 50
<211> 2386
<212> DNA
<213> artificial
<220>
<223> DNA Sequence encoding chimeric DeSNAPuniv-JE. -sE (ssBiP- sE from
JEV strain SA-14 -SNAPlike) for expression in S2 cells
<400> 50
atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60
atgaagttgt cgaatttcca ggggaagctt ttgatgacca tcaacaacac ggacattgca 120
gacgttatcg tgattcccac ctcaaaagga gagaacagat gctgggtccg ggcaatcgac 180
gtcggctaca tgtgtgagga cactatcacg tacgaatgtc ctaagcttac catgggcaat 240
gatccagagg atgtggattg ctggtgtgac aaccaagaag tctacgtcca atatggacgg 300
tgcacgcgga ccaggcattc caagcgaagc aggagatccg tgtcggtcca aacacatggg 360
gagagttcac tagtgaataa aaaagaggct tggctggatt caacgaaagc cacacgatat 420
ctcatgaaaa ctgagaactg gatcataagg aatcctggct atgctttcct ggcggcggta 480
cttggctgga tgcttggcag taacaacggt caacgcgtgg tatttaccat cctcctgctg 540
ttggtcgctc cggcttacag ttttaattgt ctgggaatgg gcaatcgtga cttcatagaa 600
ggagccagtg gagccacttg ggtggacttg gtgctagaag gagatagctg cttgacaatc 660
atggcaaacg acaaaccaac attggacgtc cgcatgatta acatcgaagc tagccaactt 720
gctgaggtca gaagttactg ctatcatgct tcagtcactg acatctcgac ggtggctcgg 780
tgccccacga ctggagaagc tcacaacgag aagcgagctg atagtagcta tgtgtgcaaa 840
caaggcttca ctgaccgtgg gtggggcaac ggatgtggac ttttcgggaa gggaagcatt 900
gacacatgtg caaaattctc ctgcaccagt aaagcgattg ggagaacaat ccagccagaa 960
aacatcaaat acgaagttgg catttttgtg catggaacca ccacttcgga aaaccatggg 1020
aattattcag cgcaagttgg ggcgtcccag gcggcaaagt ttacagtaac acccaatgct 1080
ccttcgataa ccctcaaact tggtgactac ggagaagtca cactggactg tgagccaagg 1140
agtggactga acactgaagc gttttacgtc atgaccgtgg ggtcaaagtc atttctggtc 1200
catagggagt ggtttcatga cctcgctctc ccctggacgt ccccttcgag cacagcgtgg 1260
agaaacagag aactcctcat ggaatttgaa ggggcgcacg ccacaaaaca gtccgttgtt 1320
gctcttgggt cacaggaagg aggcctccat caggcgttgg caggagccat cgtggtggag 1380
tactcaagct cagtgaagtt aacatcaggc cacctgaaat gtaggctgaa aatggacaaa 1440
ctggctctga aaggcacaac ctatggcatg tgtacagaaa aattctcgtt cgcgaaaaat 1500
ccggcggaca ctggtcacgg aacagttgtc attgaactct cctactctgg gagtgatggc 1560
tcctgcaaaa ttccgattgt ttccgttgcg agcctcaatg acatgacccc cgttgggcgg 1620
ctggtgacag tgaacccctt cgtcgcgact tccagtgcca actcaaaggt gctggtcgag 1680
atggaacccc ccttcggaga ctcctacatc gtagttggaa ggggagacaa gcagatcaac 1740
caccattggc acaaagctgg gcggccgcac ggcggaggta gcaaagactg cgaaatgaag 1800
cgcaccaccc tggatagccc tctgggcaag ctggaactgt ctgggtgcga acagggcctg 1860
cacgagatca agctgctggg caaaggaaca tctgccgccg acgccgtgga agtgcctgcc 1920
ccagccgccg tgctgggcgg accagagcca ctgatgcagg ccaccgcctg gctcaacgcc 1980
tactttcacc agcctgaggc catcgaggag ttccctgtgc cagccctgca ccacccagtg 2040
ttccagcagg agagctttac ccgccaggtg ctgtggaaac tgctgaaagt ggtgaagttc 2100
ggagaggtca tcagctacca gcagctggcc gccctggccg gcaatcccgc cgccaccgcc 2160
gccgtgaaaa ccgccctgag cggaaatccc gtgcccattc tgatcccctg ccaccgggtg 2220
gtgtctagct ctggcgccgt ggggggctac gagggcgggc tcgccgtgaa agagtggctg 2280
ctggcccacg agggccacag actgggcaag cctgggctgg gtcctgcagg tataggcgcg 2340
ccagggtccc tggagcatca tcatcatcat cattgatgac gggccc 2386
<210> 51
<211> 773
<212> PRT
<213> artificial
<220>
<223> Amino acid Sequence of fusion protein [sE from JEV strain SA-14 -
SNAPlike - Histag]
<400> 51
Arg Ser Met Lys Leu Ser Asn Phe Gln Gly Lys Leu Leu Met Thr Ile
1 5 10 15
Asn Asn Thr Asp Ile Ala Asp Val Ile Val Ile Pro Thr Ser Lys Gly
20 25 30
Glu Asn Arg Cys Trp Val Arg Ala Ile Asp Val Gly Tyr Met Cys Glu
35 40 45
Asp Thr Ile Thr Tyr Glu Cys Pro Lys Leu Thr Met Gly Asn Asp Pro
50 55 60
Glu Asp Val Asp Cys Trp Cys Asp Asn Gln Glu Val Tyr Val Gln Tyr
65 70 75 80
Gly Arg Cys Thr Arg Thr Arg His Ser Lys Arg Ser Arg Arg Ser Val
85 90 95
Ser Val Gln Thr His Gly Glu Ser Ser Leu Val Asn Lys Lys Glu Ala
100 105 110
Trp Leu Asp Ser Thr Lys Ala Thr Arg Tyr Leu Met Lys Thr Glu Asn
115 120 125
Trp Ile Ile Arg Asn Pro Gly Tyr Ala Phe Leu Ala Ala Val Leu Gly
130 135 140
Trp Met Leu Gly Ser Asn Asn Gly Gln Arg Val Val Phe Thr Ile Leu
145 150 155 160
Leu Leu Leu Val Ala Pro Ala Tyr Ser Phe Asn Cys Leu Gly Met Gly
165 170 175
Asn Arg Asp Phe Ile Glu Gly Ala Ser Gly Ala Thr Trp Val Asp Leu
180 185 190
Val Leu Glu Gly Asp Ser Cys Leu Thr Ile Met Ala Asn Asp Lys Pro
195 200 205
Thr Leu Asp Val Arg Met Ile Asn Ile Glu Ala Ser Gln Leu Ala Glu
210 215 220
Val Arg Ser Tyr Cys Tyr His Ala Ser Val Thr Asp Ile Ser Thr Val
225 230 235 240
Ala Arg Cys Pro Thr Thr Gly Glu Ala His Asn Glu Lys Arg Ala Asp
245 250 255
Ser Ser Tyr Val Cys Lys Gln Gly Phe Thr Asp Arg Gly Trp Gly Asn
260 265 270
Gly Cys Gly Leu Phe Gly Lys Gly Ser Ile Asp Thr Cys Ala Lys Phe
275 280 285
Ser Cys Thr Ser Lys Ala Ile Gly Arg Thr Ile Gln Pro Glu Asn Ile
290 295 300
Lys Tyr Glu Val Gly Ile Phe Val His Gly Thr Thr Thr Ser Glu Asn
305 310 315 320
His Gly Asn Tyr Ser Ala Gln Val Gly Ala Ser Gln Ala Ala Lys Phe
325 330 335
Thr Val Thr Pro Asn Ala Pro Ser Ile Thr Leu Lys Leu Gly Asp Tyr
340 345 350
Gly Glu Val Thr Leu Asp Cys Glu Pro Arg Ser Gly Leu Asn Thr Glu
355 360 365
Ala Phe Tyr Val Met Thr Val Gly Ser Lys Ser Phe Leu Val His Arg
370 375 380
Glu Trp Phe His Asp Leu Ala Leu Pro Trp Thr Ser Pro Ser Ser Thr
385 390 395 400
Ala Trp Arg Asn Arg Glu Leu Leu Met Glu Phe Glu Gly Ala His Ala
405 410 415
Thr Lys Gln Ser Val Val Ala Leu Gly Ser Gln Glu Gly Gly Leu His
420 425 430
Gln Ala Leu Ala Gly Ala Ile Val Val Glu Tyr Ser Ser Ser Val Lys
435 440 445
Leu Thr Ser Gly His Leu Lys Cys Arg Leu Lys Met Asp Lys Leu Ala
450 455 460
Leu Lys Gly Thr Thr Tyr Gly Met Cys Thr Glu Lys Phe Ser Phe Ala
465 470 475 480
Lys Asn Pro Ala Asp Thr Gly His Gly Thr Val Val Ile Glu Leu Ser
485 490 495
Tyr Ser Gly Ser Asp Gly Ser Cys Lys Ile Pro Ile Val Ser Val Ala
500 505 510
Ser Leu Asn Asp Met Thr Pro Val Gly Arg Leu Val Thr Val Asn Pro
515 520 525
Phe Val Ala Thr Ser Ser Ala Asn Ser Lys Val Leu Val Glu Met Glu
530 535 540
Pro Pro Phe Gly Asp Ser Tyr Ile Val Val Gly Arg Gly Asp Lys Gln
545 550 555 560
Ile Asn His His Trp His Lys Ala Gly Arg Pro His Gly Gly Gly Ser
565 570 575
Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly Lys
580 585 590
Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu Leu
595 600 605
Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro Ala
610 615 620
Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp Leu
625 630 635 640
Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val Pro
645 650 655
Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln Val
660 665 670
Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser Tyr
675 680 685
Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala Val
690 695 700
Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys His
705 710 715 720
Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly Leu
725 730 735
Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly Lys
740 745 750
Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Glu His
755 760 765
His His His His His
770
<210> 52
<211> 1020
<212> DNA
<213> artificial
<220>
<223> DNA Sequence encoding the fusion protein BiPlike-SNAPlike-EDIII
from Japanese encephalitis virus genotype I cloned into
pMT/BiP/SNAP for expression in S2 cells
<400> 52
atgaaactat gtattctact tgcagttgtt gcgttcgtag gattgtcctt aagatctgac 60
aaagactgcg aaatgaaaag aactacattg gattcaccac ttgggaagtt ggaactgagt 120
ggatgcgagc aaggattgca tgaaattaag ctactgggaa aaggaacttc tgctgctgat 180
gcagttgaag ttccagcacc agcagctgtt cttggaggtc ctgagcccct catgcaagcc 240
acagcctggc ttaacgcata tttccaccag cctgaggcca ttgaggaatt tccagtcccc 300
gcccttcacc atcctgtgtt tcagcaggag agcttcaccc gccaggtcct gtggaaattg 360
ctgaaggtgg tcaagtttgg tgaagtgatt tcatatcagc aacttgctgc attggccggt 420
aaccccgcag ctacagctgc cgtgaaaact gctctcagcg gaaatcctgt gcccatcctg 480
atcccttgtc acagagtcgt ttcatcttcc ggagctgtag gtggctatga aggaggactg 540
gcagttaagg agtggctgct ggctcatgaa ggtcatagac ttggaaagcc tgggctgggt 600
cctgctggta taggcgcgcc agggtccctg gagggaggtg gcgggtctgc tctgaagggc 660
acgacttacg gcatgtgtac agaaaaattc tcgttcgcga aaaatccagc ggacacaggc 720
catggaacag ttgtcattga gctcacatac tctggaagcg atggtccctg taaaattccg 780
attgtctcag tcgcgagttt aaacgacatg acccctgtgg ggaggctggt aacagtaaac 840
cccttcgtcg cgacatctag ctccaactca aaggtgctgg ttgagatgga acctcccttc 900
ggagactctt acatcgtggt tggaagaggg gataagcaga ttaaccatca ctggcacaaa 960
gctggaagca cgctgggtaa aggaggtggc catcaccatc accatcactg atgaccggtt 1020
<210> 53
<211> 319
<212> PRT
<213> artificial
<220>
<223> Amino acid Sequence of the fusion protein SNAPlike-EDIII from
Japanese encephalitis virus genotype I - Histag
<400> 53
Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro
1 5 10 15
Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile
20 25 30
Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro
35 40 45
Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr
50 55 60
Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe
65 70 75 80
Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr
85 90 95
Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val
100 105 110
Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr
115 120 125
Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile
130 135 140
Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu
145 150 155 160
Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg
165 170 175
Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser
180 185 190
Leu Glu Gly Gly Gly Gly Ser Ala Leu Lys Gly Thr Thr Tyr Gly Met
195 200 205
Cys Thr Glu Lys Phe Ser Phe Ala Lys Asn Pro Ala Asp Thr Gly His
210 215 220
Gly Thr Val Val Ile Glu Leu Thr Tyr Ser Gly Ser Asp Gly Pro Cys
225 230 235 240
Lys Ile Pro Ile Val Ser Val Ala Ser Leu Asn Asp Met Thr Pro Val
245 250 255
Gly Arg Leu Val Thr Val Asn Pro Phe Val Ala Thr Ser Ser Ser Asn
260 265 270
Ser Lys Val Leu Val Glu Met Glu Pro Pro Phe Gly Asp Ser Tyr Ile
275 280 285
Val Val Gly Arg Gly Asp Lys Gln Ile Asn His His Trp His Lys Ala
290 295 300
Gly Ser Thr Leu Gly Lys Gly Gly Gly His His His His His His
305 310 315
<210> 54
<211> 406
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding Domain III of envelope E protein from
Japanese encephalitis virus of genotype 1 (JE-1.EDIII)
<400> 54
gcgcgccagg gtccctggag ggaggtggcg ggtctgctct gaagggcacg acttacggca 60
tgtgtacaga aaaattctcg ttcgcgaaaa atccagcgga cacaggccat ggaacagttg 120
tcattgagct cacatactct ggaagcgatg gtccctgtaa aattccgatt gtctcagtcg 180
cgagtttaaa cgacatgacc cctgtgggga ggctggtaac agtaaacccc ttcgtcgcga 240
catctagctc caactcaaag gtgctggttg agatggaacc tcccttcgga gactcttaca 300
tcgtggttgg aagaggggat aagcagatta accatcactg gcacaaagct ggaagcacgc 360
tgggtaaagg aggtggccat caccatcacc atcactgatg accggt 406
<210> 55
<211> 406
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding Domain III of envelope E protein from
Japanese encephalitis virus of genotype 2 (JE-2.EDIII)
<400> 55
gcgcgccagg gtccctggag ggaggtggcg ggtctgctct gaaaggcaca acctatggta 60
tgtgcacaga aaactcctcg ttccgaaaaa atccagcgga cacaggccat ggaacagttg 120
tcattgagct cacatactct gggagtgatg gtccctgtaa gattccaaat gtctccgttg 180
cgagcctgaa tgacatgacc cctgtaggga ggctggtaac agtaaacccc tttgtcgcga 240
catccagcgc caactcaaaa gtgctggttg aaatggaacc cccttttgga gattcttaca 300
tcgtggtcgg aagaggtgac aagcagatca atcatcactg gcacaaagct ggaagcacgc 360
tgggcaaagg aggtggccat caccatcacc atcactgatg accggt 406
<210> 56
<211> 406
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding Domain III of envelope E protein from
Japanese encephalitis virus of genotype 4 (JE-4.EDIII)
<400> 56
gcgcgccagg gtccctggag ggaggtggcg ggtctgctct gaaaggcaca acctatggaa 60
tgtgcacaga aaagttctcg tttgcaaaga atccagcaga cactggtcat ggaacagttg 120
tcattgaact cctgtattct ggaagtgacg gcccctgtaa catcccaatt gtctcagtgg 180
tcagtctaaa cgacatgact ccagttggaa ggttggtgac agtgaacccc ttcgttgcca 240
catccagttc caattcaaag gtcttagttg agatggaacc tccttttgga gactcctaca 300
ttgtggtcgg gagaggagaa aaacaaatca accaccactg gcacaaacct ggaagcacat 360
tgggcaaagg aggtggccat caccatcacc atcactgatg accggt 406
<210> 57
<211> 406
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding Domain III of envelope E protein from
Japanese encephalitis virus of genotype 5 (JE-5.EDIII)
<400> 57
gcgcgccagg gtccctggag ggaggtggcg ggtctgcgtt gaaagggacc acctatggta 60
tgtgcacaga gaagttctct ttttccaaga atccagctga cactggtcat ggtacggttg 120
tcatagaatt gcagtacacc ggcactgacg gaccttgcaa gatacccatc tcttcggtgg 180
ccagtctgaa tgatttaact ccagttggta gattggtgac agtcaatcct tttgttgcca 240
catccaccgc caattcgaag gttttggtag aattggaacc accatttgga gattcattca 300
ttgttgtcgg aagaggagat aagcagatca atcaccattg gcacaaggct ggcagttcac 360
tgggaaaggg aggtggccat caccatcacc atcactgatg accggt 406
<210> 58
<211> 394
<212> DNA
<213> artificial
<220>
<223> DNA sequence of Domain III encoding envelope E protein from
Rabensburg virus (RabV.EDIII)
<400> 58
gcgcgccagg aggtggcggg tctcagctca aaggaacgac ctatggagta tgcgcaaaag 60
ccttcaagtt ttctgggaat ccagctgaca cagggcatgg caccgtggtc ttagagttgc 120
aatacaccgg aaccgatggt ccttgtaagg tgcctgtctc ttccgtggct tcactcaacg 180
acctaactcc cgttgggaga ctggtgacag tgaatccctt tgttgctgca gctactgcta 240
attcaaaggt tctgatagaa ctggaacctc cattcggtga ctcatacatt gtggtaggta 300
gaggagaaca ccagataaac caccattggc acaagtctgg aagcagtatt ggaaagggag 360
gtggccatca ccatcaccat cactgatgac cggt 394
<210> 59
<211> 1020
<212> DNA
<213> artificial
<220>
<223> DNA Sequence encoding the fusion protein BiPlike -SNAPlike-EDIII
from Japanese encephalitis virus genotype 2 cloned into
pMT/BiP/SNAP for expression in S2 cells
<400> 59
atgaaactat gtattctact tgcagttgtt gcgttcgtag gattgtcctt aagatctgac 60
aaagactgcg aaatgaaaag aactacattg gattcaccac ttgggaagtt ggaactgagt 120
ggatgcgagc aaggattgca tgaaattaag ctactgggaa aaggaacttc tgctgctgat 180
gcagttgaag ttccagcacc agcagctgtt cttggaggtc ctgagcccct catgcaagcc 240
acagcctggc ttaacgcata tttccaccag cctgaggcca ttgaggaatt tccagtcccc 300
gcccttcacc atcctgtgtt tcagcaggag agcttcaccc gccaggtcct gtggaaattg 360
ctgaaggtgg tcaagtttgg tgaagtgatt tcatatcagc aacttgctgc attggccggt 420
aaccccgcag ctacagctgc cgtgaaaact gctctcagcg gaaatcctgt gcccatcctg 480
atcccttgtc acagagtcgt ttcatcttcc ggagctgtag gtggctatga aggaggactg 540
gcagttaagg agtggctgct ggctcatgaa ggtcatagac ttggaaagcc tgggctgggt 600
cctgctggta taggcgcgcc agggtccctg gagggaggtg gcgggtctgc tctgaaaggc 660
acaacctatg gtatgtgcac agaaaactcc tcgttccgaa aaaatccagc ggacacaggc 720
catggaacag ttgtcattga gctcacatac tctgggagtg atggtccctg taagattcca 780
aatgtctccg ttgcgagcct gaatgacatg acccctgtag ggaggctggt aacagtaaac 840
ccctttgtcg cgacatccag cgccaactca aaagtgctgg ttgaaatgga accccctttt 900
ggagattctt acatcgtggt cggaagaggt gacaagcaga tcaatcatca ctggcacaaa 960
gctggaagca cgctgggcaa aggaggtggc catcaccatc accatcactg atgaccggtt 1020
<210> 60
<211> 319
<212> PRT
<213> artificial
<220>
<223> Amino acid Sequence of the fusion protein SNAPlike-EDIII from
Japanese encephalitis virus genotype 2 - Histag
<400> 60
Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro
1 5 10 15
Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile
20 25 30
Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro
35 40 45
Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr
50 55 60
Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe
65 70 75 80
Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr
85 90 95
Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val
100 105 110
Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr
115 120 125
Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile
130 135 140
Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu
145 150 155 160
Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg
165 170 175
Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser
180 185 190
Leu Glu Gly Gly Gly Gly Ser Ala Leu Lys Gly Thr Thr Tyr Gly Met
195 200 205
Cys Thr Glu Asn Ser Ser Phe Arg Lys Asn Pro Ala Asp Thr Gly His
210 215 220
Gly Thr Val Val Ile Glu Leu Thr Tyr Ser Gly Ser Asp Gly Pro Cys
225 230 235 240
Lys Ile Pro Asn Val Ser Val Ala Ser Leu Asn Asp Met Thr Pro Val
245 250 255
Gly Arg Leu Val Thr Val Asn Pro Phe Val Ala Thr Ser Ser Ala Asn
260 265 270
Ser Lys Val Leu Val Glu Met Glu Pro Pro Phe Gly Asp Ser Tyr Ile
275 280 285
Val Val Gly Arg Gly Asp Lys Gln Ile Asn His His Trp His Lys Ala
290 295 300
Gly Ser Thr Leu Gly Lys Gly Gly Gly His His His His His His
305 310 315
<210> 61
<211> 1020
<212> DNA
<213> artificial
<220>
<223> DNA Sequence encoding the fusion protein BiPlike -SNAPlike-EDIII
from Japanese encephalitis virus genotype 4 cloned into
pMT/BiP/SNAP for expression in S2 cells
<400> 61
atgaaactat gtattctact tgcagttgtt gcgttcgtag gattgtcctt aagatctgac 60
aaagactgcg aaatgaaaag aactacattg gattcaccac ttgggaagtt ggaactgagt 120
ggatgcgagc aaggattgca tgaaattaag ctactgggaa aaggaacttc tgctgctgat 180
gcagttgaag ttccagcacc agcagctgtt cttggaggtc ctgagcccct catgcaagcc 240
acagcctggc ttaacgcata tttccaccag cctgaggcca ttgaggaatt tccagtcccc 300
gcccttcacc atcctgtgtt tcagcaggag agcttcaccc gccaggtcct gtggaaattg 360
ctgaaggtgg tcaagtttgg tgaagtgatt tcatatcagc aacttgctgc attggccggt 420
aaccccgcag ctacagctgc cgtgaaaact gctctcagcg gaaatcctgt gcccatcctg 480
atcccttgtc acagagtcgt ttcatcttcc ggagctgtag gtggctatga aggaggactg 540
gcagttaagg agtggctgct ggctcatgaa ggtcatagac ttggaaagcc tgggctgggt 600
cctgctggta taggcgcgcc agggtccctg gagggaggtg gcgggtctgc tctgaaaggc 660
acaacctatg gaatgtgcac agaaaagttc tcgtttgcaa agaatccagc agacactggt 720
catggaacag ttgtcattga actcctgtat tctggaagtg acggcccctg taacatccca 780
attgtctcag tggtcagtct aaacgacatg actccagttg gaaggttggt gacagtgaac 840
cccttcgttg ccacatccag ttccaattca aaggtcttag ttgagatgga acctcctttt 900
ggagactcct acattgtggt cgggagagga gaaaaacaaa tcaaccacca ctggcacaaa 960
cctggaagca cattgggcaa aggaggtggc catcaccatc accatcactg atgaccggtt 1020
<210> 62
<211> 319
<212> PRT
<213> artificial
<220>
<223> Amino acid Sequence of the fusion protein SNAPlike-EDIII from
Japanese encephalitis virus genotype 4 - Histag
<400> 62
Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro
1 5 10 15
Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile
20 25 30
Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro
35 40 45
Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr
50 55 60
Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe
65 70 75 80
Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr
85 90 95
Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val
100 105 110
Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr
115 120 125
Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile
130 135 140
Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu
145 150 155 160
Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg
165 170 175
Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser
180 185 190
Leu Glu Gly Gly Gly Gly Ser Ala Leu Lys Gly Thr Thr Tyr Gly Met
195 200 205
Cys Thr Glu Lys Phe Ser Phe Ala Lys Asn Pro Ala Asp Thr Gly His
210 215 220
Gly Thr Val Val Ile Glu Leu Leu Tyr Ser Gly Ser Asp Gly Pro Cys
225 230 235 240
Asn Ile Pro Ile Val Ser Val Val Ser Leu Asn Asp Met Thr Pro Val
245 250 255
Gly Arg Leu Val Thr Val Asn Pro Phe Val Ala Thr Ser Ser Ser Asn
260 265 270
Ser Lys Val Leu Val Glu Met Glu Pro Pro Phe Gly Asp Ser Tyr Ile
275 280 285
Val Val Gly Arg Gly Glu Lys Gln Ile Asn His His Trp His Lys Pro
290 295 300
Gly Ser Thr Leu Gly Lys Gly Gly Gly His His His His His His
305 310 315
<210> 63
<211> 1020
<212> DNA
<213> artificial
<220>
<223> DNA Sequence encoding the fusion protein BiPlike -SNAPlike-EDIII
from Japanese encephalitis virus genotype 5 cloned into
pMT/BiP/SNAP for expression in S2 cells
<400> 63
atgaaactat gtattctact tgcagttgtt gcgttcgtag gattgtcctt aagatctgac 60
aaagactgcg aaatgaaaag aactacattg gattcaccac ttgggaagtt ggaactgagt 120
ggatgcgagc aaggattgca tgaaattaag ctactgggaa aaggaacttc tgctgctgat 180
gcagttgaag ttccagcacc agcagctgtt cttggaggtc ctgagcccct catgcaagcc 240
acagcctggc ttaacgcata tttccaccag cctgaggcca ttgaggaatt tccagtcccc 300
gcccttcacc atcctgtgtt tcagcaggag agcttcaccc gccaggtcct gtggaaattg 360
ctgaaggtgg tcaagtttgg tgaagtgatt tcatatcagc aacttgctgc attggccggt 420
aaccccgcag ctacagctgc cgtgaaaact gctctcagcg gaaatcctgt gcccatcctg 480
atcccttgtc acagagtcgt ttcatcttcc ggagctgtag gtggctatga aggaggactg 540
gcagttaagg agtggctgct ggctcatgaa ggtcatagac ttggaaagcc tgggctgggt 600
cctgctggta taggcgcgcc agggtccctg gagggaggtg gcgggtctgc gttgaaaggg 660
accacctatg gtatgtgcac agagaagttc tctttttcca agaatccagc tgacactggt 720
catggtacgg ttgtcataga attgcagtac accggcactg acggaccttg caagataccc 780
atctcttcgg tggccagtct gaatgattta actccagttg gtagattggt gacagtcaat 840
ccttttgttg ccacatccac cgccaattcg aaggttttgg tagaattgga accaccattt 900
ggagattcat tcattgttgt cggaagagga gataagcaga tcaatcacca ttggcacaag 960
gctggcagtt cactgggaaa gggaggtggc catcaccatc accatcactg atgaccggtt 1020
<210> 64
<211> 319
<212> PRT
<213> artificial
<220>
<223> Amino acid Sequence of the fusion protein SNAPlike-EDIII from
Japanese encephalitis virus genotype 5 - Histag
<400> 64
Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro
1 5 10 15
Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile
20 25 30
Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro
35 40 45
Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr
50 55 60
Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe
65 70 75 80
Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr
85 90 95
Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val
100 105 110
Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr
115 120 125
Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile
130 135 140
Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu
145 150 155 160
Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg
165 170 175
Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser
180 185 190
Leu Glu Gly Gly Gly Gly Ser Ala Leu Lys Gly Thr Thr Tyr Gly Met
195 200 205
Cys Thr Glu Lys Phe Ser Phe Ser Lys Asn Pro Ala Asp Thr Gly His
210 215 220
Gly Thr Val Val Ile Glu Leu Gln Tyr Thr Gly Thr Asp Gly Pro Cys
225 230 235 240
Lys Ile Pro Ile Ser Ser Val Ala Ser Leu Asn Asp Leu Thr Pro Val
245 250 255
Gly Arg Leu Val Thr Val Asn Pro Phe Val Ala Thr Ser Thr Ala Asn
260 265 270
Ser Lys Val Leu Val Glu Leu Glu Pro Pro Phe Gly Asp Ser Phe Ile
275 280 285
Val Val Gly Arg Gly Asp Lys Gln Ile Asn His His Trp His Lys Ala
290 295 300
Gly Ser Ser Leu Gly Lys Gly Gly Gly His His His His His His
305 310 315
<210> 65
<211> 1008
<212> DNA
<213> artificial
<220>
<223> DNA Sequence encoding the fusion protein BiPlike -SNAPlike-EDIII
from Rabensburg virus cloned into pMT/BiP/SNAP for expression in
S2 cells
<400> 65
atgaaactat gtattctact tgcagttgtt gcgttcgtag gattgtcctt aagatctgac 60
aaagactgcg aaatgaaaag aactacattg gattcaccac ttgggaagtt ggaactgagt 120
ggatgcgagc aaggattgca tgaaattaag ctactgggaa aaggaacttc tgctgctgat 180
gcagttgaag ttccagcacc agcagctgtt cttggaggtc ctgagcccct catgcaagcc 240
acagcctggc ttaacgcata tttccaccag cctgaggcca ttgaggaatt tccagtcccc 300
gcccttcacc atcctgtgtt tcagcaggag agcttcaccc gccaggtcct gtggaaattg 360
ctgaaggtgg tcaagtttgg tgaagtgatt tcatatcagc aacttgctgc attggccggt 420
aaccccgcag ctacagctgc cgtgaaaact gctctcagcg gaaatcctgt gcccatcctg 480
atcccttgtc acagagtcgt ttcatcttcc ggagctgtag gtggctatga aggaggactg 540
gcagttaagg agtggctgct ggctcatgaa ggtcatagac ttggaaagcc tgggctgggt 600
cctgctggta taggcgcgcc aggaggtggc gggtctcagc tcaaaggaac gacctatgga 660
gtatgcgcaa aagccttcaa gttttctggg aatccagctg acacagggca tggcaccgtg 720
gtcttagagt tgcaatacac cggaaccgat ggtccttgta aggtgcctgt ctcttccgtg 780
gcttcactca acgacctaac tcccgttggg agactggtga cagtgaatcc ctttgttgct 840
gcagctactg ctaattcaaa ggttctgata gaactggaac ctccattcgg tgactcatac 900
attgtggtag gtagaggaga acaccagata aaccaccatt ggcacaagtc tggaagcagt 960
attggaaagg gaggtggcca tcaccatcac catcactgat gaccggtt 1008
<210> 66
<211> 314
<212> PRT
<213> artificial
<220>
<223> Amino acid Sequence of the fusion protein SNAPlike-EDIII from
Rabensburg virus - Histag
<400> 66
Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro
1 5 10 15
Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile
20 25 30
Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro
35 40 45
Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr
50 55 60
Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe
65 70 75 80
Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr
85 90 95
Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val
100 105 110
Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr
115 120 125
Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile
130 135 140
Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu
145 150 155 160
Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg
165 170 175
Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Gly
180 185 190
Gly Gly Ser Gln Leu Lys Gly Thr Thr Tyr Gly Val Cys Ala Lys Ala
195 200 205
Phe Lys Phe Ser Gly Asn Pro Ala Asp Thr Gly His Gly Thr Val Val
210 215 220
Leu Glu Leu Gln Tyr Thr Gly Thr Asp Gly Pro Cys Lys Val Pro Val
225 230 235 240
Ser Ser Val Ala Ser Leu Asn Asp Leu Thr Pro Val Gly Arg Leu Val
245 250 255
Thr Val Asn Pro Phe Val Ala Ala Ala Thr Ala Asn Ser Lys Val Leu
260 265 270
Ile Glu Leu Glu Pro Pro Phe Gly Asp Ser Tyr Ile Val Val Gly Arg
275 280 285
Gly Glu His Gln Ile Asn His His Trp His Lys Ser Gly Ser Ser Ile
290 295 300
Gly Lys Gly Gly Gly His His His His His
305 310
<210> 67
<211> 977
<212> DNA
<213> artificial
<220>
<223> DNA Sequence encoding the fusion protein ssBiP-SNAPlike-EDIII
from an insect flavivirus virus cloned into pMT/BiP/SNAP for
expression in S2 cells
<400> 67
atgaaactat gtattctact tgcagttgtt gcgttcgtag gattgtcctt aagatctgac 60
aaagactgcg aaatgaaaag aactacattg gattcaccac ttgggaagtt ggaactgagt 120
ggatgcgagc aaggattgca tgaaattaag ctactgggaa aaggaacttc tgctgctgat 180
gcagttgaag ttccagcacc agcagctgtt cttggaggtc ctgagcccct catgcaagcc 240
acagcctggc ttaacgcata tttccaccag cctgaggcca ttgaggaatt tccagtcccc 300
gcccttcacc atcctgtgtt tcagcaggag agcttcaccc gccaggtcct gtggaaattg 360
ctgaaggtgg tcaagtttgg tgaagtgatt tcatatcagc aacttgctgc attggccggt 420
aaccccgcag ctacagctgc cgtgaaaact gctctcagcg gaaatcctgt gcccatcctg 480
atcccttgtc acagagtcgt ttcatcttcc ggagctgtag gtggctatga aggaggactg 540
gcagttaagg agtggctgct ggctcatgaa ggtcatagac ttggaaagcc tgggctgggt 600
cctgctggta taggcgcgcc aggaggtggc ggggaagcgc agacagtgtt ctctcaatcc 660
ccttgggggt tcgaaggaat agcggagata acactaaaag aggcccaaaa gagcatttgt 720
tcactacctt tgtcttgtgt gggctgtagc ttgttgtctt ccaaggtcgt tttccttgag 780
acaacaacga aagctgccgt ccacgttgga tgtgggaatg gaacttctgt tctaacagtt 840
ggaactactc ctgtgagtat cgactgtgta gtaacgcccc tgtcgcaggt gtggaggctc 900
gtgtcgcacg tcaccggaag atacaccaaa cttgggtttg gaggtggcca tcaccatcac 960
catcactgat gaccggt 977
<210> 68
<211> 305
<212> PRT
<213> artificial
<220>
<223> Amino acid Sequence of the fusion protein SNAPlike-EDIII from a
insect flavivirus - Histag
<400> 68
Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro
1 5 10 15
Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile
20 25 30
Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro
35 40 45
Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr
50 55 60
Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe
65 70 75 80
Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr
85 90 95
Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val
100 105 110
Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr
115 120 125
Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile
130 135 140
Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu
145 150 155 160
Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg
165 170 175
Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Gly
180 185 190
Gly Gly Glu Ala Gln Thr Val Phe Ser Gln Ser Pro Trp Gly Phe Glu
195 200 205
Gly Ile Ala Glu Ile Thr Leu Lys Glu Ala Gln Lys Ser Ile Cys Ser
210 215 220
Leu Pro Leu Ser Cys Val Gly Cys Ser Leu Leu Ser Ser Lys Val Val
225 230 235 240
Phe Leu Glu Thr Thr Thr Lys Ala Ala Val His Val Gly Cys Gly Asn
245 250 255
Gly Thr Ser Val Leu Thr Val Gly Thr Thr Pro Val Ser Ile Asp Cys
260 265 270
Val Val Thr Pro Leu Ser Gln Val Trp Arg Leu Val Ser His Val Thr
275 280 285
Gly Arg Tyr Thr Lys Leu Gly Phe Gly Gly Gly His His His His His
290 295 300
His
305
<210> 69
<211> 1783
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding ssBiP-sE2 from Ross River virus strain
QML-1 -SNAPlike-Histag for expression in S2 cells
<400> 69
atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60
agtgtaacag agcacttcaa tgtgtataag gctactagac catacctagc acattgcgct 120
gattgcgggg acgggtactt ctgctatagc ccagttgcca tcgagaagat ccgagatgag 180
gcgtctgatg gcatgctcaa gatccaagtc tccgcccaaa taggtctgga caaggcaggc 240
acccacgccc acacgaagct ccgatatatg gctggtcacg atgttcagga atctaagaga 300
gattccttga gggtgtacac gtccgcagcg tgctccatac atgggacgat gggacacttc 360
atcgtcgcac actgtccacc aggcgactac ctcaaggttt cgttcgagga cgcagattcg 420
cacgtgaagg catgtaaggt ccaatacaag cacaatccat tgccggtggg tagagagaag 480
ttcgtggtta gaccacactt tggcgtagag ctgccatgca cctcatacca gctgacaacg 540
gctcccaccg acgaggagat tgacatgcat acaccgccag atataccgga tcgcaccctg 600
ctatcacaga cggcgggcaa cgtcaaaata acagcaggcg gcaggactat caggtacaat 660
tgtacctgcg gccgtgacaa cgtaggcact accagtactg acaagaccat caacacatgc 720
aagattgacc aatgccatgc tgccgtcacc agccatgaca aatggcaatt tacctctcca 780
tttgttccca gggctgatca gacagctagg aaaggcaagg tacacgttcc gttccctctg 840
actaacgtca cctgccgagt gccgttggct cgagcgccgg atgtcaccta tggtaagaag 900
gaggtgaccc tgagattaca cccagatcat ccgacactct tctcctatag gagtttagga 960
gccgaaccgc acccgtacga ggaatgggtt gacaagttct ctgagcgcat catcccagtg 1020
acggaagaag ggattgaata ccagtggggc aacaacccgc cggtccgcct gtgggcgcaa 1080
ctgacgaccg agggcaaacc ccatggatgg ccacatgaaa tcattcagta ctattatgga 1140
ctataccccg ccgccacgcg gccgcacggc ggaggtagca aagactgcga aatgaagcgc 1200
accaccctgg atagccctct gggcaagctg gaactgtctg ggtgcgaaca gggcctgcac 1260
gagatcaagc tgctgggcaa aggaacatct gccgccgacg ccgtggaagt gcctgcccca 1320
gccgccgtgc tgggcggacc agagccactg atgcaggcca ccgcctggct caacgcctac 1380
tttcaccagc ctgaggccat cgaggagttc cctgtgccag ccctgcacca cccagtgttc 1440
cagcaggaga gctttacccg ccaggtgctg tggaaactgc tgaaagtggt gaagttcgga 1500
gaggtcatca gctaccagca gctggccgcc ctggccggca atcccgccgc caccgccgcc 1560
gtgaaaaccg ccctgagcgg aaatcccgtg cccattctga tcccctgcca ccgggtggtg 1620
tctagctctg gcgccgtggg gggctacgag ggcgggctcg ccgtgaaaga gtggctgctg 1680
gcccacgagg gccacagact gggcaagcct gggctgggtc ctgcaggtat aggcgcgcca 1740
gggtccctgg agcatcatca tcatcatcat tgatgacggg ccc 1783
<210> 70
<211> 572
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of the fusion protein [sE2 from Ross River
virus strain QML-1 -SNAPlike-Histag]
<400> 70
Arg Ser Ser Val Thr Glu His Phe Asn Val Tyr Lys Ala Thr Arg Pro
1 5 10 15
Tyr Leu Ala His Cys Ala Asp Cys Gly Asp Gly Tyr Phe Cys Tyr Ser
20 25 30
Pro Val Ala Ile Glu Lys Ile Arg Asp Glu Ala Ser Asp Gly Met Leu
35 40 45
Lys Ile Gln Val Ser Ala Gln Ile Gly Leu Asp Lys Ala Gly Thr His
50 55 60
Ala His Thr Lys Leu Arg Tyr Met Ala Gly His Asp Val Gln Glu Ser
65 70 75 80
Lys Arg Asp Ser Leu Arg Val Tyr Thr Ser Ala Ala Cys Ser Ile His
85 90 95
Gly Thr Met Gly His Phe Ile Val Ala His Cys Pro Pro Gly Asp Tyr
100 105 110
Leu Lys Val Ser Phe Glu Asp Ala Asp Ser His Val Lys Ala Cys Lys
115 120 125
Val Gln Tyr Lys His Asn Pro Leu Pro Val Gly Arg Glu Lys Phe Val
130 135 140
Val Arg Pro His Phe Gly Val Glu Leu Pro Cys Thr Ser Tyr Gln Leu
145 150 155 160
Thr Thr Ala Pro Thr Asp Glu Glu Ile Asp Met His Thr Pro Pro Asp
165 170 175
Ile Pro Asp Arg Thr Leu Leu Ser Gln Thr Ala Gly Asn Val Lys Ile
180 185 190
Thr Ala Gly Gly Arg Thr Ile Arg Tyr Asn Cys Thr Cys Gly Arg Asp
195 200 205
Asn Val Gly Thr Thr Ser Thr Asp Lys Thr Ile Asn Thr Cys Lys Ile
210 215 220
Asp Gln Cys His Ala Ala Val Thr Ser His Asp Lys Trp Gln Phe Thr
225 230 235 240
Ser Pro Phe Val Pro Arg Ala Asp Gln Thr Ala Arg Lys Gly Lys Val
245 250 255
His Val Pro Phe Pro Leu Thr Asn Val Thr Cys Arg Val Pro Leu Ala
260 265 270
Arg Ala Pro Asp Val Thr Tyr Gly Lys Lys Glu Val Thr Leu Arg Leu
275 280 285
His Pro Asp His Pro Thr Leu Phe Ser Tyr Arg Ser Leu Gly Ala Glu
290 295 300
Pro His Pro Tyr Glu Glu Trp Val Asp Lys Phe Ser Glu Arg Ile Ile
305 310 315 320
Pro Val Thr Glu Glu Gly Ile Glu Tyr Gln Trp Gly Asn Asn Pro Pro
325 330 335
Val Arg Leu Trp Ala Gln Leu Thr Thr Glu Gly Lys Pro His Gly Trp
340 345 350
Pro His Glu Ile Ile Gln Tyr Tyr Tyr Gly Leu Tyr Pro Ala Ala Thr
355 360 365
Arg Pro His Gly Gly Gly Ser Lys Asp Cys Glu Met Lys Arg Thr Thr
370 375 380
Leu Asp Ser Pro Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly
385 390 395 400
Leu His Glu Ile Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala
405 410 415
Val Glu Val Pro Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu
420 425 430
Met Gln Ala Thr Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala
435 440 445
Ile Glu Glu Phe Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln
450 455 460
Glu Ser Phe Thr Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys
465 470 475 480
Phe Gly Glu Val Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn
485 490 495
Pro Ala Ala Thr Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val
500 505 510
Pro Ile Leu Ile Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val
515 520 525
Gly Gly Tyr Glu Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His
530 535 540
Glu Gly His Arg Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly
545 550 555 560
Ala Pro Gly Ser Leu Glu His His His His His His
565 570
<210> 71
<211> 1783
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding ssBiP-sE2 from Mayaro virus strain IQD2668
-SNAPlike-Histag for expression in S2 cells
<400> 71
atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60
agtgtaacag agcacttcaa tgtgtataag gctactagac catacctagc acattgcgct 120
gattgcgggg acgggtactt ctgctatagc ccagttgcca tcgagaagat ccgagatgag 180
gcgtctgatg gcatgctcaa gatccaagtc tccgcccaaa taggtctgga caaggcaggc 240
acccacgccc acacgaagct ccgatatatg gctggtcacg atgttcagga atctaagaga 300
gattccttga gggtgtacac gtccgcagcg tgctccatac atgggacgat gggacacttc 360
atcgtcgcac actgtccacc aggcgactac ctcaaggttt cgttcgagga cgcagattcg 420
cacgtgaagg catgtaaggt ccaatacaag cacaatccat tgccggtggg tagagagaag 480
ttcgtggtta gaccacactt tggcgtagag ctgccatgca cctcatacca gctgacaacg 540
gctcccaccg acgaggagat tgacatgcat acaccgccag atataccgga tcgcaccctg 600
ctatcacaga cggcgggcaa cgtcaaaata acagcaggcg gcaggactat caggtacaat 660
tgtacctgcg gccgtgacaa cgtaggcact accagtactg acaagaccat caacacatgc 720
aagattgacc aatgccatgc tgccgtcacc agccatgaca aatggcaatt tacctctcca 780
tttgttccca gggctgatca gacagctagg aaaggcaagg tacacgttcc gttccctctg 840
actaacgtca cctgccgagt gccgttggct cgagcgccgg atgtcaccta tggtaagaag 900
gaggtgaccc tgagattaca cccagatcat ccgacactct tctcctatag gagtttagga 960
gccgaaccgc acccgtacga ggaatgggtt gacaagttct ctgagcgcat catcccagtg 1020
acggaagaag ggattgaata ccagtggggc aacaacccgc cggtccgcct gtgggcgcaa 1080
ctgacgaccg agggcaaacc ccatggatgg ccacatgaaa tcattcagta ctattatgga 1140
ctataccccg ccgccacgcg gccgcacggc ggaggtagca aagactgcga aatgaagcgc 1200
accaccctgg atagccctct gggcaagctg gaactgtctg ggtgcgaaca gggcctgcac 1260
gagatcaagc tgctgggcaa aggaacatct gccgccgacg ccgtggaagt gcctgcccca 1320
gccgccgtgc tgggcggacc agagccactg atgcaggcca ccgcctggct caacgcctac 1380
tttcaccagc ctgaggccat cgaggagttc cctgtgccag ccctgcacca cccagtgttc 1440
cagcaggaga gctttacccg ccaggtgctg tggaaactgc tgaaagtggt gaagttcgga 1500
gaggtcatca gctaccagca gctggccgcc ctggccggca atcccgccgc caccgccgcc 1560
gtgaaaaccg ccctgagcgg aaatcccgtg cccattctga tcccctgcca ccgggtggtg 1620
tctagctctg gcgccgtggg gggctacgag ggcgggctcg ccgtgaaaga gtggctgctg 1680
gcccacgagg gccacagact gggcaagcct gggctgggtc ctgcaggtat aggcgcgcca 1740
gggtccctgg agcatcatca tcatcatcat tgatgacggg ccc 1783
<210> 72
<211> 572
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of the fusion protein [sE2 from Mayaro virus
strain IQD2668 -SNAPlike-Histag]
<400> 72
Arg Ser Ser Val Thr Glu His Phe Asn Val Tyr Lys Ala Thr Arg Pro
1 5 10 15
Tyr Leu Ala His Cys Ala Asp Cys Gly Asp Gly Tyr Phe Cys Tyr Ser
20 25 30
Pro Val Ala Ile Glu Lys Ile Arg Asp Glu Ala Ser Asp Gly Met Leu
35 40 45
Lys Ile Gln Val Ser Ala Gln Ile Gly Leu Asp Lys Ala Gly Thr His
50 55 60
Ala His Thr Lys Leu Arg Tyr Met Ala Gly His Asp Val Gln Glu Ser
65 70 75 80
Lys Arg Asp Ser Leu Arg Val Tyr Thr Ser Ala Ala Cys Ser Ile His
85 90 95
Gly Thr Met Gly His Phe Ile Val Ala His Cys Pro Pro Gly Asp Tyr
100 105 110
Leu Lys Val Ser Phe Glu Asp Ala Asp Ser His Val Lys Ala Cys Lys
115 120 125
Val Gln Tyr Lys His Asn Pro Leu Pro Val Gly Arg Glu Lys Phe Val
130 135 140
Val Arg Pro His Phe Gly Val Glu Leu Pro Cys Thr Ser Tyr Gln Leu
145 150 155 160
Thr Thr Ala Pro Thr Asp Glu Glu Ile Asp Met His Thr Pro Pro Asp
165 170 175
Ile Pro Asp Arg Thr Leu Leu Ser Gln Thr Ala Gly Asn Val Lys Ile
180 185 190
Thr Ala Gly Gly Arg Thr Ile Arg Tyr Asn Cys Thr Cys Gly Arg Asp
195 200 205
Asn Val Gly Thr Thr Ser Thr Asp Lys Thr Ile Asn Thr Cys Lys Ile
210 215 220
Asp Gln Cys His Ala Ala Val Thr Ser His Asp Lys Trp Gln Phe Thr
225 230 235 240
Ser Pro Phe Val Pro Arg Ala Asp Gln Thr Ala Arg Lys Gly Lys Val
245 250 255
His Val Pro Phe Pro Leu Thr Asn Val Thr Cys Arg Val Pro Leu Ala
260 265 270
Arg Ala Pro Asp Val Thr Tyr Gly Lys Lys Glu Val Thr Leu Arg Leu
275 280 285
His Pro Asp His Pro Thr Leu Phe Ser Tyr Arg Ser Leu Gly Ala Glu
290 295 300
Pro His Pro Tyr Glu Glu Trp Val Asp Lys Phe Ser Glu Arg Ile Ile
305 310 315 320
Pro Val Thr Glu Glu Gly Ile Glu Tyr Gln Trp Gly Asn Asn Pro Pro
325 330 335
Val Arg Leu Trp Ala Gln Leu Thr Thr Glu Gly Lys Pro His Gly Trp
340 345 350
Pro His Glu Ile Ile Gln Tyr Tyr Tyr Gly Leu Tyr Pro Ala Ala Thr
355 360 365
Arg Pro His Gly Gly Gly Ser Lys Asp Cys Glu Met Lys Arg Thr Thr
370 375 380
Leu Asp Ser Pro Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly
385 390 395 400
Leu His Glu Ile Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala
405 410 415
Val Glu Val Pro Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu
420 425 430
Met Gln Ala Thr Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala
435 440 445
Ile Glu Glu Phe Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln
450 455 460
Glu Ser Phe Thr Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys
465 470 475 480
Phe Gly Glu Val Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn
485 490 495
Pro Ala Ala Thr Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val
500 505 510
Pro Ile Leu Ile Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val
515 520 525
Gly Gly Tyr Glu Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His
530 535 540
Glu Gly His Arg Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly
545 550 555 560
Ala Pro Gly Ser Leu Glu His His His His His His
565 570
<210> 73
<211> 1786
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding ssBiP-sE2 from Western Equine Encephalitis
virus -SNAPlike-Histag for expression in S2 cells
<400> 73
atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60
agcattaccg atgacttcac actgaccagt ccctacctgg ggttctgccc gtattgcaga 120
cactcaacgc cgtgtttcag cccaataaaa attgagaacg tgtgggacga atctgatgat 180
ggatcgatta gaatccaggt ctcggcacaa ttcggctaca atcaggcagg cactgcggat 240
gtcaccaaat tccgttacat gtctttcgac cacgaccatg acatcaagga agacagtatg 300
gagaaaatag ctatcagcac atctggaccc tgccgtcgtc ttggccacaa agggtacttc 360
ctgttagctc aatgtcctcc aggtgacagt gtaaccgtca gtatcacgag cggagcatct 420
gagaattcat gcaccgtgga gaaaaagatc aggaggaagt ttgtcggtag agaggagtac 480
ttgttcccac ccgtccatgg aaagctggta aagtgccacg tttacgatca cttgaaggag 540
acgtctgccg ggtacataac catgcacagg ccaggcccac acgcgtataa gtcctatctg 600
gaggaagcgt caggcgaagt gtacattaaa ccaccttctg gcaagaacgt cacctacgaa 660
tgtaagtgtg gcgactacag cacaggtatc gtgagcacgc gaacgaagat gaacggctgc 720
actaaagcaa aacagtgcat tgcctacaag agcgaccaaa cgaaatgggt cttcaactcg 780
ccggatctta ttaggcacac agaccactca gtgcaaggta aattgcacat tccattccgc 840
ttgacaccga cagtctgccc ggttccgtta gctcacacgc ctacagtcac gaagtggttc 900
aaaggcatca ccctccacct gactgcaatg cgaccaacat tgctgacaac gagaaaattg 960
gggctgcgag cagacgcaac agcagaatgg attacagggt ctacatccag gaatttttct 1020
gtggggcgag aagggctgga gtacgtatgg ggtaaccatg aaccagtcag agtctgggcc 1080
caggagtcgg caccaggcga cccacatgga tggccgcatg agatcatcat ccactattat 1140
catcggcatc cagtctacac gcggccgcac ggcggaggta gcaaagactg cgaaatgaag 1200
cgcaccaccc tggatagccc tctgggcaag ctggaactgt ctgggtgcga acagggcctg 1260
cacgagatca agctgctggg caaaggaaca tctgccgccg acgccgtgga agtgcctgcc 1320
ccagccgccg tgctgggcgg accagagcca ctgatgcagg ccaccgcctg gctcaacgcc 1380
tactttcacc agcctgaggc catcgaggag ttccctgtgc cagccctgca ccacccagtg 1440
ttccagcagg agagctttac ccgccaggtg ctgtggaaac tgctgaaagt ggtgaagttc 1500
ggagaggtca tcagctacca gcagctggcc gccctggccg gcaatcccgc cgccaccgcc 1560
gccgtgaaaa ccgccctgag cggaaatccc gtgcccattc tgatcccctg ccaccgggtg 1620
gtgtctagct ctggcgccgt ggggggctac gagggcgggc tcgccgtgaa agagtggctg 1680
ctggcccacg agggccacag actgggcaag cctgggctgg gtcctgcagg tataggcgcg 1740
ccagggtccc tggagcatca tcatcatcat cattgatgac gggccc 1786
<210> 74
<211> 573
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of the fusion protein [sE2 from Western
Equine Encephalitis -SNAPlike-Histag]
<400> 74
Arg Ser Ser Ile Thr Asp Asp Phe Thr Leu Thr Ser Pro Tyr Leu Gly
1 5 10 15
Phe Cys Pro Tyr Cys Arg His Ser Thr Pro Cys Phe Ser Pro Ile Lys
20 25 30
Ile Glu Asn Val Trp Asp Glu Ser Asp Asp Gly Ser Ile Arg Ile Gln
35 40 45
Val Ser Ala Gln Phe Gly Tyr Asn Gln Ala Gly Thr Ala Asp Val Thr
50 55 60
Lys Phe Arg Tyr Met Ser Phe Asp His Asp His Asp Ile Lys Glu Asp
65 70 75 80
Ser Met Glu Lys Ile Ala Ile Ser Thr Ser Gly Pro Cys Arg Arg Leu
85 90 95
Gly His Lys Gly Tyr Phe Leu Leu Ala Gln Cys Pro Pro Gly Asp Ser
100 105 110
Val Thr Val Ser Ile Thr Ser Gly Ala Ser Glu Asn Ser Cys Thr Val
115 120 125
Glu Lys Lys Ile Arg Arg Lys Phe Val Gly Arg Glu Glu Tyr Leu Phe
130 135 140
Pro Pro Val His Gly Lys Leu Val Lys Cys His Val Tyr Asp His Leu
145 150 155 160
Lys Glu Thr Ser Ala Gly Tyr Ile Thr Met His Arg Pro Gly Pro His
165 170 175
Ala Tyr Lys Ser Tyr Leu Glu Glu Ala Ser Gly Glu Val Tyr Ile Lys
180 185 190
Pro Pro Ser Gly Lys Asn Val Thr Tyr Glu Cys Lys Cys Gly Asp Tyr
195 200 205
Ser Thr Gly Ile Val Ser Thr Arg Thr Lys Met Asn Gly Cys Thr Lys
210 215 220
Ala Lys Gln Cys Ile Ala Tyr Lys Ser Asp Gln Thr Lys Trp Val Phe
225 230 235 240
Asn Ser Pro Asp Leu Ile Arg His Thr Asp His Ser Val Gln Gly Lys
245 250 255
Leu His Ile Pro Phe Arg Leu Thr Pro Thr Val Cys Pro Val Pro Leu
260 265 270
Ala His Thr Pro Thr Val Thr Lys Trp Phe Lys Gly Ile Thr Leu His
275 280 285
Leu Thr Ala Met Arg Pro Thr Leu Leu Thr Thr Arg Lys Leu Gly Leu
290 295 300
Arg Ala Asp Ala Thr Ala Glu Trp Ile Thr Gly Ser Thr Ser Arg Asn
305 310 315 320
Phe Ser Val Gly Arg Glu Gly Leu Glu Tyr Val Trp Gly Asn His Glu
325 330 335
Pro Val Arg Val Trp Ala Gln Glu Ser Ala Pro Gly Asp Pro His Gly
340 345 350
Trp Pro His Glu Ile Ile Ile His Tyr Tyr His Arg His Pro Val Tyr
355 360 365
Thr Arg Pro His Gly Gly Gly Ser Lys Asp Cys Glu Met Lys Arg Thr
370 375 380
Thr Leu Asp Ser Pro Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln
385 390 395 400
Gly Leu His Glu Ile Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp
405 410 415
Ala Val Glu Val Pro Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro
420 425 430
Leu Met Gln Ala Thr Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu
435 440 445
Ala Ile Glu Glu Phe Pro Val Pro Ala Leu His His Pro Val Phe Gln
450 455 460
Gln Glu Ser Phe Thr Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val
465 470 475 480
Lys Phe Gly Glu Val Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly
485 490 495
Asn Pro Ala Ala Thr Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro
500 505 510
Val Pro Ile Leu Ile Pro Cys His Arg Val Val Ser Ser Ser Gly Ala
515 520 525
Val Gly Gly Tyr Glu Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala
530 535 540
His Glu Gly His Arg Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile
545 550 555 560
Gly Ala Pro Gly Ser Leu Glu His His His His His His
565 570
<210> 75
<211> 1786
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding ssBiP-sE2 from Eastern Equine Encephalitis
virus -SNAPlike-Histag for expression in S2 cells
<400> 75
atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60
gatttggaca ctcatttcac ccagtataag ttggcacgcc cgtatattgc tgattgccct 120
aactgtgggc atagtcggtg cgacagccct atagctatag aagaagtcag aggggatgcg 180
cacgcaggag tcatccgcat ccagacatca gctatgttcg gtctgaagac ggatggagtc 240
gatttggcct acatgagttt catgaacggc aaaacgcaga aatcaataaa gatcgacaac 300
ctgcatgtgc gcacctcagc cccttgttcc ctcgtgtcgc accacggcta ttacatcctg 360
gctcaatgcc caccagggga cacggttaca gttgggtttc acgacgggcc taaccgccat 420
acgtgcacag ttgcccataa ggtagaattc aggccagtgg gtagagagaa ataccgtcac 480
ccacctgaac atggagttga attaccgtgt aaccgttaca ctcacaagcg tgcagaccaa 540
ggacactatg ttgagatgca tcaacccggg ctagttgccg accactctct ccttagcatc 600
cacagtgcca aggtgaaaat tacggtaccg agcggcgccc aagtgaaata ctactgcaag 660
tgcccagatg tacgagaggg aattaccagc agcgaccata caaccacctg cacggatgtc 720
aaacaatgca gggcttacct gattgacaac aaaaaatggg tgtacaactc tggaagactg 780
cctcgaggag agggcgacac ttttaaagga aaacttcatg tgccctttgt gcctgttaag 840
gccaagtgca tcgccacgct ggcaccggag cctctagttg agcacaaaca ccgcaccctg 900
attttacacc tgcacccgga ccatccgacc ttgctgacga ccaggtcact tggaagtgat 960
gcaaatccaa ctcgacaatg gattgagcga ccaacaactg tcaatttcac agtcaccgga 1020
gaagggttgg agtatacctg gggaaaccat ccaccaaaaa gagtatgggc tcaagagtca 1080
ggagaaggga atccacatgg atggccgcac gaagtggtag tctattacta caacaggtac 1140
ccgttaacca caattatcgg gcggccgcac ggcggaggta gcaaagactg cgaaatgaag 1200
cgcaccaccc tggatagccc tctgggcaag ctggaactgt ctgggtgcga acagggcctg 1260
cacgagatca agctgctggg caaaggaaca tctgccgccg acgccgtgga agtgcctgcc 1320
ccagccgccg tgctgggcgg accagagcca ctgatgcagg ccaccgcctg gctcaacgcc 1380
tactttcacc agcctgaggc catcgaggag ttccctgtgc cagccctgca ccacccagtg 1440
ttccagcagg agagctttac ccgccaggtg ctgtggaaac tgctgaaagt ggtgaagttc 1500
ggagaggtca tcagctacca gcagctggcc gccctggccg gcaatcccgc cgccaccgcc 1560
gccgtgaaaa ccgccctgag cggaaatccc gtgcccattc tgatcccctg ccaccgggtg 1620
gtgtctagct ctggcgccgt ggggggctac gagggcgggc tcgccgtgaa agagtggctg 1680
ctggcccacg agggccacag actgggcaag cctgggctgg gtcctgcagg tataggcgcg 1740
ccagggtccc tggagcatca tcatcatcat cattgatgac gggccc 1786
<210> 76
<211> 573
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of the fusion protein [sE2 from Eastern
Equine Encephalitis -SNAPlike-Histag]
<400> 76
Arg Ser Asp Leu Asp Thr His Phe Thr Gln Tyr Lys Leu Ala Arg Pro
1 5 10 15
Tyr Ile Ala Asp Cys Pro Asn Cys Gly His Ser Arg Cys Asp Ser Pro
20 25 30
Ile Ala Ile Glu Glu Val Arg Gly Asp Ala His Ala Gly Val Ile Arg
35 40 45
Ile Gln Thr Ser Ala Met Phe Gly Leu Lys Thr Asp Gly Val Asp Leu
50 55 60
Ala Tyr Met Ser Phe Met Asn Gly Lys Thr Gln Lys Ser Ile Lys Ile
65 70 75 80
Asp Asn Leu His Val Arg Thr Ser Ala Pro Cys Ser Leu Val Ser His
85 90 95
His Gly Tyr Tyr Ile Leu Ala Gln Cys Pro Pro Gly Asp Thr Val Thr
100 105 110
Val Gly Phe His Asp Gly Pro Asn Arg His Thr Cys Thr Val Ala His
115 120 125
Lys Val Glu Phe Arg Pro Val Gly Arg Glu Lys Tyr Arg His Pro Pro
130 135 140
Glu His Gly Val Glu Leu Pro Cys Asn Arg Tyr Thr His Lys Arg Ala
145 150 155 160
Asp Gln Gly His Tyr Val Glu Met His Gln Pro Gly Leu Val Ala Asp
165 170 175
His Ser Leu Leu Ser Ile His Ser Ala Lys Val Lys Ile Thr Val Pro
180 185 190
Ser Gly Ala Gln Val Lys Tyr Tyr Cys Lys Cys Pro Asp Val Arg Glu
195 200 205
Gly Ile Thr Ser Ser Asp His Thr Thr Thr Cys Thr Asp Val Lys Gln
210 215 220
Cys Arg Ala Tyr Leu Ile Asp Asn Lys Lys Trp Val Tyr Asn Ser Gly
225 230 235 240
Arg Leu Pro Arg Gly Glu Gly Asp Thr Phe Lys Gly Lys Leu His Val
245 250 255
Pro Phe Val Pro Val Lys Ala Lys Cys Ile Ala Thr Leu Ala Pro Glu
260 265 270
Pro Leu Val Glu His Lys His Arg Thr Leu Ile Leu His Leu His Pro
275 280 285
Asp His Pro Thr Leu Leu Thr Thr Arg Ser Leu Gly Ser Asp Ala Asn
290 295 300
Pro Thr Arg Gln Trp Ile Glu Arg Pro Thr Thr Val Asn Phe Thr Val
305 310 315 320
Thr Gly Glu Gly Leu Glu Tyr Thr Trp Gly Asn His Pro Pro Lys Arg
325 330 335
Val Trp Ala Gln Glu Ser Gly Glu Gly Asn Pro His Gly Trp Pro His
340 345 350
Glu Val Val Val Tyr Tyr Tyr Asn Arg Tyr Pro Leu Thr Thr Ile Ile
355 360 365
Gly Arg Pro His Gly Gly Gly Ser Lys Asp Cys Glu Met Lys Arg Thr
370 375 380
Thr Leu Asp Ser Pro Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln
385 390 395 400
Gly Leu His Glu Ile Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp
405 410 415
Ala Val Glu Val Pro Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro
420 425 430
Leu Met Gln Ala Thr Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu
435 440 445
Ala Ile Glu Glu Phe Pro Val Pro Ala Leu His His Pro Val Phe Gln
450 455 460
Gln Glu Ser Phe Thr Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val
465 470 475 480
Lys Phe Gly Glu Val Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly
485 490 495
Asn Pro Ala Ala Thr Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro
500 505 510
Val Pro Ile Leu Ile Pro Cys His Arg Val Val Ser Ser Ser Gly Ala
515 520 525
Val Gly Gly Tyr Glu Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala
530 535 540
His Glu Gly His Arg Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile
545 550 555 560
Gly Ala Pro Gly Ser Leu Glu His His His His His His
565 570
<210> 77
<211> 1792
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding ssBiP-sE2 from Venezuelan Equine
Encephalitis virus -SNAPlike-Histag for expression in S2 cells
<400> 77
atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60
agatcttcta ccgaggagct gtttaaggag tataagctaa cgcgccctta catggccaga 120
tgcatcagat gtgccgttgg gagctgccat agtccaatag caattgaggc agtgaagagc 180
gacgggcacg acggctatgt tagacttcag acttcctcgc agtatggcct ggattcctct 240
ggcaacttaa agggaaggac tatgcggtat gatatgcacg ggaccattga agagatacca 300
ctacatcaag tgtcactcca cacatctcgc ccgtgtcaca ttgtggatgg gcatggttat 360
tttctgcttg ctaggtgccc ggcaggggac tccatcacca tggaatttaa gaaaggttca 420
gtcacacact cctgctcagt gccgtatgaa gtgaaattta atcctgtagg cagagaactc 480
tacactcatc caccagaaca cggagcagag caagcgtgcc aagtctacgc gcacgatgca 540
cagaacagag gagcttatgt cgagatgcac ctcccgggct cagaagtgga cagcagtttg 600
atttccttga gcggcagttc agtcaccgtg acacctcctg tcgggactag cgccttggtg 660
aaatgcaagt gcggcggcac aaagatctcc gaaaccatca acaaggcaaa acagttcagc 720
cagtgcacaa agaaggagca gtgcagagca tatcgactgc agaatgacaa gtgggtgtat 780
aattctgaca aactgcccaa agcagcggga gccaccctaa aaggaaaact acacgtcccg 840
ttcttgctgg cagacggcaa atgcaccgtg cctctagcac cggaacctat gataaccttc 900
ggtttccgat cagtgtcact gaaactgcac cctaagaatc ccacatatct gaccactcgc 960
caacttgctg atgagcctca ttacacgcac gagctcatat ctgaaccagc tgttaggaat 1020
tttaccgtca ctgaaaaggg gtgggagttt gtatggggaa accatccgcc gaaaaggttt 1080
tgggcacagg aaacagcacc cggaaatcca catgggctgc cacatgaggt gataactcat 1140
tattaccaca gataccctat gtccacgcgg ccgcacggcg gaggtagcaa agactgcgaa 1200
atgaagcgca ccaccctgga tagccctctg ggcaagctgg aactgtctgg gtgcgaacag 1260
ggcctgcacg agatcaagct gctgggcaaa ggaacatctg ccgccgacgc cgtggaagtg 1320
cctgccccag ccgccgtgct gggcggacca gagccactga tgcaggccac cgcctggctc 1380
aacgcctact ttcaccagcc tgaggccatc gaggagttcc ctgtgccagc cctgcaccac 1440
ccagtgttcc agcaggagag ctttacccgc caggtgctgt ggaaactgct gaaagtggtg 1500
aagttcggag aggtcatcag ctaccagcag ctggccgccc tggccggcaa tcccgccgcc 1560
accgccgccg tgaaaaccgc cctgagcgga aatcccgtgc ccattctgat cccctgccac 1620
cgggtggtgt ctagctctgg cgccgtgggg ggctacgagg gcgggctcgc cgtgaaagag 1680
tggctgctgg cccacgaggg ccacagactg ggcaagcctg ggctgggtcc tgcaggtata 1740
ggcgcgccag ggtccctgga gcatcatcat catcatcatt gatgacgggc cc 1792
<210> 78
<211> 575
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of the fusion protein [sE2 from Venezuelan
Equine Encephalitis -SNAPlike-Histag]
<400> 78
Arg Ser Arg Ser Ser Thr Glu Glu Leu Phe Lys Glu Tyr Lys Leu Thr
1 5 10 15
Arg Pro Tyr Met Ala Arg Cys Ile Arg Cys Ala Val Gly Ser Cys His
20 25 30
Ser Pro Ile Ala Ile Glu Ala Val Lys Ser Asp Gly His Asp Gly Tyr
35 40 45
Val Arg Leu Gln Thr Ser Ser Gln Tyr Gly Leu Asp Ser Ser Gly Asn
50 55 60
Leu Lys Gly Arg Thr Met Arg Tyr Asp Met His Gly Thr Ile Glu Glu
65 70 75 80
Ile Pro Leu His Gln Val Ser Leu His Thr Ser Arg Pro Cys His Ile
85 90 95
Val Asp Gly His Gly Tyr Phe Leu Leu Ala Arg Cys Pro Ala Gly Asp
100 105 110
Ser Ile Thr Met Glu Phe Lys Lys Gly Ser Val Thr His Ser Cys Ser
115 120 125
Val Pro Tyr Glu Val Lys Phe Asn Pro Val Gly Arg Glu Leu Tyr Thr
130 135 140
His Pro Pro Glu His Gly Ala Glu Gln Ala Cys Gln Val Tyr Ala His
145 150 155 160
Asp Ala Gln Asn Arg Gly Ala Tyr Val Glu Met His Leu Pro Gly Ser
165 170 175
Glu Val Asp Ser Ser Leu Ile Ser Leu Ser Gly Ser Ser Val Thr Val
180 185 190
Thr Pro Pro Val Gly Thr Ser Ala Leu Val Lys Cys Lys Cys Gly Gly
195 200 205
Thr Lys Ile Ser Glu Thr Ile Asn Lys Ala Lys Gln Phe Ser Gln Cys
210 215 220
Thr Lys Lys Glu Gln Cys Arg Ala Tyr Arg Leu Gln Asn Asp Lys Trp
225 230 235 240
Val Tyr Asn Ser Asp Lys Leu Pro Lys Ala Ala Gly Ala Thr Leu Lys
245 250 255
Gly Lys Leu His Val Pro Phe Leu Leu Ala Asp Gly Lys Cys Thr Val
260 265 270
Pro Leu Ala Pro Glu Pro Met Ile Thr Phe Gly Phe Arg Ser Val Ser
275 280 285
Leu Lys Leu His Pro Lys Asn Pro Thr Tyr Leu Thr Thr Arg Gln Leu
290 295 300
Ala Asp Glu Pro His Tyr Thr His Glu Leu Ile Ser Glu Pro Ala Val
305 310 315 320
Arg Asn Phe Thr Val Thr Glu Lys Gly Trp Glu Phe Val Trp Gly Asn
325 330 335
His Pro Pro Lys Arg Phe Trp Ala Gln Glu Thr Ala Pro Gly Asn Pro
340 345 350
His Gly Leu Pro His Glu Val Ile Thr His Tyr Tyr His Arg Tyr Pro
355 360 365
Met Ser Thr Arg Pro His Gly Gly Gly Ser Lys Asp Cys Glu Met Lys
370 375 380
Arg Thr Thr Leu Asp Ser Pro Leu Gly Lys Leu Glu Leu Ser Gly Cys
385 390 395 400
Glu Gln Gly Leu His Glu Ile Lys Leu Leu Gly Lys Gly Thr Ser Ala
405 410 415
Ala Asp Ala Val Glu Val Pro Ala Pro Ala Ala Val Leu Gly Gly Pro
420 425 430
Glu Pro Leu Met Gln Ala Thr Ala Trp Leu Asn Ala Tyr Phe His Gln
435 440 445
Pro Glu Ala Ile Glu Glu Phe Pro Val Pro Ala Leu His His Pro Val
450 455 460
Phe Gln Gln Glu Ser Phe Thr Arg Gln Val Leu Trp Lys Leu Leu Lys
465 470 475 480
Val Val Lys Phe Gly Glu Val Ile Ser Tyr Gln Gln Leu Ala Ala Leu
485 490 495
Ala Gly Asn Pro Ala Ala Thr Ala Ala Val Lys Thr Ala Leu Ser Gly
500 505 510
Asn Pro Val Pro Ile Leu Ile Pro Cys His Arg Val Val Ser Ser Ser
515 520 525
Gly Ala Val Gly Gly Tyr Glu Gly Gly Leu Ala Val Lys Glu Trp Leu
530 535 540
Leu Ala His Glu Gly His Arg Leu Gly Lys Pro Gly Leu Gly Pro Ala
545 550 555 560
Gly Ile Gly Ala Pro Gly Ser Leu Glu His His His His His His
565 570 575
<210> 79
<211> 1442
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding ssBiP- SNAPlike-Akabane N protein-proTEV
cleavage site-Histag for expression in S2 cells
<400> 79
atgaagttat gcatattact ggccgtcgtg gtggcctttg ttggcctctc gctcgggaga 60
tctgacaaag actgcgaaat gaaaagaact acattggatt caccacttgg gaagttggaa 120
ctgagtggat gcgagcaagg attgcatgaa attaagctac tgggaaaagg aacttctgct 180
gctgatgcag ttgaagttcc agcaccagca gctgttcttg gaggtcctga gcccctcatg 240
caagccacag cctggcttaa cgcatatttc caccagcctg aggccattga ggaatttcca 300
gtccccgccc ttcaccatcc tgtgtttcag caggagagct tcacccgcca ggtcctgtgg 360
aaattgctga aggtggtcaa gtttggtgaa gtgatttcat atcagcaact tgctgcattg 420
gccggtaacc ccgcagctac agctgccgtg aaaactgctc tcagcggaaa tcctgtgccc 480
atcctgatcc cttgtcacag agtcgtttca tcttccggag ctgtaggtgg ctatgaagga 540
ggactggcag ttaaggagtg gctgctggct catgaaggtc atagacttgg aaagcctggg 600
ctgggtcctg ctggtatagg cgcgccaggg tccctaggtg gcggatccga aaacctgtac 660
ttccagagcg atatcgcaaa tcaatttatt ttcaacgatg ttccacaacg gaatgcagct 720
acatttaatc cggatgcagg gtatgtggca tttatcagta agtatgggca gcagctcaac 780
tttactgttg ctagagtctt cttcctcaac cagaagaagg ccaagatggt cttacataag 840
acgccacaac caagtgtcga tcttactttt gcaggggtca aatttacagt ggttaataac 900
cattttcccc agtatactgc aaatccggtg tcagacactg cctttacgct ccatcgcatc 960
tcgggctact tagctcgatg ggttgctgag cagtgcaagg ctaatcagat caaacttgca 1020
gaggcagctg ctacaatcgt aatgccgctg gctgaagtga agggctgcac ctggagtgat 1080
gggtacgcaa tgtacctagg ctttgcccct ggtgctgaga tgtttctgga aacctttgag 1140
ttttacccat tggttattga catgcaccgt gtgataaagg atgggatgga tgtcaacttc 1200
atgaggaagg tcttacgcca gagatatggg cagctgactg cagaagaatg gatgacatct 1260
aagttggacg cagtcaaggc tgcatttagc tcagttgccc aaatatcctg ggccaaatct 1320
ggcttctcac ctgcagctag agctttcctg gctcaatttg gtattcagat cccgggagag 1380
aatctatatt ttcaagggcc cggcggaggt agtcaccatc atcaccatca ctaatgaccg 1440
gt 1442
<210> 80
<211> 458
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of fusion protein [SNAPlike-Akabane N
protein-Histag]
<400> 80
Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro
1 5 10 15
Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile
20 25 30
Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro
35 40 45
Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr
50 55 60
Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe
65 70 75 80
Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr
85 90 95
Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val
100 105 110
Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr
115 120 125
Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile
130 135 140
Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu
145 150 155 160
Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg
165 170 175
Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser
180 185 190
Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Ala Asn
195 200 205
Gln Phe Ile Phe Asn Asp Val Pro Gln Arg Asn Ala Ala Thr Phe Asn
210 215 220
Pro Asp Ala Gly Tyr Val Ala Phe Ile Ser Lys Tyr Gly Gln Gln Leu
225 230 235 240
Asn Phe Thr Val Ala Arg Val Phe Phe Leu Asn Gln Lys Lys Ala Lys
245 250 255
Met Val Leu His Lys Thr Pro Gln Pro Ser Val Asp Leu Thr Phe Ala
260 265 270
Gly Val Lys Phe Thr Val Val Asn Asn His Phe Pro Gln Tyr Thr Ala
275 280 285
Asn Pro Val Ser Asp Thr Ala Phe Thr Leu His Arg Ile Ser Gly Tyr
290 295 300
Leu Ala Arg Trp Val Ala Glu Gln Cys Lys Ala Asn Gln Ile Lys Leu
305 310 315 320
Ala Glu Ala Ala Ala Thr Ile Val Met Pro Leu Ala Glu Val Lys Gly
325 330 335
Cys Thr Trp Ser Asp Gly Tyr Ala Met Tyr Leu Gly Phe Ala Pro Gly
340 345 350
Ala Glu Met Phe Leu Glu Thr Phe Glu Phe Tyr Pro Leu Val Ile Asp
355 360 365
Met His Arg Val Ile Lys Asp Gly Met Asp Val Asn Phe Met Arg Lys
370 375 380
Val Leu Arg Gln Arg Tyr Gly Gln Leu Thr Ala Glu Glu Trp Met Thr
385 390 395 400
Ser Lys Leu Asp Ala Val Lys Ala Ala Phe Ser Ser Val Ala Gln Ile
405 410 415
Ser Trp Ala Lys Ser Gly Phe Ser Pro Ala Ala Arg Ala Phe Leu Ala
420 425 430
Gln Phe Gly Ile Gln Ile Pro Gly Glu Asn Leu Tyr Phe Gln Gly Pro
435 440 445
Gly Gly Gly Ser His His His His His His
450 455
<210> 81
<211> 1451
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding ssBiP- SNAPlike-Aino N protein-proTEV
cleavage site-Histag for expression in S2 cells
<400> 81
atgaagttat gcatattact ggccgtcgtg gtggcctttg ttggcctctc gctcgggaga 60
tctagatctg acaaagactg cgaaatgaaa agaactacat tggattcacc acttgggaag 120
ttggaactga gtggatgcga gcaaggattg catgaaatta agctactggg aaaaggaact 180
tctgctgctg atgcagttga agttccagca ccagcagctg ttcttggagg tcctgagccc 240
ctcatgcaag ccacagcctg gcttaacgca tatttccacc agcctgaggc cattgaggaa 300
tttccagtcc ccgcccttca ccatcctgtg tttcagcagg agagcttcac ccgccaggtc 360
ctgtggaaat tgctgaaggt ggtcaagttt ggtgaagtga tttcatatca gcaacttgct 420
gcattggccg gtaaccccgc agctacagct gccgtgaaaa ctgctctcag cggaaatcct 480
gtgcccatcc tgatcccttg tcacagagtc gtttcatctt ccggagctgt aggtggctat 540
gaaggaggac tggcagttaa ggagtggctg ctggctcatg aaggtcatag acttggaaag 600
cctgggctgg gtcctgctgg tataggcgcg ccagggtccc taggtggcgg atccgaaaac 660
ctgtacttcc agagcgatat cgcaaaccaa tttattttcc aagatgttcc tcaacggaat 720
ctcgctacat ttaacccgga ggtcgggtat gtggcattta ttgctaaaca tgggtcccaa 780
ctcaatttcg ataccgttag agtcttcttc ctcaatcaga agaaggccaa gatggtgctc 840
agtaagacgg cacaaccaag tgttgatctt acatttggtg gcatcaaatt tacactggtt 900
aataaccatt ttccccaata cacagcaaat cctgtgccag acactgccct cactctccac 960
cgtctctcag gttatctagc aaaatgggtt gcagaccaat gcaaaacaaa tcagattaaa 1020
ctggctgagg ccatggaaaa aattgtcatg ccacttgctg aagtgaaagg ttgcacctgg 1080
actgaaggac tgactatgta tctgggattt gcaccaggcg ctgaaatgtt tttagaaaca 1140
tttgagttct accctttggt tattgacatg cacagagtgc tgaaagatgg aatggatgtc 1200
aactttatga gaaaggtcct tcgccagcgc tatggcacat tgactgcaga acagtggatg 1260
actcaaaaaa tagatgctgt ccgtgcagcc ttcaatgctg ttgggcagct aagttgggct 1320
aaatcaggat tctcaccagc tgccagagcc ttccttgccc aattcggcat aaacatgatc 1380
ccgggagaga atctatattt tcaagggccc ggcggaggta gtcaccatca tcaccatcac 1440
taatgaccgg t 1451
<210> 82
<211> 459
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of fusion protein [SNAPlike-Aino N
protein-Histag]
<400> 82
Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro
1 5 10 15
Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile
20 25 30
Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro
35 40 45
Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr
50 55 60
Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe
65 70 75 80
Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr
85 90 95
Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val
100 105 110
Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr
115 120 125
Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile
130 135 140
Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu
145 150 155 160
Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg
165 170 175
Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser
180 185 190
Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Ala Asn
195 200 205
Gln Phe Ile Phe Gln Asp Val Pro Gln Arg Asn Leu Ala Thr Phe Asn
210 215 220
Pro Glu Val Gly Tyr Val Ala Phe Ile Ala Lys His Gly Ser Gln Leu
225 230 235 240
Asn Phe Asp Thr Val Arg Val Phe Phe Leu Asn Gln Lys Lys Ala Lys
245 250 255
Met Val Leu Ser Lys Thr Ala Gln Pro Ser Val Asp Leu Thr Phe Gly
260 265 270
Gly Ile Lys Phe Thr Leu Val Asn Asn His Phe Pro Gln Tyr Thr Ala
275 280 285
Asn Pro Val Pro Asp Thr Ala Leu Thr Leu His Arg Leu Ser Gly Tyr
290 295 300
Leu Ala Lys Trp Val Ala Asp Gln Cys Lys Thr Asn Gln Ile Lys Leu
305 310 315 320
Ala Glu Ala Met Glu Lys Ile Val Met Pro Leu Ala Glu Val Lys Gly
325 330 335
Cys Thr Trp Thr Glu Gly Leu Thr Met Tyr Leu Gly Phe Ala Pro Gly
340 345 350
Ala Glu Met Phe Leu Glu Thr Phe Glu Phe Tyr Pro Leu Val Ile Asp
355 360 365
Met His Arg Val Leu Lys Asp Gly Met Asp Val Asn Phe Met Arg Lys
370 375 380
Val Leu Arg Gln Arg Tyr Gly Thr Leu Thr Ala Glu Gln Trp Met Thr
385 390 395 400
Gln Lys Ile Asp Ala Val Arg Ala Ala Phe Asn Ala Val Gly Gln Leu
405 410 415
Ser Trp Ala Lys Ser Gly Phe Ser Pro Ala Ala Arg Ala Phe Leu Ala
420 425 430
Gln Phe Gly Ile Asn Met Ile Pro Gly Glu Asn Leu Tyr Phe Gln Gly
435 440 445
Pro Gly Gly Gly Ser His His His His His His
450 455
<210> 83
<211> 1448
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding ssBiP - SNAPlike-Shamonda N protein-proTEV
cleavage site-Histag for expression in S2 cells
<400> 83
atgaagttat gcatattact ggccgtcgtg gtggcctttg ttggcctctc gctcgggaga 60
tctagatctg acaaagactg cgaaatgaaa agaactacat tggattcacc acttgggaag 120
ttggaactga gtggatgcga gcaaggattg catgaaatta agctactggg aaaaggaact 180
tctgctgctg atgcagttga agttccagca ccagcagctg ttcttggagg tcctgagccc 240
ctcatgcaag ccacagcctg gcttaacgca tatttccacc agcctgaggc cattgaggaa 300
tttccagtcc ccgcccttca ccatcctgtg tttcagcagg agagcttcac ccgccaggtc 360
ctgtggaaat tgctgaaggt ggtcaagttt ggtgaagtga tttcatatca gcaacttgct 420
gcattggccg gtaaccccgc agctacagct gccgtgaaaa ctgctctcag cggaaatcct 480
gtgcccatcc tgatcccttg tcacagagtc gtttcatctt ccggagctgt aggtggctat 540
gaaggaggac tggcagttaa ggagtggctg ctggctcatg aaggtcatag acttggaaag 600
cctgggctgg gtcctgctgg tataggcgcg ccagggtccc taggtggcgg atccgaaaac 660
ctgtacttcc agagcgatat ctcaagccaa ttcatttttg aagatgtacc acaacggaat 720
gcagctacat ttaacccgga aggtgggtat gtggcattta ttggtaagta tgggcaacaa 780
ctcaatttcg gggttgctaa agtcttcttc ctcaaccaga agaaggccaa aatggtccta 840
cataagacgg gacaaccaag tgtcgatctt acttttggtg gggtcaaatt cacagtggtt 900
aataaccatt ttccccaata tgtctcaaat cctgtgccag acaatgccat tacacttcac 960
aggatgtcag gttatctagc acgctggatt gctgatacat gcaaggctag tgtcctcaaa 1020
ctagctgaag ctagtgctca aattgtcatg ccccttgctg aggttaaggg atgtacctgg 1080
gctgatggtt atacaatgta tcttggattt gcacctgggg ccgaaatgtt ccttgatgct 1140
tttgattttt atccgctagt tatcgaaatg catagggtcc ttaaggacaa tatggatgta 1200
aattttatga aaaaagtcct ccgccaacgc tatggaacaa tgactgctga agaatggatg 1260
actcagaaaa taccagaaat aaaggctgct ttcaattctg ttggacaact tgcctgggct 1320
aaatctggat tctctcctgc tgctagaact ttcttgcagc aatttggtat caacatcccg 1380
ggagagaatc tatattttca agggcccggc ggaggtagtc accatcatca ccatcactaa 1440
tgaccggt 1448
<210> 84
<211> 458
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of fusion protein [SNAPlike-Shamonda N
protein-Histag]
<400> 84
Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro
1 5 10 15
Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile
20 25 30
Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro
35 40 45
Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr
50 55 60
Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe
65 70 75 80
Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr
85 90 95
Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val
100 105 110
Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr
115 120 125
Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile
130 135 140
Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu
145 150 155 160
Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg
165 170 175
Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser
180 185 190
Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Ser Ser
195 200 205
Gln Phe Ile Phe Glu Asp Val Pro Gln Arg Asn Ala Ala Thr Phe Asn
210 215 220
Pro Glu Gly Gly Tyr Val Ala Phe Ile Gly Lys Tyr Gly Gln Gln Leu
225 230 235 240
Asn Phe Gly Val Ala Lys Val Phe Phe Leu Asn Gln Lys Lys Ala Lys
245 250 255
Met Val Leu His Lys Thr Gly Gln Pro Ser Val Asp Leu Thr Phe Gly
260 265 270
Gly Val Lys Phe Thr Val Val Asn Asn His Phe Pro Gln Tyr Val Ser
275 280 285
Asn Pro Val Pro Asp Asn Ala Ile Thr Leu His Arg Met Ser Gly Tyr
290 295 300
Leu Ala Arg Trp Ile Ala Asp Thr Cys Lys Ala Ser Val Leu Lys Leu
305 310 315 320
Ala Glu Ala Ser Ala Gln Ile Val Met Pro Leu Ala Glu Val Lys Gly
325 330 335
Cys Thr Trp Ala Asp Gly Tyr Thr Met Tyr Leu Gly Phe Ala Pro Gly
340 345 350
Ala Glu Met Phe Leu Asp Ala Phe Asp Phe Tyr Pro Leu Val Ile Glu
355 360 365
Met His Arg Val Leu Lys Asp Asn Met Asp Val Asn Phe Met Lys Lys
370 375 380
Val Leu Arg Gln Arg Tyr Gly Thr Met Thr Ala Glu Glu Trp Met Thr
385 390 395 400
Gln Lys Ile Pro Glu Ile Lys Ala Ala Phe Asn Ser Val Gly Gln Leu
405 410 415
Ala Trp Ala Lys Ser Gly Phe Ser Pro Ala Ala Arg Thr Phe Leu Gln
420 425 430
Gln Phe Gly Ile Asn Ile Pro Gly Glu Asn Leu Tyr Phe Gln Gly Pro
435 440 445
Gly Gly Gly Ser His His His His His His
450 455
<210> 85
<211> 1991
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding ssBiP -SNAPlike-proTEV cleavage site-N
protein from human betacoronavirus strain 2cEMC/2012- Histag for
expression in S2 cells
<400> 85
atgaagttat gcatattact ggccgtcgtg gtggcctttg ttggcctctc gctcgggaga 60
tctagatctg acaaagactg cgaaatgaaa agaactacat tggattcacc acttgggaag 120
ttggaactga gtggatgcga gcaaggattg catgaaatta agctactggg aaaaggaact 180
tctgctgctg atgcagttga agttccagca ccagcagctg ttcttggagg tcctgagccc 240
ctcatgcaag ccacagcctg gcttaacgca tatttccacc agcctgaggc cattgaggaa 300
tttccagtcc ccgcccttca ccatcctgtg tttcagcagg agagcttcac ccgccaggtc 360
ctgtggaaat tgctgaaggt ggtcaagttt ggtgaagtga tttcatatca gcaacttgct 420
gcattggccg gtaaccccgc agctacagct gccgtgaaaa ctgctctcag cggaaatcct 480
gtgcccatcc tgatcccttg tcacagagtc gtttcatctt ccggagctgt aggtggctat 540
gaaggaggac tggcagttaa ggagtggctg ctggctcatg aaggtcatag acttggaaag 600
cctgggctgg gtcctgctgg tataggcgcg ccagggtccc taggtggcgg atccgaaaac 660
ctgtacttcc agagcgatat cgcatcccct gctgcacctc gtgctgtttc ctttgccgat 720
aacaatgata taacaaatac aaacctatct cgaggtagag gacgtaatcc aaaaccacga 780
gctgcaccaa ataacactgt ctcttggtac actgggctta cccaacacgg gaaagtccct 840
cttacctttc cacctgggca gggtgtacct cttaatgcca attctacccc tgcgcaaaat 900
gctgggtatt ggcggagaca ggacagaaaa attaataccg ggaatggaat taagcaactg 960
gctcccaggt ggtacttcta ctacactgga actggacccg aagcagcact cccattccgg 1020
gctgttaagg atggcatcgt ttgggtccat gaagatggcg ccactgatgc tccttcaact 1080
tttgggacgc ggaaccctaa caatgattca gctattgtta cacaattcgc gcccggtact 1140
aaacttccta aaaacttcca cattgagggg actggaggca atagtcaatc atcttcaaga 1200
gcctctagct taagcagaaa ctcttccagg tctagttcac aaggttcaag atcaggaaac 1260
tctacccgcg gcacttctcc aggtccatct ggaatcggag cagtaggagg tgatctactt 1320
taccttgatc ttctgaacag actacaagcc cttgagtctg gcaaagtaaa gcaatcgcag 1380
ccaaaagtaa tcactaagaa agatgctgct gctgctaaaa ataagatgcg ccacaagcgc 1440
acttccacca aaagtttcaa catggtgcag gcttttggtc ttcgcggacc aggagacctc 1500
cagggaaact ttggtgatct tcaattgaat aaactcggca ctgaggaccc acgttggccc 1560
caaattgctg agcttgctcc tacagccagt gcttttatgg gtatgtcgca atttaaactt 1620
acccatcaga acaatgatga tcatggcaac cctgtgtact tccttcggta cagtggagcc 1680
attaaacttg acccaaagaa tcccaactac aataagtggt tggagcttct tgagcaaaat 1740
attgatgcct acaaaacctt ccctaagaag gaaaagaaac aaaaggcacc aaaagaagaa 1800
tcaacagacc aaatgtctga acctccaaag gagcagcgtg tgcaaggtag catcactcag 1860
cgcactcgca cccgtccaag tgttcagcct ggtccaatga ttgatgttaa cactgatggc 1920
ccgggagaga atctatattt tcaagggccc ggcggaggta gtcaccatca tcaccatcac 1980
taatgaccgg t 1991
<210> 86
<211> 639
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of fusion protein [SNAPlike-proTEV-COV N
protein-Histag]
<400> 86
Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro
1 5 10 15
Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile
20 25 30
Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro
35 40 45
Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr
50 55 60
Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe
65 70 75 80
Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr
85 90 95
Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val
100 105 110
Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr
115 120 125
Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile
130 135 140
Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu
145 150 155 160
Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg
165 170 175
Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser
180 185 190
Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Ala Ser
195 200 205
Pro Ala Ala Pro Arg Ala Val Ser Phe Ala Asp Asn Asn Asp Ile Thr
210 215 220
Asn Thr Asn Leu Ser Arg Gly Arg Gly Arg Asn Pro Lys Pro Arg Ala
225 230 235 240
Ala Pro Asn Asn Thr Val Ser Trp Tyr Thr Gly Leu Thr Gln His Gly
245 250 255
Lys Val Pro Leu Thr Phe Pro Pro Gly Gln Gly Val Pro Leu Asn Ala
260 265 270
Asn Ser Thr Pro Ala Gln Asn Ala Gly Tyr Trp Arg Arg Gln Asp Arg
275 280 285
Lys Ile Asn Thr Gly Asn Gly Ile Lys Gln Leu Ala Pro Arg Trp Tyr
290 295 300
Phe Tyr Tyr Thr Gly Thr Gly Pro Glu Ala Ala Leu Pro Phe Arg Ala
305 310 315 320
Val Lys Asp Gly Ile Val Trp Val His Glu Asp Gly Ala Thr Asp Ala
325 330 335
Pro Ser Thr Phe Gly Thr Arg Asn Pro Asn Asn Asp Ser Ala Ile Val
340 345 350
Thr Gln Phe Ala Pro Gly Thr Lys Leu Pro Lys Asn Phe His Ile Glu
355 360 365
Gly Thr Gly Gly Asn Ser Gln Ser Ser Ser Arg Ala Ser Ser Leu Ser
370 375 380
Arg Asn Ser Ser Arg Ser Ser Ser Gln Gly Ser Arg Ser Gly Asn Ser
385 390 395 400
Thr Arg Gly Thr Ser Pro Gly Pro Ser Gly Ile Gly Ala Val Gly Gly
405 410 415
Asp Leu Leu Tyr Leu Asp Leu Leu Asn Arg Leu Gln Ala Leu Glu Ser
420 425 430
Gly Lys Val Lys Gln Ser Gln Pro Lys Val Ile Thr Lys Lys Asp Ala
435 440 445
Ala Ala Ala Lys Asn Lys Met Arg His Lys Arg Thr Ser Thr Lys Ser
450 455 460
Phe Asn Met Val Gln Ala Phe Gly Leu Arg Gly Pro Gly Asp Leu Gln
465 470 475 480
Gly Asn Phe Gly Asp Leu Gln Leu Asn Lys Leu Gly Thr Glu Asp Pro
485 490 495
Arg Trp Pro Gln Ile Ala Glu Leu Ala Pro Thr Ala Ser Ala Phe Met
500 505 510
Gly Met Ser Gln Phe Lys Leu Thr His Gln Asn Asn Asp Asp His Gly
515 520 525
Asn Pro Val Tyr Phe Leu Arg Tyr Ser Gly Ala Ile Lys Leu Asp Pro
530 535 540
Lys Asn Pro Asn Tyr Asn Lys Trp Leu Glu Leu Leu Glu Gln Asn Ile
545 550 555 560
Asp Ala Tyr Lys Thr Phe Pro Lys Lys Glu Lys Lys Gln Lys Ala Pro
565 570 575
Lys Glu Glu Ser Thr Asp Gln Met Ser Glu Pro Pro Lys Glu Gln Arg
580 585 590
Val Gln Gly Ser Ile Thr Gln Arg Thr Arg Thr Arg Pro Ser Val Gln
595 600 605
Pro Gly Pro Met Ile Asp Val Asn Thr Asp Gly Pro Gly Glu Asn Leu
610 615 620
Tyr Phe Gln Gly Pro Gly Gly Gly Ser His His His His His His
625 630 635
<210> 87
<211> 4465
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding ssBiP- S protein from human betacoronavirus
strain 2cEMC/2012- SNAPlike - Histag for expression in S2 cells
<400> 87
atgaagttat gcatattact ggccgtcgtg gtggcctttg ttggcctctc gctcgggaga 60
tctagatctg tagggccaga ttctgttaag tctgcttgta ttgaggttga tatacaacag 120
actttctttg ataaaacttg gcctaggcca attgatgttt ctaaggctga cggtattata 180
taccctcaag gccgtacata ttctaacata actatcactt atcaaggtct ttttccctat 240
cagggagacc atggtgatat gtatgtttac tctgcaggac atgctacagg cacaactcca 300
caaaagttgt ttgtagctaa ctattctcag gacgtcaaac agtttgctaa tgggtttgtc 360
gtccgtatag gagcagctgc caattccact ggcactgtta ttattagccc atctaccagc 420
gctactatac gaaaaattta ccctgctttt atgctgggtt cttcagttgg taatttctca 480
gatggtaaaa tgggccgctt cttcaatcat actctagttc ttttgcccga tggatgtggc 540
actttactta gagcttttta ttgtattcta gagcctcgct ctggaaatca ttgtcctgct 600
ggcaattcct atacttcttt tgccacttat cacactcctg caacagattg ttctgatggc 660
aattacaatc gtaatgccag tctgaactct tttaaggagt attttaattt acgtaactgc 720
acctttatgt acacttataa cattaccgaa gatgagattt tagagtggtt tggcattaca 780
caaactgctc aaggtgttca cctcttctca tctcggtatg ttgatttgta cggcggcaat 840
atgtttcaat ttgccacctt gcctgtttat gatactatta agtattattc tatcattcct 900
cacagtattc gttctatcca aagtgataga aaggcttggg ctgccttcta cgtatataaa 960
cttcaaccgt taactttcct gttggatttt tctgttgatg gttatatacg cagagctata 1020
gactgtggtt ttaatgattt gtcacaactc cactgctcat atgaatcctt cgatgttgaa 1080
tctggagttt attcagtttc gtctttcgaa gcaaaacctt ctggctcagt tgtggaacag 1140
gctgaaggtg ttgaatgtga tttttcacct cttctgtctg gcacacctcc tcaggtttat 1200
aatttcaagc gtttggtttt taccaattgc aattataatc ttaccaaatt gctttcactt 1260
ttttctgtga atgattttac ttgtagtcaa atatctccag cagcaattgc aagcaactgt 1320
tattcttcac tgattttgga ttacttttca tacccactta gtatgaaatc cgatctcagt 1380
gttagttctg ctggtccaat atcccagttt aattataaac agtccttttc taatcccaca 1440
tgtttgattt tagcgactgt tcctcataac cttactacta ttactaagcc tcttaagtac 1500
agctatatta acaagtgctc tcgtcttctt tctgatgatc gtactgaagt acctcagtta 1560
gtgaacgcta atcaatactc accctgtgta tccattgtcc catccactgt gtgggaagac 1620
ggtgattatt ataggaaaca actatctcca cttgaaggtg gtggctggct tgttgctagt 1680
ggctcaactg ttgccatgac tgagcaatta cagatgggct ttggtattac agttcaatat 1740
ggtacagaca ccaatagtgt ttgccccaag ctggaatttg ctaatgacac aaaaattgcc 1800
tctcaattag gcaattgcgt ggaatattcc ctctatggtg tttcgggccg tggtgttttt 1860
cagaattgca cagctgtagg tgttcgacag cagcgctttg tttatgatgc gtaccagaat 1920
ttagttggct attattctga tgatggcaac tactactgtt tgcgtgcttg tgttagtgtt 1980
cctgtttctg tcatctatga taaagaaact aaaacccacg ctactctatt tggtagtgtt 2040
gcatgtgaac acatttcttc taccatgtct caatactccc gttctacgcg atcaatgctt 2100
aaacggcgag attctacata tggccccctt cagacacctg ttggttgtgt cctaggactt 2160
gttaattcct ctttgttcgt agaggactgc aagttgcctc ttggtcaatc tctctgtgct 2220
cttcctgaca cacctagtac tctcacacct cgcagtgtgc gctctgttcc aggtgaaatg 2280
cgcttggcat ccattgcttt taatcatcct attcaggttg atcaacttaa tagtagttat 2340
tttaaattaa gtatacccac taatttttcc tttggtgtga ctcaggagta cattcagaca 2400
accattcaga aagttactgt tgattgtaaa cagtacgttt gcaatggttt ccagaagtgt 2460
gagcaattac tgcgcgagta tggccagttt tgttccaaaa taaaccaggc tctccatggt 2520
gccaatttac gccaggatga ttctgtacgt aatttgtttg cgagcgtgaa aagctctcaa 2580
tcatctccta tcataccagg ttttggaggt gactttaatt tgacacttct agaacctgtt 2640
tctatatcta ctggcagtcg tagtgcacgt agtgctattg aggatttgct atttgacaaa 2700
gtcactatag ctgatcctgg ttatatgcaa ggttacgatg attgcatgca gcaaggtcca 2760
gcatcagctc gtgatcttat ttgtgctcaa tatgtggctg gttacaaagt attacctcct 2820
cttatggatg ttaatatgga agccgcgtat acttcatctt tgcttggcag catagcaggt 2880
gttggctgga ctgctggctt atcctccttt gctgctattc catttgcaca gagtatcttt 2940
tataggttaa acggtgttgg cattactcaa caggttcttt cagagaacca aaagctcatt 3000
gccaataagt ttaatcaggc tctgggagct atgcaaacag gcttcactac aactaatgaa 3060
gcctttcaga aggttcagga tgctgtgaac aacaatgcac aggctctatc caaattagcg 3120
agcgagctat ctaatacttt tggtgctatt tccgcctcta ttggagacat catacaacgt 3180
cttgatgttc tcgaacagga cgcccaaata gacagactta ttaatggccg tttgacaaca 3240
ctaaatgctt ttgttgcaca gcagcttgtt cgttccgaat cagctgctct ttccgctcaa 3300
ttggctaaag ataaagtcaa tgagtgtgtc aaggcacaat ccaagcgttc tggattttgc 3360
ggtcaaggca cacatatagt gtcctttgtt gtaaatgccc ctaatggcct ttacttcatg 3420
catgttggtt attaccctag caaccacatt gaggttgttt ctgcttatgg tctttgcgat 3480
gcagctaacc ctactaattg tatagcccct gttaatggct actttattaa aactaataac 3540
actaggattg ttgatgagtg gtcatatact ggctcgtcct tctatgcacc tgagcccatt 3600
acctccctta atactaagta tgttgcacca caggtgacat accaaaacat ttctactaac 3660
ctccctcctc ctcttctcgg caattccacc gggattgact tccaagatga gttggatgag 3720
tttttcaaaa atgttagcac cagtatacct aattttggtt ccctaacaca gattaatact 3780
acattactcg atcttaccta cgagatgttg tctcttcaac aagttgttaa agcccttaag 3840
cggccgcacg gcggaggtag caaagactgc gaaatgaagc gcaccaccct ggatagccct 3900
ctgggcaagc tggaactgtc tgggtgcgaa cagggcctgc acgagatcaa gctgctgggc 3960
aaaggaacat ctgccgccga cgccgtggaa gtgcctgccc cagccgccgt gctgggcgga 4020
ccagagccac tgatgcaggc caccgcctgg ctcaacgcct actttcacca gcctgaggcc 4080
atcgaggagt tccctgtgcc agccctgcac cacccagtgt tccagcagga gagctttacc 4140
cgccaggtgc tgtggaaact gctgaaagtg gtgaagttcg gagaggtcat cagctaccag 4200
cagctggccg ccctggccgg caatcccgcc gccaccgccg ccgtgaaaac cgccctgagc 4260
ggaaatcccg tgcccattct gatcccctgc caccgggtgg tgtctagctc tggcgccgtg 4320
gggggctacg agggcgggct cgccgtgaaa gagtggctgc tggcccacga gggccacaga 4380
ctgggcaagc ctgggctggg tcctgcaggt ataggcgcgc cagggtccct ggagcatcat 4440
catcatcatc attgatgacg ggccc 4465
<210> 88
<211> 1463
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of fusion protein [huCOV.S protein
-SNAPlike-Histag]
<400> 88
Arg Ser Val Gly Pro Asp Ser Val Lys Ser Ala Cys Ile Glu Val Asp
1 5 10 15
Ile Gln Gln Thr Phe Phe Asp Lys Thr Trp Pro Arg Pro Ile Asp Val
20 25 30
Ser Lys Ala Asp Gly Ile Ile Tyr Pro Gln Gly Arg Thr Tyr Ser Asn
35 40 45
Ile Thr Ile Thr Tyr Gln Gly Leu Phe Pro Tyr Gln Gly Asp His Gly
50 55 60
Asp Met Tyr Val Tyr Ser Ala Gly His Ala Thr Gly Thr Thr Pro Gln
65 70 75 80
Lys Leu Phe Val Ala Asn Tyr Ser Gln Asp Val Lys Gln Phe Ala Asn
85 90 95
Gly Phe Val Val Arg Ile Gly Ala Ala Ala Asn Ser Thr Gly Thr Val
100 105 110
Ile Ile Ser Pro Ser Thr Ser Ala Thr Ile Arg Lys Ile Tyr Pro Ala
115 120 125
Phe Met Leu Gly Ser Ser Val Gly Asn Phe Ser Asp Gly Lys Met Gly
130 135 140
Arg Phe Phe Asn His Thr Leu Val Leu Leu Pro Asp Gly Cys Gly Thr
145 150 155 160
Leu Leu Arg Ala Phe Tyr Cys Ile Leu Glu Pro Arg Ser Gly Asn His
165 170 175
Cys Pro Ala Gly Asn Ser Tyr Thr Ser Phe Ala Thr Tyr His Thr Pro
180 185 190
Ala Thr Asp Cys Ser Asp Gly Asn Tyr Asn Arg Asn Ala Ser Leu Asn
195 200 205
Ser Phe Lys Glu Tyr Phe Asn Leu Arg Asn Cys Thr Phe Met Tyr Thr
210 215 220
Tyr Asn Ile Thr Glu Asp Glu Ile Leu Glu Trp Phe Gly Ile Thr Gln
225 230 235 240
Thr Ala Gln Gly Val His Leu Phe Ser Ser Arg Tyr Val Asp Leu Tyr
245 250 255
Gly Gly Asn Met Phe Gln Phe Ala Thr Leu Pro Val Tyr Asp Thr Ile
260 265 270
Lys Tyr Tyr Ser Ile Ile Pro His Ser Ile Arg Ser Ile Gln Ser Asp
275 280 285
Arg Lys Ala Trp Ala Ala Phe Tyr Val Tyr Lys Leu Gln Pro Leu Thr
290 295 300
Phe Leu Leu Asp Phe Ser Val Asp Gly Tyr Ile Arg Arg Ala Ile Asp
305 310 315 320
Cys Gly Phe Asn Asp Leu Ser Gln Leu His Cys Ser Tyr Glu Ser Phe
325 330 335
Asp Val Glu Ser Gly Val Tyr Ser Val Ser Ser Phe Glu Ala Lys Pro
340 345 350
Ser Gly Ser Val Val Glu Gln Ala Glu Gly Val Glu Cys Asp Phe Ser
355 360 365
Pro Leu Leu Ser Gly Thr Pro Pro Gln Val Tyr Asn Phe Lys Arg Leu
370 375 380
Val Phe Thr Asn Cys Asn Tyr Asn Leu Thr Lys Leu Leu Ser Leu Phe
385 390 395 400
Ser Val Asn Asp Phe Thr Cys Ser Gln Ile Ser Pro Ala Ala Ile Ala
405 410 415
Ser Asn Cys Tyr Ser Ser Leu Ile Leu Asp Tyr Phe Ser Tyr Pro Leu
420 425 430
Ser Met Lys Ser Asp Leu Ser Val Ser Ser Ala Gly Pro Ile Ser Gln
435 440 445
Phe Asn Tyr Lys Gln Ser Phe Ser Asn Pro Thr Cys Leu Ile Leu Ala
450 455 460
Thr Val Pro His Asn Leu Thr Thr Ile Thr Lys Pro Leu Lys Tyr Ser
465 470 475 480
Tyr Ile Asn Lys Cys Ser Arg Leu Leu Ser Asp Asp Arg Thr Glu Val
485 490 495
Pro Gln Leu Val Asn Ala Asn Gln Tyr Ser Pro Cys Val Ser Ile Val
500 505 510
Pro Ser Thr Val Trp Glu Asp Gly Asp Tyr Tyr Arg Lys Gln Leu Ser
515 520 525
Pro Leu Glu Gly Gly Gly Trp Leu Val Ala Ser Gly Ser Thr Val Ala
530 535 540
Met Thr Glu Gln Leu Gln Met Gly Phe Gly Ile Thr Val Gln Tyr Gly
545 550 555 560
Thr Asp Thr Asn Ser Val Cys Pro Lys Leu Glu Phe Ala Asn Asp Thr
565 570 575
Lys Ile Ala Ser Gln Leu Gly Asn Cys Val Glu Tyr Ser Leu Tyr Gly
580 585 590
Val Ser Gly Arg Gly Val Phe Gln Asn Cys Thr Ala Val Gly Val Arg
595 600 605
Gln Gln Arg Phe Val Tyr Asp Ala Tyr Gln Asn Leu Val Gly Tyr Tyr
610 615 620
Ser Asp Asp Gly Asn Tyr Tyr Cys Leu Arg Ala Cys Val Ser Val Pro
625 630 635 640
Val Ser Val Ile Tyr Asp Lys Glu Thr Lys Thr His Ala Thr Leu Phe
645 650 655
Gly Ser Val Ala Cys Glu His Ile Ser Ser Thr Met Ser Gln Tyr Ser
660 665 670
Arg Ser Thr Arg Ser Met Leu Lys Arg Arg Asp Ser Thr Tyr Gly Pro
675 680 685
Leu Gln Thr Pro Val Gly Cys Val Leu Gly Leu Val Asn Ser Ser Leu
690 695 700
Phe Val Glu Asp Cys Lys Leu Pro Leu Gly Gln Ser Leu Cys Ala Leu
705 710 715 720
Pro Asp Thr Pro Ser Thr Leu Thr Pro Arg Ser Val Arg Ser Val Pro
725 730 735
Gly Glu Met Arg Leu Ala Ser Ile Ala Phe Asn His Pro Ile Gln Val
740 745 750
Asp Gln Leu Asn Ser Ser Tyr Phe Lys Leu Ser Ile Pro Thr Asn Phe
755 760 765
Ser Phe Gly Val Thr Gln Glu Tyr Ile Gln Thr Thr Ile Gln Lys Val
770 775 780
Thr Val Asp Cys Lys Gln Tyr Val Cys Asn Gly Phe Gln Lys Cys Glu
785 790 795 800
Gln Leu Leu Arg Glu Tyr Gly Gln Phe Cys Ser Lys Ile Asn Gln Ala
805 810 815
Leu His Gly Ala Asn Leu Arg Gln Asp Asp Ser Val Arg Asn Leu Phe
820 825 830
Ala Ser Val Lys Ser Ser Gln Ser Ser Pro Ile Ile Pro Gly Phe Gly
835 840 845
Gly Asp Phe Asn Leu Thr Leu Leu Glu Pro Val Ser Ile Ser Thr Gly
850 855 860
Ser Arg Ser Ala Arg Ser Ala Ile Glu Asp Leu Leu Phe Asp Lys Val
865 870 875 880
Thr Ile Ala Asp Pro Gly Tyr Met Gln Gly Tyr Asp Asp Cys Met Gln
885 890 895
Gln Gly Pro Ala Ser Ala Arg Asp Leu Ile Cys Ala Gln Tyr Val Ala
900 905 910
Gly Tyr Lys Val Leu Pro Pro Leu Met Asp Val Asn Met Glu Ala Ala
915 920 925
Tyr Thr Ser Ser Leu Leu Gly Ser Ile Ala Gly Val Gly Trp Thr Ala
930 935 940
Gly Leu Ser Ser Phe Ala Ala Ile Pro Phe Ala Gln Ser Ile Phe Tyr
945 950 955 960
Arg Leu Asn Gly Val Gly Ile Thr Gln Gln Val Leu Ser Glu Asn Gln
965 970 975
Lys Leu Ile Ala Asn Lys Phe Asn Gln Ala Leu Gly Ala Met Gln Thr
980 985 990
Gly Phe Thr Thr Thr Asn Glu Ala Phe Gln Lys Val Gln Asp Ala Val
995 1000 1005
Asn Asn Asn Ala Gln Ala Leu Ser Lys Leu Ala Ser Glu Leu Ser
1010 1015 1020
Asn Thr Phe Gly Ala Ile Ser Ala Ser Ile Gly Asp Ile Ile Gln
1025 1030 1035
Arg Leu Asp Val Leu Glu Gln Asp Ala Gln Ile Asp Arg Leu Ile
1040 1045 1050
Asn Gly Arg Leu Thr Thr Leu Asn Ala Phe Val Ala Gln Gln Leu
1055 1060 1065
Val Arg Ser Glu Ser Ala Ala Leu Ser Ala Gln Leu Ala Lys Asp
1070 1075 1080
Lys Val Asn Glu Cys Val Lys Ala Gln Ser Lys Arg Ser Gly Phe
1085 1090 1095
Cys Gly Gln Gly Thr His Ile Val Ser Phe Val Val Asn Ala Pro
1100 1105 1110
Asn Gly Leu Tyr Phe Met His Val Gly Tyr Tyr Pro Ser Asn His
1115 1120 1125
Ile Glu Val Val Ser Ala Tyr Gly Leu Cys Asp Ala Ala Asn Pro
1130 1135 1140
Thr Asn Cys Ile Ala Pro Val Asn Gly Tyr Phe Ile Lys Thr Asn
1145 1150 1155
Asn Thr Arg Ile Val Asp Glu Trp Ser Tyr Thr Gly Ser Ser Phe
1160 1165 1170
Tyr Ala Pro Glu Pro Ile Thr Ser Leu Asn Thr Lys Tyr Val Ala
1175 1180 1185
Pro Gln Val Thr Tyr Gln Asn Ile Ser Thr Asn Leu Pro Pro Pro
1190 1195 1200
Leu Leu Gly Asn Ser Thr Gly Ile Asp Phe Gln Asp Glu Leu Asp
1205 1210 1215
Glu Phe Phe Lys Asn Val Ser Thr Ser Ile Pro Asn Phe Gly Ser
1220 1225 1230
Leu Thr Gln Ile Asn Thr Thr Leu Leu Asp Leu Thr Tyr Glu Met
1235 1240 1245
Leu Ser Leu Gln Gln Val Val Lys Ala Leu Lys Arg Pro His Gly
1250 1255 1260
Gly Gly Ser Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser
1265 1270 1275
Pro Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His
1280 1285 1290
Glu Ile Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val
1295 1300 1305
Glu Val Pro Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu
1310 1315 1320
Met Gln Ala Thr Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu
1325 1330 1335
Ala Ile Glu Glu Phe Pro Val Pro Ala Leu His His Pro Val Phe
1340 1345 1350
Gln Gln Glu Ser Phe Thr Arg Gln Val Leu Trp Lys Leu Leu Lys
1355 1360 1365
Val Val Lys Phe Gly Glu Val Ile Ser Tyr Gln Gln Leu Ala Ala
1370 1375 1380
Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala Val Lys Thr Ala Leu
1385 1390 1395
Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys His Arg Val Val
1400 1405 1410
Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly Leu Ala Val
1415 1420 1425
Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly Lys Pro
1430 1435 1440
Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Glu His
1445 1450 1455
His His His His His
1460
<210> 89
<211> 1325
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding ssBiP - SNAPlike -proTEV- C protein from
hepatitis C virus strain TCHM-R2/03 of genotype 1b - -proTEV -
Histag for expression in S2 cells
<400> 89
atgaagttat gcatattact ggccgtcgtg gtggcctttg ttggcctctc gctcgggaga 60
tctagatctg acaaagactg cgaaatgaaa agaactacat tggattcacc acttgggaag 120
ttggaactga gtggatgcga gcaaggattg catgaaatta agctactggg aaaaggaact 180
tctgctgctg atgcagttga agttccagca ccagcagctg ttcttggagg tcctgagccc 240
ctcatgcaag ccacagcctg gcttaacgca tatttccacc agcctgaggc cattgaggaa 300
tttccagtcc ccgcccttca ccatcctgtg tttcagcagg agagcttcac ccgccaggtc 360
ctgtggaaat tgctgaaggt ggtcaagttt ggtgaagtga tttcatatca gcaacttgct 420
gcattggccg gtaaccccgc agctacagct gccgtgaaaa ctgctctcag cggaaatcct 480
gtgcccatcc tgatcccttg tcacagagtc gtttcatctt ccggagctgt aggtggctat 540
gaaggaggac tggcagttaa ggagtggctg ctggctcatg aaggtcatag acttggaaag 600
cctgggctgg gtcctgctgg tataggcgcg ccagggtccc taggtggcgg atccgaaaac 660
ctgtacttcc agagcgatat cagtacaaat cctaaacctc aaagaaaaac taaacgaaat 720
actaatcgtc gtccacaaga tgttaagttt ccgggaggag gacaaattgt tggtggagtt 780
tacctattgc cgcgaagagg tcctcgttta ggtgttcgag caactagaaa aacttctgaa 840
cgatcacaac ctcgtggaag acgacaacct attcctaagg ctcgtcagcc tgaaggtaga 900
gcttgggctc agcctggtta tccttggcct ctatatggta atgaaggaat gggttgggca 960
ggatggctac tatcacctcg tggttctcga cctagttggg gtgcaaatga ccctcgacga 1020
agatcacgta atttaggtaa ggtaattgat acacttacat gtggttttgc tgatcttatg 1080
ggatatattc cactagtagg tgctccacta ggtggagctg caagagttct tgcacatggt 1140
gtacgagttc ttgaagatgg agtgaactat gcaacaggta atcttcctgg atgttcattt 1200
tctatttttc tattagcttt gctatcatgt ctgactattc cagcttcagc tggcccggga 1260
gagaatctat attttcaagg gcccggcgga ggtagtcacc atcatcacca tcactaatga 1320
ccggt 1325
<210> 90
<211> 417
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of fusion protein [SNAPlike-proTEV-C protein
of HCV-proTEV-Histag]
<400> 90
Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro
1 5 10 15
Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile
20 25 30
Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro
35 40 45
Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr
50 55 60
Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe
65 70 75 80
Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr
85 90 95
Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val
100 105 110
Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr
115 120 125
Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile
130 135 140
Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu
145 150 155 160
Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg
165 170 175
Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser
180 185 190
Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Ser Thr
195 200 205
Asn Pro Lys Pro Gln Arg Lys Thr Lys Arg Asn Thr Asn Arg Arg Pro
210 215 220
Gln Asp Val Lys Phe Pro Gly Gly Gly Gln Ile Val Gly Gly Val Tyr
225 230 235 240
Leu Leu Pro Arg Arg Gly Pro Arg Leu Gly Val Arg Ala Thr Arg Lys
245 250 255
Thr Ser Glu Arg Ser Gln Pro Arg Gly Arg Arg Gln Pro Ile Pro Lys
260 265 270
Ala Arg Gln Pro Glu Gly Arg Ala Trp Ala Gln Pro Gly Tyr Pro Trp
275 280 285
Pro Leu Tyr Gly Asn Glu Gly Met Gly Trp Ala Gly Trp Leu Leu Ser
290 295 300
Pro Arg Gly Ser Arg Pro Ser Trp Gly Ala Asn Asp Pro Arg Arg Arg
305 310 315 320
Ser Arg Asn Leu Gly Lys Val Ile Asp Thr Leu Thr Cys Gly Phe Ala
325 330 335
Asp Leu Met Gly Tyr Ile Pro Leu Val Gly Ala Pro Leu Gly Gly Ala
340 345 350
Ala Arg Val Leu Ala His Gly Val Arg Val Leu Glu Asp Gly Val Asn
355 360 365
Tyr Ala Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile Phe Leu Leu
370 375 380
Ala Leu Leu Ser Cys Leu Thr Ile Pro Ala Ser Ala Gly Pro Gly Glu
385 390 395 400
Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser His His His His His
405 410 415
His
<210> 91
<211> 1376
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding ssBiP- SNAPlike - MSP1(19) antigen from
Plasmodium falciparum - proTEV - AMA-1(III) antigen from
Plasmodium falciparum - Histag for expression in S2 cells
<400> 91
atgaagttat gcatattact ggccgtcgtg gtggcctttg ttggcctctc gctcgggaga 60
tctagatctg acaaagactg cgaaatgaaa agaactacat tggattcacc acttgggaag 120
ttggaactga gtggatgcga gcaaggattg catgaaatta agctactggg aaaaggaact 180
tctgctgctg atgcagttga agttccagca ccagcagctg ttcttggagg tcctgagccc 240
ctcatgcaag ccacagcctg gcttaacgca tatttccacc agcctgaggc cattgaggaa 300
tttccagtcc ccgcccttca ccatcctgtg tttcagcagg agagcttcac ccgccaggtc 360
ctgtggaaat tgctgaaggt ggtcaagttt ggtgaagtga tttcatatca gcaacttgct 420
gcattggccg gtaaccccgc agctacagct gccgtgaaaa ctgctctcag cggaaatcct 480
gtgcccatcc tgatcccttg tcacagagtc gtttcatctt ccggagctgt aggtggctat 540
gaaggaggac tggcagttaa ggagtggctg ctggctcatg aaggtcatag acttggaaag 600
cctgggctgg gtcctgctgg tataggcgcg ccagggtccc taggtggcgg atccgaaaac 660
ctgtacttcc agagcgatat caaacaatgt ccacaaaatt ctggatgttt cagacattta 720
gatgaaagag aagaatgtaa atgtttatta aattacaaac aagaaggtga taaatgtgtt 780
gaaaatccaa atcttacttg taacgaaaat aatggtggat gtgatgcaga tgccaaatgt 840
accgaagaag attcaggcag caacggaaag aaaatcacat gtgaatgtac taaacctgat 900
tcttatccac ttttcgatgg tattttcgga ggtggctctg agaatctata ttttcaaggg 960
cccggtggag gcgaagttga aaacaatttt ccatgttcat tatataaaga tgaaataatg 1020
aaagaaatcg aaagagaatc aaaacgaatt aaattaaatg ataatgatga tgaagggaat 1080
aaaaaaatta tagctccaag aatttttatt tcagatgata aagacagttt aaaatgccca 1140
tgtgaccctg aaatggtaag taatagtaca tgtcgtttct ttgtatgtaa atgtgtagaa 1200
agaagggcag aagtaacatc aaataatgaa gttgtagtta aagaagaata taaagatgaa 1260
tatgcagata ttcctgaaca taaaccaact tatgataaaa tgctcccggg agagaatcta 1320
tattttcaag ggcccggcgg aggtagtcac catcatcacc atcactaatg accggt 1376
<210> 92
<211> 434
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of fusion protein
[SNAPlike-MSP1-proTEV-AMA1-Histag]
<400> 92
Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro
1 5 10 15
Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile
20 25 30
Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro
35 40 45
Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr
50 55 60
Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe
65 70 75 80
Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr
85 90 95
Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val
100 105 110
Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr
115 120 125
Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile
130 135 140
Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu
145 150 155 160
Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg
165 170 175
Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser
180 185 190
Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Lys Gln
195 200 205
Cys Pro Gln Asn Ser Gly Cys Phe Arg His Leu Asp Glu Arg Glu Glu
210 215 220
Cys Lys Cys Leu Leu Asn Tyr Lys Gln Glu Gly Asp Lys Cys Val Glu
225 230 235 240
Asn Pro Asn Leu Thr Cys Asn Glu Asn Asn Gly Gly Cys Asp Ala Asp
245 250 255
Ala Lys Cys Thr Glu Glu Asp Ser Gly Ser Asn Gly Lys Lys Ile Thr
260 265 270
Cys Glu Cys Thr Lys Pro Asp Ser Tyr Pro Leu Phe Asp Gly Ile Phe
275 280 285
Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly Glu
290 295 300
Val Glu Asn Asn Phe Pro Cys Ser Leu Tyr Lys Asp Glu Ile Met Lys
305 310 315 320
Glu Ile Glu Arg Glu Ser Lys Arg Ile Lys Leu Asn Asp Asn Asp Asp
325 330 335
Glu Gly Asn Lys Lys Ile Ile Ala Pro Arg Ile Phe Ile Ser Asp Asp
340 345 350
Lys Asp Ser Leu Lys Cys Pro Cys Asp Pro Glu Met Val Ser Asn Ser
355 360 365
Thr Cys Arg Phe Phe Val Cys Lys Cys Val Glu Arg Arg Ala Glu Val
370 375 380
Thr Ser Asn Asn Glu Val Val Val Lys Glu Glu Tyr Lys Asp Glu Tyr
385 390 395 400
Ala Asp Ile Pro Glu His Lys Pro Thr Tyr Asp Lys Met Leu Pro Gly
405 410 415
Glu Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser His His His His
420 425 430
His His
<210> 93
<211> 2195
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding ssBiP- SNAPlike -proTEV- modified short
form of HbpA from Leptospira interrogans serovar Lai str.56601 -
proTEV- Histag for expression in S2 cells
<400> 93
atgaagttat gcatattact ggccgtcgtg gtggcctttg ttggcctctc gctcgggaga 60
tctagatctg acaaagactg cgaaatgaaa agaactacat tggattcacc acttgggaag 120
ttggaactga gtggatgcga gcaaggattg catgaaatta agctactggg aaaaggaact 180
tctgctgctg atgcagttga agttccagca ccagcagctg ttcttggagg tcctgagccc 240
ctcatgcaag ccacagcctg gcttaacgca tatttccacc agcctgaggc cattgaggaa 300
tttccagtcc ccgcccttca ccatcctgtg tttcagcagg agagcttcac ccgccaggtc 360
ctgtggaaat tgctgaaggt ggtcaagttt ggtgaagtga tttcatatca gcaacttgct 420
gcattggccg gtaaccccgc agctacagct gccgtgaaaa ctgctctcag cggaaatcct 480
gtgcccatcc tgatcccttg tcacagagtc gtttcatctt ccggagctgt aggtggctat 540
gaaggaggac tggcagttaa ggagtggctg ctggctcatg aaggtcatag acttggaaag 600
cctgggctgg gtcctgctgg tataggcgcg ccagggtccc taggtggcgg atccgaaaac 660
ctgtacttcc agagcgatat cttcaacacc acggccaaca tgggcttcag gaacgagtac 720
gtgagcggcg cggtgtccgc aggttacaat aagaaccccg gctacaggtt ggtcccaaac 780
tctcaggcga ctactgggaa cgcctatcag gacttgaaca cgggcatcaa cctgaccttc 840
aacccggacg gcaagttcaa ggggaagacg aggattctct accagcacag ggaccagaac 900
ggggtggacg tgacccagtc caaggccgtc ttcgaccgga acaacaagac gcacgacttc 960
ttggcgacgg ggtcgttgga gtacgggtta gggaagagga acttgatctc cttcaggggg 1020
aacatctcca agtgggagaa caagtactac aacaaccaga gggggtcgga cgagttggac 1080
gtgaagcagt tgaactcgga gttgacgtcg caggggaccg tgcagttgga catggaggcc 1140
tctgagaagc acttcatcac tgtaggtgcg gagtccttcg cgaacgagtt ggagtcggac 1200
cgcttgcaga gcaggtacgt gtacaggacg aggaaggcgg tgttcttcca ggacgagtgg 1260
accgtgtccc ggtcgccgag gattcgggtg gtgccaggag tgaggtacga cgacgactcg 1320
cagttcggga accagacgac gccgaagctg gcggcccggt acgacatatt gcagaacttg 1380
gtgtggaggg cgagctacgg gaggggatta cggccgccga gcttgcagga gttgtacctg 1440
cggttcgaga acccggccgt gggttacgtg gtggagggta acccgaactt gaagccggag 1500
cggtcgatca cgatcaactc ggacttggag tacagcccgt tcagcttctt gacgttctcc 1560
ttgagcgtgt accggaacga catcatcaac ctgatccagt acaagttcga ctcgaacaag 1620
gggagggagt tcgcggagtt ccagctgcag aacatcgcga aggcgtacac gagaggagga 1680
gagttcggcg tgcagtacag gttcttgaag tacttcacgc tggagttggg gtacaaccac 1740
acggacacga gggacctgag ctcggacagg ccgttggagg gcagggcgct gcaccaggcg 1800
tcggcgaact tcatctacaa ctcgcccgga ggattccaat tcaacctgag gggcaagcac 1860
ttggacaaga ggccgttcta cagctcgacc aacaacctgt cggcggccgg acaggactac 1920
atccccagcg aggtgaagtt gaacgagaac ccgcccgtga tctacgggaa gccgttcacg 1980
atcttgaacg tgaggatcga gcagaagttc ttcaacaagc acttcgcgct gttcttgggc 2040
gtggacaact tgctcaacca gtacgagctg gcgtacaacc ccacgcggcc gaggttctac 2100
tacggcggct tctcggccca gttcccggga gagaatctat attttcaagg gcccggcgga 2160
ggtagtcacc atcatcacca tcactaatga ccggt 2195
<210> 94
<211> 707
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of fusion protein
[SNAPlike-proTEV-HbPA1-proTEV-Histag]
<400> 94
Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro
1 5 10 15
Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile
20 25 30
Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro
35 40 45
Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr
50 55 60
Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe
65 70 75 80
Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr
85 90 95
Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val
100 105 110
Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr
115 120 125
Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile
130 135 140
Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu
145 150 155 160
Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg
165 170 175
Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser
180 185 190
Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Phe Asn
195 200 205
Thr Thr Ala Asn Met Gly Phe Arg Asn Glu Tyr Val Ser Gly Ala Val
210 215 220
Ser Ala Gly Tyr Asn Lys Asn Pro Gly Tyr Arg Leu Val Pro Asn Ser
225 230 235 240
Gln Ala Thr Thr Gly Asn Ala Tyr Gln Asp Leu Asn Thr Gly Ile Asn
245 250 255
Leu Thr Phe Asn Pro Asp Gly Lys Phe Lys Gly Lys Thr Arg Ile Leu
260 265 270
Tyr Gln His Arg Asp Gln Asn Gly Val Asp Val Thr Gln Ser Lys Ala
275 280 285
Val Phe Asp Arg Asn Asn Lys Thr His Asp Phe Leu Ala Thr Gly Ser
290 295 300
Leu Glu Tyr Gly Leu Gly Lys Arg Asn Leu Ile Ser Phe Arg Gly Asn
305 310 315 320
Ile Ser Lys Trp Glu Asn Lys Tyr Tyr Asn Asn Gln Arg Gly Ser Asp
325 330 335
Glu Leu Asp Val Lys Gln Leu Asn Ser Glu Leu Thr Ser Gln Gly Thr
340 345 350
Val Gln Leu Asp Met Glu Ala Ser Glu Lys His Phe Ile Thr Val Gly
355 360 365
Ala Glu Ser Phe Ala Asn Glu Leu Glu Ser Asp Arg Leu Gln Ser Arg
370 375 380
Tyr Val Tyr Arg Thr Arg Lys Ala Val Phe Phe Gln Asp Glu Trp Thr
385 390 395 400
Val Ser Arg Ser Pro Arg Ile Arg Val Val Pro Gly Val Arg Tyr Asp
405 410 415
Asp Asp Ser Gln Phe Gly Asn Gln Thr Thr Pro Lys Leu Ala Ala Arg
420 425 430
Tyr Asp Ile Leu Gln Asn Leu Val Trp Arg Ala Ser Tyr Gly Arg Gly
435 440 445
Leu Arg Pro Pro Ser Leu Gln Glu Leu Tyr Leu Arg Phe Glu Asn Pro
450 455 460
Ala Val Gly Tyr Val Val Glu Gly Asn Pro Asn Leu Lys Pro Glu Arg
465 470 475 480
Ser Ile Thr Ile Asn Ser Asp Leu Glu Tyr Ser Pro Phe Ser Phe Leu
485 490 495
Thr Phe Ser Leu Ser Val Tyr Arg Asn Asp Ile Ile Asn Leu Ile Gln
500 505 510
Tyr Lys Phe Asp Ser Asn Lys Gly Arg Glu Phe Ala Glu Phe Gln Leu
515 520 525
Gln Asn Ile Ala Lys Ala Tyr Thr Arg Gly Gly Glu Phe Gly Val Gln
530 535 540
Tyr Arg Phe Leu Lys Tyr Phe Thr Leu Glu Leu Gly Tyr Asn His Thr
545 550 555 560
Asp Thr Arg Asp Leu Ser Ser Asp Arg Pro Leu Glu Gly Arg Ala Leu
565 570 575
His Gln Ala Ser Ala Asn Phe Ile Tyr Asn Ser Pro Gly Gly Phe Gln
580 585 590
Phe Asn Leu Arg Gly Lys His Leu Asp Lys Arg Pro Phe Tyr Ser Ser
595 600 605
Thr Asn Asn Leu Ser Ala Ala Gly Gln Asp Tyr Ile Pro Ser Glu Val
610 615 620
Lys Leu Asn Glu Asn Pro Pro Val Ile Tyr Gly Lys Pro Phe Thr Ile
625 630 635 640
Leu Asn Val Arg Ile Glu Gln Lys Phe Phe Asn Lys His Phe Ala Leu
645 650 655
Phe Leu Gly Val Asp Asn Leu Leu Asn Gln Tyr Glu Leu Ala Tyr Asn
660 665 670
Pro Thr Arg Pro Arg Phe Tyr Tyr Gly Gly Phe Ser Ala Gln Phe Pro
675 680 685
Gly Glu Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser His His His
690 695 700
His His His
705
<210> 95
<211> 968
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding ssBiP- SNAPlike -proTEV- MUB40 - proTEV-
Histag for expression in S2 cells
<400> 95
atgaagttat gcatattact ggccgtcgtg gtggcctttg ttggcctctc gctcgggaga 60
tcttcgcgag ctagcaccat gaaactatgt attctacttg cagttgttgc gttcgtagga 120
ttgtccttac ctacagctct ggcaagatct gacaaagact gcgaaatgaa aagaactaca 180
ttggattcac cacttgggaa gttggaactg agtggatgcg agcaaggatt gcatgaaatt 240
aagctactgg gaaaaggaac ttctgctgct gatgcagttg aagttccagc accagcagct 300
gttcttggag gtcctgagcc cctcatgcaa gccacagcct ggcttaacgc atatttccac 360
cagcctgagg ccattgagga atttccagtc cccgcccttc accatcctgt gtttcagcag 420
gagagcttca cccgccaggt cctgtggaaa ttgctgaagg tggtcaagtt tggtgaagtg 480
atttcatatc agcaacttgc tgcattggcc ggtaaccccg cagctacagc tgccgtgaaa 540
actgctctca gcggaaatcc tgtgcccatc ctgatccctt gtcacagagt cgtttcatct 600
tccggagctg taggtggcta tgaaggagga ctggcagtta aggagtggct gctggctcat 660
gaaggtcata gacttggaaa gcctgggctg ggtcctgctg gtataggcgc gccagggtcc 720
ctaggtggcg gatccgaaaa cctgtacttc cagagcgata tcacggctga aggcatcaag 780
aagtttgaag gcgacggtta tgaactgttc aaggacaact tcccagctgg tgagaagttc 840
gataacgatg acaccaacga tcaattctac acggtaatct tcaagcacca tcgtggcccg 900
ggagagaatc tatattttca agggcccggc ggaggtagtc accatcatca ccatcactaa 960
tgaccggt 968
<210> 96
<211> 298
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of fusion protein
[SNAPlike-proTEV-MUB40-proTEV-Histag]
<400> 96
Ser Arg Ala Ser Thr Met Lys Leu Cys Ile Leu Leu Ala Val Val Ala
1 5 10 15
Phe Val Gly Leu Ser Leu Pro Thr Ala Leu Ala Arg Ser Asp Lys Asp
20 25 30
Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly Lys Leu Glu
35 40 45
Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu Leu Gly Lys
50 55 60
Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro Ala Ala Val
65 70 75 80
Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp Leu Asn Ala
85 90 95
Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val Pro Ala Leu
100 105 110
His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln Val Leu Trp
115 120 125
Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser Tyr Gln Gln
130 135 140
Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala Val Lys Thr
145 150 155 160
Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys His Arg Val
165 170 175
Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly Leu Ala Val
180 185 190
Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly Lys Pro Gly
195 200 205
Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Gly Gly Gly Ser
210 215 220
Glu Asn Leu Tyr Phe Gln Ser Asp Ile Thr Ala Glu Gly Ile Lys Lys
225 230 235 240
Phe Glu Gly Asp Gly Tyr Glu Leu Phe Lys Asp Asn Phe Pro Ala Gly
245 250 255
Glu Lys Phe Asp Asn Asp Asp Thr Asn Asp Gln Phe Tyr Thr Val Ile
260 265 270
Phe Lys His His Arg Gly Pro Gly Glu Asn Leu Tyr Phe Gln Gly Pro
275 280 285
Gly Gly Gly Ser His His His His His His
290 295
<210> 97
<211> 1238
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding ssBiP- SNAPlike -proTEV- soluble form of
mouse C-type like lectin (CLEC5A) - proTEV- Histag for expression
in S2 cells
<400> 97
atgaagttat gcatattact ggccgtcgtg gtggcctttg ttggcctctc gctcgggaga 60
tctagatctg acaaagactg cgaaatgaaa agaactacat tggattcacc acttgggaag 120
ttggaactga gtggatgcga gcaaggattg catgaaatta agctactggg aaaaggaact 180
tctgctgctg atgcagttga agttccagca ccagcagctg ttcttggagg tcctgagccc 240
ctcatgcaag ccacagcctg gcttaacgca tatttccacc agcctgaggc cattgaggaa 300
tttccagtcc ccgcccttca ccatcctgtg tttcagcagg agagcttcac ccgccaggtc 360
ctgtggaaat tgctgaaggt ggtcaagttt ggtgaagtga tttcatatca gcaacttgct 420
gcattggccg gtaaccccgc agctacagct gccgtgaaaa ctgctctcag cggaaatcct 480
gtgcccatcc tgatcccttg tcacagagtc gtttcatctt ccggagctgt aggtggctat 540
gaaggaggac tggcagttaa ggagtggctg ctggctcatg aaggtcatag acttggaaag 600
cctgggctgg gtcctgctgg tataggcgcg ccagggtccc taggtggcgg atccgaaaac 660
ctgtacttcc agagcgatat cgtttttggc aaaagtaatg atggcttcgt ccccacggag 720
agctacggaa ccactagtgt gcagaatgtc tcacaaatct ttgggagaaa tgacgaaagt 780
accatgccta caaggagcta tggaacagtc tgtcccagaa actgggattt tcaccaagga 840
aaatgctttt tcttctcctt ctccgaatca ccttggaaag acagcatgga ttattgtgca 900
acacaagggt ccacactggc aattgtcaac actccagaga aactgaagta tcttcaggac 960
atagctggta ttgagaatta ctttattggt ttggtacgtc agcctggaga gaaaaagtgg 1020
cgctggatca acaactctgt gttcaatggc aatgttacca atcaggacca gaacttcgac 1080
tgtgtcacta taggtctgac gaagacatat gatgctgcat catgtgaagt cagctatcgc 1140
tggatctgcg aaatgaatgc caaaggcccg ggagagaatc tatattttca agggcccggc 1200
ggaggtagtc accatcatca ccatcactaa tgaccggt 1238
<210> 98
<211> 388
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of fusion protein
[SNAPlike-proTEV-moCLEC5A-proTEV-Histag]
<400> 98
Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro
1 5 10 15
Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile
20 25 30
Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro
35 40 45
Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr
50 55 60
Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe
65 70 75 80
Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr
85 90 95
Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val
100 105 110
Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr
115 120 125
Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile
130 135 140
Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu
145 150 155 160
Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg
165 170 175
Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser
180 185 190
Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Val Phe
195 200 205
Gly Lys Ser Asn Asp Gly Phe Val Pro Thr Glu Ser Tyr Gly Thr Thr
210 215 220
Ser Val Gln Asn Val Ser Gln Ile Phe Gly Arg Asn Asp Glu Ser Thr
225 230 235 240
Met Pro Thr Arg Ser Tyr Gly Thr Val Cys Pro Arg Asn Trp Asp Phe
245 250 255
His Gln Gly Lys Cys Phe Phe Phe Ser Phe Ser Glu Ser Pro Trp Lys
260 265 270
Asp Ser Met Asp Tyr Cys Ala Thr Gln Gly Ser Thr Leu Ala Ile Val
275 280 285
Asn Thr Pro Glu Lys Leu Lys Tyr Leu Gln Asp Ile Ala Gly Ile Glu
290 295 300
Asn Tyr Phe Ile Gly Leu Val Arg Gln Pro Gly Glu Lys Lys Trp Arg
305 310 315 320
Trp Ile Asn Asn Ser Val Phe Asn Gly Asn Val Thr Asn Gln Asp Gln
325 330 335
Asn Phe Asp Cys Val Thr Ile Gly Leu Thr Lys Thr Tyr Asp Ala Ala
340 345 350
Ser Cys Glu Val Ser Tyr Arg Trp Ile Cys Glu Met Asn Ala Lys Gly
355 360 365
Pro Gly Glu Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser His His
370 375 380
His His His His
385
<210> 99
<211> 1229
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding ssBiP- SNAPlike -proTEV- soluble form of
human C-type like lectin (CLEC5A) - proTEV- Histag for expression
in S2 cells
<400> 99
atgaagttat gcatattact ggccgtcgtg gtggcctttg ttggcctctc gctcgggaga 60
tctagatctg acaaagactg cgaaatgaaa agaactacat tggattcacc acttgggaag 120
ttggaactga gtggatgcga gcaaggattg catgaaatta agctactggg aaaaggaact 180
tctgctgctg atgcagttga agttccagca ccagcagctg ttcttggagg tcctgagccc 240
ctcatgcaag ccacagcctg gcttaacgca tatttccacc agcctgaggc cattgaggaa 300
tttccagtcc ccgcccttca ccatcctgtg tttcagcagg agagcttcac ccgccaggtc 360
ctgtggaaat tgctgaaggt ggtcaagttt ggtgaagtga tttcatatca gcaacttgct 420
gcattggccg gtaaccccgc agctacagct gccgtgaaaa ctgctctcag cggaaatcct 480
gtgcccatcc tgatcccttg tcacagagtc gtttcatctt ccggagctgt aggtggctat 540
gaaggaggac tggcagttaa ggagtggctg ctggctcatg aaggtcatag acttggaaag 600
cctgggctgg gtcctgctgg tataggcgcg ccagggtccc taggtggcgg atccgaaaac 660
ctgtacttcc agagcgatat ctttaacaaa agtaacgatg gtttcaccac caccaggagc 720
tatggaacag tctcacagat ttttgggagc agttccccaa gtcccaacgg cttcattacc 780
acaaggagct atggaacagt ctgccccaaa gactgggaat tttatcaagc aagatgtttt 840
ttcttatcca cttctgaatc atcttggaat gaaagcaggg acttttgcaa aggaaaaggc 900
tccacattgg caattgtcaa cacgccagag aaactgaagt ttcttcagga cataactgat 960
gctgagaagt attttattgg cttaatttac catcgtgaag agaaaaggtg gcgttggatc 1020
aacaactctg tgttcaatgg caatgttacc aatcagaatc agaatttcaa ctgtgcgacc 1080
attggcctaa caaagacatt tgatgctgca tcatgtgaca tcagctaccg caggatctgt 1140
gagaagaatg ccaaaggccc gggagagaat ctatattttc aagggcccgg cggaggtagt 1200
caccatcatc accatcacta atgaccggt 1229
<210> 100
<211> 385
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of fusion protein
[SNAPlike-proTEV-huCLEC5A-proTEV-Histag]
<400> 100
Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro
1 5 10 15
Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile
20 25 30
Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro
35 40 45
Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr
50 55 60
Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe
65 70 75 80
Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr
85 90 95
Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val
100 105 110
Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr
115 120 125
Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile
130 135 140
Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu
145 150 155 160
Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg
165 170 175
Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser
180 185 190
Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Phe Asn
195 200 205
Lys Ser Asn Asp Gly Phe Thr Thr Thr Arg Ser Tyr Gly Thr Val Ser
210 215 220
Gln Ile Phe Gly Ser Ser Ser Pro Ser Pro Asn Gly Phe Ile Thr Thr
225 230 235 240
Arg Ser Tyr Gly Thr Val Cys Pro Lys Asp Trp Glu Phe Tyr Gln Ala
245 250 255
Arg Cys Phe Phe Leu Ser Thr Ser Glu Ser Ser Trp Asn Glu Ser Arg
260 265 270
Asp Phe Cys Lys Gly Lys Gly Ser Thr Leu Ala Ile Val Asn Thr Pro
275 280 285
Glu Lys Leu Lys Phe Leu Gln Asp Ile Thr Asp Ala Glu Lys Tyr Phe
290 295 300
Ile Gly Leu Ile Tyr His Arg Glu Glu Lys Arg Trp Arg Trp Ile Asn
305 310 315 320
Asn Ser Val Phe Asn Gly Asn Val Thr Asn Gln Asn Gln Asn Phe Asn
325 330 335
Cys Ala Thr Ile Gly Leu Thr Lys Thr Phe Asp Ala Ala Ser Cys Asp
340 345 350
Ile Ser Tyr Arg Arg Ile Cys Glu Lys Asn Ala Lys Gly Pro Gly Glu
355 360 365
Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser His His His His His
370 375 380
His
385
<210> 101
<211> 962
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding BiPlike- SNAPlike- cxVAGO protein from
Culex quinquefasciatus - Histag for expression in S2 cells
<400> 101
atgaaactat gtattctact tgcagttgtt gcgttcgtag gattgtcctt aagatctgac 60
aaagactgcg aaatgaaaag aactacattg gattcaccac ttgggaagtt ggaactgagt 120
ggatgcgagc aaggattgca tgaaattaag ctactgggaa aaggaacttc tgctgctgat 180
gcagttgaag ttccagcacc agcagctgtt cttggaggtc ctgagcccct catgcaagcc 240
acagcctggc ttaacgcata tttccaccag cctgaggcca ttgaggaatt tccagtcccc 300
gcccttcacc atcctgtgtt tcagcaggag agcttcaccc gccaggtcct gtggaaattg 360
ctgaaggtgg tcaagtttgg tgaagtgatt tcatatcagc aacttgctgc attggccggt 420
aaccccgcag ctacagctgc cgtgaaaact gctctcagcg gaaatcctgt gcccatcctg 480
atcccttgtc acagagtcgt ttcatcttcc ggagctgtag gtggctatga aggaggactg 540
gcagttaagg agtggctgct ggctcatgaa ggtcatagac ttggaaagcc tgggctgggt 600
cctgctggta taggcgcgcc agggtccctg gagggaggtg gcgggtctga agccgttcta 660
caaaatgccg agcatccaga ttaccctgga aagtgttacg acgaaggtac gcagaccgtt 720
gtagctcccc tagaaagtgc gaagctacca aaatcgtgta caaaggtatt ctgctcgact 780
aacctttcac tgacctatac tacgtgtggg tcagtacttg tcaatgaccc gcactgcgag 840
aagatcgaac aagacctgac taaagacttc ccagagtgct gtcacaagta taaatgtgaa 900
ctggagggag tagtcacgta ccacggaggt ggccatcacc atcaccatca ctgatgaccg 960
gt 962
<210> 102
<211> 300
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of fusion protein [SNAPlike-cxVAGO-Histag]
<400> 102
Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro
1 5 10 15
Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile
20 25 30
Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro
35 40 45
Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr
50 55 60
Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe
65 70 75 80
Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr
85 90 95
Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val
100 105 110
Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr
115 120 125
Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile
130 135 140
Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu
145 150 155 160
Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg
165 170 175
Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser
180 185 190
Leu Glu Gly Gly Gly Gly Ser Glu Ala Val Leu Gln Asn Ala Glu His
195 200 205
Pro Asp Tyr Pro Gly Lys Cys Tyr Asp Glu Gly Thr Gln Thr Val Val
210 215 220
Ala Pro Leu Glu Ser Ala Lys Leu Pro Lys Ser Cys Thr Lys Val Phe
225 230 235 240
Cys Ser Thr Asn Leu Ser Leu Thr Tyr Thr Thr Cys Gly Ser Val Leu
245 250 255
Val Asn Asp Pro His Cys Glu Lys Ile Glu Gln Asp Leu Thr Lys Asp
260 265 270
Phe Pro Glu Cys Cys His Lys Tyr Lys Cys Glu Leu Glu Gly Val Val
275 280 285
Thr Tyr His Gly Gly Gly His His His His His His
290 295 300
<210> 103
<211> 962
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding BiPlike- SNAPlike- aaVAGO protein from
Aedes albopictus - Histag for expression in S2 cells
<400> 103
atgaaactat gtattctact tgcagttgtt gcgttcgtag gattgtcctt aagatctgac 60
aaagactgcg aaatgaaaag aactacattg gattcaccac ttgggaagtt ggaactgagt 120
ggatgcgagc aaggattgca tgaaattaag ctactgggaa aaggaacttc tgctgctgat 180
gcagttgaag ttccagcacc agcagctgtt cttggaggtc ctgagcccct catgcaagcc 240
acagcctggc ttaacgcata tttccaccag cctgaggcca ttgaggaatt tccagtcccc 300
gcccttcacc atcctgtgtt tcagcaggag agcttcaccc gccaggtcct gtggaaattg 360
ctgaaggtgg tcaagtttgg tgaagtgatt tcatatcagc aacttgctgc attggccggt 420
aaccccgcag ctacagctgc cgtgaaaact gctctcagcg gaaatcctgt gcccatcctg 480
atcccttgtc acagagtcgt ttcatcttcc ggagctgtag gtggctatga aggaggactg 540
gcagttaagg agtggctgct ggctcatgaa ggtcatagac ttggaaagcc tgggctgggt 600
cctgctggta taggcgcgcc agggtccctg gagggaggtg gcgggtctac ggctatcttc 660
ccaaattcgg agaacaaaga tttcccaggc gaatgctatg acacggagac taagattcat 720
ttcaagccag gggaaaatcg tcaacgacct ggcaactgtg aagagatgtc atgcggaact 780
gacttctcga ttcacttttt cggatgcgga ctagctatac tagacgatga cccggattgc 840
gagatcccag ttcaggattt cacaaaggac acgcagtgtt gccataagta caagtgtgtg 900
cgtaacggtg aagtcaatta cattggaggt ggccatcacc atcaccatca ctgatgaccg 960
gt 962
<210> 104
<211> 300
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of fusion protein [SNAPlike-aaVAGO-Histag]
<400> 104
Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro
1 5 10 15
Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile
20 25 30
Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro
35 40 45
Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr
50 55 60
Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe
65 70 75 80
Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr
85 90 95
Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val
100 105 110
Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr
115 120 125
Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile
130 135 140
Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu
145 150 155 160
Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg
165 170 175
Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser
180 185 190
Leu Glu Gly Gly Gly Gly Ser Thr Ala Ile Phe Pro Asn Ser Glu Asn
195 200 205
Lys Asp Phe Pro Gly Glu Cys Tyr Asp Thr Glu Thr Lys Ile His Phe
210 215 220
Lys Pro Gly Glu Asn Arg Gln Arg Pro Gly Asn Cys Glu Glu Met Ser
225 230 235 240
Cys Gly Thr Asp Phe Ser Ile His Phe Phe Gly Cys Gly Leu Ala Ile
245 250 255
Leu Asp Asp Asp Pro Asp Cys Glu Ile Pro Val Gln Asp Phe Thr Lys
260 265 270
Asp Thr Gln Cys Cys His Lys Tyr Lys Cys Val Arg Asn Gly Glu Val
275 280 285
Asn Tyr Ile Gly Gly Gly His His His His His His
290 295 300
<210> 105
<211> 4108
<212> DNA
<213> artificial
<220>
<223> DNA sequence of OpIE2SP-SNAP cloned into pUC57 for constitutive
expression of secreted chimeric SNAP-target protein in
invertebrate cells
<400> 105
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtggaat tctcatgatg ataaacaatg 420
tatggtgcta atgttgcttc aacaacaatt ctgttgaact gtgttttcat gtttgccaac 480
aagcaccttt atactcggtg gcctccccac caccaacttt tttgcactgc aaaaaaacac 540
gcttttgcac gcgggcccat acatagtaca aactctacgt ttcgtagact attttacata 600
aatagtctac accgttgtat acgctccaaa tacactacca cacattgaac ctttttgcag 660
tgcaaaaaag tacgtgtcgg cagtcacgta ggccggcctt atcgggtcgc gtcctgtcac 720
gtacgaatca cattatcgga ccggacgagt gttgtcttat cgtgacagga cgccagcttc 780
ctgtgttgct aaccgcagcc ggacgcaact ccttatcgga acaggacgcg cctccatatc 840
agccgcgcgt tatctcatgc gcgtgaccgg acacgaggcg cccgtcccgc ttatcgcgcc 900
tataaataca gcccgcaacg atctggtaaa cacagttgaa cagcatctgt tcgaaggatc 960
cttgatcgag ctagcatgaa actatgtatt ctacttgcag ttgttgcgtt cgtaggattg 1020
tccttaagat ctgacaaaga ctgcgaaatg aaaagaacta cattggattc accacttggg 1080
aagttggaac tgagtggatg cgagcaagga ttgcatgaaa ttaagctact gggaaaagga 1140
acttctgctg ctgatgcagt tgaagttcca gcaccagcag ctgttcttgg aggtcctgag 1200
cccctcatgc aagccacagc ctggcttaac gcatatttcc accagcctga ggccattgag 1260
gaatttccag tccccgccct tcaccatcct gtgtttcagc aggagagctt cacccgccag 1320
gtcctgtgga aattgctgaa ggtggtcaag tttggtgaag tgatttcata tcagcaactt 1380
gctgcattgg ccggtaaccc cgcagctaca gctgccgtga aaactgctct cagcggaaat 1440
cctgtgccca tcctgatccc ttgtcacaga gtcgtttcat cttccggagc tgtaggtggc 1500
tatgaaggag gactggcagt taaggagtgg ctgctggctc atgaaggtca tagacttgga 1560
aagcctgggc tgggtcctgc tggtataggc gcgccagggt ccctaggtgg cggatccgaa 1620
aacctgtact tccagagcga tatcggaggt ggaggcccgg gaggtggcgg aagtgactat 1680
aaagatgacg acgataagtg ataagcggcc gcaaaaccgg ttgagtttat ctgactaaat 1740
cttagtttgt attgtcatgt tttaatacaa tatgttatgt ttaaatatgt ttttaataaa 1800
ttttataaaa taatttcaac ttttattgta acaacattgt ccatttacac actcctttca 1860
agcgcgtgaa gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg 1920
ctcacaattc cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa 1980
tgagtgagct aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac 2040
ctgtcgtgcc agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt 2100
gggcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga 2160
gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca 2220
ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg 2280
ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt 2340
cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc 2400
ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct 2460
tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc ggtgtaggtc 2520
gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta 2580
tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca 2640
gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag 2700
tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc tctgctgaag 2760
ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt 2820
agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa 2880
gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg 2940
attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga 3000
agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta 3060
atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc 3120
cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg 3180
ataccgcgag acccacgctc accggctcca gatttatcag caataaacca gccagccgga 3240
agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt 3300
tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt 3360
gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc 3420
caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc 3480
ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca 3540
gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag 3600
tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg 3660
tcaatacggg ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa 3720
cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa 3780
cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga 3840
gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga 3900
atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta ttgtctcatg 3960
agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt 4020
ccccgaaaag tgccacctga cgtctaagaa accattatta tcatgacatt aacctataaa 4080
aataggcgta tcacgaggcc ctttcgtc 4108
<210> 106
<211> 24
<212> DNA
<213> artificial
<220>
<223> DNA sequence of C-term peptide tag of OpIE2SP-SNAP
<400> 106
gactataaag atgacgacga taag 24
<210> 107
<211> 8
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of C-term peptide tag of OpIE2SP-SNAP
<400> 107
Asp Tyr Lys Asp Asp Asp Asp Lys
1 5
<210> 108
<211> 2200
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding ssBiP-SNAPlike-proTEV1-N nucleoprotein of
the Crimean-Congo hemorragic fever virus-proTEV2-Histag for
expression in S2 cells
<400> 108
atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60
gacaaagact gcgaaatgaa aagaactaca ttggattcac cacttgggaa gttggaactg 120
agtggatgcg agcaaggatt gcatgaaatt aagctactgg gaaaaggaac ttctgctgct 180
gatgcagttg aagttccagc accagcagct gttcttggag gtcctgagcc cctcatgcaa 240
gccacagcct ggcttaacgc atatttccac cagcctgagg ccattgagga atttccagtc 300
cccgcccttc accatcctgt gtttcagcag gagagcttca cccgccaggt cctgtggaaa 360
ttgctgaagg tggtcaagtt tggtgaagtg atttcatatc agcaacttgc tgcattggcc 420
ggtaaccccg cagctacagc tgccgtgaaa actgctctca gcggaaatcc tgtgcccatc 480
ctgatccctt gtcacagagt cgtttcatct tccggagctg taggtggcta tgaaggagga 540
ctggcagtta aggagtggct gctggctcat gaaggtcata gacttggaaa gcctgggctg 600
ggtcctgctg gtataggcgc gccagggtcc ctaggtggcg gatccgaaaa cctgtacttc 660
cagagcgata tcgaaaacaa gatcgaggtg aataacaaag atgagatgaa caggtggttt 720
gaagagttca aaaaaggaaa tggacttgtg gacaccttca caaactccta ttccttttgc 780
gagagtgttc ccaatttgga caggtttgtg tttcagatgg ccagtgccac cgatgatgca 840
cagaaggact ccatctacgc atctgctctg gtggaggcaa caaagttttg tgcacctata 900
tatgagtgcg catgggttag ctccactggc attgtaaaaa agggacttga atggttcgag 960
aaaaatgcag gaaccattaa gtcctgggat gaaagttata ctgagctaaa ggtcgacgtc 1020
ccgaaaatag agcagcttac gggttaccaa caagctgcct tgaagtggag aaaagacata 1080
ggtttccgtg tcaatgccaa cacagcagct ctgagcaaca aagtcctcgc agaatacaaa 1140
gtccctggtg agattgtgat gtctgtcaaa gagatgctgt cagacatgat taggagaagg 1200
aacctgattc taaacagggg tggtgatgag aacccacgtg gcccagtgag ccatgagcat 1260
gtagactggt gcagggagtt tgtcaaaggc aaatacatca tggccttcaa cccaccatgg 1320
ggggacatca acaagtcagg ccgttcagga atagcacttg ttgcaacagg ccttgctaag 1380
cttgcagaga ctgaaggaaa gggaatattt gatgaagcca aaaagactgt ggaggccctc 1440
aacgggtatc tggacaagca taaggacgaa gttgatagag caagcgccga cagcatgata 1500
acaaaccttc ttaagcatat tgccaaggca caggagctct ataaaaattc atctgcactt 1560
cgtgcacaaa gcgcacagat tgacactgct ttcagctcat actattggct ttacaaggct 1620
ggcgtgactc ctgaaacctt cccgacggtg tcacagttcc tctttgagct agggaaacag 1680
ccaagaggta ccaagaaaat gaagaaggct cttctgagca ccccaatgaa gtgggggaag 1740
aagctttatg agctctttgc cgatgattct ttccagcaga acaggattta catgcatcct 1800
gccgtgctta cagctggtag aatcagtgaa atgggagtct gctttgggac aatccctgtg 1860
gccaatcctg atgatgctgc ccaaggatct ggacacacta agtctattct caacctccgt 1920
accaacactg agaccaataa tccgtgtgcc aaaaccatcg tcaagctatt tgaagttcaa 1980
aaaacagggt tcaacattca ggacatggac atagtggcct ctgagcactt gctacaccaa 2040
tcccttgttg gcaagcaatc cccattccag aacgcctaca acgtcaaggg caatgccacc 2100
agtgctaaca tcatcccggg agagaatcta tattttcaag ggcccggcgg aggtagtcac 2160
catcatcacc atcactaatg accggtgcgg ccgcaagctt 2200
<210> 109
<211> 707
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of fusion protein
[SNAPlike-proTEV1-CCHF.N-proTEV2-Histag]
<400> 109
Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro
1 5 10 15
Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile
20 25 30
Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro
35 40 45
Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr
50 55 60
Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe
65 70 75 80
Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr
85 90 95
Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val
100 105 110
Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr
115 120 125
Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile
130 135 140
Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu
145 150 155 160
Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg
165 170 175
Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser
180 185 190
Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Glu Asn
195 200 205
Lys Ile Glu Val Asn Asn Lys Asp Glu Met Asn Arg Trp Phe Glu Glu
210 215 220
Phe Lys Lys Gly Asn Gly Leu Val Asp Thr Phe Thr Asn Ser Tyr Ser
225 230 235 240
Phe Cys Glu Ser Val Pro Asn Leu Asp Arg Phe Val Phe Gln Met Ala
245 250 255
Ser Ala Thr Asp Asp Ala Gln Lys Asp Ser Ile Tyr Ala Ser Ala Leu
260 265 270
Val Glu Ala Thr Lys Phe Cys Ala Pro Ile Tyr Glu Cys Ala Trp Val
275 280 285
Ser Ser Thr Gly Ile Val Lys Lys Gly Leu Glu Trp Phe Glu Lys Asn
290 295 300
Ala Gly Thr Ile Lys Ser Trp Asp Glu Ser Tyr Thr Glu Leu Lys Val
305 310 315 320
Asp Val Pro Lys Ile Glu Gln Leu Thr Gly Tyr Gln Gln Ala Ala Leu
325 330 335
Lys Trp Arg Lys Asp Ile Gly Phe Arg Val Asn Ala Asn Thr Ala Ala
340 345 350
Leu Ser Asn Lys Val Leu Ala Glu Tyr Lys Val Pro Gly Glu Ile Val
355 360 365
Met Ser Val Lys Glu Met Leu Ser Asp Met Ile Arg Arg Arg Asn Leu
370 375 380
Ile Leu Asn Arg Gly Gly Asp Glu Asn Pro Arg Gly Pro Val Ser His
385 390 395 400
Glu His Val Asp Trp Cys Arg Glu Phe Val Lys Gly Lys Tyr Ile Met
405 410 415
Ala Phe Asn Pro Pro Trp Gly Asp Ile Asn Lys Ser Gly Arg Ser Gly
420 425 430
Ile Ala Leu Val Ala Thr Gly Leu Ala Lys Leu Ala Glu Thr Glu Gly
435 440 445
Lys Gly Ile Phe Asp Glu Ala Lys Lys Thr Val Glu Ala Leu Asn Gly
450 455 460
Tyr Leu Asp Lys His Lys Asp Glu Val Asp Arg Ala Ser Ala Asp Ser
465 470 475 480
Met Ile Thr Asn Leu Leu Lys His Ile Ala Lys Ala Gln Glu Leu Tyr
485 490 495
Lys Asn Ser Ser Ala Leu Arg Ala Gln Ser Ala Gln Ile Asp Thr Ala
500 505 510
Phe Ser Ser Tyr Tyr Trp Leu Tyr Lys Ala Gly Val Thr Pro Glu Thr
515 520 525
Phe Pro Thr Val Ser Gln Phe Leu Phe Glu Leu Gly Lys Gln Pro Arg
530 535 540
Gly Thr Lys Lys Met Lys Lys Ala Leu Leu Ser Thr Pro Met Lys Trp
545 550 555 560
Gly Lys Lys Leu Tyr Glu Leu Phe Ala Asp Asp Ser Phe Gln Gln Asn
565 570 575
Arg Ile Tyr Met His Pro Ala Val Leu Thr Ala Gly Arg Ile Ser Glu
580 585 590
Met Gly Val Cys Phe Gly Thr Ile Pro Val Ala Asn Pro Asp Asp Ala
595 600 605
Ala Gln Gly Ser Gly His Thr Lys Ser Ile Leu Asn Leu Arg Thr Asn
610 615 620
Thr Glu Thr Asn Asn Pro Cys Ala Lys Thr Ile Val Lys Leu Phe Glu
625 630 635 640
Val Gln Lys Thr Gly Phe Asn Ile Gln Asp Met Asp Ile Val Ala Ser
645 650 655
Glu His Leu Leu His Gln Ser Leu Val Gly Lys Gln Ser Pro Phe Gln
660 665 670
Asn Ala Tyr Asn Val Lys Gly Asn Ala Thr Ser Ala Asn Ile Ile Pro
675 680 685
Gly Glu Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser His His His
690 695 700
His His His
705
<210> 110
<211> 2974
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding ssBiP-SNAPlike-proTEV1-N nucleoprotein of
the Ebola virus-proTEV2-Histag for expression in S2 cells
<400> 110
atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60
gacaaagact gcgaaatgaa aagaactaca ttggattcac cacttgggaa gttggaactg 120
agtggatgcg agcaaggatt gcatgaaatt aagctactgg gaaaaggaac ttctgctgct 180
gatgcagttg aagttccagc accagcagct gttcttggag gtcctgagcc cctcatgcaa 240
gccacagcct ggcttaacgc atatttccac cagcctgagg ccattgagga atttccagtc 300
cccgcccttc accatcctgt gtttcagcag gagagcttca cccgccaggt cctgtggaaa 360
ttgctgaagg tggtcaagtt tggtgaagtg atttcatatc agcaacttgc tgcattggcc 420
ggtaaccccg cagctacagc tgccgtgaaa actgctctca gcggaaatcc tgtgcccatc 480
ctgatccctt gtcacagagt cgtttcatct tccggagctg taggtggcta tgaaggagga 540
ctggcagtta aggagtggct gctggctcat gaaggtcata gacttggaaa gcctgggctg 600
ggtcctgctg gtataggcgc gccagggtcc ctaggtggcg gatccgaaaa cctgtacttc 660
cagagcgata tcgattctcg tcctcagaaa atctggatgg cgccgagtct cactgaatct 720
gacatggatt accacaaaat cttgacagca ggtctgtccg ttcaacaggg gattgttcgg 780
caaagagtca tcccagtgta tcaagtaaac aatcttgaag aaatttgcca acttatcata 840
caggcctttg aagcaggtgt tgattttcaa gagagtgcgg acagtttcct tctcatgctt 900
tgtcttcatc atgcgtacca gggagattac aaacttttct tggaaagtgg cgcagtcaag 960
tatttggaag ggcacgggtt ccgttttgaa gtcaagaagc gtgatggagt gaagcgcctt 1020
gaggaattgc tgccagcagt atctagtgga aaaaacatta agagaacact tgctgccatg 1080
ccggaagagg agacaactga agctaatgcc ggtcagtttc tctcctttgc aagtctattc 1140
cttccgaaat tggtagtagg agaaaaggct tgccttgaga aggttcaaag gcaaattcaa 1200
gtacatgcag agcaaggact gatacaatat ccaacagctt ggcaatcagt aggacacatg 1260
atggtgattt tccgtttgat gcgaacaaat tttctgatca aatttctcct aatacaccaa 1320
gggatgcaca tggttgccgg gcatgatgcc aacgatgctg tgatttcaaa ttcagtggct 1380
caagctcgtt tttcaggctt attgattgtc aaaacagtac ttgatcatat cctacaaaag 1440
acagaacgag gagttcgtct ccatcctctt gcaaggaccg ccaaggtaaa aaatgaggtg 1500
aactccttta aggctgcact cagctccctg gccaagcatg gagagtatgc tcctttcgcc 1560
cgacttttga acctttctgg agtaaataat cttgagcatg gtcttttccc tcaactatcg 1620
gcaattgcac tcggagtcgc cacagcacac gggagtaccc tcgcaggagt aaatgttgga 1680
gaacagtatc aacaactcag agaggctgcc actgaggctg agaagcaact ccaacaatat 1740
gcagagtctc gcgaacttga ccatcttgga cttgatgatc aggaaaagaa aattcttatg 1800
aacttccatc agaaaaagaa cgaaatcagc ttccagcaaa caaacgctat ggtaactcta 1860
agaaaagagc gcctggccaa gctgacagaa gctatcactg ctgcgtcact gcccaaaaca 1920
agtggacatt acgatgatga tgacgacatt ccctttccag gacccatcaa tgatgacgac 1980
aatcctggcc atcaagatga tgatccgact gactcacagg atacgaccat tcccgatgtg 2040
gtggttgatc ccgatgatgg aagctacggc gaataccaga gttactcgga aaacggcatg 2100
aatgcaccag atgacttggt cctattcgat ctggacgagg acgacgagga cactaagcca 2160
gtgcctaata gatcgaccaa gggtggacaa cagaagaaca gtcaaaaggg ccagcatata 2220
gagggcagac agacacaatc caggccaatt caaaatgtcc caggccctca cagaacaatc 2280
caccacgcca gtgcgccact cacggacaat gacagaagaa atgaaccctc cggctcaacc 2340
agccctcgca tgctgacacc aattaacgaa gaggcagacc cactggacga tgccgacgac 2400
gagacgtcta gccttccgcc cttggagtca gatgatgaag agcaggacag ggacggaact 2460
tccaaccgca cacccactgt cgccccaccg gctcccgtat acagagatca ctctgaaaag 2520
aaagaactcc cgcaagacga gcaacaagat caggaccaca ctcaagaggc caggaaccag 2580
gacagtgaca acacccagtc agaacactct tttgaggaga tgtatcgcca cattctaaga 2640
tcacaggggc catttgatgc tgttttgtat tatcatatga tgaaggatga gcctgtagtt 2700
ttcagtacca gtgatggcaa agagtacacg tatccagact cccttgaaga ggaatatcca 2760
ccatggctca ctgaaaaaga ggctatgaat gaagagaata gatttgttac attggatggt 2820
caacaatttt attggccggt gatgaatcac aagaataaat tcatggcaat cctgcaacat 2880
catcagggcc cgggagagaa tctatatttt caagggcccg gcggaggtag tcaccatcat 2940
caccatcact aatgaccggt gcggccgcaa gctt 2974
<210> 111
<211> 965
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of fusion protein
[SNAPlike-proTEV1-EBO.N-proTEV2-Histag]
<400> 111
Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro
1 5 10 15
Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile
20 25 30
Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro
35 40 45
Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr
50 55 60
Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe
65 70 75 80
Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr
85 90 95
Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val
100 105 110
Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr
115 120 125
Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile
130 135 140
Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu
145 150 155 160
Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg
165 170 175
Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser
180 185 190
Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Asp Ser
195 200 205
Arg Pro Gln Lys Ile Trp Met Ala Pro Ser Leu Thr Glu Ser Asp Met
210 215 220
Asp Tyr His Lys Ile Leu Thr Ala Gly Leu Ser Val Gln Gln Gly Ile
225 230 235 240
Val Arg Gln Arg Val Ile Pro Val Tyr Gln Val Asn Asn Leu Glu Glu
245 250 255
Ile Cys Gln Leu Ile Ile Gln Ala Phe Glu Ala Gly Val Asp Phe Gln
260 265 270
Glu Ser Ala Asp Ser Phe Leu Leu Met Leu Cys Leu His His Ala Tyr
275 280 285
Gln Gly Asp Tyr Lys Leu Phe Leu Glu Ser Gly Ala Val Lys Tyr Leu
290 295 300
Glu Gly His Gly Phe Arg Phe Glu Val Lys Lys Arg Asp Gly Val Lys
305 310 315 320
Arg Leu Glu Glu Leu Leu Pro Ala Val Ser Ser Gly Lys Asn Ile Lys
325 330 335
Arg Thr Leu Ala Ala Met Pro Glu Glu Glu Thr Thr Glu Ala Asn Ala
340 345 350
Gly Gln Phe Leu Ser Phe Ala Ser Leu Phe Leu Pro Lys Leu Val Val
355 360 365
Gly Glu Lys Ala Cys Leu Glu Lys Val Gln Arg Gln Ile Gln Val His
370 375 380
Ala Glu Gln Gly Leu Ile Gln Tyr Pro Thr Ala Trp Gln Ser Val Gly
385 390 395 400
His Met Met Val Ile Phe Arg Leu Met Arg Thr Asn Phe Leu Ile Lys
405 410 415
Phe Leu Leu Ile His Gln Gly Met His Met Val Ala Gly His Asp Ala
420 425 430
Asn Asp Ala Val Ile Ser Asn Ser Val Ala Gln Ala Arg Phe Ser Gly
435 440 445
Leu Leu Ile Val Lys Thr Val Leu Asp His Ile Leu Gln Lys Thr Glu
450 455 460
Arg Gly Val Arg Leu His Pro Leu Ala Arg Thr Ala Lys Val Lys Asn
465 470 475 480
Glu Val Asn Ser Phe Lys Ala Ala Leu Ser Ser Leu Ala Lys His Gly
485 490 495
Glu Tyr Ala Pro Phe Ala Arg Leu Leu Asn Leu Ser Gly Val Asn Asn
500 505 510
Leu Glu His Gly Leu Phe Pro Gln Leu Ser Ala Ile Ala Leu Gly Val
515 520 525
Ala Thr Ala His Gly Ser Thr Leu Ala Gly Val Asn Val Gly Glu Gln
530 535 540
Tyr Gln Gln Leu Arg Glu Ala Ala Thr Glu Ala Glu Lys Gln Leu Gln
545 550 555 560
Gln Tyr Ala Glu Ser Arg Glu Leu Asp His Leu Gly Leu Asp Asp Gln
565 570 575
Glu Lys Lys Ile Leu Met Asn Phe His Gln Lys Lys Asn Glu Ile Ser
580 585 590
Phe Gln Gln Thr Asn Ala Met Val Thr Leu Arg Lys Glu Arg Leu Ala
595 600 605
Lys Leu Thr Glu Ala Ile Thr Ala Ala Ser Leu Pro Lys Thr Ser Gly
610 615 620
His Tyr Asp Asp Asp Asp Asp Ile Pro Phe Pro Gly Pro Ile Asn Asp
625 630 635 640
Asp Asp Asn Pro Gly His Gln Asp Asp Asp Pro Thr Asp Ser Gln Asp
645 650 655
Thr Thr Ile Pro Asp Val Val Val Asp Pro Asp Asp Gly Ser Tyr Gly
660 665 670
Glu Tyr Gln Ser Tyr Ser Glu Asn Gly Met Asn Ala Pro Asp Asp Leu
675 680 685
Val Leu Phe Asp Leu Asp Glu Asp Asp Glu Asp Thr Lys Pro Val Pro
690 695 700
Asn Arg Ser Thr Lys Gly Gly Gln Gln Lys Asn Ser Gln Lys Gly Gln
705 710 715 720
His Ile Glu Gly Arg Gln Thr Gln Ser Arg Pro Ile Gln Asn Val Pro
725 730 735
Gly Pro His Arg Thr Ile His His Ala Ser Ala Pro Leu Thr Asp Asn
740 745 750
Asp Arg Arg Asn Glu Pro Ser Gly Ser Thr Ser Pro Arg Met Leu Thr
755 760 765
Pro Ile Asn Glu Glu Ala Asp Pro Leu Asp Asp Ala Asp Asp Glu Thr
770 775 780
Ser Ser Leu Pro Pro Leu Glu Ser Asp Asp Glu Glu Gln Asp Arg Asp
785 790 795 800
Gly Thr Ser Asn Arg Thr Pro Thr Val Ala Pro Pro Ala Pro Val Tyr
805 810 815
Arg Asp His Ser Glu Lys Lys Glu Leu Pro Gln Asp Glu Gln Gln Asp
820 825 830
Gln Asp His Thr Gln Glu Ala Arg Asn Gln Asp Ser Asp Asn Thr Gln
835 840 845
Ser Glu His Ser Phe Glu Glu Met Tyr Arg His Ile Leu Arg Ser Gln
850 855 860
Gly Pro Phe Asp Ala Val Leu Tyr Tyr His Met Met Lys Asp Glu Pro
865 870 875 880
Val Val Phe Ser Thr Ser Asp Gly Lys Glu Tyr Thr Tyr Pro Asp Ser
885 890 895
Leu Glu Glu Glu Tyr Pro Pro Trp Leu Thr Glu Lys Glu Ala Met Asn
900 905 910
Glu Glu Asn Arg Phe Val Thr Leu Asp Gly Gln Gln Phe Tyr Trp Pro
915 920 925
Val Met Asn His Lys Asn Lys Phe Met Ala Ile Leu Gln His His Gln
930 935 940
Gly Pro Gly Glu Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser His
945 950 955 960
His His His His His
965
<210> 112
<211> 2842
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding ssBiP-SNAPlike-proTEV1-N nucleoprotein of
the Marburg virus-proTEV2-Histag for expression in S2 cells
<400> 112
atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60
gacaaagact gcgaaatgaa aagaactaca ttggattcac cacttgggaa gttggaactg 120
agtggatgcg agcaaggatt gcatgaaatt aagctactgg gaaaaggaac ttctgctgct 180
gatgcagttg aagttccagc accagcagct gttcttggag gtcctgagcc cctcatgcaa 240
gccacagcct ggcttaacgc atatttccac cagcctgagg ccattgagga atttccagtc 300
cccgcccttc accatcctgt gtttcagcag gagagcttca cccgccaggt cctgtggaaa 360
ttgctgaagg tggtcaagtt tggtgaagtg atttcatatc agcaacttgc tgcattggcc 420
ggtaaccccg cagctacagc tgccgtgaaa actgctctca gcggaaatcc tgtgcccatc 480
ctgatccctt gtcacagagt cgtttcatct tccggagctg taggtggcta tgaaggagga 540
ctggcagtta aggagtggct gctggctcat gaaggtcata gacttggaaa gcctgggctg 600
ggtcctgctg gtataggcgc gccagggtcc ctaggtggcg gatccgaaaa cctgtacttc 660
cagagcgata tcgatttaca cagtttgttg gagttgggta caaaacccac tgcccctcat 720
gttcgtaata agaaagtgat attatttgac acaaatcatc aggttagtat ctgtaatcag 780
ataatagatg caataaactc agggattgat cttggtgatc tcctagaagg gggtttgctg 840
acgttgtgtg ttgagcatta ctataattct gataaggata aattcaacac aagtcctatc 900
gcgaagtact tacgtgatgc gggctatgaa tttgatgtca tcaagaatgc agatgcaacc 960
cgctttctgg atgtgattcc taatgaacct cattacagcc ctttaattct agcccttaag 1020
acattggaaa gtactgaatc tcagaggggg agaattgggc tctttttatc attttgcagt 1080
cttttcctcc caaaacttgt cgtcggagac cgagctagta tcgaaaaggc tttaagacaa 1140
gtaacagtgc atcaagaaca ggggatcgtc acatacccta atcattggct taccacaggc 1200
cacatgaaag taattttcgg gattttgagg tccagcttca ttttaaagtt tgtgttgatt 1260
catcaaggag taaatttggt gacaggtcat gatgcctatg acagtatcat tagtaattca 1320
gtaggtcaaa ctagattctc aggacttctt atcgtgaaaa cagttctgga gttcatcttg 1380
caaaaaactg attcaggggt gacactacat cctttggtgc ggacctccaa agtaaaaaat 1440
gaagttgcta gtttcaagca ggcgttgagc aacctagccc gacatgggga atacgcacca 1500
tttgcacggg ttctgaattt atcagggatt aacaacctcg aacatggact ctatcctcag 1560
ctttcagcaa ttgcgctggg tgtggcaaca gcacacggca gtacattggc tggtgtcaat 1620
gttggcgaac aatatcaaca actacgagag gcggcacatg atgcggaagt aaaactacaa 1680
aggcgacatg aacatcagga aattcaagct attgccgagg atgacgagga aaggaagata 1740
ttagaacaat tccaccttca gaaaactgaa atcacacaca gtcagacact agccgtcctc 1800
agccagaaac gagaaaaatt agctcgtctc gctgcagaaa ttgaaaacaa tattgtggaa 1860
gatcagggat ttaagcaatc acagaatcgg gtgtcacagt cgtttttgaa tgaccctaca 1920
cctgtggaag taacggttca agccaggccc atgaatcgac caactgctct gcctccccca 1980
gttgacgaca agattgagca tgaatctaca gaagatagct cttcttcaag tagctttgtt 2040
gacttgaatg atccatttgc actgctgaat gaggacgagg atactcttga tgacagtgtc 2100
atgatccccg gcacaacatc gagagaattt caagggattc ctgaaccgcc aagacaatcc 2160
caagacctca ataacagcca aggaaagcag gaagatgaat ccacaaatcc gattaagaaa 2220
cagtttctga gataccaaga attgcctcct gttcaagagg atgatgaatc ggaatacaca 2280
actgactctc aagaaagcat cgaccaacca ggttccgaca atgaacaagg agttgatctt 2340
ccacctcctc cgttgtacgc tcaggaaaaa agacaggacc caatacagca cccagcagca 2400
aaccctcaag atcccttcgg cagtattggt gatgtaaatg gtgacatctt agaacctata 2460
agatcacctt cttcaccatc tgctcctcag gaagacacaa ggatgaggga agcctatgaa 2520
ttgtcgcctg atttcacaaa tgatgaggat aatcagcaga attggccaca aagagtggtg 2580
acaaagaagg gtagaacttt cctttatcct aatgatcttc tgcaaacaaa tcctccagag 2640
tcacttataa cagccctcgt tgaggaatac caaaatcctg tctcagctaa ggagcttcaa 2700
gcagattggc ccgacatgtc atttgatgaa aggagacatg ttgcgatgaa cttgggcccg 2760
ggagagaatc tatattttca agggcccggc ggaggtagtc accatcatca ccatcactaa 2820
tgaccggtgc ggccgcaagc tt 2842
<210> 113
<211> 921
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of fusion protein
[SNAPlike-proTEV1-EBO.N-proTEV2-Histag]
<400> 113
Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro
1 5 10 15
Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile
20 25 30
Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro
35 40 45
Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr
50 55 60
Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe
65 70 75 80
Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr
85 90 95
Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val
100 105 110
Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr
115 120 125
Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile
130 135 140
Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu
145 150 155 160
Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg
165 170 175
Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser
180 185 190
Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Asp Leu
195 200 205
His Ser Leu Leu Glu Leu Gly Thr Lys Pro Thr Ala Pro His Val Arg
210 215 220
Asn Lys Lys Val Ile Leu Phe Asp Thr Asn His Gln Val Ser Ile Cys
225 230 235 240
Asn Gln Ile Ile Asp Ala Ile Asn Ser Gly Ile Asp Leu Gly Asp Leu
245 250 255
Leu Glu Gly Gly Leu Leu Thr Leu Cys Val Glu His Tyr Tyr Asn Ser
260 265 270
Asp Lys Asp Lys Phe Asn Thr Ser Pro Ile Ala Lys Tyr Leu Arg Asp
275 280 285
Ala Gly Tyr Glu Phe Asp Val Ile Lys Asn Ala Asp Ala Thr Arg Phe
290 295 300
Leu Asp Val Ile Pro Asn Glu Pro His Tyr Ser Pro Leu Ile Leu Ala
305 310 315 320
Leu Lys Thr Leu Glu Ser Thr Glu Ser Gln Arg Gly Arg Ile Gly Leu
325 330 335
Phe Leu Ser Phe Cys Ser Leu Phe Leu Pro Lys Leu Val Val Gly Asp
340 345 350
Arg Ala Ser Ile Glu Lys Ala Leu Arg Gln Val Thr Val His Gln Glu
355 360 365
Gln Gly Ile Val Thr Tyr Pro Asn His Trp Leu Thr Thr Gly His Met
370 375 380
Lys Val Ile Phe Gly Ile Leu Arg Ser Ser Phe Ile Leu Lys Phe Val
385 390 395 400
Leu Ile His Gln Gly Val Asn Leu Val Thr Gly His Asp Ala Tyr Asp
405 410 415
Ser Ile Ile Ser Asn Ser Val Gly Gln Thr Arg Phe Ser Gly Leu Leu
420 425 430
Ile Val Lys Thr Val Leu Glu Phe Ile Leu Gln Lys Thr Asp Ser Gly
435 440 445
Val Thr Leu His Pro Leu Val Arg Thr Ser Lys Val Lys Asn Glu Val
450 455 460
Ala Ser Phe Lys Gln Ala Leu Ser Asn Leu Ala Arg His Gly Glu Tyr
465 470 475 480
Ala Pro Phe Ala Arg Val Leu Asn Leu Ser Gly Ile Asn Asn Leu Glu
485 490 495
His Gly Leu Tyr Pro Gln Leu Ser Ala Ile Ala Leu Gly Val Ala Thr
500 505 510
Ala His Gly Ser Thr Leu Ala Gly Val Asn Val Gly Glu Gln Tyr Gln
515 520 525
Gln Leu Arg Glu Ala Ala His Asp Ala Glu Val Lys Leu Gln Arg Arg
530 535 540
His Glu His Gln Glu Ile Gln Ala Ile Ala Glu Asp Asp Glu Glu Arg
545 550 555 560
Lys Ile Leu Glu Gln Phe His Leu Gln Lys Thr Glu Ile Thr His Ser
565 570 575
Gln Thr Leu Ala Val Leu Ser Gln Lys Arg Glu Lys Leu Ala Arg Leu
580 585 590
Ala Ala Glu Ile Glu Asn Asn Ile Val Glu Asp Gln Gly Phe Lys Gln
595 600 605
Ser Gln Asn Arg Val Ser Gln Ser Phe Leu Asn Asp Pro Thr Pro Val
610 615 620
Glu Val Thr Val Gln Ala Arg Pro Met Asn Arg Pro Thr Ala Leu Pro
625 630 635 640
Pro Pro Val Asp Asp Lys Ile Glu His Glu Ser Thr Glu Asp Ser Ser
645 650 655
Ser Ser Ser Ser Phe Val Asp Leu Asn Asp Pro Phe Ala Leu Leu Asn
660 665 670
Glu Asp Glu Asp Thr Leu Asp Asp Ser Val Met Ile Pro Gly Thr Thr
675 680 685
Ser Arg Glu Phe Gln Gly Ile Pro Glu Pro Pro Arg Gln Ser Gln Asp
690 695 700
Leu Asn Asn Ser Gln Gly Lys Gln Glu Asp Glu Ser Thr Asn Pro Ile
705 710 715 720
Lys Lys Gln Phe Leu Arg Tyr Gln Glu Leu Pro Pro Val Gln Glu Asp
725 730 735
Asp Glu Ser Glu Tyr Thr Thr Asp Ser Gln Glu Ser Ile Asp Gln Pro
740 745 750
Gly Ser Asp Asn Glu Gln Gly Val Asp Leu Pro Pro Pro Pro Leu Tyr
755 760 765
Ala Gln Glu Lys Arg Gln Asp Pro Ile Gln His Pro Ala Ala Asn Pro
770 775 780
Gln Asp Pro Phe Gly Ser Ile Gly Asp Val Asn Gly Asp Ile Leu Glu
785 790 795 800
Pro Ile Arg Ser Pro Ser Ser Pro Ser Ala Pro Gln Glu Asp Thr Arg
805 810 815
Met Arg Glu Ala Tyr Glu Leu Ser Pro Asp Phe Thr Asn Asp Glu Asp
820 825 830
Asn Gln Gln Asn Trp Pro Gln Arg Val Val Thr Lys Lys Gly Arg Thr
835 840 845
Phe Leu Tyr Pro Asn Asp Leu Leu Gln Thr Asn Pro Pro Glu Ser Leu
850 855 860
Ile Thr Ala Leu Val Glu Glu Tyr Gln Asn Pro Val Ser Ala Lys Glu
865 870 875 880
Leu Gln Ala Asp Trp Pro Asp Met Ser Phe Asp Glu Arg Arg His Val
885 890 895
Ala Met Asn Leu Gly Pro Gly Glu Asn Leu Tyr Phe Gln Gly Pro Gly
900 905 910
Gly Gly Ser His His His His His His
915 920
<210> 114
<211> 2461
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding ssBiP-SNAPlike-proTEV1-N nucleoprotein of
the Lassa virus-proTEV2-Histag for expression in S2 cells
<400> 114
atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60
gacaaagact gcgaaatgaa aagaactaca ttggattcac cacttgggaa gttggaactg 120
agtggatgcg agcaaggatt gcatgaaatt aagctactgg gaaaaggaac ttctgctgct 180
gatgcagttg aagttccagc accagcagct gttcttggag gtcctgagcc cctcatgcaa 240
gccacagcct ggcttaacgc atatttccac cagcctgagg ccattgagga atttccagtc 300
cccgcccttc accatcctgt gtttcagcag gagagcttca cccgccaggt cctgtggaaa 360
ttgctgaagg tggtcaagtt tggtgaagtg atttcatatc agcaacttgc tgcattggcc 420
ggtaaccccg cagctacagc tgccgtgaaa actgctctca gcggaaatcc tgtgcccatc 480
ctgatccctt gtcacagagt cgtttcatct tccggagctg taggtggcta tgaaggagga 540
ctggcagtta aggagtggct gctggctcat gaaggtcata gacttggaaa gcctgggctg 600
ggtcctgctg gtataggcgc gccagggtcc ctaggtggcg gatccgaaaa cctgtacttc 660
cagagcgata tcagtgcctc aaaggaaata aaatcctttt tgtggacaca atctttgagg 720
agggaattat ctggttactg ctccaacatc aaactacagg tggtgaaaga tgcccaggct 780
cttttacatg gacttgactt ctccgaagtc agtaatgttc aacggttgat gcgcaaggag 840
agaagggatg acaatgattt gaaacggttg agggacctaa atcaagcggt caacaatctt 900
gttgaattaa aatcaactca acaaaagagt atactgagag ttgggactct aacctcagat 960
gacttattaa tcttagccgc tgacctagag aagttaaagt caaaggtgat cagaacagaa 1020
aggccattaa gtgcaggtgt ctatatgggc aacctaagct cacagcaact tgaccaaaga 1080
agagctctcc tgaatatgat aggaatgagt ggtggtaatc aaggggctcg ggctgggaga 1140
gatggagtgg tgagagtttg ggatgtgaaa aatgcagagt tgctcaataa tcagttcggg 1200
accatgccaa gtctgacact ggcatgtctg acaaaacagg ggcaggttga cttgaatgat 1260
gcagtacaag cattgacaga tttgggtttg atctacacag caaagtatcc caacacttca 1320
gacttagaca ggctgactca aagtcatccc atcctaaata tgattgacac caagaaaagc 1380
tctttgaata tctcaggtta taattttagc ttgggtgcag ctgtgaaggc aggagcttgc 1440
atgctggatg gtggcaatat gttggagaca atcaaggtgt cacctcagac aatggatggt 1500
atcctcaaat ccattttaaa ggtcaagaag gctcttggaa tgttcatttc agacacccct 1560
ggtgaaagga atccttatga aaacatactc tacaagattt gtttgtcagg agatggatgg 1620
ccatatattg catcaagaac ctcaataaca ggaagggcct gggaaaacac tgtcgttgat 1680
ctggaatcag atgggaagcc acagaaagct gacagcaaca attccagtaa atccctgcag 1740
tcggcagggt ttaccgctgg gcttacctat tctcagctga tgaccctcaa ggatgcaatg 1800
ctgcaacttg acccaaatgc taagacctgg atggacattg aaggaagacc tgaagatcca 1860
gtggaaattg ccctctatca accaagttca ggctgctaca tacacttctt ccgtgaacct 1920
actgatttaa agcagttcaa gcaggatgct aagtactcac atgggattga tgtcacagac 1980
ctcttcgcta cacaaccggg cttgaccagt gctgtcattg atgcactccc ccggaatatg 2040
gtcattacct gtcaggggtc cgatgacata aggaaactcc ttgaatcaca aggaagaaaa 2100
gacattaaac taattgatat tgccctcagc aaaactgatt ccaggaagta tgaaaatgca 2160
gtctgggacc agtataaaga cttatgccac atgcacacag gtgtcgttgt tgaaaagaag 2220
aaaagaggcg gtaaagagga aataacccct cactgtgcac taatggactg catcatgttt 2280
gatgcagcag tgtcaggagg actgaacaca tcggttttga gagcagtgct gcccagagat 2340
atggtgttca gaacatcgac acctagagtc gttctcccgg gagagaatct atattttcaa 2400
gggcccggcg gaggtagtca ccatcatcac catcactaat gaccggtgcg gccgcaagct 2460
t 2461
<210> 115
<211> 794
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of fusion protein
[SNAPlike-proTEV1-LAS.N-proTEV2-Histag]
<400> 115
Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro
1 5 10 15
Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile
20 25 30
Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro
35 40 45
Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr
50 55 60
Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe
65 70 75 80
Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr
85 90 95
Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val
100 105 110
Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr
115 120 125
Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile
130 135 140
Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu
145 150 155 160
Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg
165 170 175
Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser
180 185 190
Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Ser Ala
195 200 205
Ser Lys Glu Ile Lys Ser Phe Leu Trp Thr Gln Ser Leu Arg Arg Glu
210 215 220
Leu Ser Gly Tyr Cys Ser Asn Ile Lys Leu Gln Val Val Lys Asp Ala
225 230 235 240
Gln Ala Leu Leu His Gly Leu Asp Phe Ser Glu Val Ser Asn Val Gln
245 250 255
Arg Leu Met Arg Lys Glu Arg Arg Asp Asp Asn Asp Leu Lys Arg Leu
260 265 270
Arg Asp Leu Asn Gln Ala Val Asn Asn Leu Val Glu Leu Lys Ser Thr
275 280 285
Gln Gln Lys Ser Ile Leu Arg Val Gly Thr Leu Thr Ser Asp Asp Leu
290 295 300
Leu Ile Leu Ala Ala Asp Leu Glu Lys Leu Lys Ser Lys Val Ile Arg
305 310 315 320
Thr Glu Arg Pro Leu Ser Ala Gly Val Tyr Met Gly Asn Leu Ser Ser
325 330 335
Gln Gln Leu Asp Gln Arg Arg Ala Leu Leu Asn Met Ile Gly Met Ser
340 345 350
Gly Gly Asn Gln Gly Ala Arg Ala Gly Arg Asp Gly Val Val Arg Val
355 360 365
Trp Asp Val Lys Asn Ala Glu Leu Leu Asn Asn Gln Phe Gly Thr Met
370 375 380
Pro Ser Leu Thr Leu Ala Cys Leu Thr Lys Gln Gly Gln Val Asp Leu
385 390 395 400
Asn Asp Ala Val Gln Ala Leu Thr Asp Leu Gly Leu Ile Tyr Thr Ala
405 410 415
Lys Tyr Pro Asn Thr Ser Asp Leu Asp Arg Leu Thr Gln Ser His Pro
420 425 430
Ile Leu Asn Met Ile Asp Thr Lys Lys Ser Ser Leu Asn Ile Ser Gly
435 440 445
Tyr Asn Phe Ser Leu Gly Ala Ala Val Lys Ala Gly Ala Cys Met Leu
450 455 460
Asp Gly Gly Asn Met Leu Glu Thr Ile Lys Val Ser Pro Gln Thr Met
465 470 475 480
Asp Gly Ile Leu Lys Ser Ile Leu Lys Val Lys Lys Ala Leu Gly Met
485 490 495
Phe Ile Ser Asp Thr Pro Gly Glu Arg Asn Pro Tyr Glu Asn Ile Leu
500 505 510
Tyr Lys Ile Cys Leu Ser Gly Asp Gly Trp Pro Tyr Ile Ala Ser Arg
515 520 525
Thr Ser Ile Thr Gly Arg Ala Trp Glu Asn Thr Val Val Asp Leu Glu
530 535 540
Ser Asp Gly Lys Pro Gln Lys Ala Asp Ser Asn Asn Ser Ser Lys Ser
545 550 555 560
Leu Gln Ser Ala Gly Phe Thr Ala Gly Leu Thr Tyr Ser Gln Leu Met
565 570 575
Thr Leu Lys Asp Ala Met Leu Gln Leu Asp Pro Asn Ala Lys Thr Trp
580 585 590
Met Asp Ile Glu Gly Arg Pro Glu Asp Pro Val Glu Ile Ala Leu Tyr
595 600 605
Gln Pro Ser Ser Gly Cys Tyr Ile His Phe Phe Arg Glu Pro Thr Asp
610 615 620
Leu Lys Gln Phe Lys Gln Asp Ala Lys Tyr Ser His Gly Ile Asp Val
625 630 635 640
Thr Asp Leu Phe Ala Thr Gln Pro Gly Leu Thr Ser Ala Val Ile Asp
645 650 655
Ala Leu Pro Arg Asn Met Val Ile Thr Cys Gln Gly Ser Asp Asp Ile
660 665 670
Arg Lys Leu Leu Glu Ser Gln Gly Arg Lys Asp Ile Lys Leu Ile Asp
675 680 685
Ile Ala Leu Ser Lys Thr Asp Ser Arg Lys Tyr Glu Asn Ala Val Trp
690 695 700
Asp Gln Tyr Lys Asp Leu Cys His Met His Thr Gly Val Val Val Glu
705 710 715 720
Lys Lys Lys Arg Gly Gly Lys Glu Glu Ile Thr Pro His Cys Ala Leu
725 730 735
Met Asp Cys Ile Met Phe Asp Ala Ala Val Ser Gly Gly Leu Asn Thr
740 745 750
Ser Val Leu Arg Ala Val Leu Pro Arg Asp Met Val Phe Arg Thr Ser
755 760 765
Thr Pro Arg Val Val Leu Pro Gly Glu Asn Leu Tyr Phe Gln Gly Pro
770 775 780
Gly Gly Gly Ser His His His His His His
785 790
<210> 116
<211> 2446
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding ssBiP-SNAPlike-proTEV1-N nucleoprotein of
the Junin virus-proTEV2-Histag for expression in S2 cells
<400> 116
atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60
gacaaagact gcgaaatgaa aagaactaca ttggattcac cacttgggaa gttggaactg 120
agtggatgcg agcaaggatt gcatgaaatt aagctactgg gaaaaggaac ttctgctgct 180
gatgcagttg aagttccagc accagcagct gttcttggag gtcctgagcc cctcatgcaa 240
gccacagcct ggcttaacgc atatttccac cagcctgagg ccattgagga atttccagtc 300
cccgcccttc accatcctgt gtttcagcag gagagcttca cccgccaggt cctgtggaaa 360
ttgctgaagg tggtcaagtt tggtgaagtg atttcatatc agcaacttgc tgcattggcc 420
ggtaaccccg cagctacagc tgccgtgaaa actgctctca gcggaaatcc tgtgcccatc 480
ctgatccctt gtcacagagt cgtttcatct tccggagctg taggtggcta tgaaggagga 540
ctggcagtta aggagtggct gctggctcat gaaggtcata gacttggaaa gcctgggctg 600
ggtcctgctg gtataggcgc gccagggtcc ctaggtggcg gatccgaaaa cctgtacttc 660
cagagcgata tcgcacactc caaggaggtt cctagcttta gatggactca gtccttaagg 720
agaggtttga gccaattcac tcagactgtc aagtcagatg ttttgaagga cgccaagcta 780
attgctgaca gcatcgactt caaccaagtg gcacaggtgc agcgggcact cagaaagact 840
aaaaaggggg aagaagacct caataagttg agggacctga ataaagaggt tgacagactc 900
atgtccatga ggagtgttca acgaaacaca gttttcaagg tgggtgatct ggggagggat 960
gaactgatgg agttggcgtc tgaccttgag aaattaaaaa acaagataag aagagcagag 1020
acaggctctc agggggttta catgggtaac ttgtcccagt cacaacttgc taaaagatca 1080
gagatattga gaacactggg atttcaacag caagggactg ggggaaatgg tgtggtgagg 1140
atatgggatg ttaaagaccc ttcaaagcta aacaatcagt ttggctctgt tcctgcattg 1200
acaattgcat gcatgactgt tcaaggaggt gagacaatga acagtgtcat acaggcttta 1260
acctcacttg ggcttctata cactgtgaag tatccaaact taagtgacct tgacagactg 1320
actcaggaac atgactgcct tcagattgtg actaaagatg aaagctccat caatatttct 1380
ggttacaact tcagtctttc agctgcagta aaggctggag catctattct tgatggtgga 1440
aacatgttgg aaacaatcag agtcacccca gaaaacttct cttccctcat aaaatcaacc 1500
attcaggtta aacgaagaga aggcatgttt attgatgaga aaccaggcaa tagaaatcct 1560
tatgaaaacc ttttgtacaa actttgtctt tctggcgatg gttggcctta tattggttca 1620
agatcacaaa tcacaggcag gtcatgggac aacacaagta ttgatctgac aaggaaacca 1680
gttgctggtc ctagacagcc ggaaaaaaac ggtcagaatt tgagattggc taacttgaca 1740
gagatacaag aagctgtcat cagagaggca gtggggaaac tcgaccccac caacaccctt 1800
tggctcgaca ttgaaggacc agccactgac cctgttgaga tggcattatt ccaacctgca 1860
ggtaagcagt acattcactg cttcagaaaa ccacatgatg agaaagggtt taaaaatggt 1920
agcagacact ctcacggcat cttaatgaag gacatagaag atgcaatgcc aggagttctt 1980
agttacgtga tcggcttgct gcctccagac atggttgtga ctactcaagg ttccgatgac 2040
atcaggaagt tgtttgacct ccatggaaga agggatctta aactggttga tgttaagctc 2100
acatctgaac aagccaggca gtttgatcaa caggtctggg agaaatatgg tcacttatgc 2160
aaatatcaca atggagtggt tgtcaataag aaaaagaggg aaaaggatac tcccttcaag 2220
ttggcctcca gtgaaccaca ctgtgctctg ctagactgca taatgtttca gtcagtgcta 2280
gatgggaagc tctatgagga ggaacctaca cctctattac caccgagctt gctgttcctc 2340
ccgaaggcag cctatgcact cccgggagag aatctatatt ttcaagggcc cggcggaggt 2400
agtcaccatc atcaccatca ctaatgaccg gtgcggccgc aagctt 2446
<210> 117
<211> 789
<212> PRT
<213> artificial
<220>
<223> Aa sequence of fusion protein
[SNAPlike-proTEV1-JUN.N-proTEV2-Histag]
<400> 117
Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro
1 5 10 15
Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile
20 25 30
Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro
35 40 45
Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr
50 55 60
Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe
65 70 75 80
Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr
85 90 95
Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val
100 105 110
Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr
115 120 125
Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile
130 135 140
Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu
145 150 155 160
Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg
165 170 175
Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser
180 185 190
Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Ala His
195 200 205
Ser Lys Glu Val Pro Ser Phe Arg Trp Thr Gln Ser Leu Arg Arg Gly
210 215 220
Leu Ser Gln Phe Thr Gln Thr Val Lys Ser Asp Val Leu Lys Asp Ala
225 230 235 240
Lys Leu Ile Ala Asp Ser Ile Asp Phe Asn Gln Val Ala Gln Val Gln
245 250 255
Arg Ala Leu Arg Lys Thr Lys Lys Gly Glu Glu Asp Leu Asn Lys Leu
260 265 270
Arg Asp Leu Asn Lys Glu Val Asp Arg Leu Met Ser Met Arg Ser Val
275 280 285
Gln Arg Asn Thr Val Phe Lys Val Gly Asp Leu Gly Arg Asp Glu Leu
290 295 300
Met Glu Leu Ala Ser Asp Leu Glu Lys Leu Lys Asn Lys Ile Arg Arg
305 310 315 320
Ala Glu Thr Gly Ser Gln Gly Val Tyr Met Gly Asn Leu Ser Gln Ser
325 330 335
Gln Leu Ala Lys Arg Ser Glu Ile Leu Arg Thr Leu Gly Phe Gln Gln
340 345 350
Gln Gly Thr Gly Gly Asn Gly Val Val Arg Ile Trp Asp Val Lys Asp
355 360 365
Pro Ser Lys Leu Asn Asn Gln Phe Gly Ser Val Pro Ala Leu Thr Ile
370 375 380
Ala Cys Met Thr Val Gln Gly Gly Glu Thr Met Asn Ser Val Ile Gln
385 390 395 400
Ala Leu Thr Ser Leu Gly Leu Leu Tyr Thr Val Lys Tyr Pro Asn Leu
405 410 415
Ser Asp Leu Asp Arg Leu Thr Gln Glu His Asp Cys Leu Gln Ile Val
420 425 430
Thr Lys Asp Glu Ser Ser Ile Asn Ile Ser Gly Tyr Asn Phe Ser Leu
435 440 445
Ser Ala Ala Val Lys Ala Gly Ala Ser Ile Leu Asp Gly Gly Asn Met
450 455 460
Leu Glu Thr Ile Arg Val Thr Pro Glu Asn Phe Ser Ser Leu Ile Lys
465 470 475 480
Ser Thr Ile Gln Val Lys Arg Arg Glu Gly Met Phe Ile Asp Glu Lys
485 490 495
Pro Gly Asn Arg Asn Pro Tyr Glu Asn Leu Leu Tyr Lys Leu Cys Leu
500 505 510
Ser Gly Asp Gly Trp Pro Tyr Ile Gly Ser Arg Ser Gln Ile Thr Gly
515 520 525
Arg Ser Trp Asp Asn Thr Ser Ile Asp Leu Thr Arg Lys Pro Val Ala
530 535 540
Gly Pro Arg Gln Pro Glu Lys Asn Gly Gln Asn Leu Arg Leu Ala Asn
545 550 555 560
Leu Thr Glu Ile Gln Glu Ala Val Ile Arg Glu Ala Val Gly Lys Leu
565 570 575
Asp Pro Thr Asn Thr Leu Trp Leu Asp Ile Glu Gly Pro Ala Thr Asp
580 585 590
Pro Val Glu Met Ala Leu Phe Gln Pro Ala Gly Lys Gln Tyr Ile His
595 600 605
Cys Phe Arg Lys Pro His Asp Glu Lys Gly Phe Lys Asn Gly Ser Arg
610 615 620
His Ser His Gly Ile Leu Met Lys Asp Ile Glu Asp Ala Met Pro Gly
625 630 635 640
Val Leu Ser Tyr Val Ile Gly Leu Leu Pro Pro Asp Met Val Val Thr
645 650 655
Thr Gln Gly Ser Asp Asp Ile Arg Lys Leu Phe Asp Leu His Gly Arg
660 665 670
Arg Asp Leu Lys Leu Val Asp Val Lys Leu Thr Ser Glu Gln Ala Arg
675 680 685
Gln Phe Asp Gln Gln Val Trp Glu Lys Tyr Gly His Leu Cys Lys Tyr
690 695 700
His Asn Gly Val Val Val Asn Lys Lys Lys Arg Glu Lys Asp Thr Pro
705 710 715 720
Phe Lys Leu Ala Ser Ser Glu Pro His Cys Ala Leu Leu Asp Cys Ile
725 730 735
Met Phe Gln Ser Val Leu Asp Gly Lys Leu Tyr Glu Glu Glu Pro Thr
740 745 750
Pro Leu Leu Pro Pro Ser Leu Leu Phe Leu Pro Lys Ala Ala Tyr Ala
755 760 765
Leu Pro Gly Glu Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser His
770 775 780
His His His His His
785
<210> 118
<211> 2446
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding ssBiP-SNAPlike-proTEV1-N nucleoprotein of
the Machupo virus-proTEV2-Histag for expression in S2 cells
<400> 118
atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60
gacaaagact gcgaaatgaa aagaactaca ttggattcac cacttgggaa gttggaactg 120
agtggatgcg agcaaggatt gcatgaaatt aagctactgg gaaaaggaac ttctgctgct 180
gatgcagttg aagttccagc accagcagct gttcttggag gtcctgagcc cctcatgcaa 240
gccacagcct ggcttaacgc atatttccac cagcctgagg ccattgagga atttccagtc 300
cccgcccttc accatcctgt gtttcagcag gagagcttca cccgccaggt cctgtggaaa 360
ttgctgaagg tggtcaagtt tggtgaagtg atttcatatc agcaacttgc tgcattggcc 420
ggtaaccccg cagctacagc tgccgtgaaa actgctctca gcggaaatcc tgtgcccatc 480
ctgatccctt gtcacagagt cgtttcatct tccggagctg taggtggcta tgaaggagga 540
ctggcagtta aggagtggct gctggctcat gaaggtcata gacttggaaa gcctgggctg 600
ggtcctgctg gtataggcgc gccagggtcc ctaggtggcg gatccgaaaa cctgtacttc 660
cagagcgata tcgctcactc caaggaaatt cccagctttc ggtggactca gtcactgaga 720
agaggcctga gtcagttcac ccacactgtg aaaacagatg tgttgaaaga tgccaagctc 780
atagctgaca gcatcgactt caaccaggtt tcacaagtgc agagggctct cagaaagaac 840
aaaaggggtg aagaggatct gaacaagctg agggatttaa acaaagaagt ggataggctc 900
atgtctatga aaagcatcca gaaaaacacc atattcaaga ttggtgatct ggggagagat 960
gaattgatgg agcttgcatc agacttggaa aaactgaaga acaagataaa gaggactgag 1020
tcaggtcccc aagggctgta catgggtaat ttgtcacagc tgcaactgac aaagaggtca 1080
gaaatcttga agaccctggg attccaacag cagagaggtg ctggaaatgg tgtggttaga 1140
atctgggatg tctcagatcc atcaaaactg aataatcagt ttggttccat gccagctctc 1200
acaatcgctt gtatgactgt ccagggtgga gaaacgatga atagtgtggt ccaagcgttg 1260
acatctctgg gcctgttata cactgttaaa tatccgaatt taaatgacct tgacaagcta 1320
acactagagc acgaatgctt gcagatcgta actaaggacg agagctccat caacatctct 1380
ggctataact tcagtctgtc agctgctgtg aaagctggcg cctcaatact tgacggtggg 1440
aacatgctgg aaacaattag ggtcactcct gataatttct ccagcttgat taaatcaact 1500
ctgcaagtca agcgaaaaga ggggatgttt atagacgaga aacctgggaa tcgaaatcct 1560
tatgagaacc ttctgtataa attgtgtctc tcaggtgacg ggtggcctta cattggttcc 1620
agatcacaaa ttcttgggag gtcttgggac aacacaagtg ttgatctaac aaagaaacct 1680
caagttggac cgagacaacc cgagaaaaac ggtcagaatc taagactagc aaacctgact 1740
gaaatgcaag aagcagtgat taaagaggct gtaaagaagt tagaccccac taatacactg 1800
tggcttgaca ttgaagggcc tccaacagac cctgtggaat tggcactata tcagccagcc 1860
aacaagcatt atattcattg ttttagaaag ccacatgatg agaagggctt caaaaatggc 1920
agcagacatt cacatggcat cttgatgcaa gacatcgagg atgcaatgcc aggagtatta 1980
agttatgtaa taggtttact accacaagat atggtgatta caactcaagg ttctgacgac 2040
ataaggaaac ttttagacat tcatggacgg aaggatttaa agctggtaga tgtgaaactc 2100
acatctgatc aagcaagact ctatgatcag caaatttggg agaagtttgg acatctttgc 2160
aaacatcata atggagttgt tgtcaacaag aaaaagagag aaaaagactc tccattcaaa 2220
ttgagttctg gtgaacctca ctgtgctctg ttggattgta tcatgtatca atcagtgatg 2280
gatggcaaaa tggtagatga agaaccagtg gcacttttac ctctcagcct tctatttcta 2340
cccaaggcag cctttgcact cccgggagag aatctatatt ttcaagggcc cggcggaggt 2400
agtcaccatc atcaccatca ctaatgaccg gtgcggccgc aagctt 2446
<210> 119
<211> 789
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of fusion protein
[SNAPlike-proTEV1-MAC.N-proTEV2-Histag]
<400> 119
Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro
1 5 10 15
Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile
20 25 30
Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro
35 40 45
Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr
50 55 60
Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe
65 70 75 80
Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr
85 90 95
Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val
100 105 110
Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr
115 120 125
Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile
130 135 140
Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu
145 150 155 160
Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg
165 170 175
Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser
180 185 190
Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Ala His
195 200 205
Ser Lys Glu Ile Pro Ser Phe Arg Trp Thr Gln Ser Leu Arg Arg Gly
210 215 220
Leu Ser Gln Phe Thr His Thr Val Lys Thr Asp Val Leu Lys Asp Ala
225 230 235 240
Lys Leu Ile Ala Asp Ser Ile Asp Phe Asn Gln Val Ser Gln Val Gln
245 250 255
Arg Ala Leu Arg Lys Asn Lys Arg Gly Glu Glu Asp Leu Asn Lys Leu
260 265 270
Arg Asp Leu Asn Lys Glu Val Asp Arg Leu Met Ser Met Lys Ser Ile
275 280 285
Gln Lys Asn Thr Ile Phe Lys Ile Gly Asp Leu Gly Arg Asp Glu Leu
290 295 300
Met Glu Leu Ala Ser Asp Leu Glu Lys Leu Lys Asn Lys Ile Lys Arg
305 310 315 320
Thr Glu Ser Gly Pro Gln Gly Leu Tyr Met Gly Asn Leu Ser Gln Leu
325 330 335
Gln Leu Thr Lys Arg Ser Glu Ile Leu Lys Thr Leu Gly Phe Gln Gln
340 345 350
Gln Arg Gly Ala Gly Asn Gly Val Val Arg Ile Trp Asp Val Ser Asp
355 360 365
Pro Ser Lys Leu Asn Asn Gln Phe Gly Ser Met Pro Ala Leu Thr Ile
370 375 380
Ala Cys Met Thr Val Gln Gly Gly Glu Thr Met Asn Ser Val Val Gln
385 390 395 400
Ala Leu Thr Ser Leu Gly Leu Leu Tyr Thr Val Lys Tyr Pro Asn Leu
405 410 415
Asn Asp Leu Asp Lys Leu Thr Leu Glu His Glu Cys Leu Gln Ile Val
420 425 430
Thr Lys Asp Glu Ser Ser Ile Asn Ile Ser Gly Tyr Asn Phe Ser Leu
435 440 445
Ser Ala Ala Val Lys Ala Gly Ala Ser Ile Leu Asp Gly Gly Asn Met
450 455 460
Leu Glu Thr Ile Arg Val Thr Pro Asp Asn Phe Ser Ser Leu Ile Lys
465 470 475 480
Ser Thr Leu Gln Val Lys Arg Lys Glu Gly Met Phe Ile Asp Glu Lys
485 490 495
Pro Gly Asn Arg Asn Pro Tyr Glu Asn Leu Leu Tyr Lys Leu Cys Leu
500 505 510
Ser Gly Asp Gly Trp Pro Tyr Ile Gly Ser Arg Ser Gln Ile Leu Gly
515 520 525
Arg Ser Trp Asp Asn Thr Ser Val Asp Leu Thr Lys Lys Pro Gln Val
530 535 540
Gly Pro Arg Gln Pro Glu Lys Asn Gly Gln Asn Leu Arg Leu Ala Asn
545 550 555 560
Leu Thr Glu Met Gln Glu Ala Val Ile Lys Glu Ala Val Lys Lys Leu
565 570 575
Asp Pro Thr Asn Thr Leu Trp Leu Asp Ile Glu Gly Pro Pro Thr Asp
580 585 590
Pro Val Glu Leu Ala Leu Tyr Gln Pro Ala Asn Lys His Tyr Ile His
595 600 605
Cys Phe Arg Lys Pro His Asp Glu Lys Gly Phe Lys Asn Gly Ser Arg
610 615 620
His Ser His Gly Ile Leu Met Gln Asp Ile Glu Asp Ala Met Pro Gly
625 630 635 640
Val Leu Ser Tyr Val Ile Gly Leu Leu Pro Gln Asp Met Val Ile Thr
645 650 655
Thr Gln Gly Ser Asp Asp Ile Arg Lys Leu Leu Asp Ile His Gly Arg
660 665 670
Lys Asp Leu Lys Leu Val Asp Val Lys Leu Thr Ser Asp Gln Ala Arg
675 680 685
Leu Tyr Asp Gln Gln Ile Trp Glu Lys Phe Gly His Leu Cys Lys His
690 695 700
His Asn Gly Val Val Val Asn Lys Lys Lys Arg Glu Lys Asp Ser Pro
705 710 715 720
Phe Lys Leu Ser Ser Gly Glu Pro His Cys Ala Leu Leu Asp Cys Ile
725 730 735
Met Tyr Gln Ser Val Met Asp Gly Lys Met Val Asp Glu Glu Pro Val
740 745 750
Ala Leu Leu Pro Leu Ser Leu Leu Phe Leu Pro Lys Ala Ala Phe Ala
755 760 765
Leu Pro Gly Glu Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser His
770 775 780
His His His His His
785
<210> 120
<211> 2434
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding ssBiP-SNAPlike-proTEV1-N nucleoprotein of
the Guanarito virus-proTEV2-Histag for expression in S2 cells
<400> 120
atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60
gacaaagact gcgaaatgaa aagaactaca ttggattcac cacttgggaa gttggaactg 120
agtggatgcg agcaaggatt gcatgaaatt aagctactgg gaaaaggaac ttctgctgct 180
gatgcagttg aagttccagc accagcagct gttcttggag gtcctgagcc cctcatgcaa 240
gccacagcct ggcttaacgc atatttccac cagcctgagg ccattgagga atttccagtc 300
cccgcccttc accatcctgt gtttcagcag gagagcttca cccgccaggt cctgtggaaa 360
ttgctgaagg tggtcaagtt tggtgaagtg atttcatatc agcaacttgc tgcattggcc 420
ggtaaccccg cagctacagc tgccgtgaaa actgctctca gcggaaatcc tgtgcccatc 480
ctgatccctt gtcacagagt cgtttcatct tccggagctg taggtggcta tgaaggagga 540
ctggcagtta aggagtggct gctggctcat gaaggtcata gacttggaaa gcctgggctg 600
ggtcctgctg gtataggcgc gccagggtcc ctaggtggcg gatccgaaaa cctgtacttc 660
cagagcgata tcgctcactc caaagaaatc cccagcttcc gctggactca atctctaagg 720
agagaactag ggatgttcac agaaccaacc aaatcaagtg ttcttaatga tgcaaagctc 780
attgcagact cccttgattt cacacaagtt tctcaagttc aaagactcct acgtaagtcc 840
aaacgaggag acactgatct tgataaactt agggacttaa ataaagaagt tgatagactg 900
atgagcatga aaagtgttca gaacaacaca gttctgaaag ttggtgattt gggcaaagat 960
gaattaatgg acttggcctc tgacctagaa aaactaaaga agaagattgg agatagggaa 1020
agcaatagtc caaggatgta catgggaaac ttgacgcagt cacaattgga aaaaagagca 1080
gggattctta gaaccctggg attccaacaa caaagggggg ctgcaggtgg ggttgtcagg 1140
ttgtgggatg tatctgatcc ctccaaactg aataaccaat ttggttcaat gccagctctt 1200
accattgcct gcatgacagt tcagggagga gaaacaatga acaatgttgt gcaggcacta 1260
acatcacttg gtcttctcta cactgtcaaa tatcccaatc ttgatgacct ggaaaaacta 1320
actttagaac acgactgcct acagattata acaaaggatg agagtgcact caacatatct 1380
ggttataact tcagtctttc agctgctgta aaagctggtg catcacttat agatggtggc 1440
aacatgctgg agacaataaa agtcacaccc aacaacttct cttctattgt caaggccgca 1500
ttgaacgtca aaagaagaga aggcatgttc atagatgaga gaccgggcaa tagaaaccct 1560
tatgagaacc ttctctacaa gctgtgtttg tctggggagg gttggccata tattggatca 1620
aggtcacaaa tactcgggag gtcttgggac aacacaagtg tcgatttaaa tgcaagacct 1680
gtaacaggtc cccgagctcc tgaaaagaat ggacaaaata tcagactatc aaatctttct 1740
gaaatgcaag aagcgatcgt aaaggaagca atgaggaaat tagattcatc agacacaatc 1800
tggatggaca ttgaaggccc gccaactgat cctgtggagt tggcagtttt ccaaccttct 1860
tcaggaaact atgtacactg tttcagaaaa cctcatgatg agaaaggttt taaaaatgga 1920
agtaggcact cacacggcat actattaaag gaccttgaag atgctcaacc tggtctattg 1980
agttacgtca ttggcttatt gccacagggt tcagttatca ctgttcaagg ggcagatgac 2040
atcaaaaagc tattcgacat acatggaagg aaagatttaa aacttgttga tgtcagactg 2100
actggggaac agtccagaat ttttgaacag gaagtttggg aaaaatttgg ccacctctgc 2160
agagcacaca atggtgtcat tgttcctaag aagaaaaaca aggaggctaa ctccacgaag 2220
gagccacact gtgctcttct cgattgcatc atgtttcagt ctgttcttga tggtcatctt 2280
cccgacacca ttcccattca actgctacca aacacattag tgttccaagc caagagcgca 2340
tttgtgatcc cgggagagaa tctatatttt caagggcccg gcggaggtag tcaccatcat 2400
caccatcact aatgaccggt gcggccgcaa gctt 2434
<210> 121
<211> 785
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of fusion protein
[SNAPlike-proTEV1-GUA.N-proTEV2-Histag]
<400> 121
Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro
1 5 10 15
Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile
20 25 30
Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro
35 40 45
Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr
50 55 60
Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe
65 70 75 80
Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr
85 90 95
Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val
100 105 110
Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr
115 120 125
Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile
130 135 140
Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu
145 150 155 160
Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg
165 170 175
Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser
180 185 190
Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Ala His
195 200 205
Ser Lys Glu Ile Pro Ser Phe Arg Trp Thr Gln Ser Leu Arg Arg Glu
210 215 220
Leu Gly Met Phe Thr Glu Pro Thr Lys Ser Ser Val Leu Asn Asp Ala
225 230 235 240
Lys Leu Ile Ala Asp Ser Leu Asp Phe Thr Gln Val Ser Gln Val Gln
245 250 255
Arg Leu Leu Arg Lys Ser Lys Arg Gly Asp Thr Asp Leu Asp Lys Leu
260 265 270
Arg Asp Leu Asn Lys Glu Val Asp Arg Leu Met Ser Met Lys Ser Val
275 280 285
Gln Asn Asn Thr Val Leu Lys Val Gly Asp Leu Gly Lys Asp Glu Leu
290 295 300
Met Asp Leu Ala Ser Asp Leu Glu Lys Leu Lys Lys Lys Ile Gly Asp
305 310 315 320
Arg Glu Ser Asn Ser Pro Arg Met Tyr Met Gly Asn Leu Thr Gln Ser
325 330 335
Gln Leu Glu Lys Arg Ala Gly Ile Leu Arg Thr Leu Gly Phe Gln Gln
340 345 350
Gln Arg Gly Ala Ala Gly Gly Val Val Arg Leu Trp Asp Val Ser Asp
355 360 365
Pro Ser Lys Leu Asn Asn Gln Phe Gly Ser Met Pro Ala Leu Thr Ile
370 375 380
Ala Cys Met Thr Val Gln Gly Gly Glu Thr Met Asn Asn Val Val Gln
385 390 395 400
Ala Leu Thr Ser Leu Gly Leu Leu Tyr Thr Val Lys Tyr Pro Asn Leu
405 410 415
Asp Asp Leu Glu Lys Leu Thr Leu Glu His Asp Cys Leu Gln Ile Ile
420 425 430
Thr Lys Asp Glu Ser Ala Leu Asn Ile Ser Gly Tyr Asn Phe Ser Leu
435 440 445
Ser Ala Ala Val Lys Ala Gly Ala Ser Leu Ile Asp Gly Gly Asn Met
450 455 460
Leu Glu Thr Ile Lys Val Thr Pro Asn Asn Phe Ser Ser Ile Val Lys
465 470 475 480
Ala Ala Leu Asn Val Lys Arg Arg Glu Gly Met Phe Ile Asp Glu Arg
485 490 495
Pro Gly Asn Arg Asn Pro Tyr Glu Asn Leu Leu Tyr Lys Leu Cys Leu
500 505 510
Ser Gly Glu Gly Trp Pro Tyr Ile Gly Ser Arg Ser Gln Ile Leu Gly
515 520 525
Arg Ser Trp Asp Asn Thr Ser Val Asp Leu Asn Ala Arg Pro Val Thr
530 535 540
Gly Pro Arg Ala Pro Glu Lys Asn Gly Gln Asn Ile Arg Leu Ser Asn
545 550 555 560
Leu Ser Glu Met Gln Glu Ala Ile Val Lys Glu Ala Met Arg Lys Leu
565 570 575
Asp Ser Ser Asp Thr Ile Trp Met Asp Ile Glu Gly Pro Pro Thr Asp
580 585 590
Pro Val Glu Leu Ala Val Phe Gln Pro Ser Ser Gly Asn Tyr Val His
595 600 605
Cys Phe Arg Lys Pro His Asp Glu Lys Gly Phe Lys Asn Gly Ser Arg
610 615 620
His Ser His Gly Ile Leu Leu Lys Asp Leu Glu Asp Ala Gln Pro Gly
625 630 635 640
Leu Leu Ser Tyr Val Ile Gly Leu Leu Pro Gln Gly Ser Val Ile Thr
645 650 655
Val Gln Gly Ala Asp Asp Ile Lys Lys Leu Phe Asp Ile His Gly Arg
660 665 670
Lys Asp Leu Lys Leu Val Asp Val Arg Leu Thr Gly Glu Gln Ser Arg
675 680 685
Ile Phe Glu Gln Glu Val Trp Glu Lys Phe Gly His Leu Cys Arg Ala
690 695 700
His Asn Gly Val Ile Val Pro Lys Lys Lys Asn Lys Glu Ala Asn Ser
705 710 715 720
Thr Lys Glu Pro His Cys Ala Leu Leu Asp Cys Ile Met Phe Gln Ser
725 730 735
Val Leu Asp Gly His Leu Pro Asp Thr Ile Pro Ile Gln Leu Leu Pro
740 745 750
Asn Thr Leu Val Phe Gln Ala Lys Ser Ala Phe Val Ile Pro Gly Glu
755 760 765
Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser His His His His His
770 775 780
His
785
<210> 122
<211> 2440
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding ssBiP-SNAPlike-proTEV1-N nucleoprotein of
the Sabia virus-proTEV2-Histag for expression in S2 cells
<400> 122
atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60
gacaaagact gcgaaatgaa aagaactaca ttggattcac cacttgggaa gttggaactg 120
agtggatgcg agcaaggatt gcatgaaatt aagctactgg gaaaaggaac ttctgctgct 180
gatgcagttg aagttccagc accagcagct gttcttggag gtcctgagcc cctcatgcaa 240
gccacagcct ggcttaacgc atatttccac cagcctgagg ccattgagga atttccagtc 300
cccgcccttc accatcctgt gtttcagcag gagagcttca cccgccaggt cctgtggaaa 360
ttgctgaagg tggtcaagtt tggtgaagtg atttcatatc agcaacttgc tgcattggcc 420
ggtaaccccg cagctacagc tgccgtgaaa actgctctca gcggaaatcc tgtgcccatc 480
ctgatccctt gtcacagagt cgtttcatct tccggagctg taggtggcta tgaaggagga 540
ctggcagtta aggagtggct gctggctcat gaaggtcata gacttggaaa gcctgggctg 600
ggtcctgctg gtataggcgc gccagggtcc ctaggtggcg gatccgaaaa cctgtacttc 660
cagagcgata tcagcaactc aaaggaaatc cccagcttca gatggactca atccctgaga 720
agagggctca gtgagttcac aacacccgtg aagaccgatg ttctgaggga tgccaaaatg 780
atacttgatg gtcttgattt caatcaagtc tctcttgttc aaagaatcct tagaaagtct 840
aaaaggaatg atggtgatct tgataaactg agagacctaa ataaagaagt ggacaacctg 900
atgagcatga agagttccca aagagacaca atcttaaaac ttggtgatct caacaaatct 960
gaactgatgg atcttgcatc agacctggag aaactgaaaa gaaaagttgg acaaacagaa 1020
agatcagcct caggaggtgt gtacctggga aacctttccc aatcacagct caccaaaagg 1080
tctgatcttt taaggaaact tggttttcaa cagcagcaag tgaggtctcc aggggttgta 1140
aggatttggg acgtagctga tccgaacagg ctgaataatc aatttggatc tgtccctgca 1200
ctgacaatcg cttgtatgac taaacaaagt gacaatacca tgggggatgt tgttcaggca 1260
ctaacatctt tgggacttct ttatacagtt aagttcccca acctgattga cctagaaaaa 1320
cttacagcag aacatgactg tcttcaaata gtgactaaag atgagagcgg cttgaacatc 1380
tcaggatata actatagtct ttctgcagct gttaaagctg gtgcaacgct tctggatggt 1440
ggtaacatgc tggaaaccat aaggatcact cctgacaact tttctcagat cataaagaca 1500
accctatcca taaagaaaaa ggaaggcatg tttgtagatg agaaacctgg aaatagaaac 1560
ccttatgaaa accttctgta caaaatctgc ctttcaggag aaggttggcc ttacattggc 1620
tccagatccc agatcaaggg taggtcatgg gaaaacacca ctgttgattt aagcacaaag 1680
ccccaacaag ggccgagaac accagaaaag gcaggtcaga acattagact ctcccacttg 1740
actgagttgc aagagtcagt tgtgagagag gcaatgggta agattgaccc aactctgaca 1800
acatggattg acattgaggg taccagtaat gatccggttg aattagcatt gtaccaacca 1860
gacacaggta attatatcct ctgttatagg aaaccacatg atgagaaggg gttcaaaaat 1920
ggtagcaggc attcacatgg gatgttgcta aaggacctag aatctgcaca gccaggcttg 1980
ctcagctatg ttatagggct ccttcctcaa aacatggtcc tcaccaccca aggttcagat 2040
gatataaggc gcttagtaga tacacacggt cgcaaagact taaagattgt cgacattaaa 2100
ttggcatctg aacaggcgag aaagtttgag gagccaatct ggtcagattt tggtcacctc 2160
tgtaagaaac acaatggagt tattgtgcca aagaaaaaga aagacaaaga catcccacag 2220
tcctcagagc cacactgtgc cctacttgat tgtctaatgt ttcagtcagc catagcaggc 2280
caaccacctc aaaccaaact ggaaggttta ttgcctgatg cattgctctt cacactggag 2340
gcagcattca ccatcccggg agagaatcta tattttcaag ggcccggcgg aggtagtcac 2400
catcatcacc atcactaatg accggtgcgg ccgcaagctt 2440
<210> 123
<211> 787
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of fusion protein
[SNAPlike-proTEV1-SAB.N-proTEV2-Histag]
<400> 123
Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro
1 5 10 15
Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile
20 25 30
Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro
35 40 45
Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr
50 55 60
Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe
65 70 75 80
Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr
85 90 95
Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val
100 105 110
Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr
115 120 125
Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile
130 135 140
Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu
145 150 155 160
Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg
165 170 175
Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser
180 185 190
Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Ser Asn
195 200 205
Ser Lys Glu Ile Pro Ser Phe Arg Trp Thr Gln Ser Leu Arg Arg Gly
210 215 220
Leu Ser Glu Phe Thr Thr Pro Val Lys Thr Asp Val Leu Arg Asp Ala
225 230 235 240
Lys Met Ile Leu Asp Gly Leu Asp Phe Asn Gln Val Ser Leu Val Gln
245 250 255
Arg Ile Leu Arg Lys Ser Lys Arg Asn Asp Gly Asp Leu Asp Lys Leu
260 265 270
Arg Asp Leu Asn Lys Glu Val Asp Asn Leu Met Ser Met Lys Ser Ser
275 280 285
Gln Arg Asp Thr Ile Leu Lys Leu Gly Asp Leu Asn Lys Ser Glu Leu
290 295 300
Met Asp Leu Ala Ser Asp Leu Glu Lys Leu Lys Arg Lys Val Gly Gln
305 310 315 320
Thr Glu Arg Ser Ala Ser Gly Gly Val Tyr Leu Gly Asn Leu Ser Gln
325 330 335
Ser Gln Leu Thr Lys Arg Ser Asp Leu Leu Arg Lys Leu Gly Phe Gln
340 345 350
Gln Gln Gln Val Arg Ser Pro Gly Val Val Arg Ile Trp Asp Val Ala
355 360 365
Asp Pro Asn Arg Leu Asn Asn Gln Phe Gly Ser Val Pro Ala Leu Thr
370 375 380
Ile Ala Cys Met Thr Lys Gln Ser Asp Asn Thr Met Gly Asp Val Val
385 390 395 400
Gln Ala Leu Thr Ser Leu Gly Leu Leu Tyr Thr Val Lys Phe Pro Asn
405 410 415
Leu Ile Asp Leu Glu Lys Leu Thr Ala Glu His Asp Cys Leu Gln Ile
420 425 430
Val Thr Lys Asp Glu Ser Gly Leu Asn Ile Ser Gly Tyr Asn Tyr Ser
435 440 445
Leu Ser Ala Ala Val Lys Ala Gly Ala Thr Leu Leu Asp Gly Gly Asn
450 455 460
Met Leu Glu Thr Ile Arg Ile Thr Pro Asp Asn Phe Ser Gln Ile Ile
465 470 475 480
Lys Thr Thr Leu Ser Ile Lys Lys Lys Glu Gly Met Phe Val Asp Glu
485 490 495
Lys Pro Gly Asn Arg Asn Pro Tyr Glu Asn Leu Leu Tyr Lys Ile Cys
500 505 510
Leu Ser Gly Glu Gly Trp Pro Tyr Ile Gly Ser Arg Ser Gln Ile Lys
515 520 525
Gly Arg Ser Trp Glu Asn Thr Thr Val Asp Leu Ser Thr Lys Pro Gln
530 535 540
Gln Gly Pro Arg Thr Pro Glu Lys Ala Gly Gln Asn Ile Arg Leu Ser
545 550 555 560
His Leu Thr Glu Leu Gln Glu Ser Val Val Arg Glu Ala Met Gly Lys
565 570 575
Ile Asp Pro Thr Leu Thr Thr Trp Ile Asp Ile Glu Gly Thr Ser Asn
580 585 590
Asp Pro Val Glu Leu Ala Leu Tyr Gln Pro Asp Thr Gly Asn Tyr Ile
595 600 605
Leu Cys Tyr Arg Lys Pro His Asp Glu Lys Gly Phe Lys Asn Gly Ser
610 615 620
Arg His Ser His Gly Met Leu Leu Lys Asp Leu Glu Ser Ala Gln Pro
625 630 635 640
Gly Leu Leu Ser Tyr Val Ile Gly Leu Leu Pro Gln Asn Met Val Leu
645 650 655
Thr Thr Gln Gly Ser Asp Asp Ile Arg Arg Leu Val Asp Thr His Gly
660 665 670
Arg Lys Asp Leu Lys Ile Val Asp Ile Lys Leu Ala Ser Glu Gln Ala
675 680 685
Arg Lys Phe Glu Glu Pro Ile Trp Ser Asp Phe Gly His Leu Cys Lys
690 695 700
Lys His Asn Gly Val Ile Val Pro Lys Lys Lys Lys Asp Lys Asp Ile
705 710 715 720
Pro Gln Ser Ser Glu Pro His Cys Ala Leu Leu Asp Cys Leu Met Phe
725 730 735
Gln Ser Ala Ile Ala Gly Gln Pro Pro Gln Thr Lys Leu Glu Gly Leu
740 745 750
Leu Pro Asp Ala Leu Leu Phe Thr Leu Glu Ala Ala Phe Thr Ile Pro
755 760 765
Gly Glu Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser His His His
770 775 780
His His His
785
<210> 124
<211> 992
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding BiPlike-SNAPlike- EDIII protein of the Omsk
virus-Histag for expression in S2 cells
<400> 124
atgaaactat gtattctact tgcagttgtt gcgttcgtag gattgtcctt aagatctgac 60
aaagactgcg aaatgaaaag aactacattg gattcaccac ttgggaagtt ggaactgagt 120
ggatgcgagc aaggattgca tgaaattaag ctactgggaa aaggaacttc tgctgctgat 180
gcagttgaag ttccagcacc agcagctgtt cttggaggtc ctgagcccct catgcaagcc 240
acagcctggc ttaacgcata tttccaccag cctgaggcca ttgaggaatt tccagtcccc 300
gcccttcacc atcctgtgtt tcagcaggag agcttcaccc gccaggtcct gtggaaattg 360
ctgaaggtgg tcaagtttgg tgaagtgatt tcatatcagc aacttgctgc attggccggt 420
aaccccgcag ctacagctgc cgtgaaaact gctctcagcg gaaatcctgt gcccatcctg 480
atcccttgtc acagagtcgt ttcatcttcc ggagctgtag gtggctatga aggaggactg 540
gcagttaagg agtggctgct ggctcatgaa ggtcatagac ttggaaagcc tgggctgggt 600
cctgctggta taggcgcgcc aggaggtggc gggctggaaa aactcaagat gaagggtctt 660
acctatacaa tgtgcgacaa ggcaaagttc acgtggaaaa gagctcccac agacagtggg 720
cacgacacag ttgtcatgga agtcgctttc tctggaacaa agccttgcag aatacccgtc 780
agggctgtgg cacatggttc cccagatgtg gatgtggcca tgctcataac gccaaatcca 840
acaatcgaaa acaatggagg tggctttata gagatgcagc tccccccagg agacaacatc 900
atctatgttg gggaactaaa acaccagtgg ttccagaagg ggagtagcat tggcggaggt 960
ggccatcacc atcaccatca ctgatgaccg gt 992
<210> 125
<211> 310
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of fusion protein
[SNAPlike-OMSK.EDIII-Histag]
<400> 125
Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro
1 5 10 15
Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile
20 25 30
Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro
35 40 45
Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr
50 55 60
Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe
65 70 75 80
Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr
85 90 95
Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val
100 105 110
Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr
115 120 125
Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile
130 135 140
Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu
145 150 155 160
Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg
165 170 175
Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Gly
180 185 190
Gly Gly Leu Glu Lys Leu Lys Met Lys Gly Leu Thr Tyr Thr Met Cys
195 200 205
Asp Lys Ala Lys Phe Thr Trp Lys Arg Ala Pro Thr Asp Ser Gly His
210 215 220
Asp Thr Val Val Met Glu Val Ala Phe Ser Gly Thr Lys Pro Cys Arg
225 230 235 240
Ile Pro Val Arg Ala Val Ala His Gly Ser Pro Asp Val Asp Val Ala
245 250 255
Met Leu Ile Thr Pro Asn Pro Thr Ile Glu Asn Asn Gly Gly Gly Phe
260 265 270
Ile Glu Met Gln Leu Pro Pro Gly Asp Asn Ile Ile Tyr Val Gly Glu
275 280 285
Leu Lys His Gln Trp Phe Gln Lys Gly Ser Ser Ile Gly Gly Gly Gly
290 295 300
His His His His His His
305 310
<210> 126
<211> 992
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding BiPlike-SNAPlike- EDIII protein of the
Kyasanur Forest Disease virus-Histag for expression in S2 cells
<400> 126
atgaaactat gtattctact tgcagttgtt gcgttcgtag gattgtcctt aagatctgac 60
aaagactgcg aaatgaaaag aactacattg gattcaccac ttgggaagtt ggaactgagt 120
ggatgcgagc aaggattgca tgaaattaag ctactgggaa aaggaacttc tgctgctgat 180
gcagttgaag ttccagcacc agcagctgtt cttggaggtc ctgagcccct catgcaagcc 240
acagcctggc ttaacgcata tttccaccag cctgaggcca ttgaggaatt tccagtcccc 300
gcccttcacc atcctgtgtt tcagcaggag agcttcaccc gccaggtcct gtggaaattg 360
ctgaaggtgg tcaagtttgg tgaagtgatt tcatatcagc aacttgctgc attggccggt 420
aaccccgcag ctacagctgc cgtgaaaact gctctcagcg gaaatcctgt gcccatcctg 480
atcccttgtc acagagtcgt ttcatcttcc ggagctgtag gtggctatga aggaggactg 540
gcagttaagg agtggctgct ggctcatgaa ggtcatagac ttggaaagcc tgggctgggt 600
cctgctggta taggcgcgcc aggaggtggc gggcttgaaa aacttaagat gaaagggatg 660
acatacacgg tttgtgaggg atcaaaattt gcttggaaaa ggccgccaac cgacagtgga 720
catgataccg tagtcatgga ggtgacttac accgggagca agccatgcag aataccagtg 780
agagccgtgg cccatggaga acccaatgtt aacgtggcaa gtctaataac cccaaaccca 840
tccatggaaa caactggagg agggttcgtt gagctacagc taccaccagg agacaacatc 900
atctatgttg gtgagctgag ccaccagtgg tttcagaagg gcagcacaat tggcggaggt 960
ggccatcacc atcaccatca ctgatgaccg gt 992
<210> 127
<211> 310
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of fusion protein [SNAPlike-KYA.EDIII-Histag]
<400> 127
Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro
1 5 10 15
Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile
20 25 30
Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro
35 40 45
Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr
50 55 60
Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe
65 70 75 80
Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr
85 90 95
Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val
100 105 110
Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr
115 120 125
Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile
130 135 140
Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu
145 150 155 160
Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg
165 170 175
Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Gly
180 185 190
Gly Gly Leu Glu Lys Leu Lys Met Lys Gly Met Thr Tyr Thr Val Cys
195 200 205
Glu Gly Ser Lys Phe Ala Trp Lys Arg Pro Pro Thr Asp Ser Gly His
210 215 220
Asp Thr Val Val Met Glu Val Thr Tyr Thr Gly Ser Lys Pro Cys Arg
225 230 235 240
Ile Pro Val Arg Ala Val Ala His Gly Glu Pro Asn Val Asn Val Ala
245 250 255
Ser Leu Ile Thr Pro Asn Pro Ser Met Glu Thr Thr Gly Gly Gly Phe
260 265 270
Val Glu Leu Gln Leu Pro Pro Gly Asp Asn Ile Ile Tyr Val Gly Glu
275 280 285
Leu Ser His Gln Trp Phe Gln Lys Gly Ser Thr Ile Gly Gly Gly Gly
290 295 300
His His His His His His
305 310
<210> 128
<211> 992
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding BiPlike-SNAPlike- EDIII protein of the
Alkhumra virus-Histag for expression in S2 cells
<400> 128
atgaaactat gtattctact tgcagttgtt gcgttcgtag gattgtcctt aagatctgac 60
aaagactgcg aaatgaaaag aactacattg gattcaccac ttgggaagtt ggaactgagt 120
ggatgcgagc aaggattgca tgaaattaag ctactgggaa aaggaacttc tgctgctgat 180
gcagttgaag ttccagcacc agcagctgtt cttggaggtc ctgagcccct catgcaagcc 240
acagcctggc ttaacgcata tttccaccag cctgaggcca ttgaggaatt tccagtcccc 300
gcccttcacc atcctgtgtt tcagcaggag agcttcaccc gccaggtcct gtggaaattg 360
ctgaaggtgg tcaagtttgg tgaagtgatt tcatatcagc aacttgctgc attggccggt 420
aaccccgcag ctacagctgc cgtgaaaact gctctcagcg gaaatcctgt gcccatcctg 480
atcccttgtc acagagtcgt ttcatcttcc ggagctgtag gtggctatga aggaggactg 540
gcagttaagg agtggctgct ggctcatgaa ggtcatagac ttggaaagcc tgggctgggt 600
cctgctggta taggcgcgcc aggaggtggc gggcttgaaa aactcaagat gaaaggaatg 660
acatacacgg tctgtgaggg atcaaagttt gcttggaaga ggccgccaac cgacagtggg 720
catgacactg tggtcatgga agtgacttac actgggagca agccatgcag aataccagtg 780
agagccgtgg cccatggaga acctaatgtc aatgtagcta gcctgataac tccaaatcca 840
tccatggaga caactggagg aggtttcgtt gaactgcagc tgccaccagg agacaacatc 900
atctatgttg gtgagctgag tcaccagtgg tttcagaagg gtagtacaat aggcggaggt 960
ggccatcacc atcaccatca ctgatgaccg gt 992
<210> 129
<211> 310
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of fusion protein [SNAPlike-ALK.EDIII-Histag]
<400> 129
Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro
1 5 10 15
Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile
20 25 30
Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro
35 40 45
Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr
50 55 60
Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe
65 70 75 80
Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr
85 90 95
Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val
100 105 110
Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr
115 120 125
Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile
130 135 140
Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu
145 150 155 160
Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg
165 170 175
Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Gly
180 185 190
Gly Gly Leu Glu Lys Leu Lys Met Lys Gly Met Thr Tyr Thr Val Cys
195 200 205
Glu Gly Ser Lys Phe Ala Trp Lys Arg Pro Pro Thr Asp Ser Gly His
210 215 220
Asp Thr Val Val Met Glu Val Thr Tyr Thr Gly Ser Lys Pro Cys Arg
225 230 235 240
Ile Pro Val Arg Ala Val Ala His Gly Glu Pro Asn Val Asn Val Ala
245 250 255
Ser Leu Ile Thr Pro Asn Pro Ser Met Glu Thr Thr Gly Gly Gly Phe
260 265 270
Val Glu Leu Gln Leu Pro Pro Gly Asp Asn Ile Ile Tyr Val Gly Glu
275 280 285
Leu Ser His Gln Trp Phe Gln Lys Gly Ser Thr Ile Gly Gly Gly Gly
290 295 300
His His His His His His
305 310
<210> 130
<211> 1288
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding ssBiP- Glycoprotein GP1 from Lassa virus-
SNAPlike-Histag for expression in S2 cells
<400> 130
atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60
accagtctgt acaagggggt gtacgagctt cagactctgg aactgaacat ggagacactc 120
aacatgacca tgcctctctc ctgcacaaag aacaacagtc atcattacat aatggtgggc 180
aatgagacag gactggaact gaccttgacc aacacgagca tcatcaatca caagttctgc 240
aacctgtctg atgcccacaa gaagaacctc tacgaccacg ctctgatgag cataatctca 300
actttccact tgtccatccc caacttcaac cagtacgagg caatgagctg cgatttcaat 360
gggggcaaga tcagtgtgca gtacaacctg agtcacagct acgctgggga tgcagccaac 420
cattgtggca ctgtggcaaa cggtgtgttg cagactttca tgaggatggc ttggggcggg 480
agctacatcg ctcttgactc aggccgtggc aactgggact gtatcatgac tagttaccaa 540
tacctgataa tccagaacac aacctgggaa gatcactgcc aattctccag accatctccc 600
atcggctacc tcgggctcct ctcacaaagg actagagata tttacatcag tagaagattg 660
ctgcggccgc acggcggagg tagcaaagac tgcgaaatga agcgcaccac cctggatagc 720
cctctgggca agctggaact gtctgggtgc gaacagggcc tgcacgagat caagctgctg 780
ggcaaaggaa catctgccgc cgacgccgtg gaagtgcctg ccccagccgc cgtgctgggc 840
ggaccagagc cactgatgca ggccaccgcc tggctcaacg cctactttca ccagcctgag 900
gccatcgagg agttccctgt gccagccctg caccacccag tgttccagca ggagagcttt 960
acccgccagg tgctgtggaa actgctgaaa gtggtgaagt tcggagaggt catcagctac 1020
cagcagctgg ccgccctggc cggcaatccc gccgccaccg ccgccgtgaa aaccgccctg 1080
agcggaaatc ccgtgcccat tctgatcccc tgccaccggg tggtgtctag ctctggcgcc 1140
gtggggggct acgagggcgg gctcgccgtg aaagagtggc tgctggccca cgagggccac 1200
agactgggca agcctgggct gggtcctgca ggtataggcg cgccagggtc cctggagcat 1260
catcatcatc atcattgatg acgggccc 1288
<210> 131
<211> 407
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of fusion protein [LAS.ectoGP1-
SNAPlike-Histag]
<400> 131
Arg Ser Thr Ser Leu Tyr Lys Gly Val Tyr Glu Leu Gln Thr Leu Glu
1 5 10 15
Leu Asn Met Glu Thr Leu Asn Met Thr Met Pro Leu Ser Cys Thr Lys
20 25 30
Asn Asn Ser His His Tyr Ile Met Val Gly Asn Glu Thr Gly Leu Glu
35 40 45
Leu Thr Leu Thr Asn Thr Ser Ile Ile Asn His Lys Phe Cys Asn Leu
50 55 60
Ser Asp Ala His Lys Lys Asn Leu Tyr Asp His Ala Leu Met Ser Ile
65 70 75 80
Ile Ser Thr Phe His Leu Ser Ile Pro Asn Phe Asn Gln Tyr Glu Ala
85 90 95
Met Ser Cys Asp Phe Asn Gly Gly Lys Ile Ser Val Gln Tyr Asn Leu
100 105 110
Ser His Ser Tyr Ala Gly Asp Ala Ala Asn His Cys Gly Thr Val Ala
115 120 125
Asn Gly Val Leu Gln Thr Phe Met Arg Met Ala Trp Gly Gly Ser Tyr
130 135 140
Ile Ala Leu Asp Ser Gly Arg Gly Asn Trp Asp Cys Ile Met Thr Ser
145 150 155 160
Tyr Gln Tyr Leu Ile Ile Gln Asn Thr Thr Trp Glu Asp His Cys Gln
165 170 175
Phe Ser Arg Pro Ser Pro Ile Gly Tyr Leu Gly Leu Leu Ser Gln Arg
180 185 190
Thr Arg Asp Ile Tyr Ile Ser Arg Arg Leu Leu Arg Pro His Gly Gly
195 200 205
Gly Ser Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu
210 215 220
Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys
225 230 235 240
Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala
245 250 255
Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala
260 265 270
Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro
275 280 285
Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg
290 295 300
Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile
305 310 315 320
Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala
325 330 335
Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro
340 345 350
Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly
355 360 365
Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu
370 375 380
Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu
385 390 395 400
Glu His His His His His His
405
<210> 132
<211> 1264
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding ssBiP- Glycoprotein GP1 from Junin virus-
SNAPlike-Histag for expression in S2 cells
<400> 132
atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60
gaggaggctt tcaagatcgg cctgcacacc gagttccaga cggtgtcctt ctcgatggtg 120
ggcctcttct ccaacaaccc acacgacctg cctttgttgt gtaccttgaa caagagccat 180
ctgtacatta aggggggcaa cgcttcattc cagatcagct tcgacgacat cgcggtgttg 240
ttgccacagt acgacgttat catccagcac ccagcagaca tgagctggtg ctccaagagt 300
gatgatcaga tttggttgtc tcagtggttc atgaatgctg tgggacatga ttggcaccta 360
gacccaccat tcctgtgtag gaaccgtaca aagacagaag gcttcatctt ccaagtcaac 420
acctccaaga ctggtgttaa tgaaaattat gctaagaagt tcaagactgg catgcaccac 480
ttgtatagag agtaccctga ctcttgcccg aacggcaagc tgtgcttaat gaaggcacaa 540
cctaccagtt ggcctctcca atgtccactc gaccacgtca acacattaca cttccttaca 600
agaggcaaga acattcagct tccaaggagg tccttgaagc ggccgcacgg cggaggtagc 660
aaagactgcg aaatgaagcg caccaccctg gatagccctc tgggcaagct ggaactgtct 720
gggtgcgaac agggcctgca cgagatcaag ctgctgggca aaggaacatc tgccgccgac 780
gccgtggaag tgcctgcccc agccgccgtg ctgggcggac cagagccact gatgcaggcc 840
accgcctggc tcaacgccta ctttcaccag cctgaggcca tcgaggagtt ccctgtgcca 900
gccctgcacc acccagtgtt ccagcaggag agctttaccc gccaggtgct gtggaaactg 960
ctgaaagtgg tgaagttcgg agaggtcatc agctaccagc agctggccgc cctggccggc 1020
aatcccgccg ccaccgccgc cgtgaaaacc gccctgagcg gaaatcccgt gcccattctg 1080
atcccctgcc accgggtggt gtctagctct ggcgccgtgg ggggctacga gggcgggctc 1140
gccgtgaaag agtggctgct ggcccacgag ggccacagac tgggcaagcc tgggctgggt 1200
cctgcaggta taggcgcgcc agggtccctg gagcatcatc atcatcatca ttgatgacgg 1260
gccc 1264
<210> 133
<211> 399
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of fusion protein [JUN.ectoGP1-
SNAPlike-Histag]
<400> 133
Arg Ser Glu Glu Ala Phe Lys Ile Gly Leu His Thr Glu Phe Gln Thr
1 5 10 15
Val Ser Phe Ser Met Val Gly Leu Phe Ser Asn Asn Pro His Asp Leu
20 25 30
Pro Leu Leu Cys Thr Leu Asn Lys Ser His Leu Tyr Ile Lys Gly Gly
35 40 45
Asn Ala Ser Phe Gln Ile Ser Phe Asp Asp Ile Ala Val Leu Leu Pro
50 55 60
Gln Tyr Asp Val Ile Ile Gln His Pro Ala Asp Met Ser Trp Cys Ser
65 70 75 80
Lys Ser Asp Asp Gln Ile Trp Leu Ser Gln Trp Phe Met Asn Ala Val
85 90 95
Gly His Asp Trp His Leu Asp Pro Pro Phe Leu Cys Arg Asn Arg Thr
100 105 110
Lys Thr Glu Gly Phe Ile Phe Gln Val Asn Thr Ser Lys Thr Gly Val
115 120 125
Asn Glu Asn Tyr Ala Lys Lys Phe Lys Thr Gly Met His His Leu Tyr
130 135 140
Arg Glu Tyr Pro Asp Ser Cys Pro Asn Gly Lys Leu Cys Leu Met Lys
145 150 155 160
Ala Gln Pro Thr Ser Trp Pro Leu Gln Cys Pro Leu Asp His Val Asn
165 170 175
Thr Leu His Phe Leu Thr Arg Gly Lys Asn Ile Gln Leu Pro Arg Arg
180 185 190
Ser Leu Lys Arg Pro His Gly Gly Gly Ser Lys Asp Cys Glu Met Lys
195 200 205
Arg Thr Thr Leu Asp Ser Pro Leu Gly Lys Leu Glu Leu Ser Gly Cys
210 215 220
Glu Gln Gly Leu His Glu Ile Lys Leu Leu Gly Lys Gly Thr Ser Ala
225 230 235 240
Ala Asp Ala Val Glu Val Pro Ala Pro Ala Ala Val Leu Gly Gly Pro
245 250 255
Glu Pro Leu Met Gln Ala Thr Ala Trp Leu Asn Ala Tyr Phe His Gln
260 265 270
Pro Glu Ala Ile Glu Glu Phe Pro Val Pro Ala Leu His His Pro Val
275 280 285
Phe Gln Gln Glu Ser Phe Thr Arg Gln Val Leu Trp Lys Leu Leu Lys
290 295 300
Val Val Lys Phe Gly Glu Val Ile Ser Tyr Gln Gln Leu Ala Ala Leu
305 310 315 320
Ala Gly Asn Pro Ala Ala Thr Ala Ala Val Lys Thr Ala Leu Ser Gly
325 330 335
Asn Pro Val Pro Ile Leu Ile Pro Cys His Arg Val Val Ser Ser Ser
340 345 350
Gly Ala Val Gly Gly Tyr Glu Gly Gly Leu Ala Val Lys Glu Trp Leu
355 360 365
Leu Ala His Glu Gly His Arg Leu Gly Lys Pro Gly Leu Gly Pro Ala
370 375 380
Gly Ile Gly Ala Pro Gly Ser Leu Glu His His His His His His
385 390 395
<210> 134
<211> 1297
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding ssBiP- Glycoprotein GP1 from Machupo virus-
SNAPlike-Histag for expression in S2 cells
<400> 134
atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60
gacggcacat tcaagatcgg cctgcacacg gagttccagt cagtcaccct caccatgcag 120
agacttttgg ctaaccattc aaacgagctc ccgtctctct gcatgctgaa caacagtttc 180
tattatatga ggggaggtgt gaacaccttc ctgatccgtg tttctgatat ttcagtcctc 240
atgaaggagt acgatgtatc aatctacgag ccagaggacc tcggaaactg tctgaacaag 300
tctgactcaa gctgggctat ccattggttc tcaaacgctt tgggacatga ctggctgatg 360
gaccctccaa tgctctgtag aaacaagaca aagaaggagg gatctaacat ccaattcaac 420
atcagcaagg ctgatgatgc cagagtgtat ggaaagaaga tcagaaacgg tatgaggcat 480
ctcttcaggg gcttccatga cccgtgtgag gaagggaagg tgtgctacct gaccatcaac 540
cagtgtggtg accccagttc cttcgactac tgtggcgtga accatctgtc caagtgtcag 600
ttcgaccatg tgaacaccct gcatttcctg gtgagaagta agacacatct caacttcgag 660
aggtctttga agcggccgca cggcggaggt agcaaagact gcgaaatgaa gcgcaccacc 720
ctggatagcc ctctgggcaa gctggaactg tctgggtgcg aacagggcct gcacgagatc 780
aagctgctgg gcaaaggaac atctgccgcc gacgccgtgg aagtgcctgc cccagccgcc 840
gtgctgggcg gaccagagcc actgatgcag gccaccgcct ggctcaacgc ctactttcac 900
cagcctgagg ccatcgagga gttccctgtg ccagccctgc accacccagt gttccagcag 960
gagagcttta cccgccaggt gctgtggaaa ctgctgaaag tggtgaagtt cggagaggtc 1020
atcagctacc agcagctggc cgccctggcc ggcaatcccg ccgccaccgc cgccgtgaaa 1080
accgccctga gcggaaatcc cgtgcccatt ctgatcccct gccaccgggt ggtgtctagc 1140
tctggcgccg tggggggcta cgagggcggg ctcgccgtga aagagtggct gctggcccac 1200
gagggccaca gactgggcaa gcctgggctg ggtcctgcag gtataggcgc gccagggtcc 1260
ctggagcatc atcatcatca tcattgatga cgggccc 1297
<210> 135
<211> 410
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of fusion protein [MAC.ectoGP1-
SNAPlike-Histag]
<400> 135
Arg Ser Asp Gly Thr Phe Lys Ile Gly Leu His Thr Glu Phe Gln Ser
1 5 10 15
Val Thr Leu Thr Met Gln Arg Leu Leu Ala Asn His Ser Asn Glu Leu
20 25 30
Pro Ser Leu Cys Met Leu Asn Asn Ser Phe Tyr Tyr Met Arg Gly Gly
35 40 45
Val Asn Thr Phe Leu Ile Arg Val Ser Asp Ile Ser Val Leu Met Lys
50 55 60
Glu Tyr Asp Val Ser Ile Tyr Glu Pro Glu Asp Leu Gly Asn Cys Leu
65 70 75 80
Asn Lys Ser Asp Ser Ser Trp Ala Ile His Trp Phe Ser Asn Ala Leu
85 90 95
Gly His Asp Trp Leu Met Asp Pro Pro Met Leu Cys Arg Asn Lys Thr
100 105 110
Lys Lys Glu Gly Ser Asn Ile Gln Phe Asn Ile Ser Lys Ala Asp Asp
115 120 125
Ala Arg Val Tyr Gly Lys Lys Ile Arg Asn Gly Met Arg His Leu Phe
130 135 140
Arg Gly Phe His Asp Pro Cys Glu Glu Gly Lys Val Cys Tyr Leu Thr
145 150 155 160
Ile Asn Gln Cys Gly Asp Pro Ser Ser Phe Asp Tyr Cys Gly Val Asn
165 170 175
His Leu Ser Lys Cys Gln Phe Asp His Val Asn Thr Leu His Phe Leu
180 185 190
Val Arg Ser Lys Thr His Leu Asn Phe Glu Arg Ser Leu Lys Arg Pro
195 200 205
His Gly Gly Gly Ser Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp
210 215 220
Ser Pro Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His
225 230 235 240
Glu Ile Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu
245 250 255
Val Pro Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln
260 265 270
Ala Thr Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu
275 280 285
Glu Phe Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser
290 295 300
Phe Thr Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly
305 310 315 320
Glu Val Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala
325 330 335
Ala Thr Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile
340 345 350
Leu Ile Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly
355 360 365
Tyr Glu Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly
370 375 380
His Arg Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro
385 390 395 400
Gly Ser Leu Glu His His His His His His
405 410
<210> 136
<211> 1246
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding ssBiP- Glycoprotein GP1 from Guanarito
virus- SNAPlike-Histag for expression in S2 cells
<400> 136
atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60
ttcaaggttg gtcatcatac gaacttcgag tcgttcacgg ttaagctggg aggtgtcttc 120
catgaattgc cttcgctgtg tagggtcaac aactcctaca gtctgatcag gctctcccat 180
aacagtaacc aggcattgtc ggttgagtac gtggatgtgc accctgtcct ctgttcgtcc 240
agtccaacca tcctcgacaa ctacacgcaa tgtatcaagg gctcgccaga gttcgattgg 300
attctcgggt ggacgatcaa gggattggga catgacttct tgagagatcc aagaatctgc 360
tgtgagccta agaagacgac taacgctgag ttcacgttcc aattgaactt gacggatagt 420
cctgagaccc atcactacag gagcaagatt gaggtaggca tccgacactt gttcgggaac 480
tacatcacca acgatagcta ctcgaagatg tccgtggtta tgaggaacac cacctgggaa 540
ggtcaatgct cgaacagtca tgtgaacacg ctgagattcc tcgttaagaa cgcaggttac 600
ctcgttggaa ggaagccact gcggccgcac ggcggaggta gcaaagactg cgaaatgaag 660
cgcaccaccc tggatagccc tctgggcaag ctggaactgt ctgggtgcga acagggcctg 720
cacgagatca agctgctggg caaaggaaca tctgccgccg acgccgtgga agtgcctgcc 780
ccagccgccg tgctgggcgg accagagcca ctgatgcagg ccaccgcctg gctcaacgcc 840
tactttcacc agcctgaggc catcgaggag ttccctgtgc cagccctgca ccacccagtg 900
ttccagcagg agagctttac ccgccaggtg ctgtggaaac tgctgaaagt ggtgaagttc 960
ggagaggtca tcagctacca gcagctggcc gccctggccg gcaatcccgc cgccaccgcc 1020
gccgtgaaaa ccgccctgag cggaaatccc gtgcccattc tgatcccctg ccaccgggtg 1080
gtgtctagct ctggcgccgt ggggggctac gagggcgggc tcgccgtgaa agagtggctg 1140
ctggcccacg agggccacag actgggcaag cctgggctgg gtcctgcagg tataggcgcg 1200
ccagggtccc tggagcatca tcatcatcat cattgatgac gggccc 1246
<210> 137
<211> 393
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of fusion protein [GUA.ectoGP1-
SNAPlike-Histag]
<400> 137
Arg Ser Phe Lys Val Gly His His Thr Asn Phe Glu Ser Phe Thr Val
1 5 10 15
Lys Leu Gly Gly Val Phe His Glu Leu Pro Ser Leu Cys Arg Val Asn
20 25 30
Asn Ser Tyr Ser Leu Ile Arg Leu Ser His Asn Ser Asn Gln Ala Leu
35 40 45
Ser Val Glu Tyr Val Asp Val His Pro Val Leu Cys Ser Ser Ser Pro
50 55 60
Thr Ile Leu Asp Asn Tyr Thr Gln Cys Ile Lys Gly Ser Pro Glu Phe
65 70 75 80
Asp Trp Ile Leu Gly Trp Thr Ile Lys Gly Leu Gly His Asp Phe Leu
85 90 95
Arg Asp Pro Arg Ile Cys Cys Glu Pro Lys Lys Thr Thr Asn Ala Glu
100 105 110
Phe Thr Phe Gln Leu Asn Leu Thr Asp Ser Pro Glu Thr His His Tyr
115 120 125
Arg Ser Lys Ile Glu Val Gly Ile Arg His Leu Phe Gly Asn Tyr Ile
130 135 140
Thr Asn Asp Ser Tyr Ser Lys Met Ser Val Val Met Arg Asn Thr Thr
145 150 155 160
Trp Glu Gly Gln Cys Ser Asn Ser His Val Asn Thr Leu Arg Phe Leu
165 170 175
Val Lys Asn Ala Gly Tyr Leu Val Gly Arg Lys Pro Leu Arg Pro His
180 185 190
Gly Gly Gly Ser Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser
195 200 205
Pro Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu
210 215 220
Ile Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val
225 230 235 240
Pro Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala
245 250 255
Thr Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu
260 265 270
Phe Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe
275 280 285
Thr Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu
290 295 300
Val Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala
305 310 315 320
Thr Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu
325 330 335
Ile Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr
340 345 350
Glu Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His
355 360 365
Arg Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly
370 375 380
Ser Leu Glu His His His His His His
385 390
<210> 138
<211> 1273
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding ssBiP- Glycoprotein GP1 from Sabia virus-
SNAPlike-Histag for expression in S2 cells
<400> 138
atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60
ttcagaatcg gaaggagcac agaattgcag aacatcacgt tcgatatgtt gaaggtgttc 120
gaggaccacc ccacatcctg catggtgaac cattccacct actacgtcca tgagaacaag 180
aacgccactt ggtgtctgga ggtgtccgtg actgatgtta ccctgctcat ggctgaacat 240
gatcgtcaag tcctcaacaa cctgtcgaac tgtgtgcacc ctgcagtcga gcacagaagc 300
aggatggttg gcttgctgga gtggatcttc agagccctga agtacgactt caaccatgat 360
ccaacaccgt tgtgtcagaa gcagacttcg acagtgaacg agacacgtgt gcagatcaac 420
atcactgagg ggttcgggtc ccacgggttc gaagatacca tcctccagag actcggggtt 480
ctgttcggtt cgagaattgc attctcgaac atccaggact tgggtaagaa gaggttcttg 540
ttgatcagga actcgacttg gaagaaccaa tgcgagatga accatgtgaa ctccatgcac 600
ttgatgttgg cgaacgctgg tcgctcgtcc ggttcgagaa gaccactgcg gccgcacggc 660
ggaggtagca aagactgcga aatgaagcgc accaccctgg atagccctct gggcaagctg 720
gaactgtctg ggtgcgaaca gggcctgcac gagatcaagc tgctgggcaa aggaacatct 780
gccgccgacg ccgtggaagt gcctgcccca gccgccgtgc tgggcggacc agagccactg 840
atgcaggcca ccgcctggct caacgcctac tttcaccagc ctgaggccat cgaggagttc 900
cctgtgccag ccctgcacca cccagtgttc cagcaggaga gctttacccg ccaggtgctg 960
tggaaactgc tgaaagtggt gaagttcgga gaggtcatca gctaccagca gctggccgcc 1020
ctggccggca atcccgccgc caccgccgcc gtgaaaaccg ccctgagcgg aaatcccgtg 1080
cccattctga tcccctgcca ccgggtggtg tctagctctg gcgccgtggg gggctacgag 1140
ggcgggctcg ccgtgaaaga gtggctgctg gcccacgagg gccacagact gggcaagcct 1200
gggctgggtc ctgcaggtat aggcgcgcca gggtccctgg agcatcatca tcatcatcat 1260
tgatgacggg ccc 1273
<210> 139
<211> 396
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of fusion protein [SAB.ectoGP1-
SNAPlike-Histag]
<400> 139
Arg Ser Thr Glu Leu Gln Asn Ile Thr Phe Asp Met Leu Lys Val Phe
1 5 10 15
Glu Asp His Pro Thr Ser Cys Met Val Asn His Ser Thr Tyr Tyr Val
20 25 30
His Glu Asn Lys Asn Ala Thr Trp Cys Leu Glu Val Ser Val Thr Asp
35 40 45
Val Thr Leu Leu Met Ala Glu His Asp Arg Gln Val Leu Asn Asn Leu
50 55 60
Ser Asn Cys Val His Pro Ala Val Glu His Arg Ser Arg Met Val Gly
65 70 75 80
Leu Leu Glu Trp Ile Phe Arg Ala Leu Lys Tyr Asp Phe Asn His Asp
85 90 95
Pro Thr Pro Leu Cys Gln Lys Gln Thr Ser Thr Val Asn Glu Thr Arg
100 105 110
Val Gln Ile Asn Ile Thr Glu Gly Phe Gly Ser His Gly Phe Glu Asp
115 120 125
Thr Ile Leu Gln Arg Leu Gly Val Leu Phe Gly Ser Arg Ile Ala Phe
130 135 140
Ser Asn Ile Gln Asp Leu Gly Lys Lys Arg Phe Leu Leu Ile Arg Asn
145 150 155 160
Ser Thr Trp Lys Asn Gln Cys Glu Met Asn His Val Asn Ser Met His
165 170 175
Leu Met Leu Ala Asn Ala Gly Arg Ser Ser Gly Ser Arg Arg Pro Leu
180 185 190
Arg Pro His Gly Gly Gly Ser Lys Asp Cys Glu Met Lys Arg Thr Thr
195 200 205
Leu Asp Ser Pro Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly
210 215 220
Leu His Glu Ile Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala
225 230 235 240
Val Glu Val Pro Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu
245 250 255
Met Gln Ala Thr Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala
260 265 270
Ile Glu Glu Phe Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln
275 280 285
Glu Ser Phe Thr Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys
290 295 300
Phe Gly Glu Val Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn
305 310 315 320
Pro Ala Ala Thr Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val
325 330 335
Pro Ile Leu Ile Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val
340 345 350
Gly Gly Tyr Glu Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His
355 360 365
Glu Gly His Arg Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly
370 375 380
Ala Pro Gly Ser Leu Glu His His His His His His
385 390 395
<210> 140
<211> 1189
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding ssBiP- Glycoprotein GP2 from Lassa virus-
SNAPlike-Histag for expression in S2 cells
<400> 140
atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60
ggcacattca catggacact gtcggattct gaaggtaagg acacaccagg gggatactgt 120
ctgaccaggt ggatgctgat cgaggctgaa ctgaagtgct tcgggaacac agctgtggcg 180
aagtgtaacg agaagcatga tgaggagttc tgtgacatgc tgaggctgtt cgacttcaac 240
aagcaagcca tccagaggtt gaaggctgaa gcacagatga gcatccagtt gatcaacaag 300
gcagtgaatg ccttgatcaa cgaccaactg atcatgaaga accatctgcg ggacatcatg 360
ggtatcccat actgtaacta cagcaagtac tggtacctca accacacaac tactgggaga 420
acatcgctgc ccaagtgttg gctggtgtcg aacggttcgt acttgaacga gacccacttc 480
tccgatgaca tcgaacaaca agctgacaac atgatcactg agatgttgca gaaggagtac 540
atggagaggc aggggaagac accgcggccg cacggcggag gtagcaaaga ctgcgaaatg 600
aagcgcacca ccctggatag ccctctgggc aagctggaac tgtctgggtg cgaacagggc 660
ctgcacgaga tcaagctgct gggcaaagga acatctgccg ccgacgccgt ggaagtgcct 720
gccccagccg ccgtgctggg cggaccagag ccactgatgc aggccaccgc ctggctcaac 780
gcctactttc accagcctga ggccatcgag gagttccctg tgccagccct gcaccaccca 840
gtgttccagc aggagagctt tacccgccag gtgctgtgga aactgctgaa agtggtgaag 900
ttcggagagg tcatcagcta ccagcagctg gccgccctgg ccggcaatcc cgccgccacc 960
gccgccgtga aaaccgccct gagcggaaat cccgtgccca ttctgatccc ctgccaccgg 1020
gtggtgtcta gctctggcgc cgtggggggc tacgagggcg ggctcgccgt gaaagagtgg 1080
ctgctggccc acgagggcca cagactgggc aagcctgggc tgggtcctgc aggtataggc 1140
gcgccagggt ccctggagca tcatcatcat catcattgat gacgggccc 1189
<210> 141
<211> 374
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of fusion protein [LAS.ectoGP2-
SNAPlike-Histag]
<400> 141
Arg Ser Gly Thr Phe Thr Trp Thr Leu Ser Asp Ser Glu Gly Lys Asp
1 5 10 15
Thr Pro Gly Gly Tyr Cys Leu Thr Arg Trp Met Leu Ile Glu Ala Glu
20 25 30
Leu Lys Cys Phe Gly Asn Thr Ala Val Ala Lys Cys Asn Glu Lys His
35 40 45
Asp Glu Glu Phe Cys Asp Met Leu Arg Leu Phe Asp Phe Asn Lys Gln
50 55 60
Ala Ile Gln Arg Leu Lys Ala Glu Ala Gln Met Ser Ile Gln Leu Ile
65 70 75 80
Asn Lys Ala Val Asn Ala Leu Ile Asn Asp Gln Leu Ile Met Lys Asn
85 90 95
His Leu Arg Asp Ile Met Gly Ile Pro Tyr Cys Asn Tyr Ser Lys Tyr
100 105 110
Trp Tyr Leu Asn His Thr Thr Thr Gly Arg Thr Ser Leu Pro Lys Cys
115 120 125
Trp Leu Val Ser Asn Gly Ser Tyr Leu Asn Glu Thr His Phe Ser Asp
130 135 140
Asp Ile Glu Gln Gln Ala Asp Asn Met Ile Thr Glu Met Leu Gln Lys
145 150 155 160
Glu Tyr Met Glu Arg Gln Gly Lys Thr Pro Arg Pro His Gly Gly Gly
165 170 175
Ser Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly
180 185 190
Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu
195 200 205
Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro
210 215 220
Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp
225 230 235 240
Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val
245 250 255
Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln
260 265 270
Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser
275 280 285
Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala
290 295 300
Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys
305 310 315 320
His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly
325 330 335
Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly
340 345 350
Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Glu
355 360 365
His His His His His His
370
<210> 142
<211> 1189
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding ssBiP- Glycoprotein GP2 from Junin virus-
SNAPlike-Histag for expression in S2 cells
<400> 142
atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60
gcattcttct cctggtcgtt gacagactca tccggcaagg atacccctgg aggctactgc 120
ctggaagagt ggatgctcgt ggcagccaag atgaagtgct tcggcaacac tgctgtggcc 180
aagtgcaact tgaaccatga ctcggagttc tgtgacatgt tgaggctgtt cgattacaac 240
aagaacgcta tcaagaccct gaacgatgag actaagaagc aagtgaacct gatggggcag 300
acaatcaacg ccctgatctc ggacaacttg ttgatgaaga acaagatcag ggaactgatg 360
agtgtccctt actgcaacta cacgaagttc tggtacgtca accacacact ctccggacaa 420
cactcgttgc caaggtgctg gttgatcaag aacaacagct acttgaacat ctccgacttc 480
cgtaacgact ggatcttgga gagtgacttc ttgatctccg agatgctgag caaggagtac 540
tcggacaggc agggtaagac tccgcggccg cacggcggag gtagcaaaga ctgcgaaatg 600
aagcgcacca ccctggatag ccctctgggc aagctggaac tgtctgggtg cgaacagggc 660
ctgcacgaga tcaagctgct gggcaaagga acatctgccg ccgacgccgt ggaagtgcct 720
gccccagccg ccgtgctggg cggaccagag ccactgatgc aggccaccgc ctggctcaac 780
gcctactttc accagcctga ggccatcgag gagttccctg tgccagccct gcaccaccca 840
gtgttccagc aggagagctt tacccgccag gtgctgtgga aactgctgaa agtggtgaag 900
ttcggagagg tcatcagcta ccagcagctg gccgccctgg ccggcaatcc cgccgccacc 960
gccgccgtga aaaccgccct gagcggaaat cccgtgccca ttctgatccc ctgccaccgg 1020
gtggtgtcta gctctggcgc cgtggggggc tacgagggcg ggctcgccgt gaaagagtgg 1080
ctgctggccc acgagggcca cagactgggc aagcctgggc tgggtcctgc aggtataggc 1140
gcgccagggt ccctggagca tcatcatcat catcattgat gacgggccc 1189
<210> 143
<211> 374
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of fusion protein [JUN.ectoGP2-
SNAPlike-Histag]
<400> 143
Arg Ser Gly Thr Phe Thr Trp Thr Leu Ser Asp Ser Glu Gly Lys Asp
1 5 10 15
Thr Pro Gly Gly Tyr Cys Leu Thr Arg Trp Met Leu Ile Glu Ala Glu
20 25 30
Leu Lys Cys Phe Gly Asn Thr Ala Val Ala Lys Cys Asn Glu Lys His
35 40 45
Asp Glu Glu Phe Cys Asp Met Leu Arg Leu Phe Asp Phe Asn Lys Gln
50 55 60
Ala Ile Gln Arg Leu Lys Ala Glu Ala Gln Met Ser Ile Gln Leu Ile
65 70 75 80
Asn Lys Ala Val Asn Ala Leu Ile Asn Asp Gln Leu Ile Met Lys Asn
85 90 95
His Leu Arg Asp Ile Met Gly Ile Pro Tyr Cys Asn Tyr Ser Lys Tyr
100 105 110
Trp Tyr Leu Asn His Thr Thr Thr Gly Arg Thr Ser Leu Pro Lys Cys
115 120 125
Trp Leu Val Ser Asn Gly Ser Tyr Leu Asn Glu Thr His Phe Ser Asp
130 135 140
Asp Ile Glu Gln Gln Ala Asp Asn Met Ile Thr Glu Met Leu Gln Lys
145 150 155 160
Glu Tyr Met Glu Arg Gln Gly Lys Thr Pro Arg Pro His Gly Gly Gly
165 170 175
Ser Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly
180 185 190
Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu
195 200 205
Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro
210 215 220
Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp
225 230 235 240
Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val
245 250 255
Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln
260 265 270
Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser
275 280 285
Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala
290 295 300
Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys
305 310 315 320
His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly
325 330 335
Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly
340 345 350
Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Glu
355 360 365
His His His His His His
370
<210> 144
<211> 1189
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding ssBiP-Glycoprotein GP2 from Machupo virus-
SNAPlike-Histag for expression in S2 cells
<400> 144
atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60
gcattcttct catggtcgct gaccgactcc tccggcaagg acatgccagg aggttactgt 120
ctggaggaat ggatgttgat cgcagccaag atgaagtgct tcggcaacac cgctgtcgct 180
aagtgtaacc agaaccatga ctcagagttc tgtgatatgc tgaggctatt cgactacaac 240
aagaacgcaa tcaagaccct caacgatgaa tcgaagaagg agatcaacct gctaagccag 300
accgtgaacg ccttgatctc ggataacttg ttaatgaaga acaagatcaa ggagctaatg 360
agcatccctt actgtaatta cacgaagttc tggtacgtca accataccct gacagggcag 420
cacacgctgc caaggtgttg gttgatcagg aacggaagtt acctcaacac ctcggagttc 480
aggaacgact ggatcttgga gagtgatcac ctcatctcgg agatgttgag taaggaatac 540
gctgagaggc aaggcaagac cccgcggccg cacggcggag gtagcaaaga ctgcgaaatg 600
aagcgcacca ccctggatag ccctctgggc aagctggaac tgtctgggtg cgaacagggc 660
ctgcacgaga tcaagctgct gggcaaagga acatctgccg ccgacgccgt ggaagtgcct 720
gccccagccg ccgtgctggg cggaccagag ccactgatgc aggccaccgc ctggctcaac 780
gcctactttc accagcctga ggccatcgag gagttccctg tgccagccct gcaccaccca 840
gtgttccagc aggagagctt tacccgccag gtgctgtgga aactgctgaa agtggtgaag 900
ttcggagagg tcatcagcta ccagcagctg gccgccctgg ccggcaatcc cgccgccacc 960
gccgccgtga aaaccgccct gagcggaaat cccgtgccca ttctgatccc ctgccaccgg 1020
gtggtgtcta gctctggcgc cgtggggggc tacgagggcg ggctcgccgt gaaagagtgg 1080
ctgctggccc acgagggcca cagactgggc aagcctgggc tgggtcctgc aggtataggc 1140
gcgccagggt ccctggagca tcatcatcat catcattgat gacgggccc 1189
<210> 145
<211> 374
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of fusion protein [MAC.ectoGP2-
SNAPlike-Histag]
<400> 145
Arg Ser Ala Phe Phe Ser Trp Ser Leu Thr Asp Ser Ser Gly Lys Asp
1 5 10 15
Met Pro Gly Gly Tyr Cys Leu Glu Glu Trp Met Leu Ile Ala Ala Lys
20 25 30
Met Lys Cys Phe Gly Asn Thr Ala Val Ala Lys Cys Asn Gln Asn His
35 40 45
Asp Ser Glu Phe Cys Asp Met Leu Arg Leu Phe Asp Tyr Asn Lys Asn
50 55 60
Ala Ile Lys Thr Leu Asn Asp Glu Ser Lys Lys Glu Ile Asn Leu Leu
65 70 75 80
Ser Gln Thr Val Asn Ala Leu Ile Ser Asp Asn Leu Leu Met Lys Asn
85 90 95
Lys Ile Lys Glu Leu Met Ser Ile Pro Tyr Cys Asn Tyr Thr Lys Phe
100 105 110
Trp Tyr Val Asn His Thr Leu Thr Gly Gln His Thr Leu Pro Arg Cys
115 120 125
Trp Leu Ile Arg Asn Gly Ser Tyr Leu Asn Thr Ser Glu Phe Arg Asn
130 135 140
Asp Trp Ile Leu Glu Ser Asp His Leu Ile Ser Glu Met Leu Ser Lys
145 150 155 160
Glu Tyr Ala Glu Arg Gln Gly Lys Thr Pro Arg Pro His Gly Gly Gly
165 170 175
Ser Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly
180 185 190
Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu
195 200 205
Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro
210 215 220
Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp
225 230 235 240
Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val
245 250 255
Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln
260 265 270
Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser
275 280 285
Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala
290 295 300
Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys
305 310 315 320
His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly
325 330 335
Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly
340 345 350
Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Glu
355 360 365
His His His His His His
370
<210> 146
<211> 1189
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding ssBiP-Glycoprotein GP2 from Guanarito
virus- SNAPlike-Histag for expression in S2 cells
<400> 146
atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60
gcattcttca gttggtcgct gtctgacccg aagggtaatg acatgccagg tggttactgt 120
ctggagaggt ggatgttggt cgctggggac ttgaagtgct tcggcaacac agctgtcgcc 180
aagtgtaact tgaaccatga ttccgagttc tgtgacatgt tgaggctgtt cgacttcaac 240
aagaacgcca tcgagaagct gaacaaccag actaagactg ctgtcaacat gttgactcac 300
tcgatcaaca gtctgatctc cgataacttg ttgatgagga acaagctgaa ggagattttg 360
aaggtcccat actgcaacta cacaagattc tggtacatca accacacgaa gtccggcgag 420
cactcgctgc ctcggtgttg gctggtcagt aacggttcct acttgaacga gagtgacttc 480
aggaacgagt ggatcttgga gagtgatcac ctgatcgcag agatgttgag caaggaatac 540
caagataggc aggggaagac tccgcggccg cacggcggag gtagcaaaga ctgcgaaatg 600
aagcgcacca ccctggatag ccctctgggc aagctggaac tgtctgggtg cgaacagggc 660
ctgcacgaga tcaagctgct gggcaaagga acatctgccg ccgacgccgt ggaagtgcct 720
gccccagccg ccgtgctggg cggaccagag ccactgatgc aggccaccgc ctggctcaac 780
gcctactttc accagcctga ggccatcgag gagttccctg tgccagccct gcaccaccca 840
gtgttccagc aggagagctt tacccgccag gtgctgtgga aactgctgaa agtggtgaag 900
ttcggagagg tcatcagcta ccagcagctg gccgccctgg ccggcaatcc cgccgccacc 960
gccgccgtga aaaccgccct gagcggaaat cccgtgccca ttctgatccc ctgccaccgg 1020
gtggtgtcta gctctggcgc cgtggggggc tacgagggcg ggctcgccgt gaaagagtgg 1080
ctgctggccc acgagggcca cagactgggc aagcctgggc tgggtcctgc aggtataggc 1140
gcgccagggt ccctggagca tcatcatcat catcattgat gacgggccc 1189
<210> 147
<211> 374
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of fusion protein [GUA.ectoGP2-
SNAPlike-Histag]
<400> 147
Arg Ser Ala Phe Phe Ser Trp Ser Leu Ser Asp Pro Lys Gly Asn Asp
1 5 10 15
Met Pro Gly Gly Tyr Cys Leu Glu Arg Trp Met Leu Val Ala Gly Asp
20 25 30
Leu Lys Cys Phe Gly Asn Thr Ala Val Ala Lys Cys Asn Leu Asn His
35 40 45
Asp Ser Glu Phe Cys Asp Met Leu Arg Leu Phe Asp Phe Asn Lys Asn
50 55 60
Ala Ile Glu Lys Leu Asn Asn Gln Thr Lys Thr Ala Val Asn Met Leu
65 70 75 80
Thr His Ser Ile Asn Ser Leu Ile Ser Asp Asn Leu Leu Met Arg Asn
85 90 95
Lys Leu Lys Glu Ile Leu Lys Val Pro Tyr Cys Asn Tyr Thr Arg Phe
100 105 110
Trp Tyr Ile Asn His Thr Lys Ser Gly Glu His Ser Leu Pro Arg Cys
115 120 125
Trp Leu Val Ser Asn Gly Ser Tyr Leu Asn Glu Ser Asp Phe Arg Asn
130 135 140
Glu Trp Ile Leu Glu Ser Asp His Leu Ile Ala Glu Met Leu Ser Lys
145 150 155 160
Glu Tyr Gln Asp Arg Gln Gly Lys Thr Pro Arg Pro His Gly Gly Gly
165 170 175
Ser Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly
180 185 190
Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu
195 200 205
Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro
210 215 220
Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp
225 230 235 240
Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val
245 250 255
Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln
260 265 270
Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser
275 280 285
Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala
290 295 300
Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys
305 310 315 320
His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly
325 330 335
Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly
340 345 350
Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Glu
355 360 365
His His His His His His
370
<210> 148
<211> 1189
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding ssBiP-Glycoprotein GP2 from Sabia virus-
SNAPlike-Histag for expression in S2 cells
<400> 148
atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60
ggcatcttct cctggacgat cacggatgca gtgggcaacg acatgcctgg tggttactgt 120
ctggagagat ggatgctggt gacgtcggat cttaagtgct tcggcaacac ggcactggcg 180
aagtgtaacc tcgaccacga ttcggagttc tgtgacatgt tgaagttgtt cgagttcaac 240
aagaaggcga tcgagacatt gaacgacaac acgaagaaca aggtgaactt gctgacccac 300
tcgatcaacg cattgatctc cgacaacttg ctgatgaaga accgactcaa ggaattgttg 360
aacacgcctt actgtaacta caccaagttc tggtatgtca accacacggc atccggggag 420
cactcattgc cacggtgctg gctggttagg aacaatagct acttgaacga gagtgagttc 480
aggaatgatt ggatcatcga gagtgatcac ttgttgtccg agatgctcaa caaggaatac 540
atcgatagac agggcaagac gccgcggccg cacggcggag gtagcaaaga ctgcgaaatg 600
aagcgcacca ccctggatag ccctctgggc aagctggaac tgtctgggtg cgaacagggc 660
ctgcacgaga tcaagctgct gggcaaagga acatctgccg ccgacgccgt ggaagtgcct 720
gccccagccg ccgtgctggg cggaccagag ccactgatgc aggccaccgc ctggctcaac 780
gcctactttc accagcctga ggccatcgag gagttccctg tgccagccct gcaccaccca 840
gtgttccagc aggagagctt tacccgccag gtgctgtgga aactgctgaa agtggtgaag 900
ttcggagagg tcatcagcta ccagcagctg gccgccctgg ccggcaatcc cgccgccacc 960
gccgccgtga aaaccgccct gagcggaaat cccgtgccca ttctgatccc ctgccaccgg 1020
gtggtgtcta gctctggcgc cgtggggggc tacgagggcg ggctcgccgt gaaagagtgg 1080
ctgctggccc acgagggcca cagactgggc aagcctgggc tgggtcctgc aggtataggc 1140
gcgccagggt ccctggagca tcatcatcat catcattgat gacgggccc 1189
<210> 149
<211> 374
<212> PRT
<213> artificial
<220>
<223> Amino acid sequence of fusion protein [SAB.ectoGP2-
SNAPlike-Histag]
<400> 149
Arg Ser Gly Ile Phe Ser Trp Thr Ile Thr Asp Ala Val Gly Asn Asp
1 5 10 15
Met Pro Gly Gly Tyr Cys Leu Glu Arg Trp Met Leu Val Thr Ser Asp
20 25 30
Leu Lys Cys Phe Gly Asn Thr Ala Leu Ala Lys Cys Asn Leu Asp His
35 40 45
Asp Ser Glu Phe Cys Asp Met Leu Lys Leu Phe Glu Phe Asn Lys Lys
50 55 60
Ala Ile Glu Thr Leu Asn Asp Asn Thr Lys Asn Lys Val Asn Leu Leu
65 70 75 80
Thr His Ser Ile Asn Ala Leu Ile Ser Asp Asn Leu Leu Met Lys Asn
85 90 95
Arg Leu Lys Glu Leu Leu Asn Thr Pro Tyr Cys Asn Tyr Thr Lys Phe
100 105 110
Trp Tyr Val Asn His Thr Ala Ser Gly Glu His Ser Leu Pro Arg Cys
115 120 125
Trp Leu Val Arg Asn Asn Ser Tyr Leu Asn Glu Ser Glu Phe Arg Asn
130 135 140
Asp Trp Ile Ile Glu Ser Asp His Leu Leu Ser Glu Met Leu Asn Lys
145 150 155 160
Glu Tyr Ile Asp Arg Gln Gly Lys Thr Pro Arg Pro His Gly Gly Gly
165 170 175
Ser Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly
180 185 190
Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu
195 200 205
Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro
210 215 220
Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp
225 230 235 240
Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val
245 250 255
Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln
260 265 270
Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser
275 280 285
Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala
290 295 300
Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys
305 310 315 320
His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly
325 330 335
Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly
340 345 350
Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Glu
355 360 365
His His His His His His
370
<210> 150
<211> 2774
<212> DNA
<213> artificial
<220>
<223> DNA sequence encoding BiPlike- SNAPlike-proTEV1-C protein of
Hepatitis E virus- proTEV2-Histag for expression in S2 cells
<400> 150
atgaaactat gtattctact tgcagttgtt gcgttcgtag gattgtcctt acctacagct 60
ctggcaagat ctgacaaaga ctgcgaaatg aaaagaacta cattggattc accacttggg 120
aagttggaac tgagtggatg cgagcaagga ttgcatgaaa ttaagctact gggaaaagga 180
acttctgctg ctgatgcagt tgaagttcca gcaccagcag ctgttcttgg aggtcctgag 240
cccctcatgc aagccacagc ctggcttaac gcatatttcc accagcctga ggccattgag 300
gaatttccag tccccgccct tcaccatcct gtgtttcagc aggagagctt cacccgccag 360
gtcctgtgga aattgctgaa ggtggtcaag tttggtgaag tgatttcata tcagcaactt 420
gctgcattgg ccggtaaccc cgcagctaca gctgccgtga aaactgctct cagcggaaat 480
cctgtgccca tcctgatccc ttgtcacaga gtcgtttcat cttccggagc tgtaggtggc 540
tatgaaggag gactggcagt taaggagtgg ctgctggctc atgaaggtca tagacttgga 600
aagcctgggc tgggtcctgc tggtataggc gcgccagggt ccctaggtgg cggatccgaa 660
aacctgtact tccagagcga tatcaataac atgttctttt gctctgtgca tggagatgcc 720
accatgcgct ctcgggcttt tctgtttttg ttcctcgtgt ttctgcctat gctgcccgcg 780
ccaccggccg gtcagccgtc tggccgccgc cgcgggcggc gcagcggcgg tgccggcggt 840
ggtttctggg gtgaccggat tgattctcag cccttcgccc tcccctatat tcatccaacc 900
aaccccttcg cacctgacat tccagccgca gccggggctg gagctcgccc tcggcagcca 960
gcccgcccac tcggctccgc ttggcgtgac caatcccagc gccccgccac ttccgcccgt 1020
cgtcgatctg ccccagctgg ggcttcgccg ctgactgctg tggccccggc ccccgatact 1080
gttcctgttc ccgatgtcga ttctcgcggc gctatattac gccgccagta taatttatca 1140
acatccccgc taacatctac tattgccact ggtactaacc ttgttctata tgctgctccg 1200
ctgagccctt tgcttccgct ccaagatgga actaacactc acattatggc cactgaagca 1260
tcaaattatg cccagtaccg tgttgtccgc gctaccatcc ggtaccgtcc gcttgtgccg 1320
aacgctgtcg gcggatacgc tatatctatc tctttctggc ctcagacaac tactaccccg 1380
acatctgtgg acatgaactc tatcacctcc acggatgtcc gaatccttgt ccagcctggt 1440
attgcttcag aacttgtgat ccccagtgag cgcctgcatt atcgtaacca aggctggcgc 1500
tctgttgaga cctctggtgt tgcggaggag gaggcgacct ccggccttgt catgctttgc 1560
atccacggat cacctgtaaa ttcttacacc aatacgcctt atactggtgc ccttggcttg 1620
cttgatttcg cactcgagct cgagttccgc aatttgacac ctggtaacac gaacacacgt 1680
gtttcccgct actcgagtag tgcgcgccac aagctacgcc gagggcctga tggcactgct 1740
gagttaacta cgactgctgc tacacgcttt atgaaggacc ttcattttac agggactaat 1800
ggagttggtg aagtcggtcg tggtatagcg ctaactctgt tcaaccttgc tgatacgctt 1860
ctcggcgggc tcccgacaga attgatttcg tcggctggtg gtcagctatt ttattctcgc 1920
cccgtcgtct cagccaatgg cgagccgacg gtgaagctct acacttcagt cgagaacgct 1980
cagcaggata agggtatagc tatcccacat gatattgatc ttggtgagtc ccgtgttgtc 2040
attcaggatt atgataacca acatgagcag gatcgtccca ccccttctcc tgctccctct 2100
cggccttttt ctgtccttcg tgctaatgat gtgctatggc tttcacttac agcagctgag 2160
tatgatcaga ctacctatgg ctcctctact aatcccatgt atgtctctga taccgtgaca 2220
tttgtcaatg ttgctactgg tgcccagggg gtatctcgct ctctggactg gtctaaagtc 2280
acccttgatg ggcgcccact tatgactatc cagcagtatt ctaagacttt ctttgttctg 2340
cccctccgtg gcaagctctc cttctgggag gccggtacca ctaaggccgg ctacccttat 2400
aattataata ctactgccag tgaccagatt ttaattgaga atgcagctgg tcaccgtgta 2460
tgcatctcaa cctacactac taatcttgga tctggccctg tttctatttc tgctgtcggt 2520
gtcctcgcac ctcactctgc gttggccgct ttagaggaca ctgttgacta tcctgctcgt 2580
gctcacactt ttgatgattt ctgccctgag tgccgtacac tcggccttca gggttgtgct 2640
ttccaatcaa ctgttgctga gctacagcgt cttaaaatga aggtgggtaa aactcgggag 2700
tacccgggag agaatctata ttttcaaggg cccggcggag gtagtcacca tcatcaccat 2760
cactaatgac cggt 2774
<210> 151
<211> 899
<212> PRT
<213> artificial
<220>
<223> Aa sequence of fusion protein
[SNAPlike-proTEV1-HEV.C-proTEV2-Histag]
<400> 151
Arg Ser Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro
1 5 10 15
Leu Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile
20 25 30
Lys Leu Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro
35 40 45
Ala Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr
50 55 60
Ala Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe
65 70 75 80
Pro Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr
85 90 95
Arg Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val
100 105 110
Ile Ser Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr
115 120 125
Ala Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile
130 135 140
Pro Cys His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu
145 150 155 160
Gly Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg
165 170 175
Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser
180 185 190
Leu Gly Gly Gly Ser Glu Asn Leu Tyr Phe Gln Ser Asp Ile Asn Asn
195 200 205
Met Phe Phe Cys Ser Val His Gly Asp Ala Thr Met Arg Ser Arg Ala
210 215 220
Phe Leu Phe Leu Phe Leu Val Phe Leu Pro Met Leu Pro Ala Pro Pro
225 230 235 240
Ala Gly Gln Pro Ser Gly Arg Arg Arg Gly Arg Arg Ser Gly Gly Ala
245 250 255
Gly Gly Gly Phe Trp Gly Asp Arg Ile Asp Ser Gln Pro Phe Ala Leu
260 265 270
Pro Tyr Ile His Pro Thr Asn Pro Phe Ala Pro Asp Ile Pro Ala Ala
275 280 285
Ala Gly Ala Gly Ala Arg Pro Arg Gln Pro Ala Arg Pro Leu Gly Ser
290 295 300
Ala Trp Arg Asp Gln Ser Gln Arg Pro Ala Thr Ser Ala Arg Arg Arg
305 310 315 320
Ser Ala Pro Ala Gly Ala Ser Pro Leu Thr Ala Val Ala Pro Ala Pro
325 330 335
Asp Thr Val Pro Val Pro Asp Val Asp Ser Arg Gly Ala Ile Leu Arg
340 345 350
Arg Gln Tyr Asn Leu Ser Thr Ser Pro Leu Thr Ser Thr Ile Ala Thr
355 360 365
Gly Thr Asn Leu Val Leu Tyr Ala Ala Pro Leu Ser Pro Leu Leu Pro
370 375 380
Leu Gln Asp Gly Thr Asn Thr His Ile Met Ala Thr Glu Ala Ser Asn
385 390 395 400
Tyr Ala Gln Tyr Arg Val Val Arg Ala Thr Ile Arg Tyr Arg Pro Leu
405 410 415
Val Pro Asn Ala Val Gly Gly Tyr Ala Ile Ser Ile Ser Phe Trp Pro
420 425 430
Gln Thr Thr Thr Thr Pro Thr Ser Val Asp Met Asn Ser Ile Thr Ser
435 440 445
Thr Asp Val Arg Ile Leu Val Gln Pro Gly Ile Ala Ser Glu Leu Val
450 455 460
Ile Pro Ser Glu Arg Leu His Tyr Arg Asn Gln Gly Trp Arg Ser Val
465 470 475 480
Glu Thr Ser Gly Val Ala Glu Glu Glu Ala Thr Ser Gly Leu Val Met
485 490 495
Leu Cys Ile His Gly Ser Pro Val Asn Ser Tyr Thr Asn Thr Pro Tyr
500 505 510
Thr Gly Ala Leu Gly Leu Leu Asp Phe Ala Leu Glu Leu Glu Phe Arg
515 520 525
Asn Leu Thr Pro Gly Asn Thr Asn Thr Arg Val Ser Arg Tyr Ser Ser
530 535 540
Ser Ala Arg His Lys Leu Arg Arg Gly Pro Asp Gly Thr Ala Glu Leu
545 550 555 560
Thr Thr Thr Ala Ala Thr Arg Phe Met Lys Asp Leu His Phe Thr Gly
565 570 575
Thr Asn Gly Val Gly Glu Val Gly Arg Gly Ile Ala Leu Thr Leu Phe
580 585 590
Asn Leu Ala Asp Thr Leu Leu Gly Gly Leu Pro Thr Glu Leu Ile Ser
595 600 605
Ser Ala Gly Gly Gln Leu Phe Tyr Ser Arg Pro Val Val Ser Ala Asn
610 615 620
Gly Glu Pro Thr Val Lys Leu Tyr Thr Ser Val Glu Asn Ala Gln Gln
625 630 635 640
Asp Lys Gly Ile Ala Ile Pro His Asp Ile Asp Leu Gly Glu Ser Arg
645 650 655
Val Val Ile Gln Asp Tyr Asp Asn Gln His Glu Gln Asp Arg Pro Thr
660 665 670
Pro Ser Pro Ala Pro Ser Arg Pro Phe Ser Val Leu Arg Ala Asn Asp
675 680 685
Val Leu Trp Leu Ser Leu Thr Ala Ala Glu Tyr Asp Gln Thr Thr Tyr
690 695 700
Gly Ser Ser Thr Asn Pro Met Tyr Val Ser Asp Thr Val Thr Phe Val
705 710 715 720
Asn Val Ala Thr Gly Ala Gln Gly Val Ser Arg Ser Leu Asp Trp Ser
725 730 735
Lys Val Thr Leu Asp Gly Arg Pro Leu Met Thr Ile Gln Gln Tyr Ser
740 745 750
Lys Thr Phe Phe Val Leu Pro Leu Arg Gly Lys Leu Ser Phe Trp Glu
755 760 765
Ala Gly Thr Thr Lys Ala Gly Tyr Pro Tyr Asn Tyr Asn Thr Thr Ala
770 775 780
Ser Asp Gln Ile Leu Ile Glu Asn Ala Ala Gly His Arg Val Cys Ile
785 790 795 800
Ser Thr Tyr Thr Thr Asn Leu Gly Ser Gly Pro Val Ser Ile Ser Ala
805 810 815
Val Gly Val Leu Ala Pro His Ser Ala Leu Ala Ala Leu Glu Asp Thr
820 825 830
Val Asp Tyr Pro Ala Arg Ala His Thr Phe Asp Asp Phe Cys Pro Glu
835 840 845
Cys Arg Thr Leu Gly Leu Gln Gly Cys Ala Phe Gln Ser Thr Val Ala
850 855 860
Glu Leu Gln Arg Leu Lys Met Lys Val Gly Lys Thr Arg Glu Tyr Pro
865 870 875 880
Gly Glu Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser His His His
885 890 895
His His His
<210> 152
<211> 51
<212> DNA
<213> artificial
<220>
<223> DNA encoding biPlike sequence
<400> 152
atgaaactat gtattctact tgcagttgtt gcgttcgtag gattgtcctt a 51
<210> 153
<211> 17
<212> PRT
<213> artificial
<220>
<223> Amino acid of BIPlike sequence
<400> 153
Met Lys Leu Cys Ile Leu Leu Ala Val Val Ala Phe Val Gly Leu Ser
1 5 10 15
Leu
<210> 154
<211> 2047
<212> DNA
<213> Artificial Sequence
<220>
<223> nucleotide sequence of a SNAP construct containing the SARS virus
N gene
<400> 154
tcgcgagcta gcaccatgaa actatgtatt ctacttgcag ttgttgcgtt cgtaggattg 60
tccttaccta cagctctggc aagatctgac aaagactgcg aaatgaaaag aactacattg 120
gattcaccac ttgggaagtt ggaactgagt ggatgcgagc aaggattgca tgaaattaag 180
ctactgggaa aaggaacttc tgctgctgat gcagttgaag ttccagcacc agcagctgtt 240
cttggaggtc ctgagcccct catgcaagcc acagcctggc ttaacgcata tttccaccag 300
cctgaggcca ttgaggaatt tccagtcccc gcccttcacc atcctgtgtt tcagcaggag 360
agcttcaccc gccaggtcct gtggaaattg ctgaaggtgg tcaagtttgg tgaagtgatt 420
tcatatcagc aacttgctgc attggccggt aaccccgcag ctacagctgc cgtgaaaact 480
gctctcagcg gaaatcctgt gcccatcctg atcccttgtc acagagtcgt ttcatcttcc 540
ggagctgtag gtggctatga aggaggactg gcagttaagg agtggctgct ggctcatgaa 600
ggtcatagac ttggaaagcc tgggctgggt cctgctggta taggcgcgcc agggtcccta 660
ggtggcggat ccgaaaacct gtacttccag agcgatatct ctgataatgg accccaatca 720
aaccaacgta gtgcccctcg cattacattt ggtggaccta cagattcaac tgacaataac 780
cagaatggag gtcgcaatgg tgcaaggcca aagcagcgcc gacctcaagg tttacctaat 840
aatactgcgt cttggttcac agctctcact cagcatggca aggaggaact tagattccct 900
cgaggccagg gcgttccaat caacaccaat agtggtccag atgaccaaat tggctactac 960
cgaagagcta cccgacgagt tcgtggtggt gacggcaaaa tgaaggagct cagccctaga 1020
tggtacttct attacctagg aactggccca gaagcctcac ttccttacgg cgctaacaag 1080
gaaggcatcg tatgggttgc aactgaggga gccttgaata cacctaagga ccacattggc 1140
acccgcaatc ctaataacaa tgctgccacc gtgctacaac ttcctcaagg aacaacattg 1200
cctaagggct tctacgcaga gggaagcaga ggcggcagtc aagcctcttc tcgctcctca 1260
tcacgtagtc gcggtaattc aagaaattca actcctggca gcagtagggg aaattctcct 1320
gctcgaatgg ccagcggagg tggtgaaact gccctcgcgc tattgctgct agacagattg 1380
aaccagcttg agagcaaagt ttctggtaag ggccagcaac agcagggcca aactgtcact 1440
aagaagtctg ctgctgaggc atctaagaag cctcgccaaa agcgtactgc cacaaagcag 1500
tacaacgtca ctcaagcatt cggcagacgt ggtccagaac agacccaggg aaatttcggt 1560
gaccaagacc taatcagaca gggaactgat tacaagcatt ggccgcagat tgcacagttc 1620
gctccaagtg cctctgcatt cttcggaatg tcacgcattg gcatggaagt cacaccttcg 1680
ggaacatggc tgacttatca tggagccatt aagttggatg acaaggaccc acagttcaag 1740
gacaacgtca tactgctgaa caagcacatt gacgcataca aaacattccc accaacagag 1800
cctaagaagg acaagaagaa gaagactgat gaagctcagc ctttgccgca gagacaaaag 1860
aagcagccca ctgtgactct tcttcctgcg gctgacatgg atgatttctc cagacaactt 1920
cagaattcca tgagtggagc ttctgctgat tcaactcagg ccccgggaga gaatctatat 1980
tttcaagggc ccggcggagg tagtcaccat catcaccatc actaatgacc ggtgcggccg 2040
caagctt 2047
<210> 155
<211> 674
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of a SNAP construct containing the SARS virus
N gene
<400> 155
Ser Arg Ala Ser Thr Met Lys Leu Cys Ile Leu Leu Ala Val Val Ala
1 5 10 15
Phe Val Gly Leu Ser Leu Pro Thr Ala Leu Ala Arg Ser Asp Lys Asp
20 25 30
Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly Lys Leu Glu
35 40 45
Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu Leu Gly Lys
50 55 60
Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro Ala Ala Val
65 70 75 80
Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp Leu Asn Ala
85 90 95
Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val Pro Ala Leu
100 105 110
His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln Val Leu Trp
115 120 125
Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser Tyr Gln Gln
130 135 140
Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala Val Lys Thr
145 150 155 160
Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys His Arg Val
165 170 175
Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly Leu Ala Val
180 185 190
Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly Lys Pro Gly
195 200 205
Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Gly Gly Gly Ser
210 215 220
Glu Asn Leu Tyr Phe Gln Ser Asp Ile Ser Asp Asn Gly Pro Gln Ser
225 230 235 240
Asn Gln Arg Ser Ala Pro Arg Ile Thr Phe Gly Gly Pro Thr Asp Ser
245 250 255
Thr Asp Asn Asn Gln Asn Gly Gly Arg Asn Gly Ala Arg Pro Lys Gln
260 265 270
Arg Arg Pro Gln Gly Leu Pro Asn Asn Thr Ala Ser Trp Phe Thr Ala
275 280 285
Leu Thr Gln His Gly Lys Glu Glu Leu Arg Phe Pro Arg Gly Gln Gly
290 295 300
Val Pro Ile Asn Thr Asn Ser Gly Pro Asp Asp Gln Ile Gly Tyr Tyr
305 310 315 320
Arg Arg Ala Thr Arg Arg Val Arg Gly Gly Asp Gly Lys Met Lys Glu
325 330 335
Leu Ser Pro Arg Trp Tyr Phe Tyr Tyr Leu Gly Thr Gly Pro Glu Ala
340 345 350
Ser Leu Pro Tyr Gly Ala Asn Lys Glu Gly Ile Val Trp Val Ala Thr
355 360 365
Glu Gly Ala Leu Asn Thr Pro Lys Asp His Ile Gly Thr Arg Asn Pro
370 375 380
Asn Asn Asn Ala Ala Thr Val Leu Gln Leu Pro Gln Gly Thr Thr Leu
385 390 395 400
Pro Lys Gly Phe Tyr Ala Glu Gly Ser Arg Gly Gly Ser Gln Ala Ser
405 410 415
Ser Arg Ser Ser Ser Arg Ser Arg Gly Asn Ser Arg Asn Ser Thr Pro
420 425 430
Gly Ser Ser Arg Gly Asn Ser Pro Ala Arg Met Ala Ser Gly Gly Gly
435 440 445
Glu Thr Ala Leu Ala Leu Leu Leu Leu Asp Arg Leu Asn Gln Leu Glu
450 455 460
Ser Lys Val Ser Gly Lys Gly Gln Gln Gln Gln Gly Gln Thr Val Thr
465 470 475 480
Lys Lys Ser Ala Ala Glu Ala Ser Lys Lys Pro Arg Gln Lys Arg Thr
485 490 495
Ala Thr Lys Gln Tyr Asn Val Thr Gln Ala Phe Gly Arg Arg Gly Pro
500 505 510
Glu Gln Thr Gln Gly Asn Phe Gly Asp Gln Asp Leu Ile Arg Gln Gly
515 520 525
Thr Asp Tyr Lys His Trp Pro Gln Ile Ala Gln Phe Ala Pro Ser Ala
530 535 540
Ser Ala Phe Phe Gly Met Ser Arg Ile Gly Met Glu Val Thr Pro Ser
545 550 555 560
Gly Thr Trp Leu Thr Tyr His Gly Ala Ile Lys Leu Asp Asp Lys Asp
565 570 575
Pro Gln Phe Lys Asp Asn Val Ile Leu Leu Asn Lys His Ile Asp Ala
580 585 590
Tyr Lys Thr Phe Pro Pro Thr Glu Pro Lys Lys Asp Lys Lys Lys Lys
595 600 605
Thr Asp Glu Ala Gln Pro Leu Pro Gln Arg Gln Lys Lys Gln Pro Thr
610 615 620
Val Thr Leu Leu Pro Ala Ala Asp Met Asp Asp Phe Ser Arg Gln Leu
625 630 635 640
Gln Asn Ser Met Ser Gly Ala Ser Ala Asp Ser Thr Gln Ala Pro Gly
645 650 655
Glu Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser His His His His
660 665 670
His His
<210> 156
<211> 1357
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence of a SNAP construct containing the SARS virus
S gene receptor binding domain
<400> 156
tcgcgagcta gcaccatgaa actatgtatt ctacttgcag ttgttgcgtt cgtaggattg 60
tccttaccta cagctctggc aagatctgac aaagactgcg aaatgaaaag aactacattg 120
gattcaccac ttgggaagtt ggaactgagt ggatgcgagc aaggattgca tgaaattaag 180
ctactgggaa aaggaacttc tgctgctgat gcagttgaag ttccagcacc agcagctgtt 240
cttggaggtc ctgagcccct catgcaagcc acagcctggc ttaacgcata tttccaccag 300
cctgaggcca ttgaggaatt tccagtcccc gcccttcacc atcctgtgtt tcagcaggag 360
agcttcaccc gccaggtcct gtggaaattg ctgaaggtgg tcaagtttgg tgaagtgatt 420
tcatatcagc aacttgctgc attggccggt aaccccgcag ctacagctgc cgtgaaaact 480
gctctcagcg gaaatcctgt gcccatcctg atcccttgtc acagagtcgt ttcatcttcc 540
ggagctgtag gtggctatga aggaggactg gcagttaagg agtggctgct ggctcatgaa 600
ggtcatagac ttggaaagcc tgggctgggt cctgctggta taggcgcgcc agggtcccta 660
ggtggcggat ccgaaaacct gtacttccag agcgatatca ccaacctctg tcctttcggt 720
gaagtgttta acgccactaa gttccccagc gtttacgctt gggagcgtaa gaaaatctca 780
aattgcgtgg ccgactactc tgtgctctac aacagcactt tcttttccac cttcaagtgt 840
tacggagttt ccgctacaaa gctgaacgac ctgtgcttca gcaacgtgta cgctgatagc 900
tttgtggtca agggagacga tgttcgccag attgcccctg gacagaccgg cgttatcgct 960
gactacaact ataaactgcc agacgatttc atgggctgtg tcctggcctg gaacactcgt 1020
aatatcgacg ctaccagtac aggaaactac aattacaagt accgttacct gcgccacggt 1080
aagttgaggc cattcgaacg cgacatctca aacgtccctt tctcccctga cggtaagcca 1140
tgtacacccc ctgccctgaa ctgctactgg ccactcaacg actacggttt ctataccaca 1200
actggcatcg gctaccaacc ctacagagtc gttgtgctct ctttcgagtt gctcaacgct 1260
cctgccacag tcccgggaga gaatctatat tttcaagggc ccggcggagg tagtcaccat 1320
catcaccatc actaatgacc ggtgcggccg caagctt 1357
<210> 157
<211> 444
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of a SNAP construct containing the SARS virus
S gene receptor binding domain.
<400> 157
Ser Arg Ala Ser Thr Met Lys Leu Cys Ile Leu Leu Ala Val Val Ala
1 5 10 15
Phe Val Gly Leu Ser Leu Pro Thr Ala Leu Ala Arg Ser Asp Lys Asp
20 25 30
Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly Lys Leu Glu
35 40 45
Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu Leu Gly Lys
50 55 60
Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro Ala Ala Val
65 70 75 80
Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp Leu Asn Ala
85 90 95
Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val Pro Ala Leu
100 105 110
His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln Val Leu Trp
115 120 125
Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser Tyr Gln Gln
130 135 140
Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala Val Lys Thr
145 150 155 160
Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys His Arg Val
165 170 175
Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly Leu Ala Val
180 185 190
Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly Lys Pro Gly
195 200 205
Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Gly Gly Gly Ser
210 215 220
Glu Asn Leu Tyr Phe Gln Ser Asp Ile Thr Asn Leu Cys Pro Phe Gly
225 230 235 240
Glu Val Phe Asn Ala Thr Lys Phe Pro Ser Val Tyr Ala Trp Glu Arg
245 250 255
Lys Lys Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser
260 265 270
Thr Phe Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Ala Thr Lys Leu
275 280 285
Asn Asp Leu Cys Phe Ser Asn Val Tyr Ala Asp Ser Phe Val Val Lys
290 295 300
Gly Asp Asp Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Val Ile Ala
305 310 315 320
Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Met Gly Cys Val Leu Ala
325 330 335
Trp Asn Thr Arg Asn Ile Asp Ala Thr Ser Thr Gly Asn Tyr Asn Tyr
340 345 350
Lys Tyr Arg Tyr Leu Arg His Gly Lys Leu Arg Pro Phe Glu Arg Asp
355 360 365
Ile Ser Asn Val Pro Phe Ser Pro Asp Gly Lys Pro Cys Thr Pro Pro
370 375 380
Ala Leu Asn Cys Tyr Trp Pro Leu Asn Asp Tyr Gly Phe Tyr Thr Thr
385 390 395 400
Thr Gly Ile Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu
405 410 415
Leu Leu Asn Ala Pro Ala Thr Val Pro Gly Glu Asn Leu Tyr Phe Gln
420 425 430
Gly Pro Gly Gly Gly Ser His His His His His His
435 440
<210> 158
<211> 2023
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence of a SNAP construct containing the human
coronavirus N gene
<400> 158
tcgcgagcta gcaccatgaa actatgtatt ctacttgcag ttgttgcgtt cgtaggattg 60
tccttaccta cagctctggc aagatctgac aaagactgcg aaatgaaaag aactacattg 120
gattcaccac ttgggaagtt ggaactgagt ggatgcgagc aaggattgca tgaaattaag 180
ctactgggaa aaggaacttc tgctgctgat gcagttgaag ttccagcacc agcagctgtt 240
cttggaggtc ctgagcccct catgcaagcc acagcctggc ttaacgcata tttccaccag 300
cctgaggcca ttgaggaatt tccagtcccc gcccttcacc atcctgtgtt tcagcaggag 360
agcttcaccc gccaggtcct gtggaaattg ctgaaggtgg tcaagtttgg tgaagtgatt 420
tcatatcagc aacttgctgc attggccggt aaccccgcag ctacagctgc cgtgaaaact 480
gctctcagcg gaaatcctgt gcccatcctg atcccttgtc acagagtcgt ttcatcttcc 540
ggagctgtag gtggctatga aggaggactg gcagttaagg agtggctgct ggctcatgaa 600
ggtcatagac ttggaaagcc tgggctgggt cctgctggta taggcgcgcc agggtcccta 660
ggtggcggat ccgaaaacct gtacttccag agcgatatcg catcccctgc tgcacctcgt 720
gctgtttcct ttgccgataa caatgatata acaaatacaa acctatctcg aggtagagga 780
cgtaatccaa aaccacgagc tgcaccaaat aacactgtct cttggtacac tgggcttacc 840
caacacggga aagtccctct tacctttcca cctgggcagg gtgtacctct taatgccaat 900
tctacccctg cgcaaaatgc tgggtattgg cggagacagg acagaaaaat taataccggg 960
aatggaatta agcaactggc tcccaggtgg tacttctact acactggaac tggacccgaa 1020
gcagcactcc cattccgggc tgttaaggat ggcatcgttt gggtccatga agatggcgcc 1080
actgatgctc cttcaacttt tgggacgcgg aaccctaaca atgattcagc tattgttaca 1140
caattcgcgc ccggtactaa acttcctaaa aacttccaca ttgaggggac tggaggcaat 1200
agtcaatcat cttcaagagc ctctagctta agcagaaact cttccaggtc tagttcacaa 1260
ggttcaagat caggaaactc tacccgcggc acttctccag gtccatctgg aatcggagca 1320
gtaggaggtg atctacttta ccttgatctt ctgaacagac tacaagccct tgagtctggc 1380
aaagtaaagc aatcgcagcc aaaagtaatc actaagaaag atgctgctgc tgctaaaaat 1440
aagatgcgcc acaagcgcac ttccaccaaa agtttcaaca tggtgcaggc ttttggtctt 1500
cgcggaccag gagacctcca gggaaacttt ggtgatcttc aattgaataa actcggcact 1560
gaggacccac gttggcccca aattgctgag cttgctccta cagccagtgc ttttatgggt 1620
atgtcgcaat ttaaacttac ccatcagaac aatgatgatc atggcaaccc tgtgtacttc 1680
cttcggtaca gtggagccat taaacttgac ccaaagaatc ccaactacaa taagtggttg 1740
gagcttcttg agcaaaatat tgatgcctac aaaaccttcc ctaagaagga aaagaaacaa 1800
aaggcaccaa aagaagaatc aacagaccaa atgtctgaac ctccaaagga gcagcgtgtg 1860
caaggtagca tcactcagcg cactcgcacc cgtccaagtg ttcagcctgg tccaatgatt 1920
gatgttaaca ctgatggccc gggagagaat ctatattttc aagggcccgg cggaggtagt 1980
caccatcatc accatcacta atgaccggtg cggccgcaag ctt 2023
<210> 159
<211> 666
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of a SNAP construct containing the human
coronavirus N gene.
<400> 159
Ser Arg Ala Ser Thr Met Lys Leu Cys Ile Leu Leu Ala Val Val Ala
1 5 10 15
Phe Val Gly Leu Ser Leu Pro Thr Ala Leu Ala Arg Ser Asp Lys Asp
20 25 30
Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly Lys Leu Glu
35 40 45
Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu Leu Gly Lys
50 55 60
Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro Ala Ala Val
65 70 75 80
Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp Leu Asn Ala
85 90 95
Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val Pro Ala Leu
100 105 110
His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln Val Leu Trp
115 120 125
Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser Tyr Gln Gln
130 135 140
Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala Val Lys Thr
145 150 155 160
Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys His Arg Val
165 170 175
Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly Leu Ala Val
180 185 190
Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly Lys Pro Gly
195 200 205
Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Gly Gly Gly Ser
210 215 220
Glu Asn Leu Tyr Phe Gln Ser Asp Ile Ala Ser Pro Ala Ala Pro Arg
225 230 235 240
Ala Val Ser Phe Ala Asp Asn Asn Asp Ile Thr Asn Thr Asn Leu Ser
245 250 255
Arg Gly Arg Gly Arg Asn Pro Lys Pro Arg Ala Ala Pro Asn Asn Thr
260 265 270
Val Ser Trp Tyr Thr Gly Leu Thr Gln His Gly Lys Val Pro Leu Thr
275 280 285
Phe Pro Pro Gly Gln Gly Val Pro Leu Asn Ala Asn Ser Thr Pro Ala
290 295 300
Gln Asn Ala Gly Tyr Trp Arg Arg Gln Asp Arg Lys Ile Asn Thr Gly
305 310 315 320
Asn Gly Ile Lys Gln Leu Ala Pro Arg Trp Tyr Phe Tyr Tyr Thr Gly
325 330 335
Thr Gly Pro Glu Ala Ala Leu Pro Phe Arg Ala Val Lys Asp Gly Ile
340 345 350
Val Trp Val His Glu Asp Gly Ala Thr Asp Ala Pro Ser Thr Phe Gly
355 360 365
Thr Arg Asn Pro Asn Asn Asp Ser Ala Ile Val Thr Gln Phe Ala Pro
370 375 380
Gly Thr Lys Leu Pro Lys Asn Phe His Ile Glu Gly Thr Gly Gly Asn
385 390 395 400
Ser Gln Ser Ser Ser Arg Ala Ser Ser Leu Ser Arg Asn Ser Ser Arg
405 410 415
Ser Ser Ser Gln Gly Ser Arg Ser Gly Asn Ser Thr Arg Gly Thr Ser
420 425 430
Pro Gly Pro Ser Gly Ile Gly Ala Val Gly Gly Asp Leu Leu Tyr Leu
435 440 445
Asp Leu Leu Asn Arg Leu Gln Ala Leu Glu Ser Gly Lys Val Lys Gln
450 455 460
Ser Gln Pro Lys Val Ile Thr Lys Lys Asp Ala Ala Ala Ala Lys Asn
465 470 475 480
Lys Met Arg His Lys Arg Thr Ser Thr Lys Ser Phe Asn Met Val Gln
485 490 495
Ala Phe Gly Leu Arg Gly Pro Gly Asp Leu Gln Gly Asn Phe Gly Asp
500 505 510
Leu Gln Leu Asn Lys Leu Gly Thr Glu Asp Pro Arg Trp Pro Gln Ile
515 520 525
Ala Glu Leu Ala Pro Thr Ala Ser Ala Phe Met Gly Met Ser Gln Phe
530 535 540
Lys Leu Thr His Gln Asn Asn Asp Asp His Gly Asn Pro Val Tyr Phe
545 550 555 560
Leu Arg Tyr Ser Gly Ala Ile Lys Leu Asp Pro Lys Asn Pro Asn Tyr
565 570 575
Asn Lys Trp Leu Glu Leu Leu Glu Gln Asn Ile Asp Ala Tyr Lys Thr
580 585 590
Phe Pro Lys Lys Glu Lys Lys Gln Lys Ala Pro Lys Glu Glu Ser Thr
595 600 605
Asp Gln Met Ser Glu Pro Pro Lys Glu Gln Arg Val Gln Gly Ser Ile
610 615 620
Thr Gln Arg Thr Arg Thr Arg Pro Ser Val Gln Pro Gly Pro Met Ile
625 630 635 640
Asp Val Asn Thr Asp Gly Pro Gly Glu Asn Leu Tyr Phe Gln Gly Pro
645 650 655
Gly Gly Gly Ser His His His His His His
660 665
<210> 160
<211> 3055
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence of a SNAP construct containing the human
coronavirus S1 gene.
<400> 160
atgaagttat gcatattact ggccgtcgtg gcctttgttg gcctctcgct cgggagatct 60
gtagggccag attctgttaa gtctgcttgt attgaggttg atatacaaca gactttcttt 120
gataaaactt ggcctaggcc aattgatgtt tctaaggctg acggtattat ataccctcaa 180
ggccgtacat attctaacat aactatcact tatcaaggtc tttttcccta tcagggagac 240
catggtgata tgtatgttta ctctgcagga catgctacag gcacaactcc acaaaagttg 300
tttgtagcta actattctca ggacgtcaaa cagtttgcta atgggtttgt cgtccgtata 360
ggagcagctg ccaattccac tggcactgtt attattagcc catctaccag cgctactata 420
cgaaaaattt accctgcttt tatgctgggt tcttcagttg gtaatttctc agatggtaaa 480
atgggccgct tcttcaatca tactctagtt cttttgcccg atggatgtgg cactttactt 540
agagcttttt attgtattct agagcctcgc tctggaaatc attgtcctgc tggcaattcc 600
tatacttctt ttgccactta tcacactcct gcaacagatt gttctgatgg caattacaat 660
cgtaatgcca gtctgaactc ttttaaggag tattttaatt tacgtaactg cacctttatg 720
tacacttata acattaccga agatgagatt ttagagtggt ttggcattac acaaactgct 780
caaggtgttc acctcttctc atctcggtat gttgatttgt acggcggcaa tatgtttcaa 840
tttgccacct tgcctgttta tgatactatt aagtattatt ctatcattcc tcacagtatt 900
cgttctatcc aaagtgatag aaaggcttgg gctgccttct acgtatataa acttcaaccg 960
ttaactttcc tgttggattt ttctgttgat ggttatatac gcagagctat agactgtggt 1020
tttaatgatt tgtcacaact ccactgctca tatgaatcct tcgatgttga atctggagtt 1080
tattcagttt cgtctttcga agcaaaacct tctggctcag ttgtggaaca ggctgaaggt 1140
gttgaatgtg atttttcacc tcttctgtct ggcacacctc ctcaggttta taatttcaag 1200
cgtttggttt ttaccaattg caattataat cttaccaaat tgctttcact tttttctgtg 1260
aatgatttta cttgtagtca aatatctcca gcagcaattg caagcaactg ttattcttca 1320
ctgattttgg attacttttc atacccactt agtatgaaat ccgatctcag tgttagttct 1380
gctggtccaa tatcccagtt taattataaa cagtcctttt ctaatcccac atgtttgatt 1440
ttagcgactg ttcctcataa ccttactact attactaagc ctcttaagta cagctatatt 1500
aacaagtgct ctcgtcttct ttctgatgat cgtactgaag tacctcagtt agtgaacgct 1560
aatcaatact caccctgtgt atccattgtc ccatccactg tgtgggaaga cggtgattat 1620
tataggaaac aactatctcc acttgaaggt ggtggctggc ttgttgctag tggctcaact 1680
gttgccatga ctgagcaatt acagatgggc tttggtatta cagttcaata tggtacagac 1740
accaatagtg tttgccccaa gctggaattt gctaatgaca caaaaattgc ctctcaatta 1800
ggcaattgcg tggaatattc cctctatggt gtttcgggcc gtggtgtttt tcagaattgc 1860
acagctgtag gtgttcgaca gcagcgcttt gtttatgatg cgtaccagaa tttagttggc 1920
tattattctg atgatggcaa ctactactgt ttgcgtgctt gtgttagtgt tcctgtttct 1980
gtcatctatg ataaagaaac taaaacccac gctactctat ttggtagtgt tgcatgtgaa 2040
cacatttctt ctaccatgtc tcaatactcc cgttctacgc gatcaatgct taaacggcga 2100
gattctacat atggccccct tcagacacct gttggttgtg tcctaggact tgttaattcc 2160
tctttgttcg tagaggactg caagttgcct cttggtcaat ctctctgtgc tcttcctgac 2220
acacctagta ctctcacacc tcgcagtgtg cgctctgttc caggtgaaat gcgcttggca 2280
tccattgctt ttaatcatcc tattcaggtt gatcaactta atagtagtta ttttaaatta 2340
agtataccca ctaatttttc ctttggtgtg actcaggagt acattcagac aaccattcag 2400
aaagttactg ttgattgtaa acagtacgcg cggccgcacg gcggaggtag caaagactgc 2460
gaaatgaagc gcaccaccct ggatagccct ctgggcaagc tggaactgtc tgggtgcgaa 2520
cagggcctgc acgagatcaa gctgctgggc aaaggaacat ctgccgccga cgccgtggaa 2580
gtgcctgccc cagccgccgt gctgggcgga ccagagccac tgatgcaggc caccgcctgg 2640
ctcaacgcct actttcacca gcctgaggcc atcgaggagt tccctgtgcc agccctgcac 2700
cacccagtgt tccagcagga gagctttacc cgccaggtgc tgtggaaact gctgaaagtg 2760
gtgaagttcg gagaggtcat cagctaccag cagctggccg ccctggccgg caatcccgcc 2820
gccaccgccg ccgtgaaaac cgccctgagc ggaaatcccg tgcccattct gatcccctgc 2880
caccgggtgg tgtctagctc tggcgccgtg gggggctacg agggcgggct cgccgtgaaa 2940
gagtggctgc tggcccacga gggccacaga ctgggcaagc ctgggctggg tcctgcaggt 3000
ataggcgcgc cagggtccct ggagcatcat catcatcatc attgatgacg ggccc 3055
<210> 161
<211> 1014
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of a SNAP construct containing the human
coronavirus S1 gene.
<400> 161
Met Lys Leu Cys Ile Leu Leu Ala Val Val Ala Phe Val Gly Leu Ser
1 5 10 15
Leu Gly Arg Ser Val Gly Pro Asp Ser Val Lys Ser Ala Cys Ile Glu
20 25 30
Val Asp Ile Gln Gln Thr Phe Phe Asp Lys Thr Trp Pro Arg Pro Ile
35 40 45
Asp Val Ser Lys Ala Asp Gly Ile Ile Tyr Pro Gln Gly Arg Thr Tyr
50 55 60
Ser Asn Ile Thr Ile Thr Tyr Gln Gly Leu Phe Pro Tyr Gln Gly Asp
65 70 75 80
His Gly Asp Met Tyr Val Tyr Ser Ala Gly His Ala Thr Gly Thr Thr
85 90 95
Pro Gln Lys Leu Phe Val Ala Asn Tyr Ser Gln Asp Val Lys Gln Phe
100 105 110
Ala Asn Gly Phe Val Val Arg Ile Gly Ala Ala Ala Asn Ser Thr Gly
115 120 125
Thr Val Ile Ile Ser Pro Ser Thr Ser Ala Thr Ile Arg Lys Ile Tyr
130 135 140
Pro Ala Phe Met Leu Gly Ser Ser Val Gly Asn Phe Ser Asp Gly Lys
145 150 155 160
Met Gly Arg Phe Phe Asn His Thr Leu Val Leu Leu Pro Asp Gly Cys
165 170 175
Gly Thr Leu Leu Arg Ala Phe Tyr Cys Ile Leu Glu Pro Arg Ser Gly
180 185 190
Asn His Cys Pro Ala Gly Asn Ser Tyr Thr Ser Phe Ala Thr Tyr His
195 200 205
Thr Pro Ala Thr Asp Cys Ser Asp Gly Asn Tyr Asn Arg Asn Ala Ser
210 215 220
Leu Asn Ser Phe Lys Glu Tyr Phe Asn Leu Arg Asn Cys Thr Phe Met
225 230 235 240
Tyr Thr Tyr Asn Ile Thr Glu Asp Glu Ile Leu Glu Trp Phe Gly Ile
245 250 255
Thr Gln Thr Ala Gln Gly Val His Leu Phe Ser Ser Arg Tyr Val Asp
260 265 270
Leu Tyr Gly Gly Asn Met Phe Gln Phe Ala Thr Leu Pro Val Tyr Asp
275 280 285
Thr Ile Lys Tyr Tyr Ser Ile Ile Pro His Ser Ile Arg Ser Ile Gln
290 295 300
Ser Asp Arg Lys Ala Trp Ala Ala Phe Tyr Val Tyr Lys Leu Gln Pro
305 310 315 320
Leu Thr Phe Leu Leu Asp Phe Ser Val Asp Gly Tyr Ile Arg Arg Ala
325 330 335
Ile Asp Cys Gly Phe Asn Asp Leu Ser Gln Leu His Cys Ser Tyr Glu
340 345 350
Ser Phe Asp Val Glu Ser Gly Val Tyr Ser Val Ser Ser Phe Glu Ala
355 360 365
Lys Pro Ser Gly Ser Val Val Glu Gln Ala Glu Gly Val Glu Cys Asp
370 375 380
Phe Ser Pro Leu Leu Ser Gly Thr Pro Pro Gln Val Tyr Asn Phe Lys
385 390 395 400
Arg Leu Val Phe Thr Asn Cys Asn Tyr Asn Leu Thr Lys Leu Leu Ser
405 410 415
Leu Phe Ser Val Asn Asp Phe Thr Cys Ser Gln Ile Ser Pro Ala Ala
420 425 430
Ile Ala Ser Asn Cys Tyr Ser Ser Leu Ile Leu Asp Tyr Phe Ser Tyr
435 440 445
Pro Leu Ser Met Lys Ser Asp Leu Ser Val Ser Ser Ala Gly Pro Ile
450 455 460
Ser Gln Phe Asn Tyr Lys Gln Ser Phe Ser Asn Pro Thr Cys Leu Ile
465 470 475 480
Leu Ala Thr Val Pro His Asn Leu Thr Thr Ile Thr Lys Pro Leu Lys
485 490 495
Tyr Ser Tyr Ile Asn Lys Cys Ser Arg Leu Leu Ser Asp Asp Arg Thr
500 505 510
Glu Val Pro Gln Leu Val Asn Ala Asn Gln Tyr Ser Pro Cys Val Ser
515 520 525
Ile Val Pro Ser Thr Val Trp Glu Asp Gly Asp Tyr Tyr Arg Lys Gln
530 535 540
Leu Ser Pro Leu Glu Gly Gly Gly Trp Leu Val Ala Ser Gly Ser Thr
545 550 555 560
Val Ala Met Thr Glu Gln Leu Gln Met Gly Phe Gly Ile Thr Val Gln
565 570 575
Tyr Gly Thr Asp Thr Asn Ser Val Cys Pro Lys Leu Glu Phe Ala Asn
580 585 590
Asp Thr Lys Ile Ala Ser Gln Leu Gly Asn Cys Val Glu Tyr Ser Leu
595 600 605
Tyr Gly Val Ser Gly Arg Gly Val Phe Gln Asn Cys Thr Ala Val Gly
610 615 620
Val Arg Gln Gln Arg Phe Val Tyr Asp Ala Tyr Gln Asn Leu Val Gly
625 630 635 640
Tyr Tyr Ser Asp Asp Gly Asn Tyr Tyr Cys Leu Arg Ala Cys Val Ser
645 650 655
Val Pro Val Ser Val Ile Tyr Asp Lys Glu Thr Lys Thr His Ala Thr
660 665 670
Leu Phe Gly Ser Val Ala Cys Glu His Ile Ser Ser Thr Met Ser Gln
675 680 685
Tyr Ser Arg Ser Thr Arg Ser Met Leu Lys Arg Arg Asp Ser Thr Tyr
690 695 700
Gly Pro Leu Gln Thr Pro Val Gly Cys Val Leu Gly Leu Val Asn Ser
705 710 715 720
Ser Leu Phe Val Glu Asp Cys Lys Leu Pro Leu Gly Gln Ser Leu Cys
725 730 735
Ala Leu Pro Asp Thr Pro Ser Thr Leu Thr Pro Arg Ser Val Arg Ser
740 745 750
Val Pro Gly Glu Met Arg Leu Ala Ser Ile Ala Phe Asn His Pro Ile
755 760 765
Gln Val Asp Gln Leu Asn Ser Ser Tyr Phe Lys Leu Ser Ile Pro Thr
770 775 780
Asn Phe Ser Phe Gly Val Thr Gln Glu Tyr Ile Gln Thr Thr Ile Gln
785 790 795 800
Lys Val Thr Val Asp Cys Lys Gln Tyr Ala Arg Pro His Gly Gly Gly
805 810 815
Ser Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly
820 825 830
Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu
835 840 845
Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro
850 855 860
Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp
865 870 875 880
Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val
885 890 895
Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln
900 905 910
Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser
915 920 925
Tyr Gln Gln Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala
930 935 940
Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys
945 950 955 960
His Arg Val Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly
965 970 975
Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly
980 985 990
Lys Pro Gly Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Glu
995 1000 1005
His His His His His His
1010
<210> 162
<211> 1369
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence of a SNAP construct containing the human
coronavirus S1 gene receptor binding domain (RBD)
<400> 162
tcgcgagcta gcaccatgaa actatgtatt ctacttgcag ttgttgcgtt cgtaggattg 60
tccttaccta cagctctggc aagatctgac aaagactgcg aaatgaaaag aactacattg 120
gattcaccac ttgggaagtt ggaactgagt ggatgcgagc aaggattgca tgaaattaag 180
ctactgggaa aaggaacttc tgctgctgat gcagttgaag ttccagcacc agcagctgtt 240
cttggaggtc ctgagcccct catgcaagcc acagcctggc ttaacgcata tttccaccag 300
cctgaggcca ttgaggaatt tccagtcccc gcccttcacc atcctgtgtt tcagcaggag 360
agcttcaccc gccaggtcct gtggaaattg ctgaaggtgg tcaagtttgg tgaagtgatt 420
tcatatcagc aacttgctgc attggccggt aaccccgcag ctacagctgc cgtgaaaact 480
gctctcagcg gaaatcctgt gcccatcctg atcccttgtc acagagtcgt ttcatcttcc 540
ggagctgtag gtggctatga aggaggactg gcagttaagg agtggctgct ggctcatgaa 600
ggtcatagac ttggaaagcc tgggctgggt cctgctggta taggcgcgcc agggtcccta 660
ggtggcggat ccgaaaacct gtacttccag agcgatatct tgttgcgtgc tttctactgc 720
atcctcgaac ctcgttctgg taaccactgt cctgccggaa atagctacac tagcttcgcc 780
acttaccaca cacccgccac tgactgtagt gacggcaact acaatcgtaa cgcctccttg 840
aactctttta aggagtactt caacctgcgc aactgtacct tcatgtacac ttacaacatt 900
accgaagacg aaatcctcga gtggttcggc atcacacaga cagctcaggg agtccacctc 960
ttctcaagca ggtacgtgga cctctatggt ggtaacatgt ttcaattcgc cacactgcca 1020
gtctacgata ccatcaagta ttactccatc atcccacact caatccgctc tatccaaagc 1080
gaccgcaagg cctgggctgc tttttacgtg tacaagctgc agcctctgac cttcctgctg 1140
gatttctccg tggacggcta cattagacgt gctatcgatt gcggtttcaa cgacctgtca 1200
caactccatt gctcatacga atctttcgac gttgagagcg gagtgtactc cgtttccagc 1260
ttcgaggcta aacccagtgg ctccccggga gagaatctat attttcaagg gcccggcgga 1320
ggtagtcacc atcatcacca tcactaatga ccggtgcggc cgcaagctt 1369
<210> 163
<211> 448
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of a SNAP construct containing the human
coronavirus S1 gene receptor binding domain (RBD)
<400> 163
Ser Arg Ala Ser Thr Met Lys Leu Cys Ile Leu Leu Ala Val Val Ala
1 5 10 15
Phe Val Gly Leu Ser Leu Pro Thr Ala Leu Ala Arg Ser Asp Lys Asp
20 25 30
Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly Lys Leu Glu
35 40 45
Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu Leu Gly Lys
50 55 60
Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro Ala Ala Val
65 70 75 80
Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp Leu Asn Ala
85 90 95
Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val Pro Ala Leu
100 105 110
His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln Val Leu Trp
115 120 125
Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser Tyr Gln Gln
130 135 140
Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala Val Lys Thr
145 150 155 160
Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys His Arg Val
165 170 175
Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly Leu Ala Val
180 185 190
Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly Lys Pro Gly
195 200 205
Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Gly Gly Gly Ser
210 215 220
Glu Asn Leu Tyr Phe Gln Ser Asp Ile Leu Leu Arg Ala Phe Tyr Cys
225 230 235 240
Ile Leu Glu Pro Arg Ser Gly Asn His Cys Pro Ala Gly Asn Ser Tyr
245 250 255
Thr Ser Phe Ala Thr Tyr His Thr Pro Ala Thr Asp Cys Ser Asp Gly
260 265 270
Asn Tyr Asn Arg Asn Ala Ser Leu Asn Ser Phe Lys Glu Tyr Phe Asn
275 280 285
Leu Arg Asn Cys Thr Phe Met Tyr Thr Tyr Asn Ile Thr Glu Asp Glu
290 295 300
Ile Leu Glu Trp Phe Gly Ile Thr Gln Thr Ala Gln Gly Val His Leu
305 310 315 320
Phe Ser Ser Arg Tyr Val Asp Leu Tyr Gly Gly Asn Met Phe Gln Phe
325 330 335
Ala Thr Leu Pro Val Tyr Asp Thr Ile Lys Tyr Tyr Ser Ile Ile Pro
340 345 350
His Ser Ile Arg Ser Ile Gln Ser Asp Arg Lys Ala Trp Ala Ala Phe
355 360 365
Tyr Val Tyr Lys Leu Gln Pro Leu Thr Phe Leu Leu Asp Phe Ser Val
370 375 380
Asp Gly Tyr Ile Arg Arg Ala Ile Asp Cys Gly Phe Asn Asp Leu Ser
385 390 395 400
Gln Leu His Cys Ser Tyr Glu Ser Phe Asp Val Glu Ser Gly Val Tyr
405 410 415
Ser Val Ser Ser Phe Glu Ala Lys Pro Ser Gly Ser Pro Gly Glu Asn
420 425 430
Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser His His His His His His
435 440 445
<210> 164
<211> 2095
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence of a SNAP construct containing the LruA gene
of Leptospirosis
<400> 164
tcgcgagcta gcaccatgaa actatgtatt ctacttgcag ttgttgcgtt cgtaggattg 60
tccttaccta cagctctggc aagatctgac aaagactgcg aaatgaaaag aactacattg 120
gattcaccac ttgggaagtt ggaactgagt ggatgcgagc aaggattgca tgaaattaag 180
ctactgggaa aaggaacttc tgctgctgat gcagttgaag ttccagcacc agcagctgtt 240
cttggaggtc ctgagcccct catgcaagcc acagcctggc ttaacgcata tttccaccag 300
cctgaggcca ttgaggaatt tccagtcccc gcccttcacc atcctgtgtt tcagcaggag 360
agcttcaccc gccaggtcct gtggaaattg ctgaaggtgg tcaagtttgg tgaagtgatt 420
tcatatcagc aacttgctgc attggccggt aaccccgcag ctacagctgc cgtgaaaact 480
gctctcagcg gaaatcctgt gcccatcctg atcccttgtc acagagtcgt ttcatcttcc 540
ggagctgtag gtggctatga aggaggactg gcagttaagg agtggctgct ggctcatgaa 600
ggtcatagac ttggaaagcc tgggctgggt cctgctggta taggcgcgcc agggtcccta 660
ggtggcggat ccgaaaacct gtacttccag agcgatatcg gagctgagct tcctattgag 720
gagttaagtg atgcaaagaa ctcgatcaca agagctaagt ctgcaggtgc tgaaaagtat 780
gctccttcag agttagagga ggcccgtaag aacttactca cagctcatca gaaggcttcg 840
gaggagaatc ttacagagac taagaagtcc gcgttgtatg caagagcaaa ggctttagac 900
gcttccgaga agtccttccc ttcttctgtt gatgatgcac gtaaggagtc cagctcttca 960
atcgagtctg cagaggaggc ctatgcttct cagcttgctt ctgagcctta taatacttct 1020
gtacagcttc gcaaggaggg tgattctcta cgcgagactg ctgaccgcac tttagagtcg 1080
tatccgaagg agtccggaga tgacgcaaag ctgaggatga gattagcagc attcgatcag 1140
tatgaggctt ctcgtcagaa gtatgcggat tctaagaagg ccgcagacga gtccaaggta 1200
ttagctcttt ctcagaagca gcagctaatc gattcttttg cagacataga taagaatcta 1260
aatgatgcag ataagtatgc agagggaaag gacccggagg tttccgagac tagaaatcgt 1320
ctcgattcct ctaagtccaa gatagaggag gggaagatca aggagggata ttccgagata 1380
gatgatattc gtaagaagtc cggcgagctt gttgctaaga atattaagat ttacgcagag 1440
aagcagaagg aacttgcaaa gcaaagcgta gcatctgcga ctacaaggtt agcttccttc 1500
gatcgaaata agatcaattc ctctagagat tttcaggttt cttaccagag agcagaggag 1560
aaccttaagg cagctgagga gtcgagagta gctgcagagg atctatattc ttcggagaag 1620
tacgaggatt ctatttcgcg ttctgaggag gcaattcgcc tttccagaat cgtagtagac 1680
caggccactg agttggccga gagaatagag agaaaggcaa cgactgataa gatcgctggt 1740
cgtgatacaa agaccgaagg gaataagaat actaagaacc agtccacaac cgaaggcaag 1800
aactcttcat ctaagattgg agaggatggt ttaccggagg gttggaagcg ttatgtggtt 1860
cggaagaagg ttcctgcaga ttgtctttgg agaatcgcaa aggataagag acattatgga 1920
acttctaagc tctggagaag aatctacgag gcaaaccgaa acaagatcaa gaacccaaac 1980
ttgatttatc cgaagcaggt attattaatc ccgggagaga atctatattt tcaagggccc 2040
ggcggaggta gtcaccatca tcaccatcac taatgaccgg tgcggccgca agctt 2095
<210> 165
<211> 690
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of a SNAP construct containing the LruA gene
of Leptospirosis
<400> 165
Ser Arg Ala Ser Thr Met Lys Leu Cys Ile Leu Leu Ala Val Val Ala
1 5 10 15
Phe Val Gly Leu Ser Leu Pro Thr Ala Leu Ala Arg Ser Asp Lys Asp
20 25 30
Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly Lys Leu Glu
35 40 45
Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu Leu Gly Lys
50 55 60
Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro Ala Ala Val
65 70 75 80
Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp Leu Asn Ala
85 90 95
Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val Pro Ala Leu
100 105 110
His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln Val Leu Trp
115 120 125
Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser Tyr Gln Gln
130 135 140
Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala Val Lys Thr
145 150 155 160
Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys His Arg Val
165 170 175
Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly Leu Ala Val
180 185 190
Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly Lys Pro Gly
195 200 205
Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Gly Gly Gly Ser
210 215 220
Glu Asn Leu Tyr Phe Gln Ser Asp Ile Gly Ala Glu Leu Pro Ile Glu
225 230 235 240
Glu Leu Ser Asp Ala Lys Asn Ser Ile Thr Arg Ala Lys Ser Ala Gly
245 250 255
Ala Glu Lys Tyr Ala Pro Ser Glu Leu Glu Glu Ala Arg Lys Asn Leu
260 265 270
Leu Thr Ala His Gln Lys Ala Ser Glu Glu Asn Leu Thr Glu Thr Lys
275 280 285
Lys Ser Ala Leu Tyr Ala Arg Ala Lys Ala Leu Asp Ala Ser Glu Lys
290 295 300
Ser Phe Pro Ser Ser Val Asp Asp Ala Arg Lys Glu Ser Ser Ser Ser
305 310 315 320
Ile Glu Ser Ala Glu Glu Ala Tyr Ala Ser Gln Leu Ala Ser Glu Pro
325 330 335
Tyr Asn Thr Ser Val Gln Leu Arg Lys Glu Gly Asp Ser Leu Arg Glu
340 345 350
Thr Ala Asp Arg Thr Leu Glu Ser Tyr Pro Lys Glu Ser Gly Asp Asp
355 360 365
Ala Lys Leu Arg Met Arg Leu Ala Ala Phe Asp Gln Tyr Glu Ala Ser
370 375 380
Arg Gln Lys Tyr Ala Asp Ser Lys Lys Ala Ala Asp Glu Ser Lys Val
385 390 395 400
Leu Ala Leu Ser Gln Lys Gln Gln Leu Ile Asp Ser Phe Ala Asp Ile
405 410 415
Asp Lys Asn Leu Asn Asp Ala Asp Lys Tyr Ala Glu Gly Lys Asp Pro
420 425 430
Glu Val Ser Glu Thr Arg Asn Arg Leu Asp Ser Ser Lys Ser Lys Ile
435 440 445
Glu Glu Gly Lys Ile Lys Glu Gly Tyr Ser Glu Ile Asp Asp Ile Arg
450 455 460
Lys Lys Ser Gly Glu Leu Val Ala Lys Asn Ile Lys Ile Tyr Ala Glu
465 470 475 480
Lys Gln Lys Glu Leu Ala Lys Gln Ser Val Ala Ser Ala Thr Thr Arg
485 490 495
Leu Ala Ser Phe Asp Arg Asn Lys Ile Asn Ser Ser Arg Asp Phe Gln
500 505 510
Val Ser Tyr Gln Arg Ala Glu Glu Asn Leu Lys Ala Ala Glu Glu Ser
515 520 525
Arg Val Ala Ala Glu Asp Leu Tyr Ser Ser Glu Lys Tyr Glu Asp Ser
530 535 540
Ile Ser Arg Ser Glu Glu Ala Ile Arg Leu Ser Arg Ile Val Val Asp
545 550 555 560
Gln Ala Thr Glu Leu Ala Glu Arg Ile Glu Arg Lys Ala Thr Thr Asp
565 570 575
Lys Ile Ala Gly Arg Asp Thr Lys Thr Glu Gly Asn Lys Asn Thr Lys
580 585 590
Asn Gln Ser Thr Thr Glu Gly Lys Asn Ser Ser Ser Lys Ile Gly Glu
595 600 605
Asp Gly Leu Pro Glu Gly Trp Lys Arg Tyr Val Val Arg Lys Lys Val
610 615 620
Pro Ala Asp Cys Leu Trp Arg Ile Ala Lys Asp Lys Arg His Tyr Gly
625 630 635 640
Thr Ser Lys Leu Trp Arg Arg Ile Tyr Glu Ala Asn Arg Asn Lys Ile
645 650 655
Lys Asn Pro Asn Leu Ile Tyr Pro Lys Gln Val Leu Leu Ile Pro Gly
660 665 670
Glu Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser His His His His
675 680 685
His His
690
<210> 166
<211> 1711
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence of a SNAP construct containing the LruB gene
of Leptospirosis.
<400> 166
tcgcgagcta gcaccatgaa actatgtatt ctacttgcag ttgttgcgtt cgtaggattg 60
tccttaccta cagctctggc aagatctgac aaagactgcg aaatgaaaag aactacattg 120
gattcaccac ttgggaagtt ggaactgagt ggatgcgagc aaggattgca tgaaattaag 180
ctactgggaa aaggaacttc tgctgctgat gcagttgaag ttccagcacc agcagctgtt 240
cttggaggtc ctgagcccct catgcaagcc acagcctggc ttaacgcata tttccaccag 300
cctgaggcca ttgaggaatt tccagtcccc gcccttcacc atcctgtgtt tcagcaggag 360
agcttcaccc gccaggtcct gtggaaattg ctgaaggtgg tcaagtttgg tgaagtgatt 420
tcatatcagc aacttgctgc attggccggt aaccccgcag ctacagctgc cgtgaaaact 480
gctctcagcg gaaatcctgt gcccatcctg atcccttgtc acagagtcgt ttcatcttcc 540
ggagctgtag gtggctatga aggaggactg gcagttaagg agtggctgct ggctcatgaa 600
ggtcatagac ttggaaagcc tgggctgggt cctgctggta taggcgcgcc agggtcccta 660
ggtggcggat ccgaaaacct gtacttccag agcgatatcc aacccactgc gacaagagct 720
caagtcgtag atcgttatct tcaactcggc tacgaatcct acgatcagag ctataaagac 780
gcagtcgctt ttcagaccgc agtcacagcc tttgctgcca ataacaaccc gaccgcagcg 840
gatcatatca atcttaagaa tttatacgta gtagcaagag cttcttattt aactacggaa 900
gcatttcgtt tttcatctgg accgatagac aacgtagaca ttttaggttg tggaagtaat 960
gcggatggtt ccggagacga agaatgcgaa ggactgatta acggatggcc gttagacgaa 1020
agcgcgattg ataattatat agcaaatgca ggaaatgcaa caacttatgc agccatccta 1080
gctacaaatg gagatgcaaa cgcaaataac gcagatgatc aagacgatga gacagcgctt 1140
acggtcggtt ggcacgccat cgaatatata ctctggggtc aggatctatt taacggagga 1200
atcaatcaaa tttcaggaca acgtaatata gctgatctta caggagcttc tccaggaaca 1260
gttggaggca gaagaagagc ttatatgaaa gcagttacgg acggactggt tcttcagcta 1320
aaattgattc gagatcaatt tgaagacggt gccagatatt cggatggact taaatccaat 1380
cctgacgcag cggtcactta tatctttcaa ggacttggta aattcatcgc tggagaatgg 1440
ggaggagaaa gacttaccgg aacttttggt ggacagcagg aggaggagca ttcttgtttt 1500
agcgatacta caaaggctga cttctattac aacgcacaga gtgtgttgaa catttggaac 1560
ggatcttacg aattgaagaa gggaaccgta acttccacgg gtccgggttt aaagaatctt 1620
tttggcccgg gagagaatct atattttcaa gggcccggcg gaggtagtca ccatcatcac 1680
catcactaat gaccggtgcg gccgcaagct t 1711
<210> 167
<211> 562
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of a SNAP construct containing the LruB gene
of Leptospirosis.
<400> 167
Ser Arg Ala Ser Thr Met Lys Leu Cys Ile Leu Leu Ala Val Val Ala
1 5 10 15
Phe Val Gly Leu Ser Leu Pro Thr Ala Leu Ala Arg Ser Asp Lys Asp
20 25 30
Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly Lys Leu Glu
35 40 45
Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu Leu Gly Lys
50 55 60
Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro Ala Ala Val
65 70 75 80
Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp Leu Asn Ala
85 90 95
Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val Pro Ala Leu
100 105 110
His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln Val Leu Trp
115 120 125
Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser Tyr Gln Gln
130 135 140
Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala Val Lys Thr
145 150 155 160
Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys His Arg Val
165 170 175
Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly Leu Ala Val
180 185 190
Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly Lys Pro Gly
195 200 205
Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Gly Gly Gly Ser
210 215 220
Glu Asn Leu Tyr Phe Gln Ser Asp Ile Gln Pro Thr Ala Thr Arg Ala
225 230 235 240
Gln Val Val Asp Arg Tyr Leu Gln Leu Gly Tyr Glu Ser Tyr Asp Gln
245 250 255
Ser Tyr Lys Asp Ala Val Ala Phe Gln Thr Ala Val Thr Ala Phe Ala
260 265 270
Ala Asn Asn Asn Pro Thr Ala Ala Asp His Ile Asn Leu Lys Asn Leu
275 280 285
Tyr Val Val Ala Arg Ala Ser Tyr Leu Thr Thr Glu Ala Phe Arg Phe
290 295 300
Ser Ser Gly Pro Ile Asp Asn Val Asp Ile Leu Gly Cys Gly Ser Asn
305 310 315 320
Ala Asp Gly Ser Gly Asp Glu Glu Cys Glu Gly Leu Ile Asn Gly Trp
325 330 335
Pro Leu Asp Glu Ser Ala Ile Asp Asn Tyr Ile Ala Asn Ala Gly Asn
340 345 350
Ala Thr Thr Tyr Ala Ala Ile Leu Ala Thr Asn Gly Asp Ala Asn Ala
355 360 365
Asn Asn Ala Asp Asp Gln Asp Asp Glu Thr Ala Leu Thr Val Gly Trp
370 375 380
His Ala Ile Glu Tyr Ile Leu Trp Gly Gln Asp Leu Phe Asn Gly Gly
385 390 395 400
Ile Asn Gln Ile Ser Gly Gln Arg Asn Ile Ala Asp Leu Thr Gly Ala
405 410 415
Ser Pro Gly Thr Val Gly Gly Arg Arg Arg Ala Tyr Met Lys Ala Val
420 425 430
Thr Asp Gly Leu Val Leu Gln Leu Lys Leu Ile Arg Asp Gln Phe Glu
435 440 445
Asp Gly Ala Arg Tyr Ser Asp Gly Leu Lys Ser Asn Pro Asp Ala Ala
450 455 460
Val Thr Tyr Ile Phe Gln Gly Leu Gly Lys Phe Ile Ala Gly Glu Trp
465 470 475 480
Gly Gly Glu Arg Leu Thr Gly Thr Phe Gly Gly Gln Gln Glu Glu Glu
485 490 495
His Ser Cys Phe Ser Asp Thr Thr Lys Ala Asp Phe Tyr Tyr Asn Ala
500 505 510
Gln Ser Val Leu Asn Ile Trp Asn Gly Ser Tyr Glu Leu Lys Lys Gly
515 520 525
Thr Val Thr Ser Thr Gly Pro Gly Leu Lys Asn Leu Phe Gly Pro Gly
530 535 540
Glu Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser His His His His
545 550 555 560
His His
<210> 168
<211> 1513
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence of a SNAP construct containing the LipL32
gene of Leptospirosis.
<400> 168
tcgcgagcta gcaccatgaa actatgtatt ctacttgcag ttgttgcgtt cgtaggattg 60
tccttaccta cagctctggc aagatctgac aaagactgcg aaatgaaaag aactacattg 120
gattcaccac ttgggaagtt ggaactgagt ggatgcgagc aaggattgca tgaaattaag 180
ctactgggaa aaggaacttc tgctgctgat gcagttgaag ttccagcacc agcagctgtt 240
cttggaggtc ctgagcccct catgcaagcc acagcctggc ttaacgcata tttccaccag 300
cctgaggcca ttgaggaatt tccagtcccc gcccttcacc atcctgtgtt tcagcaggag 360
agcttcaccc gccaggtcct gtggaaattg ctgaaggtgg tcaagtttgg tgaagtgatt 420
tcatatcagc aacttgctgc attggccggt aaccccgcag ctacagctgc cgtgaaaact 480
gctctcagcg gaaatcctgt gcccatcctg atcccttgtc acagagtcgt ttcatcttcc 540
ggagctgtag gtggctatga aggaggactg gcagttaagg agtggctgct ggctcatgaa 600
ggtcatagac ttggaaagcc tgggctgggt cctgctggta taggcgcgcc agggtcccta 660
ggtggcggat ccgaaaacct gtacttccag agcgatatca ttaccgcttg tggtgctttc 720
ggtggtctgc caagcctaaa aagctctttt gttctgagcg aggacacaat cccagggaca 780
aacgaaaccg taaaaacgtt acttccctac ggatctgtga tcaactatta cggatacgta 840
aagccaggac aagcgccgga cggtttagtc gatggaaaca aaaaagcata ctatctctat 900
gtttggattc ctgccgtaat cgctgaaatg ggagttcgta tgatttcccc aacaggcgaa 960
atcggtgagc caggcgacgg agacttagta agcgacgctt tcaaagcggc taccccagaa 1020
gaaaaatcaa tgccacattg gtttgatact tggattcgtg tagaaagaat gtcggcgatt 1080
atgcctgacc aaatcgccaa agctgcgaaa gcaaaaccag ttcaaaaatt ggacgatgat 1140
gatgatggtg acgatactta taaagaagag agacacaaca agtacaactc tcttactaga 1200
atcaagatcc ctaatcctcc aaaatctttt gacgatctga aaaacatcga cactaaaaaa 1260
cttttagtaa gaggtcttta cagaatttct ttcactacct acaaaccagg tgaagtgaaa 1320
ggatctttcg ttgcatctgt tggtctgctt ttcccaccag gtattccagg tgtgagcccg 1380
ctgatccact caaatcctga agaattgcaa aaacaagcta tcgctgcccc gggagagaat 1440
ctatattttc aagggcccgg cggaggtagt caccatcatc accatcacta atgaccggtg 1500
cggccgcaag ctt 1513
<210> 169
<211> 496
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of a SNAP construct containing the LipL32
gene of Leptospirosis.
<400> 169
Ser Arg Ala Ser Thr Met Lys Leu Cys Ile Leu Leu Ala Val Val Ala
1 5 10 15
Phe Val Gly Leu Ser Leu Pro Thr Ala Leu Ala Arg Ser Asp Lys Asp
20 25 30
Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly Lys Leu Glu
35 40 45
Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu Leu Gly Lys
50 55 60
Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro Ala Ala Val
65 70 75 80
Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp Leu Asn Ala
85 90 95
Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val Pro Ala Leu
100 105 110
His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln Val Leu Trp
115 120 125
Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser Tyr Gln Gln
130 135 140
Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala Val Lys Thr
145 150 155 160
Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys His Arg Val
165 170 175
Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly Leu Ala Val
180 185 190
Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly Lys Pro Gly
195 200 205
Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Gly Gly Gly Ser
210 215 220
Glu Asn Leu Tyr Phe Gln Ser Asp Ile Ile Thr Ala Cys Gly Ala Phe
225 230 235 240
Gly Gly Leu Pro Ser Leu Lys Ser Ser Phe Val Leu Ser Glu Asp Thr
245 250 255
Ile Pro Gly Thr Asn Glu Thr Val Lys Thr Leu Leu Pro Tyr Gly Ser
260 265 270
Val Ile Asn Tyr Tyr Gly Tyr Val Lys Pro Gly Gln Ala Pro Asp Gly
275 280 285
Leu Val Asp Gly Asn Lys Lys Ala Tyr Tyr Leu Tyr Val Trp Ile Pro
290 295 300
Ala Val Ile Ala Glu Met Gly Val Arg Met Ile Ser Pro Thr Gly Glu
305 310 315 320
Ile Gly Glu Pro Gly Asp Gly Asp Leu Val Ser Asp Ala Phe Lys Ala
325 330 335
Ala Thr Pro Glu Glu Lys Ser Met Pro His Trp Phe Asp Thr Trp Ile
340 345 350
Arg Val Glu Arg Met Ser Ala Ile Met Pro Asp Gln Ile Ala Lys Ala
355 360 365
Ala Lys Ala Lys Pro Val Gln Lys Leu Asp Asp Asp Asp Asp Gly Asp
370 375 380
Asp Thr Tyr Lys Glu Glu Arg His Asn Lys Tyr Asn Ser Leu Thr Arg
385 390 395 400
Ile Lys Ile Pro Asn Pro Pro Lys Ser Phe Asp Asp Leu Lys Asn Ile
405 410 415
Asp Thr Lys Lys Leu Leu Val Arg Gly Leu Tyr Arg Ile Ser Phe Thr
420 425 430
Thr Tyr Lys Pro Gly Glu Val Lys Gly Ser Phe Val Ala Ser Val Gly
435 440 445
Leu Leu Phe Pro Pro Gly Ile Pro Gly Val Ser Pro Leu Ile His Ser
450 455 460
Asn Pro Glu Glu Leu Gln Lys Gln Ala Ile Ala Ala Pro Gly Glu Asn
465 470 475 480
Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser His His His His His His
485 490 495
<210> 170
<211> 2803
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence of a SNAP construct containing the C gene of
Hepatitis E
<400> 170
tcgcgagcta gcaccatgaa actatgtatt ctacttgcag ttgttgcgtt cgtaggattg 60
tccttaccta cagctctggc aagatctgac aaagactgcg aaatgaaaag aactacattg 120
gattcaccac ttgggaagtt ggaactgagt ggatgcgagc aaggattgca tgaaattaag 180
ctactgggaa aaggaacttc tgctgctgat gcagttgaag ttccagcacc agcagctgtt 240
cttggaggtc ctgagcccct catgcaagcc acagcctggc ttaacgcata tttccaccag 300
cctgaggcca ttgaggaatt tccagtcccc gcccttcacc atcctgtgtt tcagcaggag 360
agcttcaccc gccaggtcct gtggaaattg ctgaaggtgg tcaagtttgg tgaagtgatt 420
tcatatcagc aacttgctgc attggccggt aaccccgcag ctacagctgc cgtgaaaact 480
gctctcagcg gaaatcctgt gcccatcctg atcccttgtc acagagtcgt ttcatcttcc 540
ggagctgtag gtggctatga aggaggactg gcagttaagg agtggctgct ggctcatgaa 600
ggtcatagac ttggaaagcc tgggctgggt cctgctggta taggcgcgcc agggtcccta 660
ggtggcggat ccgaaaacct gtacttccag agcgatatca ataacatgtt cttttgctct 720
gtgcatggag atgccaccat gcgctctcgg gctttcctgt tcttgttcct cgtgtttctg 780
cctatgctgc cagcgccacc agccggtcag ccttctggcc gacgtcgagg tcgacgtagc 840
ggaggtgcag gtggtggttt ctggggtgac cgtattgatt ctcagccatt cgctctccct 900
tatattcatc caaccaaccc attcgcacct gacattccag ccgcagctgg tgctggagct 960
cgacctcggc agccagcccg cccactcggc tccgcttggc gtgaccaatc ccagcgccca 1020
gccacttccg cacgtcgtcg atctgcacca gctggagctt cgccactgac tgctgtggca 1080
cctgctccag atactgttcc tgttcctgat gtcgattctc gaggtgctat attacgacgt 1140
cagtataatt tatcaacatc accgctaaca tctactattg ccactggtac taaccttgtt 1200
ctatatgctg ctccgctgag ccctttgcta ccactccaag atggaactaa cactcacatt 1260
atggccactg aagcatcaaa ttatgcccag taccgtgttg tccgcgctac catccggtac 1320
cgtccgcttg tgccgaacgc tgtcggcgga tacgctatat ctatctcttt ctggcctcag 1380
acaactacta ccccgacatc tgtggacatg aactctatca cctccacgga tgtccgaatc 1440
cttgtccagc ctggtattgc ttcagaactt gtgatcccca gtgagcgcct gcattatcgt 1500
aaccaaggct ggcgctctgt tgagacctct ggtgttgcgg aggaggaggc gacctccggc 1560
cttgtcatgc tttgcatcca cggatcacct gtaaattctt acaccaatac gccttatact 1620
ggtgcccttg gcttgcttga tttcgcactc gagctcgagt tccgcaattt gacacctggt 1680
aacacgaaca cacgtgtttc ccgctactcg agtagtgcac gacacaagct acgccgagga 1740
cctgatggca ctgctgagtt aactacgact gctgctacac gctttatgaa ggaccttcat 1800
tttacaggga ctaatggagt tggtgaagtc ggtcgtggta tagcgctaac tctgttcaac 1860
cttgctgata cgcttctcgg tggactcccg acagaattga tttcgtcggc tggtggtcag 1920
ctattctatt ctcgccccgt cgtctcagcc aatggcgagc caacggtgaa gctctacact 1980
tcagtcgaga acgctcagca ggataagggt atagctatcc cacatgatat tgatcttggt 2040
gagtcccgtg ttgtcattca ggattatgat aaccaacatg agcaggatcg tccaactcct 2100
tctcctgctc catctcgacc tttatctgtc cttcgtgcta atgatgtgct atggctttca 2160
cttacagcag ctgagtatga tcagactacc tatggctcct ctactaatcc aatgtatgtc 2220
tctgataccg tgacatttgt caatgttgct actggtgccc agggtgtatc tcgctctctg 2280
gactggtcta aagtcaccct tgatggacga ccacttatga ctatccagca gtattctaag 2340
actttctttg ttctgccact acgtggcaag ctctccttct gggaggccgg taccactaag 2400
gccggctacc cttataatta taatactact gccagtgacc agattttaat tgagaatgca 2460
gctggtcacc gtgtatgcat ctcaacctac actactaatc ttggatctgg ccctgtttct 2520
atttctgctg tcggtgtcct cgcacctcac tctgcgttgg ccgctttaga ggacactgtt 2580
gactatcctg ctcgtgctca cacttttgat gatttctgcc ctgagtgccg tacactcggc 2640
cttcagggtt gtgctttcca atcaactgtt gctgagctac agcgtcttaa aatgaaggtg 2700
ggtaaaactc gggagtaccc gggagagaat ctatattttc aagggcccgg cggaggtagt 2760
caccatcatc accatcacta atgaccggtg cggccgcaag ctt 2803
<210> 171
<211> 926
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of a SNAP construct containing the C gene of
Hepatitis E
<400> 171
Ser Arg Ala Ser Thr Met Lys Leu Cys Ile Leu Leu Ala Val Val Ala
1 5 10 15
Phe Val Gly Leu Ser Leu Pro Thr Ala Leu Ala Arg Ser Asp Lys Asp
20 25 30
Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly Lys Leu Glu
35 40 45
Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu Leu Gly Lys
50 55 60
Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro Ala Ala Val
65 70 75 80
Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp Leu Asn Ala
85 90 95
Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val Pro Ala Leu
100 105 110
His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln Val Leu Trp
115 120 125
Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser Tyr Gln Gln
130 135 140
Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala Val Lys Thr
145 150 155 160
Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys His Arg Val
165 170 175
Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly Leu Ala Val
180 185 190
Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly Lys Pro Gly
195 200 205
Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Gly Gly Gly Ser
210 215 220
Glu Asn Leu Tyr Phe Gln Ser Asp Ile Asn Asn Met Phe Phe Cys Ser
225 230 235 240
Val His Gly Asp Ala Thr Met Arg Ser Arg Ala Phe Leu Phe Leu Phe
245 250 255
Leu Val Phe Leu Pro Met Leu Pro Ala Pro Pro Ala Gly Gln Pro Ser
260 265 270
Gly Arg Arg Arg Gly Arg Arg Ser Gly Gly Ala Gly Gly Gly Phe Trp
275 280 285
Gly Asp Arg Ile Asp Ser Gln Pro Phe Ala Leu Pro Tyr Ile His Pro
290 295 300
Thr Asn Pro Phe Ala Pro Asp Ile Pro Ala Ala Ala Gly Ala Gly Ala
305 310 315 320
Arg Pro Arg Gln Pro Ala Arg Pro Leu Gly Ser Ala Trp Arg Asp Gln
325 330 335
Ser Gln Arg Pro Ala Thr Ser Ala Arg Arg Arg Ser Ala Pro Ala Gly
340 345 350
Ala Ser Pro Leu Thr Ala Val Ala Pro Ala Pro Asp Thr Val Pro Val
355 360 365
Pro Asp Val Asp Ser Arg Gly Ala Ile Leu Arg Arg Gln Tyr Asn Leu
370 375 380
Ser Thr Ser Pro Leu Thr Ser Thr Ile Ala Thr Gly Thr Asn Leu Val
385 390 395 400
Leu Tyr Ala Ala Pro Leu Ser Pro Leu Leu Pro Leu Gln Asp Gly Thr
405 410 415
Asn Thr His Ile Met Ala Thr Glu Ala Ser Asn Tyr Ala Gln Tyr Arg
420 425 430
Val Val Arg Ala Thr Ile Arg Tyr Arg Pro Leu Val Pro Asn Ala Val
435 440 445
Gly Gly Tyr Ala Ile Ser Ile Ser Phe Trp Pro Gln Thr Thr Thr Thr
450 455 460
Pro Thr Ser Val Asp Met Asn Ser Ile Thr Ser Thr Asp Val Arg Ile
465 470 475 480
Leu Val Gln Pro Gly Ile Ala Ser Glu Leu Val Ile Pro Ser Glu Arg
485 490 495
Leu His Tyr Arg Asn Gln Gly Trp Arg Ser Val Glu Thr Ser Gly Val
500 505 510
Ala Glu Glu Glu Ala Thr Ser Gly Leu Val Met Leu Cys Ile His Gly
515 520 525
Ser Pro Val Asn Ser Tyr Thr Asn Thr Pro Tyr Thr Gly Ala Leu Gly
530 535 540
Leu Leu Asp Phe Ala Leu Glu Leu Glu Phe Arg Asn Leu Thr Pro Gly
545 550 555 560
Asn Thr Asn Thr Arg Val Ser Arg Tyr Ser Ser Ser Ala Arg His Lys
565 570 575
Leu Arg Arg Gly Pro Asp Gly Thr Ala Glu Leu Thr Thr Thr Ala Ala
580 585 590
Thr Arg Phe Met Lys Asp Leu His Phe Thr Gly Thr Asn Gly Val Gly
595 600 605
Glu Val Gly Arg Gly Ile Ala Leu Thr Leu Phe Asn Leu Ala Asp Thr
610 615 620
Leu Leu Gly Gly Leu Pro Thr Glu Leu Ile Ser Ser Ala Gly Gly Gln
625 630 635 640
Leu Phe Tyr Ser Arg Pro Val Val Ser Ala Asn Gly Glu Pro Thr Val
645 650 655
Lys Leu Tyr Thr Ser Val Glu Asn Ala Gln Gln Asp Lys Gly Ile Ala
660 665 670
Ile Pro His Asp Ile Asp Leu Gly Glu Ser Arg Val Val Ile Gln Asp
675 680 685
Tyr Asp Asn Gln His Glu Gln Asp Arg Pro Thr Pro Ser Pro Ala Pro
690 695 700
Ser Arg Pro Leu Ser Val Leu Arg Ala Asn Asp Val Leu Trp Leu Ser
705 710 715 720
Leu Thr Ala Ala Glu Tyr Asp Gln Thr Thr Tyr Gly Ser Ser Thr Asn
725 730 735
Pro Met Tyr Val Ser Asp Thr Val Thr Phe Val Asn Val Ala Thr Gly
740 745 750
Ala Gln Gly Val Ser Arg Ser Leu Asp Trp Ser Lys Val Thr Leu Asp
755 760 765
Gly Arg Pro Leu Met Thr Ile Gln Gln Tyr Ser Lys Thr Phe Phe Val
770 775 780
Leu Pro Leu Arg Gly Lys Leu Ser Phe Trp Glu Ala Gly Thr Thr Lys
785 790 795 800
Ala Gly Tyr Pro Tyr Asn Tyr Asn Thr Thr Ala Ser Asp Gln Ile Leu
805 810 815
Ile Glu Asn Ala Ala Gly His Arg Val Cys Ile Ser Thr Tyr Thr Thr
820 825 830
Asn Leu Gly Ser Gly Pro Val Ser Ile Ser Ala Val Gly Val Leu Ala
835 840 845
Pro His Ser Ala Leu Ala Ala Leu Glu Asp Thr Val Asp Tyr Pro Ala
850 855 860
Arg Ala His Thr Phe Asp Asp Phe Cys Pro Glu Cys Arg Thr Leu Gly
865 870 875 880
Leu Gln Gly Cys Ala Phe Gln Ser Thr Val Ala Glu Leu Gln Arg Leu
885 890 895
Lys Met Lys Val Gly Lys Thr Arg Glu Tyr Pro Gly Glu Asn Leu Tyr
900 905 910
Phe Gln Gly Pro Gly Gly Gly Ser His His His His His His
915 920 925
<210> 172
<211> 2395
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence of a SNAP construct containing the core
sequence of the C gene of Hepatitis E
<400> 172
tcgcgagcta gcaccatgaa actatgtatt ctacttgcag ttgttgcgtt cgtaggattg 60
tccttaccta cagctctggc aagatctgac aaagactgcg aaatgaaaag aactacattg 120
gattcaccac ttgggaagtt ggaactgagt ggatgcgagc aaggattgca tgaaattaag 180
ctactgggaa aaggaacttc tgctgctgat gcagttgaag ttccagcacc agcagctgtt 240
cttggaggtc ctgagcccct catgcaagcc acagcctggc ttaacgcata tttccaccag 300
cctgaggcca ttgaggaatt tccagtcccc gcccttcacc atcctgtgtt tcagcaggag 360
agcttcaccc gccaggtcct gtggaaattg ctgaaggtgg tcaagtttgg tgaagtgatt 420
tcatatcagc aacttgctgc attggccggt aaccccgcag ctacagctgc cgtgaaaact 480
gctctcagcg gaaatcctgt gcccatcctg atcccttgtc acagagtcgt ttcatcttcc 540
ggagctgtag gtggctatga aggaggactg gcagttaagg agtggctgct ggctcatgaa 600
ggtcatagac ttggaaagcc tgggctgggt cctgctggta taggcgcgcc agggtcccta 660
ggtggcggat ccgaaaacct gtacttccag agcgatatcg ctggtgctgg agctcgacct 720
cggcagccag cccgcccact cggctccgct tggcgtgacc aatcccagcg cccagccact 780
tccgcacgtc gtcgatctgc accagctgga gcttcgccac tgactgctgt ggcacctgct 840
ccagatactg ttcctgttcc tgatgtcgat tctcgaggtg ctatattacg acgtcagtat 900
aatttatcaa catcaccgct aacatctact attgccactg gtactaacct tgttctatat 960
gctgctccgc tgagcccttt gctaccactc caagatggaa ctaacactca cattatggcc 1020
actgaagcat caaattatgc ccagtaccgt gttgtccgcg ctaccatccg gtaccgtccg 1080
cttgtgccga acgctgtcgg cggatacgct atatctatct ctttctggcc tcagacaact 1140
actaccccga catctgtgga catgaactct atcacctcca cggatgtccg aatccttgtc 1200
cagcctggta ttgcttcaga acttgtgatc cccagtgagc gcctgcatta tcgtaaccaa 1260
ggctggcgct ctgttgagac ctctggtgtt gcggaggagg aggcgacctc cggccttgtc 1320
atgctttgca tccacggatc acctgtaaat tcttacacca atacgcctta tactggtgcc 1380
cttggcttgc ttgatttcgc actcgagctc gagttccgca atttgacacc tggtaacacg 1440
aacacacgtg tttcccgcta ctcgagtagt gcacgacaca agctacgccg aggacctgat 1500
ggcactgctg agttaactac gactgctgct acacgcttta tgaaggacct tcattttaca 1560
gggactaatg gagttggtga agtcggtcgt ggtatagcgc taactctgtt caaccttgct 1620
gatacgcttc tcggtggact cccgacagaa ttgatttcgt cggctggtgg tcagctattc 1680
tattctcgcc ccgtcgtctc agccaatggc gagccaacgg tgaagctcta cacttcagtc 1740
gagaacgctc agcaggataa gggtatagct atcccacatg atattgatct tggtgagtcc 1800
cgtgttgtca ttcaggatta tgataaccaa catgagcagg atcgtccaac tccttctcct 1860
gctccatctc gacctttatc tgtccttcgt gctaatgatg tgctatggct ttcacttaca 1920
gcagctgagt atgatcagac tacctatggc tcctctacta atccaatgta tgtctctgat 1980
accgtgacat ttgtcaatgt tgctactggt gcccagggtg tatctcgctc tctggactgg 2040
tctaaagtca cccttgatgg acgaccactt atgactatcc agcagtattc taagactttc 2100
tttgttctgc cactacgtgg caagctctcc ttctgggagg ccggtaccac taaggccggc 2160
tacccttata attataatac tactgccagt gaccagattt taattgagaa tgcagctggt 2220
caccgtgtat gcatctcaac ctacactact aatcttggat ctggccctgt ttctatttct 2280
gctgtcggtg tcctcgcacc tcactctgcc ccgggagaga atctatattt tcaagggccc 2340
ggcggaggta gtcaccatca tcaccatcac taatgaccgg tgcggccgca agctt 2395
<210> 173
<211> 790
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of a SNAP construct containing the core
sequence of the C gene of Hepatitis E
<400> 173
Ser Arg Ala Ser Thr Met Lys Leu Cys Ile Leu Leu Ala Val Val Ala
1 5 10 15
Phe Val Gly Leu Ser Leu Pro Thr Ala Leu Ala Arg Ser Asp Lys Asp
20 25 30
Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly Lys Leu Glu
35 40 45
Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu Leu Gly Lys
50 55 60
Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro Ala Ala Val
65 70 75 80
Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp Leu Asn Ala
85 90 95
Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val Pro Ala Leu
100 105 110
His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln Val Leu Trp
115 120 125
Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser Tyr Gln Gln
130 135 140
Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala Val Lys Thr
145 150 155 160
Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys His Arg Val
165 170 175
Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly Leu Ala Val
180 185 190
Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly Lys Pro Gly
195 200 205
Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Gly Gly Gly Ser
210 215 220
Glu Asn Leu Tyr Phe Gln Ser Asp Ile Ala Gly Ala Gly Ala Arg Pro
225 230 235 240
Arg Gln Pro Ala Arg Pro Leu Gly Ser Ala Trp Arg Asp Gln Ser Gln
245 250 255
Arg Pro Ala Thr Ser Ala Arg Arg Arg Ser Ala Pro Ala Gly Ala Ser
260 265 270
Pro Leu Thr Ala Val Ala Pro Ala Pro Asp Thr Val Pro Val Pro Asp
275 280 285
Val Asp Ser Arg Gly Ala Ile Leu Arg Arg Gln Tyr Asn Leu Ser Thr
290 295 300
Ser Pro Leu Thr Ser Thr Ile Ala Thr Gly Thr Asn Leu Val Leu Tyr
305 310 315 320
Ala Ala Pro Leu Ser Pro Leu Leu Pro Leu Gln Asp Gly Thr Asn Thr
325 330 335
His Ile Met Ala Thr Glu Ala Ser Asn Tyr Ala Gln Tyr Arg Val Val
340 345 350
Arg Ala Thr Ile Arg Tyr Arg Pro Leu Val Pro Asn Ala Val Gly Gly
355 360 365
Tyr Ala Ile Ser Ile Ser Phe Trp Pro Gln Thr Thr Thr Thr Pro Thr
370 375 380
Ser Val Asp Met Asn Ser Ile Thr Ser Thr Asp Val Arg Ile Leu Val
385 390 395 400
Gln Pro Gly Ile Ala Ser Glu Leu Val Ile Pro Ser Glu Arg Leu His
405 410 415
Tyr Arg Asn Gln Gly Trp Arg Ser Val Glu Thr Ser Gly Val Ala Glu
420 425 430
Glu Glu Ala Thr Ser Gly Leu Val Met Leu Cys Ile His Gly Ser Pro
435 440 445
Val Asn Ser Tyr Thr Asn Thr Pro Tyr Thr Gly Ala Leu Gly Leu Leu
450 455 460
Asp Phe Ala Leu Glu Leu Glu Phe Arg Asn Leu Thr Pro Gly Asn Thr
465 470 475 480
Asn Thr Arg Val Ser Arg Tyr Ser Ser Ser Ala Arg His Lys Leu Arg
485 490 495
Arg Gly Pro Asp Gly Thr Ala Glu Leu Thr Thr Thr Ala Ala Thr Arg
500 505 510
Phe Met Lys Asp Leu His Phe Thr Gly Thr Asn Gly Val Gly Glu Val
515 520 525
Gly Arg Gly Ile Ala Leu Thr Leu Phe Asn Leu Ala Asp Thr Leu Leu
530 535 540
Gly Gly Leu Pro Thr Glu Leu Ile Ser Ser Ala Gly Gly Gln Leu Phe
545 550 555 560
Tyr Ser Arg Pro Val Val Ser Ala Asn Gly Glu Pro Thr Val Lys Leu
565 570 575
Tyr Thr Ser Val Glu Asn Ala Gln Gln Asp Lys Gly Ile Ala Ile Pro
580 585 590
His Asp Ile Asp Leu Gly Glu Ser Arg Val Val Ile Gln Asp Tyr Asp
595 600 605
Asn Gln His Glu Gln Asp Arg Pro Thr Pro Ser Pro Ala Pro Ser Arg
610 615 620
Pro Leu Ser Val Leu Arg Ala Asn Asp Val Leu Trp Leu Ser Leu Thr
625 630 635 640
Ala Ala Glu Tyr Asp Gln Thr Thr Tyr Gly Ser Ser Thr Asn Pro Met
645 650 655
Tyr Val Ser Asp Thr Val Thr Phe Val Asn Val Ala Thr Gly Ala Gln
660 665 670
Gly Val Ser Arg Ser Leu Asp Trp Ser Lys Val Thr Leu Asp Gly Arg
675 680 685
Pro Leu Met Thr Ile Gln Gln Tyr Ser Lys Thr Phe Phe Val Leu Pro
690 695 700
Leu Arg Gly Lys Leu Ser Phe Trp Glu Ala Gly Thr Thr Lys Ala Gly
705 710 715 720
Tyr Pro Tyr Asn Tyr Asn Thr Thr Ala Ser Asp Gln Ile Leu Ile Glu
725 730 735
Asn Ala Ala Gly His Arg Val Cys Ile Ser Thr Tyr Thr Thr Asn Leu
740 745 750
Gly Ser Gly Pro Val Ser Ile Ser Ala Val Gly Val Leu Ala Pro His
755 760 765
Ser Ala Pro Gly Glu Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser
770 775 780
His His His His His His
785 790
<210> 174
<211> 1195
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence of a SNAP construct containing the C gene of
Hepatitis C
<400> 174
tcgcgagcta gcaccatgaa actatgtatt ctacttgcag ttgttgcgtt cgtaggattg 60
tccttaccta cagctctggc aagatctgac aaagactgcg aaatgaaaag aactacattg 120
gattcaccac ttgggaagtt ggaactgagt ggatgcgagc aaggattgca tgaaattaag 180
ctactgggaa aaggaacttc tgctgctgat gcagttgaag ttccagcacc agcagctgtt 240
cttggaggtc ctgagcccct catgcaagcc acagcctggc ttaacgcata tttccaccag 300
cctgaggcca ttgaggaatt tccagtcccc gcccttcacc atcctgtgtt tcagcaggag 360
agcttcaccc gccaggtcct gtggaaattg ctgaaggtgg tcaagtttgg tgaagtgatt 420
tcatatcagc aacttgctgc attggccggt aaccccgcag ctacagctgc cgtgaaaact 480
gctctcagcg gaaatcctgt gcccatcctg atcccttgtc acagagtcgt ttcatcttcc 540
ggagctgtag gtggctatga aggaggactg gcagttaagg agtggctgct ggctcatgaa 600
ggtcatagac ttggaaagcc tgggctgggt cctgctggta taggcgcgcc agggtcccta 660
ggtggcggat ccgaaaacct gtacttccag agcgatatcg gagtttacct attgccgcga 720
agaggtcctc gtttaggtgt tcgagcaact agaaagactt ctgaacgatc acaacctcgt 780
ggaagacgac aacctatttt taaggctcgt cgtcctgaag gtagaactat ggctcagcct 840
ggttatccta tgcctctata tggtaatgaa ggatgcggta atgcaggaat gctactatca 900
cctcgtggtt ctcgacctag ttggggtcct actgaccctc gacgaagatc acgtaattta 960
ggtagagtaa ttgatacact tacatgtggt tttgctgatc ttatgggata tattccacta 1020
gtaggtgctc cactaggtgg agctgcaaga gctcttgcac atggtgtacg agttcttgaa 1080
gatggagtga actatgcaac aggtaatctc ccgggagaga atctatattt tcaagggccc 1140
ggcggaggta gtcaccatca tcaccatcac taatgaccgg tgcggccgca agctt 1195
<210> 175
<211> 390
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of a SNAP construct containing the C gene of
Hepatitis C.
<400> 175
Ser Arg Ala Ser Thr Met Lys Leu Cys Ile Leu Leu Ala Val Val Ala
1 5 10 15
Phe Val Gly Leu Ser Leu Pro Thr Ala Leu Ala Arg Ser Asp Lys Asp
20 25 30
Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly Lys Leu Glu
35 40 45
Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu Leu Gly Lys
50 55 60
Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro Ala Ala Val
65 70 75 80
Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp Leu Asn Ala
85 90 95
Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val Pro Ala Leu
100 105 110
His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln Val Leu Trp
115 120 125
Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser Tyr Gln Gln
130 135 140
Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala Val Lys Thr
145 150 155 160
Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys His Arg Val
165 170 175
Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly Leu Ala Val
180 185 190
Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly Lys Pro Gly
195 200 205
Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Gly Gly Gly Ser
210 215 220
Glu Asn Leu Tyr Phe Gln Ser Asp Ile Gly Val Tyr Leu Leu Pro Arg
225 230 235 240
Arg Gly Pro Arg Leu Gly Val Arg Ala Thr Arg Lys Thr Ser Glu Arg
245 250 255
Ser Gln Pro Arg Gly Arg Arg Gln Pro Ile Phe Lys Ala Arg Arg Pro
260 265 270
Glu Gly Arg Thr Met Ala Gln Pro Gly Tyr Pro Met Pro Leu Tyr Gly
275 280 285
Asn Glu Gly Cys Gly Asn Ala Gly Met Leu Leu Ser Pro Arg Gly Ser
290 295 300
Arg Pro Ser Trp Gly Pro Thr Asp Pro Arg Arg Arg Ser Arg Asn Leu
305 310 315 320
Gly Arg Val Ile Asp Thr Leu Thr Cys Gly Phe Ala Asp Leu Met Gly
325 330 335
Tyr Ile Pro Leu Val Gly Ala Pro Leu Gly Gly Ala Ala Arg Ala Leu
340 345 350
Ala His Gly Val Arg Val Leu Glu Asp Gly Val Asn Tyr Ala Thr Gly
355 360 365
Asn Leu Pro Gly Glu Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser
370 375 380
His His His His His His
385 390
<210> 176
<211> 1288
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence of a SNAP construct containing the core
sequence of the C gene of Hepatitis C
<400> 176
tcgcgagcta gcaccatgaa actatgtatt ctacttgcag ttgttgcgtt cgtaggattg 60
tccttaccta cagctctggc aagatctgac aaagactgcg aaatgaaaag aactacattg 120
gattcaccac ttgggaagtt ggaactgagt ggatgcgagc aaggattgca tgaaattaag 180
ctactgggaa aaggaacttc tgctgctgat gcagttgaag ttccagcacc agcagctgtt 240
cttggaggtc ctgagcccct catgcaagcc acagcctggc ttaacgcata tttccaccag 300
cctgaggcca ttgaggaatt tccagtcccc gcccttcacc atcctgtgtt tcagcaggag 360
agcttcaccc gccaggtcct gtggaaattg ctgaaggtgg tcaagtttgg tgaagtgatt 420
tcatatcagc aacttgctgc attggccggt aaccccgcag ctacagctgc cgtgaaaact 480
gctctcagcg gaaatcctgt gcccatcctg atcccttgtc acagagtcgt ttcatcttcc 540
ggagctgtag gtggctatga aggaggactg gcagttaagg agtggctgct ggctcatgaa 600
ggtcatagac ttggaaagcc tgggctgggt cctgctggta taggcgcgcc agggtcccta 660
ggtggcggat ccgaaaacct gtacttccag agcgatatca gtacgaatcc taagcctcaa 720
cgtaagacta agcgcaatac taatcgtcgt ccacaagatg ttaagtttcc gggtggcggt 780
caaattgttg gtggagttta cctattgccg cgaagaggtc ctcgtttagg tgttcgagca 840
actagaaaga cttctgaacg atcacaacct cgtggaagac gacaacctat ttttaaggct 900
cgtcgtcctg aaggtagaac tatggctcag cctggttatc ctatgcctct atatggtaat 960
gaaggatgcg gtaatgcagg aatgctacta tcacctcgtg gttctcgacc tagttggggt 1020
cctactgacc ctcgacgaag atcacgtaat ttaggtagag taattgatac acttacatgt 1080
ggttttgctg atcttatggg atatattcca ctagtaggtg ctccactagg tggagctgca 1140
agagctcttg cacatggtgt acgagttctt gaagatggag tgaactatgc aacaggtaat 1200
ctcccgggag agaatctata ttttcaaggg cccggcggag gtagtcacca tcatcaccat 1260
cactaatgac cggtgcggcc gcaagctt 1288
<210> 177
<211> 421
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of a SNAP construct containing the core
sequence of the C gene of Hepatitis C
<400> 177
Ser Arg Ala Ser Thr Met Lys Leu Cys Ile Leu Leu Ala Val Val Ala
1 5 10 15
Phe Val Gly Leu Ser Leu Pro Thr Ala Leu Ala Arg Ser Asp Lys Asp
20 25 30
Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly Lys Leu Glu
35 40 45
Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu Leu Gly Lys
50 55 60
Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro Ala Ala Val
65 70 75 80
Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp Leu Asn Ala
85 90 95
Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val Pro Ala Leu
100 105 110
His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln Val Leu Trp
115 120 125
Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser Tyr Gln Gln
130 135 140
Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala Val Lys Thr
145 150 155 160
Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys His Arg Val
165 170 175
Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly Leu Ala Val
180 185 190
Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly Lys Pro Gly
195 200 205
Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Gly Gly Gly Ser
210 215 220
Glu Asn Leu Tyr Phe Gln Ser Asp Ile Ser Thr Asn Pro Lys Pro Gln
225 230 235 240
Arg Lys Thr Lys Arg Asn Thr Asn Arg Arg Pro Gln Asp Val Lys Phe
245 250 255
Pro Gly Gly Gly Gln Ile Val Gly Gly Val Tyr Leu Leu Pro Arg Arg
260 265 270
Gly Pro Arg Leu Gly Val Arg Ala Thr Arg Lys Thr Ser Glu Arg Ser
275 280 285
Gln Pro Arg Gly Arg Arg Gln Pro Ile Phe Lys Ala Arg Arg Pro Glu
290 295 300
Gly Arg Thr Met Ala Gln Pro Gly Tyr Pro Met Pro Leu Tyr Gly Asn
305 310 315 320
Glu Gly Cys Gly Asn Ala Gly Met Leu Leu Ser Pro Arg Gly Ser Arg
325 330 335
Pro Ser Trp Gly Pro Thr Asp Pro Arg Arg Arg Ser Arg Asn Leu Gly
340 345 350
Arg Val Ile Asp Thr Leu Thr Cys Gly Phe Ala Asp Leu Met Gly Tyr
355 360 365
Ile Pro Leu Val Gly Ala Pro Leu Gly Gly Ala Ala Arg Ala Leu Ala
370 375 380
His Gly Val Arg Val Leu Glu Asp Gly Val Asn Tyr Ala Thr Gly Asn
385 390 395 400
Leu Pro Gly Glu Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly Ser His
405 410 415
His His His His His
420
<210> 178
<211> 1054
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleotide sequence of a SNAP construct containing sequences
encoding the NSs protein from Schmallenberg virus
<400> 178
tcgcgagcta gcaccatgaa actatgtatt ctacttgcag ttgttgcgtt cgtaggattg 60
tccttaccta cagctctggc aagatctgac aaagactgcg aaatgaaaag aactacattg 120
gattcaccac ttgggaagtt ggaactgagt ggatgcgagc aaggattgca tgaaattaag 180
ctactgggaa aaggaacttc tgctgctgat gcagttgaag ttccagcacc agcagctgtt 240
cttggaggtc ctgagcccct catgcaagcc acagcctggc ttaacgcata tttccaccag 300
cctgaggcca ttgaggaatt tccagtcccc gcccttcacc atcctgtgtt tcagcaggag 360
agcttcaccc gccaggtcct gtggaaattg ctgaaggtgg tcaagtttgg tgaagtgatt 420
tcatatcagc aacttgctgc attggccggt aaccccgcag ctacagctgc cgtgaaaact 480
gctctcagcg gaaatcctgt gcccatcctg atcccttgtc acagagtcgt ttcatcttcc 540
ggagctgtag gtggctatga aggaggactg gcagttaagg agtggctgct ggctcatgaa 600
ggtcatagac ttggaaagcc tgggctgggt cctgctggta taggcgcgcc agggtcccta 660
ggtggcggat ccgaaaacct gtacttccag agcgatatct accacaacgg aatgcagcta 720
catttaaccc ggaggtcggg tatgtggcat ttattggtaa gtatgggcaa caactcaact 780
tcggtgttgc tagagtcttc ttcctcaacc agaagaaggc caagatggtc ctacataaga 840
cggcacaacc aagtgtcgat cttacttttg gtggggtcaa atttacagtg gttaataacc 900
attttcccca atatgtctca aatcctgtgc cagacaatgc cattacactt cacaggatgt 960
caggttatcc cgggagagaa tctatatttt caagggcccg gcggaggtag tcaccatcat 1020
caccatcact aatgaccggt gcggccgcaa gctt 1054
<210> 179
<211> 343
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of a SNAP construct containing sequences
encoding the NSs protein from Schmallenberg virus
<400> 179
Ser Arg Ala Ser Thr Met Lys Leu Cys Ile Leu Leu Ala Val Val Ala
1 5 10 15
Phe Val Gly Leu Ser Leu Pro Thr Ala Leu Ala Arg Ser Asp Lys Asp
20 25 30
Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu Gly Lys Leu Glu
35 40 45
Leu Ser Gly Cys Glu Gln Gly Leu His Glu Ile Lys Leu Leu Gly Lys
50 55 60
Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala Pro Ala Ala Val
65 70 75 80
Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala Trp Leu Asn Ala
85 90 95
Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro Val Pro Ala Leu
100 105 110
His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg Gln Val Leu Trp
115 120 125
Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile Ser Tyr Gln Gln
130 135 140
Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala Ala Val Lys Thr
145 150 155 160
Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro Cys His Arg Val
165 170 175
Val Ser Ser Ser Gly Ala Val Gly Gly Tyr Glu Gly Gly Leu Ala Val
180 185 190
Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu Gly Lys Pro Gly
195 200 205
Leu Gly Pro Ala Gly Ile Gly Ala Pro Gly Ser Leu Gly Gly Gly Ser
210 215 220
Glu Asn Leu Tyr Phe Gln Ser Asp Ile Tyr His Asn Gly Met Gln Leu
225 230 235 240
His Leu Thr Arg Arg Ser Gly Met Trp His Leu Leu Val Ser Met Gly
245 250 255
Asn Asn Ser Thr Ser Val Leu Leu Glu Ser Ser Ser Ser Thr Arg Arg
260 265 270
Arg Pro Arg Trp Ser Tyr Ile Arg Arg His Asn Gln Val Ser Ile Leu
275 280 285
Leu Leu Val Gly Ser Asn Leu Gln Trp Leu Ile Thr Ile Phe Pro Asn
290 295 300
Met Ser Gln Ile Leu Cys Gln Thr Met Pro Leu His Phe Thr Gly Cys
305 310 315 320
Gln Val Ile Pro Gly Glu Asn Leu Tyr Phe Gln Gly Pro Gly Gly Gly
325 330 335
Ser His His His His His His
340
Claims (38)
- 피험자로부터의 생물학적 샘플에 존재하는 적어도 2개의 상이한 표적 항체를 검출하기 위한 시험관내 분석 방법으로서, 상기 방법은
(a) 적어도 2개의 고체 지지체의 혼합물을 생물학적 샘플과 접촉시키는 단계로서, 상기 고체 지지체 중의 적어도 하나는 AGT 기질에 공유적으로 커플링 (covalently coupling)된 제1 AGT-항원 융합 단백질을 포함하고, 상기 고체 지지체 중의 적어도 하나는 AGT 기질에 공유적으로 커플링된 제2 AGT-항원 융합 단백질을 포함하는 단계,
(b) 제1 AGT-항원에 대한 항체의 결합의 존재 또는 부재를 검출하는 단계; 및
(c) 제2 AGT-항원에 대한 항체의 결합의 존재 또는 부재를 검출하는 단계를 포함하는, 시험관내 분석 방법. - 제1항에 있어서, 적어도 5개의 고체 지지체의 혼합물을 피험자로부터의 생물학적 샘플과 접촉시키는 것을 포함하는, 분석 방법.
- 제1항에 있어서, 적어도 10개의 고체 지지체를 피험자로부터의 생물학적 샘플과 접촉시키는 것을 포함하는, 분석 방법.
- 제1항에 있어서, 적어도 15개의 고체 지지체의 혼합물을 피험자로부터의 생물학적 샘플과 접촉시키는 것을 포함하는, 분석 방법.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 AGT-항원 융합 단백질 둘 다가 서열번호 2의 SNAP 돌연변이체를 포함하는, 분석 방법.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 고체 지지체가 이들의 특정 위치, 크기, 직경, 중량, 입도측정 또는 표지화에 의해 특이적으로 식별될 수 있는, 분석 방법.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 고체 지지체가 형광색소, 발색단, 방사성동위원소 및/또는 질량 태그(mass tag)에 의해 표지되는, 분석 방법.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 고체 지지체가 마이크로입자 (microparticle)로 제조되는, 분석 방법.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 고체 지지체가 자석인, 분석 방법.
- 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 고체 지지체가 형광 염료로 내부 표지된 마이크로입자인, 분석 방법.
- 제1항 내지 제10항 중 어느 한 항에 있어서, 각각의 상기 고체 지지체가 여기 후에 상이하고 식별가능한 파장을 방사하는, 분석 방법.
- 제1항 내지 제11항 중 어느 한 항에 있어서, 상기 제1 또는 제2 AGT-항원 융합 단백질이 서열번호 3의 뎅기 바이러스 1의 EDIII 단백질, 서열번호 4의 뎅기 바이러스 2의 EDIII 단백질, 서열번호 5의 뎅기 바이러스 3의 EDIII 단백질, 서열번호 6의 뎅기 바이러스 4의 EDIII 단백질, 서열번호 7의 웨스트 나일 바이러스의 EDIII 단백질, 서열번호 8의 황열 바이러스의 EDIII 단백질, 서열번호 9의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 10의 지카 바이러스의 EDIII 단백질, 서열번호 11의 베셀스브론 바이러스의 EDIII 단백질, 서열번호 12의 로시오 바이러스의 EDIII 단백질, 서열번호 13의 머레이 뇌염 바이러스의 EDIII 단백질, 서열번호 14의 세인트-루이스 뇌염 바이러스의 EDIII 단백질, 서열번호 54에 의해 인코딩되는 유전형 1의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 55에 의해 인코딩되는 유전형 2의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 56에 의해 인코딩되는 유전형 4의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 57에 의해 인코딩되는 유전형 5의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 58에 의해 인코딩되는 라벤스버그 바이러스의 EDIII 단백질의 적어도 30개의 연속적 아미노산을 포함하는, 분석 방법.
- 제1항 내지 제12항 중 어느 한 항에 있어서, 상기 제1 또는 제2 AGT-항원 융합 단백질이 HIV1, HIV2, B형 간염 바이러스, C형 간염 바이러스, E형 간염 바이러스, 웨스트-나일 바이러스 및 종양 HPV 스트레인, HPV 16, 18, 31, 33, 35, 39, 45, 51, 52, 56, 58, 59, 66 및 68의 바이러스 단백질의 적어도 20개의 연속적 아미노산을 포함하는, 분석 방법.
- 제1항 내지 제13항 중 어느 한 항에 있어서, 상기 제1 또는 제2 AGT-항원 융합 단백질이 서열번호 21, 서열번호 42, 서열번호 49, 서열번호 51, 서열번호 53, 서열번호 60, 서열번호 62, 서열번호 64, 서열번호 66, 서열번호 68, 서열번호 70, 서열번호 72, 서열번호 74, 서열번호 76, 서열번호 78, 서열번호 80, 서열번호 82, 서열번호 84, 서열번호 86, 서열번호 88, 서열번호 90, 서열번호 92, 서열번호 94, 서열번호 96, 서열번호 98, 서열번호 100, 서열번호 102, 서열번호 104, 서열번호 109, 서열번호 111, 서열번호 113, 서열번호 115, 서열번호 117, 서열번호 119, 서열번호 121, 서열번호 123, 서열번호 125, 서열번호 127, 서열번호 129, 서열번호 131, 서열번호 133, 서열번호 135, 서열번호 137, 서열번호 139, 서열번호 141, 서열번호 143, 서열번호 145, 서열번호 147, 서열번호 149 및 서열번호 151로 이루어진 그룹으로부터 선택된 아미노산 서열을 포함하는, 분석 방법.
- 제1항 내지 제14항 중 어느 한 항에 있어서, 상기 제1 또는 제2 AGT-항원 융합 단백질이 서열번호 155, 157, 159, 161, 163, 165, 167, 171, 173, 175, 177 및 179의 적어도 30개의 연속적 아미노산을 포함하는, 분석 방법.
- 제1항 내지 제15항 중 어느 한 항에 있어서, 상기 제1 또는 제2 AGT-항원 융합 단백질이 서열번호 155, 157, 159, 161, 163, 165, 167, 171, 173, 175, 177 및 179의 아미노산 서열을 포함하는, 분석 방법.
- 제1항 내지 제16항 중 어느 한 항에 있어서, 상기 생물학적 샘플이 혈청 또는 혈장인, 분석 방법.
- 피험자로부터의 생물학적 샘플에 존재하는 적어도 2개의 상이한 표적 항체를 검출하기 위한 키트로서,
(a) AGT 기질에 공유적으로 커플링된 제1 AGT-항원 융합 단백질을 포함하는 제1 고체 지지체 및
(b) AGT 기질에 공유적으로 커플링된 제2 AGT-항원 융합 단백질을 포함하는 제2 고체 지지체를 포함하는, 키트. - 제18항에 있어서, AGT 기질에 공유적으로 커플링된 상이한 AGT-항원 융합 단백질에 각각 커플링된 적어도 5개의 고체 지지체를 포함하는, 키트.
- 제19항에 있어서, AGT 기질에 공유적으로 커플링된 상이한 AGT-항원 융합 단백질에 각각 커플링된 적어도 10개의 고체 지지체를 포함하는, 키트.
- 제20항에 있어서, AGT 기질에 공유적으로 커플링된 상이한 AGT-항원 융합 단백질에 각각 커플링된 적어도 15개의 고체 지지체를 포함하는, 키트.
- 제18항 내지 제21항 중 어느 한 항에 있어서, 상기 고체 지지체가 마이크로입자인, 키트.
- 제18항 내지 제22항 중 어느 한 항에 있어서, 상기 고체 지지체가 적어도 하나의 단일 구획에서 함께 혼합되는, 키트.
- 제18항 내지 제23항 중 어느 한 항에 있어서, 상기 고체 지지체가 미세역가판 (microtiter plate)의 적어도 하나의 웰 또는 적어도 하나의 튜브에서 함께 혼합되는 마이크로입자인, 키트.
- 제18항 내지 제24항 중 어느 한 항에 있어서, 상기 고체 지지체에 결합되는 적어도 2개의 표적 항체를 검출하기 위한 표지된 제2 항체를 추가로 포함하는, 키트.
- 제18항 내지 제25항 중 어느 한 항에 있어서, 상기 제1 또는 제2 AGT-항원 융합 단백질이 서열번호 3의 뎅기 바이러스 1의 EDIII 단백질, 서열번호 4의 뎅기 바이러스 2의 EDIII 단백질, 서열번호 5의 뎅기 바이러스 3의 EDIII 단백질, 서열번호 6의 뎅기 바이러스 4의 EDIII 단백질, 서열번호 7의 웨스트 나일 바이러스의 EDIII 단백질, 서열번호 8의 황열 바이러스의 EDIII 단백질, 서열번호 9의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 10의 지카 바이러스의 EDIII 단백질, 서열번호 11의 베셀스브론 바이러스의 EDIII 단백질, 서열번호 12의 로시오 바이러스의 EDIII 단백질, 서열번호 13의 머레이 뇌염 바이러스의 EDIII 단백질, 서열번호 14의 세인트-루이스 뇌염 바이러스의 EDIII 단백질, 서열번호 54에 의해 인코딩되는 유전형 1의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 55에 의해 인코딩되는 유전형 2의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 56에 의해 인코딩되는 유전형 4의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 57에 의해 인코딩되는 유전형 5의 일본 뇌염 바이러스의 EDIII 단백질, 서열번호 58에 의해 인코딩되는 라벤스버그 바이러스의 EDIII 단백질의 적어도 30개의 연속적 아미노산을 포함하는, 키트.
- 제18항 내지 제26항 중 어느 한 항에 있어서, 상기 제1 또는 제2 AGT-항원 융합 단백질이 HIV1, HIV2, B형 간염 바이러스, C형 간염 바이러스, E형 간염 바이러스, 웨스트-나일 바이러스 및 종양 HPV 스트레인, HPV 16, 18, 31, 33, 35, 39, 45, 51, 52, 56, 58, 59, 66 및 68의 바이러스 단백질의 적어도 20개 연속적 아미노산을 포함하는, 키트.
- 제18항 내지 제27항 중 어느 한 항에 있어서, 상기 제1 또는 제2 AGT-항원 융합 단백질이 서열번호 21, 서열번호 42, 서열번호 49, 서열번호 51, 서열번호 53, 서열번호 60, 서열번호 62, 서열번호 64, 서열번호 66, 서열번호 68, 서열번호 70, 서열번호 72, 서열번호 74, 서열번호 76, 서열번호 78, 서열번호 80, 서열번호 82, 서열번호 84, 서열번호 86, 서열번호 88, 서열번호 90, 서열번호 92, 서열번호 94, 서열번호 96, 서열번호 98, 서열번호 100, 서열번호 102, 서열번호 104, 서열번호 109, 서열번호 111, 서열번호 113, 서열번호 115, 서열번호 117, 서열번호 119, 서열번호 121, 서열번호 123, 서열번호 125, 서열번호 127, 서열번호 129, 서열번호 131, 서열번호 133, 서열번호 135, 서열번호 137, 서열번호 139, 서열번호 141, 서열번호 143, 서열번호 145, 서열번호 147, 서열번호 149 및 서열번호 151로 이루어진 그룹으로부터 선택되는 아미노산 서열을 포함하는, 키트.
- 제18항 내지 제28항 중 어느 한 항에 있어서, 상기 제1 또는 제2 AGT-항원 융합 단백질이 서열번호 155, 157, 159, 161, 163, 165, 167, 171, 173, 175, 177 및 179의 적어도 30개의 연속적 아미노산을 포함하는, 키트.
- 제18항 내지 제29항 중 어느 한 항에 있어서, 상기 제1 또는 제2 AGT-항원 융합 단백질이 서열번호 155, 157, 159, 161, 163, 165, 167, 171, 173, 175, 177 및 179의 아미노산 서열을 포함하는, 키트.
- 피험자로부터의 생물학적 샘플에서 적어도 2개의 표적 항체를 검출하기 위한, 제18항 내지 제30항 중 어느 한 항에 따른 키트의 용도.
- 피험자에서 파필로마바이러스 또는 뎅기 바이러스, 황열 바이러스, 웨스트 나일 바이러스, 일본 뇌염 바이러스, 진드기-매개 뇌염 바이러스, C형 간염 바이러스, 치쿤구니아 바이러스, 로스 강 바이러스, 마야로 바이러스, 서부 말 뇌염 바이러스, 동부 말 뇌염 바이러스, 베네주엘라 말 뇌염 바이러스, 크리미아-콩고 출혈 열 바이러스, 리프트 계곡 열 바이러스, 쉬말렌베르그 바이러스, E형 간염 바이러스, 라사 바이러스, 에볼라 바이러스, 마르부르그 바이러스에 의해 유발되는 바이러스 감염; 렙토스피로사 인테로간스에 의해 유발되는 세균 감염; 또는 플라스모듐 팔시파룸에 의해 유발되는 감염인 적어도 2개의 표적 질환을 진단하기 위한, 제18항 내지 제31항 중 어느 한 항에 따른 키트의 용도.
- 피험자에서 적어도 하나의 표적 항체의 합성을 유도하는 것으로 알려진 하나 이상의 표적 질환을 진단하기 위한 시험관내 진단 방법으로서, 상기 방법은 제1항 내지 제17항 중 어느 한 항에 따른 분석 방법을 수행하는 것을 포함하고, 하나 이상의 표적 항체의 양이 대조치 보다 높은 경우 상기 피험자가 적어도 하나의 표적 질환을 앓는 것으로 진단되는, 시험관내 진단 방법.
- 키트를 제조하는 방법으로서, 상기 방법은
(a) 제1 표적 항체에 의해 인지되는 제1 AGT-항원 융합 단백질을 제공하는 단계,
(b) 상기 제1 AGT-항원 융합 단백질을, 상기 AGT-항원 융합 단백질의 기질과 공유적으로 커플링된 제1 고체 지지체와 접촉시키는 단계,
(c) 제1 AGT-항원 융합 단백질과 공유적으로 커플링된 제1 고체 지지체를 수득하는 단계,
(d) 제2 표적 항체에 의해서는 인지되나 상기 제1 표적 항체에 의해서는 인지되지 않는 제2 AGT-항원 융합 단백질을 제공하는 단계,
(e) 상기 제2 AGT-항원 융합 단백질을, 상기 AGT-항원 융합 단백질의 기질과 공유적으로 커플링된 제2 고체 지지체와 접촉시키는 단계, 및
(f) 제2 AGT-항원 융합 단백질과 공유적으로 커플링된 제2 고체 지지체를 수득하는 단계를 포함하고,
상기 제1 및 제2 고체 지지체는 서로 특이적으로 식별될 수 있는, 방법. - 제34항에 있어서, AGT-항원 융합 단백질과 공유적으로 커플링된 고체 지지체를 함께 혼합하는 것을 추가로 포함하는, 방법.
- 제34항 또는 제35항에 있어서, 5개의 상이한 AGT-항원 융합 단백질과 공유적으로 커플링된 적어도 5개의 고체 지지체를 생성하기 위해 적어도 5개의 AGT-항원 융합 단백질로 단계 (a) 내지 (c)를 수행하는 것을 추가로 포함하는, 방법.
- 제34항 또는 제35항에 있어서, 10개의 상이한 AGT-항원 융합 단백질과 공유적으로 커플링된 적어도 10개의 고체 지지체를 생성하기 위해 적어도 10개의 AGT-항원 융합 단백질로 단계 (a) 내지 (c)를 수행하는 것을 추가로 포함하는, 방법.
- 제34항 또는 제35항에 있어서, 15개의 상이한 AGT-항원 융합 단백질과 공유적으로 커플링된 적어도 15개의 고체 지지체를 생성하기 위해 적어도 15개의 AGT-항원 융합 단백질로 단계 (a) 내지 (c)를 수행하는 것을 추가로 포함하는, 방법.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261642924P | 2012-05-04 | 2012-05-04 | |
US61/642,924 | 2012-05-04 | ||
PCT/EP2012/074986 WO2013083847A2 (en) | 2011-12-09 | 2012-12-10 | Multiplex immuno screening assay |
EPPCT/EP2012/074986 | 2012-12-10 | ||
PCT/EP2013/059312 WO2013164476A1 (en) | 2012-05-04 | 2013-05-03 | Multiplex immuno screening assay |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20150016941A true KR20150016941A (ko) | 2015-02-13 |
KR102049623B1 KR102049623B1 (ko) | 2019-11-28 |
Family
ID=49514226
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020147018819A KR102007061B1 (ko) | 2011-12-09 | 2012-12-10 | 다중 면역 스크리닝 분석 |
KR1020147031586A KR102049623B1 (ko) | 2012-05-04 | 2013-05-03 | 다중 면역 스크리닝 분석 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020147018819A KR102007061B1 (ko) | 2011-12-09 | 2012-12-10 | 다중 면역 스크리닝 분석 |
Country Status (15)
Country | Link |
---|---|
US (5) | US9638692B2 (ko) |
EP (2) | EP2788478B1 (ko) |
JP (2) | JP6215223B2 (ko) |
KR (2) | KR102007061B1 (ko) |
CN (2) | CN104114697A (ko) |
AU (2) | AU2012350229B2 (ko) |
BR (2) | BR112014013745B1 (ko) |
CA (2) | CA2857998C (ko) |
DK (1) | DK2788478T3 (ko) |
ES (1) | ES2648899T3 (ko) |
MX (2) | MX349562B (ko) |
NO (1) | NO2788478T3 (ko) |
NZ (1) | NZ701380A (ko) |
SG (2) | SG11201403010TA (ko) |
WO (2) | WO2013083847A2 (ko) |
Families Citing this family (54)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105821078A (zh) * | 2010-12-09 | 2016-08-03 | 巴斯德研究所 | 用于获得高产量重组蛋白表达的基于mgmt的方法 |
AU2012350229B2 (en) | 2011-12-09 | 2018-03-22 | Institut Pasteur | Multiplex immuno screening assay |
GB201210226D0 (en) * | 2012-06-11 | 2012-07-25 | Univ St Andrews | Vaccine |
WO2014045254A2 (en) | 2012-09-23 | 2014-03-27 | Erasmus University Medical Center Rotterdam | Human betacoronavirus lineage c and identification of n-terminal dipeptidyl peptidase as its virus receptor |
JP2015535841A (ja) * | 2012-09-27 | 2015-12-17 | アイデックス ラボラトリーズ インコーポレイテッドIDEXX Laboratories, Inc. | シュマーレンベルグウイルス(sbv)の検出方法及びキット |
EP2968514A1 (en) * | 2013-03-12 | 2016-01-20 | Merial, Inc. | Reverse genetics schmallenberg virus vaccine compositions, and methods of use thereof |
WO2014154336A1 (en) * | 2013-03-26 | 2014-10-02 | Iffmedic Gmbh | Microtiter plate-based microarray |
CN103472221A (zh) * | 2013-08-12 | 2013-12-25 | 南昌大学 | 荧光微球标记沙丁胺醇多克隆抗体的方法 |
AU2014354797C1 (en) | 2013-11-29 | 2018-02-01 | Inovio Pharmaceuticals, Inc. | MERS-CoV vaccine |
EP3114482B1 (en) | 2014-03-07 | 2020-10-07 | The Regents of the University of California | Devices for integrating analyte extraction, concentration and detection |
MX2017006287A (es) | 2014-11-27 | 2017-08-14 | Kimberly Clark Co | Dispositivos y metodos para detectar norovirus en superficies. |
CN104844710B (zh) * | 2015-04-13 | 2018-02-02 | 西北大学 | 定向固定化pega复合型树酯的制备方法及应用 |
WO2017041030A1 (en) | 2015-09-04 | 2017-03-09 | The Regents Of The University Of California | Methods and devices for analyte collection, extraction, concentration, and detection for clinical applications |
CN105368873A (zh) * | 2015-11-23 | 2016-03-02 | 艾军 | 一种表达施马伦贝格病毒重组n基因杆状病毒的制备、鉴定方法以及应用 |
EP3184119A1 (en) * | 2015-12-23 | 2017-06-28 | Themis Bioscience GmbH | Chromatography based purification strategies for measles scaffold based viruses |
CN105548540A (zh) * | 2015-12-29 | 2016-05-04 | 中国医学科学院医学生物学研究所 | 一种i-iv型登革热病毒的通用检测试剂盒 |
JP7012365B2 (ja) * | 2016-02-25 | 2022-03-04 | ザ トラスティーズ オブ ザ ユニバーシティ オブ ペンシルバニア | ジカウイルスに対する新規のワクチン |
EP3229024A1 (de) * | 2016-04-08 | 2017-10-11 | Viramed Biotech AG | Zika virus diagnostik |
KR102592388B1 (ko) | 2016-06-09 | 2023-10-20 | 더 리전트 오브 더 유니버시티 오브 캘리포니아 | 종이-기반 면역검정법에서 사용하기 위한 바이오마커 농축 및 신호 증폭, 그리고 dna의 추출, 농축 및 증폭을 위한 단일 플랫폼 |
WO2018039139A1 (en) * | 2016-08-22 | 2018-03-01 | The Regents Of The University Of California | Hydrogel platform for aqueous two-phase concentration of a target to enhance its detection |
US10012645B2 (en) * | 2016-08-24 | 2018-07-03 | The Florida International University Board Of Trustees | Rapid zika virus detection using nano-enabled electrochemical sensing system |
US12009078B2 (en) | 2016-10-17 | 2024-06-11 | Reliant Immune Diagnostics, Inc. | System and method for medical escalation and intervention that is a direct result of a remote diagnostic test |
US11693002B2 (en) | 2016-10-17 | 2023-07-04 | Reliant Immune Diagnostics, Inc. | System and method for variable function mobile application for providing medical test results using visual indicia to determine medical test function type |
US11802868B2 (en) | 2016-10-17 | 2023-10-31 | Reliant Immune Diagnostics, Inc. | System and method for variable function mobile application for providing medical test results |
US9857372B1 (en) | 2016-10-17 | 2018-01-02 | Reliant Immune Diagnostics, LLC | Arbovirus indicative birth defect risk test |
US11579145B2 (en) | 2016-10-17 | 2023-02-14 | Reliant Immune Diagnostics, Inc. | System and method for image analysis of medical test results |
US11651866B2 (en) * | 2016-10-17 | 2023-05-16 | Reliant Immune Diagnostics, Inc. | System and method for real-time insurance quote in response to a self-diagnostic test |
US11107585B2 (en) | 2016-10-17 | 2021-08-31 | Reliant Immune Diagnostics, Inc | System and method for a digital consumer medical wallet and storehouse |
US10902951B2 (en) | 2016-10-17 | 2021-01-26 | Reliant Immune Diagnostics, Inc. | System and method for machine learning application for providing medical test results using visual indicia |
EP3361256A1 (en) * | 2017-02-08 | 2018-08-15 | Fundación para la Investigación Médica Aplicada | In vitro method for the diagnosis of lung cancer |
CN108503697B (zh) * | 2017-02-27 | 2023-03-31 | 中国科学院上海巴斯德研究所 | 一种果蝇细胞表达的寨卡病毒亚单位疫苗 |
CN107102144A (zh) * | 2017-03-16 | 2017-08-29 | 深圳市梓健生物科技有限公司 | 快速检测寨卡病毒ns1蛋白的荧光定量免疫层析试纸条及其制作方法 |
WO2018183211A1 (en) | 2017-03-27 | 2018-10-04 | The Regents Of The University Of California | Semi-quantitative lateral-flow immunoassay for the detection of csf leaks |
CN107287347B (zh) * | 2017-05-09 | 2020-12-25 | 广州机场出入境检验检疫局综合技术服务中心 | 戊型肝炎病毒实时荧光逆转录pcr检测引物、探针、检测试剂盒和检测方法 |
RU2661085C1 (ru) * | 2017-06-01 | 2018-07-11 | Федеральное бюджетное учреждение науки "Государственный научный центр вирусологии и биотехнологии "Вектор" Федеральной службы по надзору в сфере защиты прав потребителей и благополучия человека (ФБУН ГНЦ ВБ "Вектор" Роспотребнадзора) | Рекомбинантные белки, содержащие антигенные эпитопы белков Core, Small Envelope, NS2A и preM вируса Зика, и комплексный антиген, содержащий указанные белки и используемый в качестве компонента иммуноферментной тест-системы для выявления антител классов G и M к вирусу Зика |
WO2019039557A1 (ja) * | 2017-08-24 | 2019-02-28 | 富士レビオ株式会社 | ジカウイルスを検出する方法及びキット |
WO2019055971A2 (en) * | 2017-09-18 | 2019-03-21 | Carrera Bioscience Inc. | MULTIPLEX ENTERIC MEASUREMENTS AND METHODS OF USE |
JP6939535B2 (ja) * | 2017-12-27 | 2021-09-22 | トヨタ自動車株式会社 | 車両用撮影装置及び加熱装置 |
KR102198342B1 (ko) * | 2019-05-22 | 2021-01-04 | 연세대학교 산학협력단 | 항체 선별 방법 및 이를 이용한 항체 선별 시스템 |
CN117843811A (zh) * | 2019-09-30 | 2024-04-09 | 吉利德科学公司 | Hbv疫苗和治疗hbv的方法 |
TW202200199A (zh) * | 2020-03-20 | 2022-01-01 | 美商百歐恩泰美國公司 | 冠狀病毒疫苗及使用方法 |
WO2021194540A1 (en) * | 2020-03-23 | 2021-09-30 | Baseline Viral Diagnostics, Inc. | Methods, systems, and a kit for detection, diagnosis, monitoring and treatment of covid-19 |
US20230168244A1 (en) * | 2020-04-28 | 2023-06-01 | Aviana Molecular Technologies, Llc | Compositions and surface acoustic wave based methods for identifying infectious disease |
CN116249902A (zh) * | 2020-05-07 | 2023-06-09 | 生物辐射实验室股份有限公司 | SARS-CoV-2免疫测定及其材料 |
WO2021236050A1 (en) | 2020-05-18 | 2021-11-25 | Baseline Global, Inc. | Assay device, system, method, and kit |
KR20230011318A (ko) * | 2020-05-19 | 2023-01-20 | 애디텍스트, 인코포레이티드 | 다중 면역글로불린 이소형에 대한 이중-멀티플렉스 분석 |
WO2021247398A1 (en) * | 2020-05-30 | 2021-12-09 | Pangolin Llc | Systems and methods to detect pathogens |
US20230173056A1 (en) * | 2020-07-02 | 2023-06-08 | The Regents Of The University Of California | Persistent memory t-cell responses to cancer and infectious-disease antigens by manipulation of amino acid-catabolism pathways |
US11740240B2 (en) * | 2020-07-20 | 2023-08-29 | Bio-Rad Laboratories, Inc. | Immunoassay for SARS-CoV-2 neutralizing antibodies and materials therefor |
US20220050105A1 (en) * | 2020-08-12 | 2022-02-17 | Boston Molecules, Inc. | Method and apparatus for detecting viruses in biological samples |
WO2022036337A1 (en) * | 2020-08-13 | 2022-02-17 | Diaclone Llc | Compositions and methods for recombinant polypeptide mimicking sars-cov-2 nucleocapsid protein (np) |
CN112760420B (zh) * | 2021-02-05 | 2023-05-26 | 中国科学院长春应用化学研究所 | 一种用于检测新冠病毒SARS-CoV-2的引物、探针和试剂盒 |
WO2022241256A1 (en) * | 2021-05-13 | 2022-11-17 | Serimmune Inc. | Serum antibody profiling for leptospirosis |
US20230176072A1 (en) * | 2021-12-02 | 2023-06-08 | Zymeron Corporation | Novel Immunoassay Platform for the Serological Discrimination of Closely Related Viruses |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002083937A2 (en) * | 2001-04-10 | 2002-10-24 | Ecole Polytechnique Federale De Lausanne | Methods using o6-alkylguanine-dna alkyltransferases |
US20060292651A1 (en) * | 2002-10-03 | 2006-12-28 | Alexandre Juillerat | Protein labelling with oº-alkylguanine-dna alkyltrnsferase |
Family Cites Families (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2480764B1 (fr) | 1980-04-18 | 1985-10-04 | Rhone Poulenc Spec Chim | Latex de polymeres magnetiques et procede de preparation |
NO155316C (no) | 1982-04-23 | 1987-03-11 | Sintef | Fremgangsmaate for fremstilling av magnetiske polymerpartikler. |
GB2125047B (en) | 1982-08-09 | 1986-02-19 | Ciba Geigy Ag | Yeast hybrid vectors and their use for the production of polypeptides |
EP0118551A1 (en) | 1982-09-15 | 1984-09-19 | Collaborative Research Inc. | Production of interferon in yeast by use of invertase promoter |
WO1987002670A1 (en) | 1985-10-25 | 1987-05-07 | Mackay Vivian L | Method of using bar1 for secreting foreign proteins |
FR2645160B1 (ko) | 1989-03-31 | 1992-10-02 | Rhone Poulenc Chimie | |
US5879926A (en) | 1989-03-31 | 1999-03-09 | Transgene S.A. | Yeast strains for the production of mature heterologous proteins, especially hirudin |
JP2979414B2 (ja) | 1989-09-29 | 1999-11-15 | 富士レビオ株式会社 | 磁性粒子およびそれを用いた免疫測定法 |
US5264618A (en) | 1990-04-19 | 1993-11-23 | Vical, Inc. | Cationic lipids for intracellular delivery of biologically active molecules |
GB9224888D0 (en) * | 1992-11-27 | 1993-01-13 | Univ Singapore | Monoclonal antibody |
DK82893D0 (da) | 1993-07-08 | 1993-07-08 | Novo Nordisk As | Peptid |
FR2714830B1 (fr) | 1994-01-10 | 1996-03-22 | Rhone Poulenc Rorer Sa | Composition contenant des acides nucléiques, préparation et utilisations. |
FR2715847B1 (fr) | 1994-02-08 | 1996-04-12 | Rhone Poulenc Rorer Sa | Composition contenant des acides nucléiques, préparation et utilisations. |
FR2727679B1 (fr) | 1994-12-05 | 1997-01-03 | Rhone Poulenc Rorer Sa | Nouveaux agents de transfection et leurs applications pharmaceutiques |
FR2730637B1 (fr) | 1995-02-17 | 1997-03-28 | Rhone Poulenc Rorer Sa | Composition pharmaceutique contenant des acides nucleiques, et ses utilisations |
US5736330A (en) | 1995-10-11 | 1998-04-07 | Luminex Corporation | Method and compositions for flow cytometric determination of DNA sequences |
US5981180A (en) | 1995-10-11 | 1999-11-09 | Luminex Corporation | Multiplexed analysis of clinical specimens apparatus and methods |
EP0852004B1 (en) | 1995-10-11 | 2011-01-19 | Luminex Corporation | Multiplexed analysis of clinical specimens |
WO1998010088A1 (en) | 1996-09-06 | 1998-03-12 | Trustees Of The University Of Pennsylvania | An inducible method for production of recombinant adeno-associated viruses utilizing t7 polymerase |
US6449562B1 (en) | 1996-10-10 | 2002-09-10 | Luminex Corporation | Multiplexed analysis of clinical specimens apparatus and method |
KR20010031140A (ko) | 1997-10-14 | 2001-04-16 | 루미넥스 코포레이션 | 정밀 형광염료 입자 및 그의 제조방법 그리고 그의 사용 |
DE69907630T2 (de) | 1998-01-22 | 2004-02-26 | Luminex Corp., Austin | Mikropartikel mit multiplen fluoreszenz-signalen |
FR2777909B1 (fr) | 1998-04-24 | 2002-08-02 | Pasteur Institut | Utilisation de sequences d'adn de structure triplex pour le tranfert de sequences de nucleotides dans des cellules, vecteurs recombinants contenant ces sequences triplex |
WO2001013119A1 (en) | 1999-08-17 | 2001-02-22 | Luminex Corporation | Encapsulation of fluorescent particles |
EP1204869B1 (en) | 1999-08-17 | 2008-10-22 | Luminex Corporation | Method for analyzing a number of samples from a variety of sources for a single analyte |
ES2447115T3 (es) | 1999-10-11 | 2014-03-11 | Institut Pasteur | Vectores para la preparación de composiciones inmunoterapéuticas |
US9709559B2 (en) * | 2000-06-21 | 2017-07-18 | Bioarray Solutions, Ltd. | Multianalyte molecular analysis using application-specific random particle arrays |
US6689615B1 (en) * | 2000-10-04 | 2004-02-10 | James Murto | Methods and devices for processing blood samples |
ES2329986T3 (es) * | 2001-09-06 | 2009-12-03 | Rapid Micro Biosystems Inc | Deteccion rapida de celulas en replicacion. |
US6682507B2 (en) | 2002-02-20 | 2004-01-27 | Doug's Kangaroo Pouch, Llc | User wearable device having sterile environment for connecting peritoneal dialysis tubes |
US7351547B2 (en) * | 2002-10-31 | 2008-04-01 | Health Research, Inc. | Diagnostic test for West Nile virus |
EP1501945A4 (en) * | 2002-04-30 | 2008-02-20 | Merck & Co Inc | MULTIPLEX ASSAY FOR HUMAN PAPILLOMA VIRUS |
AU2003271669A1 (en) | 2002-10-03 | 2004-04-23 | Ecole Polytechnique Federale De Lausanne (Epfl) | Substrates for O6 -alkylguanine-DNA alkyltransferase |
EP1552307A1 (en) | 2002-10-18 | 2005-07-13 | Rescom GmbH | Diagnosis of glaucoma by complex autoantibody repertoires in body fluids |
US8163479B2 (en) | 2004-03-02 | 2012-04-24 | Ecole Polytechnique Federale De Lausanne | Specific substrates for O6-alkylguanine-DNA alkyltransferase |
CA2495138C (en) * | 2005-01-20 | 2012-10-23 | Alison Jane Basile | Multiplexed analysis for determining a serodiagnosis of viral infection |
CA2604039C (en) * | 2005-04-05 | 2014-09-16 | Allergan, Inc. | Lipophilic dye-based fret assays for clostridial toxin activity |
EP2264458A1 (en) * | 2005-04-05 | 2010-12-22 | Allergan, Inc. | Clostridial toxin activity assays |
EP1874738B1 (en) | 2005-04-27 | 2016-06-29 | Covalys Biosciences AG | Pyrimidines reacting with o6-alkylguanine-dna alkyltransferase |
EP1882688A1 (en) * | 2006-07-25 | 2008-01-30 | EPFL Ecole Polytechnique Fédérale de Lausanne | Labelling of fusion proteins with synthetic probes |
WO2010107433A1 (en) | 2009-03-18 | 2010-09-23 | Prometheus Laboratories Inc. | Addressable antibody arrays and methods of use |
US8906831B2 (en) | 2008-03-31 | 2014-12-09 | Pacific Biosciences Of California, Inc. | Single molecule loading methods and compositions |
FR2936245B1 (fr) * | 2008-09-23 | 2012-07-06 | Cis Bio Int | Nouveaux substrats d'o6-alkylguanine-adn alkyltransferase et ses mutants. |
KR101340649B1 (ko) * | 2010-03-23 | 2014-01-03 | 다이아텍코리아 주식회사 | 융합 폴리펩타이드 hpv 항원을 이용한 hpv 항체 스크리닝 방법 |
CN105821078A (zh) | 2010-12-09 | 2016-08-03 | 巴斯德研究所 | 用于获得高产量重组蛋白表达的基于mgmt的方法 |
AU2012350229B2 (en) * | 2011-12-09 | 2018-03-22 | Institut Pasteur | Multiplex immuno screening assay |
-
2012
- 2012-12-10 AU AU2012350229A patent/AU2012350229B2/en active Active
- 2012-12-10 WO PCT/EP2012/074986 patent/WO2013083847A2/en active Application Filing
- 2012-12-10 EP EP12798308.8A patent/EP2788478B1/en active Active
- 2012-12-10 KR KR1020147018819A patent/KR102007061B1/ko active IP Right Grant
- 2012-12-10 MX MX2014006870A patent/MX349562B/es active IP Right Grant
- 2012-12-10 BR BR112014013745-5A patent/BR112014013745B1/pt active IP Right Grant
- 2012-12-10 NO NO12798308A patent/NO2788478T3/no unknown
- 2012-12-10 SG SG11201403010TA patent/SG11201403010TA/en unknown
- 2012-12-10 ES ES12798308.8T patent/ES2648899T3/es active Active
- 2012-12-10 DK DK12798308.8T patent/DK2788478T3/en active
- 2012-12-10 US US13/883,339 patent/US9638692B2/en active Active
- 2012-12-10 JP JP2014545306A patent/JP6215223B2/ja active Active
- 2012-12-10 CA CA2857998A patent/CA2857998C/en active Active
- 2012-12-10 CN CN201280069229.XA patent/CN104114697A/zh active Pending
-
2013
- 2013-05-03 SG SG11201407167RA patent/SG11201407167RA/en unknown
- 2013-05-03 MX MX2014013417A patent/MX357087B/es active IP Right Grant
- 2013-05-03 NZ NZ701380A patent/NZ701380A/en not_active IP Right Cessation
- 2013-05-03 EP EP13723051.2A patent/EP2844748B1/en active Active
- 2013-05-03 AU AU2013255744A patent/AU2013255744A1/en not_active Abandoned
- 2013-05-03 US US14/396,841 patent/US10119967B2/en active Active
- 2013-05-03 KR KR1020147031586A patent/KR102049623B1/ko active IP Right Grant
- 2013-05-03 JP JP2015509458A patent/JP6351571B2/ja active Active
- 2013-05-03 WO PCT/EP2013/059312 patent/WO2013164476A1/en active Application Filing
- 2013-05-03 BR BR112014027465-7A patent/BR112014027465B1/pt active IP Right Grant
- 2013-05-03 CN CN201380035238.1A patent/CN104704117B/zh active Active
- 2013-05-03 CA CA2872127A patent/CA2872127A1/en not_active Abandoned
-
2017
- 2017-04-06 US US15/480,451 patent/US10197562B2/en active Active
- 2017-07-19 US US15/654,272 patent/US10352930B2/en active Active
- 2017-07-19 US US15/653,949 patent/US10209248B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002083937A2 (en) * | 2001-04-10 | 2002-10-24 | Ecole Polytechnique Federale De Lausanne | Methods using o6-alkylguanine-dna alkyltransferases |
US20060292651A1 (en) * | 2002-10-03 | 2006-12-28 | Alexandre Juillerat | Protein labelling with oº-alkylguanine-dna alkyltrnsferase |
Non-Patent Citations (1)
Title |
---|
J. Am. Chem. Soc., vol. 125, pp. 7810-7811 (2003.07.02.) * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102049623B1 (ko) | 다중 면역 스크리닝 분석 | |
KR102606929B1 (ko) | 동족 항원과 t-세포 수용체 상호작용의 발견 및 특징규명을 위한 조작된 2-부분 세포 디바이스 | |
KR100886312B1 (ko) | 단백질-단백질의 상호작용을 분석하는 방법 | |
CN110656090B (zh) | 一种表达质粒、用于包装容量增加的二代腺病毒的细胞株及其应用 | |
DK2692865T3 (en) | Transponeringsmedieret identification of specific binding proteins, or functional | |
CN101208425A (zh) | 产生复制缺陷型腺病毒的细胞系 | |
CN110023500A (zh) | 作为选择标记的减毒谷氨酰胺合成酶 | |
KR102614328B1 (ko) | T-세포 수용체 합성 및 tcr-제시 세포에 대한 안정적인 게놈 통합을 위한 2-부분 디바이스 | |
AU2016378480A1 (en) | Endothelium-specific nucleic acid regulatory elements and methods and use thereof | |
KR102584628B1 (ko) | T-세포 수용체, t-세포 항원 및 이들의 기능성 상호작용의 식별 및 특징규명을 위한 조작된 다성분 시스템 | |
KR20210108423A (ko) | 아데노 관련 바이러스 (aav) 생산자 세포주 및 관련 방법 | |
JP2023025182A (ja) | T細胞レセプター及びt細胞抗原の同定及び特徴決定のための遺伝子操作された多成分システム | |
KR20230019063A (ko) | C9orf72 연관 질환의 치료를 위한 삼중 기능 아데노-연관 바이러스 (aav) 벡터 | |
KR20230056630A (ko) | 신규의 omni-59, 61, 67, 76, 79, 80, 81 및 82 crispr 뉴클레아제 | |
KR20220016485A (ko) | 미엘린 단백질 제로 프로모터를 갖는 aav 벡터, 및 샤르코-마리-투스 질환과 같은 슈반 세포-관련 질환을 치료하기 위한 이의 용도 | |
CN112877292A (zh) | 产生人抗体的细胞 | |
CN114134141B (zh) | 一种引入非天然氨基酸的嵌合体苯丙氨酸翻译***及其构建方法 | |
KR20240021906A (ko) | 발현 벡터, 박테리아 서열-무함유 벡터, 및 이를 제조하고 사용하는 방법 | |
KR20230054840A (ko) | rAAV 비리온의 유도 생산을 위한 안정화된 세포주 | |
CN116848237A (zh) | 病毒样颗粒及其生产方法 | |
CN114231513B (zh) | 一种可抑制蛋白酶体psmb5亚基活性的短肽及其在抗立克次体感染中的应用 | |
CN110777147A (zh) | 一种ikzf3基因沉默的t细胞及其应用 | |
CN112063655A (zh) | 一种端粒基因治疗产品和哺乳动物广泛性启动子的用途 | |
KR20240022571A (ko) | Rna-가이드된 이펙터 동원을 위한 시스템, 방법 및 성분 | |
CN114805537A (zh) | 一种表达犬白介素6的重组质粒、稳定表达犬白介素6蛋白的细胞株及其制备方法和应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right |