KR20200128703A - B형 간염 백신 및 이의 용도 - Google Patents
B형 간염 백신 및 이의 용도 Download PDFInfo
- Publication number
- KR20200128703A KR20200128703A KR1020207028021A KR20207028021A KR20200128703A KR 20200128703 A KR20200128703 A KR 20200128703A KR 1020207028021 A KR1020207028021 A KR 1020207028021A KR 20207028021 A KR20207028021 A KR 20207028021A KR 20200128703 A KR20200128703 A KR 20200128703A
- Authority
- KR
- South Korea
- Prior art keywords
- hbv
- domain
- sequence
- peptide
- adenovirus
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
- A61K39/29—Hepatitis virus
- A61K39/292—Serum hepatitis virus, hepatitis B virus, e.g. Australia antigen
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
- A61K48/0066—Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/20—Antivirals for DNA viruses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
- C07K14/01—DNA viruses
- C07K14/02—Hepadnaviridae, e.g. hepatitis B virus
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
- C12N15/861—Adenoviral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N7/00—Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/51—Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
- A61K2039/525—Virus
- A61K2039/5256—Virus expressing foreign proteins
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/57—Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2
- A61K2039/572—Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2 cytotoxic response
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/70—Multivalent vaccine
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/33—Fusion polypeptide fusions for targeting to specific cell types, e.g. tissue specific targeting, targeting of a bacterial subspecies
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/10011—Adenoviridae
- C12N2710/10311—Mastadenovirus, e.g. human or simian adenoviruses
- C12N2710/10341—Use of virus, viral particle or viral elements as a vector
- C12N2710/10343—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/20011—Papillomaviridae
- C12N2710/20022—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/20011—Papillomaviridae
- C12N2710/20031—Uses of virus other than therapeutic or vaccine, e.g. disinfectant
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/20011—Papillomaviridae
- C12N2710/20034—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2730/00—Reverse transcribing DNA viruses
- C12N2730/00011—Details
- C12N2730/10011—Hepadnaviridae
- C12N2730/10111—Orthohepadnavirus, e.g. hepatitis B virus
- C12N2730/10122—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2730/00—Reverse transcribing DNA viruses
- C12N2730/00011—Details
- C12N2730/10011—Hepadnaviridae
- C12N2730/10111—Orthohepadnavirus, e.g. hepatitis B virus
- C12N2730/10134—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/10011—Arenaviridae
- C12N2760/10111—Deltavirus, e.g. hepatitis delta virus
- C12N2760/10122—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Virology (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Pharmacology & Pharmacy (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Biophysics (AREA)
- Immunology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Epidemiology (AREA)
- Communicable Diseases (AREA)
- Mycology (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Oncology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
Abstract
가공된 B형 간염 바이러스(HBV) 분자 백신 작제물이 본원에 제공된다. 백신 작제물은 또한 숙주 세포 내에서 이종 유전자, 예를 들면, 사이토킨의 발현을 조절하기 위한 리간드-유도성의 가공된 유전자 스위치 시스템을 포함할 수 있다.
Description
서열 목록에 대한 참고
본 출원과 함께 출원된, 전자적으로 제출된 서열 목록(명칭: 2584_161PC01_SeqListing_ST25; 크기: 372,514 바이트(byte); 생성일: 2019년 3월 5일)의 내용은 이의 전문이 본원에 참고로 포함된다.
개시내용의 분야
본 개시내용은 생물정보학 및 단백질 가공(protein engineering)에서 진전된 원리를 사용하여 설계된 개선된, 광범위한 스펙트럼의 HBV 분자 백신에 관한 것이다.
만성 B형 간염은 다수의 바이러스(HepB 또는 HBV) 유전형을 포함하는 질환이다. HBV 유전형/서브유전형(subgenotype)은 임상 및 바이러스 특성, 예를 들면, 간 질환의 중증도 및 항바이러스 치료요법에 대한 반응에 있어서의 차이와 크게 관련되어 왔다. HBV에 의한 감염은 간경변, 간 부전 및 간세포 암종(HCC)을 야기할 수 있는 간염을 유발한다. HBV의 진단은 혈청학적 발견을 기준으로 한다. 만성 HBV 감염에 대한 치유법은 존재하지 않는다. 현재 이용가능한 치료 선택사항은 간경변 및 바이러스 복제의 진행을 늦추고, HCC 및 간부전의 발생을 감소시키는 것에 목표를 두고 있다.
본 개시내용은 생물정보학 및 단백질 가공에서 진전된 원리를 사용하여 설계된 개선된, 광범위한 스펙트럼의 HBV 분자 백신에 관한 것이다. 이러한 신규 HBV 백신은 HBV 관련 질환에 대한 치료학적 백신으로서 사용될 수 있다.
참고문헌의 포함
본 명세서에서 언급된 모든 공보, 특허, 및 특허원은 각각의 개개 공보, 특허, 또는 특허원이 참고에 의해 포함되도록 구체적으로 및 개별적으로 나타내는 것과 동일한 정도로 참고에 의해 본원에 포함된다.
개시내용의 요약
적어도 하나 이상의 면역 반응-유도성(immune response inducing) B형 간염 바이러스(HBV) 폴리펩타이드를 포함하는 폴리펩타이드를 암호화하는 비-천연적으로 발생하는(non-naturally occurring) 폴리뉴클레오타이드가 본원에 제공된다.
일부 구현예에서, 상기 비-천연적으로 발생하는 폴리뉴클레오타이드는 상기 하나 이상의 HBV 폴리펩타이드를 포함하는 폴리펩타이드를 암호화한다. 일부 구현예에서, 상기 하나 이상의 HBV 폴리펩타이드는 HBV 코어 펩타이드(Core peptide)를 포함한다. 일부 구현예에서, 상기 HBV 코어 펩타이드는 표 3에 나타낸 바와 같은 코어 펩타이드 서열 중 임의의 하나를 갖는다. 일부 구현예에서, 상기 하나 이상의 HBV 펩타이드는 HBV 표면 펩타이드(Surface peptide)를 포함한다. 일부 구현예에서, 상기 HBV 표면 펩타이드는 표 3에 나타낸 바와 같은 표면 펩타이드 서열 중 임의의 하나를 갖는다. 일부 구현예에서, 상기 하나 이상의 HBV 펩타이드는 HBV Pol 펩타이드를 포함한다. 일부 구현예에서, 상기 HBV Pol 펩타이드는 표 3에 나타낸 바와 같은 Pol 펩타이드 서열 중 임의의 하나를 갖는다. 일부 구현예에서, 상기 하나 이상의 HBV 펩타이드는 HBV HBSP/HBx 펩타이드를 포함한다. 일부 구현예에서, 상기 HBV HBSP/HBx 펩타이드는 표 3에 나타낸 바와 같은 HBSP/HBx 펩타이드 서열 중 임의의 하나를 갖는다. 일부 구현예에서, 상기 하나 이상의 HBV 펩타이드는 KK 링커를 포함한다. 일부 구현예에서, 상기 KK 링커는 표 3에 나타낸 바와 같은 펩타이드 서열 중 임의의 하나를 표 3에 나타낸 바와 같은 임의의 다른 펩타이드 서열에 연결시킨다.
이종 유전자 발현의 유도성 제어(inducible control)를 위한 유전자 스위치 시스템(gene switch system)을 암호화하는 하나 이상의 폴리뉴클레오타이드를 추가로 포함하는, 본원에 제공된 임의의 폴리뉴클레오타이드를 포함하는 폴리뉴클레오타이드가 본원에 제공되며, 여기서 이종 유전자 발현은 상기 유전자 스위치 시스템에 의해 조절되며, 상기 이종 유전자는 본원에 기술된 임의의 폴리뉴클레오타이드를 포함한다. 일부 구현예에서, 상기 유전자 스위치 시스템은 엑다이손 수용체(ecdysone receptor)-기반(EcR-based) 유전자 스위치 시스템이다. 일부 구현예에서, 상기 하나 이상의 HBV 폴리펩타이드는 백신에서 사용하기 위한 것이다.
본원에 제공된 임의의 폴리뉴클레오타이드를 포함하는 벡터(vector)가 본원에 제공된다. 일부 구현예에서, 상기 벡터는 아데노바이러스 벡터이다. 일부 구현예에서, 상기 아데노바이러스 벡터는 고릴라(gorilla) 아데노바이러스 벡터이다.
세포 내에서 이종 유전자의 발현을 조절하는 방법이 본원에 제공되며, 이러한 방법은 (i) 억제성(repressible) 또는 유도성 유전자 스위치, 및 (ii) 이종 면역 반응-유도성 유전자를 포함하는 하나 이상의 폴리뉴클레오타이드를 상기 세포 내로 도입시키는 단계로서, 상기 이종 면역 반응-유도성 유전자의 발현은 상기 유전자 스위치에 의해 조절되고, 상기 이종 면역 반응-유도성 유전자는 하나 이상의 HBV 폴리펩타이드 중 적어도 하나를 암호화하는 단계; 및 상기 세포를 상기 이종 면역 반응-유도성 유전자의 발현을 억제하거나 유도하기에 충분한 양의 화합물에 노출시키는 단계를 포함한다.
일부 구현예에서, 상기 표적 세포는 본원에 기술된 세포 내에서 이종 유전자의 발현을 조절하는 방법에서의 포유동물 세포이다. 일부 구현예에서, 상기 유전자 스위치는 엑다이손 수용체(EcR), 유비쿼터스 수용체(ubiquitous receptor), 오르판 수용체(orphan receptor) 1, NER-1, 스테로이드 호르몬 핵 수용체 1, 레티노이드 X 수용체 상호작용 단백질-15, 간 X 수용체 β, 스테로이드 호르몬 수용체 유사 단백질, 간 X 수용체, 간 X 수용체 α, 파르네소이드(farnesoid) X 수용체, 수용체 상호작용 단백질 14, 및 파메솔 수용체 중 적어도 하나로부터 유래된 리간드 결합 도메인을 포함한다.
임의의 본원에 기술된 폴리펩타이드 작제물을 암호화하는 폴리뉴클레오타이드가 본원에 제공된다. 또한 상기 폴리뉴클레오타이드를 포함하는 벡터가 본원에 제공된다. 일부 구현예에서, 상기 벡터는 아데노바이러스 벡터이다. 일부 구현예에서, 상기 아데노바이러스 벡터는 고릴라(gorilla) 아데노바이러스 벡터이다.
벡터가 본원에 제공되며, 상기 벡터는 적어도 하나의 HBV 펩타이드를 암호화하는 폴리뉴클레오타이드를 포함하고, 상기 벡터는 아데노바이러스 벡터이다.
벡터가 본원에 제공되며, 상기 벡터는 적어도 하나의 HBV 펩타이드를 암호화하는 폴리뉴클레오타이드를 포함하고, 상기 벡터는 아데노바이러스 벡터이고, 상기 아데노바이러스 벡터는 고릴라 아데노바이러스 벡터이다.
폴리펩타이드 작제물이 본원에 제공되며, 상기 폴리펩타이드 작제물은 HBV HBx 도메인 및, HBV Pol 도메인, HBV 코어 도메인, HBV 프레-코어(pre-Core) 도메인 또는 HBV 표면 도메인 중 적어도 하나를 포함한다. 또한 폴리펩타이드 작제물이 본원에 제공되며, 상기 폴리펩타이드 작제물은 프레-코어 도메인 및, HBV Pol 도메인, HBV HBx 도메인 또는 HBV 표면 도메인 중 적어도 하나를 포함한다. 일부 구현예에서, 상기 HBV HBx 도메인은 서열 번호: 98에 나타낸 바와 같은 서열을 갖는다. 일부 구현예에서, 상기 HBV Pol 도메인은 야생형 HBV Pol 도메인과 비교하여 적어도 하나의 아미노산의 결실을 포함한다. 일부 구현예에서, 상기 결실은 상기 야생형 HBV Pol 도메인의 결실된 부위를 포함하고, 상기 결실된 부위는 538 내지 544번 아미노산 또는 710 내지 742번 아미노산 중 적어도 하나를 포함한다. 일부 구현예에서, 상기 결실된 부위는 538 내지 544번 아미노산 및 710 내지 742번 아미노산 둘 다를 포함한다. 일부 구현예에서, 상기 HBV Pol 도메인은 서열 번호: 99에 나타낸 바와 같은 서열을 갖는다. 일부 구현예에서, 상기 HBV 표면 도메인은 PreS1 도메인, PreS2 도메인 및 S 도메인 중 적어도 하나를 포함한다. 일부 구현예에서, 상기 HBV 표면 도메인은 HBV S 도메인을 포함한다. 일부 구현예에서, 상기 표면 도메인은 서열 번호: 100에 나타낸 바와 같은 서열을 갖는다. 일부 구현예에서, 상기 폴리펩타이드 작제물은 HBV 코어 도메인을 추가로 포함한다. 일부 구현예에서, 상기 폴리펩타이드 작제물은 코어 부위를 포함하고, 상기 코어 부위는 상기 HBV 코어 도메인 및 상기 HBV 프레-코어 도메인을 포함한다. 일부 구현예에서, 상기 코어 부위는 서열 번호: 101에 나타낸 바와 같은 서열을 갖는다. 일부 구현예에서, 상기 폴리펩타이드 작제물은 각각의 SHB(Env), HBeAg, HBx, 및 Pol 도메인을 포함한다. 일부 구현예에서, 상기 폴리펩타이드 작제물은 N-말단으로부터 C-말단까지 상기 SHB(Env), HBeAg, HBx, 및 Pol 도메인의 구조를 포함한다. 일부 구현예에서, 상기 SHB(Env) 도메인은 서열 번호: 102에 나타낸 바와 같은 서열을 갖는다. 일부 구현예에서, 상기 HBeAg 도메인은 서열 번호: 103에 나타낸 바와 같은 서열을 갖는다. 일부 구현예에서, 상기 HBx 도메인은 서열 번호: 104에 나타낸 바와 같은 서열을 갖는다. 일부 구현예에서, 상기 Pol 도메인은 서열 번호: 105에 나타낸 바와 같은 서열을 갖는다. 일부 구현예에서, 상기 폴리펩타이드 작제물은 서열 번호: 106에 나타낸 바와 같은 서열을 갖는다.
폴리펩타이드 작제물이 본원에 제공되며, 상기 폴리펩타이드 작제물은 하나 이상의 HBV HBx 링커 및, 코어 도메인, 표면 도메인 및 Pol 도메인 중 적어도 하나를 포함하고, 상기 코어 도메인, 상기 표면 도메인 및 상기 Pol 도메인 중 하나는 상기 코어 도메인, 상기 표면 도메인 및 상기 Pol 도메인 중 다른 것에 상기 하나 이상의 HBx 링커에 의해 연결된다. 일부 구현예에서, 상기 표면 도메인은 HBV PreS1 도메인, HBV PreS2 도메인 및 HBV S 도메인 중 적어도 하나를 포함한다. 일부 구현예에서, 상기 하나 이상의 HBV HBx 링커는 다중 HBV HBx 링커를 포함한다. 일부 구현예에서, 상기 다중 HBV HBx 링커 중 적어도 2개는 아미노산 서열에 있어서 상이하다. 일부 구현예에서, 상기 HBV HBx 링커는 표 3의 HBx-1, HBx-2, HBx-3, HBx-4, HBx-5 또는 HBx-6 중 어느 하나에 나타낸 바와 같은 서열을 갖는다. 일부 구현예에서, 상기 코어 도메인은 상기 표면 도메인에 인접해 있다. 일부 구현예에서, 상기 표면 도메인은 PreS1 도메인을 포함한다. 일부 구현예에서, 상기 표면 도메인은 상기 코어 도메인에 상기 하나 이상의 HBx 링커에 의해 연결되어 있다. 일부 구현예에서, 상기 Pol 도메인은 표면 도메인에 인접해 있다. 일부 구현예에서, 상기 표면 도메인은 PreS1 도메인, PreS2 도메인 및 S 도메인 중 적어도 하나를 포함한다. 일부 구현예에서, 상기 표면 도메인은 상기 PreS1 도메인을 포함하고, 상기 Pol 도메인의 N-말단 부위는 상기 PreS1 도메인에 인접해 있다. 일부 구현예에서, 상기 Pol 도메인의 상기 N-말단 부위는 상기 PreS1 도메인에 상기 하나 이상의 HBx 링커 중 하나에 의해 연결되어 있다. 일부 구현예에서, 상기 표면 도메인은 상기 PreS2 도메인을 포함하고, 상기 Pol 도메인의 N-말단 부위는 상기 PreS2 도메인에 인접해 있다. 일부 구현예에서, 상기 Pol 도메인의 N-말단 부위는 상기 PreS2 도메인에 상기 하나 이상의 HBx 링커 중 하나에 의해 연결되어 있다. 일부 구현예에서, 상기 표면 도메인은 상기 PreS2 도메인을 포함하고, 상기 Pol 도메인의 C-말단 부위는 상기 PreS2 도메인에 인접해 있다. 일부 구현예에서, 상기 Pol 도메인의 상기 C-말단 도메인은 상기 PreS2 도메인에 상기 하나 이상의 HBx 링커 중 하나에 의해 연결되어 있다. 일부 구현예에서, 상기 표면 도메인은 상기 S 도메인을 포함하고, 상기 Pol 도메인의 C-말단 부위는 상기 S 도메인에 인접되어 있다. 일부 구현예에서, 상기 Pol 도메인의 상기 C-말단 부위는 상기 S 도메인에 상기 하나 이상의 HBx 링커 중 하나에 의해 연결되어 있다. 일부 구현예에서, 상기 폴리펩타이드 작제물은 서열 번호: 107에 나타낸 바와 같은 서열을 갖는다.
안키린-유사 반복체 도메인(ankyrin-like repeat domain) 도메인 및 하나 이상의 HBV 펩타이드를 포함하는 폴리펩타이드 작제물이 본원에 제공된다. 일부 구현예에서, 상기 안키린-유사 반복체 단백질(ankyrin-like repeat protein)은 사람 안키린-유사 반복체 단백질이다. 일부 구현예에서, 상기 하나 이상의 HBV 펩타이드는 표 3의 아미노산 서열 중 어느 하나에 나타낸 바와 같은 서열을 갖는다. 일부 구현예에서, 상기 하나 이상의 HBV 펩타이드는 코어 펩타이드, 표면 펩타이드, Pol 펩타이드 및 HBSP/HBx 펩타이드 중 하나 이상을 포함한다. 일부 구현예에서, 상기 하나 이상의 HBV 펩타이드는 코어 펩타이드를 포함하고, 상기 코어 펩타이드는 표 3의 코어 아미노산 서열 중 어느 하나에 나타낸 바와 같은 서열을 갖는다. 일부 구현예에서, 상기 하나 이상의 HBV 펩타이드는 표면 펩타이드를 포함하고, 상기 표면 펩타이드는 표 3의 표면 아미노산 서열 중 어느 하나에 나타낸 바와 같은 서열을 갖는다. 일부 구현예에서, 상기 하나 이상의 HBV 펩타이드는 Pol 펩타이드를 포함하고, 상기 Pol 펩타이드는 표 3의 Pol 아미노산 서열 중 어느 하나에 나타낸 바와 같은 서열을 갖는다. 일부 구현예에서, 상기 하나 이상의 HBV 펩타이드는 HBSP/HBx 펩타이드를 포함하고, 상기 HBSP/HBx 펩타이드는 표 3의 HBSP/HBx 아미노산 서열 중 어느 하나에 나타낸 바와 같은 서열을 갖는다. 일부 구현예에서, 상기 폴리펩타이드 작제물은 서열 번호: 108에 나타낸 바와 같은 서열을 갖는다.
폴리펩타이드 작제물이 본원에 제공되며, 상기 폴리펩타이드 작제물은 표 3에 나타낸 바와 같은 적어도 2개의 HBV 아미노산 서열을 포함하고, 상기 적어도 2개의 HBV 아미노산 서열은 펩타이드 링커에 의해 연결되며, 상기 펩타이드 링커는 KK 링커이다. 일부 구현예에서, 상기는 적어도 2개의 HBV 아미노산 서열을 포함하고, 표 3에 나타낸 바와 같은 코어 펩타이드, 표면 펩타이드, Pol 펩타이드 및 HBSP/HBx 펩타이드 중 적어도 하나를 포함한다. 일부 구현예에서, 상기 적어도 2개의 HBV 아미노산 서열은 표 3에 나타낸 바와 같은 각각의 아미노산 서열을 포함한다. 일부 구현예에서, 상기 각각의 아미노산 서열은 상기 각각의 아미노산 서열 중 다른 것에 상기 KK 링커에 의해 연결되어 있다. 일부 구현예에서, 상기 폴리펩타이드 작제물은 서열 번호: 109에 나타낸 바와 같은 서열을 갖는다. 일부 구현예에서, 임의의 본원에 기술된 폴리펩타이드 작제물은 백신에서 사용하기 위한 것이다. 또한 임의의 본원에 기술된 폴리펩타이드 작제물을 암호화하는 폴리뉴클레오타이드가 본원에 제공된다. 또한 상기 폴리뉴클레오타이드를 포함하는 벡터가 본원에 제공된다. 일부 구현예에서, 상기 벡터는 아데노바이러스 벡터이다. 일부 구현예에서, 상기 아데노바이러스 벡터는 고릴라 아데노바이러스 벡터이다.
본 개시내용의 특징은 특히 첨부된 청구범위에 제공된다. 본 개시내용의 특징 및 이점의 보다 나은 이해는 예시적인 구현예를 제공하는 다음의 상세한 설명을 참고로 수득될 것이며, 여기서 본 개시내용의 원리가 활용되며, 이중 첨부되는 도면은 다음과 같다:
도 1은 만성 HBV 감염의 개략도이다.
도 2는 만성 HBV 감염의 병력(history)을 나타내는 개략도이다.
도 3a는 B형 간염 바이러스의 개략적인 개요이다. HBV DNA는 3.2kb의 환형의, 엔벨로프된(enveloped), 부분적으로 이중 가닥인 DNA 게놈이다. HBV는 4개의 유전자(S, C, P, 및 X)를 갖는다. S 유전자는 작은 표면 단백질(S), 중간 표면 단백질(S + PreS2), 및 큰 표면 단백질(S + PreS2 + PreS1)로 이루어진 엔벨로프(지질 이층) 표면 단백질(HBsAg)을 암호화한다. C 유전자는 캡시드 또는 코어 단백질을 암호화한다. C 유전자는 프레코어(precore) 및 코어 영역을 갖는다. 해독이 프레코어 영역에서 개시되는 경우, 단백질은 HBeAg이다. 해독이 코어 영역에서 개시되는 경우, 단백질은 HBcAg이다. P 유전자는 DNA 폴리머라제(Pol)를 암호화한다. X 유전자는 x 단백질(HBxAg)을 암호화한다. 도 3b는 B형 간염 바이러스 게놈의 개관이다. HBV 게놈은 TP, SP, RT 및 RH를 포함하는 Pol(832 아미노산); PreS1(108 아미노산); PreS2(55 아미노산); S(226 아미노산); PreC(29 아미노산); C(183 아미노산); 및 HBx(154 아미노산)를 포함한다. 도 3c는 수개의 오버랩핑 바이러스 단백질, 예를 들면, 폴리머라제 코어, 코어 엔벨로프(core envelop)(Pre-S1, S2, S), HBe, 및 HBx 단백질을 암호화하는 HBV 게놈의 개략도를 나타낸다. 도 3d는 수개의 오버래핑 바이러스 단백질, 예를 들면, 폴리머라제 코어, 코어 엔벨로프(Pre-S1, S2, S), HBe, 및 HBx 단백질을 암호화하는 HBV 게놈의 개략도를 나타낸다.
도 4는 HBV 감염 메카니즘의 개략적인 개요이다.
도 5는 HBV 백신 항원을 설계하기 위해 시행된 개략적인 전체 작업흐름도이다.
도 6은 HBV 설계 1 내지 5의 개략적인 구조적 도해를 나타낸다. HBV 설계 1 및 2는 클레드(clade) D 컨센수스(consensus)를 기반으로 설계되었다. HBV 설계 3의 경우, 사람 안키린-유사 반복체(ALR) 단백질 스캐폴드(scaffold)(PDB 코드 1QYM) 펩타이드는 나선 및 루프 영역에서 탄뎀(tandem) 방식으로 이식되었다. 절단가능한 링커(VSQTSKLTR)에 의해 연결된, 2개의 ALR 스캐폴드가 사용되었다. HBV 설계 4 에피토프(epitope)는 KK 링커에 의해 분리되었다. 상이한 링커를 HBV 설계 5에 사용하여 펩타이드를 연결시켰다.
도 7은 NK 세포 및 T 세포를 활성화시킴으로써 면역 반응을 촉진하는 IL-12의 개관을 나타낸다.
도 8은 다양한 IL-12 리간드-유도성 유전자 스위치 벡터 시스템의 다양한 구조적 구성성분을 나타낸다.
도 9a는 HBe에 대한 NetMHC4.0 항원성 예측을 나타낸다. 예측된 강한 및 약한 결합 펩타이드는 펩타이드 위치에 대해 플레이팅(plating)되었다. 도 9b는 HBe에 대한 NetMHC4.0 항원성 예측을 나타낸다. 제1 및 제2 차수 미분(differential)을 밀도 플롯 상에 사용하여 피크를 확인하였다. 도 9c는 HBV 서브형(subtype)에 걸쳐 포함도(coverage)를 측정하기 위하여 컨센수스 서열에 대해 정렬된 아미노산 서열을 나타낸다.
도 10은 상이한 HBV 단백질의 융합된 도메인을 강조하는 TG1050 및 HBV 설계 1의 개략적인 표시이다.
도 11은 HBx 펩타이드로 연결된 모든 3개의 주요 단백질(코어, 표면 스플라이스 변이체, 및 폴리머라제)로 이루어진 HBV 설계 2의 개략적인 표시이다.
도 12a는 코어 HBV 단백질 도메인의 구조를 나타낸다. 도 12b는 HBV preS1 및 S2 펩타이드의 구조를 나타낸다. 도 12c는 HBV HBx의 구조를 나타낸다. 도 12d는 4개의 코어 펩타이드-MHC 복합체의 구조를 나타낸다.
도 13은 멀티-에피토프(multi-epitope) 항원을 기반으로 한 HBV 설계 4의 상동성 모델을 나타낸다.
도 14는 RNA qPCR 상대적인 발현 검정에 대해 생성된 짧은 및 긴 프라이머 및 프로브 세트를 나타내는 개략적인 도해이다. 구체적인 프라이머가 각각의 HBV 항원 설계를 위해 설계되었다.
도 15a는 HBV 설계 1 및 TG1050 대조군의 코어 서열 비교를 나타낸다. 도 15b는 HBV 설계 1 및 TG1050 대조군의 서열 비교를 나타낸다. 도 15c는 HBV 설계 1 및 TG1050 대조군의 서열 비교를 나타낸다.
도 16은 HBV 설계 5의 개략적인 표시이다.
개시내용의 상세한 설명
다음의 설명 및 실시예는 본 개시내용의 구현예를 상세히 설명한다.
본 개시내용은 본원에 기술된 특수한 구현예에 한정되지 않으며 자체로서 변할 수 있음이 이해되어야 한다. 당해 분야의 기술자는 본 개시내용의 변화 및 변형이 존재함을 인식할 것이며, 이는 이의 영역 내에 포함된다.
모든 용어는 이들이 당해 분야의 기술자에게 이해될 수 있으므로 이해되는 것으로 의도된다. 달리 정의하지 않는 한, 본원에 사용된 모든 기술적 및 과학적 용어는 본 개시내용이 속한 분야의 통상의 기술자가 일반적으로 이해하는 바와 동일한 의미를 갖는다.
본원에 사용된 단락 제목은 단지 구조화 목적을 위한 것이며 기술된 주제를 제한하는 것으로 해석되지 않아야 한다.
본 개시내용의 다양한 특징은 단일 구현예의 맥락에서 기술될 수 있지만, 특징은 또한 별도로 또는 임의의 적합한 조합으로 제공될 수 있다. 역으로, 본 개시내용이 명확성을 위해 별도의 구현예의 맥락에서 본원에 기술될 수 있지만, 본 개시내용은 또한 단일 구현예로 시행될 수 있다.
다음의 정의는 당해 분야의 것을 보충하며 현재의 출원에 관한 것이며 임의의 관련되거나 관련되지 않은, 예컨대, 임의의 일반적으로 소유된 특허 또는 특허원에 귀속되지 않아야 한다. 본원에 기술된 것과 유사하거나 등가인 임의의 방법 및 물질을 본 개시내용의 시험을 위한 실시에 사용할 수 있지만, 바람직한 물질 및 방법이 본원에 기술되어 있다. 따라서, 본원에서 사용된 전문 용어는 특수한 구현예 만을 기술하는 목적을 위한 것이며, 제한하는 것으로 의도되지 않는다.
정의
본 출원에서, 단수의 사용은 구체적으로 달리 기술하지 않는 한 복수를 포함한다. 명세서에서 사용된 바와 같이, 단수 형 하나("a", "an") 및 그("the")는 문맥이 달리 명확하게 구술하지 않는 한 복수 참고를 포함한다.
본 출원에서, "또는"의 사용은 달리 기술하지 않는 한 "및/또는"을 의미한다. 본원에 사용된 바와 같은 용어 "및/또는" 및 "이의 임의의 조합" 및 이의 문법적 등가물은 상호교환적으로 사용될 수 있다. 이러한 용어는 임의의 조합이 구체적으로 고려됨을 전달할 수 있다. 단지 설명적 목적을 위해, 다음의 어구 "A, B, 및/또는 C" 또는 "A, B, C, 또는 이의 임의의 조합"은 "개별적으로 A; 개별적으로 B; 개별적으로 C; A 및 B; B 및 C; A 및 C; 및 A, B, 및 C"를 의미한다. 용어 "또는"은 문맥이 구체적으로 분리성 용도를 지칭하지 않는 한, 결합하여 또는 분리하여 사용될 수 있다.
또한, "포함하는(including)" 뿐만 아니라 다른 형태, 예를 들어, "포함하다(include, includes, 및 included)"는 제한되지 않는다.
명세서에서 "일부 구현예", "구현예", "일 구현예" 또는 "다른 구현예"에 대한 참고는 구현예와 관련하여 기술된 특수한 특징, 구조, 또는 특성이 적어도 일부 구현예에 포함되지만 필수적으로 본 개시내용의 모든 구현예에 포함되지는 않는다는 것을 의미한다.
본 명세서 및 청구범위(들)에서 사용된 바와 같은, 단어 "포함하는(comprising)"(및 "포함하다(comprise 및 comprises)"와 같은 '포함하는'의 임의l 형태), "갖는(having)"(및 "갖다(have 및 has)"와 같은 '갖는'의 임의의 형태), "포함하는"(및 "포함하다(includes 및 include)"와 같은 '포함하는'의 임의의 형태) 또는 "함유하는"(및 "함유하다(contains 및 contain)"와 같은 '함유하는'의 임의의 형태)는 포괄적이거나 비제한적(open-ended)이며 추가의, 인용되지 않은 성분 또는 방법 단계를 배제하지 않는다. 본 명세서에서 논의된 임의의 구현예는 본 개시내용의 임의의 방법 또는 조성물과 관련하여 시행될 수 있고, 그 역으로도 가능함이 고려된다. 또한, 본 개시내용의 조성물을 사용하여 본 개시내용의 방법을 달성할 수 있다.
본원에 사용된 바와 같은 참고 수치 및 이의 문법적 등가물과 관련하여 용어 "약"은 수치 자체 및 이러한 수치로부터 플러스 또는 마이너스 10%의 범위를 포함할 수 있다.
용어 "약" 또는 "대략"은 당해 분야의 통상의 기술자에 의해 측정된 특수한 값에 대해 허용되는 오차 범위 이내를 의미하며, 이는 이러한 값이 측정되거나 결정되는 방법의 일부, 즉, 측정 시스템의 한계에 의존할 것이다. 예를 들면, "약"은 당해 분야에서 실시 당, 1 또는 1 이상의 표준 편차 이내를 의미할 수 있다. 대안적으로, "약"은 주어진 값의 20% 이하, 10% 이하, 5% 이하, 또는 1% 이하의 범위를 의미할 수 있다. 다른 예에서, 양 "약 10"은 10 및 9 내지 11로부터의 임의의 양을 포함한다. 여전히 다른 실시예에서, 참고 수치와 관련하여 용어 "약"은 또한 이러한 값으로부터 플러스 또는 마이너스 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 또는 1%의 범위를 포함할 수 있다. 대안적으로, 생물학적 시스템 또는 공정과 관련하여, 용어 "약"은 값의 자릿수 이내, 바람직하게는 값의 5배, 및 보다 바람직하게는 2배 이내를 의미할 수 있다. 특수한 값이 본 출원 및 청구범위에 기술되어 있지만, 달리 기술하지 않는 한, 특수한 값에 대해 허용되는 오차 범위 이내를 의미하는 용어 "약"이 추정되어야 한다.
본원에 사용된 바와 같은 용어 "단리된" 및 이의 문법적 등가물은 이의 천연 환경으로부터 핵산의 제거를 지칭한다. 본원에 사용된 바와 같은 용어 "정제된" 및 이의 문법적 등가물은 천연(게놈성 DNA 및 mRNA 포함)으로부터 제거되거나 합성(cDNA 포함)되고/되거나 실험실 조건 하에서 증폭된 것에 상관없이, 순도가 증가된 분자 또는 조성물을 지칭하며, 여기서 "순도"는 "절대 순도"가 아닌 상대적인 용어이다. 그러나, 핵산 및 단백질은 희석제 또는 보조제(adjuvant)와 함께 제형화될 수 있고 실질적인 목적을 위해 여전히 분리되어야 함이 이해되어야 한다. 예를 들면, 핵산은 전형적으로 세포 내로 도입하기 위해 사용된 경우 허용되는 담체 또는 희석제와 혼합된다. 본원에 사용된 바와 같은 용어 "실질적으로 정제된" 및 이의 문법적 등가물은 필수적으로 유리된, 즉, 폴리뉴클레오타이드, 단백질, 폴리펩타이드 및 핵산, 폴리펩타이드, 단백질 또는 다른 화합물이 천연적으로 관련되어 있는 다른 분자 중 약 50% 유리되고, 약 70% 이상 유리되며, 약 90% 이상 유리된 다른 화합물을 지칭한다.
본원에 사용된 바와 같은 "폴리뉴클레오타이드", "올리고뉴클레오타이드", "폴리뉴클레오타이드 작제물", "유전자", "유전자 작제물", "이종 유전자" 및 이의 문법적 등가물은 리보뉴클레오타이드 또는 데옥시리보뉴클레오타이드인, 임의의 길이의 뉴클레오타이드 또는 핵산의 중합체 형태를 지칭한다. 이러한 용어는 분자의 1차 구조 만을 지칭한다. 따라서, 이러한 용어는 이중 가닥 및 단일 가닥 DNA, 트리플렉스(triplex) DNA 뿐만 아니라 이중 및 단일 가닥 RNA를 포함한다. 이는 또한 예를 들면, 메틸화에 의해 및/또는 캡핑(capping)에 의해 변형된, 및 변형되지 않은 형태의 폴리뉴클레오타이드를 또한 포함한다. 용어는 또한 비-천연적으로 발생한 또는 합성 뉴클레오타이드 뿐만 아니라 뉴클레오타이드 유사체를 포함하는 분자를 포함함을 의미한다. 본원에 개시되거나 고려된 핵산 서열 및 벡터는 예를 들면, 형질감염, 형질전환, 또는 형질도입에 의해 세포 내로 도입될 수 있다.
본원에 사용된 바와 바와 같은 "형질감염", "형질전환" 또는 "형질도입"은 물리적 또는 화학적 방법을 사용한 숙주 세포 내로의 하나 이상의 외인성 폴리뉴클레오타이드의 도입을 지칭한다. 많은 형질감염 기술이 당해 분야에 공지되어 있고 예를 들면, 인산칼슘 DNA 공-침전(참고: 예컨대, Murray E. J. (ed.), Methods in Molecular Biology, Vol. 7, Gene Transfer and Expression Protocols, Humana Press (1991)); DEAE-덱스트란; 전기천공(electroporation); 양이온성 리포좀-매개된 형질감염; 텅스텐 입자-촉진된 미세입자 충격(cationic liposome-mediated transfection; tungsten particle-facilitated microparticle bombardment)(Johnston, Nature, 346: 776-777 (1990)); 및 인산스트론튬 DNA 공-침전(Brash et al., Mol. Cell Biol., 7: 2031-2034 (1987))을 포함한다. 파아지 또는 바이러스 벡터는 적합한 패키징 세포(packaging cell) 내에서 감염성 입자의 성장 후, 숙주 세포 내로 도입시킬 수 있으며, 이들 중 많은 것이 상업적으로 이용가능하다.
본원에 사용된 바와 같은 "폴리펩타이드", "펩타이드", "폴리펩타이드 작제물" 및 "펩타이드 작제물" 및 이들의 문법적 등가물은 아미노산 잔기의 중합체를 지칭한다. "성숙한 단백질"은 전체 길이의 단백질이고, 이는 임의로, 주어진 세포 환경에서 단백질에 대해 대표적인 글리코실화 또는 다른 변형을 포함한다. 본원에 개시된 폴리펩타이드 및 단백질(이의 기능성 부위 및 기능성 변이체 포함)은 하나 이상의 천연적으로 발생하는 아미노산 대신에 합성 아미노산을 포함할 수 있다. 이러한 합성 아미노산은 당해 분야에 공지되어 있으며, 예를 들면, 아미노사이클로헥산 카복실산, 노르루이신, α-아미노 n-데카노산, 호모세린, S-아세틸아미노메틸-시스테인, 트랜스-3- 및 트랜스-4-하이드록시프롤린, 4-아미노페닐알라닌, 4-니트로페닐알라닌, 4-클로로페닐알라닌, 4-카복시페닐알라닌, β-페닐세린 β-하이드록시페닐알라닌, 페닐글리신, α-나프틸알라닌, 사이클로헥실알라닌, 사이클로헥실글리신, 인돌린-2-카복실산, 1,2,3,4-테트라하이드로이소퀴놀린-3-카복실산, 아미노말론산, 아미노말론산 모노아미드, N'-벤질-N'-메틸-라이신, N',N'-디벤질-라이신, 6-하이드록시라이신, 오르니틴, α-아미노사이클로펜탄 카복실산, α-아미노사이클로헥산 카복실산, α-아미노사이클로헵탄 카복실산, α-(2-아미노-2-노르보르난)-카복실산, α,γ-디아미노부티르산, α,β-디아미노프로피온산, 호모페닐알라닌, 및 α-3급-부틸글리신을 포함한다. 본 개시내용은 또한 가공된 세포 내에서 본원에 기술된 폴리펩타이드의 발현이 폴리펩타이드 작제물의 하나 이상의 아미노산의 해독 후 변형과 관련될 수 있음을 고려한다. 해독 후 변형의 비-제한적 예는 포스포릴화, 아실화, 에를 들면, 아세틸화 및 포르밀화, 글리코실화(N-연결된 및 O-연결된 것을 포함함), 아미드화, 하이드록실화, 알킬화, 예를 들면, 메틸화 및 에틸화, 유비퀴틸화, 피롤리돈 카복실산의 첨가, 이황화물 브릿지(disulfide bridge)의 형성, 황화(sulfation), 미리스토일화, 팔미토일화, 이소프레닐화, 파르네실화, 게라닐화, 당화(glypiation), 리포일화(lipoylation) 및 요오드화를 포함한다.
핵산 및/또는 핵산 서열은 이들이 일반적인 조상 핵산(ancestral nucleic acid) 또는 핵산 서열로부터 천연적으로 또는 인공적으로 기원하는 경우 "상동성"이다. 단백질 및/또는 단백질 서열은 이의 암호화 DNA가 일반적인 조상 핵산 또는 핵산 서열로부터 천연적으로 또는 인공적으로 유래하는 경우 "상동성"이다. 상동성 분자는 동족체로 명명될 수 있다. 예를 들면, 본원에 기술된 바와 같은, 임의의 천연적으로 발생하는 단백질은 임의의 이용가능한 돌연변이유발 방법으로 변형시킬 수 있다. 발현시키는 경우, 이러한 돌연변이유발된 핵산은 원래의 핵산에 의해 암호화된 단백질에 대해 상동성인 폴리펩타이드를 암호화한다. 상동성은 일반적으로 2개 이상의 핵산 또는 단백질(또는 이의 서열) 사이의 서열 동일성(sequence identity)으로부터 부여된다. 상동성을 확립하는데 유용한 서열 사이의 정밀한 동일성 퍼센트는 쟁점인 핵산 및 단백질과 함께 변하지만, 상동성을 확립하기 위해 25% 정도로 낮은 서열 동일성이 통상적으로 사용된다. 보다 높은 수준의 서열 동일성, 예컨대, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95% 또는 99% 이상을 또한 사용하여 상동성을 확립할 수 있다. 서열 동일성 퍼센트를 측정하는 방법(예컨대, 디폴트 매개변수(default parameter)를 사용한 BLASTP 및 BLASTN)가 본원에 기술되어 있으며 일반적으로 이용가능하다.
본원에 사용된 바와 같은 용어 "동일한" 및 이의 문법적 등가물 또는 폴리펩타이드의 2개의 핵산 서열 또는 아미노산 서열의 맥락에서 "서열 동일성"은 규정된 비교 윈도우(comparison window)에 걸쳐 최대 상응성에 대해 정렬한 경우 동일한 2개 서열 내 잔기를 지칭한다. 본원에 사용된 바와 같은 "비교 윈도우"는 적어도 약 20개, 일반적으로 약 50 내지 약 200개, 보다 일반적으로 약 100 내지 약 150개의 연속된 위치의 분절(segment)을 지칭하며, 여기서 서열은 2개의 서열을 최적으로 정렬한 후 연속된 위치의 동일한 번호의 참고 서열과 비교될 수 있다. 비교를 위한 서열의 정렬 방법은 당해 분야에 잘 공지되어 있다. 비교를 위한 서열의 최적의 정렬은 문헌: Smith and Waterman, Adv. Appl. Math., 2:482 (1981)의 국소 상동성 알고리즘(local homology algorithm)에 의해; 문헌: Needleman and Wunsch, J. Mol. Biol., 48:443 (1970)의 정렬 알고리즘에 의해; 문헌: Pearson and Lipman, Proc. Nat. Acad. Sci U.S.A., 85:2444 (1988)의 유사성 방법에 대한 조사에 의해; 이러한 알고리즘의 컴퓨터처리된 시행(예를 들면, 캘리포니아주 마운틴 뷰(Mountain View) 소재의 Intelligentics에 의한 PC/Gene 프로그램에서 CLUSTAL, GAP, BESTFIT, BLAST, FASTA, 및 미국 위스콘신주 매디슨(Madison) 사이언스 드라이브 575 소재의 Genetics Computer Group (GCG), Wisconsin Genetics Software Package에서의 TFASTA)에 의해 수행될 수 있으며; CLUSTAL 프로그램은 문헌: Higgins and Sharp, Gene, 73:237-244 (1988) 및 Higgins and Sharp, CABIOS, 5:151-153 (1989); Corpet et al., Nucleic Acids Res., 16:10881-10890 (1988); Huang et al., Computer Applications in the Biosciences, 8:155-165 (1992); 및 Pearson et al., Methods in Molecular Biology, 24:307-331 (1994)에 잘 기술되어 있다. 정렬은 또한 검토 및 매뉴얼 정렬에 의해 흔히 수행된다. 구현예의 한 부류에서, 본원의 폴리펩타이드는 예컨대, 디폴트 매개변수를 사용하여 BLASTP(또는 CLUSTAL, 또는 임의의 다른 유용한 정렬 소프트웨어)에 의해 측정된 바와 같은, 참고 폴리펩타이드, 또는 이의 단편과 적어도 80%, 85%, 90%, 98%, 99% 또는 100% 동일하다. 유사하게, 핵산은 또한 출발 핵산을 참고로 기술될 수 있는데, 이들은 예컨대, 유용한 디폴트 매개변수를 사용하여 BLASTN(또는 CLUSTAL, 또는 임의의 다른 이용가능한 정렬 소프트웨어)에 의해 측정된 바와 같이, 참고 핵산 또는 이의 단편에 대해 50%, 60%, 70%, 75%, 80%, 85%, 90%, 98%, 99% 또는 100% 동일할 수 있다. 하나의 분자가 보다 큰 분자와 서열 동일성의 특정 퍼센트를 갖는 것으로 일컬어지는 경우, 이는 2개의 분자가 최적으로 정렬되는 경우, 보다 작은 분자 내 잔기의 상기 퍼센트가 2개 분자가 최적으로 정렬된 순서에 따라 보다 큰 분자내 매치 잔기(match residue)를 찾음을 의미한다.
핵산 또는 아미노산 서열에 적용된 바와 같은 용어 "실질적으로 동일한" 및 이의 문법적 등가물은 핵산 또는 아미노산 서열이 상술한 프로그램, 예컨대, 표준 매개변수를 사용하는, BLAST를 사용하여 참고 서열과 비교시 적어도 90% 이상의 서열 동일성, 적어도 95%, 적어도 98% 및 적어도 99%의 동일성을 갖는 서열을 포함함을 의미한다. 예를 들면, BLASTN 프로그램(뉴클레오타이드 서열의 경우)은 디폴트로서 11의 단어 길이(word length)(W), 10의 예측(E), M=5, N=-4, 및 가닥(strand) 둘 다의 비교를 사용한다. 아미노산 서열의 경우, BLASTP 프로그램은 디폴트로서 3의 단어 길이(W), 10의 예측(E), 및 BLOSUM62 점수매김 매트릭스(scoring matrix)를 사용한다(참고: Henikoff & Henikoff, Proc. Natl. Acad. Sci. USA 89:10915 (1992)). 서열 동일성의 퍼센트는 비교 윈도우에 걸쳐서 2개의 최적으로 정렬된 서열을 비교함으로써 측정되며, 여기서, 비교 윈도우내 폴리뉴클레오타이드 서열의 부위는 2개의 서열의 최적의 정렬을 위해 참고 서열(이는 첨가 또는 결실을 포함하지 않는다)과 비교하여 첨가 또는 결실(즉, 갭(gap))을 포함할 수 있다. 퍼센트는 동일한 핵산 염기 또는 아미노산 잔기가 서열 둘 다에서 발생하여 매치된 위치의 수를 생성하는 위치의 수를 측정하고, 매치된 위치의 수를 비교 윈도우내 위치의 총 수로 나누고 이러한 결과에 100을 곱하여 서열 동일성 퍼센트를 수득함으로써 계산한다. 구현예에서, 실질적인 동일성은 길이가 적어도 약 50개 잔기인 서열의 영역에 걸쳐, 적어도 약 100개의 잔기의 범위에 걸쳐 존재하고, 구현예에서, 서열은 적어도 약 150개 잔기에 걸쳐 실질적으로 동일하다. 구현예에서, 서열은 암호화 영역(coding region)의 전체 길이에 걸쳐 실질적으로 동일하다.
"발현 벡터" 또는 "벡터"는 세포 내 폴리뉴클레오타이드 복제의 자가 단위(즉, 이의 자체 제어 하에 복제할 수 있는)로서 거동하거나 숙주 세포 염색체 내로 삽입하여 복제할 수 있도록 하거나, 이에 다른 폴리뉴클레오타이드 분절을 부착시켜, 부착된 분절의 복제 및/또는 발현을 유발시키는 임의의 유전 성분, 예컨대, 플라스미드, 염색체, 바이러스, 트랜스포존(transposon)이다. 적합한 벡터는 플라스미드, 트랜스포존, 박테리오파아지 및 코스미드를 포함하나, 이에 한정되지 않는다. 벡터는 목적한 숙주 세포 내로의 벡터의 연결 또는 삽입을 수행하고 부착된 분절의 발현을 수행하는데 필수적인 폴리뉴클레오타이드 서열을 함유할 수 있다. 이러한 서열은 숙주 유기체에 따라 상이하고; 이들은 전사를 수행하는 프로모터 서열, 전사를 증가시키는 인핸서 서열, 리보소옴 결합 부위 서열 및 전사 및 해독 종결 서열을 포함한다. 대안적으로, 발현 벡터는 벡터를 숙주 세포 DNA 서열 내로 연결시키거나 통합시키지 않고 내부에 암호화된 핵산 서열 생성물을 직접 발현시킬 수 있다. 일부 구현예에서, 벡터는 "에피좀 발현 벡터(episome expression vector)" 또는 "에피좀(episome)"이며, 이는 숙주 세포 내에서 복제할 수 있고, 적절한 선택적 압력의 존재하에서 숙주 세포 내에서 DNA의 염색체외 분절로서 지속한다(참고: 예컨대, Conese et al., Gene Therapy, 11:1735-1742 (2004)). 대표적으로 상업적으로 이용가능한 에피솜 발현 벡터는 엡슈타인 바르 핵 항원(Epstein Barr Nuclear 항원) 1(EBNA1) 및 엡슈타인 바르 바이러스(EBV) 복제 오리진(oriP)을 이용하는 에피솜 플라스미드를 포함하나, 이에 한정되지 않는다. Invitrogen(캘리포니아주 칼스바드 소재)으로부터의 벡터 pREP4, pCEP4, pREP7, 및 pcDNA3.1 및 Stratagene(캘리포니아주 라 졸라 소재)로부터의 pBK-CMV는 EBNA1 및 oriP 대신에 T-항원 및 SV40 복제 오리진을 사용하는 에피솜 벡터의 비-제한적 예를 나타낸다. 벡터는 또한 선택가능한 마커 유전자를 포함할 수 있다.
본원에 사용된 바와 같은 용어 "아데노바이러스"는 아데노바이러스 생명 주기에 관여하는 능력을 보유하고 에를 들면, 파괴(예컨대, 초음파), 변성(예컨대,열 또는 용매의 사용), 또는 교차-연결(예컨대, 포르말린 교차-연결)에 의해 물리적으로 불활성화되지 않은 아데노바이러스를 지칭한다. "아데노바이러스 생명 주기"는 (1) 바이러스 결합 및 세포 내로의 도입, (2) 아데노바이러스 게놈의 전사 및 아데노바이러스 단백질의 해독, (3) 아데노바이러스 게놈의 복제, 및 (4) 바이러스 입자 조립을 포함한다(참고: 예컨대, Fields Virology, 5th ed., Knipe et al. (eds.), Lippincott Williams & Wilkins, Philadelphia, PA (2006)). 본원에 사용된 바와 같은 용어 "아데노바이러스 벡터"는 아데노바이러스 게놈이 아데노바이러스 게놈과 관련하여 비-천연인 핵산 서열을 수용하도록 조작된 아데노바이러스를 지칭한다. 전형적으로, 아데노바이러스 벡터는 하나 이상의 돌연변이(예컨대, 결실, 삽입, 또는 치환)를 아데노바이러스의 아데노바이러스 게놈 내로 도입하여 예를 들면, 유전자 전달을 위해 비-천연 핵산 서열의 아데노바이러스 내로의 삽입을 수용함으로써 생성된다.
본원에 사용된 바와 같은 용어 "선택가능한 마커 유전자"는 세포가 상응하는 선택제의 존재하에서, 이에 대하여 또는 대항하여 특이적으로 선택될 핵산 서열을 발현하도록 하는 핵산 서열을 지칭한다. 적합한 선택가능한 마커 유전자는 당해 분야에 공지되어 있으며, 예컨대, 국제 특허원 공보 제WO 1992/08796호 및 제WO 1994/28143호; Wigler et al., Proc. Natl. Acad. Sci. USA, 77: 3567 (1980); O'Hare et al., Proc. Natl. Acad. Sci. USA, 78: 1527 (1981); Mulligan & Berg, Proc. Natl. Acad. Sci. USA, 78: 2072 (1981); Colberre-Garapin et al., J. Mol. Biol., 150:1 (1981); Santerre et al., Gene, 30: 147 (1984); Kent et al., Science, 237: 901-903 (1987); Wigler et al., Cell, 11: 223 (1977); Szybalska & Szybalski, Proc. Natl. Acad. Sci. USA, 48: 2026 (1962); Lowy et al., Cell, 22: 817 (1980); 및 미국 특허 제5,122,464호 및 제5,770,359호에 기술되어 있다.
본원에 사용된 바와 같은 용어 "암호화 서열"은 단백질을 암호화하는 폴리뉴클레오타이드의 분절을 지칭한다. 영역 또는 서열은 출발 코돈에 의해 5' 말단의 더 근처에서 및 출발 코돈과 함께 3' 말단의 더 근처에서 결합된다. 암호화 서열은 또한 개방 판독 프레임(open reading frame)으로써 지칭될 수 있다.
본원에 사용된 바와 같은 용어 "작동적으로 연결된"은 분절이 이들의 의도된 방식으로 작용하도록 하는 방식으로 다른 DNA 분절에 대한 DNA 분절의 물리적 및/또는 기능적 연결을 지칭하기 위해 지칭된다. 유전자 생성물을 암호화하는 DNA 서열은 이것이 조절 서열, 예를 들면, 프로모터, 인핸서 및/또는 사일런서(silencer)에 DNA 서열의 전사를 직접 또는 간접적으로 조절하도록 하는 방식으로 연결된 경우 조절 서열에 작동적으로 연결된다. 예를 들면, DNA 서열은, 이것이 프로모터의 전사 개시 부위와 관련하여 하부(downstream)로 프로모터에 연결된 경우, 전사 개시 부위와 관련하여 정확한 판독 프레임으로 프로모터에 작동적으로 연결되어 전사 신장(전사 elongation)이 DNA 서열을 통해 진행되도록 한다. 인핸서 또는 사일런서는 이것이 DNA 서열의 전사를 각각 증가시키거나 감소시키는 방식으로 DNA 서열에 연결되는 경우 유전자 생성물을 암호화하는 DNA 서열에 작동적으로 연결된다. 인핸서 및 사일런서는 DNA 서열의 암호화 영역 내에 상부(upstream)에, 하부에 위치하거나 포매(embedding)될 수 있다. 신호 서열에 대한 DNA는 신호 서열이 폴리펩타이드의 분비에 관여하는 프레(pre)-단백질로서 발현되는 경우 폴리펩타이드를 암호화하는 DNA에 작동적으로 연결된다. 조절 서열에 대한 DNA 서열의 연결은 전형적으로 적합한 제한 부위에서 연결에 의해 또는 당해 분야의 기술자에게 공지된 제한 엔도뉴클레아제를 사용하여 서열 내 삽입된 어댑터(adaptet) 또는 링커를 통해 달성된다.
본원에 사용된 바와 같은 용어 "유도하다", "유도" 및 이의 문법적 등가물은 일부 기본 수준의 전사와 관련하여 전사 조절인자에 의해 유발된 핵산 서열 전사, 프로모터 활성 및/또는 발현에 있어서의 증가를 지칭한다.
용어 "전사 조절인자"는 특정의 환경 조건(예컨대, 리프레서(repressor) 또는 핵 억제 단백질) 하에서 프로모터-유래된 DNA 서열의 전사를 예방하거나 억제하거나, 특정의 환경 조건(예컨대, 유도인자 또는 인핸서) 하에서 프로모터-유래된 DNA 서열의 전사를 허용하거나 자극하는데 작용하는 생화학적 성분을 지칭한다.
본원에 사용된 바와 같은 용어 "인핸서"는 예를 들면, 이것이 작동적으로 연결된 핵산 서열의 전사를 증가시키는 DNA 서열을 지칭한다. 인핸서는 핵산 서열의 암호화 영역으로부터 많은 킬로염기(kilobase) 떨어져서 위치할 수 있으며 조절 인자의 결합, DNA 메틸화의 패턴, 또는 DNA 구조내 변화를 매개할 수 있다. 다양한 상이한 공급원으로부터의 다수의 인핸서가 당해 분야에 잘 공지되어 있고 클로닝된 폴리뉴클레오타이드(예컨대, ATCC와 같은 기탁 기관 뿐만 아니라 다른 상업적 또는 개인 공급원으로부터의)로서 또는 내에서 이용가능하다. 프로모터(예를 들면, 일반적으로 사용된 CMV 프로모터)를 포함하는 다수의 폴리뉴클레오타이드는 또한 인핸서 서열을 포함한다. 인핸서는 암호화 서열의 상부, 내부 또는 하부에 위치할 수 있다. 용어 "Ig 인핸서"는 면역글로불린(Ig) 유전자자리(locus)(예를 들면, 인핸서는 예를 들면, 중쇄(mu) 5' 인핸서, 경쇄(카파) 5' 인핸서, 카파 및 뮤(mu) 인트론성 인핸서, 및 3' 인핸서를 포함한다) 내에 맵핑된 인핸서 영역으로부터 유래된 인핸서 성분을 지칭한다(참고: 일반적으로 Paul W. E. (ed), Fundamental Immunology, 3rd Edition, Raven Press, New York (1993), pages 353-363; 및 미국 특허 제5,885,827호).
용어 "프로모터"는 암호화 서열의 전사를 개시하는 폴리뉴클레오타이드의 영역을 지칭한다. 프로모터는 유전자의 전사 개시 부위 근처에서, 동일한 가닥 상에 및 DNA 상의 상부(센스 가닥의 5' 영역을 향해)에서 위치한다. 일부 프로모터는 이들이 세포 내 모든 환경에서 활성이므로 구성적이지만, 다른 것은 특정 자극에 대한 반응시 활성이 되도록, 예컨대, 유도성 프로모터가 되도록 조절된다. 본원에 사용된 바와 같은 용어 "프로모터 활성" 및 이의 문법적 등가물은 이의 활성이 측정되는 프로모터에 작동적으로 연결된 뉴클레오타이드 서열의 발현 정도를 지칭한다. 프로모터 활성은 예를 들면, 노던 블롯 분석(Northern blot analysis)에 의해 생산된 RNA 전사체의 양을 측정함으로써 직접적으로 또는 연결된 핵산 서열, 예를 들면, 프로모터에 연결된 리포터 핵산 서열에 대해 암호화된 생성물의 양을 측정함으로써 간접적으로 측정할 수 있다.
본원에 사용된 바와 같은 "유도성 프로모터"는 전사 조절인자, 예컨대, 바이오틱(biotic) 또는 아바이오틱(abiotic) 인자의 존재 또는 부재에 의해 활성으로 유도된 프로모터를 지칭한다. 유도성 프로모터는 이들에게 작동적으로 연결된 유전자의 발현이 유기체의 발달의 특정 단계에서 또는 특수한 조직에서 작동(turn on)되거나 작동되지 않을(turn off) 수 있으므로 유용하다. 유도성 프로모터의 비-제한적 예는 알코올-조절된 프로모터, 테트라사이클린-조절된 프로모터, 스테로이드-조절된 프로모터, 금속-조절된 프로모터, 발병-조절된 프로모터, 온도-조절된 프로모터 및 광-조절된 프로모터를 포함한다. 유도성 프로모터는 유전자 스위치 또는 유전 스위치의 부분일 수 있다. 유도성 프로모터는 유전자 스위치 리간드 유도성 프로모터일 수 있다. 일부 경우에, 유도성 프로모터는 소 분자 리간드-유도성의 2개의 폴리펩타이드 엑다이손 수용체-기반 유전자 스위치일 수 있다. 일부 경우에, 국제 특허원 제WO 2001/070816호; 제WO 2002/029075호; 제WO 2002/066613호; 제WO 2002/066614호; 제WO 2002/066612호; 제WO 2002/066615호; 제WO 2003/027266호; 제WO 2003/027289호; 제WO 2005/108617호; 제WO 2009/045370호; 제WO 2009/048560호; 제WO 2010/042189호; 제WO 2010/042189호; 제WO 2011/119773호; 및 제WO 2012/122025호; 및 미국 특허 제7,091,038호; 제7,776,587호; 제7,807,417호; 제8,202,718호; 제8,105,825호; 제8,168,426호; 제7,531,326호; 제8,236,556호; 제8,598,409호; 제8,715,959호; 제7,601,508호; 제7,829,676호; 제7,919,269호; 제8,030,067호; 제7,563,879호; 제8,021,878호; 제8,497,093호; 제7,935,510호; 제8,076,454호; 제9,402,919호; 제9,493,540호; 제9,249,207호; 및 제9,492,482호에 기술된 임의의 시스템에 기술되지만, 이에 한정되지 않는 엑다이손-기반 수용체 구성성분으로부터 선택될 수 있으며, 이들 각각은 이의 전문이 참고로 포함된다.
용어 "유전자 스위치" 또는 "유전성 스위치"는 프로모터와 관련된 반응 성분, 및 예를 들면, 하나 이상의 리간드의 존재하에서 반응 성분 및 프로모터가 도입된 유전자의 발현을 조절하는 EcR 기반 시스템의 조합을 지칭한다. 강력하게 조절된 유도성 유전자 발현 시스템 또는 유전자 스위치는 다양한 적용, 예를 들면, 유전자 치료요법, 세포 내에서 단백질의 대규모 생산, 세포 기반된 고 처리량 스크리닝 검정, 기능성 유전체학 및 형질전환 식물 및 동물에서 특징(trait)의 조절에 유용하다. 이러한 유도성 유전자 발현 시스템은 리간드 유도성 이종 유전자 발현 시스템을 포함할 수 있다.
"슬리핑 뷰티(Sleeping Beauty: SB) 트랜스포존 시스템(트랜스포존 시스템)"은 DNA 서열을 척추동물의 염색체 내로 도입시키기 위한 합성 DNA 트랜스포존 시스템을 지칭한다. 이러한 시스템의 일부 예시적인 구현예는 예를 들면, 미국 특허 제6,489,458호, 제8,227,432호, 제9,228,180호 및 제WO/2016/145146호에 기술되어 있다. 슬리핑 뷰티 트랜스포존 시스템은 슬리핑 뷰티(SB) 트랜스포사제 및 SB 트랜스포존으로 구성된다. 구현예에서, 슬리핑 뷰티 트랜스포존 시스템은 SB11 트랜스포존 시스템, SB100X 트랜스포존 시스템, 또는 SB110 트랜스포존 시스템을 포함할 수 있다.
"트랜스포존" 또는 "수송가능한 성분(transposable element)"(TE)은 때때로 돌연변이를 생성하거나 역전시키고 세포의 게놈 크기를 변경시키는 게놈 내 이의 위치를 변화시킬 수 있는 벡터 DNA 서열이다. 전위는 흔히 TE의 중복을 생성한다. 제I 부류 TE는 2개의 단계로 카피된다: 첫째로 이들은 DNA로부터 RNA로 전사되고, 생산된 RNA는 이후 DNA로 역 전사된다. 이러한 카피된 DNA는 이후 새로운 위치에서 게놈 내로 삽입된다. 역 전사 단계는 리버스 트랜스크립타제에 의해 촉매되며, 이는 TE 자체에 의해 암호화될 수 있다. 레트로트랜스포존의 특성은 레트로바이러스, 예를 들면, HIV와 유사하다. 제II 부류 TE의 절단-및-페이스트(cut-and-paste) 전위 메카니즘은 RNA 중간체를 포함하지 않는다. 전위는 수개의 트랜스포사제 효소에 의해 촉매된다. 일부 트랜스포사제는 DNA내 임의의 표적 부위에 비-특이적으로 결합하지만, 다른 것은 특정의 DNA 서열 표적에 결합한다. 트랜스포사제는 표적 부위에서 스태거된 절단(staggered cut)을 이루어 단일-가닥 5' 또는 3' DNA 오버행(overhang)(점성 말단(sticky end))을 생성한다. 이러한 단계는 DNA 트랜스포존을 절단하며, 이는 이후에 새로운 표적 부위 내에 결합(ligating)되고; 이러한 공정은 갭(gap)을 충전시키는 DNA 폴리머라제 및 당-포스페이트 골격을 폐쇄하는 DNA 리가제의 활성을 포함한다. 이는 표적 부위의 중복을 생성한다. DNA 트랜스포존의 삽입 부위는 표적 DNA 내 스태거된 절단에 의해 생성될 수 있는 짧은 직접적인 반복체에 의해서 및 DNA 폴리머라제에 의한 충전(filing in)에 이은, 트랜스포사제에 의한 TE 절개에 중요한 일련의 역위된 반복체에 의해 확인될 수 있다. 절단-및-페이스트 TE는 공여체 부위가 이미 복제되었지만, 표적 부위가 아직 복제되지 않았을 때 세포 주기의 S 기 동안에 일어나는 경우 중복될 수 있다. 전위는 제I 및 제II 부류 TE 둘 다에서 자주적이거나 비-자주적인 것으로 분류될 수 있다. 자주적인 TE는 자체적으로 이동할 수 있지만 비-자주적인 TE는 이동하기 위한 다른 TE의 존재를 필요로 한다. 이는 흔히 비-자주적인 TE가 트랜스포사제(제II 부류의 경우) 또는 리버스 트랜스퍼라제(제I 부류의 경우) 때문이다.
"트랜스포사제"는 트랜스포존의 말단에 결합하여 절단 및 페이스트 메카니즘 또는 복제성 전위 메카니즘에 의해 게놈의 다른 부분으로 트랜스포존의 이동을 촉매하는 효소를 지칭한다.
"본원에 사용된 바와 같은 "T 세포" 또는 "T 림프구"는 세포-매개된 면역성에서 중요한 역활을 하는 림프구의 유형이다. 이들은 세포 표면의 T-세포 수용체(TCR)의 존재에 의해, B 세포 및 천연 킬러 세포(NK 세포)와 같은 다른 림프구와는 구별될 수 있다.
"T 헬퍼 세포"(TH 세포)는 면역학적 공정, 예를 들면, B 세포의 혈장 세포 및 기억 B 세포로의 성숙, 및 세포독성 T 세포 및 대식구의 활성화시 다른 백혈구 세포를 보조한다. 이러한 세포는 이들의 표면에 CD4 당단백질을 발현하므로 CD4+ T 세포로서 또한 공지되어 있다. 헬퍼 T 세포는 이들이 MHC 제II 부류 분자에 의해 펩타이드 항원과 함께 나타나는 경우 활성화되며, 이러한 분자는 항원-표시 세포(antigen-presenting cell: APC)의 표면에서 발현된다. 일단 활성화되면, 이들은 신속하게 분할되어 활성 면역 반응에서 조절하거나 보조하는 사이토킨으로 불리는 소 단백질을 분비한다. 이러한 세포는 수개의 서브형, 예를 들면, TH1, TH2, TH3, TH9, TH17, TH22 또는 TFH(T 여포성 헬퍼 세포) 중 하나로 분화될 수 있으며, 이는 상이한 사이토킨을 분비하여 상이한 유형의 면역 반응을 촉진한다. APC로부터의 신호전달(signaling)은 T 세포를 특수한 서브형으로 지시한다.
"세포독성 T 세포"(TC 세포, 또는 CTL) 또는 "세포독성 T 림프구"는 바이러스-감염된 세포 및 종양 세포를 파괴하며 이식 거부에 또한 연루되어 있다. 이러한 세포는 이의 표면에 CD8 당단백질을 발현하므로 CD8+ T 세포로 공지되어 있다. 이러한 세포는 MHC 제I 부류 분자와 관련된 항원에 결합함으로써 이의 표적을 인식하며, 이는 모은 핵화된 세포(nucleated cell)의 표면에 존재한다. IL-10, 아데노신, 및 조절성 T 세포에 의해 분비된 다른 분자를 통해, CD8+ 세포는 아네르기성 상태(anergic state)로 불활성화될 수 있으며, 이는 자가면역 질환을 예방한다.
"기억 T 세포"는 감염이 해결된 후 장기간 지속하는 항원-특이적인 T 세포의 서브세트(subset)이다. 이들은 이의 동족 항원에 재-노출시 다수의 효과기 T 세포로 신속하게 확장됨으로써 과거 감염(past infection)에 대한 기억을 지닌 면역계를 제공한다. 기억 T 세포는 3개의 서브형을 포함한다: 중심 기억(central memory) T 세포(TCM 세포) 및 2개 유형의 효과기 기억 T 세포(TEM 세포 및 TEMRA 세포). 기억 세포는 CD4+ 또는 CD8+일 수 있다. 기억 T 세포는 전형적으로 세포 표면 단백질 CD45RO, CD45RA 및/또는 CCR7을 발현한다.
억제인자(suppressor) T 세포로서 앞서 공지된, "조절성 T 세포"(Treg 세포)는 면역학적 내성의 유지에 있어 역활을 담당한다. 이의 주요 역활은 면역 반응의 말기를 향해 T 세포-매개된 면역성을 정지시키고 흉선에서 음성 선택(negative selection)의 과정을 피한 자가반응성 T 세포를 억제하는 것이다.
"천연 킬러 T 세포"(NKT 세포 - 선천적 면역계의 천연 킬러 세포로 혼동되지 않아야 함)는 선천성 면역계와 함께 후천성 면역계(adaptive immune system)를 브릿지한다. 주요 조직적합성 복합체(MHC) 분자에 의해 나타난 펩타이드 항원을 인식하는 통상의 T 세포와는 달리, NKT 세포는 CD1d로 불리는 분자에 의해 나타난 당지질 항원을 인식한다. 일단 활성화되면, 이러한 세포는 T 헬퍼(TH) 및 세포독성 T(TC) 세포 둘 다에 대해 추정된 기능(즉, 사이토킨 생산 및 세포분해/세포사멸 분자의 방출)을 수행할 수 있다. 이들은 또한 일부 종양 세포 및 헤르페스 바이러스로 감염된 세포를 인식하여 이를 제거할 수 있다.
"후천성 T 세포 전달"은 예방접종 단독 또는 환자의 천연 종양 반응에 의해 수득될 수 있는 것보다 더 많은 수의 T 세포를 달성하기 위한 종양 특이적인 T 세포의 단리 및 생체외(ex vivo) 확장을 지칭한다. 이후에, 종양 특이적인 T 세포는 이의 면역 시스템에 암을 공격하여 이를 사멸시킬 수 있는 T 세포를 통해 남아있는 종양을 제압하는 능력을 제공하기 위한 시도에서 암을 지닌 환자 내로 주입된다. 종양 침윤 림프구 또는 TIL을 배양하고, 하나의 특수한 T 세포 또는 클론을 단리하고 확장하며, 심지어 종양을 강력하게 인식하고 이를 공격하도록 가공된 T 세포를 사용하는 암 치료에 사용되는 입양 T 세포 치료요법(adoptive T cell therapy)의 많은 형태가 존재한다.
본원에 사용된 바와 같은 "항체"는 모노클로날 또는 폴리클로날 항체를 지칭한다. 본원에 사용된 바와 같은 용어 "모노클로날 항체"는 B-세포의 단일 클론에 의해 생산되어 동일한 에피토프에 결합된 항체를 지칭한다. 대조적으로, "폴리클로날 항체"는 상이한 B-세포에 의해 생산되어 동일한 항원의 에피토프에 결합하는 항체의 집단을 지칭한다. 전체 항체는 전형적으로 4개의 폴리펩타이드로 이루어진다: 중(H) 쇄 폴리펩타이드의 2개의 동일한 카피 및 경(L) 쇄 폴리펩타이드의 2개의 동일한 카피. 각각의 중쇄는 하나의 N-말단 가변(VH) 영역 및 3개의 C-말단 불변(CH1, CH2 및 CH3) 영역을 함유하며, 각각의 경쇄는 하나의 N-말단 가변(VL) 영역 및 하나의 C-말단 불변(CL) 영역을 함유한다. 경쇄 및 중쇄의 각각의 쌍의 가변 영역은 항체의 항원 결합 부위를 형성한다. VH 및 VL 영역은 유사한 일반 구조를 가지며, 각각의 영역은 4개의 골격 영역을 포함하고, 이의 서열은 비교적 보존되어 있다. 골격 영역은 3개의 상보성 결정 영역(CDR)에 의해 연결되어 있다. CDR1, CDR2, 및 CDR3으로 공지된 3개의 CDR은 항체의 "초가변 영역"을 형성하며, 이는 항원 결합에 관여한다.
"항체 유사 분자"는 예를 들면, 파트너에 선택적으로 결합할 수 있는 Ig-상과(superfamily)의 구성원인 단백질일 수 있다. MHC 분자 및 T 세포 수용체가 이러한 분자이다. 일 구현예에서, 항체-유사 분자는 TCR이다. 일 구현예에서, TCR은 변형되어 이의 MHC 결합 친화성을 증가시켜 왔다.
용어 "항체의 단편", "항체 단편", "항체의 기능성 단편", "항원-결합 부위" 또는 이의 문법적 등가물은 항원에 특이적으로 결합하는 능력을 보유한 항체의 하나 이상의 단편 또는 부위를 의미하기 위해 본원에서 사용교환적으로 사용된다(참고: 일반적으로, Holliger et al., Nat. Biotech., 23(9):1126-1129 (2005)). 항체 단편은 바람직하게는 예를 들면, 하나 이상의 CDR, 가변 영역(또는 이의 부위), 불변 영역(또는 이의 부위), 또는 이의 조합을 포함한다. 항체 단편의 비-제한적 예는 (i) VL, VH, CL, 및 CH1 도메인으로 이루어진 1가 단편인, Fab 단편; (ii) 스택 영역(stalk 영역)에서 이황화물 브릿지에 의해 연결된 2개의 Fab 단편을 포함하는 2가 단편인, F(ab')2 단편; (iii) 항체의 단일 아암(arm)의 VL 및 VH 도메인으로 이루어진 Fv 단편; (iv) 2개의 도메인이 단일 폴리펩타이드 쇄로서 합성되도록 할 수 있는 합성 링커에 의해 결합된 Fv 단편(즉, VL 및 VH)의 2개의 도메인으로 이루어진 1가 분자인, 단일 쇄 Fv(scFv)(참고: 예컨대, Bird et al., Science, 242: 423-426 (1988); Huston et al., Proc. Natl. Acad. Sci. USA, 85: 5879-5883 (1988); 및 Osbourn et al., Nat. Biotechnol., 16: 778 (1998)) 및 (v) 폴리펩타이드 쇄의 이량체인, 디아보디(diabody)를 포함하며, 여기서 각각의 폴리펩타이드 쇄는 동일한 폴리펩타이드 쇄 상의 VH와 VL 사이에 쌍화(pairing)를 허용함으로써, 상이한 VH-VL 폴리펩타이드 쇄 상의 상보성 도메인 사이에 쌍화를 이끌어 2개의 기능적 항원 결합 부위를 갖는 이량체성 분자를 생성하기에는 너무 짧아서 불가능한 펩타이드 링커에 의해 VL에 연결된 VH를 포함한다. 항체 단편은 당해 분야에 공지되어 있으며 예컨대, 미국 특허 제8,603,950호에 보다 상세히 기술되어 있다.
"항원 인식 모이어티(antigen recognition moiety)" 또는 "항원 인식 도메인"은 항원에 특이적으로 결합하는 분자 또는 분자의 부위를 지칭한다. 일 구현예에서, 항원 인식 모이어티는 항체, 항체 유사 분자 또는 이의 단편이고 항원은 종양 항원이다.
용어 "보존적 아미노산 치환" 또는 "보존적 돌연변이"는 하나의 아미노산의 일반적인 특징을 지닌 다른 아미노산에 의한 대체(replacement)를 지칭한다. 개개의 아미노산 사이의 일반적인 특성을 정의하기 위한 기능적인 방법은 상동성 유기체의 상응하는 단백질 사이의 아미노산 변화의 표준화된 빈도를 분석하는 것이다(Schulz, G. E. and Schirmer, R. H., Principles of Protein Structure, Springer-Verlag, New York (1979)). 이러한 분석에 따라서, 아미노산의 그룹이 정의될 수 있으며 여기서 그룹내 아미노산은 서로 잠재적으로 교환되므로, 전체 단백질 구조에 대한 이들의 영향에 있어서 서로 가장 잘 유사하다(Schulz, G. E. and Schirmer, R. H., 상기 참고). 보존적 돌연변이의 예는 상기 서브-그룹 내 아미노산의 아미노산 치환, 예를 들면, 양성 전하가 유지될 수 있도록 아르기닌에 대해 라이신의 치환 및 이의 역; 음성 전하가 유지될 수 있도록 아스파르트산에 대해 글루탐산의 치환 및 이의 역; 유리-OH가 유지될 수 있도록 트레오닌에 대해 세린의 치환; 및 유리 -NH2가 유지될 수 있도록 아스파라긴에 대해 글루탐산의 치환을 포함한다. 대안적으로 또는 추가로, 기능성 변이체는 적어도 하나의 비-보존적 아미노산 치환을 지닌 참고 단백질의 아미노산 서열을 포함할 수 있다.
용어 "비-보존적 돌연변이"는 상이한 그룹 사이의 아미노산 치환, 예를 들면, 트립토판에 대해 라이신의 치환, 또는 세린에 대해 페닐알라닌의 치환 등을 포함한다. 이러한 경우에, 비-보존적 아미노산이 기능성 변이체의 생물학적 활성을 방해하거나 억제하지 않도록 하는 것이 바람직할 수 있다. 비-보존적 아미노산 치환은 기능성 변이체의 생물학적 활성을 향상시켜서 기능성 변이체의 생물학적 활성은 상동성 모 단백질과 비교하여 증가되도록 할 수 있다.
용어 "안키린"은 스펙트린-액틴계 막 세포골격에 대한 내재성 막 단백질(integral membrane protein)의 부착을 매개하는 어댑터 단백질(adaptor protein)의 계열(family)을 지칭한다. 안키린은 스펙트린의 베타 소단위에 대한 결합 부위 및 적어도 12 계열의 내재성 막 단백질을 갖는다. 이러한 연결은 혈장 막의 통합성을 유지하고 혈장 막에서 특수한 이온 채널, 이온 교환체(ion exchanger) 및 이온 수송인자(ion transporter)를 고정(anchor)시키는데 요구된다. 안키린은 4개의 기능성 도메인을 함유한다: 24개의 탄뎀(tandem) 안키린 반복체를 함유하는 N-말단 도메인, 스펙트린에 결합하는 중앙 도메인, 세포자멸사에 포함된 단백질에 결합하는 사멸 도메인, 및 상이한 안키린 단백질들 사이에서 고 가변성인 C-말단 조절성 도메인. 24개의 탄뎀 안키린 반복체는 광범위한 막 단백질의 인식에 관여한다. 이러한 24개의 반복체는 반복체 1 내지 14 범위의 3개의 구조적으로 명백한 결합 부위를 함유한다. 이러한 결합 부위는 서로 준-독립적(quasi-independent)이며 함께 사용될 수 있다. 부위가 막 단백질에 결합시키는데 사용하는 상호작용은 비-특이적이며 수소 결합, 소수성 상호작용 및 정전성 상호작용으로 이루어진다. 이러한 비-특이적인 상호작용은 서열이 아미노산의 특성을 바로 보존할 필요가 없으므로 거대 범위의 단백질을 인식하는 특성을 안키린에 제공한다. 준-독립성(quasi-independence)은 결합 부위가 사용되지 않는 경우, 전체 결합에서 큰 효과를 가지지 않을 수 있음을 의미한다. 조합시 이러한 2개의 특성은 안키린이 인식할 수 있는 단백질의 큰 레퍼토리를 생성한다. 안키린은 포유동물에서 3개의 유전자(ANK1, ANK2 및 ANK3)에 의해 암호화된다. 궁극적으로 각각의 유전자는 교호적인 스플라이싱(splicing)을 통해 다수의 단백질을 생산한다.
본원에 언급된 바와 같은 용어 "증식성 질환"은 세포의 과도한 증식 및/또는 세포 매트릭스의 턴오버(turnover)가 암을 포함하는 질환의 발병에 유의적으로 기여하는 통합 개념을 지칭한다.
본원에 사용된 바와 같은 "환자" 또는 "대상체"는 암과 같은 증식성 장애를 가지거나 이로 발달하는 것으로 진단되거나 예측된 포유동물 대상체를 지칭한다. 일부 구현예에서, 용어 "환자"는 암과 같은 증식성 장애로 발달하는 평균 가능성보다 더 높은 포유동물 환자를 지칭한다. 예시적인 환자는 사람, 유인원, 개, 돼지, 소, 고양이, 말, 염소, 양, 설치류 및 본원에 개시된 치료요법으로부터 유리할 수 있는 다른 포유동물을 지칭한다. 예시적인 사람 환자는 남성 및/또는 여성일 수 있다. "이를 필요로 하는 환자" 또는 "이를 필요로 하는 대상체"는 본원에서 질환 또는 장애를 지니거나 갖는 것으로 의심되는 환자로서 지칭되지만, 예를 들면, 만성 B형 간염 감염에 한정되지 않는다.
"투여하는"은 본원에서 환자 또는 대상체에게 본원에 기술된 하나 이상의 조성물을 제공하는 것으로 지칭된다. 예로써 및 제한없이, 조성물 투여, 예컨대, 주사는 정맥내(i.v.) 주사, 피하(s.c.) 주사, 피내(i.d.) 주사, 복강내(i.p.) 주사, 또는 근육내(i.m.) 주사에 의해 수행될 수 있다. 하나 이상의 이러한 경로가 사용될 수 있다. 비경구 투여는 예를 들면, 거환 주사(bolus injection)에 의해서 또는 시간에 걸쳐 점진적인 관류(perfusion)에 의할 수 있다. 대안적으로, 또는 동시에, 투여는 경구 경로에 의할 수 있다. 추가로, 투여는 세포의 거환 또는 펠렛(pellet)의 외과적 침착(surgical deposition), 또는 의료 장치의 위치조정(positioning)에 의할 수 있다. 구현예에서, 본 개시내용의 조성물은 본원에 기술된 핵산 서열, 또는 본원에 기술된 적어도 하나의 핵산 서열을 포함하는 벡터를, 증식성 장애를 치료하거나 예방하는데 효과적인 양으로 발현하는 가공된 세포 또는 숙주 세포를 포함할 수 있다. 약제학적 조성물은 하나 이상의 약제학적으로 또는 생리학적으로 허용되는 담체, 희석제 또는 부형제와 함께, 본원에 기술된 바와 같은 표적 세포 집단을 포함할 수 있다. 이러한 조성물은 완충제, 예를 들면, 중성의 완충된 염수, 인산염 완충된 염수 등; 탄수화물, 예를 들면, 글루코즈, 만노즈, 슈크로즈 또는 덱스트란, 만니톨; 단백질; 폴리펩타이드 또는 아미노산, 예를 들면, 글리신; 항산화제; 킬레이팅제(chelating agent), 예를 들면, EDTA 또는 글루타티온; 보조제(예컨대, 수산화알루미늄); 및 보존제를 포함할 수 있다.
본원에 사용된 바와 같은, 용어 "치료", "치료하는", 또는 이의 문법적 등가물은 목적한 약리학적 및/또는 생리학적 효과를 수득함을 지칭한다. 구현예에서, 효과는 치료학적인데, 즉, 효과는 질환 및/도는 질환에 기여할 수 있는 부작용 증상을 부분적으로 또는 완전히 치유한다. 이러한 목적으로, 본 발명의 방법은 본 발명의 핵산 서열, 또는 본 발명의 핵산 서열을 포함하는 벡터를 발현하는 숙주 세포를 포함하는 조성물의 치료학적 유효량을 투여함을 포함한다.
용어 "치료학적 유효량", "치료량", "면역학적 유효량", "항-종양 유효량", "종양 억제 유효량" 또는 이의 문법적 등가물은 목적한 치료학적 결과를 달성하는데 효과적인 양, 투여량 및 필수적인 기간을 지칭한다. 치료학적 유효량은 개체의 질환 상태, 성별, 및 체중과 같은 인자, 및 하나 이상의 대상체에서 목적한 반응을 유발하는 본원에 기술된 조성물의 능력에 따라 변할 수 있다. 본 개시내용의 조성물의 정확한 양은 환자(대상체)의 연령, 체중, 종양 크기, 감염 또는 전이 정도, 및 상태에서의 개개의 차이를 고려하여 주치의에 의해 결정될 수 있다.
대안적으로, 환자 또는 대상체에 대한 본원에 기술된 하나 이상의 조성물의 투여의 약리학적 및/또는 생리학적 효과는 "예방적"일 수 있는데, 즉, 이러한 효과는 질환 또는 이의 증상을 완전히 또는 부분적으로 예방한다. "예방학적으로 유효한 양"은 목적한 예방학적 결과(예컨대, 질환 발병의 예방)을 달성하는데 효과적인 양, 투여량 및 이에 필수적인 기간을 지칭한다.
HBV 분자 백신
B형 간염(HepB)은 B형 간염 바이러스(HBV)에 의해 유발된 잠재적으로 생명을 위협하는 간 감염이다. HBV는 만성 감염을 유발하고 사람들을 간경변 및 간암으로부터의 높은 사망 위험에 빠뜨린다. HBV의 진화는 유전형의 지리학적 분포에 의해 현저하게 강조된다. HBV 유전형/서브유전형은 임상적 및 바이러스학적 특성, 예를 들면, 간 질환의 중증도 및 항바이러스 치료요법에 대한 반응에 있어서의 차이와 크게 관련되어 왔다. 서열을 비교하는 경우, HBV는 8개의 유전형(A 내지 H)으로 분류되며, 각각은 명백한 지리학적 분포를 지닌다. 연구자들은 상이한 HBV 유전형과 HBV 질환의 중증도 및 결과 사이의 관련성을 연관시켜왔다.
HBV는 높은 간 향성(tropism)을 지닌 이중 가닥 DNA 바이러스이다. HBV DNA는 3.2kb의 환형의, 엔벨로프되고, 부분적으로 이중 가닥인 DNA 게놈이다(도 3a 내지 도 3d). HBV는 4개의 유전자(S, C, P, 및 X)를 갖는다. S 유전자는 작은 표면 단백질(S), 중간 표면 단백질(S + PreS2), 및 큰 표면 단백질(S + PreS2 + PreS1)로 이루어진 엔벨로프(envelope)(지질 이층) 표면 단백질(HBsAg)을 암호화한다. C 유전자는 캡시드 또는 코어 단백질을 암호화한다. C 유전자는 프레코어(precore) 및 코어 영역을 갖는다. 해독이 프레코어 영역에서 개시되는 경우, 단백질은 HBeAg이다. 해독이 코어 영역에서 개시되는 경우, 단백질은 HBcAg이다. P 유전자는 DNA 폴리머라제(Pol)를 암호화한다. X 유전자는 x 단백질(HBxAg)을 암호화한다(도 3a 내지 도 3d). HBV 게놈은 TP, SP, RT 및 RH; PreS1(108개 아미노산); PreS2(55개 아미노산); S(226개 아미노산); PreC(29개 아미노산); C(183개 아미노산); 및 HBx(154개 아미노산)을 포함하는 Pol(832개 아미노산)을 포함한다(도 3a 내지 도 3d).
급성 HBV 감염은 B형 간염 표면 항원(HBsAg) 및, 코어 항원, HBcAg에 대한 면역글로불린 M(IgM) 항체의 존재에 의해 특징화된다. 감염의 초기 상 동안에, 환자는 또한 B형 간염 항원(HBeAg)에 대해 혈청양성(seropositive)이다. HBeAg는 일반적으로 고 수준의 바이러스 복제의 마커이다. HBeAg의 존재는 감염된 개인의 혈액 및 체액이 고 감염성임을 나타낸다. 만성 감염은 적어도 6개월 동안(재발하는 HBeAg의 존재 또는 부재하에) HBsAg의 지속성에 의해 특징화된다. HBsAg의 지속성은 삶의 말기에 만성 간 질환 및 간암(간세포 암종)으로 진전될 위험의 기본 마커이다.
B형 간염 바이러스는 적어도 7일 동안 신체 밖에서 생존할 수 있다. 이러한 시간 동안, 바이러스는 백신에 의해 보호되지 않는 사람의 신체 내로 들어가는 경우 여전히 감염을 유발할 수 있다. B형 간염 바이러스의 항온처리 기간은 평균 75일이지만, 30 내지 180일로 변할 수 있다. 바이러스는 감염 후 30 내지 60일 내에 검출될 수 있고 지속하여 만성 B형 간염으로 진전될 수 있다. 매우 토착화된 지역에서, B형 간염은 출생시 어머니로부터 자녀로(분만기 전파(perinatal transmission)), 또는 수평적 전파(감염된 혈액에 대한 노출)를 통해, 특히 생애의 처음 5년 동안 감염된 아동으로부터 감염되지 않은 아동으로 가장 흔히 확산된다. B형 간염은 또한 감염된 혈액 및 다양한 체액에 대한 피하 또는 점막 노출에 의해서 뿐만 아니라 타액, 생리, 질액, 및 정액을 통해 확산된다. B형 간염의 성교 전파 또한 일반적으로 발생할 수 있다. 성인에서의 감염은 5% 미만의 사례에서 만성 간염을 초래한다. 바이러스의 전파는 또한 보건 시설(health-care settings) 또는 약물을 주사하는 개인 중에서 침(needle) 및 주사기의 재사용을 통해 발생할 수 있다. 또한, 감염은 의학적, 수술적 및 치과 수술 동안에, 문신새김(tattooing)을 통해, 또는 감염된 혈액으로 오염된 면도기 및 유사한 물체의 사용을 통해 발생할 수 있다.
대부분의 사람들은 급성 감염 상 동안 임의의 증상을 겪지 않는다. 그러나, 일부 사람들은 수 주 지속하는 증상, 예를 들면, 피부 및 눈의 황변(황달), 짙은 뇨(dark urine), 극심한 피로, 오심, 구토 및 복부 통증을 지닌 급성 질병을 갖는다. 급성 간염에 걸린 사람의 작은 서브세트(subset)는 급성 간 부전으로 진전될 수 있으며, 이는 사망을 야기할 수 있다. 일부 사람들에서, B형 간염 바이러스는 또한 후에 간경변(간의 반흔화(scarring)) 또는 간암으로 진전될 수 있는 만성 간 감염을 유발할 수 있다. 감염이 만성화되는 경향성은 개인이 감염되기 시작한 나이에 의존한다. B형 간염 바이러스로 감염되기 시작한 6세 미만의 어린이는 만성 감염으로 진전될 가능성이 가장 크다. 생애 첫해 동안 감염된 영아의 80 내지 90%는 만성 감염으로 진전되고; 6세 이전에 감염된 어린이의 30 내지 50%는 만성 감염으로 진전된다. 성인에서, 성인으로 감염된 달리 건강한 개인의 5% 미만이 만성 감염으로 진전될 것이며; 만성 감염된 성인의 20 내지 30%는 간경변 및/또는 간암으로 진전될 것이다(도 1 및 도 2).
급성 B형 간염에 대한 구체적인 치료는 존재하지 않는다. 따라서, 치유법은 편안함 및 적절한 영양적 균형의 유지, 예를 들면, 구토 및 설사로부터 손실된 유체의 보충에 목표를 둔다. 만성 B형 간염 감염은 의약, 예를 들면, 경구 항바이러스제로 치료될 수 있다. 치료(예컨대, 간 이식 또는 IFN-α 뉴클레오타이드 유사체)는 간경변의 진행을 늦추고, 간암의 발병률을 감소시키며 장기간 생존을 증진시킨다. 최근 보다 발달된 치료학적 백신(즉, GS-4777, Gilead; ABX203, 아비박스(Abivax))는 임상시험 2/3기에서 실패하였다. 그러나, 대부분의 사람들에서, 치료는 B형 간염 감염을 치유하지 않지만, 바이러스의 복제를 단지 억제한다. 따라서, B형 간염 치료를 시작한 대부분의 사람들은 생애 동안 이를 지속하여야만 한다. 많은 수단이 제한된 환경에서 B형 간염의 진단 및 치료에 대해 여전히 제한된 접근이 존재한다.
추정된 2억 5700만명의 사람들은 만성 B형 간염 바이러스(HBV) 감염을 지닌채 살고 있다(표면 항원 검출을 통한 양성 확인). 2015년에, B형 간염 감염은 사망의 주요 원인으로서 간 부전 또는 간암으로, 887,000명의 사망을 야기하였다. 현재, HBV 백신은 사례의 95%에서 감염을 방지함으로써 B형 간염으로 인한 감염, 간암, 및 만성 질환을 예방한다. 그러나, 다수의 HBV 서브형에 대한 광범위한 포함 및 간암에 대한 기능성을 지닌 HBV 백신을 개발하는 것에 대한 큰 필요성이 여전히 존재한다. 본 개시내용은 생물정보학 방법 및 단백질 가공 접근법을 기반으로 한 신규한 HBV 백신 항원에 관한 것이다. 이러한 신규한 HBV 백신 후보물은 HBV 및 HBV-관련된 질환에 대한 치료학적 백신으로서 사용될 수 있다.
치료 선택사항
만성 B형 간염 감염에 대한 표준 치료제(standard of care: SOC)는 PEG-IFN, 및/또는 뉴클레오타이드 유사체를 포함한다. 그러나, cccDNA 및 면역 내성 및 고갈이 지속될 수 있다(도 4). HBV에 의한 감염은 간병변, 간 부전 및 간세포 암종(HCC)을 야기할 수 있는 간염을 유발한다. HBV의 진단은 혈청학적 발견을 기반으로 한다. 실제로, 바이러스 DNA, 항원 및 이의 각각의 항체는 혈청 속에서 발견할 수 있다. HBV는 일반적인 항원성 결정인자 (a) 및 HBsAg에서 발견된 2개의 상호 배타적인 결정인자 쌍(d/y 및 w/r)을 기반으로 하여 4개의 주요 혈청형(adr, adw, ayr, ayw)으로 세분된다. 게놈의 전체 뉴클레오타이드 서열 변이에 따라 10개의 공지된 유전형(A 내지 J) 및 40개의 공지된 서브유전형(subgenotype)이 존재한다. 유전형은 명백한 기하학적 분포를 가지며 상이한 유전형은 상이한 질환 중증도, 경과 및 합병증 가능성, 및 치료 및 가능하게는 예방접종에 대한 반응과 관련되어 있다. 혈청형 및 유전형은 필수적으로 상응하지 않는다(예컨대, 유전형 D는 10개의 서브유전형(subgenotype)을 갖는다).
현재, 만성 HBV 감염에 대한 치유법은 존재하지 않는다. 치료 선택사항은 간경변의 진행 및 바이러스 복제를 늦추고, HCC 및 간 부전의 발생을 감소시키는 것에 목표를 둔다. 현재의 치료는 2개의 주요 범주로 나뉜다: (1) 면역 매개인자 약물, 즉, 바이러스 감염된 세포와 싸우도록 면역계를 증강시키기 위해 설계된 주로 제I형 인터페론(인터페론 알파 및 페길화된(pegylated) 인터페론 알파); 및 (2) 뉴클레오사이드 유사체(라미부딘, 엔테카비르 및 텔비부딘) 및 뉴클레오타이드 유사체(아데포비르, 디피복실 및 테노포비르)를 포함하고, 바이러스 복제를 방해하는 것을 목표로 하는 항바이러스 약물. HBV 감염에 대한 사망자수(death toll)는 HIV 및 결핵을 기준으로 거의 70만명/년이다. 신규 HBV 감염율이 감소하고 있지만, 간염으로부터 전체적인 사망에 있어서의 증가는 신규 치료 선택사항의 개발의 절실한 필요성을 요구한다.
치료학적 접근법
표면(S), 코어(C), 및 폴리머라제(Pol) 단백질로부터의 HBV 에피토프는 HBV에 대한 세포 면역 반응을 매개하는 감염 동안 T 세포에 의해 표적화된다. MHC-I 및 MHC-II 에피토프를 포함하는 HBV X 단백질(HBx)은 바이러스 발병 및 발암에 관여된 다기능성 조절 단백질이다. 본원에 기술된 HBV 백신 설계는 잠재적인 T 세포 에피토프를 갖는 모든 주요 구성성분을 포함한다. 구체적으로, Pol, Core, Env 및 HBx 내에 유전적 변형(점 돌연변이의 형태) 및 트렁케이션(truncation)을 지닌 2개의 상이한 독특한 설계를 포함하는 HBV 백신이 본원에 제공된다. 또한 사람 단백질 스캐폴드 상에 이식되고 HBV 감염을 제어 및 제거(clearing)시키는데 요구되는 세포 면역 반응을 자극할 수 있는 하전된 디펩타이드에 의해 연결된 독특하에 설계된 다중-에피토프 작제물(즉, 세포독성 T 림프구)가 본원에 제공된다.
HBV 감염을 치료하기 위한 다양한 유전자 치료학적 접근법이 본원에 제공된다. 예를 들면, HBV의 면역계-매개된 제어를 증진시키는데 사용된 전략 중 일부가 표 1에 기술되어 있다. 또한 HBV 치료학적 백신, 프라이밍(priming)을 위한 HBV의 주요 구성성분의 면역원성 영역(HBsAg, HBcAg, HBxAg, HBeAg 및 HB PolAg)의 조합을 포함하는 프라임/부스트(prime/boost) DNA-기반 백신의 지능적인 설계 및 부스팅을 위한 효능제 CD8 T 세포 에피토프의 조합이 본원에 제공된다.
HBV 재조합 백신을 포함하는 조성물, 키트(kit), 및 시스템 및 이의 제조 방법이 본원에 제공된다. 본 개시내용에서 HBV 재조합 백신(예컨대, HBV 설계 1 내지 5)는 HBe, HBx, LHBs, Pol, 및 HBSP의 단백질 가공(protein engineering)을 통해 가공된다. 각각의 HBV 백신 항원 설계는 생물정보학 분석 및 인 실리코(in silico) 단백질 가공 방법(예컨대, 컨센수스 서열에 보다 근접하게 매치하는 항원성 서열의 선택, 항원성 예측, 및 T 세포 에피토프 맵핑, 이는 MHC-I 결합 및 사이토킨 생산에 이은 T 세포 활성화를 초래할 수 있다)을 사용하여 발명자가 선택한 조합적 안내를 통해 실시된다. 본원에 개시된 HBV 백신 설계의 전체적인 작업흐름도는 도 5에 나타나 있으며, 실시예 1에 추가로 설명되어 있다. 본 개시내용은 다중-결실된 고릴라 아데노벡터(GC46)에서 작제된 5개의 HBV 항원 설계(HBV 설계 1 내지 5)를 제공한다.
4개의 항원 설계(HBV 설계 1 내지 4) 및 대조군 항원을 합성하여 아데노벡터 작제를 위한 발현 플라스미드-pAd셔틀(pAdShuttle) 내로 클로닝하였다(도 6). HBV 설계를 분석하여 상이한 링커가 상이한 에피토프의 예측을 유발하는지를 평가하였다. 초기 항원 스크리닝을 일시적인 형질감염, 시험관내(in vitro) 항원 가공 및 단핵구-유래된 수지 세포의 일시적인 형질감염 연구에서의 표시에서 평가하였다. 도 6에 나타낸 바와 같이, HBV 설계 1 및 2는 클래이드(clade) D 컨센수스를 기반으로 설계하였다. 코어(8), 표면(8), 폴리머라제(8), HBx(6) 및 HBPS(2)로부터의 32개의 HBV 펩타이드를 실험 및 기능 데이타, 예를 들면, 면역원성 데이타, 질량-스펙트럼(Mass-spec.) 등을 갖는 문헌으로부터 준비하였다(표 4). HBV 설계 3의 경우, 사람 안키린-유사 반복체(ALR) 단백질 스캐폴드(PDB 코드 1QYM) 펩타이드를 나선 및 루프 영역에서 탄뎀(tandem) 방식으로 이식하였다. 절단가능한 링커 VSQTSKLTR(서열 번호: 111)에 의해 연결된, 2개의 ALR 스캐폴드를 사용하였다. ALR 단백질은 일반적으로 고 발현 및 고 안전성을 갖는다. 따라서, ALR 단백질을 HBV 펩타이드에 대한 스캐폴드로 사용하여 신규한 CTL을 생성하였다. HBV 설계 4 에피토프는 KK 링커로 분리하였다(도 6). RNA qPCR 상대적 발현 검정을 위해, 5'- TGCCAAGAGTGACGTGTCCA-3'(서열 번호: 110)를 스플라이스 프라이머로서 사용하고, 5'-CCCAGGTCCAACTGCAGCCGG-3'(서열 번호: 128)를 스플라이스 프로브로서 사용하였다. 각각의 항원에 대해 설계된 구체적인 프라이머는 역방향 프라이머(reverse primer)로서 사용하였다(도 14).
[표 1]
전달 시스템
고릴라 아데노바이러스 셔틀 벡터(Shuttle Vector)
본 개시내용의 특정의 양태는 하나 이상의 면역 반응-유도성 HBV 폴리펩타이드를 포함하는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드를 포함하는 벡터에 관한 것이다. 특정의 구현예에서, 벡터는 바이러스 벡터이다. 특수한 구현예에서, 벡터는 아데노바이러스 벡터이다. 아데노바이러스는 일반적으로 사람에서 양성 병리학과 관련되어 있으며, 사람을 포함하는, 다양한 종으로부터 단리된 아데노바이러스의 게놈이 집중적으로 연구되었다. 아데노바이러스는 대략 36 kb의 이중 가닥 DNA를 함유하는 중간-크기(90 내지 100 nm)의, 비-엔벨로프된 정이십면체 바이러스이다. 아데노바이러스 캡시드는 바이러스에 의한 세포의 감염의 초기 단계(early stage)의 주요 상호작용을 매개하고, 아데노바이러스 생명 주기의 말기에 아데노바이러스 게놈을 패키징하는데 요구된다. 캡시드는 252개 캡소머(capsomere)를 포함하며, 이는 240개의 헥손, 12개의 펜톤 염기 단백질, 및 12개의 섬유를 포함한다(Ginsberg et al., Virology, 28: 782-83 (1966)). 헥손은 3개의 동일한 단백질, 즉, 폴리펩타이드 II를 포함한다(Roberts et al., Science, 232: 1148-51 (1986)). 펜톤 염기는 5개의 동일한 단백질을 포함하고 섬유는 3개의 동일한 단백질을 포함한다. 단백질 IIIa, VI, 및 IX는 아데노바이러스 코트(coat) 속에 존재하며 바이러스 캡시드를 안정화시키는 것으로 여겨진다(Stewart et al., Cell, 67: 145-54 (1991), 및 Stewart et al., EMBO J., 12(7): 2589-99 (1993)). pIX를 제외한, 캡시드 단백질의 발현은 아데노바이러스 폴리머라제 단백질에 의존한다. 따라서, 아데노바이러스 입자의 주요 구성성분은 폴리머라제 단백질 유전자가 존재하여 발현되는 경우에만 게놈으로부터 발현된다.
아데노바이러스의 수개의 특징은 이들을 치료학적 적용(즉, "유전자 치료요법")을 위해 세포에 유전 물질을 전달하거나, 백신 적용을 위한 항원 전달 시스템으로서 사용하기 위한 이상적인 비히클(vehicle)이 되도록 한다. 예를 들면, 아데노바이러스는 고 역가(예컨대, 약 1013개 입자 단위(pu))로 생산될 수 있으며, 유전 물질을 비-복제하는 및 복제하는 세포로 이동시킬 수 있다. 아데노바이러스 게놈은 다량의 외인성 DNA(약 8 kb 이하)를 수반하도록 조작될 수 있으며, 아데노바이러스 캡시드는 심지어 보다 긴 서열의 전달을 강화시킬 수 있다(Curiel et al., Hum. Gene Ther., 3: 147-154 (1992)). 추가로, 아데노바이러스는 일반적으로 숙주 세포 염색체 내로 통합되지 않지만, 오히려 선형 에피좀(episome)으로서 유지됨으로써 재조합 아데노바이러스가 정상의 세포 기능을 방해할 가능성을 최소화시킨다.
일부 구현예에서, 본원에 기술된 아데노바이러스는 고릴라로부터 단리된다. 이스턴 고릴라(Eastern Gorilla)(고릴라 베린게이(Gorilla beringei)) 및 웨스턴 고릴라(Western Gorilla)(고릴라 고릴라(Gorilla gorilla))의 2개 종 내에 4개의 광범위하게 인식된 고릴라 아종(subspecies)이 존재한다. 웨스턴 고릴라 종은 아종 웨스턴 로우랜드 고릴라(Western Lowland Gorilla)(고릴라 고릴라 고릴라(Gorilla gorilla gorilla)) 및 크로스 리버 고릴라(Cross River Gorilla)(고릴라 고릴라 디이흘리(Gorilla gorilla diehli))를 포함한다. 이스턴 고릴라 종은 아종인 마운틴 고릴라(Mountain Gorilla)(고릴라 베린게이 베린게이(Gorilla beringei beringei)) 및 이스턴 로우랜드 고릴라(Eastern Lowland Gorilla)(고릴라 베린게이 그라우어리(Gorilla beringei graueri))를 포함한다(참고: 예컨대, Wilson and Reeder, eds., Mammalian Species of the World, 3rd ed., Johns Hopkins University Press, Baltimore, Maryland (2005)). 일부 구현예에서, 본 개시내용의 아데노바이러스는 마운틴 고릴라(고릴라 베린게이 베린게이(Gorilla beringei beringei))로부터 단리된다.
다양한 고릴라 아데노바이러스 또는 아데노바이러스 벡터가 국제 특허원 공보 제WO 2013/052832호; 제WO 2013/052811호; 및 제WO 2013 052799호에 기술되어 있으며, 이들 각각은 본원에 이의 전문이 참고로 포함된다.
이러한 수개의 아데노바이러스의 게놈은 분석되었으며, 아데노바이러스는 예를 들면, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 또는 서열 번호: 25의 핵산 서열을 가질 수 있으며, 이들 각각은 아데노바이러스를 유일하게 정의하기 위해 제공되는 다수의 서브-서열, 즉, 서열 번호: 1 내지 10의 핵산 서열, 및 서열 번호: 11 내지 20의 아미노산 서열을 포함한다. 서열 번호: 6 내지 서열 번호: 10은 서열 번호: 16 내지 20 각각의 아미노산 서열을 암호화한다. 서열 번호: 1 내지 5는 서열 번호: 6 내지 10 각각의 핵산 서열의 서브세트이다. 서열 번호: 11 내지 15는 서열 번호: 16 내지 20 각각의 아미노산 서열의 서브세트이다.
아데노바이러스는 아데노바이러스 벡터, 예컨대, 유전자 전달 비히클로서 사용될 이미 공지된 아데노바이러스와 동일한 방식으로 변형될 수 있다. 아데노바이러스 및 아데노바이러스 벡터는 복제-가능(replication-competent)하거나, 조건적으로 복제-가능하거나, 복제-결함성(replication-deficient)일 수 있다.
복제-가능한(replication-competent) 아데노바이러스 또는 아데노바이러스 벡터는 대표적인 숙주 세포, 즉, 아데노바이러스에 의해 전형적으로 감염될 수 있는 세포 내에서 복제할 수 있다. 복제-가능한 아데노바이러스 또는 아데노바이러스 벡터는 숙주 세포 내에서 바이러스 복제를 억제하지 않는 아데노바이러스 게놈 내에서 야생형 아데노바이러스와 비교하여 하나 이상의 돌연변이(예컨대, 하나 이상의 결실, 삽입, 및/또는 치환)을 가질 수 있다. 예를 들면, 아데노바이러스 또는 아데노바이러스 벡터는 E3 영역으로서 공지된 아데노바이러스 초기 영역(early region)의 부분적인 또는 전체의 결실을 가질 수 있으며, 이는 아데노바이러스 또는 아데노바이러스 게놈의 증식에 필수적이지는 않다.
조건적으로 복제하는 아데노바이러스 또는 아데노바이러스 벡터는 예정된 조건 하에서 복제하도록 가공된 아데노바이러스 또는 아데노바이러스 벡터이다. 예를 들면, 복제-필수적인 유전자 기능, 예컨대, 아네노바이러스 초기 영역에 의해 암호화된 유전자 기능은 유도성의, 억제할 수 있거나(repressible), 조직-특이적인 전사 제어 서열, 예컨대, 프로모터에 작동적으로 연결될 수 있다. 이러한 구현예에서, 복제는 전사 제어 서열과 상호작용하는 특이적인 인자의 존재 또는 부재를 필요로 한다. 조건적으로-복제하는 아데노바이러스 벡터는 미국 특허 제5,998,205호에 추가로 기술되어 있다.
복제-결함성 아데노바이러스 또는 아데노바이러스 벡터는 예를 들면, 아데노바이러스 또는 아데노바이러스 벡터가 대표적인 숙주 세포, 특히 아데노바이러스 또는 아데노바이러스 벡터에 의해 감염될 사람내의 대표적인 숙주 세포에서 복제하지 않도록, 하나 이상의 복제-필수 유전자 기능 또는 영역내 결함의 결과로서, 복제에 요구되는 아데노바이러스 게놈의 하나 이상의 유전자 기능 또는 영역의 보충을 필요로 하는 아데노바이러스 또는 아데노바이러스 벡터이다.
본원에 기술된 바와 같은, 유전자 기능 또는 게놈 영역에서의 결함은 이의 핵산 서열이 전체적으로 또는 부분적으로 파열된(예컨대, 결실된) 유전자의 기능을 없애거나 손상시키기 위한(예컨대, 유전자 생성물의 기능을 적어도 약 2배, 5배, 10배, 20배, 30배, 또는 50배까지 감소시키기 위한) 아데노바이러스 게놈의 충분한 유전 물질의 파괴(예컨대, 결실)로서 정의된다. 전체 유전자 영역의 결실은 흔히 복제-필수적인 유전자 기능의 파괴에 요구되지 않는다. 그러나, 하나 이상의 이식유전자(transgene)에 대해 아데노바이러스 게놈 내에 충분한 공간을 제공할 목적으로, 하나 이상의 유전자 영역 대부분을 제거하는 것이 바람직할 수 있다. 유전 물질의 결실이 바람직하지만, 첨가 또는 치환에 의한 유전 물질의 돌연변이가 또한 유전자 기능을 파괴하기 위해 적절하다. 복제-필수 유전자 기능은 아데노바이러스 복제(예컨대, 증식)에 요구되는 유전자 기능이며 예를 들면, 아데노바이러스 초기 영역(예컨대, E1, E2, 및 E4 영역), 후기 영역(예컨대, L1, L2, L3, L4, 및 L5 영역), 바이러스 패키징에 관련된 유전자(예컨대, IVa2 유전자), 및 바이러스-관련된 RNA(예컨대, VA-RNA-1 및/또는 VA-RNA-2)에 의해 암호화된다.
아데노바이러스 또는 아데노바이러스 벡터가 복제-가능하거나 복제-결함성인지 여부에 따라, 아데노바이러스 또는 아데노바이러스 벡터는 아데노바이러스 게놈의 적어도 일부를 보유한다. 아데노바이러스 또는 아데노바이러스 벡터는 단백질 암호화 및 비-단백질 암호화 영역을 포함하는, 아데노바이러스 게놈의 임의의 부위를 포함할 수 있다. 바람직하게는, 아데노바이러스 또는 아데노바이러스 벡터는 아데노바이러스 단백질을 암호화하는 적어도 하나의 핵산 서열을 포함한다. 아데노바이러스 또는 아데노바이러스 벡터는 예를 들면, 초기 영역 유전자(즉, E1A, E1B, E2A, E2B, E3, 및/또는 E4 영역) 중 어느 하나에 의해 암호화된 단백질, 또는 바이러스 구조 단백질을 암호화하는, 후기 영역 유전자(즉, L1, L2, L3, L4, 및 L5 영역) 중 어느 하나에 의해 암호화된 단백질과 같은, 임의의 적합한 아데노바이러스 단백질을 암호화하는 핵산 서열을 포함할 수 있다.
아데노바이러스 또는 아데노바이러스 벡터는 바람직하게는 pIX 단백질, DNA 폴리머라제 단백질, 펜톤(penton) 단백질, 헥손(hexon) 단백질, 및/또는 섬유 단백질을 암호화하는 하나 이상의 핵산 서열을 포함한다. 아데노바이러스 또는 아데노바이러스 벡터는 아데노바이러스 단백질의 전장 아미노산 서열을 암호화하는 전장 핵산 서열을 포함할 수 있다. 대안적으로, 아데노바이러스 또는 아데노바이러스 벡터는 아데노바이러스 단백질의 전장 아미노산 서열 중 일부를 암호화하는 전장 핵산 서열 중 일부를 포함할 수 있다.
핵산 서열의 "일부"는 적어도 10개의 뉴클레오타이드(예컨대, 약 10 내지 약 5000개의 뉴클레오타이드)를 포함한다. 바람직하게는, 핵산 서열의 "일부"는 10개 이상(예컨대, 15개 이상, 20개 이상, 25개 이상, 30개 이상, 35개 이상, 40개 이상, 45개 이상, 50개 이상, 또는 100개 이상)의 뉴클레오타이드, 그러나 5,000개 미만(예컨대, 4900개 이하, 4000개 이하, 3000개 이하, 2000개 이하, 1000개 이하, 800개 이하, 500개 이하, 300개 이하, 또는 100개 이하)의 뉴클레오타이드를 포함한다. 바람직하게는, 핵산 서열의 일부는 약 10 내지 약 3500개의 뉴클레오타이드(예컨대, 약 10, 20, 30, 50, 100, 300, 500, 700, 1000, 1500, 2000, 2500, 또는 3000개의 뉴클레오타이드), 약 10 내지 약 1000개의 뉴클레오타이드(예컨대, 약 25, 55, 125, 325, 525, 725, 또는 925개의 뉴클레오타이드), 또는 약 10 내지 약 500개의 뉴클레오타이드(예컨대, 약 15, 30, 40, 50, 60, 70, 80, 90, 150, 175, 250, 275, 350, 375, 450, 475, 480, 490, 495, 또는 499개의 뉴클레오타이드), 또는 앞서의 값들 중 임의의 2개에 의해 정의된 범위이다. 보다 바람직하게는, 핵산 서열의 "일부"는 약 3200개 이하의 뉴클레오타이드(예컨대, 약 10 내지 약 3200개의 뉴클레오타이드, 약 10 내지 약 3000개의 뉴클레오타이드, 또는 약 30 내지 약 500개의 뉴클레오타이드, 또는 앞서의 값들 중 임의의 2개에 의해 정의된 범위)를 포함한다.
아미노산 서열의 "일부"는 적어도 3개의 아미노산(예컨대, 약 3 내지 약 1,200개의 아미노산)을 포함한다. 바람직하게는, 아미노산 서열의 "부위"는 3개 이상(예컨대, 5개 이상, 10개 이상, 15개 이상, 20개 이상, 25개 이상, 30개 이상, 40개 이상, 또는 50개 이상)의 아미노산, 그러나 1,200개 미만(예컨대, 1,000개 이하, 800개 이하, 700개 이하, 600개 이하, 500개 이하, 400개 이하, 300개 이하, 200개 이하, 또는 100개 이하)의 아미노산을 포함한다. 바람직하게는, 아미노산 서열의 부위는 약 3 내지 약 500개의 아미노산(예컨대, 약 10, 100, 200, 300, 400, 또는 500개의 아미노산), 약 3 내지 약 300개의 아미노산(예컨대, 약 20, 50, 75, 95, 150, 175, 또는 200개의 아미노산), 또는 약 3 내지 약 100개의 아미노산(예컨대, 약 15, 25, 35, 40, 45, 60, 65, 70, 80, 85, 90, 95, 또는 99개의 아미노산), 또는 앞서의 값들 중 임의의 2개에 의해 정의된 범위이다. 보다 바람직하게는, 아미노산 서열의 "부위"는 약 500개 이하의 아미노산(예컨대, 약 3 내지 약 400개의 아미노산, 약 10 내지 약 250개의 아미노산, 또는 약 50 내지 약 100개의 아미노산, 또는 앞서의 값들 중 임의의 2개에 의해 정의된 범위)를 포함한다.
아데노바이러스 pIX 단백질은 아데노바이러스 캡시드 속에 존재하며, 헥손 나노머 상호작용을 강화시키는 것으로 밝혀졌으며, 전장 게놈의 패키징에 필수적이다(참고: 예컨대, Boulanger et al., J. Gen. Virol., 44: 783-800 (1979); Horwitz M.S., "Adenoviridae and their replication" in Virology, 2 nd ed., B.N. Fields et al. (eds.), Raven Press, Ltd., New York, pp. 1679-1721 (1990), Ghosh-Choudhury et al., EMBO J., 6: 1733-1739 (1987), 및 van Oostrum et al, J. Virol., 56: 439-448 (1985)). 아데노바이러스 구조에 대한 이의 기여 이외에, pIX는 또한 전사 특성, 예를 들면, 아데노바이러스 주요 후기 프로모터(MLP) 활성의 자극을 나타내는 것으로 밝혀졌다(참고: 예컨대, Lutz et al., J. Virol., 71(7): 5102-5109 (1997)). 아데노바이러스 pIX 단백질 중 모두 또는 일부를 암호화하는 핵산 서열은 예를 들면, 서열 번호: 6 및 서열 번호: 1을 포함한다. 전장 pIX 단백질 또는 이의 일부를 포함하는 아미노산 서열은 예를 들면, 서열 번호: 16 및 서열 번호: 11을 포함한다.
아데노바이러스 DNA 폴리머라제 단백질은 시험관내(in vitro) 및 생체내(in vivo) 둘 다에서 바이러스 DNA 복제에 필수적이다. 폴리머라제는 말단 단백질의 전구체(pTP)와의 복합체로 동시-정제(co-purifying)하며, 이는 아데노바이러스 DNA의 5' 말단에 공유결합으로 부착된다(Field et al., J. Biol. Chem., 259: 9487-9495 (1984)). 아데노바이러스 DNA 폴리머라제 및 pTP는 E2 영역에 의해 암호화된다. 폴리머라제 단백질은 pIX를 제외한 모든 구조 단백질의 발현에 요구된다. 폴리머라제 단백질에 대한 유전자 서열없이는, 폴리머라제 단백질이 생산되지 않는다. 결과적으로, 바이러스 게놈은 복제되지 않으며, 주요 후기 프로모터는 활성화되지 않고, 캡시드 단백질은 발현되지 않는다. 아데노바이러스 DNA 폴리머라제 단백질 모두 또는 일부를 암호화하는 핵산 서열은 예를 들면, 서열 번호: 7 및 서열 번호: 2를 포함한다. 전장 아데노바이러스 DNA 폴리머라제, 또는 이의 부위를 포함하는 아미노산 서열은 예를 들면, 서열 번호: 17 및 서열 번호: 12를 포함한다.
아데노바이러스 헥손 단백질은 아데노바이러스 캡시드에서 가장 크고 가장 풍부한 단백질이다. 헥손 단백질은 바이러스 캡시드 조립, 캡시드의 정이십면체 대칭의 측정(이는 결과적으로 캡시드 용적 및 DNA 패키징 크기에서 한계를 정의한다), 및 캡시드의 통합성에 필수적이다. 또한, 헥손은 아데노바이러스 벡터의 중화를 감소시키기 위한 변형을 위한 주요 표적이다(참고: 예컨대, Gall et al., J. Virol., 72: 10260-264 (1998), 및 Rux et al., J. Virol., 77(17): 9553-9566 (2003)). 헥손 단백질의 주요 구조적 특징은 혈청형에 걸쳐서 아데노바이러스에 의해 공유되지만, 헥손 단백질은 크기 및 혈청형 사이에서의 면역학적 특성이 상이하다(Jornvall et al., J. Biol. Chem., 256(12): 6181-6186 (1981)). 15개의 아데노바이러스 헥손 단백질의 비교는 헥손의 우세한 항원성 및 혈청형-특이적인 영역이 이의 내부에 길이가 다양한 7개의 별개의 초가변성 영역(HVR1 내지 HVR7) 및 아데노바이러스 혈청형 사이의 서열인 루프 1 및 2(즉, LI 또는 l1, 및 LII 또는 l2 각각) 내에 존재하는 것으로 여겨짐을 나타내었다(Crawford-Miksza et al., J. Virol., 70(3): 1836-1844 (1996)). 아데노바이러스 헥손 단백질 모두 또는 일부를 암호화하는 핵산 서열은 예를 들면, 서열 번호: 9 및 서열 번호: 4를 포함한다. 전장 아데노바이러스 헥손 단백질, 또는 이의 일부를 포함하는 아미노산 서열은 예를 들면, 서열 번호: 19 및 서열 번호: 14를 포함한다.
아데노바이러스 섬유 단백질은 3개의 도메인: 테일(tail), 샤프트(shaft), 및 놉(knob)을 갖는 아데노바이러스 폴리펩타이드 IV의 동종삼량체(homotrimer)이다(Devaux et al., J. Molec. Biol., 215: 567-88 (1990), Yeh et al., Virus Res., 33: 179-98 (1991)). 섬유 단백질은 놉 및 샤프트 도메인을 통해 세포 표면 상의 수용체에 대한 주요 바이러스 결합을 매개한다(Henry et al., J. Virol., 68(8): 5239-46 (1994)). 삼량체화를 위한 아미노산 서열은 놉에 위치하며, 이는 펜톤 염기와 적절히 회합하기 위해 섬유의 아미노 말단(테일)에 필수적인 것으로 여겨진다(Novelli et al., Virology, 185: 365-76 (1991)). 세포 수용체를 인식하고 펜톤 염기에 결합하는 것 외에, 섬유는 혈청형 동일성(serotype identity)에 기여한다. 상이한 아데노바이러스 혈청형으로부터의 섬유 단백질은 현저히 상이하다(참고: 예컨대, Green et al., EMBO J., 2: 1357-65 (1983), Chroboczek et al., Virology, 186: 280-85 (1992), 및 Signas et al., J. Virol., 53: 672-78 (1985)). 따라서, 섬유 단백질은 아데노바이러스의 생명 주기에 대해 중요한 다수 기능을 갖는다. 아데노바이러스 섬유 단백질 중 모두 또는 일부를 암호화하는 핵산 서열은 예를 들면, 서열 번호: 10 및 서열 번호: 5를 포함한다. 전장 아데노바이러스 섬유 단백질, 또는 이의 일부를 포함하는 아미노산 서열은 예를 들면, 서열 번호: 20 및 서열 번호: 15를 포함한다.
아데노바이러스 펜톤 염기 단백질은 정이십면체 캡시드의 꼭지점에 위치하며 5개의 동일한 단량체를 포함한다. 펜톤 염기 단백질은 정이십면체 캡시드의 다수 측면 상에 헥손 단백질을 브릿징하기 위한 구조를 제공하며, 섬유 단백질이 캡시드 내에 혼입되도록 할 필수 접점(interface)를 제공한다. 펜톤 염기의 각각의 단량체는 RGD 트리펩타이드 모티프(motif)를 함유한다(Neumann et al., Gene, 69: 153-157 (1988)). RGD 트리펩타이드는 αv 인테그린에 대한 결합을 매개하며, 펜톤 염기의 RGD 서열 내 점 돌연변이를 갖는 아데노바이러스는 세포를 감염시키는 이의 능력에 있어서 제한된다(Bai et al., J. Virol., 67: 5198-5205 (1993)). 따라서, 펜톤 염기 단백질은 캡시드의 구조 및 바이러스-세포 상호작용의 최대 효율에 필수적이다. 아데노바이러스 펜톤 염기 단백질 중 모두 또는 일부를 암호화하는 핵산 서열은 예를 들면, 서열 번호: 8 및 서열 번호: 3을 포함한다. 전장 아데노바이러스 펜톤 염기 단백질, 또는 이의 일부를 포함하는 아미노산 서열은 예를 들면, 서열 번호: 18 및 서열 번호: 13을 포함한다.
본원에 사용된 바와 같은 핵산 또는 아미노산 서열 "동일성"은 목적한 핵산 또는 아미노산 서열을 참고 핵산 또는 아미노산 서열과 비교함으로써 측정할 수 있다. 목적 서열에서 생성하기 위하여 참고 서열 내에서 변화되고/되거나 변형된(예컨대, 점 돌연변이, 삽입, 또는 결실과 같은) 뉴클레오타이드 또는 아미노산 잔기의 수를 계수한다. 이러한 변화의 전체 수를 목적한 서열의 총 길이로부터 감하고, 차이를 목적한 서열의 길이로 나누고 퍼센트로서 나타낸다. 2개 이상의 서열 사이에 최적의 정렬을 수득하고 동일성을 계산하기 위한 다수의 수학적 알고리즘이 공지되어 있으며 다수의 이용가능한 소프트웨어 프로그램 내에 포함되어 있다. 이러한 프로그램의 예는 CLUSTAL-W, T-Coffee, 및 ALIGN(핵산 및 아미노산 서열의 정렬을 위해), BLAST 프로그램(예컨대, BLAST 2.1, BL2SEQ, 및 이의 이후의 버젼) 및 FASTA 프로그램(예컨대, FASTA3x, FASTM, 및 SSEARCH)(서열 정렬 및 서열 유사성 조사를 위해)을 포함한다. 서열 정렬 알고리즘은 예를 들면, 문헌: Altschul et al., J. Molecular Biol., 215(3): 403-410 (1990), Beigert et al., Proc. Natl. Acad. Sci. USA, 106(10): 3770-3775 (2009), Durbin et al., eds., Biological Sequence Analysis: Probabilistic Models of Proteins and Nucleic Acids, Cambridge University Press, Cambridge, UK (2009), Soding, Bioinformatics, 21(7): 951-960 (2005), Altschul et al., Nucleic Acids Res., 25(17): 3389-3402 (1997), 및 Gusfield, Algorithms on Strings, Trees and Sequences, Cambridge University Press, Cambridge UK (1997))에 개시되어 있다.
아데노바이러스 또는 아데노바이러스 벡터는 단독 또는 임의의 조합의 전술한 서열 중 1개, 2개, 3개, 4개, 또는 5개 모두를 포함할 수 있다. 이와 관련하여, 아데노바이러스 또는 아데노바이러스 벡터는 전술한 서열 중 임의의 2개의 조합, 전술한 서열 중 임의의 3개의 임의의 조합, 전술한 서열의 임의의 4개의 임의의 조합, 또는 전술한 서열의 5개 모두를 포함할 수 있다.
본원에 논의된 바와 같이, 아데노바이러스 또는 아데노바이러스 벡터는 복제-가능하거나, 조건적으로-복제하거나, 복제-결함성일 수 있다. 바람직하게는, 아데노바이러스 또는 아데노바이러스 벡터는 복제-결함성이어서, 복제-결함성 아데노바이러스 또는 아데노바이러스 벡터는 증식을 위한(예컨대, 아데노바이러스 벡터 입자를 형성시키기 위한) 아데노바이러스 게놈의 하나 이상의 영역의 적어도 하나의 복제-필수 유전자 기능의 보충을 필요로 한다.
복제-결함성 아데노바이러스 또는 아데노바이러스 벡터는 증식을 위한 아데노바이러스 게놈의 하나 이상의 영역 내에서 하나 이상의 복제-필수 유전자 기능에서 결함을 유발하기 위한 임의의 적합한 방식으로 변형될 수 있다. 아데노바이러스 게놈의 하나 이상의 영역의 하나 이상의 복제-필수 유전자 기능에서의 결함의 보충은 결함성 복제-필수 유전자 기능을 제공하기 위한 외인성 수단의 사용을 지칭한다. 이러한 보충은 예를 들면, 파괴된 복제-필수 유전자 기능을 암호화하는 세포 및/또는 외인성 DNA(예컨대, 헬퍼 아데노바이러스)를 사용함으로써 임의의 적합한 방식으로 시행할 수 있다.
아데노바이러스 또는 아데노바이러스 벡터는 아데노바이러스 게놈의 초기 영역(즉, E1-E4 영역) 단독, 아데노바이러스 게놈의 후기 영역(즉, L1-L5 영역) 단독, 아데노바이러스 게놈의 초기 및 후기 영역 둘 다, 또는 모든 아데노바이러스 유전자(즉, 고 능력 아데노벡터(HC-Ad)의 하나 이상의 복제-필수 유전자 기능에서 결함성일 수 있다. 문헌: Morsy et al., Proc. Natl. Acad. Sci. USA, 95: 965-976 (1998); Chen et al., Proc. Natl. Acad. Sci. USA, 94: 1645-1650 (1997); 및 Kochanek et al., Hum. Gene Ther., 10: 2451-2459 (1999)를 참고한다. 복제-결함성 아데노바이러스 벡터의 예는 미국 특허 제5,837,511호; 제5,851,806호; 제5,994,106호; 제6,127,175호; 제6,482,616호; 및 제7,195,896호, 및 국제 특허원 공보 제WO 1994/028152호, 제WO 1995/002697호, 제WO 1995/016772호, 제WO 1995/034671호, 제WO 1996/022378호, 제WO 1997/012986호, 제WO 1997/021826호, 및 제WO 2003/022311호에 개시되어 있다.
아데노바이러스 게놈의 초기 영역은 E1, E2, E3, 및 E4 영역을 포함한다. E1 영역은 E1A 및 E1B 서브영역(subregion)을 포함하고, E1 영역내 복제-필수 유전자 기능에서 하나 이상의 결함은 E1A 및 E1B 서브 영역 중 어느 하나 또는 둘 다에서 복제-필수 유전자 기능에서의 하나 이상의 결함을 포함함으로써 아데노바이러스 또는 아데노바이러스 벡터가 증식하기 위한(예컨대, 아데노바이러스 벡터 입자를 형성시키기 위한) 아데노바이러스 게놈의 E1A 서브 영역 및/또는 E1B 서브영역의 보충을 필요로 한다. E2 영역은 E2A 및 E2B 서브영역을 포함하고, E2 영역내 복제-필수 유전자 기능에서의 하나 이상의 결함은 E2A 서브영역 및/또는 E2B 서브 영역 중 어느 하나 또는 둘 다에서 복제-필수 유전자 기능에서의 하나 이상의 결함을 포함함으로써, 아데노바이러스 또는 아데노바이러스 벡터가 증식하기 위한(예컨대, 아데노바이러스 벡터 입자를 형성하기 위한) 아데노바이러스 게놈의 E2A 서브 영역 및/또는 E2B 서브 영역의 보충을 필요로 한다.
E3 영역은 어떠한 복제-필수 유전자 기능도 포함하지 않음으로써, 부분적으로 또는 전체적으로 E3 영역의 결실은 아데노바이러스 또는 아데노바이러스 벡터가 증식하기 위한(예컨대, 아데노바이러스 벡터 입자를 형성하기 위한) E3 영역내 임의의 유전자 기능을 필요로 하지 않는다. 본 개시내용의 맥락에서, E3 영역은 사람 아데노바이러스 5 (NCBI 참고 서열 AP_000218)의 E3 영역으로부터의 12.5K 단백질에 대해 높은 상동성을 지닌 단백질을 암호화하는 개방 판독 프레임(open reading frame)으로 개시하고 사람 아데노바이러스 5(NCBI 참고 서열 AP_000224.1)의 E3 영역으로부터 14.7K 단백질에 대해 높은 상동성을 지닌 단백질을 암호화하는 개방 판독 프레임에서 끝나는 영역으로 정의된다. E3 영역은 전체적으로 또는 부분적으로 결실될 수 있거나 전체적으로 또는 부분적으로 보유될 수 있다. 결실의 크기는 이의 게놈이 최적의 게놈 패키징 크기와 근접하게 매칭되는 아데노바이러스 또는 아데노바이러스 벡터를 보유하도록 조절될 수 있다. 보다 큰 결실은 아데노바이러스 또는 아데노바이러스 게놈 내에 보다 큰 이종 핵산 서열의 삽입을 수용할 것이다. 본 개시내용의 일 구현예에서, E3 영역내 잔류하는, L4 폴리아데닐화 신호 서열이 보유된다.
E4 영역은 다수의 개방 판독 프레임(ORF)을 포함한다. ORF6, 및 일부 경우에 ORF3를 제외하고는 E4 영역의 모든 개방 판독 프레임이 결실된 아데노바이러스 또는 아데노바이러스 벡터는 아데노바이러스 또는 아데노바이러스 벡터가 증식하기 위한(예컨대, 아데노바이러스 벡터 입자를 형성하기 위한) E4 영역내에 임의의 유전자 기능의 보충을 필요로 하지 않는다. 역으로, E4 영역의 ORF6, 및 일부 경우에 ORF3의 파괴 또는 결실을 지니고(예컨대, E4 영역의 ORF6 및/또는 ORF3를 기반으로 복제-필수 유전자 기능에서 결함성을 지닌) E4 영역의 임의의 다른 개방 판독 프레임 또는 천연의 E4 프로모터, 폴리아데닐화 서열, 및/또는 우측 역위된 말단 반복체(inverted terminal repeat: ITR)의 파괴 또는 결실이 존재하거나 부재하는 아데노바이러스 또는 아데노바이러스 벡터는 아데노바이러스 또는 아데노바이러스 벡터가 증식하기 위한(예컨대, 아데노바이러스 벡터 입자를 형성하기 위한) E4 영역(구체적으로, E4 영역의 ORF6 및/또는 ORF3)의 보충을 필요로 한다. 아데노바이러스 게놈의 후기 영역은 L1, L2, L3, L4, 및 L5 영역을 포함한다. 아데노바이러스 또는 아데노바이러스 벡터는 또한 국제 특허원 공보 제WO 2000/000628호에 논의된 바와 같은, 주요 후기 프로모터(MLP) 내에 돌연변이를 가질 수 있으며, 이는 필요한 경우 아데노바이러스 또는 아데노바이러스 벡터 복제-결함성이 되도록 할 수 있다.
복제-필수 유전자 기능에서 하나 이상의 결함을 함유하는 아데노바이러스 게놈의 하나 이상의 영역은 바람직하게는 임의로 E3 영역 중 일부 또는 전체에 결실을 지닌, 아데노바이러스 게놈의 하나 이상의 초기 영역, 즉, E1, E2, 및/또는 E4 영역이다.
복제-결함성 아데노바이러스 또는 아데노바이러스 벡터는 또한 숙주 세포 내에서 바이러스 복제를 억제하지 않는 아데노바이러스 게놈 내에 야생형 아데노바이러스와 비교하여 하나 이상의 돌연변이(예컨대, 하나 이상의 결실, 삽입, 및/또는 치환)을 가질 수 있다. 따라서, 복제-필수 유전자 기능에서 하나 이상의 결함 외에, 아데노바이러스 또는 아데노바이러스 벡터는 복제-필수적이 아닌 다른 관점에서 결함성일 수 있다. 예를 들면, 아데노바이러스 또는 아데노바이러스 벡터는 E3 영역으로서 공지된 아데노바이러스 초기 영역의 부분적인 또는 전체적인 결실을 가질 수 있으며, 이는 아데노바이러스 또는 아데노바이러스 게놈의 증식에 필수적이지 않다.
일 구현예에서, 아데노바이러스 또는 아데노바이러스 벡터는 복제-결함성이며, 증식을 위해(예컨대, 아데노바이러스 벡터 입자를 형성시키기 위해) 아데노바이러스 게놈의 E1 영역 또는 E4 영역의 보충을 최대한 필요로 한다. 따라서, 복제-결함성 아데노바이러스 또는 아데노바이러스 벡터는 증식을 위한(예컨대, 아데노바이러스 벡터 입자를 형성하기 위한) 아데노바이러스 게놈의 E1A 서브영역 및/또는 E1B 영역(E1-결함성 아데노바이러스 벡터로 나타냄) 또는 E4 영역(E4-결함성 아데노바이러스 벡터로 나타냄)의 적어도 하나의 복제-필수 유전자 기능의 보충을 필요로 한다. 아데노바이러스 또는 아데노바이러스 벡터는 아데노바이러스 게놈의 E1 영역의 적어도 하나의 복제-필수 유전자 기능(바람직하게는 모든 복제-필수 유전자 기능) 및 아데노바이러스 게놈의 비필수 E3 영역의 적어도 하나의 유전자 기능에서 결함성일 수 있다(E1/E3-결함성 아데노바이러스 벡터로 나타냄). 아데노바이러스 또는 아데노바이러스 벡터는 아데노바이러스 게놈의 E4 영역의 적어도 하나의 복제-필수 유전자 기능(바람직하게는 모든 복제-필수 유전자 기능) 및 아데노바이러스 게놈의 비필수 E3 영역의 적어도 하나의 유전자 기능에서 결함성일 수 있다(E3/E4-결함성 아데노바이러스 벡터로 나타냄).
일 구현예에서, 아데노바이러스 또는 아데노바이러스 벡터는 복제-결함성이며 증식을 위해(예컨대, 아데노바이러스 벡터 입자를 형성시키기 위해) 아데노바이러스 게놈의 E2 영역, 바람직하게는 E2A 서브 영역의 보충을 최대한 필요로 한다. 따라서, 복제-결함성 아데노바이러스 또는 아데노바이러스 벡터는 증식을 위한(예컨대, 아데노바이러스 벡터 입자를 형성하기 위한) 아데노바이러스 게놈의 E2A 서브영역(E2A-결함성 아데노바이러스 벡터)의 적어도 하나의 복제-필수 유전자 기능의 보충을 필요로 한다. 아데노바이러스 또는 아데노바이러스 벡터는 아데노바이러스 게놈의 E2A 영역의 적어도 하나의 복제-필수 유전자 기능(바람직하게는 모든 복제-필수 유전자 기능) 및 아데노바이러스 게놈의 비필수 E3 영역의 적어도 하나의 유전자 기능에서 결함성일 수 있다(E2A/E3-결함성 아데노바이러스 벡터로 나타냄).
일 구현예에서, 아데노바이러스 또는 아데노바이러스 벡터는 복제-결함성이며 증식을 위해(예컨대, 아데노바이러스 벡터 입자를 형성시키기 위해) 아데노바이러스 게놈의 E1 및 E4 영역의 보충을 최대한 필요로 한다. 따라서, 복제-결함성 아데노바이러스 또는 아데노바이러스 벡터는 증식을 위한(예컨대, 아데노바이러스 벡터 입자를 형성하기 위한) 아데노바이러스 게놈의 E1 및 E4 영역(E1/E4-결함성 아데노바이러스 벡터로 나타냄) 둘 다의 적어도 하나의 복제-필수 유전자 기능의 보충을 필요로 한다. 아데노바이러스 또는 아데노바이러스 벡터는 아데노바이러스 게놈의 E1 영역의 적어도 하나의 복제-필수 유전자 기능(바람직하게는 모든 복제-필수 유전자 기능), 아데노바이러스 게놈의 E4 영역의 적어도 하나의 복제-필수 유전자 기능, 및 아데노바이러스 게놈의 비필수 E3 영역의 적어도 하나의 유전자 기능에서 결함성일 수 있다(E1/E3/E4-결합성 아데노바이러스 벡터로 나타냄). 아데노바이러스 또는 아데노바이러스 벡터는 바람직하게는 증식을 위해 아데노바이러스 게놈의 E1 영역의 보충을 최대한 필요로 하며, 증식을 위해 아데노바이러스 게놈의 임의의 다른 결함의 보충을 필요로 하지 않는다. 보다 바람직하게는, 아데노바이러스 또는 아데노바이러스 벡터는 증식을 위한 아데노바이러스 게놈의 E1 및 E4 영역의 보충을 최대한 필요로 하며, 증식을 위한 아데노바이러스 게놈의 임의의 다른 결함의 보충을 필요로 하지 않는다.
아데노바이러스 또는 아데노바이러스 벡터는, 아데노바이러스 게놈의 다수의 복제-필수 기능에서 결함성인 경우(예컨대, E1/E4-결함성 아데노바이러스 벡터), 단일의 복제-필수 유전자 기능에서 결함성인 아데노바이러스 또는 아데노바이러스 벡터(예컨대, E1-결함성 아데노바이러스 벡터)에 의해 달성된 것과 유사한 보충 세포주 내에서 바이러스 성장을 제공하기 위해 스페이서 서열을 포함할 수 있다. 스페이서 서열은 목적한 길이의 임의의 뉴클레오타이드 서열 또는 서열들, 예를 들면, 길이가 적어도 약 15개 염기쌍인 서열(예컨대, 약 15개 뉴클레오타이드 내지 약 12,000개 뉴클레오타이드), 바람직하게는 약 100개 뉴클레오타이드 내지 약 10,000개 뉴클레오타이드, 보다 바람직하게는 약 500개 뉴클레오타이드 내지 약 8,000개 뉴클레오타이드, 심지어 보다 바람직하게는 약 1,500개 뉴클레오타이드 내지 약 6,000개 뉴클레오타이드, 및 가장 바람직하게는 약 2,000개 내지 약 3,000개 뉴클레오타이드, 또는 앞서의 값들 중 임의의 2개로 정의된 범위를 함유할 수 있다. 스페이서 서열은 암호화 또는 비-암호화일 수 있고 아데노바이러스 게놈과 관련하여 천연적이거나 비-천연적일 수 있지만, 결함성 영역에 대해 복제-필수 기능을 회복하지 않는다. 스페이서는 또한 발현 카세트(expression cassette)를 함유할 수 있다. 보다 바람직하게는, 스페이서는 폴리아데닐화 서열 및/또는 아데노바이러스 또는 아데노바이러스 벡터와 관련하여 비-천연적인 유전자를 포함한다. 아데노바이러스 벡터 내에서 스페이서의 사용은 예를 들면, 미국 특허 제5,851,806호 및 국제 특허원 공보 제WO 1997/021826호에 추가로 기술되어 있다.
아데노바이러스 게놈 모두 또는 일부, 예를 들면, 아데노바이러스 게놈의 E1, E3, 및 E4 영역을 제거함으로써, 수득되는 아데노바이러스 또는 아데노바이러스 벡터는 아데노바이러스 캡시드 내로 패키지되는 능력을 보유하면서 외인성 핵산 서열의 삽입을 허용할 수 있다. 외인성 핵산 서열은 위치내 삽입이 아데노바이러스 또는 아데노바이러스 벡터 입자의 형성을 허용하는 한 아데노바이러스 게놈 내 임의의 위치에 삽입될 수 있다. 외인성 핵산 서열은 바람직하게는 아데노바이러스 게놈의 E1 영역, E3 영역, 또는 E4 영역 내에 위치한다.
본 개시내용의 복제-결함성 아데노바이러스 또는 아데노바이러스 벡터는 복제-결함성 아데노바이러스 또는 아데노바이러스 벡터 내에 존재하지 않는 유전자 기능을 제공하는 세포 주를 보충하는데 있어서 생산될 수 있지만, 고 역가의 바이러스 벡터 스톡(stock)을 생성하기 위하여 적절한 수준에서, 바이러스 증식에 필요할 수 있다. 이러한 보충 세포주는 공지되어 있으며 293개 세포(예컨대, Graham et al., J. Gen. Virol., 36: 59-72 (1977)에 기술됨), PER.C6 세포(예컨대, 국제 특허원 공보 제WO 1997/000326호, 및 미국 특허 제5,994,128호 및 제6,033,908호), 및 293-ORF6 세포(예컨대, 국제 특허원 공보 제WO 95/34671호 및 Brough et al., J. Virol., 71: 9206-9213 (1997)에 기술됨)를 포함하나, 이에 한정되지 않는다. 본 개시내용의 복제-결함성 아데노바이러스 또는 아데노바이러스 벡터를 생산하기 위한 다른 적합한 보충 세포주는 이의 발현이 숙주 세포 내에서 바이러스 성장을 억제하는 이식유전자를 암호화하는 아데노바이러스 벡터를 증식시키기 위해 생성된 보충 세포를 포함한다(참고: 예컨대, 미국 특허원 공보 제2008/0233650호). 추가의 적합한 보충 세포는 예를 들면, 미국 특허 제6,677,156호 및 제6,682,929호, 및 국제 특허원 공보 제WO 2003/020879호에 기술되어 있다. 일부 예에서, 세포 게놈은 이의 유전 생성물이 복제-결함성 아데노바이러스 벡터의 결함 모두에 대해 보충하는, 핵산 서열을 포함할 필요는 없다. 복제-결함성 아데노바이러스 벡터 내에 결여하는 하나 이상의 복제-필수 유전자 기능은 헬퍼 바이러스, 예컨대, 복제-결함성 아데노바이러스 또는 아데노바이러스 벡터의 복제에 필요한 하나 이상의 필수 유전자 기능을 인 트랜스(in trans)로 보충하는 아데노바이러스 벡터에 의해 공급될 수 있다. 대안적으로, 본 발명의 아데노바이러스 또는 아데노바이러스 벡터는 본 발명의 복제-결함성 아데노바이러스 또는 아데노바이러스 벡터에서 결여하는 하나 이상의 복제-필수 유전자 기능을 보충하는 비-천연 복제-필수 유전자를 포함할 수 있다. 예를 들면, E1/E4-결함성 아데노바이러스 벡터는 상이한 아데노바이러스(예컨대, 본 발명의 아데노바이러스 또는 아데노바이러스 벡터보다는 상이한 혈청형의 아데노바이러스, 또는 본 발명의 아데노바이러스 또는 아데노바이러스 벡터보다는 상이한 종의 아데노바이러스)로부터 수득되거나 유래된 E4 ORF 6을 암호화하는 핵산 서열을 함유하도록 가공될 수 있다.
아데노바이러스 또는 아데노바이러스 벡터는 이식유전자를 추가로 포함할 수 있다. 용어 "이식유전자"는 본원에서 적절한 조절 성분(예컨대, 프로모터)에 작동적으로 연결됨으로써, 비-천연 핵산 서열이 발현되어 단백질(예컨대, 펩타이드 또는 폴리펩타이드)를 생산하도록 하는 비-천연 핵산 서열로서 본원에 정의된다. 조절 성분(예컨대, 프로모터)은 아데노바이러스 또는 아데노바이러스 벡터에 대해 천연적이거나 비-천연적일 수 있다.
"비-천연" 핵산 서열은 천연적으로 발생하는 위치에서 아데노바이러스의 천연적으로 발생하는 핵산 서열이 아닌 임의의 핵산 서열(예컨대, DNA, RNA, 또는 cDNA 서열)이다. 따라서, 비-천연 핵산 서열은 아데노바이러스 내에서 천연적으로 발견될 수 있지만, 아데노바이러스 게놈 내 비-천연 위치에 위치하고/하거나 비-천연 프로모터에 작동적으로 연결된다. 용어 "비-천연 핵산 서열", "이종 핵산 서열", 및 "외인성 핵산 서열"은 본 개시내용의 맥락에서 상호교환적으로 사용될 수 있다. 비-천연 핵산 서열은 바람직하게는 DNA이고 바람직하게는 단백질(즉, 하나 이상의 단백질을 암호화하는 하나 이상의 핵산 서열)을 암호화한다.
비-천연 핵산 서열은 질환에 대해 포유동물을 예방학적으로 또는 치료학적으로 치료하는데 사용될 수 있는 치료학적 단백질을 암호화할 수 있다. 적합한 치료학적 단백질의 예는 사이토킨, 독소, 종양 억제인자 단백질, 성장 인자, 호르몬, 수용체, 미토겐(mitogen), 면역글로불린, 신경펩타이드, 신경전달인자, 및 효소를 포함한다. 대안적으로, 비-천연 핵산 서열은 병원체(예컨대, 세균 또는 바이러스)의 항원을 암호화할 수 있으며, 아데노바이러스 또는 아데노바이러스 벡터는 백신으로서 사용될 수 있다.
바이러스 기반 전달 시스템
본 개시내용은 또한 전달 시스템, 예를 들면, 바이러스-기반 시스템을 제공하며, 여기서 본원에 기술된 핵산이 삽입된다. 대표적인 바이러스 발현 벡터는 아데노-관련 바이러스 벡터, 아데노바이러스-기반 벡터, 렌티바이러스-기반 벡터, 레트로바이러스 벡터, 및 헤르페스 바이러스-기반 벡터를 포함하나, 이에 한정되지 않는다. 구현예에서, 바이러스 벡터는 렌티바이러스 벡터이다. 레트로바이러스, 예를 들면, 렌티바이러스로부터 기원한 벡터는 딸 세포(daughter cell) 내에서 이식유전자의 장기간, 안정한 통합 및 이의 증식을 허용하므로 장기간 유전자 전달을 달성하기에 적합한 도구(tool)이다. 렌티바이러스 벡터는 비-증식 세포, 예를 들면, 간 세포를 형질도입시킬 수 있다는 점에서 종양-레트로바이러스, 예를 들면, 쥐 백혈병 바이러스로부터 기원한 벡터보다 추가된 장점을 갖는다. 이들은 또한 낮은 면역원성의 추가된 장점을 갖는다. 추가의 구현예에서, 바이러스 벡터는 아데노-관련 바이러스 벡터이다. 추가의 구현예에서, 바이러스 벡터는 레트로바이러스 벡터이다. 일반적으로, 및 구현예에서, 적합한 벡터는 적어도 하나의 유기체 내에서 기능성인 복제의 오리진(origin), 프로모터 서열, 편리한 제한 엔도뉴클레아제 부위, 및 하나 이상의 선택가능한 마커를 함유한다.
추가의 적합한 벡터는 통합 발현 벡터를 포함하며, 이는 숙주 세포의 DNA 내로 무작위로 통합될 수 있거나, 발현 벡터와 숙주 세포의 염색체 사이에 특이적인 재조합을 가능하도록 하는 재조합 부위를 포함할 수 있다. 이러한 통합 발현 벡터는 목적한 단백질의 발현을 시행하기 위한 숙주 세포의 염색체의 내인성 발현 제어 서열을 활용할 수 있다. 부위 특이적인 방식으로 통합하는 벡터의 예는 예를 들면, Invitrogen(캘리포니아주 칼스바드 소재)로부터의 flp-in 시스템(예컨대, pcDNATM5/FRT), 또는 Stratagene(캘리포니아주 라 졸라 소재)으로부터의 pExchange-6 Core 벡터에서 발견될 수 있는 것과 같은, cre-lox 시스템의 구성성분을 포함한다. 숙주 세포 염색체 내로 무작위적으로 통합되는 벡터의 예는 예를 들면, Invitrogen(캘리포니아주 칼스바드 소재)으로부터의 pcDNA3.1(T-항원의 부재하에 도입되는 경우), 및 Promega(위스콘신주 매디슨 소재)로부터의 pCI 또는 pFN10A (ACT) FLEXITM을 포함한다. 추가의 프로모터 성분, 예컨대, 인핸서는 전사 개시의 빈도를 조절한다. 전형적으로, 다수의 프로모터가 출발 부위의 하부로 기능성 성분을 또한 함유하는 것으로 최근 밝혀졌지만, 이들은 출발 부위의 상부로 30 내지 110 bp 영역 내에 위치한다. 프로모터 성분들 사이의 간격은 흔히 가요성(flexible)이어서, 성분이 삽입되거나 서로에 대해 이동하는 경우 프로모터 기능이 보존된다. 티미딘 키나제(tk) 프로모터에서, 프로모터 성분들 사이의 간격은 활성의 감소가 시작되기 전에 50 bp 떨어지게 증가할 수 있다. 프로모터에 따라, 개개 성분은 협동적으로 또는 독립적으로 기능하여 전사를 활성화시키는 것으로 여겨진다.
적합한 프로모터의 하나의 예는 즉시 초기 사이토메갈로바이러스(immediate early cytomegalovirus: CMV) 프로모터 서열이다. 이러한 프로모터 서열은 이에 작동적으로 연결된 임의의 폴리뉴클레오타이드 서열의 고 수준의 발현을 구동시킬 수 있는 강력한 구성적 프로모터 서열이다.
그러나, 다른 구성적 프로모터 서열, 예를 들면, 그러나 이에 한정되지 않는, 시미안 바이러스 40(SV40) 초기 프로모터, 마우스 유방 종양 바이러스(MMTV), 사람 면역결핍성 바이러스(HIV) 긴 말단 반복체(long terminal repeat: LTR) 프로모터, MoMuLV 프로모터, 조류 백혈병 바이러스 프로모터, 엡슈타인-바르 바이러스(Epstein-Barr virus) 즉시 초기 프로모터, 로우스 육종 바이러스(Rous sarcoma virus) 프로모터 뿐만 아니라 사람 유전자 프로모터, 예를 들면, 그러나 이에 한정되지 않는, 액틴 프로모터, 미오신 프로모터, 헤모글로빈 프로모터, 및 크레아틴 키나제 프로모터를 사용할 수 있다. 또한, 본 개시내용은 구성적 프로모터의 사용에 한정되지 않아야 한다. 유도성 프로모터가 또한 본 개시내용의 부분으로서 고려된다. 유도성 프로모터의 사용은 이러한 발현이 요구되는 경우 이것이 작동적으로 연결되는 폴리뉴클레오타이드 서열의 발현을 작동(turning on)시킬 수 있거나, 발현이 요구되지 않는 경우 작동시키지 않을(turning off) 수 있다. 유도성 프로모터의 예는 메탈로티오닌 프로모터, 글루코코르티코이드 프로모터, 프로게스테론 프로모터, 및 테트라사이클린 프로모터를 포함하나, 이에 한정되지 않는다.
리포터 유전자는 잠재적으로 형질감염된 세포를 확인하고 조절 서열의 기능성을 평가하는데 사용될 수 있다. 일반적으로, 리포터 유전자는 수용체 유기체 또는 조직 내에 존재하지 않거나 이에 의해 발현되지 않고 이의 발현이 일부 용이하게 검출가능한 특성, 예컨대, 효소 활성에 의해 나타나는 폴리펩타이드를 암호화하는 유전자이다. 리포터 유전자의 발현은 DNA가 수용체 세포 내로 도입된 후 적합한 시간에 검정된다. 적합한 리포터 유전자는 루시퍼라제, 베타-갈락토시다제, 클로람페니콜 아세틸 트랜스퍼라제, 분비된 알칼린 포스파타제, 또는 녹색 형광성 단백질 유전자(예컨대, Ui-Tei et al., FEBS Letters 479: 79-82 (2000))를 암호화하는 유전자를 포함할 수 있다. 적합한 발현 시스템을 잘 공지되어 있으며 공지된 기술을 사용하여 제조될 수 있거나 상업적으로 수득될 수 있다. 일반적으로, 리포터 유전자의 고 수준의 발현을 나타내는 최소의 5' 플랭킹 영역(flanking region)을 지닌 작제물이 프로모터로서 확인된다. 이러한 프로모터 영역은 리포터 유전자에 연결시켜 프로모터-유래된 전사를 조절하는 능력에 대해 제제(agent)를 평가하기 위해 사용될 수 있다.
유전자를 세포 내로 도입시키고 발현시키는 방법은 당해 분야에 공지되어 있다. 발현 벡터의 맥락에서, 벡터는 숙주 세포, 예컨대, 포유동물, 세균, 효모, 또는 곤충 세포 내로 당해 분야의 임의의 방법에 의해 용이하게 도입시킬 수 있다. 예를 들면, 발현 벡터는 물리적, 화학적, 또는 생물학적 수단에 의해 숙주 세포내로 전달할 수 있다.
폴리뉴클레오타이드를 숙주 세포 내로 도입시키는 물리적 방법은 인산칼슘 침전, 지질감염, 입자 충격(particle bombardment), 미세주사, 전기천공(electroporation) 등을 포함한다. 벡터 및/또는 외인성 핵산을 포함하는 세포를 생산하는 방법은 당해 분야에 잘 공지되어 있다. 예를 들면, 문허: Sambrook et al. (Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory, New York (2001))을 참고한다. 구현예에서, 폴리뉴클레오타이드를 숙주 세포 내로 도입시키는 방법은 인산칼슘 형질감염 또는 폴리에틸렌이민(PEI) 형질감염이다.
목적한 폴리뉴클레오타이드를 숙주 세포내로 도입시키기 위한 생물학적 방법은 DNA 및 RNA 벡터의 사용을 포함한다. 바이러스 벡터, 및 특히 레트로바이러스 벡터는 유전자를 포유동물, 예컨대, 사람 세포 내로 삽입시키기 위해 가장 광범위하게 사용된 방법이 되어 왔다. 다른 바이러스 벡터는 렌티바이러스, 폭스바이러스, 헤르페스 단성 바이러스 I, 아데노바이러스 및 아데노-관련 바이러스 등으로부터 유래할 수 있다. 예를 들면, 미국 특허 제5,350,674호 및 제5,585,362호를 참고한다.
비-바이러스 기반 전달 시스템
폴리뉴클레오타이드를 숙주 세포 내로 도입시키기 위한 화학적 방법은 콜로이드성 분산 시스템, 예를 들면, 거대분자 복합체, 나노캅셀(nanocapsule), 미세구(microsphere), 비드(bead), 및 지질-기반 시스템, 예를 들면 수중유(oil-in-water) 에멀젼, 미셀(micelle), 혼합된 미셀, 및 리포좀을 포함한다. 시험관내 및 생체 내에서 전달 비히클로서 사용하기 위한 예시적인 콜로이드성 시스템은 리포좀(예컨대, 인공 막 소낭)이다.
지질 제형의 사용은 핵산을 숙주 세포 내로 도입시키기 위해 고려된다(시험관내, 생체외(ex vivo) 또는 생체내). 다른 양태에서, 핵산은 지질과 관련될 수 있다. 지질과 관련된 핵산은 리포좀의 수성 내부 내에 캡슐화(encapsulating)되거나, 리포좀의 지질 이층 내에 배치되거나, 리포좀 및 올리고뉴클레오타이드 둘 다와 관련된 연결 분자를 통해 리포좀에 부착되거나, 리포좀 내에 인트랩(entrap)되거나, 리포좀과 복합체화되거나, 지질을 함유하는 용액 속에 분산되거나, 지질과 혼합되거나, 지질과 조합되거나, 지질 속의 현탁액으로서 함유되거나 미셀과 함께 함유되거나 복합체화되거나, 또는 그렇지 않으면 지질과 회합된다. 지질, 지질/DNA 또는 지질/발현 벡터 회합된 조성물은 용액 속의 임의의 특수한 구조에 제한되지 않는다. 예를 들면, 이들은 미셀로서, 또는 "붕괴된" 구조로, 이층 구조 내에 존재할 수 있다. 이들은 또한 용액 속에 단순히 산재되어, 가능하게는 크기 또는 형태가 균일하지 않은 응집물을 형성할 수 있다. 지질은 천연적으로 발생한 또는 합성 지질일 수 있는 지방 물질이다. 예를 들면, 지질은 세포질 속에 천연적으로 발생하는 지방 소적(droplet) 뿐만 아니라 장쇄 지방족 탄수화물 및 이들의 유도체, 예를 들면, 지방산, 알코올, 아민, 아미노 알코올, 및 알데하이드를 함유하는 화합물의 부류를 포함한다.
사용하기에 적합한 지질은 상업적 공급원으로부터 수득할 수 있다. 예를 들면, 디미리스틸 포스파티딜콜린("DMPC")은 미주리주 세인트 루이스(St. Louis) 소재의 Sigma로부터 수득될 수 있고; 디세틸 포스페이트("DCP")는 K & K Laboratories(뉴욕주 플레인뷰(Plainview) 소재)로부터 수득될 수 있으며; 콜레스테롤("Choi")은 Calbiochem-Behring으로부터 수득될 수 있고; 디미리스틸 포스파티딜글리세롤("DMPG") 및 다른 지질은 Avanti Polar Lipids, Inc.(Birmingham, Ala.)로부터 수득될 수 있다. 클로로포름 또는 클로로포름/메탄올 속의 지질의 스톡 용액은 약 -20℃에서 저장할 수 있다. 클로로포름은 메탄올보다 더 용이하게 증발되므로 유일한 용매로서 사용된다. "리포좀"은 봉입된(enclosed) 지질 이층 또는 응집물의 생성에 의해 형성된 다양한 단일 및 다중라멜라 지질 소낭을 포함하는 일반적인 용어이다. 리포좀은 인지질 이층 막 및 내부 수성 매질을 지닌 소낭 구조를 갖는 것으로 특징화될 수 있다. 다중라멜라 리포좀은 수성 매질에 의해 분리된 다수의 지질 층을 갖는다. 이들은 인지질이 과량의 수용액 속에 현탁되는 경우에 자발적으로 형성된다. 지질 구성성분은 밀폐된 구조의 형성 전에 자가-재배열을 겪으며 지질 이층 사이에 물과 용해된 용질을 인트랩(entrap)시킨다(Ghosh et al., Glycobiology 5: 505-10 (1991)). 그러나 정상의 소낭 구조보다는 용액 속에 상이한 구조를 갖는 조성물이 또한 포함된다. 예를 들면, 지질은 미셀 구조(micellar structure)로 추정될 수 있거나 단지 지질 분자의 비균일 응집물로서 존재할 수 있다. 리포펙타민-핵산 복합체가 또한 고려된다.
일부 예에서, 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 또한 비-바이러스 기반 전달 시스템, 예를 들면, DNA 서열을 척추동물의 염색체 내로 도입시키기 위한 합성 DNA 트랜스포존(transposon) 시스템을 지칭하는 "슬리핑 뷰티(Sleeping Beauty: SB) 트랜스포존 시스템(Transposon System)"을 사용하여 세포 내로 도입시킬 수 있다. 시스템의 일부 예시적인 구현예는 예를 들면, 미국 특허 제6,489,458호 및 제8,227,432호에 기술되어 있다. 슬리핑 뷰티 트랜스포존 시스템은 슬리핑 뷰티(SB) 트랜스포사제 및 SB 트랜스포존으로 구성된다. 구현예에서, 슬리핑 뷰티 트랜스포존 시스템은 SB11 트랜스포존 시스템, SB100X 트랜스포존 시스템, 또는 SB110 트랜스포존 시스템을 포함한다.
DNA 트랜스포존은 하나의 DNA 부위로부터 다른 것으로 단순한, 절단-및-페이스트 방식(cut-and-paste manner)으로 전좌된다(translocate). 전좌는 정의된 DNA 분절(segment)이 하나의 DNA 분자로부터 절개되어 동일한거나 상이한 DNA 분자 또는 게놈 내에서 다른 부위로 이동하는 정밀한 공정이다. 다른 Tc1/마리너-유형(mariner-type) 트랜스포사제에서와 같이, SB 트랜스포사제는 트랜스포존을 수용체 DNA 서열 내의 TA 디뉴클레오타이드 염기 쌍 내로 삽입시킨다. 삽입 부위는 동일한 DNA 분자 내, 또는 다른 DNA 분자(또는 염색체) 내의 어느 곳일 수 있다. 사람을 포함하는 포유동물 게놈에서, 대략 2억개의 TA 부위가 존재한다. TA 삽입 부위는 트랜스포존 통합 공정에서 중복되어 있다. TA 서열의 이러한 중복은 전좌의 특징이며 일부 실험에서 메카니즘을 확인하기 위해 사용된다. 트랜스포사제는 트랜스포존 내에서 암호화될 수 있거나 트랜스포사제는 다른 공급원, 예를 들면, DNA 또는 mRNA 공급원에 의해 공급될 수 있고, 이러한 경우에 트랜스포존은 비-자가 성분이 된다. 비-자가 트랜스포존은 삽입 후 독립적으로 절개 및 재-삽입을 지속할 수 없기 때문에 유전 도구로서 가장 유용하다. SB 트랜스포존은 유전자를 척추동물의 게놈 내로 도입하기 위한 및 유전자 치료요법을 위한 비-바이러스 벡터로서 사용되는 것으로 고려된다.
외인성 핵산을 숙주 세포 내로 도입하거나 또는 그렇지 않으면 세포를 본 개시내용의 억제제에 노출시키는데 사용된 방법과 상관없이, 숙주 세포 내에서 재조합 DNA 서열의 존재를 확인하기 위하여, 다양한 검정을 수행할 수 있다. 이러한 검정은 예를 들면, 당해 분야의 기술자에게 잘 공지된 분자 검정, 예를 들면, 서던 및 노던 블롯팅(Southern and Northern blotting), RT-PCR 및 PCR; "생화학적" 검정, 예를 들면, 예컨대, 면역학적 수단(ELISA 및 웨스턴 블롯)에 의하거나 본 개시내용의 영역 내에 속하는 제제를 확인하기 위해 본원에 기술된 검정에 의해, 특수한 펩타이드의 존재 또는 부재를 검출하는 것을 포함한다.
구현예에서, 본원에 기술된 변형된 효과기 세포 및 다른 유전 성분은 SB11 트랜스포존 시스템, SB100X 트랜스포존 시스템, SB110 트랜스포존 시스템, piggyBac 트랜스포존 시스템(참고: 예컨대, Wilson et al, "PiggyBac Transposon-mediated Gene Transfer in Human Cells," Molecular Therapy 15:139-145 (2007), 본원에 이의 전문이 참고로 포함됨) 및/또는 piggyBac 트랜스포존 시스템(참고: 예컨대, Mitra et al., "Functional characterization of piggyBac from the bat Myotis lucifugus unveils an active mammalian DNA transposon", Proc. Natl. Acad. Sci USA 110:234-239 (2013)을 사용하여 세포로 전달된다. 추가의 트랜스포사제 및 트랜스포존 시스템은 미국 특허 제6,489,458호; 제6,613,752호, 제7,148,203호; 제7,985,739호; 제8,227,432호; 제9,228,180호; 미국 특허 공보 제2011/0117072호; Mates et al., Nat Genet, 41(6):753-61 (2009). doi: 10.1038/ng.343. Epub 2009 May 3, Gene Ther., 18(9):849-56 (2011). doi: 10.1038/gt.2011.40. Epub 2011 Mar 31 및 in Ivics et al., Cell, 91(4):501-10, (1997)에 제공되며, 이들 각각은 이의 전문이 본원에 참고로 포함된다.
추가의 적합한 비-바이러스 시스템은 발현 벡터를 통합시키는 단계를 포함할 수 있으며, 발현 벡터는 숙주 세포의 DNA 내로 무작위로 통합될 수 있거나, 발현 벡터와 숙주 세포의 염색체 사이에 특이적인 재조합을 가능하도록 하는 재조합 부위를 포함할 수 있다. 이식유전자의 예정된 유전성 유전자자리(genetic loci) 내로의 표적화된 통합은 많은 적용을 위해 바람직한 목표이다. 첫째로, 부위-특이적인 리콤비나제에 대한 제1의 재조합 부위는 무작위 또는 예정된 위치에서 게놈 부위에 삽입시킨다. 후속적으로, 세포는 목적한 유전자 또는 DNA 및 제2의 재조합 부위 및 리콤비나제에 대한 공급원(발현 플라스미드, RNA, 단백질, 또는 바이러스-발현 리콤비나제)을 수반하는 플라스미드로 형질감염시킨다. 제1 재조합 부위와 제2 재조합 부위 사이의 재조합은 플라스미드 DNA의 통합을 생성한다.
이러한 통합 발현 벡터는 숙주 세포의 염색체의 내인성 발현 제어 서열을 이용하여 목적한 단백질의 발현을 실시할 수 있다. 일부 구현예에서, 표적화된 통합은 통합 부위를 플랭킹(flanking)하는 서열에 대해 상동성인 공여체 폴리뉴클레오타이드 상의 서열의 존재에 의해 촉진된다. 예를 들면, 본원에 기술된 공여체 폴리뉴클레오타이드를 사용한 표적화된 통합은 통상의 형질감염 기술, 예컨대, 동종 재조합에 의한 유전자 녹아웃(gene knockout) 또는 녹인(knockin)을 생성하는데 사용된 기술에 따라 달성할 수 있다. 다른 구현예에서, 표적화된 통합은 통합 부위를 플랭킹하는 서열에 대해 상동성인 공여체 폴리뉴클레오타이드 상의 서열의 존재, 및 부위-특이적인 리콤비나제의 존재 하에 공여체 폴리뉴클레오타이드와 세포를 접촉시킴 둘 다에 의해 촉진된다. 부위-특이적인 리콤비나제에 의해, 또는 단순히 리콤비나제에 의해, 이는 이의 양립성 재조합 부위 사이에서 보존적인 부위-특이적인 재조합을 촉매하는 폴리펩타이드임을 의미한다. 본원에 사용된 바와 같이, 부위-특이적인 리콤비나제는 천연의 폴리펩타이드 뿐만 아니라 활성을 보유하는 유도체, 변이체 및/또는 단편, 및 활성을 보유하는 리콤비나제를 암호화하는 천연의 폴리뉴클레오타이드, 유도체, 변이체, 및/또는 단편을 포함한다.
또한 숙주 세포 내에서 이종 유전자를 통합시키기 위한 시스템이 본원에 제공되며, 상기 시스템은 하나 이상의 유전자 발현 카세트를 포함한다. 일부 예에서, 시스템은 제1의 폴리펩타이드 작제물을 암호화하는 제1의 폴리뉴클레오타이드를 포함하는 제1의 유전자 발현 카세트를 포함한다. 다른 예에서, 시스템은 제2의 폴리펩타이드 작제물을 암호화하는 제2의 폴리뉴클레오타이드를 포함하는 제2의 유전자 발현 카세트를 포함할 수 있다. 여전히 다른 예에서, 시스템은 제3의 발현 카세트를 포함할 수 있다. 일 구현예에서, 유전자 발현 카세트 중 하나는: (i) 전사활성화 도메인(transactivation domain); (ii) 핵 수용체 리간드 결합 도메인; (iii) DNA-결합 도메인; 및 (iv) 엑다이손 수용체 결합 도메인(ecdysone receptor binding domain) 중 하나 이상을 암호화하는 유전자 스위치 폴리뉴클레오타이드를 포함할 수 있다. 다른 구현예에서, 시스템은 재조합 부착 부위; 및 세린 리콤비나제를 포함함으로써; 상기 세포가 적어도 상기 제2의 유전자 발현 카세트와 접촉시, 상기 세린 리콤비나제의 존재하에서, 상기 이종 유전자가 상기 숙주 세포 내에서 통합되도록 한다.
일부 예에서, 시스템은 리간드를 추가로 포함함으로써, 상기 숙주 세포와 접촉시, 상기 리간드의 존재하에서, 상기 이종 유전자가 상기 숙주 세포 내에서 발현되도록 한다. 하나의 예에서, 시스템은 또한 재조합 부착 부위를 포함한다. 일부 에에서, 하나의 재조합 부착 부위는 파아지 게놈성 재조합 부착 부위(attP) 또는 세균 게놈성 재조합 부착 부위(attB)이다. 하나의 예에서, 숙주 세포는 진핵 세포이다. 다른 예에서, 숙주 세포는 사람 세포이다. 추가의 예에서, 숙주 세포는 T 세포 또는 NK 세포이다.
프로모터
"프로모터"는 암호화 서열의 전사를 개시하는 폴리뉴클레오타이드의 영역을 지칭한다. 프로모터는 동일한 가닥 상에 및 DNA 상의 상부(센스 가닥(sense strand)의 5' 영역을 향해)에서 유전자의 전사 출발 부위 근처에 위치한다. 일부 프로모터는 세포 내 모든 환경에서 활성이므로 구성적인 반면, 다른 것은 조절되어 특이적인 자극, 예컨대, 유도성 프로모터에 대한 반응시 활성이 된다. 여전히 다른 프로모터는 조직 특이적이거나 활성화된 프로모터이며, T-세포 특이적인 프로모터를 포함하나, 이에 한정되지 않는다.
본원에 사용된 바와 같은 용어 "프로모터 활성" 및 이의 문법적 등가물은 이의 활성이 측정되는 프로모터에 대해 작동적으로 연결된 뉴클레오타이드 서열의 발현 정도를 지칭한다. 프로모터 활성은 예를 들면, 노던 블롯 분석에 의해 생산된 RNA 전사체의 양을 측정함으로써 직접적으로 또는 연결된 핵산 서열, 예를 들면, 프로모터에 연결된 리포터 핵산 서열에 의해 암호화된 생성물의 양을 측정함으로써 간접적으로 측정될 수 있다.
본원에 사용된 바와 같은 "유도성 프로모터"는 전사 조절인자, 예컨대, 생물 인자(biotic factor) 또는 무생물 인자(abiotic factor)의 존재 또는 부재에 의해 활성으로 도입된 프로모터를 지칭한다. 유도성의 프로모터는 이들에 작동적으로 연결된 유전자의 발현이 유기체의 발달의 특정 단계에서 또는 특수한 조직 내에서 작동되거나 작동되지 않을 수 있으므로 유용하다. 유도성 프로모터의 예는 알코올-조절된 프로모터, 테트라사이클린-조절된 프로모터, 스테로이드-조절된 프로모터, 금속-조절된 프로모터, 발병-조절된 프로모터, 온도-조절된 프로모터 및 광-조절된 프로모터이다. 일 구현예에서, 유도성 프로모터는 유전성 스위치의 부분이다. 유도성 프로모터는 유전자 스위치 리간드 유도성 프로모터일 수 있다. 일부 경우에, 유도성 프로모터는 소 분자 리간드-유도성 2개의 폴리펩타이드 엑다이손 수용체-기반 유전자 스위치, 예를 들면, RHEOSWITCH® 유전자 스위치일 수 있다. 일부 경우에, 유전자 스위치는: 제PCT/US2001/009050호(제WO 2001/070816호); 미국 특허 제7,091,038호; 제7,776,587호; 제7,807,417호; 제8,202,718호; 제PCT/US2001/030608호(제WO 2002/029075호); 미국 특허 제8,105,825호; 제8,168,426호; 제PCT/1J52002/005235호(제WO 2002/066613호); 미국 특허원 제10/468,200호(미국 공보 제20120167239호); 제PCT/US2002/005706호(제WO 2002/066614호); 미국 특허 제7,531,326호; 제8,236,556호; 제8,598,409호; 제PCT/U52002/005090호(제WO 2002/066612호); 미국 특허 제8,715,959호(미국 공보 제20060100416호); 제PCT/US2002/005234호(제WO 2003/027266호); 미국 특허 제7,601,508호; 제7,829,676호; 제7,919,269호; 제8,030,067호; 제PCT/U52002/005708호(제WO 2002/066615호); 미국 특허원 제10/468,192호(미국 공보 제20110212528호); 제PCT/US2002/005026호(제WO 2003/027289호); 미국 특허 제7,563,879호; 제8,021,878호; 제8,497,093호; 제PCT/US2005/015089호(제WO 2005/108617호); 미국 특허 제7,935,510호; 제8,076,454호; 제PCT/U52008/011270호(제WO 2009/045370허); 미국 특허원 제12/241,018호(미국 공보 제20090136465호); 제PCT/US2008/011563호(제WO 2009/048560호); 미국 특허원 제12/247,738호(미국 공보 제20090123441호); 제PCT/US2009/005510호(제WO 2010/042189호); 미국 특허원 제13/123,129호(미국 공보 제20110268766호); 제PCT/US2011/029682호(제WO 2011/119773호); 미국 특허원 제13/636,473호(미국 공보 제20130195800호); 제PCT/US2012/027515호(제WO 2012/122025호); 및 미국 특허 제9,402,919호(이들 각각은 이의 전문이 참고로 포함된다)에 기술된 임의의 시스템에 기술되어 있지만 이에 한정되지 않는 엑다이손-기반 수용체 구성성분으로부터 선택될 수 있다.
대상체에게 적어도 2개의 기능성 단백질 또는 이의 일부; 적어도 하나의 프로모터; 및 적어도 하나의 가공된 재조합 부위를 포함하는 본원에 기술된 폴리펩타이드 서열을 암호화하는 폴리뉴클레오타이드를 포함하는 적어도 하나의 비-바이러스 벡터를 투여함을 포함하는 방법이 본원에 제공되며; 상기 적어도 하나의 프로모터는 상기 적어도 2개의 기능성 단백질의 발현을 유도(driving)시킨다. 일부 경우에, 적어도 하나의 프로모터는 구성적일 수 있다. 일부 경우에, 적어도 하나의 프로모터는 조직-특이적일 수 있다. 일부 경우에, 적어도 하나의 프로모터는 유도성일 수 있다. 일부 경우에, 유도성 프로모터는 소 분자 리간드(small molecular ligand)-유도성의 2개의 폴리펩타이드 엑다이손 수용체-기반 유전자 스위치이다. 다른 경우에, 프로모터의 조합(여기서 적어도 하나의 프로모터는 유도성일 수 있고 적어도 하나의 프로모터는 활성화 특이적일 수 있다)이 활용될 수 있다.
유도성 프로모터는 상기 적어도 2개의 유전자 발현의 용량-조절된 제어를 위해 리간드를 이용한다. 일부 경우에, 리간드는 엑다이스테로이드, 9-시스-레티노산, 레티노산의 합성 유사체, N,N'-디아실하이드라진, 옥사디아졸린, 디벤조일알킬 시아노하이드라진, N-알킬-N,N'-디아로일하이드라진, N-아실-N-알킬카보닐하이드라진, N-아로일-N-알킬-N'-아로일하이드라진, 아르니도케톤, 3,5-디-3급-부틸-4-하이드록시-N-이소부틸-벤즈아미드, 8-O-아세틸하르파기드, 옥시스테롤, 22(R) 하이드록시콜레스테롤, 24(S) 하이드록시콜레스테롤, 25-에폭시콜레스테롤, T0901317, 5-알파-6-알파-에폭시콜레스테롤-3-설페이트(ECHS), 7-케토콜레스테롤-3-설페이트, 프라메솔, 담즙산, 1,1-비포스포네이트 에스테르, 청소년 호르몬(juvenile hormone) III, RG-115819 (3,5-디메틸-벤조산 N-(1-에틸-2,2-디메틸-프로필)-N'-(2-메틸-3-메톡시-벤조일)-하이드라지드-), RG-115932 ((R)-3,5-디메틸-벤조산 N-(1-3급-부틸-부틸)-N'-(2-에틸-3-메톡시-벤조일)-하이드라지드), 및 RG- 115830(3,5 -디메틸-벤조산 N-(1-3급-부틸-부틸)-N'-(2-에틸-3-메톡시-벤조일)-하이드라지드), 및 이의 임의의 조합으로 이루어진 그룹으로부터 선택될 수 있다.
일부 구현예에서, 프로모터는 유도성 프로모터이다. 일부 구현예에서, 프로모터는 비-유도성 프로모터이다. 일부 경우에, 프로모터는 조직-특이적인 프로모터일 수 있다. 여기서, "조직-특이적인"은 조직 또는 세포형의 서브세트(subset)에서 유전자의 조절된 발현을 지칭한다. 일부 경우에, 조직-특이적인 프로모터는 공간적으로 조절됨으로써 프로모터가 유기체의 특정 조직 또는 세포형에서만 발현을 유도하도록 할 수 있다. 다른 경우에, 조직-특이적인 프로모터는 일시적으로 조절됨으로써 프로모터가 유기체의 발달 동안을 포함하여, 시간에 걸쳐 차등적으로 세포형 또는 조직내에서 발현을 유도하도록 할 수 있다. 일부 경우에, 조직-특이적인 프로모터는 공간적으로 및 일시적으로 둘 다 조절된다. 특정의 구현예에서, 조직-특이적인 프로모터는 세포형의 특수한 시간 또는 단계에 구성적으로 또는 간헐적으로 특정의 세포형에서 활성화된다. 예를 들면, 조직-특이적인 프로모터는 특이적인 세포, 예를 들면, T 세포 또는 NK 세포가 활성화되는 경우 활성화되는 프로모터일 수 있다. T 세포는 예를 들면, MHC 제II 부류 분자에 의해 펩타이드 항원과 함께 나타나는 경우, 다양한 방법으로 활성화될 수 있다.
하나의 경우에, 적어도 하나의 프로모터는 가공된 프로모터 또는 이의 변이체이다. 본원에 기술된 바와 같이, 프로모터는 IL-2로부터의 최소의 프로모터 서열 및 다음 중 하나 이상을 혼입시킬 수 있다: 활성화된 T-세포의 핵 인자(NFAT) 반응 성분(들); NFIL2D 반응 성분, NFkB/TCF 반응 성분, NF_AT/NFIL2B 반응 성분 또는 NFIL2A/OCT 반응 성분. 반응 성분의 예는 이의 전문이 본원에 포함된, 문헌: Mattila et al., EMBO J. 9(13):4425-33 (1990)에 기술되어 있다.
일부 구현예에서, 적어도 하나의 프로모터는 IL-2 코어 프로모터(서열 번호: 26)를 포함한다. 일 구현예에서, 적어도 하나의 프로모터는 IL-2 최소 프로모터(서열 번호: 27)를 포함한다. 다른 구현예에서, 적어도 하나의 프로모터는 IL-2 인핸서 및 프로모터 변이체(서열 번호: 26 내지 서열 번호: 28)를 포함한다. 여전히 다른 구현예에서, 적어도 하나의 프로모터는 NF-κB 결합 부위(서열 번호: 30 내지 서열 번호: 32)를 포함한다. 일부 구현예에서, 적어도 하나의 프로모터는 (NF-κB)1-IL2 프로모터 변이체(서열 번호: 30)를 포함한다. 일부 구현예에서, 적어도 하나의 프로모터는 (NF-κB)3-IL2 프로모터 변이체(서열 번호: 31)를 포함한다. 일부 구현예에서, 적어도 하나의 프로모터는 (NF-κB)6-IL2 프로모터 변이체(서열 번호: 32)를 포함한다. 일 구현예에서, 적어도 하나의 프로모터는 활성화된 T-세포(NFAT) 반응 성분-IL2 프로모터 변이체의 1X 핵 인자(서열 번호: 33)를 포함한다. 다른 구현예에서, 적어도 하나의 프로모터는 3X NFAT 반응 성분(서열 번호: 34 내지 서열 번호: 35)을 포함한다. 여전히 다른 구현예에서, 적어도 하나의 프로모터는 6X NFAT 반응 성분-IL2 프로모터 변이체(서열 번호: 36 내지 서열 번호: 39)를 포함한다. 일부 구현예에서, 적어도 하나의 프로모터는 사람 EF1A1 프로모터 변이체(서열 번호: 40 및 서열 번호: 41)를 포함한다. 일부 구현예에서, 적어도 하나의 프로모터는 사람 EF1A1 프로모터 및 인핸서(서열 번호: 42)를 포함한다. 일부 구현예에서, 적어도 하나의 프로모터는 사람 UBC 프로모터(서열 번호: 43)를 포함한다. 일부 구현예에서, 적어도 하나의 프로모터는 6개 부위 GAL4-유도성의 인접 인자 결합 성분(proximal factor binding element)(PFB)을 포함한다. 일부 구현예에서, 적어도 하나의 프로모터는 합성의 최소 프로모터 1(유도성 프로모터)(서열 번호: 44)를 포함한다.
본원에 기술된 IL-12 발현의 리간드 유도성 제어를 위한 유전자 스위치의 사용은 예를 들면 조절된 발현을 허용하고 치료학적 지표를 증진시킴으로써 IL-12의 안전성 프로파일(safety profile)을 증진시킬 수 있다. 그러나, 유전자 스위치(들)을 사용하여 IL-12의 리간드 용량 의존성 발현을 위한 조건은 활성인자 리간드(예컨대, 벨레디멕스)의 존재 또는 부재이다. 특정의 구현예에서, IL-12 발현의 유도를 위한 추가의 조건적 제어가 고려된다. T 세포 활성화된 특이적인 프로모터의 제어 하에서 유전자 스위치 구성성분이 제공된다. 이는 유전자 스위치의 제어 하에서 이식유전자(들)의 벨레디멕스 조절된 발현에 필수적인 유전자 스위치 구성성분의 조건적 발현(예컨대, T 세포 활성화)을 야기한다. 일부 구현예에서, 이는 발레디멕스가 존재하고 T 세포가 활성화되는 경우 종양 특이적인 T 세포에 의해 IL-12 또는 IL-15와 같은 사이토킨의 우선적 발현을 야기한다. 이는 증가된 국재화된 수준의 유전자 스위치 제어된 이식유전자 발현을 이끌 수 있다.
예를 들면, 유전자 스위치 구성성분의 T 세포 활성화된 특이적인 발현은 활성화된 T-세포의 핵 인자(NFAT) 반응 구성성분(들)을 포함하는 프로모터에 의해 제어될 수 있다. NFAT 전사 인자는 효과기 T-세포 상태의 주요 조절인자이다. NFAT는 고갈(exhaustion)을 전진적으로 유도시키는 초기 전사 체크포인트(early transcriptional checkpoint)이다. NFAT는 TCR 자극 후 T 세포 내에서 신속하게 활성화되며 적절한 공-자극 신호전달에 의해 유도된 AP-1과 함께 단백질 복합체를 형성하며 효과기 유전자 및 T-세포 기능을 조절한다. NFAT 반응 성분(들)은 다른 최소의 프로모터 서열(예컨대, IL2 최소 프로모터)과 융합되어 T 세포 활성화에 대한 반응시 이식유전자의 발현을 유도시킬 수 있다.
활성화 특이적인 프로모터의 다른 예는 인터류킨-2 (IL2) 프로모터 및 프로그램화된 사멸(Programmed Death)(PD)-1(CD279) 프로모터를 포함하나, 이에 한정되지 않는다. 유전자 스위치 구성성분은 또한 전염증성 신호전달 경로의 NF-κB와 같은 다른 핵 인자에 대한 결합 부위를 최소 프로모터 서열(예컨대, IL2)에 융합시킴으로써 면역 세포 활성화시 조건적으로 발현시킬 수 있다.
특정의 구현예에서, 프로모터는: IL-2 코어 프로모터, IL-2 최소의 프로모터, IL-2 인핸서 및 프로모터 변이체, (NF-κB)1-IL2 프로모터 변이체, (NF-κB)3-IL2 프로모터 변이체, (NF-κB)6-IL2 프로모터 변이체, 1X NFAT 반응 성분-IL2 프로모터 변이체, 3X NFAT 반응 성분-IL2 프로모터 변이체, 6X NFAT 반응 성분-IL2 프로모터 변이체, 사람 EEF1A1 프로모터 변이체, 사람 EEF1A1 프로모터 및 인핸서, 사람 UBC 프로모터 및 합성의 최소의 프로모터 1 중 임의의 하나 이상일 수 있다. 특정 구현예에서, 프로모터 뉴클레오타이드는 서열 번호: 26 내지 서열 번호: 44를 포함할 수 있다.
유전자 스위치
유전자 스위치 폴리펩타이드, 리간드-유도성 유전자 스위치 폴리펩타이드를 암호화하는 폴리뉴클레오타이드, 및 이러한 폴리펩타이드 및/또는 폴리뉴클레오타이드를 혼입시키는 방법 및 시스템이 본원에 제공된다. 특정의 양태에서, 본 개시내용은 이종 유전자 발현의 유도성 제어를 위한 유전자 스위치 시스템을 암호화하는 하나 이상의 폴리뉴클레오타이드를 포함하는 폴리뉴클레오타이드에 관한 것이며, 여기서 이종 유전자 발현은 상기 유전자 스위치 시스템에 의해 조절되고, 상기 이종 유전자는 본원에 개시된 하나 이상의 면역 반응-유도성 B형 간염 바이러스(HBV) 폴리펩타이드를 포함하는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드를 포함한다.
용어 "유전자 스위치"는 프로모터와 관련된 반응 성분, 및 예를 들면, 하나 이상의 리간드의 존재 하에서, 이의 내부로 반응 성분 및 프로모터가 혼입된 유전자의 발현을 조절하는 EcR 기반 시스템의 조합을 지칭한다. 강력하게 조절된 유도성 유전자 발현 시스템 또는 유전자 스위치는 다양한 적용, 예를 들면, 유전자 치료요법, 세포 내에서 단백질의 대규모 생산, 세포 기반한 고 처리량(high throughput) 스크리닝 검정(cell based high throughput screening assay), 기능성 유전학 및 형질도입 식물 및 동물에서 특성의 조절에 유용하다. 이러한 유도성 유전자 발현 시스템은 리간드 유도성 이종 유전자 발현 시스템을 포함할 수 있다.
EcR-기반 유전자 스위치의 초기 버젼(early version)은 드로소필라 멜라노가스터(Drosophila melanogaster) EcR(DmEcR) 및 무스 무스쿨루스(Mus musculus) RXR(MmRXR) 폴리펩타이드를 사용하였으며 이러한 수용체는 스테로이드, 포나스테론A의 존재하에서 포유동물 세포주 및 형질도입 마우스에서 이러한 리포터(reporter) 유전자를 전사활성화시킴(transactivate)이 밝혀졌다(Christopherson et al., Proc. Natl. Acad. Sci. USA 89(14):6314-18 (1992); No et al., Proc. Natl. Acad. Sci. USA 93(8):3346-51 (1996)). 이후에, 문헌: Suhr et al. (Proc. Natl. Acad. Sci. USA 95(14):7999-8004 (1998))은 비-스테로이드성 엑다이손 효능제, 테부페노지드가 외인성 이종이량체 파트너의 부재하에서 봄빅스 모리(Bombyx mori) EcR(BmEcR)을 통해 포유동물 세포 내 리포터 유전자의 고수준의 전사활성화를 유도하였음을 나타내었다.
국제 특허원 제PCT/US97/05330호(제WO 97/38117호) 및 제PCT/US99/08381호(제WO99/58155호)는 외인성 유전자의 발현을 조절하는 방법을 개시하고 있으며, 여기서 외인성 유전자 및 엑다이손 반응 성분을 포함하는 DNA 작제물은 이에 대한 리간드의 존재하에서, 및 임의로 사일런트 파트너(silent partner)로서 작용할 수 있는 수용체의 존재하에서 엔다이손 반응 성분에 결합하여 유전자 발현을 유도하는 엑다이손 수용체를 포함하는 제2의 DNA 작제물에 의해 활성화된다. 이러한 예에서, 엑다이손 수용체는 드로소필라 멜라노가스터(Drosophila melanogaster)로부터 단리되었다. 전형적으로, 이러한 시스템은 최적의 활성화를 제공하기 위하여, 사일런트 파트너, 바람직하게는 레티노이드 X 수용체(RXR)의 존재를 필요로 한다. 포유동물 세포에서, 곤충 엑다이손 수용체(EcR)는 포유동물 레티노이드 X 수용체(RXR)와 이종이량체화될 수 있으며, 이에 의해, 리간드 의존적 방식으로 표적 유전자 또는 이종 유전자의 발현을 조절하는데 사용된다. 국제 특허원 제PCT/US98/14215호(제WO 99/02683호)는 누에 나방(silk moth) 봄빅스 모리로부터 단리된 엑다이손 수용체가 외인성 이량체 파트너에 대한 필요성없이 포유동물 시스템에서 기능성임을 개시하고 있다.
미국 특허 제6,265,173호는 수용체의 스테로이드/갑상선 상과(superfamily)의 다양한 구성원이 유전자 발현 시스템에서 사용하기 위한 USP의 이량체화 도메인을 적어도 포함하는 드로소필라 멜라노가스터 울트라스피라클 수용체(ultraspiracle receptor)(USP) 또는 이의 단편과 조합될 수 있음을 기술하고 있다. 미국 특허 제5,880,333호는 식물에서 사용된 드로소필라 멜라노가스터 EcR 및 울트라스피라클(USP) 이종이량체 시스템을 개시하고 있으며 여기서 전사활성화 도메인 및 DNA 결합 도메인은 2개의 상이한 하이브리드 단백질 상에 위치한다. 각각의 이러한 경우에서, 전사활성화 도메인 및 DNA 결합 도메인(국제 특허원 제PCT/US98/14215호에서와 같은 천연의 EcR로서 또는 국제 특허원 제PCT/US97/05330호에서와 같은 변형된 EcR로서)은 단일 분자 내로 혼입되었고 다른 이종이량체 파트너, USP 또는 RXR은 이의 천연 상태로 사용되었다.
국제 특허원 제PCT/US01/0905호는 엑다이손 수용체-기반 유도성 유전자 발현 시스템을 개시하고 있으며, 여기서 전사활성화 및 DNA 결합 도메인은 이들을 2개의 상이한 단백질 상에 위치시킴으로써 서로로부터 분리되어 리간드의 부재하에서 크게 감소된 배경 활성 및 리간드의 존재하에서 배경보다 유의적으로 증가된 활성을 야기한다. 이러한 2-하이브리드 시스템(two-hybrid system)은 특허원 제PCT/US97/05330호 및 제PCT/US98/14215호에 개시된 2개의 시스템과 비교하여 유도성 유전자 발현 조절 시스템을 유의적으로 개선시킨다. 2-하이브리드 시스템은 전사 활성화 도메인이 DNA 결합 도메인에 대해 보다 유리한 위치가 되도록 함으로써 DNA 결합 도메인이 유전자 상의 DNA 결합 부위에 결합하는 경우, 전사활성화 도메인이 프로모터를 보다 효과적으로 활성화시키도록 하는 상호작용 단백질의 쌍의 능력을 발휘하는 것으로 여겨진다(참고: 예를 들면, 미국 특허 제5,283,173호). 2-하이브리드 유전자 발현 시스템은 2개의 유전자 발현 카세트; 핵 수용체 폴리펩타이드에 융합된 DNA 결합 도메인을 암호화하는 제1의 유전자 발현 카세트, 및 상이한 핵 수용체 폴리펩타이드에 융합된 전사활성화 도메인을 암호화하는 제2의 유전자 발현 카세트를 포함한다. 리간드의 존재하에서, 제1의 폴리펩타이드와 제2의 폴리펩타이드의 상호작용을 촉진함으로써 이에 의해 DNA 결합 도메인 및 전사활성화 도메인의 이량체화를 생성하는 구조적 변화가 유도되는 것으로 여겨진다. DNA 결합 및 전사활성화 도메인은 2개의 상이한 분자 상에 잔류하므로, 리간드의 부재하에서 배경 활성은 크게 감소된다.
또 다른 놀라운 발견은 2-하이브리드 시스템의 특정 변형이 또한 스테로이드 리간드, 예를 들면, 포나스테론 A("PonA") 또는 무리스테론 A("MurA")과 비교하는 경우, 비-스테로이드성 리간드, 예를 들면, 디아실하이드라진에 대해 개선된 민감성을 제공할 수 있다는 것이었다. 즉, 스테로이드와 비교하는 경우, 비-스테로이드성 리간드는 보다 낮은 리간드 농도에서 더 높은 전사 활성을 제공하였다. 또한, 2-하이브리드 시스템은 변형되지 않은 RXR이 스위칭 파트너로서 사용되는 경우 발생할 수 있는 RXR의 과발현으로 인하여 일부 부작용을 피한다. 바람직한 2-하이브리드 시스템에서, EcR 또는 RXR의 천연의 DNA 결합 및 전사활성화 도메인은 제거되며 그 결과, 이러한 하이브리드 분자는 세포 내에 존재하는 다른 스테로이드 호르몬 수용체와 상호작용하는 기회가 거의 없으며, 따라서 감소된 부작용을 야기한다.
엑다이손 수용체(EcR)는 핵 수용체 상과의 구성원이며 아과(subfamily) 1, 그룹 H(본원에서 "그룹 H 핵 수용체"로 지칭됨)으로 분류된다. 각각의 그룹의 구성원은 E(리간드 결합) 도메인 내에서 40 내지 60% 아미노산 동일성을 공유한다(Laudet et al., A Unified Nomenclature System for the Nuclear Receptor Subfamily, 1999; Cell 97: 161-163). 엑다이손 수용체 외에도, 이러한 핵 수용체 아과 1, 그룹 H의 다른 구성원은: 편재된 수용체(ubiquitous receptor)(UR), 오르판 수용체(Orphan receptor) 1(OR-1), 스테로이드 호므론 핵 수용체 1(NER-1), RXR 상호작용 단백질-15(RIP-15), 간 x 수용체 β(LXRβ), 스테로이드 호르몬 수용체 유사 단백질(RLD-1), 간 x 수용체(LXR), 간 x 수용체 α(LXRα), 파르네소이드 x 수용체(FXR), 수용체 상호작용 단백질 14(RIP-14), 및 파르네솔 수용체(HRR-1)를 포함한다.
일부 경우에, 유도성 프로모터는 소 분자 리간드-유도성의 2개의 폴리펩타이드 엑다이손 수용체-기반 유전자 스위치, 예를 들면, Intrexon Corporation의 RHEOSWITCH® 유전자 스위치일 수 있다. 일부 경우에, 유전자 스위치는 제PCT/US2001/009050호(제WO 2001/070816호); 미국 특허 제7,091,038호; 제7,776,587호; 제7,807,417호; 제8,202,718호; 제PCT/US2001/030608호(제WO 2002/029075호); 미국 특허 제8,105,825호; 제8,168,426호; 제PCT/1J52002/005235호(제WO 2002/066613호); 미국 특허원 제10/468,200호(미국 공보 제20120167239호); 제PCT/US2002/005706호(제WO 2002/066614호); 미국 특허 제7,531,326호; 제8,236,556호; 제8,598,409호; 제PCT/U52002/005090호(제WO 2002/066612호); 미국 특허 제8,715,959호(미국 공보 제20060100416호); 제PCT/US2002/005234호(제WO 2003/027266호); 미국 특허 제7,601,508호; 제7,829,676호; 제7,919,269호; 제8,030,067호; 제PCT/U52002/005708호(제WO 2002/066615호); 미국 특허원 제10/468,192호(미국 공보 제20110212528호); 제PCT/US2002/005026호(제WO 2003/027289호); 미국 특허 제7,563,879호; 제8,021,878호; 제8,497,093호; 제PCT/US2005/015089호(제WO 2005/108617호); 미국 특허 제7,935,510호; 제8,076,454호; 제PCT/U52008/011270호(제WO 2009/045370호); 미국 특허원 제12/241,018호(미국 공보 제20090136465호); 제PCT/US2008/011563호(제WO 2009/048560호); 미국 특허원 제12/247,738호(미국 공보 제20090123441호); 제PCT/US2009/005510호(제WO 2010/042189호); 미국 특허원 제13/123,129호(미국 공보 제20110268766호); 제PCT/US2011/029682호(제WO 2011/119773호); 미국 특허원 제13/636,473호(미국 공보 제20130195800호); 제PCT/US2012/027515호(제WO 2012/122025호); 및 미국 특허 제9,402,919호(이들 각각은 이의 전문이 참고로 포함된다)에 기술된 임의의 시스템에 기술되어 있지만, 이에 한정되지 않는 엑다이손-기반 수용체 구성성분으로부터 선택될 수 있다.
본원에 개시된 유전자-스위치 폴리펩타이드를 발현하는 폴리뉴클레오타이드를 포함하는, 숙주 세포 내에서 이종 유전자 및 인터류킨의 발현을 조절하기 위한 시스템이 제공된다.
일부 구현예에서 제1의 폴리펩타이드를 암호화하는 제1의 폴리뉴클레오타이드를 포함하는 제1의 유전자 발현 카세트; 제2의 폴리펩타이드를 암호화하는 제2의 폴리뉴클레오타이드를 포함하는 제2의 유전자 발현 카세트; 및 리간드를 포함하는, 숙주 세포 내에서 이종 유전자 및 사이토킨의 발현을 조절하기 위한 시스템이 제공되며; 상기 제1 및 제2의 폴리펩타이드는: (i) 전사활성화 도메인; (ii) DNA-결합 도메인; 및 (iii) 리간드 결합 도메인; (iv) 상기 이종 유전자; 및 (vi) 상기 사이토킨 중 하나 이상을 포함함으로써 상기 숙주 세포가 상기 제1의 유전자 발현 카세트 및 상기 제2의 유전자 발현 카세트와 상기 리간드의 존재하에서 접촉하는 경우, 상기 이종 유전자 및 상기 사이토킨이 상기 숙주 세포 내에서 발현되도록 한다. 일부 경우에, 이종 유전자는 본원에 기술된 항원 결합 폴리펩타이드를 포함한다. 일부 경우에, 사이토킨은 적어도 하나의 케모킨, 인터페론, 인터류킨, 림포킨, 종양 괴사 인자, 또는 이의 변이체 또는 조합을 포함한다. 일부 경우에, 사이토킨은 인터류킨이다. 일부 경우에 인터류킨은 IL12, IL2, IL15, IL21, 및 이의 기능성 변이체 및 단편 중 적어도 하나이다. 일부 구현예에서, 사이토킨은 막 결합되거나 분비될 수 있다. 다른 구현예에서, 사이토킨은 세포내일 수 있다. 인터류킨은 막 결합된 IL-15(mbIL-15) 또는 IL-15 및 IL-15Rα의 융합체를 포함할 수 있다. 일부 구현예에서, mbIL-15은 본원에 기술된 변형된 효과기 세포와 공-발현될 수 있는 막-결합된 키메라 IL-15이다. 일부 구현예에서, mbIL-15는 전장 IL-15Rα, 이의 기능성 단편 또는 변이체와 프레임내(in frame)에 융합된 전장 IL-15(예컨대, 천연의 IL-15 폴리펩타이드) 또는 이의 단편 또는 변이체를 포함한다. 일부 경우에, IL-15는 링커를 통해 IL-15Rα에 간접적으로 연결된다. 일부 예에서, mbIL-15는 문헌: Hurton et al., "Tethered IL-15 augments antitumor activity and promotes a stem-cell memory subset in tumor-specific T cells", Proc. Natl. Acad. Sci. USA 113(48):E7788-E7797 (2016)에 기술된 바와 같다. 다른 양태에서, 인터류킨은 IL-12를 포함할 수 있다. 일부 구현예에서, IL-12은 단일 쇄 IL-12(scIL-12), 프로테아제 민감성 IL-12, 탈안정화된 IL-12, 막 결합된 IL-12, 삽입된(intercalated) IL-12이다. 일부 예에서, IL-12 변이체는 제WO2015/095249호, 제WO2016/048903호, 제WO2017/062953호에 기술된 바와 같으며, 이들 모두는 이의 전문이 참고로 포함된다.
유전자 스우치 폴리펩타이드를 암호화하는 폴리뉴클레오타이드가 본원에 제공되며, 상기 유전자 스위치 폴리펩타이드는: a) 핵 수용체 리간드 결합 도메인에 융합된 DNA-결합 도메인을 포함하는 제1의 유전자 스위치 폴리펩타이드, 및 b) 핵 수용체 리간드 결합 도메인에 융합된 전사활성화 도메인을 포함하는 제2의 유전자 스위치 폴리펩타이드를 포함하고, 여기서 제1의 유전자 스위치 폴리펩타이드 및 제2의 유전자 스위치 폴리펩타이드는 링커에 의해 연결되어 있다. 일부 경우에, 링커는 본원에 기술된 링커, 예를 들면, GSG 링커, 푸린링크(furinlink), 2A 링커, 예를 들면, F/T2A, T2A, p2A, GSG-p2A, 이의 변이체 및 유도체일 수 있다. 다른 예에서, 링커는 IRES일 수 있다.
일부 경우에, DNA 결합 도메인(DBD)은 본원에 기술된 DBD, 예를 들면, GAL4(GAL4 DBD), LexA DBD, 전사 인자 DBD, 스테로이드/갑상선 호르몬 핵 수용체 상과(superfamily) 구성원 DBD, 세균성 LacZ DBD, 및 효모 DBD 중 적어도 하나를 포함한다. 전사활성화 도메인은 본원에 기술된 전사활성화 도메인, 예를 들면, VP16 전사활성화 도메인, p53 전사활성화 도메인 및 B42 산성 활성인자 전사활성화 도메인을 포함할 수 있다. 핵 수용체 리간드 결합 도메인은 엑다이손 수용체(EcR), 편재하는 수용체, 오르판 수용체 1, NER-1, 스테로이드 호르몬 핵 수용체 1, 레티노이드 X 수용체 상호작용 단백질-15, 간 X 수용체 β, 스테로이드 호르몬 수용체 유사 단백질, 간 X 수용체, 간 X 수용체 α, 파르네소이드 X 수용체, 수용체 상호작용 단백질 14, 및 파메솔 수용체 중 적어도 하나를 포함할 수 있다.
일부 경우에, 폴리펩타이드 링커 또는 리보소옴-스키핑 서열(ribosome-skipping sequence)에 의해 연결된 유전자 스위치 폴리펩타이드는 리간드-유도성 유전자 스위치와 비교하여 유전자 발현의 개선된 용량-의존성 리간드-유도성 제어를 나타내고 여기서 유전자 스위치 폴리펩타이드는 비-암호화 서열, 예를 들면, IRES에 의해 연결된다. 일부 경우에, 2A 링커에 의해 연결된 유전자 스위치 폴리펩타이드는 유전자 스위치와 비교하여 이종 유전자 발현의 개선된 용량-의존성 리간드-유도성 제어를 나타낼 수 있으며 상기 유전자 스위치 폴리펩타이드는 IRES에 의해 분리된다.
일부 구현예에서, 유전자 스위치는 VP16 전사활성화 도메인을 포함한다. 일 구현예에서, 유전자 스위치는 엑다이손 수용체(EcR), 편재하는 수용체, 오르판 수용체 1, NER-1, 스테로이드 호르몬 핵 수용체 1, 레티노이드 X 수용체 상호작용 단백질-15, 간 X 수용체 β, 스테로이드 호르몬 수용체 유사 단백질, 간 X 수용체, 간 X 수용체 α, 파르네소이드 X 수용체, 수용체 상호작용 단백질 14, 및 파메솔 수용체 중 적어도 하나를 포함한다. 다른 구현예에서, 유전자 스위치의 DNA-결합 도메인(DBD)은 GAL4(GAL4 DBD), LexA DBD, 전사 인자 DBD, 스테로이드/갑상선 호르몬 핵 수용체 상과 구성원 DBD, 세균성 LacZ DBD, 및 효모 DBD 중 적어도 하나를 포함한다. 여전히 다른 경우에, 유전자 스위치는 울트라스피라클(ultraspiracle) 단백질(USP), 레티노이드 수용체 X(RXR), 이의 기능성 단편 및 변이체 중 적어도 하나를 추가로 포함하며 상기 기능성 단편 및 변이체는 EcR에 결합할 수 있다.
본원에 기술된 바와 같은 폴리펩타이드 및 폴리뉴클레오타이드는 가공된 세포 내에서 발현될 수 있다. 본원에서 가공된 세포는 이의 천연 또는 내인성 상태로부터 변형된 세포이다. 가공된 세포의 예는 예를 들면, 본원에 기술된 유전자 스위치 폴리펩타이드, 목적한 유전자(GOI), 세포 태그(tag), 이종 유전자, 및 임의의 다른 폴리펩타이드 및 폴리뉴클레오타이드를 암호화하도록 변형된(폴리뉴클레오타이드의 세포 내로의 형질감염에 의함) 본원에 기술된 세포이다.
리간드
일부 구현예에서, 유도성 유전자 스위치 조절에 사용된 리간드는 다음 중 어느 것으로부터 선택될 수 있지만, 이에 한정되지 않는다: N-[(1R)-1-(1,1-디메틸에틸)부틸]-N'-(2-에틸-3-메톡시벤조일)-3,5-디메틸벤조하이드라지드(또한 벨레디멕스로 지칭됨), (2S,3R,5R,9R,10R,13R,14S,17R)-17-[(2S,3R)-3,6-디하이드록시-6-메틸헵탄-2-일]-2,3,14-트리하이드록시-10,13-디메틸- 2,3,4,5,9,11,12,15,16,17-데카하이드로-1H-사이클로펜타[a]페난트렌-6-온; N'-(3,5-디메틸벤조일)-N'-[(3R)-2,2-디메틸-3-헥사닐]-2-에틸-3-메톡시벤조하이드라지드; 5-메틸-2,3-디하이드로-벤조[1,4]디옥신-6-카복실산 N'-(3,5-디메틸-벤조일)-N'-(1-에틸-2,2-디메틸-프로필)-하이드라지드; 5-메틸-2,3-디하이드로-벤조[1,4]디옥신-6-카복실산 N'-(3,5-디메톡시-4-메틸-벤조일)-N'-(1-에틸-2,2-디메틸-프로필)-하이드라지드; 5-메틸-2,3-디하이드로-벤조[1,4]디옥신-6-카복실산 N'-(1-3급-부틸-부틸)-N'-(3,5-디메틸-벤조일)-하이드라지드; 5-메틸-2,3-디하이드로-벤조[1,4]디옥신-6-카복실산 N'-(1-3급-부틸-부틸)-N'-(3,5-디메톡시-4-메틸-벤조일)-하이드라지드; 5-에틸-2,3-디하이드로-벤조[1,4]디옥신-6-카복실산 N'-(3,5-디메틸-벤조일)-N'-(1-에틸-2,2-디메틸-프로필)-하이드라지드; 5-에틸-2,3-디하이드로-벤조[1,4]디옥신-6-카복실산 N'-(3,5-디메톡시-4-메틸-벤조일)-N'-(1-에틸-2,2-디메틸-프로필)-하이드라지드; 5-에틸-2,3-디하이드로-벤조[1,4]디옥신-6-카복실산 N'-(1-3급-부틸-부틸)-N'-(3,5-디메틸-벤조일)-하이드라지드; 5-에틸-2,3-디하이드로-벤조[1,4]디옥신-6-카복실산 N'-(1-3급-부틸-부틸)-N'-(3,5-디메톡시-4-메틸-벤조일)-하이드라지드; 3,5-디메틸-벤조산 N-(1-에틸-2,2-디메틸-프로필)-N'-(3-메톡시-2-메틸-벤조일)-하이드라지드; 3,5-디메톡시-4-메틸-벤조산 N-(1-에틸-2,2-디메틸-프로필)-N'-(3-메톡시-2-메틸-벤조일)-하이드라지드; 3,5-디메틸-벤조산 N-(1-3급-부틸-부틸)-N'-(3-메톡시-2-메틸-벤조일)-하이드라지드; 3,5-디메톡시-4-메틸-벤조산 N-(1-3급-부틸-부틸)-N'-(3-메톡시-2-메틸-벤조일)-하이드라지드; 3,5-디메틸-벤조산 N-(1-에틸-2,2-디메틸-프로필)-N'-(2-에틸-3-메톡시-벤조일)-하이드라지드; 3,5-디메톡시-4-메틸-벤조산 N-(1-에틸-2,2-디메틸-프로필)-N'-(2-에틸-3-메톡시-벤조일)-하이드라지드; 3,5-디메틸-벤조산 N-(1-3급-부틸-부틸)-N'-(2-에틸-3-메톡시-벤조일)-하이드라지드; 3,5-디메톡시-4-메틸-벤조산 N-(1-3급-부틸-부틸)-N'-(2-에틸-3-메톡시-벤조일)-하이드라지드; 2-메톡시-니코틴산 N-(1-3급-부틸-펜틸)-N'-(4-에틸-벤조일)-하이드라지드; 3,5-디메틸-벤조산 N-(2,2-디메틸-1-페닐-프로필)-N'-(4-에틸-벤조일)-하이드라지드; 3,5-디메틸-벤조산 N-(1-3급-부틸-펜틸)-N'-(3-메톡시-2-메틸-벤조일)-하이드라지드; 및 3,5-디메톡시-4-메틸-벤조산 N-(1-3급-부틸-펜틸)-N'-(3-메톡시-2-메틸-벤조일)-하이드라지드.
일부 경우에, 엑다이손 수용체-기반 유도성 유전자 스위치의 용량-조절된 대조군에 대해 사용된 리간드는 엑다이스테로이드, 예를 들면, 엑다이손, 20-하이드록시엑다이손, 포나스테론 A, 무리스테론 A 등, 9-시스-레티노산, 레티노산의 합성 유사체, N,N'-디아실하이드라진, 예를 들면, 미국 특허 제6,013,836호; 제5,117,057호; 제5,530,028호; 및 제5,378,726호 및 미국 특허공개공보 제2005/0209283호 및 제2006/0020146호에 기술된 것; 미국 특허 공개공보, 제2004/0171651호에 기술된 바와 같은 옥사디아졸린; 디벤조일알킬 시아노하이드라진, 예를 들면, 유럽 특허원 제461,809호에 개시된 것; N-알킬-N,N'-디아로일하이드라진, 예를 들면, 미국 특허 제5,225,443호에 개시된 것; N-아실-N-알킬카보닐하이드라진, 예를 들면, 유럽 특허원 제234,994호에 기술된 것; N-아로일-N-알킬-N'-아로일하이드라진, 예를 들면, 미국 특허 제4,985,461호에 기술된 것; 아르니도케톤, 예를 들면, 미국 특허 공개공보 제2004/0049037호에 기술된 것(상기 문헌 각각은 본원에 참고로 포함된다) 및 다른 유사한 물질, 예를 들면, 3,5-디-3급-부틸-4-하이드록시-N-이소부틸-벤즈아미드, 8-O-아세틸하르파기드, 옥시스테롤, 22(R) 하이드록시콜레스테롤, 24(S) 하이드록시콜레스테롤, 25-에폭시콜레스테롤, T0901317, 5-알파-6-알파-에폭시콜레스테롤-3-설페이트(ECHS), 7-케토콜레스테롤-3-설페이트, 프라메솔, 담즙산, 1,1-비포스포네이트 에스테르, 청소년 호르몬 III 등 중 어느 것으로부터 선택될 수 있으나, 이에 한정되지 않는다. 본 개시내용에 유용한 디아실하이드라진 리간드의 예는 RG-115819(3,5-디메틸-벤조산 N-(1-에틸-2,2-디메틸-프로필)-N'-(2-메틸-3-메톡시-벤조일)-하이드라지드-), RG-115932 ((R)-3,5-디메틸-벤조산 N-(1-3급-부틸-부틸)-N'-(2-에틸-3-메톡시-벤조일)-하이드라지드), 및 RG-115830(3,5-디메틸-벤조산 N-(1-3급-부틸-부틸)-N'-(2-에틸-3-메톡시-벤조일)-하이드라지드)를 포함한다. 예컨대, 미국 특허원 제12/155,111호, 및 PCT 특허원 제PCT/US2008/006757호를 참고하며, 이들 둘 다는 이의 전문이 본원에 참고로 포함된다.
사이토킨
특정의 구현예에서, 본원에 제공된 HBV 백신 항원은 다른 사이토킨과 함께 동시-전달되고/되거나 동시-발현(예컨대, 동일한 HBV 항원 전달 벡터의 부분으로서 또는 별도의 벡터를 통해)될 수 있다. 유전자-스위치 폴리펩타이드 및 사이토킨을 암호화하는 폴리뉴클레오타이드, 또는 이의 변이체 또는 유도체, 및 이를 혼입하는 방법 및 시스템이 본원에 제공된다. 사이토킨은 세포 신호전달에 관여된 약 5 내지 20 kDa 사이의 소 분자의 범주이다. 일부 예에서, 사이토킨은 케모킨, 인터페론, 인터류킨, 콜로니-자극 인자 또는 종양 괴사 인자를 포함한다. 일부 구현예에서, 케모킨은 세포의 이주를 안내하는 화학유인물질(chemoattractant)로서 역활을 하며, 4개의 아과로 분류된다: CXC, CC, CX3C, 및 XC. 예시적인 케모킨은 CC 아과: CCL1, CCL2(MCP-1), CCL3, CCL4, CCL5(RANTES), CCL6, CCL7, CCL8, CCL9(또는 CCL10), CCL11, CCL12, CCL13, CCL14, CCL15, CCL16, CCL17, CCL18, CCL19, CCL20, CCL21, CCL22, CCL23, CCL24, CCL25, CCL26, CCL27, 및 CCL28; CXC 아과: CXCL1, CXCL2, CXCL3, CXCL4, CXCL5, CXCL6, CXCL7, CXCL8, CXCL9, CXCL10, CXCL11, CXCL12, CXCL13, CXCL14, CXCL15, CXCL16, 및 CXCL17; XC 아과: XCL1 및 XCL2; 및 CX3C 아과 CX3CL1로부터의 케모킨을 포함한다.
특정의 구현예에서, 본원에 제공된 HBV 백신 항원은 다른 인터페론과 함께 동시-전달되고/되거나 동시-발현(예컨대, 동일한 HBV 항원 전달 벡터의 부분으로서 또는 별도의 벡터를 통해)될 수 있다. 인터페론(IFN)은 인터페론 제I형(예컨대, IFN-α, IFN-β, IFN-ε, IFN-κ, 및 IFN-ω), 인터페론 제II형(예컨대, IFN-γ), 및 인터페론 제III형을 포함한다. 일부 구현예에서, IFN-α은 약 13개의 서브형, 예를 들면, IFNA1, IFNA2, IFNA4, IFNA5, IFNA6, IFNA7, IFNA8, IFNA10, IFNA13, IFNA14, IFNA16, IFNA17, 및 IFNA21로 추가로 분류된다.
특정의 구현예에서, 본원에 제공된 HBV 백신 항원은 다른 인터류킨과 함께 동시-전달되고/되거나 동시-발현(예컨대, 동일한 HBV 항원 전달 벡터의 부분으로서 또는 별도의 벡터를 통해)될 수 있다. 인터류킨은 백혈구 또는 백혈구 세포에 의해 발현되며 이들은 T 및 B 림프구 및 조혈 세포의 발달 및 분화를 촉진시킨다. 예시적인 인터류킨은 IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8 (CXCL8), IL-9, IL-10, IL-11, IL-12, IL-13, IL-14, IL-15, IL-16, IL-17, IL-18, IL-19, IL-20, IL-21, IL-22, IL-23, IL-24, IL-25, IL-26, IL-27, IL-28, IL-29, IL-30, IL-31, IL-32, IL-33, IL-35, 및 IL-36을 포함한다. 일부 구현예에서, 인터류킨은 IL-2, IL-12, IL-15, IL-21 또는 IL-15 및 IL-15α의 융합체이다.
일부 양태에서, 인터류킨은 IL-12를 포함할 수 있다. 일부 구현예에서, IL-12은 단일 쇄 IL-12(scIL-12), 프로테아제 민감성 IL-12, 탈안정화된 IL-12, 막 결합된 IL-12, 삽입된(intercalated) IL-12이다. 일부 예에서, IL-12 변이체는 제WO2015/095249호, 제WO2016/048903호, 제WO2017/062953호에 기술된 바와 같고, 이들 모두는 이의 전문이 참고로 포함된다.
일부 구현예에서, 인터류킨은 mbIL-15를 포함한다. 일부 구현예에서, mbIL-15는 본원에 기술된 변형된 효과기 세포와 함께 동시-발현될 수 있는 막-결합된 키메라 IL-15이다. 일부 구현예에서, mbIL-15는 전장 IL-15Rα, 이의 기능성 단편 또는 변이체와 프레임 내에서 융합된, 전장 IL-15(예컨대, 천연의 IL-15 폴리펩타이드) 또는 이의 단편 또는 변이체를 포함한다. 일부 경우에, IL-15는 링커를 통해 IL-15Rα에 간접적으로 연결된다. 일부 예에서, mbIL-15는 문헌: Hurton et al., 2016에 기술된 바와 같다.
특정의 구현예에서, 본원에 제공된 HBV 백신 항원은 다른 종양 괴사 인자와 함께 동시-전달되고/되거나 동시-발현(예컨대, 동일한 HBV 항원 전달 벡터의 부분으로서 또는 별도의 벡터를 통해)될 수 있다. 종양 괴사 인자(TNF)는 세포자멸사를 조절하는 사이토킨의 그룹이다. 일부 예에서, TNF 과 내에 약 19개의 구성원, 예를 들면, TNFα, 림프독소-알파(LT-알파), 림프독소-베타(LT-베타), T 세포 항원 gp39(CD40L), CD27L, CD30L, FASL, 4-1BBL, OX40L, 및 TNF-관련된 세포자멸사 유도성 리간드(TRAIL)가 존재하나, 이에 한정되지 않는다.
특정의 구현예에서, 본원에 제공된 HBV 백신 항원은 다른 콜로니 자극 인자와 함께 동시-전달되고/되거나 동시-발현(예컨대, 동일한 HBV 항원 전달 벡터의 부분으로서 또는 별도의 벡터를 통해)될 수 있다. 콜로니-자극 인자(CSF)는 조혈 줄기 세포의 표면에서 수용체 단백질과 상호작용하는 분비된 당단백질이며, 이는 후속적으로 세포 증식 및 특수한 유형의 혈액 세포로의 분화를 조절한다. 일부 예에서, CSF는 대식구 콜로니-자극 인자, 과립구 대식구 콜로니-자극 인자(GM-CSF), 과립구 콜로니-자극 인자(G-CSF) 또는 프로메가포이에틴을 포함한다.
일부 구현예에서, 사이토킨은 막-결합된 사이토킨은 막-결합된 사이토킨이며, 이는 본원에 기술된 키메라 항원 수용체와 함께 동시-발현된다. 일부 구현예에서, 본원에 기술된 하나 이상의 방법은 사이토킨의 투여를 추가로 포함한다. 일부 예에서, 사이토킨은 케모킨, 인터페론, 인터류킨, 콜로니-자극 인자 또는 종양 괴사 인자를 포함한다. 일부 예에서, 본원에 기술된 하나 이상의 방법은 케모킨, 인터페론, 인터류킨, 콜로니-자극 인자 또는 종양 괴사 인자로부터 선택된 사이토킨의 투여를 추가로 포함한다. 일부 예에서, 본원에 기술된 하나 이상의 방법은 IL2, IL7, IL12, IL15, IL-15 및 IL-15Rα의 융합체, IL21, IFNγ 또는 TNF-α로부터 선택된 사이토킨의 투여를 추가로 포함한다.
인터류킨-12
특수한 구현예에서, 본원에 제공된 HBV 백신 항원은 인터류킨-12와 함께 동시-전달되고/되거나 동시-발현(예컨대, 동일한 HBV 항원 전달 벡터의 부분으로서 또는 별도의 벡터를 통해)될 수 있다. 인터류킨 12(IL-12)는 항원성 자극에 대한 반응시 수지 세포, 대식구, 호중구, 및 사람 B-림프아구성 세포(NC-37)에 의해 천연적으로 생산된 인터류킨이다. IL-12는 4개의 알파 나선의 다발로 구성된다. 이는 2개의 별도의 유전자, IL-12A(p35) 및 IL-12B(p40)에 의해 암호화된 이종이량체성 사이토킨이다. 활성 이종이량체(p70으로서 지칭됨), 및 p40의 동종이량체는 단백질 합성 후 형성된다. IL-12는 면역계의 주요 조절인자(master regulator)이다. IL-12는 NK 세포 및 T 세포를 활성화시킴으로써 면역 반응을 촉진한다(도 18).
HBV 재조합 백신을 포함하는 조성물, 키트, 및 시스템 및 이를 제조하는 방법이 본원에 제공된다. 본 개시내용은 다중-결실된 고릴라 아데노벡터(GC46)(서열 번호: 61 내지 63) 내에 작제된 HBV 항원 설계(HBV 설계 1 내지 5)를 제공한다. 또한 유전자 스위치 폴리펩타이드 및 IL-12를 암호화하는 폴리뉴클레오타이드 또는 이의 변이체 또는 유도체, 및 이를 혼입시키는 방법 및 시스템이 본원에 제공된다(도 18).
링커
또한 본원에 기술된 폴리뉴클레오타이드 및 폴리펩타이드의 발현 및 기능성을 촉진시키기 위한 링커를 포함하는 작제물이 개시된다. 일부 구현예에서, 폴리뉴클레오타이드 링커는 본원에 기술된 폴리뉴클레오타이드 내에서 이용될 수 있다. 폴리뉴클레오타이드 링커는 본원에 기술된 폴리뉴클레오타이드를 포함하는 벡터와 적합성인(compatible) 말단 구조를 생성하기 위해 첨가될 수 있는 목적한 제한 부위를 함유하는 DNA의 이중-가닥 분절일 수 있다. 일부 경우에, 폴리뉴클레오타이드 링커는 본원에 기술된 폴리뉴클레오타이드를 포함하는 벡터를 변형시키는데 유용할 수 있다. 예를 들면, 폴리뉴클레오타이드 링커를 포함하는 벡터 변형은 다중 클로닝 부위 내의 변화, 또는 폴리-히스티딘 테일(tail)의 첨가일 수 있다. 폴리뉴클레오타이드 링커를 또한 사용하여 응집성 끝 말단(cohesive end termini)을 지닌 제한 효소로 절단된 벡터내로 클로닝하기 위해 평활 삽입부 DNA의 말단을 조정할 수 있다. 폴리뉴클레오타이드 링커의 사용은 벡터 내로의 평활 연결보다 더 효율적일 수 있으며 벡터로부터의 삽입체를 하부 적용(downstream application)으로 방출시키는 방법을 제공할 수 있다. 일부 경우에 삽입체는 치료학적 적용에 유용한 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 서열일 수 있다. 일부 경우에, 링커는 절단가능한 링커일 수 있다.
폴리뉴클레오타이드 링커는 올리고머일 수 있다. 폴리뉴클레오타이드 링커는 DNA 이중 가닥, 단일 가닥, 또는 이의 조합일 수 있다. 일부 경우에, 링커는 RNA일 수 있다. 폴리뉴클레오타이드 링커는 일부 경우에 T4 리가제에 의해 본원에 기술된 폴리뉴클레오타이드를 포함하는 벡터 내로 연결시킬 수 있다. 연결을 촉진시키기 위해 과도한 폴리뉴클레오타이드 링커를 삽입체 및 벡터를 포함하는 조성물에 가할 수 있다. 일부 경우에, 삽입체 및 벡터는 링커가 도입되기 전에 예비-처리된다. 예를 들면, 메틸라제를 사용한 예비-처리는 삽입체 DNA의 원치않는 절단을 방지할 수 있다.
특정의 구현예에서, 본원에 기술된 폴리뉴클레오타이드에 의해 암호화된 2개 이상의 폴리펩타이드는 개재되는(intervening) 링커 폴리펩타이드를 암호화하는 개재되는 서열에 의해 분리될 수 있다. 여기서 폴리뉴클레오타이드에 의해 암호화된 2개 이상의 폴리펩타이드를 분리하는 아미노산 서열을 지칭하는 용어 "개재되는 링커 폴리펩타이드"는 본원에 개시된 폴리펩타이드 작제물 내에 임의로 포함되어 막관통 도메인(transmembrane domain)을 세포 표면 폴리펩타이드(예컨대, 천연의 폴리펩타이드의 트렁케이트된(truncated) 변이체를 포함함)에 연결시키는 아미노산의 서열을 지칭하는 용어 "펩타이드 링커"와는 구별된다. 특정의 경우에, 개재되는 링커는 절단에 민감한 개재되는 링커 폴리펩타이드이다. 일부 구현예에서, 링커는 절단가능한 또는 리보소옴 스키핑(ribosome skipping) 링커이다. 일부 구현예에서, 절단가능한 링커 또는 리보소옴 스키핑 링커 서열은 2A, GSG-2A, GSG 링커, SGSG 링커, 푸린링크(furinlink) 변이체 및 이의 유도체로 이루어진 그룹으로부터 선택된다. 일부 구현예에서, 2A 링커는 p2A 링커, T2A 링커, F2A 링커 또는 E2A 링커이다. 일부 구현예에서, 목적한 폴리펩타이드는 절단에 민감한 개재되는 링커 폴리펩타이드에 의해 연결된 융합 단백질로서 발현된다. 특정의 구현예에서, 절단에 민감한 개재되는 링커 폴리펩타이드(들)은 다음 중 임의의 하나 이상일 수 있다: F/T2A, T2A, p2A, 2A, GSG-p2A, GSG 링커, 및 푸린링크 변이체. 2017년 5월 18일자로 공개된 제PCT/US2016/061668호(제WO2017083750호)가 본원에 참고로 포함된다. 특정의 구현예에서, 링커 폴리펩타이드는 하기 표에 개시된 것을 포함한다:
[표 2]
일부 구현예에서, 개재되는 링커 폴리펩타이드는 Whitlow 링커(서열 번호: 64), GSG 링커(서열 번호: 66), SGSG 링커(서열 번호: 67), (G4S)3 링커(서열 번호: 68), 푸린 절단 부위/Furlink1(서열 번호: 69), Fmdv 링커(서열 번호: 70), 쏘세아 아시그나 바이러스(Thosea asigna virus) 2A 영역(T2A)(서열 번호: 71), 푸린-GSG-T2A(서열 번호: 72), 푸린-SGSG-T2A(서열 번호: 73), 돼지 테스쵸바이러스(porcine teschovirus)-1 2A 영역(P2A)(서열 번호: 74), GSG-P2A(서열 번호: 75), 말 비염 A 바이러스 2A 영역(E2A)(서열 번호: 76), 또는 수족구 질환 바이러스(foot-and-mouth disease virus) 2A 영역(F2A)(서열 번호: 78)의 아미노산과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 99%, 99.5% 또는 100% 동일성을 갖는 아미노산 서열을 포함한다(표 2). 일부 경우에, 개재되는 링커 폴리펩타이드는 링커의 아미노산 서열(서열 번호: 65, 79, 80)과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 99%, 99.5% 또는 100% 동일성을 갖는 아미노산 서열을 포함한다. 일부 경우에, 바이러스 2A 서열이 사용될 수 있다. 2A 성분은 5 내지 100개 염기 쌍을 갖는 IRES보다 더 짧을 수 있다. 일부 경우에, 2A 서열은 길이가 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 또는 100개 뉴클레오타이드일 수 있다. 2A 연결된 유전자는 하나의 단일 개방 판독 프레임 내에서 발현될 수 있으며, "자가-절단"은 2A 폴리펩타이드의 C-말단에서, 마지막 2개의 아미노산, GP 사이에 동시-해독적으로 발생하여, 동일한 양의 동시-발현된 단백질을 생성할 수 있다.
바이러스 2A 서열은 약 20개 아미노산일 수 있다. 일부 경우에, 바이러스 2A 서열은 컨센수스 모티프 Asp-Val/Ile-Glu-X-Asn-Pro-Gly-Pro를 함유할 수 있다. 컨센수스 모티프 서열은 동시-해독적으로 작용할 수 있다. 예를 들면, 글리신과 프롤린 잔기 사이의 정상적인 펩타이드 결합의 형성은 방지될 수 있으며, 이는 신생의(nascent) 폴리펩타이드의 리보소옴 스키핑(ribosomal skipping) 및 절단을 생성할 수 있다. 이러한 효과는 등몰 수준에서 다수의 유전자를 생산할 수 있다.
2A 펩타이드는 리보소옴-스키핑 메카니즘(ribosome-skipping mechanism)을 통해 다수의 단백질을 단일 개방 판독 프레임 내에서 개개의 폴리펩타이드 내로 후속적으로 절단될 수 있는 폴리펩타이드로 해독하도록 할 수 있다(Funston et al., J. Gen. Virol. 89(Pt 2):389-96 (2008)). 일부 구현예에서, 2A 서열은: F/T2A, T2A, p2A, 2A, T2A, E2A, F2A, 및 BmCPV2A, BmIFV2A, 및 이의 임의의 조합을 포함할 수 있다.
일부 경우에, 벡터는 IRES 서열 및 2A 링커 서열을 포함할 수 있다. 다른 경우에, 2A 펩타이드에 연결된 다수의 유전자의 발현은 2A 펩타이드의 앞쪽의 스페이서 서열(GSG)에 의해 촉진될 수 있다. 일부 경우에, 작제물은 스페이서, 링커, 어댑터(adaptor), 프로모터, 또는 이의 조합물을 조합시킬 수 있다. 예를 들면, 링커는 스페이서(SGSG 또는 GSG 또는 Whitlow 링커) 및 푸린 링커(R-A-K-R) 절단 부위를 상이한 2A 펩타이드와 함께 가질 수 있다. 스페이서는 I-Ceui일 수 있다. 일부 경우에, 링커는 가공될 수 있다. 예를 들면, 링커는 소수성과 같은 화학적 특성을 포함하도록 설계할 수 있다. 일부 경우에, 적어도 2개의 링커 서열은 동일한 단백질을 생산할 수 있다. 다른 경우에, 다중 링커를 벡터 내에 사용할 수 있다. 예를 들면, 목적한 유전자는 적어도 2개의 링커로 분리될 수 있다.
특정의 구현예에서, 본원에 기술된 폴리뉴클레오타이드에 의해 암호화된 2개 이상의 폴리펩타이드는 링커 폴리펩타이드를 암호화하는 개재되는 서열에 의해 분리될 수 있다. 특정의 경우에, 링커는 절단에 민감한 링커이다. 일부 구현예에서, 목적한 폴리펩타이드는 절단에 민감한 링커 폴리펩타이드에 의해 연결된 융합 단백질로서 발현된다. 특정의 구현예에서, 절단에 민감한 링커 폴리펩타이드(들)는: Furinlink, fmdv, p2a, GSG-p2a, 및/또는 후술된 fp2a 중 임의의 1개 또는 2개일 수 있다. 일부 경우에, 링커는 APVKQGSG(서열 번호: 96)이다.
특정의 경우에, 링커 폴리펩타이드는 아미노산 서열 "RAKR"(서열 번호: 86)을 포함할 수 있다. 특정의 경우에, 푸린 링커 폴리펩타이드는 "CGTGCAAAGCGT"(서열 번호: 69) 또는 "AGAGCTAAGAGG"(서열 번호: 130)를 포함하는 폴리뉴클레오타이드 서열 폴리뉴클레오타이드 서열에 의해 암호화될 수 있다.
일부 구현예에서, 링커는 본원에 기술된 폴리뉴클레오타이드 내에서 이용될 수 있다. 링커는 가요성(flexible) 링커, 강직성(rigid) 링커, 생체내에서 절단가능한 링커, 또는 이의 임의의 조합일 수 있다. 일부 경우에, 링커는 함께 기능성 도메인을 함께 연결시키거나(가요성 및 강직성 링커에서와 같이) 또는 생체내 절단가능한 링커에서와 같이 생체 내에서 유리된 기능성 도메인을 방출할 수 있다.
링커는 생물학적 활성을 증진시키고, 발현 수율을 증가시키며, 목적한 약력학적 프로파일을 달성할 수 있다. 링커는 또한 하이드라존, 펩타이드, 디설파이드, 또는 티오에스테르를 포함할 수 있다.
일부 경우에, 본원에 기술된 링커 서열은 가요성 링커일 수 있다. 가요성 링커는 결합된 도메인이 특정 정도의 운동 또는 상호작용을 필요로 하는 경우 적용될 수 있다. 가요성 링커는 작거나, 비-극성(예컨대, Gly) 또는 극성(예컨대, Ser 또는 Thr) 아미노산으로 구성될 수 있다. 가요성 링커는 Gly 및 Ser 잔기의 스트레치(stretch)로 주로 이루어진 서열을 가질 수 있다("GS" 링커). 가요성 링커의 예는 (Gly-Gly-Gly-Gly-Ser)n(서열 번호: 85)의 서열을 가질 수 있다. 카피 수 "n"을 조절함으로써, 이러한 예시적인 GS 링커의 길이를 최적화하여 기능성 도메인의 적절한 분리를 달성하거나 필수적인 도메인간 상호작용을 유지시킬 수 있다. GS 링커 외에도, 다른 가요성 링커를 재조합 융합 단백질에 대해 이용할 수 있다. 일부 경우에, 가요성 링커는 또한 작거나 극성인 아미노산, 예를 들면, Gly 및 Ser 속에서 풍부할 수 있지만, 추가의 아미노산, 예를 들면, Thr 및 Ala를 함유함으로써 가요성(flexibility)을 유지할 수 있다. 다른 경우에, 극성 아미노산, 예를 들면, Lys 및 Glu를 사용하여 용해도를 증진시킬 수 있다.
본원에 기술된 링커 서열에 포함된 가요성 링커는 작거나 극성인 아미노산, 예를 들면, Gly 및 Ser 속에서 풍부하여 양호한 가요성 및 용해도를 제공할 수 있다. 가요성 링커는 특정의 운동 또는 상호작용이 융합체 단백질 도메인에 대해 요구되는 경우 적합한 선택이 될 수 있다. 또한, 가요성 링커가 강직성 구조를 가질 수 없지만, 이들은 수동적 링커로서 제공되어 기능성 도메인 사이의 거리를 유지할 수 있다. 가요성 링커의 길이는 적절한 폴딩(folding)을 허용하고 융합 단백질의 최적의 생물학적 활성을 달성하도록 조절될 수 있다.
본원에 기술된 링커는 일부 경우에 강직성 링커를 추가로 포함할 수 있다. 강직성 링커는 폴리펩타이드의 도메인들 사이에 고정된 거리를 유지하기 위해 이용될 수 있다. 강직성 링커의 예는: 몇가지 예를 들면, 알파 나선-형성 링커, Pro가 풍부한 서열, (XP)n, X-Pro 골격, A(EAAAK)nA(n = 2 내지 5)일 수 있다. 강직성 링커는 α-나선 구조를 채택하거나 일부 경우에 다중 Pro 잔기를 함유함으로써 비교적 강직성 구조를 나타낼 수 있다.
본원에 기술된 링커는 일부 경우에 절단가능할 수 있다. 다른 경우에, 링커는 절단가능하지 않다. 절단가능하지 않은 링커는 함께 기능성 도메인을 공유결합으로 결합시켜 생체내 공정 또는 생체외 공정 전체에서 하나의 분자로서 작용할 수 있다. 링커는 또한 생체 내에서 절단가능할 수 있다. 절단가능한 링커는 생체내에서 자유 기능성 도메인을 방출하도록 도입될 수 있다. 절단가능한 링커는 몇가지 예를 들면, 환원 시약, 프로테아제의 존재에 의해 절단될 수 있다. 예를 들면, 이황화물 결합의 환원을 이용하여 절단가능한 링커를 생산할 수 있다. 이황화물 링커의 경우에, 티올, 예를 들면, 글루타티온과의 이황화물 교환을 통한 절단 현상은 절단을 생산할 수 있다. 다른 경우에, 재조합 융합 단백질 내에서 링커의 생체내 절단은 또한 생리학적 상태(예컨대, 암 또는 염증) 하에서, 특수한 세포 또는 조직 내에서 생체내 발현될 수 있거나, 특정의 세포 구획 내에서 구속될 수 있는 프로테아제에 의해 수행될 수 있다. 일부 경우에, 절단가능한 링커는 표적화된 절단을 허용할 수 있다. 예를 들면, 많은 프로테아제의 특이성은 구속된 구획 내에서 링커의 보다 느린 절단을 제공할 수 있다. 절단가능한 링커는 또한 하이드라존, 펩타이드, 이황화물, 또는 티오에스테르를 포함할 수 있다. 예를 들면, 하이드라존은 혈청 안전성을 부여할 수 있다. 다른 경우에, 하이드라존은 산성 구획 내에서 절단을 허용할 수 있다. 산성 구획은 pH 7 이하를 가질 수 있다. 링커는 또한 티오에테르를 포함할 수 있다. 티오에테르는 비환원성일 수 있다. 티오에테르는 세포내 단백질분해성 분해를 위해 설계될 수 있다.
특정의 구현예에서, fmdv 링커 폴리펩타이드는 서열 번호: 87에 대해 적어도 약 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% 또는 100% 동일할 수 있는 서열을 포함한다. 특정의 구현예에서, fmdv 링커 폴리펩타이드는 2개 이상의 융합 단백질을 연결하는 단일 벡터 내에 암호화된 링커 중 하나 이상이다. 특정의 경우에, fmdv 링커 폴리펩타이드는 폴리뉴클레오타이드 개방 판독 프레임(ORF) 핵산 서열에 의해 암호화될 수 있다. 일부 경우에, ORF 암호화 fmdv는 서열 번호: 70의 서열을 포함하거나 이로 이루어진다. 특정의 구현예에서, fmdv를 암호화하는 폴리뉴클레오타이드는 서열 번호: 70에 대해 적어도 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% 또는 100% 동일하다.
특정의 경우에, 링커 폴리펩타이드는 "p2a" 링커일 수 있다. 특정의 구현예에서, p2a 폴리펩타이드는 서열 번호: 91에 대해 약 적어도 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% 또는 100% 동일할 수 있는 서열을 포함할 수 있다. 특정의 구현예에서, p2a 링커 폴리펩타이드는 2개 이상의 융합 단백질을 연결하는 단일 벡터 내에 암호화된 링커 중 하나 이상일 수 있다. 일부 경우에, p2a 링커 폴리펩타이드는 폴리뉴클레오타이드 개방 판독 프레임(ORF) 핵산 서열에 의해 암호화될 수 있다. 특정의 구현예에서, ORF 암호화 p2a는 서열 번호: 74의 서열을 포함하거나 이로 이루어진다. 특정의 경우에, p2a를 암호화하는 폴리뉴클레오타이드는 서열 번호: 74이거나 이와 약 적어도 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% 또는 100% 동일할 수 있다.
일부 경우에, 링커 폴리펩타이드는 "GSG-p2a" 링커일 수 있다. 특정의 구현예에서, GSG-p2a 링커 폴리펩타이드는 서열 번호: 92에 대해 약 적어도 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% 또는 100% 동일할 수 있는 서열을 포함할 수 있다. 특정의 구현예에서, GSG-p2a 링커 폴리펩타이드는 2개 이상의 융합 단백질을 연결하는 단일 벡터 내에 암호화된 링커 중 하나 이상일 수 있다. 일부 경우에, GSG-p2a 링커 폴리펩타이드는 폴리뉴클레오타이드 개방-판독 프레임(ORF) 핵산 서열에 의해 암호화될 수 있다. GSG p2a를 암호화하는 ORF는 서열 번호: 75의 서열을 포함할 수 있다. 일부 경우에, GSG-p2a를 암호화하는 폴리뉴클레오타이드는 서열 번호: 75일 수 있거나 이와 적어도 약 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% 또는 100% 동일할 수 있다.
링커 폴리펩타이드는 본원에서 제공한 바와 같은 "fp2a" 링커일 수 있다. 특정의 구현예에서, fp2a 링커 폴리펩타이드는 서열 번호: 95에 대해 적어도 약 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% 또는 100% 동일할 수 있는 서열을 포함할 수 있다. 특정의 경우에, fp2a 링커 폴리펩타이드는 2개 이상의 융합 단백질을 연결하는 단일 벡터 내에 암호화된 링커 중 하나 이상일 수 있다. 일부 경우에, fp2a 링커 폴리펩타이드는 폴리뉴클레오타이드 개방 판독 프레임(ORF) 핵산 서열에 의해 암호화될 수 있다. 특정의 구현예에서, fp2a 링커를 암호화하는 폴리뉴클레오타이드는 서열 번호: 78일 수 있거나 이에 대해 적어도 약 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% 또는 100% 동일할 수 있다.
일부 경우에, 링커는 가공될 수 있다. 예를 들면, 링커는 소수성과 같은 화학적 특성을 포함하도록 설계될 수 있다. 일부 경우에, 적어도 2개의 링커 서열은 동일한 단백질을 생산할 수 있다. 서열은 서열 번호 82, 96 또는 97의 폴리펩타이드 서열일 수 있거나 이와 약 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% , 또는 100% 동일할 수 있다. 다른 경우에, 다중 링커를 벡터 내에서 사용할 수 있다. 예를 들면, 목적한 유전자, 및 본원에 기술된 하나 이상의 유전자 스위치 폴리펩타이드 서열은 적어도 2개의 링커로 분리될 수 있다. 일부 경우에, 유전자는 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이하의 링커에 의해 분리될 수 있다.
링커는 가공된 링커일 수 있다. 링커를 설계하는 방법은 계산적일 수 있다. 일부 경우에, 계산 방법은 그래프 기술을 포함할 수 있다. 계산 방법을 사용하여 데이타베이스로부터 유도된 3차원 펩타이드 구조의 라이브러리로부터 적합한 펩타이드에 대해 조사할 수 있다. 예를 들면, 브룩해븐 단백질 데이타 뱅크(Brookhaven Protein Data Bank)(PDB)를 사용하여 링커의 선택된 아미노산들 사이의 공간에서 거리를 잴 수 있다.
일부 구현예는 푸린 폴리펩타이드 및 2A 폴리펩타이드를 포함하는 폴리펩타이드 작제물을 암호화하는 폴리뉴클레오타이드이며, 여기서 푸린 폴리펩타이드 및 2A 폴리펩타이드는 적어도 3개의 소수성 아미노산을 포함하는 폴리펩타이드 링커에 의해 연결되어 있다. 일부 경우에, 적어도 3개의 소수성 아미노산이 글리신(Gly)(G), 알라닌(Ala)(A), 발린(Val)(V), 루이신(Leu)(L), 이소루이신(Ile)(I), 프롤린(Pro)(P), 페닐알라닌(Phe)(F), 메티오닌(Met)(M), 트립토판(Trp)(W)으로 이루어진 목록으로부터 선택된다. 일부 경우에, 폴리펩타이드 링커는 또한 하나 이상의 GS 링커 서열, 예를 들면, (GS)n, (SG)n, (GSG)n, 및 (SGSG)n를 포함할 수 있으며, 여기서 n은 0 내지 15 중 임의의 수일 수 있다.
제1의 기능성 폴리펩타이드 및 제2의 기능성 폴리펩타이드를 포함하는 상기 폴리펩타이드 작제물을 암호화하는 폴리뉴클레오타이드를 제공하는 단계로서, 상기 제1의 기능성 폴리펩타이드 및 제2의 기능성 폴리펩타이드가 서열 APVKQ에 대해 적어도 60% 상동성을 지닌 서열을 포함하는 링커 폴리펩타이드에 의해 연결되어 있는 단계; 및 상기 폴리뉴클레오타이드를 숙주 세포 내에서 발현시키는 단계로서, 상기 발현시키는 것은 서열 APVKQ에 대해 적어도 60% 상동성을 지닌 서열을 포함하는 링커 폴리펩타이드를 가지지 않은 상응하는 폴리펩타이드 작제물과 비교하여 폴리펩타이드 작제물의 증진된 발현을 야기하는 단계를 포함하여, 폴리펩타이드 작제물의 증진된 발현을 수득하는 방법이 제공된다.
IRES 성분
본원에 기술된 폴리뉴클레오타이드 및 폴리펩타이드의 발현 및 기능성을 촉진시키기 위한 IRES 성분을 포함하는 작제물이 또한 본원에 개시되어 있다. 본원에 사용된 바와 같은 용어 "내부 리보소옴 도입 부위(internal ribosome entry site)(IRES)"는 내부 리보소옴 도입 부위를 의미하는 것으로 의도될 수 있다. IRES 서열을 포함하는 벡터에서, 제1의 유전자는 이의 자체의 5'-UTR을 사용한 메카니즘인, cap-의존성인, 리보소옴 스캐닝에 의해 해독될 수 있는 반면, 후속적인 유전자의 해독은 cap-독립된 방식으로 IRES에 리보소옴을 직접 보충(recruitment)시켜 달성할 수 있다. IRES 서열은 진핵세포 리보소옴이 5' 캡핑된 말단에 대한 결합없이 결합하여 해독되도록 할 수 있다. IRES 서열은 하나의 전사체로부터의 다중 유전자의 발현을 허용할 수 있다(Mountford and Smith 1995).
본원에 사용된 바와 같은 용어 "CAP" 또는 "cap"은 진핵세포 mRNA의 5' 말단에 대해 변형된 뉴클레오타이드, 일반적으로 3' 내지 5'로 연결된 7-메틸 구아노신(7meG-ppp-G)을 지칭하며, 이는 mRNA로부터 단백질의 발현 동안 정상적인 해독 개시 경로에서 필요 성분으로서 제공된다.
특정의 경우에, IRES 영역은 피코르나바이러스, 뇌척수 심근염 바이러스(encephalomyocarditis virus), C형 간염 바이러스 IRES 서열로부터 유래할 수 있다. 다른 경우에, IRES 서열은 뇌척수 심근염 바이러스로부터 유래할 수 있다. 본원에 사용된 바와 같은 용어 "EMCV" 또는 "뇌척수 심근염 바이러스"는 피코르나비리다에(Picornaviridae) 과의 속의 뇌척수 심근염 바이러스 종의 임의의 구성원 단리체 또는 균주를 지칭한다. 예에는: EMCV-R(Rueckert) 균주 바이러스, Columbia-SK 바이러스가 있다. 일부 경우에, 세포 IRES 성분, 예를 들면, 진핵세포성 개시 인자 4G, 면역글로불린 중쇄 결합 단백질, c-myc 광-종양유전자, 혈관 내피 성장 인자, 섬유아세포 성장 인자-1 IRES, 또는 이의 임의의 조합 또는 변형을 사용할 수 있다. 일부 경우에, 세포 IRES는 바이러스 IRES와 비교하는 경우 증가된 유전자 발현을 가질 수 있다.
바이러스, 이의 세포 또는 조합의 IRES 서열을 벡터 내에서 이용할 수 있다. IRES는 뇌척수 심근염(EMCV) 또는 폴리오바이러스(poliovirus)(PV)로부터 유래할 수 있다. 일부 경우에, IRES 성분은 폴리오바이러스(PV), 뇌척수염 바이러스(EMCV), 수족구병 바이러스(FMDV), 돼지 테스쵸바이러스(Porcine teschovirus)-1(PTV-1), 아이키바이러스(Aichivirus)(AiV), 세네카 밸리 바이러스(Seneca Valley virus)(SVV), C형 간염 바이러스(HCV), 전통적인 돼지 열 바이러스(Classical swine fever virus)(CSFV), 사람 면역결핍성 바이러스-2(HIV-2), 사람 면역결핍성 바이러스-1(HIV-1), 몰로니 쥐 백혈병 바이러스(Moloney murine leukemia virus)(MoMLV), 고양이 면역결핍성 바이러스(Feline immunodeficiency virus)(FIV), 마우스 유방 종양 바이러스(Mouse mammary tumor virus)(MMTV), 잠복성 사람 사이토메갈로바이러스(Human cytomegalovirus latency)(pUL138), 엡슈타인-바르 바이러스(Epstein-Barr virus)(EBNA-1), 헤르페스 바이러스 마렉 질환(Herpes virus Marek's disease)(MDV RLORF9), SV40 폴리스스트론성(polycistronic) 19S(SV40 19S), 로팔로시퓸 파디 바이러스(Rhopalosiphum padi virus)(RhPV), 크릭켓 파랄라이시스 바이러스(Cricket paralysis virus)(CrPV), 엑트로피스 오블리쿠아 피코르나-유사 바이러스(Ectropis obliqua picorna-like virus)(EoPV), 플라우티아 스탈리 장 바이러스(Plautia stali intestine virus)(PSIV), 트리아토마 바이러스(Triatoma virus)(TrV), 벌 마비 디시스트로바이러스(Bee paralysis dicistrovirus)(IAPV, KBV), 블랙 커란트 리버젼 바이러스(Black currant reversion virus)(BRV), 펠라르고늄 플라워 브레이크 바이러스(Pelargonium flower break virus)(PFBV), 히비스커스 클로로틱 링스폿 바이러스(Hibiscus chlorotic ringspot virus)(HCRSV), 크루시퍼-감염 토바모바이러스(Crucifer-infecting tobamovirus)(CrTMV), 감자 잎 마름병 폴레로바이러스(Potato leaf roll polerovirus)(PLRV), 담배 에치 바이러스(Tobacco etch virus)(TEV), 기아르디아바이러스(Giardiavirus)(GLV), 레이슈마니아(Leishmania) RNA 바이러스-1(LRV-1), 및 이의 조합 또는 변형으로 이루어진 그룹으로부터 선택된다. 일부 경우에, IRES는 Apaf-1, XIAP, HIAP2/c-IAP1, DAP5, Bcl-2, c-myc, CAT-1, INR, 분화(Differentiation) LEF-1, PDGF2, HIF-1a, VEGF, FGF2, BiP, BAG-1, CIRP, p53, SHMT1, PITSLREp58, CDK1, Rpr, hid, hsp70, grim, skl, 안테나페디아(Antennapedia), dFoxO, dInR, Adh-Adhr, HSP101, ADH, URE-2,GPR1, NCE102, YMR181a, MSN1, BOI1, FLO8, GIC1, 및 이의 임의의 조합 또는 변형으로 이루어진 그룹으로부터 선택된다. IRES 성분이 2개의 개방 판독 프레임(ORF) 사이에 포함되는 경우, 해독의 개시는 처음 ORF 내에서 캐노니칼(canonical) 5'-m7GpppN 캡(cap)-의존성 메카니즘 및 IRES 성분의 하부의 제2의 ORF 내에서 cap-독립된 메카니즘에 의해 발생할 수 있다.
일부 경우에, 유전자는 내부 리보소옴 도입 부위(IRES)에 의해 연결될 수 있다. IRES는 다중 유전자의 동시 발현을 허용할 수 있다. 예를 들면, IRES 서열은 단일의 mRNA 전사체로부터 다중 단백질의 생산을 허용할 수 있다. 리보소옴은 IRES에 5'-cap 독립된 방식으로 결합하여 해독을 개시할 수 있다.
일부 경우에, IRES 서열은 약 500개의 염기쌍일 수 있다. IRES 서열은 300개 염기쌍 내지 1000개 염기쌍일 수 있다. 예를 들면, IRES는 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 또는 1000개 염기쌍일 수 있다.
일부 경우에, IRES 서열을 포함하는 벡터 내에서 하부 유전자의 발현은 감소될 수 있다. 예를 들면, IRES 서열 이후의 유전자는 IRES 서열 앞의 유전자보다 감소된 발현을 가질 수 있다. 감소된 발현은 선행 유전자보다 1% 내지 99% 감소일 수 있다.
발현을 조절하는 방법
일 구현예에서, 가공된 세포 내에서 이종 유전자의 발현을 조절하는 방법이 제공된다. 이종 유전자 발현의 리간드 유도성 제어를 위해 유전자 스위치 폴리펩타이드를 암호화하는 폴리뉴클레오타이드, 항원 결합 폴리펩타이드 및 이종 유전자가 제공된다. 일부 예에서, 폴리뉴클레오타이드는 도 1 내지 16 중 임의의 하나에 나타낸 바와 같은 하나 이상의 유전자 발현 카세트에서와 같다. 다른 예에서, 폴리뉴클레오타이드는 바이러스 또는 비-바이러스 벡터를 통해 가공된 세포 내로 도입된다. 바이러스 벡터는 렌티바이러스 벡터, 레트로바이러스 벡터 또는 아데노바이러스 벡터를 포함할 수 있다. 비-바이러스 벡터는 슬리핑 뷰티 트랜스포존을 포함할 수 있다. 다른 예에서, 폴리뉴클레오타이드는 레콤비나제 또는 유전자 편집 기술을 통해 가공된 세포 내로 도입된다. 리콤비나제의 예는 본원에 기술된 바와 같은 세린 리콤비나제이다. 유전자 편집 기술의 예는 CRISPR 또는 아르고너트 시스템(Argonaute system)을 포함할 수 있다. 여기서 "CRISPR 시스템"의 "CRISPR 유전자 편집 시스템"은 게놈의 특수한 영역에 대해 DNA 서열내 변화를 표적화하기 위한 임의의 RNA-보조된 Cas 단백질-매개된 공정을 지칭한다. 여기서 "아르고너트 유전자 편집 시스템(Argonaute gene editing system)"은 게놈의 특이적 영역에 대해 DNA 서열내 변화를 표적화하기 위한 임의의 단일 가닥 DNA 인도된 아르고너트 엔도뉴클레아제-매개된 공정을 지칭한다.
약제학적 조성물 및 투여량
본 개시내용은 본원에 기술된 아데노바이러스 또는 아데노바이러스 벡터 및 이에 대한 담체(예컨대, 약제학적으로 허용되는 담체)를 포함하는 조성물을 제공한다. 조성물은 바람직하게는 생리학적으로 허용되는(예컨대, 약제학적으로 허용되는) 조성물이며, 이는 담체, 바람직하게는 생리학적으로(예컨대, 약제학적으로) 허용되는 담체, 및 아데노바이러스 또는 아데노바이러스 벡터를 포함한다. 임의의 적합한 담체가 본 개시내용의 맥락에서 사용될 수 있으며, 이러한 담체는 당해 분야에 잘 공지되어 있다. 담체의 선택은 부분적으로는 조성물의 특수한 사용(예컨대, 동물에 대한 투여) 및 조성물을 투여하는데 사용된 특수한 방법에 의해 결정될 것이다. 이상적으로, 복제-결함성 아데노바이러스 벡터의 맥락에서, 약제학적 조성물은 바람직하게는 복제-가능한 아데노바이러스를 포함하지 않는다. 약제학적 조성물은 임의로 멸균성일 수 있다.
적합한 조성물은 수성 및 비-수성의 등장성 멸균 용액을 포함하며, 이는 항산화제, 완충제, 및 세균정지제, 및 현탁제, 가용화제, 증점제, 안정화제, 및 보존제를 포함할 수 있는 수성 및 비-수성 멸균 현탁액을 포함한다. 조성물은 단위-투여량 또는 다중-투여량 밀봉 용기, 예를 들면, 앰플(ampule) 및 바이알(vial) 속에 존재할 수 있으며, 사용 직전에 멸균 액체 담체, 예를 들면, 물의 첨가 만을 필요로 하는 냉동-건조된(동결건조된) 상태로 저장될 수 있다. 일시적인 용액 및 현탁액을 멸균 분말, 과립, 및 정제로부터 제조할 수 있다. 바람직하게는, 담체는 완충된 염수 용액이다. 보다 바람직하게는, 아데노바이러스 또는 아데노바이러스 벡터는 투여 전에 손상으로부터 아데노바이러스 또는 아데노바이러스 벡터를 보호하도록 제형화된 조성물의 부분이다. 예를 들면, 조성물은 아데노바이러스 또는 아데노바이러스 벡터를 제조하거나, 저장하거나,투여하기 위해 사용된 장치, 예를 들면, 유리제품, 주사기, 또는 침(needle)에서 아데노바이러스 또는 아데노바이러스 벡터의 손실을 감소시키기 위해 제형화될 수 있다. 조성물은 아데노바이러스 또는 아데노바이러스 벡터의 광 민감성 및/또는 온도 민감성을 감소시키기 위해 제형화될 수 있다. 이러한 목적으로, 조성물은 바람직하게는 약제학적으로 허용되는 액체 담체, 예를 들면, 위에서 기술한 것들, 및 폴리소르베이트 80, L-아르기닌, 폴리비닐피롤리돈, 트레할로즈, 및 이의 조합으로 이루어진 그룹으로부터 선택된 안정화제를 포함한다. 이러한 조성물의 사용은 아데노바이러스 또는 아데노바이러스 벡터의 저장 수명을 연장시키고, 이의 투여를 촉진시킬 것이다. 아데노바이러스 또는 아데노바이러스 벡터-함유 조성물에 대한 제형은 예를 들면, 미국 특허 제6,225,289호, 미국 특허 제6,514,943호, 및 국제 특허원 공보 제WO 2000/034444호에 추가로 기술되어 있다.
조성물은 또한 형질도입 효율을 향상시키기 위해 제형화될 수 있다. 또한, 당해 분야의 통상의 기술자는 아데노바이러스 또는 아데노바이러스 벡터가 다른 치료학적 또는 생물학적 활성제와의 조성물 속에 존재할 수 있음을 인식할 것이다. 예를 들면, 염증을 제어하는 인자, 예를 들면, 이부프로펜 또는 스테로이드는 아데노바이러스 또는 아데노바이러스 벡터의 생체내 투여와 관련된 팽윤 및 염증을 감소시키는 조성물의 부분일 수 있다. 아데노바이러스 또는 아데노바이러스 벡터를 사용하여 항원-암호화 핵산 서열을 숙주에게 전달하는 경우, 면역계 자극인자 또는 보조제, 예컨대, 인터류킨, 지질다당류, 또는 이중-가닥 RNA를 투여하여 항원에 대한 임의의 면역 반응을 향상시키거나 변형시킬 수 있다. 항생제, 즉, 살미생물제 및 살진균제가 기존의 감염을 치료하고/하거나 미래의 감염, 예를 들면, 유전자 전달 과정과 관련된 감염의 위험을 감소시키기 위해 존재할 수 있다.
일부 구현예에서, 대상체에서 투여하기 위한 본원에 개시된 폴리뉴클레오타이드 또는 폴리펩타이드를 포함하는 조성물이 본원에 개시되어 있다. 일부 예에서, 본원에 개시된 폴리뉴클레오타이드 또는 폴리펩타이드를 암호화하고, 임의로 사이토킨 및/또는 추가의 치료제를 함유하는 변형된 효과기 세포 조성물이 개시되어 있다. 일부 예에서 또한 효과기 세포의 변형을 위해 키메라 항원 수용체의 발현을 조절하기 위한 유전자-스위치 폴리펩타이드를 암호화하는 벡터가 본원에 포함된다.
일부 예에서, 변형된 효과기 세포 또는 유전자-스위치 폴리펩타이드를 암호화하는 벡터 및 키메라 항원 수용체의 약제학적 조성물은 하나 이상의 생리학적으로 허용되는 담체, 에를 들면, 활성 화합물의 약제학적으로 사용될 수 있는 제제로의 가공을 촉진시키는 부형제 및 보조제를 사용하는 통상의 방식으로 제형화된다. 적절한 제형은 선택된 투여 경로에 의존적이다. 본원에 기술된 약제학적 조성물의 요약은 예를 들면, 문헌: Remington: The Science and Practice of Pharmacy, Nineteenth Ed (Easton, Pa.: Mack Publishing Company, 1995); Hoover, John E., Remington's Pharmaceutical Sciences, Mack Publishing Co., Easton, Pennsylvania 1975; Liberman, H.A. and Lachman, L., Eds., Pharmaceutical Dosage Forms, Marcel Decker, New York, N.Y., 1980; 및 Pharmaceutical Dosage Forms and Drug Delivery Systems, Seventh Ed.(Lippincott Williams & Wilkins1999)에서 찾을 수 있다.
약제학적 조성물은 통상의 방식, 예를 들면, 단지 예로서, 통상의 혼합, 용해, 과립화, 당의정-제조, 제분(levigating), 유화, 캡슐화, 인트랩핑(entrapping) 또는 압착 공정의 수단에 의해 임의로 제조된다.
특정의 구현예에서, 조성물은 또한 하나 이상의 pH 조절제 또는 완충제, 예를 들면, 산, 예를 들면, 아세트산, 붕산, 시트르산, 락트산, 인산 및 염산; 염기, 예를 들면, 수산화나트륨, 인산나트륨, 붕산나트륨, 시트르산나트륨, 아세트산나트륨, 락트산나트륨 및 트리스-하이드록시메틸아미노메탄; 및 완충제, 예를 들면, 시트레이트/덱스트로즈, 중탄산나트륨 및 염화암모늄을 포함할 수 있다. 이러한 산, 염기 및 완충제는 허용되는 범위 내의 조성물의 pH를 유지하는데 필요한 양으로 포함된다.
다른 구현예에서, 조성물은 또한 조성물의 삼투압을 허용되는 범위로 가져오는데 필요한 양의 하나 이상의 염을 포함할 수 있다. 이러한 염은 나트륨, 칼륨 또는 암모늄 양이온 및 클로라이드, 시트레이트, 아스코르베이트, 보레이트, 포스페이트, 비카보네이트, 설페이트, 티오설페이트 또는 비설파이드 음이온을 갖는 것을 포함하며; 적합한 염은 염화나트륨, 염화칼륨, 티오황산나트륨, 황산수소나트륨 및 황산암모늄을 포함한다.
본원에 기술된 약제학적 조성물은 임의의 적합한 투여 경로, 예를 들면, 그러나 이에 한정되지 않는, 경구, 비경구(예컨대, 정맥내, 피하, 근육내, 뇌내, 뇌실내, 관절내, 복강내, 또는 두개내), 비강내, 볼내, 설하, 또는 직장 투여 경로로 투여된다. 일부 예에서, 약제학적 조성물은 비경구(예컨대, 정맥내, 피하, 근육내, 뇌내, 뇌실내, 관절내, 복강내, 또는 두개내) 투여를 위해 제형화된다.
본원에 기술된 약제학적 조성물은 임의의 적합한 형태, 예를 들면, 그러나 이에 한정되지 않는 수성의 경구 분산제, 액체, 겔제, 시럽제, 엘릭서르제(elixir), 슬러리제(slurry), 좌제 등, 치료될 개체(individual)에 의한 경구 소화를 위해, 고체 경구 용량형, 에어로졸제, 조절된 방출 제형, 신속한 용융 제형, 비등성 제형(effervescent formulation), 동결건조된 제형, 정제, 산제, 환제, 당의제, 캅셀제, 지연된 방출 제형, 연장된 방출 제형, 맥동 방출 제형(pulsatile release formulation), 다중입자화 제형(multiparticulate formulation), 및 혼합된 즉시 방출 및 제어된 방출 제형으로 제형화된다. 일부 구현예에서, 약제학적 조성물은 캅셀제로 제형화된다. 일부 구현예에서, 약제학적 조성물은 액제(예를 들면, IV 투여용)로 제형화된다. 일부 경우에, 약제학적 조성물은 주입제로 제형화된다. 일부 경우에, 약제학적 조성물은 주사제로 제형화된다.
본원에 기술된 약제학적 고체 투여형은 본원에 기술된 화합물 및 하나 이상의 약제학적으로 허용되는 첨가제, 예를 들면, 적합성 담체, 결합제, 충전제, 현탁제, 풍미제, 감미제, 붕해제, 분산제, 계면활성제, 윤활제, 착색제, 희석제, 가용화제, 습윤제, 가소제, 안정화제, 침투 향상제, 습윤제, 소포제(anti-foaming agent), 항산화제, 보존제, 또는 하나 이상의 이의 조합을 포함한다.
여전히 다른 양태에서, 표준 코팅 과정, 예를 들면, 문헌: Remington's Pharmaceutical Sciences, 20th Edition (2000)에 기술된 과정을 사용하여, 필름 코팅을 조성물 주변에 제공한다. 일부 구현예에서, 조성물은 입자(예를 들면, 캅셀제에 의한 투여용)으로 제형화되며 입자 중 일부 또는 모두는 코팅된다. 일부 구현예에서, 조성물은 입자(예를 들면, 캅셀제에 의한 투여용으로)로 제형화되며 입자 중 일부 또는 모두는 미세캡슐화된다. 일부 구현예에서, 조성물은 입자(예를 들면 캅셀에 의한 투여용으로)로 제형화되며 입자 중 일부 또는 모두는 미세캡슐화되지 않고 코팅되지 않는다.
특정의 구현예에서, 본원에 제공된 조성물은 또한 미생물 활성을 억제는 하나 이상의 보존제를 포함할 수 있다. 적합한 보존제는 수은 함유 물질, 예를 들면, 메르펜(merfen) 및 티오메르살(thiomersal); 안정화된 이산화염소; 및 4급 암모늄 화합물, 예를 들면, 벤즈알코늄 클로라이드, 세틸트리메틸암모늄 브로마이드 및 세틸피리디늄 클로라이드를 포함한다.
"소포제"는 수성 분산액의 응집, 최종 필름내 기포를 생성할 수 있는 공정 또는 일반적으로 손상 공정 동안 발포를 감소시킨다. 예시적인 소포제는 규소 에멀젼 또는 소르비탄 세스퀴올레이트를 포함한다.
"항산화제"는 예를 들면, 부틸화된 하이드록시톨루엔(BHT), 아스코르브산나트륨, 아스코르브산, 메타중황산나트륨 및 토코페롤을 포함한다. 특정의 구현예에서, 항산화제는 필요한 경우 화학적 안전성을 향상시킨다.
본원에 기술된 제형은 항산화제, 금속 킬레이팅제(metal chelating agent), 티올 함유 화합물 및 다른 일반적인 안정화제로부터 유리할 수 있다. 이러한 안정화제의 예는: (a) 약 0.5% 내지 약 2% w/v 글리세롤, (b) 약 0.1% 내지 약 1% w/v 메티오닌, (c) 약 0.1% 내지 약 2% w/v 모노티오글리세롤, (d) 약 1 mM 내지 약 10 mM EDTA, (e) 약 0.01% 내지 약 2% w/v 아스코르브산, (f) 0.003% 내지 약 0.02% w/v 폴리소르베이트 80, (g) 0.001% 내지 약 0.05% w/v. 폴리소르베이트 20, (h) 아르기닌, (i) 헤파린, (j) 덱스트란 설페이트, (k) 사이클로덱스트린, (l) 펜토산 폴리설페이트 및 다른 헤파리노이드, (m) 2가 양이온, 예를 들면, 마그네슘 및 아연; 또는 (n) 이의 조합을 포함하나, 이에 한정되지 않는다.
"결합제"는 점착 품질(cohesive quality)을 부여하며, 예컨대, 알긴산 및 이의 염; 셀룰로즈 유도체, 예를 들면, 카복시메틸셀룰로즈, 메틸셀룰로즈(예컨대, Methocel®), 하이드록시프로필메틸셀룰로즈, 하이드록시에틸셀룰로즈, 하이드록시프로필셀룰로즈(예컨대, Klucel®), 에틸셀룰로즈(예컨대, Ethocel®), 및 미세결정성 셀룰로즈(예컨대, Avicel®); 미세결정성 덱스트로즈; 아밀로즈; 망간 알루미늄 실리케이트; 다당류 산; 벤토나이트; 젤라틴; 폴리비닐피롤리돈/비닐 아세테이트 공중합체; 크로스포비돈; 포비돈; 전분; 예비젤라틴화된 전분; 트라가칸트, 덱스트린, 당, 예를 들면, 슈크로즈(예컨대, Dipac®), 글루코즈, 덱스트로즈, 몰라세스(molasses), 만니톨, 소르비톨, 크실리톨(예컨대, Xylitab®), 및 락토즈; 천연 또는 합성 검(gum), 예를 들면, 아카시아, 트라가칸트, 가티 검(ghatti gum), 이사폴 껍질의 점액(mucilage of isapol husks), 폴리비닐피롤리돈(예컨대, Polyvidone® CL, Kollidon® CL, Polyplasdone® XL-10), 라크 아라보갈락탄(larch arabogalactan), Veegum®, 폴리에틸렌 글리콜, 왁스, 알긴산나트륨 등을 포함한다.
"담체" 또는 "담체 물질"은 약제학에서 임의의 일반적으로 사용된 부형제를 포함하며 본원에 개시된 화합물, 예를 들면, 이부루티닙 및 항암제의 화합물과의 적합성을, 및 목적한 투여량 형태의 방출 프로파일 특성을 기준으로 선택될 수 있다. 예시적인 담체 물질은 예컨대, 결합제, 현탁제, 붕해제, 충전제, 계면활성제, 가용화제, 안정화제, 윤활제, 습윤제, 희석제 등을 포함한다. "약제학적으로 허용되는 담체 물질"은 아카시아, 젤라틴, 콜로이드성 이산화규소, 칼슘 글리세로포스페이트, 락트산칼슘, 말토덱스트린, 글리세린, 규산마그네슘, 폴리비닐피롤리돈(PVP), 콜레스테롤, 콜레스테롤 에스테르, 나트륨 카제이네이트, 대두 레시틴, 타우로콜산, 포스포티딜콜린, 염화나트륨, 인산삼칼슘, 인산이칼륨, 셀룰로즈 및 셀룰로즈 접합체(conjugate), 당 나트륨 스테아로일 락틸레이트, 카라기난(carrageenan), 모노글리세라이드, 디글리세라이드, 예비젤라틴화된 전분 등을 포함하나, 이에 한정되지 않는다. 예컨대, 문헌: Remington: The Science and Practice of Pharmacy, Nineteenth Ed (Easton, Pa.: Mack Publishing Company, 1995); Hoover, John E., Remington's Pharmaceutical Sciences, Mack Publishing Co., Easton, Pennsylvania 1975; Liberman, H.A. and Lachman, L., Eds., Pharmaceutical Dosage Forms, Marcel Decker, New York, N.Y., 1980; 및 Pharmaceutical Dosage Forms and Drug Delivery Systems, Seventh Ed. (Lippincott Williams & Wilkins1999)를 참고한다.
"분산제" 및/또는 "점도 조절제"는 액체 매질을 통하거나 과립화 방법 또는 배합 방법을 통해 약물의 확산 및 균질성을 제어하는 물질을 포함한다. 일부 구현예에서, 이러한 제제는 또한 코팅 또는 침식 매트릭스(eroding matrix)의 효능을 촉진시킨다. 예시적인 확산 촉진제/분산제는 예컨대, 친수성 중합체, 전해질, Tween® 60 또는 80, PEG, 폴리비닐피롤리돈(PVP; Plasdone®로서 상업적으로 공지됨), 및 탄수화물-기반 분산제, 예를 들면, 하이드록시프로필 셀룰로즈(예컨대, HPC, HPC-SL, 및 HPC-L), 하이드록시프로필 메틸셀룰로즈(예컨대, HPMC K100, HPMC K4M, HPMC K15M, 및 HPMC K100M), 카복시메틸셀룰로즈 나트륨, 메틸셀룰로즈, 하이드록시에틸셀룰로즈, 하이드록시프로필셀룰로즈, 하이드록시프로필메틸셀룰로즈 프탈레이트, 하이드록시프로필메틸셀룰로즈 아세테이트 스테아레이트(HPMCAS), 비결정성 셀룰로즈, 마그네슘 알루미늄 실리케이트, 트리에탄올아민, 폴리비닐 알코올(PVA), 비닐 피롤리돈/비닐 아세테이트 공중합체(S630), 에틸렌 옥사이드와 포름알데하이드와의 4-(1,1,3,3-테트라메틸부틸)-페놀 중합체(또한 틸록사폴로 공지됨), 폴록사머(예컨대, Pluronics F68®, F88®, 및 F108®, 이는 에틸렌 옥사이드와 프로필렌 옥사이드의 블록 공중합체이다); 및 폴록사민(예컨대, Tetronic 908®, 또한 Poloxamine 908®로 공지되어 있으며, 이는 에틸렌디아민에 프로필렌 옥사이드와 에틸렌 옥사이드의 순차적인 첨가로부터 유도된 사기능성 블록 공중합체이다(뉴저지주 파시패니(Parsippany) 소재의 BASF Corporation)), 폴리비닐피롤리돈 K12, 폴리비닐피롤리돈 K17, 폴리비닐피롤리돈 K25, 또는 폴리비닐피롤리돈 K30, 폴리비닐피롤리돈/비닐 아세테이트 공중합체(S-630), 폴리에틸렌 글리콜(예컨대, 폴리에틸렌 글리콜은 약 300 내지 약 6000, 또는 약 3350 내지 약 4000, 또는 약 7000 내지 약 5400의 분자량을 가질 수 있다), 나트륨 카복시메틸셀룰로즈, 메틸셀룰로즈, 폴리소르베이트-80, 알긴산나트륨, 검, 예컨대, 검 트라가칸트 및 검 아카시아, 구아 검, 크산탄, 예를 들면, 크산탄 검, 당, 셀룰로직스(cellulosics), 예를 들면, 예컨대, 나트륨 카복시메틸셀룰로즈, 메틸셀룰로즈, 나트륨 카복시메틸셀룰로즈, 폴리소르베이트-80, 알긴산나트륨, 폴리에톡실화된 소르비탄 모노라우레이트, 폴리에톡실화된 소르비탄 모노라우레이트, 포비돈, 카보머, 폴리비닐 알코올(PVA), 알기네이트, 키토산 및 이의 조합을 포함한다. 가소제, 예를 들면, 셀룰로즈 또는 트리에틸 셀룰로즈를 또한 분산제로서 사용할 수 있다. 분산제는 리포좀 분산액으로서 특히 유용하며 자가-유화되는 분산액은 디미리스토일 포스파티딜 콜린, 알(egg)로부터의 천연의 포스파티딜 글리세롤, 콜레스테롤 및 이소프로필 미리스테이트를 포함한다.
하나 이상의 부식 촉진제와 하나 이상의 확산 촉진제의 조합을 또한 본 조성물에서 사용할 수 있다.
용어 "희석제"는 전달 전에 목적한 화합물을 희석시키는데 사용된 화학적 화합물을 지칭한다. 희석제는 보다 안정한 환경을 제공할 수 있으므로 이는 또한 화합물을 안정화시키는데 사용될 수 있다. 완충된 용액 속에 용해된 염(이는 또한 pH 제어 또는 유지를 제공할 수 있다), 예를 들면, 그러나 이에 한정되지 않는, 포스페이트 완충된 염수 용액을 당해 분야에서 희석제로서 이용한다. 특정의 구현예에서, 희석제는 캅셀 충전을 위해, 압착을 촉진시키거나 균질한 배합을 위한 충분한 부피를 생성시키기 위해 조성물의 부피를 증가시킨다. 이러한 화합물은 예컨대, 락토즈, 전분, 만니톨, 소르비톨, 덱스트로즈, 미세결정성 셀룰로즈, 예를 들면, Avicel®; 이염기성 인산칼슘, 인산이칼슘 이수화물; 인산삼칼슘, 인산칼슘; 무수 락토즈, 분무-건조된 락토즈; 예비젤라틴화된 전분, 압착가능한 당, 예를 들면, Di-Pac®(Amstar); 만니톨, 하이드록시프로필메틸셀룰로즈, 하이드록시프로필메틸셀룰로즈 아세테이트 스테아레이트, 당-기반 희석제, 제빵용 당(confectioner's sugar); 일염기성 황산칼슘 일수화물, 황산칼슘 이수화물; 락트산칼슘 삼수화물, 덱스트레이트; 가수분해된 곡물 고체, 아밀로즈; 분말화된 셀룰로즈, 탄산칼슘; 글리신; 카올린; 만니톨, 염화나트륨; 이노시톨, 벤토나이트 등을 포함한다.
"충전제"는 화합물, 예를 들면, 락토즈, 탄산칼슘, 인산칼슘, 이염기성 인산칼슘, 황산칼슘, 미세결정성 셀룰로즈, 셀룰로즈 분말, 덱스트로즈, 덱스트레이트, 전분, 예비젤라틴화된 전분, 슈크로즈, 크실리톨, 락티톨, 만니톨, 소르비톨, 염화나트륨, 폴리에틸렌 글리콜 등을 포함한다.
"윤활제" 및 "활주제(glidant)"는 물질의 부착 또는 마찰을 방지하거나, 감소시키거나 억제하는 화합물이다. 예시적인 윤활제는 예컨대, 스테아르산, 수산화칼슘, 활석, 나트륨 스테아릴 푸마레이트, 탄화수소, 예를 들면, 광 오일, 또는 수소화된 식물성 오일, 예를 들면, 수소화된 대두 오일(Sterotex®), 고급 지방산 및 이의 알칼리-금속 및 알칼리 토 금속 염, 예를 들면, 알루미늄, 칼슘, 마그네슘, 아연, 스테아르산, 스테아르산나트륨, 글리세롤, 활석, 왁스, Stearowet®, 붕산, 나트륨 벤조에이트, 아세트산나트륨, 염화나트륨, 루이신, 폴리에틸렌 글리콜(예컨대, PEG-4000) 또는 메톡시폴리에틸렌 글리콜, 예를 들면, Carbowax™, 올레산나트륨, 나트륨 벤조에이트, 글리세릴 베헤네이트, 폴리에틸렌 글리콜, 마그네슘 또는 나트륨 라우릴 설페이트, 콜로이드성 실리카, 예를 들면, Syloid™, Cab-O-Sil®, 전분, 예를 들면, 옥수수 전분, 실리콘 오일, 계면활성제 등을 포함한다.
"가소제"는 미세캡슐화 물질 또는 필름 코팅을 연화시켜 이들이 거의 취성이 되지 않도록 하는데 사용된 화합물이다. 적합한 가소제는 예컨대, 폴리에틸렌 글리콜, 예를 들면, PEG 300, PEG 400, PEG 600, PEG 1450, PEG 3350, 및 PEG 800, 스테아르산, 프로필렌 글리콜, 올레산, 트리에틸 셀룰로즈 및 트리아세틴을 포함한다. 일부 구현예에서, 가소제는 또한 분산제 또는 습윤제로서 기능할 수 있다.
"가용화제"는 화합물, 예를 들면, 트리아세틴, 트리에틸시트레이트, 에틸 올레이트, 에틸 카프릴레이트, 나트륨 라우릴 설페이트, 나트륨 도쿠세이트, 비타민 E TPGS, 디메틸아세트아미드, N-메틸피롤리돈, N-하이드록시에틸피롤리돈, 폴리비닐피롤리돈, 하이드록시프로필메틸 셀룰로즈, 하이드록시프로필 사이클로덱스트린, 에탄올, n-부탄올, 이소프로필 알코올, 콜레스테롤, 담즙 염, 폴리에틸렌 글리콜 200 내지 600, 글리코푸롤, 트랜스쿠톨, 프로필렌 글리콜, 및 디메틸 이소소르바이드 등을 포함한다.
"안정화제"는 항산화제, 완충제, 산, 보존제 등과 같은 화합물을 포함한다.
"현탁제"는 화합물, 예를 들면, 폴리비닐피롤리돈, 예컨대, 폴리비닐피롤리돈 K12, 폴리비닐피롤리돈 K17, 폴리비닐피롤리돈 K25, 또는 폴리비닐피롤리돈 K30, 비닐 피롤리돈/비닐 아세테이트 공중합체(S630), 폴리에틸렌 글리콜(예컨대, 폴리에틸렌 글리콜은 약 300 내지 약 6000, 또는 약 3350 내지 약 4000, 또는 약 7000 내지 약 5400의 분자량을 가질 수 있다), 나트륨 카복시메틸셀룰로즈, 메틸셀룰로즈, 하이드록시프로필메틸셀룰로즈, 하이드록시메틸셀룰로즈 아세테이트 스테아레이트, 폴리소르베이트-80, 하이드록시에틸셀룰로즈, 나트륨 알기네이트, 검, 예를 들면, 예컨대, 검 트라가칸트 및 검 아카시아, 구아 검, 크산탄, 예를 들면, 크산탄 검, 당, 셀룰로직스, 예를 들면, 예컨대, 나트륨 카복시메틸셀룰로즈, 메틸셀룰로즈, 나트륨 카복시메틸셀룰로즈, 하이드록시프로필메틸셀룰로즈, 하이드록시에틸셀룰로즈, 폴리소르베이트-80, 알긴산나트륨, 폴리에톡실화된 소르비탄 모노라우레이트, 폴리에톡실화된 소르비탄 모노라우레이트, 포비돈 등을 포함한다.
"계면활성제"는 화합물, 예를 들면, 나트륨 라우릴 설페이트, 나트륨 도쿠세이트, Tween 60 또는 80, 트리아세틴, 비타민 E TPGS, 소르비탄 모노올레이트, 폴리옥시에틸렌 소르비탄 모노올레이트, 폴리소르베이트, 폴락소머, 담즙염, 글리세릴 모노스테아레이트, 에틸렌 옥사이드와 프로필렌 옥사이드의 공중합체, 예컨대, Pluronic®(BASF) 등을 포함한다. 일부 다른 계면활성제는 폴리옥시에틸렌 지방산 글리세라이드 및 식물성 오일, 예컨대, 폴리옥시에틸렌(60) 수소화된 피마자 오일; 및 폴리옥시에틸렌 알킬에테르 및 알킬페닐 에테르, 예컨대, 옥톡시놀 10, 옥톡시놀 40을 포함한다. 일부 구현예에서, 계면활성제는 물리적 안전성을 향상시키거나 다른 목적을 위해 포함될 수 있다.
"점도 향상제"는 예컨대, 메틸 셀룰로즈, 크산탄 검, 카복시메틸 셀룰로즈, 하이드록시프로필 셀룰로즈, 하이드록시프로필메틸 셀룰로즈, 하이드록시프로필메틸 셀룰로즈 아세테이트 스테아레이트, 하이드록시프로필메틸 셀룰로즈 프탈레이트, 카보머, 폴리비닐 알코올, 알기네이트, 아카시아, 키토산 및 이의 조합을 포함한다.
"습윤제"는 화합물, 예를 들면, 올레산, 글리세릴 모노스테아레이트, 소르비탄 모노올레이트, 소르비탄 모노라우레이트, 트리에탄올아민 올레이트, 폴리옥시에틸렌 소르비탄 모노올레이트, 폴리옥시에틸렌 소르비탄 모노라우레이트, 나트륨 도쿠세이트, 나트륨 올레이트, 나트륨 라우릴 설페이트, 나트륨 도쿠세이트, 트리아세틴, Tween 80, 비타민 E TPGS, 암모늄 염 등을 포함한다.
키트(KIT)/제조 제품
특정의 구현예에서, 본원에 기술된 하나 이상의 방법으로 사용하기 위한 키트 및 제조 제품이 본원에 개시되어 있다. 이러한 키트는 담체, 패기지, 또는 바이알(vial), 튜브 등과 같은 하나 이상의 용기를 수용하도록 구획화된 용기를 포함하고, 용기(들) 각각은 본원에 기술된 방법에 사용될 별도의 성분 중 하나를 포함한다. 적합한 용기는 예를 들면, 병, 바이알, 주사기, 및 시험 튜브를 포함한다. 일 구현예에서, 용기는 다양한 물질, 예를 들면, 유리 또는 플라스틱으로부터 형성된다.
본원에 제공된 제조 제품은 패키징 물질(packaging material)을 함유한다. 약제학적 패키징 물질의 예는 블리스터 팩(blister pack), 병, 튜브, 백, 용기, 병, 및 선택된 제형에 적합하고 의도된 투여 및 치료 방식에 적합한 임의의 패키징 물질을 포함하지만 이에 제한되지 않는다.
키트는 전형적으로 성분을 나열한 표지(label) 및/또는 사용 설명서, 및 사용 설명서가 들어있는 패키지 삽입물을 포함한다. 설명서 세트는 또한 전형적으로 포함될 것이다.
일부 구현예에서, 표지는 용기 위에 또는 이와 결합된다. 일 구현예에서, 표지는 표지를 형성하는 문자, 숫자 또는 다른 특징이 용기 자체로 부착되거나, 성형되거나 에칭(etching)되는 경우 용기 위에 존재하며; 표지가 용기를 또한 유지시키는 그롯(receptacle) 또는 담체 내에 존재하는 경우 이는 예를 들면, 패키지 삽입물로서 용기와 결합된다. 일 구현예에서, 표지는 내용물들이 특수한 치료학적 적용에 사용되도록 나타내는데 사용된다. 표지는 또한 본원에 기술된 방법에서와 같이, 내용물의 사용 지시사항을 나타낸다.
도 1은 만성 HBV 감염의 개략도이다.
도 2는 만성 HBV 감염의 병력(history)을 나타내는 개략도이다.
도 3a는 B형 간염 바이러스의 개략적인 개요이다. HBV DNA는 3.2kb의 환형의, 엔벨로프된(enveloped), 부분적으로 이중 가닥인 DNA 게놈이다. HBV는 4개의 유전자(S, C, P, 및 X)를 갖는다. S 유전자는 작은 표면 단백질(S), 중간 표면 단백질(S + PreS2), 및 큰 표면 단백질(S + PreS2 + PreS1)로 이루어진 엔벨로프(지질 이층) 표면 단백질(HBsAg)을 암호화한다. C 유전자는 캡시드 또는 코어 단백질을 암호화한다. C 유전자는 프레코어(precore) 및 코어 영역을 갖는다. 해독이 프레코어 영역에서 개시되는 경우, 단백질은 HBeAg이다. 해독이 코어 영역에서 개시되는 경우, 단백질은 HBcAg이다. P 유전자는 DNA 폴리머라제(Pol)를 암호화한다. X 유전자는 x 단백질(HBxAg)을 암호화한다. 도 3b는 B형 간염 바이러스 게놈의 개관이다. HBV 게놈은 TP, SP, RT 및 RH를 포함하는 Pol(832 아미노산); PreS1(108 아미노산); PreS2(55 아미노산); S(226 아미노산); PreC(29 아미노산); C(183 아미노산); 및 HBx(154 아미노산)를 포함한다. 도 3c는 수개의 오버랩핑 바이러스 단백질, 예를 들면, 폴리머라제 코어, 코어 엔벨로프(core envelop)(Pre-S1, S2, S), HBe, 및 HBx 단백질을 암호화하는 HBV 게놈의 개략도를 나타낸다. 도 3d는 수개의 오버래핑 바이러스 단백질, 예를 들면, 폴리머라제 코어, 코어 엔벨로프(Pre-S1, S2, S), HBe, 및 HBx 단백질을 암호화하는 HBV 게놈의 개략도를 나타낸다.
도 4는 HBV 감염 메카니즘의 개략적인 개요이다.
도 5는 HBV 백신 항원을 설계하기 위해 시행된 개략적인 전체 작업흐름도이다.
도 6은 HBV 설계 1 내지 5의 개략적인 구조적 도해를 나타낸다. HBV 설계 1 및 2는 클레드(clade) D 컨센수스(consensus)를 기반으로 설계되었다. HBV 설계 3의 경우, 사람 안키린-유사 반복체(ALR) 단백질 스캐폴드(scaffold)(PDB 코드 1QYM) 펩타이드는 나선 및 루프 영역에서 탄뎀(tandem) 방식으로 이식되었다. 절단가능한 링커(VSQTSKLTR)에 의해 연결된, 2개의 ALR 스캐폴드가 사용되었다. HBV 설계 4 에피토프(epitope)는 KK 링커에 의해 분리되었다. 상이한 링커를 HBV 설계 5에 사용하여 펩타이드를 연결시켰다.
도 7은 NK 세포 및 T 세포를 활성화시킴으로써 면역 반응을 촉진하는 IL-12의 개관을 나타낸다.
도 8은 다양한 IL-12 리간드-유도성 유전자 스위치 벡터 시스템의 다양한 구조적 구성성분을 나타낸다.
도 9a는 HBe에 대한 NetMHC4.0 항원성 예측을 나타낸다. 예측된 강한 및 약한 결합 펩타이드는 펩타이드 위치에 대해 플레이팅(plating)되었다. 도 9b는 HBe에 대한 NetMHC4.0 항원성 예측을 나타낸다. 제1 및 제2 차수 미분(differential)을 밀도 플롯 상에 사용하여 피크를 확인하였다. 도 9c는 HBV 서브형(subtype)에 걸쳐 포함도(coverage)를 측정하기 위하여 컨센수스 서열에 대해 정렬된 아미노산 서열을 나타낸다.
도 10은 상이한 HBV 단백질의 융합된 도메인을 강조하는 TG1050 및 HBV 설계 1의 개략적인 표시이다.
도 11은 HBx 펩타이드로 연결된 모든 3개의 주요 단백질(코어, 표면 스플라이스 변이체, 및 폴리머라제)로 이루어진 HBV 설계 2의 개략적인 표시이다.
도 12a는 코어 HBV 단백질 도메인의 구조를 나타낸다. 도 12b는 HBV preS1 및 S2 펩타이드의 구조를 나타낸다. 도 12c는 HBV HBx의 구조를 나타낸다. 도 12d는 4개의 코어 펩타이드-MHC 복합체의 구조를 나타낸다.
도 13은 멀티-에피토프(multi-epitope) 항원을 기반으로 한 HBV 설계 4의 상동성 모델을 나타낸다.
도 14는 RNA qPCR 상대적인 발현 검정에 대해 생성된 짧은 및 긴 프라이머 및 프로브 세트를 나타내는 개략적인 도해이다. 구체적인 프라이머가 각각의 HBV 항원 설계를 위해 설계되었다.
도 15a는 HBV 설계 1 및 TG1050 대조군의 코어 서열 비교를 나타낸다. 도 15b는 HBV 설계 1 및 TG1050 대조군의 서열 비교를 나타낸다. 도 15c는 HBV 설계 1 및 TG1050 대조군의 서열 비교를 나타낸다.
도 16은 HBV 설계 5의 개략적인 표시이다.
개시내용의 상세한 설명
다음의 설명 및 실시예는 본 개시내용의 구현예를 상세히 설명한다.
본 개시내용은 본원에 기술된 특수한 구현예에 한정되지 않으며 자체로서 변할 수 있음이 이해되어야 한다. 당해 분야의 기술자는 본 개시내용의 변화 및 변형이 존재함을 인식할 것이며, 이는 이의 영역 내에 포함된다.
모든 용어는 이들이 당해 분야의 기술자에게 이해될 수 있으므로 이해되는 것으로 의도된다. 달리 정의하지 않는 한, 본원에 사용된 모든 기술적 및 과학적 용어는 본 개시내용이 속한 분야의 통상의 기술자가 일반적으로 이해하는 바와 동일한 의미를 갖는다.
본원에 사용된 단락 제목은 단지 구조화 목적을 위한 것이며 기술된 주제를 제한하는 것으로 해석되지 않아야 한다.
본 개시내용의 다양한 특징은 단일 구현예의 맥락에서 기술될 수 있지만, 특징은 또한 별도로 또는 임의의 적합한 조합으로 제공될 수 있다. 역으로, 본 개시내용이 명확성을 위해 별도의 구현예의 맥락에서 본원에 기술될 수 있지만, 본 개시내용은 또한 단일 구현예로 시행될 수 있다.
다음의 정의는 당해 분야의 것을 보충하며 현재의 출원에 관한 것이며 임의의 관련되거나 관련되지 않은, 예컨대, 임의의 일반적으로 소유된 특허 또는 특허원에 귀속되지 않아야 한다. 본원에 기술된 것과 유사하거나 등가인 임의의 방법 및 물질을 본 개시내용의 시험을 위한 실시에 사용할 수 있지만, 바람직한 물질 및 방법이 본원에 기술되어 있다. 따라서, 본원에서 사용된 전문 용어는 특수한 구현예 만을 기술하는 목적을 위한 것이며, 제한하는 것으로 의도되지 않는다.
정의
본 출원에서, 단수의 사용은 구체적으로 달리 기술하지 않는 한 복수를 포함한다. 명세서에서 사용된 바와 같이, 단수 형 하나("a", "an") 및 그("the")는 문맥이 달리 명확하게 구술하지 않는 한 복수 참고를 포함한다.
본 출원에서, "또는"의 사용은 달리 기술하지 않는 한 "및/또는"을 의미한다. 본원에 사용된 바와 같은 용어 "및/또는" 및 "이의 임의의 조합" 및 이의 문법적 등가물은 상호교환적으로 사용될 수 있다. 이러한 용어는 임의의 조합이 구체적으로 고려됨을 전달할 수 있다. 단지 설명적 목적을 위해, 다음의 어구 "A, B, 및/또는 C" 또는 "A, B, C, 또는 이의 임의의 조합"은 "개별적으로 A; 개별적으로 B; 개별적으로 C; A 및 B; B 및 C; A 및 C; 및 A, B, 및 C"를 의미한다. 용어 "또는"은 문맥이 구체적으로 분리성 용도를 지칭하지 않는 한, 결합하여 또는 분리하여 사용될 수 있다.
또한, "포함하는(including)" 뿐만 아니라 다른 형태, 예를 들어, "포함하다(include, includes, 및 included)"는 제한되지 않는다.
명세서에서 "일부 구현예", "구현예", "일 구현예" 또는 "다른 구현예"에 대한 참고는 구현예와 관련하여 기술된 특수한 특징, 구조, 또는 특성이 적어도 일부 구현예에 포함되지만 필수적으로 본 개시내용의 모든 구현예에 포함되지는 않는다는 것을 의미한다.
본 명세서 및 청구범위(들)에서 사용된 바와 같은, 단어 "포함하는(comprising)"(및 "포함하다(comprise 및 comprises)"와 같은 '포함하는'의 임의l 형태), "갖는(having)"(및 "갖다(have 및 has)"와 같은 '갖는'의 임의의 형태), "포함하는"(및 "포함하다(includes 및 include)"와 같은 '포함하는'의 임의의 형태) 또는 "함유하는"(및 "함유하다(contains 및 contain)"와 같은 '함유하는'의 임의의 형태)는 포괄적이거나 비제한적(open-ended)이며 추가의, 인용되지 않은 성분 또는 방법 단계를 배제하지 않는다. 본 명세서에서 논의된 임의의 구현예는 본 개시내용의 임의의 방법 또는 조성물과 관련하여 시행될 수 있고, 그 역으로도 가능함이 고려된다. 또한, 본 개시내용의 조성물을 사용하여 본 개시내용의 방법을 달성할 수 있다.
본원에 사용된 바와 같은 참고 수치 및 이의 문법적 등가물과 관련하여 용어 "약"은 수치 자체 및 이러한 수치로부터 플러스 또는 마이너스 10%의 범위를 포함할 수 있다.
용어 "약" 또는 "대략"은 당해 분야의 통상의 기술자에 의해 측정된 특수한 값에 대해 허용되는 오차 범위 이내를 의미하며, 이는 이러한 값이 측정되거나 결정되는 방법의 일부, 즉, 측정 시스템의 한계에 의존할 것이다. 예를 들면, "약"은 당해 분야에서 실시 당, 1 또는 1 이상의 표준 편차 이내를 의미할 수 있다. 대안적으로, "약"은 주어진 값의 20% 이하, 10% 이하, 5% 이하, 또는 1% 이하의 범위를 의미할 수 있다. 다른 예에서, 양 "약 10"은 10 및 9 내지 11로부터의 임의의 양을 포함한다. 여전히 다른 실시예에서, 참고 수치와 관련하여 용어 "약"은 또한 이러한 값으로부터 플러스 또는 마이너스 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 또는 1%의 범위를 포함할 수 있다. 대안적으로, 생물학적 시스템 또는 공정과 관련하여, 용어 "약"은 값의 자릿수 이내, 바람직하게는 값의 5배, 및 보다 바람직하게는 2배 이내를 의미할 수 있다. 특수한 값이 본 출원 및 청구범위에 기술되어 있지만, 달리 기술하지 않는 한, 특수한 값에 대해 허용되는 오차 범위 이내를 의미하는 용어 "약"이 추정되어야 한다.
본원에 사용된 바와 같은 용어 "단리된" 및 이의 문법적 등가물은 이의 천연 환경으로부터 핵산의 제거를 지칭한다. 본원에 사용된 바와 같은 용어 "정제된" 및 이의 문법적 등가물은 천연(게놈성 DNA 및 mRNA 포함)으로부터 제거되거나 합성(cDNA 포함)되고/되거나 실험실 조건 하에서 증폭된 것에 상관없이, 순도가 증가된 분자 또는 조성물을 지칭하며, 여기서 "순도"는 "절대 순도"가 아닌 상대적인 용어이다. 그러나, 핵산 및 단백질은 희석제 또는 보조제(adjuvant)와 함께 제형화될 수 있고 실질적인 목적을 위해 여전히 분리되어야 함이 이해되어야 한다. 예를 들면, 핵산은 전형적으로 세포 내로 도입하기 위해 사용된 경우 허용되는 담체 또는 희석제와 혼합된다. 본원에 사용된 바와 같은 용어 "실질적으로 정제된" 및 이의 문법적 등가물은 필수적으로 유리된, 즉, 폴리뉴클레오타이드, 단백질, 폴리펩타이드 및 핵산, 폴리펩타이드, 단백질 또는 다른 화합물이 천연적으로 관련되어 있는 다른 분자 중 약 50% 유리되고, 약 70% 이상 유리되며, 약 90% 이상 유리된 다른 화합물을 지칭한다.
본원에 사용된 바와 같은 "폴리뉴클레오타이드", "올리고뉴클레오타이드", "폴리뉴클레오타이드 작제물", "유전자", "유전자 작제물", "이종 유전자" 및 이의 문법적 등가물은 리보뉴클레오타이드 또는 데옥시리보뉴클레오타이드인, 임의의 길이의 뉴클레오타이드 또는 핵산의 중합체 형태를 지칭한다. 이러한 용어는 분자의 1차 구조 만을 지칭한다. 따라서, 이러한 용어는 이중 가닥 및 단일 가닥 DNA, 트리플렉스(triplex) DNA 뿐만 아니라 이중 및 단일 가닥 RNA를 포함한다. 이는 또한 예를 들면, 메틸화에 의해 및/또는 캡핑(capping)에 의해 변형된, 및 변형되지 않은 형태의 폴리뉴클레오타이드를 또한 포함한다. 용어는 또한 비-천연적으로 발생한 또는 합성 뉴클레오타이드 뿐만 아니라 뉴클레오타이드 유사체를 포함하는 분자를 포함함을 의미한다. 본원에 개시되거나 고려된 핵산 서열 및 벡터는 예를 들면, 형질감염, 형질전환, 또는 형질도입에 의해 세포 내로 도입될 수 있다.
본원에 사용된 바와 바와 같은 "형질감염", "형질전환" 또는 "형질도입"은 물리적 또는 화학적 방법을 사용한 숙주 세포 내로의 하나 이상의 외인성 폴리뉴클레오타이드의 도입을 지칭한다. 많은 형질감염 기술이 당해 분야에 공지되어 있고 예를 들면, 인산칼슘 DNA 공-침전(참고: 예컨대, Murray E. J. (ed.), Methods in Molecular Biology, Vol. 7, Gene Transfer and Expression Protocols, Humana Press (1991)); DEAE-덱스트란; 전기천공(electroporation); 양이온성 리포좀-매개된 형질감염; 텅스텐 입자-촉진된 미세입자 충격(cationic liposome-mediated transfection; tungsten particle-facilitated microparticle bombardment)(Johnston, Nature, 346: 776-777 (1990)); 및 인산스트론튬 DNA 공-침전(Brash et al., Mol. Cell Biol., 7: 2031-2034 (1987))을 포함한다. 파아지 또는 바이러스 벡터는 적합한 패키징 세포(packaging cell) 내에서 감염성 입자의 성장 후, 숙주 세포 내로 도입시킬 수 있으며, 이들 중 많은 것이 상업적으로 이용가능하다.
본원에 사용된 바와 같은 "폴리펩타이드", "펩타이드", "폴리펩타이드 작제물" 및 "펩타이드 작제물" 및 이들의 문법적 등가물은 아미노산 잔기의 중합체를 지칭한다. "성숙한 단백질"은 전체 길이의 단백질이고, 이는 임의로, 주어진 세포 환경에서 단백질에 대해 대표적인 글리코실화 또는 다른 변형을 포함한다. 본원에 개시된 폴리펩타이드 및 단백질(이의 기능성 부위 및 기능성 변이체 포함)은 하나 이상의 천연적으로 발생하는 아미노산 대신에 합성 아미노산을 포함할 수 있다. 이러한 합성 아미노산은 당해 분야에 공지되어 있으며, 예를 들면, 아미노사이클로헥산 카복실산, 노르루이신, α-아미노 n-데카노산, 호모세린, S-아세틸아미노메틸-시스테인, 트랜스-3- 및 트랜스-4-하이드록시프롤린, 4-아미노페닐알라닌, 4-니트로페닐알라닌, 4-클로로페닐알라닌, 4-카복시페닐알라닌, β-페닐세린 β-하이드록시페닐알라닌, 페닐글리신, α-나프틸알라닌, 사이클로헥실알라닌, 사이클로헥실글리신, 인돌린-2-카복실산, 1,2,3,4-테트라하이드로이소퀴놀린-3-카복실산, 아미노말론산, 아미노말론산 모노아미드, N'-벤질-N'-메틸-라이신, N',N'-디벤질-라이신, 6-하이드록시라이신, 오르니틴, α-아미노사이클로펜탄 카복실산, α-아미노사이클로헥산 카복실산, α-아미노사이클로헵탄 카복실산, α-(2-아미노-2-노르보르난)-카복실산, α,γ-디아미노부티르산, α,β-디아미노프로피온산, 호모페닐알라닌, 및 α-3급-부틸글리신을 포함한다. 본 개시내용은 또한 가공된 세포 내에서 본원에 기술된 폴리펩타이드의 발현이 폴리펩타이드 작제물의 하나 이상의 아미노산의 해독 후 변형과 관련될 수 있음을 고려한다. 해독 후 변형의 비-제한적 예는 포스포릴화, 아실화, 에를 들면, 아세틸화 및 포르밀화, 글리코실화(N-연결된 및 O-연결된 것을 포함함), 아미드화, 하이드록실화, 알킬화, 예를 들면, 메틸화 및 에틸화, 유비퀴틸화, 피롤리돈 카복실산의 첨가, 이황화물 브릿지(disulfide bridge)의 형성, 황화(sulfation), 미리스토일화, 팔미토일화, 이소프레닐화, 파르네실화, 게라닐화, 당화(glypiation), 리포일화(lipoylation) 및 요오드화를 포함한다.
핵산 및/또는 핵산 서열은 이들이 일반적인 조상 핵산(ancestral nucleic acid) 또는 핵산 서열로부터 천연적으로 또는 인공적으로 기원하는 경우 "상동성"이다. 단백질 및/또는 단백질 서열은 이의 암호화 DNA가 일반적인 조상 핵산 또는 핵산 서열로부터 천연적으로 또는 인공적으로 유래하는 경우 "상동성"이다. 상동성 분자는 동족체로 명명될 수 있다. 예를 들면, 본원에 기술된 바와 같은, 임의의 천연적으로 발생하는 단백질은 임의의 이용가능한 돌연변이유발 방법으로 변형시킬 수 있다. 발현시키는 경우, 이러한 돌연변이유발된 핵산은 원래의 핵산에 의해 암호화된 단백질에 대해 상동성인 폴리펩타이드를 암호화한다. 상동성은 일반적으로 2개 이상의 핵산 또는 단백질(또는 이의 서열) 사이의 서열 동일성(sequence identity)으로부터 부여된다. 상동성을 확립하는데 유용한 서열 사이의 정밀한 동일성 퍼센트는 쟁점인 핵산 및 단백질과 함께 변하지만, 상동성을 확립하기 위해 25% 정도로 낮은 서열 동일성이 통상적으로 사용된다. 보다 높은 수준의 서열 동일성, 예컨대, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95% 또는 99% 이상을 또한 사용하여 상동성을 확립할 수 있다. 서열 동일성 퍼센트를 측정하는 방법(예컨대, 디폴트 매개변수(default parameter)를 사용한 BLASTP 및 BLASTN)가 본원에 기술되어 있으며 일반적으로 이용가능하다.
본원에 사용된 바와 같은 용어 "동일한" 및 이의 문법적 등가물 또는 폴리펩타이드의 2개의 핵산 서열 또는 아미노산 서열의 맥락에서 "서열 동일성"은 규정된 비교 윈도우(comparison window)에 걸쳐 최대 상응성에 대해 정렬한 경우 동일한 2개 서열 내 잔기를 지칭한다. 본원에 사용된 바와 같은 "비교 윈도우"는 적어도 약 20개, 일반적으로 약 50 내지 약 200개, 보다 일반적으로 약 100 내지 약 150개의 연속된 위치의 분절(segment)을 지칭하며, 여기서 서열은 2개의 서열을 최적으로 정렬한 후 연속된 위치의 동일한 번호의 참고 서열과 비교될 수 있다. 비교를 위한 서열의 정렬 방법은 당해 분야에 잘 공지되어 있다. 비교를 위한 서열의 최적의 정렬은 문헌: Smith and Waterman, Adv. Appl. Math., 2:482 (1981)의 국소 상동성 알고리즘(local homology algorithm)에 의해; 문헌: Needleman and Wunsch, J. Mol. Biol., 48:443 (1970)의 정렬 알고리즘에 의해; 문헌: Pearson and Lipman, Proc. Nat. Acad. Sci U.S.A., 85:2444 (1988)의 유사성 방법에 대한 조사에 의해; 이러한 알고리즘의 컴퓨터처리된 시행(예를 들면, 캘리포니아주 마운틴 뷰(Mountain View) 소재의 Intelligentics에 의한 PC/Gene 프로그램에서 CLUSTAL, GAP, BESTFIT, BLAST, FASTA, 및 미국 위스콘신주 매디슨(Madison) 사이언스 드라이브 575 소재의 Genetics Computer Group (GCG), Wisconsin Genetics Software Package에서의 TFASTA)에 의해 수행될 수 있으며; CLUSTAL 프로그램은 문헌: Higgins and Sharp, Gene, 73:237-244 (1988) 및 Higgins and Sharp, CABIOS, 5:151-153 (1989); Corpet et al., Nucleic Acids Res., 16:10881-10890 (1988); Huang et al., Computer Applications in the Biosciences, 8:155-165 (1992); 및 Pearson et al., Methods in Molecular Biology, 24:307-331 (1994)에 잘 기술되어 있다. 정렬은 또한 검토 및 매뉴얼 정렬에 의해 흔히 수행된다. 구현예의 한 부류에서, 본원의 폴리펩타이드는 예컨대, 디폴트 매개변수를 사용하여 BLASTP(또는 CLUSTAL, 또는 임의의 다른 유용한 정렬 소프트웨어)에 의해 측정된 바와 같은, 참고 폴리펩타이드, 또는 이의 단편과 적어도 80%, 85%, 90%, 98%, 99% 또는 100% 동일하다. 유사하게, 핵산은 또한 출발 핵산을 참고로 기술될 수 있는데, 이들은 예컨대, 유용한 디폴트 매개변수를 사용하여 BLASTN(또는 CLUSTAL, 또는 임의의 다른 이용가능한 정렬 소프트웨어)에 의해 측정된 바와 같이, 참고 핵산 또는 이의 단편에 대해 50%, 60%, 70%, 75%, 80%, 85%, 90%, 98%, 99% 또는 100% 동일할 수 있다. 하나의 분자가 보다 큰 분자와 서열 동일성의 특정 퍼센트를 갖는 것으로 일컬어지는 경우, 이는 2개의 분자가 최적으로 정렬되는 경우, 보다 작은 분자 내 잔기의 상기 퍼센트가 2개 분자가 최적으로 정렬된 순서에 따라 보다 큰 분자내 매치 잔기(match residue)를 찾음을 의미한다.
핵산 또는 아미노산 서열에 적용된 바와 같은 용어 "실질적으로 동일한" 및 이의 문법적 등가물은 핵산 또는 아미노산 서열이 상술한 프로그램, 예컨대, 표준 매개변수를 사용하는, BLAST를 사용하여 참고 서열과 비교시 적어도 90% 이상의 서열 동일성, 적어도 95%, 적어도 98% 및 적어도 99%의 동일성을 갖는 서열을 포함함을 의미한다. 예를 들면, BLASTN 프로그램(뉴클레오타이드 서열의 경우)은 디폴트로서 11의 단어 길이(word length)(W), 10의 예측(E), M=5, N=-4, 및 가닥(strand) 둘 다의 비교를 사용한다. 아미노산 서열의 경우, BLASTP 프로그램은 디폴트로서 3의 단어 길이(W), 10의 예측(E), 및 BLOSUM62 점수매김 매트릭스(scoring matrix)를 사용한다(참고: Henikoff & Henikoff, Proc. Natl. Acad. Sci. USA 89:10915 (1992)). 서열 동일성의 퍼센트는 비교 윈도우에 걸쳐서 2개의 최적으로 정렬된 서열을 비교함으로써 측정되며, 여기서, 비교 윈도우내 폴리뉴클레오타이드 서열의 부위는 2개의 서열의 최적의 정렬을 위해 참고 서열(이는 첨가 또는 결실을 포함하지 않는다)과 비교하여 첨가 또는 결실(즉, 갭(gap))을 포함할 수 있다. 퍼센트는 동일한 핵산 염기 또는 아미노산 잔기가 서열 둘 다에서 발생하여 매치된 위치의 수를 생성하는 위치의 수를 측정하고, 매치된 위치의 수를 비교 윈도우내 위치의 총 수로 나누고 이러한 결과에 100을 곱하여 서열 동일성 퍼센트를 수득함으로써 계산한다. 구현예에서, 실질적인 동일성은 길이가 적어도 약 50개 잔기인 서열의 영역에 걸쳐, 적어도 약 100개의 잔기의 범위에 걸쳐 존재하고, 구현예에서, 서열은 적어도 약 150개 잔기에 걸쳐 실질적으로 동일하다. 구현예에서, 서열은 암호화 영역(coding region)의 전체 길이에 걸쳐 실질적으로 동일하다.
"발현 벡터" 또는 "벡터"는 세포 내 폴리뉴클레오타이드 복제의 자가 단위(즉, 이의 자체 제어 하에 복제할 수 있는)로서 거동하거나 숙주 세포 염색체 내로 삽입하여 복제할 수 있도록 하거나, 이에 다른 폴리뉴클레오타이드 분절을 부착시켜, 부착된 분절의 복제 및/또는 발현을 유발시키는 임의의 유전 성분, 예컨대, 플라스미드, 염색체, 바이러스, 트랜스포존(transposon)이다. 적합한 벡터는 플라스미드, 트랜스포존, 박테리오파아지 및 코스미드를 포함하나, 이에 한정되지 않는다. 벡터는 목적한 숙주 세포 내로의 벡터의 연결 또는 삽입을 수행하고 부착된 분절의 발현을 수행하는데 필수적인 폴리뉴클레오타이드 서열을 함유할 수 있다. 이러한 서열은 숙주 유기체에 따라 상이하고; 이들은 전사를 수행하는 프로모터 서열, 전사를 증가시키는 인핸서 서열, 리보소옴 결합 부위 서열 및 전사 및 해독 종결 서열을 포함한다. 대안적으로, 발현 벡터는 벡터를 숙주 세포 DNA 서열 내로 연결시키거나 통합시키지 않고 내부에 암호화된 핵산 서열 생성물을 직접 발현시킬 수 있다. 일부 구현예에서, 벡터는 "에피좀 발현 벡터(episome expression vector)" 또는 "에피좀(episome)"이며, 이는 숙주 세포 내에서 복제할 수 있고, 적절한 선택적 압력의 존재하에서 숙주 세포 내에서 DNA의 염색체외 분절로서 지속한다(참고: 예컨대, Conese et al., Gene Therapy, 11:1735-1742 (2004)). 대표적으로 상업적으로 이용가능한 에피솜 발현 벡터는 엡슈타인 바르 핵 항원(Epstein Barr Nuclear 항원) 1(EBNA1) 및 엡슈타인 바르 바이러스(EBV) 복제 오리진(oriP)을 이용하는 에피솜 플라스미드를 포함하나, 이에 한정되지 않는다. Invitrogen(캘리포니아주 칼스바드 소재)으로부터의 벡터 pREP4, pCEP4, pREP7, 및 pcDNA3.1 및 Stratagene(캘리포니아주 라 졸라 소재)로부터의 pBK-CMV는 EBNA1 및 oriP 대신에 T-항원 및 SV40 복제 오리진을 사용하는 에피솜 벡터의 비-제한적 예를 나타낸다. 벡터는 또한 선택가능한 마커 유전자를 포함할 수 있다.
본원에 사용된 바와 같은 용어 "아데노바이러스"는 아데노바이러스 생명 주기에 관여하는 능력을 보유하고 에를 들면, 파괴(예컨대, 초음파), 변성(예컨대,열 또는 용매의 사용), 또는 교차-연결(예컨대, 포르말린 교차-연결)에 의해 물리적으로 불활성화되지 않은 아데노바이러스를 지칭한다. "아데노바이러스 생명 주기"는 (1) 바이러스 결합 및 세포 내로의 도입, (2) 아데노바이러스 게놈의 전사 및 아데노바이러스 단백질의 해독, (3) 아데노바이러스 게놈의 복제, 및 (4) 바이러스 입자 조립을 포함한다(참고: 예컨대, Fields Virology, 5th ed., Knipe et al. (eds.), Lippincott Williams & Wilkins, Philadelphia, PA (2006)). 본원에 사용된 바와 같은 용어 "아데노바이러스 벡터"는 아데노바이러스 게놈이 아데노바이러스 게놈과 관련하여 비-천연인 핵산 서열을 수용하도록 조작된 아데노바이러스를 지칭한다. 전형적으로, 아데노바이러스 벡터는 하나 이상의 돌연변이(예컨대, 결실, 삽입, 또는 치환)를 아데노바이러스의 아데노바이러스 게놈 내로 도입하여 예를 들면, 유전자 전달을 위해 비-천연 핵산 서열의 아데노바이러스 내로의 삽입을 수용함으로써 생성된다.
본원에 사용된 바와 같은 용어 "선택가능한 마커 유전자"는 세포가 상응하는 선택제의 존재하에서, 이에 대하여 또는 대항하여 특이적으로 선택될 핵산 서열을 발현하도록 하는 핵산 서열을 지칭한다. 적합한 선택가능한 마커 유전자는 당해 분야에 공지되어 있으며, 예컨대, 국제 특허원 공보 제WO 1992/08796호 및 제WO 1994/28143호; Wigler et al., Proc. Natl. Acad. Sci. USA, 77: 3567 (1980); O'Hare et al., Proc. Natl. Acad. Sci. USA, 78: 1527 (1981); Mulligan & Berg, Proc. Natl. Acad. Sci. USA, 78: 2072 (1981); Colberre-Garapin et al., J. Mol. Biol., 150:1 (1981); Santerre et al., Gene, 30: 147 (1984); Kent et al., Science, 237: 901-903 (1987); Wigler et al., Cell, 11: 223 (1977); Szybalska & Szybalski, Proc. Natl. Acad. Sci. USA, 48: 2026 (1962); Lowy et al., Cell, 22: 817 (1980); 및 미국 특허 제5,122,464호 및 제5,770,359호에 기술되어 있다.
본원에 사용된 바와 같은 용어 "암호화 서열"은 단백질을 암호화하는 폴리뉴클레오타이드의 분절을 지칭한다. 영역 또는 서열은 출발 코돈에 의해 5' 말단의 더 근처에서 및 출발 코돈과 함께 3' 말단의 더 근처에서 결합된다. 암호화 서열은 또한 개방 판독 프레임(open reading frame)으로써 지칭될 수 있다.
본원에 사용된 바와 같은 용어 "작동적으로 연결된"은 분절이 이들의 의도된 방식으로 작용하도록 하는 방식으로 다른 DNA 분절에 대한 DNA 분절의 물리적 및/또는 기능적 연결을 지칭하기 위해 지칭된다. 유전자 생성물을 암호화하는 DNA 서열은 이것이 조절 서열, 예를 들면, 프로모터, 인핸서 및/또는 사일런서(silencer)에 DNA 서열의 전사를 직접 또는 간접적으로 조절하도록 하는 방식으로 연결된 경우 조절 서열에 작동적으로 연결된다. 예를 들면, DNA 서열은, 이것이 프로모터의 전사 개시 부위와 관련하여 하부(downstream)로 프로모터에 연결된 경우, 전사 개시 부위와 관련하여 정확한 판독 프레임으로 프로모터에 작동적으로 연결되어 전사 신장(전사 elongation)이 DNA 서열을 통해 진행되도록 한다. 인핸서 또는 사일런서는 이것이 DNA 서열의 전사를 각각 증가시키거나 감소시키는 방식으로 DNA 서열에 연결되는 경우 유전자 생성물을 암호화하는 DNA 서열에 작동적으로 연결된다. 인핸서 및 사일런서는 DNA 서열의 암호화 영역 내에 상부(upstream)에, 하부에 위치하거나 포매(embedding)될 수 있다. 신호 서열에 대한 DNA는 신호 서열이 폴리펩타이드의 분비에 관여하는 프레(pre)-단백질로서 발현되는 경우 폴리펩타이드를 암호화하는 DNA에 작동적으로 연결된다. 조절 서열에 대한 DNA 서열의 연결은 전형적으로 적합한 제한 부위에서 연결에 의해 또는 당해 분야의 기술자에게 공지된 제한 엔도뉴클레아제를 사용하여 서열 내 삽입된 어댑터(adaptet) 또는 링커를 통해 달성된다.
본원에 사용된 바와 같은 용어 "유도하다", "유도" 및 이의 문법적 등가물은 일부 기본 수준의 전사와 관련하여 전사 조절인자에 의해 유발된 핵산 서열 전사, 프로모터 활성 및/또는 발현에 있어서의 증가를 지칭한다.
용어 "전사 조절인자"는 특정의 환경 조건(예컨대, 리프레서(repressor) 또는 핵 억제 단백질) 하에서 프로모터-유래된 DNA 서열의 전사를 예방하거나 억제하거나, 특정의 환경 조건(예컨대, 유도인자 또는 인핸서) 하에서 프로모터-유래된 DNA 서열의 전사를 허용하거나 자극하는데 작용하는 생화학적 성분을 지칭한다.
본원에 사용된 바와 같은 용어 "인핸서"는 예를 들면, 이것이 작동적으로 연결된 핵산 서열의 전사를 증가시키는 DNA 서열을 지칭한다. 인핸서는 핵산 서열의 암호화 영역으로부터 많은 킬로염기(kilobase) 떨어져서 위치할 수 있으며 조절 인자의 결합, DNA 메틸화의 패턴, 또는 DNA 구조내 변화를 매개할 수 있다. 다양한 상이한 공급원으로부터의 다수의 인핸서가 당해 분야에 잘 공지되어 있고 클로닝된 폴리뉴클레오타이드(예컨대, ATCC와 같은 기탁 기관 뿐만 아니라 다른 상업적 또는 개인 공급원으로부터의)로서 또는 내에서 이용가능하다. 프로모터(예를 들면, 일반적으로 사용된 CMV 프로모터)를 포함하는 다수의 폴리뉴클레오타이드는 또한 인핸서 서열을 포함한다. 인핸서는 암호화 서열의 상부, 내부 또는 하부에 위치할 수 있다. 용어 "Ig 인핸서"는 면역글로불린(Ig) 유전자자리(locus)(예를 들면, 인핸서는 예를 들면, 중쇄(mu) 5' 인핸서, 경쇄(카파) 5' 인핸서, 카파 및 뮤(mu) 인트론성 인핸서, 및 3' 인핸서를 포함한다) 내에 맵핑된 인핸서 영역으로부터 유래된 인핸서 성분을 지칭한다(참고: 일반적으로 Paul W. E. (ed), Fundamental Immunology, 3rd Edition, Raven Press, New York (1993), pages 353-363; 및 미국 특허 제5,885,827호).
용어 "프로모터"는 암호화 서열의 전사를 개시하는 폴리뉴클레오타이드의 영역을 지칭한다. 프로모터는 유전자의 전사 개시 부위 근처에서, 동일한 가닥 상에 및 DNA 상의 상부(센스 가닥의 5' 영역을 향해)에서 위치한다. 일부 프로모터는 이들이 세포 내 모든 환경에서 활성이므로 구성적이지만, 다른 것은 특정 자극에 대한 반응시 활성이 되도록, 예컨대, 유도성 프로모터가 되도록 조절된다. 본원에 사용된 바와 같은 용어 "프로모터 활성" 및 이의 문법적 등가물은 이의 활성이 측정되는 프로모터에 작동적으로 연결된 뉴클레오타이드 서열의 발현 정도를 지칭한다. 프로모터 활성은 예를 들면, 노던 블롯 분석(Northern blot analysis)에 의해 생산된 RNA 전사체의 양을 측정함으로써 직접적으로 또는 연결된 핵산 서열, 예를 들면, 프로모터에 연결된 리포터 핵산 서열에 대해 암호화된 생성물의 양을 측정함으로써 간접적으로 측정할 수 있다.
본원에 사용된 바와 같은 "유도성 프로모터"는 전사 조절인자, 예컨대, 바이오틱(biotic) 또는 아바이오틱(abiotic) 인자의 존재 또는 부재에 의해 활성으로 유도된 프로모터를 지칭한다. 유도성 프로모터는 이들에게 작동적으로 연결된 유전자의 발현이 유기체의 발달의 특정 단계에서 또는 특수한 조직에서 작동(turn on)되거나 작동되지 않을(turn off) 수 있으므로 유용하다. 유도성 프로모터의 비-제한적 예는 알코올-조절된 프로모터, 테트라사이클린-조절된 프로모터, 스테로이드-조절된 프로모터, 금속-조절된 프로모터, 발병-조절된 프로모터, 온도-조절된 프로모터 및 광-조절된 프로모터를 포함한다. 유도성 프로모터는 유전자 스위치 또는 유전 스위치의 부분일 수 있다. 유도성 프로모터는 유전자 스위치 리간드 유도성 프로모터일 수 있다. 일부 경우에, 유도성 프로모터는 소 분자 리간드-유도성의 2개의 폴리펩타이드 엑다이손 수용체-기반 유전자 스위치일 수 있다. 일부 경우에, 국제 특허원 제WO 2001/070816호; 제WO 2002/029075호; 제WO 2002/066613호; 제WO 2002/066614호; 제WO 2002/066612호; 제WO 2002/066615호; 제WO 2003/027266호; 제WO 2003/027289호; 제WO 2005/108617호; 제WO 2009/045370호; 제WO 2009/048560호; 제WO 2010/042189호; 제WO 2010/042189호; 제WO 2011/119773호; 및 제WO 2012/122025호; 및 미국 특허 제7,091,038호; 제7,776,587호; 제7,807,417호; 제8,202,718호; 제8,105,825호; 제8,168,426호; 제7,531,326호; 제8,236,556호; 제8,598,409호; 제8,715,959호; 제7,601,508호; 제7,829,676호; 제7,919,269호; 제8,030,067호; 제7,563,879호; 제8,021,878호; 제8,497,093호; 제7,935,510호; 제8,076,454호; 제9,402,919호; 제9,493,540호; 제9,249,207호; 및 제9,492,482호에 기술된 임의의 시스템에 기술되지만, 이에 한정되지 않는 엑다이손-기반 수용체 구성성분으로부터 선택될 수 있으며, 이들 각각은 이의 전문이 참고로 포함된다.
용어 "유전자 스위치" 또는 "유전성 스위치"는 프로모터와 관련된 반응 성분, 및 예를 들면, 하나 이상의 리간드의 존재하에서 반응 성분 및 프로모터가 도입된 유전자의 발현을 조절하는 EcR 기반 시스템의 조합을 지칭한다. 강력하게 조절된 유도성 유전자 발현 시스템 또는 유전자 스위치는 다양한 적용, 예를 들면, 유전자 치료요법, 세포 내에서 단백질의 대규모 생산, 세포 기반된 고 처리량 스크리닝 검정, 기능성 유전체학 및 형질전환 식물 및 동물에서 특징(trait)의 조절에 유용하다. 이러한 유도성 유전자 발현 시스템은 리간드 유도성 이종 유전자 발현 시스템을 포함할 수 있다.
"슬리핑 뷰티(Sleeping Beauty: SB) 트랜스포존 시스템(트랜스포존 시스템)"은 DNA 서열을 척추동물의 염색체 내로 도입시키기 위한 합성 DNA 트랜스포존 시스템을 지칭한다. 이러한 시스템의 일부 예시적인 구현예는 예를 들면, 미국 특허 제6,489,458호, 제8,227,432호, 제9,228,180호 및 제WO/2016/145146호에 기술되어 있다. 슬리핑 뷰티 트랜스포존 시스템은 슬리핑 뷰티(SB) 트랜스포사제 및 SB 트랜스포존으로 구성된다. 구현예에서, 슬리핑 뷰티 트랜스포존 시스템은 SB11 트랜스포존 시스템, SB100X 트랜스포존 시스템, 또는 SB110 트랜스포존 시스템을 포함할 수 있다.
"트랜스포존" 또는 "수송가능한 성분(transposable element)"(TE)은 때때로 돌연변이를 생성하거나 역전시키고 세포의 게놈 크기를 변경시키는 게놈 내 이의 위치를 변화시킬 수 있는 벡터 DNA 서열이다. 전위는 흔히 TE의 중복을 생성한다. 제I 부류 TE는 2개의 단계로 카피된다: 첫째로 이들은 DNA로부터 RNA로 전사되고, 생산된 RNA는 이후 DNA로 역 전사된다. 이러한 카피된 DNA는 이후 새로운 위치에서 게놈 내로 삽입된다. 역 전사 단계는 리버스 트랜스크립타제에 의해 촉매되며, 이는 TE 자체에 의해 암호화될 수 있다. 레트로트랜스포존의 특성은 레트로바이러스, 예를 들면, HIV와 유사하다. 제II 부류 TE의 절단-및-페이스트(cut-and-paste) 전위 메카니즘은 RNA 중간체를 포함하지 않는다. 전위는 수개의 트랜스포사제 효소에 의해 촉매된다. 일부 트랜스포사제는 DNA내 임의의 표적 부위에 비-특이적으로 결합하지만, 다른 것은 특정의 DNA 서열 표적에 결합한다. 트랜스포사제는 표적 부위에서 스태거된 절단(staggered cut)을 이루어 단일-가닥 5' 또는 3' DNA 오버행(overhang)(점성 말단(sticky end))을 생성한다. 이러한 단계는 DNA 트랜스포존을 절단하며, 이는 이후에 새로운 표적 부위 내에 결합(ligating)되고; 이러한 공정은 갭(gap)을 충전시키는 DNA 폴리머라제 및 당-포스페이트 골격을 폐쇄하는 DNA 리가제의 활성을 포함한다. 이는 표적 부위의 중복을 생성한다. DNA 트랜스포존의 삽입 부위는 표적 DNA 내 스태거된 절단에 의해 생성될 수 있는 짧은 직접적인 반복체에 의해서 및 DNA 폴리머라제에 의한 충전(filing in)에 이은, 트랜스포사제에 의한 TE 절개에 중요한 일련의 역위된 반복체에 의해 확인될 수 있다. 절단-및-페이스트 TE는 공여체 부위가 이미 복제되었지만, 표적 부위가 아직 복제되지 않았을 때 세포 주기의 S 기 동안에 일어나는 경우 중복될 수 있다. 전위는 제I 및 제II 부류 TE 둘 다에서 자주적이거나 비-자주적인 것으로 분류될 수 있다. 자주적인 TE는 자체적으로 이동할 수 있지만 비-자주적인 TE는 이동하기 위한 다른 TE의 존재를 필요로 한다. 이는 흔히 비-자주적인 TE가 트랜스포사제(제II 부류의 경우) 또는 리버스 트랜스퍼라제(제I 부류의 경우) 때문이다.
"트랜스포사제"는 트랜스포존의 말단에 결합하여 절단 및 페이스트 메카니즘 또는 복제성 전위 메카니즘에 의해 게놈의 다른 부분으로 트랜스포존의 이동을 촉매하는 효소를 지칭한다.
"본원에 사용된 바와 같은 "T 세포" 또는 "T 림프구"는 세포-매개된 면역성에서 중요한 역활을 하는 림프구의 유형이다. 이들은 세포 표면의 T-세포 수용체(TCR)의 존재에 의해, B 세포 및 천연 킬러 세포(NK 세포)와 같은 다른 림프구와는 구별될 수 있다.
"T 헬퍼 세포"(TH 세포)는 면역학적 공정, 예를 들면, B 세포의 혈장 세포 및 기억 B 세포로의 성숙, 및 세포독성 T 세포 및 대식구의 활성화시 다른 백혈구 세포를 보조한다. 이러한 세포는 이들의 표면에 CD4 당단백질을 발현하므로 CD4+ T 세포로서 또한 공지되어 있다. 헬퍼 T 세포는 이들이 MHC 제II 부류 분자에 의해 펩타이드 항원과 함께 나타나는 경우 활성화되며, 이러한 분자는 항원-표시 세포(antigen-presenting cell: APC)의 표면에서 발현된다. 일단 활성화되면, 이들은 신속하게 분할되어 활성 면역 반응에서 조절하거나 보조하는 사이토킨으로 불리는 소 단백질을 분비한다. 이러한 세포는 수개의 서브형, 예를 들면, TH1, TH2, TH3, TH9, TH17, TH22 또는 TFH(T 여포성 헬퍼 세포) 중 하나로 분화될 수 있으며, 이는 상이한 사이토킨을 분비하여 상이한 유형의 면역 반응을 촉진한다. APC로부터의 신호전달(signaling)은 T 세포를 특수한 서브형으로 지시한다.
"세포독성 T 세포"(TC 세포, 또는 CTL) 또는 "세포독성 T 림프구"는 바이러스-감염된 세포 및 종양 세포를 파괴하며 이식 거부에 또한 연루되어 있다. 이러한 세포는 이의 표면에 CD8 당단백질을 발현하므로 CD8+ T 세포로 공지되어 있다. 이러한 세포는 MHC 제I 부류 분자와 관련된 항원에 결합함으로써 이의 표적을 인식하며, 이는 모은 핵화된 세포(nucleated cell)의 표면에 존재한다. IL-10, 아데노신, 및 조절성 T 세포에 의해 분비된 다른 분자를 통해, CD8+ 세포는 아네르기성 상태(anergic state)로 불활성화될 수 있으며, 이는 자가면역 질환을 예방한다.
"기억 T 세포"는 감염이 해결된 후 장기간 지속하는 항원-특이적인 T 세포의 서브세트(subset)이다. 이들은 이의 동족 항원에 재-노출시 다수의 효과기 T 세포로 신속하게 확장됨으로써 과거 감염(past infection)에 대한 기억을 지닌 면역계를 제공한다. 기억 T 세포는 3개의 서브형을 포함한다: 중심 기억(central memory) T 세포(TCM 세포) 및 2개 유형의 효과기 기억 T 세포(TEM 세포 및 TEMRA 세포). 기억 세포는 CD4+ 또는 CD8+일 수 있다. 기억 T 세포는 전형적으로 세포 표면 단백질 CD45RO, CD45RA 및/또는 CCR7을 발현한다.
억제인자(suppressor) T 세포로서 앞서 공지된, "조절성 T 세포"(Treg 세포)는 면역학적 내성의 유지에 있어 역활을 담당한다. 이의 주요 역활은 면역 반응의 말기를 향해 T 세포-매개된 면역성을 정지시키고 흉선에서 음성 선택(negative selection)의 과정을 피한 자가반응성 T 세포를 억제하는 것이다.
"천연 킬러 T 세포"(NKT 세포 - 선천적 면역계의 천연 킬러 세포로 혼동되지 않아야 함)는 선천성 면역계와 함께 후천성 면역계(adaptive immune system)를 브릿지한다. 주요 조직적합성 복합체(MHC) 분자에 의해 나타난 펩타이드 항원을 인식하는 통상의 T 세포와는 달리, NKT 세포는 CD1d로 불리는 분자에 의해 나타난 당지질 항원을 인식한다. 일단 활성화되면, 이러한 세포는 T 헬퍼(TH) 및 세포독성 T(TC) 세포 둘 다에 대해 추정된 기능(즉, 사이토킨 생산 및 세포분해/세포사멸 분자의 방출)을 수행할 수 있다. 이들은 또한 일부 종양 세포 및 헤르페스 바이러스로 감염된 세포를 인식하여 이를 제거할 수 있다.
"후천성 T 세포 전달"은 예방접종 단독 또는 환자의 천연 종양 반응에 의해 수득될 수 있는 것보다 더 많은 수의 T 세포를 달성하기 위한 종양 특이적인 T 세포의 단리 및 생체외(ex vivo) 확장을 지칭한다. 이후에, 종양 특이적인 T 세포는 이의 면역 시스템에 암을 공격하여 이를 사멸시킬 수 있는 T 세포를 통해 남아있는 종양을 제압하는 능력을 제공하기 위한 시도에서 암을 지닌 환자 내로 주입된다. 종양 침윤 림프구 또는 TIL을 배양하고, 하나의 특수한 T 세포 또는 클론을 단리하고 확장하며, 심지어 종양을 강력하게 인식하고 이를 공격하도록 가공된 T 세포를 사용하는 암 치료에 사용되는 입양 T 세포 치료요법(adoptive T cell therapy)의 많은 형태가 존재한다.
본원에 사용된 바와 같은 "항체"는 모노클로날 또는 폴리클로날 항체를 지칭한다. 본원에 사용된 바와 같은 용어 "모노클로날 항체"는 B-세포의 단일 클론에 의해 생산되어 동일한 에피토프에 결합된 항체를 지칭한다. 대조적으로, "폴리클로날 항체"는 상이한 B-세포에 의해 생산되어 동일한 항원의 에피토프에 결합하는 항체의 집단을 지칭한다. 전체 항체는 전형적으로 4개의 폴리펩타이드로 이루어진다: 중(H) 쇄 폴리펩타이드의 2개의 동일한 카피 및 경(L) 쇄 폴리펩타이드의 2개의 동일한 카피. 각각의 중쇄는 하나의 N-말단 가변(VH) 영역 및 3개의 C-말단 불변(CH1, CH2 및 CH3) 영역을 함유하며, 각각의 경쇄는 하나의 N-말단 가변(VL) 영역 및 하나의 C-말단 불변(CL) 영역을 함유한다. 경쇄 및 중쇄의 각각의 쌍의 가변 영역은 항체의 항원 결합 부위를 형성한다. VH 및 VL 영역은 유사한 일반 구조를 가지며, 각각의 영역은 4개의 골격 영역을 포함하고, 이의 서열은 비교적 보존되어 있다. 골격 영역은 3개의 상보성 결정 영역(CDR)에 의해 연결되어 있다. CDR1, CDR2, 및 CDR3으로 공지된 3개의 CDR은 항체의 "초가변 영역"을 형성하며, 이는 항원 결합에 관여한다.
"항체 유사 분자"는 예를 들면, 파트너에 선택적으로 결합할 수 있는 Ig-상과(superfamily)의 구성원인 단백질일 수 있다. MHC 분자 및 T 세포 수용체가 이러한 분자이다. 일 구현예에서, 항체-유사 분자는 TCR이다. 일 구현예에서, TCR은 변형되어 이의 MHC 결합 친화성을 증가시켜 왔다.
용어 "항체의 단편", "항체 단편", "항체의 기능성 단편", "항원-결합 부위" 또는 이의 문법적 등가물은 항원에 특이적으로 결합하는 능력을 보유한 항체의 하나 이상의 단편 또는 부위를 의미하기 위해 본원에서 사용교환적으로 사용된다(참고: 일반적으로, Holliger et al., Nat. Biotech., 23(9):1126-1129 (2005)). 항체 단편은 바람직하게는 예를 들면, 하나 이상의 CDR, 가변 영역(또는 이의 부위), 불변 영역(또는 이의 부위), 또는 이의 조합을 포함한다. 항체 단편의 비-제한적 예는 (i) VL, VH, CL, 및 CH1 도메인으로 이루어진 1가 단편인, Fab 단편; (ii) 스택 영역(stalk 영역)에서 이황화물 브릿지에 의해 연결된 2개의 Fab 단편을 포함하는 2가 단편인, F(ab')2 단편; (iii) 항체의 단일 아암(arm)의 VL 및 VH 도메인으로 이루어진 Fv 단편; (iv) 2개의 도메인이 단일 폴리펩타이드 쇄로서 합성되도록 할 수 있는 합성 링커에 의해 결합된 Fv 단편(즉, VL 및 VH)의 2개의 도메인으로 이루어진 1가 분자인, 단일 쇄 Fv(scFv)(참고: 예컨대, Bird et al., Science, 242: 423-426 (1988); Huston et al., Proc. Natl. Acad. Sci. USA, 85: 5879-5883 (1988); 및 Osbourn et al., Nat. Biotechnol., 16: 778 (1998)) 및 (v) 폴리펩타이드 쇄의 이량체인, 디아보디(diabody)를 포함하며, 여기서 각각의 폴리펩타이드 쇄는 동일한 폴리펩타이드 쇄 상의 VH와 VL 사이에 쌍화(pairing)를 허용함으로써, 상이한 VH-VL 폴리펩타이드 쇄 상의 상보성 도메인 사이에 쌍화를 이끌어 2개의 기능적 항원 결합 부위를 갖는 이량체성 분자를 생성하기에는 너무 짧아서 불가능한 펩타이드 링커에 의해 VL에 연결된 VH를 포함한다. 항체 단편은 당해 분야에 공지되어 있으며 예컨대, 미국 특허 제8,603,950호에 보다 상세히 기술되어 있다.
"항원 인식 모이어티(antigen recognition moiety)" 또는 "항원 인식 도메인"은 항원에 특이적으로 결합하는 분자 또는 분자의 부위를 지칭한다. 일 구현예에서, 항원 인식 모이어티는 항체, 항체 유사 분자 또는 이의 단편이고 항원은 종양 항원이다.
용어 "보존적 아미노산 치환" 또는 "보존적 돌연변이"는 하나의 아미노산의 일반적인 특징을 지닌 다른 아미노산에 의한 대체(replacement)를 지칭한다. 개개의 아미노산 사이의 일반적인 특성을 정의하기 위한 기능적인 방법은 상동성 유기체의 상응하는 단백질 사이의 아미노산 변화의 표준화된 빈도를 분석하는 것이다(Schulz, G. E. and Schirmer, R. H., Principles of Protein Structure, Springer-Verlag, New York (1979)). 이러한 분석에 따라서, 아미노산의 그룹이 정의될 수 있으며 여기서 그룹내 아미노산은 서로 잠재적으로 교환되므로, 전체 단백질 구조에 대한 이들의 영향에 있어서 서로 가장 잘 유사하다(Schulz, G. E. and Schirmer, R. H., 상기 참고). 보존적 돌연변이의 예는 상기 서브-그룹 내 아미노산의 아미노산 치환, 예를 들면, 양성 전하가 유지될 수 있도록 아르기닌에 대해 라이신의 치환 및 이의 역; 음성 전하가 유지될 수 있도록 아스파르트산에 대해 글루탐산의 치환 및 이의 역; 유리-OH가 유지될 수 있도록 트레오닌에 대해 세린의 치환; 및 유리 -NH2가 유지될 수 있도록 아스파라긴에 대해 글루탐산의 치환을 포함한다. 대안적으로 또는 추가로, 기능성 변이체는 적어도 하나의 비-보존적 아미노산 치환을 지닌 참고 단백질의 아미노산 서열을 포함할 수 있다.
용어 "비-보존적 돌연변이"는 상이한 그룹 사이의 아미노산 치환, 예를 들면, 트립토판에 대해 라이신의 치환, 또는 세린에 대해 페닐알라닌의 치환 등을 포함한다. 이러한 경우에, 비-보존적 아미노산이 기능성 변이체의 생물학적 활성을 방해하거나 억제하지 않도록 하는 것이 바람직할 수 있다. 비-보존적 아미노산 치환은 기능성 변이체의 생물학적 활성을 향상시켜서 기능성 변이체의 생물학적 활성은 상동성 모 단백질과 비교하여 증가되도록 할 수 있다.
용어 "안키린"은 스펙트린-액틴계 막 세포골격에 대한 내재성 막 단백질(integral membrane protein)의 부착을 매개하는 어댑터 단백질(adaptor protein)의 계열(family)을 지칭한다. 안키린은 스펙트린의 베타 소단위에 대한 결합 부위 및 적어도 12 계열의 내재성 막 단백질을 갖는다. 이러한 연결은 혈장 막의 통합성을 유지하고 혈장 막에서 특수한 이온 채널, 이온 교환체(ion exchanger) 및 이온 수송인자(ion transporter)를 고정(anchor)시키는데 요구된다. 안키린은 4개의 기능성 도메인을 함유한다: 24개의 탄뎀(tandem) 안키린 반복체를 함유하는 N-말단 도메인, 스펙트린에 결합하는 중앙 도메인, 세포자멸사에 포함된 단백질에 결합하는 사멸 도메인, 및 상이한 안키린 단백질들 사이에서 고 가변성인 C-말단 조절성 도메인. 24개의 탄뎀 안키린 반복체는 광범위한 막 단백질의 인식에 관여한다. 이러한 24개의 반복체는 반복체 1 내지 14 범위의 3개의 구조적으로 명백한 결합 부위를 함유한다. 이러한 결합 부위는 서로 준-독립적(quasi-independent)이며 함께 사용될 수 있다. 부위가 막 단백질에 결합시키는데 사용하는 상호작용은 비-특이적이며 수소 결합, 소수성 상호작용 및 정전성 상호작용으로 이루어진다. 이러한 비-특이적인 상호작용은 서열이 아미노산의 특성을 바로 보존할 필요가 없으므로 거대 범위의 단백질을 인식하는 특성을 안키린에 제공한다. 준-독립성(quasi-independence)은 결합 부위가 사용되지 않는 경우, 전체 결합에서 큰 효과를 가지지 않을 수 있음을 의미한다. 조합시 이러한 2개의 특성은 안키린이 인식할 수 있는 단백질의 큰 레퍼토리를 생성한다. 안키린은 포유동물에서 3개의 유전자(ANK1, ANK2 및 ANK3)에 의해 암호화된다. 궁극적으로 각각의 유전자는 교호적인 스플라이싱(splicing)을 통해 다수의 단백질을 생산한다.
본원에 언급된 바와 같은 용어 "증식성 질환"은 세포의 과도한 증식 및/또는 세포 매트릭스의 턴오버(turnover)가 암을 포함하는 질환의 발병에 유의적으로 기여하는 통합 개념을 지칭한다.
본원에 사용된 바와 같은 "환자" 또는 "대상체"는 암과 같은 증식성 장애를 가지거나 이로 발달하는 것으로 진단되거나 예측된 포유동물 대상체를 지칭한다. 일부 구현예에서, 용어 "환자"는 암과 같은 증식성 장애로 발달하는 평균 가능성보다 더 높은 포유동물 환자를 지칭한다. 예시적인 환자는 사람, 유인원, 개, 돼지, 소, 고양이, 말, 염소, 양, 설치류 및 본원에 개시된 치료요법으로부터 유리할 수 있는 다른 포유동물을 지칭한다. 예시적인 사람 환자는 남성 및/또는 여성일 수 있다. "이를 필요로 하는 환자" 또는 "이를 필요로 하는 대상체"는 본원에서 질환 또는 장애를 지니거나 갖는 것으로 의심되는 환자로서 지칭되지만, 예를 들면, 만성 B형 간염 감염에 한정되지 않는다.
"투여하는"은 본원에서 환자 또는 대상체에게 본원에 기술된 하나 이상의 조성물을 제공하는 것으로 지칭된다. 예로써 및 제한없이, 조성물 투여, 예컨대, 주사는 정맥내(i.v.) 주사, 피하(s.c.) 주사, 피내(i.d.) 주사, 복강내(i.p.) 주사, 또는 근육내(i.m.) 주사에 의해 수행될 수 있다. 하나 이상의 이러한 경로가 사용될 수 있다. 비경구 투여는 예를 들면, 거환 주사(bolus injection)에 의해서 또는 시간에 걸쳐 점진적인 관류(perfusion)에 의할 수 있다. 대안적으로, 또는 동시에, 투여는 경구 경로에 의할 수 있다. 추가로, 투여는 세포의 거환 또는 펠렛(pellet)의 외과적 침착(surgical deposition), 또는 의료 장치의 위치조정(positioning)에 의할 수 있다. 구현예에서, 본 개시내용의 조성물은 본원에 기술된 핵산 서열, 또는 본원에 기술된 적어도 하나의 핵산 서열을 포함하는 벡터를, 증식성 장애를 치료하거나 예방하는데 효과적인 양으로 발현하는 가공된 세포 또는 숙주 세포를 포함할 수 있다. 약제학적 조성물은 하나 이상의 약제학적으로 또는 생리학적으로 허용되는 담체, 희석제 또는 부형제와 함께, 본원에 기술된 바와 같은 표적 세포 집단을 포함할 수 있다. 이러한 조성물은 완충제, 예를 들면, 중성의 완충된 염수, 인산염 완충된 염수 등; 탄수화물, 예를 들면, 글루코즈, 만노즈, 슈크로즈 또는 덱스트란, 만니톨; 단백질; 폴리펩타이드 또는 아미노산, 예를 들면, 글리신; 항산화제; 킬레이팅제(chelating agent), 예를 들면, EDTA 또는 글루타티온; 보조제(예컨대, 수산화알루미늄); 및 보존제를 포함할 수 있다.
본원에 사용된 바와 같은, 용어 "치료", "치료하는", 또는 이의 문법적 등가물은 목적한 약리학적 및/또는 생리학적 효과를 수득함을 지칭한다. 구현예에서, 효과는 치료학적인데, 즉, 효과는 질환 및/도는 질환에 기여할 수 있는 부작용 증상을 부분적으로 또는 완전히 치유한다. 이러한 목적으로, 본 발명의 방법은 본 발명의 핵산 서열, 또는 본 발명의 핵산 서열을 포함하는 벡터를 발현하는 숙주 세포를 포함하는 조성물의 치료학적 유효량을 투여함을 포함한다.
용어 "치료학적 유효량", "치료량", "면역학적 유효량", "항-종양 유효량", "종양 억제 유효량" 또는 이의 문법적 등가물은 목적한 치료학적 결과를 달성하는데 효과적인 양, 투여량 및 필수적인 기간을 지칭한다. 치료학적 유효량은 개체의 질환 상태, 성별, 및 체중과 같은 인자, 및 하나 이상의 대상체에서 목적한 반응을 유발하는 본원에 기술된 조성물의 능력에 따라 변할 수 있다. 본 개시내용의 조성물의 정확한 양은 환자(대상체)의 연령, 체중, 종양 크기, 감염 또는 전이 정도, 및 상태에서의 개개의 차이를 고려하여 주치의에 의해 결정될 수 있다.
대안적으로, 환자 또는 대상체에 대한 본원에 기술된 하나 이상의 조성물의 투여의 약리학적 및/또는 생리학적 효과는 "예방적"일 수 있는데, 즉, 이러한 효과는 질환 또는 이의 증상을 완전히 또는 부분적으로 예방한다. "예방학적으로 유효한 양"은 목적한 예방학적 결과(예컨대, 질환 발병의 예방)을 달성하는데 효과적인 양, 투여량 및 이에 필수적인 기간을 지칭한다.
HBV 분자 백신
B형 간염(HepB)은 B형 간염 바이러스(HBV)에 의해 유발된 잠재적으로 생명을 위협하는 간 감염이다. HBV는 만성 감염을 유발하고 사람들을 간경변 및 간암으로부터의 높은 사망 위험에 빠뜨린다. HBV의 진화는 유전형의 지리학적 분포에 의해 현저하게 강조된다. HBV 유전형/서브유전형은 임상적 및 바이러스학적 특성, 예를 들면, 간 질환의 중증도 및 항바이러스 치료요법에 대한 반응에 있어서의 차이와 크게 관련되어 왔다. 서열을 비교하는 경우, HBV는 8개의 유전형(A 내지 H)으로 분류되며, 각각은 명백한 지리학적 분포를 지닌다. 연구자들은 상이한 HBV 유전형과 HBV 질환의 중증도 및 결과 사이의 관련성을 연관시켜왔다.
HBV는 높은 간 향성(tropism)을 지닌 이중 가닥 DNA 바이러스이다. HBV DNA는 3.2kb의 환형의, 엔벨로프되고, 부분적으로 이중 가닥인 DNA 게놈이다(도 3a 내지 도 3d). HBV는 4개의 유전자(S, C, P, 및 X)를 갖는다. S 유전자는 작은 표면 단백질(S), 중간 표면 단백질(S + PreS2), 및 큰 표면 단백질(S + PreS2 + PreS1)로 이루어진 엔벨로프(envelope)(지질 이층) 표면 단백질(HBsAg)을 암호화한다. C 유전자는 캡시드 또는 코어 단백질을 암호화한다. C 유전자는 프레코어(precore) 및 코어 영역을 갖는다. 해독이 프레코어 영역에서 개시되는 경우, 단백질은 HBeAg이다. 해독이 코어 영역에서 개시되는 경우, 단백질은 HBcAg이다. P 유전자는 DNA 폴리머라제(Pol)를 암호화한다. X 유전자는 x 단백질(HBxAg)을 암호화한다(도 3a 내지 도 3d). HBV 게놈은 TP, SP, RT 및 RH; PreS1(108개 아미노산); PreS2(55개 아미노산); S(226개 아미노산); PreC(29개 아미노산); C(183개 아미노산); 및 HBx(154개 아미노산)을 포함하는 Pol(832개 아미노산)을 포함한다(도 3a 내지 도 3d).
급성 HBV 감염은 B형 간염 표면 항원(HBsAg) 및, 코어 항원, HBcAg에 대한 면역글로불린 M(IgM) 항체의 존재에 의해 특징화된다. 감염의 초기 상 동안에, 환자는 또한 B형 간염 항원(HBeAg)에 대해 혈청양성(seropositive)이다. HBeAg는 일반적으로 고 수준의 바이러스 복제의 마커이다. HBeAg의 존재는 감염된 개인의 혈액 및 체액이 고 감염성임을 나타낸다. 만성 감염은 적어도 6개월 동안(재발하는 HBeAg의 존재 또는 부재하에) HBsAg의 지속성에 의해 특징화된다. HBsAg의 지속성은 삶의 말기에 만성 간 질환 및 간암(간세포 암종)으로 진전될 위험의 기본 마커이다.
B형 간염 바이러스는 적어도 7일 동안 신체 밖에서 생존할 수 있다. 이러한 시간 동안, 바이러스는 백신에 의해 보호되지 않는 사람의 신체 내로 들어가는 경우 여전히 감염을 유발할 수 있다. B형 간염 바이러스의 항온처리 기간은 평균 75일이지만, 30 내지 180일로 변할 수 있다. 바이러스는 감염 후 30 내지 60일 내에 검출될 수 있고 지속하여 만성 B형 간염으로 진전될 수 있다. 매우 토착화된 지역에서, B형 간염은 출생시 어머니로부터 자녀로(분만기 전파(perinatal transmission)), 또는 수평적 전파(감염된 혈액에 대한 노출)를 통해, 특히 생애의 처음 5년 동안 감염된 아동으로부터 감염되지 않은 아동으로 가장 흔히 확산된다. B형 간염은 또한 감염된 혈액 및 다양한 체액에 대한 피하 또는 점막 노출에 의해서 뿐만 아니라 타액, 생리, 질액, 및 정액을 통해 확산된다. B형 간염의 성교 전파 또한 일반적으로 발생할 수 있다. 성인에서의 감염은 5% 미만의 사례에서 만성 간염을 초래한다. 바이러스의 전파는 또한 보건 시설(health-care settings) 또는 약물을 주사하는 개인 중에서 침(needle) 및 주사기의 재사용을 통해 발생할 수 있다. 또한, 감염은 의학적, 수술적 및 치과 수술 동안에, 문신새김(tattooing)을 통해, 또는 감염된 혈액으로 오염된 면도기 및 유사한 물체의 사용을 통해 발생할 수 있다.
대부분의 사람들은 급성 감염 상 동안 임의의 증상을 겪지 않는다. 그러나, 일부 사람들은 수 주 지속하는 증상, 예를 들면, 피부 및 눈의 황변(황달), 짙은 뇨(dark urine), 극심한 피로, 오심, 구토 및 복부 통증을 지닌 급성 질병을 갖는다. 급성 간염에 걸린 사람의 작은 서브세트(subset)는 급성 간 부전으로 진전될 수 있으며, 이는 사망을 야기할 수 있다. 일부 사람들에서, B형 간염 바이러스는 또한 후에 간경변(간의 반흔화(scarring)) 또는 간암으로 진전될 수 있는 만성 간 감염을 유발할 수 있다. 감염이 만성화되는 경향성은 개인이 감염되기 시작한 나이에 의존한다. B형 간염 바이러스로 감염되기 시작한 6세 미만의 어린이는 만성 감염으로 진전될 가능성이 가장 크다. 생애 첫해 동안 감염된 영아의 80 내지 90%는 만성 감염으로 진전되고; 6세 이전에 감염된 어린이의 30 내지 50%는 만성 감염으로 진전된다. 성인에서, 성인으로 감염된 달리 건강한 개인의 5% 미만이 만성 감염으로 진전될 것이며; 만성 감염된 성인의 20 내지 30%는 간경변 및/또는 간암으로 진전될 것이다(도 1 및 도 2).
급성 B형 간염에 대한 구체적인 치료는 존재하지 않는다. 따라서, 치유법은 편안함 및 적절한 영양적 균형의 유지, 예를 들면, 구토 및 설사로부터 손실된 유체의 보충에 목표를 둔다. 만성 B형 간염 감염은 의약, 예를 들면, 경구 항바이러스제로 치료될 수 있다. 치료(예컨대, 간 이식 또는 IFN-α 뉴클레오타이드 유사체)는 간경변의 진행을 늦추고, 간암의 발병률을 감소시키며 장기간 생존을 증진시킨다. 최근 보다 발달된 치료학적 백신(즉, GS-4777, Gilead; ABX203, 아비박스(Abivax))는 임상시험 2/3기에서 실패하였다. 그러나, 대부분의 사람들에서, 치료는 B형 간염 감염을 치유하지 않지만, 바이러스의 복제를 단지 억제한다. 따라서, B형 간염 치료를 시작한 대부분의 사람들은 생애 동안 이를 지속하여야만 한다. 많은 수단이 제한된 환경에서 B형 간염의 진단 및 치료에 대해 여전히 제한된 접근이 존재한다.
추정된 2억 5700만명의 사람들은 만성 B형 간염 바이러스(HBV) 감염을 지닌채 살고 있다(표면 항원 검출을 통한 양성 확인). 2015년에, B형 간염 감염은 사망의 주요 원인으로서 간 부전 또는 간암으로, 887,000명의 사망을 야기하였다. 현재, HBV 백신은 사례의 95%에서 감염을 방지함으로써 B형 간염으로 인한 감염, 간암, 및 만성 질환을 예방한다. 그러나, 다수의 HBV 서브형에 대한 광범위한 포함 및 간암에 대한 기능성을 지닌 HBV 백신을 개발하는 것에 대한 큰 필요성이 여전히 존재한다. 본 개시내용은 생물정보학 방법 및 단백질 가공 접근법을 기반으로 한 신규한 HBV 백신 항원에 관한 것이다. 이러한 신규한 HBV 백신 후보물은 HBV 및 HBV-관련된 질환에 대한 치료학적 백신으로서 사용될 수 있다.
치료 선택사항
만성 B형 간염 감염에 대한 표준 치료제(standard of care: SOC)는 PEG-IFN, 및/또는 뉴클레오타이드 유사체를 포함한다. 그러나, cccDNA 및 면역 내성 및 고갈이 지속될 수 있다(도 4). HBV에 의한 감염은 간병변, 간 부전 및 간세포 암종(HCC)을 야기할 수 있는 간염을 유발한다. HBV의 진단은 혈청학적 발견을 기반으로 한다. 실제로, 바이러스 DNA, 항원 및 이의 각각의 항체는 혈청 속에서 발견할 수 있다. HBV는 일반적인 항원성 결정인자 (a) 및 HBsAg에서 발견된 2개의 상호 배타적인 결정인자 쌍(d/y 및 w/r)을 기반으로 하여 4개의 주요 혈청형(adr, adw, ayr, ayw)으로 세분된다. 게놈의 전체 뉴클레오타이드 서열 변이에 따라 10개의 공지된 유전형(A 내지 J) 및 40개의 공지된 서브유전형(subgenotype)이 존재한다. 유전형은 명백한 기하학적 분포를 가지며 상이한 유전형은 상이한 질환 중증도, 경과 및 합병증 가능성, 및 치료 및 가능하게는 예방접종에 대한 반응과 관련되어 있다. 혈청형 및 유전형은 필수적으로 상응하지 않는다(예컨대, 유전형 D는 10개의 서브유전형(subgenotype)을 갖는다).
현재, 만성 HBV 감염에 대한 치유법은 존재하지 않는다. 치료 선택사항은 간경변의 진행 및 바이러스 복제를 늦추고, HCC 및 간 부전의 발생을 감소시키는 것에 목표를 둔다. 현재의 치료는 2개의 주요 범주로 나뉜다: (1) 면역 매개인자 약물, 즉, 바이러스 감염된 세포와 싸우도록 면역계를 증강시키기 위해 설계된 주로 제I형 인터페론(인터페론 알파 및 페길화된(pegylated) 인터페론 알파); 및 (2) 뉴클레오사이드 유사체(라미부딘, 엔테카비르 및 텔비부딘) 및 뉴클레오타이드 유사체(아데포비르, 디피복실 및 테노포비르)를 포함하고, 바이러스 복제를 방해하는 것을 목표로 하는 항바이러스 약물. HBV 감염에 대한 사망자수(death toll)는 HIV 및 결핵을 기준으로 거의 70만명/년이다. 신규 HBV 감염율이 감소하고 있지만, 간염으로부터 전체적인 사망에 있어서의 증가는 신규 치료 선택사항의 개발의 절실한 필요성을 요구한다.
치료학적 접근법
표면(S), 코어(C), 및 폴리머라제(Pol) 단백질로부터의 HBV 에피토프는 HBV에 대한 세포 면역 반응을 매개하는 감염 동안 T 세포에 의해 표적화된다. MHC-I 및 MHC-II 에피토프를 포함하는 HBV X 단백질(HBx)은 바이러스 발병 및 발암에 관여된 다기능성 조절 단백질이다. 본원에 기술된 HBV 백신 설계는 잠재적인 T 세포 에피토프를 갖는 모든 주요 구성성분을 포함한다. 구체적으로, Pol, Core, Env 및 HBx 내에 유전적 변형(점 돌연변이의 형태) 및 트렁케이션(truncation)을 지닌 2개의 상이한 독특한 설계를 포함하는 HBV 백신이 본원에 제공된다. 또한 사람 단백질 스캐폴드 상에 이식되고 HBV 감염을 제어 및 제거(clearing)시키는데 요구되는 세포 면역 반응을 자극할 수 있는 하전된 디펩타이드에 의해 연결된 독특하에 설계된 다중-에피토프 작제물(즉, 세포독성 T 림프구)가 본원에 제공된다.
HBV 감염을 치료하기 위한 다양한 유전자 치료학적 접근법이 본원에 제공된다. 예를 들면, HBV의 면역계-매개된 제어를 증진시키는데 사용된 전략 중 일부가 표 1에 기술되어 있다. 또한 HBV 치료학적 백신, 프라이밍(priming)을 위한 HBV의 주요 구성성분의 면역원성 영역(HBsAg, HBcAg, HBxAg, HBeAg 및 HB PolAg)의 조합을 포함하는 프라임/부스트(prime/boost) DNA-기반 백신의 지능적인 설계 및 부스팅을 위한 효능제 CD8 T 세포 에피토프의 조합이 본원에 제공된다.
HBV 재조합 백신을 포함하는 조성물, 키트(kit), 및 시스템 및 이의 제조 방법이 본원에 제공된다. 본 개시내용에서 HBV 재조합 백신(예컨대, HBV 설계 1 내지 5)는 HBe, HBx, LHBs, Pol, 및 HBSP의 단백질 가공(protein engineering)을 통해 가공된다. 각각의 HBV 백신 항원 설계는 생물정보학 분석 및 인 실리코(in silico) 단백질 가공 방법(예컨대, 컨센수스 서열에 보다 근접하게 매치하는 항원성 서열의 선택, 항원성 예측, 및 T 세포 에피토프 맵핑, 이는 MHC-I 결합 및 사이토킨 생산에 이은 T 세포 활성화를 초래할 수 있다)을 사용하여 발명자가 선택한 조합적 안내를 통해 실시된다. 본원에 개시된 HBV 백신 설계의 전체적인 작업흐름도는 도 5에 나타나 있으며, 실시예 1에 추가로 설명되어 있다. 본 개시내용은 다중-결실된 고릴라 아데노벡터(GC46)에서 작제된 5개의 HBV 항원 설계(HBV 설계 1 내지 5)를 제공한다.
4개의 항원 설계(HBV 설계 1 내지 4) 및 대조군 항원을 합성하여 아데노벡터 작제를 위한 발현 플라스미드-pAd셔틀(pAdShuttle) 내로 클로닝하였다(도 6). HBV 설계를 분석하여 상이한 링커가 상이한 에피토프의 예측을 유발하는지를 평가하였다. 초기 항원 스크리닝을 일시적인 형질감염, 시험관내(in vitro) 항원 가공 및 단핵구-유래된 수지 세포의 일시적인 형질감염 연구에서의 표시에서 평가하였다. 도 6에 나타낸 바와 같이, HBV 설계 1 및 2는 클래이드(clade) D 컨센수스를 기반으로 설계하였다. 코어(8), 표면(8), 폴리머라제(8), HBx(6) 및 HBPS(2)로부터의 32개의 HBV 펩타이드를 실험 및 기능 데이타, 예를 들면, 면역원성 데이타, 질량-스펙트럼(Mass-spec.) 등을 갖는 문헌으로부터 준비하였다(표 4). HBV 설계 3의 경우, 사람 안키린-유사 반복체(ALR) 단백질 스캐폴드(PDB 코드 1QYM) 펩타이드를 나선 및 루프 영역에서 탄뎀(tandem) 방식으로 이식하였다. 절단가능한 링커 VSQTSKLTR(서열 번호: 111)에 의해 연결된, 2개의 ALR 스캐폴드를 사용하였다. ALR 단백질은 일반적으로 고 발현 및 고 안전성을 갖는다. 따라서, ALR 단백질을 HBV 펩타이드에 대한 스캐폴드로 사용하여 신규한 CTL을 생성하였다. HBV 설계 4 에피토프는 KK 링커로 분리하였다(도 6). RNA qPCR 상대적 발현 검정을 위해, 5'- TGCCAAGAGTGACGTGTCCA-3'(서열 번호: 110)를 스플라이스 프라이머로서 사용하고, 5'-CCCAGGTCCAACTGCAGCCGG-3'(서열 번호: 128)를 스플라이스 프로브로서 사용하였다. 각각의 항원에 대해 설계된 구체적인 프라이머는 역방향 프라이머(reverse primer)로서 사용하였다(도 14).
[표 1]
전달 시스템
고릴라 아데노바이러스 셔틀 벡터(Shuttle Vector)
본 개시내용의 특정의 양태는 하나 이상의 면역 반응-유도성 HBV 폴리펩타이드를 포함하는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드를 포함하는 벡터에 관한 것이다. 특정의 구현예에서, 벡터는 바이러스 벡터이다. 특수한 구현예에서, 벡터는 아데노바이러스 벡터이다. 아데노바이러스는 일반적으로 사람에서 양성 병리학과 관련되어 있으며, 사람을 포함하는, 다양한 종으로부터 단리된 아데노바이러스의 게놈이 집중적으로 연구되었다. 아데노바이러스는 대략 36 kb의 이중 가닥 DNA를 함유하는 중간-크기(90 내지 100 nm)의, 비-엔벨로프된 정이십면체 바이러스이다. 아데노바이러스 캡시드는 바이러스에 의한 세포의 감염의 초기 단계(early stage)의 주요 상호작용을 매개하고, 아데노바이러스 생명 주기의 말기에 아데노바이러스 게놈을 패키징하는데 요구된다. 캡시드는 252개 캡소머(capsomere)를 포함하며, 이는 240개의 헥손, 12개의 펜톤 염기 단백질, 및 12개의 섬유를 포함한다(Ginsberg et al., Virology, 28: 782-83 (1966)). 헥손은 3개의 동일한 단백질, 즉, 폴리펩타이드 II를 포함한다(Roberts et al., Science, 232: 1148-51 (1986)). 펜톤 염기는 5개의 동일한 단백질을 포함하고 섬유는 3개의 동일한 단백질을 포함한다. 단백질 IIIa, VI, 및 IX는 아데노바이러스 코트(coat) 속에 존재하며 바이러스 캡시드를 안정화시키는 것으로 여겨진다(Stewart et al., Cell, 67: 145-54 (1991), 및 Stewart et al., EMBO J., 12(7): 2589-99 (1993)). pIX를 제외한, 캡시드 단백질의 발현은 아데노바이러스 폴리머라제 단백질에 의존한다. 따라서, 아데노바이러스 입자의 주요 구성성분은 폴리머라제 단백질 유전자가 존재하여 발현되는 경우에만 게놈으로부터 발현된다.
아데노바이러스의 수개의 특징은 이들을 치료학적 적용(즉, "유전자 치료요법")을 위해 세포에 유전 물질을 전달하거나, 백신 적용을 위한 항원 전달 시스템으로서 사용하기 위한 이상적인 비히클(vehicle)이 되도록 한다. 예를 들면, 아데노바이러스는 고 역가(예컨대, 약 1013개 입자 단위(pu))로 생산될 수 있으며, 유전 물질을 비-복제하는 및 복제하는 세포로 이동시킬 수 있다. 아데노바이러스 게놈은 다량의 외인성 DNA(약 8 kb 이하)를 수반하도록 조작될 수 있으며, 아데노바이러스 캡시드는 심지어 보다 긴 서열의 전달을 강화시킬 수 있다(Curiel et al., Hum. Gene Ther., 3: 147-154 (1992)). 추가로, 아데노바이러스는 일반적으로 숙주 세포 염색체 내로 통합되지 않지만, 오히려 선형 에피좀(episome)으로서 유지됨으로써 재조합 아데노바이러스가 정상의 세포 기능을 방해할 가능성을 최소화시킨다.
일부 구현예에서, 본원에 기술된 아데노바이러스는 고릴라로부터 단리된다. 이스턴 고릴라(Eastern Gorilla)(고릴라 베린게이(Gorilla beringei)) 및 웨스턴 고릴라(Western Gorilla)(고릴라 고릴라(Gorilla gorilla))의 2개 종 내에 4개의 광범위하게 인식된 고릴라 아종(subspecies)이 존재한다. 웨스턴 고릴라 종은 아종 웨스턴 로우랜드 고릴라(Western Lowland Gorilla)(고릴라 고릴라 고릴라(Gorilla gorilla gorilla)) 및 크로스 리버 고릴라(Cross River Gorilla)(고릴라 고릴라 디이흘리(Gorilla gorilla diehli))를 포함한다. 이스턴 고릴라 종은 아종인 마운틴 고릴라(Mountain Gorilla)(고릴라 베린게이 베린게이(Gorilla beringei beringei)) 및 이스턴 로우랜드 고릴라(Eastern Lowland Gorilla)(고릴라 베린게이 그라우어리(Gorilla beringei graueri))를 포함한다(참고: 예컨대, Wilson and Reeder, eds., Mammalian Species of the World, 3rd ed., Johns Hopkins University Press, Baltimore, Maryland (2005)). 일부 구현예에서, 본 개시내용의 아데노바이러스는 마운틴 고릴라(고릴라 베린게이 베린게이(Gorilla beringei beringei))로부터 단리된다.
다양한 고릴라 아데노바이러스 또는 아데노바이러스 벡터가 국제 특허원 공보 제WO 2013/052832호; 제WO 2013/052811호; 및 제WO 2013 052799호에 기술되어 있으며, 이들 각각은 본원에 이의 전문이 참고로 포함된다.
이러한 수개의 아데노바이러스의 게놈은 분석되었으며, 아데노바이러스는 예를 들면, 서열 번호: 21, 서열 번호: 22, 서열 번호: 23, 서열 번호: 24, 또는 서열 번호: 25의 핵산 서열을 가질 수 있으며, 이들 각각은 아데노바이러스를 유일하게 정의하기 위해 제공되는 다수의 서브-서열, 즉, 서열 번호: 1 내지 10의 핵산 서열, 및 서열 번호: 11 내지 20의 아미노산 서열을 포함한다. 서열 번호: 6 내지 서열 번호: 10은 서열 번호: 16 내지 20 각각의 아미노산 서열을 암호화한다. 서열 번호: 1 내지 5는 서열 번호: 6 내지 10 각각의 핵산 서열의 서브세트이다. 서열 번호: 11 내지 15는 서열 번호: 16 내지 20 각각의 아미노산 서열의 서브세트이다.
아데노바이러스는 아데노바이러스 벡터, 예컨대, 유전자 전달 비히클로서 사용될 이미 공지된 아데노바이러스와 동일한 방식으로 변형될 수 있다. 아데노바이러스 및 아데노바이러스 벡터는 복제-가능(replication-competent)하거나, 조건적으로 복제-가능하거나, 복제-결함성(replication-deficient)일 수 있다.
복제-가능한(replication-competent) 아데노바이러스 또는 아데노바이러스 벡터는 대표적인 숙주 세포, 즉, 아데노바이러스에 의해 전형적으로 감염될 수 있는 세포 내에서 복제할 수 있다. 복제-가능한 아데노바이러스 또는 아데노바이러스 벡터는 숙주 세포 내에서 바이러스 복제를 억제하지 않는 아데노바이러스 게놈 내에서 야생형 아데노바이러스와 비교하여 하나 이상의 돌연변이(예컨대, 하나 이상의 결실, 삽입, 및/또는 치환)을 가질 수 있다. 예를 들면, 아데노바이러스 또는 아데노바이러스 벡터는 E3 영역으로서 공지된 아데노바이러스 초기 영역(early region)의 부분적인 또는 전체의 결실을 가질 수 있으며, 이는 아데노바이러스 또는 아데노바이러스 게놈의 증식에 필수적이지는 않다.
조건적으로 복제하는 아데노바이러스 또는 아데노바이러스 벡터는 예정된 조건 하에서 복제하도록 가공된 아데노바이러스 또는 아데노바이러스 벡터이다. 예를 들면, 복제-필수적인 유전자 기능, 예컨대, 아네노바이러스 초기 영역에 의해 암호화된 유전자 기능은 유도성의, 억제할 수 있거나(repressible), 조직-특이적인 전사 제어 서열, 예컨대, 프로모터에 작동적으로 연결될 수 있다. 이러한 구현예에서, 복제는 전사 제어 서열과 상호작용하는 특이적인 인자의 존재 또는 부재를 필요로 한다. 조건적으로-복제하는 아데노바이러스 벡터는 미국 특허 제5,998,205호에 추가로 기술되어 있다.
복제-결함성 아데노바이러스 또는 아데노바이러스 벡터는 예를 들면, 아데노바이러스 또는 아데노바이러스 벡터가 대표적인 숙주 세포, 특히 아데노바이러스 또는 아데노바이러스 벡터에 의해 감염될 사람내의 대표적인 숙주 세포에서 복제하지 않도록, 하나 이상의 복제-필수 유전자 기능 또는 영역내 결함의 결과로서, 복제에 요구되는 아데노바이러스 게놈의 하나 이상의 유전자 기능 또는 영역의 보충을 필요로 하는 아데노바이러스 또는 아데노바이러스 벡터이다.
본원에 기술된 바와 같은, 유전자 기능 또는 게놈 영역에서의 결함은 이의 핵산 서열이 전체적으로 또는 부분적으로 파열된(예컨대, 결실된) 유전자의 기능을 없애거나 손상시키기 위한(예컨대, 유전자 생성물의 기능을 적어도 약 2배, 5배, 10배, 20배, 30배, 또는 50배까지 감소시키기 위한) 아데노바이러스 게놈의 충분한 유전 물질의 파괴(예컨대, 결실)로서 정의된다. 전체 유전자 영역의 결실은 흔히 복제-필수적인 유전자 기능의 파괴에 요구되지 않는다. 그러나, 하나 이상의 이식유전자(transgene)에 대해 아데노바이러스 게놈 내에 충분한 공간을 제공할 목적으로, 하나 이상의 유전자 영역 대부분을 제거하는 것이 바람직할 수 있다. 유전 물질의 결실이 바람직하지만, 첨가 또는 치환에 의한 유전 물질의 돌연변이가 또한 유전자 기능을 파괴하기 위해 적절하다. 복제-필수 유전자 기능은 아데노바이러스 복제(예컨대, 증식)에 요구되는 유전자 기능이며 예를 들면, 아데노바이러스 초기 영역(예컨대, E1, E2, 및 E4 영역), 후기 영역(예컨대, L1, L2, L3, L4, 및 L5 영역), 바이러스 패키징에 관련된 유전자(예컨대, IVa2 유전자), 및 바이러스-관련된 RNA(예컨대, VA-RNA-1 및/또는 VA-RNA-2)에 의해 암호화된다.
아데노바이러스 또는 아데노바이러스 벡터가 복제-가능하거나 복제-결함성인지 여부에 따라, 아데노바이러스 또는 아데노바이러스 벡터는 아데노바이러스 게놈의 적어도 일부를 보유한다. 아데노바이러스 또는 아데노바이러스 벡터는 단백질 암호화 및 비-단백질 암호화 영역을 포함하는, 아데노바이러스 게놈의 임의의 부위를 포함할 수 있다. 바람직하게는, 아데노바이러스 또는 아데노바이러스 벡터는 아데노바이러스 단백질을 암호화하는 적어도 하나의 핵산 서열을 포함한다. 아데노바이러스 또는 아데노바이러스 벡터는 예를 들면, 초기 영역 유전자(즉, E1A, E1B, E2A, E2B, E3, 및/또는 E4 영역) 중 어느 하나에 의해 암호화된 단백질, 또는 바이러스 구조 단백질을 암호화하는, 후기 영역 유전자(즉, L1, L2, L3, L4, 및 L5 영역) 중 어느 하나에 의해 암호화된 단백질과 같은, 임의의 적합한 아데노바이러스 단백질을 암호화하는 핵산 서열을 포함할 수 있다.
아데노바이러스 또는 아데노바이러스 벡터는 바람직하게는 pIX 단백질, DNA 폴리머라제 단백질, 펜톤(penton) 단백질, 헥손(hexon) 단백질, 및/또는 섬유 단백질을 암호화하는 하나 이상의 핵산 서열을 포함한다. 아데노바이러스 또는 아데노바이러스 벡터는 아데노바이러스 단백질의 전장 아미노산 서열을 암호화하는 전장 핵산 서열을 포함할 수 있다. 대안적으로, 아데노바이러스 또는 아데노바이러스 벡터는 아데노바이러스 단백질의 전장 아미노산 서열 중 일부를 암호화하는 전장 핵산 서열 중 일부를 포함할 수 있다.
핵산 서열의 "일부"는 적어도 10개의 뉴클레오타이드(예컨대, 약 10 내지 약 5000개의 뉴클레오타이드)를 포함한다. 바람직하게는, 핵산 서열의 "일부"는 10개 이상(예컨대, 15개 이상, 20개 이상, 25개 이상, 30개 이상, 35개 이상, 40개 이상, 45개 이상, 50개 이상, 또는 100개 이상)의 뉴클레오타이드, 그러나 5,000개 미만(예컨대, 4900개 이하, 4000개 이하, 3000개 이하, 2000개 이하, 1000개 이하, 800개 이하, 500개 이하, 300개 이하, 또는 100개 이하)의 뉴클레오타이드를 포함한다. 바람직하게는, 핵산 서열의 일부는 약 10 내지 약 3500개의 뉴클레오타이드(예컨대, 약 10, 20, 30, 50, 100, 300, 500, 700, 1000, 1500, 2000, 2500, 또는 3000개의 뉴클레오타이드), 약 10 내지 약 1000개의 뉴클레오타이드(예컨대, 약 25, 55, 125, 325, 525, 725, 또는 925개의 뉴클레오타이드), 또는 약 10 내지 약 500개의 뉴클레오타이드(예컨대, 약 15, 30, 40, 50, 60, 70, 80, 90, 150, 175, 250, 275, 350, 375, 450, 475, 480, 490, 495, 또는 499개의 뉴클레오타이드), 또는 앞서의 값들 중 임의의 2개에 의해 정의된 범위이다. 보다 바람직하게는, 핵산 서열의 "일부"는 약 3200개 이하의 뉴클레오타이드(예컨대, 약 10 내지 약 3200개의 뉴클레오타이드, 약 10 내지 약 3000개의 뉴클레오타이드, 또는 약 30 내지 약 500개의 뉴클레오타이드, 또는 앞서의 값들 중 임의의 2개에 의해 정의된 범위)를 포함한다.
아미노산 서열의 "일부"는 적어도 3개의 아미노산(예컨대, 약 3 내지 약 1,200개의 아미노산)을 포함한다. 바람직하게는, 아미노산 서열의 "부위"는 3개 이상(예컨대, 5개 이상, 10개 이상, 15개 이상, 20개 이상, 25개 이상, 30개 이상, 40개 이상, 또는 50개 이상)의 아미노산, 그러나 1,200개 미만(예컨대, 1,000개 이하, 800개 이하, 700개 이하, 600개 이하, 500개 이하, 400개 이하, 300개 이하, 200개 이하, 또는 100개 이하)의 아미노산을 포함한다. 바람직하게는, 아미노산 서열의 부위는 약 3 내지 약 500개의 아미노산(예컨대, 약 10, 100, 200, 300, 400, 또는 500개의 아미노산), 약 3 내지 약 300개의 아미노산(예컨대, 약 20, 50, 75, 95, 150, 175, 또는 200개의 아미노산), 또는 약 3 내지 약 100개의 아미노산(예컨대, 약 15, 25, 35, 40, 45, 60, 65, 70, 80, 85, 90, 95, 또는 99개의 아미노산), 또는 앞서의 값들 중 임의의 2개에 의해 정의된 범위이다. 보다 바람직하게는, 아미노산 서열의 "부위"는 약 500개 이하의 아미노산(예컨대, 약 3 내지 약 400개의 아미노산, 약 10 내지 약 250개의 아미노산, 또는 약 50 내지 약 100개의 아미노산, 또는 앞서의 값들 중 임의의 2개에 의해 정의된 범위)를 포함한다.
아데노바이러스 pIX 단백질은 아데노바이러스 캡시드 속에 존재하며, 헥손 나노머 상호작용을 강화시키는 것으로 밝혀졌으며, 전장 게놈의 패키징에 필수적이다(참고: 예컨대, Boulanger et al., J. Gen. Virol., 44: 783-800 (1979); Horwitz M.S., "Adenoviridae and their replication" in Virology, 2 nd ed., B.N. Fields et al. (eds.), Raven Press, Ltd., New York, pp. 1679-1721 (1990), Ghosh-Choudhury et al., EMBO J., 6: 1733-1739 (1987), 및 van Oostrum et al, J. Virol., 56: 439-448 (1985)). 아데노바이러스 구조에 대한 이의 기여 이외에, pIX는 또한 전사 특성, 예를 들면, 아데노바이러스 주요 후기 프로모터(MLP) 활성의 자극을 나타내는 것으로 밝혀졌다(참고: 예컨대, Lutz et al., J. Virol., 71(7): 5102-5109 (1997)). 아데노바이러스 pIX 단백질 중 모두 또는 일부를 암호화하는 핵산 서열은 예를 들면, 서열 번호: 6 및 서열 번호: 1을 포함한다. 전장 pIX 단백질 또는 이의 일부를 포함하는 아미노산 서열은 예를 들면, 서열 번호: 16 및 서열 번호: 11을 포함한다.
아데노바이러스 DNA 폴리머라제 단백질은 시험관내(in vitro) 및 생체내(in vivo) 둘 다에서 바이러스 DNA 복제에 필수적이다. 폴리머라제는 말단 단백질의 전구체(pTP)와의 복합체로 동시-정제(co-purifying)하며, 이는 아데노바이러스 DNA의 5' 말단에 공유결합으로 부착된다(Field et al., J. Biol. Chem., 259: 9487-9495 (1984)). 아데노바이러스 DNA 폴리머라제 및 pTP는 E2 영역에 의해 암호화된다. 폴리머라제 단백질은 pIX를 제외한 모든 구조 단백질의 발현에 요구된다. 폴리머라제 단백질에 대한 유전자 서열없이는, 폴리머라제 단백질이 생산되지 않는다. 결과적으로, 바이러스 게놈은 복제되지 않으며, 주요 후기 프로모터는 활성화되지 않고, 캡시드 단백질은 발현되지 않는다. 아데노바이러스 DNA 폴리머라제 단백질 모두 또는 일부를 암호화하는 핵산 서열은 예를 들면, 서열 번호: 7 및 서열 번호: 2를 포함한다. 전장 아데노바이러스 DNA 폴리머라제, 또는 이의 부위를 포함하는 아미노산 서열은 예를 들면, 서열 번호: 17 및 서열 번호: 12를 포함한다.
아데노바이러스 헥손 단백질은 아데노바이러스 캡시드에서 가장 크고 가장 풍부한 단백질이다. 헥손 단백질은 바이러스 캡시드 조립, 캡시드의 정이십면체 대칭의 측정(이는 결과적으로 캡시드 용적 및 DNA 패키징 크기에서 한계를 정의한다), 및 캡시드의 통합성에 필수적이다. 또한, 헥손은 아데노바이러스 벡터의 중화를 감소시키기 위한 변형을 위한 주요 표적이다(참고: 예컨대, Gall et al., J. Virol., 72: 10260-264 (1998), 및 Rux et al., J. Virol., 77(17): 9553-9566 (2003)). 헥손 단백질의 주요 구조적 특징은 혈청형에 걸쳐서 아데노바이러스에 의해 공유되지만, 헥손 단백질은 크기 및 혈청형 사이에서의 면역학적 특성이 상이하다(Jornvall et al., J. Biol. Chem., 256(12): 6181-6186 (1981)). 15개의 아데노바이러스 헥손 단백질의 비교는 헥손의 우세한 항원성 및 혈청형-특이적인 영역이 이의 내부에 길이가 다양한 7개의 별개의 초가변성 영역(HVR1 내지 HVR7) 및 아데노바이러스 혈청형 사이의 서열인 루프 1 및 2(즉, LI 또는 l1, 및 LII 또는 l2 각각) 내에 존재하는 것으로 여겨짐을 나타내었다(Crawford-Miksza et al., J. Virol., 70(3): 1836-1844 (1996)). 아데노바이러스 헥손 단백질 모두 또는 일부를 암호화하는 핵산 서열은 예를 들면, 서열 번호: 9 및 서열 번호: 4를 포함한다. 전장 아데노바이러스 헥손 단백질, 또는 이의 일부를 포함하는 아미노산 서열은 예를 들면, 서열 번호: 19 및 서열 번호: 14를 포함한다.
아데노바이러스 섬유 단백질은 3개의 도메인: 테일(tail), 샤프트(shaft), 및 놉(knob)을 갖는 아데노바이러스 폴리펩타이드 IV의 동종삼량체(homotrimer)이다(Devaux et al., J. Molec. Biol., 215: 567-88 (1990), Yeh et al., Virus Res., 33: 179-98 (1991)). 섬유 단백질은 놉 및 샤프트 도메인을 통해 세포 표면 상의 수용체에 대한 주요 바이러스 결합을 매개한다(Henry et al., J. Virol., 68(8): 5239-46 (1994)). 삼량체화를 위한 아미노산 서열은 놉에 위치하며, 이는 펜톤 염기와 적절히 회합하기 위해 섬유의 아미노 말단(테일)에 필수적인 것으로 여겨진다(Novelli et al., Virology, 185: 365-76 (1991)). 세포 수용체를 인식하고 펜톤 염기에 결합하는 것 외에, 섬유는 혈청형 동일성(serotype identity)에 기여한다. 상이한 아데노바이러스 혈청형으로부터의 섬유 단백질은 현저히 상이하다(참고: 예컨대, Green et al., EMBO J., 2: 1357-65 (1983), Chroboczek et al., Virology, 186: 280-85 (1992), 및 Signas et al., J. Virol., 53: 672-78 (1985)). 따라서, 섬유 단백질은 아데노바이러스의 생명 주기에 대해 중요한 다수 기능을 갖는다. 아데노바이러스 섬유 단백질 중 모두 또는 일부를 암호화하는 핵산 서열은 예를 들면, 서열 번호: 10 및 서열 번호: 5를 포함한다. 전장 아데노바이러스 섬유 단백질, 또는 이의 일부를 포함하는 아미노산 서열은 예를 들면, 서열 번호: 20 및 서열 번호: 15를 포함한다.
아데노바이러스 펜톤 염기 단백질은 정이십면체 캡시드의 꼭지점에 위치하며 5개의 동일한 단량체를 포함한다. 펜톤 염기 단백질은 정이십면체 캡시드의 다수 측면 상에 헥손 단백질을 브릿징하기 위한 구조를 제공하며, 섬유 단백질이 캡시드 내에 혼입되도록 할 필수 접점(interface)를 제공한다. 펜톤 염기의 각각의 단량체는 RGD 트리펩타이드 모티프(motif)를 함유한다(Neumann et al., Gene, 69: 153-157 (1988)). RGD 트리펩타이드는 αv 인테그린에 대한 결합을 매개하며, 펜톤 염기의 RGD 서열 내 점 돌연변이를 갖는 아데노바이러스는 세포를 감염시키는 이의 능력에 있어서 제한된다(Bai et al., J. Virol., 67: 5198-5205 (1993)). 따라서, 펜톤 염기 단백질은 캡시드의 구조 및 바이러스-세포 상호작용의 최대 효율에 필수적이다. 아데노바이러스 펜톤 염기 단백질 중 모두 또는 일부를 암호화하는 핵산 서열은 예를 들면, 서열 번호: 8 및 서열 번호: 3을 포함한다. 전장 아데노바이러스 펜톤 염기 단백질, 또는 이의 일부를 포함하는 아미노산 서열은 예를 들면, 서열 번호: 18 및 서열 번호: 13을 포함한다.
본원에 사용된 바와 같은 핵산 또는 아미노산 서열 "동일성"은 목적한 핵산 또는 아미노산 서열을 참고 핵산 또는 아미노산 서열과 비교함으로써 측정할 수 있다. 목적 서열에서 생성하기 위하여 참고 서열 내에서 변화되고/되거나 변형된(예컨대, 점 돌연변이, 삽입, 또는 결실과 같은) 뉴클레오타이드 또는 아미노산 잔기의 수를 계수한다. 이러한 변화의 전체 수를 목적한 서열의 총 길이로부터 감하고, 차이를 목적한 서열의 길이로 나누고 퍼센트로서 나타낸다. 2개 이상의 서열 사이에 최적의 정렬을 수득하고 동일성을 계산하기 위한 다수의 수학적 알고리즘이 공지되어 있으며 다수의 이용가능한 소프트웨어 프로그램 내에 포함되어 있다. 이러한 프로그램의 예는 CLUSTAL-W, T-Coffee, 및 ALIGN(핵산 및 아미노산 서열의 정렬을 위해), BLAST 프로그램(예컨대, BLAST 2.1, BL2SEQ, 및 이의 이후의 버젼) 및 FASTA 프로그램(예컨대, FASTA3x, FASTM, 및 SSEARCH)(서열 정렬 및 서열 유사성 조사를 위해)을 포함한다. 서열 정렬 알고리즘은 예를 들면, 문헌: Altschul et al., J. Molecular Biol., 215(3): 403-410 (1990), Beigert et al., Proc. Natl. Acad. Sci. USA, 106(10): 3770-3775 (2009), Durbin et al., eds., Biological Sequence Analysis: Probabilistic Models of Proteins and Nucleic Acids, Cambridge University Press, Cambridge, UK (2009), Soding, Bioinformatics, 21(7): 951-960 (2005), Altschul et al., Nucleic Acids Res., 25(17): 3389-3402 (1997), 및 Gusfield, Algorithms on Strings, Trees and Sequences, Cambridge University Press, Cambridge UK (1997))에 개시되어 있다.
아데노바이러스 또는 아데노바이러스 벡터는 단독 또는 임의의 조합의 전술한 서열 중 1개, 2개, 3개, 4개, 또는 5개 모두를 포함할 수 있다. 이와 관련하여, 아데노바이러스 또는 아데노바이러스 벡터는 전술한 서열 중 임의의 2개의 조합, 전술한 서열 중 임의의 3개의 임의의 조합, 전술한 서열의 임의의 4개의 임의의 조합, 또는 전술한 서열의 5개 모두를 포함할 수 있다.
본원에 논의된 바와 같이, 아데노바이러스 또는 아데노바이러스 벡터는 복제-가능하거나, 조건적으로-복제하거나, 복제-결함성일 수 있다. 바람직하게는, 아데노바이러스 또는 아데노바이러스 벡터는 복제-결함성이어서, 복제-결함성 아데노바이러스 또는 아데노바이러스 벡터는 증식을 위한(예컨대, 아데노바이러스 벡터 입자를 형성시키기 위한) 아데노바이러스 게놈의 하나 이상의 영역의 적어도 하나의 복제-필수 유전자 기능의 보충을 필요로 한다.
복제-결함성 아데노바이러스 또는 아데노바이러스 벡터는 증식을 위한 아데노바이러스 게놈의 하나 이상의 영역 내에서 하나 이상의 복제-필수 유전자 기능에서 결함을 유발하기 위한 임의의 적합한 방식으로 변형될 수 있다. 아데노바이러스 게놈의 하나 이상의 영역의 하나 이상의 복제-필수 유전자 기능에서의 결함의 보충은 결함성 복제-필수 유전자 기능을 제공하기 위한 외인성 수단의 사용을 지칭한다. 이러한 보충은 예를 들면, 파괴된 복제-필수 유전자 기능을 암호화하는 세포 및/또는 외인성 DNA(예컨대, 헬퍼 아데노바이러스)를 사용함으로써 임의의 적합한 방식으로 시행할 수 있다.
아데노바이러스 또는 아데노바이러스 벡터는 아데노바이러스 게놈의 초기 영역(즉, E1-E4 영역) 단독, 아데노바이러스 게놈의 후기 영역(즉, L1-L5 영역) 단독, 아데노바이러스 게놈의 초기 및 후기 영역 둘 다, 또는 모든 아데노바이러스 유전자(즉, 고 능력 아데노벡터(HC-Ad)의 하나 이상의 복제-필수 유전자 기능에서 결함성일 수 있다. 문헌: Morsy et al., Proc. Natl. Acad. Sci. USA, 95: 965-976 (1998); Chen et al., Proc. Natl. Acad. Sci. USA, 94: 1645-1650 (1997); 및 Kochanek et al., Hum. Gene Ther., 10: 2451-2459 (1999)를 참고한다. 복제-결함성 아데노바이러스 벡터의 예는 미국 특허 제5,837,511호; 제5,851,806호; 제5,994,106호; 제6,127,175호; 제6,482,616호; 및 제7,195,896호, 및 국제 특허원 공보 제WO 1994/028152호, 제WO 1995/002697호, 제WO 1995/016772호, 제WO 1995/034671호, 제WO 1996/022378호, 제WO 1997/012986호, 제WO 1997/021826호, 및 제WO 2003/022311호에 개시되어 있다.
아데노바이러스 게놈의 초기 영역은 E1, E2, E3, 및 E4 영역을 포함한다. E1 영역은 E1A 및 E1B 서브영역(subregion)을 포함하고, E1 영역내 복제-필수 유전자 기능에서 하나 이상의 결함은 E1A 및 E1B 서브 영역 중 어느 하나 또는 둘 다에서 복제-필수 유전자 기능에서의 하나 이상의 결함을 포함함으로써 아데노바이러스 또는 아데노바이러스 벡터가 증식하기 위한(예컨대, 아데노바이러스 벡터 입자를 형성시키기 위한) 아데노바이러스 게놈의 E1A 서브 영역 및/또는 E1B 서브영역의 보충을 필요로 한다. E2 영역은 E2A 및 E2B 서브영역을 포함하고, E2 영역내 복제-필수 유전자 기능에서의 하나 이상의 결함은 E2A 서브영역 및/또는 E2B 서브 영역 중 어느 하나 또는 둘 다에서 복제-필수 유전자 기능에서의 하나 이상의 결함을 포함함으로써, 아데노바이러스 또는 아데노바이러스 벡터가 증식하기 위한(예컨대, 아데노바이러스 벡터 입자를 형성하기 위한) 아데노바이러스 게놈의 E2A 서브 영역 및/또는 E2B 서브 영역의 보충을 필요로 한다.
E3 영역은 어떠한 복제-필수 유전자 기능도 포함하지 않음으로써, 부분적으로 또는 전체적으로 E3 영역의 결실은 아데노바이러스 또는 아데노바이러스 벡터가 증식하기 위한(예컨대, 아데노바이러스 벡터 입자를 형성하기 위한) E3 영역내 임의의 유전자 기능을 필요로 하지 않는다. 본 개시내용의 맥락에서, E3 영역은 사람 아데노바이러스 5 (NCBI 참고 서열 AP_000218)의 E3 영역으로부터의 12.5K 단백질에 대해 높은 상동성을 지닌 단백질을 암호화하는 개방 판독 프레임(open reading frame)으로 개시하고 사람 아데노바이러스 5(NCBI 참고 서열 AP_000224.1)의 E3 영역으로부터 14.7K 단백질에 대해 높은 상동성을 지닌 단백질을 암호화하는 개방 판독 프레임에서 끝나는 영역으로 정의된다. E3 영역은 전체적으로 또는 부분적으로 결실될 수 있거나 전체적으로 또는 부분적으로 보유될 수 있다. 결실의 크기는 이의 게놈이 최적의 게놈 패키징 크기와 근접하게 매칭되는 아데노바이러스 또는 아데노바이러스 벡터를 보유하도록 조절될 수 있다. 보다 큰 결실은 아데노바이러스 또는 아데노바이러스 게놈 내에 보다 큰 이종 핵산 서열의 삽입을 수용할 것이다. 본 개시내용의 일 구현예에서, E3 영역내 잔류하는, L4 폴리아데닐화 신호 서열이 보유된다.
E4 영역은 다수의 개방 판독 프레임(ORF)을 포함한다. ORF6, 및 일부 경우에 ORF3를 제외하고는 E4 영역의 모든 개방 판독 프레임이 결실된 아데노바이러스 또는 아데노바이러스 벡터는 아데노바이러스 또는 아데노바이러스 벡터가 증식하기 위한(예컨대, 아데노바이러스 벡터 입자를 형성하기 위한) E4 영역내에 임의의 유전자 기능의 보충을 필요로 하지 않는다. 역으로, E4 영역의 ORF6, 및 일부 경우에 ORF3의 파괴 또는 결실을 지니고(예컨대, E4 영역의 ORF6 및/또는 ORF3를 기반으로 복제-필수 유전자 기능에서 결함성을 지닌) E4 영역의 임의의 다른 개방 판독 프레임 또는 천연의 E4 프로모터, 폴리아데닐화 서열, 및/또는 우측 역위된 말단 반복체(inverted terminal repeat: ITR)의 파괴 또는 결실이 존재하거나 부재하는 아데노바이러스 또는 아데노바이러스 벡터는 아데노바이러스 또는 아데노바이러스 벡터가 증식하기 위한(예컨대, 아데노바이러스 벡터 입자를 형성하기 위한) E4 영역(구체적으로, E4 영역의 ORF6 및/또는 ORF3)의 보충을 필요로 한다. 아데노바이러스 게놈의 후기 영역은 L1, L2, L3, L4, 및 L5 영역을 포함한다. 아데노바이러스 또는 아데노바이러스 벡터는 또한 국제 특허원 공보 제WO 2000/000628호에 논의된 바와 같은, 주요 후기 프로모터(MLP) 내에 돌연변이를 가질 수 있으며, 이는 필요한 경우 아데노바이러스 또는 아데노바이러스 벡터 복제-결함성이 되도록 할 수 있다.
복제-필수 유전자 기능에서 하나 이상의 결함을 함유하는 아데노바이러스 게놈의 하나 이상의 영역은 바람직하게는 임의로 E3 영역 중 일부 또는 전체에 결실을 지닌, 아데노바이러스 게놈의 하나 이상의 초기 영역, 즉, E1, E2, 및/또는 E4 영역이다.
복제-결함성 아데노바이러스 또는 아데노바이러스 벡터는 또한 숙주 세포 내에서 바이러스 복제를 억제하지 않는 아데노바이러스 게놈 내에 야생형 아데노바이러스와 비교하여 하나 이상의 돌연변이(예컨대, 하나 이상의 결실, 삽입, 및/또는 치환)을 가질 수 있다. 따라서, 복제-필수 유전자 기능에서 하나 이상의 결함 외에, 아데노바이러스 또는 아데노바이러스 벡터는 복제-필수적이 아닌 다른 관점에서 결함성일 수 있다. 예를 들면, 아데노바이러스 또는 아데노바이러스 벡터는 E3 영역으로서 공지된 아데노바이러스 초기 영역의 부분적인 또는 전체적인 결실을 가질 수 있으며, 이는 아데노바이러스 또는 아데노바이러스 게놈의 증식에 필수적이지 않다.
일 구현예에서, 아데노바이러스 또는 아데노바이러스 벡터는 복제-결함성이며, 증식을 위해(예컨대, 아데노바이러스 벡터 입자를 형성시키기 위해) 아데노바이러스 게놈의 E1 영역 또는 E4 영역의 보충을 최대한 필요로 한다. 따라서, 복제-결함성 아데노바이러스 또는 아데노바이러스 벡터는 증식을 위한(예컨대, 아데노바이러스 벡터 입자를 형성하기 위한) 아데노바이러스 게놈의 E1A 서브영역 및/또는 E1B 영역(E1-결함성 아데노바이러스 벡터로 나타냄) 또는 E4 영역(E4-결함성 아데노바이러스 벡터로 나타냄)의 적어도 하나의 복제-필수 유전자 기능의 보충을 필요로 한다. 아데노바이러스 또는 아데노바이러스 벡터는 아데노바이러스 게놈의 E1 영역의 적어도 하나의 복제-필수 유전자 기능(바람직하게는 모든 복제-필수 유전자 기능) 및 아데노바이러스 게놈의 비필수 E3 영역의 적어도 하나의 유전자 기능에서 결함성일 수 있다(E1/E3-결함성 아데노바이러스 벡터로 나타냄). 아데노바이러스 또는 아데노바이러스 벡터는 아데노바이러스 게놈의 E4 영역의 적어도 하나의 복제-필수 유전자 기능(바람직하게는 모든 복제-필수 유전자 기능) 및 아데노바이러스 게놈의 비필수 E3 영역의 적어도 하나의 유전자 기능에서 결함성일 수 있다(E3/E4-결함성 아데노바이러스 벡터로 나타냄).
일 구현예에서, 아데노바이러스 또는 아데노바이러스 벡터는 복제-결함성이며 증식을 위해(예컨대, 아데노바이러스 벡터 입자를 형성시키기 위해) 아데노바이러스 게놈의 E2 영역, 바람직하게는 E2A 서브 영역의 보충을 최대한 필요로 한다. 따라서, 복제-결함성 아데노바이러스 또는 아데노바이러스 벡터는 증식을 위한(예컨대, 아데노바이러스 벡터 입자를 형성하기 위한) 아데노바이러스 게놈의 E2A 서브영역(E2A-결함성 아데노바이러스 벡터)의 적어도 하나의 복제-필수 유전자 기능의 보충을 필요로 한다. 아데노바이러스 또는 아데노바이러스 벡터는 아데노바이러스 게놈의 E2A 영역의 적어도 하나의 복제-필수 유전자 기능(바람직하게는 모든 복제-필수 유전자 기능) 및 아데노바이러스 게놈의 비필수 E3 영역의 적어도 하나의 유전자 기능에서 결함성일 수 있다(E2A/E3-결함성 아데노바이러스 벡터로 나타냄).
일 구현예에서, 아데노바이러스 또는 아데노바이러스 벡터는 복제-결함성이며 증식을 위해(예컨대, 아데노바이러스 벡터 입자를 형성시키기 위해) 아데노바이러스 게놈의 E1 및 E4 영역의 보충을 최대한 필요로 한다. 따라서, 복제-결함성 아데노바이러스 또는 아데노바이러스 벡터는 증식을 위한(예컨대, 아데노바이러스 벡터 입자를 형성하기 위한) 아데노바이러스 게놈의 E1 및 E4 영역(E1/E4-결함성 아데노바이러스 벡터로 나타냄) 둘 다의 적어도 하나의 복제-필수 유전자 기능의 보충을 필요로 한다. 아데노바이러스 또는 아데노바이러스 벡터는 아데노바이러스 게놈의 E1 영역의 적어도 하나의 복제-필수 유전자 기능(바람직하게는 모든 복제-필수 유전자 기능), 아데노바이러스 게놈의 E4 영역의 적어도 하나의 복제-필수 유전자 기능, 및 아데노바이러스 게놈의 비필수 E3 영역의 적어도 하나의 유전자 기능에서 결함성일 수 있다(E1/E3/E4-결합성 아데노바이러스 벡터로 나타냄). 아데노바이러스 또는 아데노바이러스 벡터는 바람직하게는 증식을 위해 아데노바이러스 게놈의 E1 영역의 보충을 최대한 필요로 하며, 증식을 위해 아데노바이러스 게놈의 임의의 다른 결함의 보충을 필요로 하지 않는다. 보다 바람직하게는, 아데노바이러스 또는 아데노바이러스 벡터는 증식을 위한 아데노바이러스 게놈의 E1 및 E4 영역의 보충을 최대한 필요로 하며, 증식을 위한 아데노바이러스 게놈의 임의의 다른 결함의 보충을 필요로 하지 않는다.
아데노바이러스 또는 아데노바이러스 벡터는, 아데노바이러스 게놈의 다수의 복제-필수 기능에서 결함성인 경우(예컨대, E1/E4-결함성 아데노바이러스 벡터), 단일의 복제-필수 유전자 기능에서 결함성인 아데노바이러스 또는 아데노바이러스 벡터(예컨대, E1-결함성 아데노바이러스 벡터)에 의해 달성된 것과 유사한 보충 세포주 내에서 바이러스 성장을 제공하기 위해 스페이서 서열을 포함할 수 있다. 스페이서 서열은 목적한 길이의 임의의 뉴클레오타이드 서열 또는 서열들, 예를 들면, 길이가 적어도 약 15개 염기쌍인 서열(예컨대, 약 15개 뉴클레오타이드 내지 약 12,000개 뉴클레오타이드), 바람직하게는 약 100개 뉴클레오타이드 내지 약 10,000개 뉴클레오타이드, 보다 바람직하게는 약 500개 뉴클레오타이드 내지 약 8,000개 뉴클레오타이드, 심지어 보다 바람직하게는 약 1,500개 뉴클레오타이드 내지 약 6,000개 뉴클레오타이드, 및 가장 바람직하게는 약 2,000개 내지 약 3,000개 뉴클레오타이드, 또는 앞서의 값들 중 임의의 2개로 정의된 범위를 함유할 수 있다. 스페이서 서열은 암호화 또는 비-암호화일 수 있고 아데노바이러스 게놈과 관련하여 천연적이거나 비-천연적일 수 있지만, 결함성 영역에 대해 복제-필수 기능을 회복하지 않는다. 스페이서는 또한 발현 카세트(expression cassette)를 함유할 수 있다. 보다 바람직하게는, 스페이서는 폴리아데닐화 서열 및/또는 아데노바이러스 또는 아데노바이러스 벡터와 관련하여 비-천연적인 유전자를 포함한다. 아데노바이러스 벡터 내에서 스페이서의 사용은 예를 들면, 미국 특허 제5,851,806호 및 국제 특허원 공보 제WO 1997/021826호에 추가로 기술되어 있다.
아데노바이러스 게놈 모두 또는 일부, 예를 들면, 아데노바이러스 게놈의 E1, E3, 및 E4 영역을 제거함으로써, 수득되는 아데노바이러스 또는 아데노바이러스 벡터는 아데노바이러스 캡시드 내로 패키지되는 능력을 보유하면서 외인성 핵산 서열의 삽입을 허용할 수 있다. 외인성 핵산 서열은 위치내 삽입이 아데노바이러스 또는 아데노바이러스 벡터 입자의 형성을 허용하는 한 아데노바이러스 게놈 내 임의의 위치에 삽입될 수 있다. 외인성 핵산 서열은 바람직하게는 아데노바이러스 게놈의 E1 영역, E3 영역, 또는 E4 영역 내에 위치한다.
본 개시내용의 복제-결함성 아데노바이러스 또는 아데노바이러스 벡터는 복제-결함성 아데노바이러스 또는 아데노바이러스 벡터 내에 존재하지 않는 유전자 기능을 제공하는 세포 주를 보충하는데 있어서 생산될 수 있지만, 고 역가의 바이러스 벡터 스톡(stock)을 생성하기 위하여 적절한 수준에서, 바이러스 증식에 필요할 수 있다. 이러한 보충 세포주는 공지되어 있으며 293개 세포(예컨대, Graham et al., J. Gen. Virol., 36: 59-72 (1977)에 기술됨), PER.C6 세포(예컨대, 국제 특허원 공보 제WO 1997/000326호, 및 미국 특허 제5,994,128호 및 제6,033,908호), 및 293-ORF6 세포(예컨대, 국제 특허원 공보 제WO 95/34671호 및 Brough et al., J. Virol., 71: 9206-9213 (1997)에 기술됨)를 포함하나, 이에 한정되지 않는다. 본 개시내용의 복제-결함성 아데노바이러스 또는 아데노바이러스 벡터를 생산하기 위한 다른 적합한 보충 세포주는 이의 발현이 숙주 세포 내에서 바이러스 성장을 억제하는 이식유전자를 암호화하는 아데노바이러스 벡터를 증식시키기 위해 생성된 보충 세포를 포함한다(참고: 예컨대, 미국 특허원 공보 제2008/0233650호). 추가의 적합한 보충 세포는 예를 들면, 미국 특허 제6,677,156호 및 제6,682,929호, 및 국제 특허원 공보 제WO 2003/020879호에 기술되어 있다. 일부 예에서, 세포 게놈은 이의 유전 생성물이 복제-결함성 아데노바이러스 벡터의 결함 모두에 대해 보충하는, 핵산 서열을 포함할 필요는 없다. 복제-결함성 아데노바이러스 벡터 내에 결여하는 하나 이상의 복제-필수 유전자 기능은 헬퍼 바이러스, 예컨대, 복제-결함성 아데노바이러스 또는 아데노바이러스 벡터의 복제에 필요한 하나 이상의 필수 유전자 기능을 인 트랜스(in trans)로 보충하는 아데노바이러스 벡터에 의해 공급될 수 있다. 대안적으로, 본 발명의 아데노바이러스 또는 아데노바이러스 벡터는 본 발명의 복제-결함성 아데노바이러스 또는 아데노바이러스 벡터에서 결여하는 하나 이상의 복제-필수 유전자 기능을 보충하는 비-천연 복제-필수 유전자를 포함할 수 있다. 예를 들면, E1/E4-결함성 아데노바이러스 벡터는 상이한 아데노바이러스(예컨대, 본 발명의 아데노바이러스 또는 아데노바이러스 벡터보다는 상이한 혈청형의 아데노바이러스, 또는 본 발명의 아데노바이러스 또는 아데노바이러스 벡터보다는 상이한 종의 아데노바이러스)로부터 수득되거나 유래된 E4 ORF 6을 암호화하는 핵산 서열을 함유하도록 가공될 수 있다.
아데노바이러스 또는 아데노바이러스 벡터는 이식유전자를 추가로 포함할 수 있다. 용어 "이식유전자"는 본원에서 적절한 조절 성분(예컨대, 프로모터)에 작동적으로 연결됨으로써, 비-천연 핵산 서열이 발현되어 단백질(예컨대, 펩타이드 또는 폴리펩타이드)를 생산하도록 하는 비-천연 핵산 서열로서 본원에 정의된다. 조절 성분(예컨대, 프로모터)은 아데노바이러스 또는 아데노바이러스 벡터에 대해 천연적이거나 비-천연적일 수 있다.
"비-천연" 핵산 서열은 천연적으로 발생하는 위치에서 아데노바이러스의 천연적으로 발생하는 핵산 서열이 아닌 임의의 핵산 서열(예컨대, DNA, RNA, 또는 cDNA 서열)이다. 따라서, 비-천연 핵산 서열은 아데노바이러스 내에서 천연적으로 발견될 수 있지만, 아데노바이러스 게놈 내 비-천연 위치에 위치하고/하거나 비-천연 프로모터에 작동적으로 연결된다. 용어 "비-천연 핵산 서열", "이종 핵산 서열", 및 "외인성 핵산 서열"은 본 개시내용의 맥락에서 상호교환적으로 사용될 수 있다. 비-천연 핵산 서열은 바람직하게는 DNA이고 바람직하게는 단백질(즉, 하나 이상의 단백질을 암호화하는 하나 이상의 핵산 서열)을 암호화한다.
비-천연 핵산 서열은 질환에 대해 포유동물을 예방학적으로 또는 치료학적으로 치료하는데 사용될 수 있는 치료학적 단백질을 암호화할 수 있다. 적합한 치료학적 단백질의 예는 사이토킨, 독소, 종양 억제인자 단백질, 성장 인자, 호르몬, 수용체, 미토겐(mitogen), 면역글로불린, 신경펩타이드, 신경전달인자, 및 효소를 포함한다. 대안적으로, 비-천연 핵산 서열은 병원체(예컨대, 세균 또는 바이러스)의 항원을 암호화할 수 있으며, 아데노바이러스 또는 아데노바이러스 벡터는 백신으로서 사용될 수 있다.
바이러스 기반 전달 시스템
본 개시내용은 또한 전달 시스템, 예를 들면, 바이러스-기반 시스템을 제공하며, 여기서 본원에 기술된 핵산이 삽입된다. 대표적인 바이러스 발현 벡터는 아데노-관련 바이러스 벡터, 아데노바이러스-기반 벡터, 렌티바이러스-기반 벡터, 레트로바이러스 벡터, 및 헤르페스 바이러스-기반 벡터를 포함하나, 이에 한정되지 않는다. 구현예에서, 바이러스 벡터는 렌티바이러스 벡터이다. 레트로바이러스, 예를 들면, 렌티바이러스로부터 기원한 벡터는 딸 세포(daughter cell) 내에서 이식유전자의 장기간, 안정한 통합 및 이의 증식을 허용하므로 장기간 유전자 전달을 달성하기에 적합한 도구(tool)이다. 렌티바이러스 벡터는 비-증식 세포, 예를 들면, 간 세포를 형질도입시킬 수 있다는 점에서 종양-레트로바이러스, 예를 들면, 쥐 백혈병 바이러스로부터 기원한 벡터보다 추가된 장점을 갖는다. 이들은 또한 낮은 면역원성의 추가된 장점을 갖는다. 추가의 구현예에서, 바이러스 벡터는 아데노-관련 바이러스 벡터이다. 추가의 구현예에서, 바이러스 벡터는 레트로바이러스 벡터이다. 일반적으로, 및 구현예에서, 적합한 벡터는 적어도 하나의 유기체 내에서 기능성인 복제의 오리진(origin), 프로모터 서열, 편리한 제한 엔도뉴클레아제 부위, 및 하나 이상의 선택가능한 마커를 함유한다.
추가의 적합한 벡터는 통합 발현 벡터를 포함하며, 이는 숙주 세포의 DNA 내로 무작위로 통합될 수 있거나, 발현 벡터와 숙주 세포의 염색체 사이에 특이적인 재조합을 가능하도록 하는 재조합 부위를 포함할 수 있다. 이러한 통합 발현 벡터는 목적한 단백질의 발현을 시행하기 위한 숙주 세포의 염색체의 내인성 발현 제어 서열을 활용할 수 있다. 부위 특이적인 방식으로 통합하는 벡터의 예는 예를 들면, Invitrogen(캘리포니아주 칼스바드 소재)로부터의 flp-in 시스템(예컨대, pcDNATM5/FRT), 또는 Stratagene(캘리포니아주 라 졸라 소재)으로부터의 pExchange-6 Core 벡터에서 발견될 수 있는 것과 같은, cre-lox 시스템의 구성성분을 포함한다. 숙주 세포 염색체 내로 무작위적으로 통합되는 벡터의 예는 예를 들면, Invitrogen(캘리포니아주 칼스바드 소재)으로부터의 pcDNA3.1(T-항원의 부재하에 도입되는 경우), 및 Promega(위스콘신주 매디슨 소재)로부터의 pCI 또는 pFN10A (ACT) FLEXITM을 포함한다. 추가의 프로모터 성분, 예컨대, 인핸서는 전사 개시의 빈도를 조절한다. 전형적으로, 다수의 프로모터가 출발 부위의 하부로 기능성 성분을 또한 함유하는 것으로 최근 밝혀졌지만, 이들은 출발 부위의 상부로 30 내지 110 bp 영역 내에 위치한다. 프로모터 성분들 사이의 간격은 흔히 가요성(flexible)이어서, 성분이 삽입되거나 서로에 대해 이동하는 경우 프로모터 기능이 보존된다. 티미딘 키나제(tk) 프로모터에서, 프로모터 성분들 사이의 간격은 활성의 감소가 시작되기 전에 50 bp 떨어지게 증가할 수 있다. 프로모터에 따라, 개개 성분은 협동적으로 또는 독립적으로 기능하여 전사를 활성화시키는 것으로 여겨진다.
적합한 프로모터의 하나의 예는 즉시 초기 사이토메갈로바이러스(immediate early cytomegalovirus: CMV) 프로모터 서열이다. 이러한 프로모터 서열은 이에 작동적으로 연결된 임의의 폴리뉴클레오타이드 서열의 고 수준의 발현을 구동시킬 수 있는 강력한 구성적 프로모터 서열이다.
그러나, 다른 구성적 프로모터 서열, 예를 들면, 그러나 이에 한정되지 않는, 시미안 바이러스 40(SV40) 초기 프로모터, 마우스 유방 종양 바이러스(MMTV), 사람 면역결핍성 바이러스(HIV) 긴 말단 반복체(long terminal repeat: LTR) 프로모터, MoMuLV 프로모터, 조류 백혈병 바이러스 프로모터, 엡슈타인-바르 바이러스(Epstein-Barr virus) 즉시 초기 프로모터, 로우스 육종 바이러스(Rous sarcoma virus) 프로모터 뿐만 아니라 사람 유전자 프로모터, 예를 들면, 그러나 이에 한정되지 않는, 액틴 프로모터, 미오신 프로모터, 헤모글로빈 프로모터, 및 크레아틴 키나제 프로모터를 사용할 수 있다. 또한, 본 개시내용은 구성적 프로모터의 사용에 한정되지 않아야 한다. 유도성 프로모터가 또한 본 개시내용의 부분으로서 고려된다. 유도성 프로모터의 사용은 이러한 발현이 요구되는 경우 이것이 작동적으로 연결되는 폴리뉴클레오타이드 서열의 발현을 작동(turning on)시킬 수 있거나, 발현이 요구되지 않는 경우 작동시키지 않을(turning off) 수 있다. 유도성 프로모터의 예는 메탈로티오닌 프로모터, 글루코코르티코이드 프로모터, 프로게스테론 프로모터, 및 테트라사이클린 프로모터를 포함하나, 이에 한정되지 않는다.
리포터 유전자는 잠재적으로 형질감염된 세포를 확인하고 조절 서열의 기능성을 평가하는데 사용될 수 있다. 일반적으로, 리포터 유전자는 수용체 유기체 또는 조직 내에 존재하지 않거나 이에 의해 발현되지 않고 이의 발현이 일부 용이하게 검출가능한 특성, 예컨대, 효소 활성에 의해 나타나는 폴리펩타이드를 암호화하는 유전자이다. 리포터 유전자의 발현은 DNA가 수용체 세포 내로 도입된 후 적합한 시간에 검정된다. 적합한 리포터 유전자는 루시퍼라제, 베타-갈락토시다제, 클로람페니콜 아세틸 트랜스퍼라제, 분비된 알칼린 포스파타제, 또는 녹색 형광성 단백질 유전자(예컨대, Ui-Tei et al., FEBS Letters 479: 79-82 (2000))를 암호화하는 유전자를 포함할 수 있다. 적합한 발현 시스템을 잘 공지되어 있으며 공지된 기술을 사용하여 제조될 수 있거나 상업적으로 수득될 수 있다. 일반적으로, 리포터 유전자의 고 수준의 발현을 나타내는 최소의 5' 플랭킹 영역(flanking region)을 지닌 작제물이 프로모터로서 확인된다. 이러한 프로모터 영역은 리포터 유전자에 연결시켜 프로모터-유래된 전사를 조절하는 능력에 대해 제제(agent)를 평가하기 위해 사용될 수 있다.
유전자를 세포 내로 도입시키고 발현시키는 방법은 당해 분야에 공지되어 있다. 발현 벡터의 맥락에서, 벡터는 숙주 세포, 예컨대, 포유동물, 세균, 효모, 또는 곤충 세포 내로 당해 분야의 임의의 방법에 의해 용이하게 도입시킬 수 있다. 예를 들면, 발현 벡터는 물리적, 화학적, 또는 생물학적 수단에 의해 숙주 세포내로 전달할 수 있다.
폴리뉴클레오타이드를 숙주 세포 내로 도입시키는 물리적 방법은 인산칼슘 침전, 지질감염, 입자 충격(particle bombardment), 미세주사, 전기천공(electroporation) 등을 포함한다. 벡터 및/또는 외인성 핵산을 포함하는 세포를 생산하는 방법은 당해 분야에 잘 공지되어 있다. 예를 들면, 문허: Sambrook et al. (Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory, New York (2001))을 참고한다. 구현예에서, 폴리뉴클레오타이드를 숙주 세포 내로 도입시키는 방법은 인산칼슘 형질감염 또는 폴리에틸렌이민(PEI) 형질감염이다.
목적한 폴리뉴클레오타이드를 숙주 세포내로 도입시키기 위한 생물학적 방법은 DNA 및 RNA 벡터의 사용을 포함한다. 바이러스 벡터, 및 특히 레트로바이러스 벡터는 유전자를 포유동물, 예컨대, 사람 세포 내로 삽입시키기 위해 가장 광범위하게 사용된 방법이 되어 왔다. 다른 바이러스 벡터는 렌티바이러스, 폭스바이러스, 헤르페스 단성 바이러스 I, 아데노바이러스 및 아데노-관련 바이러스 등으로부터 유래할 수 있다. 예를 들면, 미국 특허 제5,350,674호 및 제5,585,362호를 참고한다.
비-바이러스 기반 전달 시스템
폴리뉴클레오타이드를 숙주 세포 내로 도입시키기 위한 화학적 방법은 콜로이드성 분산 시스템, 예를 들면, 거대분자 복합체, 나노캅셀(nanocapsule), 미세구(microsphere), 비드(bead), 및 지질-기반 시스템, 예를 들면 수중유(oil-in-water) 에멀젼, 미셀(micelle), 혼합된 미셀, 및 리포좀을 포함한다. 시험관내 및 생체 내에서 전달 비히클로서 사용하기 위한 예시적인 콜로이드성 시스템은 리포좀(예컨대, 인공 막 소낭)이다.
지질 제형의 사용은 핵산을 숙주 세포 내로 도입시키기 위해 고려된다(시험관내, 생체외(ex vivo) 또는 생체내). 다른 양태에서, 핵산은 지질과 관련될 수 있다. 지질과 관련된 핵산은 리포좀의 수성 내부 내에 캡슐화(encapsulating)되거나, 리포좀의 지질 이층 내에 배치되거나, 리포좀 및 올리고뉴클레오타이드 둘 다와 관련된 연결 분자를 통해 리포좀에 부착되거나, 리포좀 내에 인트랩(entrap)되거나, 리포좀과 복합체화되거나, 지질을 함유하는 용액 속에 분산되거나, 지질과 혼합되거나, 지질과 조합되거나, 지질 속의 현탁액으로서 함유되거나 미셀과 함께 함유되거나 복합체화되거나, 또는 그렇지 않으면 지질과 회합된다. 지질, 지질/DNA 또는 지질/발현 벡터 회합된 조성물은 용액 속의 임의의 특수한 구조에 제한되지 않는다. 예를 들면, 이들은 미셀로서, 또는 "붕괴된" 구조로, 이층 구조 내에 존재할 수 있다. 이들은 또한 용액 속에 단순히 산재되어, 가능하게는 크기 또는 형태가 균일하지 않은 응집물을 형성할 수 있다. 지질은 천연적으로 발생한 또는 합성 지질일 수 있는 지방 물질이다. 예를 들면, 지질은 세포질 속에 천연적으로 발생하는 지방 소적(droplet) 뿐만 아니라 장쇄 지방족 탄수화물 및 이들의 유도체, 예를 들면, 지방산, 알코올, 아민, 아미노 알코올, 및 알데하이드를 함유하는 화합물의 부류를 포함한다.
사용하기에 적합한 지질은 상업적 공급원으로부터 수득할 수 있다. 예를 들면, 디미리스틸 포스파티딜콜린("DMPC")은 미주리주 세인트 루이스(St. Louis) 소재의 Sigma로부터 수득될 수 있고; 디세틸 포스페이트("DCP")는 K & K Laboratories(뉴욕주 플레인뷰(Plainview) 소재)로부터 수득될 수 있으며; 콜레스테롤("Choi")은 Calbiochem-Behring으로부터 수득될 수 있고; 디미리스틸 포스파티딜글리세롤("DMPG") 및 다른 지질은 Avanti Polar Lipids, Inc.(Birmingham, Ala.)로부터 수득될 수 있다. 클로로포름 또는 클로로포름/메탄올 속의 지질의 스톡 용액은 약 -20℃에서 저장할 수 있다. 클로로포름은 메탄올보다 더 용이하게 증발되므로 유일한 용매로서 사용된다. "리포좀"은 봉입된(enclosed) 지질 이층 또는 응집물의 생성에 의해 형성된 다양한 단일 및 다중라멜라 지질 소낭을 포함하는 일반적인 용어이다. 리포좀은 인지질 이층 막 및 내부 수성 매질을 지닌 소낭 구조를 갖는 것으로 특징화될 수 있다. 다중라멜라 리포좀은 수성 매질에 의해 분리된 다수의 지질 층을 갖는다. 이들은 인지질이 과량의 수용액 속에 현탁되는 경우에 자발적으로 형성된다. 지질 구성성분은 밀폐된 구조의 형성 전에 자가-재배열을 겪으며 지질 이층 사이에 물과 용해된 용질을 인트랩(entrap)시킨다(Ghosh et al., Glycobiology 5: 505-10 (1991)). 그러나 정상의 소낭 구조보다는 용액 속에 상이한 구조를 갖는 조성물이 또한 포함된다. 예를 들면, 지질은 미셀 구조(micellar structure)로 추정될 수 있거나 단지 지질 분자의 비균일 응집물로서 존재할 수 있다. 리포펙타민-핵산 복합체가 또한 고려된다.
일부 예에서, 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 또한 비-바이러스 기반 전달 시스템, 예를 들면, DNA 서열을 척추동물의 염색체 내로 도입시키기 위한 합성 DNA 트랜스포존(transposon) 시스템을 지칭하는 "슬리핑 뷰티(Sleeping Beauty: SB) 트랜스포존 시스템(Transposon System)"을 사용하여 세포 내로 도입시킬 수 있다. 시스템의 일부 예시적인 구현예는 예를 들면, 미국 특허 제6,489,458호 및 제8,227,432호에 기술되어 있다. 슬리핑 뷰티 트랜스포존 시스템은 슬리핑 뷰티(SB) 트랜스포사제 및 SB 트랜스포존으로 구성된다. 구현예에서, 슬리핑 뷰티 트랜스포존 시스템은 SB11 트랜스포존 시스템, SB100X 트랜스포존 시스템, 또는 SB110 트랜스포존 시스템을 포함한다.
DNA 트랜스포존은 하나의 DNA 부위로부터 다른 것으로 단순한, 절단-및-페이스트 방식(cut-and-paste manner)으로 전좌된다(translocate). 전좌는 정의된 DNA 분절(segment)이 하나의 DNA 분자로부터 절개되어 동일한거나 상이한 DNA 분자 또는 게놈 내에서 다른 부위로 이동하는 정밀한 공정이다. 다른 Tc1/마리너-유형(mariner-type) 트랜스포사제에서와 같이, SB 트랜스포사제는 트랜스포존을 수용체 DNA 서열 내의 TA 디뉴클레오타이드 염기 쌍 내로 삽입시킨다. 삽입 부위는 동일한 DNA 분자 내, 또는 다른 DNA 분자(또는 염색체) 내의 어느 곳일 수 있다. 사람을 포함하는 포유동물 게놈에서, 대략 2억개의 TA 부위가 존재한다. TA 삽입 부위는 트랜스포존 통합 공정에서 중복되어 있다. TA 서열의 이러한 중복은 전좌의 특징이며 일부 실험에서 메카니즘을 확인하기 위해 사용된다. 트랜스포사제는 트랜스포존 내에서 암호화될 수 있거나 트랜스포사제는 다른 공급원, 예를 들면, DNA 또는 mRNA 공급원에 의해 공급될 수 있고, 이러한 경우에 트랜스포존은 비-자가 성분이 된다. 비-자가 트랜스포존은 삽입 후 독립적으로 절개 및 재-삽입을 지속할 수 없기 때문에 유전 도구로서 가장 유용하다. SB 트랜스포존은 유전자를 척추동물의 게놈 내로 도입하기 위한 및 유전자 치료요법을 위한 비-바이러스 벡터로서 사용되는 것으로 고려된다.
외인성 핵산을 숙주 세포 내로 도입하거나 또는 그렇지 않으면 세포를 본 개시내용의 억제제에 노출시키는데 사용된 방법과 상관없이, 숙주 세포 내에서 재조합 DNA 서열의 존재를 확인하기 위하여, 다양한 검정을 수행할 수 있다. 이러한 검정은 예를 들면, 당해 분야의 기술자에게 잘 공지된 분자 검정, 예를 들면, 서던 및 노던 블롯팅(Southern and Northern blotting), RT-PCR 및 PCR; "생화학적" 검정, 예를 들면, 예컨대, 면역학적 수단(ELISA 및 웨스턴 블롯)에 의하거나 본 개시내용의 영역 내에 속하는 제제를 확인하기 위해 본원에 기술된 검정에 의해, 특수한 펩타이드의 존재 또는 부재를 검출하는 것을 포함한다.
구현예에서, 본원에 기술된 변형된 효과기 세포 및 다른 유전 성분은 SB11 트랜스포존 시스템, SB100X 트랜스포존 시스템, SB110 트랜스포존 시스템, piggyBac 트랜스포존 시스템(참고: 예컨대, Wilson et al, "PiggyBac Transposon-mediated Gene Transfer in Human Cells," Molecular Therapy 15:139-145 (2007), 본원에 이의 전문이 참고로 포함됨) 및/또는 piggyBac 트랜스포존 시스템(참고: 예컨대, Mitra et al., "Functional characterization of piggyBac from the bat Myotis lucifugus unveils an active mammalian DNA transposon", Proc. Natl. Acad. Sci USA 110:234-239 (2013)을 사용하여 세포로 전달된다. 추가의 트랜스포사제 및 트랜스포존 시스템은 미국 특허 제6,489,458호; 제6,613,752호, 제7,148,203호; 제7,985,739호; 제8,227,432호; 제9,228,180호; 미국 특허 공보 제2011/0117072호; Mates et al., Nat Genet, 41(6):753-61 (2009). doi: 10.1038/ng.343. Epub 2009 May 3, Gene Ther., 18(9):849-56 (2011). doi: 10.1038/gt.2011.40. Epub 2011 Mar 31 및 in Ivics et al., Cell, 91(4):501-10, (1997)에 제공되며, 이들 각각은 이의 전문이 본원에 참고로 포함된다.
추가의 적합한 비-바이러스 시스템은 발현 벡터를 통합시키는 단계를 포함할 수 있으며, 발현 벡터는 숙주 세포의 DNA 내로 무작위로 통합될 수 있거나, 발현 벡터와 숙주 세포의 염색체 사이에 특이적인 재조합을 가능하도록 하는 재조합 부위를 포함할 수 있다. 이식유전자의 예정된 유전성 유전자자리(genetic loci) 내로의 표적화된 통합은 많은 적용을 위해 바람직한 목표이다. 첫째로, 부위-특이적인 리콤비나제에 대한 제1의 재조합 부위는 무작위 또는 예정된 위치에서 게놈 부위에 삽입시킨다. 후속적으로, 세포는 목적한 유전자 또는 DNA 및 제2의 재조합 부위 및 리콤비나제에 대한 공급원(발현 플라스미드, RNA, 단백질, 또는 바이러스-발현 리콤비나제)을 수반하는 플라스미드로 형질감염시킨다. 제1 재조합 부위와 제2 재조합 부위 사이의 재조합은 플라스미드 DNA의 통합을 생성한다.
이러한 통합 발현 벡터는 숙주 세포의 염색체의 내인성 발현 제어 서열을 이용하여 목적한 단백질의 발현을 실시할 수 있다. 일부 구현예에서, 표적화된 통합은 통합 부위를 플랭킹(flanking)하는 서열에 대해 상동성인 공여체 폴리뉴클레오타이드 상의 서열의 존재에 의해 촉진된다. 예를 들면, 본원에 기술된 공여체 폴리뉴클레오타이드를 사용한 표적화된 통합은 통상의 형질감염 기술, 예컨대, 동종 재조합에 의한 유전자 녹아웃(gene knockout) 또는 녹인(knockin)을 생성하는데 사용된 기술에 따라 달성할 수 있다. 다른 구현예에서, 표적화된 통합은 통합 부위를 플랭킹하는 서열에 대해 상동성인 공여체 폴리뉴클레오타이드 상의 서열의 존재, 및 부위-특이적인 리콤비나제의 존재 하에 공여체 폴리뉴클레오타이드와 세포를 접촉시킴 둘 다에 의해 촉진된다. 부위-특이적인 리콤비나제에 의해, 또는 단순히 리콤비나제에 의해, 이는 이의 양립성 재조합 부위 사이에서 보존적인 부위-특이적인 재조합을 촉매하는 폴리펩타이드임을 의미한다. 본원에 사용된 바와 같이, 부위-특이적인 리콤비나제는 천연의 폴리펩타이드 뿐만 아니라 활성을 보유하는 유도체, 변이체 및/또는 단편, 및 활성을 보유하는 리콤비나제를 암호화하는 천연의 폴리뉴클레오타이드, 유도체, 변이체, 및/또는 단편을 포함한다.
또한 숙주 세포 내에서 이종 유전자를 통합시키기 위한 시스템이 본원에 제공되며, 상기 시스템은 하나 이상의 유전자 발현 카세트를 포함한다. 일부 예에서, 시스템은 제1의 폴리펩타이드 작제물을 암호화하는 제1의 폴리뉴클레오타이드를 포함하는 제1의 유전자 발현 카세트를 포함한다. 다른 예에서, 시스템은 제2의 폴리펩타이드 작제물을 암호화하는 제2의 폴리뉴클레오타이드를 포함하는 제2의 유전자 발현 카세트를 포함할 수 있다. 여전히 다른 예에서, 시스템은 제3의 발현 카세트를 포함할 수 있다. 일 구현예에서, 유전자 발현 카세트 중 하나는: (i) 전사활성화 도메인(transactivation domain); (ii) 핵 수용체 리간드 결합 도메인; (iii) DNA-결합 도메인; 및 (iv) 엑다이손 수용체 결합 도메인(ecdysone receptor binding domain) 중 하나 이상을 암호화하는 유전자 스위치 폴리뉴클레오타이드를 포함할 수 있다. 다른 구현예에서, 시스템은 재조합 부착 부위; 및 세린 리콤비나제를 포함함으로써; 상기 세포가 적어도 상기 제2의 유전자 발현 카세트와 접촉시, 상기 세린 리콤비나제의 존재하에서, 상기 이종 유전자가 상기 숙주 세포 내에서 통합되도록 한다.
일부 예에서, 시스템은 리간드를 추가로 포함함으로써, 상기 숙주 세포와 접촉시, 상기 리간드의 존재하에서, 상기 이종 유전자가 상기 숙주 세포 내에서 발현되도록 한다. 하나의 예에서, 시스템은 또한 재조합 부착 부위를 포함한다. 일부 에에서, 하나의 재조합 부착 부위는 파아지 게놈성 재조합 부착 부위(attP) 또는 세균 게놈성 재조합 부착 부위(attB)이다. 하나의 예에서, 숙주 세포는 진핵 세포이다. 다른 예에서, 숙주 세포는 사람 세포이다. 추가의 예에서, 숙주 세포는 T 세포 또는 NK 세포이다.
프로모터
"프로모터"는 암호화 서열의 전사를 개시하는 폴리뉴클레오타이드의 영역을 지칭한다. 프로모터는 동일한 가닥 상에 및 DNA 상의 상부(센스 가닥(sense strand)의 5' 영역을 향해)에서 유전자의 전사 출발 부위 근처에 위치한다. 일부 프로모터는 세포 내 모든 환경에서 활성이므로 구성적인 반면, 다른 것은 조절되어 특이적인 자극, 예컨대, 유도성 프로모터에 대한 반응시 활성이 된다. 여전히 다른 프로모터는 조직 특이적이거나 활성화된 프로모터이며, T-세포 특이적인 프로모터를 포함하나, 이에 한정되지 않는다.
본원에 사용된 바와 같은 용어 "프로모터 활성" 및 이의 문법적 등가물은 이의 활성이 측정되는 프로모터에 대해 작동적으로 연결된 뉴클레오타이드 서열의 발현 정도를 지칭한다. 프로모터 활성은 예를 들면, 노던 블롯 분석에 의해 생산된 RNA 전사체의 양을 측정함으로써 직접적으로 또는 연결된 핵산 서열, 예를 들면, 프로모터에 연결된 리포터 핵산 서열에 의해 암호화된 생성물의 양을 측정함으로써 간접적으로 측정될 수 있다.
본원에 사용된 바와 같은 "유도성 프로모터"는 전사 조절인자, 예컨대, 생물 인자(biotic factor) 또는 무생물 인자(abiotic factor)의 존재 또는 부재에 의해 활성으로 도입된 프로모터를 지칭한다. 유도성의 프로모터는 이들에 작동적으로 연결된 유전자의 발현이 유기체의 발달의 특정 단계에서 또는 특수한 조직 내에서 작동되거나 작동되지 않을 수 있으므로 유용하다. 유도성 프로모터의 예는 알코올-조절된 프로모터, 테트라사이클린-조절된 프로모터, 스테로이드-조절된 프로모터, 금속-조절된 프로모터, 발병-조절된 프로모터, 온도-조절된 프로모터 및 광-조절된 프로모터이다. 일 구현예에서, 유도성 프로모터는 유전성 스위치의 부분이다. 유도성 프로모터는 유전자 스위치 리간드 유도성 프로모터일 수 있다. 일부 경우에, 유도성 프로모터는 소 분자 리간드-유도성 2개의 폴리펩타이드 엑다이손 수용체-기반 유전자 스위치, 예를 들면, RHEOSWITCH® 유전자 스위치일 수 있다. 일부 경우에, 유전자 스위치는: 제PCT/US2001/009050호(제WO 2001/070816호); 미국 특허 제7,091,038호; 제7,776,587호; 제7,807,417호; 제8,202,718호; 제PCT/US2001/030608호(제WO 2002/029075호); 미국 특허 제8,105,825호; 제8,168,426호; 제PCT/1J52002/005235호(제WO 2002/066613호); 미국 특허원 제10/468,200호(미국 공보 제20120167239호); 제PCT/US2002/005706호(제WO 2002/066614호); 미국 특허 제7,531,326호; 제8,236,556호; 제8,598,409호; 제PCT/U52002/005090호(제WO 2002/066612호); 미국 특허 제8,715,959호(미국 공보 제20060100416호); 제PCT/US2002/005234호(제WO 2003/027266호); 미국 특허 제7,601,508호; 제7,829,676호; 제7,919,269호; 제8,030,067호; 제PCT/U52002/005708호(제WO 2002/066615호); 미국 특허원 제10/468,192호(미국 공보 제20110212528호); 제PCT/US2002/005026호(제WO 2003/027289호); 미국 특허 제7,563,879호; 제8,021,878호; 제8,497,093호; 제PCT/US2005/015089호(제WO 2005/108617호); 미국 특허 제7,935,510호; 제8,076,454호; 제PCT/U52008/011270호(제WO 2009/045370허); 미국 특허원 제12/241,018호(미국 공보 제20090136465호); 제PCT/US2008/011563호(제WO 2009/048560호); 미국 특허원 제12/247,738호(미국 공보 제20090123441호); 제PCT/US2009/005510호(제WO 2010/042189호); 미국 특허원 제13/123,129호(미국 공보 제20110268766호); 제PCT/US2011/029682호(제WO 2011/119773호); 미국 특허원 제13/636,473호(미국 공보 제20130195800호); 제PCT/US2012/027515호(제WO 2012/122025호); 및 미국 특허 제9,402,919호(이들 각각은 이의 전문이 참고로 포함된다)에 기술된 임의의 시스템에 기술되어 있지만 이에 한정되지 않는 엑다이손-기반 수용체 구성성분으로부터 선택될 수 있다.
대상체에게 적어도 2개의 기능성 단백질 또는 이의 일부; 적어도 하나의 프로모터; 및 적어도 하나의 가공된 재조합 부위를 포함하는 본원에 기술된 폴리펩타이드 서열을 암호화하는 폴리뉴클레오타이드를 포함하는 적어도 하나의 비-바이러스 벡터를 투여함을 포함하는 방법이 본원에 제공되며; 상기 적어도 하나의 프로모터는 상기 적어도 2개의 기능성 단백질의 발현을 유도(driving)시킨다. 일부 경우에, 적어도 하나의 프로모터는 구성적일 수 있다. 일부 경우에, 적어도 하나의 프로모터는 조직-특이적일 수 있다. 일부 경우에, 적어도 하나의 프로모터는 유도성일 수 있다. 일부 경우에, 유도성 프로모터는 소 분자 리간드(small molecular ligand)-유도성의 2개의 폴리펩타이드 엑다이손 수용체-기반 유전자 스위치이다. 다른 경우에, 프로모터의 조합(여기서 적어도 하나의 프로모터는 유도성일 수 있고 적어도 하나의 프로모터는 활성화 특이적일 수 있다)이 활용될 수 있다.
유도성 프로모터는 상기 적어도 2개의 유전자 발현의 용량-조절된 제어를 위해 리간드를 이용한다. 일부 경우에, 리간드는 엑다이스테로이드, 9-시스-레티노산, 레티노산의 합성 유사체, N,N'-디아실하이드라진, 옥사디아졸린, 디벤조일알킬 시아노하이드라진, N-알킬-N,N'-디아로일하이드라진, N-아실-N-알킬카보닐하이드라진, N-아로일-N-알킬-N'-아로일하이드라진, 아르니도케톤, 3,5-디-3급-부틸-4-하이드록시-N-이소부틸-벤즈아미드, 8-O-아세틸하르파기드, 옥시스테롤, 22(R) 하이드록시콜레스테롤, 24(S) 하이드록시콜레스테롤, 25-에폭시콜레스테롤, T0901317, 5-알파-6-알파-에폭시콜레스테롤-3-설페이트(ECHS), 7-케토콜레스테롤-3-설페이트, 프라메솔, 담즙산, 1,1-비포스포네이트 에스테르, 청소년 호르몬(juvenile hormone) III, RG-115819 (3,5-디메틸-벤조산 N-(1-에틸-2,2-디메틸-프로필)-N'-(2-메틸-3-메톡시-벤조일)-하이드라지드-), RG-115932 ((R)-3,5-디메틸-벤조산 N-(1-3급-부틸-부틸)-N'-(2-에틸-3-메톡시-벤조일)-하이드라지드), 및 RG- 115830(3,5 -디메틸-벤조산 N-(1-3급-부틸-부틸)-N'-(2-에틸-3-메톡시-벤조일)-하이드라지드), 및 이의 임의의 조합으로 이루어진 그룹으로부터 선택될 수 있다.
일부 구현예에서, 프로모터는 유도성 프로모터이다. 일부 구현예에서, 프로모터는 비-유도성 프로모터이다. 일부 경우에, 프로모터는 조직-특이적인 프로모터일 수 있다. 여기서, "조직-특이적인"은 조직 또는 세포형의 서브세트(subset)에서 유전자의 조절된 발현을 지칭한다. 일부 경우에, 조직-특이적인 프로모터는 공간적으로 조절됨으로써 프로모터가 유기체의 특정 조직 또는 세포형에서만 발현을 유도하도록 할 수 있다. 다른 경우에, 조직-특이적인 프로모터는 일시적으로 조절됨으로써 프로모터가 유기체의 발달 동안을 포함하여, 시간에 걸쳐 차등적으로 세포형 또는 조직내에서 발현을 유도하도록 할 수 있다. 일부 경우에, 조직-특이적인 프로모터는 공간적으로 및 일시적으로 둘 다 조절된다. 특정의 구현예에서, 조직-특이적인 프로모터는 세포형의 특수한 시간 또는 단계에 구성적으로 또는 간헐적으로 특정의 세포형에서 활성화된다. 예를 들면, 조직-특이적인 프로모터는 특이적인 세포, 예를 들면, T 세포 또는 NK 세포가 활성화되는 경우 활성화되는 프로모터일 수 있다. T 세포는 예를 들면, MHC 제II 부류 분자에 의해 펩타이드 항원과 함께 나타나는 경우, 다양한 방법으로 활성화될 수 있다.
하나의 경우에, 적어도 하나의 프로모터는 가공된 프로모터 또는 이의 변이체이다. 본원에 기술된 바와 같이, 프로모터는 IL-2로부터의 최소의 프로모터 서열 및 다음 중 하나 이상을 혼입시킬 수 있다: 활성화된 T-세포의 핵 인자(NFAT) 반응 성분(들); NFIL2D 반응 성분, NFkB/TCF 반응 성분, NF_AT/NFIL2B 반응 성분 또는 NFIL2A/OCT 반응 성분. 반응 성분의 예는 이의 전문이 본원에 포함된, 문헌: Mattila et al., EMBO J. 9(13):4425-33 (1990)에 기술되어 있다.
일부 구현예에서, 적어도 하나의 프로모터는 IL-2 코어 프로모터(서열 번호: 26)를 포함한다. 일 구현예에서, 적어도 하나의 프로모터는 IL-2 최소 프로모터(서열 번호: 27)를 포함한다. 다른 구현예에서, 적어도 하나의 프로모터는 IL-2 인핸서 및 프로모터 변이체(서열 번호: 26 내지 서열 번호: 28)를 포함한다. 여전히 다른 구현예에서, 적어도 하나의 프로모터는 NF-κB 결합 부위(서열 번호: 30 내지 서열 번호: 32)를 포함한다. 일부 구현예에서, 적어도 하나의 프로모터는 (NF-κB)1-IL2 프로모터 변이체(서열 번호: 30)를 포함한다. 일부 구현예에서, 적어도 하나의 프로모터는 (NF-κB)3-IL2 프로모터 변이체(서열 번호: 31)를 포함한다. 일부 구현예에서, 적어도 하나의 프로모터는 (NF-κB)6-IL2 프로모터 변이체(서열 번호: 32)를 포함한다. 일 구현예에서, 적어도 하나의 프로모터는 활성화된 T-세포(NFAT) 반응 성분-IL2 프로모터 변이체의 1X 핵 인자(서열 번호: 33)를 포함한다. 다른 구현예에서, 적어도 하나의 프로모터는 3X NFAT 반응 성분(서열 번호: 34 내지 서열 번호: 35)을 포함한다. 여전히 다른 구현예에서, 적어도 하나의 프로모터는 6X NFAT 반응 성분-IL2 프로모터 변이체(서열 번호: 36 내지 서열 번호: 39)를 포함한다. 일부 구현예에서, 적어도 하나의 프로모터는 사람 EF1A1 프로모터 변이체(서열 번호: 40 및 서열 번호: 41)를 포함한다. 일부 구현예에서, 적어도 하나의 프로모터는 사람 EF1A1 프로모터 및 인핸서(서열 번호: 42)를 포함한다. 일부 구현예에서, 적어도 하나의 프로모터는 사람 UBC 프로모터(서열 번호: 43)를 포함한다. 일부 구현예에서, 적어도 하나의 프로모터는 6개 부위 GAL4-유도성의 인접 인자 결합 성분(proximal factor binding element)(PFB)을 포함한다. 일부 구현예에서, 적어도 하나의 프로모터는 합성의 최소 프로모터 1(유도성 프로모터)(서열 번호: 44)를 포함한다.
본원에 기술된 IL-12 발현의 리간드 유도성 제어를 위한 유전자 스위치의 사용은 예를 들면 조절된 발현을 허용하고 치료학적 지표를 증진시킴으로써 IL-12의 안전성 프로파일(safety profile)을 증진시킬 수 있다. 그러나, 유전자 스위치(들)을 사용하여 IL-12의 리간드 용량 의존성 발현을 위한 조건은 활성인자 리간드(예컨대, 벨레디멕스)의 존재 또는 부재이다. 특정의 구현예에서, IL-12 발현의 유도를 위한 추가의 조건적 제어가 고려된다. T 세포 활성화된 특이적인 프로모터의 제어 하에서 유전자 스위치 구성성분이 제공된다. 이는 유전자 스위치의 제어 하에서 이식유전자(들)의 벨레디멕스 조절된 발현에 필수적인 유전자 스위치 구성성분의 조건적 발현(예컨대, T 세포 활성화)을 야기한다. 일부 구현예에서, 이는 발레디멕스가 존재하고 T 세포가 활성화되는 경우 종양 특이적인 T 세포에 의해 IL-12 또는 IL-15와 같은 사이토킨의 우선적 발현을 야기한다. 이는 증가된 국재화된 수준의 유전자 스위치 제어된 이식유전자 발현을 이끌 수 있다.
예를 들면, 유전자 스위치 구성성분의 T 세포 활성화된 특이적인 발현은 활성화된 T-세포의 핵 인자(NFAT) 반응 구성성분(들)을 포함하는 프로모터에 의해 제어될 수 있다. NFAT 전사 인자는 효과기 T-세포 상태의 주요 조절인자이다. NFAT는 고갈(exhaustion)을 전진적으로 유도시키는 초기 전사 체크포인트(early transcriptional checkpoint)이다. NFAT는 TCR 자극 후 T 세포 내에서 신속하게 활성화되며 적절한 공-자극 신호전달에 의해 유도된 AP-1과 함께 단백질 복합체를 형성하며 효과기 유전자 및 T-세포 기능을 조절한다. NFAT 반응 성분(들)은 다른 최소의 프로모터 서열(예컨대, IL2 최소 프로모터)과 융합되어 T 세포 활성화에 대한 반응시 이식유전자의 발현을 유도시킬 수 있다.
활성화 특이적인 프로모터의 다른 예는 인터류킨-2 (IL2) 프로모터 및 프로그램화된 사멸(Programmed Death)(PD)-1(CD279) 프로모터를 포함하나, 이에 한정되지 않는다. 유전자 스위치 구성성분은 또한 전염증성 신호전달 경로의 NF-κB와 같은 다른 핵 인자에 대한 결합 부위를 최소 프로모터 서열(예컨대, IL2)에 융합시킴으로써 면역 세포 활성화시 조건적으로 발현시킬 수 있다.
특정의 구현예에서, 프로모터는: IL-2 코어 프로모터, IL-2 최소의 프로모터, IL-2 인핸서 및 프로모터 변이체, (NF-κB)1-IL2 프로모터 변이체, (NF-κB)3-IL2 프로모터 변이체, (NF-κB)6-IL2 프로모터 변이체, 1X NFAT 반응 성분-IL2 프로모터 변이체, 3X NFAT 반응 성분-IL2 프로모터 변이체, 6X NFAT 반응 성분-IL2 프로모터 변이체, 사람 EEF1A1 프로모터 변이체, 사람 EEF1A1 프로모터 및 인핸서, 사람 UBC 프로모터 및 합성의 최소의 프로모터 1 중 임의의 하나 이상일 수 있다. 특정 구현예에서, 프로모터 뉴클레오타이드는 서열 번호: 26 내지 서열 번호: 44를 포함할 수 있다.
유전자 스위치
유전자 스위치 폴리펩타이드, 리간드-유도성 유전자 스위치 폴리펩타이드를 암호화하는 폴리뉴클레오타이드, 및 이러한 폴리펩타이드 및/또는 폴리뉴클레오타이드를 혼입시키는 방법 및 시스템이 본원에 제공된다. 특정의 양태에서, 본 개시내용은 이종 유전자 발현의 유도성 제어를 위한 유전자 스위치 시스템을 암호화하는 하나 이상의 폴리뉴클레오타이드를 포함하는 폴리뉴클레오타이드에 관한 것이며, 여기서 이종 유전자 발현은 상기 유전자 스위치 시스템에 의해 조절되고, 상기 이종 유전자는 본원에 개시된 하나 이상의 면역 반응-유도성 B형 간염 바이러스(HBV) 폴리펩타이드를 포함하는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드를 포함한다.
용어 "유전자 스위치"는 프로모터와 관련된 반응 성분, 및 예를 들면, 하나 이상의 리간드의 존재 하에서, 이의 내부로 반응 성분 및 프로모터가 혼입된 유전자의 발현을 조절하는 EcR 기반 시스템의 조합을 지칭한다. 강력하게 조절된 유도성 유전자 발현 시스템 또는 유전자 스위치는 다양한 적용, 예를 들면, 유전자 치료요법, 세포 내에서 단백질의 대규모 생산, 세포 기반한 고 처리량(high throughput) 스크리닝 검정(cell based high throughput screening assay), 기능성 유전학 및 형질도입 식물 및 동물에서 특성의 조절에 유용하다. 이러한 유도성 유전자 발현 시스템은 리간드 유도성 이종 유전자 발현 시스템을 포함할 수 있다.
EcR-기반 유전자 스위치의 초기 버젼(early version)은 드로소필라 멜라노가스터(Drosophila melanogaster) EcR(DmEcR) 및 무스 무스쿨루스(Mus musculus) RXR(MmRXR) 폴리펩타이드를 사용하였으며 이러한 수용체는 스테로이드, 포나스테론A의 존재하에서 포유동물 세포주 및 형질도입 마우스에서 이러한 리포터(reporter) 유전자를 전사활성화시킴(transactivate)이 밝혀졌다(Christopherson et al., Proc. Natl. Acad. Sci. USA 89(14):6314-18 (1992); No et al., Proc. Natl. Acad. Sci. USA 93(8):3346-51 (1996)). 이후에, 문헌: Suhr et al. (Proc. Natl. Acad. Sci. USA 95(14):7999-8004 (1998))은 비-스테로이드성 엑다이손 효능제, 테부페노지드가 외인성 이종이량체 파트너의 부재하에서 봄빅스 모리(Bombyx mori) EcR(BmEcR)을 통해 포유동물 세포 내 리포터 유전자의 고수준의 전사활성화를 유도하였음을 나타내었다.
국제 특허원 제PCT/US97/05330호(제WO 97/38117호) 및 제PCT/US99/08381호(제WO99/58155호)는 외인성 유전자의 발현을 조절하는 방법을 개시하고 있으며, 여기서 외인성 유전자 및 엑다이손 반응 성분을 포함하는 DNA 작제물은 이에 대한 리간드의 존재하에서, 및 임의로 사일런트 파트너(silent partner)로서 작용할 수 있는 수용체의 존재하에서 엔다이손 반응 성분에 결합하여 유전자 발현을 유도하는 엑다이손 수용체를 포함하는 제2의 DNA 작제물에 의해 활성화된다. 이러한 예에서, 엑다이손 수용체는 드로소필라 멜라노가스터(Drosophila melanogaster)로부터 단리되었다. 전형적으로, 이러한 시스템은 최적의 활성화를 제공하기 위하여, 사일런트 파트너, 바람직하게는 레티노이드 X 수용체(RXR)의 존재를 필요로 한다. 포유동물 세포에서, 곤충 엑다이손 수용체(EcR)는 포유동물 레티노이드 X 수용체(RXR)와 이종이량체화될 수 있으며, 이에 의해, 리간드 의존적 방식으로 표적 유전자 또는 이종 유전자의 발현을 조절하는데 사용된다. 국제 특허원 제PCT/US98/14215호(제WO 99/02683호)는 누에 나방(silk moth) 봄빅스 모리로부터 단리된 엑다이손 수용체가 외인성 이량체 파트너에 대한 필요성없이 포유동물 시스템에서 기능성임을 개시하고 있다.
미국 특허 제6,265,173호는 수용체의 스테로이드/갑상선 상과(superfamily)의 다양한 구성원이 유전자 발현 시스템에서 사용하기 위한 USP의 이량체화 도메인을 적어도 포함하는 드로소필라 멜라노가스터 울트라스피라클 수용체(ultraspiracle receptor)(USP) 또는 이의 단편과 조합될 수 있음을 기술하고 있다. 미국 특허 제5,880,333호는 식물에서 사용된 드로소필라 멜라노가스터 EcR 및 울트라스피라클(USP) 이종이량체 시스템을 개시하고 있으며 여기서 전사활성화 도메인 및 DNA 결합 도메인은 2개의 상이한 하이브리드 단백질 상에 위치한다. 각각의 이러한 경우에서, 전사활성화 도메인 및 DNA 결합 도메인(국제 특허원 제PCT/US98/14215호에서와 같은 천연의 EcR로서 또는 국제 특허원 제PCT/US97/05330호에서와 같은 변형된 EcR로서)은 단일 분자 내로 혼입되었고 다른 이종이량체 파트너, USP 또는 RXR은 이의 천연 상태로 사용되었다.
국제 특허원 제PCT/US01/0905호는 엑다이손 수용체-기반 유도성 유전자 발현 시스템을 개시하고 있으며, 여기서 전사활성화 및 DNA 결합 도메인은 이들을 2개의 상이한 단백질 상에 위치시킴으로써 서로로부터 분리되어 리간드의 부재하에서 크게 감소된 배경 활성 및 리간드의 존재하에서 배경보다 유의적으로 증가된 활성을 야기한다. 이러한 2-하이브리드 시스템(two-hybrid system)은 특허원 제PCT/US97/05330호 및 제PCT/US98/14215호에 개시된 2개의 시스템과 비교하여 유도성 유전자 발현 조절 시스템을 유의적으로 개선시킨다. 2-하이브리드 시스템은 전사 활성화 도메인이 DNA 결합 도메인에 대해 보다 유리한 위치가 되도록 함으로써 DNA 결합 도메인이 유전자 상의 DNA 결합 부위에 결합하는 경우, 전사활성화 도메인이 프로모터를 보다 효과적으로 활성화시키도록 하는 상호작용 단백질의 쌍의 능력을 발휘하는 것으로 여겨진다(참고: 예를 들면, 미국 특허 제5,283,173호). 2-하이브리드 유전자 발현 시스템은 2개의 유전자 발현 카세트; 핵 수용체 폴리펩타이드에 융합된 DNA 결합 도메인을 암호화하는 제1의 유전자 발현 카세트, 및 상이한 핵 수용체 폴리펩타이드에 융합된 전사활성화 도메인을 암호화하는 제2의 유전자 발현 카세트를 포함한다. 리간드의 존재하에서, 제1의 폴리펩타이드와 제2의 폴리펩타이드의 상호작용을 촉진함으로써 이에 의해 DNA 결합 도메인 및 전사활성화 도메인의 이량체화를 생성하는 구조적 변화가 유도되는 것으로 여겨진다. DNA 결합 및 전사활성화 도메인은 2개의 상이한 분자 상에 잔류하므로, 리간드의 부재하에서 배경 활성은 크게 감소된다.
또 다른 놀라운 발견은 2-하이브리드 시스템의 특정 변형이 또한 스테로이드 리간드, 예를 들면, 포나스테론 A("PonA") 또는 무리스테론 A("MurA")과 비교하는 경우, 비-스테로이드성 리간드, 예를 들면, 디아실하이드라진에 대해 개선된 민감성을 제공할 수 있다는 것이었다. 즉, 스테로이드와 비교하는 경우, 비-스테로이드성 리간드는 보다 낮은 리간드 농도에서 더 높은 전사 활성을 제공하였다. 또한, 2-하이브리드 시스템은 변형되지 않은 RXR이 스위칭 파트너로서 사용되는 경우 발생할 수 있는 RXR의 과발현으로 인하여 일부 부작용을 피한다. 바람직한 2-하이브리드 시스템에서, EcR 또는 RXR의 천연의 DNA 결합 및 전사활성화 도메인은 제거되며 그 결과, 이러한 하이브리드 분자는 세포 내에 존재하는 다른 스테로이드 호르몬 수용체와 상호작용하는 기회가 거의 없으며, 따라서 감소된 부작용을 야기한다.
엑다이손 수용체(EcR)는 핵 수용체 상과의 구성원이며 아과(subfamily) 1, 그룹 H(본원에서 "그룹 H 핵 수용체"로 지칭됨)으로 분류된다. 각각의 그룹의 구성원은 E(리간드 결합) 도메인 내에서 40 내지 60% 아미노산 동일성을 공유한다(Laudet et al., A Unified Nomenclature System for the Nuclear Receptor Subfamily, 1999; Cell 97: 161-163). 엑다이손 수용체 외에도, 이러한 핵 수용체 아과 1, 그룹 H의 다른 구성원은: 편재된 수용체(ubiquitous receptor)(UR), 오르판 수용체(Orphan receptor) 1(OR-1), 스테로이드 호므론 핵 수용체 1(NER-1), RXR 상호작용 단백질-15(RIP-15), 간 x 수용체 β(LXRβ), 스테로이드 호르몬 수용체 유사 단백질(RLD-1), 간 x 수용체(LXR), 간 x 수용체 α(LXRα), 파르네소이드 x 수용체(FXR), 수용체 상호작용 단백질 14(RIP-14), 및 파르네솔 수용체(HRR-1)를 포함한다.
일부 경우에, 유도성 프로모터는 소 분자 리간드-유도성의 2개의 폴리펩타이드 엑다이손 수용체-기반 유전자 스위치, 예를 들면, Intrexon Corporation의 RHEOSWITCH® 유전자 스위치일 수 있다. 일부 경우에, 유전자 스위치는 제PCT/US2001/009050호(제WO 2001/070816호); 미국 특허 제7,091,038호; 제7,776,587호; 제7,807,417호; 제8,202,718호; 제PCT/US2001/030608호(제WO 2002/029075호); 미국 특허 제8,105,825호; 제8,168,426호; 제PCT/1J52002/005235호(제WO 2002/066613호); 미국 특허원 제10/468,200호(미국 공보 제20120167239호); 제PCT/US2002/005706호(제WO 2002/066614호); 미국 특허 제7,531,326호; 제8,236,556호; 제8,598,409호; 제PCT/U52002/005090호(제WO 2002/066612호); 미국 특허 제8,715,959호(미국 공보 제20060100416호); 제PCT/US2002/005234호(제WO 2003/027266호); 미국 특허 제7,601,508호; 제7,829,676호; 제7,919,269호; 제8,030,067호; 제PCT/U52002/005708호(제WO 2002/066615호); 미국 특허원 제10/468,192호(미국 공보 제20110212528호); 제PCT/US2002/005026호(제WO 2003/027289호); 미국 특허 제7,563,879호; 제8,021,878호; 제8,497,093호; 제PCT/US2005/015089호(제WO 2005/108617호); 미국 특허 제7,935,510호; 제8,076,454호; 제PCT/U52008/011270호(제WO 2009/045370호); 미국 특허원 제12/241,018호(미국 공보 제20090136465호); 제PCT/US2008/011563호(제WO 2009/048560호); 미국 특허원 제12/247,738호(미국 공보 제20090123441호); 제PCT/US2009/005510호(제WO 2010/042189호); 미국 특허원 제13/123,129호(미국 공보 제20110268766호); 제PCT/US2011/029682호(제WO 2011/119773호); 미국 특허원 제13/636,473호(미국 공보 제20130195800호); 제PCT/US2012/027515호(제WO 2012/122025호); 및 미국 특허 제9,402,919호(이들 각각은 이의 전문이 참고로 포함된다)에 기술된 임의의 시스템에 기술되어 있지만, 이에 한정되지 않는 엑다이손-기반 수용체 구성성분으로부터 선택될 수 있다.
본원에 개시된 유전자-스위치 폴리펩타이드를 발현하는 폴리뉴클레오타이드를 포함하는, 숙주 세포 내에서 이종 유전자 및 인터류킨의 발현을 조절하기 위한 시스템이 제공된다.
일부 구현예에서 제1의 폴리펩타이드를 암호화하는 제1의 폴리뉴클레오타이드를 포함하는 제1의 유전자 발현 카세트; 제2의 폴리펩타이드를 암호화하는 제2의 폴리뉴클레오타이드를 포함하는 제2의 유전자 발현 카세트; 및 리간드를 포함하는, 숙주 세포 내에서 이종 유전자 및 사이토킨의 발현을 조절하기 위한 시스템이 제공되며; 상기 제1 및 제2의 폴리펩타이드는: (i) 전사활성화 도메인; (ii) DNA-결합 도메인; 및 (iii) 리간드 결합 도메인; (iv) 상기 이종 유전자; 및 (vi) 상기 사이토킨 중 하나 이상을 포함함으로써 상기 숙주 세포가 상기 제1의 유전자 발현 카세트 및 상기 제2의 유전자 발현 카세트와 상기 리간드의 존재하에서 접촉하는 경우, 상기 이종 유전자 및 상기 사이토킨이 상기 숙주 세포 내에서 발현되도록 한다. 일부 경우에, 이종 유전자는 본원에 기술된 항원 결합 폴리펩타이드를 포함한다. 일부 경우에, 사이토킨은 적어도 하나의 케모킨, 인터페론, 인터류킨, 림포킨, 종양 괴사 인자, 또는 이의 변이체 또는 조합을 포함한다. 일부 경우에, 사이토킨은 인터류킨이다. 일부 경우에 인터류킨은 IL12, IL2, IL15, IL21, 및 이의 기능성 변이체 및 단편 중 적어도 하나이다. 일부 구현예에서, 사이토킨은 막 결합되거나 분비될 수 있다. 다른 구현예에서, 사이토킨은 세포내일 수 있다. 인터류킨은 막 결합된 IL-15(mbIL-15) 또는 IL-15 및 IL-15Rα의 융합체를 포함할 수 있다. 일부 구현예에서, mbIL-15은 본원에 기술된 변형된 효과기 세포와 공-발현될 수 있는 막-결합된 키메라 IL-15이다. 일부 구현예에서, mbIL-15는 전장 IL-15Rα, 이의 기능성 단편 또는 변이체와 프레임내(in frame)에 융합된 전장 IL-15(예컨대, 천연의 IL-15 폴리펩타이드) 또는 이의 단편 또는 변이체를 포함한다. 일부 경우에, IL-15는 링커를 통해 IL-15Rα에 간접적으로 연결된다. 일부 예에서, mbIL-15는 문헌: Hurton et al., "Tethered IL-15 augments antitumor activity and promotes a stem-cell memory subset in tumor-specific T cells", Proc. Natl. Acad. Sci. USA 113(48):E7788-E7797 (2016)에 기술된 바와 같다. 다른 양태에서, 인터류킨은 IL-12를 포함할 수 있다. 일부 구현예에서, IL-12은 단일 쇄 IL-12(scIL-12), 프로테아제 민감성 IL-12, 탈안정화된 IL-12, 막 결합된 IL-12, 삽입된(intercalated) IL-12이다. 일부 예에서, IL-12 변이체는 제WO2015/095249호, 제WO2016/048903호, 제WO2017/062953호에 기술된 바와 같으며, 이들 모두는 이의 전문이 참고로 포함된다.
유전자 스우치 폴리펩타이드를 암호화하는 폴리뉴클레오타이드가 본원에 제공되며, 상기 유전자 스위치 폴리펩타이드는: a) 핵 수용체 리간드 결합 도메인에 융합된 DNA-결합 도메인을 포함하는 제1의 유전자 스위치 폴리펩타이드, 및 b) 핵 수용체 리간드 결합 도메인에 융합된 전사활성화 도메인을 포함하는 제2의 유전자 스위치 폴리펩타이드를 포함하고, 여기서 제1의 유전자 스위치 폴리펩타이드 및 제2의 유전자 스위치 폴리펩타이드는 링커에 의해 연결되어 있다. 일부 경우에, 링커는 본원에 기술된 링커, 예를 들면, GSG 링커, 푸린링크(furinlink), 2A 링커, 예를 들면, F/T2A, T2A, p2A, GSG-p2A, 이의 변이체 및 유도체일 수 있다. 다른 예에서, 링커는 IRES일 수 있다.
일부 경우에, DNA 결합 도메인(DBD)은 본원에 기술된 DBD, 예를 들면, GAL4(GAL4 DBD), LexA DBD, 전사 인자 DBD, 스테로이드/갑상선 호르몬 핵 수용체 상과(superfamily) 구성원 DBD, 세균성 LacZ DBD, 및 효모 DBD 중 적어도 하나를 포함한다. 전사활성화 도메인은 본원에 기술된 전사활성화 도메인, 예를 들면, VP16 전사활성화 도메인, p53 전사활성화 도메인 및 B42 산성 활성인자 전사활성화 도메인을 포함할 수 있다. 핵 수용체 리간드 결합 도메인은 엑다이손 수용체(EcR), 편재하는 수용체, 오르판 수용체 1, NER-1, 스테로이드 호르몬 핵 수용체 1, 레티노이드 X 수용체 상호작용 단백질-15, 간 X 수용체 β, 스테로이드 호르몬 수용체 유사 단백질, 간 X 수용체, 간 X 수용체 α, 파르네소이드 X 수용체, 수용체 상호작용 단백질 14, 및 파메솔 수용체 중 적어도 하나를 포함할 수 있다.
일부 경우에, 폴리펩타이드 링커 또는 리보소옴-스키핑 서열(ribosome-skipping sequence)에 의해 연결된 유전자 스위치 폴리펩타이드는 리간드-유도성 유전자 스위치와 비교하여 유전자 발현의 개선된 용량-의존성 리간드-유도성 제어를 나타내고 여기서 유전자 스위치 폴리펩타이드는 비-암호화 서열, 예를 들면, IRES에 의해 연결된다. 일부 경우에, 2A 링커에 의해 연결된 유전자 스위치 폴리펩타이드는 유전자 스위치와 비교하여 이종 유전자 발현의 개선된 용량-의존성 리간드-유도성 제어를 나타낼 수 있으며 상기 유전자 스위치 폴리펩타이드는 IRES에 의해 분리된다.
일부 구현예에서, 유전자 스위치는 VP16 전사활성화 도메인을 포함한다. 일 구현예에서, 유전자 스위치는 엑다이손 수용체(EcR), 편재하는 수용체, 오르판 수용체 1, NER-1, 스테로이드 호르몬 핵 수용체 1, 레티노이드 X 수용체 상호작용 단백질-15, 간 X 수용체 β, 스테로이드 호르몬 수용체 유사 단백질, 간 X 수용체, 간 X 수용체 α, 파르네소이드 X 수용체, 수용체 상호작용 단백질 14, 및 파메솔 수용체 중 적어도 하나를 포함한다. 다른 구현예에서, 유전자 스위치의 DNA-결합 도메인(DBD)은 GAL4(GAL4 DBD), LexA DBD, 전사 인자 DBD, 스테로이드/갑상선 호르몬 핵 수용체 상과 구성원 DBD, 세균성 LacZ DBD, 및 효모 DBD 중 적어도 하나를 포함한다. 여전히 다른 경우에, 유전자 스위치는 울트라스피라클(ultraspiracle) 단백질(USP), 레티노이드 수용체 X(RXR), 이의 기능성 단편 및 변이체 중 적어도 하나를 추가로 포함하며 상기 기능성 단편 및 변이체는 EcR에 결합할 수 있다.
본원에 기술된 바와 같은 폴리펩타이드 및 폴리뉴클레오타이드는 가공된 세포 내에서 발현될 수 있다. 본원에서 가공된 세포는 이의 천연 또는 내인성 상태로부터 변형된 세포이다. 가공된 세포의 예는 예를 들면, 본원에 기술된 유전자 스위치 폴리펩타이드, 목적한 유전자(GOI), 세포 태그(tag), 이종 유전자, 및 임의의 다른 폴리펩타이드 및 폴리뉴클레오타이드를 암호화하도록 변형된(폴리뉴클레오타이드의 세포 내로의 형질감염에 의함) 본원에 기술된 세포이다.
리간드
일부 구현예에서, 유도성 유전자 스위치 조절에 사용된 리간드는 다음 중 어느 것으로부터 선택될 수 있지만, 이에 한정되지 않는다: N-[(1R)-1-(1,1-디메틸에틸)부틸]-N'-(2-에틸-3-메톡시벤조일)-3,5-디메틸벤조하이드라지드(또한 벨레디멕스로 지칭됨), (2S,3R,5R,9R,10R,13R,14S,17R)-17-[(2S,3R)-3,6-디하이드록시-6-메틸헵탄-2-일]-2,3,14-트리하이드록시-10,13-디메틸- 2,3,4,5,9,11,12,15,16,17-데카하이드로-1H-사이클로펜타[a]페난트렌-6-온; N'-(3,5-디메틸벤조일)-N'-[(3R)-2,2-디메틸-3-헥사닐]-2-에틸-3-메톡시벤조하이드라지드; 5-메틸-2,3-디하이드로-벤조[1,4]디옥신-6-카복실산 N'-(3,5-디메틸-벤조일)-N'-(1-에틸-2,2-디메틸-프로필)-하이드라지드; 5-메틸-2,3-디하이드로-벤조[1,4]디옥신-6-카복실산 N'-(3,5-디메톡시-4-메틸-벤조일)-N'-(1-에틸-2,2-디메틸-프로필)-하이드라지드; 5-메틸-2,3-디하이드로-벤조[1,4]디옥신-6-카복실산 N'-(1-3급-부틸-부틸)-N'-(3,5-디메틸-벤조일)-하이드라지드; 5-메틸-2,3-디하이드로-벤조[1,4]디옥신-6-카복실산 N'-(1-3급-부틸-부틸)-N'-(3,5-디메톡시-4-메틸-벤조일)-하이드라지드; 5-에틸-2,3-디하이드로-벤조[1,4]디옥신-6-카복실산 N'-(3,5-디메틸-벤조일)-N'-(1-에틸-2,2-디메틸-프로필)-하이드라지드; 5-에틸-2,3-디하이드로-벤조[1,4]디옥신-6-카복실산 N'-(3,5-디메톡시-4-메틸-벤조일)-N'-(1-에틸-2,2-디메틸-프로필)-하이드라지드; 5-에틸-2,3-디하이드로-벤조[1,4]디옥신-6-카복실산 N'-(1-3급-부틸-부틸)-N'-(3,5-디메틸-벤조일)-하이드라지드; 5-에틸-2,3-디하이드로-벤조[1,4]디옥신-6-카복실산 N'-(1-3급-부틸-부틸)-N'-(3,5-디메톡시-4-메틸-벤조일)-하이드라지드; 3,5-디메틸-벤조산 N-(1-에틸-2,2-디메틸-프로필)-N'-(3-메톡시-2-메틸-벤조일)-하이드라지드; 3,5-디메톡시-4-메틸-벤조산 N-(1-에틸-2,2-디메틸-프로필)-N'-(3-메톡시-2-메틸-벤조일)-하이드라지드; 3,5-디메틸-벤조산 N-(1-3급-부틸-부틸)-N'-(3-메톡시-2-메틸-벤조일)-하이드라지드; 3,5-디메톡시-4-메틸-벤조산 N-(1-3급-부틸-부틸)-N'-(3-메톡시-2-메틸-벤조일)-하이드라지드; 3,5-디메틸-벤조산 N-(1-에틸-2,2-디메틸-프로필)-N'-(2-에틸-3-메톡시-벤조일)-하이드라지드; 3,5-디메톡시-4-메틸-벤조산 N-(1-에틸-2,2-디메틸-프로필)-N'-(2-에틸-3-메톡시-벤조일)-하이드라지드; 3,5-디메틸-벤조산 N-(1-3급-부틸-부틸)-N'-(2-에틸-3-메톡시-벤조일)-하이드라지드; 3,5-디메톡시-4-메틸-벤조산 N-(1-3급-부틸-부틸)-N'-(2-에틸-3-메톡시-벤조일)-하이드라지드; 2-메톡시-니코틴산 N-(1-3급-부틸-펜틸)-N'-(4-에틸-벤조일)-하이드라지드; 3,5-디메틸-벤조산 N-(2,2-디메틸-1-페닐-프로필)-N'-(4-에틸-벤조일)-하이드라지드; 3,5-디메틸-벤조산 N-(1-3급-부틸-펜틸)-N'-(3-메톡시-2-메틸-벤조일)-하이드라지드; 및 3,5-디메톡시-4-메틸-벤조산 N-(1-3급-부틸-펜틸)-N'-(3-메톡시-2-메틸-벤조일)-하이드라지드.
일부 경우에, 엑다이손 수용체-기반 유도성 유전자 스위치의 용량-조절된 대조군에 대해 사용된 리간드는 엑다이스테로이드, 예를 들면, 엑다이손, 20-하이드록시엑다이손, 포나스테론 A, 무리스테론 A 등, 9-시스-레티노산, 레티노산의 합성 유사체, N,N'-디아실하이드라진, 예를 들면, 미국 특허 제6,013,836호; 제5,117,057호; 제5,530,028호; 및 제5,378,726호 및 미국 특허공개공보 제2005/0209283호 및 제2006/0020146호에 기술된 것; 미국 특허 공개공보, 제2004/0171651호에 기술된 바와 같은 옥사디아졸린; 디벤조일알킬 시아노하이드라진, 예를 들면, 유럽 특허원 제461,809호에 개시된 것; N-알킬-N,N'-디아로일하이드라진, 예를 들면, 미국 특허 제5,225,443호에 개시된 것; N-아실-N-알킬카보닐하이드라진, 예를 들면, 유럽 특허원 제234,994호에 기술된 것; N-아로일-N-알킬-N'-아로일하이드라진, 예를 들면, 미국 특허 제4,985,461호에 기술된 것; 아르니도케톤, 예를 들면, 미국 특허 공개공보 제2004/0049037호에 기술된 것(상기 문헌 각각은 본원에 참고로 포함된다) 및 다른 유사한 물질, 예를 들면, 3,5-디-3급-부틸-4-하이드록시-N-이소부틸-벤즈아미드, 8-O-아세틸하르파기드, 옥시스테롤, 22(R) 하이드록시콜레스테롤, 24(S) 하이드록시콜레스테롤, 25-에폭시콜레스테롤, T0901317, 5-알파-6-알파-에폭시콜레스테롤-3-설페이트(ECHS), 7-케토콜레스테롤-3-설페이트, 프라메솔, 담즙산, 1,1-비포스포네이트 에스테르, 청소년 호르몬 III 등 중 어느 것으로부터 선택될 수 있으나, 이에 한정되지 않는다. 본 개시내용에 유용한 디아실하이드라진 리간드의 예는 RG-115819(3,5-디메틸-벤조산 N-(1-에틸-2,2-디메틸-프로필)-N'-(2-메틸-3-메톡시-벤조일)-하이드라지드-), RG-115932 ((R)-3,5-디메틸-벤조산 N-(1-3급-부틸-부틸)-N'-(2-에틸-3-메톡시-벤조일)-하이드라지드), 및 RG-115830(3,5-디메틸-벤조산 N-(1-3급-부틸-부틸)-N'-(2-에틸-3-메톡시-벤조일)-하이드라지드)를 포함한다. 예컨대, 미국 특허원 제12/155,111호, 및 PCT 특허원 제PCT/US2008/006757호를 참고하며, 이들 둘 다는 이의 전문이 본원에 참고로 포함된다.
사이토킨
특정의 구현예에서, 본원에 제공된 HBV 백신 항원은 다른 사이토킨과 함께 동시-전달되고/되거나 동시-발현(예컨대, 동일한 HBV 항원 전달 벡터의 부분으로서 또는 별도의 벡터를 통해)될 수 있다. 유전자-스위치 폴리펩타이드 및 사이토킨을 암호화하는 폴리뉴클레오타이드, 또는 이의 변이체 또는 유도체, 및 이를 혼입하는 방법 및 시스템이 본원에 제공된다. 사이토킨은 세포 신호전달에 관여된 약 5 내지 20 kDa 사이의 소 분자의 범주이다. 일부 예에서, 사이토킨은 케모킨, 인터페론, 인터류킨, 콜로니-자극 인자 또는 종양 괴사 인자를 포함한다. 일부 구현예에서, 케모킨은 세포의 이주를 안내하는 화학유인물질(chemoattractant)로서 역활을 하며, 4개의 아과로 분류된다: CXC, CC, CX3C, 및 XC. 예시적인 케모킨은 CC 아과: CCL1, CCL2(MCP-1), CCL3, CCL4, CCL5(RANTES), CCL6, CCL7, CCL8, CCL9(또는 CCL10), CCL11, CCL12, CCL13, CCL14, CCL15, CCL16, CCL17, CCL18, CCL19, CCL20, CCL21, CCL22, CCL23, CCL24, CCL25, CCL26, CCL27, 및 CCL28; CXC 아과: CXCL1, CXCL2, CXCL3, CXCL4, CXCL5, CXCL6, CXCL7, CXCL8, CXCL9, CXCL10, CXCL11, CXCL12, CXCL13, CXCL14, CXCL15, CXCL16, 및 CXCL17; XC 아과: XCL1 및 XCL2; 및 CX3C 아과 CX3CL1로부터의 케모킨을 포함한다.
특정의 구현예에서, 본원에 제공된 HBV 백신 항원은 다른 인터페론과 함께 동시-전달되고/되거나 동시-발현(예컨대, 동일한 HBV 항원 전달 벡터의 부분으로서 또는 별도의 벡터를 통해)될 수 있다. 인터페론(IFN)은 인터페론 제I형(예컨대, IFN-α, IFN-β, IFN-ε, IFN-κ, 및 IFN-ω), 인터페론 제II형(예컨대, IFN-γ), 및 인터페론 제III형을 포함한다. 일부 구현예에서, IFN-α은 약 13개의 서브형, 예를 들면, IFNA1, IFNA2, IFNA4, IFNA5, IFNA6, IFNA7, IFNA8, IFNA10, IFNA13, IFNA14, IFNA16, IFNA17, 및 IFNA21로 추가로 분류된다.
특정의 구현예에서, 본원에 제공된 HBV 백신 항원은 다른 인터류킨과 함께 동시-전달되고/되거나 동시-발현(예컨대, 동일한 HBV 항원 전달 벡터의 부분으로서 또는 별도의 벡터를 통해)될 수 있다. 인터류킨은 백혈구 또는 백혈구 세포에 의해 발현되며 이들은 T 및 B 림프구 및 조혈 세포의 발달 및 분화를 촉진시킨다. 예시적인 인터류킨은 IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8 (CXCL8), IL-9, IL-10, IL-11, IL-12, IL-13, IL-14, IL-15, IL-16, IL-17, IL-18, IL-19, IL-20, IL-21, IL-22, IL-23, IL-24, IL-25, IL-26, IL-27, IL-28, IL-29, IL-30, IL-31, IL-32, IL-33, IL-35, 및 IL-36을 포함한다. 일부 구현예에서, 인터류킨은 IL-2, IL-12, IL-15, IL-21 또는 IL-15 및 IL-15α의 융합체이다.
일부 양태에서, 인터류킨은 IL-12를 포함할 수 있다. 일부 구현예에서, IL-12은 단일 쇄 IL-12(scIL-12), 프로테아제 민감성 IL-12, 탈안정화된 IL-12, 막 결합된 IL-12, 삽입된(intercalated) IL-12이다. 일부 예에서, IL-12 변이체는 제WO2015/095249호, 제WO2016/048903호, 제WO2017/062953호에 기술된 바와 같고, 이들 모두는 이의 전문이 참고로 포함된다.
일부 구현예에서, 인터류킨은 mbIL-15를 포함한다. 일부 구현예에서, mbIL-15는 본원에 기술된 변형된 효과기 세포와 함께 동시-발현될 수 있는 막-결합된 키메라 IL-15이다. 일부 구현예에서, mbIL-15는 전장 IL-15Rα, 이의 기능성 단편 또는 변이체와 프레임 내에서 융합된, 전장 IL-15(예컨대, 천연의 IL-15 폴리펩타이드) 또는 이의 단편 또는 변이체를 포함한다. 일부 경우에, IL-15는 링커를 통해 IL-15Rα에 간접적으로 연결된다. 일부 예에서, mbIL-15는 문헌: Hurton et al., 2016에 기술된 바와 같다.
특정의 구현예에서, 본원에 제공된 HBV 백신 항원은 다른 종양 괴사 인자와 함께 동시-전달되고/되거나 동시-발현(예컨대, 동일한 HBV 항원 전달 벡터의 부분으로서 또는 별도의 벡터를 통해)될 수 있다. 종양 괴사 인자(TNF)는 세포자멸사를 조절하는 사이토킨의 그룹이다. 일부 예에서, TNF 과 내에 약 19개의 구성원, 예를 들면, TNFα, 림프독소-알파(LT-알파), 림프독소-베타(LT-베타), T 세포 항원 gp39(CD40L), CD27L, CD30L, FASL, 4-1BBL, OX40L, 및 TNF-관련된 세포자멸사 유도성 리간드(TRAIL)가 존재하나, 이에 한정되지 않는다.
특정의 구현예에서, 본원에 제공된 HBV 백신 항원은 다른 콜로니 자극 인자와 함께 동시-전달되고/되거나 동시-발현(예컨대, 동일한 HBV 항원 전달 벡터의 부분으로서 또는 별도의 벡터를 통해)될 수 있다. 콜로니-자극 인자(CSF)는 조혈 줄기 세포의 표면에서 수용체 단백질과 상호작용하는 분비된 당단백질이며, 이는 후속적으로 세포 증식 및 특수한 유형의 혈액 세포로의 분화를 조절한다. 일부 예에서, CSF는 대식구 콜로니-자극 인자, 과립구 대식구 콜로니-자극 인자(GM-CSF), 과립구 콜로니-자극 인자(G-CSF) 또는 프로메가포이에틴을 포함한다.
일부 구현예에서, 사이토킨은 막-결합된 사이토킨은 막-결합된 사이토킨이며, 이는 본원에 기술된 키메라 항원 수용체와 함께 동시-발현된다. 일부 구현예에서, 본원에 기술된 하나 이상의 방법은 사이토킨의 투여를 추가로 포함한다. 일부 예에서, 사이토킨은 케모킨, 인터페론, 인터류킨, 콜로니-자극 인자 또는 종양 괴사 인자를 포함한다. 일부 예에서, 본원에 기술된 하나 이상의 방법은 케모킨, 인터페론, 인터류킨, 콜로니-자극 인자 또는 종양 괴사 인자로부터 선택된 사이토킨의 투여를 추가로 포함한다. 일부 예에서, 본원에 기술된 하나 이상의 방법은 IL2, IL7, IL12, IL15, IL-15 및 IL-15Rα의 융합체, IL21, IFNγ 또는 TNF-α로부터 선택된 사이토킨의 투여를 추가로 포함한다.
인터류킨-12
특수한 구현예에서, 본원에 제공된 HBV 백신 항원은 인터류킨-12와 함께 동시-전달되고/되거나 동시-발현(예컨대, 동일한 HBV 항원 전달 벡터의 부분으로서 또는 별도의 벡터를 통해)될 수 있다. 인터류킨 12(IL-12)는 항원성 자극에 대한 반응시 수지 세포, 대식구, 호중구, 및 사람 B-림프아구성 세포(NC-37)에 의해 천연적으로 생산된 인터류킨이다. IL-12는 4개의 알파 나선의 다발로 구성된다. 이는 2개의 별도의 유전자, IL-12A(p35) 및 IL-12B(p40)에 의해 암호화된 이종이량체성 사이토킨이다. 활성 이종이량체(p70으로서 지칭됨), 및 p40의 동종이량체는 단백질 합성 후 형성된다. IL-12는 면역계의 주요 조절인자(master regulator)이다. IL-12는 NK 세포 및 T 세포를 활성화시킴으로써 면역 반응을 촉진한다(도 18).
HBV 재조합 백신을 포함하는 조성물, 키트, 및 시스템 및 이를 제조하는 방법이 본원에 제공된다. 본 개시내용은 다중-결실된 고릴라 아데노벡터(GC46)(서열 번호: 61 내지 63) 내에 작제된 HBV 항원 설계(HBV 설계 1 내지 5)를 제공한다. 또한 유전자 스위치 폴리펩타이드 및 IL-12를 암호화하는 폴리뉴클레오타이드 또는 이의 변이체 또는 유도체, 및 이를 혼입시키는 방법 및 시스템이 본원에 제공된다(도 18).
링커
또한 본원에 기술된 폴리뉴클레오타이드 및 폴리펩타이드의 발현 및 기능성을 촉진시키기 위한 링커를 포함하는 작제물이 개시된다. 일부 구현예에서, 폴리뉴클레오타이드 링커는 본원에 기술된 폴리뉴클레오타이드 내에서 이용될 수 있다. 폴리뉴클레오타이드 링커는 본원에 기술된 폴리뉴클레오타이드를 포함하는 벡터와 적합성인(compatible) 말단 구조를 생성하기 위해 첨가될 수 있는 목적한 제한 부위를 함유하는 DNA의 이중-가닥 분절일 수 있다. 일부 경우에, 폴리뉴클레오타이드 링커는 본원에 기술된 폴리뉴클레오타이드를 포함하는 벡터를 변형시키는데 유용할 수 있다. 예를 들면, 폴리뉴클레오타이드 링커를 포함하는 벡터 변형은 다중 클로닝 부위 내의 변화, 또는 폴리-히스티딘 테일(tail)의 첨가일 수 있다. 폴리뉴클레오타이드 링커를 또한 사용하여 응집성 끝 말단(cohesive end termini)을 지닌 제한 효소로 절단된 벡터내로 클로닝하기 위해 평활 삽입부 DNA의 말단을 조정할 수 있다. 폴리뉴클레오타이드 링커의 사용은 벡터 내로의 평활 연결보다 더 효율적일 수 있으며 벡터로부터의 삽입체를 하부 적용(downstream application)으로 방출시키는 방법을 제공할 수 있다. 일부 경우에 삽입체는 치료학적 적용에 유용한 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 서열일 수 있다. 일부 경우에, 링커는 절단가능한 링커일 수 있다.
폴리뉴클레오타이드 링커는 올리고머일 수 있다. 폴리뉴클레오타이드 링커는 DNA 이중 가닥, 단일 가닥, 또는 이의 조합일 수 있다. 일부 경우에, 링커는 RNA일 수 있다. 폴리뉴클레오타이드 링커는 일부 경우에 T4 리가제에 의해 본원에 기술된 폴리뉴클레오타이드를 포함하는 벡터 내로 연결시킬 수 있다. 연결을 촉진시키기 위해 과도한 폴리뉴클레오타이드 링커를 삽입체 및 벡터를 포함하는 조성물에 가할 수 있다. 일부 경우에, 삽입체 및 벡터는 링커가 도입되기 전에 예비-처리된다. 예를 들면, 메틸라제를 사용한 예비-처리는 삽입체 DNA의 원치않는 절단을 방지할 수 있다.
특정의 구현예에서, 본원에 기술된 폴리뉴클레오타이드에 의해 암호화된 2개 이상의 폴리펩타이드는 개재되는(intervening) 링커 폴리펩타이드를 암호화하는 개재되는 서열에 의해 분리될 수 있다. 여기서 폴리뉴클레오타이드에 의해 암호화된 2개 이상의 폴리펩타이드를 분리하는 아미노산 서열을 지칭하는 용어 "개재되는 링커 폴리펩타이드"는 본원에 개시된 폴리펩타이드 작제물 내에 임의로 포함되어 막관통 도메인(transmembrane domain)을 세포 표면 폴리펩타이드(예컨대, 천연의 폴리펩타이드의 트렁케이트된(truncated) 변이체를 포함함)에 연결시키는 아미노산의 서열을 지칭하는 용어 "펩타이드 링커"와는 구별된다. 특정의 경우에, 개재되는 링커는 절단에 민감한 개재되는 링커 폴리펩타이드이다. 일부 구현예에서, 링커는 절단가능한 또는 리보소옴 스키핑(ribosome skipping) 링커이다. 일부 구현예에서, 절단가능한 링커 또는 리보소옴 스키핑 링커 서열은 2A, GSG-2A, GSG 링커, SGSG 링커, 푸린링크(furinlink) 변이체 및 이의 유도체로 이루어진 그룹으로부터 선택된다. 일부 구현예에서, 2A 링커는 p2A 링커, T2A 링커, F2A 링커 또는 E2A 링커이다. 일부 구현예에서, 목적한 폴리펩타이드는 절단에 민감한 개재되는 링커 폴리펩타이드에 의해 연결된 융합 단백질로서 발현된다. 특정의 구현예에서, 절단에 민감한 개재되는 링커 폴리펩타이드(들)은 다음 중 임의의 하나 이상일 수 있다: F/T2A, T2A, p2A, 2A, GSG-p2A, GSG 링커, 및 푸린링크 변이체. 2017년 5월 18일자로 공개된 제PCT/US2016/061668호(제WO2017083750호)가 본원에 참고로 포함된다. 특정의 구현예에서, 링커 폴리펩타이드는 하기 표에 개시된 것을 포함한다:
[표 2]
일부 구현예에서, 개재되는 링커 폴리펩타이드는 Whitlow 링커(서열 번호: 64), GSG 링커(서열 번호: 66), SGSG 링커(서열 번호: 67), (G4S)3 링커(서열 번호: 68), 푸린 절단 부위/Furlink1(서열 번호: 69), Fmdv 링커(서열 번호: 70), 쏘세아 아시그나 바이러스(Thosea asigna virus) 2A 영역(T2A)(서열 번호: 71), 푸린-GSG-T2A(서열 번호: 72), 푸린-SGSG-T2A(서열 번호: 73), 돼지 테스쵸바이러스(porcine teschovirus)-1 2A 영역(P2A)(서열 번호: 74), GSG-P2A(서열 번호: 75), 말 비염 A 바이러스 2A 영역(E2A)(서열 번호: 76), 또는 수족구 질환 바이러스(foot-and-mouth disease virus) 2A 영역(F2A)(서열 번호: 78)의 아미노산과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 99%, 99.5% 또는 100% 동일성을 갖는 아미노산 서열을 포함한다(표 2). 일부 경우에, 개재되는 링커 폴리펩타이드는 링커의 아미노산 서열(서열 번호: 65, 79, 80)과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 99%, 99.5% 또는 100% 동일성을 갖는 아미노산 서열을 포함한다. 일부 경우에, 바이러스 2A 서열이 사용될 수 있다. 2A 성분은 5 내지 100개 염기 쌍을 갖는 IRES보다 더 짧을 수 있다. 일부 경우에, 2A 서열은 길이가 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 또는 100개 뉴클레오타이드일 수 있다. 2A 연결된 유전자는 하나의 단일 개방 판독 프레임 내에서 발현될 수 있으며, "자가-절단"은 2A 폴리펩타이드의 C-말단에서, 마지막 2개의 아미노산, GP 사이에 동시-해독적으로 발생하여, 동일한 양의 동시-발현된 단백질을 생성할 수 있다.
바이러스 2A 서열은 약 20개 아미노산일 수 있다. 일부 경우에, 바이러스 2A 서열은 컨센수스 모티프 Asp-Val/Ile-Glu-X-Asn-Pro-Gly-Pro를 함유할 수 있다. 컨센수스 모티프 서열은 동시-해독적으로 작용할 수 있다. 예를 들면, 글리신과 프롤린 잔기 사이의 정상적인 펩타이드 결합의 형성은 방지될 수 있으며, 이는 신생의(nascent) 폴리펩타이드의 리보소옴 스키핑(ribosomal skipping) 및 절단을 생성할 수 있다. 이러한 효과는 등몰 수준에서 다수의 유전자를 생산할 수 있다.
2A 펩타이드는 리보소옴-스키핑 메카니즘(ribosome-skipping mechanism)을 통해 다수의 단백질을 단일 개방 판독 프레임 내에서 개개의 폴리펩타이드 내로 후속적으로 절단될 수 있는 폴리펩타이드로 해독하도록 할 수 있다(Funston et al., J. Gen. Virol. 89(Pt 2):389-96 (2008)). 일부 구현예에서, 2A 서열은: F/T2A, T2A, p2A, 2A, T2A, E2A, F2A, 및 BmCPV2A, BmIFV2A, 및 이의 임의의 조합을 포함할 수 있다.
일부 경우에, 벡터는 IRES 서열 및 2A 링커 서열을 포함할 수 있다. 다른 경우에, 2A 펩타이드에 연결된 다수의 유전자의 발현은 2A 펩타이드의 앞쪽의 스페이서 서열(GSG)에 의해 촉진될 수 있다. 일부 경우에, 작제물은 스페이서, 링커, 어댑터(adaptor), 프로모터, 또는 이의 조합물을 조합시킬 수 있다. 예를 들면, 링커는 스페이서(SGSG 또는 GSG 또는 Whitlow 링커) 및 푸린 링커(R-A-K-R) 절단 부위를 상이한 2A 펩타이드와 함께 가질 수 있다. 스페이서는 I-Ceui일 수 있다. 일부 경우에, 링커는 가공될 수 있다. 예를 들면, 링커는 소수성과 같은 화학적 특성을 포함하도록 설계할 수 있다. 일부 경우에, 적어도 2개의 링커 서열은 동일한 단백질을 생산할 수 있다. 다른 경우에, 다중 링커를 벡터 내에 사용할 수 있다. 예를 들면, 목적한 유전자는 적어도 2개의 링커로 분리될 수 있다.
특정의 구현예에서, 본원에 기술된 폴리뉴클레오타이드에 의해 암호화된 2개 이상의 폴리펩타이드는 링커 폴리펩타이드를 암호화하는 개재되는 서열에 의해 분리될 수 있다. 특정의 경우에, 링커는 절단에 민감한 링커이다. 일부 구현예에서, 목적한 폴리펩타이드는 절단에 민감한 링커 폴리펩타이드에 의해 연결된 융합 단백질로서 발현된다. 특정의 구현예에서, 절단에 민감한 링커 폴리펩타이드(들)는: Furinlink, fmdv, p2a, GSG-p2a, 및/또는 후술된 fp2a 중 임의의 1개 또는 2개일 수 있다. 일부 경우에, 링커는 APVKQGSG(서열 번호: 96)이다.
특정의 경우에, 링커 폴리펩타이드는 아미노산 서열 "RAKR"(서열 번호: 86)을 포함할 수 있다. 특정의 경우에, 푸린 링커 폴리펩타이드는 "CGTGCAAAGCGT"(서열 번호: 69) 또는 "AGAGCTAAGAGG"(서열 번호: 130)를 포함하는 폴리뉴클레오타이드 서열 폴리뉴클레오타이드 서열에 의해 암호화될 수 있다.
일부 구현예에서, 링커는 본원에 기술된 폴리뉴클레오타이드 내에서 이용될 수 있다. 링커는 가요성(flexible) 링커, 강직성(rigid) 링커, 생체내에서 절단가능한 링커, 또는 이의 임의의 조합일 수 있다. 일부 경우에, 링커는 함께 기능성 도메인을 함께 연결시키거나(가요성 및 강직성 링커에서와 같이) 또는 생체내 절단가능한 링커에서와 같이 생체 내에서 유리된 기능성 도메인을 방출할 수 있다.
링커는 생물학적 활성을 증진시키고, 발현 수율을 증가시키며, 목적한 약력학적 프로파일을 달성할 수 있다. 링커는 또한 하이드라존, 펩타이드, 디설파이드, 또는 티오에스테르를 포함할 수 있다.
일부 경우에, 본원에 기술된 링커 서열은 가요성 링커일 수 있다. 가요성 링커는 결합된 도메인이 특정 정도의 운동 또는 상호작용을 필요로 하는 경우 적용될 수 있다. 가요성 링커는 작거나, 비-극성(예컨대, Gly) 또는 극성(예컨대, Ser 또는 Thr) 아미노산으로 구성될 수 있다. 가요성 링커는 Gly 및 Ser 잔기의 스트레치(stretch)로 주로 이루어진 서열을 가질 수 있다("GS" 링커). 가요성 링커의 예는 (Gly-Gly-Gly-Gly-Ser)n(서열 번호: 85)의 서열을 가질 수 있다. 카피 수 "n"을 조절함으로써, 이러한 예시적인 GS 링커의 길이를 최적화하여 기능성 도메인의 적절한 분리를 달성하거나 필수적인 도메인간 상호작용을 유지시킬 수 있다. GS 링커 외에도, 다른 가요성 링커를 재조합 융합 단백질에 대해 이용할 수 있다. 일부 경우에, 가요성 링커는 또한 작거나 극성인 아미노산, 예를 들면, Gly 및 Ser 속에서 풍부할 수 있지만, 추가의 아미노산, 예를 들면, Thr 및 Ala를 함유함으로써 가요성(flexibility)을 유지할 수 있다. 다른 경우에, 극성 아미노산, 예를 들면, Lys 및 Glu를 사용하여 용해도를 증진시킬 수 있다.
본원에 기술된 링커 서열에 포함된 가요성 링커는 작거나 극성인 아미노산, 예를 들면, Gly 및 Ser 속에서 풍부하여 양호한 가요성 및 용해도를 제공할 수 있다. 가요성 링커는 특정의 운동 또는 상호작용이 융합체 단백질 도메인에 대해 요구되는 경우 적합한 선택이 될 수 있다. 또한, 가요성 링커가 강직성 구조를 가질 수 없지만, 이들은 수동적 링커로서 제공되어 기능성 도메인 사이의 거리를 유지할 수 있다. 가요성 링커의 길이는 적절한 폴딩(folding)을 허용하고 융합 단백질의 최적의 생물학적 활성을 달성하도록 조절될 수 있다.
본원에 기술된 링커는 일부 경우에 강직성 링커를 추가로 포함할 수 있다. 강직성 링커는 폴리펩타이드의 도메인들 사이에 고정된 거리를 유지하기 위해 이용될 수 있다. 강직성 링커의 예는: 몇가지 예를 들면, 알파 나선-형성 링커, Pro가 풍부한 서열, (XP)n, X-Pro 골격, A(EAAAK)nA(n = 2 내지 5)일 수 있다. 강직성 링커는 α-나선 구조를 채택하거나 일부 경우에 다중 Pro 잔기를 함유함으로써 비교적 강직성 구조를 나타낼 수 있다.
본원에 기술된 링커는 일부 경우에 절단가능할 수 있다. 다른 경우에, 링커는 절단가능하지 않다. 절단가능하지 않은 링커는 함께 기능성 도메인을 공유결합으로 결합시켜 생체내 공정 또는 생체외 공정 전체에서 하나의 분자로서 작용할 수 있다. 링커는 또한 생체 내에서 절단가능할 수 있다. 절단가능한 링커는 생체내에서 자유 기능성 도메인을 방출하도록 도입될 수 있다. 절단가능한 링커는 몇가지 예를 들면, 환원 시약, 프로테아제의 존재에 의해 절단될 수 있다. 예를 들면, 이황화물 결합의 환원을 이용하여 절단가능한 링커를 생산할 수 있다. 이황화물 링커의 경우에, 티올, 예를 들면, 글루타티온과의 이황화물 교환을 통한 절단 현상은 절단을 생산할 수 있다. 다른 경우에, 재조합 융합 단백질 내에서 링커의 생체내 절단은 또한 생리학적 상태(예컨대, 암 또는 염증) 하에서, 특수한 세포 또는 조직 내에서 생체내 발현될 수 있거나, 특정의 세포 구획 내에서 구속될 수 있는 프로테아제에 의해 수행될 수 있다. 일부 경우에, 절단가능한 링커는 표적화된 절단을 허용할 수 있다. 예를 들면, 많은 프로테아제의 특이성은 구속된 구획 내에서 링커의 보다 느린 절단을 제공할 수 있다. 절단가능한 링커는 또한 하이드라존, 펩타이드, 이황화물, 또는 티오에스테르를 포함할 수 있다. 예를 들면, 하이드라존은 혈청 안전성을 부여할 수 있다. 다른 경우에, 하이드라존은 산성 구획 내에서 절단을 허용할 수 있다. 산성 구획은 pH 7 이하를 가질 수 있다. 링커는 또한 티오에테르를 포함할 수 있다. 티오에테르는 비환원성일 수 있다. 티오에테르는 세포내 단백질분해성 분해를 위해 설계될 수 있다.
특정의 구현예에서, fmdv 링커 폴리펩타이드는 서열 번호: 87에 대해 적어도 약 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% 또는 100% 동일할 수 있는 서열을 포함한다. 특정의 구현예에서, fmdv 링커 폴리펩타이드는 2개 이상의 융합 단백질을 연결하는 단일 벡터 내에 암호화된 링커 중 하나 이상이다. 특정의 경우에, fmdv 링커 폴리펩타이드는 폴리뉴클레오타이드 개방 판독 프레임(ORF) 핵산 서열에 의해 암호화될 수 있다. 일부 경우에, ORF 암호화 fmdv는 서열 번호: 70의 서열을 포함하거나 이로 이루어진다. 특정의 구현예에서, fmdv를 암호화하는 폴리뉴클레오타이드는 서열 번호: 70에 대해 적어도 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% 또는 100% 동일하다.
특정의 경우에, 링커 폴리펩타이드는 "p2a" 링커일 수 있다. 특정의 구현예에서, p2a 폴리펩타이드는 서열 번호: 91에 대해 약 적어도 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% 또는 100% 동일할 수 있는 서열을 포함할 수 있다. 특정의 구현예에서, p2a 링커 폴리펩타이드는 2개 이상의 융합 단백질을 연결하는 단일 벡터 내에 암호화된 링커 중 하나 이상일 수 있다. 일부 경우에, p2a 링커 폴리펩타이드는 폴리뉴클레오타이드 개방 판독 프레임(ORF) 핵산 서열에 의해 암호화될 수 있다. 특정의 구현예에서, ORF 암호화 p2a는 서열 번호: 74의 서열을 포함하거나 이로 이루어진다. 특정의 경우에, p2a를 암호화하는 폴리뉴클레오타이드는 서열 번호: 74이거나 이와 약 적어도 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% 또는 100% 동일할 수 있다.
일부 경우에, 링커 폴리펩타이드는 "GSG-p2a" 링커일 수 있다. 특정의 구현예에서, GSG-p2a 링커 폴리펩타이드는 서열 번호: 92에 대해 약 적어도 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% 또는 100% 동일할 수 있는 서열을 포함할 수 있다. 특정의 구현예에서, GSG-p2a 링커 폴리펩타이드는 2개 이상의 융합 단백질을 연결하는 단일 벡터 내에 암호화된 링커 중 하나 이상일 수 있다. 일부 경우에, GSG-p2a 링커 폴리펩타이드는 폴리뉴클레오타이드 개방-판독 프레임(ORF) 핵산 서열에 의해 암호화될 수 있다. GSG p2a를 암호화하는 ORF는 서열 번호: 75의 서열을 포함할 수 있다. 일부 경우에, GSG-p2a를 암호화하는 폴리뉴클레오타이드는 서열 번호: 75일 수 있거나 이와 적어도 약 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% 또는 100% 동일할 수 있다.
링커 폴리펩타이드는 본원에서 제공한 바와 같은 "fp2a" 링커일 수 있다. 특정의 구현예에서, fp2a 링커 폴리펩타이드는 서열 번호: 95에 대해 적어도 약 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% 또는 100% 동일할 수 있는 서열을 포함할 수 있다. 특정의 경우에, fp2a 링커 폴리펩타이드는 2개 이상의 융합 단백질을 연결하는 단일 벡터 내에 암호화된 링커 중 하나 이상일 수 있다. 일부 경우에, fp2a 링커 폴리펩타이드는 폴리뉴클레오타이드 개방 판독 프레임(ORF) 핵산 서열에 의해 암호화될 수 있다. 특정의 구현예에서, fp2a 링커를 암호화하는 폴리뉴클레오타이드는 서열 번호: 78일 수 있거나 이에 대해 적어도 약 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% 또는 100% 동일할 수 있다.
일부 경우에, 링커는 가공될 수 있다. 예를 들면, 링커는 소수성과 같은 화학적 특성을 포함하도록 설계될 수 있다. 일부 경우에, 적어도 2개의 링커 서열은 동일한 단백질을 생산할 수 있다. 서열은 서열 번호 82, 96 또는 97의 폴리펩타이드 서열일 수 있거나 이와 약 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% , 또는 100% 동일할 수 있다. 다른 경우에, 다중 링커를 벡터 내에서 사용할 수 있다. 예를 들면, 목적한 유전자, 및 본원에 기술된 하나 이상의 유전자 스위치 폴리펩타이드 서열은 적어도 2개의 링커로 분리될 수 있다. 일부 경우에, 유전자는 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이하의 링커에 의해 분리될 수 있다.
링커는 가공된 링커일 수 있다. 링커를 설계하는 방법은 계산적일 수 있다. 일부 경우에, 계산 방법은 그래프 기술을 포함할 수 있다. 계산 방법을 사용하여 데이타베이스로부터 유도된 3차원 펩타이드 구조의 라이브러리로부터 적합한 펩타이드에 대해 조사할 수 있다. 예를 들면, 브룩해븐 단백질 데이타 뱅크(Brookhaven Protein Data Bank)(PDB)를 사용하여 링커의 선택된 아미노산들 사이의 공간에서 거리를 잴 수 있다.
일부 구현예는 푸린 폴리펩타이드 및 2A 폴리펩타이드를 포함하는 폴리펩타이드 작제물을 암호화하는 폴리뉴클레오타이드이며, 여기서 푸린 폴리펩타이드 및 2A 폴리펩타이드는 적어도 3개의 소수성 아미노산을 포함하는 폴리펩타이드 링커에 의해 연결되어 있다. 일부 경우에, 적어도 3개의 소수성 아미노산이 글리신(Gly)(G), 알라닌(Ala)(A), 발린(Val)(V), 루이신(Leu)(L), 이소루이신(Ile)(I), 프롤린(Pro)(P), 페닐알라닌(Phe)(F), 메티오닌(Met)(M), 트립토판(Trp)(W)으로 이루어진 목록으로부터 선택된다. 일부 경우에, 폴리펩타이드 링커는 또한 하나 이상의 GS 링커 서열, 예를 들면, (GS)n, (SG)n, (GSG)n, 및 (SGSG)n를 포함할 수 있으며, 여기서 n은 0 내지 15 중 임의의 수일 수 있다.
제1의 기능성 폴리펩타이드 및 제2의 기능성 폴리펩타이드를 포함하는 상기 폴리펩타이드 작제물을 암호화하는 폴리뉴클레오타이드를 제공하는 단계로서, 상기 제1의 기능성 폴리펩타이드 및 제2의 기능성 폴리펩타이드가 서열 APVKQ에 대해 적어도 60% 상동성을 지닌 서열을 포함하는 링커 폴리펩타이드에 의해 연결되어 있는 단계; 및 상기 폴리뉴클레오타이드를 숙주 세포 내에서 발현시키는 단계로서, 상기 발현시키는 것은 서열 APVKQ에 대해 적어도 60% 상동성을 지닌 서열을 포함하는 링커 폴리펩타이드를 가지지 않은 상응하는 폴리펩타이드 작제물과 비교하여 폴리펩타이드 작제물의 증진된 발현을 야기하는 단계를 포함하여, 폴리펩타이드 작제물의 증진된 발현을 수득하는 방법이 제공된다.
IRES 성분
본원에 기술된 폴리뉴클레오타이드 및 폴리펩타이드의 발현 및 기능성을 촉진시키기 위한 IRES 성분을 포함하는 작제물이 또한 본원에 개시되어 있다. 본원에 사용된 바와 같은 용어 "내부 리보소옴 도입 부위(internal ribosome entry site)(IRES)"는 내부 리보소옴 도입 부위를 의미하는 것으로 의도될 수 있다. IRES 서열을 포함하는 벡터에서, 제1의 유전자는 이의 자체의 5'-UTR을 사용한 메카니즘인, cap-의존성인, 리보소옴 스캐닝에 의해 해독될 수 있는 반면, 후속적인 유전자의 해독은 cap-독립된 방식으로 IRES에 리보소옴을 직접 보충(recruitment)시켜 달성할 수 있다. IRES 서열은 진핵세포 리보소옴이 5' 캡핑된 말단에 대한 결합없이 결합하여 해독되도록 할 수 있다. IRES 서열은 하나의 전사체로부터의 다중 유전자의 발현을 허용할 수 있다(Mountford and Smith 1995).
본원에 사용된 바와 같은 용어 "CAP" 또는 "cap"은 진핵세포 mRNA의 5' 말단에 대해 변형된 뉴클레오타이드, 일반적으로 3' 내지 5'로 연결된 7-메틸 구아노신(7meG-ppp-G)을 지칭하며, 이는 mRNA로부터 단백질의 발현 동안 정상적인 해독 개시 경로에서 필요 성분으로서 제공된다.
특정의 경우에, IRES 영역은 피코르나바이러스, 뇌척수 심근염 바이러스(encephalomyocarditis virus), C형 간염 바이러스 IRES 서열로부터 유래할 수 있다. 다른 경우에, IRES 서열은 뇌척수 심근염 바이러스로부터 유래할 수 있다. 본원에 사용된 바와 같은 용어 "EMCV" 또는 "뇌척수 심근염 바이러스"는 피코르나비리다에(Picornaviridae) 과의 속의 뇌척수 심근염 바이러스 종의 임의의 구성원 단리체 또는 균주를 지칭한다. 예에는: EMCV-R(Rueckert) 균주 바이러스, Columbia-SK 바이러스가 있다. 일부 경우에, 세포 IRES 성분, 예를 들면, 진핵세포성 개시 인자 4G, 면역글로불린 중쇄 결합 단백질, c-myc 광-종양유전자, 혈관 내피 성장 인자, 섬유아세포 성장 인자-1 IRES, 또는 이의 임의의 조합 또는 변형을 사용할 수 있다. 일부 경우에, 세포 IRES는 바이러스 IRES와 비교하는 경우 증가된 유전자 발현을 가질 수 있다.
바이러스, 이의 세포 또는 조합의 IRES 서열을 벡터 내에서 이용할 수 있다. IRES는 뇌척수 심근염(EMCV) 또는 폴리오바이러스(poliovirus)(PV)로부터 유래할 수 있다. 일부 경우에, IRES 성분은 폴리오바이러스(PV), 뇌척수염 바이러스(EMCV), 수족구병 바이러스(FMDV), 돼지 테스쵸바이러스(Porcine teschovirus)-1(PTV-1), 아이키바이러스(Aichivirus)(AiV), 세네카 밸리 바이러스(Seneca Valley virus)(SVV), C형 간염 바이러스(HCV), 전통적인 돼지 열 바이러스(Classical swine fever virus)(CSFV), 사람 면역결핍성 바이러스-2(HIV-2), 사람 면역결핍성 바이러스-1(HIV-1), 몰로니 쥐 백혈병 바이러스(Moloney murine leukemia virus)(MoMLV), 고양이 면역결핍성 바이러스(Feline immunodeficiency virus)(FIV), 마우스 유방 종양 바이러스(Mouse mammary tumor virus)(MMTV), 잠복성 사람 사이토메갈로바이러스(Human cytomegalovirus latency)(pUL138), 엡슈타인-바르 바이러스(Epstein-Barr virus)(EBNA-1), 헤르페스 바이러스 마렉 질환(Herpes virus Marek's disease)(MDV RLORF9), SV40 폴리스스트론성(polycistronic) 19S(SV40 19S), 로팔로시퓸 파디 바이러스(Rhopalosiphum padi virus)(RhPV), 크릭켓 파랄라이시스 바이러스(Cricket paralysis virus)(CrPV), 엑트로피스 오블리쿠아 피코르나-유사 바이러스(Ectropis obliqua picorna-like virus)(EoPV), 플라우티아 스탈리 장 바이러스(Plautia stali intestine virus)(PSIV), 트리아토마 바이러스(Triatoma virus)(TrV), 벌 마비 디시스트로바이러스(Bee paralysis dicistrovirus)(IAPV, KBV), 블랙 커란트 리버젼 바이러스(Black currant reversion virus)(BRV), 펠라르고늄 플라워 브레이크 바이러스(Pelargonium flower break virus)(PFBV), 히비스커스 클로로틱 링스폿 바이러스(Hibiscus chlorotic ringspot virus)(HCRSV), 크루시퍼-감염 토바모바이러스(Crucifer-infecting tobamovirus)(CrTMV), 감자 잎 마름병 폴레로바이러스(Potato leaf roll polerovirus)(PLRV), 담배 에치 바이러스(Tobacco etch virus)(TEV), 기아르디아바이러스(Giardiavirus)(GLV), 레이슈마니아(Leishmania) RNA 바이러스-1(LRV-1), 및 이의 조합 또는 변형으로 이루어진 그룹으로부터 선택된다. 일부 경우에, IRES는 Apaf-1, XIAP, HIAP2/c-IAP1, DAP5, Bcl-2, c-myc, CAT-1, INR, 분화(Differentiation) LEF-1, PDGF2, HIF-1a, VEGF, FGF2, BiP, BAG-1, CIRP, p53, SHMT1, PITSLREp58, CDK1, Rpr, hid, hsp70, grim, skl, 안테나페디아(Antennapedia), dFoxO, dInR, Adh-Adhr, HSP101, ADH, URE-2,GPR1, NCE102, YMR181a, MSN1, BOI1, FLO8, GIC1, 및 이의 임의의 조합 또는 변형으로 이루어진 그룹으로부터 선택된다. IRES 성분이 2개의 개방 판독 프레임(ORF) 사이에 포함되는 경우, 해독의 개시는 처음 ORF 내에서 캐노니칼(canonical) 5'-m7GpppN 캡(cap)-의존성 메카니즘 및 IRES 성분의 하부의 제2의 ORF 내에서 cap-독립된 메카니즘에 의해 발생할 수 있다.
일부 경우에, 유전자는 내부 리보소옴 도입 부위(IRES)에 의해 연결될 수 있다. IRES는 다중 유전자의 동시 발현을 허용할 수 있다. 예를 들면, IRES 서열은 단일의 mRNA 전사체로부터 다중 단백질의 생산을 허용할 수 있다. 리보소옴은 IRES에 5'-cap 독립된 방식으로 결합하여 해독을 개시할 수 있다.
일부 경우에, IRES 서열은 약 500개의 염기쌍일 수 있다. IRES 서열은 300개 염기쌍 내지 1000개 염기쌍일 수 있다. 예를 들면, IRES는 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 또는 1000개 염기쌍일 수 있다.
일부 경우에, IRES 서열을 포함하는 벡터 내에서 하부 유전자의 발현은 감소될 수 있다. 예를 들면, IRES 서열 이후의 유전자는 IRES 서열 앞의 유전자보다 감소된 발현을 가질 수 있다. 감소된 발현은 선행 유전자보다 1% 내지 99% 감소일 수 있다.
발현을 조절하는 방법
일 구현예에서, 가공된 세포 내에서 이종 유전자의 발현을 조절하는 방법이 제공된다. 이종 유전자 발현의 리간드 유도성 제어를 위해 유전자 스위치 폴리펩타이드를 암호화하는 폴리뉴클레오타이드, 항원 결합 폴리펩타이드 및 이종 유전자가 제공된다. 일부 예에서, 폴리뉴클레오타이드는 도 1 내지 16 중 임의의 하나에 나타낸 바와 같은 하나 이상의 유전자 발현 카세트에서와 같다. 다른 예에서, 폴리뉴클레오타이드는 바이러스 또는 비-바이러스 벡터를 통해 가공된 세포 내로 도입된다. 바이러스 벡터는 렌티바이러스 벡터, 레트로바이러스 벡터 또는 아데노바이러스 벡터를 포함할 수 있다. 비-바이러스 벡터는 슬리핑 뷰티 트랜스포존을 포함할 수 있다. 다른 예에서, 폴리뉴클레오타이드는 레콤비나제 또는 유전자 편집 기술을 통해 가공된 세포 내로 도입된다. 리콤비나제의 예는 본원에 기술된 바와 같은 세린 리콤비나제이다. 유전자 편집 기술의 예는 CRISPR 또는 아르고너트 시스템(Argonaute system)을 포함할 수 있다. 여기서 "CRISPR 시스템"의 "CRISPR 유전자 편집 시스템"은 게놈의 특수한 영역에 대해 DNA 서열내 변화를 표적화하기 위한 임의의 RNA-보조된 Cas 단백질-매개된 공정을 지칭한다. 여기서 "아르고너트 유전자 편집 시스템(Argonaute gene editing system)"은 게놈의 특이적 영역에 대해 DNA 서열내 변화를 표적화하기 위한 임의의 단일 가닥 DNA 인도된 아르고너트 엔도뉴클레아제-매개된 공정을 지칭한다.
약제학적 조성물 및 투여량
본 개시내용은 본원에 기술된 아데노바이러스 또는 아데노바이러스 벡터 및 이에 대한 담체(예컨대, 약제학적으로 허용되는 담체)를 포함하는 조성물을 제공한다. 조성물은 바람직하게는 생리학적으로 허용되는(예컨대, 약제학적으로 허용되는) 조성물이며, 이는 담체, 바람직하게는 생리학적으로(예컨대, 약제학적으로) 허용되는 담체, 및 아데노바이러스 또는 아데노바이러스 벡터를 포함한다. 임의의 적합한 담체가 본 개시내용의 맥락에서 사용될 수 있으며, 이러한 담체는 당해 분야에 잘 공지되어 있다. 담체의 선택은 부분적으로는 조성물의 특수한 사용(예컨대, 동물에 대한 투여) 및 조성물을 투여하는데 사용된 특수한 방법에 의해 결정될 것이다. 이상적으로, 복제-결함성 아데노바이러스 벡터의 맥락에서, 약제학적 조성물은 바람직하게는 복제-가능한 아데노바이러스를 포함하지 않는다. 약제학적 조성물은 임의로 멸균성일 수 있다.
적합한 조성물은 수성 및 비-수성의 등장성 멸균 용액을 포함하며, 이는 항산화제, 완충제, 및 세균정지제, 및 현탁제, 가용화제, 증점제, 안정화제, 및 보존제를 포함할 수 있는 수성 및 비-수성 멸균 현탁액을 포함한다. 조성물은 단위-투여량 또는 다중-투여량 밀봉 용기, 예를 들면, 앰플(ampule) 및 바이알(vial) 속에 존재할 수 있으며, 사용 직전에 멸균 액체 담체, 예를 들면, 물의 첨가 만을 필요로 하는 냉동-건조된(동결건조된) 상태로 저장될 수 있다. 일시적인 용액 및 현탁액을 멸균 분말, 과립, 및 정제로부터 제조할 수 있다. 바람직하게는, 담체는 완충된 염수 용액이다. 보다 바람직하게는, 아데노바이러스 또는 아데노바이러스 벡터는 투여 전에 손상으로부터 아데노바이러스 또는 아데노바이러스 벡터를 보호하도록 제형화된 조성물의 부분이다. 예를 들면, 조성물은 아데노바이러스 또는 아데노바이러스 벡터를 제조하거나, 저장하거나,투여하기 위해 사용된 장치, 예를 들면, 유리제품, 주사기, 또는 침(needle)에서 아데노바이러스 또는 아데노바이러스 벡터의 손실을 감소시키기 위해 제형화될 수 있다. 조성물은 아데노바이러스 또는 아데노바이러스 벡터의 광 민감성 및/또는 온도 민감성을 감소시키기 위해 제형화될 수 있다. 이러한 목적으로, 조성물은 바람직하게는 약제학적으로 허용되는 액체 담체, 예를 들면, 위에서 기술한 것들, 및 폴리소르베이트 80, L-아르기닌, 폴리비닐피롤리돈, 트레할로즈, 및 이의 조합으로 이루어진 그룹으로부터 선택된 안정화제를 포함한다. 이러한 조성물의 사용은 아데노바이러스 또는 아데노바이러스 벡터의 저장 수명을 연장시키고, 이의 투여를 촉진시킬 것이다. 아데노바이러스 또는 아데노바이러스 벡터-함유 조성물에 대한 제형은 예를 들면, 미국 특허 제6,225,289호, 미국 특허 제6,514,943호, 및 국제 특허원 공보 제WO 2000/034444호에 추가로 기술되어 있다.
조성물은 또한 형질도입 효율을 향상시키기 위해 제형화될 수 있다. 또한, 당해 분야의 통상의 기술자는 아데노바이러스 또는 아데노바이러스 벡터가 다른 치료학적 또는 생물학적 활성제와의 조성물 속에 존재할 수 있음을 인식할 것이다. 예를 들면, 염증을 제어하는 인자, 예를 들면, 이부프로펜 또는 스테로이드는 아데노바이러스 또는 아데노바이러스 벡터의 생체내 투여와 관련된 팽윤 및 염증을 감소시키는 조성물의 부분일 수 있다. 아데노바이러스 또는 아데노바이러스 벡터를 사용하여 항원-암호화 핵산 서열을 숙주에게 전달하는 경우, 면역계 자극인자 또는 보조제, 예컨대, 인터류킨, 지질다당류, 또는 이중-가닥 RNA를 투여하여 항원에 대한 임의의 면역 반응을 향상시키거나 변형시킬 수 있다. 항생제, 즉, 살미생물제 및 살진균제가 기존의 감염을 치료하고/하거나 미래의 감염, 예를 들면, 유전자 전달 과정과 관련된 감염의 위험을 감소시키기 위해 존재할 수 있다.
일부 구현예에서, 대상체에서 투여하기 위한 본원에 개시된 폴리뉴클레오타이드 또는 폴리펩타이드를 포함하는 조성물이 본원에 개시되어 있다. 일부 예에서, 본원에 개시된 폴리뉴클레오타이드 또는 폴리펩타이드를 암호화하고, 임의로 사이토킨 및/또는 추가의 치료제를 함유하는 변형된 효과기 세포 조성물이 개시되어 있다. 일부 예에서 또한 효과기 세포의 변형을 위해 키메라 항원 수용체의 발현을 조절하기 위한 유전자-스위치 폴리펩타이드를 암호화하는 벡터가 본원에 포함된다.
일부 예에서, 변형된 효과기 세포 또는 유전자-스위치 폴리펩타이드를 암호화하는 벡터 및 키메라 항원 수용체의 약제학적 조성물은 하나 이상의 생리학적으로 허용되는 담체, 에를 들면, 활성 화합물의 약제학적으로 사용될 수 있는 제제로의 가공을 촉진시키는 부형제 및 보조제를 사용하는 통상의 방식으로 제형화된다. 적절한 제형은 선택된 투여 경로에 의존적이다. 본원에 기술된 약제학적 조성물의 요약은 예를 들면, 문헌: Remington: The Science and Practice of Pharmacy, Nineteenth Ed (Easton, Pa.: Mack Publishing Company, 1995); Hoover, John E., Remington's Pharmaceutical Sciences, Mack Publishing Co., Easton, Pennsylvania 1975; Liberman, H.A. and Lachman, L., Eds., Pharmaceutical Dosage Forms, Marcel Decker, New York, N.Y., 1980; 및 Pharmaceutical Dosage Forms and Drug Delivery Systems, Seventh Ed.(Lippincott Williams & Wilkins1999)에서 찾을 수 있다.
약제학적 조성물은 통상의 방식, 예를 들면, 단지 예로서, 통상의 혼합, 용해, 과립화, 당의정-제조, 제분(levigating), 유화, 캡슐화, 인트랩핑(entrapping) 또는 압착 공정의 수단에 의해 임의로 제조된다.
특정의 구현예에서, 조성물은 또한 하나 이상의 pH 조절제 또는 완충제, 예를 들면, 산, 예를 들면, 아세트산, 붕산, 시트르산, 락트산, 인산 및 염산; 염기, 예를 들면, 수산화나트륨, 인산나트륨, 붕산나트륨, 시트르산나트륨, 아세트산나트륨, 락트산나트륨 및 트리스-하이드록시메틸아미노메탄; 및 완충제, 예를 들면, 시트레이트/덱스트로즈, 중탄산나트륨 및 염화암모늄을 포함할 수 있다. 이러한 산, 염기 및 완충제는 허용되는 범위 내의 조성물의 pH를 유지하는데 필요한 양으로 포함된다.
다른 구현예에서, 조성물은 또한 조성물의 삼투압을 허용되는 범위로 가져오는데 필요한 양의 하나 이상의 염을 포함할 수 있다. 이러한 염은 나트륨, 칼륨 또는 암모늄 양이온 및 클로라이드, 시트레이트, 아스코르베이트, 보레이트, 포스페이트, 비카보네이트, 설페이트, 티오설페이트 또는 비설파이드 음이온을 갖는 것을 포함하며; 적합한 염은 염화나트륨, 염화칼륨, 티오황산나트륨, 황산수소나트륨 및 황산암모늄을 포함한다.
본원에 기술된 약제학적 조성물은 임의의 적합한 투여 경로, 예를 들면, 그러나 이에 한정되지 않는, 경구, 비경구(예컨대, 정맥내, 피하, 근육내, 뇌내, 뇌실내, 관절내, 복강내, 또는 두개내), 비강내, 볼내, 설하, 또는 직장 투여 경로로 투여된다. 일부 예에서, 약제학적 조성물은 비경구(예컨대, 정맥내, 피하, 근육내, 뇌내, 뇌실내, 관절내, 복강내, 또는 두개내) 투여를 위해 제형화된다.
본원에 기술된 약제학적 조성물은 임의의 적합한 형태, 예를 들면, 그러나 이에 한정되지 않는 수성의 경구 분산제, 액체, 겔제, 시럽제, 엘릭서르제(elixir), 슬러리제(slurry), 좌제 등, 치료될 개체(individual)에 의한 경구 소화를 위해, 고체 경구 용량형, 에어로졸제, 조절된 방출 제형, 신속한 용융 제형, 비등성 제형(effervescent formulation), 동결건조된 제형, 정제, 산제, 환제, 당의제, 캅셀제, 지연된 방출 제형, 연장된 방출 제형, 맥동 방출 제형(pulsatile release formulation), 다중입자화 제형(multiparticulate formulation), 및 혼합된 즉시 방출 및 제어된 방출 제형으로 제형화된다. 일부 구현예에서, 약제학적 조성물은 캅셀제로 제형화된다. 일부 구현예에서, 약제학적 조성물은 액제(예를 들면, IV 투여용)로 제형화된다. 일부 경우에, 약제학적 조성물은 주입제로 제형화된다. 일부 경우에, 약제학적 조성물은 주사제로 제형화된다.
본원에 기술된 약제학적 고체 투여형은 본원에 기술된 화합물 및 하나 이상의 약제학적으로 허용되는 첨가제, 예를 들면, 적합성 담체, 결합제, 충전제, 현탁제, 풍미제, 감미제, 붕해제, 분산제, 계면활성제, 윤활제, 착색제, 희석제, 가용화제, 습윤제, 가소제, 안정화제, 침투 향상제, 습윤제, 소포제(anti-foaming agent), 항산화제, 보존제, 또는 하나 이상의 이의 조합을 포함한다.
여전히 다른 양태에서, 표준 코팅 과정, 예를 들면, 문헌: Remington's Pharmaceutical Sciences, 20th Edition (2000)에 기술된 과정을 사용하여, 필름 코팅을 조성물 주변에 제공한다. 일부 구현예에서, 조성물은 입자(예를 들면, 캅셀제에 의한 투여용)으로 제형화되며 입자 중 일부 또는 모두는 코팅된다. 일부 구현예에서, 조성물은 입자(예를 들면, 캅셀제에 의한 투여용으로)로 제형화되며 입자 중 일부 또는 모두는 미세캡슐화된다. 일부 구현예에서, 조성물은 입자(예를 들면 캅셀에 의한 투여용으로)로 제형화되며 입자 중 일부 또는 모두는 미세캡슐화되지 않고 코팅되지 않는다.
특정의 구현예에서, 본원에 제공된 조성물은 또한 미생물 활성을 억제는 하나 이상의 보존제를 포함할 수 있다. 적합한 보존제는 수은 함유 물질, 예를 들면, 메르펜(merfen) 및 티오메르살(thiomersal); 안정화된 이산화염소; 및 4급 암모늄 화합물, 예를 들면, 벤즈알코늄 클로라이드, 세틸트리메틸암모늄 브로마이드 및 세틸피리디늄 클로라이드를 포함한다.
"소포제"는 수성 분산액의 응집, 최종 필름내 기포를 생성할 수 있는 공정 또는 일반적으로 손상 공정 동안 발포를 감소시킨다. 예시적인 소포제는 규소 에멀젼 또는 소르비탄 세스퀴올레이트를 포함한다.
"항산화제"는 예를 들면, 부틸화된 하이드록시톨루엔(BHT), 아스코르브산나트륨, 아스코르브산, 메타중황산나트륨 및 토코페롤을 포함한다. 특정의 구현예에서, 항산화제는 필요한 경우 화학적 안전성을 향상시킨다.
본원에 기술된 제형은 항산화제, 금속 킬레이팅제(metal chelating agent), 티올 함유 화합물 및 다른 일반적인 안정화제로부터 유리할 수 있다. 이러한 안정화제의 예는: (a) 약 0.5% 내지 약 2% w/v 글리세롤, (b) 약 0.1% 내지 약 1% w/v 메티오닌, (c) 약 0.1% 내지 약 2% w/v 모노티오글리세롤, (d) 약 1 mM 내지 약 10 mM EDTA, (e) 약 0.01% 내지 약 2% w/v 아스코르브산, (f) 0.003% 내지 약 0.02% w/v 폴리소르베이트 80, (g) 0.001% 내지 약 0.05% w/v. 폴리소르베이트 20, (h) 아르기닌, (i) 헤파린, (j) 덱스트란 설페이트, (k) 사이클로덱스트린, (l) 펜토산 폴리설페이트 및 다른 헤파리노이드, (m) 2가 양이온, 예를 들면, 마그네슘 및 아연; 또는 (n) 이의 조합을 포함하나, 이에 한정되지 않는다.
"결합제"는 점착 품질(cohesive quality)을 부여하며, 예컨대, 알긴산 및 이의 염; 셀룰로즈 유도체, 예를 들면, 카복시메틸셀룰로즈, 메틸셀룰로즈(예컨대, Methocel®), 하이드록시프로필메틸셀룰로즈, 하이드록시에틸셀룰로즈, 하이드록시프로필셀룰로즈(예컨대, Klucel®), 에틸셀룰로즈(예컨대, Ethocel®), 및 미세결정성 셀룰로즈(예컨대, Avicel®); 미세결정성 덱스트로즈; 아밀로즈; 망간 알루미늄 실리케이트; 다당류 산; 벤토나이트; 젤라틴; 폴리비닐피롤리돈/비닐 아세테이트 공중합체; 크로스포비돈; 포비돈; 전분; 예비젤라틴화된 전분; 트라가칸트, 덱스트린, 당, 예를 들면, 슈크로즈(예컨대, Dipac®), 글루코즈, 덱스트로즈, 몰라세스(molasses), 만니톨, 소르비톨, 크실리톨(예컨대, Xylitab®), 및 락토즈; 천연 또는 합성 검(gum), 예를 들면, 아카시아, 트라가칸트, 가티 검(ghatti gum), 이사폴 껍질의 점액(mucilage of isapol husks), 폴리비닐피롤리돈(예컨대, Polyvidone® CL, Kollidon® CL, Polyplasdone® XL-10), 라크 아라보갈락탄(larch arabogalactan), Veegum®, 폴리에틸렌 글리콜, 왁스, 알긴산나트륨 등을 포함한다.
"담체" 또는 "담체 물질"은 약제학에서 임의의 일반적으로 사용된 부형제를 포함하며 본원에 개시된 화합물, 예를 들면, 이부루티닙 및 항암제의 화합물과의 적합성을, 및 목적한 투여량 형태의 방출 프로파일 특성을 기준으로 선택될 수 있다. 예시적인 담체 물질은 예컨대, 결합제, 현탁제, 붕해제, 충전제, 계면활성제, 가용화제, 안정화제, 윤활제, 습윤제, 희석제 등을 포함한다. "약제학적으로 허용되는 담체 물질"은 아카시아, 젤라틴, 콜로이드성 이산화규소, 칼슘 글리세로포스페이트, 락트산칼슘, 말토덱스트린, 글리세린, 규산마그네슘, 폴리비닐피롤리돈(PVP), 콜레스테롤, 콜레스테롤 에스테르, 나트륨 카제이네이트, 대두 레시틴, 타우로콜산, 포스포티딜콜린, 염화나트륨, 인산삼칼슘, 인산이칼륨, 셀룰로즈 및 셀룰로즈 접합체(conjugate), 당 나트륨 스테아로일 락틸레이트, 카라기난(carrageenan), 모노글리세라이드, 디글리세라이드, 예비젤라틴화된 전분 등을 포함하나, 이에 한정되지 않는다. 예컨대, 문헌: Remington: The Science and Practice of Pharmacy, Nineteenth Ed (Easton, Pa.: Mack Publishing Company, 1995); Hoover, John E., Remington's Pharmaceutical Sciences, Mack Publishing Co., Easton, Pennsylvania 1975; Liberman, H.A. and Lachman, L., Eds., Pharmaceutical Dosage Forms, Marcel Decker, New York, N.Y., 1980; 및 Pharmaceutical Dosage Forms and Drug Delivery Systems, Seventh Ed. (Lippincott Williams & Wilkins1999)를 참고한다.
"분산제" 및/또는 "점도 조절제"는 액체 매질을 통하거나 과립화 방법 또는 배합 방법을 통해 약물의 확산 및 균질성을 제어하는 물질을 포함한다. 일부 구현예에서, 이러한 제제는 또한 코팅 또는 침식 매트릭스(eroding matrix)의 효능을 촉진시킨다. 예시적인 확산 촉진제/분산제는 예컨대, 친수성 중합체, 전해질, Tween® 60 또는 80, PEG, 폴리비닐피롤리돈(PVP; Plasdone®로서 상업적으로 공지됨), 및 탄수화물-기반 분산제, 예를 들면, 하이드록시프로필 셀룰로즈(예컨대, HPC, HPC-SL, 및 HPC-L), 하이드록시프로필 메틸셀룰로즈(예컨대, HPMC K100, HPMC K4M, HPMC K15M, 및 HPMC K100M), 카복시메틸셀룰로즈 나트륨, 메틸셀룰로즈, 하이드록시에틸셀룰로즈, 하이드록시프로필셀룰로즈, 하이드록시프로필메틸셀룰로즈 프탈레이트, 하이드록시프로필메틸셀룰로즈 아세테이트 스테아레이트(HPMCAS), 비결정성 셀룰로즈, 마그네슘 알루미늄 실리케이트, 트리에탄올아민, 폴리비닐 알코올(PVA), 비닐 피롤리돈/비닐 아세테이트 공중합체(S630), 에틸렌 옥사이드와 포름알데하이드와의 4-(1,1,3,3-테트라메틸부틸)-페놀 중합체(또한 틸록사폴로 공지됨), 폴록사머(예컨대, Pluronics F68®, F88®, 및 F108®, 이는 에틸렌 옥사이드와 프로필렌 옥사이드의 블록 공중합체이다); 및 폴록사민(예컨대, Tetronic 908®, 또한 Poloxamine 908®로 공지되어 있으며, 이는 에틸렌디아민에 프로필렌 옥사이드와 에틸렌 옥사이드의 순차적인 첨가로부터 유도된 사기능성 블록 공중합체이다(뉴저지주 파시패니(Parsippany) 소재의 BASF Corporation)), 폴리비닐피롤리돈 K12, 폴리비닐피롤리돈 K17, 폴리비닐피롤리돈 K25, 또는 폴리비닐피롤리돈 K30, 폴리비닐피롤리돈/비닐 아세테이트 공중합체(S-630), 폴리에틸렌 글리콜(예컨대, 폴리에틸렌 글리콜은 약 300 내지 약 6000, 또는 약 3350 내지 약 4000, 또는 약 7000 내지 약 5400의 분자량을 가질 수 있다), 나트륨 카복시메틸셀룰로즈, 메틸셀룰로즈, 폴리소르베이트-80, 알긴산나트륨, 검, 예컨대, 검 트라가칸트 및 검 아카시아, 구아 검, 크산탄, 예를 들면, 크산탄 검, 당, 셀룰로직스(cellulosics), 예를 들면, 예컨대, 나트륨 카복시메틸셀룰로즈, 메틸셀룰로즈, 나트륨 카복시메틸셀룰로즈, 폴리소르베이트-80, 알긴산나트륨, 폴리에톡실화된 소르비탄 모노라우레이트, 폴리에톡실화된 소르비탄 모노라우레이트, 포비돈, 카보머, 폴리비닐 알코올(PVA), 알기네이트, 키토산 및 이의 조합을 포함한다. 가소제, 예를 들면, 셀룰로즈 또는 트리에틸 셀룰로즈를 또한 분산제로서 사용할 수 있다. 분산제는 리포좀 분산액으로서 특히 유용하며 자가-유화되는 분산액은 디미리스토일 포스파티딜 콜린, 알(egg)로부터의 천연의 포스파티딜 글리세롤, 콜레스테롤 및 이소프로필 미리스테이트를 포함한다.
하나 이상의 부식 촉진제와 하나 이상의 확산 촉진제의 조합을 또한 본 조성물에서 사용할 수 있다.
용어 "희석제"는 전달 전에 목적한 화합물을 희석시키는데 사용된 화학적 화합물을 지칭한다. 희석제는 보다 안정한 환경을 제공할 수 있으므로 이는 또한 화합물을 안정화시키는데 사용될 수 있다. 완충된 용액 속에 용해된 염(이는 또한 pH 제어 또는 유지를 제공할 수 있다), 예를 들면, 그러나 이에 한정되지 않는, 포스페이트 완충된 염수 용액을 당해 분야에서 희석제로서 이용한다. 특정의 구현예에서, 희석제는 캅셀 충전을 위해, 압착을 촉진시키거나 균질한 배합을 위한 충분한 부피를 생성시키기 위해 조성물의 부피를 증가시킨다. 이러한 화합물은 예컨대, 락토즈, 전분, 만니톨, 소르비톨, 덱스트로즈, 미세결정성 셀룰로즈, 예를 들면, Avicel®; 이염기성 인산칼슘, 인산이칼슘 이수화물; 인산삼칼슘, 인산칼슘; 무수 락토즈, 분무-건조된 락토즈; 예비젤라틴화된 전분, 압착가능한 당, 예를 들면, Di-Pac®(Amstar); 만니톨, 하이드록시프로필메틸셀룰로즈, 하이드록시프로필메틸셀룰로즈 아세테이트 스테아레이트, 당-기반 희석제, 제빵용 당(confectioner's sugar); 일염기성 황산칼슘 일수화물, 황산칼슘 이수화물; 락트산칼슘 삼수화물, 덱스트레이트; 가수분해된 곡물 고체, 아밀로즈; 분말화된 셀룰로즈, 탄산칼슘; 글리신; 카올린; 만니톨, 염화나트륨; 이노시톨, 벤토나이트 등을 포함한다.
"충전제"는 화합물, 예를 들면, 락토즈, 탄산칼슘, 인산칼슘, 이염기성 인산칼슘, 황산칼슘, 미세결정성 셀룰로즈, 셀룰로즈 분말, 덱스트로즈, 덱스트레이트, 전분, 예비젤라틴화된 전분, 슈크로즈, 크실리톨, 락티톨, 만니톨, 소르비톨, 염화나트륨, 폴리에틸렌 글리콜 등을 포함한다.
"윤활제" 및 "활주제(glidant)"는 물질의 부착 또는 마찰을 방지하거나, 감소시키거나 억제하는 화합물이다. 예시적인 윤활제는 예컨대, 스테아르산, 수산화칼슘, 활석, 나트륨 스테아릴 푸마레이트, 탄화수소, 예를 들면, 광 오일, 또는 수소화된 식물성 오일, 예를 들면, 수소화된 대두 오일(Sterotex®), 고급 지방산 및 이의 알칼리-금속 및 알칼리 토 금속 염, 예를 들면, 알루미늄, 칼슘, 마그네슘, 아연, 스테아르산, 스테아르산나트륨, 글리세롤, 활석, 왁스, Stearowet®, 붕산, 나트륨 벤조에이트, 아세트산나트륨, 염화나트륨, 루이신, 폴리에틸렌 글리콜(예컨대, PEG-4000) 또는 메톡시폴리에틸렌 글리콜, 예를 들면, Carbowax™, 올레산나트륨, 나트륨 벤조에이트, 글리세릴 베헤네이트, 폴리에틸렌 글리콜, 마그네슘 또는 나트륨 라우릴 설페이트, 콜로이드성 실리카, 예를 들면, Syloid™, Cab-O-Sil®, 전분, 예를 들면, 옥수수 전분, 실리콘 오일, 계면활성제 등을 포함한다.
"가소제"는 미세캡슐화 물질 또는 필름 코팅을 연화시켜 이들이 거의 취성이 되지 않도록 하는데 사용된 화합물이다. 적합한 가소제는 예컨대, 폴리에틸렌 글리콜, 예를 들면, PEG 300, PEG 400, PEG 600, PEG 1450, PEG 3350, 및 PEG 800, 스테아르산, 프로필렌 글리콜, 올레산, 트리에틸 셀룰로즈 및 트리아세틴을 포함한다. 일부 구현예에서, 가소제는 또한 분산제 또는 습윤제로서 기능할 수 있다.
"가용화제"는 화합물, 예를 들면, 트리아세틴, 트리에틸시트레이트, 에틸 올레이트, 에틸 카프릴레이트, 나트륨 라우릴 설페이트, 나트륨 도쿠세이트, 비타민 E TPGS, 디메틸아세트아미드, N-메틸피롤리돈, N-하이드록시에틸피롤리돈, 폴리비닐피롤리돈, 하이드록시프로필메틸 셀룰로즈, 하이드록시프로필 사이클로덱스트린, 에탄올, n-부탄올, 이소프로필 알코올, 콜레스테롤, 담즙 염, 폴리에틸렌 글리콜 200 내지 600, 글리코푸롤, 트랜스쿠톨, 프로필렌 글리콜, 및 디메틸 이소소르바이드 등을 포함한다.
"안정화제"는 항산화제, 완충제, 산, 보존제 등과 같은 화합물을 포함한다.
"현탁제"는 화합물, 예를 들면, 폴리비닐피롤리돈, 예컨대, 폴리비닐피롤리돈 K12, 폴리비닐피롤리돈 K17, 폴리비닐피롤리돈 K25, 또는 폴리비닐피롤리돈 K30, 비닐 피롤리돈/비닐 아세테이트 공중합체(S630), 폴리에틸렌 글리콜(예컨대, 폴리에틸렌 글리콜은 약 300 내지 약 6000, 또는 약 3350 내지 약 4000, 또는 약 7000 내지 약 5400의 분자량을 가질 수 있다), 나트륨 카복시메틸셀룰로즈, 메틸셀룰로즈, 하이드록시프로필메틸셀룰로즈, 하이드록시메틸셀룰로즈 아세테이트 스테아레이트, 폴리소르베이트-80, 하이드록시에틸셀룰로즈, 나트륨 알기네이트, 검, 예를 들면, 예컨대, 검 트라가칸트 및 검 아카시아, 구아 검, 크산탄, 예를 들면, 크산탄 검, 당, 셀룰로직스, 예를 들면, 예컨대, 나트륨 카복시메틸셀룰로즈, 메틸셀룰로즈, 나트륨 카복시메틸셀룰로즈, 하이드록시프로필메틸셀룰로즈, 하이드록시에틸셀룰로즈, 폴리소르베이트-80, 알긴산나트륨, 폴리에톡실화된 소르비탄 모노라우레이트, 폴리에톡실화된 소르비탄 모노라우레이트, 포비돈 등을 포함한다.
"계면활성제"는 화합물, 예를 들면, 나트륨 라우릴 설페이트, 나트륨 도쿠세이트, Tween 60 또는 80, 트리아세틴, 비타민 E TPGS, 소르비탄 모노올레이트, 폴리옥시에틸렌 소르비탄 모노올레이트, 폴리소르베이트, 폴락소머, 담즙염, 글리세릴 모노스테아레이트, 에틸렌 옥사이드와 프로필렌 옥사이드의 공중합체, 예컨대, Pluronic®(BASF) 등을 포함한다. 일부 다른 계면활성제는 폴리옥시에틸렌 지방산 글리세라이드 및 식물성 오일, 예컨대, 폴리옥시에틸렌(60) 수소화된 피마자 오일; 및 폴리옥시에틸렌 알킬에테르 및 알킬페닐 에테르, 예컨대, 옥톡시놀 10, 옥톡시놀 40을 포함한다. 일부 구현예에서, 계면활성제는 물리적 안전성을 향상시키거나 다른 목적을 위해 포함될 수 있다.
"점도 향상제"는 예컨대, 메틸 셀룰로즈, 크산탄 검, 카복시메틸 셀룰로즈, 하이드록시프로필 셀룰로즈, 하이드록시프로필메틸 셀룰로즈, 하이드록시프로필메틸 셀룰로즈 아세테이트 스테아레이트, 하이드록시프로필메틸 셀룰로즈 프탈레이트, 카보머, 폴리비닐 알코올, 알기네이트, 아카시아, 키토산 및 이의 조합을 포함한다.
"습윤제"는 화합물, 예를 들면, 올레산, 글리세릴 모노스테아레이트, 소르비탄 모노올레이트, 소르비탄 모노라우레이트, 트리에탄올아민 올레이트, 폴리옥시에틸렌 소르비탄 모노올레이트, 폴리옥시에틸렌 소르비탄 모노라우레이트, 나트륨 도쿠세이트, 나트륨 올레이트, 나트륨 라우릴 설페이트, 나트륨 도쿠세이트, 트리아세틴, Tween 80, 비타민 E TPGS, 암모늄 염 등을 포함한다.
키트(KIT)/제조 제품
특정의 구현예에서, 본원에 기술된 하나 이상의 방법으로 사용하기 위한 키트 및 제조 제품이 본원에 개시되어 있다. 이러한 키트는 담체, 패기지, 또는 바이알(vial), 튜브 등과 같은 하나 이상의 용기를 수용하도록 구획화된 용기를 포함하고, 용기(들) 각각은 본원에 기술된 방법에 사용될 별도의 성분 중 하나를 포함한다. 적합한 용기는 예를 들면, 병, 바이알, 주사기, 및 시험 튜브를 포함한다. 일 구현예에서, 용기는 다양한 물질, 예를 들면, 유리 또는 플라스틱으로부터 형성된다.
본원에 제공된 제조 제품은 패키징 물질(packaging material)을 함유한다. 약제학적 패키징 물질의 예는 블리스터 팩(blister pack), 병, 튜브, 백, 용기, 병, 및 선택된 제형에 적합하고 의도된 투여 및 치료 방식에 적합한 임의의 패키징 물질을 포함하지만 이에 제한되지 않는다.
키트는 전형적으로 성분을 나열한 표지(label) 및/또는 사용 설명서, 및 사용 설명서가 들어있는 패키지 삽입물을 포함한다. 설명서 세트는 또한 전형적으로 포함될 것이다.
일부 구현예에서, 표지는 용기 위에 또는 이와 결합된다. 일 구현예에서, 표지는 표지를 형성하는 문자, 숫자 또는 다른 특징이 용기 자체로 부착되거나, 성형되거나 에칭(etching)되는 경우 용기 위에 존재하며; 표지가 용기를 또한 유지시키는 그롯(receptacle) 또는 담체 내에 존재하는 경우 이는 예를 들면, 패키지 삽입물로서 용기와 결합된다. 일 구현예에서, 표지는 내용물들이 특수한 치료학적 적용에 사용되도록 나타내는데 사용된다. 표지는 또한 본원에 기술된 방법에서와 같이, 내용물의 사용 지시사항을 나타낸다.
실시예
본 실시예는 설명 목적으로만 제공되며 본원에 제공된 청구범위를 제한하지 않는다.
실시예 1
HBV 백신 설계를 위한 항원성 생물정보학 작업흐름도
본원에 제공된 HBV 백신 항원 설계를 생물정보학 분석 및 인 실리코 단백질 가공 방법의 사용을 통해 제공된 발명자가 선택한 조합 안내를 통해 고취된다. HBV 항원 서열을 유전형 D 단백질 서열, 항원성 예측 및 광범위한 포함(coverage)으로 맵핑(mapping)되는 T 세포 에피토프(epitope)를 기반으로 선택하였으며, 이는 MHC-I 결합 및 사이토킨 생산에 이은 T 세포 활성화를 초래할 수 있다. 본원에 제공된 HBV 백신 설계의 전체적인 작업흐름도는 도 5에 나타내며 하기에 추가로 설명한다.
컨센수스 서열의 수득
HBV 게놈은 수개의 오버래핑(overlapping) 바이러스 단백질, 예를 들면, 폴리머라제, 코어, 엔벨로프(envelope)(Pre-S1, S2, S), HBe, 및 HBx 단백질을 암호화한다(도 3a 내지 도 3d). 콘센수스 AA 서열을 A, C, 및 D 서브형에 대한 B형 간염 바이러스 데이타베이스(HBVdb)로부터 수득하였다.
결합 친화성의 예측
NetMHC 4.0을 각각의 컨센수스 서열에 적용하여 모든 주요 MHC-I 대립형질(HLA-A0101, HLA-A0201, HLA-A0301, HLA-A2402, HLA-A2601, HLA-B0702, HLA-B0801, HLA-B2705, HLA-B3901, HLA-B4001, HLA-B5801, 및 HLA-B1501)에 대한 결합 친화성을 예측하였다. NetMHC 4.0은 펩타이드 서열의 결합 친화성을 예측하기 위한 인공 신경 네트워크를 사용한다. 이러한 분석은 HBV 유전형 A, C, 및 D에 걸쳐 수행하였다. 역치(threshold)를 0.5%(강한 결합제) 및 2%(약한 결합제) 순위에서 임의로 확립하였다. 99.5%보다 더 큰 예측된 결합 친화성을 지닌 펩타이드는 강한 결합제로 분류하고 98%보다 더 큰 예측된 결합 친화성을을 지닌 펩타이드는 약한 결합제로 분류하였다. 펩타이드 서열 내에 각각의 AA의 위치를 추출하고 밀도 곡선을 생성하는데 사용하였다(도 9a). 이러한 밀도 곡선을 사용하여, 제1 및 제2 차수 미분(differential)을 계산하여 강한 및 약한 결합제에 대한 피크를 측정하였다(도 9b). 최종적으로, 이러한 위치의 통합을 사용하여 반응을 유발할 가능성이 있는 AA 서열을 추출하였다(도 9c).
실시예 2
HBV 분자 백신 설계
본원에 기술된 HBV 백신은 다음의 HBV 설계 1 내지 5 가공된 단백질(유전적 변형을 지닌 펩타이드)을 포함한다. 일단 설계가 끝나면, 각각의 설계에 대한 전체 서열을 NetMHC 예측에 적용하여 A, C, 및 D 유전형에 대한 항원성 및 포함을 평가하였다(실시예 1). 본원에 기술된 백신을 (a) 트렁케이트된 코어(truncated core), (b) 변형된 폴리머라제, 및 (c) 2개의 엔벨로프 도메인으로 구성된 독특한 거대 융합 단백질을 암호화하는, 현재 임상 시험에서 아데노바이러스-기반 면역치료학적 HBV 백신인, TG1050에 대해 비교하였다. TG1050의 코어 영역은 프레-코어(pre-core)를 결여하였으며 이의 폴리머라제는 4개의 점 돌연변이를 따라 3개의 분절로 분할되어 백신 작제물 안정성을 증진시켰다(Pol1, Plo2 및 Pol3; Δ AA 538-544 및 Δ AA 710-742 및 돌연변이 D689H, V769Y, T776Y, D777H). 2개의 선택된 엔벨로프 도메인을 도 5에 나타낸 바와 같이 폴리머라제 분절 사이 내로 삽입하였다. TG1050 폴리머라제, Env1 및 Env2 서열은 Genbank(Y07587.1)로부터 수득하였고, TG1050 코어 서열은 HBV DB(AB048701)로부터 수득하였다.
5개의 항원 설계(HBV 설계 1 내지 5) 및 대조군 항원을 합성하고 아데노벡터 작제를 위해 발현 플라스미드-pAdShuttles 내로 클로닝(cloning)하였다(도 6). 초기 항원 스크리닝은 일시적인 형질감염에서 시험관내 항원 발현, 시험관내 항원 가공 및 단핵구-기원한 수지 세포의 일시적인 형질감염 연구에서의 표시를 평가하였다. 도 17에 나타낸 바와 같이, HBV 설계 1 및 2를 클래이드(clade) D 컨센수스를 기반으로 설계하였다. 코어(8), 표면(8), 폴리머라제(8), HBx(6) 및 HBPS(2)로부터의 32개 HBV 펩타이드를 실험 및 기능 데이타, 예를 들면, 면역원성 데이타, 질량-스펙트럼(Mass-spec.) 등을 갖는 문헌으로부터 준비하였다(표 3). HBV 설계 3의 경우, 사람 안키린-유사 반복체(ALR) 단백질 스캐폴드(PDB 코드(code) 1QYM) 펩타이드를 나선 및 루프(loop) 영역에서 탄뎀(tandem) 방식으로 이식시켰다. 절단가능한 링커(VSQTSKLTR; 서열 번호:111)에 의해 연결된, 2개의 ALR 스캐폴드를 사용하였다. ALR 단백질은 일반적으로 고 발현 및 고 안정성을 갖는다. 따라서, ALR 단백질을 HBV 펩타이드에 대한 스캐폴드로서 사용하여 신규한 CTL을 생성하였다. HBV 설계 4 에피토프는 KK 링커에 의해 분리되었다(도 6).
HBV 설계 1
HBV D 유전형 단백질 서열(HBV DB: AB048701)을 당해 서열에서 사용하였다. 항원성 예측 분석(실시예 1) 및 HBV 단백질의 상동성 모델은 이러한 설계를 인도하였다. 단백질 항원의 상동성 모델과 함께 HBV 설계 1 및 TG1050의 비교는 도 10에 나타내며, 서열 비교는 도 15a 내지 도 15c에 나타낸다. 이러한 설계는 4개의 천연 HBV 항원: (1) 연장된 Env2/S 영역 165 내지 382번 AA; (2) 코어 영역 1 내지 151번 AA 및 프레-코어 영역; (3) HBx 영역 1 내지 154번 AA; 및 (4) 폴리머라제(339 내지 832번 AA), del 538 내지 544번, 710 내지 742번 AA을 함유하였다. TG1050 비교인자(comparator)는 폴리머라제에 융합된 제3의 엔벨로프 펩타이드를 지닌 2개의 HBV 항원을 가졌다.
이러한 설계는 폴리머라제의 엔벨로프, 코어, HBx 및 리버스 트랜스크립타제 도메인(reverse transcriptase domain)으로부터의 전체 단백질 도메인을 포함하였다. TG1050 비교인자는 트렁케이트된 코어 및 변형된 폴리머라제 도메인으로 융합된 엔벨로프 펩타이드를 가졌으나 임의의 HBx 서열에 의해 암호화되지 않았다.
상이한 HBV 도메인은 하나의 긴 개방 판독 프레임으로서 함께 균일하게 융합되었다. TG1050 비교인자는 트렁케이션(truncation) 뿐만 아니라 결실을 지닌 단지 2개의 도메인(코어 및 폴리머라제)를 가졌다. TG1050 비교인자는 폴리머라제 도메인 내에 엔벨로프 펩타이드의 무작위 삽입을 가졌다.
트렁케이션은 엔벨로프 단백질 및 폴리머라제 도메인 내에서 이루어졌다. 엔벨로프 단백질의 C 말단 영역만이 이러한 설계에 사용되었다. 리버스 트랜스크립타제의 C 말단 만이 포함되었다. 전체 RNaseH 도메인이 포함되었다. 트렁케이션은 ΔRT 활성 모티프(538 내지 544: 6개 aa) 및 ΔRNase H 모티프(710 내지 742번: 32개 aa) 내에서 리버스 트랜스크립타제 기능을 불활성화시키도록 이루어졌다.
HBV 설계 1 신규성: 전체적으로, HBV 설계 1은 TG1050과 비교하여 프레-코어 및 코어 영역 둘 다를 따라 연장된 Env2/S 영역을 가졌다. TG1050과는 달리, 이는 또한 HBx 도메인을 함유하였다. TG1050과 유사한 결실과 함께 N-말단 트렁케이트된 폴리머라제가 또한 사용되었다.
HBV 설계 2
본 설계는 모든 3개의 주요 단백질, 예를 들면, 코어, 표면 스플라이스 변이체, 및 도 11에 나타낸 바와 같은 HBx 펩타이드와 연결된 폴리머라제로 이루어졌다. 선택된 단백질 구성성분을 함께 융합시켜 하나의 긴 개방 판독 프레임을 제조하였다. 이러한 설계은 다음을 기반으로 하였다: (a) 기능성 유전학 데이타(HBVdb: AB048701); (b) T 세포 에피토프 예측(실시예 1); 및 (c) 도 12a 내지 도 12d에 나타낸 바와 같이 이용가능한 HBV 단백질 구조의 비교. TG1050 비교인자 및 HBV 설계 설계 1에 대해 비교하는 경우, 이러한 설계는 다음과 같은 추가의 및/또는 변형된 단백질 도메인을 갖는다: (a) 트렁케이트된 C 말단; (b) 표면 단백질의 스플라이스된 변이체(PreS1 및 PreS2, S); (c) 분할(split)된 Pol N- 및 C-말단 단편; 및 (d) 6개의 HBx 펩타이드. 단백질 도메인을 셔플링(shuffling)하여 임의의 HBV 감염성을 피하고, HBV 설계 2는 TG1050 비교인자 및 HBV 설계 1보다 상이한 차수 도해(ordering scheme)를 사용하였다.
HBV 설계 3
본 설계는 총 32개의 CTL 특이적인 에피토프를 기반으로 하였으며(표 3) 다음으로부터 선택하였다: (1) 다수의 면역학적 분석 및 면역단백질학을 기반으로 한 문헌 고찰; (2) IEDB; (3) NetMHC 4.0 에피토프 예측. 사람 안키린-유사 반복체 단백질(PDB 코드 1QYM)를 32개의 펩타이드가 이식된 스캐폴드로서 선택하여 반복체 영역을 대체하였다. 이러한 설계의 상동성 모델(도 13)을 생성하였으며, 이는 이식된 펩타이드를 지닌 안키린 스캐폴드는 전체적인 3차 구조를 보유할 수 있다는 것을 시사한다. 32개의 이식된 CTL 에피토프를 연결시키는 스캐폴드 골격 아미노산은 적절한 링커로서 제공될 수 있다.
HBV 설계 4
본 설계는 설계 3과 같이 코어, 표면, Pol, HBx 및 HBSP로부터의 동일한 32개의 CTL 에피토프로 구성되었다(표 3). 펩타이드를 스캐폴드 상에 이식하는 것 대신에 하전된(charged) 디펩타이드 KK 잔기 링커로 조립하였다.
[표 3]
HBV 설계 5
본 설계는 설계 1과 유사하며 융합 구성성분들 사이에 강직성(rigid) 링커 (EAAAK)2(서열 번호: 129)를 갖는다(서열 번호: 112 및 서열 번호: 113; 표 6; 도 16).
RNA qPCR 상대적인 발현 검정의 경우, 5'- TGCCAAGAGTGACGTGTCCA-3'(서열 번호: 110)를 스플라이스 프라이머로서 사용하였고 5'-CCCAGGTCCAACTGCAGCCGG-3'(서열 번호: 128)를 스플라이스 프로브로서 사용하였다. 각각의 항원에 대해 설계된 특이적인 프라이머를 역 프라이머로서 사용하였다(도 14). A549 세포를 지질형질감염(lipotransfection)시키고(표 4), HT1080 세포를 핵감염시켰다(표 5).
[표 4]
[표 5]
실시예 3
HBV 백신의 면역원성 시험
모든 항원을 다중-결실된 고릴라 아데노벡터 내에서 작제하고 실험용 연구 물질 뿐만 아니라 임상 연구용 GMP 제작으로 이동시킬 수 있는 프레-GMP 스톡(pre-GMP stock)을 생성하도록 생산하였다(도 6).
수지 세포 형질감염을 위한 최적의 플라스미드 농도를 측정한다. 만성 PHBV 환자로부터 T 세포를 활성화시키기 위한 상이한 항원 설계의 능력을 평가한다. HBV 감염된 환자에 대한 설계된 항원 설계의 면역원성을 평가한다. 생체내 시험 계획은 마우스 내에서 생체내 면역원성 연구(예컨대, 단일 투여 연구, 반복 투여 연구, 예를 들면, 실행가능성의 "집에서 증강(boost at home)", 투여 경로(IM 대 SC)), 및 만성 HBV 감염의 마우스 모델 및 궁극적으로 HCC를 수행하기 위한 것이다.
단핵구-기원한 수지 세포를 표준 프로토콜에 따라서 GM-CSF 및 IL-4를 사용하여 생성시켰다. 단핵구-기원한 수지 세포를 상이한 HBV 항원 작제물로 감염시키고 벡터와 함께 37℃에서 24시간 동안 항온처리하였다. 세포를 세척하고 10 ng/ml rhuTNF-α를 사용하여 밤새 성숙(maturing)시켰다. 세포 성숙은 유동 세포분석법(CD40, CD80, CD83, CD86, HLA-DR)으로 평가하였다. 사이토킨 생산은 IL-1β, TNF-α, IL-6, IL-12p40, 및 MCP1에 대해 평가하였다. 단핵구-유래된 수지 세포를 자가 T 세포와 함께 10일 동안 1:10의 비율로 동시-배양한다. 외인성 rhuIL-2(200U/ml), rhuIL-7 및 rHuIL-15(10 ng/ml)을 3일, 5일 및 7일째에 가한다. IFN-γ, TNF-α, CXCL-10, CXCL-9, IL-10, IL-6, IL-4, IL-5, IL-12p70, 및 MCP1에 대한 사이토킨 분비를 평가한다. T 세포에 대한 활성화 마커는 CD25, CD69, CD45RA, CD45RO, PD1, CTLA-4, TIGIT, 및 LAG3이다. 수지 세포 및 T 세포 활성화에 기반한 대부분의 면역원성을 사용한 항원 설계를 선택하고, HBV 감염된 환자 샘플에 대한 항원 설계의 면역원성을 평가한다.
구체적인 구현예의 앞서의 설명은 당해 분야의 기술 내에서의 지식을 적용함으로써 다른 것이 과도한 실험없이, 본 발명의 일반적인 개념으로부터 벗어나지 않고, 이러한 구체적인 구현예를 다양한 적용을 위해 용이하게 변형시키고/시키거나 조정할 수 있다는 본 발명의 일반적인 특성을 매우 충분히 나타낼 것이다. 따라서, 이러한 조정 및 변형은 본원에 나타낸 교시 및 안내를 기반으로 하여, 개시된 구현예의 등가물의 의미 및 범위 내에 있는 것으로 의도된다. 본원의 어법 또는 전문용어는 설명의 목적을 위한 것이며 한정할 목적이 아니므로, 본 명세서의 전문용어 또는 어법이 교시 및 안내의 측면에서 기술자에 의해 해석되어야 함이 이해되어야 한다.
본 발명의 다른 구현예는 본원에 개시된 본 발명의 명세서 및 실시의 고려로부터 당해 분야의 기술자에게 명백할 것이다. 명세서 및 실시예는 단지 예로서 고려되며, 본 발명의 실제 영역 및 취지는 다음의 청구범위에 의해 나타내어지는 것으로 의도된다.
본 출원은 2018년 3월 6일자로 출원된 미국 가특허원 제62/639,354호에 대한 이익을 주장하며, 이는 이의 전문이 본원에 참고로 포함된다.
구현예
E1. 적어도 하나 이상의 면역 반응-유도성 B형 간염 바이러스(HBV) 폴리펩타이드를 포함하는 폴리펩타이드를 암호화하는 비-천연적으로 발생하는 폴리뉴클레오타이드.
E2. E1의 폴리뉴클레오타이드로서, 상기 하나 이상의 HBV 폴리펩타이드가 HBV 코어 펩타이드를 포함하는 폴리뉴클레오타이드.
E3. E2의 폴리뉴클레오타이드로서, 상기 HBV 코어 펩타이드가 표 3에 나타낸 바와 같은 코어 펩타이드 서열 중 임의의 하나를 갖는 폴리뉴클레오타이드.
E4. E1 내지 E3 중 어느 하나의 폴리뉴클레오타이드로서, 상기 하나 이상의 HBV 폴리펩타이드가 HBV 표면 펩타이드를 포함하는 폴리뉴클레오타이드.
E5. E4의 폴리뉴클레오타이드로서, 상기 HBV 표면 펩타이드가 표 3에 나타낸 바와 같은 표면 펩타이드 서열 중 어느 하나를 갖는 폴리뉴클레오타이드.
E6. E1 내지 E5 중 어느 하나의 폴리뉴클레오타이드, 상기 하나 이상의 HBV 폴리펩타이드가 HBV Pol 펩타이드를 포함하는 폴리뉴클레오타이드.
E7. E6의 폴리뉴클레오타이드로서, 상기 HBV Pol 펩타이드가 표 3에 나타낸 바와 같은 Pol 펩타이드 서열 중 임의의 하나를 갖는 폴리뉴클레오타이드.
E8. E1 내지 E7 중 어느 하나의 폴리뉴클레오타이드로서, 상기 하나 이상의 HBV 폴리펩타이드가 HBV HBSP/HBx 펩타이드를 포함하는 폴리뉴클레오타이드.
E9. E8의 폴리뉴클레오타이드로서, 상기 HBV HBSP/HBx 펩타이드가 표 3에 나타낸 바와 같은 HBSP/HBx 펩타이드 서열 중 어느 하나를 갖는 폴리뉴클레오타이드.
E10. E1 내지 E9 중 어느 하나의 폴리뉴클레오타이드로서, 상기 하나 이상의 HBV 폴리펩타이드가 KK 링커를 포함하는 폴리뉴클레오타이드.
E11. E10의 폴리뉴클레오타이드로서, 상기 KK 링커가 표 3에 나타낸 바와 같은 임의의 다른 펩타이드 서열에 연결시키는 폴리뉴클레오타이드.
E12. E1 내지 E11 중 어느 하나의 폴리뉴클레오타이드를 포함하고, 이종 유전자 발현의 유도성 제어를 위한 유전자 스위치 시스템을 암호화하는 하나 이상의 폴리뉴클레오타이드를 츄가로 포함하는 폴리뉴클레오타이드로서, 상기 이종 유전자 발현은 상기 유전자 스위치 시스템에 의해 조절되고, 상기 이종 유전자는 E1 내지 E11 중 어느 하나의 폴리뉴클레오타이드를 포함하는 폴리뉴클레오타이드.
E13. E1 내지 E12 중 어느 하나의 폴리뉴클레오타이드로서, 상기 유전자 스위치 시스템이 엑다이손 수용체(ecdysone receptor)-기반(EcR-based) 유전자 스위치 시스템인 폴리뉴클레오타이드.
E14. E1 내지 E13 중 어느 하나의 폴리뉴클레오타이드로서, 상기 하나 이상의 HBV 폴리펩타이드가 백신에서 사용하기 위한 폴리뉴클레오타이드.
E15. E1 내지 E14 중 어느 하나의 폴리뉴클레오타이드를 포함하는 벡터.
E16. E15의 벡터로서, 상기 벡터가 아데노바이러스 벡터인 벡터(vector).
E17. E16의 벡터로서, 상기 아데노바이러스 벡터가 고릴라 아데노바이러스 벡터인 벡터.
E18. 세포 내에서 이종 유전자의 발현을 조절하는 방법으로서, 이러한 방법이 상기 세포 내로 (i) 억제성(repressible) 또는 유도성 유전자 스위치(gene switch), 및 (ii) 이종 면역 반응-유도성 유전자를 포함하는 하나 이상의 폴리뉴클레오타이드를 도입시키는 단계로서, 상기 이종 면역 반응-유도성 유전자의 발현이 상기 유전자 스위치에 의해 조절되고, 상기 이종 면역 반응-유도성 유전자가 하나 이상의 HBV 폴리펩타이드 중 적어도 하나를 암호화하는 단계; 및 상기 세포를 상기 이종 면역 반응-유도성 유전자의 발현을 억제하거나 유도하기에 충분한 양의 화합물에 노출시키는 단계를 포함하는 방법.
E19. E18의 방법으로서, 상기 표적 세포가 포유동물 세포인 방법.
E20. E18 또는 E19의 방법으로서, 상기 유전자 스위치가 엑다이손 수용체(ecdysone receptor)(EcR), 편재된 수용체(ubiquitous receptor), 오르판 수용체(orphan receptor) 1, NER-1, 스테로이드 호르몬 핵 수용체 1, 레티노이드 X 수용체 상호작용 단백질-15, 간 X 수용체 β, 스테로이드 호르몬 수용체 유사 단백질, 간 X 수용체, 간 X 수용체 α, 파르네소이드 X 수용체, 수용체 상호작용 단백질 14, 및 파메솔 수용체(famesol receptor) 중 적어도 하나로부터 유래된 리간드 결합 도메인을 포함하는 방법.
E21. 벡터로서, 상기 벡터가 적어도 하나의 HBV 펩타이드를 암호화하는 폴리뉴클레오타이드를 포함하고, 상기 벡터가 아데노바이러스 벡터인 벡터.
E22. 벡터로서, 상기 벡터가 적어도 하나의 HBV 펩타이드를 암호화하는 폴리뉴클레오타이드를 포함하고, 상기 벡터가 아데노바이러스 벡터이며, 상기 아데노바이러스 벡터가 고릴라 아데노바이러스 벡터인 벡터.
E23. 폴리펩타이드 작제물로서, 상기 폴리펩타이드 작제물이 HBV HBx 도메인 및, HBV Pol 도메인, HBV 코어 도메인, HBV 프레-코어 도메인(pre-Core domain) 또는 HBV 표면 도메인 중 적어도 하나를 포함하는 폴리펩타이드 작제물.
E24. 폴리펩타이드 작제물로서, 상기 폴리펩타이드 작제물이 프레-코어 도메인 및, HBV Pol 도메인, HBV HBx 도메인 또는 HBV 표면 도메인 중 적어도 하나를 포함하는 폴리펩타이드 작제물.
E25. E23 또는 E24의 폴리펩타이드 작제물로서, 상기 HBV HBx 도메인이 서열 번호: 98에 나타낸 바와 같은 서열을 갖는 폴리펩타이드 작제물.
E26. E23 내지 E25 중 어느 하나의 폴리펩타이드 작제물로서, 상기 HBV Pol 도메인이 야생형 HBV Pol 도메인과 비교하여 적어도 하나의 아미노산의 결실을 포함하는 폴리펩타이드 작제물.
E27. E26의 폴리펩타이드 작제물로서, 상기 결실이 상기 야생형 HBV Pol 도메인의 결실된 부위를 포함하고, 상기 결실된 부위가 538 내지 544번 아미노산 또는 710번 내지 742번 아미노산을 포함하는 폴리펩타이드 작제물.
E28. E27의 폴리펩타이드 작제물로서, 상기 결실된 부위가 538 내지 544번 아미노산 및 710 내지 742번 아미노산 둘 다를 포함하는 폴리펩타이드 작제물.
E29. E28의 폴리펩타이드 작제물로서, 상기 HBV Pol 도메인이 서열 번호: 99에 나타낸 바와 같은 서열을 갖는 폴리펩타이드 작제물.
E30. E23 내지 E29 중 어느 하나의 폴리펩타이드 작제물로서, 상기 HBV 표면 도메인이 PreS1 도메인, PreS2 도메인 및 S 도메인 중 적어도 하나를 포함하는 폴리펩타이드 작제물.
E31. E30의 폴리펩타이드 작제물로서, 상기 HBV 표면 도메인이 HBV S 도메인을 포함하는 폴리펩타이드 작제물.
E32. E30 또는 E31의 폴리펩타이드 작제물로서, 상기 HBV 표면 도메인이 서열 번호: 100에 나타낸 바와 같은 서열을 갖는 폴리펩타이드 작제물.
E33. E24 내지 E32 중 어느 하나의 폴리펩타이드 작제물로서, 상기 폴리펩타이드 작제물이 HBV 코어 도메인을 추가로 포함하는 폴리펩타이드 작제물.
E34. E23 또는 E33의 폴리펩타이드 작제물로서, 상기 폴리펩타이드 작제물이 코어 부위를 포함하고, 상기 코어 부위가 상기 HBV 코어 도메인 및 상기 HBV 프레-코어 도메인을 포함하는 폴리펩타이드 작제물.
E35. E34의 폴리펩타이드 작제물로서, 상기 코어 부위가 서열 번호: 101에 나타낸 바와 같은 서열을 갖는 폴리펩타이드 작제물.
E36. E23 또는 E33의 폴리펩타이드 작제물로서, 상기 폴리펩타이드 작제물이 각각의 SHB(Env), HBeAg, HBx, 및 Pol 도메인을 포함하는 폴리펩타이드 작제물.
E37. E36의 폴리펩타이드 작제물로서, 상기 폴리펩타이드 작제물이 N-말단으로부터 C-말단까지 상기 SHB(Env), HBeAg, HBx, 및 Pol 도메인의 구조를 포함하는 폴리펩타이드 작제물.
E38. E36 또는 E37의 폴리펩타이드 작제물로서, 상기 SHB(Env) 도메인이 서열 번호: 102에 나타낸 바와 같은 서열을 갖는 폴리펩타이드 작제물.
E39. E36 또는 E37의 폴리펩타이드 작제물로서, 상기 HBeAg 도메인이 서열 번호: 103에 나타낸 바와 같은 서열을 갖는 폴리펩타이드 작제물.
E40. E36 또는 E37의 폴리펩타이드 작제물로서, 상기 HBx 도메인이 서열 번호: 104에 나타낸 바와 같은 서열을 갖는 폴리펩타이드 작제물.
E41. E36 또는 E37의 폴리펩타이드 작제물로서, 상기 Pol 도메인이 서열 번호: 105에 나타낸 바와 같은 서열을 갖는 폴리펩타이드 작제물.
E42. E36 또는 E37의 폴리펩타이드 작제물로서, 상기 폴리펩타이드 작제물이 서열 번호: 106에 나타낸 바와 같은 서열을 갖는 폴리펩타이드 작제물.
E43. 강직성(rigid) 링커를 추가로 포함하는, E36 또는 E37의 폴리펩타이드 작제물.
E44. E36 또는 E37의 폴리펩타이드 작제물로서, 상기 폴리펩타이드가 서열 번호: 112에 나타낸 바와 같은 서열을 갖는 폴리펩타이드 작제물.
E45. 폴리펩타이드 작제물로서, 상기 폴리펩타이드 작제물이 하나 이상의 HBV HBx 링커 및, 코어 도메인, 표면 도메인 및 Pol 도메인 중 적어도 하나를 포함하고, 상기 코어 도메인, 상기 표면 도메인 및 상기 Pol 도메인 중 하나는 상기 코어 도메인, 상기 표면 도메인 및 상기 Pol 도메인 중 다른 것에 상기 하나 이상의 HBx 링커에 의해 연결되어 있는 폴리펩타이드 작제물.
E46. E45의 폴리펩타이드 작제물로서, 상기 표면 도메인이 HBV PreS1 도메인, HBV PreS2 도메인 및 HBV S 도메인 중 적어도 하나를 포함하는 폴리펩타이드 작제물.
E47. E45 또는 E46의 폴리펩타이드 작제물로서, 상기 하나 이상의 HBV HBx 링커가 다중 HBV HBx 링커를 포함하는 폴리펩타이드 작제물.
E48. E47의 폴리펩타이드 작제물로서, 상기 다중 HBV HBx 링커 중 적어도 2개가 아미노산 서열에 있어서 상이한 폴리펩타이드 작제물.
E49. E45 내지 E48 중 어느 하나의 폴리펩타이드 작제물로서, 상기 HBV HBx 링커가 표 3의 HBx-1, HBx-2, HBx-3, HBx-4, HBx-5 또는 HBx-6 중 어느 하나에 나타낸 바와 같은 서열을 갖는 폴리펩타이드 작제물.
E50. E45 내지 E49 중 어느 하나의 폴리펩타이드 작제물로서, 상기 코어 도메인이 상기 표면 도메인에 인접한 폴리펩타이드 작제물.
E51. E50의 폴리펩타이드 작제물로서, 상기 표면 도메인이 PreS1 도메인을 포함하는 폴리펩타이드 작제물.
E52. E50 또는 E51의 폴리펩타이드 작제물로서, 상기 표면 도메인이 상기 코어 도메인에 상기 하나 이상의 HBx 링커 중 하나에 의해 연결되어 있는 폴리펩타이드 작제물.
E53. E45 내지 E52 중 어느 하나의 폴리펩타이드 작제물로서, 상기 Pol 도메인이 표면 도메인에 인접한 폴리펩타이드 작제물.
E54. E53의 폴리펩타이드 작제물로서, 상기 표면 도메인이 PreS1 도메인, PreS2 도메인 및 S 도메인 중 적어도 하나를 포함하는 폴리펩타이드 작제물.
E55. E54의 폴리펩타이드 작제물로서, 상기 표면 도메인이 상기 PreS1 도메인을 포함하고, 상기 Pol 도메인의 N-말단 부위가 상기 PreS1 도메인에 인접하고 있는 폴리펩타이드 작제물.
E56. E55의 폴리펩타이드 작제물로서, 상기 상기 Pol 도메인의 N-말단 부위가 상기 PreS1 도메인에 상기 하나 이상의 HBx 링커 중 하나에 의해 연결되어 있는 폴리펩타이드 작제물.
E57. E56의 폴리펩타이드 작제물로서, 상기 표면 도메인이 상기 PreS2 도메인을 포함하고, 상기 Pol 도메인의 N-말단 부위가 상기 PreS2 도메인에 인접하고 있는 폴리펩타이드 작제물.
E58. E57의 폴리펩타이드 작제물로서, 상기 상기 Pol 도메인의 N-말단 부위가 상기 PreS2 도메인에 상기 하나 이상의 HBx 링커 중 하나에 의해 연결되어 있는 폴리펩타이드 작제물.
E59. E58의 폴리펩타이드 작제물로서, 상기 표면 도메인이 상기 PreS2 도메인을 포함하고, 상기 Pol 도메인의 C-말단 부위가 상기 PreS2 도메인에 인접해 있는 폴리펩타이드 작제물.
E60. E59의 폴리펩타이드 작제물로서, 상기 Pol 도메인의 상기 C-말단 부위가 상기 PreS2 도메인에 상기 하나 이상의 HBx 링커 중 하나에 의해 연결되어 있는 폴리펩타이드 작제물.
E61. E60의 폴리펩타이드 작제물로서, 상기 표면 도메인이 상기 S 도메인을 포함하고, 상기 Pol 도메인의 C-말단 부위가 상기 S 도메인에 인접해 있는 폴리펩타이드 작제물.
E62. E61의 폴리펩타이드 작제물로서, 상기 Pol 도메인의 상기 C-말단 부위가 상기 S 도메인에 상기 하나 이상의 HBx 링커 중 어느 하나에 의해 연결되어 있는 폴리펩타이드 작제물.
E63. E45 내지 E62 중 어느 하나의 폴리펩타이드 작제물로서, 상기 폴리펩타이드 작제물이 서열 번호: 107에 나타낸 바와 같은 서열을 갖는 폴리펩타이드 작제물.
E64. 안키린-유사 반복체 도메인 및 하나 이상의 HBV 펩타이드를 포함하는 폴리펩타이드 작제물.
E65. E64의 폴리펩타이드 작제물로서, 상기 안키린-유사 반복체 단백질이 사람 안키린-유사 수용체 단백질인 폴리펩타이드 작제물.
E66. E64 또는 E65이 폴리펩타이드 작제물로서, 상기 하나 이상의 HBV 펩타이드가 표 3의 아미노산 서열 중 어느 하나에 나타낸 바와 같은 서열을 갖는 폴리펩타이드 작제물.
E67. E64 내지 E66 중 어느 하나의 폴리펩타이드 작제물로서, 상기 하나 이상의 HBV 펩타이드가 코어 펩타이드, 표면 펩타이드, Pol 펩타이드 및 HBSP/HBx 펩타이드 중 하나 이상을 포함하는 폴리펩타이드 작제물.
E68. E67의 폴리펩타이드 작제물로서, 상기 하나 이상의 HBV 펩타이드가 코어 펩타이드를 포함하고, 상기 코어 펩타이드가 표 3의 코어 아미노산 서열 중 어느 하나에 나타낸 바와 같은 서열을 갖는 폴리펩타이드 작제물.
E69. E67의 폴리펩타이드 작제물로서, 상기 하나 이상의 HBV 펩타이드가 표면 펩타이드를 포함하고, 상기 표면 펩타이드가 표 3의 표면 아미노산 서열 중 어느 하나에 나타낸 바와 같은 서열을 갖는 폴리펩타이드 작제물.
E70. E67의 폴리펩타이드 작제물로서, 상기 하나 이상의 HBV 펩타이드가 Pol 펩타이드를 포함하고, 상기 Pol 펩타이드가 표 3의 Pol 아미노산 서열 중 어느 하나에 나타낸 바와 같은 서열을 갖는 폴리펩타이드 작제물.
E71. E67의 폴리펩타이드 작제물로서, 상기 하나 이상의 HBV 펩타이드가 HBSP/HBx 펩타이드를 포함하고, 상기 HBSP/HBx 펩타이드가 표 3의 HBSP/HBx 아미노산 서열 중 어느 하나에 나타낸 바와 같은 서열을 갖는 폴리펩타이드 작제물.
E72. E65 내지 E71 중 어느 하나의 폴리펩타이드 작제물로서, 상기 폴리펩타이드 작제물이 서열 번호: 108에 나타낸 바와 같은 서열을 갖는 폴리펩타이드 작제물.
E73. 폴리펩타이드 작제물로서, 상기 폴리펩타이드 작제물이 표 3에 나타낸 바와 같은 적어도 2개의 HBV 아미노산 서열을 포함하고, 상기 적어도 2개의 HBV 아미노산 서열이 펩타이드 링커에 의해 연결되어 있으며, 상기 펩타이드 링커가 KK 링커인 폴리펩타이드 작제물.
E74. E73의 폴리펩타이드 작제물로서, 상기 적어도 2개의 HBV 아미노산 서열이 표 3에 나타낸 바와 같은 코어 펩타이드, 표면 펩타이드, Pol 펩타이드 및 HBSP/HBx 펩타이드 중 적어도 하나를 포함하는 폴리펩타이드 작제물.
E75. E73 또는 E74의 폴리펩타이드 작제물로서, 상기 적어도 2개의 HBV 아미노산 서열이 표 3에 나타낸 바와 같은 각각의 아미노산 서열을 포함하는 폴리펩타이드 작제물.
E76. E75의 폴리펩타이드 작제물로서, 상기 각각의 아미노산 서열이 상기 각각의 아미노산 서열의 다른 것에 상기 KK 링커에 의해 연결되어 있는 폴리펩타이드 작제물.
E77. E73 내지 E75 중 어느 하나의 폴리펩타이드 작제물로서, 상기 폴리펩타이드 작제물이 서열 번호: 109에 나타낸 바와 같은 서열을 갖는 폴리펩타이드 작제물.
E78. 백신에서 사용하기 위한 E23 내지 E77 중 어느 하나의 폴리펩타이드 작제물.
E79. E25 내지 E78 중 어느 하나의 폴리펩타이드 작제물을 암호화하는 폴리뉴클레오타이드.
E80. E79의 폴리뉴클레오타이드를 포함하는 벡터.
E81. E80의 벡터로서, 상기 벡터가 아데노바이러스 벡터인 벡터.
E82. E81의 벡터로서, 상기 아데노바이러스 벡터가 고릴라 아데노바이러스 벡터인 벡터.
서열
본원에 제공된 구현예에 포함된 특정 서열의 대표적인 목록이 본원에 제공된다(표 6).
[표 6]
SEQUENCE LISTING
<110> INTREXON CORPORATION
PRECIGEN, INC.
BROUGH, DOUGLAS
BOLINGER, CHERYL
YARLAGADDA, RAMYA
KURELLA, VINODHBABU
PRABAKARAN, PONRAJ
METENOU, SIMON
DING, KUAN-FU
<120> HEPATITIS B VACCINES AND USES OF THE SAME
<130> 2584.161PC01
<150> US 62/639,354
<151> 2018-03-06
<160> 130
<170> PatentIn version 3.5
<210> 1
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Adenovirus pIX fragment nucleotides
<400> 1
agctctttgg tggcgagcgg cgcggcctct 30
<210> 2
<211> 439
<212> DNA
<213> Artificial Sequence
<220>
<223> Adenovirus DNA polymerase fragment nucleotides
<400> 2
aacatcaata cctcaaagtc atggtcaggg acactttcgc cctcacccac acctccctcc 60
gcaaggcggc gcaggcctac gcgctgcccg tggagaaggg ctgttgcccc taccaggccg 120
tcaaccagtt ctacatgcta ggctcttacc gttcggacac ggacgggttt cccctccaag 180
agtactggaa agaccgcgaa gagttcgtcc tcaaccgcga gctgtggaaa aagaaggggg 240
aggataagta tgacatcatc cgcgagaccc tcgactactg cgcgctcgac gtccaggtca 300
ccgccgagct ggtgcacaag ctgcgcgagt cctacgcctc cttcgtcagg gactcggtgg 360
gcttgcaaga agcaagcttc aacgtcttcc agcggcccac catctcctcc aactcccatg 420
ccatcttcag gcagatcgc 439
<210> 3
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Adenovirus penton base protein fragment nucleotides
<400> 3
actgaggctg cggctaaggc tgaggtcgaa gcca 34
<210> 4
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Adenovirus hexon protein fragment nucleotides
<400> 4
ataggtgtgg atgccacaca ggcgggagat aaccctatat atgct 45
<210> 5
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Adenovirus fiber protein fragment nucleotides
<400> 5
gtagcaggcc ccctagctgt ggccaatggc 30
<210> 6
<211> 399
<212> DNA
<213> Artificial Sequence
<220>
<223> Adenovirus pIX nucleotides
<400> 6
atgagcgaca ccggcaacag ctttgatgga agcatcttta gcccctatct gacagtgcgc 60
atgcctcact gggctggagt gcgtcagaat gtgatgggtt ccaacgtgga tggacgcccc 120
gttctgcctt caaattcgtc tacaatggcc tacgcgaccg tgggaggaac tccgctggac 180
gccgcgacct ccgccgccgc ctccgccgcc gccgcgaccg cgcgcagcat ggctacggac 240
ctttacagct ctttggtggc gagcggcgcg gcctctcgcg cgtctgctcg ggatgagaaa 300
ctgaccgctc tgctgcttaa actggaagac ttgacccggg agctgggtca actgacccag 360
caggtctcca gcttgcgtga gagcagcctt gcctccccc 399
<210> 7
<211> 3168
<212> DNA
<213> Artificial Sequence
<220>
<223> Adenovirus DNA polymerase nucleotides
<400> 7
atggacagct ccaatgtgcg cgatgtcgtc atcaaactcc gcccgccgag cgccgagatc 60
tggacctgcg gctctcgcgg cgtggtggtc tgctccacca tcgccctcca ggagacagat 120
gctggcggcc agacaaccaa agtagaagac caccagccac acgggacccc aggcggggga 180
cttagattcc cgctgcgctt cctcgtcaga ggtcgccagg ttcacctcgt gcaagatata 240
caacccgtgc agcgctgcca gtactgcggt cgcttttaca aaagccagca cgagtgctcg 300
gcccgcagac gggacttcta ctttcaccac atcaacagcc aatcctccaa ctggtggcgg 360
gagatccagt tcttcccgat cggctctcat cctcgcacgg agcgcctctt tgtcacctac 420
gatgtagaga cctacacttg gatgggagcc tttggcaagc agctcgtgcc cttcatgctg 480
gtcatgaaac tggggggcga cgaggctctg gtcgccgccg cgcgcgacct cgcccgagag 540
ctcagatggg acccctggga gaaagacccc ctcaccttct actgcatcac ccccgaaaag 600
atggccgtgg ggcgacagtt cagaaccttc cgcgaccgcc tgcagaccct catggcccgc 660
gacctctggc gatccttcct ggcggccaac cctcacttgc aagactgggc cctggaggag 720
cacggcctgg aatcgcccga ggagctcacc tacgaggaac tcaaaaagct cccctccatc 780
aagggccagc cccgcttttt ggagctctac atcgtgggcc acaacataaa cggctttgac 840
gagatcgtcc tggccgccca ggtcatcaac aaccgctcct cggtcccagg gccctttcgc 900
atcaccagaa acttcatgcc tcgagcgggg aagatcctct tcaatgacct caccttctcc 960
ctgcccaacc cgcgctccaa aaagcgcacg gactacaccc tgtgggaaca gggcggctgc 1020
gatgacacag acttcaaaca tcaatacctc aaagtcatgg tcagggacac tttcgccctc 1080
acccacacct ccctccgcaa ggcggcgcag gcctacgcgc tgcccgtgga gaagggctgt 1140
tgcccctacc aggccgtcaa ccagttctac atgctaggct cttaccgttc ggacacggac 1200
gggtttcccc tccaagagta ctggaaagac cgcgaagagt tcgtcctcaa ccgcgagctg 1260
tggaaaaaga agggggagga taagtatgac atcatccgcg agaccctcga ctactgcgcg 1320
ctcgacgtcc aggtcaccgc cgagctggtg cacaagctgc gcgagtccta cgcctccttc 1380
gtcagggact cggtgggctt gcaagaagca agcttcaacg tcttccagcg gcccaccatc 1440
tcctccaact cccatgccat cttcaggcag atcgccttcc gcgccgagcg cccccagcgc 1500
accaacctcg ggcccaacat gctggccccc tcccacgagc tctatgacta cgtgcgcgcc 1560
agcatccgcg gggggcgctg ctaccccacc tacctcggca tcctcaggga acccctgtac 1620
gtgtatgaca tctgcggcat gtacgcctcc gcgctcaccc accccatgcc ctggggcccg 1680
cccctcaacc cctacgagcg cgcgctcgcc gcccgcgaat ggcagcgggc tctggacatg 1740
caagcttgca agatcgacta ctttgacccg cgcttgctcc ccggggtctt caccatcgac 1800
gcggaccccc caaacgagga ccagctggac cccctacccc ccttctgctc gcgcaagggc 1860
ggccgcctct gctggaccaa cgagcgcctg cgcggcgagg tcgccaccag cgtcgacatg 1920
gtcaccctgc acaaccgagg ctggagggtg cgcctaatcc cagacgagcg caccaccgtc 1980
ttccccgagt ggaagtgcgt ggcccgcgag tacgtgcaac tcaacatcgc ggccaaggag 2040
cgagccgacc gcgacaaaaa ccagaccctg cgctccatcg ccaagctgct ctccaacgcc 2100
ctctacgggt cgttcgccac caagcttgac aacaaaaaaa tagtgttttc tgaccagatg 2160
gacccaggta ccctcaaagg tatcacctcc ggacaggtga acatcaaatc ctcctcattt 2220
ttagaaactg acaacctgag cgctgaggtc atgcccgcct tcgagaggga atacttaccc 2280
cagcagctgg ccctcgcaga cagcgatgcg gaagagagtg aagatgaaag ggcgcccacc 2340
cccttttata cccccccgtc gggaaccccc ggtcacgtgt cctacaccta caagccaatc 2400
acttttctgg acgcggagga gggggacatg tgcctgcaca ccctggagaa ggtggacccg 2460
ctagtggaca acgaccgcta cccctcccac gtggcctcct tcgtcctggc ctggacgcgg 2520
gccttcgtct cagagtggtc agagtttctc tacgaggagg acagaggcac tccgctggaa 2580
gacaggcccc tgaagtcggt ctacggggac acggacagcc tcttcgtcac cgagaaggga 2640
caccgcctca tggagagccg aggtaagaaa cgcatcaaaa agcatggggg caacctggtt 2700
tttgaccctg accgcccgga gctcacttgg ctggtggaat gcgagacggt ctgcgcttcc 2760
tgcggcgcgg acgcctactc cccagagtcc gtgtttctcg ctcccaagct ctacgccctg 2820
aagagcctgc agtgcccctc gtgcggcgcc acctccaagg gaaagctccg cgccaagggg 2880
cacgccgccg agggtctcga ctacgagacc atggtcaaat gctacctggc cgacgcgcag 2940
ggcgaagagc ggcagcgatt cagcaccagc agaaccagcc tcaagcgcac cctggccagc 3000
gcccaacccg gagcgcaccc cttcaccgtg acccagacca ccctgacgag gaccctgcgc 3060
ccatggaagg acatgactct ggccccgctg gacgcccatc ggctggtgcc ctacagcgaa 3120
agccgcccca acccgcgaaa cgaggagatc tgctggatcg agatgccg 3168
<210> 8
<211> 1974
<212> DNA
<213> Artificial Sequence
<220>
<223> Adenovirus penton base protein nucleotides
<400> 8
atgcggcgcg cggcgatgtt cgaggagggg cctcccccct cttacgagag cgcgatgggg 60
atttctcctg cggcgcccct gcagcctccc tacgtgcctc ctcggtacct gcaacctaca 120
ggggggagaa atagcatctg ttactctgag ctgcagcccc tgtacgatac caccagactg 180
tacctggtgg acaacaagtc cgcggacgtg gcctccctga actaccagaa cgaccacagc 240
gattttttga ccacggtgat ccaaaacaac gacttcaccc caaccgaggc cagcacccag 300
accataaacc tggataacag gtcgaactgg ggcggcgacc tgaagaccat cttgcacacc 360
aacatgccca acgtgaacga gttcatgttc accaactctt ttaaggcgcg ggtgatggtg 420
gcgcgcgagc agggggaggc gaagtacgag tgggtggact tcacgctgcc cgagggcaac 480
tactcagaga ccatgactct cgacctgatg aacaatgcga tcgtggaaca ctatctgaaa 540
gtgggcaggc agaacggggt gaaggaaagc gatatcgggg tcaagtttga caccagaaac 600
ttccgtctgg gctgggaccc cgtgaccggg ctggtcatgc cgggggtcta caccaacgag 660
gcctttcatc ccgacatagt gcttctgccc ggctgtgggg tggacttcac ccagagccgg 720
ctgagcaacc tgctgggcat tcgcaagcgg cagcctttcc aggagggttt caagatcacc 780
tatgaggatc tgaagggggg caacattccc gcgctccttg atctggacgc ctacgaggag 840
agcttgaaac ccgaggagag cgctggcgac agcggcgaga gtggcgagga gcaagccggc 900
ggcggtggcg gcgcgtcggt agaaaacgaa agtacgcccg cagtggcggc ggacgctgcg 960
gaggtcgagc cggaggccat gcagcaggac gcagaggagg gcgcacagga gggcgcgcag 1020
aaggacatga acgatgggga gatcagggga gacacattcg ccacccgggg cgaagaaaaa 1080
gaggcagagg cggcggcggc ggcgacggcg gaggccgaaa ccgaggttga ggcagaggca 1140
gagcccgaga ccgaagttat ggaagacatg aatgatggag aacgtagggg cgacacgttc 1200
gccacccggg gcgaagagaa ggcggcggag gcagaagccg cggctgagga ggcggctgcg 1260
gctgcggcca agactgaggc tgcggctaag gctgaggtcg aagccaatgt tgcggttgag 1320
gctcaggctg aggaggaggc ggcggctgaa gcagttaagg aaaaggccca ggcagagcag 1380
gaagagaaaa aacctgtcat tcaacctcta aaagaagata gcaaaaagcg cagttacaac 1440
gtcatcgagg gcagcacctt tacccagtac cgcagctggt acctggcgta caactacggc 1500
gacccggtca agggggtgcg ctcgtggacc ctgctctgca cgccggacgt cacctgcggc 1560
tccgagcaga tgtactggtc gctgccgaac atgatgcaag acccggtgac cttccgctcc 1620
acgcggcagg ttagcaactt cccggtggtg ggcgccgaac tgctgcccgt gcactccaag 1680
agtttttaca acgagcaggc cgtctactcc cagctgatcc gccaggccac ctctctgacc 1740
cacgtgttca atcgctttcc cgagaaccag attttggcgc gcccgccggc ccccaccatc 1800
accaccgtga gtgaaaacgt tcctgccctc acagatcacg ggacgctacc gctgcgcaac 1860
agcatctcag gagtccagcg agtgaccatt actgacgcca gacgccggac ctgcccctac 1920
gtttacaagg ccttgggcat agtctcgccg cgcgtcctct ccagtcgcac tttt 1974
<210> 9
<211> 2877
<212> DNA
<213> Artificial Sequence
<220>
<223> Adenovirus hexon protein nucleotides
<400> 9
atggcgaccc catcgatgat gcctcagtgg tcgtacatgc acatctcggg ccaggacgct 60
tcggagtacc tgagccccgg gctggtgcag ttcgcccgcg ccacagacac ctacttcaac 120
atgagtaaca agttcaggaa ccccactgtg gcgcccaccc acgatgtgac cacggaccgg 180
tcgcagcgcc tgacgctgcg gttcatcccc gtggatcggg aggacaccgc ctactcttac 240
aaggcgcggt tcacgctggc cgtgggcgac aaccgcgtgc tggacatggc ctccacttac 300
tttgacatca ggggggtgct ggacaggggc cccaccttca agccctactc gggtactgcc 360
tacaactccc tggcccccaa gggcgctccc aattcttgcg agtgggaaca agatgaacca 420
gctcaggcag caatagctga agatgaagaa gaacttgaag aagaacaagc tcaggacgaa 480
caggcgccca ctaagaaaac ccatgtatac gcccaggcac ctctttctgg tgaaaaaatt 540
actaaggatg gtttgcaaat aggtgtggat gccacacagg cgggagataa ccctatatat 600
gctgataaaa cattccaacc cgaacctcag ataggtgagt ctcagtggaa cgaggctgat 660
gccacagtag caggaggcag agtcttaaaa aagaccaccc ctatgagacc ttgctatgga 720
tcctatgcca aacctactaa tgccaatggc ggtcaaggga tcatggtggc caatgatcag 780
ggagcgcttg aatctaaagt tgagatgcaa tttttctcca ccacaacgtc tcttaatgta 840
agggaaggtg aaaacaatct tcagccaaaa gtagtgctat acagcgaaga tgttaacttg 900
gaatcccctg acactcattt gtcttacaaa cctaaaaagg atgacaccaa ctctaaaatc 960
atgttgggtc agcaagccat gcccaacaga cccaacctca ttgcttttag ggacaacttt 1020
attggactta tgtactacaa cagcacaggc aacatgggag tgctggcagg acaggcctcc 1080
cagctaaacg ctgtggtaga cttgcaagac agaaacacag agctgtcata ccaactgatg 1140
cttgattcca ttggagacag atcaagatac ttttccatgt ggaaccaggc agtggacagc 1200
tatgacccag atgtcagaat cattgaaaac catggggttg aagatgagct gcccaactat 1260
tgctttcccc tgggcggtat tggaattaca gacacatacc agtgcataaa accaaccgca 1320
gctgctaata acactacatg gtctaaggat gaagaattta gtgatcgcaa tgaaataggg 1380
gtgggaaaca acttcgccat ggagatcaac atccaggcca acctctggag gaacttcctc 1440
tatgcgaacg tggggctcta cctgccagac aagctcaagt acaaccccac caacgtggac 1500
atctctgaca accccaacac ctatgactac atgaacaagc gtgtggtggc tcccggcctg 1560
gtggactgct ttgtcaatgt gggagccagg tggtccctgg actacatgga caacgtcaac 1620
cccttcaacc accaccgcaa tgcgggtctg cgctaccgct ccatgatcct gggcaacggg 1680
cgctacgtgc ccttccacat tcaggtgccc cagaagttct ttgccatcaa gaacctcctc 1740
ctcctgccgg gctcctacac ttacgagtgg aacttcagga aggatgtcaa catggtcctg 1800
cagagctctc tgggcaatga ccttagggtg gacggggcca gcatcaagtt tgacagcgtc 1860
accctctatg ctaccttctt ccccatggct cacaacaccg cctccacgct cgaggccatg 1920
ctgaggaacg acaccaacga ccagtccttc aatgactacc tctctggggc caacatgctc 1980
taccccatcc ccgccaaggc caccaacgtg cccatctcca ttccctctcg caactgggcc 2040
gccttcagag gctgggcctt tacccgcctt aagaccaagg aaaccccctc cctgggctcg 2100
ggttttgacc cctactttgt ctactcggga tccatcccct acctggatgg caccttctac 2160
ctcaaccaca cttttaagaa gatatccatc atgtatgact cctccgtcag ctggccgggc 2220
aatgaccgcc tgctcacccc caatgagttc gaggtcaagc gcgccgtgga cggcgagggc 2280
tacaacgtgg cccagtgcaa catgaccaag gactggttcc tggtgcagat gctggccaac 2340
tacaacatag gctaccaggg cttctacatc ccagagagct acaaggacag gatgtactcc 2400
ttcttcagaa atttccaacc catgagcagg caggtggtgg acgagaccaa atacaaggac 2460
tatcaggcca ttggcatcac tcaccagcac aacaactcgg gattcgtggg ctacctggct 2520
cccaccatgc gcgaggggca ggcctacccc gccaacttcc cctacccgtt gataggcaaa 2580
accgcggtcg acagcgtcac ccagaaaaag ttcctctgcg accgcaccct ctggcgcatc 2640
cccttctcta gcaacttcat gtccatgggt gcgctcacgg acctgggcca gaacctgctc 2700
tatgccaact ccgcccatgc gctggacatg acttttgagg tggaccccat ggacgagccc 2760
acccttctct atattgtgtt tgaagtgttc gacgtggtca gagtgcacca gccgcaccgc 2820
ggtgtcatcg agaccgtgta cctgcgcacg cccttctcgg ccggcaacgc caccacc 2877
<210> 10
<211> 1749
<212> DNA
<213> Artificial Sequence
<220>
<223> Adenovirus fiber protein nucleotides
<400> 10
atgaaacgcg cgagatcgtc tgacgagacc ttcaaccccg tgtaccccta cgataccgag 60
atcgctccga cttctgtccc tttccttacc cctccctttg tgtcatccgc aggaatgcaa 120
gaaaatccag ctggggtgct gtccctgcac ttgtcagagc cccttaccac ccacaatggg 180
gccctgactc taaaaatggg gggcggcctg accctggaca aggaagggaa tctcacttcc 240
caaaacatca ccagtgtcga tccccctctc aaaaaaagca agaacaacat cagccttcag 300
accgccgcac ccctcgccgt cagctccggg gccctaacac tttttgccac tcccccccta 360
gcggtcagtg gtgacaacct tactgtgcag tctcaggccc ctctcacttt ggaagactca 420
aaactaactc tggccaccaa aggaccccta actgtgtccg aaggcaaact tgtcctagaa 480
acagaggctc ccctgcatgc aagtgacagc agcagcctgg gccttagcgt tacggcccca 540
cttagcatta acaatgacag cctaggacta gatctgcagg cacccattgt ctctcaaaat 600
ggaaaactgg ctctaaatgt agcaggcccc ctagctgtgg ccaatggcat taatgctttg 660
acagtaggca caggcaaagg tattggtcta aatgaaacca gcactcactt gcaagcaaag 720
ttggtcgccc ccctaggctt tgataccaat ggcaacatta agctaagcgt tgcaggaggc 780
atgagactaa ataatgacac acttatacta gatgtaaact acccatttga agctcaaggc 840
caactaagtc taagagtggg ccagggtccg ctgtatgtag attctagcag ccataacctg 900
accattagat gccttagagg attatacata acatcgtcta ataaccaaac cggtctagag 960
gccaacataa aactaacaaa aggccttgtc tatgatggaa atgccatagc agtcaatgtt 1020
ggtcaaggat tgcaatacag cactactgcc acatcggaag gtgtgtatcc tatacagtct 1080
aagataggtt tgggaatgga atatgatacc aacggagcca tgatgacaaa actaggctct 1140
ggactaagct ttgacaattc aggagccatt gtagtgggaa acaaaaatga tgacaggctt 1200
actctgtgga ctacaccaga cccatctcct aactgtagaa tttattctga aaaagatact 1260
aaactaacct tggtgctgac taagtgtggc agccaaatcc taggcacagt atctgccctt 1320
gctgtcagag gcagccttgc gcccatcact aatgcatcca gcatagtcca aatatttcta 1380
agatttgatg aaaatggact attgatgagc aactcatcgc tagacggtga ttactggaat 1440
tacagaaatg gggactccac taatagcaca ccatatacaa atgcagtagg ctttatgcct 1500
aatctagcag cctatcctaa aggtcaggct acagctgcaa aaagcagtat tgtaagccag 1560
gtatacatgg atggtgacac tactaaacct ataacactaa aaataaactt caatggcatt 1620
gatgaaacaa cagaaaatac ccctgttagt aaatattcca tgacattctc atggagctgg 1680
cccaccgcaa gctacatagg ccacactttt gcaacaaact cttttacttt ctcctacatc 1740
gcccaagaa 1749
<210> 11
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> Adenovirus pIX protein fragment
<400> 11
Ser Ser Leu Val Ala Ser Gly Ala Ala Ser
1 5 10
<210> 12
<211> 147
<212> PRT
<213> Artificial Sequence
<220>
<223> Adenovirus DNA polymerase fragment
<400> 12
Lys His Gln Tyr Leu Lys Val Met Val Arg Asp Thr Phe Ala Leu Thr
1 5 10 15
His Thr Ser Leu Arg Lys Ala Ala Gln Ala Tyr Ala Leu Pro Val Glu
20 25 30
Lys Gly Cys Cys Pro Tyr Gln Ala Val Asn Gln Phe Tyr Met Leu Gly
35 40 45
Ser Tyr Arg Ser Asp Thr Asp Gly Phe Pro Leu Gln Glu Tyr Trp Lys
50 55 60
Asp Arg Glu Glu Phe Val Leu Asn Arg Glu Leu Trp Lys Lys Lys Gly
65 70 75 80
Glu Asp Lys Tyr Asp Ile Ile Arg Glu Thr Leu Asp Tyr Cys Ala Leu
85 90 95
Asp Val Gln Val Thr Ala Glu Leu Val His Lys Leu Arg Glu Ser Tyr
100 105 110
Ala Ser Phe Val Arg Asp Ser Val Gly Leu Gln Glu Ala Ser Phe Asn
115 120 125
Val Phe Gln Arg Pro Thr Ile Ser Ser Asn Ser His Ala Ile Phe Arg
130 135 140
Gln Ile Ala
145
<210> 13
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Adenovirus penton base protein fragment
<400> 13
Lys Thr Glu Ala Ala Ala Lys Ala Glu Val Glu Ala Asn Val Ala
1 5 10 15
<210> 14
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Adenovirus hexon protein fragment
<400> 14
Ile Gly Val Asp Ala Thr Gln Ala Gly Asp Asn Pro Ile Tyr Ala
1 5 10 15
<210> 15
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Adenovirus fiber protein fragment
<400> 15
Leu Asn Val Ala Gly Pro Leu Ala Val Ala Asn Gly Ile Asn Ala
1 5 10 15
<210> 16
<211> 133
<212> PRT
<213> Artificial Sequence
<220>
<223> Adenovirus pIX amino acids
<400> 16
Met Ser Asp Thr Gly Asn Ser Phe Asp Gly Ser Ile Phe Ser Pro Tyr
1 5 10 15
Leu Thr Val Arg Met Pro His Trp Ala Gly Val Arg Gln Asn Val Met
20 25 30
Gly Ser Asn Val Asp Gly Arg Pro Val Leu Pro Ser Asn Ser Ser Thr
35 40 45
Met Ala Tyr Ala Thr Val Gly Gly Thr Pro Leu Asp Ala Ala Thr Ser
50 55 60
Ala Ala Ala Ser Ala Ala Ala Ala Thr Ala Arg Ser Met Ala Thr Asp
65 70 75 80
Leu Tyr Ser Ser Leu Val Ala Ser Gly Ala Ala Ser Arg Ala Ser Ala
85 90 95
Arg Asp Glu Lys Leu Thr Ala Leu Leu Leu Lys Leu Glu Asp Leu Thr
100 105 110
Arg Glu Leu Gly Gln Leu Thr Gln Gln Val Ser Ser Leu Arg Glu Ser
115 120 125
Ser Leu Ala Ser Pro
130
<210> 17
<211> 1056
<212> PRT
<213> Artificial Sequence
<220>
<223> Adenovirus DNA polymerase amino acids
<400> 17
Met Asp Ser Ser Asn Val Arg Asp Val Val Ile Lys Leu Arg Pro Pro
1 5 10 15
Ser Ala Glu Ile Trp Thr Cys Gly Ser Arg Gly Val Val Val Cys Ser
20 25 30
Thr Ile Ala Leu Gln Glu Thr Asp Ala Gly Gly Gln Thr Thr Lys Val
35 40 45
Glu Asp His Gln Pro His Gly Thr Pro Gly Gly Gly Leu Arg Phe Pro
50 55 60
Leu Arg Phe Leu Val Arg Gly Arg Gln Val His Leu Val Gln Asp Ile
65 70 75 80
Gln Pro Val Gln Arg Cys Gln Tyr Cys Gly Arg Phe Tyr Lys Ser Gln
85 90 95
His Glu Cys Ser Ala Arg Arg Arg Asp Phe Tyr Phe His His Ile Asn
100 105 110
Ser Gln Ser Ser Asn Trp Trp Arg Glu Ile Gln Phe Phe Pro Ile Gly
115 120 125
Ser His Pro Arg Thr Glu Arg Leu Phe Val Thr Tyr Asp Val Glu Thr
130 135 140
Tyr Thr Trp Met Gly Ala Phe Gly Lys Gln Leu Val Pro Phe Met Leu
145 150 155 160
Val Met Lys Leu Gly Gly Asp Glu Ala Leu Val Ala Ala Ala Arg Asp
165 170 175
Leu Ala Arg Glu Leu Arg Trp Asp Pro Trp Glu Lys Asp Pro Leu Thr
180 185 190
Phe Tyr Cys Ile Thr Pro Glu Lys Met Ala Val Gly Arg Gln Phe Arg
195 200 205
Thr Phe Arg Asp Arg Leu Gln Thr Leu Met Ala Arg Asp Leu Trp Arg
210 215 220
Ser Phe Leu Ala Ala Asn Pro His Leu Gln Asp Trp Ala Leu Glu Glu
225 230 235 240
His Gly Leu Glu Ser Pro Glu Glu Leu Thr Tyr Glu Glu Leu Lys Lys
245 250 255
Leu Pro Ser Ile Lys Gly Gln Pro Arg Phe Leu Glu Leu Tyr Ile Val
260 265 270
Gly His Asn Ile Asn Gly Phe Asp Glu Ile Val Leu Ala Ala Gln Val
275 280 285
Ile Asn Asn Arg Ser Ser Val Pro Gly Pro Phe Arg Ile Thr Arg Asn
290 295 300
Phe Met Pro Arg Ala Gly Lys Ile Leu Phe Asn Asp Leu Thr Phe Ser
305 310 315 320
Leu Pro Asn Pro Arg Ser Lys Lys Arg Thr Asp Tyr Thr Leu Trp Glu
325 330 335
Gln Gly Gly Cys Asp Asp Thr Asp Phe Lys His Gln Tyr Leu Lys Val
340 345 350
Met Val Arg Asp Thr Phe Ala Leu Thr His Thr Ser Leu Arg Lys Ala
355 360 365
Ala Gln Ala Tyr Ala Leu Pro Val Glu Lys Gly Cys Cys Pro Tyr Gln
370 375 380
Ala Val Asn Gln Phe Tyr Met Leu Gly Ser Tyr Arg Ser Asp Thr Asp
385 390 395 400
Gly Phe Pro Leu Gln Glu Tyr Trp Lys Asp Arg Glu Glu Phe Val Leu
405 410 415
Asn Arg Glu Leu Trp Lys Lys Lys Gly Glu Asp Lys Tyr Asp Ile Ile
420 425 430
Arg Glu Thr Leu Asp Tyr Cys Ala Leu Asp Val Gln Val Thr Ala Glu
435 440 445
Leu Val His Lys Leu Arg Glu Ser Tyr Ala Ser Phe Val Arg Asp Ser
450 455 460
Val Gly Leu Gln Glu Ala Ser Phe Asn Val Phe Gln Arg Pro Thr Ile
465 470 475 480
Ser Ser Asn Ser His Ala Ile Phe Arg Gln Ile Ala Phe Arg Ala Glu
485 490 495
Arg Pro Gln Arg Thr Asn Leu Gly Pro Asn Met Leu Ala Pro Ser His
500 505 510
Glu Leu Tyr Asp Tyr Val Arg Ala Ser Ile Arg Gly Gly Arg Cys Tyr
515 520 525
Pro Thr Tyr Leu Gly Ile Leu Arg Glu Pro Leu Tyr Val Tyr Asp Ile
530 535 540
Cys Gly Met Tyr Ala Ser Ala Leu Thr His Pro Met Pro Trp Gly Pro
545 550 555 560
Pro Leu Asn Pro Tyr Glu Arg Ala Leu Ala Ala Arg Glu Trp Gln Arg
565 570 575
Ala Leu Asp Met Gln Ala Cys Lys Ile Asp Tyr Phe Asp Pro Arg Leu
580 585 590
Leu Pro Gly Val Phe Thr Ile Asp Ala Asp Pro Pro Asn Glu Asp Gln
595 600 605
Leu Asp Pro Leu Pro Pro Phe Cys Ser Arg Lys Gly Gly Arg Leu Cys
610 615 620
Trp Thr Asn Glu Arg Leu Arg Gly Glu Val Ala Thr Ser Val Asp Met
625 630 635 640
Val Thr Leu His Asn Arg Gly Trp Arg Val Arg Leu Ile Pro Asp Glu
645 650 655
Arg Thr Thr Val Phe Pro Glu Trp Lys Cys Val Ala Arg Glu Tyr Val
660 665 670
Gln Leu Asn Ile Ala Ala Lys Glu Arg Ala Asp Arg Asp Lys Asn Gln
675 680 685
Thr Leu Arg Ser Ile Ala Lys Leu Leu Ser Asn Ala Leu Tyr Gly Ser
690 695 700
Phe Ala Thr Lys Leu Asp Asn Lys Lys Ile Val Phe Ser Asp Gln Met
705 710 715 720
Asp Pro Gly Thr Leu Lys Gly Ile Thr Ser Gly Gln Val Asn Ile Lys
725 730 735
Ser Ser Ser Phe Leu Glu Thr Asp Asn Leu Ser Ala Glu Val Met Pro
740 745 750
Ala Phe Glu Arg Glu Tyr Leu Pro Gln Gln Leu Ala Leu Ala Asp Ser
755 760 765
Asp Ala Glu Glu Ser Glu Asp Glu Arg Ala Pro Thr Pro Phe Tyr Thr
770 775 780
Pro Pro Ser Gly Thr Pro Gly His Val Ser Tyr Thr Tyr Lys Pro Ile
785 790 795 800
Thr Phe Leu Asp Ala Glu Glu Gly Asp Met Cys Leu His Thr Leu Glu
805 810 815
Lys Val Asp Pro Leu Val Asp Asn Asp Arg Tyr Pro Ser His Val Ala
820 825 830
Ser Phe Val Leu Ala Trp Thr Arg Ala Phe Val Ser Glu Trp Ser Glu
835 840 845
Phe Leu Tyr Glu Glu Asp Arg Gly Thr Pro Leu Glu Asp Arg Pro Leu
850 855 860
Lys Ser Val Tyr Gly Asp Thr Asp Ser Leu Phe Val Thr Glu Lys Gly
865 870 875 880
His Arg Leu Met Glu Ser Arg Gly Lys Lys Arg Ile Lys Lys His Gly
885 890 895
Gly Asn Leu Val Phe Asp Pro Asp Arg Pro Glu Leu Thr Trp Leu Val
900 905 910
Glu Cys Glu Thr Val Cys Ala Ser Cys Gly Ala Asp Ala Tyr Ser Pro
915 920 925
Glu Ser Val Phe Leu Ala Pro Lys Leu Tyr Ala Leu Lys Ser Leu Gln
930 935 940
Cys Pro Ser Cys Gly Ala Thr Ser Lys Gly Lys Leu Arg Ala Lys Gly
945 950 955 960
His Ala Ala Glu Gly Leu Asp Tyr Glu Thr Met Val Lys Cys Tyr Leu
965 970 975
Ala Asp Ala Gln Gly Glu Glu Arg Gln Arg Phe Ser Thr Ser Arg Thr
980 985 990
Ser Leu Lys Arg Thr Leu Ala Ser Ala Gln Pro Gly Ala His Pro Phe
995 1000 1005
Thr Val Thr Gln Thr Thr Leu Thr Arg Thr Leu Arg Pro Trp Lys
1010 1015 1020
Asp Met Thr Leu Ala Pro Leu Asp Ala His Arg Leu Val Pro Tyr
1025 1030 1035
Ser Glu Ser Arg Pro Asn Pro Arg Asn Glu Glu Ile Cys Trp Ile
1040 1045 1050
Glu Met Pro
1055
<210> 18
<211> 658
<212> PRT
<213> Artificial Sequence
<220>
<223> Adenovirus penton base protein
<400> 18
Met Arg Arg Ala Ala Met Phe Glu Glu Gly Pro Pro Pro Ser Tyr Glu
1 5 10 15
Ser Ala Met Gly Ile Ser Pro Ala Ala Pro Leu Gln Pro Pro Tyr Val
20 25 30
Pro Pro Arg Tyr Leu Gln Pro Thr Gly Gly Arg Asn Ser Ile Cys Tyr
35 40 45
Ser Glu Leu Gln Pro Leu Tyr Asp Thr Thr Arg Leu Tyr Leu Val Asp
50 55 60
Asn Lys Ser Ala Asp Val Ala Ser Leu Asn Tyr Gln Asn Asp His Ser
65 70 75 80
Asp Phe Leu Thr Thr Val Ile Gln Asn Asn Asp Phe Thr Pro Thr Glu
85 90 95
Ala Ser Thr Gln Thr Ile Asn Leu Asp Asn Arg Ser Asn Trp Gly Gly
100 105 110
Asp Leu Lys Thr Ile Leu His Thr Asn Met Pro Asn Val Asn Glu Phe
115 120 125
Met Phe Thr Asn Ser Phe Lys Ala Arg Val Met Val Ala Arg Glu Gln
130 135 140
Gly Glu Ala Lys Tyr Glu Trp Val Asp Phe Thr Leu Pro Glu Gly Asn
145 150 155 160
Tyr Ser Glu Thr Met Thr Leu Asp Leu Met Asn Asn Ala Ile Val Glu
165 170 175
His Tyr Leu Lys Val Gly Arg Gln Asn Gly Val Lys Glu Ser Asp Ile
180 185 190
Gly Val Lys Phe Asp Thr Arg Asn Phe Arg Leu Gly Trp Asp Pro Val
195 200 205
Thr Gly Leu Val Met Pro Gly Val Tyr Thr Asn Glu Ala Phe His Pro
210 215 220
Asp Ile Val Leu Leu Pro Gly Cys Gly Val Asp Phe Thr Gln Ser Arg
225 230 235 240
Leu Ser Asn Leu Leu Gly Ile Arg Lys Arg Gln Pro Phe Gln Glu Gly
245 250 255
Phe Lys Ile Thr Tyr Glu Asp Leu Lys Gly Gly Asn Ile Pro Ala Leu
260 265 270
Leu Asp Leu Asp Ala Tyr Glu Glu Ser Leu Lys Pro Glu Glu Ser Ala
275 280 285
Gly Asp Ser Gly Glu Ser Gly Glu Glu Gln Ala Gly Gly Gly Gly Gly
290 295 300
Ala Ser Val Glu Asn Glu Ser Thr Pro Ala Val Ala Ala Asp Ala Ala
305 310 315 320
Glu Val Glu Pro Glu Ala Met Gln Gln Asp Ala Glu Glu Gly Ala Gln
325 330 335
Glu Gly Ala Gln Lys Asp Met Asn Asp Gly Glu Ile Arg Gly Asp Thr
340 345 350
Phe Ala Thr Arg Gly Glu Glu Lys Glu Ala Glu Ala Ala Ala Ala Ala
355 360 365
Thr Ala Glu Ala Glu Thr Glu Val Glu Ala Glu Ala Glu Pro Glu Thr
370 375 380
Glu Val Met Glu Asp Met Asn Asp Gly Glu Arg Arg Gly Asp Thr Phe
385 390 395 400
Ala Thr Arg Gly Glu Glu Lys Ala Ala Glu Ala Glu Ala Ala Ala Glu
405 410 415
Glu Ala Ala Ala Ala Ala Ala Lys Thr Glu Ala Ala Ala Lys Ala Glu
420 425 430
Val Glu Ala Asn Val Ala Val Glu Ala Gln Ala Glu Glu Glu Ala Ala
435 440 445
Ala Glu Ala Val Lys Glu Lys Ala Gln Ala Glu Gln Glu Glu Lys Lys
450 455 460
Pro Val Ile Gln Pro Leu Lys Glu Asp Ser Lys Lys Arg Ser Tyr Asn
465 470 475 480
Val Ile Glu Gly Ser Thr Phe Thr Gln Tyr Arg Ser Trp Tyr Leu Ala
485 490 495
Tyr Asn Tyr Gly Asp Pro Val Lys Gly Val Arg Ser Trp Thr Leu Leu
500 505 510
Cys Thr Pro Asp Val Thr Cys Gly Ser Glu Gln Met Tyr Trp Ser Leu
515 520 525
Pro Asn Met Met Gln Asp Pro Val Thr Phe Arg Ser Thr Arg Gln Val
530 535 540
Ser Asn Phe Pro Val Val Gly Ala Glu Leu Leu Pro Val His Ser Lys
545 550 555 560
Ser Phe Tyr Asn Glu Gln Ala Val Tyr Ser Gln Leu Ile Arg Gln Ala
565 570 575
Thr Ser Leu Thr His Val Phe Asn Arg Phe Pro Glu Asn Gln Ile Leu
580 585 590
Ala Arg Pro Pro Ala Pro Thr Ile Thr Thr Val Ser Glu Asn Val Pro
595 600 605
Ala Leu Thr Asp His Gly Thr Leu Pro Leu Arg Asn Ser Ile Ser Gly
610 615 620
Val Gln Arg Val Thr Ile Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr
625 630 635 640
Val Tyr Lys Ala Leu Gly Ile Val Ser Pro Arg Val Leu Ser Ser Arg
645 650 655
Thr Phe
<210> 19
<211> 959
<212> PRT
<213> Artificial Sequence
<220>
<223> Adenovirus hexon protein
<400> 19
Met Ala Thr Pro Ser Met Met Pro Gln Trp Ser Tyr Met His Ile Ser
1 5 10 15
Gly Gln Asp Ala Ser Glu Tyr Leu Ser Pro Gly Leu Val Gln Phe Ala
20 25 30
Arg Ala Thr Asp Thr Tyr Phe Asn Met Ser Asn Lys Phe Arg Asn Pro
35 40 45
Thr Val Ala Pro Thr His Asp Val Thr Thr Asp Arg Ser Gln Arg Leu
50 55 60
Thr Leu Arg Phe Ile Pro Val Asp Arg Glu Asp Thr Ala Tyr Ser Tyr
65 70 75 80
Lys Ala Arg Phe Thr Leu Ala Val Gly Asp Asn Arg Val Leu Asp Met
85 90 95
Ala Ser Thr Tyr Phe Asp Ile Arg Gly Val Leu Asp Arg Gly Pro Thr
100 105 110
Phe Lys Pro Tyr Ser Gly Thr Ala Tyr Asn Ser Leu Ala Pro Lys Gly
115 120 125
Ala Pro Asn Ser Cys Glu Trp Glu Gln Asp Glu Pro Ala Gln Ala Ala
130 135 140
Ile Ala Glu Asp Glu Glu Glu Leu Glu Glu Glu Gln Ala Gln Asp Glu
145 150 155 160
Gln Ala Pro Thr Lys Lys Thr His Val Tyr Ala Gln Ala Pro Leu Ser
165 170 175
Gly Glu Lys Ile Thr Lys Asp Gly Leu Gln Ile Gly Val Asp Ala Thr
180 185 190
Gln Ala Gly Asp Asn Pro Ile Tyr Ala Asp Lys Thr Phe Gln Pro Glu
195 200 205
Pro Gln Ile Gly Glu Ser Gln Trp Asn Glu Ala Asp Ala Thr Val Ala
210 215 220
Gly Gly Arg Val Leu Lys Lys Thr Thr Pro Met Arg Pro Cys Tyr Gly
225 230 235 240
Ser Tyr Ala Lys Pro Thr Asn Ala Asn Gly Gly Gln Gly Ile Met Val
245 250 255
Ala Asn Asp Gln Gly Ala Leu Glu Ser Lys Val Glu Met Gln Phe Phe
260 265 270
Ser Thr Thr Thr Ser Leu Asn Val Arg Glu Gly Glu Asn Asn Leu Gln
275 280 285
Pro Lys Val Val Leu Tyr Ser Glu Asp Val Asn Leu Glu Ser Pro Asp
290 295 300
Thr His Leu Ser Tyr Lys Pro Lys Lys Asp Asp Thr Asn Ser Lys Ile
305 310 315 320
Met Leu Gly Gln Gln Ala Met Pro Asn Arg Pro Asn Leu Ile Ala Phe
325 330 335
Arg Asp Asn Phe Ile Gly Leu Met Tyr Tyr Asn Ser Thr Gly Asn Met
340 345 350
Gly Val Leu Ala Gly Gln Ala Ser Gln Leu Asn Ala Val Val Asp Leu
355 360 365
Gln Asp Arg Asn Thr Glu Leu Ser Tyr Gln Leu Met Leu Asp Ser Ile
370 375 380
Gly Asp Arg Ser Arg Tyr Phe Ser Met Trp Asn Gln Ala Val Asp Ser
385 390 395 400
Tyr Asp Pro Asp Val Arg Ile Ile Glu Asn His Gly Val Glu Asp Glu
405 410 415
Leu Pro Asn Tyr Cys Phe Pro Leu Gly Gly Ile Gly Ile Thr Asp Thr
420 425 430
Tyr Gln Cys Ile Lys Pro Thr Ala Ala Ala Asn Asn Thr Thr Trp Ser
435 440 445
Lys Asp Glu Glu Phe Ser Asp Arg Asn Glu Ile Gly Val Gly Asn Asn
450 455 460
Phe Ala Met Glu Ile Asn Ile Gln Ala Asn Leu Trp Arg Asn Phe Leu
465 470 475 480
Tyr Ala Asn Val Gly Leu Tyr Leu Pro Asp Lys Leu Lys Tyr Asn Pro
485 490 495
Thr Asn Val Asp Ile Ser Asp Asn Pro Asn Thr Tyr Asp Tyr Met Asn
500 505 510
Lys Arg Val Val Ala Pro Gly Leu Val Asp Cys Phe Val Asn Val Gly
515 520 525
Ala Arg Trp Ser Leu Asp Tyr Met Asp Asn Val Asn Pro Phe Asn His
530 535 540
His Arg Asn Ala Gly Leu Arg Tyr Arg Ser Met Ile Leu Gly Asn Gly
545 550 555 560
Arg Tyr Val Pro Phe His Ile Gln Val Pro Gln Lys Phe Phe Ala Ile
565 570 575
Lys Asn Leu Leu Leu Leu Pro Gly Ser Tyr Thr Tyr Glu Trp Asn Phe
580 585 590
Arg Lys Asp Val Asn Met Val Leu Gln Ser Ser Leu Gly Asn Asp Leu
595 600 605
Arg Val Asp Gly Ala Ser Ile Lys Phe Asp Ser Val Thr Leu Tyr Ala
610 615 620
Thr Phe Phe Pro Met Ala His Asn Thr Ala Ser Thr Leu Glu Ala Met
625 630 635 640
Leu Arg Asn Asp Thr Asn Asp Gln Ser Phe Asn Asp Tyr Leu Ser Gly
645 650 655
Ala Asn Met Leu Tyr Pro Ile Pro Ala Lys Ala Thr Asn Val Pro Ile
660 665 670
Ser Ile Pro Ser Arg Asn Trp Ala Ala Phe Arg Gly Trp Ala Phe Thr
675 680 685
Arg Leu Lys Thr Lys Glu Thr Pro Ser Leu Gly Ser Gly Phe Asp Pro
690 695 700
Tyr Phe Val Tyr Ser Gly Ser Ile Pro Tyr Leu Asp Gly Thr Phe Tyr
705 710 715 720
Leu Asn His Thr Phe Lys Lys Ile Ser Ile Met Tyr Asp Ser Ser Val
725 730 735
Ser Trp Pro Gly Asn Asp Arg Leu Leu Thr Pro Asn Glu Phe Glu Val
740 745 750
Lys Arg Ala Val Asp Gly Glu Gly Tyr Asn Val Ala Gln Cys Asn Met
755 760 765
Thr Lys Asp Trp Phe Leu Val Gln Met Leu Ala Asn Tyr Asn Ile Gly
770 775 780
Tyr Gln Gly Phe Tyr Ile Pro Glu Ser Tyr Lys Asp Arg Met Tyr Ser
785 790 795 800
Phe Phe Arg Asn Phe Gln Pro Met Ser Arg Gln Val Val Asp Glu Thr
805 810 815
Lys Tyr Lys Asp Tyr Gln Ala Ile Gly Ile Thr His Gln His Asn Asn
820 825 830
Ser Gly Phe Val Gly Tyr Leu Ala Pro Thr Met Arg Glu Gly Gln Ala
835 840 845
Tyr Pro Ala Asn Phe Pro Tyr Pro Leu Ile Gly Lys Thr Ala Val Asp
850 855 860
Ser Val Thr Gln Lys Lys Phe Leu Cys Asp Arg Thr Leu Trp Arg Ile
865 870 875 880
Pro Phe Ser Ser Asn Phe Met Ser Met Gly Ala Leu Thr Asp Leu Gly
885 890 895
Gln Asn Leu Leu Tyr Ala Asn Ser Ala His Ala Leu Asp Met Thr Phe
900 905 910
Glu Val Asp Pro Met Asp Glu Pro Thr Leu Leu Tyr Ile Val Phe Glu
915 920 925
Val Phe Asp Val Val Arg Val His Gln Pro His Arg Gly Val Ile Glu
930 935 940
Thr Val Tyr Leu Arg Thr Pro Phe Ser Ala Gly Asn Ala Thr Thr
945 950 955
<210> 20
<211> 583
<212> PRT
<213> Artificial Sequence
<220>
<223> Adenovirus fiber protein
<400> 20
Met Lys Arg Ala Arg Ser Ser Asp Glu Thr Phe Asn Pro Val Tyr Pro
1 5 10 15
Tyr Asp Thr Glu Ile Ala Pro Thr Ser Val Pro Phe Leu Thr Pro Pro
20 25 30
Phe Val Ser Ser Ala Gly Met Gln Glu Asn Pro Ala Gly Val Leu Ser
35 40 45
Leu His Leu Ser Glu Pro Leu Thr Thr His Asn Gly Ala Leu Thr Leu
50 55 60
Lys Met Gly Gly Gly Leu Thr Leu Asp Lys Glu Gly Asn Leu Thr Ser
65 70 75 80
Gln Asn Ile Thr Ser Val Asp Pro Pro Leu Lys Lys Ser Lys Asn Asn
85 90 95
Ile Ser Leu Gln Thr Ala Ala Pro Leu Ala Val Ser Ser Gly Ala Leu
100 105 110
Thr Leu Phe Ala Thr Pro Pro Leu Ala Val Ser Gly Asp Asn Leu Thr
115 120 125
Val Gln Ser Gln Ala Pro Leu Thr Leu Glu Asp Ser Lys Leu Thr Leu
130 135 140
Ala Thr Lys Gly Pro Leu Thr Val Ser Glu Gly Lys Leu Val Leu Glu
145 150 155 160
Thr Glu Ala Pro Leu His Ala Ser Asp Ser Ser Ser Leu Gly Leu Ser
165 170 175
Val Thr Ala Pro Leu Ser Ile Asn Asn Asp Ser Leu Gly Leu Asp Leu
180 185 190
Gln Ala Pro Ile Val Ser Gln Asn Gly Lys Leu Ala Leu Asn Val Ala
195 200 205
Gly Pro Leu Ala Val Ala Asn Gly Ile Asn Ala Leu Thr Val Gly Thr
210 215 220
Gly Lys Gly Ile Gly Leu Asn Glu Thr Ser Thr His Leu Gln Ala Lys
225 230 235 240
Leu Val Ala Pro Leu Gly Phe Asp Thr Asn Gly Asn Ile Lys Leu Ser
245 250 255
Val Ala Gly Gly Met Arg Leu Asn Asn Asp Thr Leu Ile Leu Asp Val
260 265 270
Asn Tyr Pro Phe Glu Ala Gln Gly Gln Leu Ser Leu Arg Val Gly Gln
275 280 285
Gly Pro Leu Tyr Val Asp Ser Ser Ser His Asn Leu Thr Ile Arg Cys
290 295 300
Leu Arg Gly Leu Tyr Ile Thr Ser Ser Asn Asn Gln Thr Gly Leu Glu
305 310 315 320
Ala Asn Ile Lys Leu Thr Lys Gly Leu Val Tyr Asp Gly Asn Ala Ile
325 330 335
Ala Val Asn Val Gly Gln Gly Leu Gln Tyr Ser Thr Thr Ala Thr Ser
340 345 350
Glu Gly Val Tyr Pro Ile Gln Ser Lys Ile Gly Leu Gly Met Glu Tyr
355 360 365
Asp Thr Asn Gly Ala Met Met Thr Lys Leu Gly Ser Gly Leu Ser Phe
370 375 380
Asp Asn Ser Gly Ala Ile Val Val Gly Asn Lys Asn Asp Asp Arg Leu
385 390 395 400
Thr Leu Trp Thr Thr Pro Asp Pro Ser Pro Asn Cys Arg Ile Tyr Ser
405 410 415
Glu Lys Asp Thr Lys Leu Thr Leu Val Leu Thr Lys Cys Gly Ser Gln
420 425 430
Ile Leu Gly Thr Val Ser Ala Leu Ala Val Arg Gly Ser Leu Ala Pro
435 440 445
Ile Thr Asn Ala Ser Ser Ile Val Gln Ile Phe Leu Arg Phe Asp Glu
450 455 460
Asn Gly Leu Leu Met Ser Asn Ser Ser Leu Asp Gly Asp Tyr Trp Asn
465 470 475 480
Tyr Arg Asn Gly Asp Ser Thr Asn Ser Thr Pro Tyr Thr Asn Ala Val
485 490 495
Gly Phe Met Pro Asn Leu Ala Ala Tyr Pro Lys Gly Gln Ala Thr Ala
500 505 510
Ala Lys Ser Ser Ile Val Ser Gln Val Tyr Met Asp Gly Asp Thr Thr
515 520 525
Lys Pro Ile Thr Leu Lys Ile Asn Phe Asn Gly Ile Asp Glu Thr Thr
530 535 540
Glu Asn Thr Pro Val Ser Lys Tyr Ser Met Thr Phe Ser Trp Ser Trp
545 550 555 560
Pro Thr Ala Ser Tyr Ile Gly His Thr Phe Ala Thr Asn Ser Phe Thr
565 570 575
Phe Ser Tyr Ile Ala Gln Glu
580
<210> 21
<211> 32739
<212> DNA
<213> Artificial Sequence
<220>
<223> Adenovirus vector nucleotide sequences
<400> 21
catcatcaat aatatacctt attttggatt gtggccaata tgataatgag gtgggcgggg 60
agaggcgggg cgggtgacgt aggacgcgcg agtagggttg ggaggtgtgg cggaagtgtg 120
gcatttgcaa gtgggaggag ctcacatgca agcttccgtc gcggaaaatg tgacgttttt 180
gatgagcgcc gcctacctcc ggaagtgcca attttcgcgc gcttttcacc ggatatcgta 240
gtaattttgg gcgggaccat gtaagatttg gccattttcg cgcgaaaagt gaaacgggga 300
agtgaaaact gaataatagg gcgttagtca tagcgcgtaa tatttaccga gggccgaggg 360
actttgaccg attacgtgga ggactcgccc aggtgttttt tacgtgaatt tccgcgttcc 420
gggtcaaagt ctccgttttt attgtcaccg tcatttgacg cggagggtat ttaaacccgc 480
tgcgctcctc aagaggccac tcttgagtgc cagcgagaag agttttctcc tctgctccgc 540
ttcggtgatc gaaaaatgag acacatagcc tgcactccgg gtcttttgtc cggtcgggcg 600
gcggccgagc ttttggacgc tttgatcaat gatgtcctaa gcgatgattt tccgtctact 660
acccacttta gcccacctac tcttcacgaa ctgtacgatc tggatgtact ggtggatgtg 720
aacgatccca acgaggaggc ggtttctgcg ttttttcccg agtctgcgct gttggccgct 780
caggagggat ttgacctaca cactccgccg cctattttag agtctccgct gccggagccc 840
agtggtatac cttatatgcc tgaactgctt cccgaagtgg tagacctgac ctgccacgag 900
cctggctttc cgcccagcga cgatgagggt gagccttttg ttttagactt tgctgagata 960
cctgggcacg gttgcaggtc ttgtgcatat catcagaggg ttaccggaga ccccgaggtt 1020
aagtgttcgc tgtgctatat gaggatgacc tcttccttta tctacagtaa gtttttgtct 1080
aggtgggctt ttgggtaggt gggttttgtg tcagaacagg tgtaaacgtt gcttgtgttt 1140
tttgtacctg taggtccggt gtccgagcca gacccggagc ccgaccgcga tcccgagccg 1200
gatcccgagc ctcctcgcag gacaaggaaa ctaccttcca ttctgtgcaa gtctcagaca 1260
cctgtaagga ccagcgaggc agacagcacc gactctggca cttctacctc tccccctgaa 1320
attcacccag tggttcctct gggtatacat aaacctgttg ctgttaaagt ttgcgggcga 1380
cgccctgcag tacagtgcat tgaggacttg cttcacgatc ccgaggaacc tttggacttg 1440
agccttaaac gccctaggca ataaacccca cctaagtaat aaaccccacc taagtaataa 1500
accctgccgc ccttggttat tgagatgacg cccaatgttt gcttttgaat gacttcatgt 1560
gtgtaataaa agtgagtgtg atcataggtc tcttgtttgt ctgggcgggg cttaagggta 1620
tataagtctc ttggggctaa acttggttac acttgacccc aatggaggcg tgggggtgct 1680
tggaggagtt tgcggacgtg cgccgtttgc tggacgagag ctctagcaat acctatacta 1740
tttggaggta tctgtggggc tctactcagg ccaagttggt ttccagaatt aagcaggatt 1800
acaagtgcga ttttgaagag ctttttagtt cctgcggtga gcttttgcaa tccttgaatc 1860
tgggccatca ggctattttc caggaaaagg ttctctcgac tttggatttt tccactcccg 1920
ggcgcaccgc cgcttgtgtg gcttttgtgt cttttgtgca agataaatgg agcgaggaga 1980
cccacctgag tcacggctac gtactggatt tcatggcgat ggctctttgg agggctcaca 2040
acaaatggaa gattcagaag gaactgtacg gttccgccct acgtcgtcca cttctgtcgc 2100
gacaggggct gaggtttccc gaccatcggc agcatcagaa tctggaagac gagtcggagg 2160
agcgagcgga ggagaagatc agcttgagag ccggcctgga ccctcctcag gaggaatgaa 2220
tctcccgcag gtggttgacc tgtttccaga actgagacgg gtcctgacta tcagggagga 2280
tggtcagttt gtgaagaagt ttaagaggga tcggggtgag ggagatgatg aggcggctag 2340
caatttagct tttagtctga tgactcgcca ccgaccggaa tgtattacct atcagcagat 2400
taaggagagt tgtgccaacg agctggatct tttgggtcag aagtatagca tagaacagct 2460
taccacttac tggcttcagc ctggggatga ttgggaagag gcgatcaggg tgtatgcaaa 2520
ggtggccctg cggcccgatt gcaagtataa gattactaag ttggttaata ttagaaactg 2580
ctgctatatt tctgggaacg gggccgaagt ggagatagat actcaggaca gggtggcttt 2640
taggtgttgc atgataaaca tgtggcccgg gatactgggg atggatgggg tggtattcat 2700
gaatgtgagg tttacgggcc ccaactttaa tggcacggtg ttcatgggca acaccaactt 2760
gctcctgcat ggtgcgagtt tctatgggtt taataacacc tgtatagagg cctggaccga 2820
tgtaaaggtt cgaggttgtt ccttttatag ctgttggaag gcggtggtgt gtcgccctaa 2880
aagcaggggt tctgtgaaaa aatgcttgtt tgaaaggtgc accttaggca tcctctctga 2940
gggcaactcc agggtgcgcc ataatgtggc ttcgaactgc ggttgcttca tgcaagtgaa 3000
gggggtgagc gttatcaagc ataactcggt gtgtggaaac tgcgaggatc gcgcctccca 3060
gatgctgacc tgctttgatg gcaactgtca cctgttgaag accattcata taagcagcca 3120
ccccagaaag gcctggcccg tgtttgagca taacatcttg acccgctgct ccttgcatct 3180
gggggtcagg aggggtatgt tcctgcctta ccagtgtaac tttagccaca ctaaaatcct 3240
gctggaaccc gagtgcatga ccaaggtcag cctgaatggt gtgtttgatg tgactctgaa 3300
aatctggaag gtgctgaggt atgatgagac caggaccagg tgccgaccct gcgagtgcgg 3360
cggcaagcac atgagaaatc agcctgtgat gttggatgtg accgaggagc ttaggcctga 3420
ccatctggtg ctggcctgca ccagggccga gtttgggtct agcgatgagg ataccgattg 3480
aggtgggtaa ggtgggcgtg gctagaaggg tggggcgtgt ataaattggg ggtctaaggg 3540
tctctctgtt ttgtcttgca acagccgccg ccatgagcga caccggcaac agctttgatg 3600
gaagcatctt tagcccctat ctgacagtgc gcatgcctca ctgggctgga gtgcgtcaga 3660
atgtgatggg ttccaacgtg gatggacgcc ccgttctgcc ttcaaattcg tctacaatgg 3720
cctacgcgac cgtgggagga actccgctgg acgccgcgac ctccgccgcc gcctccgccg 3780
ccgccgcgac cgcgcgcagc atggctacgg acctttacag ctctttggtg gcgagcggcg 3840
cggcctctcg cgcgtctgct cgggatgaga aactgaccgc tctgctgctt aaactggaag 3900
acttgacccg ggagctgggt caactgaccc agcaggtctc cagcttgcgt gagagcagcc 3960
ttgcctcccc ctaatggccc ataatataaa taaaagccag tctgtttgga ttaagcaagt 4020
gtatgttctt tatttaactc tccgcgcgcg gtaagcccgg gaccagcggt ctcggtcgtt 4080
tagggtgcgg tggattcttt ccaacacgtg gtacaggtgg ctctggatgt ttagatacat 4140
gggcatgagt ccatccctgg ggtggaggta gcaccactgc agagcttcgt gctcgggggt 4200
ggtgttgtat atgatccagt cgtagcagga gcgctgggcg tggtgctgaa aaatgtcctt 4260
aagcaagagg cttatagcta gggggaggcc cttggtgtaa gtgtttacaa atctgctcag 4320
ttgggagggg tgcatccggg gggatataat gtgcatcttg gactggattt ttaggttggc 4380
tatgttccca cccagatccc ttctgggatt catgttgtgc aggaccacca gcacggtata 4440
tccagtgcac ttgggaaatt tatcgtggag cttagacggg aatgcatgga agaacttgga 4500
gacgcccttg tggcctccca gattttccat acattcgtcc atgatgatgg caatgggccc 4560
gtgggaagct gcctgagcaa aaatgtttct gggatcgctc acatcgtagt tatgttccag 4620
ggtgaggtca tcataggaca tctttacgaa tcgggggcgg agggtcccgg actgggggat 4680
gatggtaccc tcgggccccg gggcgtagtt cccctcacag atctgcatct cccaggcttt 4740
catttcagag ggagggatca tatccacctg cggagcgatg aaaaacacag tttctggcgc 4800
aggggagatt aactgggatg agagcaggtt tctgagcagc tgtgactttc cacagccggt 4860
gggcccatat atcacgccta tcaccggctg cagctggtag ttaagagagc tgcagctgcc 4920
gtcctcccgg agcagggggg ccacctcgtt cagcatatcc ctgacgtgga tgttctccct 4980
gaccaattcc gccagaaggc gctcgccgcc cagcgaaagc agctcttgca aggaagcaaa 5040
atttttcagc ggttttaggc cgtcggccgt gggcatgttt ttcagcgtct gggtcagcag 5100
ttccagcctg tcccacagct cggtgatgtg ctctacggca tctcgatcca gcagatctcc 5160
tcgtttcgcg ggttggggcg gctttcgctg tagggcacca gccgatgggc gtccagcggg 5220
gccagagtca tgtccttcca tgggcgcagg gtcctcgtca gggtggtctg ggtcacggtg 5280
aaggggtgcg ctccgggttg ggcgctggcc agggtgcgct tgaggctggt tctgctggtg 5340
ctgaatcgct gccgctcttc gccctgcgcg tcggccaggt agcatttgac catggtctcg 5400
tagtcgagac cctcggcggc gtgccccttg gcgcggagct ttcccttgga ggtggcgccg 5460
cacgaggggc actgcaggct cttcagggcg tagagcttgg gagcgagaaa cacggactct 5520
ggggagtagg cgtccgcgcc gcaggaagcg cagaccgtct cgcattccac cagccaagtg 5580
agctccgggc ggtcagggtc aaaaaccagg ttgcccccat gctttttgat gcgtttctta 5640
cctcggctct ccatgaggcg gtgtcccttc tcggtgacga agaggctgtc cgtgtccccg 5700
tagaccgact tcaggggcct gtcttccagc ggagtgcctc tgtcctcctc gtagagaaac 5760
tctgaccact ctgagacgaa ggcccgcgtc caggccagga cgaaggaggc cacgtgggag 5820
gggtagcggt cgttgtccac tagcgggtcc accttctcca gggtgtgcag gcacatgtcc 5880
ccctcctccg cgtccagaaa agtgattggc ttgtaggtgt aggacacgtg accgggggtt 5940
cccgacgggg gggtataaaa gggggtgggc gccctttcat cttcactctc ttccgcatcg 6000
ctgtctgcga gggccagctg ctggggtaag tattccctct cgaaggcggg catgacctca 6060
gcgctcaggt tgtcagtttc taaaaatgag gaggatttga tgttcacctg tccggaggtg 6120
atacctttga gggtacctgg gtccatctgg tcagaaaaca ctattttttt gttgtcaagc 6180
ttggtggcga acgacccgta gagggcgttg gagagcagct tggcgatgga gcgcagggtc 6240
tggtttttgt cgcggtcggc tcgctccttg gccgcgatgt tgagttgcac gtactcgcgg 6300
gccacgcact tccactcggg gaagacggtg gtgcgctcgt ctgggattag gcgcaccctc 6360
cagcctcggt tgtgcagggt gaccatgtcg acgctggtgg cgacctcgcc gcgcaggcgc 6420
tcgttggtcc agcagaggcg gccgcccttg cgcgagcaga aggggggtag ggggtccagc 6480
tggtcctcgt ttggggggtc cgcgtcgatg gtgaagaccc cggggagcaa gcgcgggtca 6540
aagtagtcga tcttgcaagc ttgcatgtcc agagcccgct gccattcgcg ggcggcgagc 6600
gcgcgctcgt aggggttgag gggcgggccc cagggcatgg ggtgggtgag cgcggaggcg 6660
tacatgccgc agatgtcata cacgtacagg ggttccctga ggatgccgag gtaggtgggg 6720
tagcagcgcc ccccgcggat gctggcgcgc acgtagtcat agagctcgtg ggagggggcc 6780
agcatgttgg gcccgaggtt ggtgcgctgg gggcgctcgg cgcggaaggc gatctgcctg 6840
aagatggcat gggagttgga ggagatggtg ggccgctgga agacgttgaa gcttgcttct 6900
tgcaagccca ccgagtccct gacgaaggag gcgtaggact cgcgcagctt gtgcaccagc 6960
tcggcggtga cctggacgtc gagcgcgcag tagtcgaggg tctcgcggat gatgtcatac 7020
ttatcctccc ccttcttttt ccacagctcg cggttgagga cgaactcttc gcggtctttc 7080
cagtactctt ggaggggaaa cccgtccgtg tccgaacggt aagagcctag catgtagaac 7140
tggttgacgg cctggtaggg gcaacagccc ttctccacgg gcagcgcgta ggcctgcgcc 7200
gccttgcgga gggaggtgtg ggtgagggcg aaagtgtccc tgaccatgac tttgaggtat 7260
tgatgtttga agtctgtgtc atcgcagccg ccctgttccc acagggtgta gtccgtgcgc 7320
tttttggagc gcgggttggg cagggagaag gtgaggtcat tgaagaggat cttccccgct 7380
cgaggcatga agtttctggt gatgcgaaag ggccctggga ccgaggagcg gttgttgatg 7440
acctgggcgg ccaggacgat ctcgtcaaag ccgtttatgt tgtggcccac gatgtagagc 7500
tccaaaaagc ggggctggcc cttgatggag gggagctttt tgagttcctc gtaggtgagc 7560
tcctcgggcg attccaggcc gtgctcctcc agggcccagt cttgcaagtg agggttggcc 7620
gccaggaagg atcgccagag gtcgcgggcc atgagggtct gcaggcggtc gcggaaggtt 7680
ctgaactgtc gccccacggc catcttttcg ggggtgatgc agtagaaggt gagggggtct 7740
ttctcccagg ggtcccatct gagctctcgg gcgaggtcgc gcgcggcggc gaccagagcc 7800
tcgtcgcccc ccagtttcat gaccagcatg aagggcacga gctgcttgcc aaaggctccc 7860
atccaagtgt aggtctctac atcgtaggtg acaaagaggc gctccgtgcg aggatgagag 7920
ccgatcggga agaactggat ctcccgccac cagttggagg attggctgtt gatgtggtga 7980
aagtagaagt cccgtctgcg ggccgagcac tcgtgctggc ttttgtaaaa gcgaccgcag 8040
tactggcagc gctgcacggg ttgtatatct tgcacgaggt gaacctggcg acctctgacg 8100
aggaagcgca gcgggaatct aagtcccccg cctggggtcc cgtgtggctg gtggtcttct 8160
actttggttg tctggccgcc agcatctgtc tcctggaggg cgatggtgga gcagaccacc 8220
acgccgcgag agccgcaggt ccagatctcg gcgctcggcg ggcggagttt gatgacgaca 8280
tcgcgcacat tggagctgtc catggtctcc agctcccgcg gcggcaggtc agctgggagt 8340
tcctggaggt tcacctcgca gagacgggtc aaggcgcggg cagtgttgag atggtatctg 8400
atttcaaggg gcgtgttggc ggcggagtcg atggcttgca ggaggccgca gccccggggg 8460
gccacgatgg ttccccgcgg ggcgcgaggg gaggcggaag ctgggggtgt gttcagaagc 8520
ggtgacgcgg gcgggccccc ggaggtaggg ggggttccgg ccccacaggc atgggcggca 8580
ggggcacgtc ttcgccgcgc gcgggcaggg gctggtgctg gctccgaaga gcgcttgcgt 8640
gcgcgacgac gcgacggttg gtgtcctgta tctgacgcct ctgagtgaag accacgggtc 8700
ccgtgacctt gaacctgaaa gagagttcga cagaatcaat ctcggcatcg ttgacagcgg 8760
cctggcgcag gatctcctgc acgtcgcccg agttgtcctg gtaggcgatc tctgccatga 8820
actgctcgat ctcttcttcc tggagatctc ctcgtccggc gcgctccacg gtggccgcca 8880
ggtcgttgga gatgcgaccc atgagctgtg agaaggcgtt gagcccgccc tcgttccaga 8940
cccggctgta gaccacgccc ccctcggcgt cgcgagcgcg catgaccacc tgggccaggt 9000
tgagctccac gtgtcgcgtg aagacggcgt agttgcgcag gcgctggaaa aggtagttca 9060
gggtggtggc ggtgtgctcg gcgacgaaga agtacatgac ccagcgccgc aacgtggatt 9120
cattgatgtc ccccaaggcc tccaggcgct ccatggcctc gtagaagtcc acggcgaagt 9180
tgaaaaactg ggagttgcga gcggacacgg tcaactcctc ctccagaaga cggatgagct 9240
cggcgacagt gttgcgcacc tcgcgctcga aggccacggg gggcgcttct tcctcttcca 9300
cctcttcttc catgatcgct tcttcttctt cctcagccgg gacgggaggg ggcggcggcg 9360
gcgggggagg ggcgcggcgg cggcggcggc gcaccgggag gcggtcgatg aagcgctcga 9420
tcatctcccc ccgcatgcgg cgcatggtct cggtgacggc gcggccgttc tcccgggggc 9480
gcagctcgaa gacgccgcct ctcatctcgc cgcggggcga gcggccgtga ggtagcgaga 9540
cggcgctgac tatgcatctt aacaattgct gtgtaggtac accgccgagg gacctgattg 9600
agtccagatc caccggatcc gaaaaccttt ggaggaaagc gtctatccag tcgcagtcgc 9660
aaggtaggct gagcaccgtg gcgggcgggg gcgggtctgg agagttcctg gcggagatgc 9720
tgctgatgat gtaattaaag taggcggtct tgagaaggcg gatggtggac aggagcacca 9780
tgtctttggg tccggcctgt tggatgcgga ggcggtcggc catgccccag gcctcgttct 9840
gacaccggcg caggtctttg tagtagtctt gcatgagtct ttccaccggc acctcttctc 9900
cttcctcttc tccatctcgc cggtggtttc tcgcgccgcc catgcgcgtg accccaaagc 9960
ccctgagcgg ctgcagcagg gccaggtcgg cgaccacgcg ctcggccaag atggcctgct 10020
gcacctgagt gagggtcctc tcgaagtcat ccatgtccac gaagcggtgg taggcgcccg 10080
tgttgatggt gtaggtgcag ttggccatga cggaccagtt gacggtctgg tgtcccggct 10140
gcgagagctc cgtgtaccgc aggcgcgaga aggcgcggga atcgaacacg tagtcgttgc 10200
aagtccgcac cagatactgg tagcccacca ggaagtgcgg cggaggttgg cgatagaggg 10260
gccagcgctg ggtggcgggg gcgccgggcg ccaggtcttc cagcatgagg cggtggtatc 10320
cgtagatgta cctggacatc caggtgatgc cggcggcggt ggtggtggcg cgcgcgtagt 10380
cgcggacccg gttccagatg tttcgcaggg gcgagaagtg ttccatggtc ggcacgctct 10440
ggccggtgag gcgcgcgcag tcgttgacgc tctatacaca cacaaaaacg aaagcgttta 10500
cagggctttc gttctgtagc ctggaggaaa gtaaatgggt tgggttgcgg tgtgccccgg 10560
ttcgagacca agctgagctc ggccggctga agccgcagct aacgtggtat tggcagtccc 10620
gtctcgaccc aggccctgta tcctccagga tacggtcgag agcccttttg ctttcttggc 10680
caagcgcccg tggcgcgatc tgggatagat ggtcgcgatg agaggacaaa agcggctcgc 10740
ttccgtagtc tggagaaaca atcgccaggg ttgcgttgcg gcgtaccccg gttcgagccc 10800
ctatggcggc ttgaatcggc cggaaccgcg gctaacgagg gccgtggcag ccccgtcctc 10860
aggaccccgc cagccgactt ctccagttac gggagcgagc cccttttgtt ttttattttt 10920
tagatgcatc ccgtgctgcg gcagatgcgc ccctcgcccc ggcccgatca gcagcagcaa 10980
cagcaggcat gcagaccccc ctctcccctt tccgccccgg tcaccacggc cgcggcggcc 11040
gtgtcgggcg cggggggcgc gctggagtca gatgagccac cgcggcggcg acctaggcag 11100
tatctggact tggaagaggg cgagggactg gcgcggctgg gggcgaactc tccagagcgc 11160
cacccgcggg tgcagttgaa aagggacgcg cgcgaggcgt acctgccgcg gcagaacctg 11220
tttcgcgacc gcgggggcga ggagcccgag gagatgcgag actgcaggtt ccaagcgggg 11280
cgcgagctgc ggcgcgggct ggacagacag cgcctgctgc gcgaggagga ctttgagccc 11340
gacacgcaga cgggcatcag ccccgcgcgc gcgcacgtag ccgcggccga cctggtgacc 11400
gcctacgagc agacggtaaa ccaggagcgc aacttccaaa agagcttcaa caaccacgtg 11460
cgcacgctgg tggcgcgcga ggaggtgacc ctgggtctca tgcatctgtg ggacctggtg 11520
gaggcgatcg tgcagaaccc cagcagcaag cccctgaccg cgcagctgtt cctggtggtg 11580
cagcacagca gggacaacga ggccttcagg gaggcgctgc tgaacatcac cgagccggag 11640
gggcgctggc tcctggacct gataaacatc ctgcagagca tagtggtgca ggagcgcagc 11700
ctgagcctgg ccgagaaggt ggcggccatc aactactcta tgctgagcct gggcaagttc 11760
tacgcccgca agatctacaa gaccccctac gtgcccatag acaaggaggt gaagatagac 11820
agcttctaca tgcgcatggc gctgaaggtg ctgaccctga gcgacgacct gggagtgtac 11880
cgcaacgagc gcatccacaa ggccgtgagc gccagccggc ggcgcgagct gagcgaccgc 11940
gagctgatgc acagtctgca gcgcgcgctg accggcgcgg gcgagggcga cagggaggtc 12000
gagtcctact tcgacatggg ggccgacctg cactggcagc cgagccgccg cgccctggag 12060
gcggcggggg cgtacggcgg ccccctggcg gccgatgacc aggaagagga ggactatgag 12120
ctagaggagg gcgagtacct ggaggactga cctggctggt ggtgttttgg tatagatgca 12180
agatccgaac gtggcggacc cggcggtccg ggcggcgctg caaagccagc cgtccggcat 12240
taactcctct gacgactggg ccgcggccat gggtcgcatc atggccctga ccgcgcgcaa 12300
ccccgaggct ttcaggcagc agcctcaggc caaccggctg gcggccatct tggaagcggt 12360
agtgcccgcg cgctccaacc ccacccacga gaaggtgctg gccatagtca acgcgctggc 12420
ggagagcagg gccatccgcg cggacgaggc cggactggtg tacgatgcgc tgctgcagcg 12480
ggtggcgcgg tacaacagcg gcaacgtgca gaccaacctg gaccgcctgg tgacggacgt 12540
gcgcgaggcc gtggcgcagc gcgagcgctt gcatcaggac ggtaacctgg gctcgctggt 12600
ggcgctaaac gccttcctca gcacccagcc ggccaacgta ccgcgggggc aggaggacta 12660
caccaacttt ttgagcgcgc tgcggctgat ggtgaccgag gtccctcaga gcgaggtgta 12720
ccagtcgggg cccgactact tcttccagac cagcagacag ggcttgcaaa ccgtgaacct 12780
gagccaggct ttcaagaacc tgcgggggct gtggggagtg aaggcgccca ccggcgaccg 12840
ggctacggtg tccagcctgc taacccccaa ctcgcgcctg ctgctgctgc tgatcgcgcc 12900
cttcacggac agcgggagcg tctcgcggga gacctatctg ggccacctgc tgacgctgta 12960
ccgcgaggcc atcgggcagg cgcaggtgga cgagcacacc ttccaagaga tcaccagcgt 13020
gagccacgcg ctggggcagg aggacacggg cagcctgcag gcgaccctga actacctgct 13080
gaccaacagg cggcagaaga ttcccacgct gcacagcctg acccaggagg aggagcgcat 13140
cttgcgctac gtgcagcaga gcgtgagcct gaacctgatg cgcgacggcg tgacgcccag 13200
cgtggcgctg gacatgaccg cgcgcaacat ggaaccgggc atgtacgcct cccaccggcc 13260
gtttatcaac cgcctgatgg actacttgca tcgggcggcg gccgtgaacc ccgagtactt 13320
cactaatgcc attctgaatc cccactggat gccccctccg ggtttctaca acggggactt 13380
tgaggtgccc gaggtcaacg acgggttcct ctgggatgac atggatgaca gtgtgttctc 13440
acccaacccg ctgcgcgccg cgtctctgcg attgaaggag ggctctgaca gggaaggacc 13500
gaggagtctg gcctcctccc tggctctggg agcggtgggc gccacgggcg cggcggcgcg 13560
gggcagtagc cccttcccca gcctggcaga ctctctgaac agcgggcggg tgagcaggcc 13620
ccgcttgcta ggcgaggagg agtatctgaa caactccctg ctgcagcccg cgagggacaa 13680
gaacgctcag cggcagcagt ttcccaacaa tgggatagag agcctggtgg acaagatgtc 13740
cagatggaag acgtatgcgc aggagtacaa ggagtgggag gaccgccagc cgcggccctt 13800
gccgccccct aggcagcgct ggcagcggcg cgcgtccaac cgccgctgga ggcaggggcc 13860
cgaggacgat gatgactctg cagatgacag cagcgtgttg gacctgggcg ggagcgggaa 13920
ccccttttcg cacctgcgcc cacgcctggg caagatgttt taaaagaaaa aaaaaataaa 13980
actcaccaag gccatggcga cgagcgttgg ttttttgttc ccttccttag tatgcggcgc 14040
gcggcgatgt tcgaggaggg gcctcccccc tcttacgaga gcgcgatggg gatttctcct 14100
gcggcgcccc tgcagcctcc ctacgtgcct cctcggtacc tgcaacctac aggggggaga 14160
aatagcatct gttactctga gctgcagccc ctgtacgata ccaccagact gtacctggtg 14220
gacaacaagt ccgcggacgt ggcctccctg aactaccaga acgaccacag cgattttttg 14280
accacggtga tccaaaacaa cgacttcacc ccaaccgagg ccagcaccca gaccataaac 14340
ctggataaca ggtcgaactg gggcggcgac ctgaagacca tcttgcacac caacatgccc 14400
aacgtgaacg agttcatgtt caccaactct tttaaggcgc gggtgatggt ggcgcgcgag 14460
cagggggagg cgaagtacga gtgggtggac ttcacgctgc ccgagggcaa ctactcagag 14520
accatgactc tcgacctgat gaacaatgcg atcgtggaac actatctgaa agtgggcagg 14580
cagaacgggg tgaaggaaag cgatatcggg gtcaagtttg acaccagaaa cttccgtctg 14640
ggctgggacc ccgtgaccgg gctggtcatg ccgggggtct acaccaacga ggcctttcat 14700
cccgacatag tgcttctgcc cggctgtggg gtggacttca cccagagccg gctgagcaac 14760
ctgctgggca ttcgcaagcg gcagcctttc caggagggtt tcaagatcac ctatgaggat 14820
ctgaaggggg gcaacattcc cgcgctcctt gatctggacg cctacgagga gagcttgaaa 14880
cccgaggaga gcgctggcga cagcggcgag agtggcgagg agcaagccgg cggcggtggc 14940
ggcgcgtcgg tagaaaacga aagtacgccc gcagtggcgg cggacgctgc ggaggtcgag 15000
ccggaggcca tgcagcagga cgcagaggag ggcgcacagg agggcgcgca gaaggacatg 15060
aacgatgggg agatcagggg agacacattc gccacccggg gcgaagaaaa agaggcagag 15120
gcggcggcgg cggcgacggc ggaggccgaa accgaggttg aggcagaggc agagcccgag 15180
accgaagtta tggaagacat gaatgatgga gaacgtaggg gcgacacgtt cgccacccgg 15240
ggcgaagaga aggcggcgga ggcagaagcc gcggctgagg aggcggctgc ggctgcggcc 15300
aagactgagg ctgcggctaa ggctgaggtc gaagccaatg ttgcggttga ggctcaggct 15360
gaggaggagg cggcggctga agcagttaag gaaaaggccc aggcagagca ggaagagaaa 15420
aaacctgtca ttcaacctct aaaagaagat agcaaaaagc gcagttacaa cgtcatcgag 15480
ggcagcacct ttacccagta ccgcagctgg tacctggcgt acaactacgg cgacccggtc 15540
aagggggtgc gctcgtggac cctgctctgc acgccggacg tcacctgcgg ctccgagcag 15600
atgtactggt cgctgccgaa catgatgcaa gacccggtga ccttccgctc cacgcggcag 15660
gttagcaact tcccggtggt gggcgccgaa ctgctgcccg tgcactccaa gagtttttac 15720
aacgagcagg ccgtctactc ccagctgatc cgccaggcca cctctctgac ccacgtgttc 15780
aatcgctttc ccgagaacca gattttggcg cgcccgccgg cccccaccat caccaccgtg 15840
agtgaaaacg ttcctgccct cacagatcac gggacgctac cgctgcgcaa cagcatctca 15900
ggagtccagc gagtgaccat tactgacgcc agacgccgga cctgccccta cgtttacaag 15960
gccttgggca tagtctcgcc gcgcgtcctc tccagtcgca ctttttaaaa cacatctacc 16020
cacacgttcc aaaatcatgt ccgtactcat ctcacccagc aacaacaccg gctgggggct 16080
gcgcgcgccc agcaagatgt ttggaggggc gaggaagcgc tccgaccagc accctgtgcg 16140
cgtgcgcggc cactaccgcg cgccctgggg agcgcacaag cgcgggcgca cagggcgcac 16200
cactgtggac gacgtcattg actccgtagt ggagcaagcg cgccactaca cacccggcgc 16260
gccgaccgcc cccgccgtgt ccaccgtgga ccaggcgatc gaaagcgtgg tacagggcgc 16320
gcggcactat gccaacctta aaagtcgccg ccgccgcgtg gcccgccgcc atcgccggag 16380
accccgggcc accgccgccg cgcgccttac taaggctctg ctcaggcgcg ccaggcgaac 16440
tggccaccgg gccgccatga gggccgcacg gcgggctgcc gctgccgcaa gcgtcgtggc 16500
cccgcgggca cgaaggcgcg cggccgctgc cgccgccgcc gccatttcca gcttggcctc 16560
gacgcggcgc ggtaacatat actgggtgcg cgactcggta accggcacgc gggtacccgt 16620
gcgctttcgc cccccgcgga attagcacaa gacaacatac acactgagtc tcctgctgtt 16680
gtgtatccca gcggcgaccg tcagcagcgg cgacatgtcc aagcgcaaaa ttaaagaaga 16740
gatgctccag gtcatcgcgc cggagatcta tgggcccccg aagaaggagg aggatgatta 16800
caagccccgc aagctaaagc gggtcaaaaa gaaaaagaaa gatgatgatg acgaggcggt 16860
ggagtttgtc cgccgcatgg cacccaggcg ccccgtgcag tggaagggcc ggcgcgtgca 16920
gcgcgttttg cgccccggca ccgcggtggt cttcacgccc ggcgagcgct ccacgcgcac 16980
tttcaagcgg gtgtacgatg aggtgtacgg cgacgaggac ctgttggagc aggccaacca 17040
gcgctttggg gagtttgcat atgggaaacg gccccgcgag agtctaaaag aggacctgct 17100
ggcgctaccg ctggacgagg gcaatcccac cccgagtctg aagccggtaa ccctgcaaca 17160
ggtgctgcct ttgagcgcgc ccagcgagca taagcgaggg ttgaagcgcg aaggcgggga 17220
cctggcgccc accgtgcagt tgatggtgcc caagcggcag aagctggagg acgtgctgga 17280
gaaaatgaaa gtagagcccg ggatccagcc cgagatcaag gtccgcccca tcaagcaggt 17340
ggcgcccggc gtgggagtcc agaccgtgga cgttaggatt cccacggagg agatggaaac 17400
ccaaaccgcc actccctctt cggcggccag cgccaccacc ggcaccgctt cggtagaggt 17460
gcagacggac ccctggctac ccgccaccgc tgttgccgcc gccgcccccc gttcgcgcgg 17520
gcgcaagaga aattatccag cggccagcgc gctcatgccc cagtacgcac tgcatccatc 17580
catcgtgccc acccccggct accgcgggta ctcgtaccgc ccgcgcagat cagccggcac 17640
tcgcggccgc cgccgccgtg cgaccacaac cagccgccgc cgtcgccgcc gccgccagcc 17700
agtgctgacc cccgtgtctg taaggaaggt ggctcgctcg gggagcacgc tggtggtgcc 17760
cagagcgcgc taccacccca gcatcgttta aagccggtct ctgtatggtt cttgcagata 17820
tggccctcac ttgtcgcctc cgcttcccgg tgccgggata ccgaggaaga actcaccgcc 17880
gcagaggcat ggcgggcagc ggtctccgcg gcggccgtcg ccatcgccgg cgcgcaaaaa 17940
gcaggcgcat gcgcggcggt gtgctgcctc tgctaatccc gctaatcgcc gcggcgatcg 18000
gtgccgtacc cgggatcgcc tccgtggccc tgcaggcgtc ccagaaacgt tgactcttgc 18060
aaccttgcaa gcttgcattt tttggaggaa aaataaaaaa aagtctagac tctcacgctc 18120
gcttggtcct gtgactattt tgtagaaaaa aagatggaag acatcaactt tgcgtcgctg 18180
gccccgcgtc acggctcgcg cccgttcatg ggagactgga cagatatcgg caccagcaat 18240
atgagcggtg gcgccttcag ctggggcagt ctgtggagcg gccttaaaaa ttttggttcc 18300
accattaaga actatggcaa caaagcgtgg aacagcagca cgggccagat gctgagagac 18360
aagttgaaag agcagaactt ccaggagaag gtggcgcagg gcctggcctc tggcatcagc 18420
ggggtggtgg acatagctaa ccaggccgtg cagaaaaaga taaacagtca tctggacccc 18480
cgtcctcagg tggaggaaat gcctccagcg atggagacgg tgtctcccga gggcaaaggc 18540
gaaaagcgcc cgcggcccga cagagaagag accctggtgt cacacaccga ggagccgccc 18600
tcttacgagg aggcagtcaa ggccggcctg cccaccactc gccccatagc ccccatggcc 18660
accggtgtgg tgggccacag gcaacacact cccgcaacac tagatctgcc cccgccgtcc 18720
gagccgccgc gccagccaaa ggcggcgacg gtgcccgctc cctccacttc cgccgccaac 18780
agagtgcccc tgcgccgcgc cgcgagcggc ccccgggcct cgcgagttag cggcaactgg 18840
cagagcacac tgaacagcat cgtgggcctg ggagtgagga gtgtgaagcg ccgccgttgc 18900
tactgaatga gcaagctagc taacgtgttg tatgtgtgta tgcgtcctat gtcgccgcca 18960
gaggagctgt tgagccgccg gcgccgtctg cactccagcg aatttcaaga tggcgacccc 19020
atcgatgatg cctcagtggt cgtacatgca catctcgggc caggacgctt cggagtacct 19080
gagccccggg ctggtgcagt tcgcccgcgc cacagacacc tacttcaaca tgagtaacaa 19140
gttcaggaac cccactgtgg cgcccaccca cgatgtgacc acggaccggt cgcagcgcct 19200
gacgctgcgg ttcatccccg tggatcggga ggacaccgcc tactcttaca aggcgcggtt 19260
cacgctggcc gtgggcgaca accgcgtgct ggacatggcc tccacttact ttgacatcag 19320
gggggtgctg gacaggggcc ccaccttcaa gccctactcg ggtactgcct acaactccct 19380
ggcccccaag ggcgctccca attcttgcga gtgggaacaa gatgaaccag ctcaggcagc 19440
aatagctgaa gatgaagaag aacttgaaga agaacaagct caggacgaac aggcgcccac 19500
taagaaaacc catgtatacg cccaggcacc tctttctggt gaaaaaatta ctaaggatgg 19560
tttgcaaata ggtgtggatg ccacacaggc gggagataac cctatatatg ctgataaaac 19620
attccaaccc gaacctcaga taggtgagtc tcagtggaac gaggctgatg ccacagtagc 19680
aggaggcaga gtcttaaaaa agaccacccc tatgagacct tgctatggat cctatgccaa 19740
acctactaat gccaatggcg gtcaagggat catggtggcc aatgatcagg gagcgcttga 19800
atctaaagtt gagatgcaat ttttctccac cacaacgtct cttaatgtaa gggaaggtga 19860
aaacaatctt cagccaaaag tagtgctata cagcgaagat gttaacttgg aatcccctga 19920
cactcatttg tcttacaaac ctaaaaagga tgacaccaac tctaaaatca tgttgggtca 19980
gcaagccatg cccaacagac ccaacctcat tgcttttagg gacaacttta ttggacttat 20040
gtactacaac agcacaggca acatgggagt gctggcagga caggcctccc agctaaacgc 20100
tgtggtagac ttgcaagaca gaaacacaga gctgtcatac caactgatgc ttgattccat 20160
tggagacaga tcaagatact tttccatgtg gaaccaggca gtggacagct atgacccaga 20220
tgtcagaatc attgaaaacc atggggttga agatgagctg cccaactatt gctttcccct 20280
gggcggtatt ggaattacag acacatacca gtgcataaaa ccaaccgcag ctgctaataa 20340
cactacatgg tctaaggatg aagaatttag tgatcgcaat gaaatagggg tgggaaacaa 20400
cttcgccatg gagatcaaca tccaggccaa cctctggagg aacttcctct atgcgaacgt 20460
ggggctctac ctgccagaca agctcaagta caaccccacc aacgtggaca tctctgacaa 20520
ccccaacacc tatgactaca tgaacaagcg tgtggtggct cccggcctgg tggactgctt 20580
tgtcaatgtg ggagccaggt ggtccctgga ctacatggac aacgtcaacc ccttcaacca 20640
ccaccgcaat gcgggtctgc gctaccgctc catgatcctg ggcaacgggc gctacgtgcc 20700
cttccacatt caggtgcccc agaagttctt tgccatcaag aacctcctcc tcctgccggg 20760
ctcctacact tacgagtgga acttcaggaa ggatgtcaac atggtcctgc agagctctct 20820
gggcaatgac cttagggtgg acggggccag catcaagttt gacagcgtca ccctctatgc 20880
taccttcttc cccatggctc acaacaccgc ctccacgctc gaggccatgc tgaggaacga 20940
caccaacgac cagtccttca atgactacct ctctggggcc aacatgctct accccatccc 21000
cgccaaggcc accaacgtgc ccatctccat tccctctcgc aactgggccg ccttcagagg 21060
ctgggccttt acccgcctta agaccaagga aaccccctcc ctgggctcgg gttttgaccc 21120
ctactttgtc tactcgggat ccatccccta cctggatggc accttctacc tcaaccacac 21180
ttttaagaag atatccatca tgtatgactc ctccgtcagc tggccgggca atgaccgcct 21240
gctcaccccc aatgagttcg aggtcaagcg cgccgtggac ggcgagggct acaacgtggc 21300
ccagtgcaac atgaccaagg actggttcct ggtgcagatg ctggccaact acaacatagg 21360
ctaccagggc ttctacatcc cagagagcta caaggacagg atgtactcct tcttcagaaa 21420
tttccaaccc atgagcaggc aggtggtgga cgagaccaaa tacaaggact atcaggccat 21480
tggcatcact caccagcaca acaactcggg attcgtgggc tacctggctc ccaccatgcg 21540
cgaggggcag gcctaccccg ccaacttccc ctacccgttg ataggcaaaa ccgcggtcga 21600
cagcgtcacc cagaaaaagt tcctctgcga ccgcaccctc tggcgcatcc ccttctctag 21660
caacttcatg tccatgggtg cgctcacgga cctgggccag aacctgctct atgccaactc 21720
cgcccatgcg ctggacatga cttttgaggt ggaccccatg gacgagccca cccttctcta 21780
tattgtgttt gaagtgttcg acgtggtcag agtgcaccag ccgcaccgcg gtgtcatcga 21840
gaccgtgtac ctgcgcacgc ccttctcggc cggcaacgcc accacctaag gagacagcgc 21900
cgccgcctgc atgacgggtt ccaccgagca agagctcagg gccatcgcca gagacctggg 21960
atgcggaccc tattttttgg gcacctatga caaacgcttc ccgggcttca tctcccgaga 22020
caagctcgcc tgcgccatcg tcaacacggc cgcgcgcgag accgggggcg tgcactggct 22080
ggcctttggc tgggacccgc gctccaaaac ctgctacctc ttcgacccct ttggcttctc 22140
cgatcagcgc ctcagacaga tctatgagtt tgagtacgag gggctgctgc gccgcagcgc 22200
gcttgcctcc tcgcccgacc gctgcatcac ccttgagaag tccaccgaga ccgtgcaggg 22260
gccccactcg gccgcctgcg gtctcttctg ctgcatgttt ttgcacgcct ttgtgcgctg 22320
gccccagagt cccatggatc gcaaccccac catgaacttg ctcaagggag tgcccaacgc 22380
catgctccag agcccccagg tccagcccac cctgcgccac aaccaggaac agctctaccg 22440
cttcctggag cgccactccc cctacttccg cagtcacagc gcgcacatcc ggggggccac 22500
ctctttctgc cacttgcaag aaaacatgca agacggaaaa tgatgtacag ctcgcttttt 22560
aataaatgta aagactgtgc actttattta tacacgggct ctttctggtt atttattcaa 22620
caccgccgtc gccatctaga aatcgaaagg gttctgccgc gcgtcgccgt gcgccacggg 22680
cagagacacg ttgcgatact ggaagcggct cgcccactta aactcgggca ccaccatgcg 22740
gggcagtggt tcctcgggga agttctcgcc ccacagggtg cgggtcagct gcagcgcgct 22800
caggaggtcg ggagccgaga tcttgaagtc gcagttgggg ccggaaccct gcgcgcgcga 22860
gttgcggtac acggggttgc agcactggaa caccagcagg gccggattat gcacgctggc 22920
cagcaggctc tcgtcgctga tcatgtcgct gtccagatcc tccgcgttgc tcagggcgaa 22980
cggggtcatc ttgcagacct gcctgcccag gaaaggcggc agcccgggct tgccgttgca 23040
gtcgcagcgc aggggcatca gcaggtgccc gcggcccgac tgcgcctgcg ggtacagcgc 23100
gcgcatgaag gcttcgatct gcctgaaagc cacctgcgtc ttggctccct ccgaaaagaa 23160
catcccacag gacttgctgg agaactggtt cgcgggacag ctggcatcgt gcaggcagca 23220
gcgcgcgtcg gtgttggcga tctgcaccac gttgcgaccc caccggttct tcactatctt 23280
ggccttggaa gcctgctcct tcagcgcgcg ctggccgttc tcgctggtca catccatctc 23340
tatcacctgc tccttgttga tcatgtttgt accgtgcaga cacttcaggt cgccctccgt 23400
ctgggtgcag cggtgctccc acagcgcgca accggtgggc tcccaatttt tgtgggtcac 23460
ccccgcgtag gcctgcaggt aggcctgcaa gaagcgcccc atcatggcca caaaggtctt 23520
ctggctcgta aaggtcagct gcaggccgcg atgctcttcg ttcagccagg tcttgcagat 23580
ggcggccagc gcctcggtct gctcgggcag catcctaaaa tttgtcttca ggtcgttatc 23640
cacgtggtac ttgtccatca tggcgcgcgc cgcctccatg cccttctccc aggcggacac 23700
catgggcagg cttagggggt ttatcacttc caccggcgag gacaccgtac tttcgatttc 23760
ttcttcctcc ccctcttccc ggcgcgcgcc cacgctgctg cgcgctctca ccgcctgcac 23820
caaggggtcg tcttcaggca agcgccgcac cgagcgcttg ccgcccttga cctgcttaat 23880
cagcaccggc gggttgctga agcccaccat ggtcagcgcc gcctgctctt cttcgtcttc 23940
gctgtctacc actatctctg gggaagggct tctccgctct gcggcggcgc gcttcttttt 24000
tttcttggga gcggccgtga tggagtccgc cacggcgacg gaggtcgagg gcgtggggct 24060
gggggtgcgc ggtaccaggg cctcgtcgcc ctcggactct tcctctgact ccaggcggcg 24120
gcggagtcgc ttctttgggg gcgcgcgcgt cagcggcggc ggagacgggg acggggacgg 24180
ggacgggacg ccctccacag ggggtggtct tcgcgcagac ccgcggccgc gctcgggggt 24240
cttctcgagc tggtcttggt cccgactggc cattgtatcc tcctcctcct aggcagagag 24300
acataaggag tctatcatgc aagtcgagaa ggaggagagc ttaaccaccc cctctgagac 24360
cgccgatgcg cccgccgtcg ccgtcgcccc cgctgccgcc gacgcgcccg ccacaccgag 24420
cgacaccccc gcggaccccc ccgccgacgc acccctgttc gaggaagcgg ccgtggagca 24480
ggacccgggc tttgtctcgg cagaggagga tttgcgagag gaggaggata aggagaagaa 24540
gccctcagtg ccaaaagatg ataaagagca agacgagcac gacgcagatg cacaccaggg 24600
tgaagtcggg cggggggacg gagggcatga cggcgccgac tacctagacg aagggaacga 24660
cgtgctcttg aagcacctgc atcgtcagtg cgccattgtt tgcgacgctc tgcaggagcg 24720
cagcgaagtg cccctcagcg tggcggaggt cagccacgcc tacgagctca gcctcttctc 24780
cccccgggtg cccccccgcc gccgcgaaaa cggcacatgc gagcccaacc cgcgcctcaa 24840
cttctacccc gcctttgtgg tacccgaggt cctggccacc tatcacatct tctttcaaaa 24900
ttgcaagatc cccctctcgt gccgcgccaa ccgtagccgc gccgataaga tgctggccct 24960
gcgccagggc gaccacatac ctgatatcgc cgctttggaa gatgtaccaa agatcttcga 25020
gggtctgggt cgcaacgaga agcgggcagc aaactctctg caacaggaaa acagcgaaaa 25080
tgagagtcac accggggtac tggtggagct cgagggcgac aacgcccgcc tggcggtggt 25140
caagcgcagc atcgaggtca cccactttgc ctaccccgcg ctaaacctgc cccccaaagt 25200
catgaacgcg gccatggacg ggctgatcat gcgccgcggc cggcccctcg ctccagatgc 25260
aaacttgcat gaggagaccg aggacggcca gcccgtggtc agcgacgagc agctggcgcg 25320
ctggctggag accgcggacc ccgccgaact ggaggagcgg cgcaagatga tgatggccgt 25380
ggtgctggtc accgtagagc tggagtgtct gcagcgcttc ttcggcgacc ccgagatgca 25440
gagaaaggtc gaggagaccc tgcactacac cttccgccag ggctacgtgc gccaggcttg 25500
caagatctcc aacgtggagc tcagcaacct ggtgtcctac ctgggcatct tgcatgagaa 25560
ccgcctcggg cagagcgtgc tgcactccac cctgcgcggg gaggcgcgcc gcgactacgt 25620
gcgcgactgc gtttacctct tcctctgcta cacctggcag acggccatgg gggtctggca 25680
gcagtgcctg gaggagcgca acctcaagga gctggagaag ctcctgcagc gcgcgctcaa 25740
agatctctgg acgggctaca acgagcgctc ggtggccgcc gcgctggccg acctcatctt 25800
ccccgagcgc ctgctcaaaa ccctccagca ggggctgccc gacttcacca gccaaagcat 25860
gttgcaaaac ttcaggaact ttatcctgga gcgttctggc atcctacccg ccacctgctg 25920
cgccctgccc agcgactttg tccccctcgt gtaccgcgag tgccccccgc cgctgtgggg 25980
tcactgctac ctgttccaac tggccaacta cctgtcctac cacgcggacc tcatggagga 26040
ctccagcggc gaggggctca tggagtgcca ctgccgctgc aacctctgca cgccccaccg 26100
ctccctggtc tgcaacaccc aactgctcag cgagagtcag attatcggta ccttcgagct 26160
acagggtccg tcctcctcag acgagaagtc cgcggctccg gggctaaaac tcactccggg 26220
gctgtggact tccgcctacc tgcgcaaatt tgtacctgaa gactaccacg cccacgagat 26280
caggttttac gaagaccaat cccgcccgcc caaggcggag ctgaccgcct gcgtcatcac 26340
ccagggcgag atcctaggcc aattgcaagc catccaaaaa gcccgccaag actttttgct 26400
gaagaagggt cggggggtgt atctggaccc ccagtcgggt gaggagctca acccggttcc 26460
cccgctgccg ccgccgcggg accttgcttc ccaggataag catcgccatg gctcccagaa 26520
agaagcagca gcggccgcca ctgccgccac cccacatgct ggaggaagag gaggaatact 26580
gggacagtca ggcagaggag gtttcggacg aggaggagcc ggagacggag atggaagagt 26640
gggaggagga cagcttagac gaggaggctt ccgaagccga agaggcagac gcaacaccgt 26700
caccctcggc cgcagccccc tcgcaggcgc ccccgaagtc cgctcccagc atcagcagca 26760
acagcagcgc tataacctcc gctcctccac cgccgcgacc cacggccgac cgcagaccca 26820
accgtagatg ggacaccacc ggaaccgggg ccggtaagtc ctccgggaga ggcaagcaag 26880
cgcagcgcca aggctaccgc tcgtggcgcg ctcacaagaa cgccatagtc gcttgcttgc 26940
aagactgcgg ggggaacatc tccttcgccc gccgcttcct gctcttccac cacggtgtgg 27000
ccttcccccg taacgtcctg cattactacc gtcatctcta cagcccctac tgcggcggca 27060
gtgagccaga gacggtcggc ggcggcggcg gcgcccgttt cggcgcctag gaagacccag 27120
ggcaagactt cagccaagaa actcgcggcg gccgcggcga acgcggtcgc gggggccctg 27180
cgcctgacgg tgaacgaacc cctgtcgacc cgcgaactga ggaaccgaat cttccccact 27240
ctctatgcca tcttccagca gagcagaggg caggatcagg aactgaaagt aaaaaacagg 27300
tctctgcgct ccctcacccg cagctgtctg tatcacaaga gcgaagacca gcttcggcgc 27360
acgctggagg acgctgaggc actcttcagc aaatactgcg cgctcactct taaggactag 27420
ctccgcgccc ttctcgaatt taggcgggaa cgcctacgtc atcgcagcgc cgccgtcatg 27480
agcaaggaca ttcccacgcc atacatgtgg agctatcagc cgcagatggg actcgcggcg 27540
ggcgcctccc aagactactc cacccgcatg aactggctca gtgccggccc acacatgatc 27600
tcacaggtta atgatatccg cacccatcga aaccaaatat tggtggagca ggcggcaatt 27660
accaccacgc cccgcaataa tcccaacccc agggagtggc ccgcgtccct ggtgtatcag 27720
gaaattcccg gccccaccac cgtactactt ccgcgtgatt cccaggccga agtccaaatg 27780
actaactcag gggcacagct cgcgggcggc tgtcgtcaca gggtgcggcc tcctcgccag 27840
ggtataactc acctggagat ccgaggcaga ggtattcagc tcaacgacga gtcggtgagc 27900
tcctcgctcg gtctcagacc tgacgggacc ttccagatag ccggagccgg ccgatcttcc 27960
ttcacgcccc gccaggcgta cctgactctg caaagctcgt cctcggcgcc gcgctcgggc 28020
ggcatcggga ctctccagtt cgtgcaggag tttgtgccct cggtctactt caaccccttc 28080
tcgggctctc ccggtcgcta cccggaccag ttcatctcga actttgacgc cgcgagggac 28140
tcggtggacg gctacgactg aatgtcgggt ggacccggtg cagagcaact tcgcctgaag 28200
cacctcgacc actgccgccg ccctcagtgc tttgcccgct gtcagaccgg tgagttccag 28260
tacttttccc tgcccgactc gcacccggac ggcccggcgc acggggtgcg ctttttcatc 28320
ccgagtcagg tgcgctctac cctaatcagg gagtttaccg cccgtcccct actggcggag 28380
ttggaaaagg ggccttctat cctaaccatt gcctgcatct gctctaaccc tggattgcac 28440
caagatcttt gctgtcattt gtgtgctgag tataataaag gctgagatca gaatctactc 28500
gggctcctgt cgccatcctg tcaacgccac cgtccaagcc cggcccgatc agcccgaggt 28560
gaacctcacc tgcggtctgc accggcgcct gaggaaatac ctagcttggt actacaacag 28620
cactcccttt gtggtttaca acagctttga ccaggacggg gtctcactga gggataacct 28680
ctcgaacctg agctactcca tcaggaagaa cagcaccctc gagctacttc ctccttacct 28740
gcccgggact taccagtgtg tcaccggtcc ctgcacccac acccacctgt tgatcgtaaa 28800
cgactctctt ccgagaacag acctcaataa ctcctcttcg cagttcccca gaacaggagg 28860
tgagctcagg aaaccccggg taaagaaggg tggacgagag ttaacacttg tggggtttct 28920
ggtgtatgtg acgctggtgg tggctctttt gattaaggct tttccttcca tgtctgaact 28980
ctccctcttc ttttatgaac aactcgacta gtgctaacgg gaccctaccc aacgaatcgg 29040
gattgaatat cggtaaccag gttgcagttt cacttttgat taccttcata gtcctcttcc 29100
tgctagtgct gtcgcttctg tgcctgcgga tcgggggctg ctgcatccac gtttatatct 29160
ggtgctggct gtttagaagg ttcggagacc atcgcaggta gaataaacat gctgctgctt 29220
accctctttg tcctggcgct ggccgccagc tgccaagcct tttccgaggc tgactttata 29280
gagccccagt gtaatgtgac ttttaaagcc catgcacagc gttgtcatac tataatcaaa 29340
tgtgccaccg aacacgatga ataccttatc cagtataaag ataaatcaca caaagtggca 29400
cttgttgaca tctggaaacc cgaagaccct ttggaataca atgtgaccgt tttccagggt 29460
gacctcttca aaatttacaa ttacactttc ccatttgacc agatgtgtga ctttgtcatg 29520
tacatggaaa agcagcacaa gctgtggcct ccgactcccc agggctgtgt ggaaaatcca 29580
ggctctttct gcatgatctc tctctgtgta actgtgctgg cactaatact cacgcttttg 29640
tatatcagat ttaaatcaag gcaaagcttc attgatgaaa agaaaatgcc ttaatcgctt 29700
tcacgcttga ttgctaacac cgggttttta tccgcagaat gattggaatc accctactaa 29760
tcacctccct ccttgcgatt gcccatgggt tggaacgaat cgaagtccct gtgggggcca 29820
atgttaccct ggtggggcct gtcggcaatg ctacattaat gtgggaaaaa tatactaaaa 29880
atcaatgggt ctcttactgc actaacaaaa atagccacaa gcccagagcc atctgcgatg 29940
ggcaaaatct aaccttgatt gatgttcaat tgctggatgc gggctactat tatgggcagc 30000
tgggtacaat gattaattac tggagacccc acagagatta catgctccac gtagtaaagg 30060
gtccccttag cagcccaccc actaccacct ctactacccc cactaccacc actactccca 30120
ccaccagcac tgccgcccag cctcctcata gcagaacaac cacttttatc aattccaagt 30180
cccactcccc ccacattgcc ggcgggccct ccgcctcaga ctccgaaacc accgagatct 30240
gcttctgcaa atgctctgac gccattgccc aggatttgga agatcacgag gaagatgagc 30300
atgacttcgc agatgcatgc caggcatcag agccagaagc gctgccggtg gccctcaaac 30360
agtatgcaga cccccacacc acccccgacc ttcctccacc ttcccagaag ccaagtttcc 30420
tgggggaaaa tgaaactctg cctctctcca tactcgctct gacatctgtt gctatgttga 30480
ccgctctgct ggtgcttcta tgctctatat gctacctgat ctgctgcaga aagaaaaaat 30540
ctcacggcca tgctcaccag cccctcatgc acttccctta ccctccagag ctgggcgacc 30600
acaaacttta agtctgcagt aactatctgc ccatcccttg tcagtcgaca gcgatgagcc 30660
ccactaatct aacggcctct ggacttacaa catcgtctct taatgagacc accgctcctc 30720
aagacctgta cgatggtgtc tccgcgctgg ttaaccagtg ggatcacctg ggcatatggt 30780
ggctcctcat aggagcagtg accctgtgcc taatcctggt ctggatcatc tgctgcatca 30840
aaagcagaag acccaggcgg cggcccatct acaggccctt tgtcatcaca cctgaagatg 30900
atgatgacac cacttccagg ctgcagaggc taaagcagct actcttctct tttacagcat 30960
ggtaaattga atcatgcctc gcattttcat ctacttgtct ctccttccac tttttctggg 31020
ctcttctaca ttggccgctg tgtcccacat cgaggtagac tgcctcacgc ccttcacagt 31080
ctacctgctt ttcggctttg tcatctgcac ctttgtctgc agcgttatca ctgtagtgat 31140
ctgcttcata cagtgcatcg actacgtctg cgtgcgggtg gcttacttta gacaccaccc 31200
ccagtatcgc aacagggaca tagcggctct cctaagactt gtttaaaatc atggccaaat 31260
taactgtgat tggtcttctg atcatctgct gcgtcctagc cgcgattggg actcaagctc 31320
ctaccaccac cagcgctccc agaaagagac atgtatcctg cagcttcaag cgtccctgga 31380
atatacccca atgctttact gatgaacctg aaatctcttt ggcttggtac ttcagcgtca 31440
ccgcccttct tatcttctgc agtacggtta ttgcccttgc catctaccct tcccttgacc 31500
tgggctggaa tgctgtcaac tctatggaat atcccacctt cccagaacca gacctgccag 31560
acctggttgt tctaaacgcg tttcctcctc ctgctcccgt tcaaaatcag tttcgccctc 31620
cgtcccccac gcccactgag gtcagctact ttaatctaac aggcggagat gactgaaaac 31680
ctagacctag aaatggacgg tctctgcagc gagcaacgca cactagagag gcgccggcaa 31740
aaagagctcg agcgtcttaa acaagagctc caagacgcgg tggccataca ccagtgcaaa 31800
aaaggtgtct tctgtctggt aaaacaggcc acgctcacct atgaaaaaac aggtgacacc 31860
caccgcctag gatacaagct gcccacacag cgccaaaagt tcgccctcat gataggcgaa 31920
caacccatca ccgtgaccca gcactccgtg gagacagaag gctgcataca tgctccctgt 31980
aggggcgctg actgcctcta caccttgatc aaaaccctct gcggtctcag agaccttatc 32040
cctttcaatt aatcataact gtaatcaata aaaaatcact tacttgaaat ctgatagcaa 32100
gcctctgtcc aattttttca gcaacacttc cttcccctcc tcccaactct ggtactctag 32160
gcgcctccta gctgcaaact tcctccacag tctgaaggga atgtcagatt cctcctcctg 32220
tccctccgca cccacgatct tcatgttgtt gcagatgaaa cgcgcgagat cgtctgacga 32280
gaccttcaac cccgtgtacc cctacgatac cgagatcgct ccgacttctg tccctttcct 32340
tacccctccc tttgtgtcat ccgcaggaat gcaagaaaat ccagctgggg tgctgtccct 32400
gcacttgtca gagcccctta ccacccacaa tggggccctg actctaaaaa tggggggcgg 32460
cctgaccctg gacaaggaag ggaatctcac ttcccaaaac atcaccagtg tcgatccccc 32520
tctcaaaaaa agcaagaaca acatcagcct tcagaccgcc gcacccctcg ccgtcagctc 32580
cggggcccta acactttttg ccactccccc cctagcggtc agtggtgaca accttactgt 32640
gcagtctcag gcccctctca ctttggaaga ctcaaaacta actctggcca ccaaaggacc 32700
cctaactgtg tccgaaggca aacttgtcct agaaacaga 32739
<210> 22
<211> 32739
<212> DNA
<213> Artificial Sequence
<220>
<223> Adenovirus vector nucleotide sequences
<400> 22
catcatcaat aatatacctt attttggatt gtggccaata tgataatgag gtgggcgggg 60
agaggcgggg cgggtgacgt aggacgcgcg agtagggttg ggaggtgtgg cggaagtgtg 120
gcatttgcaa gtgggaggag ctcacatgca agcttccgtc gcggaaaatg tgacgttttt 180
gatgagcgcc gcctacctcc ggaagtgcca attttcgcgc gcttttcacc ggatatcgta 240
gtaattttgg gcgggaccat gtaagatttg gccattttcg cgcgaaaagt gaaacgggga 300
agtgaaaact gaataatagg gcgttagtca tagcgcgtaa tatttaccga gggccgaggg 360
actttgaccg attacgtgga ggactcgccc aggtgttttt tacgtgaatt tccgcgttcc 420
gggtcaaagt ctccgttttt attgtcaccg tcatttgacg cggagggtat ttaaacccgc 480
tgcgctcctc aagaggccac tcttgagtgc cagcgagaag agttttctcc tctgctccgc 540
ttcggtgatc gaaaaatgag acacatagcc tgcactccgg gtcttttgtc cggtcgggcg 600
gcggccgagc ttttggacgc tttgatcaat gatgtcctaa gcgatgattt tccgtctact 660
acccacttta gcccacctac tcttcacgaa ctgtacgatc tggatgtact ggtggatgtg 720
aacgatccca acgaggaggc ggtttctgcg ttttttcccg agtctgcgct gttggccgct 780
caggagggat ttgacctaca cactccgccg cctattttag agtctccgct gccggagccc 840
agtggtatac cttatatgcc tgaactgctt cccgaagtgg tagacctgac ctgccacgag 900
cctggctttc cgcccagcga cgatgagggt gagccttttg ttttagactt tgctgagata 960
cctgggcacg gttgcaggtc ttgtgcatat catcagaggg ttaccggaga ccccgaggtt 1020
aagtgttcgc tgtgctatat gaggatgacc tcttccttta tctacagtaa gtttttgtct 1080
aggtgggctt ttgggtaggt gggttttgtg tcagaacagg tgtaaacgtt gcttgtgttt 1140
tttgtacctg taggtccggt gtccgagcca gacccggagc ccgaccgcga tcccgagccg 1200
gatcccgagc ctcctcgcag gacaaggaaa ctaccttcca ttctgtgcaa gtctcagaca 1260
cctgtaagga ccagcgaggc agacagcacc gactctggca cttctacctc tccccctgaa 1320
attcacccag tggttcctct gggtatacat aaacctgttg ctgttaaagt ttgcgggcga 1380
cgccctgcag tacagtgcat tgaggacttg cttcacgatc ccgaggaacc tttggacttg 1440
agccttaaac gccctaggca ataaacccca cctaagtaat aaaccccacc taagtaataa 1500
accctgccgc ccttggttat tgagatgacg cccaatgttt gcttttgaat gacttcatgt 1560
gtgtaataaa agtgagtgtg atcataggtc tcttgtttgt ctgggcgggg cttaagggta 1620
tataagtctc ttggggctaa acttggttac acttgacccc aatggaggcg tgggggtgct 1680
tggaggagtt tgcggacgtg cgccgtttgc tggacgagag ctctagcaat acctatacta 1740
tttggaggta tctgtggggc tctactcagg ccaagttggt ttccagaatt aagcaggatt 1800
acaagtgcga ttttgaagag ctttttagtt cctgcggtga gcttttgcaa tccttgaatc 1860
tgggccatca ggctattttc caggaaaagg ttctctcgac tttggatttt tccactcccg 1920
ggcgcaccgc cgcttgtgtg gcttttgtgt cttttgtgca agataaatgg agcgaggaga 1980
cccacctgag tcacggctac gtactggatt tcatggcgat ggctctttgg agggctcaca 2040
acaaatggaa gattcagaag gaactgtacg gttccgccct acgtcgtcca cttctgtcgc 2100
gacaggggct gaggtttccc gaccatcggc agcatcagaa tctggaagac gagtcggagg 2160
agcgagcgga ggagaagatc agcttgagag ccggcctgga ccctcctcag gaggaatgaa 2220
tctcccgcag gtggttgacc tgtttccaga actgagacgg gtcctgacta tcagggagga 2280
tggtcagttt gtgaagaagt ttaagaggga tcggggtgag ggagatgatg aggcggctag 2340
caatttagct tttagtctga tgactcgcca ccgaccggaa tgtattacct atcagcagat 2400
taaggagagt tgtgccaacg agctggatct tttgggtcag aagtatagca tagaacagct 2460
taccacttac tggcttcagc ctggggatga ttgggaagag gcgatcaggg tgtatgcaaa 2520
ggtggccctg cggcccgatt gcaagtataa gattactaag ttggttaata ttagaaactg 2580
ctgctatatt tctgggaacg gggccgaagt ggagatagat actcaggaca gggtggcttt 2640
taggtgttgc atgataaaca tgtggcccgg gatactgggg atggatgggg tggtattcat 2700
gaatgtgagg tttacgggcc ccaactttaa tggcacggtg ttcatgggca acaccaactt 2760
gctcctgcat ggtgcgagtt tctatgggtt taataacacc tgtatagagg cctggaccga 2820
tgtaaaggtt cgaggttgtt ccttttatag ctgttggaag gcggtggtgt gtcgccctaa 2880
aagcaggggt tctgtgaaaa aatgcttgtt tgaaaggtgc accttaggca tcctctctga 2940
gggcaactcc agggtgcgcc ataatgtggc ttcgaactgc ggttgcttca tgcaagtgaa 3000
gggggtgagc gttatcaagc ataactcggt gtgtggaaac tgcgaggatc gcgcctccca 3060
gatgctgacc tgctttgatg gcaactgtca cctgttgaag accattcata taagcagcca 3120
ccccagaaag gcctggcccg tgtttgagca taacatcttg acccgctgct ccttgcatct 3180
gggggtcagg aggggtatgt tcctgcctta ccagtgtaac tttagccaca ctaaaatcct 3240
gctggaaccc gagtgcatga ccaaggtcag cctgaatggt gtgtttgatg tgactctgaa 3300
aatctggaag gtgctgaggt atgatgagac caggaccagg tgccgaccct gcgagtgcgg 3360
cggcaagcac atgagaaatc agcctgtgat gttggatgtg accgaggagc ttaggcctga 3420
ccatctggtg ctggcctgca ccagggccga gtttgggtct agcgatgagg ataccgattg 3480
aggtgggtaa ggtgggcgtg gctagaaggg tggggcgtgt ataaattggg ggtctaaggg 3540
tctctctgtt ttgtcttgca acagccgccg ccatgagcga caccggcaac agctttgatg 3600
gaagcatctt tagcccctat ctgacagtgc gcatgcctca ctgggctgga gtgcgtcaga 3660
atgtgatggg ttccaacgtg gatggacgcc ccgttctgcc ttcaaattcg tctacaatgg 3720
cctacgcgac cgtgggagga actccgctgg acgccgcgac ctccgccgcc gcctccgccg 3780
ccgccgcgac cgcgcgcagc atggctacgg acctttacag ctctttggtg gcgagcggcg 3840
cggcctctcg cgcgtctgct cgggatgaga aactgaccgc tctgctgctt aaactggaag 3900
acttgacccg ggagctgggt caactgaccc agcaggtctc cagcttgcgt gagagcagcc 3960
ttgcctcccc ctaatggccc ataatataaa taaaagccag tctgtttgga ttaagcaagt 4020
gtatgttctt tatttaactc tccgcgcgcg gtaagcccgg gaccagcggt ctcggtcgtt 4080
tagggtgcgg tggattcttt ccaacacgtg gtacaggtgg ctctggatgt ttagatacat 4140
gggcatgagt ccatccctgg ggtggaggta gcaccactgc agagcttcgt gctcgggggt 4200
ggtgttgtat atgatccagt cgtagcagga gcgctgggcg tggtgctgaa aaatgtcctt 4260
aagcaagagg cttatagcta gggggaggcc cttggtgtaa gtgtttacaa atctgctcag 4320
ttgggagggg tgcatccggg gggatataat gtgcatcttg gactggattt ttaggttggc 4380
tatgttccca cccagatccc ttctgggatt catgttgtgc aggaccacca gcacggtata 4440
tccagtgcac ttgggaaatt tatcgtggag cttagacggg aatgcatgga agaacttgga 4500
gacgcccttg tggcctccca gattttccat acattcgtcc atgatgatgg caatgggccc 4560
gtgggaagct gcctgagcaa aaatgtttct gggatcgctc acatcgtagt tatgttccag 4620
ggtgaggtca tcataggaca tctttacgaa tcgggggcgg agggtcccgg actgggggat 4680
gatggtaccc tcgggccccg gggcgtagtt cccctcacag atctgcatct cccaggcttt 4740
catttcagag ggagggatca tatccacctg cggagcgatg aaaaacacag tttctggcgc 4800
aggggagatt aactgggatg agagcaggtt tctgagcagc tgtgactttc cacagccggt 4860
gggcccatat atcacgccta tcaccggctg cagctggtag ttaagagagc tgcagctgcc 4920
gtcctcccgg agcagggggg ccacctcgtt cagcatatcc ctgacgtgga tgttctccct 4980
gaccaattcc gccagaaggc gctcgccgcc cagcgaaagc agctcttgca aggaagcaaa 5040
atttttcagc ggttttaggc cgtcggccgt gggcatgttt ttcagcgtct gggtcagcag 5100
ttccagcctg tcccacagct cggtgatgtg ctctacggca tctcgatcca gcagatctcc 5160
tcgtttcgcg ggttggggcg gctttcgctg tagggcacca gccgatgggc gtccagcggg 5220
gccagagtca tgtccttcca tgggcgcagg gtcctcgtca gggtggtctg ggtcacggtg 5280
aaggggtgcg ctccgggttg ggcgctggcc agggtgcgct tgaggctggt tctgctggtg 5340
ctgaatcgct gccgctcttc gccctgcgcg tcggccaggt agcatttgac catggtctcg 5400
tagtcgagac cctcggcggc gtgccccttg gcgcggagct ttcccttgga ggtggcgccg 5460
cacgaggggc actgcaggct cttcagggcg tagagcttgg gagcgagaaa cacggactct 5520
ggggagtagg cgtccgcgcc gcaggaagcg cagaccgtct cgcattccac cagccaagtg 5580
agctccgggc ggtcagggtc aaaaaccagg ttgcccccat gctttttgat gcgtttctta 5640
cctcggctct ccatgaggcg gtgtcccttc tcggtgacga agaggctgtc cgtgtccccg 5700
tagaccgact tcaggggcct gtcttccagc ggagtgcctc tgtcctcctc gtagagaaac 5760
tctgaccact ctgagacgaa ggcccgcgtc caggccagga cgaaggaggc cacgtgggag 5820
gggtagcggt cgttgtccac tagcgggtcc accttctcca gggtgtgcag gcacatgtcc 5880
ccctcctccg cgtccagaaa agtgattggc ttgtaggtgt aggacacgtg accgggggtt 5940
cccgacgggg gggtataaaa gggggtgggc gccctttcat cttcactctc ttccgcatcg 6000
ctgtctgcga gggccagctg ctggggtaag tattccctct cgaaggcggg catgacctca 6060
gcgctcaggt tgtcagtttc taaaaatgag gaggatttga tgttcacctg tccggaggtg 6120
atacctttga gggtacctgg gtccatctgg tcagaaaaca ctattttttt gttgtcaagc 6180
ttggtggcga acgacccgta gagggcgttg gagagcagct tggcgatgga gcgcagggtc 6240
tggtttttgt cgcggtcggc tcgctccttg gccgcgatgt tgagttgcac gtactcgcgg 6300
gccacgcact tccactcggg gaagacggtg gtgcgctcgt ctgggattag gcgcaccctc 6360
cagcctcggt tgtgcagggt gaccatgtcg acgctggtgg cgacctcgcc gcgcaggcgc 6420
tcgttggtcc agcagaggcg gccgcccttg cgcgagcaga aggggggtag ggggtccagc 6480
tggtcctcgt ttggggggtc cgcgtcgatg gtgaagaccc cggggagcaa gcgcgggtca 6540
aagtagtcga tcttgcaagc ttgcatgtcc agagcccgct gccattcgcg ggcggcgagc 6600
gcgcgctcgt aggggttgag gggcgggccc cagggcatgg ggtgggtgag cgcggaggcg 6660
tacatgccgc agatgtcata cacgtacagg ggttccctga ggatgccgag gtaggtgggg 6720
tagcagcgcc ccccgcggat gctggcgcgc acgtagtcat agagctcgtg ggagggggcc 6780
agcatgttgg gcccgaggtt ggtgcgctgg gggcgctcgg cgcggaaggc gatctgcctg 6840
aagatggcat gggagttgga ggagatggtg ggccgctgga agacgttgaa gcttgcttct 6900
tgcaagccca ccgagtccct gacgaaggag gcgtaggact cgcgcagctt gtgcaccagc 6960
tcggcggtga cctggacgtc gagcgcgcag tagtcgaggg tctcgcggat gatgtcatac 7020
ttatcctccc ccttcttttt ccacagctcg cggttgagga cgaactcttc gcggtctttc 7080
cagtactctt ggaggggaaa cccgtccgtg tccgaacggt aagagcctag catgtagaac 7140
tggttgacgg cctggtaggg gcaacagccc ttctccacgg gcagcgcgta ggcctgcgcc 7200
gccttgcgga gggaggtgtg ggtgagggcg aaagtgtccc tgaccatgac tttgaggtat 7260
tgatgtttga agtctgtgtc atcgcagccg ccctgttccc acagggtgta gtccgtgcgc 7320
tttttggagc gcgggttggg cagggagaag gtgaggtcat tgaagaggat cttccccgct 7380
cgaggcatga agtttctggt gatgcgaaag ggccctggga ccgaggagcg gttgttgatg 7440
acctgggcgg ccaggacgat ctcgtcaaag ccgtttatgt tgtggcccac gatgtagagc 7500
tccaaaaagc ggggctggcc cttgatggag gggagctttt tgagttcctc gtaggtgagc 7560
tcctcgggcg attccaggcc gtgctcctcc agggcccagt cttgcaagtg agggttggcc 7620
gccaggaagg atcgccagag gtcgcgggcc atgagggtct gcaggcggtc gcggaaggtt 7680
ctgaactgtc gccccacggc catcttttcg ggggtgatgc agtagaaggt gagggggtct 7740
ttctcccagg ggtcccatct gagctctcgg gcgaggtcgc gcgcggcggc gaccagagcc 7800
tcgtcgcccc ccagtttcat gaccagcatg aagggcacga gctgcttgcc aaaggctccc 7860
atccaagtgt aggtctctac atcgtaggtg acaaagaggc gctccgtgcg aggatgagag 7920
ccgatcggga agaactggat ctcccgccac cagttggagg attggctgtt gatgtggtga 7980
aagtagaagt cccgtctgcg ggccgagcac tcgtgctggc ttttgtaaaa gcgaccgcag 8040
tactggcagc gctgcacggg ttgtatatct tgcacgaggt gaacctggcg acctctgacg 8100
aggaagcgca gcgggaatct aagtcccccg cctggggtcc cgtgtggctg gtggtcttct 8160
actttggttg tctggccgcc agcatctgtc tcctggaggg cgatggtgga gcagaccacc 8220
acgccgcgag agccgcaggt ccagatctcg gcgctcggcg ggcggagttt gatgacgaca 8280
tcgcgcacat tggagctgtc catggtctcc agctcccgcg gcggcaggtc agctgggagt 8340
tcctggaggt tcacctcgca gagacgggtc aaggcgcggg cagtgttgag atggtatctg 8400
atttcaaggg gcgtgttggc ggcggagtcg atggcttgca ggaggccgca gccccggggg 8460
gccacgatgg ttccccgcgg ggcgcgaggg gaggcggaag ctgggggtgt gttcagaagc 8520
ggtgacgcgg gcgggccccc ggaggtaggg ggggttccgg ccccacaggc atgggcggca 8580
ggggcacgtc ttcgccgcgc gcgggcaggg gctggtgctg gctccgaaga gcgcttgcgt 8640
gcgcgacgac gcgacggttg gtgtcctgta tctgacgcct ctgagtgaag accacgggtc 8700
ccgtgacctt gaacctgaaa gagagttcga cagaatcaat ctcggcatcg ttgacagcgg 8760
cctggcgcag gatctcctgc acgtcgcccg agttgtcctg gtaggcgatc tctgccatga 8820
actgctcgat ctcttcttcc tggagatctc ctcgtccggc gcgctccacg gtggccgcca 8880
ggtcgttgga gatgcgaccc atgagctgtg agaaggcgtt gagcccgccc tcgttccaga 8940
cccggctgta gaccacgccc ccctcggcgt cgcgagcgcg catgaccacc tgggccaggt 9000
tgagctccac gtgtcgcgtg aagacggcgt agttgcgcag gcgctggaaa aggtagttca 9060
gggtggtggc ggtgtgctcg gcgacgaaga agtacatgac ccagcgccgc aacgtggatt 9120
cattgatgtc ccccaaggcc tccaggcgct ccatggcctc gtagaagtcc acggcgaagt 9180
tgaaaaactg ggagttgcga gcggacacgg tcaactcctc ctccagaaga cggatgagct 9240
cggcgacagt gttgcgcacc tcgcgctcga aggccacggg gggcgcttct tcctcttcca 9300
cctcttcttc catgatcgct tcttcttctt cctcagccgg gacgggaggg ggcggcggcg 9360
gcgggggagg ggcgcggcgg cggcggcggc gcaccgggag gcggtcgatg aagcgctcga 9420
tcatctcccc ccgcatgcgg cgcatggtct cggtgacggc gcggccgttc tcccgggggc 9480
gcagctcgaa gacgccgcct ctcatctcgc cgcggggcga gcggccgtga ggtagcgaga 9540
cggcgctgac tatgcatctt aacaattgct gtgtaggtac accgccgagg gacctgattg 9600
agtccagatc caccggatcc gaaaaccttt ggaggaaagc gtctatccag tcgcagtcgc 9660
aaggtaggct gagcaccgtg gcgggcgggg gcgggtctgg agagttcctg gcggagatgc 9720
tgctgatgat gtaattaaag taggcggtct tgagaaggcg gatggtggac aggagcacca 9780
tgtctttggg tccggcctgt tggatgcgga ggcggtcggc catgccccag gcctcgttct 9840
gacaccggcg caggtctttg tagtagtctt gcatgagtct ttccaccggc acctcttctc 9900
cttcctcttc tccatctcgc cggtggtttc tcgcgccgcc catgcgcgtg accccaaagc 9960
ccctgagcgg ctgcagcagg gccaggtcgg cgaccacgcg ctcggccaag atggcctgct 10020
gcacctgagt gagggtcctc tcgaagtcat ccatgtccac gaagcggtgg taggcgcccg 10080
tgttgatggt gtaggtgcag ttggccatga cggaccagtt gacggtctgg tgtcccggct 10140
gcgagagctc cgtgtaccgc aggcgcgaga aggcgcggga atcgaacacg tagtcgttgc 10200
aagtccgcac cagatactgg tagcccacca ggaagtgcgg cggaggttgg cgatagaggg 10260
gccagcgctg ggtggcgggg gcgccgggcg ccaggtcttc cagcatgagg cggtggtatc 10320
cgtagatgta cctggacatc caggtgatgc cggcggcggt ggtggtggcg cgcgcgtagt 10380
cgcggacccg gttccagatg tttcgcaggg gcgagaagtg ttccatggtc ggcacgctct 10440
ggccggtgag gcgcgcgcag tcgttgacgc tctatacaca cacaaaaacg aaagcgttta 10500
cagggctttc gttctgtagc ctggaggaaa gtaaatgggt tgggttgcgg tgtgccccgg 10560
ttcgagacca agctgagctc ggccggctga agccgcagct aacgtggtat tggcagtccc 10620
gtctcgaccc aggccctgta tcctccagga tacggtcgag agcccttttg ctttcttggc 10680
caagcgcccg tggcgcgatc tgggatagat ggtcgcgatg agaggacaaa agcggctcgc 10740
ttccgtagtc tggagaaaca atcgccaggg ttgcgttgcg gcgtaccccg gttcgagccc 10800
ctatggcggc ttgaatcggc cggaaccgcg gctaacgagg gccgtggcag ccccgtcctc 10860
aggaccccgc cagccgactt ctccagttac gggagcgagc cccttttgtt ttttattttt 10920
tagatgcatc ccgtgctgcg gcagatgcgc ccctcgcccc ggcccgatca gcagcagcaa 10980
cagcaggcat gcagaccccc ctctcccctt tccgccccgg tcaccacggc cgcggcggcc 11040
gtgtcgggcg cggggggcgc gctggagtca gatgagccac cgcggcggcg acctaggcag 11100
tatctggact tggaagaggg cgagggactg gcgcggctgg gggcgaactc tccagagcgc 11160
cacccgcggg tgcagttgaa aagggacgcg cgcgaggcgt acctgccgcg gcagaacctg 11220
tttcgcgacc gcgggggcga ggagcccgag gagatgcgag actgcaggtt ccaagcgggg 11280
cgcgagctgc ggcgcgggct ggacagacag cgcctgctgc gcgaggagga ctttgagccc 11340
gacacgcaga cgggcatcag ccccgcgcgc gcgcacgtag ccgcggccga cctggtgacc 11400
gcctacgagc agacggtaaa ccaggagcgc aacttccaaa agagcttcaa caaccacgtg 11460
cgcacgctgg tggcgcgcga ggaggtgacc ctgggtctca tgcatctgtg ggacctggtg 11520
gaggcgatcg tgcagaaccc cagcagcaag cccctgaccg cgcagctgtt cctggtggtg 11580
cagcacagca gggacaacga ggccttcagg gaggcgctgc tgaacatcac cgagccggag 11640
gggcgctggc tcctggacct gataaacatc ctgcagagca tagtggtgca ggagcgcagc 11700
ctgagcctgg ccgagaaggt ggcggccatc aactactcta tgctgagcct gggcaagttc 11760
tacgcccgca agatctacaa gaccccctac gtgcccatag acaaggaggt gaagatagac 11820
agcttctaca tgcgcatggc gctgaaggtg ctgaccctga gcgacgacct gggagtgtac 11880
cgcaacgagc gcatccacaa ggccgtgagc gccagccggc ggcgcgagct gagcgaccgc 11940
gagctgatgc acagtctgca gcgcgcgctg accggcgcgg gcgagggcga cagggaggtc 12000
gagtcctact tcgacatggg ggccgacctg cactggcagc cgagccgccg cgccctggag 12060
gcggcggggg cgtacggcgg ccccctggcg gccgatgacc aggaagagga ggactatgag 12120
ctagaggagg gcgagtacct ggaggactga cctggctggt ggtgttttgg tatagatgca 12180
agatccgaac gtggcggacc cggcggtccg ggcggcgctg caaagccagc cgtccggcat 12240
taactcctct gacgactggg ccgcggccat gggtcgcatc atggccctga ccgcgcgcaa 12300
ccccgaggct ttcaggcagc agcctcaggc caaccggctg gcggccatct tggaagcggt 12360
agtgcccgcg cgctccaacc ccacccacga gaaggtgctg gccatagtca acgcgctggc 12420
ggagagcagg gccatccgcg cggacgaggc cggactggtg tacgatgcgc tgctgcagcg 12480
ggtggcgcgg tacaacagcg gcaacgtgca gaccaacctg gaccgcctgg tgacggacgt 12540
gcgcgaggcc gtggcgcagc gcgagcgctt gcatcaggac ggtaacctgg gctcgctggt 12600
ggcgctaaac gccttcctca gcacccagcc ggccaacgta ccgcgggggc aggaggacta 12660
caccaacttt ttgagcgcgc tgcggctgat ggtgaccgag gtccctcaga gcgaggtgta 12720
ccagtcgggg cccgactact tcttccagac cagcagacag ggcttgcaaa ccgtgaacct 12780
gagccaggct ttcaagaacc tgcgggggct gtggggagtg aaggcgccca ccggcgaccg 12840
ggctacggtg tccagcctgc taacccccaa ctcgcgcctg ctgctgctgc tgatcgcgcc 12900
cttcacggac agcgggagcg tctcgcggga gacctatctg ggccacctgc tgacgctgta 12960
ccgcgaggcc atcgggcagg cgcaggtgga cgagcacacc ttccaagaga tcaccagcgt 13020
gagccacgcg ctggggcagg aggacacggg cagcctgcag gcgaccctga actacctgct 13080
gaccaacagg cggcagaaga ttcccacgct gcacagcctg acccaggagg aggagcgcat 13140
cttgcgctac gtgcagcaga gcgtgagcct gaacctgatg cgcgacggcg tgacgcccag 13200
cgtggcgctg gacatgaccg cgcgcaacat ggaaccgggc atgtacgcct cccaccggcc 13260
gtttatcaac cgcctgatgg actacttgca tcgggcggcg gccgtgaacc ccgagtactt 13320
cactaatgcc attctgaatc cccactggat gccccctccg ggtttctaca acggggactt 13380
tgaggtgccc gaggtcaacg acgggttcct ctgggatgac atggatgaca gtgtgttctc 13440
acccaacccg ctgcgcgccg cgtctctgcg attgaaggag ggctctgaca gggaaggacc 13500
gaggagtctg gcctcctccc tggctctggg agcggtgggc gccacgggcg cggcggcgcg 13560
gggcagtagc cccttcccca gcctggcaga ctctctgaac agcgggcggg tgagcaggcc 13620
ccgcttgcta ggcgaggagg agtatctgaa caactccctg ctgcagcccg cgagggacaa 13680
gaacgctcag cggcagcagt ttcccaacaa tgggatagag agcctggtgg acaagatgtc 13740
cagatggaag acgtatgcgc aggagtacaa ggagtgggag gaccgccagc cgcggccctt 13800
gccgccccct aggcagcgct ggcagcggcg cgcgtccaac cgccgctgga ggcaggggcc 13860
cgaggacgat gatgactctg cagatgacag cagcgtgttg gacctgggcg ggagcgggaa 13920
ccccttttcg cacctgcgcc cacgcctggg caagatgttt taaaagaaaa aaaaaaataa 13980
aactcaccaa ggccatggcg acgagcgttg gttttttgtt cccttcctta gtatgcggcg 14040
cgcggcgatg ttcgaggagg ggcctccccc ctcttacgag agcgcgatgg ggatttctcc 14100
tgcggcgccc ctgcagcctc cctacgtgcc tcctcggtac ctgcaaccta caggggggag 14160
aaatagcatc tgttactctg agctgcagcc cctgtacgat accaccagac tgtacctggt 14220
ggacaacaag tccgcggacg tggcctccct gaactaccag aacgaccaca gcgatttttt 14280
gaccacggtg atccaaaaca acgacttcac cccaaccgag gccagcaccc agaccataaa 14340
cctggataac aggtcgaact ggggcggcga cctgaagacc atcttgcaca ccaacatgcc 14400
caacgtgaac gagttcatgt tcaccaactc ttttaaggcg cgggtgatgg tggcgcgcga 14460
gcagggggag gcgaagtacg agtgggtgga cttcacgctg cccgagggca actactcaga 14520
gaccatgact ctcgacctga tgaacaatgc gatcgtggaa cactatctga aagtgggcag 14580
gcagaacggg gtgaaggaaa gcgatatcgg ggtcaagttt gacaccagaa acttccgtct 14640
gggctgggac cccgtgaccg ggctggtcat gccgggggtc tacaccaacg aggcctttca 14700
tcccgacata gtgcttctgc ccggctgtgg ggtggacttc acccagagcc ggctgagcaa 14760
cctgctgggc attcgcaagc ggcagccttt ccaggagggt ttcaagatca cctatgagga 14820
tctgaagggg ggcaacattc ccgcgctcct tgatctggac gcctacgagg agagcttgaa 14880
acccgaggag agcgctggcg acagcggcga gagtggcgag gagcaagccg gcggcggtgg 14940
cggcgcgtcg gtagaaaacg aaagtacgcc cgcagtggcg gcggacgctg cggaggtcga 15000
gccggaggcc atgcagcagg acgcagagga gggcgcacag gagggcgcgc agaaggacat 15060
gaacgatggg gagatcaggg gagacacatt cgccacccgg ggcgaagaaa aagaggcaga 15120
ggcggcggcg gcggcgacgg cggaggccga aaccgaggtt gaggcagagg cagagcccga 15180
gaccgaagtt atggaagaca tgaatgatgg agaacgtagg ggcgacacgt tcgccacccg 15240
gggcgaagag aaggcggcgg aggcagaagc cgcggctgag gaggcggctg cggctgcggc 15300
caagactgag gctgcggcta aggctgaggt cgaagccaat gttgcggttg aggctcaggc 15360
tgaggaggag gcggcggctg aagcagttaa ggaaaaggcc caggcagagc aggaagagaa 15420
aaaacctgtc attcaacctc taaaagaaga tagcaaaaag cgcagttaca acgtcatcga 15480
gggcagcacc tttacccagt accgcagctg gtacctggcg tacaactacg gcgacccggt 15540
caagggggtg cgctcgtgga ccctgctctg cacgccggac gtcacctgcg gctccgagca 15600
gatgtactgg tcgctgccga acatgatgca agacccggtg accttccgct ccacgcggca 15660
ggttagcaac ttcccggtgg tgggcgccga actgctgccc gtgcactcca agagttttta 15720
caacgagcag gccgtctact cccagctgat ccgccaggcc acctctctga cccacgtgtt 15780
caatcgcttt cccgagaacc agattttggc gcgcccgccg gcccccacca tcaccaccgt 15840
gagtgaaaac gttcctgccc tcacagatca cgggacgcta ccgctgcgca acagcatctc 15900
aggagtccag cgagtgacca ttactgacgc cagacgccgg acctgcccct acgtttacaa 15960
ggccttgggc atagtctcgc cgcgcgtcct ctccagtcgc actttttaaa acacatctac 16020
ccacacgttc caaaatcatg tccgtactca tctcacccag caacaacacc ggctgggggc 16080
tgcgcgcgcc cagcaagatg tttggagggg cgaggaagcg ctccgaccag caccctgtgc 16140
gcgtgcgcgg ccactaccgc gcgccctggg gagcgcacaa gcgcgggcgc acagggcgca 16200
ccactgtgga cgacgtcatt gactccgtag tggagcaagc gcgccactac acacccggcg 16260
cgccgaccgc ccccgccgtg tccaccgtgg accaggcgat cgaaagcgtg gtacagggcg 16320
cgcggcacta tgccaacctt aaaagtcgcc gccgccgcgt ggcccgccgc catcgccgga 16380
gaccccgggc caccgccgcc gcgcgcctta ctaaggctct gctcaggcgc gccaggcgaa 16440
ctggccaccg ggccgccatg agggccgcac ggcgggctgc cgctgccgca agcgtcgtgg 16500
ccccgcgggc acgaaggcgc gcggccgctg ccgccgccgc cgccatttcc agcttggcct 16560
cgacgcggcg cggtaacata tactgggtgc gcgactcggt aaccggcacg cgggtacccg 16620
tgcgctttcg ccccccgcgg aattagcaca agacaacata cacactgagt ctcctgctgt 16680
tgtgtatccc agcggcgacc gtcagcagcg gcgacatgtc caagcgcaaa attaaagaag 16740
agatgctcca ggtcatcgcg ccggagatct atgggccccc gaagaaggag gaggatgatt 16800
acaagccccg caagctaaag cgggtcaaaa agaaaaagaa agatgatgat gacgaggcgg 16860
tggagtttgt ccgccgcatg gcacccaggc gccccgtgca gtggaagggc cggcgcgtgc 16920
agcgcgtttt gcgccccggc accgcggtgg tcttcacgcc cggcgagcgc tccacgcgca 16980
ctttcaagcg ggtgtacgat gaggtgtacg gcgacgagga cctgttggag caggccaacc 17040
agcgctttgg ggagtttgca tatgggaaac ggccccgcga gagtctaaaa gaggacctgc 17100
tggcgctacc gctggacgag ggcaatccca ccccgagtct gaagccggta accctgcaac 17160
aggtgctgcc tttgagcgcg cccagcgagc ataagcgagg gttgaagcgc gaaggcgggg 17220
acctggcgcc caccgtgcag ttgatggtgc ccaagcggca gaagctggag gacgtgctgg 17280
agaaaatgaa agtagagccc gggatccagc ccgagatcaa ggtccgcccc atcaagcagg 17340
tggcgcccgg cgtgggagtc cagaccgtgg acgttaggat tcccacggag gagatggaaa 17400
cccaaaccgc cactccctct tcggcggcca gcgccaccac cggcaccgct tcggtagagg 17460
tgcagacgga cccctggcta cccgccaccg ctgttgccgc cgccgccccc cgttcgcgcg 17520
ggcgcaagag aaattatcca gcggccagcg cgctcatgcc ccagtacgca ctgcatccat 17580
ccatcgtgcc cacccccggc taccgcgggt actcgtaccg cccgcgcaga tcagccggca 17640
ctcgcggccg ccgccgccgt gcgaccacaa ccagccgccg ccgtcgccgc cgccgccagc 17700
cagtgctgac ccccgtgtct gtaaggaagg tggctcgctc ggggagcacg ctggtggtgc 17760
ccagagcgcg ctaccacccc agcatcgttt aaagccggtc tctgtatggt tcttgcagat 17820
atggccctca cttgtcgcct ccgcttcccg gtgccgggat accgaggaag aactcaccgc 17880
cgcagaggca tggcgggcag cggtctccgc ggcggccgtc gccatcgccg gcgcgcaaaa 17940
agcaggcgca tgcgcggcgg tgtgctgcct ctgctaatcc cgctaatcgc cgcggcgatc 18000
ggtgccgtac ccgggatcgc ctccgtggcc ctgcaggcgt cccagaaacg ttgactcttg 18060
caaccttgca agcttgcatt ttttggagga aaaaataaaa aaaaagtcta gactctcacg 18120
ctcgcttggt cctgtgacta ttttgtagaa aaaaagatgg aagacatcaa ctttgcgtcg 18180
ctggccccgc gtcacggctc gcgcccgttc atgggagact ggacagatat cggcaccagc 18240
aatatgagcg gtggcgcctt cagctggggc agtctgtgga gcggccttaa aaattttggt 18300
tccaccatta agaactatgg caacaaagcg tggaacagca gcacgggcca gatgctgaga 18360
gacaagttga aagagcagaa cttccaggag aaggtggcgc agggcctggc ctctggcatc 18420
agcggggtgg tggacatagc taaccaggcc gtgcagaaaa agataaacag tcatctggac 18480
ccccgtcctc aggtggagga aatgcctcca gcgatggaga cggtgtctcc cgagggcaaa 18540
ggcgaaaagc gcccgcggcc cgacagagaa gagaccctgg tgtcacacac cgaggagccg 18600
ccctcttacg aggaggcagt caaggccggc ctgcccacca ctcgccccat agcccccatg 18660
gccaccggtg tggtgggcca caggcaacac actcccgcaa cactagatct gcccccgccg 18720
tccgagccgc cgcgccagcc aaaggcggcg acggtgcccg ctccctccac ttccgccgcc 18780
aacagagtgc ccctgcgccg cgccgcgagc ggcccccggg cctcgcgagt tagcggcaac 18840
tggcagagca cactgaacag catcgtgggc ctgggagtga ggagtgtgaa gcgccgccgt 18900
tgctactgaa tgagcaagct agctaacgtg ttgtatgtgt gtatgcgtcc tatgtcgccg 18960
ccagaggagc tgttgagccg ccggcgccgt ctgcactcca gcgaatttca agatggcgac 19020
cccatcgatg atgcctcagt ggtcgtacat gcacatctcg ggccaggacg cttcggagta 19080
cctgagcccc gggctggtgc agttcgcccg cgccacagac acctacttca acatgagtaa 19140
caagttcagg aaccccactg tggcgcccac ccacgatgtg accacggacc ggtcgcagcg 19200
cctgacgctg cggttcatcc ccgtggatcg ggaggacacc gcctactctt acaaggcgcg 19260
gttcacgctg gccgtgggcg acaaccgcgt gctggacatg gcctccactt actttgacat 19320
caggggggtg ctggacaggg gccccacctt caagccctac tcgggtactg cctacaactc 19380
cctggccccc aagggcgctc ccaattcttg cgagtgggaa caagatgaac cagctcaggc 19440
agcaatagct gaagatgaag aagaacttga agaagaacaa gctcaggacg aacaggcgcc 19500
cactaagaaa acccatgtat acgcccaggc acctctttct ggtgaaaaaa ttactaagga 19560
tggtttgcaa ataggtgtgg atgccacaca ggcgggagat aaccctatat atgctgataa 19620
aacattccaa cccgaacctc agataggtga gtctcagtgg aacgaggctg atgccacagt 19680
agcaggaggc agagtcttaa aaaagaccac ccctatgaga ccttgctatg gatcctatgc 19740
caaacctact aatgccaatg gcggtcaagg gatcatggtg gccaatgatc agggagcgct 19800
tgaatctaaa gttgagatgc aatttttctc caccacaacg tctcttaatg taagggaagg 19860
tgaaaacaat cttcagccaa aagtagtgct atacagcgaa gatgttaact tggaatcccc 19920
tgacactcat ttgtcttaca aacctaaaaa ggatgacacc aactctaaaa tcatgttggg 19980
tcagcaagcc atgcccaaca gacccaacct cattgctttt agggacaact ttattggact 20040
tatgtactac aacagcacag gcaacatggg agtgctggca ggacaggcct cccagctaaa 20100
cgctgtggta gacttgcaag acagaaacac agagctgtca taccaactga tgcttgattc 20160
cattggagac agatcaagat acttttccat gtggaaccag gcagtggaca gctatgaccc 20220
agatgtcaga atcattgaaa accatggggt tgaagatgag ctgcccaact attgctttcc 20280
cctgggcggt attggaatta cagacacata ccagtgcata aaaccaaccg cagctgctaa 20340
taacactaca tggtctaagg atgaagaatt tagtgatcgc aatgaaatag gggtgggaaa 20400
caacttcgcc atggagatca acatccaggc caacctctgg aggaacttcc tctatgcgaa 20460
cgtggggctc tacctgccag acaagctcaa gtacaacccc accaacgtgg acatctctga 20520
caaccccaac acctatgact acatgaacaa gcgtgtggtg gctcccggcc tggtggactg 20580
ctttgtcaat gtgggagcca ggtggtccct ggactacatg gacaacgtca accccttcaa 20640
ccaccaccgc aatgcgggtc tgcgctaccg ctccatgatc ctgggcaacg ggcgctacgt 20700
gcccttccac attcaggtgc cccagaagtt ctttgccatc aagaacctcc tcctcctgcc 20760
gggctcctac acttacgagt ggaacttcag gaaggatgtc aacatggtcc tgcagagctc 20820
tctgggcaat gaccttaggg tggacggggc cagcatcaag tttgacagcg tcaccctcta 20880
tgctaccttc ttccccatgg ctcacaacac cgcctccacg ctcgaggcca tgctgaggaa 20940
cgacaccaac gaccagtcct tcaatgacta cctctctggg gccaacatgc tctaccccat 21000
ccccgccaag gccaccaacg tgcccatctc cattccctct cgcaactggg ccgccttcag 21060
aggctgggcc tttacccgcc ttaagaccaa ggaaaccccc tccctgggct cgggttttga 21120
cccctacttt gtctactcgg gatccatccc ctacctggat ggcaccttct acctcaacca 21180
cacttttaag aagatatcca tcatgtatga ctcctccgtc agctggccgg gcaatgaccg 21240
cctgctcacc cccaatgagt tcgaggtcaa gcgcgccgtg gacggcgagg gctacaacgt 21300
ggcccagtgc aacatgacca aggactggtt cctggtgcag atgctggcca actacaacat 21360
aggctaccag ggcttctaca tcccagagag ctacaaggac aggatgtact ccttcttcag 21420
aaatttccaa cccatgagca ggcaggtggt ggacgagacc aaatacaagg actatcaggc 21480
cattggcatc actcaccagc acaacaactc gggattcgtg ggctacctgg ctcccaccat 21540
gcgcgagggg caggcctacc ccgccaactt cccctacccg ttgataggca aaaccgcggt 21600
cgacagcgtc acccagaaaa agttcctctg cgaccgcacc ctctggcgca tccccttctc 21660
tagcaacttc atgtccatgg gtgcgctcac ggacctgggc cagaacctgc tctatgccaa 21720
ctccgcccat gcgctggaca tgacttttga ggtggacccc atggacgagc ccacccttct 21780
ctatattgtg tttgaagtgt tcgacgtggt cagagtgcac cagccgcacc gcggtgtcat 21840
cgagaccgtg tacctgcgca cgcccttctc ggccggcaac gccaccacct aaggagacag 21900
cgccgccgcc tgcatgacgg gttccaccga gcaagagctc agggccatcg ccagagacct 21960
gggatgcgga ccctattttt tgggcaccta tgacaaacgc ttcccgggct tcatctcccg 22020
agacaagctc gcctgcgcca tcgtcaacac ggccgcgcgc gagaccgggg gcgtgcactg 22080
gctggccttt ggctgggacc cgcgctccaa aacctgctac ctcttcgacc cctttggctt 22140
ctccgatcag cgcctcagac agatctatga gtttgagtac gaggggctgc tgcgccgcag 22200
cgcgcttgcc tcctcgcccg accgctgcat cacccttgag aagtccaccg agaccgtgca 22260
ggggccccac tcggccgcct gcggtctctt ctgctgcatg tttttgcacg cctttgtgcg 22320
ctggccccag agtcccatgg atcgcaaccc caccatgaac ttgctcaagg gagtgcccaa 22380
cgccatgctc cagagccccc aggtccagcc caccctgcgc cacaaccagg aacagctcta 22440
ccgcttcctg gagcgccact ccccctactt ccgcagtcac agcgcgcaca tccggggggc 22500
cacctctttc tgccacttgc aagaaaacat gcaagacgga aaatgatgta cagctcgctt 22560
tttaataaat gtaaagactg tgcactttat ttatacacgg gctctttctg gttatttatt 22620
caacaccgcc gtcgccatct agaaatcgaa agggttctgc cgcgcgtcgc cgtgcgccac 22680
gggcagagac acgttgcgat actggaagcg gctcgcccac ttaaactcgg gcaccaccat 22740
gcggggcagt ggttcctcgg ggaagttctc gccccacagg gtgcgggtca gctgcagcgc 22800
gctcaggagg tcgggagccg agatcttgaa gtcgcagttg gggccggaac cctgcgcgcg 22860
cgagttgcgg tacacggggt tgcagcactg gaacaccagc agggccggat tatgcacgct 22920
ggccagcagg ctctcgtcgc tgatcatgtc gctgtccaga tcctccgcgt tgctcagggc 22980
gaacggggtc atcttgcaga cctgcctgcc caggaaaggc ggcagcccgg gcttgccgtt 23040
gcagtcgcag cgcaggggca tcagcaggtg cccgcggccc gactgcgcct gcgggtacag 23100
cgcgcgcatg aaggcttcga tctgcctgaa agccacctgc gtcttggctc cctccgaaaa 23160
gaacatccca caggacttgc tggagaactg gttcgcggga cagctggcat cgtgcaggca 23220
gcagcgcgcg tcggtgttgg cgatctgcac cacgttgcga ccccaccggt tcttcactat 23280
cttggccttg gaagcctgct ccttcagcgc gcgctggccg ttctcgctgg tcacatccat 23340
ctctatcacc tgctccttgt tgatcatgtt tgtaccgtgc agacacttca ggtcgccctc 23400
cgtctgggtg cagcggtgct cccacagcgc gcaaccggtg ggctcccaat ttttgtgggt 23460
cacccccgcg taggcctgca ggtaggcctg caagaagcgc cccatcatgg ccacaaaggt 23520
cttctggctc gtaaaggtca gctgcaggcc gcgatgctct tcgttcagcc aggtcttgca 23580
gatggcggcc agcgcctcgg tctgctcggg cagcatccta aaatttgtct tcaggtcgtt 23640
atccacgtgg tacttgtcca tcatggcgcg cgccgcctcc atgcccttct cccaggcgga 23700
caccatgggc aggcttaggg ggtttatcac ttccaccggc gaggacaccg tactttcgat 23760
ttcttcttcc tccccctctt cccggcgcgc gcccacgctg ctgcgcgctc tcaccgcctg 23820
caccaagggg tcgtcttcag gcaagcgccg caccgagcgc ttgccgccct tgacctgctt 23880
aatcagcacc ggcgggttgc tgaagcccac catggtcagc gccgcctgct cttcttcgtc 23940
ttcgctgtct accactatct ctggggaagg gcttctccgc tctgcggcgg cgcgcttctt 24000
ttttttcttg ggagcggccg tgatggagtc cgccacggcg acggaggtcg agggcgtggg 24060
gctgggggtg cgcggtacca gggcctcgtc gccctcggac tcttcctctg actccaggcg 24120
gcggcggagt cgcttctttg ggggcgcgcg cgtcagcggc ggcggagacg gggacgggga 24180
cggggacggg acgccctcca cagggggtgg tcttcgcgca gacccgcggc cgcgctcggg 24240
ggtcttctcg agctggtctt ggtcccgact ggccattgta tcctcctcct cctaggcaga 24300
gagacataag gagtctatca tgcaagtcga gaaggaggag agcttaacca ccccctctga 24360
gaccgccgat gcgcccgccg tcgccgtcgc ccccgctgcc gccgacgcgc ccgccacacc 24420
gagcgacacc cccgcggacc cccccgccga cgcacccctg ttcgaggaag cggccgtgga 24480
gcaggacccg ggctttgtct cggcagagga ggatttgcga gaggaggagg ataaggagaa 24540
gaagccctca gtgccaaaag atgataaaga gcaagacgag cacgacgcag atgcacacca 24600
gggtgaagtc gggcgggggg acggagggca tgacggcgcc gactacctag acgaagggaa 24660
cgacgtgctc ttgaagcacc tgcatcgtca gtgcgccatt gtttgcgacg ctctgcagga 24720
gcgcagcgaa gtgcccctca gcgtggcgga ggtcagccac gcctacgagc tcagcctctt 24780
ctccccccgg gtgccccccc gccgccgcga aaacggcaca tgcgagccca acccgcgcct 24840
caacttctac cccgcctttg tggtacccga ggtcctggcc acctatcaca tcttctttca 24900
aaattgcaag atccccctct cgtgccgcgc caaccgtagc cgcgccgata agatgctggc 24960
cctgcgccag ggcgaccaca tacctgatat cgccgctttg gaagatgtac caaagatctt 25020
cgagggtctg ggtcgcaacg agaagcgggc agcaaactct ctgcaacagg aaaacagcga 25080
aaatgagagt cacaccgggg tactggtgga gctcgagggc gacaacgccc gcctggcggt 25140
ggtcaagcgc agcatcgagg tcacccactt tgcctacccc gcgctaaacc tgccccccaa 25200
agtcatgaac gcggccatgg acgggctgat catgcgccgc ggccggcccc tcgctccaga 25260
tgcaaacttg catgaggaga ccgaggacgg ccagcccgtg gtcagcgacg agcagctggc 25320
gcgctggctg gagaccgcgg accccgccga actggaggag cggcgcaaga tgatgatggc 25380
cgtggtgctg gtcaccgtag agctggagtg tctgcagcgc ttcttcggcg accccgagat 25440
gcagagaaag gtcgaggaga ccctgcacta caccttccgc cagggctacg tgcgccaggc 25500
ttgcaagatc tccaacgtgg agctcagcaa cctggtgtcc tacctgggca tcttgcatga 25560
gaaccgcctc gggcagagcg tgctgcactc caccctgcgc ggggaggcgc gccgcgacta 25620
cgtgcgcgac tgcgtttacc tcttcctctg ctacacctgg cagacggcca tgggggtctg 25680
gcagcagtgc ctggaggagc gcaacctcaa ggagctggag aagctcctgc agcgcgcgct 25740
caaagatctc tggacgggct acaacgagcg ctcggtggcc gccgcgctgg ccgacctcat 25800
cttccccgag cgcctgctca aaaccctcca gcaggggctg cccgacttca ccagccaaag 25860
catgttgcaa aacttcagga actttatcct ggagcgttct ggcatcctac ccgccacctg 25920
ctgcgccctg cccagcgact ttgtccccct cgtgtaccgc gagtgccccc cgccgctgtg 25980
gggtcactgc tacctgttcc aactggccaa ctacctgtcc taccacgcgg acctcatgga 26040
ggactccagc ggcgaggggc tcatggagtg ccactgccgc tgcaacctct gcacgcccca 26100
ccgctccctg gtctgcaaca cccaactgct cagcgagagt cagattatcg gtaccttcga 26160
gctacagggt ccgtcctcct cagacgagaa gtccgcggct ccggggctaa aactcactcc 26220
ggggctgtgg acttccgcct acctgcgcaa atttgtacct gaagactacc acgcccacga 26280
gatcaggttt tacgaagacc aatcccgccc gcccaaggcg gagctgaccg cctgcgtcat 26340
cacccagggc gagatcctag gccaattgca agccatccaa aaagcccgcc aagacttttt 26400
gctgaagaag ggtcgggggg tgtatctgga cccccagtcg ggtgaggagc tcaacccggt 26460
tcccccgctg ccgccgccgc gggaccttgc ttcccaggat aagcatcgcc atggctccca 26520
gaaagaagca gcagcggccg ccactgccgc caccccacat gctggaggaa gaggaggaat 26580
actgggacag tcaggcagag gaggtttcgg acgaggagga gccggagacg gagatggaag 26640
agtgggagga ggacagctta gacgaggagg cttccgaagc cgaagaggca gacgcaacac 26700
cgtcaccctc ggccgcagcc ccctcgcagg cgcccccgaa gtccgctccc agcatcagca 26760
gcaacagcag cgctataacc tccgctcctc caccgccgcg acccacggcc gaccgcagac 26820
ccaaccgtag atgggacacc accggaaccg gggccggtaa gtcctccggg agaggcaagc 26880
aagcgcagcg ccaaggctac cgctcgtggc gcgctcacaa gaacgccata gtcgcttgct 26940
tgcaagactg cggggggaac atctccttcg cccgccgctt cctgctcttc caccacggtg 27000
tggccttccc ccgtaacgtc ctgcattact accgtcatct ctacagcccc tactgcggcg 27060
gcagtgagcc agagacggtc ggcggcggcg gcggcgcccg tttcggcgcc taggaagacc 27120
cagggcaaga cttcagccaa gaaactcgcg gcggccgcgg cgaacgcggt cgcgggggcc 27180
ctgcgcctga cggtgaacga acccctgtcg acccgcgaac tgaggaaccg aatcttcccc 27240
actctctatg ccatcttcca gcagagcaga gggcaggatc aggaactgaa agtaaaaaac 27300
aggtctctgc gctccctcac ccgcagctgt ctgtatcaca agagcgaaga ccagcttcgg 27360
cgcacgctgg aggacgctga ggcactcttc agcaaatact gcgcgctcac tcttaaggac 27420
tagctccgcg cccttctcga atttaggcgg gaacgcctac gtcatcgcag cgccgccgtc 27480
atgagcaagg acattcccac gccatacatg tggagctatc agccgcagat gggactcgcg 27540
gcgggcgcct cccaagacta ctccacccgc atgaactggc tcagtgccgg cccacacatg 27600
atctcacagg ttaatgatat ccgcacccat cgaaaccaaa tattggtgga gcaggcggca 27660
attaccacca cgccccgcaa taatcccaac cccagggagt ggcccgcgtc cctggtgtat 27720
caggaaattc ccggccccac caccgtacta cttccgcgtg attcccaggc cgaagtccaa 27780
atgactaact caggggcaca gctcgcgggc ggctgtcgtc acagggtgcg gcctcctcgc 27840
cagggtataa ctcacctgga gatccgaggc agaggtattc agctcaacga cgagtcggtg 27900
agctcctcgc tcggtctcag acctgacggg accttccaga tagccggagc cggccgatct 27960
tccttcacgc cccgccaggc gtacctgact ctgcaaagct cgtcctcggc gccgcgctcg 28020
ggcggcatcg ggactctcca gttcgtgcag gagtttgtgc cctcggtcta cttcaacccc 28080
ttctcgggct ctcccggtcg ctacccggac cagttcatct cgaactttga cgccgcgagg 28140
gactcggtgg acggctacga ctgaatgtcg ggtggacccg gtgcagagca acttcgcctg 28200
aagcacctcg accactgccg ccgccctcag tgctttgccc gctgtcagac cggtgagttc 28260
cagtactttt ccctgcccga ctcgcacccg gacggcccgg cgcacggggt gcgctttttc 28320
atcccgagtc aggtgcgctc taccctaatc agggagttta ccgcccgtcc cctactggcg 28380
gagttggaaa aggggccttc tatcctaacc attgcctgca tctgctctaa ccctggattg 28440
caccaagatc tttgctgtca tttgtgtgct gagtataata aaggctgaga tcagaatcta 28500
ctcgggctcc tgtcgccatc ctgtcaacgc caccgtccaa gcccggcccg atcagcccga 28560
ggtgaacctc acctgcggtc tgcaccggcg cctgaggaaa tacctagctt ggtactacaa 28620
cagcactccc tttgtggttt acaacagctt tgaccaggac ggggtctcac tgagggataa 28680
cctctcgaac ctgagctact ccatcaggaa gaacagcacc ctcgagctac ttcctcctta 28740
cctgcccggg acttaccagt gtgtcaccgg tccctgcacc cacacccacc tgttgatcgt 28800
aaacgactct cttccgagaa cagacctcaa taactcctct tcgcagttcc ccagaacagg 28860
aggtgagctc aggaaacccc gggtaaagaa gggtggacga gagttaacac ttgtggggtt 28920
tctggtgtat gtgacgctgg tggtggctct tttgattaag gcttttcctt ccatgtctga 28980
actctccctc ttcttttatg aacaactcga ctagtgctaa cgggacccta cccaacgaat 29040
cgggattgaa tatcggtaac caggttgcag tttcactttt gattaccttc atagtcctct 29100
tcctgctagt gctgtcgctt ctgtgcctgc ggatcggggg ctgctgcatc cacgtttata 29160
tctggtgctg gctgtttaga aggttcggag accatcgcag gtagaataaa catgctgctg 29220
cttaccctct ttgtcctggc gctggccgcc agctgccaag ccttttccga ggctgacttt 29280
atagagcccc agtgtaatgt gacttttaaa gcccatgcac agcgttgtca tactataatc 29340
aaatgtgcca ccgaacacga tgaatacctt atccagtata aagataaatc acacaaagtg 29400
gcacttgttg acatctggaa acccgaagac cctttggaat acaatgtgac cgttttccag 29460
ggtgacctct tcaaaattta caattacact ttcccatttg accagatgtg tgactttgtc 29520
atgtacatgg aaaagcagca caagctgtgg cctccgactc cccagggctg tgtggaaaat 29580
ccaggctctt tctgcatgat ctctctctgt gtaactgtgc tggcactaat actcacgctt 29640
ttgtatatca gatttaaatc aaggcaaagc ttcattgatg aaaagaaaat gccttaatcg 29700
ctttcacgct tgattgctaa caccgggttt ttatccgcag aatgattgga atcaccctac 29760
taatcacctc cctccttgcg attgcccatg ggttggaacg aatcgaagtc cctgtggggg 29820
ccaatgttac cctggtgggg cctgtcggca atgctacatt aatgtgggaa aaatatacta 29880
aaaatcaatg ggtctcttac tgcactaaca aaaatagcca caagcccaga gccatctgcg 29940
atgggcaaaa tctaaccttg attgatgttc aattgctgga tgcgggctac tattatgggc 30000
agctgggtac aatgattaat tactggagac cccacagaga ttacatgctc cacgtagtaa 30060
agggtcccct tagcagccca cccactacca cctctactac ccccactacc accactactc 30120
ccaccaccag cactgccgcc cagcctcctc atagcagaac aaccactttt atcaattcca 30180
agtcccactc cccccacatt gccggcgggc cctccgcctc agactccgaa accaccgaga 30240
tctgcttctg caaatgctct gacgccattg cccaggattt ggaagatcac gaggaagatg 30300
agcatgactt cgcagatgca tgccaggcat cagagccaga agcgctgccg gtggccctca 30360
aacagtatgc agacccccac accacccccg accttcctcc accttcccag aagccaagtt 30420
tcctggggga aaatgaaact ctgcctctct ccatactcgc tctgacatct gttgctatgt 30480
tgaccgctct gctggtgctt ctatgctcta tatgctacct gatctgctgc agaaagaaaa 30540
aatctcacgg ccatgctcac cagcccctca tgcacttccc ttaccctcca gagctgggcg 30600
accacaaact ttaagtctgc agtaactatc tgcccatccc ttgtcagtcg acagcgatga 30660
gccccactaa tctaacggcc tctggactta caacatcgtc tcttaatgag accaccgctc 30720
ctcaagacct gtacgatggt gtctccgcgc tggttaacca gtgggatcac ctgggcatat 30780
ggtggctcct cataggagca gtgaccctgt gcctaatcct ggtctggatc atctgctgca 30840
tcaaaagcag aagacccagg cggcggccca tctacaggcc ctttgtcatc acacctgaag 30900
atgatgatga caccacttcc aggctgcaga ggctaaagca gctactcttc tcttttacag 30960
catggtaaat tgaatcatgc ctcgcatttt catctacttg tctctccttc cactttttct 31020
gggctcttct acattggccg ctgtgtccca catcgaggta gactgcctca cgcccttcac 31080
agtctacctg cttttcggct ttgtcatctg cacctttgtc tgcagcgtta tcactgtagt 31140
gatctgcttc atacagtgca tcgactacgt ctgcgtgcgg gtggcttact ttagacacca 31200
cccccagtat cgcaacaggg acatagcggc tctcctaaga cttgtttaaa atcatggcca 31260
aattaactgt gattggtctt ctgatcatct gctgcgtcct agccgcgatt gggactcaag 31320
ctcctaccac caccagcgct cccagaaaga gacatgtatc ctgcagcttc aagcgtccct 31380
ggaatatacc ccaatgcttt actgatgaac ctgaaatctc tttggcttgg tacttcagcg 31440
tcaccgccct tcttatcttc tgcagtacgg ttattgccct tgccatctac ccttcccttg 31500
acctgggctg gaatgctgtc aactctatgg aatatcccac cttcccagaa ccagacctgc 31560
cagacctggt tgttctaaac gcgtttcctc ctcctgctcc cgttcaaaat cagtttcgcc 31620
ctccgtcccc cacgcccact gaggtcagct actttaatct aacaggcgga gatgactgaa 31680
aacctagacc tagaaatgga cggtctctgc agcgagcaac gcacactaga gaggcgccgg 31740
caaaaagagc tcgagcgtct taaacaagag ctccaagacg cggtggccat acaccagtgc 31800
aaaaaaggtg tcttctgtct ggtaaaacag gccacgctca cctatgaaaa aacaggtgac 31860
acccaccgcc taggatacaa gctgcccaca cagcgccaaa agttcgccct catgataggc 31920
gaacaaccca tcaccgtgac ccagcactcc gtggagacag aaggctgcat acatgctccc 31980
tgtaggggcg ctgactgcct ctacaccttg atcaaaaccc tctgcggtct cagagacctt 32040
atccctttca attaatcata actgtaatca ataaaaaatc acttacttga aatctgatag 32100
caagcctctg tccaattttt tcagcaacac ttccttcccc tcctcccaac tctggtactc 32160
taggcgcctc ctagctgcaa acttcctcca cagtctgaag ggaatgtcag attcctcctc 32220
ctgtccctcc gcacccacga tcttcatgtt gttgcagatg aaacgcgcga gatcgtctga 32280
cgagaccttc aaccccgtgt acccctacga taccgagatc gctccgactt ctgtcccttt 32340
ccttacccct ccctttgtgt catccgcagg aatgcaagaa aatccagctg gggtgctgtc 32400
cctgcacttg tcagagcccc ttaccaccca caatggggcc ctgactctaa aaatgggggg 32460
cggcctgacc ctggacaagg aagggaatct cacttcccaa aacatcacca gtgtcgatcc 32520
ccctctcaaa aaaagcaaga acaacatcag ccttcagacc gccgcacccc tcgccgtcag 32580
ctccggggcc ctaacacttt ttgccactcc ccccctagcg gtcagtggtg acaaccttac 32640
tgtgcagtct caggcccctc tcactttgga agactcaaaa ctaactctgg ccaccaaagg 32700
acccctaact gtgtccgaag gcaaacttgt cctagaaac 32739
<210> 23
<211> 32739
<212> DNA
<213> Artificial Sequence
<220>
<223> Adenovirus vector nucleotide sequences
<400> 23
ataatatacc ttattttgga ttgtggccaa tatgataatg aggtgggcgg ggagaggcgg 60
ggcgggtgac gtaggacgcg cgagtagggt tgggaggtgt ggcggaagtg tggcatttgc 120
aagtgggagg agctcacatg caagcttccg tcgcggaaaa tgtgacgttt ttgatgagcg 180
ccgcctacct ccggaagtgc caattttcgc gcgcttttca ccggatatcg tagtaatttt 240
gggcgggacc atgtaagatt tggccatttt cgcgcgaaaa gtgaaacggg gaagtgaaaa 300
ctgaataata gggcgttagt catagcgcgt aatatttacc gagggccgag ggactttgac 360
cgattacgtg gaggactcgc ccaggtgttt tttacgtgaa tttccgcgtt ccgggtcaaa 420
gtctccgttt ttattgtcac cgtcatttga cgcggagggt atttaaaccc gctgcgctcc 480
tcaagaggcc actcttgagt gccagcgaga agagttttct cctctgctcc gcttcggtga 540
tcgaaaaatg agacacatag cctgcactcc gggtcttttg tccggtcggg cggcggccga 600
gcttttggac gctttgatca atgatgtcct aagcgatgat tttccgtcta ctacccactt 660
tagcccacct actcttcacg aactgtacga tctggatgta ctggtggatg tgaacgatcc 720
caacgaggag gcggtttctg cgttttttcc cgagtctgcg ctgttggccg ctcaggaggg 780
atttgaccta cacactccgc cgcctatttt agagtctccg ctgccggagc ccagtggtat 840
accttatatg cctgaactgc ttcccgaagt ggtagacctg acctgccacg agcctggctt 900
tccgcccagc gacgatgagg gtgagccttt tgttttagac tttgctgaga tacctgggca 960
cggttgcagg tcttgtgcat atcatcagag ggttaccgga gaccccgagg ttaagtgttc 1020
gctgtgctat atgaggatga cctcttcctt tatctacagt aagtttttgt ctaggtgggc 1080
ttttgggtag gtgggttttg tgtcagaaca ggtgtaaacg ttgcttgtgt tttttgtacc 1140
tgtaggtccg gtgtccgagc cagacccgga gcccgaccgc gatcccgagc cggatcccga 1200
gcctcctcgc aggacaagga aactaccttc cattctgtgc aagtctcaga cacctgtaag 1260
gaccagcgag gcagacagca ccgactctgg cacttctacc tctccccctg aaattcaccc 1320
agtggttcct ctgggtatac ataaacctgt tgctgttaaa gtttgcgggc gacgccctgc 1380
agtacagtgc attgaggact tgcttcacga tcccgaggaa cctttggact tgagccttaa 1440
acgccctagg caataaaccc cacctaagta ataaacccca cctaagtaat aaaccctgcc 1500
gcccttggtt attgagatga cgcccaatgt ttgcttttga atgacttcat gtgtgtaata 1560
aaagtgagtg tgatcatagg tctcttgttt gtctgggcgg ggcttaaggg tatataagtc 1620
tcttggggct aaacttggtt acacttgacc ccaatggagg cgtgggggtg cttggaggag 1680
tttgcggacg tgcgccgttt gctggacgag agctctagca atacctatac tatttggagg 1740
tatctgtggg gctctactca ggccaagttg gtttccagaa ttaagcagga ttacaagtgc 1800
gattttgaag agctttttag ttcctgcggt gagcttttgc aatccttgaa tctgggccat 1860
caggctattt tccaggaaaa ggttctctcg actttggatt tttccactcc cgggcgcacc 1920
gccgcttgtg tggcttttgt gtcttttgtg caagataaat ggagcgagga gacccacctg 1980
agtcacggct acgtactgga tttcatggcg atggctcttt ggagggctca caacaaatgg 2040
aagattcaga aggaactgta cggttccgcc ctacgtcgtc cacttctgtc gcgacagggg 2100
ctgaggtttc ccgaccatcg gcagcatcag aatctggaag acgagtcgga ggagcgagcg 2160
gaggagaaga tcagcttgag agccggcctg gaccctcctc aggaggaatg aatctcccgc 2220
aggtggttga cctgtttcca gaactgagac gggtcctgac tatcagggag gatggtcagt 2280
ttgtgaagaa gtttaagagg gatcggggtg agggagatga tgaggcggct agcaatttag 2340
cttttagtct gatgactcgc caccgaccgg aatgtattac ctatcagcag attaaggaga 2400
gttgtgccaa cgagctggat cttttgggtc agaagtatag catagaacag cttaccactt 2460
actggcttca gcctggggat gattgggaag aggcgatcag ggtgtatgca aaggtggccc 2520
tgcggcccga ttgcaagtat aagattacta agttggttaa tattagaaac tgctgctata 2580
tttctgggaa cggggccgaa gtggagatag atactcagga cagggtggct tttaggtgtt 2640
gcatgataaa catgtggccc gggatactgg ggatggatgg ggtggtattc atgaatgtga 2700
ggtttacggg ccccaacttt aatggcacgg tgttcatggg caacaccaac ttgctcctgc 2760
atggtgcgag tttctatggg tttaataaca cctgtataga ggcctggacc gatgtaaagg 2820
ttcgaggttg ttccttttat agctgttgga aggcggtggt gtgtcgccct aaaagcaggg 2880
gttctgtgaa aaaatgcttg tttgaaaggt gcaccttagg catcctctct gagggcaact 2940
ccagggtgcg ccataatgtg gcttcgaact gcggttgctt catgcaagtg aagggggtga 3000
gcgttatcaa gcataactcg gtgtgtggaa actgcgagga tcgcgcctcc cagatgctga 3060
cctgctttga tggcaactgt cacctgttga agaccattca tataagcagc caccccagaa 3120
aggcctggcc cgtgtttgag cataacatct tgacccgctg ctccttgcat ctgggggtca 3180
ggaggggtat gttcctgcct taccagtgta actttagcca cactaaaatc ctgctggaac 3240
ccgagtgcat gaccaaggtc agcctgaatg gtgtgtttga tgtgactctg aaaatctgga 3300
aggtgctgag gtatgatgag accaggacca ggtgccgacc ctgcgagtgc ggcggcaagc 3360
acatgagaaa tcagcctgtg atgttggatg tgaccgagga gcttaggcct gaccatctgg 3420
tgctggcctg caccagggcc gagtttgggt ctagcgatga ggataccgat tgaggtgggt 3480
aaggtgggcg tggctagaag ggtggggcgt gtataaattg ggggtctaag ggtctctctg 3540
ttttgtcttg caacagccgc cgccatgagc gacaccggca acagctttga tggaagcatc 3600
tttagcccct atctgacagt gcgcatgcct cactgggctg gagtgcgtca gaatgtgatg 3660
ggttccaacg tggatggacg ccccgttctg ccttcaaatt cgtctacaat ggcctacgcg 3720
accgtgggag gaactccgct ggacgccgcg acctccgccg ccgcctccgc cgccgccgcg 3780
accgcgcgca gcatggctac ggacctttac agctctttgg tggcgagcgg cgcggcctct 3840
cgcgcgtctg ctcgggatga gaaactgacc gctctgctgc ttaaactgga agacttgacc 3900
cgggagctgg gtcaactgac ccagcaggtc tccagcttgc gtgagagcag ccttgcctcc 3960
ccctaatggc ccataatata aataaaagcc agtctgtttg gattaagcaa gtgtatgttc 4020
tttatttaac tctccgcgcg cggtaagccc gggaccagcg gtctcggtcg tttagggtgc 4080
ggtggattct ttccaacacg tggtacaggt ggctctggat gtttagatac atgggcatga 4140
gtccatccct ggggtggagg tagcaccact gcagagcttc gtgctcgggg gtggtgttgt 4200
atatgatcca gtcgtagcag gagcgctggg cgtggtgctg aaaaatgtcc ttaagcaaga 4260
ggcttatagc tagggggagg cccttggtgt aagtgtttac aaatctgctc agttgggagg 4320
ggtgcatccg gggggatata atgtgcatct tggactggat ttttaggttg gctatgttcc 4380
cacccagatc ccttctggga ttcatgttgt gcaggaccac cagcacggta tatccagtgc 4440
acttgggaaa tttatcgtgg agcttagacg ggaatgcatg gaagaacttg gagacgccct 4500
tgtggcctcc cagattttcc atacattcgt ccatgatgat ggcaatgggc ccgtgggaag 4560
ctgcctgagc aaaaatgttt ctgggatcgc tcacatcgta gttatgttcc agggtgaggt 4620
catcatagga catctttacg aatcgggggc ggagggtccc ggactggggg atgatggtac 4680
cctcgggccc cggggcgtag ttcccctcac agatctgcat ctcccaggct ttcatttcag 4740
agggagggat catatccacc tgcggagcga tgaaaaacac agtttctggc gcaggggaga 4800
ttaactggga tgagagcagg tttctgagca gctgtgactt tccacagccg gtgggcccat 4860
atatcacgcc tatcaccggc tgcagctggt agttaagaga gctgcagctg ccgtcctccc 4920
ggagcagggg ggccacctcg ttcagcatat ccctgacgtg gatgttctcc ctgaccaatt 4980
ccgccagaag gcgctcgccg cccagcgaaa gcagctcttg caaggaagca aaatttttca 5040
gcggttttag gccgtcggcc gtgggcatgt ttttcagcgt ctgggtcagc agttccagcc 5100
tgtcccacag ctcggtgatg tgctctacgg catctcgatc cagcagatct cctcgtttcg 5160
cgggttgggg cggctttcgc tgtagggcac cagccgatgg gcgtccagcg gggccagagt 5220
catgtccttc catgggcgca gggtcctcgt cagggtggtc tgggtcacgg tgaaggggtg 5280
cgctccgggt tgggcgctgg ccagggtgcg cttgaggctg gttctgctgg tgctgaatcg 5340
ctgccgctct tcgccctgcg cgtcggccag gtagcatttg accatggtct cgtagtcgag 5400
accctcggcg gcgtgcccct tggcgcggag ctttcccttg gaggtggcgc cgcacgaggg 5460
gcactgcagg ctcttcaggg cgtagagctt gggagcgaga aacacggact ctggggagta 5520
ggcgtccgcg ccgcaggaag cgcagaccgt ctcgcattcc accagccaag tgagctccgg 5580
gcggtcaggg tcaaaaacca ggttgccccc atgctttttg atgcgtttct tacctcggct 5640
ctccatgagg cggtgtccct tctcggtgac gaagaggctg tccgtgtccc cgtagaccga 5700
cttcaggggc ctgtcttcca gcggagtgcc tctgtcctcc tcgtagagaa actctgacca 5760
ctctgagacg aaggcccgcg tccaggccag gacgaaggag gccacgtggg aggggtagcg 5820
gtcgttgtcc actagcgggt ccaccttctc cagggtgtgc aggcacatgt ccccctcctc 5880
cgcgtccaga aaagtgattg gcttgtaggt gtaggacacg tgaccggggg ttcccgacgg 5940
gggggtataa aagggggtgg gcgccctttc atcttcactc tcttccgcat cgctgtctgc 6000
gagggccagc tgctggggta agtattccct ctcgaaggcg ggcatgacct cagcgctcag 6060
gttgtcagtt tctaaaaatg aggaggattt gatgttcacc tgtccggagg tgataccttt 6120
gagggtacct gggtccatct ggtcagaaaa cactattttt ttgttgtcaa gcttggtggc 6180
gaacgacccg tagagggcgt tggagagcag cttggcgatg gagcgcaggg tctggttttt 6240
gtcgcggtcg gctcgctcct tggccgcgat gttgagttgc acgtactcgc gggccacgca 6300
cttccactcg gggaagacgg tggtgcgctc gtctgggatt aggcgcaccc tccagcctcg 6360
gttgtgcagg gtgaccatgt cgacgctggt ggcgacctcg ccgcgcaggc gctcgttggt 6420
ccagcagagg cggccgccct tgcgcgagca gaaggggggt agggggtcca gctggtcctc 6480
gtttgggggg tccgcgtcga tggtgaagac cccggggagc aagcgcgggt caaagtagtc 6540
gatcttgcaa gcttgcatgt ccagagcccg ctgccattcg cgggcggcga gcgcgcgctc 6600
gtaggggttg aggggcgggc cccagggcat ggggtgggtg agcgcggagg cgtacatgcc 6660
gcagatgtca tacacgtaca ggggttccct gaggatgccg aggtaggtgg ggtagcagcg 6720
ccccccgcgg atgctggcgc gcacgtagtc atagagctcg tgggaggggg ccagcatgtt 6780
gggcccgagg ttggtgcgct gggggcgctc ggcgcggaag gcgatctgcc tgaagatggc 6840
atgggagttg gaggagatgg tgggccgctg gaagacgttg aagcttgctt cttgcaagcc 6900
caccgagtcc ctgacgaagg aggcgtagga ctcgcgcagc ttgtgcacca gctcggcggt 6960
gacctggacg tcgagcgcgc agtagtcgag ggtctcgcgg atgatgtcat acttatcctc 7020
ccccttcttt ttccacagct cgcggttgag gacgaactct tcgcggtctt tccagtactc 7080
ttggagggga aacccgtccg tgtccgaacg gtaagagcct agcatgtaga actggttgac 7140
ggcctggtag gggcaacagc ccttctccac gggcagcgcg taggcctgcg ccgccttgcg 7200
gagggaggtg tgggtgaggg cgaaagtgtc cctgaccatg actttgaggt attgatgttt 7260
gaagtctgtg tcatcgcagc cgccctgttc ccacagggtg tagtccgtgc gctttttgga 7320
gcgcgggttg ggcagggaga aggtgaggtc attgaagagg atcttccccg ctcgaggcat 7380
gaagtttctg gtgatgcgaa agggccctgg gaccgaggag cggttgttga tgacctgggc 7440
ggccaggacg atctcgtcaa agccgtttat gttgtggccc acgatgtaga gctccaaaaa 7500
gcggggctgg cccttgatgg aggggagctt tttgagttcc tcgtaggtga gctcctcggg 7560
cgattccagg ccgtgctcct ccagggccca gtcttgcaag tgagggttgg ccgccaggaa 7620
ggatcgccag aggtcgcggg ccatgagggt ctgcaggcgg tcgcggaagg ttctgaactg 7680
tcgccccacg gccatctttt cgggggtgat gcagtagaag gtgagggggt ctttctccca 7740
ggggtcccat ctgagctctc gggcgaggtc gcgcgcggcg gcgaccagag cctcgtcgcc 7800
ccccagtttc atgaccagca tgaagggcac gagctgcttg ccaaaggctc ccatccaagt 7860
gtaggtctct acatcgtagg tgacaaagag gcgctccgtg cgaggatgag agccgatcgg 7920
gaagaactgg atctcccgcc accagttgga ggattggctg ttgatgtggt gaaagtagaa 7980
gtcccgtctg cgggccgagc actcgtgctg gcttttgtaa aagcgaccgc agtactggca 8040
gcgctgcacg ggttgtatat cttgcacgag gtgaacctgg cgacctctga cgaggaagcg 8100
cagcgggaat ctaagtcccc cgcctggggt cccgtgtggc tggtggtctt ctactttggt 8160
tgtctggccg ccagcatctg tctcctggag ggcgatggtg gagcagacca ccacgccgcg 8220
agagccgcag gtccagatct cggcgctcgg cgggcggagt ttgatgacga catcgcgcac 8280
attggagctg tccatggtct ccagctcccg cggcggcagg tcagctggga gttcctggag 8340
gttcacctcg cagagacggg tcaaggcgcg ggcagtgttg agatggtatc tgatttcaag 8400
gggcgtgttg gcggcggagt cgatggcttg caggaggccg cagccccggg gggccacgat 8460
ggttccccgc ggggcgcgag gggaggcgga agctgggggt gtgttcagaa gcggtgacgc 8520
gggcgggccc ccggaggtag ggggggttcc ggccccacag gcatgggcgg caggggcacg 8580
tcttcgccgc gcgcgggcag gggctggtgc tggctccgaa gagcgcttgc gtgcgcgacg 8640
acgcgacggt tggtgtcctg tatctgacgc ctctgagtga agaccacggg tcccgtgacc 8700
ttgaacctga aagagagttc gacagaatca atctcggcat cgttgacagc ggcctggcgc 8760
aggatctcct gcacgtcgcc cgagttgtcc tggtaggcga tctctgccat gaactgctcg 8820
atctcttctt cctggagatc tcctcgtccg gcgcgctcca cggtggccgc caggtcgttg 8880
gagatgcgac ccatgagctg tgagaaggcg ttgagcccgc cctcgttcca gacccggctg 8940
tagaccacgc ccccctcggc gtcgcgagcg cgcatgacca cctgggccag gttgagctcc 9000
acgtgtcgcg tgaagacggc gtagttgcgc aggcgctgga aaaggtagtt cagggtggtg 9060
gcggtgtgct cggcgacgaa gaagtacatg acccagcgcc gcaacgtgga ttcattgatg 9120
tcccccaagg cctccaggcg ctccatggcc tcgtagaagt ccacggcgaa gttgaaaaac 9180
tgggagttgc gagcggacac ggtcaactcc tcctccagaa gacggatgag ctcggcgaca 9240
gtgttgcgca cctcgcgctc gaaggccacg gggggcgctt cttcctcttc cacctcttct 9300
tccatgatcg cttcttcttc ttcctcagcc gggacgggag ggggcggcgg cggcggggga 9360
ggggcgcggc ggcggcggcg gcgcaccggg aggcggtcga tgaagcgctc gatcatctcc 9420
ccccgcatgc ggcgcatggt ctcggtgacg gcgcggccgt tctcccgggg gcgcagctcg 9480
aagacgccgc ctctcatctc gccgcggggc gagcggccgt gaggtagcga gacggcgctg 9540
actatgcatc ttaacaattg ctgtgtaggt acaccgccga gggacctgat tgagtccaga 9600
tccaccggat ccgaaaacct ttggaggaaa gcgtctatcc agtcgcagtc gcaaggtagg 9660
ctgagcaccg tggcgggcgg gggcgggtct ggagagttcc tggcggagat gctgctgatg 9720
atgtaattaa agtaggcggt cttgagaagg cggatggtgg acaggagcac catgtctttg 9780
ggtccggcct gttggatgcg gaggcggtcg gccatgcccc aggcctcgtt ctgacaccgg 9840
cgcaggtctt tgtagtagtc ttgcatgagt ctttccaccg gcacctcttc tccttcctct 9900
tctccatctc gccggtggtt tctcgcgccg cccatgcgcg tgaccccaaa gcccctgagc 9960
ggctgcagca gggccaggtc ggcgaccacg cgctcggcca agatggcctg ctgcacctga 10020
gtgagggtcc tctcgaagtc atccatgtcc acgaagcggt ggtaggcgcc cgtgttgatg 10080
gtgtaggtgc agttggccat gacggaccag ttgacggtct ggtgtcccgg ctgcgagagc 10140
tccgtgtacc gcaggcgcga gaaggcgcgg gaatcgaaca cgtagtcgtt gcaagtccgc 10200
accagatact ggtagcccac caggaagtgc ggcggaggtt ggcgatagag gggccagcgc 10260
tgggtggcgg gggcgccggg cgccaggtct tccagcatga ggcggtggta tccgtagatg 10320
tacctggaca tccaggtgat gccggcggcg gtggtggtgg cgcgcgcgta gtcgcggacc 10380
cggttccaga tgtttcgcag gggcgagaag tgttccatgg tcggcacgct ctggccggtg 10440
aggcgcgcgc agtcgttgac gctctataca cacacaaaaa cgaaagcgtt tacagggctt 10500
tcgttctgta gcctggagga aagtaaatgg gttgggttgc ggtgtgcccc ggttcgagac 10560
caagctgagc tcggccggct gaagccgcag ctaacgtggt attggcagtc ccgtctcgac 10620
ccaggccctg tatcctccag gatacggtcg agagcccttt tgctttcttg gccaagcgcc 10680
cgtggcgcga tctgggatag atggtcgcga tgagaggaca aaagcggctc gcttccgtag 10740
tctggagaaa caatcgccag ggttgcgttg cggcgtaccc cggttcgagc ccctatggcg 10800
gcttgaatcg gccggaaccg cggctaacga gggccgtggc agccccgtcc tcaggacccc 10860
gccagccgac ttctccagtt acgggagcga gccccttttg ttttttattt tttagatgca 10920
tcccgtgctg cggcagatgc gcccctcgcc ccggcccgat cagcagcagc aacagcaggc 10980
atgcagaccc ccctctcccc tttccgcccc ggtcaccacg gccgcggcgg ccgtgtcggg 11040
cgcggggggc gcgctggagt cagatgagcc accgcggcgg cgacctaggc agtatctgga 11100
cttggaagag ggcgagggac tggcgcggct gggggcgaac tctccagagc gccacccgcg 11160
ggtgcagttg aaaagggacg cgcgcgaggc gtacctgccg cggcagaacc tgtttcgcga 11220
ccgcgggggc gaggagcccg aggagatgcg agactgcagg ttccaagcgg ggcgcgagct 11280
gcggcgcggg ctggacagac agcgcctgct gcgcgaggag gactttgagc ccgacacgca 11340
gacgggcatc agccccgcgc gcgcgcacgt agccgcggcc gacctggtga ccgcctacga 11400
gcagacggta aaccaggagc gcaacttcca aaagagcttc aacaaccacg tgcgcacgct 11460
ggtggcgcgc gaggaggtga ccctgggtct catgcatctg tgggacctgg tggaggcgat 11520
cgtgcagaac cccagcagca agcccctgac cgcgcagctg ttcctggtgg tgcagcacag 11580
cagggacaac gaggccttca gggaggcgct gctgaacatc accgagccgg aggggcgctg 11640
gctcctggac ctgataaaca tcctgcagag catagtggtg caggagcgca gcctgagcct 11700
ggccgagaag gtggcggcca tcaactactc tatgctgagc ctgggcaagt tctacgcccg 11760
caagatctac aagaccccct acgtgcccat agacaaggag gtgaagatag acagcttcta 11820
catgcgcatg gcgctgaagg tgctgaccct gagcgacgac ctgggagtgt accgcaacga 11880
gcgcatccac aaggccgtga gcgccagccg gcggcgcgag ctgagcgacc gcgagctgat 11940
gcacagtctg cagcgcgcgc tgaccggcgc gggcgagggc gacagggagg tcgagtccta 12000
cttcgacatg ggggccgacc tgcactggca gccgagccgc cgcgccctgg aggcggcggg 12060
ggcgtacggc ggccccctgg cggccgatga ccaggaagag gaggactatg agctagagga 12120
gggcgagtac ctggaggact gacctggctg gtggtgtttt ggtatagatg caagatccga 12180
acgtggcgga cccggcggtc cgggcggcgc tgcaaagcca gccgtccggc attaactcct 12240
ctgacgactg ggccgcggcc atgggtcgca tcatggccct gaccgcgcgc aaccccgagg 12300
ctttcaggca gcagcctcag gccaaccggc tggcggccat cttggaagcg gtagtgcccg 12360
cgcgctccaa ccccacccac gagaaggtgc tggccatagt caacgcgctg gcggagagca 12420
gggccatccg cgcggacgag gccggactgg tgtacgatgc gctgctgcag cgggtggcgc 12480
ggtacaacag cggcaacgtg cagaccaacc tggaccgcct ggtgacggac gtgcgcgagg 12540
ccgtggcgca gcgcgagcgc ttgcatcagg acggtaacct gggctcgctg gtggcgctaa 12600
acgccttcct cagcacccag ccggccaacg taccgcgggg gcaggaggac tacaccaact 12660
ttttgagcgc gctgcggctg atggtgaccg aggtccctca gagcgaggtg taccagtcgg 12720
ggcccgacta cttcttccag accagcagac agggcttgca aaccgtgaac ctgagccagg 12780
ctttcaagaa cctgcggggg ctgtggggag tgaaggcgcc caccggcgac cgggctacgg 12840
tgtccagcct gctaaccccc aactcgcgcc tgctgctgct gctgatcgcg cccttcacgg 12900
acagcgggag cgtctcgcgg gagacctatc tgggccacct gctgacgctg taccgcgagg 12960
ccatcgggca ggcgcaggtg gacgagcaca ccttccaaga gatcaccagc gtgagccacg 13020
cgctggggca ggaggacacg ggcagcctgc aggcgaccct gaactacctg ctgaccaaca 13080
ggcggcagaa gattcccacg ctgcacagcc tgacccagga ggaggagcgc atcttgcgct 13140
acgtgcagca gagcgtgagc ctgaacctga tgcgcgacgg cgtgacgccc agcgtggcgc 13200
tggacatgac cgcgcgcaac atggaaccgg gcatgtacgc ctcccaccgg ccgtttatca 13260
accgcctgat ggactacttg catcgggcgg cggccgtgaa ccccgagtac ttcactaatg 13320
ccattctgaa tccccactgg atgccccctc cgggtttcta caacggggac tttgaggtgc 13380
ccgaggtcaa cgacgggttc ctctgggatg acatggatga cagtgtgttc tcacccaacc 13440
cgctgcgcgc cgcgtctctg cgattgaagg agggctctga cagggaagga ccgaggagtc 13500
tggcctcctc cctggctctg ggagcggtgg gcgccacggg cgcggcggcg cggggcagta 13560
gccccttccc cagcctggca gactctctga acagcgggcg ggtgagcagg ccccgcttgc 13620
taggcgagga ggagtatctg aacaactccc tgctgcagcc cgcgagggac aagaacgctc 13680
agcggcagca gtttcccaac aatgggatag agagcctggt ggacaagatg tccagatgga 13740
agacgtatgc gcaggagtac aaggagtggg aggaccgcca gccgcggccc ttgccgcccc 13800
ctaggcagcg ctggcagcgg cgcgcgtcca accgccgctg gaggcagggg cccgaggacg 13860
atgatgactc tgcagatgac agcagcgtgt tggacctggg cgggagcggg aacccctttt 13920
cgcacctgcg cccacgcctg ggcaagatgt tttaaaagaa aaaaaaaata aaactcacca 13980
aggccatggc gacgagcgtt ggttttttgt tcccttcctt agtatgcggc gcgcggcgat 14040
gttcgaggag gggcctcccc cctcttacga gagcgcgatg gggatttctc ctgcggcgcc 14100
cctgcagcct ccctacgtgc ctcctcggta cctgcaacct acagggggga gaaatagcat 14160
ctgttactct gagctgcagc ccctgtacga taccaccaga ctgtacctgg tggacaacaa 14220
gtccgcggac gtggcctccc tgaactacca gaacgaccac agcgattttt tgaccacggt 14280
gatccaaaac aacgacttca ccccaaccga ggccagcacc cagaccataa acctggataa 14340
caggtcgaac tggggcggcg acctgaagac catcttgcac accaacatgc ccaacgtgaa 14400
cgagttcatg ttcaccaact cttttaaggc gcgggtgatg gtggcgcgcg agcaggggga 14460
ggcgaagtac gagtgggtgg acttcacgct gcccgagggc aactactcag agaccatgac 14520
tctcgacctg atgaacaatg cgatcgtgga acactatctg aaagtgggca ggcagaacgg 14580
ggtgaaggaa agcgatatcg gggtcaagtt tgacaccaga aacttccgtc tgggctggga 14640
ccccgtgacc gggctggtca tgccgggggt ctacaccaac gaggcctttc atcccgacat 14700
agtgcttctg cccggctgtg gggtggactt cacccagagc cggctgagca acctgctggg 14760
cattcgcaag cggcagcctt tccaggaggg tttcaagatc acctatgagg atctgaaggg 14820
gggcaacatt cccgcgctcc ttgatctgga cgcctacgag gagagcttga aacccgagga 14880
gagcgctggc gacagcggcg agagtggcga ggagcaagcc ggcggcggtg gcggcgcgtc 14940
ggtagaaaac gaaagtacgc ccgcagtggc ggcggacgct gcggaggtcg agccggaggc 15000
catgcagcag gacgcagagg agggcgcaca ggagggcgcg cagaaggaca tgaacgatgg 15060
ggagatcagg ggagacacat tcgccacccg gggcgaagaa aaagaggcag aggcggcggc 15120
ggcggcgacg gcggaggccg aaaccgaggt tgaggcagag gcagagcccg agaccgaagt 15180
tatggaagac atgaatgatg gagaacgtag gggcgacacg ttcgccaccc ggggcgaaga 15240
gaaggcggcg gaggcagaag ccgcggctga ggaggcggct gcggctgcgg ccaagactga 15300
ggctgcggct aaggctgagg tcgaagccaa tgttgcggtt gaggctcagg ctgaggagga 15360
ggcggcggct gaagcagtta aggaaaaggc ccaggcagag caggaagaga aaaaacctgt 15420
cattcaacct ctaaaagaag atagcaaaaa gcgcagttac aacgtcatcg agggcagcac 15480
ctttacccag taccgcagct ggtacctggc gtacaactac ggcgacccgg tcaagggggt 15540
gcgctcgtgg accctgctct gcacgccgga cgtcacctgc ggctccgagc agatgtactg 15600
gtcgctgccg aacatgatgc aagacccggt gaccttccgc tccacgcggc aggttagcaa 15660
cttcccggtg gtgggcgccg aactgctgcc cgtgcactcc aagagttttt acaacgagca 15720
ggccgtctac tcccagctga tccgccaggc cacctctctg acccacgtgt tcaatcgctt 15780
tcccgagaac cagattttgg cgcgcccgcc ggcccccacc atcaccaccg tgagtgaaaa 15840
cgttcctgcc ctcacagatc acgggacgct accgctgcgc aacagcatct caggagtcca 15900
gcgagtgacc attactgacg ccagacgccg gacctgcccc tacgtttaca aggccttggg 15960
catagtctcg ccgcgcgtcc tctccagtcg cactttttaa aacacatcta cccacacgtt 16020
ccaaaatcat gtccgtactc atctcaccca gcaacaacac cggctggggg ctgcgcgcgc 16080
ccagcaagat gtttggaggg gcgaggaagc gctccgacca gcaccctgtg cgcgtgcgcg 16140
gccactaccg cgcgccctgg ggagcgcaca agcgcgggcg cacagggcgc accactgtgg 16200
acgacgtcat tgactccgta gtggagcaag cgcgccacta cacacccggc gcgccgaccg 16260
cccccgccgt gtccaccgtg gaccaggcga tcgaaagcgt ggtacagggc gcgcggcact 16320
atgccaacct taaaagtcgc cgccgccgcg tggcccgccg ccatcgccgg agaccccggg 16380
ccaccgccgc cgcgcgcctt actaaggctc tgctcaggcg cgccaggcga actggccacc 16440
gggccgccat gagggccgca cggcgggctg ccgctgccgc aagcgtcgtg gccccgcggg 16500
cacgaaggcg cgcggccgct gccgccgccg ccgccatttc cagcttggcc tcgacgcggc 16560
gcggtaacat atactgggtg cgcgactcgg taaccggcac gcgggtaccc gtgcgctttc 16620
gccccccgcg gaattagcac aagacaacat acacactgag tctcctgctg ttgtgtatcc 16680
cagcggcgac cgtcagcagc ggcgacatgt ccaagcgcaa aattaaagaa gagatgctcc 16740
aggtcatcgc gccggagatc tatgggcccc cgaagaagga ggaggatgat tacaagcccc 16800
gcaagctaaa gcgggtcaaa aagaaaaaga aagatgatga tgacgaggcg gtggagtttg 16860
tccgccgcat ggcacccagg cgccccgtgc agtggaaggg ccggcgcgtg cagcgcgttt 16920
tgcgccccgg caccgcggtg gtcttcacgc ccggcgagcg ctccacgcgc actttcaagc 16980
gggtgtacga tgaggtgtac ggcgacgagg acctgttgga gcaggccaac cagcgctttg 17040
gggagtttgc atatgggaaa cggccccgcg agagtctaaa agaggacctg ctggcgctac 17100
cgctggacga gggcaatccc accccgagtc tgaagccggt aaccctgcaa caggtgctgc 17160
ctttgagcgc gcccagcgag cataagcgag ggttgaagcg cgaaggcggg gacctggcgc 17220
ccaccgtgca gttgatggtg cccaagcggc agaagctgga ggacgtgctg gagaaaatga 17280
aagtagagcc cgggatccag cccgagatca aggtccgccc catcaagcag gtggcgcccg 17340
gcgtgggagt ccagaccgtg gacgttagga ttcccacgga ggagatggaa acccaaaccg 17400
ccactccctc ttcggcggcc agcgccacca ccggcaccgc ttcggtagag gtgcagacgg 17460
acccctggct acccgccacc gctgttgccg ccgccgcccc ccgttcgcgc gggcgcaaga 17520
gaaattatcc agcggccagc gcgctcatgc cccagtacgc actgcatcca tccatcgtgc 17580
ccacccccgg ctaccgcggg tactcgtacc gcccgcgcag atcagccggc actcgcggcc 17640
gccgccgccg tgcgaccaca accagccgcc gccgtcgccg ccgccgccag ccagtgctga 17700
cccccgtgtc tgtaaggaag gtggctcgct cggggagcac gctggtggtg cccagagcgc 17760
gctaccaccc cagcatcgtt taaagccggt ctctgtatgg ttcttgcaga tatggccctc 17820
acttgtcgcc tccgcttccc ggtgccggga taccgaggaa gaactcaccg ccgcagaggc 17880
atggcgggca gcggtctccg cggcggccgt cgccatcgcc ggcgcgcaaa aagcaggcgc 17940
atgcgcggcg gtgtgctgcc tctgctaatc ccgctaatcg ccgcggcgat cggtgccgta 18000
cccgggatcg cctccgtggc cctgcaggcg tcccagaaac gttgactctt gcaaccttgc 18060
aagcttgcat tttttggagg aaaaataaaa aaaagtctag actctcacgc tcgcttggtc 18120
ctgtgactat tttgtagaaa aaaagatgga agacatcaac tttgcgtcgc tggccccgcg 18180
tcacggctcg cgcccgttca tgggagactg gacagatatc ggcaccagca atatgagcgg 18240
tggcgccttc agctggggca gtctgtggag cggccttaaa aattttggtt ccaccattaa 18300
gaactatggc aacaaagcgt ggaacagcag cacgggccag atgctgagag acaagttgaa 18360
agagcagaac ttccaggaga aggtggcgca gggcctggcc tctggcatca gcggggtggt 18420
ggacatagct aaccaggccg tgcagaaaaa gataaacagt catctggacc cccgtcctca 18480
ggtggaggaa atgcctccag cgatggagac ggtgtctccc gagggcaaag gcgaaaagcg 18540
cccgcggccc gacagagaag agaccctggt gtcacacacc gaggagccgc cctcttacga 18600
ggaggcagtc aaggccggcc tgcccaccac tcgccccata gcccccatgg ccaccggtgt 18660
ggtgggccac aggcaacaca ctcccgcaac actagatctg cccccgccgt ccgagccgcc 18720
gcgccagcca aaggcggcga cggtgcccgc tccctccact tccgccgcca acagagtgcc 18780
cctgcgccgc gccgcgagcg gcccccgggc ctcgcgagtt agcggcaact ggcagagcac 18840
actgaacagc atcgtgggcc tgggagtgag gagtgtgaag cgccgccgtt gctactgaat 18900
gagcaagcta gctaacgtgt tgtatgtgtg tatgcgtcct atgtcgccgc cagaggagct 18960
gttgagccgc cggcgccgtc tgcactccag cgaatttcaa gatggcgacc ccatcgatga 19020
tgcctcagtg gtcgtacatg cacatctcgg gccaggacgc ttcggagtac ctgagccccg 19080
ggctggtgca gttcgcccgc gccacagaca cctacttcaa catgagtaac aagttcagga 19140
accccactgt ggcgcccacc cacgatgtga ccacggaccg gtcgcagcgc ctgacgctgc 19200
ggttcatccc cgtggatcgg gaggacaccg cctactctta caaggcgcgg ttcacgctgg 19260
ccgtgggcga caaccgcgtg ctggacatgg cctccactta ctttgacatc aggggggtgc 19320
tggacagggg ccccaccttc aagccctact cgggtactgc ctacaactcc ctggccccca 19380
agggcgctcc caattcttgc gagtgggaac aagatgaacc agctcaggca gcaatagctg 19440
aagatgaaga agaacttgaa gaagaacaag ctcaggacga acaggcgccc actaagaaaa 19500
cccatgtata cgcccaggca cctctttctg gtgaaaaaat tactaaggat ggtttgcaaa 19560
taggtgtgga tgccacacag gcgggagata accctatata tgctgataaa acattccaac 19620
ccgaacctca gataggtgag tctcagtgga acgaggctga tgccacagta gcaggaggca 19680
gagtcttaaa aaagaccacc cctatgagac cttgctatgg atcctatgcc aaacctacta 19740
atgccaatgg cggtcaaggg atcatggtgg ccaatgatca gggagcgctt gaatctaaag 19800
ttgagatgca atttttctcc accacaacgt ctcttaatgt aagggaaggt gaaaacaatc 19860
ttcagccaaa agtagtgcta tacagcgaag atgttaactt ggaatcccct gacactcatt 19920
tgtcttacaa acctaaaaag gatgacacca actctaaaat catgttgggt cagcaagcca 19980
tgcccaacag acccaacctc attgctttta gggacaactt tattggactt atgtactaca 20040
acagcacagg caacatggga gtgctggcag gacaggcctc ccagctaaac gctgtggtag 20100
acttgcaaga cagaaacaca gagctgtcat accaactgat gcttgattcc attggagaca 20160
gatcaagata cttttccatg tggaaccagg cagtggacag ctatgaccca gatgtcagaa 20220
tcattgaaaa ccatggggtt gaagatgagc tgcccaacta ttgctttccc ctgggcggta 20280
ttggaattac agacacatac cagtgcataa aaccaaccgc agctgctaat aacactacat 20340
ggtctaagga tgaagaattt agtgatcgca atgaaatagg ggtgggaaac aacttcgcca 20400
tggagatcaa catccaggcc aacctctgga ggaacttcct ctatgcgaac gtggggctct 20460
acctgccaga caagctcaag tacaacccca ccaacgtgga catctctgac aaccccaaca 20520
cctatgacta catgaacaag cgtgtggtgg ctcccggcct ggtggactgc tttgtcaatg 20580
tgggagccag gtggtccctg gactacatgg acaacgtcaa ccccttcaac caccaccgca 20640
atgcgggtct gcgctaccgc tccatgatcc tgggcaacgg gcgctacgtg cccttccaca 20700
ttcaggtgcc ccagaagttc tttgccatca agaacctcct cctcctgccg ggctcctaca 20760
cttacgagtg gaacttcagg aaggatgtca acatggtcct gcagagctct ctgggcaatg 20820
accttagggt ggacggggcc agcatcaagt ttgacagcgt caccctctat gctaccttct 20880
tccccatggc tcacaacacc gcctccacgc tcgaggccat gctgaggaac gacaccaacg 20940
accagtcctt caatgactac ctctctgggg ccaacatgct ctaccccatc cccgccaagg 21000
ccaccaacgt gcccatctcc attccctctc gcaactgggc cgccttcaga ggctgggcct 21060
ttacccgcct taagaccaag gaaaccccct ccctgggctc gggttttgac ccctactttg 21120
tctactcggg atccatcccc tacctggatg gcaccttcta cctcaaccac acttttaaga 21180
agatatccat catgtatgac tcctccgtca gctggccggg caatgaccgc ctgctcaccc 21240
ccaatgagtt cgaggtcaag cgcgccgtgg acggcgaggg ctacaacgtg gcccagtgca 21300
acatgaccaa ggactggttc ctggtgcaga tgctggccaa ctacaacata ggctaccagg 21360
gcttctacat cccagagagc tacaaggaca ggatgtactc cttcttcaga aatttccaac 21420
ccatgagcag gcaggtggtg gacgagacca aatacaagga ctatcaggcc attggcatca 21480
ctcaccagca caacaactcg ggattcgtgg gctacctggc tcccaccatg cgcgaggggc 21540
aggcctaccc cgccaacttc ccctacccgt tgataggcaa aaccgcggtc gacagcgtca 21600
cccagaaaaa gttcctctgc gaccgcaccc tctggcgcat ccccttctct agcaacttca 21660
tgtccatggg tgcgctcacg gacctgggcc agaacctgct ctatgccaac tccgcccatg 21720
cgctggacat gacttttgag gtggacccca tggacgagcc cacccttctc tatattgtgt 21780
ttgaagtgtt cgacgtggtc agagtgcacc agccgcaccg cggtgtcatc gagaccgtgt 21840
acctgcgcac gcccttctcg gccggcaacg ccaccaccta aggagacagc gccgccgcct 21900
gcatgacggg ttccaccgag caagagctca gggccatcgc cagagacctg ggatgcggac 21960
cctatttttt gggcacctat gacaaacgct tcccgggctt catctcccga gacaagctcg 22020
cctgcgccat cgtcaacacg gccgcgcgcg agaccggggg cgtgcactgg ctggcctttg 22080
gctgggaccc gcgctccaaa acctgctacc tcttcgaccc ctttggcttc tccgatcagc 22140
gcctcagaca gatctatgag tttgagtacg aggggctgct gcgccgcagc gcgcttgcct 22200
cctcgcccga ccgctgcatc acccttgaga agtccaccga gaccgtgcag gggccccact 22260
cggccgcctg cggtctcttc tgctgcatgt ttttgcacgc ctttgtgcgc tggccccaga 22320
gtcccatgga tcgcaacccc accatgaact tgctcaaggg agtgcccaac gccatgctcc 22380
agagccccca ggtccagccc accctgcgcc acaaccagga acagctctac cgcttcctgg 22440
agcgccactc cccctacttc cgcagtcaca gcgcgcacat ccggggggcc acctctttct 22500
gccacttgca agaaaacatg caagacggaa aatgatgtac agctcgcttt ttaataaatg 22560
taaagactgt gcactttatt tatacacggg ctctttctgg ttatttattc aacaccgccg 22620
tcgccatcta gaaatcgaaa gggttctgcc gcgcgtcgcc gtgcgccacg ggcagagaca 22680
cgttgcgata ctggaagcgg ctcgcccact taaactcggg caccaccatg cggggcagtg 22740
gttcctcggg gaagttctcg ccccacaggg tgcgggtcag ctgcagcgcg ctcaggaggt 22800
cgggagccga gatcttgaag tcgcagttgg ggccggaacc ctgcgcgcgc gagttgcggt 22860
acacggggtt gcagcactgg aacaccagca gggccggatt atgcacgctg gccagcaggc 22920
tctcgtcgct gatcatgtcg ctgtccagat cctccgcgtt gctcagggcg aacggggtca 22980
tcttgcagac ctgcctgccc aggaaaggcg gcagcccggg cttgccgttg cagtcgcagc 23040
gcaggggcat cagcaggtgc ccgcggcccg actgcgcctg cgggtacagc gcgcgcatga 23100
aggcttcgat ctgcctgaaa gccacctgcg tcttggctcc ctccgaaaag aacatcccac 23160
aggacttgct ggagaactgg ttcgcgggac agctggcatc gtgcaggcag cagcgcgcgt 23220
cggtgttggc gatctgcacc acgttgcgac cccaccggtt cttcactatc ttggccttgg 23280
aagcctgctc cttcagcgcg cgctggccgt tctcgctggt cacatccatc tctatcacct 23340
gctccttgtt gatcatgttt gtaccgtgca gacacttcag gtcgccctcc gtctgggtgc 23400
agcggtgctc ccacagcgcg caaccggtgg gctcccaatt tttgtgggtc acccccgcgt 23460
aggcctgcag gtaggcctgc aagaagcgcc ccatcatggc cacaaaggtc ttctggctcg 23520
taaaggtcag ctgcaggccg cgatgctctt cgttcagcca ggtcttgcag atggcggcca 23580
gcgcctcggt ctgctcgggc agcatcctaa aatttgtctt caggtcgtta tccacgtggt 23640
acttgtccat catggcgcgc gccgcctcca tgcccttctc ccaggcggac accatgggca 23700
ggcttagggg gtttatcact tccaccggcg aggacaccgt actttcgatt tcttcttcct 23760
ccccctcttc ccggcgcgcg cccacgctgc tgcgcgctct caccgcctgc accaaggggt 23820
cgtcttcagg caagcgccgc accgagcgct tgccgccctt gacctgctta atcagcaccg 23880
gcgggttgct gaagcccacc atggtcagcg ccgcctgctc ttcttcgtct tcgctgtcta 23940
ccactatctc tggggaaggg cttctccgct ctgcggcggc gcgcttcttt tttttcttgg 24000
gagcggccgt gatggagtcc gccacggcga cggaggtcga gggcgtgggg ctgggggtgc 24060
gcggtaccag ggcctcgtcg ccctcggact cttcctctga ctccaggcgg cggcggagtc 24120
gcttctttgg gggcgcgcgc gtcagcggcg gcggagacgg ggacggggac ggggacggga 24180
cgccctccac agggggtggt cttcgcgcag acccgcggcc gcgctcgggg gtcttctcga 24240
gctggtcttg gtcccgactg gccattgtat cctcctcctc ctaggcagag agacataagg 24300
agtctatcat gcaagtcgag aaggaggaga gcttaaccac cccctctgag accgccgatg 24360
cgcccgccgt cgccgtcgcc cccgctgccg ccgacgcgcc cgccacaccg agcgacaccc 24420
ccgcggaccc ccccgccgac gcacccctgt tcgaggaagc ggccgtggag caggacccgg 24480
gctttgtctc ggcagaggag gatttgcgag aggaggagga taaggagaag aagccctcag 24540
tgccaaaaga tgataaagag caagacgagc acgacgcaga tgcacaccag ggtgaagtcg 24600
ggcgggggga cggagggcat gacggcgccg actacctaga cgaagggaac gacgtgctct 24660
tgaagcacct gcatcgtcag tgcgccattg tttgcgacgc tctgcaggag cgcagcgaag 24720
tgcccctcag cgtggcggag gtcagccacg cctacgagct cagcctcttc tccccccggg 24780
tgcccccccg ccgccgcgaa aacggcacat gcgagcccaa cccgcgcctc aacttctacc 24840
ccgcctttgt ggtacccgag gtcctggcca cctatcacat cttctttcaa aattgcaaga 24900
tccccctctc gtgccgcgcc aaccgtagcc gcgccgataa gatgctggcc ctgcgccagg 24960
gcgaccacat acctgatatc gccgctttgg aagatgtacc aaagatcttc gagggtctgg 25020
gtcgcaacga gaagcgggca gcaaactctc tgcaacagga aaacagcgaa aatgagagtc 25080
acaccggggt actggtggag ctcgagggcg acaacgcccg cctggcggtg gtcaagcgca 25140
gcatcgaggt cacccacttt gcctaccccg cgctaaacct gccccccaaa gtcatgaacg 25200
cggccatgga cgggctgatc atgcgccgcg gccggcccct cgctccagat gcaaacttgc 25260
atgaggagac cgaggacggc cagcccgtgg tcagcgacga gcagctggcg cgctggctgg 25320
agaccgcgga ccccgccgaa ctggaggagc ggcgcaagat gatgatggcc gtggtgctgg 25380
tcaccgtaga gctggagtgt ctgcagcgct tcttcggcga ccccgagatg cagagaaagg 25440
tcgaggagac cctgcactac accttccgcc agggctacgt gcgccaggct tgcaagatct 25500
ccaacgtgga gctcagcaac ctggtgtcct acctgggcat cttgcatgag aaccgcctcg 25560
ggcagagcgt gctgcactcc accctgcgcg gggaggcgcg ccgcgactac gtgcgcgact 25620
gcgtttacct cttcctctgc tacacctggc agacggccat gggggtctgg cagcagtgcc 25680
tggaggagcg caacctcaag gagctggaga agctcctgca gcgcgcgctc aaagatctct 25740
ggacgggcta caacgagcgc tcggtggccg ccgcgctggc cgacctcatc ttccccgagc 25800
gcctgctcaa aaccctccag caggggctgc ccgacttcac cagccaaagc atgttgcaaa 25860
acttcaggaa ctttatcctg gagcgttctg gcatcctacc cgccacctgc tgcgccctgc 25920
ccagcgactt tgtccccctc gtgtaccgcg agtgcccccc gccgctgtgg ggtcactgct 25980
acctgttcca actggccaac tacctgtcct accacgcgga cctcatggag gactccagcg 26040
gcgaggggct catggagtgc cactgccgct gcaacctctg cacgccccac cgctccctgg 26100
tctgcaacac ccaactgctc agcgagagtc agattatcgg taccttcgag ctacagggtc 26160
cgtcctcctc agacgagaag tccgcggctc cggggctaaa actcactccg gggctgtgga 26220
cttccgccta cctgcgcaaa tttgtacctg aagactacca cgcccacgag atcaggtttt 26280
acgaagacca atcccgcccg cccaaggcgg agctgaccgc ctgcgtcatc acccagggcg 26340
agatcctagg ccaattgcaa gccatccaaa aagcccgcca agactttttg ctgaagaagg 26400
gtcggggggt gtatctggac ccccagtcgg gtgaggagct caacccggtt cccccgctgc 26460
cgccgccgcg ggaccttgct tcccaggata agcatcgcca tggctcccag aaagaagcag 26520
cagcggccgc cactgccgcc accccacatg ctggaggaag aggaggaata ctgggacagt 26580
caggcagagg aggtttcgga cgaggaggag ccggagacgg agatggaaga gtgggaggag 26640
gacagcttag acgaggaggc ttccgaagcc gaagaggcag acgcaacacc gtcaccctcg 26700
gccgcagccc cctcgcaggc gcccccgaag tccgctccca gcatcagcag caacagcagc 26760
gctataacct ccgctcctcc accgccgcga cccacggccg accgcagacc caaccgtaga 26820
tgggacacca ccggaaccgg ggccggtaag tcctccggga gaggcaagca agcgcagcgc 26880
caaggctacc gctcgtggcg cgctcacaag aacgccatag tcgcttgctt gcaagactgc 26940
ggggggaaca tctccttcgc ccgccgcttc ctgctcttcc accacggtgt ggccttcccc 27000
cgtaacgtcc tgcattacta ccgtcatctc tacagcccct actgcggcgg cagtgagcca 27060
gagacggtcg gcggcggcgg cggcgcccgt ttcggcgcct aggaagaccc agggcaagac 27120
ttcagccaag aaactcgcgg cggccgcggc gaacgcggtc gcgggggccc tgcgcctgac 27180
ggtgaacgaa cccctgtcga cccgcgaact gaggaaccga atcttcccca ctctctatgc 27240
catcttccag cagagcagag ggcaggatca ggaactgaaa gtaaaaaaca ggtctctgcg 27300
ctccctcacc cgcagctgtc tgtatcacaa gagcgaagac cagcttcggc gcacgctgga 27360
ggacgctgag gcactcttca gcaaatactg cgcgctcact cttaaggact agctccgcgc 27420
ccttctcgaa tttaggcggg aacgcctacg tcatcgcagc gccgccgtca tgagcaagga 27480
cattcccacg ccatacatgt ggagctatca gccgcagatg ggactcgcgg cgggcgcctc 27540
ccaagactac tccacccgca tgaactggct cagtgccggc ccacacatga tctcacaggt 27600
taatgatatc cgcacccatc gaaaccaaat attggtggag caggcggcaa ttaccaccac 27660
gccccgcaat aatcccaacc ccagggagtg gcccgcgtcc ctggtgtatc aggaaattcc 27720
cggccccacc accgtactac ttccgcgtga ttcccaggcc gaagtccaaa tgactaactc 27780
aggggcacag ctcgcgggcg gctgtcgtca cagggtgcgg cctcctcgcc agggtataac 27840
tcacctggag atccgaggca gaggtattca gctcaacgac gagtcggtga gctcctcgct 27900
cggtctcaga cctgacggga ccttccagat agccggagcc ggccgatctt ccttcacgcc 27960
ccgccaggcg tacctgactc tgcaaagctc gtcctcggcg ccgcgctcgg gcggcatcgg 28020
gactctccag ttcgtgcagg agtttgtgcc ctcggtctac ttcaacccct tctcgggctc 28080
tcccggtcgc tacccggacc agttcatctc gaactttgac gccgcgaggg actcggtgga 28140
cggctacgac tgaatgtcgg gtggacccgg tgcagagcaa cttcgcctga agcacctcga 28200
ccactgccgc cgccctcagt gctttgcccg ctgtcagacc ggtgagttcc agtacttttc 28260
cctgcccgac tcgcacccgg acggcccggc gcacggggtg cgctttttca tcccgagtca 28320
ggtgcgctct accctaatca gggagtttac cgcccgtccc ctactggcgg agttggaaaa 28380
ggggccttct atcctaacca ttgcctgcat ctgctctaac cctggattgc accaagatct 28440
ttgctgtcat ttgtgtgctg agtataataa aggctgagat cagaatctac tcgggctcct 28500
gtcgccatcc tgtcaacgcc accgtccaag cccggcccga tcagcccgag gtgaacctca 28560
cctgcggtct gcaccggcgc ctgaggaaat acctagcttg gtactacaac agcactccct 28620
ttgtggttta caacagcttt gaccaggacg gggtctcact gagggataac ctctcgaacc 28680
tgagctactc catcaggaag aacagcaccc tcgagctact tcctccttac ctgcccggga 28740
cttaccagtg tgtcaccggt ccctgcaccc acacccacct gttgatcgta aacgactctc 28800
ttccgagaac agacctcaat aactcctctt cgcagttccc cagaacagga ggtgagctca 28860
ggaaaccccg ggtaaagaag ggtggacgag agttaacact tgtggggttt ctggtgtatg 28920
tgacgctggt ggtggctctt ttgattaagg cttttccttc catgtctgaa ctctccctct 28980
tcttttatga acaactcgac tagtgctaac gggaccctac ccaacgaatc gggattgaat 29040
atcggtaacc aggttgcagt ttcacttttg attaccttca tagtcctctt cctgctagtg 29100
ctgtcgcttc tgtgcctgcg gatcgggggc tgctgcatcc acgtttatat ctggtgctgg 29160
ctgtttagaa ggttcggaga ccatcgcagg tagaataaac atgctgctgc ttaccctctt 29220
tgtcctggcg ctggccgcca gctgccaagc cttttccgag gctgacttta tagagcccca 29280
gtgtaatgtg acttttaaag cccatgcaca gcgttgtcat actataatca aatgtgccac 29340
cgaacacgat gaatacctta tccagtataa agataaatca cacaaagtgg cacttgttga 29400
catctggaaa cccgaagacc ctttggaata caatgtgacc gttttccagg gtgacctctt 29460
caaaatttac aattacactt tcccatttga ccagatgtgt gactttgtca tgtacatgga 29520
aaagcagcac aagctgtggc ctccgactcc ccagggctgt gtggaaaatc caggctcttt 29580
ctgcatgatc tctctctgtg taactgtgct ggcactaata ctcacgcttt tgtatatcag 29640
atttaaatca aggcaaagct tcattgatga aaagaaaatg ccttaatcgc tttcacgctt 29700
gattgctaac accgggtttt tatccgcaga atgattggaa tcaccctact aatcacctcc 29760
ctccttgcga ttgcccatgg gttggaacga atcgaagtcc ctgtgggggc caatgttacc 29820
ctggtggggc ctgtcggcaa tgctacatta atgtgggaaa aatatactaa aaatcaatgg 29880
gtctcttact gcactaacaa aaatagccac aagcccagag ccatctgcga tgggcaaaat 29940
ctaaccttga ttgatgttca attgctggat gcgggctact attatgggca gctgggtaca 30000
atgattaatt actggagacc ccacagagat tacatgctcc acgtagtaaa gggtcccctt 30060
agcagcccac ccactaccac ctctactacc cccactacca ccactactcc caccaccagc 30120
actgccgccc agcctcctca tagcagaaca accactttta tcaattccaa gtcccactcc 30180
ccccacattg ccggcgggcc ctccgcctca gactccgaaa ccaccgagat ctgcttctgc 30240
aaatgctctg acgccattgc ccaggatttg gaagatcacg aggaagatga gcatgacttc 30300
gcagatgcat gccaggcatc agagccagaa gcgctgccgg tggccctcaa acagtatgca 30360
gacccccaca ccacccccga ccttcctcca ccttcccaga agccaagttt cctgggggaa 30420
aatgaaactc tgcctctctc catactcgct ctgacatctg ttgctatgtt gaccgctctg 30480
ctggtgcttc tatgctctat atgctacctg atctgctgca gaaagaaaaa atctcacggc 30540
catgctcacc agcccctcat gcacttccct taccctccag agctgggcga ccacaaactt 30600
taagtctgca gtaactatct gcccatccct tgtcagtcga cagcgatgag ccccactaat 30660
ctaacggcct ctggacttac aacatcgtct cttaatgaga ccaccgctcc tcaagacctg 30720
tacgatggtg tctccgcgct ggttaaccag tgggatcacc tgggcatatg gtggctcctc 30780
ataggagcag tgaccctgtg cctaatcctg gtctggatca tctgctgcat caaaagcaga 30840
agacccaggc ggcggcccat ctacaggccc tttgtcatca cacctgaaga tgatgatgac 30900
accacttcca ggctgcagag gctaaagcag ctactcttct cttttacagc atggtaaatt 30960
gaatcatgcc tcgcattttc atctacttgt ctctccttcc actttttctg ggctcttcta 31020
cattggccgc tgtgtcccac atcgaggtag actgcctcac gcccttcaca gtctacctgc 31080
ttttcggctt tgtcatctgc acctttgtct gcagcgttat cactgtagtg atctgcttca 31140
tacagtgcat cgactacgtc tgcgtgcggg tggcttactt tagacaccac ccccagtatc 31200
gcaacaggga catagcggct ctcctaagac ttgtttaaaa tcatggccaa attaactgtg 31260
attggtcttc tgatcatctg ctgcgtccta gccgcgattg ggactcaagc tcctaccacc 31320
accagcgctc ccagaaagag acatgtatcc tgcagcttca agcgtccctg gaatataccc 31380
caatgcttta ctgatgaacc tgaaatctct ttggcttggt acttcagcgt caccgccctt 31440
cttatcttct gcagtacggt tattgccctt gccatctacc cttcccttga cctgggctgg 31500
aatgctgtca actctatgga atatcccacc ttcccagaac cagacctgcc agacctggtt 31560
gttctaaacg cgtttcctcc tcctgctccc gttcaaaatc agtttcgccc tccgtccccc 31620
acgcccactg aggtcagcta ctttaatcta acaggcggag atgactgaaa acctagacct 31680
agaaatggac ggtctctgca gcgagcaacg cacactagag aggcgccggc aaaaagagct 31740
cgagcgtctt aaacaagagc tccaagacgc ggtggccata caccagtgca aaaaaggtgt 31800
cttctgtctg gtaaaacagg ccacgctcac ctatgaaaaa acaggtgaca cccaccgcct 31860
aggatacaag ctgcccacac agcgccaaaa gttcgccctc atgataggcg aacaacccat 31920
caccgtgacc cagcactccg tggagacaga aggctgcata catgctccct gtaggggcgc 31980
tgactgcctc tacaccttga tcaaaaccct ctgcggtctc agagacctta tccctttcaa 32040
ttaatcataa ctgtaatcaa taaaaaatca cttacttgaa atctgatagc aagcctctgt 32100
ccaatttttt cagcaacact tccttcccct cctcccaact ctggtactct aggcgcctcc 32160
tagctgcaaa cttcctccac agtctgaagg gaatgtcaga ttcctcctcc tgtccctccg 32220
cacccacgat cttcatgttg ttgcagatga aacgcgcgag atcgtctgac gagaccttca 32280
accccgtgta cccctacgat accgagatcg ctccgacttc tgtccctttc cttacccctc 32340
cctttgtgtc atccgcagga atgcaagaaa atccagctgg ggtgctgtcc ctgcacttgt 32400
cagagcccct taccacccac aatggggccc tgactctaaa aatggggggc ggcctgaccc 32460
tggacaagga agggaatctc acttcccaaa acatcaccag tgtcgatccc cctctcaaaa 32520
aaagcaagaa caacatcagc cttcagaccg ccgcacccct cgccgtcagc tccggggccc 32580
taacactttt tgccactccc cccctagcgg tcagtggtga caaccttact gtgcagtctc 32640
aggcccctct cactttggaa gactcaaaac taactctggc caccaaagga cccctaactg 32700
tgtccgaagg caaacttgtc ctagaaacag aggctcccc 32739
<210> 24
<211> 32739
<212> DNA
<213> Artificial Sequence
<220>
<223> Adenovirus vector nucleotide sequences
<400> 24
ataatatacc ttattttgga ttgtggccaa tatgataatg aggtgggcgg ggagaggcgg 60
ggcgggtgac gtaggacgcg cgagtagggt tgggaggtgt ggcggaagtg tggcatttgc 120
aagtgggagg agctcacatg caagcttccg tcgcggaaaa tgtgacgttt ttgatgagcg 180
ccgcctacct ccggaagtgc caattttcgc gcgcttttca ccggatatcg tagtaatttt 240
gggcgggacc atgtaagatt tggccatttt cgcgcgaaaa gtgaaacggg gaagtgaaaa 300
ctgaataata gggcgttagt catagcgcgt aatatttacc gagggccgag ggactttgac 360
cgattacgtg gaggactcgc ccaggtgttt tttacgtgaa tttccgcgtt ccgggtcaaa 420
gtctccgttt ttattgtcac cgtcatttga cgcggagggt atttaaaccc gctgcgctcc 480
tcaagaggcc actcttgagt gccagcgaga agagttttct cctctgctcc gcttcggtga 540
tcgaaaaatg agacacatag cctgcactcc gggtcttttg tccggtcggg cggcggccga 600
gcttttggac gctttgatca atgatgtcct aagcgatgat tttccgtcta ctacccactt 660
tagcccacct actcttcacg aactgtacga tctggatgta ctggtggatg tgaacgatcc 720
caacgaggag gcggtttctg cgttttttcc cgagtctgcg ctgttggccg ctcaggaggg 780
atttgaccta cacactccgc cgcctatttt agagtctccg ctgccggagc ccagtggtat 840
accttatatg cctgaactgc ttcccgaagt ggtagacctg acctgccacg agcctggctt 900
tccgcccagc gacgatgagg gtgagccttt tgttttagac tttgctgaga tacctgggca 960
cggttgcagg tcttgtgcat atcatcagag ggttaccgga gaccccgagg ttaagtgttc 1020
gctgtgctat atgaggatga cctcttcctt tatctacagt aagtttttgt ctaggtgggc 1080
ttttgggtag gtgggttttg tgtcagaaca ggtgtaaacg ttgcttgtgt tttttgtacc 1140
tgtaggtccg gtgtccgagc cagacccgga gcccgaccgc gatcccgagc cggatcccga 1200
gcctcctcgc aggacaagga aactaccttc cattctgtgc aagtctcaga cacctgtaag 1260
gaccagcgag gcagacagca ccgactctgg cacttctacc tctccccctg aaattcaccc 1320
agtggttcct ctgggtatac ataaacctgt tgctgttaaa gtttgcgggc gacgccctgc 1380
agtacagtgc attgaggact tgcttcacga tcccgaggaa cctttggact tgagccttaa 1440
acgccctagg caataaaccc cacctaagta ataaacccca cctaagtaat aaaccctgcc 1500
gcccttggtt attgagatga cgcccaatgt ttgcttttga atgacttcat gtgtgtaata 1560
aaagtgagtg tgatcatagg tctcttgttt gtctgggcgg ggcttaaggg tatataagtc 1620
tcttggggct aaacttggtt acacttgacc ccaatggagg cgtgggggtg cttggaggag 1680
tttgcggacg tgcgccgttt gctggacgag agctctagca atacctatac tatttggagg 1740
tatctgtggg gctctactca ggccaagttg gtttccagaa ttaagcagga ttacaagtgc 1800
gattttgaag agctttttag ttcctgcggt gagcttttgc aatccttgaa tctgggccat 1860
caggctattt tccaggaaaa ggttctctcg actttggatt tttccactcc cgggcgcacc 1920
gccgcttgtg tggcttttgt gtcttttgtg caagataaat ggagcgagga gacccacctg 1980
agtcacggct acgtactgga tttcatggcg atggctcttt ggagggctca caacaaatgg 2040
aagattcaga aggaactgta cggttccgcc ctacgtcgtc cacttctgtc gcgacagggg 2100
ctgaggtttc ccgaccatcg gcagcatcag aatctggaag acgagtcgga ggagcgagcg 2160
gaggagaaga tcagcttgag agccggcctg gaccctcctc aggaggaatg aatctcccgc 2220
aggtggttga cctgtttcca gaactgagac gggtcctgac tatcagggag gatggtcagt 2280
ttgtgaagaa gtttaagagg gatcggggtg agggagatga tgaggcggct agcaatttag 2340
cttttagtct gatgactcgc caccgaccgg aatgtattac ctatcagcag attaaggaga 2400
gttgtgccaa cgagctggat cttttgggtc agaagtatag catagaacag cttaccactt 2460
actggcttca gcctggggat gattgggaag aggcgatcag ggtgtatgca aaggtggccc 2520
tgcggcccga ttgcaagtat aagattacta agttggttaa tattagaaac tgctgctata 2580
tttctgggaa cggggccgaa gtggagatag atactcagga cagggtggct tttaggtgtt 2640
gcatgataaa catgtggccc gggatactgg ggatggatgg ggtggtattc atgaatgtga 2700
ggtttacggg ccccaacttt aatggcacgg tgttcatggg caacaccaac ttgctcctgc 2760
atggtgcgag tttctatggg tttaataaca cctgtataga ggcctggacc gatgtaaagg 2820
ttcgaggttg ttccttttat agctgttgga aggcggtggt gtgtcgccct aaaagcaggg 2880
gttctgtgaa aaaatgcttg tttgaaaggt gcaccttagg catcctctct gagggcaact 2940
ccagggtgcg ccataatgtg gcttcgaact gcggttgctt catgcaagtg aagggggtga 3000
gcgttatcaa gcataactcg gtgtgtggaa actgcgagga tcgcgcctcc cagatgctga 3060
cctgctttga tggcaactgt cacctgttga agaccattca tataagcagc caccccagaa 3120
aggcctggcc cgtgtttgag cataacatct tgacccgctg ctccttgcat ctgggggtca 3180
ggaggggtat gttcctgcct taccagtgta actttagcca cactaaaatc ctgctggaac 3240
ccgagtgcat gaccaaggtc agcctgaatg gtgtgtttga tgtgactctg aaaatctgga 3300
aggtgctgag gtatgatgag accaggacca ggtgccgacc ctgcgagtgc ggcggcaagc 3360
acatgagaaa tcagcctgtg atgttggatg tgaccgagga gcttaggcct gaccatctgg 3420
tgctggcctg caccagggcc gagtttgggt ctagcgatga ggataccgat tgaggtgggt 3480
aaggtgggcg tggctagaag ggtggggcgt gtataaattg ggggtctaag ggtctctctg 3540
ttttgtcttg caacagccgc cgccatgagc gacaccggca acagctttga tggaagcatc 3600
tttagcccct atctgacagt gcgcatgcct cactgggctg gagtgcgtca gaatgtgatg 3660
ggttccaacg tggatggacg ccccgttctg ccttcaaatt cgtctacaat ggcctacgcg 3720
accgtgggag gaactccgct ggacgccgcg acctccgccg ccgcctccgc cgccgccgcg 3780
accgcgcgca gcatggctac ggacctttac agctctttgg tggcgagcgg cgcggcctct 3840
cgcgcgtctg ctcgggatga gaaactgacc gctctgctgc ttaaactgga agacttgacc 3900
cgggagctgg gtcaactgac ccagcaggtc tccagcttgc gtgagagcag ccttgcctcc 3960
ccctaatggc ccataatata aataaaagcc agtctgtttg gattaagcaa gtgtatgttc 4020
tttatttaac tctccgcgcg cggtaagccc gggaccagcg gtctcggtcg tttagggtgc 4080
ggtggattct ttccaacacg tggtacaggt ggctctggat gtttagatac atgggcatga 4140
gtccatccct ggggtggagg tagcaccact gcagagcttc gtgctcgggg gtggtgttgt 4200
atatgatcca gtcgtagcag gagcgctggg cgtggtgctg aaaaatgtcc ttaagcaaga 4260
ggcttatagc tagggggagg cccttggtgt aagtgtttac aaatctgctc agttgggagg 4320
ggtgcatccg gggggatata atgtgcatct tggactggat ttttaggttg gctatgttcc 4380
cacccagatc ccttctggga ttcatgttgt gcaggaccac cagcacggta tatccagtgc 4440
acttgggaaa tttatcgtgg agcttagacg ggaatgcatg gaagaacttg gagacgccct 4500
tgtggcctcc cagattttcc atacattcgt ccatgatgat ggcaatgggc ccgtgggaag 4560
ctgcctgagc aaaaatgttt ctgggatcgc tcacatcgta gttatgttcc agggtgaggt 4620
catcatagga catctttacg aatcgggggc ggagggtccc ggactggggg atgatggtac 4680
cctcgggccc cggggcgtag ttcccctcac agatctgcat ctcccaggct ttcatttcag 4740
agggagggat catatccacc tgcggagcga tgaaaaacac agtttctggc gcaggggaga 4800
ttaactggga tgagagcagg tttctgagca gctgtgactt tccacagccg gtgggcccat 4860
atatcacgcc tatcaccggc tgcagctggt agttaagaga gctgcagctg ccgtcctccc 4920
ggagcagggg ggccacctcg ttcagcatat ccctgacgtg gatgttctcc ctgaccaatt 4980
ccgccagaag gcgctcgccg cccagcgaaa gcagctcttg caaggaagca aaatttttca 5040
gcggttttag gccgtcggcc gtgggcatgt ttttcagcgt ctgggtcagc agttccagcc 5100
tgtcccacag ctcggtgatg tgctctacgg catctcgatc cagcagatct cctcgtttcg 5160
cgggttgggg cggctttcgc tgtagggcac cagccgatgg gcgtccagcg gggccagagt 5220
catgtccttc catgggcgca gggtcctcgt cagggtggtc tgggtcacgg tgaaggggtg 5280
cgctccgggt tgggcgctgg ccagggtgcg cttgaggctg gttctgctgg tgctgaatcg 5340
ctgccgctct tcgccctgcg cgtcggccag gtagcatttg accatggtct cgtagtcgag 5400
accctcggcg gcgtgcccct tggcgcggag ctttcccttg gaggtggcgc cgcacgaggg 5460
gcactgcagg ctcttcaggg cgtagagctt gggagcgaga aacacggact ctggggagta 5520
ggcgtccgcg ccgcaggaag cgcagaccgt ctcgcattcc accagccaag tgagctccgg 5580
gcggtcaggg tcaaaaacca ggttgccccc atgctttttg atgcgtttct tacctcggct 5640
ctccatgagg cggtgtccct tctcggtgac gaagaggctg tccgtgtccc cgtagaccga 5700
cttcaggggc ctgtcttcca gcggagtgcc tctgtcctcc tcgtagagaa actctgacca 5760
ctctgagacg aaggcccgcg tccaggccag gacgaaggag gccacgtggg aggggtagcg 5820
gtcgttgtcc actagcgggt ccaccttctc cagggtgtgc aggcacatgt ccccctcctc 5880
cgcgtccaga aaagtgattg gcttgtaggt gtaggacacg tgaccggggg ttcccgacgg 5940
gggggtataa aagggggtgg gcgccctttc atcttcactc tcttccgcat cgctgtctgc 6000
gagggccagc tgctggggta agtattccct ctcgaaggcg ggcatgacct cagcgctcag 6060
gttgtcagtt tctaaaaatg aggaggattt gatgttcacc tgtccggagg tgataccttt 6120
gagggtacct gggtccatct ggtcagaaaa cactattttt ttgttgtcaa gcttggtggc 6180
gaacgacccg tagagggcgt tggagagcag cttggcgatg gagcgcaggg tctggttttt 6240
gtcgcggtcg gctcgctcct tggccgcgat gttgagttgc acgtactcgc gggccacgca 6300
cttccactcg gggaagacgg tggtgcgctc gtctgggatt aggcgcaccc tccagcctcg 6360
gttgtgcagg gtgaccatgt cgacgctggt ggcgacctcg ccgcgcaggc gctcgttggt 6420
ccagcagagg cggccgccct tgcgcgagca gaaggggggt agggggtcca gctggtcctc 6480
gtttgggggg tccgcgtcga tggtgaagac cccggggagc aagcgcgggt caaagtagtc 6540
gatcttgcaa gcttgcatgt ccagagcccg ctgccattcg cgggcggcga gcgcgcgctc 6600
gtaggggttg aggggcgggc cccagggcat ggggtgggtg agcgcggagg cgtacatgcc 6660
gcagatgtca tacacgtaca ggggttccct gaggatgccg aggtaggtgg ggtagcagcg 6720
ccccccgcgg atgctggcgc gcacgtagtc atagagctcg tgggaggggg ccagcatgtt 6780
gggcccgagg ttggtgcgct gggggcgctc ggcgcggaag gcgatctgcc tgaagatggc 6840
atgggagttg gaggagatgg tgggccgctg gaagacgttg aagcttgctt cttgcaagcc 6900
caccgagtcc ctgacgaagg aggcgtagga ctcgcgcagc ttgtgcacca gctcggcggt 6960
gacctggacg tcgagcgcgc agtagtcgag ggtctcgcgg atgatgtcat acttatcctc 7020
ccccttcttt ttccacagct cgcggttgag gacgaactct tcgcggtctt tccagtactc 7080
ttggagggga aacccgtccg tgtccgaacg gtaagagcct agcatgtaga actggttgac 7140
ggcctggtag gggcaacagc ccttctccac gggcagcgcg taggcctgcg ccgccttgcg 7200
gagggaggtg tgggtgaggg cgaaagtgtc cctgaccatg actttgaggt attgatgttt 7260
gaagtctgtg tcatcgcagc cgccctgttc ccacagggtg tagtccgtgc gctttttgga 7320
gcgcgggttg ggcagggaga aggtgaggtc attgaagagg atcttccccg ctcgaggcat 7380
gaagtttctg gtgatgcgaa agggccctgg gaccgaggag cggttgttga tgacctgggc 7440
ggccaggacg atctcgtcaa agccgtttat gttgtggccc acgatgtaga gctccaaaaa 7500
gcggggctgg cccttgatgg aggggagctt tttgagttcc tcgtaggtga gctcctcggg 7560
cgattccagg ccgtgctcct ccagggccca gtcttgcaag tgagggttgg ccgccaggaa 7620
ggatcgccag aggtcgcggg ccatgagggt ctgcaggcgg tcgcggaagg ttctgaactg 7680
tcgccccacg gccatctttt cgggggtgat gcagtagaag gtgagggggt ctttctccca 7740
ggggtcccat ctgagctctc gggcgaggtc gcgcgcggcg gcgaccagag cctcgtcgcc 7800
ccccagtttc atgaccagca tgaagggcac gagctgcttg ccaaaggctc ccatccaagt 7860
gtaggtctct acatcgtagg tgacaaagag gcgctccgtg cgaggatgag agccgatcgg 7920
gaagaactgg atctcccgcc accagttgga ggattggctg ttgatgtggt gaaagtagaa 7980
gtcccgtctg cgggccgagc actcgtgctg gcttttgtaa aagcgaccgc agtactggca 8040
gcgctgcacg ggttgtatat cttgcacgag gtgaacctgg cgacctctga cgaggaagcg 8100
cagcgggaat ctaagtcccc cgcctggggt cccgtgtggc tggtggtctt ctactttggt 8160
tgtctggccg ccagcatctg tctcctggag ggcgatggtg gagcagacca ccacgccgcg 8220
agagccgcag gtccagatct cggcgctcgg cgggcggagt ttgatgacga catcgcgcac 8280
attggagctg tccatggtct ccagctcccg cggcggcagg tcagctggga gttcctggag 8340
gttcacctcg cagagacggg tcaaggcgcg ggcagtgttg agatggtatc tgatttcaag 8400
gggcgtgttg gcggcggagt cgatggcttg caggaggccg cagccccggg gggccacgat 8460
ggttccccgc ggggcgcgag gggaggcgga agctgggggt gtgttcagaa gcggtgacgc 8520
gggcgggccc ccggaggtag ggggggttcc ggccccacag gcatgggcgg caggggcacg 8580
tcttcgccgc gcgcgggcag gggctggtgc tggctccgaa gagcgcttgc gtgcgcgacg 8640
acgcgacggt tggtgtcctg tatctgacgc ctctgagtga agaccacggg tcccgtgacc 8700
ttgaacctga aagagagttc gacagaatca atctcggcat cgttgacagc ggcctggcgc 8760
aggatctcct gcacgtcgcc cgagttgtcc tggtaggcga tctctgccat gaactgctcg 8820
atctcttctt cctggagatc tcctcgtccg gcgcgctcca cggtggccgc caggtcgttg 8880
gagatgcgac ccatgagctg tgagaaggcg ttgagcccgc cctcgttcca gacccggctg 8940
tagaccacgc ccccctcggc gtcgcgagcg cgcatgacca cctgggccag gttgagctcc 9000
acgtgtcgcg tgaagacggc gtagttgcgc aggcgctgga aaaggtagtt cagggtggtg 9060
gcggtgtgct cggcgacgaa gaagtacatg acccagcgcc gcaacgtgga ttcattgatg 9120
tcccccaagg cctccaggcg ctccatggcc tcgtagaagt ccacggcgaa gttgaaaaac 9180
tgggagttgc gagcggacac ggtcaactcc tcctccagaa gacggatgag ctcggcgaca 9240
gtgttgcgca cctcgcgctc gaaggccacg gggggcgctt cttcctcttc cacctcttct 9300
tccatgatcg cttcttcttc ttcctcagcc gggacgggag ggggcggcgg cggcggggga 9360
ggggcgcggc ggcggcggcg gcgcaccggg aggcggtcga tgaagcgctc gatcatctcc 9420
ccccgcatgc ggcgcatggt ctcggtgacg gcgcggccgt tctcccgggg gcgcagctcg 9480
aagacgccgc ctctcatctc gccgcggggc gagcggccgt gaggtagcga gacggcgctg 9540
actatgcatc ttaacaattg ctgtgtaggt acaccgccga gggacctgat tgagtccaga 9600
tccaccggat ccgaaaacct ttggaggaaa gcgtctatcc agtcgcagtc gcaaggtagg 9660
ctgagcaccg tggcgggcgg gggcgggtct ggagagttcc tggcggagat gctgctgatg 9720
atgtaattaa agtaggcggt cttgagaagg cggatggtgg acaggagcac catgtctttg 9780
ggtccggcct gttggatgcg gaggcggtcg gccatgcccc aggcctcgtt ctgacaccgg 9840
cgcaggtctt tgtagtagtc ttgcatgagt ctttccaccg gcacctcttc tccttcctct 9900
tctccatctc gccggtggtt tctcgcgccg cccatgcgcg tgaccccaaa gcccctgagc 9960
ggctgcagca gggccaggtc ggcgaccacg cgctcggcca agatggcctg ctgcacctga 10020
gtgagggtcc tctcgaagtc atccatgtcc acgaagcggt ggtaggcgcc cgtgttgatg 10080
gtgtaggtgc agttggccat gacggaccag ttgacggtct ggtgtcccgg ctgcgagagc 10140
tccgtgtacc gcaggcgcga gaaggcgcgg gaatcgaaca cgtagtcgtt gcaagtccgc 10200
accagatact ggtagcccac caggaagtgc ggcggaggtt ggcgatagag gggccagcgc 10260
tgggtggcgg gggcgccggg cgccaggtct tccagcatga ggcggtggta tccgtagatg 10320
tacctggaca tccaggtgat gccggcggcg gtggtggtgg cgcgcgcgta gtcgcggacc 10380
cggttccaga tgtttcgcag gggcgagaag tgttccatgg tcggcacgct ctggccggtg 10440
aggcgcgcgc agtcgttgac gctctataca cacacaaaaa cgaaagcgtt tacagggctt 10500
tcgttctgta gcctggagga aagtaaatgg gttgggttgc ggtgtgcccc ggttcgagac 10560
caagctgagc tcggccggct gaagccgcag ctaacgtggt attggcagtc ccgtctcgac 10620
ccaggccctg tatcctccag gatacggtcg agagcccttt tgctttcttg gccaagcgcc 10680
cgtggcgcga tctgggatag atggtcgcga tgagaggaca aaagcggctc gcttccgtag 10740
tctggagaaa caatcgccag ggttgcgttg cggcgtaccc cggttcgagc ccctatggcg 10800
gcttgaatcg gccggaaccg cggctaacga gggccgtggc agccccgtcc tcaggacccc 10860
gccagccgac ttctccagtt acgggagcga gccccttttg ttttttattt tttagatgca 10920
tcccgtgctg cggcagatgc gcccctcgcc ccggcccgat cagcagcagc aacagcaggc 10980
atgcagaccc ccctctcccc tttccgcccc ggtcaccacg gccgcggcgg ccgtgtcggg 11040
cgcggggggc gcgctggagt cagatgagcc accgcggcgg cgacctaggc agtatctgga 11100
cttggaagag ggcgagggac tggcgcggct gggggcgaac tctccagagc gccacccgcg 11160
ggtgcagttg aaaagggacg cgcgcgaggc gtacctgccg cggcagaacc tgtttcgcga 11220
ccgcgggggc gaggagcccg aggagatgcg agactgcagg ttccaagcgg ggcgcgagct 11280
gcggcgcggg ctggacagac agcgcctgct gcgcgaggag gactttgagc ccgacacgca 11340
gacgggcatc agccccgcgc gcgcgcacgt agccgcggcc gacctggtga ccgcctacga 11400
gcagacggta aaccaggagc gcaacttcca aaagagcttc aacaaccacg tgcgcacgct 11460
ggtggcgcgc gaggaggtga ccctgggtct catgcatctg tgggacctgg tggaggcgat 11520
cgtgcagaac cccagcagca agcccctgac cgcgcagctg ttcctggtgg tgcagcacag 11580
cagggacaac gaggccttca gggaggcgct gctgaacatc accgagccgg aggggcgctg 11640
gctcctggac ctgataaaca tcctgcagag catagtggtg caggagcgca gcctgagcct 11700
ggccgagaag gtggcggcca tcaactactc tatgctgagc ctgggcaagt tctacgcccg 11760
caagatctac aagaccccct acgtgcccat agacaaggag gtgaagatag acagcttcta 11820
catgcgcatg gcgctgaagg tgctgaccct gagcgacgac ctgggagtgt accgcaacga 11880
gcgcatccac aaggccgtga gcgccagccg gcggcgcgag ctgagcgacc gcgagctgat 11940
gcacagtctg cagcgcgcgc tgaccggcgc gggcgagggc gacagggagg tcgagtccta 12000
cttcgacatg ggggccgacc tgcactggca gccgagccgc cgcgccctgg aggcggcggg 12060
ggcgtacggc ggccccctgg cggccgatga ccaggaagag gaggactatg agctagagga 12120
gggcgagtac ctggaggact gacctggctg gtggtgtttt ggtatagatg caagatccga 12180
acgtggcgga cccggcggtc cgggcggcgc tgcaaagcca gccgtccggc attaactcct 12240
ctgacgactg ggccgcggcc atgggtcgca tcatggccct gaccgcgcgc aaccccgagg 12300
ctttcaggca gcagcctcag gccaaccggc tggcggccat cttggaagcg gtagtgcccg 12360
cgcgctccaa ccccacccac gagaaggtgc tggccatagt caacgcgctg gcggagagca 12420
gggccatccg cgcggacgag gccggactgg tgtacgatgc gctgctgcag cgggtggcgc 12480
ggtacaacag cggcaacgtg cagaccaacc tggaccgcct ggtgacggac gtgcgcgagg 12540
ccgtggcgca gcgcgagcgc ttgcatcagg acggtaacct gggctcgctg gtggcgctaa 12600
acgccttcct cagcacccag ccggccaacg taccgcgggg gcaggaggac tacaccaact 12660
ttttgagcgc gctgcggctg atggtgaccg aggtccctca gagcgaggtg taccagtcgg 12720
ggcccgacta cttcttccag accagcagac agggcttgca aaccgtgaac ctgagccagg 12780
ctttcaagaa cctgcggggg ctgtggggag tgaaggcgcc caccggcgac cgggctacgg 12840
tgtccagcct gctaaccccc aactcgcgcc tgctgctgct gctgatcgcg cccttcacgg 12900
acagcgggag cgtctcgcgg gagacctatc tgggccacct gctgacgctg taccgcgagg 12960
ccatcgggca ggcgcaggtg gacgagcaca ccttccaaga gatcaccagc gtgagccacg 13020
cgctggggca ggaggacacg ggcagcctgc aggcgaccct gaactacctg ctgaccaaca 13080
ggcggcagaa gattcccacg ctgcacagcc tgacccagga ggaggagcgc atcttgcgct 13140
acgtgcagca gagcgtgagc ctgaacctga tgcgcgacgg cgtgacgccc agcgtggcgc 13200
tggacatgac cgcgcgcaac atggaaccgg gcatgtacgc ctcccaccgg ccgtttatca 13260
accgcctgat ggactacttg catcgggcgg cggccgtgaa ccccgagtac ttcactaatg 13320
ccattctgaa tccccactgg atgccccctc cgggtttcta caacggggac tttgaggtgc 13380
ccgaggtcaa cgacgggttc ctctgggatg acatggatga cagtgtgttc tcacccaacc 13440
cgctgcgcgc cgcgtctctg cgattgaagg agggctctga cagggaagga ccgaggagtc 13500
tggcctcctc cctggctctg ggagcggtgg gcgccacggg cgcggcggcg cggggcagta 13560
gccccttccc cagcctggca gactctctga acagcgggcg ggtgagcagg ccccgcttgc 13620
taggcgagga ggagtatctg aacaactccc tgctgcagcc cgcgagggac aagaacgctc 13680
agcggcagca gtttcccaac aatgggatag agagcctggt ggacaagatg tccagatgga 13740
agacgtatgc gcaggagtac aaggagtggg aggaccgcca gccgcggccc ttgccgcccc 13800
ctaggcagcg ctggcagcgg cgcgcgtcca accgccgctg gaggcagggg cccgaggacg 13860
atgatgactc tgcagatgac agcagcgtgt tggacctggg cgggagcggg aacccctttt 13920
cgcacctgcg cccacgcctg ggcaagatgt tttaaaagaa aaaaaaaaat aaaactcacc 13980
aaggccatgg cgacgagcgt tggttttttg ttcccttcct tagtatgcgg cgcgcggcga 14040
tgttcgagga ggggcctccc ccctcttacg agagcgcgat ggggatttct cctgcggcgc 14100
ccctgcagcc tccctacgtg cctcctcggt acctgcaacc tacagggggg agaaatagca 14160
tctgttactc tgagctgcag cccctgtacg ataccaccag actgtacctg gtggacaaca 14220
agtccgcgga cgtggcctcc ctgaactacc agaacgacca cagcgatttt ttgaccacgg 14280
tgatccaaaa caacgacttc accccaaccg aggccagcac ccagaccata aacctggata 14340
acaggtcgaa ctggggcggc gacctgaaga ccatcttgca caccaacatg cccaacgtga 14400
acgagttcat gttcaccaac tcttttaagg cgcgggtgat ggtggcgcgc gagcaggggg 14460
aggcgaagta cgagtgggtg gacttcacgc tgcccgaggg caactactca gagaccatga 14520
ctctcgacct gatgaacaat gcgatcgtgg aacactatct gaaagtgggc aggcagaacg 14580
gggtgaagga aagcgatatc ggggtcaagt ttgacaccag aaacttccgt ctgggctggg 14640
accccgtgac cgggctggtc atgccggggg tctacaccaa cgaggccttt catcccgaca 14700
tagtgcttct gcccggctgt ggggtggact tcacccagag ccggctgagc aacctgctgg 14760
gcattcgcaa gcggcagcct ttccaggagg gtttcaagat cacctatgag gatctgaagg 14820
ggggcaacat tcccgcgctc cttgatctgg acgcctacga ggagagcttg aaacccgagg 14880
agagcgctgg cgacagcggc gagagtggcg aggagcaagc cggcggcggt ggcggcgcgt 14940
cggtagaaaa cgaaagtacg cccgcagtgg cggcggacgc tgcggaggtc gagccggagg 15000
ccatgcagca ggacgcagag gagggcgcac aggagggcgc gcagaaggac atgaacgatg 15060
gggagatcag gggagacaca ttcgccaccc ggggcgaaga aaaagaggca gaggcggcgg 15120
cggcggcgac ggcggaggcc gaaaccgagg ttgaggcaga ggcagagccc gagaccgaag 15180
ttatggaaga catgaatgat ggagaacgta ggggcgacac gttcgccacc cggggcgaag 15240
agaaggcggc ggaggcagaa gccgcggctg aggaggcggc tgcggctgcg gccaagactg 15300
aggctgcggc taaggctgag gtcgaagcca atgttgcggt tgaggctcag gctgaggagg 15360
aggcggcggc tgaagcagtt aaggaaaagg cccaggcaga gcaggaagag aaaaaacctg 15420
tcattcaacc tctaaaagaa gatagcaaaa agcgcagtta caacgtcatc gagggcagca 15480
cctttaccca gtaccgcagc tggtacctgg cgtacaacta cggcgacccg gtcaaggggg 15540
tgcgctcgtg gaccctgctc tgcacgccgg acgtcacctg cggctccgag cagatgtact 15600
ggtcgctgcc gaacatgatg caagacccgg tgaccttccg ctccacgcgg caggttagca 15660
acttcccggt ggtgggcgcc gaactgctgc ccgtgcactc caagagtttt tacaacgagc 15720
aggccgtcta ctcccagctg atccgccagg ccacctctct gacccacgtg ttcaatcgct 15780
ttcccgagaa ccagattttg gcgcgcccgc cggcccccac catcaccacc gtgagtgaaa 15840
acgttcctgc cctcacagat cacgggacgc taccgctgcg caacagcatc tcaggagtcc 15900
agcgagtgac cattactgac gccagacgcc ggacctgccc ctacgtttac aaggccttgg 15960
gcatagtctc gccgcgcgtc ctctccagtc gcacttttta aaacacatct acccacacgt 16020
tccaaaatca tgtccgtact catctcaccc agcaacaaca ccggctgggg gctgcgcgcg 16080
cccagcaaga tgtttggagg ggcgaggaag cgctccgacc agcaccctgt gcgcgtgcgc 16140
ggccactacc gcgcgccctg gggagcgcac aagcgcgggc gcacagggcg caccactgtg 16200
gacgacgtca ttgactccgt agtggagcaa gcgcgccact acacacccgg cgcgccgacc 16260
gcccccgccg tgtccaccgt ggaccaggcg atcgaaagcg tggtacaggg cgcgcggcac 16320
tatgccaacc ttaaaagtcg ccgccgccgc gtggcccgcc gccatcgccg gagaccccgg 16380
gccaccgccg ccgcgcgcct tactaaggct ctgctcaggc gcgccaggcg aactggccac 16440
cgggccgcca tgagggccgc acggcgggct gccgctgccg caagcgtcgt ggccccgcgg 16500
gcacgaaggc gcgcggccgc tgccgccgcc gccgccattt ccagcttggc ctcgacgcgg 16560
cgcggtaaca tatactgggt gcgcgactcg gtaaccggca cgcgggtacc cgtgcgcttt 16620
cgccccccgc ggaattagca caagacaaca tacacactga gtctcctgct gttgtgtatc 16680
ccagcggcga ccgtcagcag cggcgacatg tccaagcgca aaattaaaga agagatgctc 16740
caggtcatcg cgccggagat ctatgggccc ccgaagaagg aggaggatga ttacaagccc 16800
cgcaagctaa agcgggtcaa aaagaaaaag aaagatgatg atgacgaggc ggtggagttt 16860
gtccgccgca tggcacccag gcgccccgtg cagtggaagg gccggcgcgt gcagcgcgtt 16920
ttgcgccccg gcaccgcggt ggtcttcacg cccggcgagc gctccacgcg cactttcaag 16980
cgggtgtacg atgaggtgta cggcgacgag gacctgttgg agcaggccaa ccagcgcttt 17040
ggggagtttg catatgggaa acggccccgc gagagtctaa aagaggacct gctggcgcta 17100
ccgctggacg agggcaatcc caccccgagt ctgaagccgg taaccctgca acaggtgctg 17160
cctttgagcg cgcccagcga gcataagcga gggttgaagc gcgaaggcgg ggacctggcg 17220
cccaccgtgc agttgatggt gcccaagcgg cagaagctgg aggacgtgct ggagaaaatg 17280
aaagtagagc ccgggatcca gcccgagatc aaggtccgcc ccatcaagca ggtggcgccc 17340
ggcgtgggag tccagaccgt ggacgttagg attcccacgg aggagatgga aacccaaacc 17400
gccactccct cttcggcggc cagcgccacc accggcaccg cttcggtaga ggtgcagacg 17460
gacccctggc tacccgccac cgctgttgcc gccgccgccc cccgttcgcg cgggcgcaag 17520
agaaattatc cagcggccag cgcgctcatg ccccagtacg cactgcatcc atccatcgtg 17580
cccacccccg gctaccgcgg gtactcgtac cgcccgcgca gatcagccgg cactcgcggc 17640
cgccgccgcc gtgcgaccac aaccagccgc cgccgtcgcc gccgccgcca gccagtgctg 17700
acccccgtgt ctgtaaggaa ggtggctcgc tcggggagca cgctggtggt gcccagagcg 17760
cgctaccacc ccagcatcgt ttaaagccgg tctctgtatg gttcttgcag atatggccct 17820
cacttgtcgc ctccgcttcc cggtgccggg ataccgagga agaactcacc gccgcagagg 17880
catggcgggc agcggtctcc gcggcggccg tcgccatcgc cggcgcgcaa aaagcaggcg 17940
catgcgcggc ggtgtgctgc ctctgctaat cccgctaatc gccgcggcga tcggtgccgt 18000
acccgggatc gcctccgtgg ccctgcaggc gtcccagaaa cgttgactct tgcaaccttg 18060
caagcttgca ttttttggag gaaaaaataa aaaaaaagtc tagactctca cgctcgcttg 18120
gtcctgtgac tattttgtag aaaaaaagat ggaagacatc aactttgcgt cgctggcccc 18180
gcgtcacggc tcgcgcccgt tcatgggaga ctggacagat atcggcacca gcaatatgag 18240
cggtggcgcc ttcagctggg gcagtctgtg gagcggcctt aaaaattttg gttccaccat 18300
taagaactat ggcaacaaag cgtggaacag cagcacgggc cagatgctga gagacaagtt 18360
gaaagagcag aacttccagg agaaggtggc gcagggcctg gcctctggca tcagcggggt 18420
ggtggacata gctaaccagg ccgtgcagaa aaagataaac agtcatctgg acccccgtcc 18480
tcaggtggag gaaatgcctc cagcgatgga gacggtgtct cccgagggca aaggcgaaaa 18540
gcgcccgcgg cccgacagag aagagaccct ggtgtcacac accgaggagc cgccctctta 18600
cgaggaggca gtcaaggccg gcctgcccac cactcgcccc atagccccca tggccaccgg 18660
tgtggtgggc cacaggcaac acactcccgc aacactagat ctgcccccgc cgtccgagcc 18720
gccgcgccag ccaaaggcgg cgacggtgcc cgctccctcc acttccgccg ccaacagagt 18780
gcccctgcgc cgcgccgcga gcggcccccg ggcctcgcga gttagcggca actggcagag 18840
cacactgaac agcatcgtgg gcctgggagt gaggagtgtg aagcgccgcc gttgctactg 18900
aatgagcaag ctagctaacg tgttgtatgt gtgtatgcgt cctatgtcgc cgccagagga 18960
gctgttgagc cgccggcgcc gtctgcactc cagcgaattt caagatggcg accccatcga 19020
tgatgcctca gtggtcgtac atgcacatct cgggccagga cgcttcggag tacctgagcc 19080
ccgggctggt gcagttcgcc cgcgccacag acacctactt caacatgagt aacaagttca 19140
ggaaccccac tgtggcgccc acccacgatg tgaccacgga ccggtcgcag cgcctgacgc 19200
tgcggttcat ccccgtggat cgggaggaca ccgcctactc ttacaaggcg cggttcacgc 19260
tggccgtggg cgacaaccgc gtgctggaca tggcctccac ttactttgac atcagggggg 19320
tgctggacag gggccccacc ttcaagccct actcgggtac tgcctacaac tccctggccc 19380
ccaagggcgc tcccaattct tgcgagtggg aacaagatga accagctcag gcagcaatag 19440
ctgaagatga agaagaactt gaagaagaac aagctcagga cgaacaggcg cccactaaga 19500
aaacccatgt atacgcccag gcacctcttt ctggtgaaaa aattactaag gatggtttgc 19560
aaataggtgt ggatgccaca caggcgggag ataaccctat atatgctgat aaaacattcc 19620
aacccgaacc tcagataggt gagtctcagt ggaacgaggc tgatgccaca gtagcaggag 19680
gcagagtctt aaaaaagacc acccctatga gaccttgcta tggatcctat gccaaaccta 19740
ctaatgccaa tggcggtcaa gggatcatgg tggccaatga tcagggagcg cttgaatcta 19800
aagttgagat gcaatttttc tccaccacaa cgtctcttaa tgtaagggaa ggtgaaaaca 19860
atcttcagcc aaaagtagtg ctatacagcg aagatgttaa cttggaatcc cctgacactc 19920
atttgtctta caaacctaaa aaggatgaca ccaactctaa aatcatgttg ggtcagcaag 19980
ccatgcccaa cagacccaac ctcattgctt ttagggacaa ctttattgga cttatgtact 20040
acaacagcac aggcaacatg ggagtgctgg caggacaggc ctcccagcta aacgctgtgg 20100
tagacttgca agacagaaac acagagctgt cataccaact gatgcttgat tccattggag 20160
acagatcaag atacttttcc atgtggaacc aggcagtgga cagctatgac ccagatgtca 20220
gaatcattga aaaccatggg gttgaagatg agctgcccaa ctattgcttt cccctgggcg 20280
gtattggaat tacagacaca taccagtgca taaaaccaac cgcagctgct aataacacta 20340
catggtctaa ggatgaagaa tttagtgatc gcaatgaaat aggggtggga aacaacttcg 20400
ccatggagat caacatccag gccaacctct ggaggaactt cctctatgcg aacgtggggc 20460
tctacctgcc agacaagctc aagtacaacc ccaccaacgt ggacatctct gacaacccca 20520
acacctatga ctacatgaac aagcgtgtgg tggctcccgg cctggtggac tgctttgtca 20580
atgtgggagc caggtggtcc ctggactaca tggacaacgt caaccccttc aaccaccacc 20640
gcaatgcggg tctgcgctac cgctccatga tcctgggcaa cgggcgctac gtgcccttcc 20700
acattcaggt gccccagaag ttctttgcca tcaagaacct cctcctcctg ccgggctcct 20760
acacttacga gtggaacttc aggaaggatg tcaacatggt cctgcagagc tctctgggca 20820
atgaccttag ggtggacggg gccagcatca agtttgacag cgtcaccctc tatgctacct 20880
tcttccccat ggctcacaac accgcctcca cgctcgaggc catgctgagg aacgacacca 20940
acgaccagtc cttcaatgac tacctctctg gggccaacat gctctacccc atccccgcca 21000
aggccaccaa cgtgcccatc tccattccct ctcgcaactg ggccgccttc agaggctggg 21060
cctttacccg ccttaagacc aaggaaaccc cctccctggg ctcgggtttt gacccctact 21120
ttgtctactc gggatccatc ccctacctgg atggcacctt ctacctcaac cacactttta 21180
agaagatatc catcatgtat gactcctccg tcagctggcc gggcaatgac cgcctgctca 21240
cccccaatga gttcgaggtc aagcgcgccg tggacggcga gggctacaac gtggcccagt 21300
gcaacatgac caaggactgg ttcctggtgc agatgctggc caactacaac ataggctacc 21360
agggcttcta catcccagag agctacaagg acaggatgta ctccttcttc agaaatttcc 21420
aacccatgag caggcaggtg gtggacgaga ccaaatacaa ggactatcag gccattggca 21480
tcactcacca gcacaacaac tcgggattcg tgggctacct ggctcccacc atgcgcgagg 21540
ggcaggccta ccccgccaac ttcccctacc cgttgatagg caaaaccgcg gtcgacagcg 21600
tcacccagaa aaagttcctc tgcgaccgca ccctctggcg catccccttc tctagcaact 21660
tcatgtccat gggtgcgctc acggacctgg gccagaacct gctctatgcc aactccgccc 21720
atgcgctgga catgactttt gaggtggacc ccatggacga gcccaccctt ctctatattg 21780
tgtttgaagt gttcgacgtg gtcagagtgc accagccgca ccgcggtgtc atcgagaccg 21840
tgtacctgcg cacgcccttc tcggccggca acgccaccac ctaaggagac agcgccgccg 21900
cctgcatgac gggttccacc gagcaagagc tcagggccat cgccagagac ctgggatgcg 21960
gaccctattt tttgggcacc tatgacaaac gcttcccggg cttcatctcc cgagacaagc 22020
tcgcctgcgc catcgtcaac acggccgcgc gcgagaccgg gggcgtgcac tggctggcct 22080
ttggctggga cccgcgctcc aaaacctgct acctcttcga cccctttggc ttctccgatc 22140
agcgcctcag acagatctat gagtttgagt acgaggggct gctgcgccgc agcgcgcttg 22200
cctcctcgcc cgaccgctgc atcacccttg agaagtccac cgagaccgtg caggggcccc 22260
actcggccgc ctgcggtctc ttctgctgca tgtttttgca cgcctttgtg cgctggcccc 22320
agagtcccat ggatcgcaac cccaccatga acttgctcaa gggagtgccc aacgccatgc 22380
tccagagccc ccaggtccag cccaccctgc gccacaacca ggaacagctc taccgcttcc 22440
tggagcgcca ctccccctac ttccgcagtc acagcgcgca catccggggg gccacctctt 22500
tctgccactt gcaagaaaac atgcaagacg gaaaatgatg tacagctcgc tttttaataa 22560
atgtaaagac tgtgcacttt atttatacac gggctctttc tggttattta ttcaacaccg 22620
ccgtcgccat ctagaaatcg aaagggttct gccgcgcgtc gccgtgcgcc acgggcagag 22680
acacgttgcg atactggaag cggctcgccc acttaaactc gggcaccacc atgcggggca 22740
gtggttcctc ggggaagttc tcgccccaca gggtgcgggt cagctgcagc gcgctcagga 22800
ggtcgggagc cgagatcttg aagtcgcagt tggggccgga accctgcgcg cgcgagttgc 22860
ggtacacggg gttgcagcac tggaacacca gcagggccgg attatgcacg ctggccagca 22920
ggctctcgtc gctgatcatg tcgctgtcca gatcctccgc gttgctcagg gcgaacgggg 22980
tcatcttgca gacctgcctg cccaggaaag gcggcagccc gggcttgccg ttgcagtcgc 23040
agcgcagggg catcagcagg tgcccgcggc ccgactgcgc ctgcgggtac agcgcgcgca 23100
tgaaggcttc gatctgcctg aaagccacct gcgtcttggc tccctccgaa aagaacatcc 23160
cacaggactt gctggagaac tggttcgcgg gacagctggc atcgtgcagg cagcagcgcg 23220
cgtcggtgtt ggcgatctgc accacgttgc gaccccaccg gttcttcact atcttggcct 23280
tggaagcctg ctccttcagc gcgcgctggc cgttctcgct ggtcacatcc atctctatca 23340
cctgctcctt gttgatcatg tttgtaccgt gcagacactt caggtcgccc tccgtctggg 23400
tgcagcggtg ctcccacagc gcgcaaccgg tgggctccca atttttgtgg gtcacccccg 23460
cgtaggcctg caggtaggcc tgcaagaagc gccccatcat ggccacaaag gtcttctggc 23520
tcgtaaaggt cagctgcagg ccgcgatgct cttcgttcag ccaggtcttg cagatggcgg 23580
ccagcgcctc ggtctgctcg ggcagcatcc taaaatttgt cttcaggtcg ttatccacgt 23640
ggtacttgtc catcatggcg cgcgccgcct ccatgccctt ctcccaggcg gacaccatgg 23700
gcaggcttag ggggtttatc acttccaccg gcgaggacac cgtactttcg atttcttctt 23760
cctccccctc ttcccggcgc gcgcccacgc tgctgcgcgc tctcaccgcc tgcaccaagg 23820
ggtcgtcttc aggcaagcgc cgcaccgagc gcttgccgcc cttgacctgc ttaatcagca 23880
ccggcgggtt gctgaagccc accatggtca gcgccgcctg ctcttcttcg tcttcgctgt 23940
ctaccactat ctctggggaa gggcttctcc gctctgcggc ggcgcgcttc ttttttttct 24000
tgggagcggc cgtgatggag tccgccacgg cgacggaggt cgagggcgtg gggctggggg 24060
tgcgcggtac cagggcctcg tcgccctcgg actcttcctc tgactccagg cggcggcgga 24120
gtcgcttctt tgggggcgcg cgcgtcagcg gcggcggaga cggggacggg gacggggacg 24180
ggacgccctc cacagggggt ggtcttcgcg cagacccgcg gccgcgctcg ggggtcttct 24240
cgagctggtc ttggtcccga ctggccattg tatcctcctc ctcctaggca gagagacata 24300
aggagtctat catgcaagtc gagaaggagg agagcttaac caccccctct gagaccgccg 24360
atgcgcccgc cgtcgccgtc gcccccgctg ccgccgacgc gcccgccaca ccgagcgaca 24420
cccccgcgga cccccccgcc gacgcacccc tgttcgagga agcggccgtg gagcaggacc 24480
cgggctttgt ctcggcagag gaggatttgc gagaggagga ggataaggag aagaagccct 24540
cagtgccaaa agatgataaa gagcaagacg agcacgacgc agatgcacac cagggtgaag 24600
tcgggcgggg ggacggaggg catgacggcg ccgactacct agacgaaggg aacgacgtgc 24660
tcttgaagca cctgcatcgt cagtgcgcca ttgtttgcga cgctctgcag gagcgcagcg 24720
aagtgcccct cagcgtggcg gaggtcagcc acgcctacga gctcagcctc ttctcccccc 24780
gggtgccccc ccgccgccgc gaaaacggca catgcgagcc caacccgcgc ctcaacttct 24840
accccgcctt tgtggtaccc gaggtcctgg ccacctatca catcttcttt caaaattgca 24900
agatccccct ctcgtgccgc gccaaccgta gccgcgccga taagatgctg gccctgcgcc 24960
agggcgacca catacctgat atcgccgctt tggaagatgt accaaagatc ttcgagggtc 25020
tgggtcgcaa cgagaagcgg gcagcaaact ctctgcaaca ggaaaacagc gaaaatgaga 25080
gtcacaccgg ggtactggtg gagctcgagg gcgacaacgc ccgcctggcg gtggtcaagc 25140
gcagcatcga ggtcacccac tttgcctacc ccgcgctaaa cctgcccccc aaagtcatga 25200
acgcggccat ggacgggctg atcatgcgcc gcggccggcc cctcgctcca gatgcaaact 25260
tgcatgagga gaccgaggac ggccagcccg tggtcagcga cgagcagctg gcgcgctggc 25320
tggagaccgc ggaccccgcc gaactggagg agcggcgcaa gatgatgatg gccgtggtgc 25380
tggtcaccgt agagctggag tgtctgcagc gcttcttcgg cgaccccgag atgcagagaa 25440
aggtcgagga gaccctgcac tacaccttcc gccagggcta cgtgcgccag gcttgcaaga 25500
tctccaacgt ggagctcagc aacctggtgt cctacctggg catcttgcat gagaaccgcc 25560
tcgggcagag cgtgctgcac tccaccctgc gcggggaggc gcgccgcgac tacgtgcgcg 25620
actgcgttta cctcttcctc tgctacacct ggcagacggc catgggggtc tggcagcagt 25680
gcctggagga gcgcaacctc aaggagctgg agaagctcct gcagcgcgcg ctcaaagatc 25740
tctggacggg ctacaacgag cgctcggtgg ccgccgcgct ggccgacctc atcttccccg 25800
agcgcctgct caaaaccctc cagcaggggc tgcccgactt caccagccaa agcatgttgc 25860
aaaacttcag gaactttatc ctggagcgtt ctggcatcct acccgccacc tgctgcgccc 25920
tgcccagcga ctttgtcccc ctcgtgtacc gcgagtgccc cccgccgctg tggggtcact 25980
gctacctgtt ccaactggcc aactacctgt cctaccacgc ggacctcatg gaggactcca 26040
gcggcgaggg gctcatggag tgccactgcc gctgcaacct ctgcacgccc caccgctccc 26100
tggtctgcaa cacccaactg ctcagcgaga gtcagattat cggtaccttc gagctacagg 26160
gtccgtcctc ctcagacgag aagtccgcgg ctccggggct aaaactcact ccggggctgt 26220
ggacttccgc ctacctgcgc aaatttgtac ctgaagacta ccacgcccac gagatcaggt 26280
tttacgaaga ccaatcccgc ccgcccaagg cggagctgac cgcctgcgtc atcacccagg 26340
gcgagatcct aggccaattg caagccatcc aaaaagcccg ccaagacttt ttgctgaaga 26400
agggtcgggg ggtgtatctg gacccccagt cgggtgagga gctcaacccg gttcccccgc 26460
tgccgccgcc gcgggacctt gcttcccagg ataagcatcg ccatggctcc cagaaagaag 26520
cagcagcggc cgccactgcc gccaccccac atgctggagg aagaggagga atactgggac 26580
agtcaggcag aggaggtttc ggacgaggag gagccggaga cggagatgga agagtgggag 26640
gaggacagct tagacgagga ggcttccgaa gccgaagagg cagacgcaac accgtcaccc 26700
tcggccgcag ccccctcgca ggcgcccccg aagtccgctc ccagcatcag cagcaacagc 26760
agcgctataa cctccgctcc tccaccgccg cgacccacgg ccgaccgcag acccaaccgt 26820
agatgggaca ccaccggaac cggggccggt aagtcctccg ggagaggcaa gcaagcgcag 26880
cgccaaggct accgctcgtg gcgcgctcac aagaacgcca tagtcgcttg cttgcaagac 26940
tgcgggggga acatctcctt cgcccgccgc ttcctgctct tccaccacgg tgtggccttc 27000
ccccgtaacg tcctgcatta ctaccgtcat ctctacagcc cctactgcgg cggcagtgag 27060
ccagagacgg tcggcggcgg cggcggcgcc cgtttcggcg cctaggaaga cccagggcaa 27120
gacttcagcc aagaaactcg cggcggccgc ggcgaacgcg gtcgcggggg ccctgcgcct 27180
gacggtgaac gaacccctgt cgacccgcga actgaggaac cgaatcttcc ccactctcta 27240
tgccatcttc cagcagagca gagggcagga tcaggaactg aaagtaaaaa acaggtctct 27300
gcgctccctc acccgcagct gtctgtatca caagagcgaa gaccagcttc ggcgcacgct 27360
ggaggacgct gaggcactct tcagcaaata ctgcgcgctc actcttaagg actagctccg 27420
cgcccttctc gaatttaggc gggaacgcct acgtcatcgc agcgccgccg tcatgagcaa 27480
ggacattccc acgccataca tgtggagcta tcagccgcag atgggactcg cggcgggcgc 27540
ctcccaagac tactccaccc gcatgaactg gctcagtgcc ggcccacaca tgatctcaca 27600
ggttaatgat atccgcaccc atcgaaacca aatattggtg gagcaggcgg caattaccac 27660
cacgccccgc aataatccca accccaggga gtggcccgcg tccctggtgt atcaggaaat 27720
tcccggcccc accaccgtac tacttccgcg tgattcccag gccgaagtcc aaatgactaa 27780
ctcaggggca cagctcgcgg gcggctgtcg tcacagggtg cggcctcctc gccagggtat 27840
aactcacctg gagatccgag gcagaggtat tcagctcaac gacgagtcgg tgagctcctc 27900
gctcggtctc agacctgacg ggaccttcca gatagccgga gccggccgat cttccttcac 27960
gccccgccag gcgtacctga ctctgcaaag ctcgtcctcg gcgccgcgct cgggcggcat 28020
cgggactctc cagttcgtgc aggagtttgt gccctcggtc tacttcaacc ccttctcggg 28080
ctctcccggt cgctacccgg accagttcat ctcgaacttt gacgccgcga gggactcggt 28140
ggacggctac gactgaatgt cgggtggacc cggtgcagag caacttcgcc tgaagcacct 28200
cgaccactgc cgccgccctc agtgctttgc ccgctgtcag accggtgagt tccagtactt 28260
ttccctgccc gactcgcacc cggacggccc ggcgcacggg gtgcgctttt tcatcccgag 28320
tcaggtgcgc tctaccctaa tcagggagtt taccgcccgt cccctactgg cggagttgga 28380
aaaggggcct tctatcctaa ccattgcctg catctgctct aaccctggat tgcaccaaga 28440
tctttgctgt catttgtgtg ctgagtataa taaaggctga gatcagaatc tactcgggct 28500
cctgtcgcca tcctgtcaac gccaccgtcc aagcccggcc cgatcagccc gaggtgaacc 28560
tcacctgcgg tctgcaccgg cgcctgagga aatacctagc ttggtactac aacagcactc 28620
cctttgtggt ttacaacagc tttgaccagg acggggtctc actgagggat aacctctcga 28680
acctgagcta ctccatcagg aagaacagca ccctcgagct acttcctcct tacctgcccg 28740
ggacttacca gtgtgtcacc ggtccctgca cccacaccca cctgttgatc gtaaacgact 28800
ctcttccgag aacagacctc aataactcct cttcgcagtt ccccagaaca ggaggtgagc 28860
tcaggaaacc ccgggtaaag aagggtggac gagagttaac acttgtgggg tttctggtgt 28920
atgtgacgct ggtggtggct cttttgatta aggcttttcc ttccatgtct gaactctccc 28980
tcttctttta tgaacaactc gactagtgct aacgggaccc tacccaacga atcgggattg 29040
aatatcggta accaggttgc agtttcactt ttgattacct tcatagtcct cttcctgcta 29100
gtgctgtcgc ttctgtgcct gcggatcggg ggctgctgca tccacgttta tatctggtgc 29160
tggctgttta gaaggttcgg agaccatcgc aggtagaata aacatgctgc tgcttaccct 29220
ctttgtcctg gcgctggccg ccagctgcca agccttttcc gaggctgact ttatagagcc 29280
ccagtgtaat gtgactttta aagcccatgc acagcgttgt catactataa tcaaatgtgc 29340
caccgaacac gatgaatacc ttatccagta taaagataaa tcacacaaag tggcacttgt 29400
tgacatctgg aaacccgaag accctttgga atacaatgtg accgttttcc agggtgacct 29460
cttcaaaatt tacaattaca ctttcccatt tgaccagatg tgtgactttg tcatgtacat 29520
ggaaaagcag cacaagctgt ggcctccgac tccccagggc tgtgtggaaa atccaggctc 29580
tttctgcatg atctctctct gtgtaactgt gctggcacta atactcacgc ttttgtatat 29640
cagatttaaa tcaaggcaaa gcttcattga tgaaaagaaa atgccttaat cgctttcacg 29700
cttgattgct aacaccgggt ttttatccgc agaatgattg gaatcaccct actaatcacc 29760
tccctccttg cgattgccca tgggttggaa cgaatcgaag tccctgtggg ggccaatgtt 29820
accctggtgg ggcctgtcgg caatgctaca ttaatgtggg aaaaatatac taaaaatcaa 29880
tgggtctctt actgcactaa caaaaatagc cacaagccca gagccatctg cgatgggcaa 29940
aatctaacct tgattgatgt tcaattgctg gatgcgggct actattatgg gcagctgggt 30000
acaatgatta attactggag accccacaga gattacatgc tccacgtagt aaagggtccc 30060
cttagcagcc cacccactac cacctctact acccccacta ccaccactac tcccaccacc 30120
agcactgccg cccagcctcc tcatagcaga acaaccactt ttatcaattc caagtcccac 30180
tccccccaca ttgccggcgg gccctccgcc tcagactccg aaaccaccga gatctgcttc 30240
tgcaaatgct ctgacgccat tgcccaggat ttggaagatc acgaggaaga tgagcatgac 30300
ttcgcagatg catgccaggc atcagagcca gaagcgctgc cggtggccct caaacagtat 30360
gcagaccccc acaccacccc cgaccttcct ccaccttccc agaagccaag tttcctgggg 30420
gaaaatgaaa ctctgcctct ctccatactc gctctgacat ctgttgctat gttgaccgct 30480
ctgctggtgc ttctatgctc tatatgctac ctgatctgct gcagaaagaa aaaatctcac 30540
ggccatgctc accagcccct catgcacttc ccttaccctc cagagctggg cgaccacaaa 30600
ctttaagtct gcagtaacta tctgcccatc ccttgtcagt cgacagcgat gagccccact 30660
aatctaacgg cctctggact tacaacatcg tctcttaatg agaccaccgc tcctcaagac 30720
ctgtacgatg gtgtctccgc gctggttaac cagtgggatc acctgggcat atggtggctc 30780
ctcataggag cagtgaccct gtgcctaatc ctggtctgga tcatctgctg catcaaaagc 30840
agaagaccca ggcggcggcc catctacagg ccctttgtca tcacacctga agatgatgat 30900
gacaccactt ccaggctgca gaggctaaag cagctactct tctcttttac agcatggtaa 30960
attgaatcat gcctcgcatt ttcatctact tgtctctcct tccacttttt ctgggctctt 31020
ctacattggc cgctgtgtcc cacatcgagg tagactgcct cacgcccttc acagtctacc 31080
tgcttttcgg ctttgtcatc tgcacctttg tctgcagcgt tatcactgta gtgatctgct 31140
tcatacagtg catcgactac gtctgcgtgc gggtggctta ctttagacac cacccccagt 31200
atcgcaacag ggacatagcg gctctcctaa gacttgttta aaatcatggc caaattaact 31260
gtgattggtc ttctgatcat ctgctgcgtc ctagccgcga ttgggactca agctcctacc 31320
accaccagcg ctcccagaaa gagacatgta tcctgcagct tcaagcgtcc ctggaatata 31380
ccccaatgct ttactgatga acctgaaatc tctttggctt ggtacttcag cgtcaccgcc 31440
cttcttatct tctgcagtac ggttattgcc cttgccatct acccttccct tgacctgggc 31500
tggaatgctg tcaactctat ggaatatccc accttcccag aaccagacct gccagacctg 31560
gttgttctaa acgcgtttcc tcctcctgct cccgttcaaa atcagtttcg ccctccgtcc 31620
cccacgccca ctgaggtcag ctactttaat ctaacaggcg gagatgactg aaaacctaga 31680
cctagaaatg gacggtctct gcagcgagca acgcacacta gagaggcgcc ggcaaaaaga 31740
gctcgagcgt cttaaacaag agctccaaga cgcggtggcc atacaccagt gcaaaaaagg 31800
tgtcttctgt ctggtaaaac aggccacgct cacctatgaa aaaacaggtg acacccaccg 31860
cctaggatac aagctgccca cacagcgcca aaagttcgcc ctcatgatag gcgaacaacc 31920
catcaccgtg acccagcact ccgtggagac agaaggctgc atacatgctc cctgtagggg 31980
cgctgactgc ctctacacct tgatcaaaac cctctgcggt ctcagagacc ttatcccttt 32040
caattaatca taactgtaat caataaaaaa tcacttactt gaaatctgat agcaagcctc 32100
tgtccaattt tttcagcaac acttccttcc cctcctccca actctggtac tctaggcgcc 32160
tcctagctgc aaacttcctc cacagtctga agggaatgtc agattcctcc tcctgtccct 32220
ccgcacccac gatcttcatg ttgttgcaga tgaaacgcgc gagatcgtct gacgagacct 32280
tcaaccccgt gtacccctac gataccgaga tcgctccgac ttctgtccct ttccttaccc 32340
ctccctttgt gtcatccgca ggaatgcaag aaaatccagc tggggtgctg tccctgcact 32400
tgtcagagcc ccttaccacc cacaatgggg ccctgactct aaaaatgggg ggcggcctga 32460
ccctggacaa ggaagggaat ctcacttccc aaaacatcac cagtgtcgat ccccctctca 32520
aaaaaagcaa gaacaacatc agccttcaga ccgccgcacc cctcgccgtc agctccgggg 32580
ccctaacact ttttgccact ccccccctag cggtcagtgg tgacaacctt actgtgcagt 32640
ctcaggcccc tctcactttg gaagactcaa aactaactct ggccaccaaa ggacccctaa 32700
ctgtgtccga aggcaaactt gtcctagaaa cagaggctc 32739
<210> 25
<211> 32739
<212> DNA
<213> Artificial Sequence
<220>
<223> Adenovirus vector nucleotide sequences
<400> 25
catcatcaat aatatacctt attttggatt gtggccaata tgataatgag gtgggcgggg 60
agaggcgggg cgggtgacgt aggacgcgcg agtagggttg ggaggtgtgg cggaagtgtg 120
gcatttgcaa gtgggaggag ctcacatgca agcttccgtc gcggaaaatg tgacgttttt 180
gatgagcgcc gcctacctcc ggaagtgcca attttcgcgc gcttttcacc ggatatcgta 240
gtaattttgg gcgggaccat gtaagatttg gccattttcg cgcgaaaagt gaaacgggga 300
agtgaaaact gaataatagg gcgttagtca tagtgcgtaa tatttaccga gggccgaggg 360
actttgaccg attacgtgga ggactcgccc aggtgttttt tacgtgaatt tccgcgttcc 420
gggtcaaagt ctccgtttta ttgtcaccgt catttgacgc ttaggcctga ccatctggtg 480
ctggcctgca ccagggccga gtttgggtct agcgatgagg ataccgattg aggtgggtaa 540
ggtgggcgtg gctagaaggg tggggcgtgt ataaattggg ggtctaaggg tctctctgtt 600
ttgtcttgca acagccgccg ccatgagcga caccggcaac agctttgatg gaagcatctt 660
tagcccctat ctgacagtgc gcatgcctca ctgggctgga gtgcgtcaga atgtgatggg 720
ttccaacgtg gatggacgcc ccgttctgcc ttcaaattcg tctacaatgg cctacgcgac 780
cgtgggagga actccgctgg acgccgcgac ctccgccgcc gcctccgccg ccgccgcgac 840
cgcgcgcagc atggctacgg acctttacag ctctttggtg gcgagcggcg cggcctctcg 900
cgcgtctgct cgggatgaga aactgaccgc tctgctgctt aaactggaag acttgacccg 960
ggagctgggt caactgaccc agcaggtctc cagcttgcgt gagagcagcc ttgcctcccc 1020
ctaatggccc ataatataaa taaaagccag tctgtttgga ttaagcaagt gtatgttctt 1080
tatttaactc tccgcgcgcg gtaagcccgg gaccagcggt ctcggtcgtt tagggtgcgg 1140
tggattcttt ccaacacgtg gtacaggtgg ctctggatgt ttagatacat gggcatgagt 1200
ccatccctgg ggtggaggta gcaccactgc agagcttcgt gctcgggggt ggtgttgtat 1260
atgatccagt cgtagcagga gcgctgggcg tggtgctgaa aaatgtcctt aagcaagagg 1320
cttatagcta gggggaggcc cttggtgtaa gtgtttacaa atctgctcag ttgggagggg 1380
tgcatccggg gggatataat gtgcatcttg gactggattt ttaggttggc tatgttccca 1440
cccagatccc ttctgggatt catgttgtgc aggaccacca gcacggtata tccagtgcac 1500
ttgggaaatt tatcgtggag cttagacggg aatgcatgga agaacttgga gacgcccttg 1560
tggcctccca gattttccat acattcgtcc atgatgatgg caatgggccc gtgggaagct 1620
gcctgagcaa aaatgtttct gggatcgctc acatcgtagt tatgttccag ggtgaggtca 1680
tcataggaca tctttacgaa tcgggggcgg agggtcccgg actgggggat gatggtaccc 1740
tcgggccccg gggcgtagtt cccctcacag atctgcatct cccaggcttt catttcagag 1800
ggagggatca tatccacctg cggagcgatg aaaaacacag tttctggcgc aggggagatt 1860
aactgggatg agagcaggtt tctgagcagc tgtgactttc cacagccggt gggcccatat 1920
atcacgccta tcaccggctg cagctggtag ttaagagagc tgcagctgcc gtcctcccgg 1980
agcagggggg ccacctcgtt cagcatatcc ctgacgtgga tgttctccct gaccaattcc 2040
gccagaaggc gctcgccgcc cagcgaaagc agctcttgca aggaagcaaa atttttcagc 2100
ggttttaggc cgtcggccgt gggcatgttt ttcagcgtct gggtcagcag ttccagcctg 2160
tcccacagct cggtgatgtg ctctacggca tctcgatcca gcagatctcc tcgtttcgcg 2220
ggttggggcg gctttcgctg tagggcacca gccgatgggc gtccagcggg gccagagtca 2280
tgtccttcca tgggcgcagg gtcctcgtca gggtggtctg ggtcacggtg aaggggtgcg 2340
ctccgggttg ggcgctggcc agggtgcgct tgaggctggt tctgctggtg ctgaatcgct 2400
gccgctcttc gccctgcgcg tcggccaggt agcatttgac catggtctcg tagtcgagac 2460
cctcggcggc gtgccccttg gcgcggagct ttcccttgga ggtggcgccg cacgaggggc 2520
actgcaggct cttcagggcg tagagcttgg gagcgagaaa cacggactct ggggagtagg 2580
cgtccgcgcc gcaggaagcg cagaccgtct cgcattccac cagccaagtg agctccgggc 2640
ggtcagggtc aaaaaccagg ttgcccccat gctttttgat gcgtttctta cctcggctct 2700
ccatgaggcg gtgtcccttc tcggtgacga agaggctgtc cgtgtccccg tagaccgact 2760
tcaggggcct gtcttccagc ggagtgcctc tgtcctcctc gtagagaaac tctgaccact 2820
ctgagacgaa ggcccgcgtc caggccagga cgaaggaggc cacgtgggag gggtagcggt 2880
cgttgtccac tagcgggtcc accttctcca gggtgtgcag gcacatgtcc ccctcctccg 2940
cgtccagaaa agtgattggc ttgtaggtgt aggacacgtg accgggggtt cccgacgggg 3000
gggtataaaa gggggtgggc gccctttcat cttcactctc ttccgcatcg ctgtctgcga 3060
gggccagctg ctggggtaag tattccctct cgaaggcggg catgacctca gcgctcaggt 3120
tgtcagtttc taaaaatgag gaggatttga tgttcacctg tccggaggtg atacctttga 3180
gggtacctgg gtccatctgg tcagaaaaca ctattttttt gttgtcaagc ttggtggcga 3240
acgacccgta gagggcgttg gagagcagct tggcgatgga gcgcagggtc tggtttttgt 3300
cgcggtcggc tcgctccttg gccgcgatgt tgagttgcac gtactcgcgg gccacgcact 3360
tccactcggg gaagacggtg gtgcgctcgt ctgggattag gcgcaccctc cagcctcggt 3420
tgtgcagggt gaccatgtcg acgctggtgg cgacctcgcc gcgcaggcgc tcgttggtcc 3480
agcagaggcg gccgcccttg cgcgagcaga aggggggtag ggggtccagc tggtcctcgt 3540
ttggggggtc cgcgtcgatg gtgaagaccc cggggagcaa gcgcgggtca aagtagtcga 3600
tcttgcaagc ttgcatgtcc agagcccgct gccattcgcg ggcggcgagc gcgcgctcgt 3660
aggggttgag gggcgggccc cagggcatgg ggtgggtgag cgcggaggcg tacatgccgc 3720
agatgtcata cacgtacagg ggttccctga ggatgccgag gtaggtgggg tagcagcgcc 3780
ccccgcggat gctggcgcgc acgtagtcat agagctcgtg ggagggggcc agcatgttgg 3840
gcccgaggtt ggtgcgctgg gggcgctcgg cgcggaaggc gatctgcctg aagatggcat 3900
gggagttgga ggagatggtg ggccgctgga agacgttgaa gcttgcttct tgcaagccca 3960
ccgagtccct gacgaaggag gcgtaggact cgcgcagctt gtgcaccagc tcggcggtga 4020
cctggacgtc gagcgcgcag tagtcgaggg tctcgcggat gatgtcatac ttatcctccc 4080
ccttcttttt ccacagctcg cggttgagga cgaactcttc gcggtctttc cagtactctt 4140
ggaggggaaa cccgtccgtg tccgaacggt aagagcctag catgtagaac tggttgacgg 4200
cctggtaggg gcaacagccc ttctccacgg gcagcgcgta ggcctgcgcc gccttgcgga 4260
gggaggtgtg ggtgagggcg aaagtgtccc tgaccatgac tttgaggtat tgatgtttga 4320
agtctgtgtc atcgcagccg ccctgttccc acagggtgta gtccgtgcgc tttttggagc 4380
gcgggttggg cagggagaag gtgaggtcat tgaagaggat cttccccgct cgaggcatga 4440
agtttctggt gatgcgaaag ggccctggga ccgaggagcg gttgttgatg acctgggcgg 4500
ccaggacgat ctcgtcaaag ccgtttatgt tgtggcccac gatgtagagc tccaaaaagc 4560
ggggctggcc cttgatggag gggagctttt tgagttcctc gtaggtgagc tcctcgggcg 4620
attccaggcc gtgctcctcc agggcccagt cttgcaagtg agggttggcc gccaggaagg 4680
atcgccagag gtcgcgggcc atgagggtct gcaggcggtc gcggaaggtt ctgaactgtc 4740
gccccacggc catcttttcg ggggtgatgc agtagaaggt gagggggtct ttctcccagg 4800
ggtcccatct gagctctcgg gcgaggtcgc gcgcggcggc gaccagagcc tcgtcgcccc 4860
ccagtttcat gaccagcatg aagggcacga gctgcttgcc aaaggctccc atccaagtgt 4920
aggtctctac atcgtaggtg acaaagaggc gctccgtgcg aggatgagag ccgatcggga 4980
agaactggat ctcccgccac cagttggagg attggctgtt gatgtggtga aagtagaagt 5040
cccgtctgcg ggccgagcac tcgtgctggc ttttgtaaaa gcgaccgcag tactggcagc 5100
gctgcacggg ttgtatatct tgcacgaggt gaacctggcg acctctgacg aggaagcgca 5160
gcgggaatct aagtcccccg cctggggtcc cgtgtggctg gtggtcttct actttggttg 5220
tctggccgcc agcatctgtc tcctggaggg cgatggtgga gcagaccacc acgccgcgag 5280
agccgcaggt ccagatctcg gcgctcggcg ggcggagttt gatgacgaca tcgcgcacat 5340
tggagctgtc catggtctcc agctcccgcg gcggcaggtc agctgggagt tcctggaggt 5400
tcacctcgca gagacgggtc aaggcgcggg cagtgttgag atggtatctg atttcaaggg 5460
gcgtgttggc ggcggagtcg atggcttgca ggaggccgca gccccggggg gccacgatgg 5520
ttccccgcgg ggcgcgaggg gaggcggaag ctgggggtgt gttcagaagc ggtgacgcgg 5580
gcgggccccc ggaggtaggg ggggttccgg ccccacaggc atgggcggca ggggcacgtc 5640
ttcgccgcgc gcgggcaggg gctggtgctg gctccgaaga gcgcttgcgt gcgcgacgac 5700
gcgacggttg gtgtcctgta tctgacgcct ctgagtgaag accacgggtc ccgtgacctt 5760
gaacctgaaa gagagttcga cagaatcaat ctcggcatcg ttgacagcgg cctggcgcag 5820
gatctcctgc acgtcgcccg agttgtcctg gtaggcgatc tctgccatga actgctcgat 5880
ctcttcttcc tggagatctc ctcgtccggc gcgctccacg gtggccgcca ggtcgttgga 5940
gatgcgaccc atgagctgtg agaaggcgtt gagcccgccc tcgttccaga cccggctgta 6000
gaccacgccc ccctcggcgt cgcgagcgcg catgaccacc tgggccaggt tgagctccac 6060
gtgtcgcgtg aagacggcgt agttgcgcag gcgctggaaa aggtagttca gggtggtggc 6120
ggtgtgctcg gcgacgaaga agtacatgac ccagcgccgc aacgtggatt cattgatgtc 6180
ccccaaggcc tccaggcgct ccatggcctc gtagaagtcc acggcgaagt tgaaaaactg 6240
ggagttgcga gcggacacgg tcaactcctc ctccagaaga cggatgagct cggcgacagt 6300
gttgcgcacc tcgcgctcga aggccacggg gggcgcttct tcctcttcca cctcttcttc 6360
catgatcgct tcttcttctt cctcagccgg gacgggaggg ggcggcggcg gcgggggagg 6420
ggcgcggcgg cggcggcggc gcaccgggag gcggtcgatg aagcgctcga tcatctcccc 6480
ccgcatgcgg cgcatggtct cggtgacggc gcggccgttc tcccgggggc gcagctcgaa 6540
gacgccgcct ctcatctcgc cgcggggcga gcggccgtga ggtagcgaga cggcgctgac 6600
tatgcatctt aacaattgct gtgtaggtac accgccgagg gacctgattg agtccagatc 6660
caccggatcc gaaaaccttt ggaggaaagc gtctatccag tcgcagtcgc aaggtaggct 6720
gagcaccgtg gcgggcgggg gcgggtctgg agagttcctg gcggagatgc tgctgatgat 6780
gtaattaaag taggcggtct tgagaaggcg gatggtggac aggagcacca tgtctttggg 6840
tccggcctgt tggatgcgga ggcggtcggc catgccccag gcctcgttct gacaccggcg 6900
caggtctttg tagtagtctt gcatgagtct ttccaccggc acctcttctc cttcctcttc 6960
tccatctcgc cggtggtttc tcgcgccgcc catgcgcgtg accccaaagc ccctgagcgg 7020
ctgcagcagg gccaggtcgg cgaccacgcg ctcggccaag atggcctgct gcacctgagt 7080
gagggtcctc tcgaagtcat ccatgtccac gaagcggtgg taggcgcccg tgttgatggt 7140
gtaggtgcag ttggccatga cggaccagtt gacggtctgg tgtcccggct gcgagagctc 7200
cgtgtaccgc aggcgcgaga aggcgcggga atcgaacacg tagtcgttgc aagtccgcac 7260
cagatactgg tagcccacca ggaagtgcgg cggaggttgg cgatagaggg gccagcgctg 7320
ggtggcgggg gcgccgggcg ccaggtcttc cagcatgagg cggtggtatc cgtagatgta 7380
cctggacatc caggtgatgc cggcggcggt ggtggtggcg cgcgcgtagt cgcggacccg 7440
gttccagatg tttcgcaggg gcgagaagtg ttccatggtc ggcacgctct ggccggtgag 7500
gcgcgcgcag tcgttgacgc tctatacaca cacaaaaacg aaagcgttta cagggctttc 7560
gttctgtagc ctggaggaaa gtaaatgggt tgggttgcgg tgtgccccgg ttcgagacca 7620
agctgagctc ggccggctga agccgcagct aacgtggtat tggcagtccc gtctcgaccc 7680
aggccctgta tcctccagga tacggtcgag agcccttttg ctttcttggc caagcgcccg 7740
tggcgcgatc tgggatagat ggtcgcgatg agaggacaaa agcggctcgc ttccgtagtc 7800
tggagaaaca atcgccaggg ttgcgttgcg gcgtaccccg gttcgagccc ctatggcggc 7860
ttgaatcggc cggaaccgcg gctaacgagg gccgtggcag ccccgtcctc aggaccccgc 7920
cagccgactt ctccagttac gggagcgagc cccttttgtt ttttattttt tagatgcatc 7980
ccgtgctgcg gcagatgcgc ccctcgcccc ggcccgatca gcagcagcaa cagcaggcat 8040
gcagaccccc ctctcccctt tccgccccgg tcaccacggc cgcggcggcc gtgtcgggcg 8100
cggggggcgc gctggagtca gatgagccac cgcggcggcg acctaggcag tatctggact 8160
tggaagaggg cgagggactg gcgcggctgg gggcgaactc tccagagcgc cacccgcggg 8220
tgcagttgaa aagggacgcg cgcgaggcgt acctgccgcg gcagaacctg tttcgcgacc 8280
gcgggggcga ggagcccgag gagatgcgag actgcaggtt ccaagcgggg cgcgagctgc 8340
ggcgcgggct ggacagacag cgcctgctgc gcgaggagga ctttgagccc gacacgcaga 8400
cgggcatcag ccccgcgcgc gcgcacgtag ccgcggccga cctggtgacc gcctacgagc 8460
agacggtaaa ccaggagcgc aacttccaaa agagcttcaa caaccacgtg cgcacgctgg 8520
tggcgcgcga ggaggtgacc ctgggtctca tgcatctgtg ggacctggtg gaggcgatcg 8580
tgcagaaccc cagcagcaag cccctgaccg cgcagctgtt cctggtggtg cagcacagca 8640
gggacaacga ggccttcagg gaggcgctgc tgaacatcac cgagccggag gggcgctggc 8700
tcctggacct gataaacatc ctgcagagca tagtggtgca ggagcgcagc ctgagcctgg 8760
ccgagaaggt ggcggccatc aactactcta tgctgagcct gggcaagttc tacgcccgca 8820
agatctacaa gaccccctac gtgcccatag acaaggaggt gaagatagac agcttctaca 8880
tgcgcatggc gctgaaggtg ctgaccctga gcgacgacct gggagtgtac cgcaacgagc 8940
gcatccacaa ggccgtgagc gccagccggc ggcgcgagct gagcgaccgc gagctgatgc 9000
acagtctgca gcgcgcgctg accggcgcgg gcgagggcga cagggaggtc gagtcctact 9060
tcgacatggg ggccgacctg cactggcagc cgagccgccg cgccctggag gcggcggggg 9120
cgtacggcgg ccccctggcg gccgatgacc aggaagagga ggactatgag ctagaggagg 9180
gcgagtacct ggaggactga cctggctggt ggtgttttgg tatagatgca agatccgaac 9240
gtggcggacc cggcggtccg ggcggcgctg caaagccagc cgtccggcat taactcctct 9300
gacgactggg ccgcggccat gggtcgcatc atggccctga ccgcgcgcaa ccccgaggct 9360
ttcaggcagc agcctcaggc caaccggctg gcggccatct tggaagcggt agtgcccgcg 9420
cgctccaacc ccacccacga gaaggtgctg gccatagtca acgcgctggc ggagagcagg 9480
gccatccgcg cggacgaggc cggactggtg tacgatgcgc tgctgcagcg ggtggcgcgg 9540
tacaacagcg gcaacgtgca gaccaacctg gaccgcctgg tgacggacgt gcgcgaggcc 9600
gtggcgcagc gcgagcgctt gcatcaggac ggtaacctgg gctcgctggt ggcgctaaac 9660
gccttcctca gcacccagcc ggccaacgta ccgcgggggc aggaggacta caccaacttt 9720
ttgagcgcgc tgcggctgat ggtgaccgag gtccctcaga gcgaggtgta ccagtcgggg 9780
cccgactact tcttccagac cagcagacag ggcttgcaaa ccgtgaacct gagccaggct 9840
ttcaagaacc tgcgggggct gtggggagtg aaggcgccca ccggcgaccg ggctacggtg 9900
tccagcctgc taacccccaa ctcgcgcctg ctgctgctgc tgatcgcgcc cttcacggac 9960
agcgggagcg tctcgcggga gacctatctg ggccacctgc tgacgctgta ccgcgaggcc 10020
atcgggcagg cgcaggtgga cgagcacacc ttccaagaga tcaccagcgt gagccacgcg 10080
ctggggcagg aggacacggg cagcctgcag gcgaccctga actacctgct gaccaacagg 10140
cggcagaaga ttcccacgct gcacagcctg acccaggagg aggagcgcat cttgcgctac 10200
gtgcagcaga gcgtgagcct gaacctgatg cgcgacggcg tgacgcccag cgtggcgctg 10260
gacatgaccg cgcgcaacat ggaaccgggc atgtacgcct cccaccggcc gtttatcaac 10320
cgcctgatgg actacttgca tcgggcggcg gccgtgaacc ccgagtactt cactaatgcc 10380
attctgaatc cccactggat gccccctccg ggtttctaca acggggactt tgaggtgccc 10440
gaggtcaacg acgggttcct ctgggatgac atggatgaca gtgtgttctc acccaacccg 10500
ctgcgcgccg cgtctctgcg attgaaggag ggctctgaca gggaaggacc gaggagtctg 10560
gcctcctccc tggctctggg agcggtgggc gccacgggcg cggcggcgcg gggcagtagc 10620
cccttcccca gcctggcaga ctctctgaac agcgggcggg tgagcaggcc ccgcttgcta 10680
ggcgaggagg agtatctgaa caactccctg ctgcagcccg cgagggacaa gaacgctcag 10740
cggcagcagt ttcccaacaa tgggatagag agcctggtgg acaagatgtc cagatggaag 10800
acgtatgcgc aggagtacaa ggagtgggag gaccgccagc cgcggccctt gccgccccct 10860
aggcagcgct ggcagcggcg cgcgtccaac cgccgctgga ggcaggggcc cgaggacgat 10920
gatgactctg cagatgacag cagcgtgttg gacctgggcg ggagcgggaa ccccttttcg 10980
cacctgcgcc cacgcctggg caagatgttt taaaagaaaa aaaaaataaa actcaccaag 11040
gccatggcga cgagcgttgg ttttttgttc ccttccttag tatgcggcgc gcggcgatgt 11100
tcgaggaggg gcctcccccc tcttacgaga gcgcgatggg gatttctcct gcggcgcccc 11160
tgcagcctcc ctacgtgcct cctcggtacc tgcaacctac aggggggaga aatagcatct 11220
gttactctga gctgcagccc ctgtacgata ccaccagact gtacctggtg gacaacaagt 11280
ccgcggacgt ggcctccctg aactaccaga acgaccacag cgattttttg accacggtga 11340
tccaaaacaa cgacttcacc ccaaccgagg ccagcaccca gaccataaac ctggataaca 11400
ggtcgaactg gggcggcgac ctgaagacca tcttgcacac caacatgccc aacgtgaacg 11460
agttcatgtt caccaactct tttaaggcgc gggtgatggt ggcgcgcgag cagggggagg 11520
cgaagtacga gtgggtggac ttcacgctgc ccgagggcaa ctactcagag accatgactc 11580
tcgacctgat gaacaatgcg atcgtggaac actatctgaa agtgggcagg cagaacgggg 11640
tgaaggaaag cgatatcggg gtcaagtttg acaccagaaa cttccgtctg ggctgggacc 11700
ccgtgaccgg gctggtcatg ccgggggtct acaccaacga ggcctttcat cccgacatag 11760
tgcttctgcc cggctgtggg gtggacttca cccagagccg gctgagcaac ctgctgggca 11820
ttcgcaagcg gcagcctttc caggagggtt tcaagatcac ctatgaggat ctgaaggggg 11880
gcaacattcc cgcgctcctt gatctggacg cctacgagga gagcttgaaa cccgaggaga 11940
gcgctggcga cagcggcgag agtggcgagg agcaagccgg cggcggtggc ggcgcgtcgg 12000
tagaaaacga aagtacgccc gcagtggcgg cggacgctgc ggaggtcgag ccggaggcca 12060
tgcagcagga cgcagaggag ggcgcacagg agggcgcgca gaaggacatg aacgatgggg 12120
agatcagggg agacacattc gccacccggg gcgaagaaaa agaggcagag gcggcggcgg 12180
cggcgacggc ggaggccgaa accgaggttg aggcagaggc agagcccgag accgaagtta 12240
tggaagacat gaatgatgga gaacgtaggg gcgacacgtt cgccacccgg ggcgaagaga 12300
aggcggcgga ggcagaagcc gcggctgagg aggcggctgc ggctgcggcc aagactgagg 12360
ctgcggctaa ggctgaggtc gaagccaatg ttgcggttga ggctcaggct gaggaggagg 12420
cggcggctga agcagttaag gaaaaggccc aggcagagca ggaagagaaa aaacctgtca 12480
ttcaacctct aaaagaagat agcaaaaagc gcagttacaa cgtcatcgag ggcagcacct 12540
ttacccagta ccgcagctgg tacctggcgt acaactacgg cgacccggtc aagggggtgc 12600
gctcgtggac cctgctctgc acgccggacg tcacctgcgg ctccgagcag atgtactggt 12660
cgctgccgaa catgatgcaa gacccggtga ccttccgctc cacgcggcag gttagcaact 12720
tcccggtggt gggcgccgaa ctgctgcccg tgcactccaa gagtttttac aacgagcagg 12780
ccgtctactc ccagctgatc cgccaggcca cctctctgac ccacgtgttc aatcgctttc 12840
ccgagaacca gattttggcg cgcccgccgg cccccaccat caccaccgtg agtgaaaacg 12900
ttcctgccct cacagatcac gggacgctac cgctgcgcaa cagcatctca ggagtccagc 12960
gagtgaccat tactgacgcc agacgccgga cctgccccta cgtttacaag gccttgggca 13020
tagtctcgcc gcgcgtcctc tccagtcgca ctttttaaaa cacatctacc cacacgttcc 13080
aaaatcatgt ccgtactcat ctcacccagc aacaacaccg gctgggggct gcgcgcgccc 13140
agcaagatgt ttggaggggc gaggaagcgc tccgaccagc accctgtgcg cgtgcgcggc 13200
cactaccgcg cgccctgggg agcgcacaag cgcgggcgca cagggcgcac cactgtggac 13260
gacgtcattg actccgtagt ggagcaagcg cgccactaca cacccggcgc gccgaccgcc 13320
cccgccgtgt ccaccgtgga ccaggcgatc gaaagcgtgg tacagggcgc gcggcactat 13380
gccaacctta aaagtcgccg ccgccgcgtg gcccgccgcc atcgccggag accccgggcc 13440
accgccgccg cgcgccttac taaggctctg ctcaggcgcg ccaggcgaac tggccaccgg 13500
gccgccatga gggccgcacg gcgggctgcc gctgccgcaa gcgtcgtggc cccgcgggca 13560
cgaaggcgcg cggccgctgc cgccgccgcc gccatttcca gcttggcctc gacgcggcgc 13620
ggtaacatat actgggtgcg cgactcggta accggcacgc gggtacccgt gcgctttcgc 13680
cccccgcgga attagcacaa gacaacatac acactgagtc tcctgctgtt gtgtatccca 13740
gcggcgaccg tcagcagcgg cgacatgtcc aagcgcaaaa ttaaagaaga gatgctccag 13800
gtcatcgcgc cggagatcta tgggcccccg aagaaggagg aggatgatta caagccccgc 13860
aagctaaagc gggtcaaaaa gaaaaagaaa gatgatgatg acgaggcggt ggagtttgtc 13920
cgccgcatgg cacccaggcg ccccgtgcag tggaagggcc ggcgcgtgca gcgcgttttg 13980
cgccccggca ccgcggtggt cttcacgccc ggcgagcgct ccacgcgcac tttcaagcgg 14040
gtgtacgatg aggtgtacgg cgacgaggac ctgttggagc aggccaacca gcgctttggg 14100
gagtttgcat atgggaaacg gccccgcgag agtctaaaag aggacctgct ggcgctaccg 14160
ctggacgagg gcaatcccac cccgagtctg aagccggtaa ccctgcaaca ggtgctgcct 14220
ttgagcgcgc ccagcgagca taagcgaggg ttgaagcgcg aaggcgggga cctggcgccc 14280
accgtgcagt tgatggtgcc caagcggcag aagctggagg acgtgctgga gaaaatgaaa 14340
gtagagcccg ggatccagcc cgagatcaag gtccgcccca tcaagcaggt ggcgcccggc 14400
gtgggagtcc agaccgtgga cgttaggatt cccacggagg agatggaaac ccaaaccgcc 14460
actccctctt cggcggccag cgccaccacc ggcaccgctt cggtagaggt gcagacggac 14520
ccctggctac ccgccaccgc tgttgccgcc gccgcccccc gttcgcgcgg gcgcaagaga 14580
aattatccag cggccagcgc gctcatgccc cagtacgcac tgcatccatc catcgtgccc 14640
acccccggct accgcgggta ctcgtaccgc ccgcgcagat cagccggcac tcgcggccgc 14700
cgccgccgtg cgaccacaac cagccgccgc cgtcgccgcc gccgccagcc agtgctgacc 14760
cccgtgtctg taaggaaggt ggctcgctcg gggagcacgc tggtggtgcc cagagcgcgc 14820
taccacccca gcatcgttta aagccggtct ctgtatggtt cttgcagata tggccctcac 14880
ttgtcgcctc cgcttcccgg tgccgggata ccgaggaaga actcaccgcc gcagaggcat 14940
ggcgggcagc ggtctccgcg gcggccgtcg ccatcgccgg cgcgcaaaaa gcaggcgcat 15000
gcgcggcggt gtgctgcctc tgctaatccc gctaatcgcc gcggcgatcg gtgccgtacc 15060
cgggatcgcc tccgtggccc tgcaggcgtc ccagaaacgt tgactcttgc aaccttgcaa 15120
gcttgcattt tttggaggaa aaataaaaaa aagtctagac tctcacgctc gcttggtcct 15180
gtgactattt tgtagaaaaa aagatggaag acatcaactt tgcgtcgctg gccccgcgtc 15240
acggctcgcg cccgttcatg ggagactgga cagatatcgg caccagcaat atgagcggtg 15300
gcgccttcag ctggggcagt ctgtggagcg gccttaaaaa ttttggttcc accattaaga 15360
actatggcaa caaagcgtgg aacagcagca cgggccagat gctgagagac aagttgaaag 15420
agcagaactt ccaggagaag gtggcgcagg gcctggcctc tggcatcagc ggggtggtgg 15480
acatagctaa ccaggccgtg cagaaaaaga taaacagtca tctggacccc cgtcctcagg 15540
tggaggaaat gcctccagcg atggagacgg tgtctcccga gggcaaaggc gaaaagcgcc 15600
cgcggcccga cagagaagag accctggtgt cacacaccga ggagccgccc tcttacgagg 15660
aggcagtcaa ggccggcctg cccaccactc gccccatagc ccccatggcc accggtgtgg 15720
tgggccacag gcaacacact cccgcaacac tagatctgcc cccgccgtcc gagccgccgc 15780
gccagccaaa ggcggcgacg gtgcccgctc cctccacttc cgccgccaac agagtgcccc 15840
tgcgccgcgc cgcgagcggc ccccgggcct cgcgagttag cggcaactgg cagagcacac 15900
tgaacagcat cgtgggcctg ggagtgagga gtgtgaagcg ccgccgttgc tactgaatga 15960
gcaagctagc taacgtgttg tatgtgtgta tgcgtcctat gtcgccgcca gaggagctgt 16020
tgagccgccg gcgccgtctg cactccagcg aatttcaaga tggcgacccc atcgatgatg 16080
cctcagtggt cgtacatgca catctcgggc caggacgctt cggagtacct gagccccggg 16140
ctggtgcagt tcgcccgcgc cacagacacc tacttcaaca tgagtaacaa gttcaggaac 16200
cccactgtgg cgcccaccca cgatgtgacc acggaccggt cgcagcgcct gacgctgcgg 16260
ttcatccccg tggatcggga ggacaccgcc tactcttaca aggcgcggtt cacgctggcc 16320
gtgggcgaca accgcgtgct ggacatggcc tccacttact ttgacatcag gggggtgctg 16380
gacaggggcc ccaccttcaa gccctactcg ggtactgcct acaactccct ggcccccaag 16440
ggcgctccca attcttgcga gtgggaacaa gatgaaccag ctcaggcagc aatagctgaa 16500
gatgaagaag aacttgaaga agaacaagct caggacgaac aggcgcccac taagaaaacc 16560
catgtatacg cccaggcacc tctttctggt gaaaaaatta ctaaggatgg tttgcaaata 16620
ggtgtggatg ccacacaggc gggagataac cctatatatg ctgataaaac attccaaccc 16680
gaacctcaga taggtgagtc tcagtggaac gaggctgatg ccacagtagc aggaggcaga 16740
gtcttaaaaa agaccacccc tatgagacct tgctatggat cctatgccaa acctactaat 16800
gccaatggcg gtcaagggat catggtggcc aatgatcagg gagcgcttga atctaaagtt 16860
gagatgcaat ttttctccac cacaacgtct cttaatgtaa gggaaggtga aaacaatctt 16920
cagccaaaag tagtgctata cagcgaagat gttaacttgg aatcccctga cactcatttg 16980
tcttacaaac ctaaaaagga tgacaccaac tctaaaatca tgttgggtca gcaagccatg 17040
cccaacagac ccaacctcat tgcttttagg gacaacttta ttggacttat gtactacaac 17100
agcacaggca acatgggagt gctggcagga caggcctccc agctaaacgc tgtggtagac 17160
ttgcaagaca gaaacacaga gctgtcatac caactgatgc ttgattccat tggagacaga 17220
tcaagatact tttccatgtg gaaccaggca gtggacagct atgacccaga tgtcagaatc 17280
attgaaaacc atggggttga agatgagctg cccaactatt gctttcccct gggcggtatt 17340
ggaattacag acacatacca gtgcataaaa ccaaccgcag ctgctaataa cactacatgg 17400
tctaaggatg aagaatttag tgatcgcaat gaaatagggg tgggaaacaa cttcgccatg 17460
gagatcaaca tccaggccaa cctctggagg aacttcctct atgcgaacgt ggggctctac 17520
ctgccagaca agctcaagta caaccccacc aacgtggaca tctctgacaa ccccaacacc 17580
tatgactaca tgaacaagcg tgtggtggct cccggcctgg tggactgctt tgtcaatgtg 17640
ggagccaggt ggtccctgga ctacatggac aacgtcaacc ccttcaacca ccaccgcaat 17700
gcgggtctgc gctaccgctc catgatcctg ggcaacgggc gctacgtgcc cttccacatt 17760
caggtgcccc agaagttctt tgccatcaag aacctcctcc tcctgccggg ctcctacact 17820
tacgagtgga acttcaggaa ggatgtcaac atggtcctgc agagctctct gggcaatgac 17880
cttagggtgg acggggccag catcaagttt gacagcgtca ccctctatgc taccttcttc 17940
cccatggctc acaacaccgc ctccacgctc gaggccatgc tgaggaacga caccaacgac 18000
cagtccttca atgactacct ctctggggcc aacatgctct accccatccc cgccaaggcc 18060
accaacgtgc ccatctccat tccctctcgc aactgggccg ccttcagagg ctgggccttt 18120
acccgcctta agaccaagga aaccccctcc ctgggctcgg gttttgaccc ctactttgtc 18180
tactcgggat ccatccccta cctggatggc accttctacc tcaaccacac ttttaagaag 18240
atatccatca tgtatgactc ctccgtcagc tggccgggca atgaccgcct gctcaccccc 18300
aatgagttcg aggtcaagcg cgccgtggac ggcgagggct acaacgtggc ccagtgcaac 18360
atgaccaagg actggttcct ggtgcagatg ctggccaact acaacatagg ctaccagggc 18420
ttctacatcc cagagagcta caaggacagg atgtactcct tcttcagaaa tttccaaccc 18480
atgagcaggc aggtggtgga cgagaccaaa tacaaggact atcaggccat tggcatcact 18540
caccagcaca acaactcggg attcgtgggc tacctggctc ccaccatgcg cgaggggcag 18600
gcctaccccg ccaacttccc ctacccgttg ataggcaaaa ccgcggtcga cagcgtcacc 18660
cagaaaaagt tcctctgcga ccgcaccctc tggcgcatcc ccttctctag caacttcatg 18720
tccatgggtg cgctcacgga cctgggccag aacctgctct atgccaactc cgcccatgcg 18780
ctggacatga cttttgaggt ggaccccatg gacgagccca cccttctcta tattgtgttt 18840
gaagtgttcg acgtggtcag agtgcaccag ccgcaccgcg gtgtcatcga gaccgtgtac 18900
ctgcgcacgc ccttctcggc cggcaacgcc accacctaag gagacagcgc cgccgcctgc 18960
atgacgggtt ccaccgagca agagctcagg gccatcgcca gagacctggg atgcggaccc 19020
tattttttgg gcacctatga caaacgcttc ccgggcttca tctcccgaga caagctcgcc 19080
tgcgccatcg tcaacacggc cgcgcgcgag accgggggcg tgcactggct ggcctttggc 19140
tgggacccgc gctccaaaac ctgctacctc ttcgacccct ttggcttctc cgatcagcgc 19200
ctcagacaga tctatgagtt tgagtacgag gggctgctgc gccgcagcgc gcttgcctcc 19260
tcgcccgacc gctgcatcac ccttgagaag tccaccgaga ccgtgcaggg gccccactcg 19320
gccgcctgcg gtctcttctg ctgcatgttt ttgcacgcct ttgtgcgctg gccccagagt 19380
cccatggatc gcaaccccac catgaacttg ctcaagggag tgcccaacgc catgctccag 19440
agcccccagg tccagcccac cctgcgccac aaccaggaac agctctaccg cttcctggag 19500
cgccactccc cctacttccg cagtcacagc gcgcacatcc ggggggccac ctctttctgc 19560
cacttgcaag aaaacatgca agacggaaaa tgatgtacag ctcgcttttt aataaatgta 19620
aagactgtgc actttattta tacacgggct ctttctggtt atttattcaa caccgccgtc 19680
gccatctaga aatcgaaagg gttctgccgc gcgtcgccgt gcgccacggg cagagacacg 19740
ttgcgatact ggaagcggct cgcccactta aactcgggca ccaccatgcg gggcagtggt 19800
tcctcgggga agttctcgcc ccacagggtg cgggtcagct gcagcgcgct caggaggtcg 19860
ggagccgaga tcttgaagtc gcagttgggg ccggaaccct gcgcgcgcga gttgcggtac 19920
acggggttgc agcactggaa caccagcagg gccggattat gcacgctggc cagcaggctc 19980
tcgtcgctga tcatgtcgct gtccagatcc tccgcgttgc tcagggcgaa cggggtcatc 20040
ttgcagacct gcctgcccag gaaaggcggc agcccgggct tgccgttgca gtcgcagcgc 20100
aggggcatca gcaggtgccc gcggcccgac tgcgcctgcg ggtacagcgc gcgcatgaag 20160
gcttcgatct gcctgaaagc cacctgcgtc ttggctccct ccgaaaagaa catcccacag 20220
gacttgctgg agaactggtt cgcgggacag ctggcatcgt gcaggcagca gcgcgcgtcg 20280
gtgttggcga tctgcaccac gttgcgaccc caccggttct tcactatctt ggccttggaa 20340
gcctgctcct tcagcgcgcg ctggccgttc tcgctggtca catccatctc tatcacctgc 20400
tccttgttga tcatgtttgt accgtgcaga cacttcaggt cgccctccgt ctgggtgcag 20460
cggtgctccc acagcgcgca accggtgggc tcccaatttt tgtgggtcac ccccgcgtag 20520
gcctgcaggt aggcctgcaa gaagcgcccc atcatggcca caaaggtctt ctggctcgta 20580
aaggtcagct gcaggccgcg atgctcttcg ttcagccagg tcttgcagat ggcggccagc 20640
gcctcggtct gctcgggcag catcctaaaa tttgtcttca ggtcgttatc cacgtggtac 20700
ttgtccatca tggcgcgcgc cgcctccatg cccttctccc aggcggacac catgggcagg 20760
cttagggggt ttatcacttc caccggcgag gacaccgtac tttcgatttc ttcttcctcc 20820
ccctcttccc ggcgcgcgcc cacgctgctg cgcgctctca ccgcctgcac caaggggtcg 20880
tcttcaggca agcgccgcac cgagcgcttg ccgcccttga cctgcttaat cagcaccggc 20940
gggttgctga agcccaccat ggtcagcgcc gcctgctctt cttcgtcttc gctgtctacc 21000
actatctctg gggaagggct tctccgctct gcggcggcgc gcttcttttt tttcttggga 21060
gcggccgtga tggagtccgc cacggcgacg gaggtcgagg gcgtggggct gggggtgcgc 21120
ggtaccaggg cctcgtcgcc ctcggactct tcctctgact ccaggcggcg gcggagtcgc 21180
ttctttgggg gcgcgcgcgt cagcggcggc ggagacgggg acggggacgg ggacgggacg 21240
ccctccacag ggggtggtct tcgcgcagac ccgcggccgc gctcgggggt cttctcgagc 21300
tggtcttggt cccgactggc cattgtatcc tcctcctcct aggcagagag acataaggag 21360
tctatcatgc aagtcgagaa ggaggagagc ttaaccaccc cctctgagac cgccgatgcg 21420
cccgccgtcg ccgtcgcccc cgctgccgcc gacgcgcccg ccacaccgag cgacaccccc 21480
gcggaccccc ccgccgacgc acccctgttc gaggaagcgg ccgtggagca ggacccgggc 21540
tttgtctcgg cagaggagga tttgcgagag gaggaggata aggagaagaa gccctcagtg 21600
ccaaaagatg ataaagagca agacgagcac gacgcagatg cacaccaggg tgaagtcggg 21660
cggggggacg gagggcatga cggcgccgac tacctagacg aagggaacga cgtgctcttg 21720
aagcacctgc atcgtcagtg cgccattgtt tgcgacgctc tgcaggagcg cagcgaagtg 21780
cccctcagcg tggcggaggt cagccacgcc tacgagctca gcctcttctc cccccgggtg 21840
cccccccgcc gccgcgaaaa cggcacatgc gagcccaacc cgcgcctcaa cttctacccc 21900
gcctttgtgg tacccgaggt cctggccacc tatcacatct tctttcaaaa ttgcaagatc 21960
cccctctcgt gccgcgccaa ccgtagccgc gccgataaga tgctggccct gcgccagggc 22020
gaccacatac ctgatatcgc cgctttggaa gatgtaccaa agatcttcga gggtctgggt 22080
cgcaacgaga agcgggcagc aaactctctg caacaggaaa acagcgaaaa tgagagtcac 22140
accggggtac tggtggagct cgagggcgac aacgcccgcc tggcggtggt caagcgcagc 22200
atcgaggtca cccactttgc ctaccccgcg ctaaacctgc cccccaaagt catgaacgcg 22260
gccatggacg ggctgatcat gcgccgcggc cggcccctcg ctccagatgc aaacttgcat 22320
gaggagaccg aggacggcca gcccgtggtc agcgacgagc agctggcgcg ctggctggag 22380
accgcggacc ccgccgaact ggaggagcgg cgcaagatga tgatggccgt ggtgctggtc 22440
accgtagagc tggagtgtct gcagcgcttc ttcggcgacc ccgagatgca gagaaaggtc 22500
gaggagaccc tgcactacac cttccgccag ggctacgtgc gccaggcttg caagatctcc 22560
aacgtggagc tcagcaacct ggtgtcctac ctgggcatct tgcatgagaa ccgcctcggg 22620
cagagcgtgc tgcactccac cctgcgcggg gaggcgcgcc gcgactacgt gcgcgactgc 22680
gtttacctct tcctctgcta cacctggcag acggccatgg gggtctggca gcagtgcctg 22740
gaggagcgca acctcaagga gctggagaag ctcctgcagc gcgcgctcaa agatctctgg 22800
acgggctaca acgagcgctc ggtggccgcc gcgctggccg acctcatctt ccccgagcgc 22860
ctgctcaaaa ccctccagca ggggctgccc gacttcacca gccaaagcat gttgcaaaac 22920
ttcaggaact ttatcctgga gcgttctggc atcctacccg ccacctgctg cgccctgccc 22980
agcgactttg tccccctcgt gtaccgcgag tgccccccgc cgctgtgggg tcactgctac 23040
ctgttccaac tggccaacta cctgtcctac cacgcggacc tcatggagga ctccagcggc 23100
gaggggctca tggagtgcca ctgccgctgc aacctctgca cgccccaccg ctccctggtc 23160
tgcaacaccc aactgctcag cgagagtcag attatcggta ccttcgagct acagggtccg 23220
tcctcctcag acgagaagtc cgcggctccg gggctaaaac tcactccggg gctgtggact 23280
tccgcctacc tgcgcaaatt tgtacctgaa gactaccacg cccacgagat caggttttac 23340
gaagaccaat cccgcccgcc caaggcggag ctgaccgcct gcgtcatcac ccagggcgag 23400
atcctaggcc aattgcaagc catccaaaaa gcccgccaag actttttgct gaagaagggt 23460
cggggggtgt atctggaccc ccagtcgggt gaggagctca acccggttcc cccgctgccg 23520
ccgccgcggg accttgcttc ccaggataag catcgccatg gctcccagaa agaagcagca 23580
gcggccgcca ctgccgccac cccacatgct ggaggaagag gaggaatact gggacagtca 23640
ggcagaggag gtttcggacg aggaggagcc ggagacggag atggaagagt gggaggagga 23700
cagcttagac gaggaggctt ccgaagccga agaggcagac gcaacaccgt caccctcggc 23760
cgcagccccc tcgcaggcgc ccccgaagtc cgctcccagc atcagcagca acagcagcgc 23820
tataacctcc gctcctccac cgccgcgacc cacggccgac cgcagaccca accgtagatg 23880
ggacaccacc ggaaccgggg ccggtaagtc ctccgggaga ggcaagcaag cgcagcgcca 23940
aggctaccgc tcgtggcgcg ctcacaagaa cgccatagtc gcttgcttgc aagactgcgg 24000
ggggaacatc tccttcgccc gccgcttcct gctcttccac cacggtgtgg ccttcccccg 24060
taacgtcctg cattactacc gtcatctcta cagcccctac tgcggcggca gtgagccaga 24120
gacggtcggc ggcggcggcg gcgcccgttt cggcgcctag gaagacccag ggcaagactt 24180
cagccaagaa actcgcggcg gccgcggcga acgcggtcgc gggggccctg cgcctgacgg 24240
tgaacgaacc cctgtcgacc cgcgaactga ggaaccgaat cttccccact ctctatgcca 24300
tcttccagca gagcagaggg caggatcagg aactgaaagt aaaaaacagg tctctgcgct 24360
ccctcacccg cagctgtctg tatcacaaga gcgaagacca gcttcggcgc acgctggagg 24420
acgctgaggc actcttcagc aaatactgcg cgctcactct taaggactag ctccgcgccc 24480
ttctcgaatt taggcgggaa cgcctacgtc atcgcagcgc cgccgtcatg agcaaggaca 24540
ttcccacgcc atacatgtgg agctatcagc cgcagatggg actcgcggcg ggcgcctccc 24600
aagactactc cacccgcatg aactggctca gtgccggccc acacatgatc tcacaggtta 24660
atgatatccg cacccatcga aaccaaatat tggtggagca ggcggcaatt accaccacgc 24720
cccgcaataa tcccaacccc agggagtggc ccgcgtccct ggtgtatcag gaaattcccg 24780
gccccaccac cgtactactt ccgcgtgatt cccaggccga agtccaaatg actaactcag 24840
gggcacagct cgcgggcggc tgtcgtcaca gggtgcggcc tcctcgccag ggtataactc 24900
acctggagat ccgaggcaga ggtattcagc tcaacgacga gtcggtgagc tcctcgctcg 24960
gtctcagacc tgacgggacc ttccagatag ccggagccgg ccgatcttcc ttcacgcccc 25020
gccaggcgta cctgactctg caaagctcgt cctcggcgcc gcgctcgggc ggcatcggga 25080
ctctccagtt cgtgcaggag tttgtgccct cggtctactt caaccccttc tcgggctctc 25140
ccggtcgcta cccggaccag ttcatctcga actttgacgc cgcgagggac tcggtggacg 25200
gctacgactg aatgtcgggt ggacccggtg cagagcaact tcgcctgaag cacctcgacc 25260
actgccgccg ccctcagtgc tttgcccgct gtcagaccgg tgagttccag tacttttccc 25320
tgcccgactc gcacccggac ggcccggcgc acggggtgcg ctttttcatc ccgagtcagg 25380
tgcgctctac cctaatcagg gagtttaccg cccgtcccct actggcggag ttggaaaagg 25440
ggccttctat cctaaccatt gcctgcatct gctctaaccc tggattgcac caagatcttt 25500
gctgtcattt gtgtgctgag tataataaag gctgagatca gaatctactc gggctcctgt 25560
cgccatcctg tcaacgccac cgtccaagcc cggcccgatc agcccgaggt gaacctcacc 25620
tgcggtctgc accggcgcct gaggaaatac ctagcttggt actacaacag cactcccttt 25680
gtggtttaca acagctttga ccaggacggg gtctcactga gggataacct ctcgaacctg 25740
agctactcca tcaggaagaa cagcaccctc gagctacttc ctccttacct gcccgggact 25800
taccagtgtg tcaccggtcc ctgcacccac acccacctgt tgatcgtaaa cgactctctt 25860
ccgagaacag acctcaataa ctcctcttcg cagttcccca gaacaggagg tgagctcagg 25920
aaaccccggg taaagaaggg tggacgagag ttaacacttg tggggtttct ggtgtatgtg 25980
acgctggtgg tggctctttt gattaaggct tttccttcca tgtctgaact ctccctcttc 26040
ttttatgaac aactcgacta gtgctaacgg gaccctaccc aacgaatcgg gattgaatat 26100
cggtaaccag gttgcagttt cacttttgat taccttcata gtcctcttcc tgctagtgct 26160
gtcgcttctg tgcctgcgga tcgggggctg ctgcatccac gtttatatct ggtgctggct 26220
gtttagaagg ttcggagacc atcgcaggta gaataaacat gctgctgctt accctctttg 26280
tcctggcgct ggccgccagc tgccaagcct tttccgaggc tgactttata gagccccagt 26340
gtaatgtgac ttttaaagcc catgcacagc gttgtcatac tataatcaaa tgtgccaccg 26400
aacacgatga ataccttatc cagtataaag ataaatcaca caaagtggca cttgttgaca 26460
tctggaaacc cgaagaccct ttggaataca atgtgaccgt tttccagggt gacctcttca 26520
aaatttacaa ttacactttc ccatttgacc agatgtgtga ctttgtcatg tacatggaaa 26580
agcagcacaa gctgtggcct ccgactcccc agggctgtgt ggaaaatcca ggctctttct 26640
gcatgatctc tctctgtgta actgtgctgg cactaatact cacgcttttg tatatcagat 26700
ttaaatcaag gcaaagcttc attgatgaaa agaaaatgcc ttaatcgctt tcacgcttga 26760
ttgctaacac cgggttttta tccgcagaat gattggaatc accctactaa tcacctccct 26820
ccttgcgatt gcccatgggt tggaacgaat cgaagtccct gtgggggcca atgttaccct 26880
ggtggggcct gtcggcaatg ctacattaat gtgggaaaaa tatactaaaa atcaatgggt 26940
ctcttactgc actaacaaaa atagccacaa gcccagagcc atctgcgatg ggcaaaatct 27000
aaccttgatt gatgttcaat tgctggatgc gggctactat tatgggcagc tgggtacaat 27060
gattaattac tggagacccc acagagatta catgctccac gtagtaaagg gtccccttag 27120
cagcccaccc actaccacct ctactacccc cactaccacc actactccca ccaccagcac 27180
tgccgcccag cctcctcata gcagaacaac cacttttatc aattccaagt cccactcccc 27240
ccacattgcc ggcgggccct ccgcctcaga ctccgaaacc accgagatct gcttctgcaa 27300
atgctctgac gccattgccc aggatttgga agatcacgag gaagatgagc atgacttcgc 27360
agatgcatgc caggcatcag agccagaagc gctgccggtg gccctcaaac agtatgcaga 27420
cccccacacc acccccgacc ttcctccacc ttcccagaag ccaagtttcc tgggggaaaa 27480
tgaaactctg cctctctcca tactcgctct gacatctgtt gctatgttga ccgctctgct 27540
ggtgcttcta tgctctatat gctacctgat ctgctgcaga aagaaaaaat ctcacggcca 27600
tgctcaccag cccctcatgc acttccctta ccctccagag ctgggcgacc acaaacttta 27660
agtctgcagt aactatctgc ccatcccttg tcagtcgaca gcgatgagcc ccactaatct 27720
aacggcctct ggacttacaa catcgtctct taatgagacc accgctcctc aagacctgta 27780
cgatggtgtc tccgcgctgg ttaaccagtg ggatcacctg ggcatatggt ggctcctcat 27840
aggagcagtg accctgtgcc taatcctggt ctggatcatc tgctgcatca aaagcagaag 27900
acccaggcgg cggcccatct acaggccctt tgtcatcaca cctgaagatg atgatgacac 27960
cacttccagg ctgcagaggc taaagcagct actcttctct tttacagcat ggtaaattga 28020
atcatgcctc gcattttcat ctacttgtct ctccttccac tttttctggg ctcttctaca 28080
ttggccgctg tgtcccacat cgaggtagac tgcctcacgc ccttcacagt ctacctgctt 28140
ttcggctttg tcatctgcac ctttgtctgc agcgttatca ctgtagtgat ctgcttcata 28200
cagtgcatcg actacgtctg cgtgcgggtg gcttacttta gacaccaccc ccagtatcgc 28260
aacagggaca tagcggctct cctaagactt gtttaaaatc atggccaaat taactgtgat 28320
tggtcttctg atcatctgct gcgtcctagc cgcgattggg actcaagctc ctaccaccac 28380
cagcgctccc agaaagagac atgtatcctg cagcttcaag cgtccctgga atatacccca 28440
atgctttact gatgaacctg aaatctcttt ggcttggtac ttcagcgtca ccgcccttct 28500
tatcttctgc agtacggtta ttgcccttgc catctaccct tcccttgacc tgggctggaa 28560
tgctgtcaac tctatggaat atcccacctt cccagaacca gacctgccag acctggttgt 28620
tctaaacgcg tttcctcctc ctgctcccgt tcaaaatcag tttcgccctc cgtcccccac 28680
gcccactgag gtcagctact ttaatctaac aggcggagat gactgaaaac ctagacctag 28740
aaatggacgg tctctgcagc gagcaacgca cactagagag gcgccggcaa aaagagctcg 28800
agcgtcttaa acaagagctc caagacgcgg tggccataca ccagtgcaaa aaaggtgtct 28860
tctgtctggt aaaacaggcc acgctcacct atgaaaaaac aggtgacacc caccgcctag 28920
gatacaagct gcccacacag cgccaaaagt tcgccctcat gataggcgaa caacccatca 28980
ccgtgaccca gcactccgtg gagacagaag gctgcataca tgctccctgt aggggcgctg 29040
actgcctcta caccttgatc aaaaccctct gcggtctcag agaccttatc cctttcaatt 29100
aatcataact gtaatcaata aaaaatcact tacttgaaat ctgatagcaa gcctctgtcc 29160
aattttttca gcaacacttc cttcccctcc tcccaactct ggtactctag gcgcctccta 29220
gctgcaaact tcctccacag tctgaaggga atgtcagatt cctcctcctg tccctccgca 29280
cccacgatct tcatgttgtt gcagatgaaa cgcgcgagat cgtctgacga gaccttcaac 29340
cccgtgtacc cctacgatac cgagatcgct ccgacttctg tccctttcct tacccctccc 29400
tttgtgtcat ccgcaggaat gcaagaaaat ccagctgggg tgctgtccct gcacttgtca 29460
gagcccctta ccacccacaa tggggccctg actctaaaaa tggggggcgg cctgaccctg 29520
gacaaggaag ggaatctcac ttcccaaaac atcaccagtg tcgatccccc tctcaaaaaa 29580
agcaagaaca acatcagcct tcagaccgcc gcacccctcg ccgtcagctc cggggcccta 29640
acactttttg ccactccccc cctagcggtc agtggtgaca accttactgt gcagtctcag 29700
gcccctctca ctttggaaga ctcaaaacta actctggcca ccaaaggacc cctaactgtg 29760
tccgaaggca aacttgtcct agaaacagag gctcccctgc atgcaagtga cagcagcagc 29820
ctgggcctta gcgttacggc cccacttagc attaacaatg acagcctagg actagatctg 29880
caggcaccca ttgtctctca aaatggaaaa ctggctctaa atgtagcagg ccccctagct 29940
gtggccaatg gcattaatgc tttgacagta ggcacaggca aaggtattgg tctaaatgaa 30000
accagcactc acttgcaagc aaagttggtc gcccccctag gctttgatac caatggcaac 30060
attaagctaa gcgttgcagg aggcatgaga ctaaataatg acacacttat actagatgta 30120
aactacccat ttgaagctca aggccaacta agtctaagag tgggccaggg tccgctgtat 30180
gtagattcta gcagccataa cctgaccatt agatgcctta gaggattata cataacatcg 30240
tctaataacc aaaccggtct agaggccaac ataaaactaa caaaaggcct tgtctatgat 30300
ggaaatgcca tagcagtcaa tgttggtcaa ggattgcaat acagcactac tgccacatcg 30360
gaaggtgtgt atcctataca gtctaagata ggtttgggaa tggaatatga taccaacgga 30420
gccatgatga caaaactagg ctctggacta agctttgaca attcaggagc cattgtagtg 30480
ggaaacaaaa atgatgacag gcttactctg tggactacac cagacccatc tcctaactgt 30540
agaatttatt ctgaaaaaga tactaaacta accttggtgc tgactaagtg tggcagccaa 30600
atcctaggca cagtatctgc ccttgctgtc agaggcagcc ttgcgcccat cactaatgca 30660
tccagcatag tccaaatatt tctaagattt gatgaaaatg gactattgat gagcaactca 30720
tcgctagacg gtgattactg gaattacaga aatggggact ccactaatag cacaccatat 30780
acaaatgcag taggctttat gcctaatcta gcagcctatc ctaaaggtca ggctacagct 30840
gcaaaaagca gtattgtaag ccaggtatac atggatggtg acactactaa acctataaca 30900
ctaaaaataa acttcaatgg cattgatgaa acaacagaaa atacccctgt tagtaaatat 30960
tccatgacat tctcatggag ctggcccacc gcaagctaca taggccacac ttttgcaaca 31020
aactctttta ctttctccta catcgcccaa gaataaagaa agcacagaga tgcttgtttt 31080
gatttcaaaa ttgtgtgctt ttatttattt tcagcttaca gtatttccag tagtcattcg 31140
aataaagctt aatcaaactg catgagaacc cttccacata gcttaaatta gcaccagtgc 31200
aaatggagaa aagcctcgag gtcgttgcgc ggccgggatc ggtgatcacc gatccagaca 31260
tgataagata cattgatgag tttggacaaa ccacaactag aatgcagtga aaaaaatgct 31320
ttatttgtga aatttgtgat gctattgctt tatttgtaac cattataagc tgcaataaac 31380
aagttcccgg atcgcgatcc ggcccgaggc tgtagccgac gatggtgcgc caggagagtt 31440
gttgattcat tgtttgcctc cctgctgcgg tttttcaccg aagttcatgc cagtccagcg 31500
tttttgcagc agaaaagccg ccgacttcgg tttgcggtcg cgagtgaaga tccctttctt 31560
gttaccgcca acgcgcaata tgccttgcga ggtcgcaaaa tcggcgaaat tccatacctg 31620
ttcaccgacg acggcgctga cgcgatcaaa gacgcggtga tacatatcca gccatgcaca 31680
ctgatactct tcactccaca tgtcggtgta cattgagtgc agcccggcta acgtatccac 31740
gccgtattcg gtgatgataa tcggctgatg cagtttctcc tgccaggcca gaagttcttt 31800
ttccagtacc ttctctgccg tttccaaatc gccgctttgg acataccatc cgtaataacg 31860
gttcaggcac agcacatcaa agagatcgct gatggtatcg gtgtgagcgt cgcagaacat 31920
tacattgacg caggtgatcg gacgcgtcgg gtcgagttta cgcgttgctt ccgccagtgg 31980
cgcgaaatat tcccgtgcac cttgcggacg ggtatccggt tcgttggcaa tactccacat 32040
caccacgctt gggtggtttt tgtcacgcgc tatcagctct ttaatcgcct gtaagtgcgc 32100
ttgctgagtt tccccgttga ctgcctcttc gctgtacagt tctttcggct tgttgcccgc 32160
ttcgaaacca atgcctaaag agaggttaaa gccgacagca gcagtttcat caatcaccac 32220
gatgccatgt tcatctgccc agtcgagcat ctcttcagcg taagggtaat gcgaggtacg 32280
gtaggagttg gccccaatcc agtccattaa tgcgtggtcg tgcaccatca gcacgttatc 32340
gaatcctttg ccacgcaagt ccgcatcttc atgacgacca aagccagtaa agtagaacgg 32400
tttgtggtta atcaggaact gttcgccctt cactgccact gaccggatgc cgacgcgaag 32460
cgggtagata tcacactctg tctggctttt ggctgtgacg cacagttcat agagataacc 32520
ttcacccggt tgccagaggt gcggattcac cacttgcaaa gtcccgctag tgccttgtcc 32580
agttgcaacc acctgttgat ccgcatcacg cagttcaacg ctgacatcac cattggccac 32640
cacctgccag tcaacagacg cgtggttaca gtcttgcgcg acatgcgtca ccacggtgat 32700
atcgtccacc caggtgttcg gcgtggtgta gagcattac 32739
<210> 26
<211> 114
<212> DNA
<213> Artificial Sequence
<220>
<223> IL-2 core promoter
<400> 26
acattttgac acccccataa tatttttcca gaattaacag tataaattgc atctcttgtt 60
caagagttcc ctatcactct ctttaatcac tactcacagt aacctcaact cctg 114
<210> 27
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> IL-2 minimal promoter
<400> 27
tcaagagttc cctatcactc tctttaatca ctactcacag taacctcaac tcctg 55
<210> 28
<211> 380
<212> DNA
<213> Artificial Sequence
<220>
<223> IL-2 enhancer and promoter variant
<400> 28
tgatatcttt tctgagttac ttttgtatcc ccaccccctt aaagaaagga ggaaaaactg 60
tttcatacag aaggcgttaa ttgcatgaat tagagctatc acctaagtgt gggctaatgt 120
aacaaagagg gatttcacct acatccattc agtcagtctt tgggggttta aagaaattcc 180
aaagagtcat cagaagagga aaaatgaagg taatgttttt tcagactggt aaagtctttg 240
aaaatatgtg taatatgtaa aacattttga cacccccata atatttttcc agaattaaca 300
gtataaattg catctcttgt tcaagagttc cctatcactc tctttaatca ctactcacag 360
taacctcaac tcctgccaca 380
<210> 29
<211> 373
<212> DNA
<213> Artificial Sequence
<220>
<223> L-2 enhancer and promoter variant
<400> 29
ttttctgagt tacttttgta tccccacccc cttaaagaaa ggaggaaaaa ctgtttcata 60
cagaaggcgt taattgcatg aattagagct atcacctaag tgtgggctaa tgtaacaaag 120
agggatttca cctacatcca ttcagtcagt ctttgggggt ttaaagaaat tccaaagagt 180
catcagaaga ggaaaaatga aggtaatgtt ttttcagact ggtaaagtct ttgaaaatat 240
gtgtaatatg taaaacattt tgacaccccc ataatatttt tccagaatta acagtataaa 300
ttgcatctct tgttcaagag ttccctatca ctctctttaa tcactactca cagtaacctc 360
aactcctgcc aca 373
<210> 30
<211> 161
<212> DNA
<213> Artificial Sequence
<220>
<223> (NF-KB)1-IL2 promoter variant
<400> 30
aattggtccc atcgaagagg gatttcacct acataattgg tcccgggaca ttttgacacc 60
cccataatat ttttccagaa ttaacagtat aaattgcatc tcttgttcaa gagttcccta 120
tcactctctt taatcactac tcacagtaac ctcaactcct g 161
<210> 31
<211> 201
<212> DNA
<213> Artificial Sequence
<220>
<223> (NF-KB)3-IL2 promoter variant
<400> 31
aattggtccc atcgaagagg gatttcacct acataagagg gatttcacct acataagagg 60
gatttcacct acataattgg tcccgggaca ttttgacacc cccataatat ttttccagaa 120
ttaacagtat aaattgcatc tcttgttcaa gagttcccta tcactctctt taatcactac 180
tcacagtaac ctcaactcct g 201
<210> 32
<211> 268
<212> DNA
<213> Artificial Sequence
<220>
<223> (NF-kB)6-IL2 promoter variant
<400> 32
aattggtccc atcgaagagg gatttcacct acataagagg gatttcacct acataagagg 60
gatttcacct acataattgg taagagggat ttcacctaca taagagggat ttcacctaca 120
taagagggat ttcacctaca taattggtcc cgggacattt tgacaccccc ataatatttt 180
tccagaatta acagtataaa ttgcatctct tgttcaagag ttccctatca ctctctttaa 240
tcactactca cagtaacctc aactcctg 268
<210> 33
<211> 177
<212> DNA
<213> Artificial Sequence
<220>
<223> 1X NFAT response elements-IL2 promoter variant
<400> 33
aattggtccc atcgaattag gaggaaaaac tgtttcatac agaaggcgtc aattggtccc 60
gggacatttt gacaccccca taatattttt ccagaattaa cagtataaat tgcatctctt 120
gttcaagagt tccctatcac tctctttaat cactactcac agtaacctca actcctg 177
<210> 34
<211> 256
<212> DNA
<213> Artificial Sequence
<220>
<223> 3X NFAT response elements-IL2 promoter variant
<400> 34
tgatatcaat tggtcccatc gaattaggag gaaaaactgt ttcatacaga aggcgtcaat 60
taggaggaaa aactgtttca tacagaaggc gtcaattagg aggaaaaact gtttcataca 120
gaaggcgtca attggtcccg ggacattttg acacccccat aatatttttc cagaattaac 180
agtataaatt gcatctcttg ttcaagagtt ccctatcact ctctttaatc actactcaca 240
gtaacctcaa ctcctg 256
<210> 35
<211> 249
<212> DNA
<213> Artificial Sequence
<220>
<223> 3X NFAT response elements-IL2 promoter variant
<400> 35
aattggtccc atcgaattag gaggaaaaac tgtttcatac agaaggcgtc aattaggagg 60
aaaaactgtt tcatacagaa ggcgtcaatt aggaggaaaa actgtttcat acagaaggcg 120
tcaattggtc ccgggacatt ttgacacccc cataatattt ttccagaatt aacagtataa 180
attgcatctc ttgttcaaga gttccctatc actctcttta atcactactc acagtaacct 240
caactcctg 249
<210> 36
<211> 358
<212> DNA
<213> Artificial Sequence
<220>
<223> 6X NFAT response elements-IL2 promoter variant
<400> 36
gaattaggag gaaaaactgt ttcatacaga aggcgtcaat taggaggaaa aactgtttca 60
tacagaaggc gtcaattagg aggaaaaact gtttcataca gaaggcgtca attggtccca 120
tcgaattagg aggaaaaact gtttcataca gaaggcgtca attaggagga aaaactgttt 180
catacagaag gcgtcaatta ggaggaaaaa ctgtttcata cagaaggcgt caattggtcc 240
cgggacattt tgacaccccc ataatatttt tccagaatta acagtataaa ttgcatctct 300
tgttcaagag ttccctatca ctctccttaa tcactactca cagtaacctc aactcctg 358
<210> 37
<211> 374
<212> DNA
<213> Artificial Sequence
<220>
<223> 6X NFAT response elements-IL2 promoter variant
<400> 37
tgatatcgaa ttaggaggaa aaactgtttc atacagaagg cgtcaattag gaggaaaaac 60
tgtttcatac agaaggcgtc aattaggagg aaaaactgtt tcatacagaa ggcgtcaatt 120
ggtcccatcg aattaggagg aaaaactgtt tcatacagaa ggcgtcaatt aggaggaaaa 180
actgtttcat acagaaggcg tcaattagga ggaaaaactg tttcatacag aaggcgtcaa 240
ttggtcccgg gacattttga cacccccata atatttttcc agaattaaca gtataaattg 300
catctcttgt tcaagagttc cctatcactc tctttaatca ctactcacag taacctcaac 360
tcctgaattc catg 374
<210> 38
<211> 358
<212> DNA
<213> Artificial Sequence
<220>
<223> 6X NFAT response elements-IL2 promoter variant
<400> 38
gaattaggag gaaaaactgt ttcatacaga aggcgtcaat taggaggaaa aactgtttca 60
tacagaaggc gtcaattagg aggaaaaact gtttcataca gaaggcgtca attggtccca 120
tcgaattagg aggaaaaact gtttcataca gaaggcgtca attaggagga aaaactgttt 180
catacagaag gcgtcaatta ggaggaaaaa ctgtttcata cagaaggcgt caattggtcc 240
cgggacattt tgacaccccc ataatatttt tccagaatta acagtataaa ttgcatctct 300
tgttcaagag ttccctatca ctctctttaa tcactactca cagtaacctc aactcctg 358
<210> 39
<211> 365
<212> DNA
<213> Artificial Sequence
<220>
<223> 6X NFAT response elements-IL2 promoter variant
<400> 39
tgatatcgaa ttaggaggaa aaactgtttc atacagaagg cgtcaattag gaggaaaaac 60
tgtttcatac agaaggcgtc aattaggagg aaaaactgtt tcatacagaa ggcgtcaatt 120
ggtcccatcg aattaggagg aaaaactgtt tcatacagaa ggcgtcaatt aggaggaaaa 180
actgtttcat acagaaggcg tcaattagga ggaaaaactg tttcatacag aaggcgtcaa 240
ttggtcccgg gacattttga cacccccata atatttttcc agaattaaca gtataaattg 300
catctcttgt tcaagagttc cctatcactc tctttaatca ctactcacag taacctcaac 360
tcctg 365
<210> 40
<211> 244
<212> DNA
<213> Artificial Sequence
<220>
<223> human EEF1A1 promoter variant
<400> 40
gagcgtgcgt gaggctccgg tgcccgtcag tgggcagagc gcacatcgcc cacagtcccc 60
gagaagttgg ggggaggggg tcggcgattg aaccggtgcc tagagaaggt ggcgcggggt 120
aaactgggaa agtgatgtcg tgtactggct ccgccttttt cccgagggtg ggggagaacc 180
gtatataagt gcagtagtcg ccgtgaacgt tctttttcgc aacgggtttg ccgccagaac 240
acag 244
<210> 41
<211> 236
<212> DNA
<213> Artificial Sequence
<220>
<223> human EEF1A1 promoter variant
<400> 41
gcgtgaggct ccggtgcccg tcagtgggca gagcgcacat cgcccacagt ccccgagaag 60
ttggggggag gggtcggcaa ttgaaccggt gcctagagaa ggtggcgcgg ggtaaactgg 120
gaaagtgatg tcgtgtactg gctccgcctt tttcccgagg gtgggggaga accgtatata 180
agtgcagtag tcgccgtgaa cgttcttttt cgcaacgggt ttgccgccag aacaca 236
<210> 42
<211> 1266
<212> DNA
<213> Artificial Sequence
<220>
<223> human EEF1A1 promoter and enhancer
<400> 42
gagctttgca aagatggata aagttttaaa cagagaggaa tctttgcagc taatggacct 60
tctaggtctt gaaaggagtg ggaattggct ccggtgcccg tcagtgggca gagcgcacat 120
cgcccacagt ccccgagaag ttggggggag gggtcggcaa ttgaaccggt gcctagagaa 180
ggtggcgcgg ggtaaactgg gaaagtgatg tcgtgtactg gctccgcctt tttcccgagg 240
gtgggggaga accgtatata agtgcagtag tcgccgtgaa cgttcttttt cgcaacgggt 300
ttgccgccag aacacaggta agtgccgtgt gtggttcccg cgggcctggc ctctttacgg 360
gttatggccc ttgcgtgcct tgaattactt ccacctggct gcagtacgtg attcttgatc 420
ccgagcttcg ggttggaagt gggtgggaga gttcgaggcc ttgcgcttaa ggagcccctt 480
cgcctcgtgc ttgagttgag gcctggcctg ggcgctgggg ccgccgcgtg cgaatctggt 540
ggcaccttcg cgcctgtctc gctgctttcg ataagtctct agccatttaa aatttttgat 600
gacctgctgc gacgcttttt ttctggcaag atagtcttgt aaatgcgggc caagatctgc 660
acactggtat ttcggttttt ggggccgcgg gcggcgacgg ggcccgtgcg tcccagcgca 720
catgttcggc gaggcggggc ctgcgagcgc ggccaccgag aatcggacgg gggtagtctc 780
aagctggccg gcctgctctg gtgcctggcc tcgcgccgcc gtgtatcgcc ccgccctggg 840
cggcaaggct ggcccggtcg gcaccagttg cgtgagcgga aagatggccg cttcccggcc 900
ctgctgcagg gagctcaaaa tggaggacgc ggcgctcggg agagcgggcg ggtgagtcac 960
ccacacaaag gaaaagggcc tttccgtcct cagccgtcgc ttcatgtgac tccacggagt 1020
accgggcgcc gtccaggcac ctcgattagt tctcgagctt ttggagtacg tcgtctttag 1080
gttgggggga ggggttttat gcgatggagt ttccccacac tgagtgggtg gagactgaag 1140
ttaggccagc ttggcacttg atgtaattct ccttggaatt tgcccttttt gagtttggat 1200
cttggttcat tctcaagcct cagacagtgg ttcaaagttt ttttcttcca tttcaggtgt 1260
cgtgag 1266
<210> 43
<211> 571
<212> DNA
<213> Artificial Sequence
<220>
<223> human UBC promoter
<400> 43
ggcctccgcg ccgggttttg gcgcctcccg cgggcgcccc cctcctcacg gcgagcgctg 60
ccacgtcaga cgaagggcgc agcgagcgtc ctgatccttc cgcccggacg ctcaggacag 120
cggcccgctg ctcataagac tcggccttag aaccccagta tcagcagaag gacattttag 180
gacgggactt gggtgactct agggcactgg ttttctttcc agagagcgga acaggcgagg 240
aaaagtagtc ccttctcggc gattctgcgg agggatctcc gtggggcggt gaacgccgat 300
gattatataa ggacgcgccg ggtgtggcac agctagttcc gtcgcagccg ggatttgggt 360
cgcggttctt gtttgtggat cgctgtgatc gtcacttggt gagtagcggg ctgctgggct 420
gggtacgtgc gctcggggtt ggcgagtgtg ttttgtgaag ttttttaggc accttttgaa 480
atgtaatcat ttgggtcaat atgtaatttt cagtgttaga ctagtaaatt gtccgctaaa 540
ttctggccgt ttttggcttt tttgttagac g 571
<210> 44
<211> 81
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic minimal promoter 1
<400> 44
aggtctatat aagcagagct cgtttagtga accctcattc tggagacgga tcccgagccg 60
agtgttttga cctccataga a 81
<210> 45
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> HBV Peptides from Core 1
<400> 45
Phe Leu Pro Ser Asp Phe Phe Pro Ser Val
1 5 10
<210> 46
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> HBV Peptides from Core 2
<400> 46
Cys Trp Gly Glu Leu Met Thr Leu
1 5
<210> 47
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> HBV Peptides from Core 3
<400> 47
Gly Val Trp Ile Arg Thr Pro Pro Ala
1 5
<210> 48
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> HBV Peptides from Core 4
<400> 48
Ser Thr Leu Pro Glu Thr Thr Val Val Arg Arg
1 5 10
<210> 49
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> HBV Peptides from Core 5
<400> 49
Leu Thr Phe Gly Arg Glu Thr Val Leu Glu Tyr
1 5 10
<210> 50
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> HBV Peptides from Core 6
<400> 50
Asp Leu Leu Asp Thr Ala Ser Ala Leu Tyr
1 5 10
<210> 51
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> HBV Peptides from Core 7
<400> 51
Leu Trp Phe His Ile Ser Cys Leu Thr Phe
1 5 10
<210> 52
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> HBV Peptides from Core 8
<400> 52
Glu Tyr Leu Val Ser Phe Gly Val Trp
1 5
<210> 53
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> HBV Peptides from Polymerase 1
<400> 53
Phe Leu Lys Gln Gln Tyr Met Asn Leu
1 5
<210> 54
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> HBV Peptides from Polymerase 2
<400> 54
Phe Leu Ser Lys Gln Tyr Met Asp Leu
1 5
<210> 55
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> HBV Peptides from Polymerase 3
<400> 55
Thr Val Ser Thr Lys Leu Cys Lys Ile
1 5
<210> 56
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> HBV Peptides from Polymerase 4
<400> 56
Gly Leu Ser Arg Tyr Val Ala Arg Leu
1 5
<210> 57
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> HBV Peptides from Polymerase 5
<400> 57
Lys Leu His Leu Tyr Ser His Pro Ile
1 5
<210> 58
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> HBV Peptides from Polymerase 6
<400> 58
Phe Leu Leu Ser Leu Gly Ile His Leu
1 5
<210> 59
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> HBV Peptides from Polymerase 7
<400> 59
Ser Leu Tyr Ala Asp Ser Pro Ser Val
1 5
<210> 60
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> HBV Peptides from Polymerase 8
<400> 60
Ala Leu Met Pro Leu Tyr Ala Cys Ile
1 5
<210> 61
<211> 10410
<212> DNA
<213> Artificial Sequence
<220>
<223> GCAd-RTS-IL12 design 1
<400> 61
ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 60
aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt 120
ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca 180
gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag 240
ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc 300
ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac actattctca 360
gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt 420
aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct 480
gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg gggatcatgt 540
aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga 600
caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact 660
tactctagct tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc 720
acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga 780
gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt 840
agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac agatcgctga 900
gataggtgcc tcactgatta agcattggta actgtcagac caagtttact catatatact 960
ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga tcctttttga 1020
taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt cagaccccgt 1080
agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct gctgcttgca 1140
aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc taccaactct 1200
ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgttc ttctagtgta 1260
gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc tcgctctgct 1320
aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg ggttggactc 1380
aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt cgtgcacaca 1440
gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg agctatgaga 1500
aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg 1560
aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt atagtcctgt 1620
cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag gggggcggag 1680
cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt 1740
tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt 1800
tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt cagtgagcga 1860
ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc cgattcatta 1920
atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca acgcaattaa 1980
tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc cggctcgtat 2040
gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg accatgatta 2100
cgccaagctg ggtcaagtct tccagtttaa gcagcagagc ggtcagtttc tcatcccgag 2160
cagacgcgcg agaggccgcg ccgctcgcca ccaaagagct gtaaaggtcc gtagccatgc 2220
tgcgcgcggt cgcggcggcg gcggaggcgg cggcggaggt cgcggcgtcc agcggagttc 2280
ctcccacggt cgcgtaggcc attgtagacg aatttgaagg cagaacgggg cgtccatcca 2340
cgttggaacc catcacattc tgacgcactc cagcccagtg aggcatgcgc actgtcagat 2400
aggggctaaa gatgcttcca tcaaagctgt tgccggtgtc gctcatggcg gcggctgttg 2460
caagacaaaa cagagagacc cttagacccc caatttatac acgccccacc cttctagcca 2520
cgcccacctt acccacctca atcggtatcc tcatcgctag acccaaactc ggccctggtg 2580
caggccagca ccagatggtc aggcctgcag gccgcaataa aatatcttta ttttcattac 2640
atctgtgtgt tggttttttg tgtgaatcga tagtactaac atacgctctc catcaaaaca 2700
aaacgaaaca aaacaaacta gcaaaatagg ctgtccccag tgcaagtgca ggtgccagaa 2760
catttctcta tcgataatgc aggtcggagt actgtcctcc gagcggagta ctgtcctccg 2820
agcggagtac tgtcctccga gcggagtact gtcctccgag cggagtactg tcctccgagc 2880
ggagtactgt cctccgagcg gagactcttc gaaggaagag gggcggggtc gatcgacccc 2940
gcccctcttc cttcgaagga agaggggcgg ggtcgaagac ctagagggta tataatgggt 3000
gccttagctg gtgtgtgagc tcatcttcct gtagatcacg cgtgccacca tgggtcacca 3060
gcagttggtc atctcttggt tttccctggt ttttctggca tctcccctcg tggccatatg 3120
ggaactgaag aaagatgttt atgtcgtaga attggattgg tatccggatg cccctggaga 3180
aatggtggtc ctcacctgtg acacccctga agaagatggt atcacctgga ccttggacca 3240
gagcagtgag gtcttaggct ctggcaaaac cctgaccatc caagtcaaag agtttggaga 3300
tgctggccag tacacctgtc acaaaggagg cgaggttcta agccattcgc tcctgctgct 3360
tcacaaaaag gaagatggaa tttggtccac tgatatttta aaggaccaga aagaacccaa 3420
aaataagacc tttctaagat gcgaggccaa gaattattct ggacgtttca cctgctggtg 3480
gctgacgaca atcagtactg atttgacatt cagtgtcaaa agcagcagag gctcttctga 3540
cccccaaggg gtgacgtgcg gagctgctac actctctgca gagagagtca gaggggacaa 3600
caaggagtat gagtactcag tggagtgcca ggaggacagt gcctgcccag ctgctgagga 3660
gagtctgccc attgaggtca tggtggatgc cgttcacaag ctcaagtatg aaaactacac 3720
cagcagcttc ttcatcaggg acatcatcaa acctgaccca cccaagaact tgcagctgaa 3780
gccattaaag aattctcggc aggtggaggt cagctgggag taccctgaca cctggagtac 3840
tccacattcc tacttctccc tgacattctg cgttcaggtc cagggcaaga gcaagagaga 3900
aaagaaagat agagtcttca cggacaagac ctcagccacg gtcatctgcc gcaaaaatgc 3960
cagcattagc gtgcgggccc aggaccgcta ctatagctca tcttggagcg aatgggcatc 4020
tgtgccctgc agttaggttg ggcgagctcg aattcattga tcccccgggc tgcaggaatt 4080
cgatatcaag ctcgggatcc gaattccgcc cccccccccc ccccccccct aacgttactg 4140
gccgaagccg cttggaataa ggccggtgtg cgtttgtcta tatgttattt tccaccatat 4200
tgccgtcttt tggcaatgtg agggcccgga aacctggccc tgtcttcttg acgagcattc 4260
ctaggggtct ttcccctctc gccaaaggaa tgcaaggtct gttgaatgtc gtgaaggaag 4320
cagttcctct ggaagcttct tgaagacaaa caacgtctgt agcgaccctt tgcaggcagc 4380
ggaacccccc acctggcgac aggtgcctct gcggccaaaa gccacgtgta taagatacac 4440
ctgcaaaggc ggcacaaccc cagtgccacg ttgtgagttg gatagttgtg gaaagagtca 4500
aatggctctc ctcaagcgta ttcaacaagg ggctgaagga tgcccagaag gtaccccatt 4560
gtatgggatc tgatctgggg cctcggtgca catgctttac atgtgtttag tcgaggttaa 4620
aaaaacgtct aggccccccg aaccacgggg acgtggtttt cctttgaaaa acacgatgat 4680
aatatggcca caaccatggg tccagcgcgc agcctcctcc ttgtggctac cctggtcctc 4740
ctggaccacc tcagtttggc cagaaacctc cccgtggcca ctccagaccc aggaatgttc 4800
ccatgccttc accactccca aaacctgctg agggccgtca gcaacatgct ccagaaggcc 4860
agacaaactc tagaatttta cccttgcact tctgaagaga ttgatcatga agatatcaca 4920
aaagataaaa ccagcacagt ggaggcctgt ttaccattgg aattaaccaa gaatgagagt 4980
tgcctaaatt ccagagagac ctctttcata actaatggga gttgcctggc ctccagaaag 5040
acctctttta tgatggccct gtgccttagt agtatttatg aagacttgaa gatgtaccag 5100
gtggagttca agaccatgaa tgcaaagctt ctgatggatc ctaagaggca gatctttcta 5160
gatcaaaaca tgctggcagt tattgatgag ctgatgcagg ccctgaattt caacagtgag 5220
actgtgccac aaaaatcctc ccttgaagaa ccggattttt ataaaactaa aatcaagctc 5280
tgcatacttc ttcatgcttt cagaattcgg gcagtgacta ttgatagagt gatgagctat 5340
ctgaatgctt cctaacgtac gtcgacatcg agaacttgtt tattgcagct tataatggtt 5400
acaaataaag caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta 5460
gttgtggttt gtccaaactc atcaatgtat cttatcatgt ctgggcgcgc cggcctccgc 5520
gccgggtttt ggcgcctccc gcgggcgccc ccctcctcac ggcgagcgct gccacgtcag 5580
acgaagggcg cagcgagcgt cctgatcctt ccgcccggac gctcaggaca gcggcccgct 5640
gctcataaga ctcggcctta gaaccccagt atcagcagaa ggacatttta ggacgggact 5700
tgggtgactc tagggcactg gttttctttc cagagagcgg aacaggcgag gaaaagtagt 5760
cccttctcgg cgattctgcg gagggatctc cgtggggcgg tgaacgccga tgattatata 5820
aggacgcgcc gggtgtggca cagctagttc cgtcgcagcc gggatttggg tcgcggttct 5880
tgtttgtgga tcgctgtgat cgtcacttgg tgagtagcgg gctgctgggc tgggtacgtg 5940
cgctcggggt tggcgagtgt gttttgtgaa gttttttagg caccttttga aatgtaatca 6000
tttgggtcaa tatgtaattt tcagtgttag actagtaaat tgtccgctaa attctggccg 6060
tttttggctt ttttgttaga cgagctagcg ccgccaccat gggccctaaa aagaagcgta 6120
aagtcgcccc cccgaccgat gtcagcctgg gggacgagct ccacttagac ggcgaggacg 6180
tggcgatggc gcatgccgac gcgctagacg atttcgatct ggacatgttg ggggacgggg 6240
attccccggg tccgggattt accccccacg actccgcccc ctacggcgct ctggatatgg 6300
ccgacttcga gtttgagcag atgtttaccg atgcccttgg aattgacgag tacggtgggg 6360
aattcgagat gcctgtggac aggatcctgg aggcagagct tgctgtggaa cagaagagtg 6420
accagggcgt tgagggtcct gggggaaccg ggggtagcgg cagcagccca aatgaccctg 6480
tgactaacat ctgtcaggca gctgacaaac agctattcac gcttgttgag tgggcgaaga 6540
ggatcccaca cttttcctcc ttgcctctgg atgatcaggt catattgctg cgggcaggct 6600
ggaatgaact cctcattgcc tccttttcac accgatccat tgatgttcga gatggcatcc 6660
tccttgccac aggtcttcac gtgcaccgca actcagccca ttcagcagga gtaggagcca 6720
tctttgatcg ggtgctgaca gagctagtgt ccaaaatgcg tgacatgagg atggacaaga 6780
cagagcttgg ctgcctgagg gcaatcattc tgtttaatcc agaggtgagg ggtttgaaat 6840
ccgcccagga agttgaactt ctacgtgaaa aagtatatgc cgctttggaa gaatatacta 6900
gaacaacaca tcccgatgaa ccaggaagat ttgcaaaact tttgcttcgt ctgccttctt 6960
tacgttccat aggccttaag tgtttggagc atttgttttt ctttcgcctt attggagatg 7020
ttccaattga tacgttcctg atggagatgc ttgaatcacc ttctgattca taatctagcc 7080
tagcccccct ctccctcccc cccccctaac gttactggcc gaagccgctt ggaataaggc 7140
cggtgtgcgt ttgtctatat gttattttcc accatattgc cgtcttttgg caatgtgagg 7200
gcccggaaac ctggccctgt cttcttgacg agcattccta ggggtctttc ccctctcgcc 7260
aaaggaatgc aaggtctgtt gaatgtcgtg aaggaagcag ttcctctgga agcttcttga 7320
agacaaacaa cgtctgtagc gaccctttgc aggcagcgga accccccacc tggcgacagg 7380
tgcctctgcg gccaaaagcc acgtgtataa gatacacctg caaaggcggc acaaccccag 7440
tgccacgttg tgagttggat agttgtggaa agagtcaaat ggctctcctc aagcgtattc 7500
aacaaggggc tgaaggatgc ccagaaggta ccccattgta tgggatctga tctggggcct 7560
cggtgcacat gctttacatg tgtttagtcg aggttaaaaa acgtctaggc cccccgaacc 7620
acggggacgt ggttttcctt tgaaaaacac gatctctagg cgccaccatg aagctactgt 7680
cttctatcga acaagcatgc gatatttgcc gacttaaaaa gctcaagtgc tccaaagaaa 7740
aaccgaagtg cgccaagtgt ctgaagaaca actgggagtg tcgctactct cccaaaacca 7800
aaaggtctcc gctgactagg gcacatctga cagaagtgga atcaaggcta gaaagactgg 7860
aacagctatt tctactgatt tttcctcgag aagaccttga catgattttg aaaatggatt 7920
ctttacagga tataaaagca ttgttaacag gattatttgt acaagataat gtgaataaag 7980
atgccgtcac agatagattg gcttcagtgg agactgatat gcctctaaca ttgagacagc 8040
atagaataag tgcgacatca tcatcggaag agagtagtaa caaaggtcaa agacagttga 8100
ctgtatcgcc ggaattcccg gggatccggc ctgagtgcgt agtacccgag actcagtgcg 8160
ccatgaagcg gaaagagaag aaagcacaga aggagaagga caaactgcct gtcagcacga 8220
cgacggtgga cgaccacatg ccgcccatta tgcagtgtga acctccacct cctgaagcag 8280
caaggattca cgaagtggtc ccaaggtttc tctccgacaa gctgttggtg acaaaccggc 8340
agaaaaacat cccccagttg acagccaacc agcagttcct tatcgccagg ctcatctggt 8400
accaggacgg gtacgagcag ccttctgatg aagatttgaa gaggattacg cagacgtggc 8460
agcaagcgga cgatgaaaac gaagagtcgg acactccctt ccgccagatc acagagatga 8520
ctatcctcac ggtccaactt atcgtggagt tcgcgaaggg attgccaggg ttcgccaaga 8580
tctcgcagcc tgatcaaatt acgctgctta aggcttgctc aagtgaggta atgatgctcc 8640
gagtcgcgcg acgatacgat gcggcctcag acagtattct gttcgcgaac aaccaagcgt 8700
acactcgcga caactaccgc aaggctggca tggccgaggt catcgaggat ctactgcact 8760
tctgccggtg catgtactct atggcgttgg acaacatcca ttacgcgctg ctcacggctg 8820
tcgtcatctt ttctgaccgg ccagggttgg agcagccgca actggtggaa gagatccagc 8880
ggtactacct gaatacgctc cgcatctata tcctgaacca gctgagcggg tcggcgcgtt 8940
cgtccgtcat atacggcaag atcctctcaa tcctctctga gctacgcacg ctcggcatgc 9000
aaaactccaa catgtgcatc tccctcaagc tcaagaacag aaagctgccg cctttcctcg 9060
aggagatctg ggatgtggcg gacatgtcgc acacccaacc gccgcctatc ctcgagtccc 9120
ccacgaatct ctaggcggcc tctagagcgg ccgccaccgc ggggagatcc agacatgata 9180
agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt 9240
tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt 9300
aacaacaaca attgcattca ttttatgttt caggttcagg gggaggtgtg ggaggttttt 9360
taaagcaagt aaaacctcta caaatgtggt atggctgatt atgatcaccg gtcaaatgac 9420
ggtgacaata aaacggagac tttgacccgg aacgcggaaa ttcacgtaaa aaacacctgg 9480
gcgagtcctc cacgtaatcg gtcaaagtcc ctcggccctc ggtaaatatt acgcactatg 9540
actaacgccc tattattcag ttttcacttc cccgtttcac ttttcgcgcg aaaatggcca 9600
aatcttacat ggtcccgccc aaaattacta cgatatccgg tgaaaagcgc gcgaaaattg 9660
gcacttccgg aggtaggcgg cgctcatcaa aaacgtcaca ttttccgcga cggaagcttg 9720
catgtgagct cctcccactt gcaaatgcca cacttccgcc acacctccca accctactcg 9780
cgcgtcctac gtcacccgcc ccgcctctcc ccgcccacct cattatcata ttggccacaa 9840
tccaaaataa ggtatattat tgatgatggt ttaaacgccc aattcactgg ccgtcgtttt 9900
acaacgtcgt gactgggaaa accctggcgt tacccaactt aatcgccttg cagcacatcc 9960
ccctttcgcc agctggcgta atagcgaaga ggcccgcacc gatcgccctt cccaacagtt 10020
gcgcagcctg aatggcgaat ggcgcctgat gcggtatttt ctccttacgc atctgtgcgg 10080
tatttcacac cgcatatggt gcactctcag tacaatctgc tctgatgccg catagttaag 10140
ccagccccga cacccgccaa cacccgctga cgcgccctga cgggcttgtc tgctcccggc 10200
atccgcttac agacaagctg tgaccgtctc cgggagctgc atgtgtcaga ggttttcacc 10260
gtcatcaccg aaacgcgcga gacgaaaggg cctcgtgata cgcctatttt tataggttaa 10320
tgtcatgata ataatggttt cttagacgtc aggtggcact tttcggggaa atgtgcgcgg 10380
aacccctatt tgtttatttt tctaaataca 10410
<210> 62
<211> 10040
<212> DNA
<213> Artificial Sequence
<220>
<223> GCAd-RTS-IL12 design 2
<400> 62
ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 60
aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt 120
ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca 180
gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag 240
ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc 300
ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac actattctca 360
gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt 420
aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct 480
gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg gggatcatgt 540
aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga 600
caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact 660
tactctagct tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc 720
acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga 780
gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt 840
agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac agatcgctga 900
gataggtgcc tcactgatta agcattggta actgtcagac caagtttact catatatact 960
ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga tcctttttga 1020
taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt cagaccccgt 1080
agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct gctgcttgca 1140
aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc taccaactct 1200
ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgttc ttctagtgta 1260
gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc tcgctctgct 1320
aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg ggttggactc 1380
aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt cgtgcacaca 1440
gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg agctatgaga 1500
aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg 1560
aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt atagtcctgt 1620
cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag gggggcggag 1680
cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt 1740
tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt 1800
tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt cagtgagcga 1860
ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc cgattcatta 1920
atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca acgcaattaa 1980
tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc cggctcgtat 2040
gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg accatgatta 2100
cgccaagctg ggtcaagtct tccagtttaa gcagcagagc ggtcagtttc tcatcccgag 2160
cagacgcgcg agaggccgcg ccgctcgcca ccaaagagct gtaaaggtcc gtagccatgc 2220
tgcgcgcggt cgcggcggcg gcggaggcgg cggcggaggt cgcggcgtcc agcggagttc 2280
ctcccacggt cgcgtaggcc attgtagacg aatttgaagg cagaacgggg cgtccatcca 2340
cgttggaacc catcacattc tgacgcactc cagcccagtg aggcatgcgc actgtcagat 2400
aggggctaaa gatgcttcca tcaaagctgt tgccggtgtc gctcatggcg gcggctgttg 2460
caagacaaaa cagagagacc cttagacccc caatttatac acgccccacc cttctagcca 2520
cgcccacctt acccacctca atcggtatcc tcatcgctag acccaaactc ggccctggtg 2580
caggccagca ccagatggtc aggcctgcag gtacgtagcc gcaataaaat atctttattt 2640
tcattacatc tgtgtgttgg ttttttgtgt gaatccatag tactaacata cgctctccat 2700
caaaacaaaa cgaaacaaaa caaactagca aaataggctg tccccagtgc aagtccaggt 2760
gccagaacat ttctctatcc ataatgcagg ggtaccggaa ggaagagggg cggggtcgat 2820
cgaccccgcc cctcttcctt cgaaggaaga ggggcggggt ccaattgcgg agtactgtcc 2880
tccgagcgga gtactgtcct ccgagcggag tactgtcctc cgagcggagt actgtcctcc 2940
gagcggagta ctgtcctccg agcggagtac tgtcctccga gcggagagtc cccggggacc 3000
tagagggtat ataatgggtg ccttagctgg tgtgtgacct catcttcctg tacgcccctg 3060
caggagatca cgcgtgccac catgggtcac cagcagttgg tcatctcttg gttttccctg 3120
gtttttctgg catctcccct cgtggccata tgggaactga agaaagatgt ttatgtcgta 3180
gaattggatt ggtatccgga tgcccctgga gaaatggtgg tcctcacctg tgacacccct 3240
gaagaagatg gtatcacctg gaccttggac cagagcagtg aggtcttagg ctctggcaaa 3300
accctgacca tccaagtcaa agagtttgga gatgctggcc agtacacctg tcacaaagga 3360
ggcgaggttc taagccattc gctcctgctg cttcacaaaa aggaagatgg aatttggtcc 3420
actgatattt taaaggacca gaaagaaccc aaaaataaga cctttctaag atgcgaggcc 3480
aagaattatt ctggacgttt cacctgctgg tggctgacga caatcagtac tgatttgaca 3540
ttcagtgtca aaagcagcag aggctcttct gacccccaag gggtgacgtg cggagctgct 3600
acactctctg cagagagagt cagaggggac aacaaggagt atgagtactc agtggagtgc 3660
caggaggaca gtgcctgccc agctgctgag gagagtctgc ccattgaggt catggtggat 3720
gccgttcaca agctcaagta tgaaaactac accagcagct tcttcatcag ggacatcatc 3780
aaacctgacc cacccaagaa cttgcagctg aagccattaa agaattctcg gcaggtggag 3840
gtcagctggg agtaccctga cacctggagt actccacatt cctacttctc cctgacattc 3900
tgcgttcagg tccagggcaa gagcaagaga gaaaagaaag atagagtctt cacggacaag 3960
acctcagcca cggtcatctg ccgcaaaaat gccagcatta gcgtgcgggc ccaggaccgc 4020
tactatagct catcttggag cgaatgggca tctgtgccct gcagtctcga gggcggcgga 4080
gagggcagag gaagtcttct aacatgcggt gacgtggagg agaatcccgg ccctaggatg 4140
ggtccagcgc gcagcctcct ccttgtggct accctggtcc tcctggacca cctcagtttg 4200
gccagaaacc tccccgtggc cactccagac ccaggaatgt tcccatgcct tcaccactcc 4260
caaaacctgc tgagggccgt cagcaacatg ctccagaagg ccagacaaac tctagaattt 4320
tacccttgca cttctgaaga gattgatcat gaagatatca caaaagataa aaccagcaca 4380
gtggaggcct gtttaccatt ggaattaacc aagaatgaga gttgcctaaa ttccagagag 4440
acctctttca taactaatgg gagttgcctg gcctccagaa agacctcttt tatgatggcc 4500
ctgtgcctta gtagtattta tgaagacttg aagatgtacc aggtggagtt caagaccatg 4560
aatgcaaagc ttctgatgga tcctaagagg cagatctttc tagatcaaaa catgctggca 4620
gttattgatg agctgatgca ggccctgaat ttcaacagtg agactgtgcc acaaaaatcc 4680
tcccttgaag aaccggattt ttataaaact aaaatcaagc tctgcatact tcttcatgct 4740
ttcagaattc gggcagtgac tattgataga gtgatgagct atctgaatgc ttcctaaatc 4800
gatttattta tcggcataaa taattttttt gaagaagtaa tactattttt cttttttttt 4860
gtaaataaat gggttaaggg atgtaacatt gtttgttgtt tggtgggggt tggggcctcc 4920
gcgccgggtt ttggcgcctc ccgcgggcgc ccccctcctc acggcgagcg ctgccacgtc 4980
agacgaaggg cgcagcgagc gtcctgatcc ttccgcccgg acgctcagga cagcggcccg 5040
ctgctcataa gactcggcct tagaacccca gtatcagcag aaggacattt taggacggga 5100
cttgggtgac tctagggcac tggttttctt tccagagagc ggaacaggcg aggaaaagta 5160
gtcccttctc ggcgattctg cggagggatc tccgtggggc ggtgaacgcc gatgattata 5220
taaggacgcg ccgggtgtgg cacagctagt tccgtcgcag ccgggatttg ggtcgcggtt 5280
cttgtttgtg gatcgctgtg atcgtcactt ggtgagtagc gggctgctgg gctgggtacg 5340
tgcgctcggg gttggcgagt gtgttttgtg aagtttttta ggcacctttt gaaatgtaat 5400
catttgggtc aatatgtaat tttcagtgtt agactagtaa attgtccgct aaattctggc 5460
cgtttttggc ttttttgtta gacgagctag cgccgccacc atgggcccta aaaagaagcg 5520
taaagtcgcc cccccgaccg atgtcagcct gggggacgag ctccacttag acggcgagga 5580
cgtggcgatg gcgcatgccg acgcgctaga cgatttcgat ctggacatgt tgggggacgg 5640
ggattccccg ggtccgggat ttacccccca cgactccgcc ccctacggcg ctctggatat 5700
ggccgacttc gagtttgagc agatgtttac cgatgccctt ggaattgacg agtacggtgg 5760
ggaattcgag atgcctgtgg acaggatcct ggaggcagag cttgctgtgg aacagaagag 5820
tgaccagggc gttgagggtc ctgggggaac cgggggtagc ggcagcagcc caaatgaccc 5880
tgtgactaac atctgtcagg cagctgacaa acagctattc acgcttgttg agtgggcgaa 5940
gaggatccca cacttttcct ccttgcctct ggatgatcag gtcatattgc tgcgggcagg 6000
ctggaatgaa ctcctcattg cctccttttc acaccgatcc attgatgttc gagatggcat 6060
cctccttgcc acaggtcttc acgtgcaccg caactcagcc cattcagcag gagtaggagc 6120
catctttgat cgggtgctga cagagctagt gtccaaaatg cgtgacatga ggatggacaa 6180
gacagagctt ggctgcctga gggcaatcat tctgtttaat ccagaggtga ggggtttgaa 6240
atccgcccag gaagttgaac ttctacgtga aaaagtatat gccgctttgg aagaatatac 6300
tagaacaaca catcccgatg aaccaggaag atttgcaaaa cttttgcttc gtctgccttc 6360
tttacgttcc ataggcctta agtgtttgga gcatttgttt ttctttcgcc ttattggaga 6420
tgttccaatt gatacgttcc tgatggagat gcttgaatca ccttctgatt cataatctag 6480
cctagccccc ctctccctcc ccccccccta acgttactgg ccgaagccgc ttggaataag 6540
gccggtgtgc gtttgtctat atgttatttt ccaccatatt gccgtctttt ggcaatgtga 6600
gggcccggaa acctggccct gtcttcttga cgagcattcc taggggtctt tcccctctcg 6660
ccaaaggaat gcaaggtctg ttgaatgtcg tgaaggaagc agttcctctg gaagcttctt 6720
gaagacaaac aacgtctgta gcgacccttt gcaggcagcg gaacccccca cctggcgaca 6780
ggtgcctctg cggccaaaag ccacgtgtat aagatacacc tgcaaaggcg gcacaacccc 6840
agtgccacgt tgtgagttgg atagttgtgg aaagagtcaa atggctctcc tcaagcgtat 6900
tcaacaaggg gctgaaggat gcccagaagg taccccattg tatgggatct gatctggggc 6960
ctcggtgcac atgctttaca tgtgtttagt cgaggttaaa aaacgtctag gccccccgaa 7020
ccacggggac gtggttttcc tttgaaaaac acgatctcta ggcgccacca tgaagctact 7080
gtcttctatc gaacaagcat gcgatatttg ccgacttaaa aagctcaagt gctccaaaga 7140
aaaaccgaag tgcgccaagt gtctgaagaa caactgggag tgtcgctact ctcccaaaac 7200
caaaaggtct ccgctgacta gggcacatct gacagaagtg gaatcaaggc tagaaagact 7260
ggaacagcta tttctactga tttttcctcg agaagacctt gacatgattt tgaaaatgga 7320
ttctttacag gatataaaag cattgttaac aggattattt gtacaagata atgtgaataa 7380
agatgccgtc acagatagat tggcttcagt ggagactgat atgcctctaa cattgagaca 7440
gcatagaata agtgcgacat catcatcgga agagagtagt aacaaaggtc aaagacagtt 7500
gactgtatcg ccggaattcc cggggatccg gcctgagtgc gtagtacccg agactcagtg 7560
cgccatgaag cggaaagaga agaaagcaca gaaggagaag gacaaactgc ctgtcagcac 7620
gacgacggtg gacgaccaca tgccgcccat tatgcagtgt gaacctccac ctcctgaagc 7680
agcaaggatt cacgaagtgg tcccaaggtt tctctccgac aagctgttgg tgacaaaccg 7740
gcagaaaaac atcccccagt tgacagccaa ccagcagttc cttatcgcca ggctcatctg 7800
gtaccaggac gggtacgagc agccttctga tgaagatttg aagaggatta cgcagacgtg 7860
gcagcaagcg gacgatgaaa acgaagagtc ggacactccc ttccgccaga tcacagagat 7920
gactatcctc acggtccaac ttatcgtgga gttcgcgaag ggattgccag ggttcgccaa 7980
gatctcgcag cctgatcaaa ttacgctgct taaggcttgc tcaagtgagg taatgatgct 8040
ccgagtcgcg cgacgatacg atgcggcctc agacagtatt ctgttcgcga acaaccaagc 8100
gtacactcgc gacaactacc gcaaggctgg catggccgag gtcatcgagg atctactgca 8160
cttctgccgg tgcatgtact ctatggcgtt ggacaacatc cattacgcgc tgctcacggc 8220
tgtcgtcatc ttttctgacc ggccagggtt ggagcagccg caactggtgg aagagatcca 8280
gcggtactac ctgaatacgc tccgcatcta tatcctgaac cagctgagcg ggtcggcgcg 8340
ttcgtccgtc atatacggca agatcctctc aatcctctct gagctacgca cgctcggcat 8400
gcaaaactcc aacatgtgca tctccctcaa gctcaagaac agaaagctgc cgcctttcct 8460
cgaggagatc tgggatgtgg cggacatgtc gcacacccaa ccgccgccta tcctcgagtc 8520
ccccacgaat ctctaaatcg attacgctcc tctactcttt gagacatcac tggcctataa 8580
taaatgggtt aatttatgta acaaaattgc cttggcttgt taactttatt agacattctg 8640
atgtttgcat tgtgtaaata ctgttgtatt ggaaaagcgt gccaagatgg attattgtaa 8700
ttcagtgtct tttttagtag cgtcacgtgc caaacactgt tagtcacaga gggcatgaga 8760
cagcctgtgc tggaacagct cagttcatag ggctatggag atggggagaa aggggcgctt 8820
ctgtcagaga caagctgtgg tctgggaagg ccttagcact aaaagcacca caatgagaag 8880
caaccgccag aagcagggcc cgcaggcctt tgttccagct gcaaagagaa aggaaaaagt 8940
ggggaataag agttggggct gcggaggggg tggggagcat tgtgcaggtt ccgtacttga 9000
acagaaagca gggaccaaca caaggaaggg cgcgccaccg gtcaaatgac ggtgacaata 9060
aaacggagac tttgacccgg aacgcggaaa ttcacgtaaa aaacacctgg gcgagtcctc 9120
cacgtaatcg gtcaaagtcc ctcggccctc ggtaaatatt acgcactatg actaacgccc 9180
tattattcag ttttcacttc cccgtttcac ttttcgcgcg aaaatggcca aatcttacat 9240
ggtcccgccc aaaattacta cgatatccgg tgaaaagcgc gcgaaaattg gcacttccgg 9300
aggtaggcgg cgctcatcaa aaacgtcaca ttttccgcga cggaagcttg catgtgagct 9360
cctcccactt gcaaatgcca cacttccgcc acacctccca accctactcg cgcgtcctac 9420
gtcacccgcc ccgcctctcc ccgcccacct cattatcata ttggccacaa tccaaaataa 9480
ggtatattat tgatgatggt ttaaacgccc aattcactgg ccgtcgtttt acaacgtcgt 9540
gactgggaaa accctggcgt tacccaactt aatcgccttg cagcacatcc ccctttcgcc 9600
agctggcgta atagcgaaga ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg 9660
aatggcgaat ggcgcctgat gcggtatttt ctccttacgc atctgtgcgg tatttcacac 9720
cgcatatggt gcactctcag tacaatctgc tctgatgccg catagttaag ccagccccga 9780
cacccgccaa cacccgctga cgcgccctga cgggcttgtc tgctcccggc atccgcttac 9840
agacaagctg tgaccgtctc cgggagctgc atgtgtcaga ggttttcacc gtcatcaccg 9900
aaacgcgcga gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata 9960
ataatggttt cttagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt 10020
tgtttatttt tctaaataca 10040
<210> 63
<211> 9949
<212> DNA
<213> Artificial Sequence
<220>
<223> GCAd-RTS-IL12 design 3
<400> 63
ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 60
aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt 120
ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca 180
gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag 240
ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc 300
ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac actattctca 360
gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt 420
aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct 480
gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg gggatcatgt 540
aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga 600
caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact 660
tactctagct tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc 720
acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga 780
gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt 840
agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac agatcgctga 900
gataggtgcc tcactgatta agcattggta actgtcagac caagtttact catatatact 960
ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga tcctttttga 1020
taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt cagaccccgt 1080
agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct gctgcttgca 1140
aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc taccaactct 1200
ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgttc ttctagtgta 1260
gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc tcgctctgct 1320
aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg ggttggactc 1380
aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt cgtgcacaca 1440
gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg agctatgaga 1500
aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg 1560
aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt atagtcctgt 1620
cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag gggggcggag 1680
cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt 1740
tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt 1800
tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt cagtgagcga 1860
ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc cgattcatta 1920
atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca acgcaattaa 1980
tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc cggctcgtat 2040
gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg accatgatta 2100
cgccaagctg ggtcaagtct tccagtttaa gcagcagagc ggtcagtttc tcatcccgag 2160
cagacgcgcg agaggccgcg ccgctcgcca ccaaagagct gtaaaggtcc gtagccatgc 2220
tgcgcgcggt cgcggcggcg gcggaggcgg cggcggaggt cgcggcgtcc agcggagttc 2280
ctcccacggt cgcgtaggcc attgtagacg aatttgaagg cagaacgggg cgtccatcca 2340
cgttggaacc catcacattc tgacgcactc cagcccagtg aggcatgcgc actgtcagat 2400
aggggctaaa gatgcttcca tcaaagctgt tgccggtgtc gctcatggcg gcggctgttg 2460
caagacaaaa cagagagacc cttagacccc caatttatac acgccccacc cttctagcca 2520
cgcccacctt acccacctca atcggtatcc tcatcgctag acccaaactc ggccctggtg 2580
caggccagca ccagatggtc aggcctgcag gtacgtagcc gcaataaaat atctttattt 2640
tcattacatc tgtgtgttgg ttttttgtgt gaatccatag tactaacata cgctctccat 2700
caaaacaaaa cgaaacaaaa caaactagca aaataggctg tccccagtgc aagtccaggt 2760
gccagaacat ttctctatcc ataatgcagg ggtaccggaa ggaagagggg cggggtcgat 2820
cgaccccgcc cctcttcctt cgaaggaaga ggggcggggt ccaattgcgg agtactgtcc 2880
tccgagcgga gtactgtcct ccgagcggag tactgtcctc cgagcggagt actgtcctcc 2940
gagcggagta ctgtcctccg agcggagtac tgtcctccga gcggagagtc cccggggacc 3000
tagagggtat ataatgggtg ccttagctgg tgtgtgacct catcttcctg tacgcccctg 3060
caggcagccg ctaaatccaa ggtaaggtca gaagagctag cgccaccatg tgtcaccagc 3120
agttggtcat ctcttggttc agcctggttt ttctggcatc tcccctcgtg gccatctggg 3180
aactgaagaa agatgtttat gtcgtagaat tggattggta tcccgacgcc cctggagaaa 3240
tggtggtcct gacatgtgac acccctgaag aagatggtat cacctggacc ttggaccaga 3300
gcagtgaggt cttaggctct ggcaagaccc tgaccatcca agtcaaagag tttggagatg 3360
ctggccagta cacctgtcac aaaggaggcg aggttctaag ccattcgctc ctgctgcttc 3420
acaaaaagga agatggaatt tggtccactg acattctgaa ggaccagaaa gaacccaaga 3480
ataagacctt tctaagatgc gaggccaaga attattctgg acgtttcacc tgctggtggc 3540
tgacgacaat cagtactgat ttgacattca gtgtcaaaag cagcagaggc tcttctgacc 3600
cccaaggggt gacgtgcgga gctgctacac tcagcgccga gagagtcaga ggggacaaca 3660
aggagtatga gtactcagtg gagtgccagg aggacagtgc ctgcccagct gctgaggaga 3720
gtctgcccat tgaggtcatg gtggatgccg ttcacaagct caagtatgaa aactacacca 3780
gcagcttctt catcagggac atcatcaaac ctgacccacc caagaacttg cagctgaagc 3840
ccctgaagaa cagcagacag gtggaggtca gctgggagta ccctgacacc tggagtactc 3900
cacattccta cttctccctg acattctgcg ttcaggtcca gggcaagagc aagagagaaa 3960
agaaagatag agtcttcacg gacaagacct cagccacggt catctgccgc aaaaatgcca 4020
gcattagcgt gcgggcccag gaccgctact atagctcatc ttggagcgaa tgggcatctg 4080
tgccctgctc cggtggcggt ggcggcggat ctagaaacct ccccgtggcc actccagacc 4140
caggaatgtt cccatgcctt caccacagcc agaacctgct gagggccgtc agcaacatgc 4200
tccagaaggc cagacaaact ctagaatttt acccttgcac ttctgaagag attgatcatg 4260
aagatatcac aaaagataaa accagcacag tggaggcctg tttaccattg gaattaacca 4320
agaatgagag ttgcctaaat tccagagaga cctctttcat aactaatggg agttgcctgg 4380
cctccagaaa gacctctttt atgatggccc tgtgccttag tagtatttat gaagacttga 4440
agatgtacca ggtggagttc aagaccatga atgcaaagct gctgatggac cccaagaggc 4500
agatctttct agatcaaaac atgctggcag ttattgatga gctgatgcag gccctgaatt 4560
tcaacagtga gactgtgcca caaaaatcct cccttgaaga accggatttt tataaaacta 4620
aaatcaagct ctgcatactt cttcatgctt tcagaatcag agcagtgact attgatagag 4680
tgatgagcta tctgaatgct tcctaaatcg atttatttat cggcataaat aatttttttg 4740
aagaagtaat actatttttc tttttttttg taaataaatg ggttaaggga tgtaacattg 4800
tttgttgttt ggtgggggtt ggggcctccg cgccgggttt tggcgcctcc cgcgggcgcc 4860
cccctcctca cggcgagcgc tgccacgtca gacgaagggc gcagcgagcg tcctgatcct 4920
tccgcccgga cgctcaggac agcggcccgc tgctcataag actcggcctt agaaccccag 4980
tatcagcaga aggacatttt aggacgggac ttgggtgact ctagggcact ggttttcttt 5040
ccagagagcg gaacaggcga ggaaaagtag tcccttctcg gcgattctgc ggagggatct 5100
ccgtggggcg gtgaacgccg atgattatat aaggacgcgc cgggtgtggc acagctagtt 5160
ccgtcgcagc cgggatttgg gtcgcggttc ttgtttgtgg atcgctgtga tcgtcacttg 5220
gtgagtagcg ggctgctggg ctgggtacgt gcgctcgggg ttggcgagtg tgttttgtga 5280
agttttttag gcaccttttg aaatgtaatc atttgggtca atatgtaatt ttcagtgtta 5340
gactagtaaa ttgtccgcta aattctggcc gtttttggct tttttgttag acgagctagc 5400
gccgccacca tgggccctaa aaagaagcgt aaagtcgccc ccccgaccga tgtcagcctg 5460
ggggacgagc tccacttaga cggcgaggac gtggcgatgg cgcatgccga cgcgctagac 5520
gatttcgatc tggacatgtt gggggacggg gattccccgg gtccgggatt taccccccac 5580
gactccgccc cctacggcgc tctggatatg gccgacttcg agtttgagca gatgtttacc 5640
gatgcccttg gaattgacga gtacggtggg gaattcgaga tgcctgtgga caggatcctg 5700
gaggcagagc ttgctgtgga acagaagagt gaccagggcg ttgagggtcc tgggggaacc 5760
gggggtagcg gcagcagccc aaatgaccct gtgactaaca tctgtcaggc agctgacaaa 5820
cagctattca cgcttgttga gtgggcgaag aggatcccac acttttcctc cttgcctctg 5880
gatgatcagg tcatattgct gcgggcaggc tggaatgaac tcctcattgc ctccttttca 5940
caccgatcca ttgatgttcg agatggcatc ctccttgcca caggtcttca cgtgcaccgc 6000
aactcagccc attcagcagg agtaggagcc atctttgatc gggtgctgac agagctagtg 6060
tccaaaatgc gtgacatgag gatggacaag acagagcttg gctgcctgag ggcaatcatt 6120
ctgtttaatc cagaggtgag gggtttgaaa tccgcccagg aagttgaact tctacgtgaa 6180
aaagtatatg ccgctttgga agaatatact agaacaacac atcccgatga accaggaaga 6240
tttgcaaaac ttttgcttcg tctgccttct ttacgttcca taggccttaa gtgtttggag 6300
catttgtttt tctttcgcct tattggagat gttccaattg atacgttcct gatggagatg 6360
cttgaatcac cttctgattc ataatctagc ctagcccccc tctccctccc ccccccctaa 6420
cgttactggc cgaagccgct tggaataagg ccggtgtgcg tttgtctata tgttattttc 6480
caccatattg ccgtcttttg gcaatgtgag ggcccggaaa cctggccctg tcttcttgac 6540
gagcattcct aggggtcttt cccctctcgc caaaggaatg caaggtctgt tgaatgtcgt 6600
gaaggaagca gttcctctgg aagcttcttg aagacaaaca acgtctgtag cgaccctttg 6660
caggcagcgg aaccccccac ctggcgacag gtgcctctgc ggccaaaagc cacgtgtata 6720
agatacacct gcaaaggcgg cacaacccca gtgccacgtt gtgagttgga tagttgtgga 6780
aagagtcaaa tggctctcct caagcgtatt caacaagggg ctgaaggatg cccagaaggt 6840
accccattgt atgggatctg atctggggcc tcggtgcaca tgctttacat gtgtttagtc 6900
gaggttaaaa aacgtctagg ccccccgaac cacggggacg tggttttcct ttgaaaaaca 6960
cgatctctag gcgccaccat gaagctactg tcttctatcg aacaagcatg cgatatttgc 7020
cgacttaaaa agctcaagtg ctccaaagaa aaaccgaagt gcgccaagtg tctgaagaac 7080
aactgggagt gtcgctactc tcccaaaacc aaaaggtctc cgctgactag ggcacatctg 7140
acagaagtgg aatcaaggct agaaagactg gaacagctat ttctactgat ttttcctcga 7200
gaagaccttg acatgatttt gaaaatggat tctttacagg atataaaagc attgttaaca 7260
ggattatttg tacaagataa tgtgaataaa gatgccgtca cagatagatt ggcttcagtg 7320
gagactgata tgcctctaac attgagacag catagaataa gtgcgacatc atcatcggaa 7380
gagagtagta acaaaggtca aagacagttg actgtatcgc cggaattccc ggggatccgg 7440
cctgagtgcg tagtacccga gactcagtgc gccatgaagc ggaaagagaa gaaagcacag 7500
aaggagaagg acaaactgcc tgtcagcacg acgacggtgg acgaccacat gccgcccatt 7560
atgcagtgtg aacctccacc tcctgaagca gcaaggattc acgaagtggt cccaaggttt 7620
ctctccgaca agctgttggt gacaaaccgg cagaaaaaca tcccccagtt gacagccaac 7680
cagcagttcc ttatcgccag gctcatctgg taccaggacg ggtacgagca gccttctgat 7740
gaagatttga agaggattac gcagacgtgg cagcaagcgg acgatgaaaa cgaagagtcg 7800
gacactccct tccgccagat cacagagatg actatcctca cggtccaact tatcgtggag 7860
ttcgcgaagg gattgccagg gttcgccaag atctcgcagc ctgatcaaat tacgctgctt 7920
aaggcttgct caagtgaggt aatgatgctc cgagtcgcgc gacgatacga tgcggcctca 7980
gacagtattc tgttcgcgaa caaccaagcg tacactcgcg acaactaccg caaggctggc 8040
atggccgagg tcatcgagga tctactgcac ttctgccggt gcatgtactc tatggcgttg 8100
gacaacatcc attacgcgct gctcacggct gtcgtcatct tttctgaccg gccagggttg 8160
gagcagccgc aactggtgga agagatccag cggtactacc tgaatacgct ccgcatctat 8220
atcctgaacc agctgagcgg gtcggcgcgt tcgtccgtca tatacggcaa gatcctctca 8280
atcctctctg agctacgcac gctcggcatg caaaactcca acatgtgcat ctccctcaag 8340
ctcaagaaca gaaagctgcc gcctttcctc gaggagatct gggatgtggc ggacatgtcg 8400
cacacccaac cgccgcctat cctcgagtcc cccacgaatc tctaaatcga ttacgctcct 8460
ctactctttg agacatcact ggcctataat aaatgggtta atttatgtaa caaaattgcc 8520
ttggcttgtt aactttatta gacattctga tgtttgcatt gtgtaaatac tgttgtattg 8580
gaaaagcgtg ccaagatgga ttattgtaat tcagtgtctt ttttagtagc gtcacgtgcc 8640
aaacactgtt agtcacagag ggcatgagac agcctgtgct ggaacagctc agttcatagg 8700
gctatggaga tggggagaaa ggggcgcttc tgtcagagac aagctgtggt ctgggaaggc 8760
cttagcacta aaagcaccac aatgagaagc aaccgccaga agcagggccc gcaggccttt 8820
gttccagctg caaagagaaa ggaaaaagtg gggaataaga gttggggctg cggagggggt 8880
ggggagcatt gtgcaggttc cgtacttgaa cagaaagcag ggaccaacac aaggaagggc 8940
gcgccaccgg tcaaatgacg gtgacaataa aacggagact ttgacccgga acgcggaaat 9000
tcacgtaaaa aacacctggg cgagtcctcc acgtaatcgg tcaaagtccc tcggccctcg 9060
gtaaatatta cgcactatga ctaacgccct attattcagt tttcacttcc ccgtttcact 9120
tttcgcgcga aaatggccaa atcttacatg gtcccgccca aaattactac gatatccggt 9180
gaaaagcgcg cgaaaattgg cacttccgga ggtaggcggc gctcatcaaa aacgtcacat 9240
tttccgcgac ggaagcttgc atgtgagctc ctcccacttg caaatgccac acttccgcca 9300
cacctcccaa ccctactcgc gcgtcctacg tcacccgccc cgcctctccc cgcccacctc 9360
attatcatat tggccacaat ccaaaataag gtatattatt gatgatggtt taaacgccca 9420
attcactggc cgtcgtttta caacgtcgtg actgggaaaa ccctggcgtt acccaactta 9480
atcgccttgc agcacatccc cctttcgcca gctggcgtaa tagcgaagag gcccgcaccg 9540
atcgcccttc ccaacagttg cgcagcctga atggcgaatg gcgcctgatg cggtattttc 9600
tccttacgca tctgtgcggt atttcacacc gcatatggtg cactctcagt acaatctgct 9660
ctgatgccgc atagttaagc cagccccgac acccgccaac acccgctgac gcgccctgac 9720
gggcttgtct gctcccggca tccgcttaca gacaagctgt gaccgtctcc gggagctgca 9780
tgtgtcagag gttttcaccg tcatcaccga aacgcgcgag acgaaagggc ctcgtgatac 9840
gcctattttt ataggttaat gtcatgataa taatggtttc ttagacgtca ggtggcactt 9900
ttcggggaaa tgtgcgcgga acccctattt gtttattttt ctaaataca 9949
<210> 64
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Whitlow Linker
<400> 64
ggcagcacct ccggcagcgg caagcctggc agcggcgagg gcagcaccaa gggc 54
<210> 65
<211> 78
<212> DNA
<213> Artificial Sequence
<220>
<223> Linker
<400> 65
tctggcggag gatctggagg aggcggatct ggaggaggag gcagtggagg cggaggatct 60
ggcggaggat ctctgcag 78
<210> 66
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> GSG linker
<400> 66
ggaagcgga 9
<210> 67
<211> 12
<212> DNA
<213> Artificial Sequence
<220>
<223> SGSG linker
<400> 67
agtggcagcg gc 12
<210> 68
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> (G4S)3 linker
<400> 68
ggtggcggtg gctcgggcgg tggtgggtcg ggtggcggcg gatct 45
<210> 69
<211> 12
<212> DNA
<213> Artificial Sequence
<220>
<223> Furin cleavage site
<400> 69
cgtgcaaagc gt 12
<210> 70
<211> 84
<212> DNA
<213> Artificial Sequence
<220>
<223> Fmdv
<400> 70
agagccaaga gggcaccggt gaaacagact ttgaattttg accttctgaa gttggcagga 60
gacgttgagt ccaaccctgg gccc 84
<210> 71
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Thosea asigna virus 2A region (T2A)
<400> 71
gagggcagag gaagtctgct aacatgcggt gacgtcgagg agaatcctgg acct 54
<210> 72
<211> 75
<212> DNA
<213> Artificial Sequence
<220>
<223> Furin-GSG-T2A
<400> 72
agagctaaga ggggaagcgg agagggcaga ggaagtctgc taacatgcgg tgacgtcgag 60
gagaatcctg gacct 75
<210> 73
<211> 78
<212> DNA
<213> Artificial Sequence
<220>
<223> Furin-SGSG-T2A
<400> 73
agggccaaga ggagtggcag cggcgagggc agaggaagtc ttctaacatg cggtgacgtg 60
gaggagaatc ccggccct 78
<210> 74
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Porcine teschovirus-1 2A region (P2A)
<400> 74
gcaacgaact tctctctcct aaaacaggct ggtgatgtgg aggagaatcc tggtcca 57
<210> 75
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> GSG-P2A
<400> 75
ggaagcggag ctactaactt cagcctgctg aagcaggctg gagacgtgga ggagaaccct 60
ggacct 66
<210> 76
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Equine rhinitis A virus 2A region (E2A)
<400> 76
cagtgtacta attatgctct cttgaaattg gctggagatg ttgagagcaa ccctggacct 60
<210> 77
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> Foot-and-mouth disease virus 2A region (F2A)
<400> 77
gtcaaacaga ccctaaactt tgatctgcta aaactggccg gggatgtgga aagtaatccc 60
ggcccc 66
<210> 78
<211> 93
<212> DNA
<213> Artificial Sequence
<220>
<223> FP2A
<400> 78
cgtgcaaagc gtgcaccggt gaaacaggga agcggagcta ctaacttcag cctgctgaag 60
caggctggag acgtggagga gaaccctgga cct 93
<210> 79
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Linker-GSG
<400> 79
gcaccggtga aacagggaag cgga 24
<210> 80
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> Linker
<400> 80
gcaccggtga aacag 15
<210> 81
<211> 18
<212> PRT
<213> Artificial Sequence
<220>
<223> Whitlow Linker Amino Acid Sequence
<400> 81
Gly Ser Thr Ser Gly Ser Gly Lys Pro Gly Ser Gly Glu Gly Ser Thr
1 5 10 15
Lys Gly
<210> 82
<211> 26
<212> PRT
<213> Artificial Sequence
<220>
<223> Linker Amino Acid Sequence
<400> 82
Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Gly Ser Gly Gly Gly Ser Leu Gln
20 25
<210> 83
<211> 3
<212> PRT
<213> Artificial Sequence
<220>
<223> GSG Linker Amino Acid Sequence
<400> 83
Gly Ser Gly
1
<210> 84
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> SGSG Linker Amino Acid Sequence
<400> 84
Ser Gly Ser Gly
1
<210> 85
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> G4S LINKER Amino Acid Sequence
<400> 85
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10 15
<210> 86
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Furin Cleavage site Amino Acid Sequence
<400> 86
Arg Ala Lys Arg
1
<210> 87
<211> 28
<212> PRT
<213> Artificial Sequence
<220>
<223> FMDV Amino Acid Sequence
<400> 87
Arg Ala Lys Arg Ala Pro Val Lys Gln Thr Leu Asn Phe Asp Leu Leu
1 5 10 15
Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly Pro
20 25
<210> 88
<211> 18
<212> PRT
<213> Artificial Sequence
<220>
<223> Thosea asigna virus 2a Region (T2A) Amino Acid Sequence
<400> 88
Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro
1 5 10 15
Gly Pro
<210> 89
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> FURIN-SGSG-T2A Amino Acid Sequence
<400> 89
Arg Ala Lys Arg Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys
1 5 10 15
Gly Asp Val Glu Glu Asn Pro Gly Pro
20 25
<210> 90
<211> 26
<212> PRT
<213> Artificial Sequence
<220>
<223> FURIN-SGSG-T2A Amino Acid Sequence
<400> 90
Arg Ala Lys Arg Ser Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr
1 5 10 15
Cys Gly Asp Val Glu Glu Asn Pro Gly Pro
20 25
<210> 91
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> Porcine teschovirus-1 2A region (P2A) Amino Acid Sequence
<400> 91
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
1 5 10 15
Pro Gly Pro
<210> 92
<211> 22
<212> PRT
<213> Artificial Sequence
<220>
<223> GSG-P2A Amino Acid Sequence
<400> 92
Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val
1 5 10 15
Glu Glu Asn Pro Gly Pro
20
<210> 93
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> GSG-P2A Amino Acid Sequence
<400> 93
Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp Val Glu Ser
1 5 10 15
Asn Pro Gly Pro
20
<210> 94
<211> 22
<212> PRT
<213> Artificial Sequence
<220>
<223> Foot-and-motuh disease virus 2A region (F2A) Amino Acid Sequence
<400> 94
Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val
1 5 10 15
Glu Ser Asn Pro Gly Pro
20
<210> 95
<211> 31
<212> PRT
<213> Artificial Sequence
<220>
<223> FP2A Amino Acid Sequence
<400> 95
Arg Ala Lys Arg Ala Pro Val Lys Gln Gly Ser Gly Ala Thr Asn Phe
1 5 10 15
Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro
20 25 30
<210> 96
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> LINKER-GSG Amino Acid Sequence
<400> 96
Ala Pro Val Lys Gln Gly Ser Gly
1 5
<210> 97
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> LINKER Amino Acid Sequence
<400> 97
Ala Pro Val Lys Gln
1 5
<210> 98
<211> 154
<212> PRT
<213> Artificial Sequence
<220>
<223> HBV HBx domain of HBV design 1
<400> 98
Met Ala Ala Arg Leu Cys Cys Gln Leu Asp Pro Ala Arg Asp Val Leu
1 5 10 15
Cys Leu Arg Pro Val Gly Ala Glu Ser Arg Gly Arg Pro Phe Ser Gly
20 25 30
Pro Leu Gly Ala Leu Ser Ser Ser Ser Pro Pro Ala Val Pro Thr Asp
35 40 45
His Gly Ala His Leu Ser Leu Arg Gly Leu Pro Val Cys Ala Phe Ser
50 55 60
Ser Ala Gly Pro Cys Ala Leu Arg Phe Thr Ser Ala Arg Arg Met Glu
65 70 75 80
Thr Thr Val Asn Ala His Gln Phe Leu Pro Lys Val Leu His Lys Arg
85 90 95
Thr Leu Gly Leu Ser Ala Met Ser Thr Thr Asp Leu Glu Ala Tyr Phe
100 105 110
Lys Asp Cys Leu Phe Lys Asp Trp Glu Glu Leu Gly Glu Glu Leu Arg
115 120 125
Leu Lys Val Phe Val Leu Gly Gly Cys Arg His Lys Leu Val Cys Ala
130 135 140
Pro Ala Pro Cys Asn Phe Phe Thr Ser Ala
145 150
<210> 99
<211> 454
<212> PRT
<213> Artificial Sequence
<220>
<223> HBV Pol domain of HBV design 1
<400> 99
Gly Pro Cys Ala Glu His Gly Glu His His Ile Arg Ile Pro Arg Thr
1 5 10 15
Pro Ala Arg Val Thr Gly Gly Val Phe Leu Val Asp Lys Asn Pro His
20 25 30
Asn Thr Ala Glu Ser Arg Leu Val Val Asp Phe Ser Gln Phe Ser Arg
35 40 45
Gly Asn Tyr Arg Val Ser Trp Pro Lys Phe Ala Val Pro Asn Leu Gln
50 55 60
Ser Leu Thr Asn Leu Leu Ser Ser Asn Leu Cys Trp Leu Ser Leu Asp
65 70 75 80
Val Ser Ala Ala Phe Tyr His Leu Pro Leu His Pro Ala Ala Met Pro
85 90 95
His Leu Leu Val Gly Ser Ser Gly Leu Ser Arg Tyr Val Ala Arg Leu
100 105 110
Ser Ser Asn Ser Arg Ile Ile Asn His Gln His Gly Thr Leu Gln Asn
115 120 125
Leu His Asp Ser Cys Ser Arg Asn Leu Tyr Val Ser Leu Leu Leu Leu
130 135 140
Tyr Lys Thr Phe Gly Trp Lys Leu His Leu Tyr Ser His Pro Ile Ile
145 150 155 160
Leu Gly Phe Arg Lys Ile Pro Met Gly Val Gly Leu Ser Pro Phe Leu
165 170 175
Leu Ala Gln Phe Thr Ser Ala Ile Cys Ser Val Val Arg Arg Ala Phe
180 185 190
Pro His Cys Leu Ala Phe Ser Gly Ala Lys Ser Val Gln His Leu Glu
195 200 205
Ser Leu Phe Thr Ala Val Thr Asn Phe Leu Leu Ser Leu Gly Ile His
210 215 220
Leu Asn Pro Asn Lys Thr Lys Arg Trp Gly Tyr Ser Leu Asn Phe Met
225 230 235 240
Gly Tyr Val Ile Gly Ser Trp Gly Ser Leu Pro Gln Asp His Ile Arg
245 250 255
His Lys Ile Lys Glu Cys Phe Arg Lys Leu Pro Val His Arg Pro Ile
260 265 270
Asp Trp Lys Val Cys Gln Arg Ile Val Gly Leu Leu Gly Phe Ala Ala
275 280 285
Pro Phe Thr Gln Cys Gly Tyr Pro Ala Leu Met Pro Leu Tyr Ala Cys
290 295 300
Ile Gln Ser Lys Gln Ala Phe Thr Phe Ser Pro Thr Tyr Lys Ala Phe
305 310 315 320
Leu Cys Lys Gln Tyr Leu Asn Leu Tyr Pro Val Ala Arg Gln Arg Pro
325 330 335
Gly Leu Cys Gln Val Phe Ala Asp Ala Thr Pro Thr Gly Trp Gly Leu
340 345 350
Val Met Gly His Gln Arg Met Arg Gly Thr Phe Ser Ser Arg Lys Tyr
355 360 365
Thr Ser Phe Pro Trp Leu Leu Gly Cys Ala Ala Asn Trp Ile Leu Arg
370 375 380
Gly Thr Ser Phe Val Tyr Val Pro Ser Ala Leu Asn Pro Ala Asp Asp
385 390 395 400
Pro Ser Arg Gly Arg Leu Gly Pro Cys Arg Pro Leu Leu His Leu Pro
405 410 415
Phe Arg Pro Thr Thr Gly Arg Thr Ser Leu Tyr Ala Asp Ser Pro Ser
420 425 430
Val Pro Ser His Leu Pro Asp Arg Val His Phe Ala Ser Pro Leu His
435 440 445
Val Ala Trp Arg Pro Pro
450
<210> 100
<211> 226
<212> PRT
<213> Artificial Sequence
<220>
<223> HBV Surface (Env1) domain of HBV domain 1
<400> 100
Met Glu Asn Ile Thr Ser Gly Phe Leu Gly Pro Leu Leu Val Leu Gln
1 5 10 15
Ala Gly Phe Phe Leu Leu Thr Arg Ile Leu Thr Ile Pro Gln Ser Leu
20 25 30
Asp Ser Trp Trp Thr Ser Leu Ser Phe Leu Gly Gly Thr Thr Val Cys
35 40 45
Leu Gly Gln Asn Ser Gln Ser Pro Thr Ser Asn His Ser Pro Thr Ser
50 55 60
Cys Pro Pro Thr Cys Val Gly Tyr Arg Trp Met Cys Leu Arg Arg Phe
65 70 75 80
Ile Ile Phe Leu Phe Ile Leu Leu Leu Cys Leu Ile Phe Leu Leu Val
85 90 95
Leu Leu Asp Tyr Gln Gly Met Leu Pro Val Cys Pro Leu Ile Pro Gly
100 105 110
Ser Ser Thr Thr Ser Thr Gly Pro Cys Arg Thr Cys Thr Thr Pro Ala
115 120 125
Gln Gly Thr Ser Met Tyr Pro Ser Cys Cys Cys Thr Lys Pro Ser Asp
130 135 140
Gly Asn Cys Thr Cys Ile Pro Ile Pro Ser Ser Trp Ala Phe Gly Lys
145 150 155 160
Phe Leu Trp Glu Trp Ala Ser Ala Arg Phe Ser Trp Leu Ser Leu Leu
165 170 175
Val Pro Phe Val Gln Trp Phe Val Gly Leu Ser Pro Thr Val Trp Leu
180 185 190
Ser Val Ile Trp Met Met Trp Tyr Trp Gly Pro Ser Leu Tyr Asn Thr
195 200 205
Leu Ser Pro Phe Leu Pro Leu Leu Pro Ile Phe Phe Tyr Leu Trp Val
210 215 220
Tyr Ile
225
<210> 101
<211> 180
<212> PRT
<213> Artificial Sequence
<220>
<223> HBV Core domain of HBV design 1
<400> 101
Met Gln Leu Phe His Leu Cys Leu Ile Ile Ser Cys Ser Cys Pro Thr
1 5 10 15
Val Gln Ala Ser Lys Leu Cys Leu Gly Trp Leu Trp Asp Met Asp Ile
20 25 30
Asp Pro Tyr Lys Glu Phe Gly Ala Ser Val Glu Leu Leu Ser Phe Leu
35 40 45
Pro Ser Asp Phe Phe Pro Ser Val Arg Asp Leu Leu Asp Thr Ala Thr
50 55 60
Ala Leu Tyr Arg Asp Ala Leu Glu Ser Pro Glu His Cys Thr Pro His
65 70 75 80
His Thr Ala Leu Arg His Val Cys Leu Cys Trp Gly Asp Leu Met Asn
85 90 95
Leu Ala Thr Trp Val Gly Thr Asn Leu Glu Asp Gln Ala Ser Arg Asp
100 105 110
Leu Val Val Ser Tyr Val Asn Thr Asn Met Gly Leu Lys Phe Arg Gln
115 120 125
Leu Leu Trp Phe His Ile Ser Cys Leu Thr Phe Gly Arg Asp Leu Val
130 135 140
Leu Glu Tyr Leu Val Ser Phe Gly Val Trp Ile Arg Thr Pro Pro Ala
145 150 155 160
Tyr Arg Pro Ser Asn Ala Pro Ile Leu Ser Thr Leu Pro Glu Thr Thr
165 170 175
Val Val Arg Gln
180
<210> 102
<211> 226
<212> PRT
<213> Artificial Sequence
<220>
<223> SHB(Env) domain
<400> 102
Met Glu Asn Ile Thr Ser Gly Phe Leu Gly Pro Leu Leu Val Leu Gln
1 5 10 15
Ala Gly Phe Phe Leu Leu Thr Arg Ile Leu Thr Ile Pro Gln Ser Leu
20 25 30
Asp Ser Trp Trp Thr Ser Leu Ser Phe Leu Gly Gly Thr Thr Val Cys
35 40 45
Leu Gly Gln Asn Ser Gln Ser Pro Thr Ser Asn His Ser Pro Thr Ser
50 55 60
Cys Pro Pro Thr Cys Val Gly Tyr Arg Trp Met Cys Leu Arg Arg Phe
65 70 75 80
Ile Ile Phe Leu Phe Ile Leu Leu Leu Cys Leu Ile Phe Leu Leu Val
85 90 95
Leu Leu Asp Tyr Gln Gly Met Leu Pro Val Cys Pro Leu Ile Pro Gly
100 105 110
Ser Ser Thr Thr Ser Thr Gly Pro Cys Arg Thr Cys Thr Thr Pro Ala
115 120 125
Gln Gly Thr Ser Met Tyr Pro Ser Cys Cys Cys Thr Lys Pro Ser Asp
130 135 140
Gly Asn Cys Thr Cys Ile Pro Ile Pro Ser Ser Trp Ala Phe Gly Lys
145 150 155 160
Phe Leu Trp Glu Trp Ala Ser Ala Arg Phe Ser Trp Leu Ser Leu Leu
165 170 175
Val Pro Phe Val Gln Trp Phe Val Gly Leu Ser Pro Thr Val Trp Leu
180 185 190
Ser Val Ile Trp Met Met Trp Tyr Trp Gly Pro Ser Leu Tyr Asn Thr
195 200 205
Leu Ser Pro Phe Leu Pro Leu Leu Pro Ile Phe Phe Tyr Leu Trp Val
210 215 220
Tyr Ile
225
<210> 103
<211> 180
<212> PRT
<213> Artificial Sequence
<220>
<223> HBeAg domain
<400> 103
Met Gln Leu Phe His Leu Cys Leu Ile Ile Ser Cys Ser Cys Pro Thr
1 5 10 15
Val Gln Ala Ser Lys Leu Cys Leu Gly Trp Leu Trp Asp Met Asp Ile
20 25 30
Asp Pro Tyr Lys Glu Phe Gly Ala Ser Val Glu Leu Leu Ser Phe Leu
35 40 45
Pro Ser Asp Phe Phe Pro Ser Val Arg Asp Leu Leu Asp Thr Ala Thr
50 55 60
Ala Leu Tyr Arg Asp Ala Leu Glu Ser Pro Glu His Cys Thr Pro His
65 70 75 80
His Thr Ala Leu Arg His Val Cys Leu Cys Trp Gly Asp Leu Met Asn
85 90 95
Leu Ala Thr Trp Val Gly Thr Asn Leu Glu Asp Gln Ala Ser Arg Asp
100 105 110
Leu Val Val Ser Tyr Val Asn Thr Asn Met Gly Leu Lys Phe Arg Gln
115 120 125
Leu Leu Trp Phe His Ile Ser Cys Leu Thr Phe Gly Arg Asp Leu Val
130 135 140
Leu Glu Tyr Leu Val Ser Phe Gly Val Trp Ile Arg Thr Pro Pro Ala
145 150 155 160
Tyr Arg Pro Ser Asn Ala Pro Ile Leu Ser Thr Leu Pro Glu Thr Thr
165 170 175
Val Val Arg Gln
180
<210> 104
<211> 154
<212> PRT
<213> Artificial Sequence
<220>
<223> HBx domain
<400> 104
Met Ala Ala Arg Leu Cys Cys Gln Leu Asp Pro Ala Arg Asp Val Leu
1 5 10 15
Cys Leu Arg Pro Val Gly Ala Glu Ser Arg Gly Arg Pro Phe Ser Gly
20 25 30
Pro Leu Gly Ala Leu Ser Ser Ser Ser Pro Pro Ala Val Pro Thr Asp
35 40 45
His Gly Ala His Leu Ser Leu Arg Gly Leu Pro Val Cys Ala Phe Ser
50 55 60
Ser Ala Gly Pro Cys Ala Leu Arg Phe Thr Ser Ala Arg Arg Met Glu
65 70 75 80
Thr Thr Val Asn Ala His Gln Phe Leu Pro Lys Val Leu His Lys Arg
85 90 95
Thr Leu Gly Leu Ser Ala Met Ser Thr Thr Asp Leu Glu Ala Tyr Phe
100 105 110
Lys Asp Cys Leu Phe Lys Asp Trp Glu Glu Leu Gly Glu Glu Leu Arg
115 120 125
Leu Lys Val Phe Val Leu Gly Gly Cys Arg His Lys Leu Val Cys Ala
130 135 140
Pro Ala Pro Cys Asn Phe Phe Thr Ser Ala
145 150
<210> 105
<211> 454
<212> PRT
<213> Artificial Sequence
<220>
<223> Pol domain
<400> 105
Gly Pro Cys Ala Glu His Gly Glu His His Ile Arg Ile Pro Arg Thr
1 5 10 15
Pro Ala Arg Val Thr Gly Gly Val Phe Leu Val Asp Lys Asn Pro His
20 25 30
Asn Thr Ala Glu Ser Arg Leu Val Val Asp Phe Ser Gln Phe Ser Arg
35 40 45
Gly Asn Tyr Arg Val Ser Trp Pro Lys Phe Ala Val Pro Asn Leu Gln
50 55 60
Ser Leu Thr Asn Leu Leu Ser Ser Asn Leu Cys Trp Leu Ser Leu Asp
65 70 75 80
Val Ser Ala Ala Phe Tyr His Leu Pro Leu His Pro Ala Ala Met Pro
85 90 95
His Leu Leu Val Gly Ser Ser Gly Leu Ser Arg Tyr Val Ala Arg Leu
100 105 110
Ser Ser Asn Ser Arg Ile Ile Asn His Gln His Gly Thr Leu Gln Asn
115 120 125
Leu His Asp Ser Cys Ser Arg Asn Leu Tyr Val Ser Leu Leu Leu Leu
130 135 140
Tyr Lys Thr Phe Gly Trp Lys Leu His Leu Tyr Ser His Pro Ile Ile
145 150 155 160
Leu Gly Phe Arg Lys Ile Pro Met Gly Val Gly Leu Ser Pro Phe Leu
165 170 175
Leu Ala Gln Phe Thr Ser Ala Ile Cys Ser Val Val Arg Arg Ala Phe
180 185 190
Pro His Cys Leu Ala Phe Ser Gly Ala Lys Ser Val Gln His Leu Glu
195 200 205
Ser Leu Phe Thr Ala Val Thr Asn Phe Leu Leu Ser Leu Gly Ile His
210 215 220
Leu Asn Pro Asn Lys Thr Lys Arg Trp Gly Tyr Ser Leu Asn Phe Met
225 230 235 240
Gly Tyr Val Ile Gly Ser Trp Gly Ser Leu Pro Gln Asp His Ile Arg
245 250 255
His Lys Ile Lys Glu Cys Phe Arg Lys Leu Pro Val His Arg Pro Ile
260 265 270
Asp Trp Lys Val Cys Gln Arg Ile Val Gly Leu Leu Gly Phe Ala Ala
275 280 285
Pro Phe Thr Gln Cys Gly Tyr Pro Ala Leu Met Pro Leu Tyr Ala Cys
290 295 300
Ile Gln Ser Lys Gln Ala Phe Thr Phe Ser Pro Thr Tyr Lys Ala Phe
305 310 315 320
Leu Cys Lys Gln Tyr Leu Asn Leu Tyr Pro Val Ala Arg Gln Arg Pro
325 330 335
Gly Leu Cys Gln Val Phe Ala Asp Ala Thr Pro Thr Gly Trp Gly Leu
340 345 350
Val Met Gly His Gln Arg Met Arg Gly Thr Phe Ser Ser Arg Lys Tyr
355 360 365
Thr Ser Phe Pro Trp Leu Leu Gly Cys Ala Ala Asn Trp Ile Leu Arg
370 375 380
Gly Thr Ser Phe Val Tyr Val Pro Ser Ala Leu Asn Pro Ala Asp Asp
385 390 395 400
Pro Ser Arg Gly Arg Leu Gly Pro Cys Arg Pro Leu Leu His Leu Pro
405 410 415
Phe Arg Pro Thr Thr Gly Arg Thr Ser Leu Tyr Ala Asp Ser Pro Ser
420 425 430
Val Pro Ser His Leu Pro Asp Arg Val His Phe Ala Ser Pro Leu His
435 440 445
Val Ala Trp Arg Pro Pro
450
<210> 106
<211> 1014
<212> PRT
<213> Artificial Sequence
<220>
<223> HBV design 1
<400> 106
Met Glu Asn Ile Thr Ser Gly Phe Leu Gly Pro Leu Leu Val Leu Gln
1 5 10 15
Ala Gly Phe Phe Leu Leu Thr Arg Ile Leu Thr Ile Pro Gln Ser Leu
20 25 30
Asp Ser Trp Trp Thr Ser Leu Ser Phe Leu Gly Gly Thr Thr Val Cys
35 40 45
Leu Gly Gln Asn Ser Gln Ser Pro Thr Ser Asn His Ser Pro Thr Ser
50 55 60
Cys Pro Pro Thr Cys Val Gly Tyr Arg Trp Met Cys Leu Arg Arg Phe
65 70 75 80
Ile Ile Phe Leu Phe Ile Leu Leu Leu Cys Leu Ile Phe Leu Leu Val
85 90 95
Leu Leu Asp Tyr Gln Gly Met Leu Pro Val Cys Pro Leu Ile Pro Gly
100 105 110
Ser Ser Thr Thr Ser Thr Gly Pro Cys Arg Thr Cys Thr Thr Pro Ala
115 120 125
Gln Gly Thr Ser Met Tyr Pro Ser Cys Cys Cys Thr Lys Pro Ser Asp
130 135 140
Gly Asn Cys Thr Cys Ile Pro Ile Pro Ser Ser Trp Ala Phe Gly Lys
145 150 155 160
Phe Leu Trp Glu Trp Ala Ser Ala Arg Phe Ser Trp Leu Ser Leu Leu
165 170 175
Val Pro Phe Val Gln Trp Phe Val Gly Leu Ser Pro Thr Val Trp Leu
180 185 190
Ser Val Ile Trp Met Met Trp Tyr Trp Gly Pro Ser Leu Tyr Asn Thr
195 200 205
Leu Ser Pro Phe Leu Pro Leu Leu Pro Ile Phe Phe Tyr Leu Trp Val
210 215 220
Tyr Ile Met Gln Leu Phe His Leu Cys Leu Ile Ile Ser Cys Ser Cys
225 230 235 240
Pro Thr Val Gln Ala Ser Lys Leu Cys Leu Gly Trp Leu Trp Asp Met
245 250 255
Asp Ile Asp Pro Tyr Lys Glu Phe Gly Ala Ser Val Glu Leu Leu Ser
260 265 270
Phe Leu Pro Ser Asp Phe Phe Pro Ser Val Arg Asp Leu Leu Asp Thr
275 280 285
Ala Thr Ala Leu Tyr Arg Asp Ala Leu Glu Ser Pro Glu His Cys Thr
290 295 300
Pro His His Thr Ala Leu Arg His Val Cys Leu Cys Trp Gly Asp Leu
305 310 315 320
Met Asn Leu Ala Thr Trp Val Gly Thr Asn Leu Glu Asp Gln Ala Ser
325 330 335
Arg Asp Leu Val Val Ser Tyr Val Asn Thr Asn Met Gly Leu Lys Phe
340 345 350
Arg Gln Leu Leu Trp Phe His Ile Ser Cys Leu Thr Phe Gly Arg Asp
355 360 365
Leu Val Leu Glu Tyr Leu Val Ser Phe Gly Val Trp Ile Arg Thr Pro
370 375 380
Pro Ala Tyr Arg Pro Ser Asn Ala Pro Ile Leu Ser Thr Leu Pro Glu
385 390 395 400
Thr Thr Val Val Arg Gln Met Ala Ala Arg Leu Cys Cys Gln Leu Asp
405 410 415
Pro Ala Arg Asp Val Leu Cys Leu Arg Pro Val Gly Ala Glu Ser Arg
420 425 430
Gly Arg Pro Phe Ser Gly Pro Leu Gly Ala Leu Ser Ser Ser Ser Pro
435 440 445
Pro Ala Val Pro Thr Asp His Gly Ala His Leu Ser Leu Arg Gly Leu
450 455 460
Pro Val Cys Ala Phe Ser Ser Ala Gly Pro Cys Ala Leu Arg Phe Thr
465 470 475 480
Ser Ala Arg Arg Met Glu Thr Thr Val Asn Ala His Gln Phe Leu Pro
485 490 495
Lys Val Leu His Lys Arg Thr Leu Gly Leu Ser Ala Met Ser Thr Thr
500 505 510
Asp Leu Glu Ala Tyr Phe Lys Asp Cys Leu Phe Lys Asp Trp Glu Glu
515 520 525
Leu Gly Glu Glu Leu Arg Leu Lys Val Phe Val Leu Gly Gly Cys Arg
530 535 540
His Lys Leu Val Cys Ala Pro Ala Pro Cys Asn Phe Phe Thr Ser Ala
545 550 555 560
Gly Pro Cys Ala Glu His Gly Glu His His Ile Arg Ile Pro Arg Thr
565 570 575
Pro Ala Arg Val Thr Gly Gly Val Phe Leu Val Asp Lys Asn Pro His
580 585 590
Asn Thr Ala Glu Ser Arg Leu Val Val Asp Phe Ser Gln Phe Ser Arg
595 600 605
Gly Asn Tyr Arg Val Ser Trp Pro Lys Phe Ala Val Pro Asn Leu Gln
610 615 620
Ser Leu Thr Asn Leu Leu Ser Ser Asn Leu Cys Trp Leu Ser Leu Asp
625 630 635 640
Val Ser Ala Ala Phe Tyr His Leu Pro Leu His Pro Ala Ala Met Pro
645 650 655
His Leu Leu Val Gly Ser Ser Gly Leu Ser Arg Tyr Val Ala Arg Leu
660 665 670
Ser Ser Asn Ser Arg Ile Ile Asn His Gln His Gly Thr Leu Gln Asn
675 680 685
Leu His Asp Ser Cys Ser Arg Asn Leu Tyr Val Ser Leu Leu Leu Leu
690 695 700
Tyr Lys Thr Phe Gly Trp Lys Leu His Leu Tyr Ser His Pro Ile Ile
705 710 715 720
Leu Gly Phe Arg Lys Ile Pro Met Gly Val Gly Leu Ser Pro Phe Leu
725 730 735
Leu Ala Gln Phe Thr Ser Ala Ile Cys Ser Val Val Arg Arg Ala Phe
740 745 750
Pro His Cys Leu Ala Phe Ser Gly Ala Lys Ser Val Gln His Leu Glu
755 760 765
Ser Leu Phe Thr Ala Val Thr Asn Phe Leu Leu Ser Leu Gly Ile His
770 775 780
Leu Asn Pro Asn Lys Thr Lys Arg Trp Gly Tyr Ser Leu Asn Phe Met
785 790 795 800
Gly Tyr Val Ile Gly Ser Trp Gly Ser Leu Pro Gln Asp His Ile Arg
805 810 815
His Lys Ile Lys Glu Cys Phe Arg Lys Leu Pro Val His Arg Pro Ile
820 825 830
Asp Trp Lys Val Cys Gln Arg Ile Val Gly Leu Leu Gly Phe Ala Ala
835 840 845
Pro Phe Thr Gln Cys Gly Tyr Pro Ala Leu Met Pro Leu Tyr Ala Cys
850 855 860
Ile Gln Ser Lys Gln Ala Phe Thr Phe Ser Pro Thr Tyr Lys Ala Phe
865 870 875 880
Leu Cys Lys Gln Tyr Leu Asn Leu Tyr Pro Val Ala Arg Gln Arg Pro
885 890 895
Gly Leu Cys Gln Val Phe Ala Asp Ala Thr Pro Thr Gly Trp Gly Leu
900 905 910
Val Met Gly His Gln Arg Met Arg Gly Thr Phe Ser Ser Arg Lys Tyr
915 920 925
Thr Ser Phe Pro Trp Leu Leu Gly Cys Ala Ala Asn Trp Ile Leu Arg
930 935 940
Gly Thr Ser Phe Val Tyr Val Pro Ser Ala Leu Asn Pro Ala Asp Asp
945 950 955 960
Pro Ser Arg Gly Arg Leu Gly Pro Cys Arg Pro Leu Leu His Leu Pro
965 970 975
Phe Arg Pro Thr Thr Gly Arg Thr Ser Leu Tyr Ala Asp Ser Pro Ser
980 985 990
Val Pro Ser His Leu Pro Asp Arg Val His Phe Ala Ser Pro Leu His
995 1000 1005
Val Ala Trp Arg Pro Pro
1010
<210> 107
<211> 1021
<212> PRT
<213> Artificial Sequence
<220>
<223> HBV design 2
<400> 107
Ser Val Glu Leu Leu Ser Phe Leu Pro Ser Asp Phe Phe Pro Ser Val
1 5 10 15
Arg Asp Leu Leu Asp Thr Ala Thr Ala Leu Tyr Arg Asp Ala Leu Glu
20 25 30
Ser Pro Glu His Cys Thr Pro His His Thr Ala Leu Arg His Val Cys
35 40 45
Leu Cys Trp Gly Asp Leu Met Asn Leu Ala Thr Trp Val Gly Thr Asn
50 55 60
Leu Glu Asp Gln Ala Ser Arg Asp Leu Val Val Ser Tyr Val Asn Thr
65 70 75 80
Asn Met Gly Leu Lys Phe Arg Gln Leu Leu Trp Phe His Ile Ser Cys
85 90 95
Leu Thr Phe Gly Arg Asp Leu Val Leu Glu Tyr Leu Val Ser Phe Gly
100 105 110
Val Trp Ile Arg Thr Pro Pro Ala Tyr Arg Pro Ser Asn Ala Pro Ile
115 120 125
Leu Ser Thr Leu Pro Glu Thr Thr Val Val Arg Gln Arg Gly Arg Thr
130 135 140
Ile Val Leu His Lys Arg Thr Leu Gly Leu Met Gly Gln Asn Leu Ser
145 150 155 160
Thr Ser Asn Pro Leu Gly Phe Phe Pro Asp His Gln Leu Asp Pro Ala
165 170 175
Phe Arg Ala Asn Thr Asn Asn Pro Asp Trp Asp Phe Asn Pro Asn Lys
180 185 190
Asp Thr Trp Pro Asp Ala Asn Lys Val Gly Ala Gly Ala Phe Gly Leu
195 200 205
Gly Phe Thr Pro Pro His Gly Gly Leu Leu Gly Trp Ser Pro Gln Ala
210 215 220
Gln Gly Ile Met Gln Thr Leu Pro Ala Asn Pro Pro Pro Ala Ser Thr
225 230 235 240
Asn Arg Gln Ser Gly Arg Gln Pro Thr Pro Leu Leu Pro Lys Val Leu
245 250 255
His Lys Arg Thr Leu Met Pro Leu Ser Tyr Gln His Phe Arg Lys Leu
260 265 270
Leu Leu Leu Asp Asn Glu Ala Gly Pro Leu Glu Glu Glu Leu Pro Arg
275 280 285
Leu Ala Asp Glu Asp Leu Asn Arg Arg Val Ala Glu Asp Leu Asn Leu
290 295 300
Gly Asn Leu Asn Val Ser Ile Pro Trp Thr His Lys Val Gly Asn Phe
305 310 315 320
Thr Gly Leu Tyr Ser Ser Ser Val Pro Val Phe Asn Pro His Trp Lys
325 330 335
Thr Pro Ser Phe Pro Asn Ile His Leu His Gln Asp Ile Ile Lys Lys
340 345 350
Cys Glu Gln Phe Val Gly Pro Leu Thr Val Asn Glu Lys Arg Arg Leu
355 360 365
Lys Leu Ile Met Pro Ala Arg Phe Tyr Pro Asn Phe Thr Lys Tyr Leu
370 375 380
Pro Leu Asp Lys Gly Ile Lys Pro Tyr Tyr Pro Glu His Leu Val Asn
385 390 395 400
His Tyr Phe His Thr Arg His Tyr Leu His Thr Leu Trp Lys Ala Gly
405 410 415
Ile Leu Tyr Lys Arg Val Ser Thr His Ser Ala Ser Phe Cys Gly Ser
420 425 430
Pro Tyr Ser Trp Glu Gln Glu Leu Gln His Gly Ala Glu Ser Phe His
435 440 445
Gln Gln Ser Ser Gly Ile Leu Ser Arg Pro Ser Val Gly Ser Ser Leu
450 455 460
Gln Ser Lys His Gln Gln Ser Arg Leu Gly Leu Gln Ser Gln Gln Gly
465 470 475 480
His Leu Ala Arg Arg Gln Gln Gly Arg Ser Trp Ser Ile Arg Thr Arg
485 490 495
Val His Pro Thr Ala Arg Arg Pro Ser Gly Val Glu Pro Ser Gly Ser
500 505 510
Gly His Asn Ala Asn Leu Ala Ser Lys Ser Ala Ser Cys Leu Tyr Gln
515 520 525
Ser Thr Val Arg Thr Ala Ala Tyr Pro Ala Val Ser Thr Ser Glu Asn
530 535 540
His Ser Ser Ser Gly His Ala Val Glu Leu His Asn Leu Pro Pro Asn
545 550 555 560
Ser Ala Arg Ser Gln Ser Glu Arg Pro Val Ser Pro Cys Trp Trp Leu
565 570 575
Gln Phe Arg Asn Ser Lys Pro Cys Ser Asp Tyr Cys Leu Ser His Ile
580 585 590
Val Asn Leu Leu Glu Asp Trp Gly Pro Cys His Lys Arg Thr Leu Gly
595 600 605
Leu Ser Ala Met Ser Pro Pro Leu Arg Thr Thr His Pro Gln Ala Met
610 615 620
Gln Trp Asn Ser Thr Thr Phe His Gln Thr Leu Gln Asp Pro Arg Val
625 630 635 640
Arg Gly Leu Tyr Leu Pro Ala Gly Gly Ser Ser Ser Gly Thr Val Asn
645 650 655
Pro Val Pro Thr Thr Ala Ser Pro Thr Leu Ser Thr Ser Ser Arg Ile
660 665 670
Gly Asp Pro Ala Leu Asn Gln Phe Leu Pro Lys Val Leu His Lys Arg
675 680 685
Ser Arg Gly Asn Tyr Arg Val Ser Trp Pro Lys Phe Ala Val Pro Asn
690 695 700
Leu Gln Ser Leu Thr Asn Leu Leu Ser Ser Asn Leu Cys Trp Leu Ser
705 710 715 720
Leu Asp Val Ser Ala Ala Phe Tyr His Leu Pro Leu His Pro Ala Ala
725 730 735
Met Pro His Leu Leu Val Gly Ser Ser Gly Leu Ser Arg Tyr Val Ala
740 745 750
Arg Leu Ser Ser Asn Ser Arg Ile Ile Asn His Gln His Gly Thr Leu
755 760 765
Gln Asn Leu His Asp Ser Cys Ser Arg Asn Leu Tyr Val Ser Leu Leu
770 775 780
Leu Leu Tyr Lys Thr Phe Gly Trp Lys Leu His Leu Tyr Ser His Pro
785 790 795 800
Ile Ile Leu Gly Phe Arg Lys Ile Pro Met Gly Val Gly Leu Ser Pro
805 810 815
Phe Leu Leu Ala Gln Phe Thr Ser Ala Ile Thr Val Asn Ala His Gln
820 825 830
Phe Leu Pro Lys Gln Asn Ser Gln Ser Pro Thr Ser Asn His Ser Pro
835 840 845
Thr Ser Cys Pro Pro Thr Cys Val Gly Tyr Arg Trp Met Cys Leu Arg
850 855 860
Arg Phe Ile Ile Phe Leu Phe Ile Leu Leu Leu Cys Leu Ile Phe Leu
865 870 875 880
Leu Val Leu Leu Asp Tyr Gln Gly Met Leu Pro Val Cys Pro Leu Ile
885 890 895
Pro Gly Ser Ser Thr Thr Ser Thr Gly Pro Cys Arg Thr Cys Thr Thr
900 905 910
Pro Ala Gln Gly Thr Ser Met Tyr Pro Ser Cys Cys Cys Thr Lys Pro
915 920 925
Ser Asp Gly Asn Cys Thr Cys Ile Pro Ile Pro Ser Ser Trp Ala Phe
930 935 940
Gly Lys Phe Leu Trp Glu Trp Ala Ser Ala Arg Phe Ser Trp Leu Ser
945 950 955 960
Leu Leu Val Pro Phe Val Gln Trp Phe Val Gly Leu Ser Pro Thr Val
965 970 975
Trp Leu Ser Val Ile Trp Met Met Trp Tyr Trp Gly Pro Ser Leu Tyr
980 985 990
Asn Thr Leu Ser Pro Phe Leu Pro Leu Leu Pro Ile Phe Phe Tyr Leu
995 1000 1005
Trp Val Tyr Ile Leu Ser Ala Met Ser Thr Thr Asp Leu
1010 1015 1020
<210> 108
<211> 532
<212> PRT
<213> Artificial Sequence
<220>
<223> HBV design 3
<400> 108
Met Gln Thr Asp Arg Thr Gly Glu Thr Ala Leu His Leu Ala Ala Arg
1 5 10 15
Tyr Ser Arg Ser Asp Phe Leu Pro Ser Asp Phe Phe Pro Ser Val Ala
20 25 30
Asp Ala Gly Val Trp Ile Arg Thr Pro Pro Ala Asp Asn Met Glu Tyr
35 40 45
Leu Val Ser Phe Gly Val Trp Pro Leu His Ala Ala Val Ser Ala Asp
50 55 60
Cys Trp Gly Glu Leu Met Thr Leu Arg Asn Arg Ala Thr Asp Leu Gly
65 70 75 80
Gly Pro Asn Leu Asp Asn Ile Leu Met His Asp Ile Leu Arg Ser Phe
85 90 95
Ile Pro Leu Leu Pro Leu Ile Leu Ala Ala Arg Leu Ala Val Ser Thr
100 105 110
Leu Pro Glu Thr Thr Val Val Arg Arg Ser His Ala Asp Val Phe Leu
115 120 125
Gly Gly Pro Pro Val Cys Leu Asp Asp Leu Phe Leu Leu Thr Arg Ile
130 135 140
Leu Thr Ile Ala Leu His Trp Ala Ala Ala Val Asn Asn Val Leu Thr
145 150 155 160
Phe Gly Arg Glu Thr Val Leu Glu Tyr Gly Ala Asn Lys Trp Leu Ser
165 170 175
Leu Leu Val Pro Phe Val Asn Asn Arg Phe Leu Lys Gln Gln Tyr Met
180 185 190
Asn Leu Pro Leu Phe Leu Ala Ala Arg Glu Gly Ser Tyr Glu Asp Leu
195 200 205
Leu Asp Thr Ala Ser Ala Leu Tyr Ala Asn Arg Phe Leu Ser Lys Gln
210 215 220
Tyr Met Asp Leu Asp His Met Thr Val Ser Thr Lys Leu Cys Lys Ile
225 230 235 240
Pro Arg Asp Leu Trp Phe His Ile Ser Cys Leu Thr Phe Ile Val Arg
245 250 255
Leu Leu Asp Leu Glu Val Ser Gln Thr Ser Lys Leu Thr Arg Gln Thr
260 265 270
Asp Arg Thr Gly Glu Thr Ala Leu His Leu Ala Ala Arg Tyr Ser Arg
275 280 285
Ser Asp Leu Thr Thr Val Pro Ala Ala Ser Leu Leu Ala Ala Asp Ala
290 295 300
Gly Leu Ser Arg Tyr Val Ala Arg Leu Asp Asn Met Lys Leu His Leu
305 310 315 320
Tyr Ser His Pro Ile Pro Leu His Ala Ala Val Ser Ala Asp Gly Leu
325 330 335
Ser Pro Thr Val Trp Leu Ser Val Arg Asn Arg Ala Thr Asp Leu Phe
340 345 350
Leu Leu Ser Leu Gly Ile His Leu Met His Asp Ser Leu Tyr Ala Asp
355 360 365
Ser Pro Ser Val Pro Leu Ile Leu Ala Ala Arg Leu Ala Val His Lys
370 375 380
Arg Thr Leu Gly Leu Ser Ala Met Ser His Ala Asp Val Thr Leu Cys
385 390 395 400
Ile Pro His Val Ala Val Asp Asp Leu Leu Leu Leu Lys Ala Thr Leu
405 410 415
Cys Ile Ala Leu His Trp Ala Ala Ala Val Asn Asn Val Gln Phe Leu
420 425 430
Pro Lys Val Leu His Lys Arg Gly Ala Asn Lys Ala Leu Met Pro Leu
435 440 445
Tyr Ala Cys Ile Asn Asn Arg Thr Val Asn Ala His Gln Phe Leu Pro
450 455 460
Lys Pro Leu Phe Leu Ala Ala Arg Glu Gly Ser Tyr Glu Leu Pro Lys
465 470 475 480
Val Leu His Lys Arg Thr Leu Ala Asn Arg Val Leu His Lys Arg Thr
485 490 495
Leu Gly Leu Asp His Met Leu Ser Ala Met Ser Thr Thr Asp Leu Pro
500 505 510
Arg Asp Leu Leu Val Pro Phe Val Gln Trp Phe Val Ile Val Arg Leu
515 520 525
Leu Asp Leu Glu
530
<210> 109
<211> 368
<212> PRT
<213> Artificial Sequence
<220>
<223> HBV design 4
<400> 109
Lys Lys Phe Leu Pro Ser Asp Phe Phe Pro Ser Val Lys Lys Cys Trp
1 5 10 15
Gly Glu Leu Met Thr Leu Lys Lys Gly Val Trp Ile Arg Thr Pro Pro
20 25 30
Ala Lys Lys Ser Thr Leu Pro Glu Thr Thr Val Val Arg Arg Lys Lys
35 40 45
Leu Thr Phe Gly Arg Glu Thr Val Leu Glu Tyr Lys Lys Asp Leu Leu
50 55 60
Asp Thr Ala Ser Ala Leu Tyr Lys Lys Leu Trp Phe His Ile Ser Cys
65 70 75 80
Leu Thr Phe Lys Lys Glu Tyr Leu Val Ser Phe Gly Val Trp Lys Lys
85 90 95
Gly Gly Pro Asn Leu Asp Asn Ile Leu Lys Lys Leu Thr Thr Val Pro
100 105 110
Ala Ala Ser Leu Leu Ala Lys Lys Ile Leu Arg Ser Phe Ile Pro Leu
115 120 125
Leu Lys Lys Phe Leu Gly Gly Pro Pro Val Cys Leu Lys Lys Phe Leu
130 135 140
Leu Thr Arg Ile Leu Thr Ile Lys Lys Trp Leu Ser Leu Leu Val Pro
145 150 155 160
Phe Val Lys Lys Gly Leu Ser Pro Thr Val Trp Leu Ser Val Lys Lys
165 170 175
Leu Leu Val Pro Phe Val Gln Trp Phe Val Lys Lys Phe Leu Lys Gln
180 185 190
Gln Tyr Met Asn Leu Lys Lys Phe Leu Ser Lys Gln Tyr Met Asp Leu
195 200 205
Lys Lys Thr Val Ser Thr Lys Leu Cys Lys Ile Lys Lys Gly Leu Ser
210 215 220
Arg Tyr Val Ala Arg Leu Lys Lys Lys Leu His Leu Tyr Ser His Pro
225 230 235 240
Ile Lys Lys Phe Leu Leu Ser Leu Gly Ile His Leu Lys Lys Ser Leu
245 250 255
Tyr Ala Asp Ser Pro Ser Val Lys Lys Ala Leu Met Pro Leu Tyr Ala
260 265 270
Cys Ile Lys Lys Leu Leu Leu Lys Ala Thr Leu Cys Ile Lys Lys Thr
275 280 285
Leu Cys Ile Pro His Val Ala Val Lys Lys Val Leu His Lys Arg Thr
290 295 300
Leu Gly Leu Lys Lys Leu Pro Lys Val Leu His Lys Arg Thr Leu Lys
305 310 315 320
Lys His Lys Arg Thr Leu Gly Leu Ser Ala Met Lys Lys Gln Phe Leu
325 330 335
Pro Lys Val Leu His Lys Arg Lys Lys Thr Val Asn Ala His Gln Phe
340 345 350
Leu Pro Lys Lys Lys Leu Ser Ala Met Ser Thr Thr Asp Leu Lys Lys
355 360 365
<210> 110
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> splice primer
<400> 110
Thr Gly Cys Cys Ala Ala Gly Ala Gly Thr Gly Ala Cys Gly Thr Gly
1 5 10 15
Thr Cys Cys Ala
20
<210> 111
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Cleavable linker
<400> 111
Val Ser Gln Thr Ser Lys Leu Thr Arg
1 5
<210> 112
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> HBV Peptides from Surface 1
<400> 112
Gly Gly Pro Asn Leu Asp Asn Ile Leu
1 5
<210> 113
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> HBV Peptides from Surface 2
<400> 113
Leu Thr Thr Val Pro Ala Ala Ser Leu Leu Ala
1 5 10
<210> 114
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> HBV Peptides from Surface 3
<400> 114
Ile Leu Arg Ser Phe Ile Pro Leu Leu
1 5
<210> 115
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> HBV Peptides from Surface 4
<400> 115
Phe Leu Gly Gly Pro Pro Val Cys Leu
1 5
<210> 116
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> HBV Peptides from Surface 5
<400> 116
Phe Leu Leu Thr Arg Ile Leu Thr Ile
1 5
<210> 117
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> HBV Peptides from Surface 6
<400> 117
Trp Leu Ser Leu Leu Val Pro Phe Val
1 5
<210> 118
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> HBV Peptides from Surface 7
<400> 118
Gly Leu Ser Pro Thr Val Trp Leu Ser Val
1 5 10
<210> 119
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> HBV Peptides from Surface 8
<400> 119
Leu Leu Val Pro Phe Val Gln Trp Phe Val
1 5 10
<210> 120
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Hepatitis B Spliced Protein 1
<400> 120
Leu Leu Leu Lys Ala Thr Leu Cys Ile
1 5
<210> 121
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Hepatitis B Spliced Protein 2
<400> 121
Thr Leu Cys Ile Pro His Val Ala Val
1 5
<210> 122
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> HBx protein
<400> 122
Val Leu His Lys Arg Thr Leu Gly Leu
1 5
<210> 123
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> HBx protein
<400> 123
Leu Pro Lys Val Leu His Lys Arg Thr Leu
1 5 10
<210> 124
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> HBx protein
<400> 124
His Lys Arg Thr Leu Gly Leu Ser Ala Met
1 5 10
<210> 125
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> HBx protein
<400> 125
Gln Phe Leu Pro Lys Val Leu His Lys Arg
1 5 10
<210> 126
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> HBx protein
<400> 126
Thr Val Asn Ala His Gln Phe Leu Pro Lys
1 5 10
<210> 127
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> HBx protein
<400> 127
Leu Ser Ala Met Ser Thr Thr Asp Leu
1 5
<210> 128
<211> 21
<212> PRT
<213> Artificial Sequence
<220>
<223> splice probe
<400> 128
Cys Cys Cys Ala Gly Gly Thr Cys Cys Ala Ala Cys Thr Gly Cys Ala
1 5 10 15
Gly Cys Cys Gly Gly
20
<210> 129
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> Rigid Linker
<400> 129
Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys
1 5 10
<210> 130
<211> 12
<212> DNA
<213> Artificial Sequence
<220>
<223> Furin Linker
<400> 130
agagctaaga gg 12
Claims (34)
- 하나 이상의 면역 반응-유도성(immune response-inducing) B형 간염 바이러스(HBV) 폴리펩타이드를 포함하는 폴리펩타이드를 암호화하는 비-천연적으로 발생하는(non-naturally occurring) 폴리뉴클레오타이드(non-naturally occurring polynucleotide).
- 제1항에 있어서, 상기 하나 이상의 HBV 폴리펩타이드가 HBV 코어 펩타이드(Core peptide), HBV 표면 펩타이드(Surface peptide), HBV Pol 펩타이드, HBV HBSP/HBx 펩타이드, KK 링커, 또는 이의 임의의 조합을 포함하는 폴리뉴클레오타이드.
- 제2항에 있어서,
(i) 상기 HBV 코어 펩타이드가 표 3에 나타낸 바와 같은 코어 펩타이드 서열 중 임의의 하나를 가지거나,
(ii) 상기 HBV 표면 펩타이드가 표 3에 나타낸 바와 같은 표면 펩타이드 서열 중 임의의 하나를 가지거나,
(iii) 상기 HBV Pol 펩타이드가 표 3에 나타낸 바와 같은 the Pol 펩타이드 서열 중 임의의 하나를 가지거나,
(iv) 상기 HBV HBSP/HBx 펩타이드가 표 3에 나타낸 바와 같은 HBSP/HBx 펩타이드 서열 중 임의의 하나를 가지거나,
(v) 상기 KK 링커가 표 3에 나타낸 바와 같은 펩타이드 서열 중 임의의 하나를 표 3에 나타낸 바와 같은 임의의 다른 펩타이드 서열에 연결시키거나, 또는
(vi) (i) 내지 (v)의 임의의 조합인 폴리뉴클레오타이드. - 제1항 내지 제3항 중 어느 한 항에 있어서, 이종 유전자 발현의 유도성 제어를 위한 유전자 스위치 시스템을 암호화하는 하나 이상의 폴리뉴클레오타이드를 추가로 포함하고, 여기서 이종 유전자 발현이 상기 유전자 스위치 시스템에 의해 조절되며; 상기 이종 유전자가 제1항 내지 제3항 중 어느 한 항에 따른 폴리뉴클레오타이드를 포함하는 폴리뉴클레오타이드.
- 제4항에 있어서, 상기 유전자 스위치 시스템이 엑다이손 수용체(ecdysone receptor)-기반(EcR-based) 유전자 스위치 시스템인 폴리뉴클레오타이드.
- 세포 내에서 이종 유전자의 발현을 조절하는 방법으로서, 이러한 방법이:
(a) 상기 세포 내로
(i) 억제성(repressible) 또는 유도성(inducible) 유전자 스위치(gene switch), 및
(ii) 이종 면역 반응-유도성 유전자를 포함하는 하나 이상의 폴리뉴클레오타이드를 도입시키는 단계로서, 상기 이종 면역 반응-유도성 유전자의 발현이 상기 유전자 스위치에 의해 조절되고, 상기 이종 면역 반응-유도성 유전자가 하나 이상의 HBV 폴리펩타이드 중 적어도 하나를 암호화하는 단계; 및
(b) 상기 세포를 상기 이종 면역 반응-유도성 유전자의 발현을 억제하거나 유도하는데 충분한 양의 화합물에 노출시키는 단계를 포함하는 방법. - 제6항에 있어서, 상기 유전자 스위치가 엑다이손 수용체(EcR), 편재하는 수용체(ubiquitous receptor), 오르판 수용체(orphan receptor) 1, NER-1, 스테로이드 호르몬 핵 수용체 1, 레티노이드 X 수용체 상호작용 단백질-15, 간 X 수용체 β, 스테로이드 호르몬 수용체 유사 단백질, 간 X 수용체, 간 X 수용체 α, 파르네소이드 X 수용체, 수용체 상호작용 단백질 14, 및 파메솔 수용체(famesol receptor) 중 적어도 하나로부터 기원한 리간드 결합 도메인을 포함하는 방법.
- 폴리펩타이드 작제물로서, 상기 폴리펩타이드 작제물이:
(a) HBV HBx 도메인 및, HBV Pol 도메인, HBV 코어 도메인, HBV 프레-코어 도메인(pre-Core domain) 또는 HBV 표면 도메인; 또는
(b) 프레-코어 도메인 및, HBV Pol 도메인, HBV HBx 도메인 또는 HBV 표면 도메인 중 적어도 하나를 포함하는 폴리펩타이드 작제물. - 제8항에 있어서,
(i) 상기 HBV HBx 도메인이 서열 번호: 98에 나타낸 바와 같은 서열을 갖거나;
(ii) 상기 HBV Pol 도메인이 야생형 HBV Pol 도메인과 비교하여 적어도 하나의 아미노산의 결실을 포함하거나;
(iii) 상기 HBV 표면 도메인이 PreS1 도메인, PreS2 도메인 및 S 도메인 중 적어도 하나를 포함하거나; 또는
(iv) 이의 임의의 조합인 폴리펩타이드 작제물. - 제8항 또는 제9항에 있어서,
(i) 상기 HBV Pol 도메인이 서열 번호: 99에 나타낸 바와 같은 서열을 갖거나,
(ii) 상기 HBV 표면 도메인이 서열 번호: 100에 나타낸 바와 같은 서열을 갖거나,
(ii) 상기 HBV 코어 도메인 및 상기 HBV 프레-코어 도메인("코어 부위")가 서열 번호: 101에 나타낸 바와 같은 서열을 갖거나, 또는
(iv) 이의 임의의 조합인 폴리펩타이드 작제물. - 제8항 내지 제10항 중 어느 한 항에 있어서, 상기 폴리펩타이드 작제물이 각각의 SHB(Env), HBeAg, HBx, 및 Pol 도메인을 포함하는 폴리펩타이드 작제물.
- 제11항에 있어서,
(i) 상기 SHB(Env) 도메인이 서열 번호: 102에 나타낸 바와 같은 서열을 갖거나,
(ii) 상기 HBeAg 도메인이 서열 번호: 103에 나타낸 바와 같은 서열을 갖거나,
(iii) 상기 HBx 도메인이 서열 번호: 104에 나타낸 바와 같은 서열을 갖거나, 또는
(iv) 상기 Pol 도메인이 서열 번호: 105에 나타낸 바와 같은 서열을 갖는 폴리펩타이드 작제물. - 제8항 내지 제12항 중 어느 한 항에 있어서, 상기 폴리펩타이드 작제물이 서열 번호: 106에 나타낸 바와 같은 서열을 갖는 폴리펩타이드 작제물.
- 제8항 내지 제13항 중 어느 한 항에 있어서, 강직성 링커(rigd linker)를 추가로 포함하는 폴리펩타이드 작제물.
- 제8항 내지 제14항 중 어느 한 항에 있어서, 상기 폴리펩타이드가 서열 번호: 112에 나타낸 바와 같은 서열을 갖는 폴리펩타이드 작제물.
- 폴리펩타이드 작제물로서, 상기 폴리펩타이드 작제물이 하나 이상의 HBV HBx 링커 및, 코어 도메인, 표면 도메인 및 Pol 도메인 중 적어도 하나를 포함하고, 상기 코어 도메인, 상기 표면 도메인 및 상기 Pol 도메인 중 하나는 상기 코어 도메인, 상기 표면 도메인 및 상기 Pol 도메인 중 다른 것에 상기 하나 이상의 HBx 링커에 의해 연결되어 있는 폴리펩타이드 작제물.
- 제16항에 있어서,
(i) 상기 표면 도메인이 HBV PreS1 도메인, HBV PreS2 도메인 및 HBV S 도메인 중 적어도 하나를 포함하거나;
(ii) 상기 하나 이상의 HBV HBx 링커가 표 3의 HBx-1, HBx-2, HBx-3, HBx-4, HBx-5 또는 HBx-6 중 어느 하나에 나타낸 바와 같은 서열을 포함하거나; 또는
(iii) (i) 또는 (ii) 둘 다인 폴리펩타이드 작제물. - 제16항 또는 제17항에 있어서, 상기 코어 도메인이 상기 표면 도메인에 인접해 있는 폴리펩타이드 작제물.
- 제16항 내지 제18항 중 어느 한 항에 있어서, 상기 표면 도메인이 PreS1 도메인, PreS2 도메인, S 도메인, 또는 이의 임의의 조합을 포함하는 폴리펩타이드 작제물.
- 제16항 내지 제19항 중 어느 한 항에 있어서, 상기 폴리펩타이드 작제물이 서열 번호: 107에 나타낸 바와 같은 서열을 갖는 폴리펩타이드 작제물.
- 안키린-유사 반복체 도메인(ankyrin-like repeat domain) 및 하나 이상의 HBV 펩타이드를 포함하는 펩타이드 작제물.
- 제21항에 있어서,
(i) 상기 안키린-유사 반복체 단백질(ankyrin-like repeat protein)이 사람 안키린-유사 반복체 단백질이고,
(ii) 상기 하나 이상의 HBV 펩타이드가 표 3의 아미노산 서열 중 임의의 하나에 나타낸 바와 같은 서열을 갖는 폴리펩타이드 작제물. - 제21항 또는 제22항에 있어서, 상기 하나 이상의 HBV 펩타이드가 코어 펩타이드, 표면 펩타이드, Pol 펩타이드 및 HBSP/HBx 펩타이드 중 하나 이상을 포함하는 폴리펩타이드 작제물.
- 제23항에 있어서,
(i) 상기 코어 펩타이드가 표 3의 코어 아미노산 서열 중 임의의 하나에 나타낸 바와 같은 서열을 갖거나;
(ii) 상기 표면 펩타이드가 표 3의 표면 아미노산 서열 중 임의의 하나에 나타낸 바와 같은 서열을 갖거나;
(iii) 상기 Pol 펩타이드가 표 3의 Pol 아미노산 서열 중 임의의 하나에 나타낸 바와 같은 서열을 갖거나;
(iv) 상기 HBSP/HBx 펩타이드가 표 3의 HBSP/HBx 아미노산 서열 중 임의의 하나에 나타낸 바와 같은 서열을 갖거나; 또는
(v) 이의 임의의 조합인 폴리펩타이드 작제물. - 제21항 내지 제24항 중 어느 한 항에 있어서, 상기 폴리펩타이드 작제물이 서열 번호: 108에 나타낸 바와 같은 서열을 갖는 폴리펩타이드 작제물.
- 폴리펩타이드 작제물로서, 상기 폴리펩타이드 작제물이 표 3에 나타낸 바와 같은 적어도 2개의 HBV 아미노산 서열을 포함하고, 상기 적어도 2개의 HBV 아미노산 서열이 펩타이드 링커에 의해 연결되어 있으며, 상기 펩타이드 링커가 KK 링커인 폴리펩타이드 작제물.
- 제26항에 있어서, 상기 적어도 2개의 HBV 아미노산 서열이 표 3에 나타낸 바와 같은 코어 펩타이드, 표면 펩타이드, Pol 펩타이드 및 HBSP/HBx 펩타이드 중 적어도 하나를 포함하는 폴리펩타이드 작제물.
- 제26항 또는 제27항에 있어서, 상기 적어도 2개의 HBV 아미노산 서열이 표 3에 나타낸 바와 같은 각각의 아미노산 서열을 포함하는 폴리펩타이드 작제물.
- 제26항 내지 제28항 중 어느 한 항에 있어서, 상기 폴리펩타이드 작제물이 서열 번호: 109에 나타낸 바와 같은 서열을 갖는 폴리펩타이드 작제물.
- 제8항 내지 제29항 중 어느 한 항에 따른 폴리펩타이드 작제물을 암호화하는 폴리뉴클레오타이드.
- 제1항 내지 제5항 및 제30항 중 어느 한 항에 따른 폴리펩타이드를 포함하는 벡터(vector).
- 제31항에 있어서, 상기 벡터가 아데노바이러스 벡터인 벡터.
- 제32항에 있어서, 상기 아데노바이러스 벡터가 고릴라(gorilla) 아데노바이러스 벡터인 벡터.
- 백신에서 사용하기 위한, 제1항 내지 제5항 및 제30항 중 어느 한 항에 따른 폴리뉴클레오타이드, 제8항 내지 제29항 중 어느 한 항에 따른 폴리펩타이드 작제물, 또는 제31항 내지 제33항 중 어느 한 항에 따른 벡터.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862639354P | 2018-03-06 | 2018-03-06 | |
US62/639,354 | 2018-03-06 | ||
PCT/US2019/020930 WO2019173463A1 (en) | 2018-03-06 | 2019-03-06 | Hepatitis b vaccines and uses of the same |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20200128703A true KR20200128703A (ko) | 2020-11-16 |
Family
ID=67845806
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020207028021A KR20200128703A (ko) | 2018-03-06 | 2019-03-06 | B형 간염 백신 및 이의 용도 |
Country Status (11)
Country | Link |
---|---|
US (2) | US11608362B2 (ko) |
EP (1) | EP3762010A4 (ko) |
JP (2) | JP2021514666A (ko) |
KR (1) | KR20200128703A (ko) |
CN (1) | CN112135622A (ko) |
AU (1) | AU2019231652A1 (ko) |
CA (1) | CA3092935A1 (ko) |
IL (1) | IL277128A (ko) |
SG (1) | SG11202008508QA (ko) |
WO (1) | WO2019173463A1 (ko) |
ZA (1) | ZA202005672B (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2019231652A1 (en) | 2018-03-06 | 2020-10-01 | Precigen, Inc. | Hepatitis B vaccines and uses of the same |
CN114929264A (zh) * | 2019-10-09 | 2022-08-19 | E·弗里奇 | 多结构域蛋白疫苗 |
Family Cites Families (86)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4985461A (en) | 1985-10-21 | 1991-01-15 | Rohm And Haas Company | Insecticidal N'-substituted-N,N'-diacylhydrazines |
US5117057A (en) | 1985-10-21 | 1992-05-26 | Rohm And Haas Company | Insecticidal N' substituted-N-N'-disubstituted-hydrazines |
GB8601597D0 (en) | 1986-01-23 | 1986-02-26 | Wilson R H | Nucleotide sequences |
FR2593630B1 (fr) | 1986-01-27 | 1988-03-18 | Maurice Francois | Ecran d'affichage a matrice active a resistance de drain et procedes de fabrication de cet ecran |
US5225443A (en) | 1986-05-01 | 1993-07-06 | Rohm And Haas Company | Insecticidal N'-substituted-N'-substituted N,N'-diacylhydrazines |
US5585362A (en) | 1989-08-22 | 1996-12-17 | The Regents Of The University Of Michigan | Adenovirus vectors for gene therapy |
US5283173A (en) | 1990-01-24 | 1994-02-01 | The Research Foundation Of State University Of New York | System to detect protein-protein interactions |
CA2075192A1 (en) | 1990-03-22 | 1991-09-23 | Anthony E. Oro | Insect retinoid receptor compositions and methods |
CA2043775A1 (en) | 1990-06-14 | 1991-12-15 | Dat P. Le | Dibenzoylakylcyanohydrazines |
IE913929A1 (en) | 1990-11-13 | 1992-05-20 | Immunex Corp | Bifunctional selectable fusion genes |
IL100643A (en) | 1991-01-25 | 1996-10-31 | Nippon Kayaku Kk | History of hydrazine and pesticides containing these histories as an active ingredient |
US5530028A (en) | 1992-11-23 | 1996-06-25 | Rohm And Haas Company | Insecticidal N'-substituted-N,N'-diacylhydrazines |
US6013836A (en) | 1992-02-28 | 2000-01-11 | Rohm And Haas Company | Insecticidal N'-substituted-N,N'-disubstitutedhydrazines |
US5350674A (en) | 1992-09-04 | 1994-09-27 | Becton, Dickinson And Company | Intrinsic factor - horse peroxidase conjugates and a method for increasing the stability thereof |
JPH09500783A (ja) | 1993-05-21 | 1997-01-28 | ターゲッティッド ジェネティクス コーポレイション | シトシンデアミナーゼ(cd)遺伝子に基づく二機能性選択融合遺伝子 |
FR2705686B1 (fr) | 1993-05-28 | 1995-08-18 | Transgene Sa | Nouveaux adénovirus défectifs et lignées de complémentation correspondantes. |
AU7264694A (en) | 1993-07-13 | 1995-02-13 | Rhone-Poulenc Rorer S.A. | Defective adenovirus vectors and use thereof in gene therapy |
WO1995016772A1 (en) | 1993-12-14 | 1995-06-22 | Cornell Research Foundation, Inc. | Adenovirus gene expression system |
US5851806A (en) | 1994-06-10 | 1998-12-22 | Genvec, Inc. | Complementary adenoviral systems and cell lines |
ATE336587T1 (de) | 1994-06-10 | 2006-09-15 | Genvec Inc | Adenoviren-vektor systeme und zelllinien |
US5998205A (en) | 1994-11-28 | 1999-12-07 | Genetic Therapy, Inc. | Vectors for tissue-specific replication |
IL116816A (en) | 1995-01-20 | 2003-05-29 | Rhone Poulenc Rorer Sa | Cell for the production of a defective recombinant adenovirus or an adeno-associated virus and the various uses thereof |
EP0813604B1 (en) | 1995-03-03 | 2005-04-20 | Syngenta Participations AG | Control of gene expression in plants by receptor mediated transactivation in the presence of a chemical ligand |
IL122614A0 (en) | 1995-06-15 | 1998-08-16 | Introgene Bv | Packaging systems for human recombinant adenovirus to be used in gene therapy |
US5837511A (en) | 1995-10-02 | 1998-11-17 | Cornell Research Foundation, Inc. | Non-group C adenoviral vectors |
US6001622A (en) | 1995-12-21 | 1999-12-14 | Sunnybrook Health Science Centre | Integrin-linked kinase and its use |
US5885827A (en) | 1996-01-23 | 1999-03-23 | The Regents Of The Universtiy Of California | Eukaryotic high rate mutagenesis system |
IL126418A0 (en) | 1996-04-05 | 1999-05-09 | Salk Inst For Biological Studi | Hormone-mediated methods for modulating expression of exogenous genes and pharmaceutical compositions for modulating the same |
KR20000076157A (ko) | 1997-03-11 | 2000-12-26 | 리전츠 오브 더 유니버스티 오브 미네소타 | 세포의 디엔에이로 핵산을 도입하는 디엔에이-기초 전이인자 시스템 |
CA2296093A1 (en) | 1997-07-10 | 1999-01-21 | The Salk Institute For Biological Studies | Modified lepidopteran receptors and hybrid multifunctional proteins for use in regulation of transgene expression |
US6333318B1 (en) | 1998-05-14 | 2001-12-25 | The Salk Institute For Biological Studies | Formulations useful for modulating expression of exogenous genes in mammalian systems, and products related thereto |
US6113913A (en) | 1998-06-26 | 2000-09-05 | Genvec, Inc. | Recombinant adenovirus |
US6225289B1 (en) | 1998-12-10 | 2001-05-01 | Genvec, Inc. | Methods and compositions for preserving adenoviral vectors |
AU1100201A (en) | 1999-10-28 | 2001-05-08 | Board Of Trustees Of The Leland Stanford Junior University | Methods of in vivo gene transfer using a sleeping beauty transposon system |
EP1266015B1 (en) | 2000-03-22 | 2006-08-30 | RheoGene Holdings Inc. | Ecdysone receptor-based inducible gene expression system |
US20040033600A1 (en) | 2001-03-21 | 2004-02-19 | Palli Subba Reddy | Ecdysone receptor-based inducible gene expression system |
AU6616301A (en) | 2000-06-22 | 2002-01-02 | Celltech Pharmaceuticals Ltd | Modification of hepatitis b core antigen |
US8105825B2 (en) | 2000-10-03 | 2012-01-31 | Intrexon Corporation | Multiple inducible gene regulation system |
EP1572862B1 (en) | 2001-02-20 | 2012-08-01 | Intrexon Corporation | Chimeric retinoid x receptors and their use in a novel ecdysone receptor-based inducible gene expression system |
EP1534738B1 (en) | 2001-02-20 | 2012-06-20 | Intrexon Corporation | Novel substitution mutant receptors and their use in a nuclear receptor-based inducible gene expression system |
JP4328094B2 (ja) | 2001-02-20 | 2009-09-09 | イントレクソン・コーポレイション | 新規置換突然変異体受容体および核受容体−ベースの誘導性遺伝子発現システムにおけるその使用 |
EP1456346B1 (en) | 2001-02-20 | 2012-02-15 | Intrexon Corporation | Novel ecdysone receptor/invertebrate retinoid x receptor-based inducible gene expression system |
US6682929B2 (en) | 2001-07-23 | 2004-01-27 | Genvec, Inc. | Adenovector complementing cells |
US6677156B2 (en) | 2001-07-23 | 2004-01-13 | Genvec, Inc. | Non-adenoviral gene product-based complementing cells for adenoviral vectors |
WO2003020879A2 (en) | 2001-07-23 | 2003-03-13 | Genvec, Inc. | Cells and methods for propagating adenoviral vectors |
WO2003022311A1 (en) | 2001-09-13 | 2003-03-20 | Genvec, Inc. | Adenoviral vector and related system and methods of making and use |
CA2820170C (en) | 2001-09-26 | 2016-07-05 | Intrexon Corporation | Whitefly ecdysone receptor nucleic acids, polypeptides, and uses thereof |
CA2820144C (en) | 2001-09-26 | 2017-06-20 | Intrexon Corporation | Leafhopper ecdysone receptor nucleic acids, polypeptides, and uses thereof |
US8227432B2 (en) | 2002-04-22 | 2012-07-24 | Regents Of The University Of Minnesota | Transposon system and methods of use |
US7375093B2 (en) | 2002-07-05 | 2008-05-20 | Intrexon Corporation | Ketone ligands for modulating the expression of exogenous genes via an ecdysone receptor complex |
BR0317544A (pt) | 2002-12-20 | 2005-11-22 | Glaxosmithkline Biolog Sa | Uso de uma composição que compreende vlps de hpv 16 e hpv 18, e, métodos para induzir uma resposta imune contra um ou mais do grupo de tipos de hpv oncogênicos, para prevenir infecção e/ou doença causada por um ou mais do grupo de tipos de hpv oncogênicos, para prevenir a infecção de uma população de pacientes por um ou mais tipos de hpv, uso de uma mistura de vlps de hpv 16 e hpv18, e, composição de vacina |
US7304161B2 (en) | 2003-02-10 | 2007-12-04 | Intrexon Corporation | Diaclhydrazine ligands for modulating the expression of exogenous genes in mammalian systems via an ecdysone receptor complex |
US7304162B2 (en) | 2003-02-21 | 2007-12-04 | Intrexon Corporation | Oxadiazoline ligands for modulating the expression of exogenous genes via an ecdysone receptor complex |
US7456315B2 (en) | 2003-02-28 | 2008-11-25 | Intrexon Corporation | Bioavailable diacylhydrazine ligands for modulating the expression of exogenous genes via an ecdysone receptor complex |
US7985739B2 (en) | 2003-06-04 | 2011-07-26 | The Board Of Trustees Of The Leland Stanford Junior University | Enhanced sleeping beauty transposon system and methods for using the same |
US7935510B2 (en) | 2004-04-30 | 2011-05-03 | Intrexon Corporation | Mutant receptors and their use in a nuclear receptor-based inducible gene expression system |
ES2536995T3 (es) * | 2005-03-25 | 2015-06-01 | National Research Council Of Canada | Método para aislamiento de polipéptidos solubles |
WO2007073513A2 (en) | 2005-11-10 | 2007-06-28 | Genvec, Inc. | Method for propagating adenoviral vectors encoding inhibitory gene products |
WO2008051854A2 (en) | 2006-10-20 | 2008-05-02 | Trustees Of Boston University | A tunable genetic switch for regulating gene expression |
BRPI0807952A2 (pt) | 2007-02-20 | 2014-06-10 | Anaptysbio Inc | Sistemas de hipermutação somática |
ES2672513T3 (es) | 2007-05-29 | 2018-06-14 | Intrexon Corporation | Ligandos de diacilhidrazina quirales para modular la expresión genética exógena a través del complejo del receptor de ecdisona |
GB0710538D0 (en) | 2007-06-01 | 2007-07-11 | Glaxo Group Ltd | Vaccine |
CA2692501C (en) | 2007-07-04 | 2017-10-10 | Max-Delbrueck-Centrum Fuer Molekulare Medizin | Hyperactive variants of the transposase protein of the transposon system sleeping beauty |
WO2009045370A2 (en) | 2007-09-28 | 2009-04-09 | Intrexon Corporation | Therapeutic gene-switch constructs and bioreactors for the expression of biotherapeutic molecules, and uses thereof |
HUE024479T2 (en) | 2007-10-08 | 2016-01-28 | Intrexon Corp | Genetically altered dendritic cells and uses for cancer treatment |
WO2010042189A2 (en) | 2008-10-08 | 2010-04-15 | Intrexon Corporation | Engineered cells expressing multiple immunomodulators and uses thereof |
US9393299B2 (en) * | 2009-08-07 | 2016-07-19 | Transgene S.A. | Composition for treating HBV infection |
KR20180108886A (ko) * | 2010-03-23 | 2018-10-04 | 인트렉손 코포레이션 | 치료적 단백질을 조건부로 발현하는 벡터,상기 벡터를 포함하는 숙주 세포 및 이의 용도 |
AU2012214394B2 (en) * | 2011-02-12 | 2016-08-11 | Globeimmune, Inc. | Yeast-based therapeutic for chronic hepatitis B infection |
SG10201600912SA (en) | 2011-03-04 | 2016-03-30 | Intrexon Corp | Vectors conditionally expressing protein |
TWI575070B (zh) * | 2011-07-12 | 2017-03-21 | 傳斯堅公司 | Hbv聚合酶突變體 |
EP2764014B1 (en) | 2011-10-05 | 2022-02-09 | GenVec, Inc. | Adenoviral vectors and methods of use |
EP2764012B1 (en) | 2011-10-05 | 2022-02-23 | GenVec, Inc. | Adenoviral vectors and methods of use |
CN107937440A (zh) | 2011-10-05 | 2018-04-20 | 金维克有限公司 | 猴腺病毒(大猩猩)或腺病毒载体及其使用方法 |
US20160311879A1 (en) | 2013-12-18 | 2016-10-27 | Intrexon Corporation | Single chain il-12 nucleic acids, polypeptides, and uses thereof |
CA2950863C (en) * | 2014-06-02 | 2023-01-17 | Isa Pharmaceuticals B.V. | Synthetic long peptides (slp) for therapeutic vaccination against hepatitis b virus infection |
WO2016020538A1 (en) * | 2014-08-08 | 2016-02-11 | Transgene Sa | Hbv vaccine and antibody combination therapy to treat hbv infections |
US20170291934A1 (en) | 2014-09-22 | 2017-10-12 | Charles C. Reed | Improved therapeutic control of heterodimeric and single chain forms of interleukin-12 |
WO2016145146A1 (en) | 2015-03-11 | 2016-09-15 | Board Of Regents, The University Of Texas System | Transposase polypeptides and uses thereof |
EP3138579A1 (en) | 2015-09-05 | 2017-03-08 | Biomay Ag | Fusion protein for use in the treatment of a hepatitis b virus infection |
AU2016334401A1 (en) | 2015-10-10 | 2018-04-26 | Intrexon Corporation | Improved therapeutic control of proteolytically sensitive, destabilized forms of interleukin-12 |
AU2016341919A1 (en) * | 2015-10-21 | 2018-04-19 | Editas Medicine, Inc. | CRISPR/CAS-related methods and compositions for treating hepatitis b virus |
WO2017083750A1 (en) | 2015-11-11 | 2017-05-18 | Intrexon Corporation | Compositions and methods for expression of multiple biologically active polypeptides from a single vector for treatment of cardiac conditions and other pathologies |
US10596248B2 (en) | 2015-12-09 | 2020-03-24 | Jingang Medicine (Australia) Pty Ltd | Immunomodulating composition for treatment |
AU2019231652A1 (en) | 2018-03-06 | 2020-10-01 | Precigen, Inc. | Hepatitis B vaccines and uses of the same |
KR20200130339A (ko) | 2018-03-06 | 2020-11-18 | 프레시전 인코포레이티드 | 사람 파필로마바이러스 백신 및 이의 용도 |
-
2019
- 2019-03-06 AU AU2019231652A patent/AU2019231652A1/en active Pending
- 2019-03-06 KR KR1020207028021A patent/KR20200128703A/ko unknown
- 2019-03-06 US US16/978,570 patent/US11608362B2/en active Active
- 2019-03-06 SG SG11202008508QA patent/SG11202008508QA/en unknown
- 2019-03-06 CA CA3092935A patent/CA3092935A1/en active Pending
- 2019-03-06 CN CN201980030927.0A patent/CN112135622A/zh active Pending
- 2019-03-06 EP EP19764606.0A patent/EP3762010A4/en active Pending
- 2019-03-06 JP JP2020547045A patent/JP2021514666A/ja active Pending
- 2019-03-06 WO PCT/US2019/020930 patent/WO2019173463A1/en unknown
-
2020
- 2020-09-03 IL IL277128A patent/IL277128A/en unknown
- 2020-09-11 ZA ZA2020/05672A patent/ZA202005672B/en unknown
-
2022
- 2022-12-02 US US18/074,302 patent/US20230279057A1/en active Pending
-
2023
- 2023-12-25 JP JP2023217919A patent/JP2024043538A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
IL277128A (en) | 2020-10-29 |
JP2021514666A (ja) | 2021-06-17 |
WO2019173463A1 (en) | 2019-09-12 |
SG11202008508QA (en) | 2020-10-29 |
CN112135622A (zh) | 2020-12-25 |
US20230279057A1 (en) | 2023-09-07 |
EP3762010A4 (en) | 2022-04-06 |
AU2019231652A1 (en) | 2020-10-01 |
EP3762010A1 (en) | 2021-01-13 |
US11608362B2 (en) | 2023-03-21 |
ZA202005672B (en) | 2024-01-31 |
US20210015911A1 (en) | 2021-01-21 |
JP2024043538A (ja) | 2024-03-29 |
CA3092935A1 (en) | 2019-09-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113271955A (zh) | 用于细胞介导的溶瘤病毒疗法的增强的*** | |
KR101449587B1 (ko) | 장기 지속형 약물 제형 | |
KR20230057487A (ko) | 게놈 조정을 위한 방법 및 조성물 | |
CN112673092A (zh) | 工程化的免疫刺激性细菌菌株及其用途 | |
KR20220004959A (ko) | 종양, 종양-상주 면역 세포, 및 종양 미세환경을 콜로니화하기 위해 조작된 면역자극성 박테리아 | |
KR20220113943A (ko) | 면역자극성 박테리아 전달 플랫폼 및 치료 제품의 전달을 위한 이의 용도 | |
JP2003524368A (ja) | ニ量化ドメイン、三量化ドメインまたは四量化ドメインおよび補足的非相同転写活性化ドメイン、転写抑制ドメイン、dna結合ドメインまたはリガンド結合ドメインを含む融合蛋白 | |
JP2024073576A (ja) | 改変アデノウイルス | |
KR20200126997A (ko) | 인간 대상체에서의 비-노화-관련 청각 손상의 치료를 위한 조성물 및 방법 | |
KR20160102024A (ko) | 아데노바이러스 및 상응하는 플라스미드의 제조 방법 | |
KR101591887B1 (ko) | 장기 지속형 약물 제형 | |
KR20230066000A (ko) | 면역자극성 박테리아-기초 백신, 치료제, 및 rna 전달 플랫폼 | |
KR20200130339A (ko) | 사람 파필로마바이러스 백신 및 이의 용도 | |
US20230279057A1 (en) | Hepatitis b vaccines and uses of the same | |
KR20200095462A (ko) | Hbb 유전자 기능 회복을 위한 아데노-연관 바이러스 조성물 및 이의 사용 방법 | |
KR20230046313A (ko) | 다중에피토프 백신 카세트 | |
KR20230014694A (ko) | 항원-코딩 카세트 | |
KR20230006825A (ko) | 전염성 질병 항원 및 백신 | |
CN113874512A (zh) | 诱导毛细胞分化的组合物和方法 | |
CN113302202A (zh) | 利用表达***1异构体的脱氧核糖核酸构建体的神经病变的治疗 | |
TW202302857A (zh) | 多臂黏液瘤(myxoma)病毒 | |
CN116801912A (zh) | 表达载体组合物 | |
CN117157109A (zh) | 腺病毒基因疗法载体 | |
JP2002153275A (ja) | スプーマウイルスプラスミドおよびその利用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
N231 | Notification of change of applicant |