CN108093639A - 用于肝脏中蛋白质表达的重组启动子和载体及其用途 - Google Patents

用于肝脏中蛋白质表达的重组启动子和载体及其用途 Download PDF

Info

Publication number
CN108093639A
CN108093639A CN201680035258.2A CN201680035258A CN108093639A CN 108093639 A CN108093639 A CN 108093639A CN 201680035258 A CN201680035258 A CN 201680035258A CN 108093639 A CN108093639 A CN 108093639A
Authority
CN
China
Prior art keywords
seq
nucleotide
sequence
tss
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201680035258.2A
Other languages
English (en)
Other versions
CN108093639B (zh
Inventor
C·B·德林
T·H·斯潘塞
H·C·布朗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Health Care Ltd By Share Ltd For Children In Atlanta
AMORY UNIV
Original Assignee
Health Care Ltd By Share Ltd For Children In Atlanta
AMORY UNIV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Health Care Ltd By Share Ltd For Children In Atlanta, AMORY UNIV filed Critical Health Care Ltd By Share Ltd For Children In Atlanta
Priority to CN202210812376.7A priority Critical patent/CN115074366A/zh
Priority to CN202210813636.2A priority patent/CN115094062A/zh
Publication of CN108093639A publication Critical patent/CN108093639A/zh
Application granted granted Critical
Publication of CN108093639B publication Critical patent/CN108093639B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/64Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue
    • C12N9/6421Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue from mammals
    • C12N9/6424Serine endopeptidases (3.4.21)
    • C12N9/644Coagulation factor IXa (3.4.21.22)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0058Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • A61P7/02Antithrombotic agents; Anticoagulants; Platelet aggregation inhibitors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • A61P7/04Antihaemorrhagics; Procoagulants; Haemostatic agents; Antifibrinolytic agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/745Blood coagulation or fibrinolysis factors
    • C07K14/755Factors VIII, e.g. factor VIII C (AHF), factor VIII Ag (VWF)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • C12N15/861Adenoviral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • C12N15/864Parvoviral vectors, e.g. parvovirus, densovirus
    • C12N15/8645Adeno-associated virus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • C12N15/867Retroviral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y304/00Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
    • C12Y304/21Serine endopeptidases (3.4.21)
    • C12Y304/21022Coagulation factor IXa (3.4.21.22)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14132Use of virus as therapeutic agent, other than vaccine, e.g. as cytolytic agent
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/008Vector systems having a special element relevant for transcription cell type or tissue specific enhancer/promoter combination

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Epidemiology (AREA)
  • Hematology (AREA)
  • Virology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Diabetes (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Immunology (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本文公开了一种重组病毒载体,其包含与编码蛋白质如凝血因子的异源核酸序列可操作组合的肝特异性启动子。还提供了治疗患有凝血障碍如血友病A或血友病B的受试对象的方法。

Description

用于肝脏中蛋白质表达的重组启动子和载体及其用途
相关申请
本申请要求2015年8月6日提交美国临时专利申请NO.62/202,133、2015年9月1日提交美国临时专利申请NO.62/212,634和2015年4月16日提交的美国临时专利申请NO.62/148,696的权益,各个临时专利申请通过引用整体并入本文。
技术领域
本发明涉及重组启动子和载体转基因表达以及编码新型凝血因子的重组核酸分子。
鸣谢政府的支持
本发明是在美国国立卫生研究院颁发的批准号为R01HL092179U54HL112309的政府支持下做出的。政府在该发明中享有一定权力。
背景技术
凝血因子VIII(fVIII)基因中的突变导致凝血因子(fVIII)蛋白质减少或有缺陷,这可引起血友病A,该病的特征在于不受控的出血。类似地,血友病B与凝血因子IX(fIX)相关。血友病A通常需要终身多周静脉输入人血浆衍生的或重组的fVIII产物。由于高昂的费用,全球血友病A人群中只有不到30%接受了这种形式的治疗。而且,约25%的用fVIII替代品治疗的病人产生了中和性抗体,这能使以后的治疗无效。因此,有必要确定改进的治疗。
基因治疗通常基于基因工程化的病毒,设计为向病人递送功能性转基因以使其自身细胞能生物合成缺失的或有缺陷的蛋白质。通过采用重组腺相关病毒(rAAV)载体,fIX在肝脏中的表达已经取得了临床进展;然而,由于人fVIII(hfVIII)的低效生物合成,使用用于患有血友病A的病人的fVIII表达的rAAV一直在具有挑战性。重组腺相关病毒(rAAV)载体产生具有有限的封装核酸的空间的衣壳。FVIII是大的糖蛋白,编码和表达fVIII所需的rAAV序列通常超出衣壳包装能力。
发明内容
本文公开了新型重组核酸分子的实施方案,该新型重组核酸分子包含已经优化为最小长度且促进组织特异性蛋白表达的启动子。在若干实施方案中,启动子可以是肝特异性启动子,它在肝脏和肝细胞中比其它组织类型中能促进大幅增加的蛋白表达。在一些实施方案中,为了促进目的蛋白例如在肝组织和/或细胞中的表达,启动子可与编码目的蛋白的异源核酸序列可操作组合地包含在病毒载体(如腺相关病毒载体)中。
在一些实施方案中,重组核酸分子可包含启动子,所述启动子包含第一应答元件,所述应答元件包含一组转录因子(TF)结合位点,包括HNF1a TF结合位点、HNF1-1TF结合位点、HNF4TF结合位点、HNF3a TF结合位点、HNF1-2TF结合位点、HNF3-2TF结合位点、HP1TF结合位点、TATA框和转录起始位点(TSS)。在一些实施方案中,HNF1a TF结合位点包含SEQ IDNO:4的第1-12位核苷酸或由SEQ ID NO:4的第1-12位核苷酸组成;HNF1-1TF结合位点包含SEQ ID NO:4的第16-23位核苷酸或由SEQ ID NO:4的第16-23位核苷酸组成;HNF4TF结合位点包含SEQ ID NO:4的第26-36位核苷酸或由SEQ ID NO:4的第26-36位核苷酸组成;HNF3aTF结合位点包含SEQ ID NO:4的第39-45位核苷酸或由SEQ ID NO:4的第39-45位核苷酸组成;HNF1-2TF结合位点包含SEQ ID NO:4的第48-62位核苷酸或由SEQ ID NO:4的第48-62位核苷酸组成;HNF3-2TF结合位点包含SEQ ID NO:4的第65-71位核苷酸或由SEQ ID NO:4的第65-71位核苷酸组成;HP1TF结合位点包含SEQ ID NO:4的第75-87位核苷酸或由SEQ IDNO:4的第75-87位核苷酸组成;TATA框结合位点包含SEQ ID NO:4的第108-114位核苷酸或由SEQ ID NO:4的第108-114位核苷酸组成;和/或转录起始位点(TSS)包含SEQ ID NO:4的第116-146位核苷酸或由SEQ ID NO:4的第116-146位核苷酸组成。在一些实施方案中,第一应答元件的长度不超过160个核苷酸(如长度不超过150核苷酸,如长度为146个核苷酸)。
在一些实施方案中,第一应答元件从5’到3’包含HNF1a TF结合位点、HNF1-1TF结合位点、HNF4TF结合位点、HNF3a TF结合位点、HNF1-2TF结合位点、HNF3-2TF结合位点、HP1TF结合位点、TATA框和转录起始位点(TSS)。
在一些实施方案中,重组核酸分子包含启动子,所述启动子包含SEQ ID NO:4(HCB)所示的核酸序列或与其有至少90%相同性的序列或由如SEQ ID NO:4(HCB)所示的核酸序列或与其有至少90%相同性的序列组成。
在一些实施方案中,重组核酸分子可包含如上所述的包含第一应答元件的启动子,还可包含第二应答元件。第二应答元件可包括,例如,HSh应答元件(例如,包含如SEQ IDNO:111所示的核苷酸序列,或与其有至少90%相同性的序列或由如SEQ ID NO:111所示的核苷酸序列,或与其有至少90%相同性的序列组成)、5’HS应答元件(例如,包含如SEQ IDNO:111的第6-32位核苷酸所示的核苷酸序列,或与其有至少90%相同性序列或由如SEQ IDNO:111的第6-32位核苷酸所示的核苷酸序列,或与其有至少90%相同性序列组成)或3’HS应答元件(例如,包含如SEQ ID NO:111的第44-68位核苷酸所示的核苷酸序列,或与其有至少90%相同性的序列或由如SEQ ID NO:111的第44-68位核苷酸所示的核苷酸序列,或与其有至少90%相同性的序列组成)。
在一些实施方案中,重组核酸分子包含启动子,所述启动子包含如SEQ ID NO:102(HSh-HCB)、SEQ ID NO:104(5’HSh-HCB)或SEQ ID NO:103(3’HSh-HCB)之一所示的核酸序列,或与SEQ ID NO:102(HSh-HCB)、SEQ ID NO:104(5’HSh-HCB)或SEQ ID NO:103(3’HSh-HCB)之一有至少90%相同性的序列或由如SEQ ID NO:102(HSh-HCB)、SEQ ID NO:104(5’HSh-HCB)或SEQ ID NO:103(3’HSh-HCB)之一所示的核酸序列,或与SEQ ID NO:102(HSh-HCB)、SEQ ID NO:104(5’HSh-HCB)或SEQ ID NO:103(3’HSh-HCB)之一有至少90%相同性的序列组成。在另外的实施方案中,重组核酸分子包含启动子,所述启动子包含如SEQ ID NO:5(短ABP-HP1-God-TSS)、SEQ ID NO:7(ABP-HP1-God-TSS)、SEQ ID NO:105(HSh-SynO-TSS)、SEQ ID NO:106(sHS-SynO-TSS)、SEQ ID NO:107(Agro)、SEQ ID NO:108(HS-SynO-TSS)或SEQ ID NO:112(HNF1-短ABPExact-SynO-TSS-Int)中的任意一者所示的核苷酸序列,或与SEQ ID NO:5(短ABP-HP1-God-TSS)、SEQ ID NO:7(ABP-HP1-God-TSS)、SEQ ID NO:105(HSh-SynO-TSS)、SEQ ID NO:106(sHS-SynO-TSS)、SEQ ID NO:107(Agro)、SEQ ID NO:108(HS-SynO-TSS)或SEQ ID NO:112(HNF1-短ABPExact-SynO-TSS-Int)中的任意一者有至少90%相同性的序列或由如SEQ ID NO:5(短ABP-HP1-God-TSS)、SEQ ID NO:7(ABP-HP1-God-TSS)、SEQ ID NO:105(HSh-SynO-TSS)、SEQ ID NO:106(sHS-SynO-TSS)、SEQ ID NO:107(Agro)、SEQ ID NO:108(HS-SynO-TSS)或SEQ ID NO:112(HNF1-短ABPExact-SynO-TSS-Int)中的任意一者所示的核苷酸序列,或与SEQ ID NO:5(短ABP-HP1-God-TSS)、SEQ IDNO:7(ABP-HP1-God-TSS)、SEQ ID NO:105(HSh-SynO-TSS)、SEQ ID NO:106(sHS-SynO-TSS)、SEQ ID NO:107(Agro)、SEQ ID NO:108(HS-SynO-TSS)或SEQ ID NO:112(HNF1-短ABPExact-SynO-TSS-Int)中的任意一者有至少90%相同性的序列组成。
在一些实施方案中,启动子可包括在载体中,如病毒载体(例如,腺相关病毒载体)。在一些实施方案中,为促进目的蛋白例如在肝组织和/或细胞中表达,启动子与编码目的蛋白的异源核酸序列可操作组合地包括在载体上。在一些实施方案中,目的蛋白可以是凝血因子,如fVIII或fIX或其变体,如包含fVIIIA1、A2、A3、C1和C2结构域的fVIII变体,其中A2和A3结构域通过肽接头连接,缺少fVIIIB结构域。在一些实施方案中,目的蛋白可以是fVIII变体,异源核酸分子可包含SEQ ID NO:2、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:125或SEQ ID NO:126所示的核酸序列,或与SEQ ID NO:2、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:125或SEQ ID NO:126有至少90%相同性的核酸序列或由如SEQ ID NO:2、SEQID NO:11、SEQ ID NO:12、SEQ ID NO:125或SEQ ID NO:126所示的核酸序列,或与SEQ IDNO:2、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:125或SEQ ID NO:126有至少90%相同性的核酸序列组成。在一些实施方案中,目的蛋白可以是fIX,异源核酸分子可包含SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:124或SEQ ID NO:127所示的核酸序列,或与SEQID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:124或SEQ ID NO:127有至少90%相同性的核酸序列或由如SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:124或SEQ IDNO:127所示的核酸序列,或与SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:124或SEQ ID NO:127有至少90%相同性的核酸序列组成。
在一些实施方案中,载体可以是重组AAV载体,所述重组AAV载体包含基因组,所述基因组包含编码本文提供的肝特异性启动子(如HCB启动子,SEQ ID NO:4)中的任一者的核酸分子,所述核酸分子与编码fVIII变体的异源核酸分子可操作连接,其中所述异源核酸分子包含如SEQ ID NO:2、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:125或SEQ ID NO:126所示的核酸序列,或与SEQ ID NO:2、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:125或SEQ IDNO:126有至少90%相同性的核酸序列或由如SEQ ID NO:2、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:125或SEQ ID NO:126所示的核酸序列,或与SEQ ID NO:2、SEQ ID NO:11、SEQID NO:12、SEQ ID NO:125或SEQ ID NO:126有至少90%相同性的核酸序列组成。在若干此类实施方案中,重组AAV基因组(从5’到3’ITR)的长度不超过5.1、5.0、4.9、4.8、4.7、4.6或4.5kb。
在一些实施方案中,载体可以是重组AAV载体,所述重组AAV载体包含基因组,所述基因组包含编码本文提供的肝特异性启动子(如HCB启动子,SEQ ID NO:4)中的任意一者的核酸分子,所述核酸分子与编码fIX变体的异源核酸分子可操作连接,其中所述异源核酸分子包含如SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:124或SEQ ID NO:127所示的核酸序列,或与SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:124或SEQ ID NO:127有至少90%相同性的核酸序列或由如SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQID NO:124或SEQ ID NO:127所示的核酸序列,或与SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:124或SEQ ID NO:127有至少90%相同性的核酸序列组成。在若干此类实施方案中,重组AAV基因组(从5’到3’ITR)的长度不超过5.1、5.0、4.9、4.8、4.7、4.6或4.5kb。
在一些实施方案中,提供了一种在有需要的受试对象中诱导血液凝结的方法。所述方法包括将治疗有效量的编码如本文所述的凝血因子的载体(如AAV载体)施用于受试对象。在一些实施方案中,受试对象为患有凝血障碍如血友病A或血友病B的受试者。在一些实施方案,凝血障碍为血友病A,并将包含编码具有fVIII活性的蛋白质的核酸分子的载体施用于受试对象。在其他的实施方案中,凝血障碍为血友病B,并将包含编码具有fIX活性的蛋白质的核酸分子的载体施用于受试对象。
从以下参考附图实践的若干实施方案的详细描述可知,本发明的前述和其他特点与优势将变得更加明显。
附图说明
图1A和1B示出了ET3变体fVIII蛋白的人和猪直系同源物的A1和A3结构域的序列比对。(图1A)fVIII的人(上部序列,SEQ ID NO:13)和猪(中间序列,SEQ ID NO:14)ET3变体的A1结构域的序列比对。下方的序列显示相同的残基。显示了信号肽(N-末端条)、重链酸性结构域(C-末端条)、人(顶部)和ET3(底部)fVIII的氨基酸序列比对。由连接半胱氨酸残基的线标注二硫键。人、ET3或两个序列都编码N连接的糖基化附接位点(N-X-S/T)的位置用框标出。(图1B)fVIII的人(上部序列,SEQ ID NO:15)和猪(中间序列,SEQ ID NO:16)ET3变体的A3结构域的序列比对。下部序列显示相同的残基。显示了激活肽(条)、人(顶部)和ET3(底部)fVIII的氨基酸比对。人、ET3或两个序列都编码N连接的糖基化附接位点(N-X-S/T)的位置用框标出。
图2A-2C显示了肝、人总体和骨髓特异性密码子偏好表。
图3A显示了HepG2细胞中的体外表达数据,表明肝特异性密码子优化改善了fVIII蛋白质的HSQ和ET3变体的表达。
图3B显示了密码子优化的HSQ和ET3的体内数据,表明在将编码HSQ和ET3fVIII蛋白质的肝密码子优化变体的AAV载体流体动力学注射入小鼠中后,fVIII的表达增加。
图4示出了编码fVIII变体的AAV载体。
图5显示了HepG2细胞中的体外表达数据,表明肝特异性密码子优化而非骨髓特异性密码子优化改善了肝细胞中fVIII蛋白质的HSQ和ET3变体的表达。
图6显示了HepG2细胞中的体外表达数据,表明肝特异性密码子优化而非骨髓特异性密码子优化改善了肝细胞中fVIII蛋白质的HSQ和ET3变体的表达。
图7显示了HepG2细胞中的体外表达数据,表明肝特异性密码子优化而非人特异性密码子优化改善了肝细胞中fIX蛋白质的表达。
图8示出了包含ABP增强子或缩短的ABP增强子的启动子。
图9A和9B显示了关于使用含有用于fVIII表达的所示的启动子的AAV载体的数据。(图9A)HepG2细胞中的体外表达数据。(图9B)在AAV载体的流体动力学注射后fVIII的体内表达。
图10示出了应答元件序列和所示的应答元件的组分。
图11A和11B示出了启动子序列和所示启动子的组分。
图12A和12B显示了关于使用含有用于fVIII的表达的所示的启动子的AAV载体的数据。(图12A)HepG2细胞中的体外表达数据。(图12B)在AAV载体的流体动力学注射后fVIII的体内表达。
图13示出了启动子序列和所示启动子的组分。
图14A和14B显示了有关使用含有所示启动子的AAV载体来表达fVIII的数据。(图14A)HepG2细胞中的体外表达数据。(图14B)在AAV载体的流体动力学注射后fVIII的体内表达。
图15和16显示了示出肝特异性增强子(图15)和包括肝特异性增强子的启动子(图16)的结构的示意图。
图17示显示了来自使用体外测定的有关使用含有所示启动子的AAV载体在HepG2细胞中表达fVIII的数据。
图18示出了编码fVIII变体的AAV载体。
图19是显示用编码具有缺失型CpG基序的肝密码子优化的ET3的AAV2-HCB-ET3-LCO-NCG-SpA载体(SEQ ID NO:130)转导小鼠会导致被转导的小鼠中fVIII活性显著增加的图。
序列表
随附的序列表中列出的核酸和氨基酸序列,用表示核苷酸碱基的标准字母缩写和如37C.F.R.1.822所定义的表示氨基酸三个字母密码显示。仅示出每个核酸序列的一条链,但应理解为对所显示链的任何引用包括互补链。序列表以2016年4月14日创建的名为“Sequence.txt”(~148kb)的文件形式以ASCII版本文件提交,其通过引用并入本文。
发明详述
有必要研发一种安全且高效的用于治疗血友病如血友病A和B以及获得性血友病的基因转移策略。在用于治疗血友病A的基因疗法的背景下,若干障碍阻碍了使用腺相关病毒载体作为基因递送运载体的发展,如针对大型fVIII转基因的腺相关病毒的有限的DNA包装能力,和人fVIII的低效生物合成。本文报道了基于AAV的转基因递送***,所述***在肝靶向的AAV基因转移的背景下利用对fVIII表达的改进。这些包括:1)与天然存在的fVIII的核苷酸序列相比,使用具有对人肝细胞有改进的密码子选择偏好的核苷酸编码序列;2)优化密码子选择以去除5’-CG-3’二核苷酸和其他有害的顺势作用DNA基序,如隐蔽剪接位点、TATA框、末端信号、mRNA二级结构、过早polyA信号、RNA不稳定性基序、内部核糖体结合位点;以及3)为降低转基因的尺寸的尺寸最小化的肝靶向的启动子,所以其可用于腺相关病毒载体***的尺寸约束性环境中。对于任意AAV转基因的改进的表达,可以推广这些改进。在一些实施方案中,AAV载体以预测不会引起人中毒的病毒剂量递送有效表达的fVIII。
在一些实施方案中,这些改进也可应用于fIX中,特别是应用于自身互补fIX载体设计中。具有一半的包装能力的自身互补设计是单链设计,即使对于fIX,所以载体尺寸的限制(~2.4kb)也成为关注点。
先前的工作指出用编码称为ET3的修饰形式的fVIII(B结构域缺失)的AAV载体以范围为5*1011-2*1013vp/kg的载体剂量治疗fVIII缺乏(血友病A)的小鼠理论上能校正它们的fVIII缺乏和出血表型(参见Brown等,“Bioengineered Factor FVIII Enables Long-Term Correction of Murine Hemophilia A Following Liver-Directed Adeno-Associated Viral Vector Delivery,”Molecular Therapy–Methods and ClinicalDevelopment.1:14036,2014)。然而,由于ET3的基因组尺寸过大,载体的制造滴度低并有大量的颗粒间异质性。密码子优化的ET3-AAV基因组的较大尺寸与高效的病毒载体包装不相容。对于AAV载体,优选尺寸不超过4.7-5.0kb的AAV基因组以获得比超过5.0kb的基因组更高的产量和相容性。B结构域缺失型ET3编码序列为4.4kb。然而,随着必要的病毒和调控元件的添加,fVIII ET3-AAV基因组大大超过包装容量。
本文首次公开了长度小于5.0kb的fVIII(ET3或其他B结构域缺失型变体)-AAV基因组,该基因组被开发以允许增强的fVIII(或其变体)表达和高效病毒包装。采取多个步骤将AAV基因组的尺寸减小至可接受的水平。例如,使用组合转录因子结合位点组装方法以产生一组在尺寸不等(ranging in size)的肝特异性启动子。与当前使用的肝特异性启动子如HLP和HCR-hAAT(其尺寸范围为从250至超过700个碱基)相比,这些启动子表现了30-90%的尺寸减少。这些启动子中的某些与用HLP和HCR-hAAT观察到的转基因水平和特异性相当或更好。
开发成功的基于临床基因转移的疗法的一个极大障碍是天然存在的或合成的遗传元件的可用性,所述遗传元件能够功能化的且常常是细胞型靶向或限制性的在载体递送的核酸盒(参见,例如,Papadakis等,"Promoters and control elements:designingexpression cassettes for gene therapy"Curr Gene Ther.,4(1):89-113,2004)的背景下进行表达。人们普遍认为天然存在的启动子已经过进化磨炼,通过多个顺式调控序列的组合来驱动精细调节的表达。在大多数活的生物体,特别是具有较大基因组尺寸的真核细胞中,没有限制启动子尺寸的驱动力,因此,大多数的内源性启动子以数百、通常更是数千DNA碱基对(bp)分布。由于它们的尺寸,这些内源性的天然的基因启动子由于尺寸局限性通常不适于包含在基因治疗产品中。
另一方面,内源性病毒启动子已进化为具有强度和尺寸的效率,而不是使其在基因转移技术中的使用具有吸引力。显著的示例包括巨细胞病毒(CMV)立早(IE)启动子、腺病毒(Ad)主要晚期启动子、猿猴病毒40(SV40)启动子和莫罗尼鼠白血病病毒(MoMLV)长末端重复序列(LTR)。这些启动子中的每个都能使内源性异源转基因在各种真核细胞类型中进行高水平的转录。然而,没有令人惊讶的是,真核细胞已发展了细胞防御机制以有效地检测和灭活(即沉默)病毒启动子,因此,与在体内基因治疗应用中相比,这些启动子可在细胞培养模型***中比在体内基因治疗应用中更有效地执行。
基于这些原因,人们对合成启动子的发展产生了浓厚的兴趣,这些启动子要么是通用的(参见,例如,Juven-Gershon等,"Rational design of a super core promoterthat enhances gene expression,"Nat Methods,3(11):917-22,2006;Schlabach等,"Rational design of a super core promoter that enhances gene expression"PNAS,2010;107(6):2538-43,2010),要么是针对特殊的基因治疗应用,包括血友病A和B(参见,例如,McIntosh等,"Therapeutic levels of FVIII following a single peripheral veinadministration of rAAV vector encoding a novel human factor VIII variant,"Blood,121(17):3335-44,2013;Nair等,"Computationally designed liver-specifictranscriptional modules and hyperactive factor IX improve hepatic genetherapy,"Blood,123(20):3195-9,2014)。
对启动子和增强子的知识仍然是有限的,目前,不可能很有信心地计算设计出最佳的启动子。如由Juven-Gershon和Kadonaga说明的那些研究已经在限定优化的核心启动子设计方面如它们的超核心启动子1(SCP1)取得了进步并且对本领域是有益的。然而,由于我们显示了本文示例中描述的与核心启动子结构域中的SCP1没有强的相似性的启动子,所以这些序列至少在肝靶向的基因治疗应用(还参见,Juven-Gershon等,"Rational designof a super core promoter that enhances gene expression,"Nat Methods,3(11):917-22,2006)的背景下对强启动子功能来说不是必需的。
大多数通用的启动子的开发聚焦在以最小的尺寸实现转录效能的最佳平衡。在肝靶向的启动子设计的领域中,由McIntosh等和Nair等(supra)采用的合理设计方法致使需鉴定在AAV-fVIII和AAV-fIX基因治疗方法中使用的启动子。然而,尽管进行了大量研究,但是两组都描述了比本文所述的那些如SEQ ID NO:4(HCB)更大(≧252bp)且没有更多(或更低)效能的启动子设计。实际上,如果给出了先前的优化启动子设计的尝试,那么特别令人惊讶的是,可鉴定出如本文所述的那些的启动子,这些启动子比现有技术的启动子(如HLP启动子)更小,还具有等效的或增强的效能以进行转录,特别是在体内基因治疗应用背景下。
I.术语
除非另有所指,根据常规用法使用技术术语。分子生物学中的通用术语的定义可在以下中找到:Benjamin Lewin,Genes V,published by Oxford University Press,1994(ISBN 0-19-854287-9);Kendrew等.(eds.),The Encyclopedia of Molecular Biology,published by Blackwell Science Ltd.,1994(ISBN 0-632-02182-9);和RobertA.Meyers(ed.),Molecular Biology and Biotechnology:a Comprehensive DeskReference,published by VCH Publishers,Inc.,1995(ISBN 1-56081-569-8。
为了便于评述本发明的各个实施方案,下文提供了具体术语的解释:
5’和/或3’:核酸分子(如DNA和RNA)具有5’端和3’端,因为单核苷酸以通过磷酸二酯键将一个单核苷酸戊糖环的5’磷酸酯连接到其相邻的在一个方向上的3’氧上的方式发生反应以获得多核苷酸。因此,当其5’磷酸酯未与单核苷酸戊糖环的3’氧连接时,线性多核苷酸的一端被称为“‘5’端”。当其3’氧未与另一单核苷酸戊糖环的5’磷酸酯连接时,多核苷酸的另一端被称为“”‘3’端”。尽管一个单核苷酸戊糖环的5’磷酸酯连接至其相邻环的3’氧上,但是内部核酸序列也可以具有5’和3’端。
在线性或环状核酸分子中,离散的内部元件被称为“下游”或3’元件的“上游”或5’。针对DNA,该术语反映出沿DNA链在5’至3’方向进行转录。指到相连基因转录的启动子和增强子一般位于编码区的5’或上游。然而,增强子元件甚至在位于启动子元件和编码区的3’时也能发挥其作用。转录终止和聚腺苷酸化信号位于编码区的3’或下游。
腺相关病毒(AAV):一种感染人和某些其他灵长类物种的小的复制缺陷型非包膜病毒。尚不知晓AAV致病且会产生非常轻微的免疫反应。利用AAV的基因治疗载体能感染***的和休眠的细胞并能在染色体外的状态下持续存在,而不需整合到宿主细胞的基因组中。这些特性使得AAV成为一种有吸引力的基因治疗用病毒载体。目前,有11种公认的AAV血清型(AAV1-11)。
施用(administration)/施用(administer):将物质(agent)如治疗剂(例如,重组AAV)通过任意有效途径提供给或给予受试对象。施用的示例性途径包括但不限于注射(如皮下、肌肉内、皮内、腹膜内和静脉内)、口服、导管内、舌下、直肠、经皮、鼻内、***和吸入途径。
出血时间测定:一种用于测量受试对象血液凝结所用时间的测定法。血压表套袖置于上臂并使之膨胀。在下壁处做出两个切口。这两个切口大约10mm(小于1/2英寸)长、1mm(仅是足以引起最小限度出血的深度)深。血压表套袖可立即放气。每30秒将印记纸接触切口直到出血停止。记录切口停止出血所用的时间长度。正常情况下,非血友病人在大约1至10分钟内出血停止,并且实验室与实验室之间会有不同,这取决于测定是如何测量的。相反地,具有不到1%的正常水平的适宜凝血因子的严重血友病人的整个血液凝结时间大于60分钟。在小鼠中,通过横切尾巴的尖部并且周期性地接触印记纸直到在尾巴的尖部形成凝块来测定出血时间。正常的出血时间是在2-4分钟之间。相反地,具有不到1%正常水平的适宜凝血因子的血友病小鼠的出血时间大于15分钟。
cDNA(互补DNA):一条没有内部非编码区段(内含子)和确定转录的调控序列的DNA。在实验室中通过从细胞提取的信使RNA的逆转录来合成cDNA。cDNA还含有非翻译区(UTRs),该区负责在相应的RNA分子中进行翻译控制。
凝血障碍:一种针对导致血液凝结不良和连续出血的各种不同医学问题的一般性术语。医生也用术语如凝血紊乱、异常出血和出血障碍(bleedingdisorder)来指代凝血障碍。凝血障碍包括导致异常(或病理性)出血的任何先天的、后天的或诱导的缺陷。示例包括但不限于不充分凝血或止血的障碍,如血友病A(fVIII的缺陷)、血友病B(fIX的缺陷)、血友病C(因子XI的缺陷)、其他凝血因子缺陷(如因子VII或fXIII),异常水平的凝血因子抑制剂、血小板障碍、血小板减少、维生素K缺乏病和von Willebrand’s病。
某些凝血障碍是一出生就存在的并且在某些情况下是遗传性障碍。具体的示例包括但不限于血友病A、血友病B、蛋白质C缺陷和vonWillebrand’s病。某些凝血障碍是在某种疾病(如维生素K缺乏病、严重的肝病)发病期间或治疗(如抗凝药物的使用或抗生素的延长使用)期间发展起来的。
凝血因子:包括促进适当止血的任何蛋白质。在一个实施方案中,凝血因子为fVIII或fIX,或保留止血活性的其变体或区段,例如用APTT测定或出血时间测定测量的。在一些实施方案中,当凝血因子以治疗有效量施用时,其增加了患有凝血障碍如血友病的受试对象中的止血作用。
凝血因子VIII(fVIII):fVIII是血液有效凝结所需的蛋白质,可在凝结中发挥作为fIX对因子X进行激活中的辅因子的功能。血液中大约100ng/ml的fVIII浓度被认为处于正常范围。fVIII的缺乏与血友病A相关,当受试对象含有不到fVIII正常量的大约1%(即,每毫升血液含有少于约1ng的fVIII)时,会导致严重的疾病。fVIII以2351氨基酸的单链前体蛋白合成为,其经蛋白水解处理。人因子VIII基因(189,000个碱基对)由26个尺寸为69至3,106bp的外显子和大至(as large as)32.4个千碱基(kb)的内含子组成。fVIII核酸和蛋白序列的示例是公众可得到的(例如,参见Genbank AccessionNos:K01740、M14113和E00527)。本文提供了保留针对血液凝结的fVIII活性但尺寸减小的fVIII变体,如缺少fVIII B结构域的fVIII变体。示例性的fVIII变体包括HSQ和ET3变体。
凝血因子IX(fIX):fIX是血液有效凝结所需的维生素K依赖性蛋白质,可在凝结中发挥作为因子X的激活剂的功能。血液中大约1-5μg/ml的fIX浓度被认为处于正常范围。fIX的缺乏与血友病B相关,当fIX的浓度不到fIX正常浓度的大约1%(即,每毫升血液含有少于大约0.01-0.05μg的fIX)时,会导致严重的病症。fX核酸和蛋白序列是公众可得到的(例如,参见Kurachi等,1982.Proc.Natl.Acad.Sci.U.S.A.79(21):6461-4;GenbankAccessionNos:J00136、XM045316、K02402、J00137和M11309)。
密码子优化的:“密码子优化的”核酸是指已被更改从而使密码子在特定的***(如特定物种或物种群)中的表达是最佳的核酸序列。例如,核酸序列被优化以在哺乳动物细胞或在特定的哺乳动物物种(如人细胞)中表达。密码子优化不会改变被编码蛋白质的氨基酸序列。
术语“肝特异性氨基酸密码子”是指在与人基因组的整个编码区的密码子使用相比在人肝脏内高度表达的基因中被区别地利用-表征的密码子。使用大量的肝特异性氨基酸密码子的策略是力图避免低于限额的密码子的产生,例如,因为与肝脏细胞中的tRNA匹配的的密码子的数量少会导致较慢的蛋白质翻译。
对照:一种参考标准。在一些实施方案中,对照是从健康病人中获得的阴性对照样本。在其他的实施方案中,对照是从诊断患有血友病的病人中获得的阳性对照样本。在其他实施方案中,对照是历史对照或标准参考值或值的范围(如之前测试的对照样本,如一组已知预后或后果的血友病A病人,或一组代表基础或正常值的样本)。
测试样本与对照之间的差异可以是增加的或是降低的。这种差异可以是定性差异或定量差异,例如统计学显著差异。在一些示例中,相对于对照,差异可增加或降低至少大约5%,如至少大约10%,至少大约20%,至少大约30%,至少大约40%,至少大约50%,至少大约60%,至少大约70%,至少大约80%,至少大约90%,至少大约100%,至少大约150%,至少大约200%,至少大约250%,至少大约300%,至少大约350%,至少大约400%,至少大约500%,或大于500%。
DNA(脱氧核糖核酸):DNA是长链聚合物,其包含大多数活的生物体(一些病毒具有包含核糖核酸(RNA)的基因)的遗传物质。DNA聚合物中的重复单元为4种不同的核苷酸,每种核苷酸包含结合到脱氧核糖的四种碱基腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和胸腺嘧啶之一,所述脱氧核糖与磷酸基团连接。核苷酸的三联体(称为密码子)编码多肽中的每个氨基酸或停止信号。术语密码子也用于DNA序列转录成的mRNA中的三个核苷酸的相应(和互补)序列。
除非另有所指,对DNA分子的任何引用都旨在包括该DNA分子的反向互补。除了本文的文本需要单链之外,DNA分子,尽管写为仅描述了单链,包含双链DNA分子的双链。因此,对编码特异性蛋白或其片段的核酸分子的引用包含有义链和其反向互补。例如,生成来自公开的核酸分子的反向互补序列的探针或前体是适宜的。
增强子:通过增加启动子活性来增加转录速率的核酸序列。
位于侧面:靠近或挨近,还包括邻接,例如在线性或环状多核苷酸如DNA分子中。
基因:一种核酸序列,通常为DNA序列,包含RNA(无论是mRNA还是其他)转录必需的控制和编码序列。例如,基因可包括启动子、一个或多个增强子或沉默子,编码RNA和/或多肽的核酸序列,下游调控序列以及可能地,调控mRNA表达所涉及的其他核酸序列。
如本领域已知,大多数的真核基因含有外显子和内含子。术语“外显子”是指在基因组DNA中发现的、在生物信息学上可预测和/或实验上证实为成熟的mRNA转录贡献连续序列的核酸序列。“内含子”是指在基因组DNA中发现的被预测和/或证实为成熟mRNA转录未做贡献但在转录加工期间被“剪接出去”的核酸序列。
基因治疗:将异源核酸分子引入一个或多个受体细胞中,其中异源核酸分子在受体细胞中的表达影响细胞的功能并影响受试对象中的治疗效果。例如,异源核酸分子可编码蛋白质,这影响受体细胞的功能。
血友病:一种凝血因子活性不足(这降低了止血作用)引起的凝血障碍。当凝血因子的浓度不到正常受试对象中的凝血因子的正常浓度的大约1%时就会导致严重的疾病类型。在一些受试对象中,血友病是由于导致凝血因子表达受损的基因突变引起的。在其他受试对象中,血友病是一种自身免疫障碍,称为获得性血友病,其中在受试对象中产生的针对凝血因子的抗体导致止血作用降低。
血友病A是由于功能性凝血fVIII的缺陷导致的,而血友病B是由于功能性凝血fIX的缺陷导致的。由于基因突变导致的这些病症是由遗传的性连锁隐性性状引起的,其中缺陷性基因位于X染色体上,因此这种疾病只发生在男性中。症状的严重性随着该疾病而变化,严重的形式在早期就显现出来。出血是疾病的标志且通常在男性幼儿割***时发生。当幼儿乱动时会出现额外的出血表现。轻微的病情可能会被忽视,直到在之后的生活中当遇到手术或创伤时病情会再次发生。
止血:通过形成血块来阻止出血。凝血时间是采用活化的局部促凝血酶原激酶时间测定(APTT)或通过测量出血时间的外周血凝块所用的时间长度。在具体的实施方案中,与在施用本文所述的编码适当的凝血因子的治疗载体之前受试对象的凝血时间相比,凝血时间降低了至少50%,例如至少60%,至少70%,至少75%,至少80%,至少90%,至少95%,至少98%,或甚至大约100%(即凝血时间比对正常受试对象所观察到的时间短)。在另一个实施方案中,在口服施用治疗有效量的适当凝血因子后,受影响的受试对象的凝血时间修正为正常受试对象的大约50%,正常受试对象的大约75%,正常受试对象的大约90%,例如大约95%,例如大约100%。如本文所用,“大约”是指参考值的正负5%。因此,大约50%是指47.5%至52.5%。
内含子:基因内的不含有蛋白质编码信息的一串(a stretch of)DNA。内含子在信使RNA翻译之前去除。
末端反向重复序列(ITR):高效复制所需的腺相关病毒的基因组中的对称核酸序列。ITR序列位于AAV DNA基因组的每一端。ITR用作病毒DNA复制的起点并且是生成AAV整合载体的必要顺式组分。
分离的:“分离的”生物组分(如核酸分子、蛋白质、病毒或细胞)基本上已经与所述组分天然存在于其中的生物体的细胞或组织中的其他生物学组分或生物体本身,如其他染色体和染色体外的DNA和RNA、蛋白质和细胞,分离或纯化。已经分离的核酸分子和蛋白质包括由标准纯化方法纯化的那些。该术语还包含通过在宿主细胞中重组表达制得的核酸分子和蛋白质以及化学合成的核酸分子和蛋白质。
核酸分子:一种核苷酸的聚合形式,其可包括RNA、cDNA、基因组DNA的正反义链以及上述的合成形式和混合聚合体。核苷酸是指核糖核苷酸、脱氧核糖核苷酸或任意类型核苷酸的修饰形式。本文所用的术语“核酸分子”与“核酸”和“多核苷酸”同义。一般地,核酸分子的长度为至少10个碱基,除非另有所指。该术语包括单链和双链形式的DNA。多核苷酸可包括通过天然存在的和/或非天然存在的核苷酸键连接在一起的天然存在的和修饰的核苷酸中的一者或二者。“cDNA”是指与mRNA互补或相同的以单链或双链形式存在的DNA。“编码”是指多核苷酸如基因、cDNA或mRNA中的核苷酸的特异性序列的固有特性,所述特异性序列作为在生物进程中合成具有核苷酸(即rRNA、tRNA和mRNA)的限定序列或氨基酸的限定序列的和由其产生的生物学特性的其他聚合物和大分子的模板。
核苷酸:该术语包括但不限于与糖连接的碱基如嘧啶、嘌呤或其合成类似物,或与如肽核酸(PNA)中的氨基酸连接的碱基。核苷酸为多核苷酸中的一种单体。核苷酸序列是指多核苷酸中的碱基的序列。
可操作性连接:当第一核酸序列与第二核酸序列处于功能性关系时,第一核酸序列与第二核酸序列可操作性连接。例如,如果启动子影响编码序列的转录或表达,那么启动子与编码序列可操作性连接。一般地,可操作性连接的DNA序列是连续的,并且必要时,在同一阅读框架内连接两个蛋白编码区。
ORF(开放阅读框):一系列编码氨基酸的核苷酸三联体(密码子)。这些序列一般可翻译为肽。
药学上可接受的载剂:使用的药学上可接受的载剂(运载体)是常规的。Remington's Pharmaceutical Sciences(E.W.Martin,Mack Publishing Co.,Easton,PA,19th Edition(1995))中描述了适于公开的载体的药物递送的组合物和配制物。
一般地,载剂的性质取决于所采用的具体施用模式。例如,肠胃外制剂通常包括可注射液体,所述可注射液体包括药学上和生理学上可接受的液体如作为运载体的水、生理盐水、平衡盐溶液、水性葡萄糖、甘油等。对于固体组合物(例如,粉末、丸剂、片剂或胶囊形式),常规的无毒固体载剂可包括,例如,药物等级的甘露醇、乳糖、淀粉或硬脂酸镁。除了生物学上中性的载剂之外,待施用的药物组合物(如载体组合物)可含有少量的无毒辅料,如润湿或乳化剂、防腐剂和pH缓冲剂等,例如醋酸钠或脱水山梨醇月桂酸酯。在具体的实施方案中,适用于给受试对象施用的载剂是无菌的,和/或悬浮在或包含在含有一个或多个所测剂量的适于诱导所期望的免疫应答的组合物的单位剂型中。这是通过出于治疗目的所使用的药物来完成的。单位剂型可以是,例如,在含有无菌内容物的密封小瓶或注射进受试对象中的注射器中,或冻干用于随后的溶解和施用或以固体或控释的剂量。
多肽:氨基酸的任意链,无论长度或翻译后修饰(例如,糖基化或磷酸化)。“多肽”应用于氨基酸聚合体中,所述氨基酸聚合体包括天然存在的氨基酸聚合体和非天然存在的氨基酸聚合体以及其内的一个或多个氨基酸残基是非天然氨基酸,例如相应的天然存在的氨基酸的人工化学模拟物。“残基”是指通过酰胺键或酰胺键模拟物而包含在多肽中的氨基酸或氨基酸模拟物。多肽具有氨基末端(N-末端)和羧基末端(C-末端)。“多肽”与肽或蛋白质可交换地使用,并且在本文中是指氨基酸残基的聚合体。
预防、治疗或减轻疾病:“预防”疾病(如血友病)是指抑制疾病的完全发展。“治疗”是指疾病或病理状况已经开始发展后减轻其体征或症状的治疗性干预。“减轻”是指疾病体征或症状的数量或严重性的降低。
启动子:一段指导/启动核酸(例如,基因)转录的DNA区域。启动子包括转录起始位点附近的必要核酸序列。通常,启动子位于它们所转录的基因附近。启动子还任选地包括可位于离转录起始位点几千个碱基对处的末端增强子或抑物元件。组织特异性启动子是指引/启动主要在单一类型的组织或细胞中进行转录的启动子。例如,肝特异性启动子是一种指引/启动在肝组织中比在其他组织类型中的转录的程度基本上更大的启动子。
蛋白质:一种由基因或其他编码核酸(例如,cDNA)表达且由氨基酸组成的生物学分子。
纯化的:术语“纯化的”不要求绝对的纯度;确切地说,它是相对的术语。因此,例如,纯化的肽、蛋白质、病毒或其他活性化合物是与天然相关的蛋白质和其他污染物完全或部分分离的化合物。在某些实施方案中,术语“基本上纯化的”是指已经与细胞、细胞培养基或其它粗制品分离的并进行分级分离以去除初始制剂的多种成分如蛋白质、细胞碎片及其他成分的肽、蛋白质、病毒或其它活性化合物。
重组的:重组核酸分子是具有非天然存在的,例如,包括一种或多种核酸取代、缺失或***的序列,和/或具有通过对序列的两个(如不组合,是分离的)序列区段进行人工组合制得的核酸分子。该人工组合可以通过化学合成或更一般地通过对核酸的分离片段进行人工处理例如通过基因工程技术来完成。
重组病毒是包含基因组的病毒,所述基因组包含重组核酸分子。如本文所述,“重组AAV”是指其内已经包装有重组核酸分子(如编码凝血因子的重组核酸分子)的AAV颗粒。
重组蛋白质是具有非天然存在的序列或具有通过对两个(如不组合,是分离的)序列区段进行人工组合制得的蛋白质。在若干实施方案中,重组蛋白质由已引入到宿主细胞如细菌或真核细胞中或者引入到重组病毒的基因组中的异源(例如,重组的)核酸编码。
应答元件(RE):包含在启动子中的可与一个或多个转录因子结合,并调控基因表达的一段DNA序列。
序列相同性:根据序列之间的相同性或相似性来表达两个或多个核酸序列或者两个或多个氨基酸序列之间的相同性或相似性。根据百分比相同性来度量序列相同性;百分比越高,序列越相同。根据百分比相似性来度量序列相似性(考虑保守性氨基酸取代);百分比越高,序列越相似。当采用标准方法进行比对时,核酸或氨基酸序列的同源物或直系同源物具有比较高程度的序列相同性/相似性。与关系疏远的物种(如人和线虫序列)相比,当直系同源蛋白或cDNA源自关系更密切的物种时,这种同源性更显著。
用于比较的序列对比的方法在本领是公知的。以下文献中描述了各种程序和比对算法:Smith&Waterman,Adv.Appl Math.2:482,1981;Needleman&Wunsch,J.Mol Biol 48:443,1970;Pearson&Lipman,Proc.Natl Acad.Sci.USA 85:2444,1988;Higgins&Sharp,Gene,73:237-44,1988;Higgins&Sharp,CABIOS 5:151-3,1989;Corptt等,Nuc.AcidsRes.16:10881-90,1988;Huang a/.Computer Appls.in the Biosciences 8,155-65,1992;以及Pearson等,Meth.Mol Bio.24:307-31,1994.Altschul等,J.Mol Biol 215:403-410,1990提出了序列比对方法和同源性计算的详细考虑。
NCBI基本局部比对检索工具(BLAST)(Altschul等,J.Mol Biol.215:403-10,1990)可从多种来源获得,包括美国国家生物技术中心(NCBI)和互联网,用于与序列分析程序blastp、blastn、blastx、tblastn和tblastx连接。更多有关信息请访问NCBI网站。
如本文所用的,“至少90%相同性”的引用是指与特定的参考序列有“至少90%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%甚或是100%相同性”。
受试对象:活的多细胞脊椎动物生物体,包括人和非人哺乳动物的一类。
合成的:在实验室中以人工手段进行生产,例如,合成的核酸可在实验室化学合成。
TATA框:一段在基因的启动子区发现的DNA序列,其可在DNA通过RNA聚合酶II解链并且结合期间被TATA结合蛋白和转录因子II D结合。TATA框序列通常包括TATAAA序列并且常常包括额外的3’腺嘌呤核苷酸。示例性TATA框序列设置为SEQ ID NO:4的第108-114位核苷酸。
治疗有效量:特定药物剂或治疗剂(例如,重组AAV)的数量,足以在用其治疗的受试对象中或细胞中达到所需效果。物质的有效量取决于若干因素,包括但不限于所治疗的受试对象或细胞,以及治疗组合物的施用方式。
转录因子(TF):一种与特定DNA序列结合从而控制的遗传信息从DNA到RNA转移(或转录)的蛋白质。TF通过促进(如激活剂)或阻断(如抑制剂)将RNA聚合酶(进行从DNA到RNA的遗传信息的转录的酶)招募到特定基因中而单独地实现此功能或与其他蛋白质一起以复合物的形式实现此功能。与TF结合的特定DNA序列被称为应答元件(RE)或调控元件。其他名称包括顺式元件和顺式作用转录调控元件。
转录因子采用静电力(其氢键是特殊的)和范德华力的组合与它们的结合位点相互作用。由于这些化学相互作用的性质,大多数的转录因子以序列特异性方式结合DNA。然而,实际上,并不是转录因子结合位点中的所有碱基都可与转录因子相互作用。此外,这些相互作用中的某些可以比其它的弱。因此,许多转录因子并不是仅仅结合一个序列,而是能够结合一系列(a subset of)关系密切的序列,各序列有不同的相互作用强度。
例如,尽管TATA结合蛋白(TBP)的共有结合位点是TATAAAA;然而,TBP转录因子也可结合相似的序列如TATATAT或TATATAA。
转录因子(TF)分类根据许多方面进行,例如,蛋白质结构的二级、三级和四级结构,DNA结合序列和特性,与DNA的双螺旋相互作用,以及金属和其他结合特征。JASPAR数据库和TRANSFAC(7.0Public 2005)是两个基于网络的转录因子数据库,公开其实验上证明过的结合位点与调控的基因。
HNF1a:也称为HNF1同源框A或HNF1,HNF1a蛋白质是若干肝特异性基因表达所需的转录因子。HNF1a形成与特定的启动子序列结合的同源二聚体。示例性的HNF1a TF结合位点包括提供为SEQ ID NO:4的第1-12位核苷酸的“HNF1a”TF结合位点、提供为SEQ ID NO:4的第16-23位核苷酸的“HNF1-1”TF结合位点和提供为SEQ ID NO:4的第48-62位核苷酸的“HNF1-2”TF结合位点(参见,例如,PubMed Gene ID NO.6927;Chi等,"Diabetes mutationsdelineate an atypical POU domain in HNF-1alpha,”Mol.Cell.,10:1129-1137,2002;和Rose等,"Diabetes mutations delineate an atypical POU domain in HNF-1alpha,”Nat.Struct.Biol.7:744-748,2000)。
HNF3a:一种若干肝特异性基因转录所需的转录因子。HNF3a与特定的启动子序列结合。示例性的HNF3a TF结合位点提供为SEQ ID NO:4的第39-45位核苷酸。示例性的HNF3-2TF结合位点提供为SEQ ID NO:4的第65-71位核苷酸。(参见,例如,Laganiere等,“Diabetes mutations delineatean atypical POU domain in HNF-1alpha,"Proc.Natl.Acad.Sci.U.S.A.102:11651-11656,2005;Williamson等,"BRCA1andFOXA1proteins coregulate the expression of the cell cycle-dependent kinaseinhibitor p27(Kip1),”Oncogene 25:1391-1399,2006;Lupien等,"FoxA1translatesepigenetic signatures into enhancer-driven lineage-specific transcription,”Cell 132:958-970,2008;Song等,"Role of Foxa1in regulation of bcl2expressionduring oxidative-stress-induced apoptosis in A549type II pneumocytes,"CellStress Chaperones,14:417-425,2009);和Malik等,"Histone deacetylase 7andFoxA1in estrogen-mediated repression of RPRM,”Mol.Cell.Biol.30:399-412,2010).
HNF4:一种若干肝特异性基因表达所需的转录因子。HNF4与特定体的启动子序列结合。示例性的HNF4TF结合位点提供为SEQ ID NO:4的第26-36位核苷酸。(参加,例如,Wang等,"Hepatocyte nuclear factor-4αinteracts with other hepatocyte nuclearfactors in regulating transthyretin gene expression,”FEBS J.,277(19):4066-75,2010)。
HP1:一种若干肝特异性基因表达所需的转录因子。HP1与特定的启动子序列结合。示例性的HP1TF结合位点提供为SEQ ID NO:4的第75-87位核苷酸。(参见,例如,Schorpp等,“Hepatocyte-specific promoter element HP1of the Xenopus albumin geneinteracts with transcriptional factors of mammalian hepatocytes,”,J MolBiol.,202(2):307-20,1988)。
转录起始位点:在基因序列的5’端开始转录的位置。示例性的转录起始位点作提供为SEQ ID NO:4的第116-146位核苷酸。
治疗有效量:物质如所公开的编码凝血因子的重组AAV载体的用量,足以预防(prevent)、治疗(包括预防(prophylaxis))、降低和/或减轻病症或疾病的症状和/或深层病因(例如预防、抑制和/或治疗血友病),例如,以防止、抑制或治疗血友病。例如,这可以是抑制或防止病毒复制或可测定地改变疾病或病症的外部症状所必需的用量。
在一个示例中,所期望的应答是减少受试对象(如患有血友病的受试对象)的凝血时间,例如采用出血时间测定来测定。凝血时间不需要完全恢复至正常的健康的没有血友病的受试对象的凝血时间才证明方法有效。例如,本文公开的治疗有效量的载体(如编码fVIII的载体)的施用可使凝血时间(或血友病的其他症状)减少所期望的量,例如与适宜的对照相比,可减少至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少98%、至少100%或更多。
应理解的是获得对疾病或病症的治疗性应答可以需要多次施用所述物质。因此,治疗有效量包含分服量,所述分服量与之前或随后的施用组合一起促进在病人中取得疗效。例如,在疗程期间,可以单剂量或以多剂量,例如每天,施用治疗有效量的物质。然而,治疗有效量取决于正在被治疗的受试对象、正在被治疗的病症的严重性和类型以及施用方式。单位剂型的物质可以治疗量或多个治疗量包装,例如,在具有无菌组分的小瓶(例如,具有可刺穿的盖)或注射器中。
载体:载体是允许外源核酸***而不干扰载体在宿主细胞中复制和/或整合的能力的核酸分子。载体可包含允许其在宿主细胞中复制的核酸序列,如复制起点。载体还可包含一个或多个可选择的标志基因和其他遗传元件。表达载体是含有允许***基因或基因的转录和翻译的必要调控序列的载体。在本文的一些实施方案中,载体是腺相关病毒(AAV)载体。在一些实施方案中,载体是γ逆转录病毒载体、慢病毒载体或腺病毒载体。
除非另有解释,本文使用的所有技术和科学术语都与本发明所属领域的技术人员共同理解有相同的含义。单数术语“一(a)”、“一(an)”和“所述(the)”包括复数参照物,除非上下文另有明确的指示。“包括A或B”意指包括A或B或A和B。应进一步理解的是针对核酸或多肽给出的所有碱基大小或氨基酸大小以及所有分子量或分子质量值都是近似的,并提供用于说明。尽管与本文描述相似或等同的方法和材料可用于本发明的实践或测试中,但是适宜的方法和材料在下文有说明。本文中提及的所有出版物、专利申请、专利和其他参考都通过引用整体并入。为避免冲突,将控制本说明书,包括术语的解释。此外,材料、方法和示例仅是示例性的,并不旨在限制。
II.用于肝定向转录的优化的启动子
本文提供了用于促进在肝组织和/或细胞中转录的新启动子。如实施例2所讨论的,所述新启动子采用迭代法来设计,所述迭代法可最终鉴定出提供意想不到的高转录水平(如通过测量表达的蛋白质活性所测定的)的若干启动子序列,并且所述新启动子比之前的启动子序列如HLP启动子序列短得多。
在一些实施方案中,提供了包含启动子的重组核酸分子,所述启动子包含第一应答元件,所述第一应答元件包含一组转录因子(TF)结合位点,包括HNF1a TF结合位点、HNF1-1TF结合位点、HNF4TF结合位点、HNF3aTF结合位点、HNF1-2TF结合位点、HNF3-2TF结合位点、HP1TF结合位点、TATA框以及转录起始位点。这些是包含在HCB启动子上的转录因子结合位点。
在一些实施方案中,第一应答元件可包含长度不超过160个核苷酸(如长度不超过150核苷酸,如长度为146个核苷酸)的核苷酸序列。
在一些实施方案中,HNF1a TF结合位点包含SEQ ID NO:4的第1-12位核苷酸或由SEQ ID NO:4的第1-12位核苷酸组成;HNF1-1TF结合位点包含SEQ ID NO:4的第16-23位核苷酸或由SEQ ID NO:4的第16-23位核苷酸组成;HNF4TF结合位点包含SEQ ID NO:4的第26-36位核苷酸或由SEQ ID NO:4的第26-36位核苷酸组成;HNF3a TF结合位点包含SEQ ID NO:4的第39-45位核苷酸或由SEQ ID NO:4的第39-45位核苷酸组成;HNF1-2TF结合位点包含SEQ ID NO:4的第48-62位核苷酸或由SEQ ID NO:4的第48-62位核苷酸组成;HNF3-2TF结合位点包含SEQ ID NO:4的第65-71位核苷酸或由SEQ ID NO:4的第65-71位核苷酸组成;HP1TF结合位点包含SEQ ID NO:4的第75-87位核苷酸或由SEQ ID NO:4的第75-87位核苷酸组成;TATA框包含SEQ ID NO:4的第108-114位核苷酸或由SEQ ID NO:4的第108-114位核苷酸组成;和/或转录起始位点(TSS)包含SEQ ID NO:4的第116-146位核苷酸或由SEQ ID NO:4的第116-146位核苷酸组成。
在一些实施方案中,第一应答元件从5’到3’包含HNF1a TF结合位点、HNF1-1TF结合位点、HNF4TF结合位点、HNF3a TF结合位点、HNF1-2TF结合位点、HNF3-2TF结合位点、HP1TF结合位点、TATA框和转录起始位点(TSS)。
在一些实施方案中,重组核酸分子包含启动子,所述启动子包含SEQ ID NO:4(HCB)所示的核酸序列,或与其有至少90%(如至少91%、至少92%、至少93%、至少94%、至少95%、至少98%、或至少99%)相同性的序列或由如SEQ ID NO:4(HCB)所示的核酸序列,或与其有至少90%(如至少91%、至少92%、至少93%、至少94%、至少95%、至少98%、或至少99%)相同性的序列组成。
在一些实施方案中,重组核酸分子可包含启动子,所述启动子包含如上讨论的第一应答元件,并且进一步包含第二应答元件。
在一些实施方案中,第二应答元件可包括HSh应答元件。例如,HSh应答元件包含如SEQ ID NO:111所示的核苷酸序列,或与其有至少90%(如至少91%、至少92%、至少93%、至少94%、至少95%、至少98%、或至少99%)相同性的序列或由如SEQ ID NO:111所示的核苷酸序列,或与其有至少90%(如至少91%、至少92%、至少93%、至少94%、至少95%、至少98%、或至少99%)相同性的序列组成。
在一些实施方案中,第二应答元件可包括5’HS应答元件。例如,5’应答元件包含如SEQ ID NO:111的第6-32位核苷酸所示的核苷酸序列,或与其有至少90%(如至少91%、至少92%、至少93%、至少94%、至少95%、至少98%、或至少99%)相同性的序列或由如SEQID NO:111的第6-32位核苷酸所示的核苷酸序列,或与其有至少90%(如至少91%、至少92%、至少93%、至少94%、至少95%、至少98%、或至少99%)相同性的序列组成。
在一些实施方案中,第二应答元件可包括3’HS应答元件。例如,3’应答元件包含如SEQ ID NO:111的第44-68位核苷酸所示的核苷酸序列,或与其有至少90%(如至少91%、至少92%、至少93%、至少94%、至少95%、至少98%、或至少99%)相同性的序列或由如SEQID NO:111的第44-68位核苷酸所示的核苷酸序列,或与其有至少90%(如至少91%、至少92%、至少93%、至少94%、至少95%、至少98%、或至少99%)相同性的序列组成。
在一些实施方案中,重组核酸分子包含启动子,所述启动子包含如SEQ ID NO:102(HSh-HCB)的所示的核酸序列,或与其有至少90%(如至少91%、至少92%、至少93%、至少94%、至少95%、至少98%、或至少99%)相同性的序列或由如SEQ ID NO:102(HSh-HCB)的所示的核酸序列,或与其有至少90%(如至少91%、至少92%、至少93%、至少94%、至少95%、至少98%、或至少99%)相同性的序列组成。
在一些实施方案中,重组核酸分子包含启动子,所述启动子包含如SEQ ID NO:104(5’HSh-HCB)的所示的核酸序列,或与其有至少90%(如至少91%、至少92%、至少93%、至少94%、至少95%、至少98%、或至少99%)相同性的序列或由如SEQ ID NO:104(5’HSh-HCB)的所示的核酸序列,或与其有至少90%(如至少91%、至少92%、至少93%、至少94%、至少95%、至少98%、或至少99%)相同性的序列组成。
在一些实施方案中,重组核酸分子包含启动子,所述启动子包含或由如SEQ IDNO:103(3’HSh-HCB)的所示的核酸序列组成。
在一些实施方案中,重组核酸分子包含启动子,所述启动子包含如SEQ ID NO:7(ABP-HP1-God-TSS)的所示的核酸序列,或与其有至少90%(如至少91%、至少92%、至少93%、至少94%、至少95%、至少98%、或至少99%)相同性的序列或由如SEQ ID NO:7(ABP-HP1-God-TSS)的所示的核酸序列,或与其有至少90%(如至少91%、至少92%、至少93%、至少94%、至少95%、至少98%、或至少99%)相同性的序列组成。
在一些实施方案中,重组核酸分子包含启动子,所述启动子包含如SEQ ID NO:105(HSh-SynO-TSS)的所示的核酸序列,或与其有至少90%(如至少91%、至少92%、至少93%、至少94%、至少95%、至少98%、或至少99%)相同性的序列或由如SEQ ID NO:105(HSh-SynO-TSS)的所示的核酸序列,或与其有至少90%(如至少91%、至少92%、至少93%、至少94%、至少95%、至少98%、或至少99%)相同性的序列组成。
在一些实施方案中,重组核酸分子包含启动子,所述启动子包含如SEQ ID NO:106(sHS-SynO-TSS)的所示的核酸序列,或与其有至少90%(如至少91%、至少92%、至少93%、至少94%、至少95%、至少98%、或至少99%)相同性的序列或由如SEQ ID NO:106(sHS-SynO-TSS)的所示的核酸序列,或与其有至少90%(如至少91%、至少92%、至少93%、至少94%、至少95%、至少98%、或至少99%)相同性的序列组成。
在一些实施方案中,重组核酸分子包含启动子,所述启动子包含如SEQ ID NO:107(Agro)的所示的核酸序列,或与其有至少90%(如至少91%、至少92%、至少93%、至少94%、至少95%、至少98%、或至少99%)相同性的序列或由如SEQ ID NO:107(Agro)的所示的核酸序列,或与其有至少90%(如至少91%、至少92%、至少93%、至少94%、至少95%、至少98%、或至少99%)相同性的序列组成。
在一些实施方案中,重组核酸分子包含启动子,所述启动子包含如SEQ ID NO:108(HS-SynO-TSS)的所示的核酸序列,或与其有至少90%(如至少91%、至少92%、至少93%、至少94%、至少95%、至少98%、或至少99%)相同性的序列或由如SEQ ID NO:108(HS-SynO-TSS)的所示的核酸序列,或与其有至少90%(如至少91%、至少92%、至少93%、至少94%、至少95%、至少98%、或至少99%)相同性的序列组成。
在一些实施方案中,重组核酸分子包含启动子,所述启动子包含如SEQ ID NO:112(HNF1-短ABPExact-SynO-TSS-Int)的所示的核酸序列,或与其有至少90%(如至少91%、至少92%、至少93%、至少94%、至少95%、至少98%、或至少99%)相同性的序列或由如SEQID NO:112(HNF1-短ABPExact-SynO-TSS-Int)的所示的核酸序列,或与其有至少90%(如至少91%、至少92%、至少93%、至少94%、至少95%、至少98%、或至少99%)相同性的序列组成。
在一些实施方案中,重组核酸分子包含启动子,所述启动子包含如SEQ ID NO:5(短ABP-HP1-God-TSS)的所示的核酸序列,或与其有至少90%(如至少91%、至少92%、至少93%、至少94%、至少95%、至少98%、或至少99%)相同性的序列或由如SEQ ID NO:5(短ABP-HP1-God-TSS)的所示的核酸序列,或与其有至少90%(如至少91%、至少92%、至少93%、至少94%、至少95%、至少98%、或至少99%)相同性的序列组成。
在一些实施方案中,重组核酸分子包含启动子,所述启动子包含如SEQ ID NO:7(ABP-HP1-God-TSS)的所示的核酸序列,或与其有至少90%(如至少91%、至少92%、至少93%、至少94%、至少95%、至少98%、或至少99%)相同性的序列或由如SEQ ID NO:7(ABP-HP1-God-TSS)的所示的核酸序列,或与其有至少90%(如至少91%、至少92%、至少93%、至少94%、至少95%、至少98%、或至少99%)相同性的序列组成。
可以在期望肝特异性转录的任何情况下利用所公开的启动子。在若干实施方案中,用于基因治疗方法的载体(如AAV载体)上含有任意一个所公开的启动子,所述基因治疗方法中期望有肝特异性表达,如本文公开的凝血因子的肝特异性表达。
III.编码凝血因子的重组核酸分子
凝血***是蛋白水解级联。凝血因子以酶原形式存在于血浆中,换言之,以非活化的形式存在,其激活时经历蛋白水解裂解而从前体分子释放活性因子形式。最终的目标是产生凝血酶。凝血酶将纤维蛋白原转化为形成凝块的纤维蛋白。
因子X是共用通路的第一分子并且由在血小板表面含有激活的fIX、fVIII、钙和磷脂的分子的复合物激活。FVIII由凝血酶激活,并且帮助fIXa激活因子X。含有多个结构域(A1-A2-B-ap-A3-C1-C2)并以非活化的形式在血液中循环的FVIII与von Willebrand因子(VWT)结合。C2结构域与连接至VWT的fVIII有关。凝血酶切割fVIII,引起与解离VWT,用最终导致通过fIX形成纤维蛋白。先天性血友病A与fVIII基因中的遗传突变有关并且由于低于循环的fVIII的正常水平而导致凝血受损。类似地,血友病B与fIX基因中的遗传突变相关。
FVIII结构域边界是指人fVIII氨基酸序列,编号如下:SEQ ID NO:1的残基1-19(信号序列),20–391(A1),392–759(A2),760-1667(B),1668–1708(ap),1709–2038(A3),2039–2191(C1)和2192–2351(C2)(参见,Gitschier等,Nature,1984,312,326–330):
MQIELSTCFFLCLLRFCFSATRRYYLGAVELSWDYMQSDLGELPVDARFPPRVPKSFPFNTSVVYKKTLFVEFTDHLFNIAKPRPPWMGLLGPTIQAEVYDTVVITLKNMASHPVSLHAVGVSYWKASEGAEYDDQTSQREKEDDKVFPGGSHTYVWQVLKENGPMASDPLCLTYSYLSHVDLVKDLNSGLIGALLVCREGSLAKEKTQTLHKFILLFAVFDEGKSWHSETKNSLMQDRDAASARAWPKMHTVNGYVNRSLPGLIGCHRKSVYWHVIGMGTTPEVHSIFLEGHTFLVRNHRQASLEISPITFLTAQTLLMDLGQFLLFCHISSHQHDGMEAYVKVDSCPEEPQLRMKNNEEAEDYDDDLTDSEMDVVRFDDDNSPSFIQIRSVAKKHPKTWVHYIAAEEEDWDYAPLVLAPDDRSYKSQYLNNGPQRIGRKYKKVRFMAYTDETFKTREAIQHESGILGPLLYGEVGDTLLIIFKNQASRPYNIYPHGITDVRPLYSRRLPKGVKHLKDFPILPGEIFKYKWTVTVEDGPTKSDPRCLTRYYSSFVNMERDLASGLIGPLLICYKESVDQRGNQIMSDKRNVILFSVFDENRSWYLTENIQRFLPNPAGVQLEDPEFQASNIMHSINGYVFDSLQLSVCLHEVAYWYILSIGAQTDFLSVFFSGYTFKHKMVYEDTLTLFPFSGETVFMSMENPGLWILGCHNSDFRNRGMTALLKVSSCDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFSQNSRHPSTRQKQFNATTIPENDIEKTDPWFAHRTPMPKIQNVSSSDLLMLLRQSPTPHGLSLSDLQEAKYETFSDDPSPGAIDSNNSLSEMTHFRPQLHHSGDMVFTPESGLQLRLNEKLGTTAATELKKLDFKVSSTSNNLISTIPSDNLAAGTDNTSSLGPPSMPVHYDSQLDTTLFGKKSSPLTESGGPLSLSEENNDSKLLESGLMNSQESSWGKNVSSTESGRLFKGKRAHGPALLTKDNALFKVSISLLKTNKTSNNSATNRKTHIDGPSLLIENSPSVWQNILESDTEFKKVTPLIHDRMLMDKNATALRLNHMSNKTTSSKNMEMVQQKKEGPIPPDAQNPDMSFFKMLFLPESARWIQRTHGKNSLNSGQGPSPKQLVSLGPEKSVEGQNFLSEKNKVVVGKGEFTKDVGLKEMVFPSSRNLFLTNLDNLHENNTHNQEKKIQEEIEKKETLIQENVVLPQIHTVTGTKNFMKNLFLLSTRQNVEGSYDGAYAPVLQDFRSLNDSTNRTKKHTAHFSKKGEEENLEGLGNQTKQIVEKYACTTRISPNTSQQNFVTQRSKRALKQFRLPLEETELEKRIIVDDTSTQWSKNMKHLTPSTLTQIDYNEKEKGAITQSPLSDCLTRSHSIPQANRSPLPIAKVSSFPSIRPIYLTRVLFQDNSSHLPAASYRKKDSGVQESSHFLQGAKKNNLSLAILTLEMTGDQREVGSLGTSATNSVTYKKVENTVLPKPDLPKTSGKVELLPKVHIYQKDLFPTETSNGSPGHLDLVEGSLLQGTEGAIKWNEANRPGKVPFLRVATESSAKTPSKLLDPLAWDNHYGTQIPKEEWKSQEKSPEKTAFKKKDTILSLNACESNHAIAAINEGQNKPEIEVTWAKQGRTERLCSQNPPVLKRHQREITRTTLQSDQEEIDYDDTISVEMKKEDFDIYDEDENQSPRSFQKKTRHYFIAAVERLWDYGMSSSPHVLRNRAQSGSVPQFKKVVFQEFTDGSFTQPLYRGELNEHLGLLGPYIRAEVEDNIMVTFRNQASRPYSFYSSLISYEEDQRQGAEPRKNFVKPNETKTYFWKVQHHMAPTKDEFDCKAWAYFSDVDLEKDVHSGLIGPLLVCHTNTLNPAHGRQVTVQEFALFFTIFDETKSWYFTENMERNCRAPCNIQMEDPTFKENYRFHAINGYIMDTLPGLVMAQDQRIRWYLLSMGSNENIHSIHFSGHVFTVRKKEEYKMALYNLYPGVFETVEMLPSKAGIWRVECLIGEHLHAGMSTLFLVYSNKCQTPLGMASGHIRDFQITASGQYGQWAPKLARLHYSGSINAWSTKEPFSWIKVDLLAPMIIHGIKTQGARQKFSSLYISQFIIMYSLDGKKWQTYRGNSTGTLMVFFGNVDSSGIKHNIFNPPIIARYIRLHPTHYSIRSTLRMELMGCDLNSCSMPLGMESKAISDAQITASSYFTNMFATWSPSKARLHLQGRSNAWRPQVNNPKEWLQVDFQKTMKVTGVTTQGVKSLLTSMYVKEFLISSSQDGHQWTLFFQNGKVKVFQGNQDSFTPVVNSLDPPLLTRYLRIHPQSWVHQIALRMEVLGCEAQDLY
如实施例1中所讨论的,与编码相应的人非密码子优化序列的天然存在的核苷酸序列相比,通过实施特别针对人肝细胞的密码子使用偏好性来改进编码fVIII变体ET3和HSQ的cDNA核苷酸序列。还做出了提高翻译效率的其他改变,如GC内含物、mRNA二级结构、过早PolyA位点、RNA不稳定性基序、mRNA的稳定自由能、内部χ位点、核糖体结合位点、隐蔽剪接位点、阴性CpG岛、SD序列、TATA框和隐蔽终止信号的优化。
此外,去除了CpG DNA基序,因为它们可导致基因甲基化和沉默。参见Bird,DNAmethylation and the frequency of CpG in animal DNA,1980,Nucleic Acids Res,8:1499–1504。密码子被高度使用的人/肝替代品替代,该替代品不会导致在序列中形成5’-CG-3’二核苷酸。CpG的去除还可减少对包含修饰的转基因的载体的免疫应答,从而增强了载体的安全性和效能。参见J Clin Invest.2013,123(7):2994-3001,题目为“CpG-depleted adeno-associated virus vectors evade immune detection”。
ET3是B结构域缺失型(BDD)fVIII杂合体,其含有人和猪结构域,即,在缺失型B结构域内具有接头的序列(A1和A3猪,参见图1A和1B)。ET3利用24氨基酸的猪序列衍生的OL接头序列,即,猪衍生的序列SFAQNSRPPSASAPKPPVLRRHQR(SEQ ID NO:23)。HSQ是人fVIII变体,其中BDD人fVIII蛋白质被第14位氨基酸人衍生的SQ接头SFSQNPPVLKRHQR(SEQ ID NO:22)取代。HSQ氨基酸序列提供为SEQ ID NO:3。HSQ和ET3都含有针对B结构域的PACE/弗林蛋白酶加工序列的RHQR(SEQ ID NO:24)识别序列。
如实施例1中所讨论的,编码ET3的核苷酸序列是密码子优化的以在人肝脏中表达。示例性的肝密码子优化的ET3序列被提供为SEQ ID NO:12。在一些实施方案中,提供包含如SEQ ID NO:12所示的核苷酸序列或与其有至少90%相同性的序列的重组核酸分子。进一步地,去除密码子优化的ET3序列内的CpG基序以提供如SEQ ID NO:11所示的CpG缺失的肝密码子优化的ET3序列。在一些实施方案中,提供包含如SEQ ID NO:11所示的核苷酸序列或与其有至少90%(如至少95%)相同性的序列的重组核酸分子。
如实施例1中所讨论的,编码HSQ的核苷酸序列是密码子优化的以在人肝脏中表达。进一步地,去除密码子优化的HSQ序列内的CpG基序以提供如SEQ ID NO:2所示的CpG缺失的肝密码子优化的HSQ序列。在一些实施方案中,提供包含如SEQ ID NO:2所示的核苷酸序列或与其有至少90%(如至少95%)相同性的序列的重组核酸分子。
此外,优化编码ET3和HSQ的核苷酸序列以在骨髓细胞中表达。示例性的CpG缺失的骨髓密码子优化的ET3序列提供为SEQ ID NO:125。在一些实施方案中,提供包含如SEQ IDNO:125所示的核苷酸序列或与其有至少90%(如至少95%)相同性的序列的重组核酸分子。示例性的CpG缺失的骨髓密码子优化的HSQ序列提供为SEQ ID NO:126。在一些实施方案中,提供包含如SEQ ID NO:126所示的核苷酸序列或与其有至少90%(如至少95%)相同性的序列的重组核酸分子。
在另外的实施方案中,当从为许多fIX靶向基因治疗策略的靶组织的肝脏中表达转基因时,提供为高水平表达而设计的fIX编码序列变体。为生成该编码序列,利用肝靶向的密码子优化策略。
如实施例1中所讨论的,与编码相应的人非密码子优化的序列的天然存在的核苷酸序列相比,通过实现特别针对人肝脏细胞的密码子使用偏好性来优化编码fIX的核苷酸序列。还做出了提高翻译效能的其他改变,如GC内含物、mRNA二级结构、过早PolyA位点、RNA不稳定性基序、mRNA的稳定自由能、内部χ位点、核糖体结合位点、隐秘剪接位点、阴性CpG岛、SD序列、TATA框和隐秘终止信号的优化。
除了调节密码子使用偏好性之外,进一步修饰所产生的序列以去除可抑制转基因的高效表达的CpG基序。进一步地,在一些实施方案中,重组fIX核酸分子可编码具有K5A突变(Darrel Stafford collagen binding mutation,Gui等,Blood.2002,100(1):153-8)的fIX。在某些实施方案中,重组fIX核酸分子可编码具有R338L突变(Padua mutation)的fIX,所述突变为天然存在的功能突变增益,其已表明fIX的特异性活性提高了8倍。此外产生序列变体以反映在包括丙氨酸和苏氨酸的第148位残基处fIX的两个主要的多态性。在一些实施方案中,这些fIX序列可以单链或自互补双链转基因设计植入肝靶向的AAV中。
实施例1中讨论了编码fVIII或fIX蛋白质或其变体的示例性重组核酸序列,其被修饰以进行组织特异性表达。
SEQ ID NO:12提供了示例性的肝密码子优化的ET3序列。在一些实施方案中,提供了包含如SEQ ID NO:12所示的核酸序列或与其有至少90%(如至少95%)相同性的序列或由如SEQ ID NO:12所示的核酸序列或与其有至少90%(如至少95%)相同性的序列组成的重组核酸分子。
SEQ ID NO:11提供了示例性的CpG缺失的肝密码子优化的ET3序列。在一些实施方案中,提供了包含如SEQ ID NO:11所示的核酸序列或与其有至少90%(如至少95%)相同性的序列或由如SEQ ID NO:11所示的核酸序列或与其有至少90%(如至少95%)相同性的序列组成的重组核酸分子。
SEQ ID NO:2提供了示例性的CpG缺失的肝密码子优化的HSQ序列。在一些实施方案中,提供了包含如SEQ ID NO:2所示的核酸序列或与其有至少90%(如至少95%)相同性的序列或由如SEQ ID NO:2所示的核酸序列或与其有至少90%(如至少95%)相同性的序列组成的重组核酸分子。
SEQ ID NO:125提供了示例性的CpG缺失的骨髓密码子优化的ET3序列。在一些实施方案中,提供了包含如SEQ ID NO:125所示的核酸序列或与其有至少90%(如至少95%)相同性的序列或由如SEQ ID NO:125所示的核酸序列或与其有至少90%(如至少95%)相同性的序列组成的重组核酸分子。
SEQ ID NO:126提供了示例性的CpG缺失的骨髓密码子优化的HSQ序列。在一些实施方案中,提供了包含如SEQ ID NO:126所示的核酸序列或与其有至少90%(如至少95%)相同性的序列或由如SEQ ID NO:126所示的核酸序列或与其有至少90%(如至少95%)相同性的序列组成的重组核酸分子。
实施例1中讨论了编码fIX蛋白质或其变体的示例性重组核酸序列,其被修饰以进行组织特异性表达。
SEQ ID NO:124提供了示例性的具有Padua/Malmo突变和无CpG的肝密码子优化的fIX序列。在一些实施方案中,提供了包含如SEQ ID NO:124所示的核酸序列或与其有至少90%(如至少95%)相同性的序列或由如SEQ ID NO:124所示的核酸序列或与其有至少90%(如至少95%)相同性的序列组成的重组核酸分子。
SEQ ID NO:8提供了示例性的无CpG且编码A582修饰的肝密码子优化的fIX序列。在一些实施方案中,提供了包含如SEQ ID NO:8所示的核酸序列或与其有至少90%(如至少95%)相同性的序列或由如SEQ ID NO:8所示的核酸序列或与其有至少90%(如至少95%)相同性的序列组成的重组核酸分子。
SEQ ID NO:9提供了示例性的无CpG且包含Padua和A582修饰的肝密码子优化的fIX序列。在一些实施方案中,提供了包含如SEQ ID NO:9所示的核酸序列或与其有至少90%(如至少95%)相同性的序列或由如SEQ ID NO:9所示的核酸序列或与其有至少90%(如至少95%)相同性的序列组成的重组核酸分子。
SEQ ID NO:10提供了示例性的具有Padua/Malmo突变和无CpG的肝密码子优化的fIX序列。在一些实施方案中,提供了包含如SEQ ID NO:10所示的核酸序列或与其有至少90%(如至少95%)相同性的序列或由如SEQ ID NO:10所示的核酸序列或与其有至少90%(如至少95%)相同性的序列组成的重组核酸分子。
SEQ ID NO:127提供了示例性的具有Padua/Malmo突变和无CpG的人密码子优化的fIX序列。在一些实施方案中,提供了包含如SEQ ID NO:127所示的核酸序列或与其有至少90%(如至少95%)相同性的序列或由如SEQ ID NO:127所示的核酸序列或与其有至少90%(如至少95%)相同性的序列组成的重组核酸分子。
在用于实施方案的本文所述的载体(如AAV载体)中包含任意上述讨论的编码fVIII或fIX蛋白质或其变体的重组核酸分子,在所述实施方案中,感兴趣的是fVIII或fIX蛋白质或其变体的表达。
在一些实施方案中,提供了分离的蛋白质,所述分离的蛋白质包含由SEQ ID NO:8、9或10之一编码的氨基酸序列,如以下SEQ ID NO:17-18所示的氨基酸序列。在一些实施方案中,提供了分离的蛋白质,所述蛋白质包含如SEQ ID NO:17所示的氨基酸序列或与其有至少90%(如至少95%)相同性的具有fIX活性的氨基酸序列。在一些实施方案中,提供了分离的蛋白质,所述分离的蛋白质包含如SEQ ID NO:18所示的氨基酸序列或与其有至少90%(如至少95%)相同性的具有fIX活性的氨基酸序列。在一些实施方案中,提供了分离的蛋白质,所述分离的蛋白质包含如SEQ ID NO:19所示的氨基酸序列或与其有至少90%(如至少95%)相同性的具有fIX活性的氨基酸序列。
SEQ ID NO:8编码如SEQ ID NO:17所示的氨基酸序列:
MQRVNMIMAESPGLITICLLGYLLSAECTVFLDHENANKILNRPKRYNSGKLEEFVQGNLERECMEEKCSFEEAREVFENTERTTEFWKQYVDGDQCESNPCLNGGSCKDDINSYECWCPFGFEGKNCELDVTCNIKNGRCEQFCKNSADNKVVCSCTEGYRLAENQKSCEPAVPFPCGRVSVSQTSKLTRAEAVFPDVDYVNSTEAETILDNITQSTQSFNDFTRVVGGEDAKPGQFPWQVVLNGKVDAFCGGSIVNEKWIVTAAHCVETGVKITVVAGEHNIEETEHTEQKRNVIRIIPHHNYNAAINKYNHDIALLELDEPLVLNSYVTPICIADKEYTNIFLKFGSGYVSGWGRVFHKGRSALVLQYLRVPLVDRATCLRSTKFTIYNNMFCAGFHEGGRDSCQGDSGGPHVTEVEGTSFLTGIISWGEECAMKGKYGIYTKVSRYVNWIKEKTKLT
SEQ ID NO:9编码如SEQ ID NO:18所示的氨基酸序列:
MQRVNMIMAESPGLITICLLGYLLSAECTVFLDHENANKILNRPKRYNSGKLEEFVQGNLERECMEEKCSFEEAREVFENTERTTEFWKQYVDGDQCESNPCLNGGSCKDDINSYECWCPFGFEGKNCELDVTCNIKNGRCEQFCKNSADNKVVCSCTEGYRLAENQKSCEPAVPFPCGRVSVSQTSKLTRAEAVFPDVDYVNSTEAETILDNITQSTQSFNDFTRVVGGEDAKPGQFPWQVVLNGKVDAFCGGSIVNEKWIVTAAHCVETGVKITVVAGEHNIEETEHTEQKRNVIRIIPHHNYNAAINKYNHDIALLELDEPLVLNSYVTPICIADKEYTNIFLKFGSGYVSGWGRVFHKGRSALVLQYLRVPLVDRATCLLSTKFTIYNNMFCAGFHEGGRDSCQGDSGGPHVTEVEGTSFLTGIISWGEECAMKGKYGIYTKVSRYVNWIKEKTKLT
SEQ ID NO:10编码如SEQ ID NO:19所示的氨基酸序列:
MQRVNMIMAESPGLITICLLGYLLSAECTVFLDHENANKILNRPKRYNSGKLEEFVQGNLERECMEEKCSFEEAREVFENTERTTEFWKQYVDGDQCESNPCLNGGSCKDDINSYECWCPFGFEGKNCELDVTCNIKNGRCEQFCKNSADNKVVCSCTEGYRLAENQKSCEPAVPFPCGRVSVSQTSKLTRAETVFPDVDYVNSTEAETILDNITQSTQSFNDFTRVVGGEDAKPGQFPWQVVLNGKVDAFCGGSIVNEKWIVTAAHCVETGVKITVVAGEHNIEETEHTEQKRNVIRIIPHHNYNAAINKYNHDIALLELDEPLVLNSYVTPICIADKEYTNIFLKFGSGYVSGWGRVFHKGRSALVLQYLRVPLVDRATCLLSTKFTIYNNMFCAGFHEGGRDSCQGDSGGPHVTEVEGTSFLTGIISWGEECAMKGKYGIYTKVSRYVNWIKEKTKLT
示例性的核酸可通过克隆技术来制备,或者合成生成。适宜的克隆和测序技术的示例以及足以通过许多克隆练习来指引本领域技术人员的说明是公知的(参见,例如,Sambrook等(Molecular Cloning:A Laboratory Manual,4th ed,Cold Spring Harbor,NewYork,2012)和Ausubel等(In Current Protocols in Molecular Biology,John Wiley&Sons,New York,through supplement 104,2013)。来自生物试剂和试验设备的生产商的产品信息也提供了有用的信息。这样的生产商包括SIGMA Chemical Company(Saint Louis,MO),R&D Systems(Minneapolis,MN),Pharmacia Amersham(Piscataway,NJ),CLONTECHLaboratories,Inc.(Palo Alto,CA),Chem Genes Corp.,Aldrich Chemical Company(Milwaukee,WI),Glen Research,Inc.,GIBCO BRL Life Technologies,Inc.(Gaithersburg,MD),Fluka Chemica-Biochemika Analytika(Fluka Chemie AG,Buchs,Switzerland),Invitrogen(Carlsbad,CA),and Applied Biosystems(Foster City,CA),以及许多本领域技术人员公知的其他的商业来源。
核酸还也可通过扩增方法来制备。扩增方法包括聚合酶链反应(PCR)、连接酶链反应(LCR)、基于转录的扩增***(TAS)、自维持序列复制***(3SR)。许多克隆方法、宿主细胞和体外扩增方法对本领域的技术人员来说是公知的。
IV.重组载体和基因治疗应用
本文公开的核酸和启动子序列可用于生产载体(如rAAV载体),还可用作反义递送载体、基因治疗载体或疫苗载体。在某些实施方案中,本发明公开了基因递送载体和含有本文公开的核酸序列的宿主细胞。在一些实施方案中,可通过包括静脉内注射、离体转导、转染、电穿孔、脂质体递送、膜融合技术、高速DNA包被微丸、病毒性感染或原生质体融合的任何适宜的方法将选择的载体递送至受试对象中以将转基因引入到受试对象中。
在某些实施方案中,本发明涉及病毒颗粒,例如衣壳,其含有编码本文公开的启动子和蛋白质的核酸序列。病毒颗粒、衣壳和重组载体可用于将异源基因或其他核酸序列递送至靶细胞中。可容易地在各种载体***、衣壳和宿主细胞中利用核酸。在某些实施方案中,核酸位于包含在衣壳内的载体中,所述衣壳包含cap蛋白质,包括AAV衣壳蛋白质vp1、vp2、vp3和高变区。
在某些实施方案中,本文公开的核酸可以是任意可递送至宿主细胞中的遗传元件的一部分,例如裸DNA、质粒、噬菌体、转位子、粘粒、附加体、非病毒递送运载体(如基于脂质的载体)中的蛋白质、病毒等,它们转移其上携带的序列。
在某些实施方案中,载体可以是基于慢性病毒(含有慢病毒基因或序列)的载体,例如,具有源自VSVG或GP64假型或二者的核酸序列的载体。在某些实施方案中,源自VSVG或GP64假型的核酸序列可以是至少一个或两个或多个基因或超过1000、500、400、300、200、100、50或25个连续核苷酸的基因片段,或者与所述基因或片段有大于50%、60%、70%、80%、90%、95%或99%相同性的核苷酸序列。
在一些实施方案中,提供了在有需要的受试对象中诱导血液凝结的方法。方法包括将治疗有效量的本文所述的编码凝血因子的载体(如AAV载体)施用于受试对象。在一些实施方案中,受试对象是患有凝血障碍如血友病A或血友病B的受试者。在一些实施方案中,凝血障碍为血友病A,将包含编码具有fVIII活性的蛋白质的核酸分子的载体施用于受试对象。在其他的实施方案中,凝血障碍为血友病B,将包含编码具有fIX活性的蛋白质的核酸分子的载体施用于受试对象。
在一些实施方案中,本文公开的核酸和启动子序列可用于生产AAV载体。AAV属于细小病毒科和依赖病毒属。AAV是包装线性单链DNA基因组的小型非包膜病毒。AAV DNA的正反义链以相同的频率包装入AAV衣壳中。
AAV基因组的特征在于位于两个开放阅读框架(ORF)侧面的两个反向末端重复序列(ITR)。在AAV2基因组中,例如,ITR的前125个核苷酸是回文,其自身折叠以使碱基配对最大化并形成T形发夹结构。称为D序列的ITR的其他20个碱基仍保持不配对。ITR是对AAV DNA复制来说重要的顺式作用序列;ITR是复制的起点并作为用于通过DNA聚合酶进行第二链合成的引物。在该合成期间形成的称为复制形式的单体的双链DNA用于第二轮自启动复制并形成复制形式的二聚体。通过链置换机制加工这些双链中间体,从而产生用于包装的单链DNA和用于转录的双链DNA。Rep绑定元件和末端解析位点(terminal resolution site,TRS)位于ITR内。这些特征在AAV复制期间被病毒调节蛋白Rep使用来处理双链中间体。除了它们在AAV复制中的作用,ITR对AAV基因组包装、转录、非允许条件下的负调控和位点特异性整合来说也是必需的(Daya和Berns,Clin Microbiol Rev 21(4):583-593,2008)。
AAV的左ORF含有Rep基因,该基因编码四种蛋白质-Rep78、Rep68、Rep52和Rep40。右ORF含有Cap基因,该基因产生3个病毒衣壳蛋白质(VP1、VP2和VP3)。AAV衣壳含有60个排列成二十面体对称的病毒衣壳蛋白质。VP1、VP2和VP3以1:1:10的摩尔比存在(Daya和Bems,Clin Microbiol Rev 21(4):583-593,2008)。
AAV载体通常在ITR之间含有替代rep和cap基因的转基因表达盒。通过细胞与含有载体基因组的质粒和反式表达rep和cap蛋白质的包装/辅助构建体的质粒共转染来生产病毒颗粒。感染期间,AAV病毒基因组进入细胞核和并能以多分子状态持续存在。一个一般的结果是通过第二链合成或互补链配对将AAV基因组转化为双链环状附加体。
在AAV载体的背景下,所公开的载体通常具有包含以下结构的重组基因组:
(5’AAV ITR)-(启动子)-(转基因)-(3’AAV ITR)。
如上所讨论,这些重组载体在ITR之间含有替代rep和cap基因的转基因表达盒。例如,通过细胞与含有重组载体基因组和反式表达rep和cap蛋白质的包装/辅助构建体的质粒的共转染来生产载体颗粒。例如,在一些实施方案中,重组AAV载体可具有结构如以下所示的基因组:
(5’AAV ITR)-(HCB)-(转基因)-(3’AAV ITR)
(5’AAV ITR)-(HCB)-(fVIII)-(3’AAV ITR)
(5’AAV ITR)-(HCB)-(fVIII-B-结构域缺失)-(3’AAV ITR)
(5’AAV ITR)-(HCB)-(ET3)-(3’AAV ITR)
(5’AAV ITR)-(HCB)-(ET3,Seq_12)-(3’AAV ITR)
(5’AAV ITR)-(HCB)-(ET3,Seq_11)-(3’AAV ITR)
(5’AAV ITR)-(HCB)-(HSQ)-(3’AAV ITR)
(5’AAV ITR)-(HCB)-(HSQ,Seq_2)-(3’AAV ITR)
(5’AAV ITR)-(HCB)-(fIX)-(3’AAV ITR)
(5’AAV ITR)-(HCB)-(fIX,Seq_124)-(3’AAV ITR)
(5’AAV ITR)-(HCB)-(fIX,Seq_8)-(3’AAV ITR)
(5’AAV ITR)-(HCB)-(fIX,Seq_9)-(3’AAV ITR)
(5’AAV ITR)-(HCB)-(fIX,Seq_10)-(3’AAV ITR)
(5’AAV ITR)-(HSh-HCB)-(转基因)-(3’AAV ITR)
(5’AAV ITR)-(HSh-HCB)-(fVIII)-(3’AAV ITR)
(5’AAV ITR)-(HSh-HCB)-(fVIII-B-结构域缺失)-(3’AAV ITR)
(5’AAV ITR)-(HSh-HCB)-(ET3)-(3’AAV ITR)
(5’AAV ITR)-(HSh-HCB)-(ET3,Seq_12)-(3’AAV ITR)
(5’AAV ITR)-(HSh-HCB)-(ET3,Seq_11)-(3’AAV ITR)
(5’AAV ITR)-(HSh-HCB)-(HSQ)-(3’AAV ITR)
(5’AAV ITR)-(HSh-HCB)-(HSQ,Seq_2)-(3’AAV ITR)
(5’AAV ITR)-(HSh-HCB)-(fIX)-(3’AAV ITR)
(5’AAV ITR)-(HSh-HCB)-(fIX,Seq_124)-(3’AAV ITR)
(5’AAV ITR)-(HSh-HCB)-(fIX,Seq_8)-(3’AAV ITR)
(5’AAV ITR)-(HSh-HCB)-(fIX,Seq_9)-(3’AAV ITR)
(5’AAV ITR)-(HSh-HCB)-(fIX,Seq_10)-(3’AAV ITR)
(5’AAV ITR)-(5’HSh-HCB)-(转基因)-(3’AAV ITR)
(5’AAV ITR)-(5’HSh-HCB)-(fVIII-B-结构域缺失)-(3’AAV ITR)
(5’AAV ITR)-(5’HSh-HCB)-(ET3)-(3’AAV ITR)
(5’AAV ITR)-(5’HSh-HCB)-(ET3,Seq_12)-(3’AAV ITR)
(5’AAV ITR)-(5’HSh-HCB)-(ET3,Seq_11)-(3’AAV ITR)
(5’AAV ITR)-(5’HSh-HCB)-(HSQ)-(3’AAV ITR)
(5’AAV ITR)-(5’HSh-HCB)-(HSQ,Seq_2)-(3’AAV ITR)
(5’AAV ITR)-(5’HSh-HCB)-(fIX)-(3’AAV ITR)
(5’AAV ITR)-(5’HSh-HCB)-(fIX,Seq_124)-(3’AAV ITR)
(5’AAV ITR)-(5’HSh-HCB)-(fIX,Seq_8)-(3’AAV ITR)
(5’AAV ITR)-(5’HSh-HCB)-(fIX,Seq_9)-(3’AAV ITR)
(5’AAV ITR)-(5’HSh-HCB)-(fIX,Seq_10)-(3’AAV ITR)
(5’AAV ITR)-(3’HSh-HCB)-(转基因)-(3’AAV ITR)
(5’AAV ITR)-(3’HSh-HCB)-(fVIII)-(3’AAV ITR)
(5’AAV ITR)-(3’HSh-HCB)-(fVIII-B-结构域缺失)-(3’AAV ITR)
(5’AAV ITR)-(3’HSh-HCB)-(ET3)-(3’AAV ITR)
(5’AAV ITR)-(3’HSh-HCB)-(ET3,Seq_12)-(3’AAV ITR)
(5’AAV ITR)-(3’HSh-HCB)-(ET3,Seq_11)-(3’AAV ITR)
(5’AAV ITR)-(3’HSh-HCB)-(HSQ)-(3’AAV ITR)
(5’AAV ITR)-(3’HSh-HCB)-(HSQ,Seq_2)-(3’AAV ITR)
(5’AAV ITR)-(3’HSh-HCB)-(fIX)-(3’AAV ITR)
(5’AAV ITR)-(3’HSh-HCB)-(fIX,Seq_124)-(3’AAV ITR)
(5’AAV ITR)-(3’HSh-HCB)-(fIX,Seq_8)-(3’AAV ITR)
(5’AAV ITR)-(3’HSh-HCB)-(fIX,Seq_9)-(3’AAV ITR)
(5’AAV ITR)-(3’HSh-HCB)-(fIX,Seq_10)-(3’AAV ITR)
(5’AAV ITR)-(ABP-HP1-God-TSS)-(转基因)-(3’AAV ITR)
(5’AAV ITR)-(ABP-HP1-God-TSS)-(fVIII)-(3’AAV ITR)
(5’AAV ITR)-(ABP-HP1-God-TSS)-(fVIII-B-结构域缺失)-(3’AAV ITR)
(5’AAV ITR)-(ABP-HP1-God-TSS)-(ET3)-(3’AAV ITR)
(5’AAV ITR)-(ABP-HP1-God-TSS)-(ET3,Seq_12)-(3’AAV ITR)
(5’AAV ITR)-(ABP-HP1-God-TSS)-(ET3,Seq_11)-(3’AAV ITR)
(5’AAV ITR)-(ABP-HP1-God-TSS)-(HSQ)-(3’AAV ITR)
(5’AAV ITR)-(ABP-HP1-God-TSS)-(HSQ,Seq_2)-(3’AAV ITR)
(5’AAV ITR)-(ABP-HP1-God-TSS)-(fIX)-(3’AAV ITR)
(5’AAV ITR)-(ABP-HP1-God-TSS)-(fIX,Seq_124)-(3’AAV ITR)
(5’AAV ITR)-(ABP-HP1-God-TSS)-(fIX,Seq_8)-(3’AAV ITR)
(5’AAV ITR)-(ABP-HP1-God-TSS)-(fIX,Seq_9)-(3’AAV ITR)
(5’AAV ITR)-(ABP-HP1-God-TSS)-(fIX,Seq_10)-(3’AAV ITR)
(5’AAV ITR)-(HSh-SynO-TSS)-(转基因)-(3’AAV ITR)
(5’AAV ITR)-(HSh-SynO-TSS)-(fVIII)-(3’AAV ITR)
(5’AAV ITR)-(HSh-SynO-TSS)-(fVIII-B-结构域缺失)-(3’AAV ITR)
(5’AAV ITR)-(HSh-SynO-TSS)-(ET3)-(3’AAV ITR)
(5’AAV ITR)-(HSh-SynO-TSS)-(ET3,Seq_12)-(3’AAV ITR)
(5’AAV ITR)-(HSh-SynO-TSS)-(ET3,Seq_11)-(3’AAV ITR)
(5’AAV ITR)-(HSh-SynO-TSS)-(HSQ)-(3’AAV ITR)
(5’AAV ITR)-(HSh-SynO-TSS)-(HSQ,Seq_2)-(3’AAV ITR)
(5’AAV ITR)-(HSh-SynO-TSS)-(fIX)-(3’AAV ITR)
(5’AAV ITR)-(HSh-SynO-TSS)-(fIX,Seq_124)-(3’AAV ITR)
(5’AAV ITR)-(HSh-SynO-TSS)-(fIX,Seq_8)-(3’AAV ITR)
(5’AAV ITR)-(HSh-SynO-TSS)-(fIX,Seq_9)-(3’AAV ITR)
(5’AAV ITR)-(HSh-SynO-TSS)-(fIX,Seq_10)-(3’AAV ITR)
(5’AAV ITR)-(sHS-SynO-TSS)-(转基因)-(3’AAV ITR)
(5’AAV ITR)-(sHS-SynO-TSS)-(fVIII)-(3’AAV ITR)
(5’AAV ITR)-(sHS-SynO-TSS)-(fVIII-B-结构域缺失)-(3’AAV ITR)
(5’AAV ITR)-(sHS-SynO-TSS)-(ET3)-(3’AAV ITR)
(5’AAV ITR)-(sHS-SynO-TSS)-(ET3,Seq_12)-(3’AAV ITR)
(5’AAV ITR)-(sHS-SynO-TSS)-(ET3,Seq_11)-(3’AAV ITR)
(5’AAV ITR)-(sHS-SynO-TSS)-(HSQ)-(3’AAV ITR)
(5’AAV ITR)-(sHS-SynO-TSS)-(HSQ,Seq_2)-(3’AAV ITR)
(5’AAV ITR)-(sHS-SynO-TSS)-(fIX)-(3’AAV ITR)
(5’AAV ITR)-(sHS-SynO-TSS)-(fIX,Seq_124)-(3’AAV ITR)
(5’AAV ITR)-(sHS-SynO-TSS)-(fIX,Seq_8)-(3’AAV ITR)
(5’AAV ITR)-(sHS-SynO-TSS)-(fIX,Seq_9)-(3’AAV ITR)
(5’AAV ITR)-(sHS-SynO-TSS)-(fIX,Seq_10)-(3’AAV ITR)
调控序列如5’Kozak序列和/或3’聚腺苷酸化信号可位于转基因的侧面。例如,在一些实施方案中,重组AAV载体可具有结构如以下所示的基因组:
(5’AAV ITR)-(HCB)-(Kozak)-(转基因)-(polyA信号)-(polyA信号)-(3’AAVITR)
(5’AAV ITR)-(HCB)-(Kozak)-(fVIII)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(HCB)-(Kozak)-(fVIII-B-结构域缺失)-(polyA信号)-(3’AAVITR)
(5’AAV ITR)-(HCB)-(Kozak)-(ET3)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(HCB)-(Kozak)-(ET3,Seq_12)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(HCB)-(Kozak)-(ET3,Seq_11)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(HCB)-(Kozak)-(HSQ)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(HCB)-(Kozak)-(HSQ,Seq_2)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(HCB)-(Kozak)-(fIX)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(HCB)-(Kozak)-(fIX,Seq_124)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(HCB)-(Kozak)-(fIX,Seq_8)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(HCB)-(Kozak)-(fIX,Seq_9)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(HCB)-(Kozak)-(fIX,Seq_10)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(HSh-HCB)-(Kozak)-(转基因)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(HSh-HCB)-(Kozak)-(fVIII)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(HSh-HCB)-(Kozak)-(fVIII-B-结构域缺失)-(polyA信号)-(3’AAVITR)
(5’AAV ITR)-(HSh-HCB)-(Kozak)-(ET3)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(HSh-HCB)-(Kozak)-(ET3,Seq_12)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(HSh-HCB)-(Kozak)-(ET3,Seq_11)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(HSh-HCB)-(Kozak)-(HSQ)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(HSh-HCB)-(Kozak)-(HSQ,Seq_2)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(HSh-HCB)-(Kozak)-(fIX)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(HSh-HCB)-(Kozak)-(fIX,Seq_124)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(HSh-HCB)-(Kozak)-(fIX,Seq_8)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(HSh-HCB)-(Kozak)-(fIX,Seq_9)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(HSh-HCB)-(Kozak)-(fIX,Seq_10)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(5’HSh-HCB)-(Kozak)-(转基因)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(5’HSh-HCB)-(Kozak)-(fVIII)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(5’HSh-HCB)-(Kozak)-(fVIII-B-结构域缺失)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(5’HSh-HCB)-(Kozak)-(ET3)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(5’HSh-HCB)-(Kozak)-(ET3,Seq_12)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(5’HSh-HCB)-(Kozak)-(ET3,Seq_11)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(5’HSh-HCB)-(Kozak)-(HSQ)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(5’HSh-HCB)-(Kozak)-(HSQ,Seq_2)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(5’HSh-HCB)-(Kozak)-(fIX)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(5’HSh-HCB)-(Kozak)-(fIX,Seq_124)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(5’HSh-HCB)-(Kozak)-(fIX,Seq_8)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(5’HSh-HCB)-(Kozak)-(fIX,Seq_9)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(5’HSh-HCB)-(Kozak)-(fIX,Seq_10)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(3’HSh-HCB)-(Kozak)-(转基因)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(3’HSh-HCB)-(Kozak)-(fVIII)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(3’HSh-HCB)-(Kozak)-(fVIII-B-结构域缺失)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(3’HSh-HCB)-(Kozak)-(ET3)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(3’HSh-HCB)-(Kozak)-(ET3,Seq_12)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(3’HSh-HCB)-(Kozak)-(ET3,Seq_11)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(3’HSh-HCB)-(Kozak)-(HSQ)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(3’HSh-HCB)-(Kozak)-(HSQ,Seq_2)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(3’HSh-HCB)-(Kozak)-(fIX)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(3’HSh-HCB)-(Kozak)-(fIX,Seq_124)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(3’HSh-HCB)-(Kozak)-(fIX,Seq_8)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(3’HSh-HCB)-(Kozak)-(fIX,Seq_9)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(3’HSh-HCB)-(Kozak)-(fIX,Seq_10)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(ABP-HP1-God-TSS)-(Kozak)-(转基因)-(polyA信号)-(3’AAVITR)
(5’AAV ITR)-(ABP-HP1-God-TSS)-(Kozak)-(fVIII)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(ABP-HP1-God-TSS)-(Kozak)-(fVIII-B-结构域缺失)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(ABP-HP1-God-TSS)-(Kozak)-(ET3)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(ABP-HP1-God-TSS)-(Kozak)-(ET3,Seq_12)-(polyA信号)-(3’AAVITR)
(5’AAV ITR)-(ABP-HP1-God-TSS)-(Kozak)-(ET3,Seq_11)-(polyA信号)-(3’AAVITR)
(5’AAV ITR)-(ABP-HP1-God-TSS)-(Kozak)-(HSQ)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(ABP-HP1-God-TSS)-(Kozak)-(HSQ,Seq_2)-(polyA信号)-(3’AAVITR)
(5’AAV ITR)-(ABP-HP1-God-TSS)-(Kozak)-(fIX)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(ABP-HP1-God-TSS)-(Kozak)-(fIX,Seq_124)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(ABP-HP1-God-TSS)-(Kozak)-(fIX,Seq_8)-(polyA信号)-(3’AAVITR)
(5’AAV ITR)-(ABP-HP1-God-TSS)-(Kozak)-(fIX,Seq_9)-(polyA信号)-(3’AAVITR)
(5’AAV ITR)-(ABP-HP1-God-TSS)-(Kozak)-(fIX,Seq_10)-(polyA信号)-(3’AAVITR)
(5’AAV ITR)-(HSh-SynO-TSS)-(Kozak)-(转基因)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(HSh-SynO-TSS)-(Kozak)-(fVIII)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(HSh-SynO-TSS)-(Kozak)-(fVIII-B-结构域缺失)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(HSh-SynO-TSS)-(Kozak)-(ET3)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(HSh-SynO-TSS)-(Kozak)-(ET3,Seq_12)-(polyA信号)-(3’AAVITR)
(5’AAV ITR)-(HSh-SynO-TSS)-(Kozak)-(ET3,Seq_11)-(polyA信号)-(3’AAVITR)
(5’AAV ITR)-(HSh-SynO-TSS)-(Kozak)-(HSQ)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(HSh-SynO-TSS)-(Kozak)-(HSQ,Seq_2)-(polyA信号)-(3’AAVITR)
(5’AAV ITR)-(HSh-SynO-TSS)-(Kozak)-(fIX)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(HSh-SynO-TSS)-(Kozak)-(fIX,Seq_124)-(polyA信号)-(3’AAVITR)
(5’AAV ITR)-(HSh-SynO-TSS)-(Kozak)-(fIX,Seq_8)-(polyA信号)-(3’AAVITR)
(5’AAV ITR)-(HSh-SynO-TSS)-(Kozak)-(fIX,Seq_9)-(polyA信号)-(3’AAVITR)
(5’AAV ITR)-(HSh-SynO-TSS)-(Kozak)-(fIX,Seq_10)-(polyA信号)-(3’AAVITR)
(5’AAV ITR)-(sHS-SynO-TSS)-(Kozak)-(转基因)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(sHS-SynO-TSS)-(Kozak)-(fVIII)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(sHS-SynO-TSS)-(Kozak)-(fVIII-B-结构域缺失)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(sHS-SynO-TSS)-(Kozak)-(ET3)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(sHS-SynO-TSS)-(Kozak)-(ET3,Seq_12)-(polyA信号)-(3’AAVITR)
(5’AAV ITR)-(sHS-SynO-TSS)-(Kozak)-(ET3,Seq_11)-(polyA信号)-(3’AAVITR)
(5’AAV ITR)-(sHS-SynO-TSS)-(Kozak)-(HSQ)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(sHS-SynO-TSS)-(Kozak)-(HSQ,Seq_2)-(polyA信号)-(3’AAVITR)
(5’AAV ITR)-(sHS-SynO-TSS)-(Kozak)-(fIX)-(polyA信号)-(3’AAV ITR)
(5’AAV ITR)-(sHS-SynO-TSS)-(Kozak)-(fIX,Seq_124)-(polyA信号)-(3’AAVITR)
(5’AAV ITR)-(sHS-SynO-TSS)-(Kozak)-(fIX,Seq_8)-(polyA信号)-(3’AAVITR)
(5’AAV ITR)-(sHS-SynO-TSS)-(Kozak)-(fIX,Seq_9)-(polyA信号)-(3’AAVITR)
(5’AAV ITR)-(sHS-SynO-TSS)-(Kozak)-(fIX,Seq_10)-(polyA信号)-(3’AAVITR)
可以容易地从任意AAV血清型中选择本文所述的AAV ITR和其他选择的AAV组分,包括但不限于AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9及其功能变体。这些ITR或其他AAV组分可采用本领域技术人员可获得的技术容易地与AAV血清型分离。此类AAV可以从学术的、商业的或公共的来源(例如the American Type CultureCollection,Manassas,Va.)中分离或获得。或者,AAV序列可参考在文献中或如GenBank、PubMed等的数据库中获得的公开的序列通过合成或其他适宜的手段获得。
在一些实施方案中,载体可以是重组AAV载体,所述重组AAV载体包含基因组,所述基因组包含编码本文提供的与编码fVIII变体的异源核酸分子可操作连接的任意肝特异性启动子(如HCB启动子,SEQ ID NO:4)的核酸分子,其中所述异源核酸分子包含如SEQ IDNO:2、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:125或SEQ ID NO:126所示的核酸序列,或与SEQ ID NO:2、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:125或SEQ ID NO:126有至少90%相同性的核酸序列或由如SEQ ID NO:2、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:125或SEQ ID NO:126所示的核酸序列,或与SEQ ID NO:2、SEQ ID NO:11、SEQ ID NO:12、SEQID NO:125或SEQ ID NO:126有至少90%相同性的核酸序列组成。在若干此种实施方案中,重组AAV基因组(从5’到3’ITR)的长度不超过5.1、5.0、4.9、4.8、4.7、4.6或4.5kb。
在一些实施方案中,载体可以是重组AAV载体,所述重组AAV载体包含基因组,所述基因组包含具有编码本文提供的与编码fIX变体的异源核酸分子可操作连接的任意肝特异性启动子(如HCB启动子,SEQ ID NO:4)的核酸分子,其中所述异源核酸分子包含如SEQ IDNO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:124或SEQ ID NO:127所示的核酸序列,或与SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:124或SEQ ID NO:127有至少90%相同性的核酸序列或由如SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:124或SEQID NO:127所示的核酸序列,或与SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:124或SEQ ID NO:127有至少90%相同性的核酸序列组成。在若干此种实施方案中,重组AAV基因组(从5’到3’ITR)的长度不超过5.1、5.0、4.9、4.8、4.7、4.6或4.5kb。
目前,AAV是用于基因治疗最常使用的病毒之一。尽管AAV感染人和一些其他灵长类物种,但是尚不知晓AAV致病,并且会产生非常轻微的免疫应答。利用AAV的基因治疗载体能感染***的和休眠的细胞并能在染色体外的状态下持续存在,而不需整合到宿主细胞的基因组中。由于AAV的优点,本发明构想了AAV在本文公开的重组核酸分子和方法中的用途。
AAV具有若干基因治疗载体所需的特征,包括结合并进入靶细胞、进入细胞核的能力、在细胞核中表达延长的一段时间的能力和较低的毒性。然而,AAV基因组的小尺寸限制了可被并入的异源DNA的尺寸。为最小化这个问题,已构建了不编码Rep和整合效率元件(IEE)的AAV载体。保留了ITR,因为它们是包装(Daya and Berns,Clin Microbiol Rev 21(4):583-593,2008)所需的顺式信号。
用于生产适用于基因治疗的AAV的方法是公知的(参见,例如,美国专利申请2012/0100606;2012/0135515;2011/0229971;和2013/0072548;以及Ghosh等,Gene Ther 13(4):321-329,2006),并与本文所公开的重组核酸分子和方法一起使用。
在一些实施方案中,本文公开的核酸是表达盒或转基因的一部分。参见,例如,USPat.App.Pub.20150139953。表达盒由转基因和调控序列如启动子与5’和3’AAV反向末端重复序列(ITR)构成。在一个期望的实施方案中,使用AAV血清型2或8的ITR。然而,可选择来自其他适宜血清型的ITR。表达盒通常被包装入衣壳蛋白中并被递送入所选择的宿主细胞中。
在一些实施方案中,本发明提供了一种产生具有AAV血清型衣壳的重组腺相关病毒(AAV)或其一部分的方法。这种方法包括培养含有编码腺相关病毒(AAV)血清型衣壳蛋白的核酸序列;功能rep基因;由AAV反向末端重复序列(ITR)和转基因以及足以允许将表达盒包装入AAV衣壳蛋白质中的辅助因子功能的宿主细胞。参见,例如,USPat.App.Pub.20150139953。
用于在宿主细胞中培养以在AAV衣壳中包装AAV表达盒的组分可反式提供给宿主细胞。或者,一个或多个所述组分(例如,表达盒、rep序列、cap序列和/或辅助因子功能)可由已经本领技术人员已知的方法被工程化而含有一个或多个所需组分的稳定的宿主细胞来提供。最适宜的,此类稳定的宿主细胞含有在可诱导启动子的控制下的组分。然而,所需的组分可在组成型启动子的控制下。在另一种替代中,所选择的稳定的宿主细胞含有在组成型启动子的控制下的选择的组分和在一个或多个可诱导启动子的控制下其他选择的组分。例如,可生成源自293细胞(其含有在组成型启动子的控制下的E1辅助因子功能)的但含有在可诱导启动子的控制下的rep和/或cap蛋白质的稳定的宿主细胞。本领域技术人员还可生成其他稳定的宿主细胞。
在一些实施方案中,本发明涉及包含与转基因可操作组合的肝特异性启动子核酸序列的重组载体。转基因是与位于转基因侧面的载体序列不同的核酸序列,其编码目的蛋白或其他目的产物。核酸编码序列以允许在宿主细胞中进行转基因转录、翻译和/或表达的方式与调控组分可操作连接。
典型的转基因是编码在生物学和医学中使用的产物的序列,如蛋白质、肽、RNA、酶、显性负突变体或催化RNA。期望的RNA分子包括mRNA、tRNA、dsRNA、核糖体RNA、催化RNA、siRNA、microRNA、小发夹RNA、反式剪接RNA和反义RNA。有用的核酸序列的一个示例为抑制或消除靶核酸序列在受治疗的动物中表达的序列。通常,适宜的靶序列包括肿瘤学靶和病毒性疾病。
转基因可用于修正或改善基因缺陷,所述基因缺陷可包括正常基因以低于正常水平进行表达的缺陷或者不表达功能基因产物的缺陷。优选类型的转基因序列编码可在宿主细胞中表达的治疗性蛋白质或多肽。本发明进一步构想了用多个转基因例如以修正或改善由多亚基蛋白质引起的基因缺陷。在某些情况下,不同的转基因可用于编码蛋白质的各亚基或编码不同的肽或蛋白质。例如,对于免疫球蛋白、血小板衍生生长因子或肌营养不良蛋白,当编码蛋白质亚基的DNA的尺寸较大时,这是理想的。为了使细胞产生多亚基蛋白质,用含有每个不同亚基的重组病毒感染细胞。或者,由相同的转基因编码蛋白质的不同亚基。在这种情况下,单一转基因包括编码每个亚基的DNA,每个亚基的所述DNA被内部核糖酶进入位点(IRES)隔开。当编码每个亚基和顺式调控区如启动子、内含子、PolyA信号的DNA的尺寸较小时,例如,编码亚基和IRES以及顺式调控区的DNA的总尺寸小于4kb时,这是理想的。作为对IRES的替代,DNA可被编码2A肽的序列隔开,该DNA在翻译后自剪切。参见,例如,M.L.Donnelly,等,J.Gen.Virol.,78(Pt 1):13-21(Jan 1997);Furler,S.,等Gene Ther.,8(11):864-873(June 2001);Klump H.,等,Gene Ther.,8(10):811-817(May 2001)。在某些实施方案中,共施用携带所需转基因或亚基的rAAV以使它们进行体内串联体化以形成单一载体基因组。在此实施方案中,第一AAV可携带表达单一转基因的表达盒,第二AAV可携带表达在宿主细胞中进行共表达的不同的转基因的表达盒。然而,选择的转基因可编码任意生物学活性产物或其他产物,例如,研究所需的产物。
表达盒能携带在任何适宜的载体中,例如,质粒,其可被递送至宿主细胞中。本发明中使用的质粒可被工程化以使它们适用于复制以及任选地在原核细胞、哺乳动物细胞或二者中整合。这些质粒(或其它携带5’AAV IT-异源分子-3’ITR的载体)含有允许表达盒在真核生物和/或原核生物中复制的序列和用于这些***的选择标记物。优选地,携带表达盒的分子转染至细胞中,其中,该分子可瞬时存在。或者,表达盒(携带5’AAV ITR-异源分子-3'ITR)可染色体地或作为附加体而稳定地整合入宿主细胞的基因组中。在某些实施方案中,表达盒可以多拷贝,任选地以头接头、头结尾或尾结尾串联体的形式存在。适宜的转染技术是公知的并且可易于使用以将表达盒递送至宿主细胞中。
一般地,当通过转染递送包含表达盒的载体时,可调整载体和宿主细胞中的载体DNA的相对量,考虑的因素如选择的载体、递送方法和选择的宿主细胞。除了表达盒之外,宿主细胞含有使AAV衣壳蛋白质在宿主细胞中表达的序列和与在表达盒中发现的AAV ITR的血清型有相同血清型或有交叉互补血清型的rep序列。尽管提供rep和cap的分子可瞬时存在于宿主细胞中(例如通过转染),但是优选地是rep和cap蛋白质之一或二者与控制它们表达的启动子可稳定地在宿主细胞中表达,例如,作为附加体或通过整合进入宿主细胞的染色体中。
为了包装本发明的rAAV,包装宿主细胞通常还具有辅助因子功能。任选地,由疱疹病毒提供这些功能。最理想地,从人或非人灵长类腺病毒来源各自提供必要的辅助因子功能,如上文所述和/或从多种来源获得的那些,包括美国型培养菌种集(ATCC),Manassas,Va.(US)。可采用允许它们在细胞中表达的任意手段来提供期望的辅助因子功能。
在载体的宿主细胞中的引入可通过本领域已知的或如上文所述的任意手段实现,包括转染、感染、电穿孔、质粒递送、膜融合技术、高速DNA包被微丸、病毒感染和原生质体融合,除了其他以外。一个或多个基因可稳定地整合入宿主细胞的基因组中,作为附加体稳定地表达或瞬时表达。基因产物都可在附加体上瞬时表达或稳定地整合,或者一些基因产物可稳定表达而其他的则瞬时表达。此外,可独立地从组成型启动子、可诱导启动子或天然腺病毒启动子中选择针对每个腺病毒基因的启动子。例如,可通过生物体或细胞的特殊生理状态(即,通过分化状态或在复制或静态细胞中)或者通过外源性加入的因子来调控启动子。
可采用本领域技术人员已知的技术来完成分子(作为质粒或病毒)向宿主细胞的引入。在优选的实施方案中,采用标准的转染技术,例如,CaPO4转染或电穿孔,和/或通过混合腺病毒/AAV载体在细胞系如人胚胎肾细胞系HEK293(人肾细胞系含有提供反式作用的E1蛋白质的功能腺病毒E1基因)中的感染。
本领域技术人员将易于理解的是AAV技术可适用于这些和其他用于体内、间接体内或体外基因递送的病毒载体***。在某些实施方案中,本发明构想了本文公开的核酸和病毒在各种rAAV和非rAAV***中的用途。除了其他以外,此载体***可包括例如慢病毒、逆转录病毒、痘病毒、牛痘病毒和腺病毒***。
在一些实施方案中,可以设想的是本文公开的病毒颗粒、核酸和载体可用于多种用途,包括用于治疗蛋白质的基因表达的治疗分子的递送。
本文所报道的由核酸(例如与启动子可操作组合)编码的治疗蛋白质包括用于治疗血友病包括血友病B(包括fIX)和血友病A(包括fVIII和其变体,如异二聚体的轻链和重链以及B缺失型结构域;U.S.Pat.No.6,200,560和U.S.Pat.No.6,221,349)的那些。因子VIII基因编码2351个氨基酸,蛋白质有6个结构域,从氨基到末端羧基端指定为A1-A2-B-A3-C1-C2[Wood等,Nature,312:330(1984);Vehar等,Nature 312:337(1984);和Toole等,Nature,342:337(1984)]。在细胞内加工人fVIII以获得主要包含含有A1、A2和B结构域的重链和含有A3、C1和C2结构域的轻链的异二聚体。单链多肽和异二聚体都作为灭活的前体在血浆中循环,直到通过A2和B结构域之间的凝血酶剪切被激活,这释放了B结构域并产生由A1和A2结构域组成的重链。激活的促凝血形式的蛋白质中缺失B结构域。或者,在天然的蛋白质中,位于B结构域侧面的两个多肽链(“a”和“b”)与二价钙离子连接。
诊断患有血友病A的病人的治疗选择是重组fVIII的外源性施用,有时也称为fVIII替代治疗。在一些病人中,这种治疗可导致与施用的fVIII蛋白质结合的抗体的发展。随后,通常称为抑制剂的fVIII-抗体连接缀合物干扰或阻碍fVIII进行凝血的能力。在从遗传学角度上未处于患有被称为获得性血友病的血友病的风险中的受试对象中有时还可同时产生抑制性自身抗体。为了确定抗阻凝剂是否有效,在外源性fVIII治疗之前通常进行抑制性抗体测定。
历史上已经将“Bethesda测定”用于定量fVIII结合抗体的浓度的抑制性强度。在测定中,例如,在手术前,制备病人血浆的连续稀释物,并将每个稀释物与相等体积的作为fVIII的来源的正常血浆混合。培养几小时后,测量每个稀释的混合物中的fVIII的活性。多次重复稀释后阻止fVIII凝血活性的抗体抑制剂浓度表明不受控制的出血的风险提高。大约十次稀释后具有抑制剂滴度的病人感觉到不可能对外源性fVIII注射产生应答以停止出血。Bethesda滴度被定义为导致正常人血浆中存在的FVIII活性50%抑制的稀释度的倒数。大于10的Bethesda滴度被认为是对FVIII替代治疗的应答的阈值。
在某些实施方案中,本发明涉及诱导血液凝结的方法,包括将有效量的包含含有编码本文所述的凝血因子的核酸的载体的病毒颗粒或衣壳施用于有需要的受试对象。
在某些实施方案中,受试对象诊断患有血友病A或B或获得性血友病,或者不可能对外源性fVIII注射产生应答。
在一些实施方案中,本发明涉及使用作为基因递送运载体的编码人fIX的腺相关病毒(AAV)载体治疗血友病B的基因转移方法。虽然若干此种用于血友病B的基于AAV的基因治疗已经进入人临床试验,但是施用在导致仅局部修正疾病的病毒后,它们仍一直受到治疗蛋白质、凝血fIX的低表达的阻碍。AAV载体毒性限制了可安全施用的病毒的剂量。为成功过度到临床上可实行的治疗,载体应以低于毒性阈值的病毒剂量提供fIX的有效表达。
还可通过诱导免疫耐受性(ITI)的方法实现用fVIII抑制剂治疗病人,所述诱导免疫耐受性涉及fVIII的每日灌注直到循环的抑制剂/抗体水平降低。然而,20-30%的病人在诱导免疫耐受性(ITI)治疗后没有变得有耐受性。fVIII抑制剂的存在与发病率和死亡率的风险的增加相关。在某些实施方案中,本发明涉及诱导免疫耐受性方法,包括将本文所述的有效量的载体或衣壳施用于有需要的受试对象。
在一些实施方案中,本文报道的治疗性蛋白质由核酸(例如与启动子可操作组合)编码,所述核酸包含编码10氨基酸信号序列的fVIII重链的前57个碱基对以及人β球蛋白聚腺苷酸化序列或生长激素(hGH)聚腺苷酸化序列。在可替换的实施方案中,A1和A2结构域以及来自B结构域的N末端的5个氨基酸,和/或B结构域的C末端的85个氨基酸,以及A3、C1和C2结构域。在其他的实施方案中,在单一核酸中提供编码fVIII重链和轻链的核酸,以编码B结构域的14个氨基酸的42个核酸隔开。参见U.S.Pat.No.6,200,560。
如本文所用,治疗有效量是可产生足量的fVIII以减少受试对象的血液凝块所用时间的AAV载体的量。一般地,以非血友病人的大约10分钟相比,具有不到1%正常水平的fVIII的严重血友病人的整个血液凝结时间超过60分钟。
本发明不限制于本文报道的任何特殊的fVIII或fIX或其他蛋白质序列。许多天然和重组形式的fVIII已被分离和生成。可在病人和科学文献中发现天然存在和重组形式的fVIII的示例,所述科学文献包括U.S.Pat.No.5,563,045、U.S.Pat.No.5,451,521、U.S.Pat.No.5,422,260、U.S.Pat.No.5,004,803、U.S.Pat.No.4,757,006、U.S.Pat.No.5,661,008、U.S.Pat.No.5,789,203、U.S.Pat.No.5,681,746、U.S.Pat.No.5,595,886、U.S.Pat.No.5,045,455、U.S.Pat.No.5,668,108、U.S.Pat.No.5,633,150、U.S.Pat.No.5,693,499、U.S.Pat.No.5,587,310、U.S.Pat.No.5,171,844、U.S.Pat.No.5,149,637、U.S.Pat.No.5,112,950、U.S.Pat.No.4,886,876、WO 94/11503、WO 87/07144、WO 92/16557、WO 91/09122、WO 97/03195、WO 96/21035、WO 91/07490、EP 0 672 138、EP 0 270618、EP 0 182 448、EP 0 162 067、EP 0 786 474、EP 0 533 862、EP 0 506 757、EP 0 874057、EP 0 795 021、EP 0 670 332、EP 0 500 734、EP 0 232 112、EP 0 160 457、Sanberg等,Int.Congress of the World Fed.Of Hemophilia(1992),and Lind等,Eur.J.Biochem.,232:19(1995)。
此外,本发明不限制于人fVIII。事实上,目的是本发明包含来自除了人以外的动物的fVIII,所述动物包括但不限于伴随动物(例如,狗、猫和马)、牲畜(例如,牛、山羊和羊)、实验动物、海洋哺乳动物、大型猫科动物等。
AAV载体可含有编码自身不具有生物学活性但当施用于受试者对象时可改善或恢复凝血时间的fVIII片段的核酸。例如,fVIII蛋白质包含两个多肽链:由在加工期间被剪切的B结构域隔开的重链和轻链。具有FVIII重轻链的共转染受体细胞导致生物学上活性的fVIII的表达。构想病人中仅进行链缺陷施用,因为大多数血友病人仅含有其中一条链(例如,重或轻链)的突变或缺失。
因此,在某些实施方案中,本发明涉及本文公开的具有编码含有A3、C1和C2结构域的轻链或由A1和A2结构域组成的重链的核酸的载体。
重组载体和治疗方法的另外描述
根据重组载体编码的目的蛋白,本文公开的重组载体(例如重组AAV载体)可用于若干不同的治疗应用中。
在某些实施方案中,用途为治疗遗传性血色沉着病(HH)、铁负荷失调、Wilson病、铜负荷遗传性障碍、α1-抗胰蛋白酶(α1-AT)缺陷。在某些实施方案中,蛋白质为人Α1-抗胰蛋白酶(α1-AT,Accession:P01009.3)、HFE蛋白质(Accession NP_000401.1or Q30201)或肝脏蛋白质ATP7B(Accession P35670.4)或具有大于50、60、70、80、90、95或95序列相同性或相似性的变体。
在某些实施方案中个,用途为用与编码人苯丙氨酸羟化酶(Accession:P00439.1)的核酸或具有大于50、60、70、80、90、95或95序列相同性或相似性的变体可操作组合的本文的启动子来治疗血胆甾醇过多。
在某些实施方案中,用途为用与编码人延胡索乙酰乙酸水解酶(Accession:P16930.2)的核酸或具有大于50、60、70、80、90、95或95序列相同性或相似性的变体可操作组合的本文的启动子来治疗1型酪氨酸血症。
在某些实施方案中,用途为用与编码人酪氨酸氨基转移酶(Accession:P17735.1)的核酸或具有大于50、60、70、80、90、95或95序列相同性或相似性的变体可操作组合的本文的启动子来治疗2型酪氨酸血症。
在某些实施方案中,用途为用与编码人亚甲基四氢叶酸还原酶(Accession:P42898.3)的核酸或具有大于50、60、70、80、90、95或95序列相同性或相似性的变体可操作地组合的本文的启动子来治疗高胱氨酸尿和高同型半胱氨酸血症。
在某些实施方案中,用途为用与编码人中链酰基-CoA脱氢酶(Accession:P11310.1)的核酸或具有大于50、60、70、80、90、95或95序列相同性或相似性的变体可操作地组合的本文的启动子来治疗高脂血症和高胆固醇血症。
在某些实施方案中,用途为用与编码人半乳糖-1-磷酸尿苷转移酶(Accession:P07902.3)的核酸或具有大于50、60、70、80、90、95或95序列相同性或相似性的变体可操作组合的本文的启动子来治疗半乳糖症。
在某些实施方案中,用途为用与编码人次黄嘌呤磷酸核糖转移酶(Accession:P00492.2)的核酸或具有大于50、60、70、80、90、95或95序列相同性或相似性的变体可操作组合的本文的启动子来治疗Lesch-Nyhan综合征。
在某些实施方案中,用途为用与编码人脑苷酶(Accession:P07602.2,Accession:P04062.3)的核酸或具有大于50、60、70、80、90、95或95序列相同性或相似性的变体可操作组合的本文的启动子来治疗高雪氏症。
在某些实施方案中,用途为用与编码人β-己糖胺酶A(Accession:P06865.2)的核酸或具有大于50、60、70、80、90、95或95序列相同性或相似性的变体可操作组合的本文的启动子来治疗Tay-Sachs病。
在某些实施方案中,用途为用与编码人α-半乳糖苷酶(Accession:P06280.1)的核酸或具有大于50、60、70、80、90、95或95序列相同性或相似性的变体可操作组合的本文的启动子来治疗Fabry病。
在某些实施方案中,用途为用与编码人艾杜糖醛酸硫酸酯酶(Accession:P22304.1)的核酸或具有大于50、60、70、80、90、95或95序列相同性或相似性的变体可操作组合的本文的启动子来治疗Hunter综合征。
在某些实施方案中,用途为用与编码人葡萄糖-6-磷酸酶(Accession:P35575.2)的核酸或具有大于50、60、70、80、90、95或95序列相同性或相似性的变体可操作组合的本文的启动子来治疗Ia型糖原贮积病。
在某些实施方案中,用途为用与编码人鸟氨酸转氨甲酰酶(Accession:P00480.3)的核酸或具有大于50、60、70、80、90、95或95序列相同性或相似性的变体可操作组合的本文的启动子来治疗氨代谢。
在某些实施方案中,用途为用与编码人低密度脂蛋白受体(Accession:P01130.1)的核酸或具有大于50、60、70、80、90、95或95序列相同性或相似性的变体可操作组合的本文的启动子来治疗苯丙酮尿症。
在某些实施方案中,用途为用与编码人丙酰-辅酶A羧化酶PCCA和/或PCCB(Accession:P05166.3beta,NP_000273.2alpha,NP_001121164.1alpha)的核酸或具有大于50、60、70、80、90、95或95序列相同性或相似性的变体可操作组合的本文的启动子来治疗丙酸酸血症。
还可设想在疫苗方案中的用途,例如,用于细胞因子的共递送,或用于免疫源或抗原的递送。
包含本文公开的重组病毒颗粒、衣壳或载体可通过肝动脉、门静脉递送或静脉内递送至肝脏中以在血液中获得治疗水平的治疗蛋白质或凝血因子。优选地,衣壳或载体悬浮在生理上可相容的载剂中,可施用于人或非人哺乳动物患者。可由本领域的技术人员根据转移病毒的指示容易地选择适宜的载剂。例如,一种适宜的载剂包括盐水,其可用不同的缓冲溶液配制(例如,磷酸缓冲的盐水)。其他示例性的载剂包括无菌盐水、乳糖、蔗糖、磷酸钙、明胶、右旋糖苷、琼脂、果胶、芝麻油和水。
任选地,本发明的组合物可含有其他药学上可接受的赋形剂,如防腐剂或化学稳定剂。适宜的示例性防腐剂包括氯丁醇、山梨酸钾、山梨酸、二氧化硫、没食子酸丙酯、尼泊金、乙基香草醛、甘油、石碳酸和对氯酚。适宜的化学稳定剂包括明胶和白蛋白。
以足以转染细胞且提供足够水平的基因转移和表达的量来施用重组病毒颗粒、衣壳或载体以提供治疗益处,而无过分的不良影响,或者有医学上可接受的生理效果,其可以由医学领域的技术人员确定。常规的和药学上可接受的施用途径包括但不限于直接递送至所期望的器官(例如,肝(任选地通过肝动脉)或肺)、口服、吸入、鼻内、气管内、动脉内、眼内、静脉内、肌肉内、皮下、真皮内和其他施用途径。若需要,施用途径可以组合。
重组病毒颗粒、衣壳或载体的剂量主要取决于以下因素,如正在治疗的症状、病人的年龄、体重和健康情况,因此这些因素在病人之间会变化。例如,病毒载体对人的治疗有效剂量的范围一般为大约0.1ml到大约100ml溶液,含有浓度大约1*109到1*1016个基因组病毒载体的。
本文报道的其他有用的由核酸(例如,与启动子可操作组合)编码的治疗蛋白质包括激素和生长与分化因子,包括但不限于胰岛素、胰高血糖素、生长激素(GH)、甲状旁腺激素(PTH)、生长激素释放因子(GRF)、卵泡刺激激素(FSH)、促黄体激素(LH)、人绒膜***(hCG)、血管内皮生长因子(VEGF)、血管生成素、血管抑素、粒细胞菌落刺激因子(GCSF)、红细胞生成素(EPO)、缔结组织生长因子(CTGF)、碱性成纤维细胞生长因子(bFGF)、酸性成纤维细胞生长因子(aFGF)、表皮生长因子(EGF)、血小板衍生生长因子(PDGF)、胰岛素生长因子I和II(IGF-I和IGF-II)、的转化生长因子α超家族中的任意一者(包括TGFα、激活素、抑制素)或骨成型蛋白质(BMP)BMP1-15中的任意一者、生长因子的heregluin/神经调节蛋白/ARIA/神经鞘分化因子(NDF)家族中的任意一者、脑源性神经营养因子(BDNF)、神经营养因子NT-3和NT-4/5、纤毛神经营养因子(CNTF)、神经胶质细胞系源性神经营养因子(GDNF)、面神经元、聚集蛋白(agrin)、信号素/脑衰蛋白的家族中的任意一者、神经突起生长导向因子-1和神经突起生长导向因子-2、肝细胞生长因子(HGF)、肝配蛋白、头蛋白、音猥因子和酪氨酸羟化酶。
本文报道的由核酸(例如与启动子可操作组合)编码的其他治疗蛋白质包括调控免疫***的那些,包括但不限于细胞因子和淋巴因子如促血小板生成素(TPO)、白细胞介素(IL)IL-1直到IL-25(包括IL-2、IL-4、IL-12和IL-18)、单核细胞化学引诱物蛋白质、白血病抑制因子、粒细胞-巨噬细胞菌落刺激因子、Fas配体、肿瘤坏死因子α和β、干扰素α、β和γ、干细胞因子、flk-2/flt3配体。也可使用由免疫***产生的蛋白质。这些包括但不限于免疫球蛋白IgG、IgM、IgA、IgD和IgE、嵌合免疫球蛋白、人源化抗体、单链抗体、T细胞受体、嵌合T细胞受体、单链T细胞受体、I类和II类MHC分子以及工程化的免疫球蛋白和MHC分子。有用的免疫球蛋白还包括补体调节蛋白、膜辅因子蛋白(MCP)、衰变加速因子(DAF)、CR1、CF2和CD59。
由本文报道的核酸(例如,与启动子可操作地组合)编码的其他治疗蛋白质为针对激素、生长因子、细胞因子、淋巴因子、调节蛋白和免疫***蛋白的受体。本发明包含针对胆固醇调节和/或脂质调控的受体,包括低密度脂蛋白(LDL)受体、高密度脂蛋白(HDL)受体、超低密度脂蛋白(VLDL)受体和清道夫受体。本公开还涵盖蛋白质如甾体激素受体超家族的成员,包括糖皮质激素受体和***受体、维生素D受体和其他核酸受体。此外,有用的蛋白质包括转录因子(如jun、fos、max、mad)血清应答因子(SRF)、AP-1、AP2、myb、MyoD和肌细胞生成素、含有ETS-框的蛋白质、TFE3、E2F、ATF1、ATF2、ATF3、ATF4、ZF5、NFAT、CREB、HNF-4、C/EBP、SP1、CCAAT-框结合蛋白、干扰素调节因子(IRF-1)、威尔母氏瘤蛋白、ETS结合蛋白、STAT、GATA-框结合蛋白,例如,GATA-3,以及叉头家族的翼状螺旋蛋白。
其他有用的蛋白质包括氨基甲酰合成酶I、鸟氨酸转氨甲酰酶、精氨琥珀酸合成酶、精氨琥珀酸裂解酶、精氨酸酶、延胡索酰基乙酰乙酸水解酶、苯丙氨酸羟化酶、α-1抗胰蛋白酶、葡萄糖-6-磷酸酶、胆色素原脱氨酶、胱硫醚β-合酶、支链酮酸脱羧酶、白蛋白、异戊酰-coA脱氢酶、丙酰CoA羧酶、甲基丙二酰CoA变位酶、戊二酰CoA脱氢酶、胰岛素、β-葡糖苷酶、丙酮酸羧化酶、肝磷酸化酶、磷酸化酶激酶、甘氨酸脱羧酶、H-蛋白质、T-蛋白质、囊性纤维跨膜调控蛋白(CFTR)序列和肌营养不良蛋白cDNA序列。其他有用的蛋白质还包括如可在酶替换治疗中使用的酶,其可用于由各种酶活性不足导致的病症。例如,涉及(contain)甘露糖-6-磷酸的酶可用于溶酶体贮积病的治疗(例如,适宜的基因包括编码β-葡萄糖醛酸酶(GUSB)的基因)。
其他有用的蛋白质包括非天然存在的多肽,如具有包含***、缺失或氨基酸取代的非天然存在的氨基酸序列的嵌合或混合多肽。例如,单链工程化的免疫球蛋白可用于某些免疫功能不全的病人中。其他类型的非天然存在的基因序列包括反义分子和催化核酸,如核酶,其可用于降低靶的过表达。
蛋白质表达的降低和/或调控尤其适合于以过度增殖细胞为特征的过度增殖病症的治疗,所述过度增殖病症为癌症和牛皮鲜。靶多肽包括仅在过度增殖细胞中或以比在正常细胞中更高的水平在过度增殖细胞中产生的那些多肽。靶抗原包括由致癌基因如myb、myc、fyn和移位基因bcr/abl、ras、src、P53、neu、trk和EGRF编码的多肽。除了作为靶抗原的致癌基因产物之外,用于抗癌治疗和预防性方案的靶多肽还包括由B细胞淋巴瘤制得的抗体的可变区和T细胞淋巴瘤的T细胞受体的可变区,在一些实施方案中,可变区也用作针对自身免疫疾病的靶抗原。其他肿瘤相关的多肽可用作靶多肽如在肿瘤细胞中发现的水平较高的多肽,包括被单克隆抗体17-1A和识别的多肽和叶酸结合多肽。
其他适宜的治疗多肽和蛋白质包括可用于通过给予广泛的针对与自身免疫相关的标靶的保护性免疫应答来治疗患有自身免疫疾病和障碍的个体的那些,所述标靶包括细胞受体和产生“自”定向抗体的细胞。T细胞介导的自身免疫疾病包括类风湿性关节炎(RA)、多发性硬化(MS)、Sjogren综合征、结节病、胰岛素依赖型糖尿病(IDDM)、自身免疫甲状腺炎、反应性关节炎、强直性脊椎炎、硬皮病、多肌炎、皮肌炎、银屑病、血管炎、Wegener肉芽肿病、克罗恩氏病和溃疡性结肠炎。这些疾病中的每一个的特征在都于与内源性抗原结合且启动与自身免疫疾病相关的炎症级联的T细胞受体(TCR)。
本文报道的载体可以允许由载体携带的蛋白质的表达以诱导对选择的抗原的免疫应答的方法制备。例如,为促进免疫应答,可从本文公开的启动子中表达抗原,载体可以如本文所述是辅助的,和/或载体可置于变性组织中。
适宜的免疫源性抗原的示例包括选自各种病毒家族的那些。需要对其有免疫应答的所期望的病毒科的示例包括小核糖核酸病毒科,其包括引起大约50%的普通感冒病症的鼻病毒属;肠道病毒属,其包括脊髓灰质炎病毒、柯萨奇病毒、艾柯病毒和人肠道病毒如甲型肝炎病毒;以及***病毒属,其引起***,主要在非人动物中。在病毒的小核糖核酸病毒科内,靶抗原包括VP1、VP2、VP3、VP4和VP5。其他的病毒科包括星形病毒和卡西病毒科。卡西病毒科包含诺瓦克病毒群,它是传染性肠胃炎的主要病原体。期望用于靶向在人和非人动物中诱导免疫应答的抗原的另一病毒科是囊膜病毒科,其包括甲病毒属,所述甲病毒属包括辛德毕斯病毒、RossRiver病毒和Venezuelan,Eastern&Western马脑炎以及风疹病毒,包括德国麻疹病毒。黄病毒科包括登革热、黄热病、日本脑炎、St.Louis脑炎、虱传播脑炎病毒。其他的靶抗原可从丙型肝炎或冠状病毒科中产生,所述冠状病毒科包括许多非人病毒如传染性支气管炎病毒(家畜)、猪传染性肠胃病毒(猪)、猪凝血性脑脊髓炎病毒(猪)、猫传染性腹膜炎病毒(猫)、猫肠冠状病毒(猫)、犬冠状病毒(狗),以及人呼吸冠状病毒,其可引起普通感冒和/或非甲、乙或丙型肝炎,并且其包括突发急性呼吸综合征(SARS)的可能病因。在冠状病毒科内,靶抗原包括E1(也称为M或基质蛋白)、E2(也称为S或纤突蛋白)、E3(也称为HE或血凝素-elterose)糖蛋白(不存在于所有的冠状病毒中)或N(核蛋白壳)。其他的抗原可靶向动脉炎病毒科和棒状病毒科。棒状病毒科包括水疱性病毒(例如水泡性口炎病毒)和一般的狂犬病毒(例如狂犬病)。在棒状病毒科内,适宜的抗原可衍生自G蛋白或N蛋白。包括出血热病毒如青猴病和埃博拉病毒的丝状病毒科可以是适宜的抗原来源。副粘病毒科包括1型副流感病毒、3型副流感病毒、3型牛副流感病毒、风疹病毒(腮腺炎病毒)、2型副流感病毒、4型副流感病毒、新城病病毒(鸡)、牛瘟、包括麻疹和犬瘟热的麻疹病毒以及包括呼吸道合胞病毒的肺炎病毒。流感病毒分类于正粘病毒科内且是适宜的抗原来源(例如,HA蛋白、N1蛋白)。布尼亚病毒科包括布尼亚病毒属(加利福尼亚脑炎,La Crosse)、白蛉病毒属(里夫特裂谷热)、汗坦病毒属(puremala是一种出血热病毒)、内罗病毒属(内罗毕羊病)和各种未分配的布尼亚病毒(bungavirus)。沙粒病毒科提供了抗LCM和Lassa热病毒抗原来源。抗原的另一来源是玻那病毒科。呼吸道肠道病毒科包括呼吸道肠道病毒属、轮状病毒属(其引起儿童急性肠胃炎)、环状病毒属和萼状病毒属(Colorado Tick热、Lebombo(人)、马器质性脑病、蓝舌病)。逆转录病毒科包括oncorivirinal亚科,所述oncorivirinal亚科涵盖人和兽医学疾病,如猫白血病病毒、HTLV1和HTLVII、慢病毒(其包括HIV、猴免疫缺陷病毒、猫免疫缺陷病毒、马感染性贫血和spumavirinal)。乳多空病毒科包括多瘤病毒亚科(BKU和JCU病毒)和***瘤病毒亚科(与癌症或***瘤的恶性进展相关)。腺病毒科包括引起呼吸道疾病和/或肠炎的病毒(EX、AD7、ARD、O.B.)。细小病毒科包括猫细小病毒(猫肠炎)、猫泛白细胞减少症病毒、犬细小病毒和猪细小病毒。疱疹病毒科包括疱疹病毒α疱疹病毒亚科,其包含单纯疱疹病毒(HSVI、HSVII)、水痘病毒(假狂犬病、水痘带状疱疹)和包括巨细胞病毒(HCMV,鼠巨细胞病毒)的β疱疹病毒亚科以及包括lymphocryptovirus属、EBV属(伯基特淋巴瘤)、人疱疹病毒6A、6B和7、卡波济氏瘤相关的疱疹病毒和cercopithecine疱疹病毒(B病毒)、感染性鼻气管炎、马来克氏病病毒和疱疹病毒属的γ疱疹病毒亚科。痘病毒科包括脊椎动物痘病毒亚科和昆虫痘病毒亚科,所述脊椎动物痘病毒亚科涵盖正痘病毒属(典型天花(天花)和牛痘(牛痘))、副痘病毒属、禽痘病毒属、羊痘病毒属、兔痘病毒属、猪痘病毒属。嗜肝DNA病毒科包括乙型肝炎病毒。一个可以是适宜的抗原来源的未分类的病毒为丁型肝炎病毒、戊型肝炎病毒和朊病毒。另一作为抗原来源的病毒是Nipan病毒。其他的病毒来源可包括鸟传染性囊病病毒和猪呼吸与繁殖综合征病毒。甲病毒科包括马动脉炎病毒和各种脑炎病毒。
本公开还可以涵盖基于蛋白质的免疫基因,该免疫基因用于使人或非人动物对其他病原体免疫,所述其他病原体包括感染人和非人脊椎动物的或来自癌症细胞或肿瘤细胞的细菌、真菌、寄生微生物、多细胞寄生物。细菌病原体的示例包括致病革兰氏阳性球菌,包括肺炎双球菌;葡萄状球菌(和由其产生的毒素,例如,肠毒素B);和链球菌。致病革兰氏阴性球菌包括脑膜炎球菌;淋病球菌。致病肠革兰氏阴性杆菌包括肠杆菌;假单胞菌,不动杆菌和艾肯菌;类鼻疽;沙门氏菌;志贺氏菌;嗜血杆菌;莫拉氏菌;杜克嗜血杆菌(H.ducreyi)(其引起软性下疳);布鲁氏菌物种(布鲁氏菌病);土拉弗朗西斯菌(Francisellatularensis)(其引起兔热病)鼠疫杆菌(Yersinia pestis)(鼠疫)和其他耶尔森氏鼠疫杆菌(巴氏杆菌);念珠状链杆菌(Streptobacillus moniliformis)和螺菌。革兰氏阳性杆菌包括单核细胞增生李斯特菌(Listeria monocytogenes);红斑丹毒丝菌(Erysipelothrixrhusiopathiae);白喉棒状杆菌(Corynebacterium diphtheria)(白喉);霍乱;炭疽杆菌(B.anthracia)(炭疽);杜诺凡病(***);和巴尔通氏体病。由致病厌氧细菌引起的疾病包括破伤风;肉毒中毒(肉毒梭菌(Clostridum botulinum)和其毒素);产气荚膜梭菌(Clostridium perfringens)和其ε毒素;其他梭状芽孢杆菌;结核病;麻风病;和其他分枝杆菌。致病螺旋体疾病包括梅毒;密螺旋体病:雅司病、品他病和地方性梅毒;和细螺旋体病。由高等(higher)病原体细菌和致病真菌引起的其他感染包括鼻疽病(鼻疽假单胞菌(Burkholderia mallei));放线菌病;诺卡氏菌病;隐球菌病、芽生菌病、组织胞浆菌病和球孢子菌病;念珠菌病;曲霉病和毛霉菌病;孢子丝菌病;副球孢子菌病、petriellidiosis、球拟酵母病、足分支菌病和着色性真菌病;和皮真菌病。立克次氏体感染包括斑疹伤寒、落基山斑疹热、Q热(贝纳特氏克立次体(Coxiella burnetti))和克立次体痘疹。支原菌和衣原体感染包括:支原体肺炎;淋巴肉芽肿;鹦鹉热;和围产期衣原体感染。致病真核微生物包含致病原生动物和蠕虫肠虫,且由其产生的感染包括:阿米虫病;疟疾;利什曼病;锥虫病;弓形虫病;卡氏肺孢子虫(Pneumocystis carinii);旋毛虫病;刚地弓形虫(Toxoplasmagondii);巴贝西虫病;梨形鞭毛虫病;毛线虫病;丝虫病;血吸虫病;线虫;吸虫;和绦虫(绦虫)感染。
疾病控制中心((CDC),健康与人类服务部,USA)鉴定了这些生物体和/或其产生的毒素中的很多,作为有可能用于生物攻击的物质。例如,一些这类生物学物质剂包括炭疽芽孢杆菌(Bacillus anthracia)(炭疽)、肉毒梭菌及其毒素(肉毒中毒)、鼠疫杆菌(鼠疫)、天花、土拉弗朗西斯菌(兔热病)和病毒性出血热[丝状病毒(例如,埃博拉病毒、青猴病)]、以及沙粒病毒(例如,拉沙热、马丘波病毒),目前所有这些都分类为A类物质;立克次体(Q热);布鲁氏菌物种(布氏杆菌病)、鼻疽假单胞菌(鼻疽病)、类鼻疽伯克氏菌(Burkholderiapseudomallei)(类鼻疽)、蓖麻(Ricinus communis)及其毒素(蓖麻毒素)、产气荚膜梭菌和其ε毒素、葡萄球菌物种及其毒素(肠毒素B)、鹦鹉热衣原体(Chlamydia psittaci)(鹦鹉热)、水安全威胁(例如,霍乱弧菌(Chlamydia psittaci)、隐孢子虫)、斑疹伤寒(Richettsia powazekii)和病毒性脑炎(甲病毒,例如委内瑞拉马脑炎;东部马脑炎;西部马脑炎);目前,所有这些都被分类为B类物质;以及Nipan病毒和汗坦病毒,其目前被分类为C类物质。此外,将来可以鉴定其他如此分类或不同分类的生物体和/或将其用于此目的。易于理解的是本文所述的病毒载体和其他构建体用于递送来自这些生机体、病毒、它们的毒素或其他副产物的抗原,所述病毒载体和其他构建体将与这些生物试剂一起预防和/或治疗感染或其他副反应。
在某些实施方案中,在本发明的载体中表达的蛋白质是引发免疫应答(即,清除细胞毒性T细胞)的T细胞的可变区的一个区段。在类风湿性关节炎中(RA)已经表征了疾病所涉及的TCR的若干特定可变区。这些TCR包括V-3、V-14、V-17和V-17。因此,编码这些多肽至少之一的核酸序列的递送会引发靶向RA中所涉及的T细胞的免疫应答。在多发性硬化(MS)中已经表征了疾病中所涉及的TCR的若干特定可变区。这些TCR包括V-7和V-10。因此,编码这些多肽至少之一的核酸序列的递送会引发靶向MS中所涉及的T细胞的免疫应答。在硬皮病中已经表征了疾病中所涉及的TCR的若干特定可变区。这些TCR包括V-6、V-8、V-14以及V-16、V-3C、V-7、V-14、V-15、V-16、V-28和V-12。因此,编码这些多肽至少之一的核酸序列的递送会引发靶向硬皮病中所涉及的T细胞的免疫应答。
本发明的重组病毒载体提供了能将选择的蛋白质体内或间接体内递送至选择的宿主细胞中的高效基因转移运载体,甚至其中,生物体具有针对蛋白质的中和抗体。在一个实施方案中,本文所公开的载体和细胞间接体内混合;用常规的方法培养感染的细胞;以及将转导的细胞在再注射到病人中。
另外的实施方案
在某些实施方案中,本发明涉及重组病毒载体,所述重组病毒载体包含与编码蛋白质的异源核酸序列可操作组合的肝特异性启动子核酸序列。通常,与总的人密码子使用相比,编码蛋白质的核酸序列包含更高百分比的肝细胞特异性氨基酸密码子。在某些实施方案中,本发明涉及通过施用本文公开的配置为从肝脏中表达功能蛋白质的有效量的载体来治疗诊断患有导致表达突变的或截断的非功能蛋白质的遗传性状的受试对象的方法。
在某些实施方案中,载体包含大于10、20、30、40、50、100或200个核苷酸的病毒核酸序列。在某些实施方案中,病毒核酸序列是血清型1、2、3B、4、5、6、7、8、9或组合的人腺相关病毒(hAAV)或其变体的一个区段,通常包含AAV反向末端重复序列。
在某些实施方案中,本发明涉及病毒颗粒,例如,衣壳,其包含本文公开的载体,例如,包装在衣壳中的载体。衣壳可以是重组的或嵌合的颗粒或衣壳,例如,具有是AAV假型VP1、2或3的组合的氨基酸序列的衣壳。AAV衣壳VP衍生自人基因或动物基因或具有基因工程化变化的组合,即自所感染的人细胞或非人灵长动物分离的AAV。动物AAV包括衍生自鸟、牛、猪、小鼠等的那些。在某些实施方案中,衣壳可具有被生物工程化的氨基酸序列或通过诸如定向进化或合理设计的方法鉴定的合成衣壳。
在某些实施方案中,本文公开的载体为单链或双链核酸或总长小于5.1、5.0、4.9、4.8、4.7、4.6或4.5kb核苷酸的自互补核酸。在某些实施方案中,载体在人宿主中无复制能力,例如,载体不编码病毒聚合酶。
在某些实施方案中,肝特异性启动子序列包含与GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTA(SEQ ID NO:21)ATAATCTCAGGACAAACA(SEQ IDNO:43)和/或TATAAAAGGCCAGCAGCAGCCTGACCACATCTCATCCTC(SEQ ID NO:20)有至少50、60、70、80、85、90、95、96、97、98、99或100%序列相同性的序列。
在某些实施方案中,SEQ ID NO:20位于3’或在SEQ ID NO:21之后,之间是核苷酸接头,例如以接头连接,如下所示:5’-SEQ ID NO:21接着是接头接着是SEQ ID NO:20-3’。接头可以是0至200个核苷酸、10至100个核苷酸、30至60个核苷酸、30至40个核苷酸、32至36个核苷酸。在某些实施方案中,肝特异性启动子序列包含与SEQ ID NO:4、5、6或7有至少50、60、70、80、85、90、95、96、97、98、99或100%序列相同性的序列。
如本文所使用的,肝特异性启动子是指在待产生的蛋白质的转录起始位点的5’方向的序列。本文公开的启动子序列可含有其他已知启动子、增强子、其他序列及其片段的组合。例如,SEQ ID NO:21为变短的ABP增强子的序列。单独地,其不作为启动子发挥作用,它用于增强核心启动子、SEQ ID NO:20、SynO所赋予的表达,其自身不赋予高效基因表达。构想可替换或增加短ABP增强子的另外的增强子序列。
在某些实施方案中,肝特异性启动子序列包含与CGGAGGAGCAAACAGGG(SEQ ID NO:97)和/或TATAAAAGGCCAGCAGCAGCCTGACCACATCTCATCCTC(SEQ ID NO:20)有至少50、60、70、80、85、90、95、96、97、98、99或100%序列相同性的序列。
在某些实施方案中,SEQ ID NO:20位于3’或在SEQ ID NO:97后,之间是核苷酸接头,例如,以接头连接,如下所示:5’-SEQ ID NO:97接着是接头接着是SEQ ID NO:20-3’。接头可以是0至200个核苷酸、10至100个核苷酸、30至60个核苷酸、30至40个核苷酸、32至36个核苷酸。
在某些实施方案中,肝特异性启动子序列包含与CGGAGGAGCAAACAGGGGCTAAGTCCAC(SEQ ID NO:98)和/或TATAAAAGGCCAGCAGCAGCCTGACCACATCTCATCCTC(SEQ ID NO:20)有至少50、60、70、80、85、90、95、96、97、98、99或100%序列相同性的序列。
在某些实施方案中,SEQ ID NO:20位于3’或在SEQ ID NO:98后,之间是核苷酸接头,例如,以接头连接,如下所示:5’-SEQ ID NO:98接着是接头接着是SEQ ID NO:20-3’。接头可以是0至200个核苷酸、10至100个核苷酸、30至60个核苷酸、30至40个核苷酸、32至36个核苷酸。
在某些实施方案中,肝特异性启动子序列包含与GGCTGCTGGTGAATATTAACCAAGGTC(SEQ ID NO:99)和/或TATAAAAGGCCAGCAGCAGCCTGACCACATCTCATCCTC(SEQ ID NO:20)有至少50、60、70、80、85、90、95、96、97、98、99或100%序列相同性的序列。
在某些实施方案中,SEQ ID NO:20位于3’或在SEQ ID NO:99后,之间是核苷酸接头,例如,以接头连接,如下所示:5’-SEQ ID NO:99接着是接头接着是SEQ ID NO:20-3’。接头可以是0至200个核苷酸、10至100个核苷酸、30至60个核苷酸、30至40个核苷酸、32至36个核苷酸。
在某些实施方案中,肝特异性启动子序列包含与GGGGAGGCTGCTGGTGAATATTAACCAAGGTCACCCCAGTTATCGGAGGAGCAAACAGGGGCTAAGTCCAC(SEQID NO:100)和/或TATAAAAGGCCAGCAGCAGCCTGACCACATCTCATCCTC(SEQ ID NO:20)有至少50、60、70、80、85、90、95、96、97、98、99或100%序列相同性的序列。
在某些实施方案中,SEQ ID NO:20位于3’或在SEQ ID NO:100后,之间是核苷酸接头,例如,以接头连接,如下所示:5’-SEQ ID NO:100接着是接头接着是SEQ ID NO:20-3’。接头可以是0至200个核苷酸、10至100个核苷酸、30至60个核苷酸、30至40个核苷酸、32至36个核苷酸。
在某些实施方案中,肝特异性启动子序列包含与GGGGAGGCTGCTGGTGAATATTAACCAAGGTCACCCCAGTTATCGGAGGAGCAAACAGGGACTAAGTCCAC(SEQID NO:101)和/或TATAAAAGGCCAGCAGCAGCCTGACCACATCTCATCCTC(SEQ ID NO:20)有至少50、60、70、80、85、90、95、96、97、98、99或100%序列相同性的序列。
在某些实施方案中,SEQ ID NO:20位于3’或在SEQ ID NO:101后,之间是核苷酸接头,例如,以接头连接,如下所示:5’-SEQ ID NO:101接着是接头接着是SEQ ID NO:20-3’。接头可以是0至200个核苷酸、10至100个核苷酸、30至60个核苷酸、30至40个核苷酸、32至36个核苷酸。
在某些实施方案中,肝特异性启动子序列包含与SEQ ID NO:4、5、6、7、102、103、104、105、106、107或108有至少50、60、70、80、85、90、95、96、97、98、99或100%序列相同性的序列。
在某些实施方案中,肝特异性启动子核酸序列为小于205或250个核苷酸。术语“小于205或250个核苷酸”是指单链的长度或双链碱基对的长度。功能启动子在病毒感染后的胞内转化之后是双链的。如果它是单链的,就不会发挥作用。
在某些实施方案中,本发明构想了启动子序列的第一核苷酸为HFN1aTF结合位点GTTAAT(SEQ ID NO:25)中的5’“G”,例如,启动子为5’-SEQ ID NO:21,接着是接头,接着是转录起始位点(TSS),例如TCATCCTC(SEQ ID NO:109),其中转录起始位点中的最后的核苷酸为启动子序列的末端。在某些实施方案中,本发明构想了启动子序列的第一核苷酸为GTTAA(SEQ ID NO:27)、GTTA(SEQ ID NO:28)、GTT(SEQ ID NO:29)中的5’“G”。在某些实施方案中,启动子序列的第一核苷酸为TTAAT(SEQ ID NO:30)、TTAA(SEQ ID NO:31)、TTA(SEQID NO:32)中的5’“T”。在某些实施方案中,启动子序列的第一核苷酸为AAT(SEQ ID NO:33)中的5’“A”。
在某些实施方案中,本发明构想了启动子,包含5’-SEQ ID NO:21或97或98或99或100或101,任选地,接着是接头,接着是TATAA盒、接着是富含GC的间隔物、接着是转录起始位点。在某些实施方案中,富含GC的间隔物是序列其中超过60%、70%、80%或90%的核苷酸为G或C,例如,跨过第5至35位核苷酸、第10至30位核苷酸或第15至40位核苷酸或第5至50或60位核苷酸的窗口。在某些实施方案中,富含GC的间隔物为GGCCAGCAGCAGCCTGACCACATC(SEQ ID NO:110)。在某些实施方案中,肝特异性启动子序列包含与SEQ ID NO:110有至少50、60、70、80、85、90、95、96、97、98、99或100%序列相同性的序列。
在某些实施方案中,肝特异性启动子序列包含与以下序列之一有至少50、60、70、80、85、90、95、96、97、98、99或100%序列相同性的序列:
SEQ ID NO:34:GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACA;
SEQ ID NO:35:TTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACA;
SEQ ID NO:36:TAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACA;
SEQ ID NO:37:AATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACA;
SEQ ID NO:38:ATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACA;
SEQ ID NO:39:TTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACA;
SEQ ID NO:40:TTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACA;
SEQ ID NO:41:TTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACA;
SEQ ID NO:42:TTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACA;
SEQ ID NO:44:TGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACA;
SEQ ID NO:45:GTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACA;
SEQ ID NO:46:TGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACA;
SEQ ID NO:47:GCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACA;
SEQ ID NO:48:CCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACA;
SEQ ID NO:49:CCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACA;
SEQ ID NO:50:CTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACA;
SEQ ID NO:51:GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAAC;
SEQ ID NO:52:GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAA;
SEQ ID NO:53:GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAA;
SEQ ID NO:54:GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAA;
SEQ ID NO:55:GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACA;
SEQ ID NO:56:GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGAC;
SEQ ID NO:57:GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGA;
SEQ ID NO:58:GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGG;
SEQ ID NO:59:GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAG;
SEQ ID NO:60:GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCA;
SEQ ID NO:61:GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTC;
SEQ ID NO:62:GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCT;
SEQ ID NO:63:GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATC;
SEQ ID NO:64:GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAAT;
SEQ ID NO:65:GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAA;
SEQ ID NO:66:GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAAC;
SEQ ID NO:67:TTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAA;
SEQ ID NO:68:TAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAA;
SEQ ID NO:69:AATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACA;
SEQ ID NO:70:ATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGAC;
SEQ ID NO:71:TTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGA;
SEQ ID NO:72:TTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGG;
SEQ ID NO:73:TTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAG;
SEQ ID NO:74:TTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCA;
SEQ ID NO:75:TGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTC;
SEQ ID NO:76:GTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCT;
SEQ ID NO:77:TGGCCCTTGCGATGTTTGCTCTGGTTAATAATC;
SEQ ID NO:78:GCCCTTGCGATGTTTGCTCTGGTTAATAAT;
SEQ ID NO:79:CCCTTGCGATGTTTGCTCTGGTTAATAA;
SEQ ID NO:80:CCTTGCGATGTTTGCTCTGGTTAATA;
SEQ ID NO:81:CTTGCGATGTTTGCTCTGGTTAAT;
SEQ ID NO:82:TTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAAC;
SEQ ID NO:83:TAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAA;
SEQ ID NO:84:AATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAA;
SEQ ID NO:85:ATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAA;
SEQ ID NO:86:TTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACA;
SEQ ID NO:87:TTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGAC;
SEQ ID NO:88:TTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGA;
SEQ ID NO:89:TTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGG;
SEQ ID NO:90:TGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAG;
SEQ ID NO:91:TGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCA;
SEQ ID NO:92:GGCCCTTGCGATGTTTGCTCTGGTTAATAATCTC;
SEQ ID NO:93:GCCCTTGCGATGTTTGCTCTGGTTAATAATCT;
SEQ ID NO:94:CCCTTGCGATGTTTGCTCTGGTTAATAATC;
SEQ ID NO:95:CCTTGCGATGTTTGCTCTGGTTAATAAT;或
SEQ ID NO:96:CTTGCGATGTTTGCTCTGGTTAATAA.
在某些实施方案中,启动子可以SEQ ID NO:34-96的第一5’核苷酸开始和以TSS的最后的核苷酸结束。
在某些实施方案中,蛋白质为fVIII或fIX或其变体。在某些实施方案中,本文公开的启动子和密码子优化方案可用于肝靶向的AAV基因治疗。构想由肝酶的缺陷和那些功能蛋白质的表达引起的其他代谢疾病。
在某些实施方案中,fVIII变体包含A1结构域、A2结构域、RHQR序列(SEQ ID NO:24)、A3结构域、C1结构域和C2结构域。在某些实施方案中,fVIII变体包含缺失的B结构域。
在某些实施方案中,fVIII变体包含处于在A2结构域与A3结构域之间的2至55、2至25或2至15个氨基酸的接头。
在某些实施方案中,fVIII变体包含A1结构域、A2结构域、激活肽(ap)结构域、A3结构域、C1结构域和C2结构域。在某些实施方案中,fVIII变体包含缺失的B结构域。
在某些实施方案中,fVIII变体包含处于在A2结构域与激活肽(ap)结构域之间的2至55、2至25或2至15个氨基酸的接头。
在某些实施方案中,fVIII变体包含与SEQ ID NO:3有至少50、60、70、80、85、90、95、96、97、98、99或100%序列相同性的序列。
在某些实施方案中,fVIII变体包含与SEQ ID NO:13、14、15或16有至少50、60、70、80、85、90、95、96、97、98、99或100%序列相同性的序列。
在某些实施方案中,本发明涉及方法,其中根据将表达的组织例如肝组织来调节基因的密码子使用。在某些实施方案中,编码蛋白质的核酸序列包含密码子,所述密码子与人的整个编码区的密码子使用相比在肝或其他特异性组织中高度表达的基因中被差异性利用或表征,并且该编码蛋白质的核酸序列避免了在肝或其他特异性组织中所占比例偏低(under-represented)的密码子。
在某些实施方案中,编码蛋白质的核酸序列包含密码子,所述密码子对于多于50、60、70、80、90或95%或100%的氨基酸是优选的(如图2中所提供的)。
在某些实施方案中,与整个人密码子使用相比,编码蛋白质的核酸序列包含更高百分比的肝细胞特异性氨基酸密码子,其是与SEQ ID NO:1有至少50、60、70、80、85、90、95、96、97、98、99或100%序列相同性的序列。
在某些实施方案中,fIX变体包含于与SEQ ID NO:17、18或19有至少50、60、70、80、85、90、95、96、97、98、99或100%序列相同性的序列。
在某些实施方案中,与整个人密码子使用相比,编码蛋白质的核酸序列包含更高百分比的肝细胞特异性氨基酸密码子,其是与SEQ ID NO:8、9或10有至少50、60、70、80、85、90、95、96、97、98、99或100%序列相同性的序列。
在某些实施方案中,编码蛋白质的核酸序列包含a)至g)中的至少一者,其中,
a)ATC密码子超过Ile的50%或52%;
b)ACC密码子超过Thr的38%或40%;
c)TTC密码子超过Phe的57%或59%;
d)GAC密码子超过Glu的60%或62%;
e)CTG密码子超过Leu的43%或45%;
f)AAG密码子超过Lys的60%或62%;和/或
g)GAC密码子超过Asp的56%或58%。
在某些实施方案中,编码蛋白质的核酸序列包含a)、b)、c)、d)、e)、f)和g)中的至少两个或更多、三个或更多、四个或更多、五个或更多、六个或更多或全部。
在某些实施方案中,编码蛋白质的核酸序列包含少于100、50、30、25、20、15、10、9、8、7、6、5、4、3、2或无5’-CG-3’二核苷酸。
在某些实施方案中,本发明涉及包含本文公开的载体或衣壳的药物组合物和药学上可接受的赋形剂。
在某些实施方案中,本发明涉及诱导血液凝结的方法,包括在有需要时将本文公开的有效量的病毒颗粒、衣壳或载体施用于受试对象。
在某些实施方案中,受试对象被诊断为患有血友病A或B或获得性血友病,或者不太可能对外源fVIII灌注有应答。
在某些实施方案中,载体、病毒颗粒或衣壳与免疫抑制剂组合施用,例如,环孢素、他克莫司、雷帕霉素、环磷酰胺、甲氨蝶呤硫唑嘌呤、巯嘌呤、氟二氧嘧啶、霉酚酸、放线菌素、芬戈莫德、T细胞受体抗体或结合蛋白、莫罗单抗-CD3、IL-2受体抗体或结合蛋白、巴利昔单抗、达克珠单抗、重组IFN-β、TNF-α抗体或结合蛋白、英夫利昔、依那西普、阿达木单抗或其组合。
在某些实施方案中,本发明涉及包含核酸或含有本文公开的核酸的载体的表达***。
在某些实施方案中,本发明涉及包含核酸或含有本文公开的核酸的载体的表达***。
通过由以下条款说明另外的实施方案:
条款1:一种载体,包含少于250个核苷酸的与编码蛋白质的异源核酸序列可操作组合的肝特异性启动子核酸序列。
条款2:根据条款1所述的载体,其中所述肝特异性启动子序列包含与GGCCAGCAGCAGCCTGACCACATC(SEQ ID NO:110)有大于50、60、70、80、85、90、95、96、97、98或99%序列相同性的序列。
条款3:根据条款1所述的载体,其中所述肝特异性启动子序列包含与SEQ ID NO:4、5、6、7、102、103、104、105、106、107或108有大于50、60、70、80、85、90、95、96、97、98或99%序列相同性的序列。
条款4:根据条款1所述的载体,其中所述蛋白质为fVIII或fIX或其变体。
条款5:根据条款4所述的载体,其中fVIII变体包含A1结构域、A2结构域、ap结构域、A3结构域、C1结构域和C2结构域。
条款6:根据条款4所述的载体,其中所述fVIII变体包含缺失的B结构域。
条款7:根据条款4所述的载体,其中所述fVIII变体在A2结构域与激活结构域之间包含有2至55或2至25或2至55个氨基酸之间的接头。
条款8:根据条款4所述的载体,其中所述fVIII变体包含与SEQ ID NO:3有大于50、60、70、80、85、90、91、92、93、94、95、96、97、98或99%序列相同性的序列。
条款9:根据条款4所述的载体,其中所述fVIII变体包含与SEQ ID NO:13、14、15或16有大于50、60、70、80、85、90、91、92、93、94、95、96、97、98或99%序列相同性的序列。
条款10:根据条款1所述的方法,其中与整个人密码子使用相比,所述异源核酸序列包含更高百分比的肝细胞特异性氨基酸密码子。
条款11:根据条款1所述的载体,其中与整个人密码子使用相比,所述编码蛋白质的核酸序列包含更高百分比的肝细胞特异性氨基酸密码子其是与SEQ ID NO:2或11有大于70、80、85、90、95、96、97、98或99%序列相同性的序列。
条款12:根据条款3所述的载体,其中fIX变体包含与SEQ ID NO:17、18或19有大于50、60、70、80、85、90、91、92、93、94、95、96、97、98或99%序列相同性的序列。
条款13:根据条款1所述的载体,其中与整个人密码子使用相比,所述编码蛋白质的核酸序列包含更高百分比的肝细胞特异性氨基酸密码子,其是与SEQ ID NO:8、9或10有大于70、80、85、90、95、96、97、98或99%序列相同性的序列。
条款14:一种药物组合物,其包含条款1所述的载体和药学上可接受的赋形剂。
条款15:一种诱导血液凝结的方法,包括将有效量的条款1所述的载体施用于有需要的受试对象。
条款16:根据条款15所述的方法,其中所述受试对象被诊断含有血友病A或B或获得性血友病。
条款17:根据条款15所述的方法,其中所述载体与免疫抑制剂组合施用。
条款18:根据条款17所述的方法,其中所述免疫抑制剂为环孢素、他克莫司、雷帕霉素、环磷酰胺、甲氨嘌呤、硫唑嘌呤、巯嘌呤、氟二氧嘧啶、麦考酚酸、放线菌素、芬戈莫德、T细胞受体抗体或结合蛋白、莫罗单抗-CD3、IL-2受体抗体或结合蛋白、巴利昔单抗、达克珠单抗、重组IFN-β、TNF-α抗体或结合蛋白、英夫利昔或阿达木单抗。
提供以下实施例来说明某些具体特征和/或实施方案。这些实施例不应被认为是将本发明限制于所述的具体特征或实施方案。
实施例
实施例1
优化凝血因子及其编码DNA
该实施例说明了fVIII和fIX蛋白质的编码序列的优化以提高它们用于体内表达和基因治疗的实用性。
与编码天然存在的相应的人非密码子优化的序列核苷酸相比,通过实施特别用于人肝细胞的密码子使用偏好来初步优化编码fVIII和fIX的cDNA核苷酸序列。
编码fVIII的核苷酸序列对人肝细胞的密码子使用的适应性表达为肝密码子适应指数(LCAI)。密码子适应指数定义为基因的密码子使用相对于在人肝脏中高度表达的基因的密码子使用的适应性的度量。每个密码子的相对适应性为每个密码子的使用与相同氨基酸中数目最多的密码子的使用的比值。CAI定义为这些相对适应性值的几何平均值。排除了非同义密码子和终止密码子(取决于基因密码)。CAI值的范围为0至1,值越大说明数目最多的密码子的比例越大。通过使用在人肝脏中高表达的43个基因的序列来构建特别用于人肝脏的自定义密码子使用偏好表(参见图2A),该表与总人编码序列中使用的最流行的密码子大大不同(图2B)。利用由肝使用偏好分析鉴定的统计学上最流行的密码子开发了fVIII的ET3和HSQ变体的优化编码序列。
ET3是B结构域缺失(BDD)型fVIII杂合体,其含有人和猪结构域,即在缺失的B结构域中具有接头的序列(A1和A3猪,参见图1A和1B)。ET3利用24氨基酸的猪序列衍生的OL接头序列,即猪源性序列SFAQNSRPPSASAPKPPVLRRHQR(SEQ ID NO:23)。ET3氨基酸序列为SEQ IDNO:123:
MQLELSTCVFLCLLPLGFSAIRRYYLGAVELSWDYRQSELLRELHVDTRFPATAPGALPLGPSVLYKKTVFVEFTDQLFSVARPRPPWMGLLGPTIQAEVYDTVVVTLKNMASHPVSLHAVGVSFWKSSEGAEYEDHTSQREKEDDKVLPGKSQTYVWQVLKENGPTASDPPCLTYSYLSHVDLVKDLNSGLIGALLVCREGSLTRERTQNLHEFVLLFAVFDEGKSWHSARNDSWTRAMDPAPARAQPAMHTVNGYVNRSLPGLIGCHKKSVYWHVIGMGTSPEVHSIFLEGHTFLVRHHRQASLEISPLTFLTAQTFLMDLGQFLLFCHISSHHHGGMEAHVRVESCAEEPQLRRKADEEEDYDDNLYDSDMDVVRLDGDDVSPFIQIRSVAKKHPKTWVHYIAAEEEDWDYAPLVLAPDDRSYKSQYLNNGPQRIGRKYKKVRFMAYTDETFKTREAIQHESGILGPLLYGEVGDTLLIIFKNQASRPYNIYPHGITDVRPLYSRRLPKGVKHLKDFPILPGEIFKYKWTVTVEDGPTKSDPRCLTRYYSSFVNMERDLASGLIGPLLICYKESVDQRGNQIMSDKRNVILFSVFDENRSWYLTENIQRFLPNPAGVQLEDPEFQASNIMHSINGYVFDSLQLSVCLHEVAYWYILSIGAQTDFLSVFFSGYTFKHKMVYEDTLTLFPFSGETVFMSMENPGLWILGCHNSDFRNRGMTALLKVSSCDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFAQNSRPPSASAPKPPVLRRHQRDISLPTFQPEEDKMDYDDIFSTETKGEDFDIYGEDENQDPRSFQKRTRHYFIAAVEQLWDYGMSESPRALRNRAQNGEVPRFKKVVFREFADGSFTQPSYRGELNKHLGLLGPYIRAEVEDNIMVTFKNQASRPYSFYSSLISYPDDQEQGAEPRHNFVQPNETRTYFWKVQHHMAPTEDEFDCKAWAYFSDVDLEKDVHSGLIGPLLICRANTLNAAHGRQVTVQEFALFFTIFDETKSWYFTENVERNCRAPCHLQMEDPTLKENYRFHAINGYVMDTLPGLVMAQNQRIRWYLLSMGSNENIHSIHFSGHVFSVRKKEEYKMAVYNLYPGVFETVEMLPSKVGIWRIECLIGEHLQAGMSTTFLVYSKKCQTPLGMASGHIRDFQITASGQYGQWAPKLARLHYSGSINAWSTKEPFSWIKVDLLAPMIIHGIKTQGARQKFSSLYISQFIIMYSLDGKKWQTYRGNSTGTLMVFFGNVDSSGIKHNIFNPPIIARYIRLHPTHYSIRSTLRMELMGCDLNSCSMPLGMESKAISDAQITASSYFTNMFATWSPSKARLHLQGRSNAWRPQVNNPKEWLQVDFQKTMKVTGVTTQGVKSLLTSMYVKEFLISSSQDGHQWTLFFQNGKVKVFQGNQDSFTPVVNSLDPPLLTRYLRIHPQSWVHQIALRMEVLGCEAQDLY。
HSQ为人fVIII变体,其中BDD人fVIII蛋白质用14氨基酸的人源性SQ接头SFSQNPPVLKRHQR(SEQ ID NO:22)取代。HSQ氨基酸序列为SEQ ID NO:3:
MQIELSTCFFLCLLRFCFSATRRYYLGAVELSWDYMQSDLGELPVDARFPPRVPKSFPFNTSVVYKKTLFVEFTVHLFNIAKPRPPWMGLLGPTIQAEVYDTVVITLKNMASHPVSLHAVGVSYWKASEGAEYDDQTSQREKEDDKVFPGGSHTYVWQVLKENGPMASDPLCLTYSYLSHVDLVKDLNSGLIGALLVCREGSLAKEKTQTLHKFILLFAVFDEGKSWHSETKNSLMQDRDAASARAWPKMHTVNGYVNRSLPGLIGCHRKSVYWHVIGMGTTPEVHSIFLEGHTFLVRNHRQASLEISPITFLTAQTLLMDLGQFLLFCHISSHQHDGMEAYVKVDSCPEEPQLRMKNNEEAEDYDDDLTDSEMDVVRFDDDNSPSFIQIRSVAKKHPKTWVHYIAAEEEDWDYAPLVLAPDDRSYKSQYLNNGPQRIGRKYKKVRFMAYTDETFKTREAIQHESGILGPLLYGEVGDTLLIIFKNQASRPYNIYPHGITDVRPLYSRRLPKGVKHLKDFPILPGEIFKYKWTVTVEDGPTKSDPRCLTRYYSSFVNMERDLASGLIGPLLICYKESVDQRGNQIMSDKRNVILFSVFDENRSWYLTENIQRFLPNPAGVQLEDPEFQASNIMHSINGYVFDSLQLSVCLHEVAYWYILSIGAQTDFLSVFFSGYTFKHKMVYEDTLTLFPFSGETVFMSMENPGLWILGCHNSDFRNRGMTALLKVSSCDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFSQNPPVLKRHQREITRTTLQSDQEEIDYDDTISVEMKKEDFDIYDEDENQSPRSFQKKTRHYFIAAVERLWDYGMSSSPHVLRNRAQSGSVPQFKKVVFQEFTDGSFTQPLYRGELNEHLGLLGPYIRAEVEDNIMVTFRNQASRPYSFYSSLISYEEDQRQGAEPRKNFVKPNETKTYFWKVQHHMAPTKDEFDCKAWAYFSDVDLEKDVHSGLIGPLLVCHTNTLNPAHGRQVTVQEFALFFTIFDETKSWYFTENMERNCRAPCNIQMEDPTFKENYRFHAINGYIMDTLPGLVMAQDQRIRWYLLSMGSNENIHSIHFSGHVFTVRKKEEYKMALYNLYPGVFETVEMLPSKAGIWRVECLIGEHLHAGMSTLFLVYSNKCQTPLGMASGHIRDFQITASGQYGQWAPKLARLHYSGSINAWSTKEPFSWIKVDLLAPMIIHGIKTQGARQKFSSLYISQFIIMYSLDGKKWQTYRGNSTGTLMVFFGNVDSSGIKHNIFNPPIIARYIRLHPTHYSIRSTLRMELMGCDLNSCSMPLGMESKAISDAQITASSYFTNMFATWSPSKARLHLQGRSNAWRPQVNNPKEWLQVDFQKTMKVTGVTTQGVKSLLTSMYVKEFLISSSQDGHQWTLFFQNGKVKVFQGNQDSFTPVVNSLDPPLLTRYLRIHPQSWVHQIALRMEVLGCEAQDLY。
HSQ和ET3都含有RHQR(SEQ ID NO:24)识别序列,用于B结构域的PACE/弗林蛋白加工序列。
肝密码子优化的ET3序列为(SEQ ID NO:12):
ATGCAGCTGGAACTGTCTACCTGTGTGTTTCTGTGTCTGCTGCCTCTGGGGTTTTCTGCTATCCGCCGCTACTATCTGGGAGCCGTGGAGCTGTCCTGGGACTACAGGCAGAGCGAGCTGCTGAGAGAACTGCACGTGGATACCAGATTCCCAGCTACCGCTCCAGGAGCTCTGCCTCTGGGCCCATCCGTGCTGTACAAGAAAACCGTCTTCGTGGAGTTTACCGACCAGCTGTTCAGCGTGGCCAGGCCAAGACCACCTTGGATGGGACTGCTGGGACCAACCATCCAGGCTGAGGTGTACGATACCGTGGTCGTGACCCTGAAAAACATGGCCTCCCATCCCGTGAGCCTGCACGCTGTCGGGGTGTCCTTCTGGAAGTCCAGCGAGGGAGCCGAGTACGAAGACCATACCTCCCAGCGCGAGAAAGAAGACGATAAGGTGCTGCCTGGCAAAAGCCAGACCTATGTCTGGCAGGTGCTGAAGGAGAACGGACCAACCGCTAGCGACCCACCATGCCTGACCTACTCTTATCTGTCCCACGTCGATCTGGTGAAGGACCTGAATTCCGGACTGATCGGAGCTCTGCTGGTGTGTAGAGAGGGAAGCCTGACCAGAGAAAGAACCCAGAACCTGCATGAGTTCGTCCTGCTGTTCGCCGTGTTTGACGAAGGGAAGAGCTGGCACTCTGCCCGCAATGACTCCTGGACCAGAGCTATGGATCCAGCTCCTGCTAGAGCTCAGCCTGCTATGCACACCGTCAACGGCTACGTGAATCGGTCTCTGCCAGGACTGATCGGCTGCCATAAGAAAAGCGTCTATTGGCACGTGATCGGAATGGGCACCAGCCCCGAGGTGCATTCTATCTTCCTGGAAGGCCACACCTTTCTGGTCAGGCACCATAGACAGGCCTCTCTGGAGATCTCCCCTCTGACCTTCCTGACCGCTCAGACCTTTCTGATGGACCTGGGGCAGTTCCTGCTGTTTTGCCATATCTCTTCCCACCATCACGGAGGAATGGAGGCTCACGTCAGGGTGGAATCCTGTGCTGAGGAACCACAGCTGAGAAGAAAGGCTGATGAGGAAGAGGACTACGACGATAACCTGTATGACAGCGATATGGACGTCGTGCGCCTGGACGGCGACGATGTCAGCCCTTTCATCCAGATCCGGTCTGTGGCCAAGAAACATCCAAAGACCTGGGTCCACTACATCGCCGCTGAAGAGGAAGATTGGGACTATGCCCCCCTGGTGCTGGCTCCTGACGATAGATCCTACAAAAGCCAGTATCTGAACAATGGGCCCCAGCGCATCGGACGGAAGTACAAGAAAGTGAGGTTCATGGCCTATACCGACGAGACCTTTAAGACCAGAGAGGCTATCCAGCACGAATCCGGGATCCTGGGACCTCTGCTGTACGGCGAAGTGGGGGATACCCTGCTGATCATCTTCAAGAACCAGGCCTCCAGGCCATACAATATCTATCCCCATGGCATCACCGACGTGAGACCACTGTACAGCAGGAGACTGCCCAAGGGGGTCAAACACCTGAAGGATTTCCCCATCCTGCCTGGAGAGATCTTTAAGTATAAATGGACCGTCACCGTGGAAGACGGGCCTACCAAGTCCGATCCACGCTGCCTGACCCGGTACTATAGCTCTTTCGTGAACATGGAGAGAGACCTGGCTAGCGGACTGATCGGACCCCTGCTGATCTGTTACAAAGAGAGCGTGGACCAGAGGGGCAACCAGATCATGTCTGATAAGAGAAATGTCATCCTGTTCTCCGTGTTTGACGAGAACCGCAGCTGGTACCTGACCGAGAACATCCAGCGGTTCCTGCCAAATCCAGCTGGAGTGCAGCTGGAGGACCCAGAATTTCAGGCTTCCAACATCATGCATAGCATCAATGGCTACGTGTTCGATAGCCTGCAGCTGTCTGTCTGCCTGCACGAGGTGGCCTACTGGTATATCCTGTCCATCGGCGCTCAGACCGACTTCCTGTCCGTGTTCTTTAGCGGGTACACCTTTAAGCATAAAATGGTGTATGAGGATACCCTGACCCTGTTCCCCTTTTCTGGCGAGACCGTGTTCATGTCCATGGAAAACCCTGGCCTGTGGATCCTGGGGTGCCACAACAGCGACTTCAGGAATAGAGGAATGACCGCCCTGCTGAAAGTGTCCAGCTGTGATAAGAATACCGGCGATTACTATGAGGACTCTTACGAAGATATCTCCGCTTATCTGCTGAGCAAGAACAATGCCATCGAGCCCAGGTCTTTCGCTCAGAACTCCAGACCTCCAAGCGCTTCTGCTCCTAAGCCACCTGTGCTGAGAAGACATCAGAGGGACATCTCCCTGCCTACCTTCCAGCCAGAGGAAGATAAAATGGACTACGACGATATCTTCAGCACCGAGACCAAGGGGGAAGATTTTGACATCTATGGAGAGGACGAAAACCAGGATCCAAGATCCTTCCAGAAGAGAACCAGACACTACTTTATCGCCGCTGTGGAGCAGCTGTGGGACTATGGGATGTCCGAAAGCCCACGGGCCCTGAGGAACAGAGCTCAGAATGGAGAGGTGCCCCGCTTCAAGAAAGTCGTGTTCCGGGAGTTTGCCGACGGCAGCTTTACCCAGCCATCTTACAGGGGGGAGCTGAACAAGCATCTGGGGCTGCTGGGACCCTATATCAGAGCCGAGGTCGAAGATAACATCATGGTGACCTTCAAGAATCAGGCTTCTCGCCCCTACTCCTTTTATTCTTCCCTGATCTCCTACCCTGACGATCAGGAGCAGGGCGCCGAACCTAGGCACAACTTCGTGCAGCCAAATGAGACCAGAACCTACTTTTGGAAGGTGCAGCATCACATGGCTCCCACCGAGGATGAATTCGACTGCAAAGCTTGGGCCTATTTTTCCGATGTCGACCTGGAGAAGGACGTGCATAGCGGCCTGATCGGGCCTCTGCTGATCTGTCGCGCCAACACCCTGAATGCTGCTCACGGAAGACAGGTCACCGTGCAGGAGTTCGCTCTGTTCTTTACCATCTTTGACGAAACCAAGAGCTGGTACTTCACCGAGAACGTGGAAAGGAATTGCAGAGCCCCCTGTCATCTGCAGATGGAGGACCCTACCCTGAAGGAAAACTACAGGTTCCACGCCATCAATGGATATGTCATGGATACCCTGCCCGGCCTGGTCATGGCTCAGAACCAGCGCATCCGGTGGTACCTGCTGTCTATGGGATCCAACGAGAATATCCATAGCATCCACTTCTCTGGCCATGTCTTTTCCGTGAGGAAGAAAGAGGAATACAAAATGGCCGTGTACAATCTGTATCCTGGGGTCTTCGAGACCGTGGAAATGCTGCCAAGCAAAGTGGGAATCTGGAGAATCGAGTGCCTGATCGGCGAACACCTGCAGGCCGGGATGAGCACCACCTTCCTGGTGTACTCTAAGAAATGTCAGACCCCACTGGGGATGGCCTCCGGACATATCCGCGACTTCCAGATCACCGCTAGCGGACAGTACGGACAGTGGGCTCCAAAGCTGGCTAGACTGCACTATTCTGGCTCCATCAACGCCTGGTCTACCAAAGAGCCATTCTCCTGGATCAAGGTGGACCTGCTGGCCCCCATGATCATCCACGGAATCAAAACCCAGGGCGCTAGGCAGAAGTTCAGCTCTCTGTACATCTCCCAGTTTATCATCATGTATAGCCTGGACGGGAAGAAATGGCAGACCTACAGAGGCAATTCCACCGGGACCCTGATGGTCTTCTTTGGAAACGTGGATTCCAGCGGCATCAAGCACAACATCTTCAATCCACCCATCATCGCCCGCTACATCCGGCTGCATCCTACCCACTATAGCATCAGGTCTACCCTGAGAATGGAGCTGATGGGATGCGACCTGAACAGCTGTTCTATGCCACTGGGCATGGAGTCCAAGGCTATCAGCGATGCCCAGATCACCGCTTCTTCCTACTTCACCAATATGTTTGCTACCTGGTCCCCAAGCAAGGCTAGACTGCACCTGCAGGGAAGATCCAACGCTTGGAGACCCCAGGTGAACAATCCTAAGGAGTGGCTGCAGGTCGACTTCCAGAAAACCATGAAGGTCACCGGGGTGACCACCCAGGGAGTGAAATCTCTGCTGACCTCCATGTACGTCAAGGAGTTCCTGATCAGCTCTTCCCAGGACGGCCACCAGTGGACCCTGTTCTTTCAGAACGGCAAGGTCAAAGTGTTCCAGGGGAATCAGGACTCTTTTACCCCCGTCGTGAACTCCCTGGATCCTCCACTGCTGACCAGGTACCTGAGAATCCATCCTCAGAGCTGGGTGCACCAGATCGCTCTGAGAATGGAGGTCCTGGGATGCGAAGCTCAGGACCTGTATTGA。
此外,去除了ET3和HSQ的肝密码子优化的编码序列中的CpG DNA基序,因为它们会导致基因甲基化和沉默。参见Bird,DNA methylation and the frequency of CpG inanimal DNA,1980,Nucleic Acids Res,8:1499–1504。密码子被最常使用的人/肝替代物取代(基于上文讨论的肝使用偏好分析),所述最常使用的人/肝替代物不会导致在序列中形成5’-CG-3’。这些修饰分别去除了来自肝密码子优化的ET3和HSQ序列的174和175个CpG。CpG的去除还有助于载体逃避免疫检测,从而增强了载体的安全性和效能。参见最常使用的人/肝替代物取代,标题为“CpG-depleted adeno-associated virus vectors evadeimmune detection”。
CpG缺失的肝密码子优化的ET3序列为SEQ ID NO:11:
ATGCAGCTGGAACTGTCTACCTGTGTGTTTCTGTGTCTGCTGCCTCTGGGGTTTTCTGCTATCAGGAGATACTATCTGGGAGCTGTGGAGCTGTCCTGGGACTACAGGCAGTCTGAGCTGCTGAGAGAACTGCATGTGGATACCAGATTCCCAGCTACAGCTCCAGGAGCTCTGCCTCTGGGCCCATCTGTGCTGTACAAGAAAACAGTCTTTGTGGAGTTTACAGACCAGCTGTTCTCTGTGGCCAGGCCAAGACCACCTTGGATGGGACTGCTGGGACCAACCATCCAGGCTGAGGTGTATGATACAGTGGTGGTGACCCTGAAAAACATGGCCTCCCATCCTGTGAGCCTGCATGCTGTGGGGGTGTCCTTCTGGAAGTCCTCTGAGGGAGCTGAGTATGAAGACCATACCTCCCAGAGGGAGAAAGAAGATGATAAGGTGCTGCCTGGCAAAAGCCAGACCTATGTCTGGCAGGTGCTGAAGGAGAATGGACCAACTGCTTCTGACCCACCATGCCTGACCTACTCTTATCTGTCCCATGTGGATCTGGTGAAGGACCTGAATTCTGGACTGATTGGAGCTCTGCTGGTGTGTAGAGAGGGAAGCCTGACCAGAGAAAGAACCCAGAACCTGCATGAGTTTGTCCTGCTGTTTGCTGTGTTTGATGAAGGGAAGAGCTGGCACTCTGCCAGGAATGACTCCTGGACCAGAGCTATGGATCCAGCTCCTGCTAGAGCTCAGCCTGCTATGCACACAGTCAATGGCTATGTGAATAGGTCTCTGCCAGGACTGATTGGCTGCCATAAGAAATCTGTCTATTGGCATGTGATTGGAATGGGCACCAGCCCTGAGGTGCATTCTATCTTCCTGGAAGGCCACACCTTTCTGGTCAGGCACCATAGACAGGCCTCTCTGGAGATCTCCCCTCTGACCTTCCTGACAGCTCAGACCTTTCTGATGGACCTGGGGCAGTTCCTGCTGTTTTGCCATATCTCTTCCCACCATCATGGAGGAATGGAGGCTCATGTCAGGGTGGAATCCTGTGCTGAGGAACCACAGCTGAGAAGAAAGGCTGATGAGGAAGAGGACTATGATGATAACCTGTATGACTCTGATATGGATGTGGTGAGGCTGGATGGGGATGATGTCAGCCCTTTCATCCAGATCAGGTCTGTGGCCAAGAAACATCCAAAGACCTGGGTCCACTACATTGCTGCTGAAGAGGAAGATTGGGACTATGCCCCCCTGGTGCTGGCTCCTGATGATAGATCCTACAAAAGCCAGTATCTGAACAATGGGCCCCAGAGGATTGGAAGGAAGTACAAGAAAGTGAGGTTCATGGCCTATACAGATGAGACCTTTAAGACCAGAGAGGCTATCCAGCATGAATCTGGGATCCTGGGACCTCTGCTGTATGGAGAAGTGGGGGATACCCTGCTGATCATCTTCAAGAACCAGGCCTCCAGGCCATACAATATCTATCCCCATGGCATCACAGATGTGAGACCACTGTACAGCAGGAGACTGCCCAAGGGGGTCAAACACCTGAAGGATTTCCCCATCCTGCCTGGAGAGATCTTTAAGTATAAATGGACAGTCACAGTGGAAGATGGGCCTACCAAGTCTGATCCAAGGTGCCTGACCAGATACTATAGCTCTTTTGTGAACATGGAGAGAGACCTGGCTTCTGGACTGATTGGACCCCTGCTGATCTGTTACAAAGAGTCTGTGGACCAGAGGGGCAACCAGATCATGTCTGATAAGAGAAATGTCATCCTGTTCTCTGTGTTTGATGAGAACAGGAGCTGGTACCTGACAGAGAACATCCAGAGGTTCCTGCCAAATCCAGCTGGAGTGCAGCTGGAGGACCCAGAATTTCAGGCTTCCAACATCATGCATAGCATCAATGGCTATGTGTTTGATAGCCTGCAGCTGTCTGTCTGCCTGCATGAGGTGGCCTACTGGTATATCCTGTCCATTGGAGCTCAGACAGACTTCCTGTCTGTGTTCTTTAGTGGGTACACCTTTAAGCATAAAATGGTGTATGAGGATACCCTGACCCTGTTCCCCTTTTCTGGGGAGACAGTGTTCATGTCCATGGAAAACCCTGGCCTGTGGATCCTGGGGTGCCACAACTCTGACTTCAGGAATAGAGGAATGACAGCCCTGCTGAAAGTGTCCAGCTGTGATAAGAATACAGGGGATTACTATGAGGACTCTTATGAAGATATCTCTGCTTATCTGCTGAGCAAGAACAATGCCATTGAGCCCAGGTCTTTTGCTCAGAACTCCAGACCTCCATCTGCTTCTGCTCCTAAGCCACCTGTGCTGAGAAGACATCAGAGGGACATCTCCCTGCCTACCTTCCAGCCAGAGGAAGATAAAATGGACTATGATGATATCTTCAGCACAGAGACCAAGGGGGAAGATTTTGACATCTATGGAGAGGATGAAAACCAGGATCCAAGATCCTTCCAGAAGAGAACCAGACACTACTTTATTGCTGCTGTGGAGCAGCTGTGGGACTATGGGATGTCTGAAAGCCCAAGGGCCCTGAGGAACAGAGCTCAGAATGGAGAGGTGCCCAGATTCAAGAAAGTGGTGTTCAGAGAGTTTGCTGATGGCAGCTTTACCCAGCCATCTTACAGGGGGGAGCTGAACAAGCATCTGGGGCTGCTGGGACCCTATATCAGAGCTGAGGTGGAAGATAACATCATGGTGACCTTCAAGAATCAGGCTTCTAGGCCCTACTCCTTTTATTCTTCCCTGATCTCCTACCCTGATGATCAGGAGCAGGGAGCTGAACCTAGGCACAACTTTGTGCAGCCAAATGAGACCAGAACCTACTTTTGGAAGGTGCAGCATCACATGGCTCCCACAGAGGATGAATTTGACTGCAAAGCTTGGGCCTATTTTTCTGATGTGGACCTGGAGAAGGATGTGCATTCTGGCCTGATTGGGCCTCTGCTGATCTGTAGGGCCAACACCCTGAATGCTGCTCATGGAAGACAGGTCACAGTGCAGGAGTTTGCTCTGTTCTTTACCATCTTTGATGAAACCAAGAGCTGGTACTTCACAGAGAATGTGGAAAGGAATTGCAGAGCCCCCTGTCATCTGCAGATGGAGGACCCTACCCTGAAGGAAAACTACAGGTTCCATGCCATCAATGGATATGTCATGGATACCCTGCCTGGCCTGGTCATGGCTCAGAACCAGAGGATCAGATGGTACCTGCTGTCTATGGGATCCAATGAGAATATCCATAGCATCCACTTCTCTGGCCATGTCTTTTCTGTGAGGAAGAAAGAGGAATACAAAATGGCTGTGTACAATCTGTATCCTGGGGTCTTTGAGACAGTGGAAATGCTGCCAAGCAAAGTGGGAATCTGGAGAATTGAGTGCCTGATTGGGGAACACCTGCAGGCTGGGATGAGCACCACCTTCCTGGTGTACTCTAAGAAATGTCAGACCCCACTGGGGATGGCCTCTGGACATATCAGGGACTTCCAGATCACAGCTTCTGGACAGTATGGACAGTGGGCTCCAAAGCTGGCTAGACTGCACTATTCTGGCTCCATCAATGCCTGGTCTACCAAAGAGCCATTCTCCTGGATCAAGGTGGACCTGCTGGCCCCCATGATCATCCATGGAATCAAAACCCAGGGAGCTAGGCAGAAGTTCAGCTCTCTGTACATCTCCCAGTTTATCATCATGTATAGCCTGGATGGGAAGAAATGGCAGACCTACAGAGGCAATTCCACTGGGACCCTGATGGTCTTCTTTGGAAATGTGGATTCCTCTGGCATCAAGCACAACATCTTCAATCCACCCATCATTGCCAGGTACATCAGGCTGCATCCTACCCACTATAGCATCAGGTCTACCCTGAGAATGGAGCTGATGGGATGTGACCTGAACAGCTGTTCTATGCCACTGGGCATGGAGTCCAAGGCTATCTCTGATGCCCAGATCACAGCTTCTTCCTACTTCACCAATATGTTTGCTACCTGGTCCCCAAGCAAGGCTAGACTGCACCTGCAGGGAAGATCCAATGCTTGGAGACCCCAGGTGAACAATCCTAAGGAGTGGCTGCAGGTGGACTTCCAGAAAACCATGAAGGTCACAGGGGTGACCACCCAGGGAGTGAAATCTCTGCTGACCTCCATGTATGTCAAGGAGTTCCTGATCAGCTCTTCCCAGGATGGCCACCAGTGGACCCTGTTCTTTCAGAATGGCAAGGTCAAAGTGTTCCAGGGGAATCAGGACTCTTTTACCCCAGTGGTGAACTCCCTGGATCCTCCACTGCTGACCAGGTACCTGAGAATCCATCCTCAGAGCTGGGTGCACCAGATTGCTCTGAGAATGGAGGTCCTGGGATGTGAAGCTCAGGACCTGTATTGA。
CpG缺失的肝密码子优化的HSQ序列为SEQ ID NO:2:
ATGCAGATTGAACTGTCTACCTGTTTCTTTCTGTGCCTGCTGAGGTTTTGTTTTTCTGCTACCAGAAGATACTACCTGGGAGCTGTGGAACTGAGCTGGGATTACATGCAGTCTGACCTGGGAGAGCTGCCTGTGGATGCTAGATTCCCACCTAGAGTCCCTAAGTCCTTCCCCTTCAACACCTCTGTGGTCTACAAGAAAACCCTGTTTGTGGAGTTTACAGACCACCTGTTCAACATTGCTAAGCCTAGACCACCATGGATGGGACTGCTGGGACCAACCATCCAGGCAGAGGTGTATGACACAGTGGTCATCACCCTGAAAAACATGGCTTCTCACCCTGTGTCCCTGCATGCTGTGGGAGTCTCCTACTGGAAGGCCTCTGAAGGGGCTGAGTATGATGATCAGACCAGCCAGAGGGAAAAAGAGGATGATAAGGTGTTCCCTGGAGGGTCCCATACCTATGTGTGGCAGGTCCTGAAGGAGAATGGACCAATGGCTTCTGACCCTCTGTGCCTGACCTACTCTTATCTGTCCCATGTGGACCTGGTCAAGGATCTGAACTCTGGCCTGATTGGGGCTCTGCTGGTGTGTAGGGAAGGGTCCCTGGCCAAGGAGAAAACCCAGACCCTGCATAAGTTCATCCTGCTGTTTGCTGTGTTTGATGAAGGAAAAAGCTGGCACTCTGAGACCAAGAACTCTCTGATGCAGGACAGGGATGCTGCTTCTGCCAGAGCTTGGCCCAAGATGCACACAGTGAATGGCTATGTCAATAGGAGCCTGCCTGGACTGATTGGCTGCCACAGAAAGTCTGTGTATTGGCATGTCATTGGAATGGGCACCACCCCTGAAGTGCACAGCATCTTCCTGGAGGGGCATACCTTTCTGGTCAGGAACCACAGGCAGGCTAGCCTGGAGATCTCTCCAATCACCTTCCTGACAGCCCAGACCCTGCTGATGGACCTGGGACAGTTCCTGCTGTTTTGCCACATCTCCAGCCACCAGCATGATGGCATGGAGGCTTATGTGAAAGTGGACTCCTGTCCTGAGGAACCTCAGCTGAGGATGAAGAACAATGAGGAAGCTGAAGACTATGATGATGACCTGACAGACTCTGAGATGGATGTGGTCAGGTTTGATGATGATAACTCTCCCTCCTTTATCCAGATCAGGTCTGTGGCCAAGAAACACCCTAAGACCTGGGTCCATTACATTGCTGCTGAGGAAGAGGACTGGGATTATGCTCCACTGGTGCTGGCCCCTGATGATAGATCCTACAAAAGCCAGTATCTGAACAATGGACCCCAGAGGATTGGCAGAAAGTACAAGAAAGTGAGGTTCATGGCTTATACAGATGAGACCTTTAAGACCAGAGAAGCCATCCAGCATGAGTCTGGGATCCTGGGACCTCTGCTGTATGGGGAAGTGGGGGACACCCTGCTGATCATCTTCAAGAACCAGGCCAGCAGGCCTTACAATATCTATCCACATGGCATCACAGATGTGAGACCTCTGTACTCCAGGAGGCTGCCAAAGGGGGTGAAACACCTGAAGGACTTCCCAATCCTGCCTGGGGAAATCTTTAAGTATAAATGGACAGTCACAGTGGAGGATGGGCCCACCAAGTCTGACCCTAGGTGCCTGACCAGATACTATTCTTCCTTTGTGAATATGGAGAGAGACCTGGCTTCTGGACTGATTGGACCCCTGCTGATCTGTTACAAAGAGTCTGTGGATCAGAGGGGCAACCAGATCATGTCTGACAAGAGGAATGTGATCCTGTTCTCTGTCTTTGATGAAAACAGGTCTTGGTACCTGACAGAGAACATCCAGAGGTTCCTGCCTAATCCAGCTGGAGTGCAGCTGGAAGATCCTGAGTTCCAGGCCTCTAACATCATGCATTCCATCAATGGCTATGTGTTTGACTCCCTGCAGCTGTCTGTGTGCCTGCATGAGGTGGCTTACTGGTATATCCTGAGCATTGGAGCCCAGACAGATTTCCTGTCTGTGTTCTTTTCTGGCTACACCTTTAAGCATAAAATGGTGTATGAGGACACCCTGACCCTGTTCCCATTTTCTGGAGAAACTGTGTTCATGAGCATGGAGAATCCTGGGCTGTGGATCCTGGGATGCCACAACTCTGATTTCAGGAATAGAGGGATGACAGCCCTGCTGAAAGTGAGCTCTTGTGACAAGAACACAGGAGACTACTATGAAGATAGCTATGAGGACATCTCTGCTTATCTGCTGTCCAAAAACAATGCCATTGAGCCCAGGAGCTTCTCTCAGAACCCTCCAGTGCTGAAGAGGCACCAGAGGGAGATCACCAGAACCACCCTGCAGTCTGATCAGGAAGAGATTGACTATGATGATACCATCTCTGTGGAAATGAAGAAAGAGGACTTTGATATCTATGATGAAGATGAGAACCAGTCTCCCAGGTCCTTCCAGAAGAAAACCAGACATTACTTTATTGCTGCTGTGGAGAGGCTGTGGGACTATGGCATGTCCAGCTCTCCTCATGTGCTGAGAAATAGAGCTCAGTCTGGATCTGTCCCACAGTTCAAGAAAGTGGTCTTCCAGGAGTTTACAGATGGAAGCTTTACCCAGCCACTGTACAGGGGAGAACTGAATGAGCACCTGGGGCTGCTGGGACCCTATATCAGGGCTGAAGTGGAGGATAACATCATGGTCACCTTCAGGAATCAGGCCAGCAGACCCTACTCTTTTTATTCCAGCCTGATCTCCTATGAAGAGGACCAGAGACAGGGAGCTGAACCAAGAAAAAACTTTGTGAAGCCTAATGAGACCAAAACCTACTTTTGGAAGGTGCAGCACCATATGGCCCCTACCAAAGATGAGTTTGATTGCAAGGCCTGGGCTTATTTTTCTGATGTGGATCTGGAGAAGGATGTCCACTCTGGCCTGATTGGGCCACTGCTGGTGTGTCATACCAACACCCTGAATCCAGCTCATGGAAGGCAGGTGACAGTCCAGGAATTTGCCCTGTTCTTTACCATCTTTGATGAGACCAAGAGCTGGTACTTCACAGAAAACATGGAGAGGAATTGCAGAGCCCCATGTAACATCCAGATGGAAGACCCCACCTTCAAGGAGAACTACAGATTTCATGCTATCAATGGGTATATCATGGATACCCTGCCAGGACTGGTCATGGCTCAGGACCAGAGGATCAGATGGTACCTGCTGAGCATGGGGTCTAATGAGAATATCCACTCCATCCATTTCTCTGGACATGTGTTTACAGTAAGGAAGAAAGAAGAGTACAAGATGGCCCTGTACAACCTGTATCCTGGGGTGTTTGAAACAGTGGAGATGCTGCCTTCCAAGGCTGGGATCTGGAGGGTGGAATGCCTGATTGGGGAGCACCTGCATGCTGGAATGTCTACCCTGTTCCTGGTGTACTCCAATAAGTGTCAGACCCCCCTGGGGATGGCTTCTGGACATATCAGGGACTTCCAGATCACAGCTTCTGGACAGTATGGACAGTGGGCTCCTAAGCTGGCTAGACTGCACTATTCTGGCTCCATCAATGCTTGGTCTACCAAAGAGCCTTTCTCCTGGATCAAGGTGGACCTGCTGGCTCCAATGATCATCCATGGCATCAAAACCCAGGGGGCCAGGCAGAAGTTCTCTTCCCTGTACATCAGCCAGTTTATCATCATGTATTCTCTGGATGGGAAGAAATGGCAGACCTACAGAGGCAATTCCACAGGGACCCTGATGGTGTTCTTTGGCAATGTGGACAGCTCTGGGATCAAGCACAACATCTTCAATCCCCCTATCATTGCCAGGTACATCAGACTGCACCCAACCCATTATTCCATCAGGAGCACCCTGAGAATGGAGCTGATGGGGTGTGATCTGAACAGCTGTTCTATGCCCCTGGGAATGGAGTCTAAGGCCATCTCTGATGCTCAGATCACAGCCTCCAGCTACTTCACCAATATGTTTGCTACCTGGTCCCCAAGCAAGGCTAGACTGCATCTGCAGGGAAGAAGCAATGCTTGGAGACCACAGGTGAACAATCCCAAGGAGTGGCTGCAGGTGGACTTCCAGAAAACCATGAAGGTGACAGGAGTCACCACCCAGGGAGTGAAAAGCCTGCTGACCTCTATGTATGTCAAGGAGTTCCTGATCTCTTCCAGCCAGGATGGGCACCAGTGGACCCTGTTCTTTCAGAATGGAAAGGTGAAAGTCTTCCAGGGCAATCAGGATTCCTTTACCCCTGTGGTCAACAGCCTGGACCCACCCCTGCTGACCAGGTACCTGAGAATCCACCCACAGTCCTGGGTGCATCAGATTGCTCTGAGGATGGAAGTCCTGGGCTGTGAGGCCCAGGACCTGTATTGA。
该方法增加了B结构域缺失的人fVIII(HSQ)的LCAI,从0.62至0.86。在用相应的fVIII表达质粒瞬时感染的HepG2细胞中评估优化的fVIII序列的体外表达。编码HSQ的核酸序列中的密码子优化使HSQ的表达增加了7.4倍,并像非密码子优化的ET3一样高效表达(图3A)。编码HSQ的核酸序列中的密码子优化使ET3的表达增加了5.6倍。当通过将携带密码子优化的fVIII变体的质粒水动力学注射到小鼠中来进行体内测试时,HSQ活性升高至能够通过测定法检测到的水平,该水平与在非密码子优化的ET3(图3B)中看到的fVIII水平几乎相等。进一步地,可观察到密码子优化的ET3的活性增加了17倍(图3B)。
有时可通过GC含量、mRNA二级结构、过早的PolyA位点、RNA不稳定性基序、稳定的mRNA自由能、内部χ位点、核糖体结合位点、隐蔽剪接位点、负CpG岛、SD序列、TATA框和模糊末端信号等的优化来提高翻译效率。图4示出了对编码ET3密码子优化的CpG缺失的序列做的变化以增加其产量。对HSQ序列内的若干顺式作用元件进行额外修饰以增加fVIII表达,如下表概括。
除上述提供的肝优化的密码子序列之外,ET3和HSQ fVIII蛋白质的编码序列是密码子优化的以在骨髓细胞中表达。使用在人骨髓细胞中高度表达的基因的序列来构建特别用于人肝脏的自定义密码子使用偏好表(参见图2C),该表基本上与总人编码序列中最流行使用的密码子不同(图2B)。利用由肝使用偏好分析鉴定的统计学上最流行的密码子研发了fVIII的ET3和HSQ变体的优化编码序列。此外,去除了ET3和HSQ的骨髓密码子优化的编码序列中的CpG DNA基序,因为它们会并导致基因甲基化和沉默。
CpG缺失的骨髓密码子优化的ET3序列为SEQ ID NO:125:
ATGCAGCTGGAGCTCTCAACCTGTGTGTTCCTCTGCCTGCTCCCCCTGGGATTTTCAGCTATCAGGAGATACTATCTGGGAGCAGTGGAACTGTCCTGGGACTACAGGCAGTCAGAGCTGCTCAGAGAACTGCATGTGGATACTAGGTTCCCTGCAACAGCTCCTGGAGCACTGCCACTGGGACCTTCAGTGCTGTACAAGAAAACTGTCTTTGTGGAGTTTACAGACCAGCTGTTCAGTGTGGCCAGGCCCAGGCCCCCCTGGATGGGGCTGCTGGGACCCACCATCCAGGCTGAAGTGTATGATACTGTGGTGGTGACCCTGAAAAACATGGCCTCTCATCCAGTCAGCCTGCATGCTGTGGGAGTGAGCTTCTGGAAGAGCAGTGAGGGAGCTGAGTATGAAGACCATACCTCACAGAGGGAGAAAGAAGATGATAAGGTGCTGCCAGGAAAAAGCCAGACCTATGTGTGGCAGGTGCTGAAGGAGAATGGCCCTACAGCTTCAGATCCTCCCTGCCTCACATACTCTTATCTGAGCCATGTGGATCTGGTGAAGGACCTCAATAGTGGCCTGATTGGGGCACTGCTGGTGTGCAGAGAGGGGTCCCTCACAAGGGAAAGAACTCAGAACCTGCATGAGTTTGTCCTGCTCTTTGCTGTGTTTGATGAGGGAAAGTCCTGGCACTCAGCAAGGAATGACAGCTGGACCAGGGCTATGGACCCAGCACCAGCCAGAGCTCAGCCAGCTATGCACACTGTCAATGGCTATGTGAATAGGTCCCTGCCTGGACTCATTGGCTGCCATAAGAAATCAGTCTATTGGCATGTGATTGGAATGGGCACCAGCCCAGAGGTGCATTCCATCTTCCTGGAAGGCCACACATTTCTGGTCAGGCACCATAGACAGGCCAGCCTGGAGATCAGCCCACTGACTTTCCTCACAGCACAGACATTTCTGATGGACCTGGGGCAGTTCCTGCTCTTTTGCCATATCTCAAGTCACCATCATGGAGGGATGGAGGCTCATGTCAGGGTGGAAAGCTGTGCAGAGGAACCTCAGCTGAGGAGGAAGGCAGATGAGGAAGAGGACTATGATGATAACCTGTATGACTCAGATATGGATGTGGTGAGGCTGGATGGAGATGATGTCAGCCCATTCATCCAGATCAGGTCAGTGGCTAAGAAACACCCTAAGACCTGGGTCCACTACATTGCAGCTGAAGAGGAAGATTGGGACTATGCACCCCTGGTGCTGGCCCCAGATGATAGAAGTTACAAATCTCAGTATCTGAACAATGGGCCCCAGAGGATTGGAAGGAAGTACAAGAAAGTGAGGTTCATGGCTTATACTGATGAGACCTTTAAGACAAGAGAGGCAATCCAGCATGAAAGTGGCATCCTGGGACCACTGCTCTATGGAGAAGTGGGGGATACCCTGCTCATCATCTTCAAGAACCAGGCCTCAAGGCCTTACAATATCTATCCCCATGGCATCACAGATGTGAGGCCTCTCTACAGCAGGAGACTGCCCAAGGGAGTCAAACACCTCAAGGATTTCCCCATCCTGCCAGGGGAAATCTTCAAGTATAAATGGACAGTCACTGTGGAAGATGGGCCAACTAAGTCAGATCCTAGGTGCCTGACCAGGTACTATTCTAGCTTTGTGAACATGGAGAGGGACCTGGCTTCAGGACTGATTGGACCTCTGCTCATCTGCTACAAAGAATCAGTGGACCAGAGGGGCAACCAGATCATGAGTGATAAGAGAAATGTCATCCTGTTCTCAGTGTTTGATGAGAATAGGAGTTGGTATCTGACAGAAAACATCCAGAGGTTCCTGCCTAATCCTGCAGGAGTGCAGCTGGAGGACCCAGAATTTCAGGCTTCAAACATCATGCATAGTATCAATGGCTATGTGTTTGATAGTCTGCAGCTCTCTGTCTGCCTGCATGAGGTGGCCTACTGGTATATCCTCAGCATTGGAGCTCAGACTGACTTCCTGAGTGTGTTCTTTTCAGGCTACACATTCAAGCATAAGATGGTCTATGAAGATACCCTGACACTCTTCCCCTTTTCTGGGGAGACTGTGTTTATGAGCATGGAAAACCCAGGCCTGTGGATTCTGGGGTGCCACAACAGTGACTTCAGGAATAGAGGGATGACTGCTCTGCTCAAAGTGTCCTCATGTGATAAGAATACTGGAGATTACTATGAGGACTCTTATGAAGATATCAGTGCATATCTGCTCTCCAAAAACAATGCCATTGAGCCCAGGTCATTTGCTCAGAACAGTAGACCACCTTCTGCAAGTGCACCAAAGCCTCCAGTGCTGAGGAGACACCAGAGGGACATCAGCCTGCCAACCTTCCAGCCTGAGGAAGATAAAATGGACTATGATGATATCTTCTCCACTGAGACCAAGGGGGAAGATTTTGACATCTATGGAGAGGATGAAAACCAGGACCCCAGGTCCTTCCAGAAGAGGACCAGACACTACTTTATTGCAGCTGTGGAGCAGCTGTGGGACTATGGCATGTCTGAATCACCTAGAGCTCTGAGGAACAGAGCACAGAATGGGGAGGTGCCCAGGTTCAAGAAAGTGGTGTTCAGAGAATTTGCAGATGGCTCTTTTACCCAGCCTAGCTACAGGGGGGAGCTCAACAAGCATCTGGGGCTGCTGGGACCCTATATCAGAGCAGAGGTGGAAGATAACATCATGGTGACATTCAAGAATCAGGCCTCAAGACCCTACAGTTTTTATAGTTCTCTGATCAGCTACCCAGATGATCAGGAGCAGGGGGCTGAACCAAGGCACAACTTTGTGCAGCCTAATGAGACAAGAACTTACTTTTGGAAGGTCCAGCATCACATGGCTCCCACAGAGGATGAGTTTGACTGCAAGGCCTGGGCATATTTTTCTGATGTGGACCTGGAGAAGGATGTGCATAGTGGCCTCATTGGGCCACTGCTCATCTGCAGGGCAAACACACTGAATGCTGCACATGGCAGGCAGGTCACTGTGCAGGAGTTTGCCCTGTTCTTTACAATCTTTGATGAAACTAAGTCCTGGTACTTCACAGAGAATGTGGAAAGGAATTGCAGAGCCCCCTGCCATCTCCAGATGGAGGACCCAACTCTGAAGGAAAACTACAGGTTCCATGCTATCAATGGATATGTCATGGATACACTGCCAGGCCTGGTGATGGCACAGAACCAGAGGATCAGGTGGTATCTGCTCAGCATGGGGTCCAATGAGAATATCCATTCTATCCACTTCTCAGGACATGTCTTTTCAGTGAGGAAGAAAGAGGAATATAAAATGGCTGTGTACAATCTGTATCCAGGGGTCTTTGAGACAGTGGAAATGCTGCCTAGCAAAGTGGGGATCTGGAGAATTGAGTGCCTCATTGGAGAACACCTGCAGGCAGGGATGTCCACCACATTTCTGGTGTACTCAAAGAAATGCCAGACTCCCCTGGGGATGGCAAGTGGACATATCAGGGACTTCCAGATCACTGCATCAGGACAGTATGGACAGTGGGCACCAAAGCTGGCTAGGCTCCACTATAGTGGCTCTATCAATGCTTGGAGTACCAAAGAGCCTTTCTCTTGGATCAAGGTGGATCTGCTGGCCCCCATGATCATCCATGGAATCAAAACACAGGGAGCTAGACAGAAGTTCAGCTCCCTGTACATCAGTCAGTTTATCATCATGTATTCTCTGGATGGGAAGAAATGGCAGACCTACAGGGGCAATAGCACTGGGACACTGATGGTCTTCTTTGGAAATGTGGATTCAAGTGGCATCAAGCACAACATCTTCAATCCTCCCATCATTGCCAGGTACATCAGACTGCATCCCACACACTATTCAATCAGGAGTACTCTCAGAATGGAGCTGATGGGGTGTGACCTCAACAGCTGCTCCATGCCACTGGGAATGGAATCCAAGGCAATCTCAGATGCCCAGATCACTGCTTCTAGCTACTTCACCAATATGTTTGCAACATGGTCACCCAGTAAAGCAAGGCTGCACCTCCAGGGAAGGTCCAATGCTTGGAGACCCCAGGTGAACAATCCAAAGGAGTGGCTGCAGGTGGACTTTCAGAAAACCATGAAGGTCACAGGGGTGACTACCCAGGGAGTGAAAAGTCTGCTCACCTCTATGTATGTCAAGGAGTTCCTGATCTCCTCAAGTCAGGATGGCCACCAGTGGACACTGTTCTTTCAGAATGGCAAGGTCAAAGTGTTCCAGGGGAATCAGGACAGCTTTACACCAGTGGTGAACAGCCTGGACCCCCCTCTGCTCACTAGATATCTGAGAATCCATCCACAGAGCTGGGTGCACCAGATTGCACTCAGAATGGAGGTCCTGGGCTGTGAAGCCCAGGACCTGTATTGA
CpG缺失的骨髓密码子优化的HSQ序列为SEQ ID NO:126:
ATGCAGATTGAGCTCAGCACCTGCTTCTTTCTGTGCCTGCTCAGGTTCTGCTTTTCAGCCACAAGGAGATACTATCTGGGAGCTGTGGAACTGTCATGGGATTACATGCAGAGTGACCTGGGAGAGCTCCCTGTGGATGCTAGGTTCCCCCCAAGGGTCCCAAAGTCTTTCCCTTTTAATACCAGTGTGGTCTATAAGAAAACACTCTTTGTGGAATTTACTGATCACCTGTTCAACATTGCAAAGCCAAGGCCTCCCTGGATGGGACTGCTGGGACCTACCATCCAGGCTGAGGTGTATGACACTGTGGTCATCACACTGAAAAACATGGCATCTCACCCTGTCAGCCTGCATGCAGTGGGAGTCAGCTACTGGAAGGCTTCAGAAGGGGCAGAGTATGATGATCAGACAAGCCAGAGAGAAAAAGAGGATGATAAGGTGTTCCCAGGAGGGAGCCATACTTATGTGTGGCAGGTCCTGAAGGAGAATGGCCCAATGGCCAGTGACCCACTGTGCCTCACCTACTCATATCTGAGTCATGTGGACCTGGTCAAGGATCTCAACTCAGGCCTGATTGGGGCACTGCTGGTGTGCAGGGAAGGCTCACTGGCCAAGGAGAAAACCCAGACACTGCATAAGTTCATCCTGCTCTTTGCTGTGTTTGATGAAGGGAAATCTTGGCACAGTGAGACCAAGAACAGTCTGATGCAGGACAGGGATGCTGCTTCTGCCAGAGCTTGGCCCAAGATGCACACAGTGAATGGATATGTCAATAGGTCCCTGCCAGGACTCATTGGCTGCCACAGAAAGTCAGTGTATTGGCATGTCATTGGAATGGGCACCACACCAGAAGTGCACAGCATCTTCCTGGAGGGGCATACCTTTCTGGTCAGGAACCACAGGCAGGCCAGCCTGGAGATCAGCCCAATCACCTTCCTGACAGCCCAGACTCTGCTCATGGATCTGGGGCAGTTCCTGCTCTTTTGCCACATCAGCTCCCACCAGCATGATGGAATGGAGGCATATGTGAAAGTGGACTCCTGCCCAGAGGAACCACAGCTGAGGATGAAGAACAATGAGGAAGCTGAAGACTATGATGATGACCTGACAGACTCAGAGATGGATGTGGTCAGGTTTGATGATGATAACAGCCCCTCCTTTATCCAGATCAGAAGTGTGGCCAAGAAACACCCAAAGACATGGGTCCATTACATTGCAGCTGAGGAAGAGGACTGGGATTATGCACCTCTGGTGCTGGCCCCAGATGATAGATCCTACAAATCACAGTATCTGAACAATGGACCCCAGAGGATTGGCAGAAAGTACAAGAAAGTGAGGTTCATGGCCTATACTGATGAAACATTTAAGACTAGAGAAGCTATCCAGCATGAGTCAGGCATCCTGGGACCACTGCTCTATGGAGAAGTGGGGGACACCCTGCTCATCATCTTCAAGAACCAGGCTTCCAGGCCATACAATATCTATCCTCATGGCATCACAGATGTGAGACCACTCTACTCAAGGAGACTGCCTAAGGGAGTCAAACACCTCAAGGACTTCCCTATCCTGCCAGGGGAAATCTTTAAGTATAAATGGACTGTGACAGTGGAGGATGGGCCCACTAAGAGTGACCCAAGGTGCCTGACCAGATACTATTCAAGTTTTGTGAATATGGAAAGGGATCTGGCATCAGGACTGATTGGACCTCTGCTCATCTGCTACAAAGAGAGTGTGGATCAGAGGGGCAACCAGATCATGTCAGACAAGAGGAATGTGATCCTGTTCAGTGTCTTTGATGAAAACAGGTCTTGGTATCTGACAGAGAACATCCAGAGATTCCTGCCAAATCCTGCAGGGGTGCAGCTGGAAGATCCAGAGTTTCAGGCCTCAAACATCATGCATAGTATCAATGGATATGTGTTTGACAGTCTGCAGCTCTCTGTGTGCCTGCATGAAGTGGCCTACTGGTATATCCTGTCCATTGGAGCTCAGACAGATTTCCTGAGTGTGTTCTTTTCAGGCTACACTTTTAAGCATAAAATGGTCTATGAGGACACACTGACTCTCTTCCCTTTTAGTGGGGAAACAGTGTTTATGAGCATGGAGAATCCAGGGCTGTGGATTCTGGGATGCCACAACAGTGATTTCAGGAATAGAGGCATGACTGCTCTGCTCAAAGTGTCTAGCTGTGACAAGAACACAGGGGACTACTATGAAGATTCTTATGAGGACATCAGTGCTTATCTGCTCTCCAAAAACAATGCAATTGAACCCAGATCATTCAGTCAGAATCCACCTGTGCTGAAGAGGCACCAGAGAGAGATCACTAGGACTACCCTGCAGTCAGATCAGGAAGAGATTGACTATGATGATACCATCTCAGTGGAAATGAAGAAAGAGGACTTTGATATCTATGATGAAGATGAGAACCAGAGTCCAAGGTCTTTCCAGAAGAAAACCAGACATTACTTTATTGCTGCAGTGGAGAGGCTGTGGGATTATGGAATGTCCTCAAGTCCACATGTGCTGAGGAATAGGGCACAGTCTGGCAGTGTCCCTCAGTTCAAGAAAGTGGTCTTCCAGGAGTTTACAGATGGCAGCTTCACTCAGCCTCTGTACAGGGGAGAACTCAATGAGCACCTGGGGCTGCTGGGACCCTATATCAGAGCTGAAGTGGAGGATAACATCATGGTCACCTTCAGGAATCAGGCTTCAAGACCCTACAGTTTTTATTCTAGCCTGATCAGCTATGAAGAGGACCAGAGGCAGGGAGCTGAACCTAGGAAAAACTTTGTGAAGCCAAATGAGACCAAAACATACTTTTGGAAGGTCCAGCACCACATGGCACCAACCAAAGATGAGTTTGATTGCAAGGCATGGGCCTATTTTTCAGATGTGGATCTGGAGAAGGATGTCCACAGTGGCCTCATTGGGCCTCTGCTGGTGTGCCATACTAACACCCTGAATCCAGCTCATGGCAGGCAGGTGACAGTCCAGGAGTTTGCACTGTTCTTTACCATCTTTGATGAGACAAAGTCCTGGTACTTCACTGAAAACATGGAGAGGAATTGCAGAGCTCCTTGCAACATCCAGATGGAAGACCCCACCTTCAAGGAGAACTACAGATTTCATGCAATCAATGGGTATATCATGGATACACTGCCAGGACTGGTGATGGCCCAGGACCAGAGGATCAGATGGTATCTGCTCAGCATGGGGTCCAATGAGAATATCCACTCTATCCATTTCAGTGGACATGTGTTTACAGTCAGAAAGAAAGAAGAGTATAAAATGGCCCTGTACAACCTCTATCCAGGAGTGTTTGAAACAGTGGAGATGCTGCCAAGCAAGGCTGGGATCTGGAGGGTGGAATGCCTCATTGGGGAGCACCTGCATGCAGGAATGTCAACCCTGTTTCTGGTCTACAGTAATAAGTGCCAGACACCTCTGGGAATGGCAAGTGGACATATCAGGGATTTCCAGATCACTGCTAGTGGACAGTATGGACAGTGGGCACCAAAGCTGGCTAGACTCCACTATTCAGGCTCAATCAATGCTTGGTCCACCAAAGAGCCATTCTCATGGATCAAGGTGGACCTGCTGGCTCCTATGATCATCCATGGCATCAAAACACAGGGGGCAAGGCAGAAGTTCTCCTCACTGTACATCTCTCAGTTTATCATCATGTATAGCCTGGATGGCAAGAAATGGCAGACCTACAGGGGCAATAGCACAGGGACTCTGATGGTGTTCTTTGGCAATGTGGACAGCAGTGGGATCAAGCACAACATCTTCAATCCCCCAATCATTGCAAGGTACATCAGACTGCACCCCACCCATTATTCAATCAGGAGTACACTCAGGATGGAACTGATGGGGTGTGATCTCAACAGTTGCTCTATGCCACTGGGAATGGAGTCCAAGGCAATCTCAGATGCCCAGATCACTGCTAGCTCCTACTTCACTAATATGTTTGCTACCTGGAGCCCCTCCAAAGCAAGGCTGCACCTCCAGGGAAGGAGCAATGCATGGAGGCCTCAGGTGAACAATCCCAAGGAATGGCTGCAGGTGGATTTCCAGAAAACTATGAAGGTGACTGGAGTCACAACTCAGGGAGTGAAAAGTCTGCTCACTTCTATGTATGTCAAGGAGTTCCTGATCTCAAGTTCTCAGGATGGCCACCAGTGGACCCTGTTCTTTCAGAATGGAAAGGTGAAAGTCTTCCAGGGCAATCAGGATTCCTTTACACCAGTGGTCAACTCACTGGACCCTCCCCTGCTCACTAGATATCTGAGAATCCACCCTCAGAGCTGGGTGCATCAGATTGCTCTCAGAATGGAAGTCCTGGGCTGTGAGGCACAGGACCTGTATTGA。
在用相应的fVIII表达质粒瞬时转染的HepG2细胞中评估未优化的、肝优化的和骨髓优化的fVIII序列的体外表达(图5)。与未优化的或骨髓优化形式的ET3或HSQ相比,组织特异性优化导致表达肝优化的fVIII的HepG2(肝)细胞中的FVIII活性增加。这些结果显示肝优化特别有益于在肝细胞衍生的细胞中的表达并显示骨髓优化的FVIII的表达不利于在HepG2细胞中的表达。
进一步地,当使用非人细胞(幼仓鼠肾细胞)重复这些实验时,发现人特异性序列优化导致在非人细胞中的表达下降(图6)。
因子IX
与上文讨论的凝血fVIII的密码子优化类似,也可采用相同的用于凝血因子fVIII的密码子优化表来对fIX序列进行密码子优化以在肝细胞中表达。选择用于优化的fIX序列包括具有形成血栓前的“Padua”突变R338L(“fIX Padua,”参见Paolo等,“X-LinkedThrombophilia with a Mutant Factor IX”N Engl J Med;361:1671-1675,2009)的fIX和具有血栓形成的“Malmo”变体148T(“fIX Malmo”,参见Graham等,“The MalmoPolymorphism of Coagulation Factor IX,An Immunologic Polymorphism Due toDimorphism of Residue 148That Is in Linkage Disequilibrium with Two Other FIXPolymorphisms,”Am.J.Hum.Genet.42:573-580,1988)。
根据图2中显示的肝和骨髓表来设计和优化肝和骨髓优化的fIX cDNA。通过同义密码子取代去除它们的序列中的“cg”的所有实例。cDNA都并入Padua和Malmo取代中。
具有Padua/Malmo突变且无CpG的肝密码子优化的fIX(版本1)(SEQ ID NO:124):
ATGCAGAGGGTCAATATGATCATGGCTGAATCTCCTGGGCTGATCACCATTTGCCTGCTGGGATACCTGCTGTCTGCTGAGTGTACAGTGTTCCTGGACCATGAGAATGCCAATAAGATCCTGAACAGGCCCAAAAGATACAATTCTGGAAAGCTGGAGGAATTTGTGCAGGGCAACCTGGAGAGGGAATGCATGGAGGAAAAGTGTAGCTTTGAGGAAGCTAGGGAGGTGTTTGAAAACACAGAGAGGACCACAGAATTCTGGAAGCAGTATGTGGATGGAGATCAGTGTGAGTCCAACCCCTGTCTGAATGGAGGGTCTTGCAAAGATGATATCAACTCCTATGAGTGCTGGTGTCCTTTTGGATTTGAAGGCAAAAATTGTGAGCTGGATGTGACCTGTAACATCAAGAATGGCAGGTGTGAGCAGTTCTGTAAAAACTCTGCTGATAATAAGGTGGTCTGCAGCTGTACAGAAGGCTATAGGCTGGCTGAGAACCAGAAGAGCTGTGAACCAGCTGTGCCCTTCCCTTGTGGGAGGGTGTCTGTCAGCCAGACCTCTAAGCTGACCAGAGCTGAGACTGTGTTCCCAGATGTGGATTATGTCAACTCCACAGAGGCTGAAACCATCCTGGACAACATCACCCAGTCTACCCAGTCCTTCAATGACTTTACCAGAGTGGTGGGAGGAGAGGATGCCAAACCAGGCCAGTTCCCCTGGCAGGTGGTCCTGAATGGGAAGGTGGATGCTTTTTGTGGGGGATCCATTGTGAATGAGAAATGGATTGTCACAGCTGCTCACTGTGTGGAGACAGGGGTCAAGATCACTGTGGTGGCTGGAGAGCACAACATTGAGGAAACAGAACATACTGAGCAGAAGAGGAATGTGATCAGAATCATCCCTCACCATAACTACAATGCTGCTATCAACAAATATAATCATGACATTGCCCTGCTGGAACTGGATGAGCCTCTGGTGCTGAACAGCTATGTCACCCCAATCTGCATTGCTGACAAAGAGTATACCAATATCTTCCTGAAGTTTGGATCTGGATATGTGTCTGGATGGGGAAGGGTCTTCCACAAGGGCAGGTCTGCCCTGGTGCTGCAGTATCTGAGGGTGCCTCTGGTGGACAGAGCTACCTGCCTGCTGTCTACCAAGTTCACCATCTACAACAATATGTTCTGTGCTGGATTTCATGAGGGAGGCAGGGACTCCTGTCAGGGGGATTCTGGAGGCCCACATGTGACAGAGGTGGAAGGCACCAGCTTCCTGACTGGCATCATCTCTTGGGGGGAGGAATGTGCTATGAAGGGGAAATATGGAATCTACACCAAAGTGAGCAGGTATGTGAACTGGATCAAAGAGAAGACCAAACTGACCTGA。
编码A582修饰的无CpG的肝密码子优化的fIX(SEQ ID NO:8):
ATGCAGAGGGTGAACATGATCATGGCTGAGTCTCCTGGACTGATCACCATCTGCCTGCTGGGCTATCTGCTGTCTGCTGAGTGTACAGTGTTCCTGGACCATGAAAATGCTAATAAAATCCTGAACAGGCCAAAGAGGTACAATTCTGGGAAACTGGAGGAATTTGTGCAGGGAAACCTGGAGAGGGAATGCATGGAGGAAAAGTGTAGCTTTGAGGAAGCCAGGGAGGTGTTTGAAAATACAGAGAGGACCACAGAGTTCTGGAAACAGTATGTGGATGGGGATCAGTGTGAGTCCAACCCCTGTCTGAATGGAGGGTCTTGCAAGGATGATATCAACTCCTATGAGTGCTGGTGTCCTTTTGGATTTGAAGGCAAGAATTGTGAGCTGGATGTGACCTGTAACATCAAAAATGGGAGGTGTGAGCAGTTCTGTAAGAACTCTGCTGATAATAAAGTGGTCTGCAGCTGTACAGAAGGCTACAGGCTGGCTGAGAACCAGAAGAGCTGTGAACCAGCTGTGCCCTTCCCTTGTGGGAGGGTGTCTGTCAGCCAGACCAGCAAGCTGACCAGAGCTGAGGCTGTGTTTCCTGATGTGGATTATGTCAACTCTACAGAGGCTGAAACCATCCTGGACAACATCACCCAGTCTACCCAGTCCTTCAATGACTTTACCAGGGTGGTGGGAGGGGAGGATGCTAAGCCAGGACAGTTCCCCTGGCAGGTGGTCCTGAATGGCAAAGTGGATGCTTTTTGTGGGGGCTCCATTGTGAATGAGAAGTGGATTGTCACAGCTGCTCACTGTGTGGAAACTGGGGTCAAGATCACAGTGGTGGCTGGAGAGCACAACATTGAGGAAACTGAACATACAGAGCAGAAAAGGAATGTGATCAGAATCATCCCCCACCATAACTACAATGCTGCTATCAACAAGTATAATCATGACATTGCCCTGCTGGAACTGGATGAGCCTCTGGTGCTGAACAGCTATGTCACCCCAATCTGCATTGCTGACAAGGAGTATACCAATATCTTCCTGAAATTTGGGTCTGGATATGTGTCTGGGTGGGGAAGGGTCTTCCACAAGGGAAGGTCTGCTCTGGTGCTGCAGTATCTGAGGGTGCCCCTGGTGGACAGAGCTACCTGCCTGAGGAGCACCAAGTTCACCATCTACAACAATATGTTCTGTGCTGGATTTCATGAGGGAGGGAGGGACTCCTGTCAGGGAGATTCTGGAGGCCCTCATGTGACAGAGGTGGAAGGCACCAGCTTCCTGACTGGCATCATCTCTTGGGGGGAGGAATGTGCTATGAAGGGGAAATATGGAATCTATACCAAGGTGTCCAGATATGTCAACTGGATCAAGGAGAAAACCAAGCTGACCTGA。
包含Padua和A582修饰的无CpG的肝密码子优化的fIX(SEQ ID NO:9):
ATGCAGAGGGTGAACATGATCATGGCTGAGTCTCCTGGACTGATCACCATCTGCCTGCTGGGCTATCTGCTGTCTGCTGAGTGTACAGTGTTCCTGGACCATGAAAATGCTAATAAAATCCTGAACAGGCCAAAGAGGTACAATTCTGGGAAACTGGAGGAATTTGTGCAGGGAAACCTGGAGAGGGAATGCATGGAGGAAAAGTGTAGCTTTGAGGAAGCCAGGGAGGTGTTTGAAAATACAGAGAGGACCACAGAGTTCTGGAAACAGTATGTGGATGGGGATCAGTGTGAGTCCAACCCCTGTCTGAATGGAGGGTCTTGCAAGGATGATATCAACTCCTATGAGTGCTGGTGTCCTTTTGGATTTGAAGGCAAGAATTGTGAGCTGGATGTGACCTGTAACATCAAAAATGGGAGGTGTGAGCAGTTCTGTAAGAACTCTGCTGATAATAAAGTGGTCTGCAGCTGTACAGAAGGCTACAGGCTGGCTGAGAACCAGAAGAGCTGTGAACCAGCTGTGCCCTTCCCTTGTGGGAGGGTGTCTGTCAGCCAGACCAGCAAGCTGACCAGAGCTGAGGCTGTGTTTCCTGATGTGGATTATGTCAACTCTACAGAGGCTGAAACCATCCTGGACAACATCACCCAGTCTACCCAGTCCTTCAATGACTTTACCAGGGTGGTGGGAGGGGAGGATGCTAAGCCAGGACAGTTCCCCTGGCAGGTGGTCCTGAATGGCAAAGTGGATGCTTTTTGTGGGGGCTCCATTGTGAATGAGAAGTGGATTGTCACAGCTGCTCACTGTGTGGAAACTGGGGTCAAGATCACAGTGGTGGCTGGAGAGCACAACATTGAGGAAACTGAACATACAGAGCAGAAAAGGAATGTGATCAGAATCATCCCCCACCATAACTACAATGCTGCTATCAACAAGTATAATCATGACATTGCCCTGCTGGAACTGGATGAGCCTCTGGTGCTGAACAGCTATGTCACCCCAATCTGCATTGCTGACAAGGAGTATACCAATATCTTCCTGAAATTTGGGTCTGGATATGTGTCTGGGTGGGGAAGGGTCTTCCACAAGGGAAGGTCTGCTCTGGTGCTGCAGTATCTGAGGGTGCCCCTGGTGGACAGAGCTACCTGCCTGCTGAGCACCAAGTTCACCATCTACAACAATATGTTCTGTGCTGGATTTCATGAGGGAGGGAGGGACTCCTGTCAGGGAGATTCTGGAGGCCCTCATGTGACAGAGGTGGAAGGCACCAGCTTCCTGACTGGCATCATCTCTTGGGGGGAGGAATGTGCTATGAAGGGGAAATATGGAATCTATACCAAGGTGTCCAGATATGTCAACTGGATCAAGGAGAAAACCAAGCTGACCTGA。
此外,构建了其他两个变体。第一个为肝优化的Padua 148T变体,除了是采用替换版本的密码子优化算法合成的之外,所述肝优化的Padua 148T变体与上述肝优化的序列十分类似。
具有Padua/Malmo突变且无CpG的肝密码子优化的fIX(版本2)(SEQ ID NO:10):
ATGCAGAGGGTGAACATGATCATGGCTGAGTCTCCTGGACTGATCACCATCTGCCTGCTGGGCTATCTGCTGTCTGCTGAGTGTACAGTGTTCCTGGACCATGAAAATGCTAATAAAATCCTGAACAGGCCAAAGAGGTACAATTCTGGGAAACTGGAGGAATTTGTGCAGGGAAACCTGGAGAGGGAATGCATGGAGGAAAAGTGTAGCTTTGAGGAAGCCAGGGAGGTGTTTGAAAATACAGAGAGGACCACAGAGTTCTGGAAACAGTATGTGGATGGGGATCAGTGTGAGTCCAACCCCTGTCTGAATGGAGGGTCTTGCAAGGATGATATCAACTCCTATGAGTGCTGGTGTCCTTTTGGATTTGAAGGCAAGAATTGTGAGCTGGATGTGACCTGTAACATCAAAAATGGGAGGTGTGAGCAGTTCTGTAAGAACTCTGCTGATAATAAAGTGGTCTGCAGCTGTACAGAAGGCTACAGGCTGGCTGAGAACCAGAAGAGCTGTGAACCAGCTGTGCCCTTCCCTTGTGGGAGGGTGTCTGTCAGCCAGACCAGCAAGCTGACCAGAGCTGAGACAGTGTTTCCTGATGTGGATTATGTCAACTCTACAGAGGCTGAAACCATCCTGGACAACATCACCCAGTCTACCCAGTCCTTCAATGACTTTACCAGGGTGGTGGGAGGGGAGGATGCTAAGCCAGGACAGTTCCCCTGGCAGGTGGTCCTGAATGGCAAAGTGGATGCTTTTTGTGGGGGCTCCATTGTGAATGAGAAGTGGATTGTCACAGCTGCTCACTGTGTGGAAACTGGGGTCAAGATCACAGTGGTGGCTGGAGAGCACAACATTGAGGAAACTGAACATACAGAGCAGAAAAGGAATGTGATCAGAATCATCCCCCACCATAACTACAATGCTGCTATCAACAAGTATAATCATGACATTGCCCTGCTGGAACTGGATGAGCCTCTGGTGCTGAACAGCTATGTCACCCCAATCTGCATTGCTGACAAGGAGTATACCAATATCTTCCTGAAATTTGGGTCTGGATATGTGTCTGGGTGGGGAAGGGTCTTCCACAAGGGAAGGTCTGCTCTGGTGCTGCAGTATCTGAGGGTGCCCCTGGTGGACAGAGCTACCTGCCTGCTGAGCACCAAGTTCACCATCTACAACAATATGTTCTGTGCTGGATTTCATGAGGGAGGGAGGGACTCCTGTCAGGGAGATTCTGGAGGCCCTCATGTGACAGAGGTGGAAGGCACCAGCTTCCTGACTGGCATCATCTCTTGGGGGGAGGAATGTGCTATGAAGGGGAAATATGGAATCTATACCAAGGTGTCCAGATATGTCAACTGGATCAAGGAGAAAACCAAGCTGACCTGA。
此外,根据标准人密码子优化表(参见图2B)来优化具有Padua/Malmo突变且无CpG的fIX序列。
具有Padua/Malmo突变且无CpG的人密码子优化的fIX(SEQ ID NO:127):
ATGCAGAGGGTGAATATGATTATGGCTGAGTCCCCTGGGCTGATTACCATTTGCCTGCTGGGATACCTGCTGTCTGCTGAGTGTACAGTGTTCCTGGACCATGAGAATGCAAATAAGATCCTGAACAGGCCCAAAAGATATAATAGTGGAAAGCTGGAGGAATTTGTGCAGGGCAACCTGGAGAGAGAATGCATGGAGGAAAAGTGTAGCTTTGAGGAAGCCAGGGAGGTGTTTGAAAATACAGAGAGAACCACAGAATTCTGGAAGCAGTATGTGGATGGAGATCAGTGTGAGAGCAACCCCTGTCTGAATGGAGGGAGTTGCAAAGATGATATCAACTCATATGAATGCTGGTGTCCTTTTGGATTTGAAGGCAAAAATTGTGAGCTGGATGTGACCTGTAACATTAAGAATGGGAGGTGTGAGCAGTTTTGTAAAAACTCTGCTGATAATAAGGTGGTCTGCAGTTGTACAGAAGGGTATAGACTGGCTGAGAACCAGAAGTCCTGTGAACCAGCTGTGCCCTTCCCTTGTGGAAGGGTGTCTGTCTCCCAGACTTCAAAACTGACCAGAGCTGAGACTGTGTTTCCTGATGTGGATTATGTCAACAGCACAGAGGCTGAAACTATCCTGGACAACATTACTCAGTCTACCCAGAGTTTCAATGACTTTACCAGAGTGGTGGGAGGAGAGGATGCTAAACCAGGCCAGTTCCCCTGGCAGGTGGTCCTGAATGGGAAGGTGGATGCATTTTGTGGGGGATCTATTGTGAATGAGAAATGGATTGTCACAGCTGCTCACTGTGTGGAAACTGGGGTCAAGATCACAGTGGTGGCTGGAGAGCACAACATTGAGGAAACAGAACATACTGAGCAGAAGAGGAATGTGATCAGAATCATTCCTCACCATAACTACAATGCAGCCATCAACAAATATAATCATGACATTGCCCTGCTGGAACTGGATGAGCCTCTGGTGCTGAACAGCTATGTCACACCAATCTGCATTGCTGACAAGGAGTACACTAACATCTTCCTGAAGTTTGGGTCAGGATATGTGTCTGGATGGGGAAGAGTCTTCCACAAGGGCAGGTCTGCACTGGTGCTGCAGTATCTGAGAGTGCCTCTGGTGGATAGGGCCACTTGTCTGCTGTCTACCAAGTTCACCATCTACAACAATATGTTCTGTGCTGGATTTCATGAGGGAGGGAGAGACTCCTGTCAGGGAGATTCTGGAGGCCCACATGTGACAGAGGTGGAAGGCACCAGCTTCCTGACAGGCATCATTTCCTGGGGGGAGGAATGTGCAATGAAGGGGAAATATGGAATCTACACCAAAGTGAGCAGGTATGTGAACTGGATCAAGGAAAAGACCAAACTGACATGA。
在用相应的fVIII表达质粒瞬时转染的HepG2细胞中评估肝优化的fIX序列(SEQID NO:10)和人优化的fIX序列(SEQ ID NO:127)的体外表达(图7)。与人优化的fIX相比,组织特异性优化导致表达肝优化的fIX的HepG2(肝)细胞中的fIX活性增加。这些结果显示肝优化特别有益于在肝细胞衍生的细胞中的表达。
实施例2
启动子开发
该实施例描述了用于肝组织和细胞中的蛋白质的表达的优化的启动子序列的迭代发展。
启动子是从头合成的并克隆到驱动凝血fVIII的表达的表达质粒。转染后48小时通过一步法凝血测定测量FVIII活性。使用杂合肝启动子(HLP)作为参比。HLP启动子代表迄今为止描述的最短的但功效最大的肝靶向启动子之一。HLP启动子及其用途在以下文献中有描述:McIntosh等,“Therapeutic levels of FVIII following a single peripheralvein administration of rAAV vector encoding a novel human fVIII variant,”Blood,25;121(17):3335-44,2013。HLP序列提供为SEQ ID NO:128:
TGTTTGCTGCTTGCAATGTTTGCCCATTTTAGGGTGGACACAGGACGCTGTGGTTTCTGAGCCAGGGGGCGACTCAGATCCCAGCCAGTGGACTTAGCCCCTGTTTGCTCCTCCGATAACTGGGGTGACCTTGGTTAATATTCACCAGCAGCCTCCCCCGTTGCCCCTCTGGATCCACTGCTTAAATACGGACGAGGACAGGGCCCTGTCTCCTCAGCTTCAGGCACCACCACTGACCTGGGACAGTGAATC
初始启动子设计(第一代启动子)
为构件合成的肝靶向启动子,选择两个最小的肝靶向启动子,它们是为进一步修饰所设计的平台。这两个启动子指定为“ABP-SynO”(SEQ ID NO:131)”和“ABP-HP1-God”。这些启动子是前文描述的调控元件的新型融合物。“ABP”为转录因子结合位点的群集区,“HP1”为特异性转录因子结合位点,“God”为在接近转录起始位点的方向发挥作用的增强子样区,“SynO”为含有HP1转录结合位点和TATA框的最小启动子。对于所有构建体,如果上下文没有提供,则向启动子区的3’紧接着添加或完成TATA序列(TATAAA)。
设计的初始启动子基于“ABP”元件,其在例如以下文献中描述:Rouet等“A potentenhancer made of clustered liver-specific elements in the transcriptioncontrol sequences of human alpha 1-microglobulin/bikunin gene,”J Biol Chem.,267(29):20765-73,1992。ABP包含以下所示的核苷酸序列:
ABP元件(SEQ ID NO:113):
GTTAATTTTTAAAAAGCAGTCAAAAGTCCAAGTGGCCCTTGCGAGCATTTACTCTCTCTGTTTGCTCTGGTTAATAATCTCAGGAGCACAAACA
如图8所示,ABP包含以下TF结合位点:HNF-1-1(SEQ ID NO:4的第16-23位核苷酸)、HNF-4(SEQ ID NO:4的第26-36位核苷酸)、HNF-3a(SEQ ID NO:4的第39-45位核苷酸)、HNF1-2(SEQ ID NO:4的第48-62位核苷酸)和HNF-3-2TF(SEQ ID NO:4的第65-71位核苷酸)。
若干公开的启动子包含HP1TF结合位点(GTTAATAATTTTC,SEQ ID NO:4的第75-87位核苷酸)。HP1元件在例如以下文献中描述:Schorpp等“Hepatocyte-specific promoterelement HP1of the Xenopus albumin gene interacts with transcriptional factorsof mammalian hepatocytes,”J Mol Biol.,202(2):307-20,1988。HP1TF结合位点包含在SynO元件(包含在若干公开的启动子)中,所述SynO元件还包含TATA框。SynO元件的序列提供为:
SynO元件
GAGGTTAATAATTTTCCAGATCTCTCTGAGCAATAGTATAAAA(SEQ ID NO:114)
SynO元件在例如以下文献中描述:Ryffel等“Liver cell specific genetranscription in vitro:the promoter elements HP1and TATA box are necessaryand sufficient to generate a liver-specific promoter”Nucleic Acids Res.,17(3):939–953,1989。
若干公开的启动子包括“God”,所述“God”包含以下所示的序列:
God元件
AGTCATATGTTTGCTCACTGAAGGTTACTAGTTAACAGGCATCCCTTAAACAGGA(SEQ ID NO:115)
God元件在例如以下文件中描述:Godbout等“Multiple regulatory elements inthe intergenic region between the alpha-fetoprotein and albumin genes,”MolCell Biol.,6(2):477-87,1986。
将ABP、SynO和God元件组合以形成两个新型启动子“ABP-SynO”和“ABP-HP1-God”,如下所示(参见图8):
ABP-SynO启动子(SEQ ID NO:131)
GTTAATTTTTAAAAAGCAGTCAAAAGTCCAAGTGGCCCTTGCGAGCATTTACTCTCTCTGTTTGCTCTGGTTAATAATCTCAGGAGCACAAACAGAGGTTAATAATTTTCCAGATCTCTCTGAGCAATAGTATAAAA
ABP-Hp1-God启动子(SEQ ID NO:6)
GTTAATTTTTAAAAAGCAGTCAAAAGTCCAAGTGGCCCTTGCGAGCATTTACTCTCTCTGTTTGCTCTGGTTAATAATCTCAGGAGCACAAACAGAGGTTAATAATTTTCAGTCATATGTTTGCTCACTGAAGGTTACTAGTTAACAGGCATCCCTTAAACAGGATATAAAA
在用由ABP-SynO或ABP-HP1-God启动子驱动的FVIII表达质粒瞬时转染的HepG2细胞中评估FVIII的体外表达(图9A)。另外地,通过表达由ABP-SynO或ABP-HP1-God启动子驱动的FVIII的流体动力学递送的裸质粒来测定小鼠中的体内fVIII活性(图9B)。根据结果,显示ABP-SynO和ABP-HP1-God启动子都能驱动fVIII体外和体内表达。然而,这些初始设计并不能像HLP启动子一样强有力地驱动fVIII体外表达,并且显示体内表达相对于HLP急速下降。
初始优化(第二代启动子)
为增加ABP-SynO和ABP-HP1-God启动子的转录强度,采用多种优化策略。这包括改变转录因子结合位点以反映共有结合序列,去除转录因子结合位点之间的中间空间,增加额外的转录因子结合位点,增加转录起始位点基序,并包含SV40内含子。
生成含有共有TF结合位点的ABP变体,如下:
ABP-exact(共有转录因子结合位点)(SEQ ID NO:116)
GTTAATCATTAACTTAAAAAGCAGTCAAAAGTCCAAAGGTCAAAGGTCAGAGCATTTACTCTCTCCAATGTTGACTCTCGTTAATGATTAAGGAGCAATTGTTGACTT
如图8所示,ABP-exact包含以下共有TF结合位点:共有HNF-1-1、共有HNF-4、共有HNF-3a、共有HNF1-2和共有HNF-3-2。生成包含相同的共有TF结合位点但整个序列较短的称为短-ABP-exact的浓缩版本的Apb-exact,其序列如下所示:
短-ABP-exact(SEQ ID NO:117)
GTTAATCATTAACTTAGGTCAAAGGTCAGACAATGTTGACTCTCGTTAATGATTAACCGGAATTGTTGACTT
某些公开的启动子中还包括以下特征:
转录起始位点(TSS),其含有23,其含有富含GC的间隔基并紧接着位于启动子的TATA框之后,为了与在间隔物之后紧接着的转录起始基序的最佳间隔(参见图10)。测定的TSS序列包括如GCCAGCAGCAGCCTGACCACATCTCATCCTC(SEQ ID NO:4的第116-146位核苷酸)。
HNF1a转录因子结合位点。HNF1a是肝靶向转录因子:GTTAATCATTAA(SEQ ID NO:4的第1-12位核苷酸)。
Sp1转录因子结合位点。Sp1是肝靶向转录因子:TGGGCGGAGT(SEQ ID NO:121的第1-10位核苷酸)。
SV40内含子序列,如下所示:
CTCTAAGGTAAATATAAAATTTTTAAGTGTATAATGTGTTAAACTACTGATTCTAATTGTTTGTGTATTTTAGATTCCAACCTATGGAACTGA(SEQ ID NO:112的第163-225位核苷酸)。
将这些元件组合以形成若干新型启动子,如下(参见图11):
ABP-exact-SynO(SEQ ID NO:118)
GTTAATCATTAACTTAAAAAGCAGTCAAAAGTCCAAAGGTCAAAGGTCAGAGCATTTACTCTCTCCAATGTTGACTCTCGTTAATGATTAAGGAGCAATTGTTGACTTGAGGTTAATAATTTTCCAGATCTCTCTGAGCAATAGTATAAAA
短ABP-exact-SynO(SEQ ID NO:119)
GTTAATCATTAACTTAGGTCAAAGGTCAGACAATGTTGACTCTCGTTAATGATTAACCGGAATTGTTGACTTGAGGTTAATAATTTTCCAGATCTCTCTGAGCAATAGTATAAAA
ABP-HP1-God-TSS(SEQ ID NO:7)
GTTAATTTTTAAAAAGCAGTCAAAAGTCCAAGTGGCCCTTGCGAGCATTTACTCTCTCTGTTTGCTCTGGTTAATAATCTCAGGAGCACAAACAGAGGTTAATAATTTTCAGTCATATGTTTGCTCACTGAAGGTTACTAGTTAACAGGCATCCCTTAAACAGGATATAAAAGGCCAGCAGCAGCCTGACCACATCTCATCCTC
HNF1a-ABP-SynO(SEQ ID NO:120)
GTTAATCATTAAGTCGTTAATTTTTAAAAAGCAGTCAAAAGTCCAAGTGGCCCTTGCGAGCATTTACTCTCTCTGTTTGCTCTGGTTAATAATCTCAGGAGCACAAACAGAGGTTAATAATTTTCCAGATCTCTCTGAGCAATAGTATAAAA
Sp1-ABP-SynO(SEQ ID NO:121)
TGGGCGGAGTGTCGTTAATTTTTAAAAAGCAGTCAAAAGTCCAAGTGGCCCTTGCGAGCATTTACTCTCTCTGTTTGCTCTGGTTAATAATCTCAGGAGCACAAACAGAGGTTAATAATTTTCCAGATCTCTCTGAGCAATAGTATAAAA
HNF1-短ABPExact-SynO-TSS-Int(SEQ ID NO:112)
GTTAATCATTAAGTCGTTAATCATTAACTTAGGTCAAAGGTCAGACAATGTTGACTCTCGTTAATGATTAACCGGAATTGTTGACTTGAGGTTAATAATTTTCCAGATCTCTCTGAGCAATAGTATAAAAGGCCAGCAGCAGCCTGACCACATCTCATCCTCCTCTAAGGTAAATATAAAATTTTTAAGTGTATAATGTGTTAAACTACTGATTCTAATTGTTTGTGTATTTTAGATTCCAACCTATGGAACTGA
合成启动子是从头合成的并克隆入驱动凝血fVIII的表达的表达质粒中。转染后48小时通过一步法凝血测定测量FVIII活性。在该实验和其他实验中使用作为比测仪的杂合肝启动子(HLP)。
在用由各自启动子驱动的FVIII表达质粒进行瞬时转染的HepG2细胞中测定FVIII的体外表达(图12A)。此外,通过由各个启动子驱动的表达FVIII的水动力学递送的裸质粒来测定小鼠中的体内fVIII活性(图12B)。根据这些数据,显示合成的新型的转录起始位点基序的添加基本上提高了表达。进一步地,将转录因子结合位点添加至它们原生基因组环境的外侧对表达有意想不到的且不可预知的影响。当直接添加至ABP增强子元件附近时,HNF1和Sp1转录因子结合位点完全消除了表达。当HNF1转录因子结合位点直接添加至短ABPExact增强子附近时,表达具有鲁棒性。该发现说明转录因子的复杂时空相互作用,无论是在原生或还是非原生的基因组环境中,都很难建模或预测。此外,将转录因子结合位点更改为共有结合序列消除了基因表达。然而,HNF1转录因子结合位点、转录起始位点和SV40内含子的添加足以从HNF1补充的短ABPExact-SynO启动子设计中拯救表达。如图12B所示,在整个实验过程中,ABP-Hp1-God-TSS和HNF1-短ABPExact-Syno-TSS-Int都保留了比HLP启动子更高的表达,这显示了转录起始位点、HNF1转录因子结合位点的添加、ABP序列对共有序列的调节和转录因子结合位点之间干扰DNA的去除和/或SN40内含子的添加能提高体内表达的耐久性和强度。
进一步优化(第三代启动子)
当测试的ABP-Hp1-God-TSS启动子设计远超过HLP启动子的强度,其尺寸(204个碱基对)与AAV载体的某些完整包装不相容,如含有全长fVIII转基因的那些。通过选择上述测试和描述的最有前途的元件以及为新型元件短ABP来靶向启动子尺寸的进一步减少,所述新型元件为ABP增强子,其中保留了原生基因组转录因子结合位点序列但它们之间的中间序列已被删除。
短ABP(SEQ ID NO:4的第16-71位核苷酸)
GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACA
如图13所示,短ABP含有以下TF结合位点:HNF-1-1(SEQ ID NO:4的第16-23位核苷酸)、HNF-4(SEQ ID NO:4的第26-36位核苷酸)、HNF-3a(SEQ ID NO:4的第39-45位核苷酸)、HNF1-2(SEQ ID NO:4的第48-62位核苷酸)和HNF-3-2TF(SEQ ID NO:4的第65-71位核苷酸)。
如图13所示,HNF1TF结合位点、SynO元件(含有HP1TF结合位点和TATA框)和转录起始位点与短ABP结合以形成HNF1-短ABP-SynO-TSS(指定为肝组合束,或HCB),如下:
HNF1-短ABP-SynO-TSS(也称为肝组合束,或HCB)(SEQ ID NO:4)GTTAATCATTAAGTCGTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACAGAGGTTAATAATTTTCCAGATCTCTCTGAGCAATAGTATAAAAGGCCAGCAGCAGCCTGACCACATCTCATCCTC
如图13所示,HNF1TF结合位点、God元件、TATA框和转录起始位点与短ABP连接以形成短ABP-HP1-God-TSS,如下:
短ABP-HP1-God-TSS(SEQ ID NO:5)
GTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACATACATTTTCAGTCATATGTTTGCTCACTGAAGGTTACTAGTTAACAGGCATCCCTTAAACAGGATATAAAAGGCCAGCAGCAGCCTGACCACATCTCATCCTC
合成启动子是从头合成的并克隆入驱动凝血fVIII的表达的表达质粒中。转染后48小时通过一步法凝血测定测量FVIII活性。在用由各个启动子驱动的FVIII表达质粒瞬时转染的HepG2细胞中测定的FVIII的体外表达在图14A中显示。此外,通过表达由各个启动子驱动的FVIII的水动力学递送的裸质粒来测定小鼠中的体内fVIII活性(图14)。根据这些数据,显示与HLP相比,HNF1-短ABP-SynO-TSS启动子(HCB)在体内和体外都促进了fVIII的表达的增加,尽管HFN1-短ABP-SynO-TSS比HLP小42%,但保持持久的表达比HLP体内表达高4-14倍。
补充优化(***启动子)
近期,通过将来自若干物种的序列组合入计算机构建的新型增强子来构建强有力的肝靶向的增强子,指定肝细胞特异性计算调控模块(HSCRM8或“HS”)(参见,例如,air等,“Computationally designed liver-specific transcriptional modules andhyperactive fIX improve hepatic gene therapy,”Blood,23(20):3195–3199,2014)。以下提供了HS增强子的序列与相应转录因子结合位点:
HS(HSCRM8非人增强子序列)(SEQ ID NO:101)
GGGGAGGCTGCTGGTGAATATTAACCAAGGTCACCCCAGTTATCGGAGGAGCAAACAGGGACTAAGTCCAC
HS应答元件包含以下TF结合位点:
MYOD GGCTGCTGGTGAATATT,SEQ ID NO:101的第5-22位核苷酸
CEBP GCTGCTGGTGAA,SEQ ID NO:101的第7-18位核苷酸
Nhf1 GCTGGTGAATATTAACCA,SEQ ID NO:101的第10-27位核苷酸
Lef1/TCF1 TTAACCAAGGT,SEQ ID NO:101的第21-31位核苷酸
CEBP CGGAGGAGCAAA,SEQ ID NO:101的第44-55位核苷酸
Forkhead GGAGCAAACAGGG,SEQ ID NO:101的第48-60位核苷酸
Lef1/TCF1 AGGGACTAAG,SEQ ID NO:101的第57-66位核苷酸
检查人基因组以确定与HS元件的对应的那些人序列,并修饰HS元件以仅包含人序列以产生称为“HSh”的全人增强子序列。以下提供了HSh增强子序列和相应的转录因子结合位点(也参见图15):
HSh(人基因组序列)(SEQ ID NO:111)
GGGGAGGCTGCTGGTGAATATTAACCAAGGTCACCCCAGTTATCGGAGGAGCAAACAGGGGCTAAGTCCAC
HSh应答元件包含以下TF结合位点:
MYOD GGCTGCTGGTGAATATT,SEQ ID NO:101的第5-22位核苷酸
CEBP GCTGCTGGTGAA,SEQ ID NO:101的第7-18位核苷酸
Nhf1 GCTGGTGAATATTAACCA,SEQ ID NO:101的第10-27位核苷酸
Lef1/TCF1 TTAACCAAGGT,SEQ ID NO:101的第21-31位核苷酸
CEBP CGGAGGAGCAAA,SEQ ID NO:101的第44-55位核苷酸
Forkhead GGAGCAAACAGGG,SEQ ID NO:101的第48-60位核苷酸
Lef1/TCF1 AGGGGCTAAG,SEQ ID NO:111的第57-66位核苷酸
还可利用部分HSh增强子,如下:
5’HSh(HSCRM8h的5’部分)(SEQ ID NO:111的第6-32位核苷酸)
GGCTGCTGGTGAATATTAACCAAGGTC
5’应答元件包含以下TF结合位点:
MYOD GGCTGCTGGTGAATATT,SEQ ID NO:101的第5-22位核苷酸
CEBP GCTGCTGGTGAA,SEQ ID NO:101的第7-18位核苷酸
Nhf1 GCTGGTGAATATTAACCA,SEQ ID NO:101的第10-27位核苷酸
Lef1/TCF1 TTAACCAAGGT,SEQ ID NO:101的第21-31位核苷酸
3’HSh(HSCRM8h的3’部分)(SEQ ID NO:111的第44-68位核苷酸)
CGGAGGAGCAAACAGGGGCTAAGTC
3’HSh应答元件包括以下TF结合位点:
CEBP CGGAGGAGCAAA,SEQ ID NO:101的第44-55位核苷酸
Forkhead GGAGCAAACAGGG,SEQ ID NO:101的第48-60位核苷酸
Lef1/TCF1 AGGGGCTAAG,SEQ ID NO:111的第57-66位核苷酸
sHS(短HS,已经去除转录因子结合位点的5’与3’簇之间的中间间隔)(SEQ ID NO:106的第1-54位核苷酸)。
GGCTGCTGGTGAATATTAACCAAGGTCATCGGAGGAGCAAACAGGGACTAAGTC
sHS应答元件包含以下TF结合位点:
MYOD GGCTGCTGGTGAATATT,SEQ ID NO:101的第5-22位核苷酸
CEBP GCTGCTGGTGAA,SEQ ID NO:101的第7-18位核苷酸
Nhf1 GCTGGTGAATATTAACCA,SEQ ID NO:101的第10-27位核苷酸
Lef1/TCF1 TTAACCAAGGT,SEQ ID NO:101的第21-31位核苷酸
CEBP CGGAGGAGCAAA,SEQ ID NO:101的第44-55位核苷酸
Forkhead GGAGCAAACAGGG,SEQ ID NO:101的第48-60位核苷酸
Lef1/TCF1 AGGGACTAAG,SEQ ID NO:111的第57-66位核苷酸
此外,通过进一步删除核苷酸并重排TF结合位点来构建修饰形式的短ABP启动子,称为“超短ABP”。以下提供了超短ABP应答元件的序列和相应转录因子结合位点。
超短ABP(进一步缩短的基于ABP的元件)(SEQ ID NO:122)
CCCTTGCTGGTTAATAATCTCAGTTAATTTGTTTGCACAAACA
超短ABP应答元件包含以下TF结合位点:
HNF4 CCCTTGC,SEQ ID NO:122的第1-7位核苷酸
HNF1b TGGTTAATAATCTCA,SEQ ID NO:122的第8-22位核苷酸
HNF1 GTTAATT,SEQ ID NO:122的第23-29位核苷酸
HNF3 TGTTTGC,SEQ ID NO:122的第30-36位核苷酸
HNF3b ACAAACA,SEQ ID NO:122的第37-43位核苷酸
如图16所示,将上述元件组合以形成若干新型启动子,如下(参见图11):
Agro(SEQ ID NO:107)
GGCTGCTGGTGAATATTAACCAAGGTCCCCTTGCTGGTTAATAATCTCAGTTAATTTGTTTGCACAAACACGGAGGAGCAAACAGGGGAGGTTAATAATTTTCTATAAAAGGCCAGCAGCAGCCTGACCACATCTCATCCTC
Agro序列包含5’HS(SEQ ID NO:107的第1-27位核苷酸)、超短ABP(SEQ ID NO:107的第28-70位核苷酸)、3’HSh(SEQ ID NO:107的第71-87位核苷酸)、SynO(SEQ ID NO:107的第88-110位核苷酸)和TSS(SEQ IDNO:107的第111-142位核苷酸)。
HSh-HCB(SEQ ID NO:102)
GGGGAGGCTGCTGGTGAATATTAACCAAGGTCACCCCAGTTATCGGAGGAGCAAACAGGGGCTAAGTCCACTAGGTTAATCATTAAGTCGTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACAGAGGTTAATAATTTTCCAGATCTCTCTGAGCAATAGTATAAAAGGCCAGCAGCAGCCTGACCACATCTCATCCTC
5’HSh-HCB(SEQ ID NO:104)
GGCTGCTGGTGAATATTAACCAAGGTCGTTAATCATTAAGTCGTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACAGAGGTTAATAATTTTCCAGATCTCTCTGAGCAATAGTATAAAAGGCCAGCAGCAGCCTGACCACATCTCATCCTC
3’HSh-HCB(SEQ ID NO:103)
CGGAGGAGCAAACAGGGGCTAAGTCGTTAATCATTAAGTCGTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACAGAGGTTAATAATTTTCCAGATCTCTCTGAGCAATAGTATAAAAGGCCAGCAGCAGCCTGACCACATCTCATCCTC
HSh-SynO-TSS(SEQ ID NO:105)
GGGGAGGCTGCTGGTGAATATTAACCAAGGTCACCCCAGTTATCGGAGGAGCAAACAGGGGCTAAGTCCACGAGGTTAATAATTTTCCAGATCTCTCTGAGCAATAGTATAAAAGGCCAGCAGCAGCCTGACCACATCTCATCCTC
HS-SynO-TSS(SEQ ID NO:108)
GGGGAGGCTGCTGGTGAATATTAACCAAGGTCACCCCAGTTATCGGAGGAGCAAACAGGGACTAAGTCCACGAGGTTAATAATTTTCCAGATCTCTCTGAGCAATAGTATAAAAGGCCAGCAGCAGCCTGACCACATCTCATCCTC
sHS-SynO-TSS(SEQ ID NO:106)
GGCTGCTGGTGAATATTAACCAAGGTCATCGGAGGAGCAAACAGGGACTAAGTCGAGGTTAATAATTTTCCAGATCTCTCTGAGCAATAGTATAAAAGGCCAGCAGCAGCCTGACCACATCTCATCCTC
合成启动子是从头合成的并克隆入驱动凝血fVIII的表达的表达质粒中。转染后48小时通过一步法凝血测定进行测量FVIII活性。在用通过各个启动子驱动的FVIII表达质粒瞬时转染的HepG2细胞中测定的FVIII体外表达在图17中显示。这些结果显示可通过添加补充的增强子序列来增加HCB启动子的体内强度。当将完整的人HSh增强子添加至HCB启动子的5’端时,获益最大。与完整的HSh模块相比,仅补充HSh的5’或3’部分略微减弱了提高的表达。此外,当从HCB设计中去除短ABP增强子并相反地用HSh或HS增强子替换时,fVIII表达从HSh-HCB启动子中看到的水平略微降低,所述HSh-HCB启动子含有短ABP增强子。然而,当将sHS-SynO质粒水动力学施用于小鼠时,没有观察到表达,这显示短ABP增强子模块可以是针对持久体内表达的更加合适的增强子。
实施例3
用于fVIII表达的重组AAV载体
本实施例示出编码fVIII变体的示例性AAV载体,所述例性AAV载体包含大小适于最佳基于AAV载体的蛋白质表达的基因组(即,5kb或更小的基因组)。
图4描述用于表达缺少B结构域的fVIII变体的基于AAV的载体。然而,图4显示的构建体是5.0kb以上,限制了AAV载体的最佳蛋白质表达。去除不重要病毒基因组DNA和克隆残余以及替换更短的启动子序列(如HCB启动子(SEQ ID NO:4,146bp))使得能够开发长度大约为4.9kb的高表达的fVIII-AAV基因组。
图18中描述了具有此基因组的示例性AAV载体。该图示出包含5‘和3’ITR、HCB(SEQID NO:4)启动子、编码缺少B结构域的变体fVIII蛋白质的核酸分子(如本文提供的ET3或HSQ CpG缺失的及密码子优化的序列中的任意一者),和合成的polyA序列的AAV载体。
如图18所示的AAV盒的示例性序列提供为SEQ ID NO:129,其具有以下结构:
(5’AAV2ITR)–RE–(HCB启动子)–Kozak–(HSQ编码区)–RE–(聚腺苷酰化信号)–RE–(3’AAV2ITR)
以下为SEQ ID NO:129的AAV盒的元件:
元件 起始(bp) 结束(bp)
5’AAV2ITR 1 141
AgeI(限制性位点) 142 147
HCB启动子 148 293
破坏的XhoI位点 294 299
Kozak共有序列 300 304
具有CpGs的肝优化的HSQ 305 4678
NotI(限制性位点) 4679 4686
兔β球蛋白polyA信号 4687 4735
MunI(限制位点) 4736 4741
3’AAV2ITR 4742 4882
可任选地从盒中去除限制位点以提供更短的重组AAV基因组。此外,必要时可替换转基因。去除限制位点元件会产生4885个碱基对(ET3)或4855个碱基对(HSQ)的载体。
SEQ ID NO:129:
CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTACCGGTGTTAATCATTAAGTCGTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACAGAGGTTAATAATTTTCCAGATCTCTCTGAGCAATAGTATAAAAGGCCAGCAGCAGCCTGACCACATCTCATCCTCGTCGAGCCACCATGCAGATCGAACTGTCTACCTGTTTCTTTCTGTGCCTGCTGCGGTTTTGTTTTTCCGCTACCAGAAGATACTACCTGGGAGCCGTCGAACTGAGCTGGGATTACATGCAGTCTGACCTGGGAGAGCTGCCCGTGGACGCTAGATTCCCACCTAGAGTCCCTAAGTCCTTCCCCTTCAACACCAGCGTGGTCTACAAGAAAACCCTGTTCGTGGAGTTTACCGACCACCTGTTCAACATCGCTAAGCCTAGACCACCATGGATGGGACTGCTGGGACCAACCATCCAGGCCGAGGTGTACGACACCGTGGTCATCACCCTGAAAAACATGGCTTCTCACCCCGTGTCCCTGCATGCTGTGGGCGTCTCCTACTGGAAGGCCAGCGAAGGGGCTGAGTATGACGATCAGACCAGCCAGCGGGAAAAAGAGGACGATAAGGTGTTCCCTGGCGGGTCCCATACCTACGTGTGGCAGGTCCTGAAGGAGAATGGACCAATGGCTTCCGACCCTCTGTGCCTGACCTACTCTTATCTGTCCCACGTGGACCTGGTCAAGGATCTGAACAGCGGCCTGATCGGGGCTCTGCTGGTGTGTCGCGAAGGGTCCCTGGCCAAGGAGAAAACCCAGACCCTGCATAAGTTCATCCTGCTGTTCGCCGTGTTTGACGAAGGAAAAAGCTGGCACTCTGAGACCAAGAACTCTCTGATGCAGGACAGGGATGCCGCTTCCGCCAGAGCTTGGCCCAAGATGCACACCGTGAACGGCTACGTCAATAGGAGCCTGCCTGGACTGATCGGCTGCCACAGAAAGTCCGTGTATTGGCATGTCATCGGAATGGGCACCACCCCTGAAGTGCACAGCATCTTCCTGGAGGGGCATACCTTTCTGGTCCGCAACCACCGGCAGGCTAGCCTGGAGATCTCTCCAATCACCTTCCTGACCGCCCAGACCCTGCTGATGGACCTGGGACAGTTCCTGCTGTTTTGCCACATCTCCAGCCACCAGCATGATGGCATGGAGGCTTACGTGAAAGTCGACTCCTGTCCCGAGGAACCTCAGCTGAGGATGAAGAACAATGAGGAAGCCGAAGACTATGACGATGACCTGACCGACAGCGAGATGGATGTGGTCCGCTTCGATGACGATAACTCTCCCTCCTTTATCCAGATCCGGTCCGTGGCCAAGAAACACCCTAAGACCTGGGTCCATTACATCGCCGCTGAGGAAGAGGACTGGGATTATGCTCCACTGGTGCTGGCCCCCGACGATAGATCCTACAAAAGCCAGTATCTGAACAATGGACCCCAGAGGATCGGCAGAAAGTACAAGAAAGTGAGGTTCATGGCTTATACCGATGAGACCTTTAAGACCAGAGAAGCCATCCAGCACGAGTCCGGGATCCTGGGACCTCTGCTGTACGGCGAAGTGGGGGACACCCTGCTGATCATCTTCAAGAACCAGGCCAGCAGGCCTTACAATATCTATCCACATGGCATCACCGATGTGAGACCTCTGTACTCCCGCCGGCTGCCAAAGGGCGTGAAACACCTGAAGGACTTCCCAATCCTGCCCGGGGAAATCTTTAAGTATAAATGGACCGTCACCGTCGAGGATGGGCCCACCAAGAGCGACCCTAGGTGCCTGACCAGATACTATTCTTCCTTCGTGAATATGGAGAGAGACCTGGCTTCCGGACTGATCGGACCCCTGCTGATCTGTTACAAAGAGAGCGTGGATCAGCGCGGCAACCAGATCATGTCTGACAAGCGGAATGTGATCCTGTTCAGCGTCTTTGACGAAAACCGCTCTTGGTACCTGACCGAGAACATCCAGCGGTTCCTGCCTAATCCAGCTGGAGTGCAGCTGGAAGATCCCGAGTTCCAGGCCTCTAACATCATGCATTCCATCAATGGCTACGTGTTCGACTCCCTGCAGCTGAGCGTGTGCCTGCACGAGGTCGCTTACTGGTATATCCTGAGCATCGGAGCCCAGACCGATTTCCTGTCTGTGTTCTTTTCCGGCTACACCTTTAAGCATAAAATGGTGTATGAGGACACCCTGACCCTGTTCCCATTTTCCGGCGAAACCGTGTTCATGAGCATGGAGAATCCCGGGCTGTGGATCCTGGGATGCCACAACTCCGATTTCAGGAATAGAGGGATGACCGCCCTGCTGAAAGTGAGCTCTTGTGACAAGAACACCGGAGACTACTATGAAGATAGCTACGAGGACATCTCTGCTTATCTGCTGTCCAAAAACAATGCCATCGAGCCCAGGAGCTTCTCTCAGAACCCTCCAGTGCTGAAGCGCCACCAGCGGGAGATCACCAGAACCACCCTGCAGAGCGATCAGGAAGAGATCGACTACGACGATACCATCTCCGTGGAAATGAAGAAAGAGGACTTCGATATCTATGACGAAGATGAGAACCAGTCTCCCAGGTCCTTCCAGAAGAAAACCAGACATTACTTTATCGCCGCTGTGGAGCGGCTGTGGGACTATGGCATGTCCAGCTCTCCTCACGTGCTGAGAAATAGAGCTCAGTCCGGAAGCGTCCCACAGTTCAAGAAAGTGGTCTTCCAGGAGTTTACCGACGGAAGCTTTACCCAGCCACTGTACCGCGGCGAACTGAACGAGCACCTGGGGCTGCTGGGACCCTATATCCGGGCTGAAGTGGAGGATAACATCATGGTCACCTTCAGGAATCAGGCCAGCAGACCCTACTCTTTTTATTCCAGCCTGATCTCCTACGAAGAGGACCAGAGACAGGGAGCTGAACCAAGAAAAAACTTCGTGAAGCCTAATGAGACCAAAACCTACTTTTGGAAGGTGCAGCACCATATGGCCCCTACCAAAGACGAGTTCGATTGCAAGGCCTGGGCTTATTTTAGCGACGTGGATCTGGAGAAGGACGTCCACTCCGGCCTGATCGGGCCACTGCTGGTGTGTCATACCAACACCCTGAATCCAGCTCACGGAAGGCAGGTGACCGTCCAGGAATTCGCCCTGTTCTTTACCATCTTTGATGAGACCAAGAGCTGGTACTTCACCGAAAACATGGAGAGGAATTGCAGAGCCCCATGTAACATCCAGATGGAAGACCCCACCTTCAAGGAGAACTACAGATTTCATGCTATCAATGGGTATATCATGGATACCCTGCCAGGACTGGTCATGGCTCAGGACCAGAGGATCAGATGGTACCTGCTGAGCATGGGGTCTAACGAGAATATCCACTCCATCCATTTCAGCGGACACGTGTTTACCGTCCGCAAGAAAGAAGAGTACAAGATGGCCCTGTACAACCTGTATCCCGGCGTGTTCGAAACCGTCGAGATGCTGCCTTCCAAGGCTGGGATCTGGCGGGTGGAATGCCTGATCGGGGAGCACCTGCATGCCGGAATGTCTACCCTGTTCCTGGTGTACTCCAATAAGTGTCAGACCCCCCTGGGGATGGCTAGCGGACATATCCGCGACTTCCAGATCACCGCTTCCGGACAGTACGGACAGTGGGCTCCTAAGCTGGCTAGACTGCACTATTCTGGCTCCATCAACGCTTGGTCTACCAAAGAGCCTTTCTCCTGGATCAAGGTGGACCTGCTGGCTCCAATGATCATCCATGGCATCAAAACCCAGGGGGCCAGGCAGAAGTTCTCTTCCCTGTACATCAGCCAGTTTATCATCATGTATTCTCTGGATGGGAAGAAATGGCAGACCTACAGAGGCAATTCCACCGGGACCCTGATGGTGTTCTTTGGCAACGTCGACAGCTCTGGGATCAAGCACAACATCTTCAATCCCCCTATCATCGCCCGCTACATCCGGCTGCACCCAACCCATTATTCCATCCGCAGCACCCTGCGGATGGAGCTGATGGGGTGCGATCTGAACAGCTGTTCTATGCCCCTGGGAATGGAGTCTAAGGCCATCTCCGACGCTCAGATCACCGCCTCCAGCTACTTCACCAATATGTTTGCTACCTGGTCCCCAAGCAAGGCTAGACTGCATCTGCAGGGAAGAAGCAACGCTTGGAGACCACAGGTGAACAATCCCAAGGAGTGGCTGCAGGTCGACTTCCAGAAAACCATGAAGGTGACCGGAGTCACCACCCAGGGCGTGAAAAGCCTGCTGACCTCTATGTACGTCAAGGAGTTCCTGATCTCTTCCAGCCAGGACGGGCACCAGTGGACCCTGTTCTTTCAGAACGGAAAGGTGAAAGTCTTCCAGGGCAATCAGGATTCCTTTACCCCTGTGGTCAACAGCCTGGACCCACCCCTGCTGACCAGGTACCTGAGAATCCACCCACAGTCCTGGGTGCATCAGATCGCTCTGAGGATGGAAGTCCTGGGCTGCGAGGCCCAGGACCTGTATTGAGCGGCCGCAATAAAATATCTTTATTTTCATTACATCTGTGTGTTGGTTTTTTGTGTGCAATTGAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGG
包含由HCB启动子驱动的fVIII转基因的另一示例性AAV载体提供为SEQ ID NO:130,其提供了在HCB启动子的控制下编码治疗转基因的AAV盒的原型设计。每个元件被一个或两个限制酶(RE)位点分隔,所述限制酶位点使得这些元件易于替换。在SEQ ID NO:130中,元件的顺序如下:
(5’AAV2ITR)–RE–(HCB启动子)–RE–(MVM内含子)–RE–Kozak–(ET3编码区)–RE–(聚腺苷酰化信号)–RE–(3’AAV2ITR)
AAV2-HCB-ET3-LCO-NCG-SpA
元件 起始(bp) 末端(bp)
5’AAV2ITR 1 141
AgeI(限制性位点) 142 147
HCB启动子 148 293
SalI+PacI(限制性位点) 294 307
MVM内含子 308 399
XhoI(限制性位点) 400 405
Kozak共有序列 406 410
无CpGs的肝优化的ET3 411 4814
NotI(限制性位点) 4815 4822
兔β球蛋白polyA信号 4823 4871
MunI(限制性位点) 4872 4877
3’AAV2ITR 4878 5018
可任选地从盒中去除内含子和限制位点以提供更短的重组AAV基因组。此外,必要时替换转基因。去除内含子和限制位点会产生4885个碱基对(ET3)或4855个碱基对(HSQ)的载体。
生成AAV2-HCB-ET3-LCO-NCG-SpA病毒颗粒并用于转导小鼠。在转导后的不同时间点测定血清中的fVIII活性(参见图19)。基本上如Brown 等(“Bioengineered FactorFVIII Enables Long-Term Correction of Murine Hemophilia A Following Liver-Directed Adeno-Associated Viral Vector Delivery”Molecular Therapy–Methods andClinical Development.1:14036,2014)描述的进行体内基因治疗测定。
SEQ ID NO:130:
CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTACCGGTGTTAATCATTAAGTCGTTAATTTTTGTGGCCCTTGCGATGTTTGCTCTGGTTAATAATCTCAGGACAAACAGAGGTTAATAATTTTCCAGATCTCTCTGAGCAATAGTATAAAAGGCCAGCAGCAGCCTGACCACATCTCATCCTCGTCGACTTAATTAAAAGAGGTAAGGGTTTAAGGGATGGTTGGTTGGTGGGGTATTAATGTTTAATTACCTGGAGCACCTGCCTGAAATCACTTTTTTTCAGGTTGGCTCGAGCCACCATGCAGCTGGAACTGTCTACCTGTGTGTTTCTGTGTCTGCTGCCTCTGGGGTTTTCTGCTATCAGGAGATACTATCTGGGAGCTGTGGAGCTGTCCTGGGACTACAGGCAGTCTGAGCTGCTGAGAGAACTGCATGTGGATACCAGATTCCCAGCTACAGCTCCAGGAGCTCTGCCTCTGGGCCCATCTGTGCTGTACAAGAAAACAGTCTTTGTGGAGTTTACAGACCAGCTGTTCTCTGTGGCCAGGCCAAGACCACCTTGGATGGGACTGCTGGGACCAACCATCCAGGCTGAGGTGTATGATACAGTGGTGGTGACCCTGAAAAACATGGCCTCCCATCCTGTGAGCCTGCATGCTGTGGGGGTGTCCTTCTGGAAGTCCTCTGAGGGAGCTGAGTATGAAGACCATACCTCCCAGAGGGAGAAAGAAGATGATAAGGTGCTGCCTGGCAAAAGCCAGACCTATGTCTGGCAGGTGCTGAAGGAGAATGGACCAACTGCTTCTGACCCACCATGCCTGACCTACTCTTATCTGTCCCATGTGGATCTGGTGAAGGACCTGAATTCTGGACTGATTGGAGCTCTGCTGGTGTGTAGAGAGGGAAGCCTGACCAGAGAAAGAACCCAGAACCTGCATGAGTTTGTCCTGCTGTTTGCTGTGTTTGATGAAGGGAAGAGCTGGCACTCTGCCAGGAATGACTCCTGGACCAGAGCTATGGATCCAGCTCCTGCTAGAGCTCAGCCTGCTATGCACACAGTCAATGGCTATGTGAATAGGTCTCTGCCAGGACTGATTGGCTGCCATAAGAAATCTGTCTATTGGCATGTGATTGGAATGGGCACCAGCCCTGAGGTGCATTCTATCTTCCTGGAAGGCCACACCTTTCTGGTCAGGCACCATAGACAGGCCTCTCTGGAGATCTCCCCTCTGACCTTCCTGACAGCTCAGACCTTTCTGATGGACCTGGGGCAGTTCCTGCTGTTTTGCCATATCTCTTCCCACCATCATGGAGGAATGGAGGCTCATGTCAGGGTGGAATCCTGTGCTGAGGAACCACAGCTGAGAAGAAAGGCTGATGAGGAAGAGGACTATGATGATAACCTGTATGACTCTGATATGGATGTGGTGAGGCTGGATGGGGATGATGTCAGCCCTTTCATCCAGATCAGGTCTGTGGCCAAGAAACATCCAAAGACCTGGGTCCACTACATTGCTGCTGAAGAGGAAGATTGGGACTATGCCCCCCTGGTGCTGGCTCCTGATGATAGATCCTACAAAAGCCAGTATCTGAACAATGGGCCCCAGAGGATTGGAAGGAAGTACAAGAAAGTGAGGTTCATGGCCTATACAGATGAGACCTTTAAGACCAGAGAGGCTATCCAGCATGAATCTGGGATCCTGGGACCTCTGCTGTATGGAGAAGTGGGGGATACCCTGCTGATCATCTTCAAGAACCAGGCCTCCAGGCCATACAATATCTATCCCCATGGCATCACAGATGTGAGACCACTGTACAGCAGGAGACTGCCCAAGGGGGTCAAACACCTGAAGGATTTCCCCATCCTGCCTGGAGAGATCTTTAAGTATAAATGGACAGTCACAGTGGAAGATGGGCCTACCAAGTCTGATCCAAGGTGCCTGACCAGATACTATAGCTCTTTTGTGAACATGGAGAGAGACCTGGCTTCTGGACTGATTGGACCCCTGCTGATCTGTTACAAAGAGTCTGTGGACCAGAGGGGCAACCAGATCATGTCTGATAAGAGAAATGTCATCCTGTTCTCTGTGTTTGATGAGAACAGGAGCTGGTACCTGACAGAGAACATCCAGAGGTTCCTGCCAAATCCAGCTGGAGTGCAGCTGGAGGACCCAGAATTTCAGGCTTCCAACATCATGCATAGCATCAATGGCTATGTGTTTGATAGCCTGCAGCTGTCTGTCTGCCTGCATGAGGTGGCCTACTGGTATATCCTGTCCATTGGAGCTCAGACAGACTTCCTGTCTGTGTTCTTTAGTGGGTACACCTTTAAGCATAAAATGGTGTATGAGGATACCCTGACCCTGTTCCCCTTTTCTGGGGAGACAGTGTTCATGTCCATGGAAAACCCTGGCCTGTGGATCCTGGGGTGCCACAACTCTGACTTCAGGAATAGAGGAATGACAGCCCTGCTGAAAGTGTCCAGCTGTGATAAGAATACAGGGGATTACTATGAGGACTCTTATGAAGATATCTCTGCTTATCTGCTGAGCAAGAACAATGCCATTGAGCCCAGGTCTTTTGCTCAGAACTCCAGACCTCCATCTGCTTCTGCTCCTAAGCCACCTGTGCTGAGAAGACATCAGAGGGACATCTCCCTGCCTACCTTCCAGCCAGAGGAAGATAAAATGGACTATGATGATATCTTCAGCACAGAGACCAAGGGGGAAGATTTTGACATCTATGGAGAGGATGAAAACCAGGATCCAAGATCCTTCCAGAAGAGAACCAGACACTACTTTATTGCTGCTGTGGAGCAGCTGTGGGACTATGGGATGTCTGAAAGCCCAAGGGCCCTGAGGAACAGAGCTCAGAATGGAGAGGTGCCCAGATTCAAGAAAGTGGTGTTCAGAGAGTTTGCTGATGGCAGCTTTACCCAGCCATCTTACAGGGGGGAGCTGAACAAGCATCTGGGGCTGCTGGGACCCTATATCAGAGCTGAGGTGGAAGATAACATCATGGTGACCTTCAAGAATCAGGCTTCTAGGCCCTACTCCTTTTATTCTTCCCTGATCTCCTACCCTGATGATCAGGAGCAGGGAGCTGAACCTAGGCACAACTTTGTGCAGCCAAATGAGACCAGAACCTACTTTTGGAAGGTGCAGCATCACATGGCTCCCACAGAGGATGAATTTGACTGCAAAGCTTGGGCCTATTTTTCTGATGTGGACCTGGAGAAGGATGTGCATTCTGGCCTGATTGGGCCTCTGCTGATCTGTAGGGCCAACACCCTGAATGCTGCTCATGGAAGACAGGTCACAGTGCAGGAGTTTGCTCTGTTCTTTACCATCTTTGATGAAACCAAGAGCTGGTACTTCACAGAGAATGTGGAAAGGAATTGCAGAGCCCCCTGTCATCTGCAGATGGAGGACCCTACCCTGAAGGAAAACTACAGGTTCCATGCCATCAATGGATATGTCATGGATACCCTGCCTGGCCTGGTCATGGCTCAGAACCAGAGGATCAGATGGTACCTGCTGTCTATGGGATCCAATGAGAATATCCATAGCATCCACTTCTCTGGCCATGTCTTTTCTGTGAGGAAGAAAGAGGAATACAAAATGGCTGTGTACAATCTGTATCCTGGGGTCTTTGAGACAGTGGAAATGCTGCCAAGCAAAGTGGGAATCTGGAGAATTGAGTGCCTGATTGGGGAACACCTGCAGGCTGGGATGAGCACCACCTTCCTGGTGTACTCTAAGAAATGTCAGACCCCACTGGGGATGGCCTCTGGACATATCAGGGACTTCCAGATCACAGCTTCTGGACAGTATGGACAGTGGGCTCCAAAGCTGGCTAGACTGCACTATTCTGGCTCCATCAATGCCTGGTCTACCAAAGAGCCATTCTCCTGGATCAAGGTGGACCTGCTGGCCCCCATGATCATCCATGGAATCAAAACCCAGGGAGCTAGGCAGAAGTTCAGCTCTCTGTACATCTCCCAGTTTATCATCATGTATAGCCTGGATGGGAAGAAATGGCAGACCTACAGAGGCAATTCCACTGGGACCCTGATGGTCTTCTTTGGAAATGTGGATTCCTCTGGCATCAAGCACAACATCTTCAATCCACCCATCATTGCCAGGTACATCAGGCTGCATCCTACCCACTATAGCATCAGGTCTACCCTGAGAATGGAGCTGATGGGATGTGACCTGAACAGCTGTTCTATGCCACTGGGCATGGAGTCCAAGGCTATCTCTGATGCCCAGATCACAGCTTCTTCCTACTTCACCAATATGTTTGCTACCTGGTCCCCAAGCAAGGCTAGACTGCACCTGCAGGGAAGATCCAATGCTTGGAGACCCCAGGTGAACAATCCTAAGGAGTGGCTGCAGGTGGACTTCCAGAAAACCATGAAGGTCACAGGGGTGACCACCCAGGGAGTGAAATCTCTGCTGACCTCCATGTATGTCAAGGAGTTCCTGATCAGCTCTTCCCAGGATGGCCACCAGTGGACCCTGTTCTTTCAGAATGGCAAGGTCAAAGTGTTCCAGGGGAATCAGGACTCTTTTACCCCAGTGGTGAACTCCCTGGATCCTCCACTGCTGACCAGGTACCTGAGAATCCATCCTCAGAGCTGGGTGCACCAGATTGCTCTGAGAATGGAGGTCCTGGGATGTGAAGCTCAGGACCTGTATTGAGCGGCCGCAATAAAATATCTTTATTTTCATTACATCTGTGTGTTGGTTTTTTGTGTGCAATTGAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGG。
实施例4
使用基于AAV的基因疗法治疗人血友病A
本实施例描述了用于编码fVIII的AAV载体在治疗血友病A中的临床使用的示例性方法。
选择诊断患有血友病A的病人进行治疗。将治疗有效量的在本文所公开的HCB启动子的控制下编码ET3或HSQ fVIII变体如AAV-ET3或AAV-HSQ的重组AAV施用于病人。重组AAV可静脉施用。由医师选择适当的治疗剂量。在某些情况下,治疗有效剂量的范围为1*1011至1*1014病毒颗粒(vp)/kg。在大多数情况下,给病人施用单剂。可随时间监控受试对象的健康以确定治疗的有效性。
显而易见的是,在不脱离所公开的实施方案的精神的前体下可改变或修改所述的方法或组合物的准确细节。我们要求保护落入下列权利要求的范围和精神内的所有这种修改和变化。
序列表
<110> 埃默里大学
亚特兰大儿童健康护理股份有限公司
C·B·德林
T·H·斯潘塞
H·C·布朗
<120> 用于肝脏中蛋白质表达的重组启动子和载体及其用途
<130> 6975-96747-04
<150> US 62/202,133
<151> 2015-08-06
<150> US 62/212,634
<151> 2015-09-01
<150> US 62/148,696
<151> 2015-04-16
<160> 131
<170> PatentIn version 3.5
<210> 1
<211> 2351
<212> PRT
<213> 人类
<400> 1
Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe
1 5 10 15
Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser
20 25 30
Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg
35 40 45
Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val
50 55 60
Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile
65 70 75 80
Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln
85 90 95
Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser
100 105 110
His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser
115 120 125
Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp
130 135 140
Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu
145 150 155 160
Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser
165 170 175
Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile
180 185 190
Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr
195 200 205
Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly
210 215 220
Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp
225 230 235 240
Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr
245 250 255
Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val
260 265 270
Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile
275 280 285
Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser
290 295 300
Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met
305 310 315 320
Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His
325 330 335
Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro
340 345 350
Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp
355 360 365
Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser
370 375 380
Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr
385 390 395 400
Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro
405 410 415
Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn
420 425 430
Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met
435 440 445
Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu
450 455 460
Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu
465 470 475 480
Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro
485 490 495
His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys
500 505 510
Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe
515 520 525
Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp
530 535 540
Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg
545 550 555 560
Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu
565 570 575
Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val
580 585 590
Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu
595 600 605
Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp
610 615 620
Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val
625 630 635 640
Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp
645 650 655
Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe
660 665 670
Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr
675 680 685
Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro
690 695 700
Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly
705 710 715 720
Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp
725 730 735
Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys
740 745 750
Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro
755 760 765
Ser Thr Arg Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp
770 775 780
Ile Glu Lys Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys
785 790 795 800
Ile Gln Asn Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser
805 810 815
Pro Thr Pro His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr
820 825 830
Glu Thr Phe Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn
835 840 845
Ser Leu Ser Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly
850 855 860
Asp Met Val Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu
865 870 875 880
Lys Leu Gly Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys
885 890 895
Val Ser Ser Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn
900 905 910
Leu Ala Ala Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met
915 920 925
Pro Val His Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys
930 935 940
Ser Ser Pro Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu
945 950 955 960
Asn Asn Asp Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu
965 970 975
Ser Ser Trp Gly Lys Asn Val Ser Ser Thr Glu Ser Gly Arg Leu Phe
980 985 990
Lys Gly Lys Arg Ala His Gly Pro Ala Leu Leu Thr Lys Asp Asn Ala
995 1000 1005
Leu Phe Lys Val Ser Ile Ser Leu Leu Lys Thr Asn Lys Thr Ser
1010 1015 1020
Asn Asn Ser Ala Thr Asn Arg Lys Thr His Ile Asp Gly Pro Ser
1025 1030 1035
Leu Leu Ile Glu Asn Ser Pro Ser Val Trp Gln Asn Ile Leu Glu
1040 1045 1050
Ser Asp Thr Glu Phe Lys Lys Val Thr Pro Leu Ile His Asp Arg
1055 1060 1065
Met Leu Met Asp Lys Asn Ala Thr Ala Leu Arg Leu Asn His Met
1070 1075 1080
Ser Asn Lys Thr Thr Ser Ser Lys Asn Met Glu Met Val Gln Gln
1085 1090 1095
Lys Lys Glu Gly Pro Ile Pro Pro Asp Ala Gln Asn Pro Asp Met
1100 1105 1110
Ser Phe Phe Lys Met Leu Phe Leu Pro Glu Ser Ala Arg Trp Ile
1115 1120 1125
Gln Arg Thr His Gly Lys Asn Ser Leu Asn Ser Gly Gln Gly Pro
1130 1135 1140
Ser Pro Lys Gln Leu Val Ser Leu Gly Pro Glu Lys Ser Val Glu
1145 1150 1155
Gly Gln Asn Phe Leu Ser Glu Lys Asn Lys Val Val Val Gly Lys
1160 1165 1170
Gly Glu Phe Thr Lys Asp Val Gly Leu Lys Glu Met Val Phe Pro
1175 1180 1185
Ser Ser Arg Asn Leu Phe Leu Thr Asn Leu Asp Asn Leu His Glu
1190 1195 1200
Asn Asn Thr His Asn Gln Glu Lys Lys Ile Gln Glu Glu Ile Glu
1205 1210 1215
Lys Lys Glu Thr Leu Ile Gln Glu Asn Val Val Leu Pro Gln Ile
1220 1225 1230
His Thr Val Thr Gly Thr Lys Asn Phe Met Lys Asn Leu Phe Leu
1235 1240 1245
Leu Ser Thr Arg Gln Asn Val Glu Gly Ser Tyr Asp Gly Ala Tyr
1250 1255 1260
Ala Pro Val Leu Gln Asp Phe Arg Ser Leu Asn Asp Ser Thr Asn
1265 1270 1275
Arg Thr Lys Lys His Thr Ala His Phe Ser Lys Lys Gly Glu Glu
1280 1285 1290
Glu Asn Leu Glu Gly Leu Gly Asn Gln Thr Lys Gln Ile Val Glu
1295 1300 1305
Lys Tyr Ala Cys Thr Thr Arg Ile Ser Pro Asn Thr Ser Gln Gln
1310 1315 1320
Asn Phe Val Thr Gln Arg Ser Lys Arg Ala Leu Lys Gln Phe Arg
1325 1330 1335
Leu Pro Leu Glu Glu Thr Glu Leu Glu Lys Arg Ile Ile Val Asp
1340 1345 1350
Asp Thr Ser Thr Gln Trp Ser Lys Asn Met Lys His Leu Thr Pro
1355 1360 1365
Ser Thr Leu Thr Gln Ile Asp Tyr Asn Glu Lys Glu Lys Gly Ala
1370 1375 1380
Ile Thr Gln Ser Pro Leu Ser Asp Cys Leu Thr Arg Ser His Ser
1385 1390 1395
Ile Pro Gln Ala Asn Arg Ser Pro Leu Pro Ile Ala Lys Val Ser
1400 1405 1410
Ser Phe Pro Ser Ile Arg Pro Ile Tyr Leu Thr Arg Val Leu Phe
1415 1420 1425
Gln Asp Asn Ser Ser His Leu Pro Ala Ala Ser Tyr Arg Lys Lys
1430 1435 1440
Asp Ser Gly Val Gln Glu Ser Ser His Phe Leu Gln Gly Ala Lys
1445 1450 1455
Lys Asn Asn Leu Ser Leu Ala Ile Leu Thr Leu Glu Met Thr Gly
1460 1465 1470
Asp Gln Arg Glu Val Gly Ser Leu Gly Thr Ser Ala Thr Asn Ser
1475 1480 1485
Val Thr Tyr Lys Lys Val Glu Asn Thr Val Leu Pro Lys Pro Asp
1490 1495 1500
Leu Pro Lys Thr Ser Gly Lys Val Glu Leu Leu Pro Lys Val His
1505 1510 1515
Ile Tyr Gln Lys Asp Leu Phe Pro Thr Glu Thr Ser Asn Gly Ser
1520 1525 1530
Pro Gly His Leu Asp Leu Val Glu Gly Ser Leu Leu Gln Gly Thr
1535 1540 1545
Glu Gly Ala Ile Lys Trp Asn Glu Ala Asn Arg Pro Gly Lys Val
1550 1555 1560
Pro Phe Leu Arg Val Ala Thr Glu Ser Ser Ala Lys Thr Pro Ser
1565 1570 1575
Lys Leu Leu Asp Pro Leu Ala Trp Asp Asn His Tyr Gly Thr Gln
1580 1585 1590
Ile Pro Lys Glu Glu Trp Lys Ser Gln Glu Lys Ser Pro Glu Lys
1595 1600 1605
Thr Ala Phe Lys Lys Lys Asp Thr Ile Leu Ser Leu Asn Ala Cys
1610 1615 1620
Glu Ser Asn His Ala Ile Ala Ala Ile Asn Glu Gly Gln Asn Lys
1625 1630 1635
Pro Glu Ile Glu Val Thr Trp Ala Lys Gln Gly Arg Thr Glu Arg
1640 1645 1650
Leu Cys Ser Gln Asn Pro Pro Val Leu Lys Arg His Gln Arg Glu
1655 1660 1665
Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr
1670 1675 1680
Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile
1685 1690 1695
Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys
1700 1705 1710
Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr
1715 1720 1725
Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser
1730 1735 1740
Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr
1745 1750 1755
Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu
1760 1765 1770
His Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp
1775 1780 1785
Asn Ile Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser
1790 1795 1800
Phe Tyr Ser Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly
1805 1810 1815
Ala Glu Pro Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr
1820 1825 1830
Tyr Phe Trp Lys Val Gln His His Met Ala Pro Thr Lys Asp Glu
1835 1840 1845
Phe Asp Cys Lys Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu
1850 1855 1860
Lys Asp Val His Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His
1865 1870 1875
Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln Val Thr Val Gln
1880 1885 1890
Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp
1895 1900 1905
Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn
1910 1915 1920
Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His
1925 1930 1935
Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met
1940 1945 1950
Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser
1955 1960 1965
Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val Phe Thr
1970 1975 1980
Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr
1985 1990 1995
Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly
2000 2005 2010
Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His Ala Gly
2015 2020 2025
Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro
2030 2035 2040
Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala
2045 2050 2055
Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His
2060 2065 2070
Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser
2075 2080 2085
Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile
2090 2095 2100
Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser
2105 2110 2115
Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr
2120 2125 2130
Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn
2135 2140 2145
Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile
2150 2155 2160
Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg
2165 2170 2175
Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys
2180 2185 2190
Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln
2195 2200 2205
Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser
2210 2215 2220
Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp
2225 2230 2235
Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe
2240 2245 2250
Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys
2255 2260 2265
Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser
2270 2275 2280
Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys
2285 2290 2295
Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val
2300 2305 2310
Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His
2315 2320 2325
Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu Val Leu
2330 2335 2340
Gly Cys Glu Ala Gln Asp Leu Tyr
2345 2350
<210> 2
<211> 4374
<212> DNA
<213> 人工序列
<220>
<223> 重组fVIII
<400> 2
atgcagattg aactgtctac ctgtttcttt ctgtgcctgc tgaggttttg tttttctgct 60
accagaagat actacctggg agctgtggaa ctgagctggg attacatgca gtctgacctg 120
ggagagctgc ctgtggatgc tagattccca cctagagtcc ctaagtcctt ccccttcaac 180
acctctgtgg tctacaagaa aaccctgttt gtggagttta cagaccacct gttcaacatt 240
gctaagccta gaccaccatg gatgggactg ctgggaccaa ccatccaggc agaggtgtat 300
gacacagtgg tcatcaccct gaaaaacatg gcttctcacc ctgtgtccct gcatgctgtg 360
ggagtctcct actggaaggc ctctgaaggg gctgagtatg atgatcagac cagccagagg 420
gaaaaagagg atgataaggt gttccctgga gggtcccata cctatgtgtg gcaggtcctg 480
aaggagaatg gaccaatggc ttctgaccct ctgtgcctga cctactctta tctgtcccat 540
gtggacctgg tcaaggatct gaactctggc ctgattgggg ctctgctggt gtgtagggaa 600
gggtccctgg ccaaggagaa aacccagacc ctgcataagt tcatcctgct gtttgctgtg 660
tttgatgaag gaaaaagctg gcactctgag accaagaact ctctgatgca ggacagggat 720
gctgcttctg ccagagcttg gcccaagatg cacacagtga atggctatgt caataggagc 780
ctgcctggac tgattggctg ccacagaaag tctgtgtatt ggcatgtcat tggaatgggc 840
accacccctg aagtgcacag catcttcctg gaggggcata cctttctggt caggaaccac 900
aggcaggcta gcctggagat ctctccaatc accttcctga cagcccagac cctgctgatg 960
gacctgggac agttcctgct gttttgccac atctccagcc accagcatga tggcatggag 1020
gcttatgtga aagtggactc ctgtcctgag gaacctcagc tgaggatgaa gaacaatgag 1080
gaagctgaag actatgatga tgacctgaca gactctgaga tggatgtggt caggtttgat 1140
gatgataact ctccctcctt tatccagatc aggtctgtgg ccaagaaaca ccctaagacc 1200
tgggtccatt acattgctgc tgaggaagag gactgggatt atgctccact ggtgctggcc 1260
cctgatgata gatcctacaa aagccagtat ctgaacaatg gaccccagag gattggcaga 1320
aagtacaaga aagtgaggtt catggcttat acagatgaga cctttaagac cagagaagcc 1380
atccagcatg agtctgggat cctgggacct ctgctgtatg gggaagtggg ggacaccctg 1440
ctgatcatct tcaagaacca ggccagcagg ccttacaata tctatccaca tggcatcaca 1500
gatgtgagac ctctgtactc caggaggctg ccaaaggggg tgaaacacct gaaggacttc 1560
ccaatcctgc ctggggaaat ctttaagtat aaatggacag tcacagtgga ggatgggccc 1620
accaagtctg accctaggtg cctgaccaga tactattctt cctttgtgaa tatggagaga 1680
gacctggctt ctggactgat tggacccctg ctgatctgtt acaaagagtc tgtggatcag 1740
aggggcaacc agatcatgtc tgacaagagg aatgtgatcc tgttctctgt ctttgatgaa 1800
aacaggtctt ggtacctgac agagaacatc cagaggttcc tgcctaatcc agctggagtg 1860
cagctggaag atcctgagtt ccaggcctct aacatcatgc attccatcaa tggctatgtg 1920
tttgactccc tgcagctgtc tgtgtgcctg catgaggtgg cttactggta tatcctgagc 1980
attggagccc agacagattt cctgtctgtg ttcttttctg gctacacctt taagcataaa 2040
atggtgtatg aggacaccct gaccctgttc ccattttctg gagaaactgt gttcatgagc 2100
atggagaatc ctgggctgtg gatcctggga tgccacaact ctgatttcag gaatagaggg 2160
atgacagccc tgctgaaagt gagctcttgt gacaagaaca caggagacta ctatgaagat 2220
agctatgagg acatctctgc ttatctgctg tccaaaaaca atgccattga gcccaggagc 2280
ttctctcaga accctccagt gctgaagagg caccagaggg agatcaccag aaccaccctg 2340
cagtctgatc aggaagagat tgactatgat gataccatct ctgtggaaat gaagaaagag 2400
gactttgata tctatgatga agatgagaac cagtctccca ggtccttcca gaagaaaacc 2460
agacattact ttattgctgc tgtggagagg ctgtgggact atggcatgtc cagctctcct 2520
catgtgctga gaaatagagc tcagtctgga tctgtcccac agttcaagaa agtggtcttc 2580
caggagttta cagatggaag ctttacccag ccactgtaca ggggagaact gaatgagcac 2640
ctggggctgc tgggacccta tatcagggct gaagtggagg ataacatcat ggtcaccttc 2700
aggaatcagg ccagcagacc ctactctttt tattccagcc tgatctccta tgaagaggac 2760
cagagacagg gagctgaacc aagaaaaaac tttgtgaagc ctaatgagac caaaacctac 2820
ttttggaagg tgcagcacca tatggcccct accaaagatg agtttgattg caaggcctgg 2880
gcttattttt ctgatgtgga tctggagaag gatgtccact ctggcctgat tgggccactg 2940
ctggtgtgtc ataccaacac cctgaatcca gctcatggaa ggcaggtgac agtccaggaa 3000
tttgccctgt tctttaccat ctttgatgag accaagagct ggtacttcac agaaaacatg 3060
gagaggaatt gcagagcccc atgtaacatc cagatggaag accccacctt caaggagaac 3120
tacagatttc atgctatcaa tgggtatatc atggataccc tgccaggact ggtcatggct 3180
caggaccaga ggatcagatg gtacctgctg agcatggggt ctaatgagaa tatccactcc 3240
atccatttct ctggacatgt gtttacagta aggaagaaag aagagtacaa gatggccctg 3300
tacaacctgt atcctggggt gtttgaaaca gtggagatgc tgccttccaa ggctgggatc 3360
tggagggtgg aatgcctgat tggggagcac ctgcatgctg gaatgtctac cctgttcctg 3420
gtgtactcca ataagtgtca gacccccctg gggatggctt ctggacatat cagggacttc 3480
cagatcacag cttctggaca gtatggacag tgggctccta agctggctag actgcactat 3540
tctggctcca tcaatgcttg gtctaccaaa gagcctttct cctggatcaa ggtggacctg 3600
ctggctccaa tgatcatcca tggcatcaaa acccaggggg ccaggcagaa gttctcttcc 3660
ctgtacatca gccagtttat catcatgtat tctctggatg ggaagaaatg gcagacctac 3720
agaggcaatt ccacagggac cctgatggtg ttctttggca atgtggacag ctctgggatc 3780
aagcacaaca tcttcaatcc ccctatcatt gccaggtaca tcagactgca cccaacccat 3840
tattccatca ggagcaccct gagaatggag ctgatggggt gtgatctgaa cagctgttct 3900
atgcccctgg gaatggagtc taaggccatc tctgatgctc agatcacagc ctccagctac 3960
ttcaccaata tgtttgctac ctggtcccca agcaaggcta gactgcatct gcagggaaga 4020
agcaatgctt ggagaccaca ggtgaacaat cccaaggagt ggctgcaggt ggacttccag 4080
aaaaccatga aggtgacagg agtcaccacc cagggagtga aaagcctgct gacctctatg 4140
tatgtcaagg agttcctgat ctcttccagc caggatgggc accagtggac cctgttcttt 4200
cagaatggaa aggtgaaagt cttccagggc aatcaggatt cctttacccc tgtggtcaac 4260
agcctggacc cacccctgct gaccaggtac ctgagaatcc acccacagtc ctgggtgcat 4320
cagattgctc tgaggatgga agtcctgggc tgtgaggccc aggacctgta ttga 4374
<210> 3
<211> 1457
<212> PRT
<213> 人工序列
<220>
<223> 重组fVIII
<400> 3
Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe
1 5 10 15
Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser
20 25 30
Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg
35 40 45
Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val
50 55 60
Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Val His Leu Phe Asn Ile
65 70 75 80
Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln
85 90 95
Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser
100 105 110
His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser
115 120 125
Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp
130 135 140
Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu
145 150 155 160
Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser
165 170 175
Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile
180 185 190
Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr
195 200 205
Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly
210 215 220
Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp
225 230 235 240
Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr
245 250 255
Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val
260 265 270
Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile
275 280 285
Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser
290 295 300
Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met
305 310 315 320
Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His
325 330 335
Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro
340 345 350
Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp
355 360 365
Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser
370 375 380
Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr
385 390 395 400
Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro
405 410 415
Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn
420 425 430
Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met
435 440 445
Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu
450 455 460
Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu
465 470 475 480
Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro
485 490 495
His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys
500 505 510
Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe
515 520 525
Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp
530 535 540
Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg
545 550 555 560
Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu
565 570 575
Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val
580 585 590
Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu
595 600 605
Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp
610 615 620
Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val
625 630 635 640
Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp
645 650 655
Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe
660 665 670
Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr
675 680 685
Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro
690 695 700
Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly
705 710 715 720
Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp
725 730 735
Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys
740 745 750
Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Pro Pro Val Leu
755 760 765
Lys Arg His Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln
770 775 780
Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu
785 790 795 800
Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe
805 810 815
Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp
820 825 830
Asp Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln
835 840 845
Ser Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr
850 855 860
Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His
865 870 875 880
Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile
885 890 895
Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser
900 905 910
Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg
915 920 925
Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val
930 935 940
Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp
945 950 955 960
Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu
965 970 975
Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His
980 985 990
Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe
995 1000 1005
Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn
1010 1015 1020
Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys
1025 1030 1035
Glu Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr
1040 1045 1050
Leu Pro Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr
1055 1060 1065
Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His Ser Ile His Phe
1070 1075 1080
Ser Gly His Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met
1085 1090 1095
Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met
1100 1105 1110
Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly
1115 1120 1125
Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser
1130 1135 1140
Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg
1145 1150 1155
Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro
1160 1165 1170
Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser
1175 1180 1185
Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro
1190 1195 1200
Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe
1205 1210 1215
Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp
1220 1225 1230
Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu
1235 1240 1245
Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn
1250 1255 1260
Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro
1265 1270 1275
Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly
1280 1285 1290
Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys
1295 1300 1305
Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn
1310 1315 1320
Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln
1325 1330 1335
Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu
1340 1345 1350
Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val
1355 1360 1365
Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys
1370 1375 1380
Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu
1385 1390 1395
Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp
1400 1405 1410
Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr
1415 1420 1425
Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala
1430 1435 1440
Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1445 1450 1455
<210> 4
<211> 146
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 4
gttaatcatt aagtcgttaa tttttgtggc ccttgcgatg tttgctctgg ttaataatct 60
caggacaaac agaggttaat aattttccag atctctctga gcaatagtat aaaaggccag 120
cagcagcctg accacatctc atcctc 146
<210> 5
<211> 159
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 5
gttaattttt gtggcccttg cgatgtttgc tctggttaat aatctcagga caaacataca 60
ttttcagtca tatgtttgct cactgaaggt tactagttaa caggcatccc ttaaacagga 120
tataaaaggc cagcagcagc ctgaccacat ctcatcctc 159
<210> 6
<211> 172
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 6
gttaattttt aaaaagcagt caaaagtcca agtggccctt gcgagcattt actctctctg 60
tttgctctgg ttaataatct caggagcaca aacagaggtt aataattttc agtcatatgt 120
ttgctcactg aaggttacta gttaacaggc atcccttaaa caggatataa aa 172
<210> 7
<211> 204
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 7
gttaattttt aaaaagcagt caaaagtcca agtggccctt gcgagcattt actctctctg 60
tttgctctgg ttaataatct caggagcaca aacagaggtt aataattttc agtcatatgt 120
ttgctcactg aaggttacta gttaacaggc atcccttaaa caggatataa aaggccagca 180
gcagcctgac cacatctcat cctc 204
<210> 8
<211> 1386
<212> DNA
<213> 人工序列
<220>
<223> 重组fIX
<400> 8
atgcagaggg tgaacatgat catggctgag tctcctggac tgatcaccat ctgcctgctg 60
ggctatctgc tgtctgctga gtgtacagtg ttcctggacc atgaaaatgc taataaaatc 120
ctgaacaggc caaagaggta caattctggg aaactggagg aatttgtgca gggaaacctg 180
gagagggaat gcatggagga aaagtgtagc tttgaggaag ccagggaggt gtttgaaaat 240
acagagagga ccacagagtt ctggaaacag tatgtggatg gggatcagtg tgagtccaac 300
ccctgtctga atggagggtc ttgcaaggat gatatcaact cctatgagtg ctggtgtcct 360
tttggatttg aaggcaagaa ttgtgagctg gatgtgacct gtaacatcaa aaatgggagg 420
tgtgagcagt tctgtaagaa ctctgctgat aataaagtgg tctgcagctg tacagaaggc 480
tacaggctgg ctgagaacca gaagagctgt gaaccagctg tgcccttccc ttgtgggagg 540
gtgtctgtca gccagaccag caagctgacc agagctgagg ctgtgtttcc tgatgtggat 600
tatgtcaact ctacagaggc tgaaaccatc ctggacaaca tcacccagtc tacccagtcc 660
ttcaatgact ttaccagggt ggtgggaggg gaggatgcta agccaggaca gttcccctgg 720
caggtggtcc tgaatggcaa agtggatgct ttttgtgggg gctccattgt gaatgagaag 780
tggattgtca cagctgctca ctgtgtggaa actggggtca agatcacagt ggtggctgga 840
gagcacaaca ttgaggaaac tgaacataca gagcagaaaa ggaatgtgat cagaatcatc 900
ccccaccata actacaatgc tgctatcaac aagtataatc atgacattgc cctgctggaa 960
ctggatgagc ctctggtgct gaacagctat gtcaccccaa tctgcattgc tgacaaggag 1020
tataccaata tcttcctgaa atttgggtct ggatatgtgt ctgggtgggg aagggtcttc 1080
cacaagggaa ggtctgctct ggtgctgcag tatctgaggg tgcccctggt ggacagagct 1140
acctgcctga ggagcaccaa gttcaccatc tacaacaata tgttctgtgc tggatttcat 1200
gagggaggga gggactcctg tcagggagat tctggaggcc ctcatgtgac agaggtggaa 1260
ggcaccagct tcctgactgg catcatctct tggggggagg aatgtgctat gaaggggaaa 1320
tatggaatct ataccaaggt gtccagatat gtcaactgga tcaaggagaa aaccaagctg 1380
acctga 1386
<210> 9
<211> 1386
<212> DNA
<213> 人工序列
<220>
<223> 重组fIX
<400> 9
atgcagaggg tgaacatgat catggctgag tctcctggac tgatcaccat ctgcctgctg 60
ggctatctgc tgtctgctga gtgtacagtg ttcctggacc atgaaaatgc taataaaatc 120
ctgaacaggc caaagaggta caattctggg aaactggagg aatttgtgca gggaaacctg 180
gagagggaat gcatggagga aaagtgtagc tttgaggaag ccagggaggt gtttgaaaat 240
acagagagga ccacagagtt ctggaaacag tatgtggatg gggatcagtg tgagtccaac 300
ccctgtctga atggagggtc ttgcaaggat gatatcaact cctatgagtg ctggtgtcct 360
tttggatttg aaggcaagaa ttgtgagctg gatgtgacct gtaacatcaa aaatgggagg 420
tgtgagcagt tctgtaagaa ctctgctgat aataaagtgg tctgcagctg tacagaaggc 480
tacaggctgg ctgagaacca gaagagctgt gaaccagctg tgcccttccc ttgtgggagg 540
gtgtctgtca gccagaccag caagctgacc agagctgagg ctgtgtttcc tgatgtggat 600
tatgtcaact ctacagaggc tgaaaccatc ctggacaaca tcacccagtc tacccagtcc 660
ttcaatgact ttaccagggt ggtgggaggg gaggatgcta agccaggaca gttcccctgg 720
caggtggtcc tgaatggcaa agtggatgct ttttgtgggg gctccattgt gaatgagaag 780
tggattgtca cagctgctca ctgtgtggaa actggggtca agatcacagt ggtggctgga 840
gagcacaaca ttgaggaaac tgaacataca gagcagaaaa ggaatgtgat cagaatcatc 900
ccccaccata actacaatgc tgctatcaac aagtataatc atgacattgc cctgctggaa 960
ctggatgagc ctctggtgct gaacagctat gtcaccccaa tctgcattgc tgacaaggag 1020
tataccaata tcttcctgaa atttgggtct ggatatgtgt ctgggtgggg aagggtcttc 1080
cacaagggaa ggtctgctct ggtgctgcag tatctgaggg tgcccctggt ggacagagct 1140
acctgcctgc tgagcaccaa gttcaccatc tacaacaata tgttctgtgc tggatttcat 1200
gagggaggga gggactcctg tcagggagat tctggaggcc ctcatgtgac agaggtggaa 1260
ggcaccagct tcctgactgg catcatctct tggggggagg aatgtgctat gaaggggaaa 1320
tatggaatct ataccaaggt gtccagatat gtcaactgga tcaaggagaa aaccaagctg 1380
acctga 1386
<210> 10
<211> 1386
<212> DNA
<213> 人工序列
<220>
<223> 重组fIX
<400> 10
atgcagaggg tgaacatgat catggctgag tctcctggac tgatcaccat ctgcctgctg 60
ggctatctgc tgtctgctga gtgtacagtg ttcctggacc atgaaaatgc taataaaatc 120
ctgaacaggc caaagaggta caattctggg aaactggagg aatttgtgca gggaaacctg 180
gagagggaat gcatggagga aaagtgtagc tttgaggaag ccagggaggt gtttgaaaat 240
acagagagga ccacagagtt ctggaaacag tatgtggatg gggatcagtg tgagtccaac 300
ccctgtctga atggagggtc ttgcaaggat gatatcaact cctatgagtg ctggtgtcct 360
tttggatttg aaggcaagaa ttgtgagctg gatgtgacct gtaacatcaa aaatgggagg 420
tgtgagcagt tctgtaagaa ctctgctgat aataaagtgg tctgcagctg tacagaaggc 480
tacaggctgg ctgagaacca gaagagctgt gaaccagctg tgcccttccc ttgtgggagg 540
gtgtctgtca gccagaccag caagctgacc agagctgaga cagtgtttcc tgatgtggat 600
tatgtcaact ctacagaggc tgaaaccatc ctggacaaca tcacccagtc tacccagtcc 660
ttcaatgact ttaccagggt ggtgggaggg gaggatgcta agccaggaca gttcccctgg 720
caggtggtcc tgaatggcaa agtggatgct ttttgtgggg gctccattgt gaatgagaag 780
tggattgtca cagctgctca ctgtgtggaa actggggtca agatcacagt ggtggctgga 840
gagcacaaca ttgaggaaac tgaacataca gagcagaaaa ggaatgtgat cagaatcatc 900
ccccaccata actacaatgc tgctatcaac aagtataatc atgacattgc cctgctggaa 960
ctggatgagc ctctggtgct gaacagctat gtcaccccaa tctgcattgc tgacaaggag 1020
tataccaata tcttcctgaa atttgggtct ggatatgtgt ctgggtgggg aagggtcttc 1080
cacaagggaa ggtctgctct ggtgctgcag tatctgaggg tgcccctggt ggacagagct 1140
acctgcctgc tgagcaccaa gttcaccatc tacaacaata tgttctgtgc tggatttcat 1200
gagggaggga gggactcctg tcagggagat tctggaggcc ctcatgtgac agaggtggaa 1260
ggcaccagct tcctgactgg catcatctct tggggggagg aatgtgctat gaaggggaaa 1320
tatggaatct ataccaaggt gtccagatat gtcaactgga tcaaggagaa aaccaagctg 1380
acctga 1386
<210> 11
<211> 4404
<212> DNA
<213> 人工序列
<220>
<223> 重组fVIII
<400> 11
atgcagctgg aactgtctac ctgtgtgttt ctgtgtctgc tgcctctggg gttttctgct 60
atcaggagat actatctggg agctgtggag ctgtcctggg actacaggca gtctgagctg 120
ctgagagaac tgcatgtgga taccagattc ccagctacag ctccaggagc tctgcctctg 180
ggcccatctg tgctgtacaa gaaaacagtc tttgtggagt ttacagacca gctgttctct 240
gtggccaggc caagaccacc ttggatggga ctgctgggac caaccatcca ggctgaggtg 300
tatgatacag tggtggtgac cctgaaaaac atggcctccc atcctgtgag cctgcatgct 360
gtgggggtgt ccttctggaa gtcctctgag ggagctgagt atgaagacca tacctcccag 420
agggagaaag aagatgataa ggtgctgcct ggcaaaagcc agacctatgt ctggcaggtg 480
ctgaaggaga atggaccaac tgcttctgac ccaccatgcc tgacctactc ttatctgtcc 540
catgtggatc tggtgaagga cctgaattct ggactgattg gagctctgct ggtgtgtaga 600
gagggaagcc tgaccagaga aagaacccag aacctgcatg agtttgtcct gctgtttgct 660
gtgtttgatg aagggaagag ctggcactct gccaggaatg actcctggac cagagctatg 720
gatccagctc ctgctagagc tcagcctgct atgcacacag tcaatggcta tgtgaatagg 780
tctctgccag gactgattgg ctgccataag aaatctgtct attggcatgt gattggaatg 840
ggcaccagcc ctgaggtgca ttctatcttc ctggaaggcc acacctttct ggtcaggcac 900
catagacagg cctctctgga gatctcccct ctgaccttcc tgacagctca gacctttctg 960
atggacctgg ggcagttcct gctgttttgc catatctctt cccaccatca tggaggaatg 1020
gaggctcatg tcagggtgga atcctgtgct gaggaaccac agctgagaag aaaggctgat 1080
gaggaagagg actatgatga taacctgtat gactctgata tggatgtggt gaggctggat 1140
ggggatgatg tcagcccttt catccagatc aggtctgtgg ccaagaaaca tccaaagacc 1200
tgggtccact acattgctgc tgaagaggaa gattgggact atgcccccct ggtgctggct 1260
cctgatgata gatcctacaa aagccagtat ctgaacaatg ggccccagag gattggaagg 1320
aagtacaaga aagtgaggtt catggcctat acagatgaga cctttaagac cagagaggct 1380
atccagcatg aatctgggat cctgggacct ctgctgtatg gagaagtggg ggataccctg 1440
ctgatcatct tcaagaacca ggcctccagg ccatacaata tctatcccca tggcatcaca 1500
gatgtgagac cactgtacag caggagactg cccaaggggg tcaaacacct gaaggatttc 1560
cccatcctgc ctggagagat ctttaagtat aaatggacag tcacagtgga agatgggcct 1620
accaagtctg atccaaggtg cctgaccaga tactatagct cttttgtgaa catggagaga 1680
gacctggctt ctggactgat tggacccctg ctgatctgtt acaaagagtc tgtggaccag 1740
aggggcaacc agatcatgtc tgataagaga aatgtcatcc tgttctctgt gtttgatgag 1800
aacaggagct ggtacctgac agagaacatc cagaggttcc tgccaaatcc agctggagtg 1860
cagctggagg acccagaatt tcaggcttcc aacatcatgc atagcatcaa tggctatgtg 1920
tttgatagcc tgcagctgtc tgtctgcctg catgaggtgg cctactggta tatcctgtcc 1980
attggagctc agacagactt cctgtctgtg ttctttagtg ggtacacctt taagcataaa 2040
atggtgtatg aggataccct gaccctgttc cccttttctg gggagacagt gttcatgtcc 2100
atggaaaacc ctggcctgtg gatcctgggg tgccacaact ctgacttcag gaatagagga 2160
atgacagccc tgctgaaagt gtccagctgt gataagaata caggggatta ctatgaggac 2220
tcttatgaag atatctctgc ttatctgctg agcaagaaca atgccattga gcccaggtct 2280
tttgctcaga actccagacc tccatctgct tctgctccta agccacctgt gctgagaaga 2340
catcagaggg acatctccct gcctaccttc cagccagagg aagataaaat ggactatgat 2400
gatatcttca gcacagagac caagggggaa gattttgaca tctatggaga ggatgaaaac 2460
caggatccaa gatccttcca gaagagaacc agacactact ttattgctgc tgtggagcag 2520
ctgtgggact atgggatgtc tgaaagccca agggccctga ggaacagagc tcagaatgga 2580
gaggtgccca gattcaagaa agtggtgttc agagagtttg ctgatggcag ctttacccag 2640
ccatcttaca ggggggagct gaacaagcat ctggggctgc tgggacccta tatcagagct 2700
gaggtggaag ataacatcat ggtgaccttc aagaatcagg cttctaggcc ctactccttt 2760
tattcttccc tgatctccta ccctgatgat caggagcagg gagctgaacc taggcacaac 2820
tttgtgcagc caaatgagac cagaacctac ttttggaagg tgcagcatca catggctccc 2880
acagaggatg aatttgactg caaagcttgg gcctattttt ctgatgtgga cctggagaag 2940
gatgtgcatt ctggcctgat tgggcctctg ctgatctgta gggccaacac cctgaatgct 3000
gctcatggaa gacaggtcac agtgcaggag tttgctctgt tctttaccat ctttgatgaa 3060
accaagagct ggtacttcac agagaatgtg gaaaggaatt gcagagcccc ctgtcatctg 3120
cagatggagg accctaccct gaaggaaaac tacaggttcc atgccatcaa tggatatgtc 3180
atggataccc tgcctggcct ggtcatggct cagaaccaga ggatcagatg gtacctgctg 3240
tctatgggat ccaatgagaa tatccatagc atccacttct ctggccatgt cttttctgtg 3300
aggaagaaag aggaatacaa aatggctgtg tacaatctgt atcctggggt ctttgagaca 3360
gtggaaatgc tgccaagcaa agtgggaatc tggagaattg agtgcctgat tggggaacac 3420
ctgcaggctg ggatgagcac caccttcctg gtgtactcta agaaatgtca gaccccactg 3480
gggatggcct ctggacatat cagggacttc cagatcacag cttctggaca gtatggacag 3540
tgggctccaa agctggctag actgcactat tctggctcca tcaatgcctg gtctaccaaa 3600
gagccattct cctggatcaa ggtggacctg ctggccccca tgatcatcca tggaatcaaa 3660
acccagggag ctaggcagaa gttcagctct ctgtacatct cccagtttat catcatgtat 3720
agcctggatg ggaagaaatg gcagacctac agaggcaatt ccactgggac cctgatggtc 3780
ttctttggaa atgtggattc ctctggcatc aagcacaaca tcttcaatcc acccatcatt 3840
gccaggtaca tcaggctgca tcctacccac tatagcatca ggtctaccct gagaatggag 3900
ctgatgggat gtgacctgaa cagctgttct atgccactgg gcatggagtc caaggctatc 3960
tctgatgccc agatcacagc ttcttcctac ttcaccaata tgtttgctac ctggtcccca 4020
agcaaggcta gactgcacct gcagggaaga tccaatgctt ggagacccca ggtgaacaat 4080
cctaaggagt ggctgcaggt ggacttccag aaaaccatga aggtcacagg ggtgaccacc 4140
cagggagtga aatctctgct gacctccatg tatgtcaagg agttcctgat cagctcttcc 4200
caggatggcc accagtggac cctgttcttt cagaatggca aggtcaaagt gttccagggg 4260
aatcaggact cttttacccc agtggtgaac tccctggatc ctccactgct gaccaggtac 4320
ctgagaatcc atcctcagag ctgggtgcac cagattgctc tgagaatgga ggtcctggga 4380
tgtgaagctc aggacctgta ttga 4404
<210> 12
<211> 4404
<212> DNA
<213> 人工序列
<220>
<223> 重组fVIII
<400> 12
atgcagctgg aactgtctac ctgtgtgttt ctgtgtctgc tgcctctggg gttttctgct 60
atccgccgct actatctggg agccgtggag ctgtcctggg actacaggca gagcgagctg 120
ctgagagaac tgcacgtgga taccagattc ccagctaccg ctccaggagc tctgcctctg 180
ggcccatccg tgctgtacaa gaaaaccgtc ttcgtggagt ttaccgacca gctgttcagc 240
gtggccaggc caagaccacc ttggatggga ctgctgggac caaccatcca ggctgaggtg 300
tacgataccg tggtcgtgac cctgaaaaac atggcctccc atcccgtgag cctgcacgct 360
gtcggggtgt ccttctggaa gtccagcgag ggagccgagt acgaagacca tacctcccag 420
cgcgagaaag aagacgataa ggtgctgcct ggcaaaagcc agacctatgt ctggcaggtg 480
ctgaaggaga acggaccaac cgctagcgac ccaccatgcc tgacctactc ttatctgtcc 540
cacgtcgatc tggtgaagga cctgaattcc ggactgatcg gagctctgct ggtgtgtaga 600
gagggaagcc tgaccagaga aagaacccag aacctgcatg agttcgtcct gctgttcgcc 660
gtgtttgacg aagggaagag ctggcactct gcccgcaatg actcctggac cagagctatg 720
gatccagctc ctgctagagc tcagcctgct atgcacaccg tcaacggcta cgtgaatcgg 780
tctctgccag gactgatcgg ctgccataag aaaagcgtct attggcacgt gatcggaatg 840
ggcaccagcc ccgaggtgca ttctatcttc ctggaaggcc acacctttct ggtcaggcac 900
catagacagg cctctctgga gatctcccct ctgaccttcc tgaccgctca gacctttctg 960
atggacctgg ggcagttcct gctgttttgc catatctctt cccaccatca cggaggaatg 1020
gaggctcacg tcagggtgga atcctgtgct gaggaaccac agctgagaag aaaggctgat 1080
gaggaagagg actacgacga taacctgtat gacagcgata tggacgtcgt gcgcctggac 1140
ggcgacgatg tcagcccttt catccagatc cggtctgtgg ccaagaaaca tccaaagacc 1200
tgggtccact acatcgccgc tgaagaggaa gattgggact atgcccccct ggtgctggct 1260
cctgacgata gatcctacaa aagccagtat ctgaacaatg ggccccagcg catcggacgg 1320
aagtacaaga aagtgaggtt catggcctat accgacgaga cctttaagac cagagaggct 1380
atccagcacg aatccgggat cctgggacct ctgctgtacg gcgaagtggg ggataccctg 1440
ctgatcatct tcaagaacca ggcctccagg ccatacaata tctatcccca tggcatcacc 1500
gacgtgagac cactgtacag caggagactg cccaaggggg tcaaacacct gaaggatttc 1560
cccatcctgc ctggagagat ctttaagtat aaatggaccg tcaccgtgga agacgggcct 1620
accaagtccg atccacgctg cctgacccgg tactatagct ctttcgtgaa catggagaga 1680
gacctggcta gcggactgat cggacccctg ctgatctgtt acaaagagag cgtggaccag 1740
aggggcaacc agatcatgtc tgataagaga aatgtcatcc tgttctccgt gtttgacgag 1800
aaccgcagct ggtacctgac cgagaacatc cagcggttcc tgccaaatcc agctggagtg 1860
cagctggagg acccagaatt tcaggcttcc aacatcatgc atagcatcaa tggctacgtg 1920
ttcgatagcc tgcagctgtc tgtctgcctg cacgaggtgg cctactggta tatcctgtcc 1980
atcggcgctc agaccgactt cctgtccgtg ttctttagcg ggtacacctt taagcataaa 2040
atggtgtatg aggataccct gaccctgttc cccttttctg gcgagaccgt gttcatgtcc 2100
atggaaaacc ctggcctgtg gatcctgggg tgccacaaca gcgacttcag gaatagagga 2160
atgaccgccc tgctgaaagt gtccagctgt gataagaata ccggcgatta ctatgaggac 2220
tcttacgaag atatctccgc ttatctgctg agcaagaaca atgccatcga gcccaggtct 2280
ttcgctcaga actccagacc tccaagcgct tctgctccta agccacctgt gctgagaaga 2340
catcagaggg acatctccct gcctaccttc cagccagagg aagataaaat ggactacgac 2400
gatatcttca gcaccgagac caagggggaa gattttgaca tctatggaga ggacgaaaac 2460
caggatccaa gatccttcca gaagagaacc agacactact ttatcgccgc tgtggagcag 2520
ctgtgggact atgggatgtc cgaaagccca cgggccctga ggaacagagc tcagaatgga 2580
gaggtgcccc gcttcaagaa agtcgtgttc cgggagtttg ccgacggcag ctttacccag 2640
ccatcttaca ggggggagct gaacaagcat ctggggctgc tgggacccta tatcagagcc 2700
gaggtcgaag ataacatcat ggtgaccttc aagaatcagg cttctcgccc ctactccttt 2760
tattcttccc tgatctccta ccctgacgat caggagcagg gcgccgaacc taggcacaac 2820
ttcgtgcagc caaatgagac cagaacctac ttttggaagg tgcagcatca catggctccc 2880
accgaggatg aattcgactg caaagcttgg gcctattttt ccgatgtcga cctggagaag 2940
gacgtgcata gcggcctgat cgggcctctg ctgatctgtc gcgccaacac cctgaatgct 3000
gctcacggaa gacaggtcac cgtgcaggag ttcgctctgt tctttaccat ctttgacgaa 3060
accaagagct ggtacttcac cgagaacgtg gaaaggaatt gcagagcccc ctgtcatctg 3120
cagatggagg accctaccct gaaggaaaac tacaggttcc acgccatcaa tggatatgtc 3180
atggataccc tgcccggcct ggtcatggct cagaaccagc gcatccggtg gtacctgctg 3240
tctatgggat ccaacgagaa tatccatagc atccacttct ctggccatgt cttttccgtg 3300
aggaagaaag aggaatacaa aatggccgtg tacaatctgt atcctggggt cttcgagacc 3360
gtggaaatgc tgccaagcaa agtgggaatc tggagaatcg agtgcctgat cggcgaacac 3420
ctgcaggccg ggatgagcac caccttcctg gtgtactcta agaaatgtca gaccccactg 3480
gggatggcct ccggacatat ccgcgacttc cagatcaccg ctagcggaca gtacggacag 3540
tgggctccaa agctggctag actgcactat tctggctcca tcaacgcctg gtctaccaaa 3600
gagccattct cctggatcaa ggtggacctg ctggccccca tgatcatcca cggaatcaaa 3660
acccagggcg ctaggcagaa gttcagctct ctgtacatct cccagtttat catcatgtat 3720
agcctggacg ggaagaaatg gcagacctac agaggcaatt ccaccgggac cctgatggtc 3780
ttctttggaa acgtggattc cagcggcatc aagcacaaca tcttcaatcc acccatcatc 3840
gcccgctaca tccggctgca tcctacccac tatagcatca ggtctaccct gagaatggag 3900
ctgatgggat gcgacctgaa cagctgttct atgccactgg gcatggagtc caaggctatc 3960
agcgatgccc agatcaccgc ttcttcctac ttcaccaata tgtttgctac ctggtcccca 4020
agcaaggcta gactgcacct gcagggaaga tccaacgctt ggagacccca ggtgaacaat 4080
cctaaggagt ggctgcaggt cgacttccag aaaaccatga aggtcaccgg ggtgaccacc 4140
cagggagtga aatctctgct gacctccatg tacgtcaagg agttcctgat cagctcttcc 4200
caggacggcc accagtggac cctgttcttt cagaacggca aggtcaaagt gttccagggg 4260
aatcaggact cttttacccc cgtcgtgaac tccctggatc ctccactgct gaccaggtac 4320
ctgagaatcc atcctcagag ctgggtgcac cagatcgctc tgagaatgga ggtcctggga 4380
tgcgaagctc aggacctgta ttga 4404
<210> 13
<211> 391
<212> PRT
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 13
Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe
1 5 10 15
Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser
20 25 30
Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg
35 40 45
Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val
50 55 60
Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Val His Leu Phe Asn Ile
65 70 75 80
Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln
85 90 95
Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser
100 105 110
His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser
115 120 125
Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp
130 135 140
Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu
145 150 155 160
Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser
165 170 175
Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile
180 185 190
Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr
195 200 205
Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly
210 215 220
Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp
225 230 235 240
Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr
245 250 255
Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val
260 265 270
Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile
275 280 285
Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser
290 295 300
Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met
305 310 315 320
Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His
325 330 335
Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro
340 345 350
Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp
355 360 365
Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser
370 375 380
Pro Ser Phe Ile Gln Ile Arg
385 390
<210> 14
<211> 391
<212> PRT
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 14
Met Gln Leu Glu Leu Ser Thr Cys Val Phe Leu Cys Leu Leu Pro Leu
1 5 10 15
Gly Phe Ser Ala Ile Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser
20 25 30
Trp Asp Tyr Arg Gln Ser Glu Leu Leu Arg Glu Leu His Val Asp Thr
35 40 45
Arg Phe Pro Ala Thr Ala Pro Gly Ala Leu Pro Leu Gly Pro Ser Val
50 55 60
Leu Tyr Lys Lys Thr Val Phe Val Glu Phe Thr Asp Gln Leu Phe Ser
65 70 75 80
Val Ala Arg Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile
85 90 95
Gln Ala Glu Val Tyr Asp Thr Val Val Val Thr Leu Lys Asn Met Ala
100 105 110
Ser His Pro Val Ser Leu His Ala Val Gly Val Ser Phe Trp Lys Ser
115 120 125
Ser Glu Gly Ala Glu Tyr Glu Asp His Thr Ser Gln Arg Glu Lys Glu
130 135 140
Asp Asp Lys Val Leu Pro Gly Lys Ser Gln Thr Tyr Val Trp Gln Val
145 150 155 160
Leu Lys Glu Asn Gly Pro Thr Ala Ser Asp Pro Pro Cys Leu Thr Tyr
165 170 175
Ser Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu
180 185 190
Ile Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Thr Arg Glu Arg
195 200 205
Thr Gln Asn Leu His Glu Phe Val Leu Leu Phe Ala Val Phe Asp Glu
210 215 220
Gly Lys Ser Trp His Ser Ala Arg Asn Asp Ser Trp Thr Arg Ala Met
225 230 235 240
Asp Pro Ala Pro Ala Arg Ala Gln Pro Ala Met His Thr Val Asn Gly
245 250 255
Tyr Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Lys Lys Ser
260 265 270
Val Tyr Trp His Val Ile Gly Met Gly Thr Ser Pro Glu Val His Ser
275 280 285
Ile Phe Leu Glu Gly His Thr Phe Leu Val Arg His His Arg Gln Ala
290 295 300
Ser Leu Glu Ile Ser Pro Leu Thr Phe Leu Thr Ala Gln Thr Phe Leu
305 310 315 320
Met Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His His
325 330 335
His Gly Gly Met Glu Ala His Val Arg Val Glu Ser Cys Ala Glu Glu
340 345 350
Pro Gln Leu Arg Arg Lys Ala Asp Glu Glu Glu Asp Tyr Asp Asp Asn
355 360 365
Leu Tyr Asp Ser Asp Met Asp Val Val Arg Leu Asp Gly Asp Asp Val
370 375 380
Ser Pro Phe Ile Gln Ile Arg
385 390
<210> 15
<211> 371
<212> PRT
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 15
Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr
1 5 10 15
Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr
20 25 30
Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg
35 40 45
His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser
50 55 60
Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro
65 70 75 80
Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe Thr
85 90 95
Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu Leu Gly
100 105 110
Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr Phe Arg
115 120 125
Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile Ser Tyr
130 135 140
Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe Val Lys
145 150 155 160
Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His Met Ala
165 170 175
Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe Ser Asp
180 185 190
Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro Leu Leu
195 200 205
Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln Val Thr
210 215 220
Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser
225 230 235 240
Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn
245 250 255
Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His Ala
260 265 270
Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met Ala Gln
275 280 285
Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn
290 295 300
Ile His Ser Ile His Phe Ser Gly His Val Phe Thr Val Arg Lys Lys
305 310 315 320
Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu
325 330 335
Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys
340 345 350
Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu Val
355 360 365
Tyr Ser Asn
370
<210> 16
<211> 371
<212> PRT
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 16
Asp Ile Ser Leu Pro Thr Phe Gln Pro Glu Glu Asp Lys Met Asp Tyr
1 5 10 15
Asp Asp Ile Phe Ser Thr Glu Thr Lys Gly Glu Asp Phe Asp Ile Tyr
20 25 30
Gly Glu Asp Glu Asn Gln Asp Pro Arg Ser Phe Gln Lys Arg Thr Arg
35 40 45
His Tyr Phe Ile Ala Ala Val Glu Gln Leu Trp Asp Tyr Gly Met Ser
50 55 60
Glu Ser Pro Arg Ala Leu Arg Asn Arg Ala Gln Asn Gly Glu Val Pro
65 70 75 80
Arg Phe Lys Lys Val Val Phe Arg Glu Phe Ala Asp Gly Ser Phe Thr
85 90 95
Gln Pro Ser Tyr Arg Gly Glu Leu Asn Lys His Leu Gly Leu Leu Gly
100 105 110
Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr Phe Lys
115 120 125
Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile Ser Tyr
130 135 140
Pro Asp Asp Gln Glu Gln Gly Ala Glu Pro Arg His Asn Phe Val Gln
145 150 155 160
Pro Asn Glu Thr Arg Thr Tyr Phe Trp Lys Val Gln His His Met Ala
165 170 175
Pro Thr Glu Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe Ser Asp
180 185 190
Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro Leu Leu
195 200 205
Ile Cys Arg Ala Asn Thr Leu Asn Ala Ala His Gly Arg Gln Val Thr
210 215 220
Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser
225 230 235 240
Trp Tyr Phe Thr Glu Asn Val Glu Arg Asn Cys Arg Ala Pro Cys His
245 250 255
Leu Gln Met Glu Asp Pro Thr Leu Lys Glu Asn Tyr Arg Phe His Ala
260 265 270
Ile Asn Gly Tyr Val Met Asp Thr Leu Pro Gly Leu Val Met Ala Gln
275 280 285
Asn Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn
290 295 300
Ile His Ser Ile His Phe Ser Gly His Val Phe Ser Val Arg Lys Lys
305 310 315 320
Glu Glu Tyr Lys Met Ala Val Tyr Asn Leu Tyr Pro Gly Val Phe Glu
325 330 335
Thr Val Glu Met Leu Pro Ser Lys Val Gly Ile Trp Arg Ile Glu Cys
340 345 350
Leu Ile Gly Glu His Leu Gln Ala Gly Met Ser Thr Thr Phe Leu Val
355 360 365
Tyr Ser Lys
370
<210> 17
<211> 461
<212> PRT
<213> 人工序列
<220>
<223> 重组fIX
<400> 17
Met Gln Arg Val Asn Met Ile Met Ala Glu Ser Pro Gly Leu Ile Thr
1 5 10 15
Ile Cys Leu Leu Gly Tyr Leu Leu Ser Ala Glu Cys Thr Val Phe Leu
20 25 30
Asp His Glu Asn Ala Asn Lys Ile Leu Asn Arg Pro Lys Arg Tyr Asn
35 40 45
Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg Glu Cys
50 55 60
Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe Glu Asn
65 70 75 80
Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly Asp Gln
85 90 95
Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp Asp Ile
100 105 110
Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys Asn Cys
115 120 125
Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu Gln Phe
130 135 140
Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr Glu Gly
145 150 155 160
Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val Pro Phe
165 170 175
Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr Arg Ala
180 185 190
Glu Ala Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu Ala Glu
195 200 205
Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn Asp Phe
210 215 220
Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe Pro Trp
225 230 235 240
Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly Ser Ile
245 250 255
Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu Thr Gly
260 265 270
Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu Thr Glu
275 280 285
His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His His Asn
290 295 300
Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu Leu Glu
305 310 315 320
Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile Cys Ile
325 330 335
Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser Gly Tyr
340 345 350
Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala Leu Val
355 360 365
Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys Leu Arg
370 375 380
Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly Phe His
385 390 395 400
Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro His Val
405 410 415
Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser Trp Gly
420 425 430
Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys Val Ser
435 440 445
Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr
450 455 460
<210> 18
<211> 461
<212> PRT
<213> 人工序列
<220>
<223> 重组fIX
<400> 18
Met Gln Arg Val Asn Met Ile Met Ala Glu Ser Pro Gly Leu Ile Thr
1 5 10 15
Ile Cys Leu Leu Gly Tyr Leu Leu Ser Ala Glu Cys Thr Val Phe Leu
20 25 30
Asp His Glu Asn Ala Asn Lys Ile Leu Asn Arg Pro Lys Arg Tyr Asn
35 40 45
Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg Glu Cys
50 55 60
Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe Glu Asn
65 70 75 80
Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly Asp Gln
85 90 95
Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp Asp Ile
100 105 110
Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys Asn Cys
115 120 125
Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu Gln Phe
130 135 140
Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr Glu Gly
145 150 155 160
Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val Pro Phe
165 170 175
Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr Arg Ala
180 185 190
Glu Ala Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu Ala Glu
195 200 205
Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn Asp Phe
210 215 220
Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe Pro Trp
225 230 235 240
Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly Ser Ile
245 250 255
Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu Thr Gly
260 265 270
Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu Thr Glu
275 280 285
His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His His Asn
290 295 300
Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu Leu Glu
305 310 315 320
Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile Cys Ile
325 330 335
Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser Gly Tyr
340 345 350
Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala Leu Val
355 360 365
Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys Leu Leu
370 375 380
Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly Phe His
385 390 395 400
Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro His Val
405 410 415
Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser Trp Gly
420 425 430
Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys Val Ser
435 440 445
Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr
450 455 460
<210> 19
<211> 461
<212> PRT
<213> 人工序列
<220>
<223> 重组fIX
<400> 19
Met Gln Arg Val Asn Met Ile Met Ala Glu Ser Pro Gly Leu Ile Thr
1 5 10 15
Ile Cys Leu Leu Gly Tyr Leu Leu Ser Ala Glu Cys Thr Val Phe Leu
20 25 30
Asp His Glu Asn Ala Asn Lys Ile Leu Asn Arg Pro Lys Arg Tyr Asn
35 40 45
Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg Glu Cys
50 55 60
Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe Glu Asn
65 70 75 80
Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly Asp Gln
85 90 95
Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp Asp Ile
100 105 110
Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys Asn Cys
115 120 125
Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu Gln Phe
130 135 140
Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr Glu Gly
145 150 155 160
Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val Pro Phe
165 170 175
Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr Arg Ala
180 185 190
Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu Ala Glu
195 200 205
Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn Asp Phe
210 215 220
Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe Pro Trp
225 230 235 240
Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly Ser Ile
245 250 255
Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu Thr Gly
260 265 270
Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu Thr Glu
275 280 285
His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His His Asn
290 295 300
Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu Leu Glu
305 310 315 320
Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile Cys Ile
325 330 335
Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser Gly Tyr
340 345 350
Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala Leu Val
355 360 365
Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys Leu Leu
370 375 380
Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly Phe His
385 390 395 400
Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro His Val
405 410 415
Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser Trp Gly
420 425 430
Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys Val Ser
435 440 445
Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr
450 455 460
<210> 20
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 20
tataaaaggc cagcagcagc ctgaccacat ctcatcctc 39
<210> 21
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 21
gttaattttt gtggcccttg cgatgtttgc tctggtta 38
<210> 22
<211> 14
<212> PRT
<213> 人工序列
<220>
<223> 重组肽连接物
<400> 22
Ser Phe Ser Gln Asn Pro Pro Val Leu Lys Arg His Gln Arg
1 5 10
<210> 23
<211> 24
<212> PRT
<213> 人工序列
<220>
<223> 重组肽连接物
<400> 23
Ser Phe Ala Gln Asn Ser Arg Pro Pro Ser Ala Ser Ala Pro Lys Pro
1 5 10 15
Pro Val Leu Arg Arg His Gln Arg
20
<210> 24
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 24
Arg His Gln Arg
1
<210> 25
<211> 6
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 25
gttaat 6
<210> 26
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 26
tataa 5
<210> 27
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 27
gttaa 5
<210> 28
<211> 4
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 28
gtta 4
<210> 29
<211> 3
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 29
gtt 3
<210> 30
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 30
ttaat 5
<210> 31
<211> 4
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 31
ttaa 4
<210> 32
<211> 3
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 32
tta 3
<210> 33
<211> 3
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 33
aat 3
<210> 34
<211> 56
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 34
gttaattttt gtggcccttg cgatgtttgc tctggttaat aatctcagga caaaca 56
<210> 35
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 35
ttaatttttg tggcccttgc gatgtttgct ctggttaata atctcaggac aaaca 55
<210> 36
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 36
taatttttgt ggcccttgcg atgtttgctc tggttaataa tctcaggaca aaca 54
<210> 37
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 37
aatttttgtg gcccttgcga tgtttgctct ggttaataat ctcaggacaa aca 53
<210> 38
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 38
atttttgtgg cccttgcgat gtttgctctg gttaataatc tcaggacaaa ca 52
<210> 39
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 39
tttttgtggc ccttgcgatg tttgctctgg ttaataatct caggacaaac a 51
<210> 40
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 40
ttttgtggcc cttgcgatgt ttgctctggt taataatctc aggacaaaca 50
<210> 41
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 41
tttgtggccc ttgcgatgtt tgctctggtt aataatctca ggacaaaca 49
<210> 42
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 42
ttgtggccct tgcgatgttt gctctggtta ataatctcag gacaaaca 48
<210> 43
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 43
ataatctcag gacaaaca 18
<210> 44
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 44
tgtggccctt gcgatgtttg ctctggttaa taatctcagg acaaaca 47
<210> 45
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 45
gtggcccttg cgatgtttgc tctggttaat aatctcagga caaaca 46
<210> 46
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 46
tggcccttgc gatgtttgct ctggttaata atctcaggac aaaca 45
<210> 47
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 47
gcccttgcga tgtttgctct ggttaataat ctcaggacaa aca 43
<210> 48
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 48
cccttgcgat gtttgctctg gttaataatc tcaggacaaa ca 42
<210> 49
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 49
ccttgcgatg tttgctctgg ttaataatct caggacaaac a 41
<210> 50
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 50
cttgcgatgt ttgctctggt taataatctc aggacaaaca 40
<210> 51
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 51
gttaattttt gtggcccttg cgatgtttgc tctggttaat aatctcagga caaac 55
<210> 52
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 52
gttaattttt gtggcccttg cgatgtttgc tctggttaat aatctcagga caaa 54
<210> 53
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 53
gttaattttt gtggcccttg cgatgtttgc tctggttaat aatctcagga caa 53
<210> 54
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 54
gttaattttt gtggcccttg cgatgtttgc tctggttaat aatctcagga caa 53
<210> 55
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 55
gttaattttt gtggcccttg cgatgtttgc tctggttaat aatctcagga ca 52
<210> 56
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 56
gttaattttt gtggcccttg cgatgtttgc tctggttaat aatctcagga c 51
<210> 57
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 57
gttaattttt gtggcccttg cgatgtttgc tctggttaat aatctcagga 50
<210> 58
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 58
gttaattttt gtggcccttg cgatgtttgc tctggttaat aatctcagg 49
<210> 59
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 59
gttaattttt gtggcccttg cgatgtttgc tctggttaat aatctcag 48
<210> 60
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 60
gttaattttt gtggcccttg cgatgtttgc tctggttaat aatctca 47
<210> 61
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 61
gttaattttt gtggcccttg cgatgtttgc tctggttaat aatctc 46
<210> 62
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 62
gttaattttt gtggcccttg cgatgtttgc tctggttaat aatct 45
<210> 63
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 63
gttaattttt gtggcccttg cgatgtttgc tctggttaat aatc 44
<210> 64
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 64
gttaattttt gtggcccttg cgatgtttgc tctggttaat aat 43
<210> 65
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 65
gttaattttt gtggcccttg cgatgtttgc tctggttaat aa 42
<210> 66
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 66
gttaattttt gtggcccttg cgatgtttgc tctggttaat aatctcagga caaac 55
<210> 67
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 67
ttaatttttg tggcccttgc gatgtttgct ctggttaata atctcaggac aaa 53
<210> 68
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 68
taatttttgt ggcccttgcg atgtttgctc tggttaataa tctcaggaca a 51
<210> 69
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 69
aatttttgtg gcccttgcga tgtttgctct ggttaataat ctcaggaca 49
<210> 70
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 70
atttttgtgg cccttgcgat gtttgctctg gttaataatc tcaggac 47
<210> 71
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 71
tttttgtggc ccttgcgatg tttgctctgg ttaataatct cagga 45
<210> 72
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 72
ttttgtggcc cttgcgatgt ttgctctggt taataatctc agg 43
<210> 73
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 73
tttgtggccc ttgcgatgtt tgctctggtt aataatctca g 41
<210> 74
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 74
ttgtggccct tgcgatgttt gctctggtta ataatctca 39
<210> 75
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 75
tgtggccctt gcgatgtttg ctctggttaa taatctc 37
<210> 76
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 76
gtggcccttg cgatgtttgc tctggttaat aatct 35
<210> 77
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 77
tggcccttgc gatgtttgct ctggttaata atc 33
<210> 78
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 78
gcccttgcga tgtttgctct ggttaataat 30
<210> 79
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 79
cccttgcgat gtttgctctg gttaataa 28
<210> 80
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 80
ccttgcgatg tttgctctgg ttaata 26
<210> 81
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 81
cttgcgatgt ttgctctggt taat 24
<210> 82
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 82
ttaatttttg tggcccttgc gatgtttgct ctggttaata atctcaggac aaac 54
<210> 83
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 83
taatttttgt ggcccttgcg atgtttgctc tggttaataa tctcaggaca aa 52
<210> 84
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 84
aatttttgtg gcccttgcga tgtttgctct ggttaataat ctcaggacaa 50
<210> 85
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 85
atttttgtgg cccttgcgat gtttgctctg gttaataatc tcaggacaa 49
<210> 86
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 86
tttttgtggc ccttgcgatg tttgctctgg ttaataatct caggaca 47
<210> 87
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 87
ttttgtggcc cttgcgatgt ttgctctggt taataatctc aggac 45
<210> 88
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 88
tttgtggccc ttgcgatgtt tgctctggtt aataatctca gga 43
<210> 89
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 89
ttgtggccct tgcgatgttt gctctggtta ataatctcag g 41
<210> 90
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 90
tgtggccctt gcgatgtttg ctctggttaa taatctcag 39
<210> 91
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 91
tggcccttgc gatgtttgct ctggttaata atctca 36
<210> 92
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 92
ggcccttgcg atgtttgctc tggttaataa tctc 34
<210> 93
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 93
gcccttgcga tgtttgctct ggttaataat ct 32
<210> 94
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 94
cccttgcgat gtttgctctg gttaataatc 30
<210> 95
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 95
ccttgcgatg tttgctctgg ttaataat 28
<210> 96
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 96
cttgcgatgt ttgctctggt taataa 26
<210> 97
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 97
cggaggagca aacaggg 17
<210> 98
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 98
cggaggagca aacaggggct aagtccac 28
<210> 99
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 99
ggctgctggt gaatattaac caaggtc 27
<210> 100
<211> 71
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 100
ggggaggctg ctggtgaata ttaaccaagg tcaccccagt tatcggagga gcaaacaggg 60
gctaagtcca c 71
<210> 101
<211> 71
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 101
ggggaggctg ctggtgaata ttaaccaagg tcaccccagt tatcggagga gcaaacaggg 60
actaagtcca c 71
<210> 102
<211> 220
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 102
ggggaggctg ctggtgaata ttaaccaagg tcaccccagt tatcggagga gcaaacaggg 60
gctaagtcca ctaggttaat cattaagtcg ttaatttttg tggcccttgc gatgtttgct 120
ctggttaata atctcaggac aaacagaggt taataatttt ccagatctct ctgagcaata 180
gtataaaagg ccagcagcag cctgaccaca tctcatcctc 220
<210> 103
<211> 171
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 103
cggaggagca aacaggggct aagtcgttaa tcattaagtc gttaattttt gtggcccttg 60
cgatgtttgc tctggttaat aatctcagga caaacagagg ttaataattt tccagatctc 120
tctgagcaat agtataaaag gccagcagca gcctgaccac atctcatcct c 171
<210> 104
<211> 173
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 104
ggctgctggt gaatattaac caaggtcgtt aatcattaag tcgttaattt ttgtggccct 60
tgcgatgttt gctctggtta ataatctcag gacaaacaga ggttaataat tttccagatc 120
tctctgagca atagtataaa aggccagcag cagcctgacc acatctcatc ctc 173
<210> 105
<211> 146
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 105
ggggaggctg ctggtgaata ttaaccaagg tcaccccagt tatcggagga gcaaacaggg 60
gctaagtcca cgaggttaat aattttccag atctctctga gcaatagtat aaaaggccag 120
cagcagcctg accacatctc atcctc 146
<210> 106
<211> 129
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 106
ggctgctggt gaatattaac caaggtcatc ggaggagcaa acagggacta agtcgaggtt 60
aataattttc cagatctctc tgagcaatag tataaaaggc cagcagcagc ctgaccacat 120
ctcatcctc 129
<210> 107
<211> 142
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 107
ggctgctggt gaatattaac caaggtcccc ttgctggtta ataatctcag ttaatttgtt 60
tgcacaaaca cggaggagca aacaggggag gttaataatt ttctataaaa ggccagcagc 120
agcctgacca catctcatcc tc 142
<210> 108
<211> 146
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 108
ggggaggctg ctggtgaata ttaaccaagg tcaccccagt tatcggagga gcaaacaggg 60
actaagtcca cgaggttaat aattttccag atctctctga gcaatagtat aaaaggccag 120
cagcagcctg accacatctc atcctc 146
<210> 109
<211> 8
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 109
tcatcctc 8
<210> 110
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 110
ggccagcagc agcctgacca catc 24
<210> 111
<211> 71
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 111
ggggaggctg ctggtgaata ttaaccaagg tcaccccagt tatcggagga gcaaacaggg 60
gctaagtcca c 71
<210> 112
<211> 255
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 112
gttaatcatt aagtcgttaa tcattaactt aggtcaaagg tcagacaatg ttgactctcg 60
ttaatgatta accggaattg ttgacttgag gttaataatt ttccagatct ctctgagcaa 120
tagtataaaa ggccagcagc agcctgacca catctcatcc tcctctaagg taaatataaa 180
atttttaagt gtataatgtg ttaaactact gattctaatt gtttgtgtat tttagattcc 240
aacctatgga actga 255
<210> 113
<211> 94
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 113
gttaattttt aaaaagcagt caaaagtcca agtggccctt gcgagcattt actctctctg 60
tttgctctgg ttaataatct caggagcaca aaca 94
<210> 114
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 114
gaggttaata attttccaga tctctctgag caatagtata aaa 43
<210> 115
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 115
agtcatatgt ttgctcactg aaggttacta gttaacaggc atcccttaaa cagga 55
<210> 116
<211> 108
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 116
gttaatcatt aacttaaaaa gcagtcaaaa gtccaaaggt caaaggtcag agcatttact 60
ctctccaatg ttgactctcg ttaatgatta aggagcaatt gttgactt 108
<210> 117
<211> 72
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 117
gttaatcatt aacttaggtc aaaggtcaga caatgttgac tctcgttaat gattaaccgg 60
aattgttgac tt 72
<210> 118
<211> 151
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 118
gttaatcatt aacttaaaaa gcagtcaaaa gtccaaaggt caaaggtcag agcatttact 60
ctctccaatg ttgactctcg ttaatgatta aggagcaatt gttgacttga ggttaataat 120
tttccagatc tctctgagca atagtataaa a 151
<210> 119
<211> 115
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 119
gttaatcatt aacttaggtc aaaggtcaga caatgttgac tctcgttaat gattaaccgg 60
aattgttgac ttgaggttaa taattttcca gatctctctg agcaatagta taaaa 115
<210> 120
<211> 152
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 120
gttaatcatt aagtcgttaa tttttaaaaa gcagtcaaaa gtccaagtgg cccttgcgag 60
catttactct ctctgtttgc tctggttaat aatctcagga gcacaaacag aggttaataa 120
ttttccagat ctctctgagc aatagtataa aa 152
<210> 121
<211> 150
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 121
tgggcggagt gtcgttaatt tttaaaaagc agtcaaaagt ccaagtggcc cttgcgagca 60
tttactctct ctgtttgctc tggttaataa tctcaggagc acaaacagag gttaataatt 120
ttccagatct ctctgagcaa tagtataaaa 150
<210> 122
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 122
cccttgctgg ttaataatct cagttaattt gtttgcacaa aca 43
<210> 123
<211> 1467
<212> PRT
<213> 人工序列
<220>
<223> 重组fVIII
<400> 123
Met Gln Leu Glu Leu Ser Thr Cys Val Phe Leu Cys Leu Leu Pro Leu
1 5 10 15
Gly Phe Ser Ala Ile Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser
20 25 30
Trp Asp Tyr Arg Gln Ser Glu Leu Leu Arg Glu Leu His Val Asp Thr
35 40 45
Arg Phe Pro Ala Thr Ala Pro Gly Ala Leu Pro Leu Gly Pro Ser Val
50 55 60
Leu Tyr Lys Lys Thr Val Phe Val Glu Phe Thr Asp Gln Leu Phe Ser
65 70 75 80
Val Ala Arg Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile
85 90 95
Gln Ala Glu Val Tyr Asp Thr Val Val Val Thr Leu Lys Asn Met Ala
100 105 110
Ser His Pro Val Ser Leu His Ala Val Gly Val Ser Phe Trp Lys Ser
115 120 125
Ser Glu Gly Ala Glu Tyr Glu Asp His Thr Ser Gln Arg Glu Lys Glu
130 135 140
Asp Asp Lys Val Leu Pro Gly Lys Ser Gln Thr Tyr Val Trp Gln Val
145 150 155 160
Leu Lys Glu Asn Gly Pro Thr Ala Ser Asp Pro Pro Cys Leu Thr Tyr
165 170 175
Ser Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu
180 185 190
Ile Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Thr Arg Glu Arg
195 200 205
Thr Gln Asn Leu His Glu Phe Val Leu Leu Phe Ala Val Phe Asp Glu
210 215 220
Gly Lys Ser Trp His Ser Ala Arg Asn Asp Ser Trp Thr Arg Ala Met
225 230 235 240
Asp Pro Ala Pro Ala Arg Ala Gln Pro Ala Met His Thr Val Asn Gly
245 250 255
Tyr Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Lys Lys Ser
260 265 270
Val Tyr Trp His Val Ile Gly Met Gly Thr Ser Pro Glu Val His Ser
275 280 285
Ile Phe Leu Glu Gly His Thr Phe Leu Val Arg His His Arg Gln Ala
290 295 300
Ser Leu Glu Ile Ser Pro Leu Thr Phe Leu Thr Ala Gln Thr Phe Leu
305 310 315 320
Met Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His His
325 330 335
His Gly Gly Met Glu Ala His Val Arg Val Glu Ser Cys Ala Glu Glu
340 345 350
Pro Gln Leu Arg Arg Lys Ala Asp Glu Glu Glu Asp Tyr Asp Asp Asn
355 360 365
Leu Tyr Asp Ser Asp Met Asp Val Val Arg Leu Asp Gly Asp Asp Val
370 375 380
Ser Pro Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr
385 390 395 400
Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro
405 410 415
Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn
420 425 430
Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met
435 440 445
Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu
450 455 460
Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu
465 470 475 480
Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro
485 490 495
His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys
500 505 510
Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe
515 520 525
Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp
530 535 540
Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg
545 550 555 560
Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu
565 570 575
Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val
580 585 590
Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu
595 600 605
Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp
610 615 620
Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val
625 630 635 640
Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp
645 650 655
Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe
660 665 670
Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr
675 680 685
Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro
690 695 700
Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly
705 710 715 720
Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp
725 730 735
Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys
740 745 750
Asn Asn Ala Ile Glu Pro Arg Ser Phe Ala Gln Asn Ser Arg Pro Pro
755 760 765
Ser Ala Ser Ala Pro Lys Pro Pro Val Leu Arg Arg His Gln Arg Asp
770 775 780
Ile Ser Leu Pro Thr Phe Gln Pro Glu Glu Asp Lys Met Asp Tyr Asp
785 790 795 800
Asp Ile Phe Ser Thr Glu Thr Lys Gly Glu Asp Phe Asp Ile Tyr Gly
805 810 815
Glu Asp Glu Asn Gln Asp Pro Arg Ser Phe Gln Lys Arg Thr Arg His
820 825 830
Tyr Phe Ile Ala Ala Val Glu Gln Leu Trp Asp Tyr Gly Met Ser Glu
835 840 845
Ser Pro Arg Ala Leu Arg Asn Arg Ala Gln Asn Gly Glu Val Pro Arg
850 855 860
Phe Lys Lys Val Val Phe Arg Glu Phe Ala Asp Gly Ser Phe Thr Gln
865 870 875 880
Pro Ser Tyr Arg Gly Glu Leu Asn Lys His Leu Gly Leu Leu Gly Pro
885 890 895
Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr Phe Lys Asn
900 905 910
Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile Ser Tyr Pro
915 920 925
Asp Asp Gln Glu Gln Gly Ala Glu Pro Arg His Asn Phe Val Gln Pro
930 935 940
Asn Glu Thr Arg Thr Tyr Phe Trp Lys Val Gln His His Met Ala Pro
945 950 955 960
Thr Glu Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe Ser Asp Val
965 970 975
Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro Leu Leu Ile
980 985 990
Cys Arg Ala Asn Thr Leu Asn Ala Ala His Gly Arg Gln Val Thr Val
995 1000 1005
Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser
1010 1015 1020
Trp Tyr Phe Thr Glu Asn Val Glu Arg Asn Cys Arg Ala Pro Cys
1025 1030 1035
His Leu Gln Met Glu Asp Pro Thr Leu Lys Glu Asn Tyr Arg Phe
1040 1045 1050
His Ala Ile Asn Gly Tyr Val Met Asp Thr Leu Pro Gly Leu Val
1055 1060 1065
Met Ala Gln Asn Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly
1070 1075 1080
Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val Phe
1085 1090 1095
Ser Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Val Tyr Asn Leu
1100 1105 1110
Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys Val
1115 1120 1125
Gly Ile Trp Arg Ile Glu Cys Leu Ile Gly Glu His Leu Gln Ala
1130 1135 1140
Gly Met Ser Thr Thr Phe Leu Val Tyr Ser Lys Lys Cys Gln Thr
1145 1150 1155
Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile Thr
1160 1165 1170
Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu
1175 1180 1185
His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe
1190 1195 1200
Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His Gly
1205 1210 1215
Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile
1220 1225 1230
Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln
1235 1240 1245
Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe Gly
1250 1255 1260
Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro Pro
1265 1270 1275
Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser Ile
1280 1285 1290
Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser
1295 1300 1305
Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala
1310 1315 1320
Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp
1325 1330 1335
Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala
1340 1345 1350
Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val Asp
1355 1360 1365
Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly Val
1370 1375 1380
Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile Ser
1385 1390 1395
Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn Gly
1400 1405 1410
Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro Val
1415 1420 1425
Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile
1430 1435 1440
His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu Val
1445 1450 1455
Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1460 1465
<210> 124
<211> 1386
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 124
atgcagaggg tcaatatgat catggctgaa tctcctgggc tgatcaccat ttgcctgctg 60
ggatacctgc tgtctgctga gtgtacagtg ttcctggacc atgagaatgc caataagatc 120
ctgaacaggc ccaaaagata caattctgga aagctggagg aatttgtgca gggcaacctg 180
gagagggaat gcatggagga aaagtgtagc tttgaggaag ctagggaggt gtttgaaaac 240
acagagagga ccacagaatt ctggaagcag tatgtggatg gagatcagtg tgagtccaac 300
ccctgtctga atggagggtc ttgcaaagat gatatcaact cctatgagtg ctggtgtcct 360
tttggatttg aaggcaaaaa ttgtgagctg gatgtgacct gtaacatcaa gaatggcagg 420
tgtgagcagt tctgtaaaaa ctctgctgat aataaggtgg tctgcagctg tacagaaggc 480
tataggctgg ctgagaacca gaagagctgt gaaccagctg tgcccttccc ttgtgggagg 540
gtgtctgtca gccagacctc taagctgacc agagctgaga ctgtgttccc agatgtggat 600
tatgtcaact ccacagaggc tgaaaccatc ctggacaaca tcacccagtc tacccagtcc 660
ttcaatgact ttaccagagt ggtgggagga gaggatgcca aaccaggcca gttcccctgg 720
caggtggtcc tgaatgggaa ggtggatgct ttttgtgggg gatccattgt gaatgagaaa 780
tggattgtca cagctgctca ctgtgtggag acaggggtca agatcactgt ggtggctgga 840
gagcacaaca ttgaggaaac agaacatact gagcagaaga ggaatgtgat cagaatcatc 900
cctcaccata actacaatgc tgctatcaac aaatataatc atgacattgc cctgctggaa 960
ctggatgagc ctctggtgct gaacagctat gtcaccccaa tctgcattgc tgacaaagag 1020
tataccaata tcttcctgaa gtttggatct ggatatgtgt ctggatgggg aagggtcttc 1080
cacaagggca ggtctgccct ggtgctgcag tatctgaggg tgcctctggt ggacagagct 1140
acctgcctgc tgtctaccaa gttcaccatc tacaacaata tgttctgtgc tggatttcat 1200
gagggaggca gggactcctg tcagggggat tctggaggcc cacatgtgac agaggtggaa 1260
ggcaccagct tcctgactgg catcatctct tggggggagg aatgtgctat gaaggggaaa 1320
tatggaatct acaccaaagt gagcaggtat gtgaactgga tcaaagagaa gaccaaactg 1380
acctga 1386
<210> 125
<211> 4404
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 125
atgcagctgg agctctcaac ctgtgtgttc ctctgcctgc tccccctggg attttcagct 60
atcaggagat actatctggg agcagtggaa ctgtcctggg actacaggca gtcagagctg 120
ctcagagaac tgcatgtgga tactaggttc cctgcaacag ctcctggagc actgccactg 180
ggaccttcag tgctgtacaa gaaaactgtc tttgtggagt ttacagacca gctgttcagt 240
gtggccaggc ccaggccccc ctggatgggg ctgctgggac ccaccatcca ggctgaagtg 300
tatgatactg tggtggtgac cctgaaaaac atggcctctc atccagtcag cctgcatgct 360
gtgggagtga gcttctggaa gagcagtgag ggagctgagt atgaagacca tacctcacag 420
agggagaaag aagatgataa ggtgctgcca ggaaaaagcc agacctatgt gtggcaggtg 480
ctgaaggaga atggccctac agcttcagat cctccctgcc tcacatactc ttatctgagc 540
catgtggatc tggtgaagga cctcaatagt ggcctgattg gggcactgct ggtgtgcaga 600
gaggggtccc tcacaaggga aagaactcag aacctgcatg agtttgtcct gctctttgct 660
gtgtttgatg agggaaagtc ctggcactca gcaaggaatg acagctggac cagggctatg 720
gacccagcac cagccagagc tcagccagct atgcacactg tcaatggcta tgtgaatagg 780
tccctgcctg gactcattgg ctgccataag aaatcagtct attggcatgt gattggaatg 840
ggcaccagcc cagaggtgca ttccatcttc ctggaaggcc acacatttct ggtcaggcac 900
catagacagg ccagcctgga gatcagccca ctgactttcc tcacagcaca gacatttctg 960
atggacctgg ggcagttcct gctcttttgc catatctcaa gtcaccatca tggagggatg 1020
gaggctcatg tcagggtgga aagctgtgca gaggaacctc agctgaggag gaaggcagat 1080
gaggaagagg actatgatga taacctgtat gactcagata tggatgtggt gaggctggat 1140
ggagatgatg tcagcccatt catccagatc aggtcagtgg ctaagaaaca ccctaagacc 1200
tgggtccact acattgcagc tgaagaggaa gattgggact atgcacccct ggtgctggcc 1260
ccagatgata gaagttacaa atctcagtat ctgaacaatg ggccccagag gattggaagg 1320
aagtacaaga aagtgaggtt catggcttat actgatgaga cctttaagac aagagaggca 1380
atccagcatg aaagtggcat cctgggacca ctgctctatg gagaagtggg ggataccctg 1440
ctcatcatct tcaagaacca ggcctcaagg ccttacaata tctatcccca tggcatcaca 1500
gatgtgaggc ctctctacag caggagactg cccaagggag tcaaacacct caaggatttc 1560
cccatcctgc caggggaaat cttcaagtat aaatggacag tcactgtgga agatgggcca 1620
actaagtcag atcctaggtg cctgaccagg tactattcta gctttgtgaa catggagagg 1680
gacctggctt caggactgat tggacctctg ctcatctgct acaaagaatc agtggaccag 1740
aggggcaacc agatcatgag tgataagaga aatgtcatcc tgttctcagt gtttgatgag 1800
aataggagtt ggtatctgac agaaaacatc cagaggttcc tgcctaatcc tgcaggagtg 1860
cagctggagg acccagaatt tcaggcttca aacatcatgc atagtatcaa tggctatgtg 1920
tttgatagtc tgcagctctc tgtctgcctg catgaggtgg cctactggta tatcctcagc 1980
attggagctc agactgactt cctgagtgtg ttcttttcag gctacacatt caagcataag 2040
atggtctatg aagataccct gacactcttc cccttttctg gggagactgt gtttatgagc 2100
atggaaaacc caggcctgtg gattctgggg tgccacaaca gtgacttcag gaatagaggg 2160
atgactgctc tgctcaaagt gtcctcatgt gataagaata ctggagatta ctatgaggac 2220
tcttatgaag atatcagtgc atatctgctc tccaaaaaca atgccattga gcccaggtca 2280
tttgctcaga acagtagacc accttctgca agtgcaccaa agcctccagt gctgaggaga 2340
caccagaggg acatcagcct gccaaccttc cagcctgagg aagataaaat ggactatgat 2400
gatatcttct ccactgagac caagggggaa gattttgaca tctatggaga ggatgaaaac 2460
caggacccca ggtccttcca gaagaggacc agacactact ttattgcagc tgtggagcag 2520
ctgtgggact atggcatgtc tgaatcacct agagctctga ggaacagagc acagaatggg 2580
gaggtgccca ggttcaagaa agtggtgttc agagaatttg cagatggctc ttttacccag 2640
cctagctaca ggggggagct caacaagcat ctggggctgc tgggacccta tatcagagca 2700
gaggtggaag ataacatcat ggtgacattc aagaatcagg cctcaagacc ctacagtttt 2760
tatagttctc tgatcagcta cccagatgat caggagcagg gggctgaacc aaggcacaac 2820
tttgtgcagc ctaatgagac aagaacttac ttttggaagg tccagcatca catggctccc 2880
acagaggatg agtttgactg caaggcctgg gcatattttt ctgatgtgga cctggagaag 2940
gatgtgcata gtggcctcat tgggccactg ctcatctgca gggcaaacac actgaatgct 3000
gcacatggca ggcaggtcac tgtgcaggag tttgccctgt tctttacaat ctttgatgaa 3060
actaagtcct ggtacttcac agagaatgtg gaaaggaatt gcagagcccc ctgccatctc 3120
cagatggagg acccaactct gaaggaaaac tacaggttcc atgctatcaa tggatatgtc 3180
atggatacac tgccaggcct ggtgatggca cagaaccaga ggatcaggtg gtatctgctc 3240
agcatggggt ccaatgagaa tatccattct atccacttct caggacatgt cttttcagtg 3300
aggaagaaag aggaatataa aatggctgtg tacaatctgt atccaggggt ctttgagaca 3360
gtggaaatgc tgcctagcaa agtggggatc tggagaattg agtgcctcat tggagaacac 3420
ctgcaggcag ggatgtccac cacatttctg gtgtactcaa agaaatgcca gactcccctg 3480
gggatggcaa gtggacatat cagggacttc cagatcactg catcaggaca gtatggacag 3540
tgggcaccaa agctggctag gctccactat agtggctcta tcaatgcttg gagtaccaaa 3600
gagcctttct cttggatcaa ggtggatctg ctggccccca tgatcatcca tggaatcaaa 3660
acacagggag ctagacagaa gttcagctcc ctgtacatca gtcagtttat catcatgtat 3720
tctctggatg ggaagaaatg gcagacctac aggggcaata gcactgggac actgatggtc 3780
ttctttggaa atgtggattc aagtggcatc aagcacaaca tcttcaatcc tcccatcatt 3840
gccaggtaca tcagactgca tcccacacac tattcaatca ggagtactct cagaatggag 3900
ctgatggggt gtgacctcaa cagctgctcc atgccactgg gaatggaatc caaggcaatc 3960
tcagatgccc agatcactgc ttctagctac ttcaccaata tgtttgcaac atggtcaccc 4020
agtaaagcaa ggctgcacct ccagggaagg tccaatgctt ggagacccca ggtgaacaat 4080
ccaaaggagt ggctgcaggt ggactttcag aaaaccatga aggtcacagg ggtgactacc 4140
cagggagtga aaagtctgct cacctctatg tatgtcaagg agttcctgat ctcctcaagt 4200
caggatggcc accagtggac actgttcttt cagaatggca aggtcaaagt gttccagggg 4260
aatcaggaca gctttacacc agtggtgaac agcctggacc cccctctgct cactagatat 4320
ctgagaatcc atccacagag ctgggtgcac cagattgcac tcagaatgga ggtcctgggc 4380
tgtgaagccc aggacctgta ttga 4404
<210> 126
<211> 4374
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 126
atgcagattg agctcagcac ctgcttcttt ctgtgcctgc tcaggttctg cttttcagcc 60
acaaggagat actatctggg agctgtggaa ctgtcatggg attacatgca gagtgacctg 120
ggagagctcc ctgtggatgc taggttcccc ccaagggtcc caaagtcttt cccttttaat 180
accagtgtgg tctataagaa aacactcttt gtggaattta ctgatcacct gttcaacatt 240
gcaaagccaa ggcctccctg gatgggactg ctgggaccta ccatccaggc tgaggtgtat 300
gacactgtgg tcatcacact gaaaaacatg gcatctcacc ctgtcagcct gcatgcagtg 360
ggagtcagct actggaaggc ttcagaaggg gcagagtatg atgatcagac aagccagaga 420
gaaaaagagg atgataaggt gttcccagga gggagccata cttatgtgtg gcaggtcctg 480
aaggagaatg gcccaatggc cagtgaccca ctgtgcctca cctactcata tctgagtcat 540
gtggacctgg tcaaggatct caactcaggc ctgattgggg cactgctggt gtgcagggaa 600
ggctcactgg ccaaggagaa aacccagaca ctgcataagt tcatcctgct ctttgctgtg 660
tttgatgaag ggaaatcttg gcacagtgag accaagaaca gtctgatgca ggacagggat 720
gctgcttctg ccagagcttg gcccaagatg cacacagtga atggatatgt caataggtcc 780
ctgccaggac tcattggctg ccacagaaag tcagtgtatt ggcatgtcat tggaatgggc 840
accacaccag aagtgcacag catcttcctg gaggggcata cctttctggt caggaaccac 900
aggcaggcca gcctggagat cagcccaatc accttcctga cagcccagac tctgctcatg 960
gatctggggc agttcctgct cttttgccac atcagctccc accagcatga tggaatggag 1020
gcatatgtga aagtggactc ctgcccagag gaaccacagc tgaggatgaa gaacaatgag 1080
gaagctgaag actatgatga tgacctgaca gactcagaga tggatgtggt caggtttgat 1140
gatgataaca gcccctcctt tatccagatc agaagtgtgg ccaagaaaca cccaaagaca 1200
tgggtccatt acattgcagc tgaggaagag gactgggatt atgcacctct ggtgctggcc 1260
ccagatgata gatcctacaa atcacagtat ctgaacaatg gaccccagag gattggcaga 1320
aagtacaaga aagtgaggtt catggcctat actgatgaaa catttaagac tagagaagct 1380
atccagcatg agtcaggcat cctgggacca ctgctctatg gagaagtggg ggacaccctg 1440
ctcatcatct tcaagaacca ggcttccagg ccatacaata tctatcctca tggcatcaca 1500
gatgtgagac cactctactc aaggagactg cctaagggag tcaaacacct caaggacttc 1560
cctatcctgc caggggaaat ctttaagtat aaatggactg tgacagtgga ggatgggccc 1620
actaagagtg acccaaggtg cctgaccaga tactattcaa gttttgtgaa tatggaaagg 1680
gatctggcat caggactgat tggacctctg ctcatctgct acaaagagag tgtggatcag 1740
aggggcaacc agatcatgtc agacaagagg aatgtgatcc tgttcagtgt ctttgatgaa 1800
aacaggtctt ggtatctgac agagaacatc cagagattcc tgccaaatcc tgcaggggtg 1860
cagctggaag atccagagtt tcaggcctca aacatcatgc atagtatcaa tggatatgtg 1920
tttgacagtc tgcagctctc tgtgtgcctg catgaagtgg cctactggta tatcctgtcc 1980
attggagctc agacagattt cctgagtgtg ttcttttcag gctacacttt taagcataaa 2040
atggtctatg aggacacact gactctcttc ccttttagtg gggaaacagt gtttatgagc 2100
atggagaatc cagggctgtg gattctggga tgccacaaca gtgatttcag gaatagaggc 2160
atgactgctc tgctcaaagt gtctagctgt gacaagaaca caggggacta ctatgaagat 2220
tcttatgagg acatcagtgc ttatctgctc tccaaaaaca atgcaattga acccagatca 2280
ttcagtcaga atccacctgt gctgaagagg caccagagag agatcactag gactaccctg 2340
cagtcagatc aggaagagat tgactatgat gataccatct cagtggaaat gaagaaagag 2400
gactttgata tctatgatga agatgagaac cagagtccaa ggtctttcca gaagaaaacc 2460
agacattact ttattgctgc agtggagagg ctgtgggatt atggaatgtc ctcaagtcca 2520
catgtgctga ggaatagggc acagtctggc agtgtccctc agttcaagaa agtggtcttc 2580
caggagttta cagatggcag cttcactcag cctctgtaca ggggagaact caatgagcac 2640
ctggggctgc tgggacccta tatcagagct gaagtggagg ataacatcat ggtcaccttc 2700
aggaatcagg cttcaagacc ctacagtttt tattctagcc tgatcagcta tgaagaggac 2760
cagaggcagg gagctgaacc taggaaaaac tttgtgaagc caaatgagac caaaacatac 2820
ttttggaagg tccagcacca catggcacca accaaagatg agtttgattg caaggcatgg 2880
gcctattttt cagatgtgga tctggagaag gatgtccaca gtggcctcat tgggcctctg 2940
ctggtgtgcc atactaacac cctgaatcca gctcatggca ggcaggtgac agtccaggag 3000
tttgcactgt tctttaccat ctttgatgag acaaagtcct ggtacttcac tgaaaacatg 3060
gagaggaatt gcagagctcc ttgcaacatc cagatggaag accccacctt caaggagaac 3120
tacagatttc atgcaatcaa tgggtatatc atggatacac tgccaggact ggtgatggcc 3180
caggaccaga ggatcagatg gtatctgctc agcatggggt ccaatgagaa tatccactct 3240
atccatttca gtggacatgt gtttacagtc agaaagaaag aagagtataa aatggccctg 3300
tacaacctct atccaggagt gtttgaaaca gtggagatgc tgccaagcaa ggctgggatc 3360
tggagggtgg aatgcctcat tggggagcac ctgcatgcag gaatgtcaac cctgtttctg 3420
gtctacagta ataagtgcca gacacctctg ggaatggcaa gtggacatat cagggatttc 3480
cagatcactg ctagtggaca gtatggacag tgggcaccaa agctggctag actccactat 3540
tcaggctcaa tcaatgcttg gtccaccaaa gagccattct catggatcaa ggtggacctg 3600
ctggctccta tgatcatcca tggcatcaaa acacaggggg caaggcagaa gttctcctca 3660
ctgtacatct ctcagtttat catcatgtat agcctggatg gcaagaaatg gcagacctac 3720
aggggcaata gcacagggac tctgatggtg ttctttggca atgtggacag cagtgggatc 3780
aagcacaaca tcttcaatcc cccaatcatt gcaaggtaca tcagactgca ccccacccat 3840
tattcaatca ggagtacact caggatggaa ctgatggggt gtgatctcaa cagttgctct 3900
atgccactgg gaatggagtc caaggcaatc tcagatgccc agatcactgc tagctcctac 3960
ttcactaata tgtttgctac ctggagcccc tccaaagcaa ggctgcacct ccagggaagg 4020
agcaatgcat ggaggcctca ggtgaacaat cccaaggaat ggctgcaggt ggatttccag 4080
aaaactatga aggtgactgg agtcacaact cagggagtga aaagtctgct cacttctatg 4140
tatgtcaagg agttcctgat ctcaagttct caggatggcc accagtggac cctgttcttt 4200
cagaatggaa aggtgaaagt cttccagggc aatcaggatt cctttacacc agtggtcaac 4260
tcactggacc ctcccctgct cactagatat ctgagaatcc accctcagag ctgggtgcat 4320
cagattgctc tcagaatgga agtcctgggc tgtgaggcac aggacctgta ttga 4374
<210> 127
<211> 1386
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 127
atgcagaggg tgaatatgat tatggctgag tcccctgggc tgattaccat ttgcctgctg 60
ggatacctgc tgtctgctga gtgtacagtg ttcctggacc atgagaatgc aaataagatc 120
ctgaacaggc ccaaaagata taatagtgga aagctggagg aatttgtgca gggcaacctg 180
gagagagaat gcatggagga aaagtgtagc tttgaggaag ccagggaggt gtttgaaaat 240
acagagagaa ccacagaatt ctggaagcag tatgtggatg gagatcagtg tgagagcaac 300
ccctgtctga atggagggag ttgcaaagat gatatcaact catatgaatg ctggtgtcct 360
tttggatttg aaggcaaaaa ttgtgagctg gatgtgacct gtaacattaa gaatgggagg 420
tgtgagcagt tttgtaaaaa ctctgctgat aataaggtgg tctgcagttg tacagaaggg 480
tatagactgg ctgagaacca gaagtcctgt gaaccagctg tgcccttccc ttgtggaagg 540
gtgtctgtct cccagacttc aaaactgacc agagctgaga ctgtgtttcc tgatgtggat 600
tatgtcaaca gcacagaggc tgaaactatc ctggacaaca ttactcagtc tacccagagt 660
ttcaatgact ttaccagagt ggtgggagga gaggatgcta aaccaggcca gttcccctgg 720
caggtggtcc tgaatgggaa ggtggatgca ttttgtgggg gatctattgt gaatgagaaa 780
tggattgtca cagctgctca ctgtgtggaa actggggtca agatcacagt ggtggctgga 840
gagcacaaca ttgaggaaac agaacatact gagcagaaga ggaatgtgat cagaatcatt 900
cctcaccata actacaatgc agccatcaac aaatataatc atgacattgc cctgctggaa 960
ctggatgagc ctctggtgct gaacagctat gtcacaccaa tctgcattgc tgacaaggag 1020
tacactaaca tcttcctgaa gtttgggtca ggatatgtgt ctggatgggg aagagtcttc 1080
cacaagggca ggtctgcact ggtgctgcag tatctgagag tgcctctggt ggatagggcc 1140
acttgtctgc tgtctaccaa gttcaccatc tacaacaata tgttctgtgc tggatttcat 1200
gagggaggga gagactcctg tcagggagat tctggaggcc cacatgtgac agaggtggaa 1260
ggcaccagct tcctgacagg catcatttcc tggggggagg aatgtgcaat gaaggggaaa 1320
tatggaatct acaccaaagt gagcaggtat gtgaactgga tcaaggaaaa gaccaaactg 1380
acatga 1386
<210> 128
<211> 252
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 128
tgtttgctgc ttgcaatgtt tgcccatttt agggtggaca caggacgctg tggtttctga 60
gccagggggc gactcagatc ccagccagtg gacttagccc ctgtttgctc ctccgataac 120
tggggtgacc ttggttaata ttcaccagca gcctcccccg ttgcccctct ggatccactg 180
cttaaatacg gacgaggaca gggccctgtc tcctcagctt caggcaccac cactgacctg 240
ggacagtgaa tc 252
<210> 129
<211> 4882
<212> DNA
<213> 人工序列
<220>
<223> 重组AAV序列
<400> 129
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc taccggtgtt aatcattaag tcgttaattt ttgtggccct 180
tgcgatgttt gctctggtta ataatctcag gacaaacaga ggttaataat tttccagatc 240
tctctgagca atagtataaa aggccagcag cagcctgacc acatctcatc ctcgtcgagc 300
caccatgcag atcgaactgt ctacctgttt ctttctgtgc ctgctgcggt tttgtttttc 360
cgctaccaga agatactacc tgggagccgt cgaactgagc tgggattaca tgcagtctga 420
cctgggagag ctgcccgtgg acgctagatt cccacctaga gtccctaagt ccttcccctt 480
caacaccagc gtggtctaca agaaaaccct gttcgtggag tttaccgacc acctgttcaa 540
catcgctaag cctagaccac catggatggg actgctggga ccaaccatcc aggccgaggt 600
gtacgacacc gtggtcatca ccctgaaaaa catggcttct caccccgtgt ccctgcatgc 660
tgtgggcgtc tcctactgga aggccagcga aggggctgag tatgacgatc agaccagcca 720
gcgggaaaaa gaggacgata aggtgttccc tggcgggtcc catacctacg tgtggcaggt 780
cctgaaggag aatggaccaa tggcttccga ccctctgtgc ctgacctact cttatctgtc 840
ccacgtggac ctggtcaagg atctgaacag cggcctgatc ggggctctgc tggtgtgtcg 900
cgaagggtcc ctggccaagg agaaaaccca gaccctgcat aagttcatcc tgctgttcgc 960
cgtgtttgac gaaggaaaaa gctggcactc tgagaccaag aactctctga tgcaggacag 1020
ggatgccgct tccgccagag cttggcccaa gatgcacacc gtgaacggct acgtcaatag 1080
gagcctgcct ggactgatcg gctgccacag aaagtccgtg tattggcatg tcatcggaat 1140
gggcaccacc cctgaagtgc acagcatctt cctggagggg catacctttc tggtccgcaa 1200
ccaccggcag gctagcctgg agatctctcc aatcaccttc ctgaccgccc agaccctgct 1260
gatggacctg ggacagttcc tgctgttttg ccacatctcc agccaccagc atgatggcat 1320
ggaggcttac gtgaaagtcg actcctgtcc cgaggaacct cagctgagga tgaagaacaa 1380
tgaggaagcc gaagactatg acgatgacct gaccgacagc gagatggatg tggtccgctt 1440
cgatgacgat aactctccct cctttatcca gatccggtcc gtggccaaga aacaccctaa 1500
gacctgggtc cattacatcg ccgctgagga agaggactgg gattatgctc cactggtgct 1560
ggcccccgac gatagatcct acaaaagcca gtatctgaac aatggacccc agaggatcgg 1620
cagaaagtac aagaaagtga ggttcatggc ttataccgat gagaccttta agaccagaga 1680
agccatccag cacgagtccg ggatcctggg acctctgctg tacggcgaag tgggggacac 1740
cctgctgatc atcttcaaga accaggccag caggccttac aatatctatc cacatggcat 1800
caccgatgtg agacctctgt actcccgccg gctgccaaag ggcgtgaaac acctgaagga 1860
cttcccaatc ctgcccgggg aaatctttaa gtataaatgg accgtcaccg tcgaggatgg 1920
gcccaccaag agcgacccta ggtgcctgac cagatactat tcttccttcg tgaatatgga 1980
gagagacctg gcttccggac tgatcggacc cctgctgatc tgttacaaag agagcgtgga 2040
tcagcgcggc aaccagatca tgtctgacaa gcggaatgtg atcctgttca gcgtctttga 2100
cgaaaaccgc tcttggtacc tgaccgagaa catccagcgg ttcctgccta atccagctgg 2160
agtgcagctg gaagatcccg agttccaggc ctctaacatc atgcattcca tcaatggcta 2220
cgtgttcgac tccctgcagc tgagcgtgtg cctgcacgag gtcgcttact ggtatatcct 2280
gagcatcgga gcccagaccg atttcctgtc tgtgttcttt tccggctaca cctttaagca 2340
taaaatggtg tatgaggaca ccctgaccct gttcccattt tccggcgaaa ccgtgttcat 2400
gagcatggag aatcccgggc tgtggatcct gggatgccac aactccgatt tcaggaatag 2460
agggatgacc gccctgctga aagtgagctc ttgtgacaag aacaccggag actactatga 2520
agatagctac gaggacatct ctgcttatct gctgtccaaa aacaatgcca tcgagcccag 2580
gagcttctct cagaaccctc cagtgctgaa gcgccaccag cgggagatca ccagaaccac 2640
cctgcagagc gatcaggaag agatcgacta cgacgatacc atctccgtgg aaatgaagaa 2700
agaggacttc gatatctatg acgaagatga gaaccagtct cccaggtcct tccagaagaa 2760
aaccagacat tactttatcg ccgctgtgga gcggctgtgg gactatggca tgtccagctc 2820
tcctcacgtg ctgagaaata gagctcagtc cggaagcgtc ccacagttca agaaagtggt 2880
cttccaggag tttaccgacg gaagctttac ccagccactg taccgcggcg aactgaacga 2940
gcacctgggg ctgctgggac cctatatccg ggctgaagtg gaggataaca tcatggtcac 3000
cttcaggaat caggccagca gaccctactc tttttattcc agcctgatct cctacgaaga 3060
ggaccagaga cagggagctg aaccaagaaa aaacttcgtg aagcctaatg agaccaaaac 3120
ctacttttgg aaggtgcagc accatatggc ccctaccaaa gacgagttcg attgcaaggc 3180
ctgggcttat tttagcgacg tggatctgga gaaggacgtc cactccggcc tgatcgggcc 3240
actgctggtg tgtcatacca acaccctgaa tccagctcac ggaaggcagg tgaccgtcca 3300
ggaattcgcc ctgttcttta ccatctttga tgagaccaag agctggtact tcaccgaaaa 3360
catggagagg aattgcagag ccccatgtaa catccagatg gaagacccca ccttcaagga 3420
gaactacaga tttcatgcta tcaatgggta tatcatggat accctgccag gactggtcat 3480
ggctcaggac cagaggatca gatggtacct gctgagcatg gggtctaacg agaatatcca 3540
ctccatccat ttcagcggac acgtgtttac cgtccgcaag aaagaagagt acaagatggc 3600
cctgtacaac ctgtatcccg gcgtgttcga aaccgtcgag atgctgcctt ccaaggctgg 3660
gatctggcgg gtggaatgcc tgatcgggga gcacctgcat gccggaatgt ctaccctgtt 3720
cctggtgtac tccaataagt gtcagacccc cctggggatg gctagcggac atatccgcga 3780
cttccagatc accgcttccg gacagtacgg acagtgggct cctaagctgg ctagactgca 3840
ctattctggc tccatcaacg cttggtctac caaagagcct ttctcctgga tcaaggtgga 3900
cctgctggct ccaatgatca tccatggcat caaaacccag ggggccaggc agaagttctc 3960
ttccctgtac atcagccagt ttatcatcat gtattctctg gatgggaaga aatggcagac 4020
ctacagaggc aattccaccg ggaccctgat ggtgttcttt ggcaacgtcg acagctctgg 4080
gatcaagcac aacatcttca atccccctat catcgcccgc tacatccggc tgcacccaac 4140
ccattattcc atccgcagca ccctgcggat ggagctgatg gggtgcgatc tgaacagctg 4200
ttctatgccc ctgggaatgg agtctaaggc catctccgac gctcagatca ccgcctccag 4260
ctacttcacc aatatgtttg ctacctggtc cccaagcaag gctagactgc atctgcaggg 4320
aagaagcaac gcttggagac cacaggtgaa caatcccaag gagtggctgc aggtcgactt 4380
ccagaaaacc atgaaggtga ccggagtcac cacccagggc gtgaaaagcc tgctgacctc 4440
tatgtacgtc aaggagttcc tgatctcttc cagccaggac gggcaccagt ggaccctgtt 4500
ctttcagaac ggaaaggtga aagtcttcca gggcaatcag gattccttta cccctgtggt 4560
caacagcctg gacccacccc tgctgaccag gtacctgaga atccacccac agtcctgggt 4620
gcatcagatc gctctgagga tggaagtcct gggctgcgag gcccaggacc tgtattgagc 4680
ggccgcaata aaatatcttt attttcatta catctgtgtg ttggtttttt gtgtgcaatt 4740
gaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag 4800
gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc agtgagcgag 4860
cgagcgcgca gctgcctgca gg 4882
<210> 130
<211> 5018
<212> DNA
<213> 人工序列
<220>
<223> 重组AAV序列
<400> 130
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc taccggtgtt aatcattaag tcgttaattt ttgtggccct 180
tgcgatgttt gctctggtta ataatctcag gacaaacaga ggttaataat tttccagatc 240
tctctgagca atagtataaa aggccagcag cagcctgacc acatctcatc ctcgtcgact 300
taattaaaag aggtaagggt ttaagggatg gttggttggt ggggtattaa tgtttaatta 360
cctggagcac ctgcctgaaa tcactttttt tcaggttggc tcgagccacc atgcagctgg 420
aactgtctac ctgtgtgttt ctgtgtctgc tgcctctggg gttttctgct atcaggagat 480
actatctggg agctgtggag ctgtcctggg actacaggca gtctgagctg ctgagagaac 540
tgcatgtgga taccagattc ccagctacag ctccaggagc tctgcctctg ggcccatctg 600
tgctgtacaa gaaaacagtc tttgtggagt ttacagacca gctgttctct gtggccaggc 660
caagaccacc ttggatggga ctgctgggac caaccatcca ggctgaggtg tatgatacag 720
tggtggtgac cctgaaaaac atggcctccc atcctgtgag cctgcatgct gtgggggtgt 780
ccttctggaa gtcctctgag ggagctgagt atgaagacca tacctcccag agggagaaag 840
aagatgataa ggtgctgcct ggcaaaagcc agacctatgt ctggcaggtg ctgaaggaga 900
atggaccaac tgcttctgac ccaccatgcc tgacctactc ttatctgtcc catgtggatc 960
tggtgaagga cctgaattct ggactgattg gagctctgct ggtgtgtaga gagggaagcc 1020
tgaccagaga aagaacccag aacctgcatg agtttgtcct gctgtttgct gtgtttgatg 1080
aagggaagag ctggcactct gccaggaatg actcctggac cagagctatg gatccagctc 1140
ctgctagagc tcagcctgct atgcacacag tcaatggcta tgtgaatagg tctctgccag 1200
gactgattgg ctgccataag aaatctgtct attggcatgt gattggaatg ggcaccagcc 1260
ctgaggtgca ttctatcttc ctggaaggcc acacctttct ggtcaggcac catagacagg 1320
cctctctgga gatctcccct ctgaccttcc tgacagctca gacctttctg atggacctgg 1380
ggcagttcct gctgttttgc catatctctt cccaccatca tggaggaatg gaggctcatg 1440
tcagggtgga atcctgtgct gaggaaccac agctgagaag aaaggctgat gaggaagagg 1500
actatgatga taacctgtat gactctgata tggatgtggt gaggctggat ggggatgatg 1560
tcagcccttt catccagatc aggtctgtgg ccaagaaaca tccaaagacc tgggtccact 1620
acattgctgc tgaagaggaa gattgggact atgcccccct ggtgctggct cctgatgata 1680
gatcctacaa aagccagtat ctgaacaatg ggccccagag gattggaagg aagtacaaga 1740
aagtgaggtt catggcctat acagatgaga cctttaagac cagagaggct atccagcatg 1800
aatctgggat cctgggacct ctgctgtatg gagaagtggg ggataccctg ctgatcatct 1860
tcaagaacca ggcctccagg ccatacaata tctatcccca tggcatcaca gatgtgagac 1920
cactgtacag caggagactg cccaaggggg tcaaacacct gaaggatttc cccatcctgc 1980
ctggagagat ctttaagtat aaatggacag tcacagtgga agatgggcct accaagtctg 2040
atccaaggtg cctgaccaga tactatagct cttttgtgaa catggagaga gacctggctt 2100
ctggactgat tggacccctg ctgatctgtt acaaagagtc tgtggaccag aggggcaacc 2160
agatcatgtc tgataagaga aatgtcatcc tgttctctgt gtttgatgag aacaggagct 2220
ggtacctgac agagaacatc cagaggttcc tgccaaatcc agctggagtg cagctggagg 2280
acccagaatt tcaggcttcc aacatcatgc atagcatcaa tggctatgtg tttgatagcc 2340
tgcagctgtc tgtctgcctg catgaggtgg cctactggta tatcctgtcc attggagctc 2400
agacagactt cctgtctgtg ttctttagtg ggtacacctt taagcataaa atggtgtatg 2460
aggataccct gaccctgttc cccttttctg gggagacagt gttcatgtcc atggaaaacc 2520
ctggcctgtg gatcctgggg tgccacaact ctgacttcag gaatagagga atgacagccc 2580
tgctgaaagt gtccagctgt gataagaata caggggatta ctatgaggac tcttatgaag 2640
atatctctgc ttatctgctg agcaagaaca atgccattga gcccaggtct tttgctcaga 2700
actccagacc tccatctgct tctgctccta agccacctgt gctgagaaga catcagaggg 2760
acatctccct gcctaccttc cagccagagg aagataaaat ggactatgat gatatcttca 2820
gcacagagac caagggggaa gattttgaca tctatggaga ggatgaaaac caggatccaa 2880
gatccttcca gaagagaacc agacactact ttattgctgc tgtggagcag ctgtgggact 2940
atgggatgtc tgaaagccca agggccctga ggaacagagc tcagaatgga gaggtgccca 3000
gattcaagaa agtggtgttc agagagtttg ctgatggcag ctttacccag ccatcttaca 3060
ggggggagct gaacaagcat ctggggctgc tgggacccta tatcagagct gaggtggaag 3120
ataacatcat ggtgaccttc aagaatcagg cttctaggcc ctactccttt tattcttccc 3180
tgatctccta ccctgatgat caggagcagg gagctgaacc taggcacaac tttgtgcagc 3240
caaatgagac cagaacctac ttttggaagg tgcagcatca catggctccc acagaggatg 3300
aatttgactg caaagcttgg gcctattttt ctgatgtgga cctggagaag gatgtgcatt 3360
ctggcctgat tgggcctctg ctgatctgta gggccaacac cctgaatgct gctcatggaa 3420
gacaggtcac agtgcaggag tttgctctgt tctttaccat ctttgatgaa accaagagct 3480
ggtacttcac agagaatgtg gaaaggaatt gcagagcccc ctgtcatctg cagatggagg 3540
accctaccct gaaggaaaac tacaggttcc atgccatcaa tggatatgtc atggataccc 3600
tgcctggcct ggtcatggct cagaaccaga ggatcagatg gtacctgctg tctatgggat 3660
ccaatgagaa tatccatagc atccacttct ctggccatgt cttttctgtg aggaagaaag 3720
aggaatacaa aatggctgtg tacaatctgt atcctggggt ctttgagaca gtggaaatgc 3780
tgccaagcaa agtgggaatc tggagaattg agtgcctgat tggggaacac ctgcaggctg 3840
ggatgagcac caccttcctg gtgtactcta agaaatgtca gaccccactg gggatggcct 3900
ctggacatat cagggacttc cagatcacag cttctggaca gtatggacag tgggctccaa 3960
agctggctag actgcactat tctggctcca tcaatgcctg gtctaccaaa gagccattct 4020
cctggatcaa ggtggacctg ctggccccca tgatcatcca tggaatcaaa acccagggag 4080
ctaggcagaa gttcagctct ctgtacatct cccagtttat catcatgtat agcctggatg 4140
ggaagaaatg gcagacctac agaggcaatt ccactgggac cctgatggtc ttctttggaa 4200
atgtggattc ctctggcatc aagcacaaca tcttcaatcc acccatcatt gccaggtaca 4260
tcaggctgca tcctacccac tatagcatca ggtctaccct gagaatggag ctgatgggat 4320
gtgacctgaa cagctgttct atgccactgg gcatggagtc caaggctatc tctgatgccc 4380
agatcacagc ttcttcctac ttcaccaata tgtttgctac ctggtcccca agcaaggcta 4440
gactgcacct gcagggaaga tccaatgctt ggagacccca ggtgaacaat cctaaggagt 4500
ggctgcaggt ggacttccag aaaaccatga aggtcacagg ggtgaccacc cagggagtga 4560
aatctctgct gacctccatg tatgtcaagg agttcctgat cagctcttcc caggatggcc 4620
accagtggac cctgttcttt cagaatggca aggtcaaagt gttccagggg aatcaggact 4680
cttttacccc agtggtgaac tccctggatc ctccactgct gaccaggtac ctgagaatcc 4740
atcctcagag ctgggtgcac cagattgctc tgagaatgga ggtcctggga tgtgaagctc 4800
aggacctgta ttgagcggcc gcaataaaat atctttattt tcattacatc tgtgtgttgg 4860
ttttttgtgt gcaattgagg aacccctagt gatggagttg gccactccct ctctgcgcgc 4920
tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc 4980
ggcctcagtg agcgagcgag cgcgcagctg cctgcagg 5018
<210> 131
<211> 137
<212> DNA
<213> 人工序列
<220>
<223> 重组启动子序列
<400> 131
gttaattttt aaaaagcagt caaaagtcca agtggccctt gcgagcattt actctctctg 60
tttgctctgg ttaataatct caggagcaca aacagaggtt aataattttc cagatctctc 120
tgagcaatag tataaaa 137

Claims (39)

1.一种重组核酸分子,包含:
肝特异性启动子,其包含长度不大于160个核苷酸的第一应答元件,所述第一应答元件包含:
HNF1a转录因子(TF)结合位点;
HNF1-1TF结合位点;
HNF4TF结合位点;
HNF3a TF结合位点;
HNF1-2TF结合位点;
HNF3-2TF结合位点;
HP1TF结合位点;
TATA框;以及
转录起始位点。
2.根据权利要求1所述的重组核酸分子,其中:
所述HNF1a TF结合位点包含SEQ ID NO:4的第1-12位核苷酸或由SEQ ID NO:4的第1-12位核苷酸组成;
所述HNF1-1TF结合位点包含SEQ ID NO:4的第16-23位核苷酸或由SEQ ID NO:4的第16-23位核苷酸组成;
所述HNF4TF结合位点包含SEQ ID NO:4的第26-36位核苷酸或由SEQ ID NO:4的第26-36位核苷酸组成;
所述HNF3a TF结合位点包含SEQ ID NO:4的第39-45位核苷酸或由SEQ ID NO:4的第39-45位核苷酸组成;
所述HNF1-2TF结合位点包含SEQ ID NO:4的第48-62位核苷酸或由SEQ ID NO:4的第48-62位核苷酸组成;
所述HNF3-2TF结合位点包含SEQ ID NO:4的第65-71位核苷酸或由SEQ ID NO:4的第65-71位核苷酸组成;
所述HP1TF结合位点包含SEQ ID NO:4的第75-87位核苷酸组或由SEQ ID NO:4的第75-87位核苷酸组成;
所述TATA框包含SEQ ID NO:4的第108-114位核苷酸或由SEQ ID NO:4的第108-114位核苷酸组成;以及
所述转录起始位点(TSS)包含SEQ ID NO:4的第116-146位核苷酸或由SEQ ID NO:4的第116-146位核苷酸组成。
3.根据权利要求1或权利要求2所述的重组核酸分子,其中所述第一应答元件从5’到3’包含HNF1a TF结合位点、HNF1-1TF结合位点、HNF4TF结合位点、HNF3a TF结合位点、HNF1-2TF结合位点、HNF3-2TF结合位点、HP1TF结合位点、TATA框和转录起始位点(TSS)。
4.根据前述权利要求中任意一项所述的重组核酸分子,其中所述第一应答元件的长度不超过150个核苷酸。
5.根据前述权利要求中任意一项所述的重组核酸分子,其中所述第一应答元件的长度为146个核苷酸。
6.根据前述权利要求中任意一项所述的重组核酸分子,其中所述第一应答元件包含与SEQ ID NO:4有至少90%相同性的核苷酸序列或由与SEQ ID NO:4有至少90%相同性的核苷酸序列组成。
7.根据权利要求6所述的重组核酸分子,其中所述第一应答元件包含SEQ ID NO:4所示的核苷酸序列或由SEQ ID NO:4所示的核苷酸序列组成。
8.根据前述权利要求中任意一项所述的重组核酸分子,其中所述启动子由所述第一应答元件组成。
9.根据权利要求1-8中任意一项所述的重组核酸分子,进一步包含位于所述第一应答元件上游的第二应答元件,所述第二应答元件包含以下之一:
HSh应答元件,包含与SEQ ID NO:111有至少90%相同性的核苷酸序列或由与SEQ IDNO:111有至少90%相同性的核苷酸序列组成;
5’HS应答元件,包含与SEQ ID NO:111的第6-32位核苷酸有至少90%相同性的核苷酸序列或由与SEQ ID NO:111的第6-32位核苷酸有至少90%相同性的核苷酸序列组成;或
3’HS应答元件,包含与SEQ ID NO:111的第44-68位核苷酸有至少90%相同性的核苷酸序列或由与SEQ ID NO:111的第44-68位核苷酸有至少90%相同性的核苷酸序列组成。
10.根据权利要求9所述的重组核酸分子,其中:
所述HSh应答元件包含SEQ ID NO:111所示的核苷酸序列或由SEQ ID NO:111所示的核苷酸序列组成;
所述5’HS应答元件包含SEQ ID NO:111的第6-32位核苷酸或由SEQ ID NO:111的第6-32位核苷酸组成;或
所述3’HS应答元件包含SEQ ID NO:111的第44-68位核苷酸或由SEQ ID NO:111的第44-68位核苷酸组成。
11.根据权利要求10所述的重组核酸分子,其中:
所述HSh应答元件由SEQ ID NO:111所示的核苷酸序列组成;
所述5’HS应答元件由SEQ ID NO:111的第6-32位核苷酸组成;或
所述3’HS应答元件由SEQ ID NO:111的第44-68位核苷酸组成。
12.根据权利要求9-11中任意一项所述的重组核酸分子,其中所述重组启动子包含与SEQ ID NO:102(HSh-HCB)、SEQ ID NO:104(5’HSh-HCB)或SEQ ID NO:103(3’HSh-HCB)之一有至少90%相同性的核苷酸序列或由与SEQ ID NO:102(HSh-HCB)、SEQ ID NO:104(5’HSh-HCB)或SEQ ID NO:103(3’HSh-HCB)之一有至少90%相同性的核苷酸序列组成。
13.根据权利要求12所述的重组核酸分子,其中所述重组启动子包含SEQ ID NO:102(HSh-HCB)、SEQ ID NO:104(5’HSh-HCB)或SEQ ID NO:103(3’HSh-HCB)所示的核苷酸序列或由SEQ ID NO:102(HSh-HCB)、SEQ ID NO:104(5’HSh-HCB)或SEQ ID NO:103(3’HSh-HCB)所示的核苷酸序列组成。
14.一种重组核酸分子,包含与SEQ ID NO:5(短ABP-HP1-God-TSS)、SEQ ID NO:7(ABP-HP1-God-TSS)、SEQ ID NO:105(HSh-SynO-TSS)、SEQ ID NO:106(sHS-SynO-TSS)、SEQ IDNO:107(Agro)、SEQ ID NO:108(HS-SynO-TSS)或SEQ ID NO:112(HNF1-短ABPExact-SynO-TSS-Int)中的任意一个有至少90%相同性的核苷酸序列或由与SEQ ID NO:5(短ABP-HP1-God-TSS)、SEQ ID NO:7(ABP-HP1-God-TSS)、SEQ ID NO:105(HSh-SynO-TSS)、SEQ ID NO:106(sHS-SynO-TSS)、SEQ ID NO:107(Agro)、SEQ ID NO:108(HS-SynO-TSS)或SEQ ID NO:112(HNF1-短ABPExact-SynO-TSS-Int)中的任意一个有至少90%相同性的核苷酸序列组成。
15.根据权利要求14所述的重组核酸分子,包含SEQ ID NO:5(短ABP1-God-TSS)、SEQID NO:7(ABP-HP1-God-TSS)、SEQ ID NO:105(HSh-SynO-TSS)、SEQ ID NO:106(sHS-SynO-TSS)、SEQ ID NO:107(Agro)、SEQ ID NO:108(HS-SynO-TSS)或SEQ ID NO:112(HNF1-短ABPExact-SynO-TSS-Int)中的任意一个所示的核苷酸序列或由SEQ ID NO:5(短ABP1-God-TSS)、SEQ ID NO:7(ABP-HP1-God-TSS)、SEQ ID NO:105(HSh-SynO-TSS)、SEQ ID NO:106(sHS-SynO-TSS)、SEQ ID NO:107(Agro)、SEQ ID NO:108(HS-SynO-TSS)或SEQ ID NO:112(HNF1-短ABPExact-SynO-TSS-Int)中的任意一个所示的核苷酸序列组成。
16.一种载体,包含前述权利要求中的任意一项所述的重组核酸分子。
17.根据权利要求16所述的载体,其中所述载体为病毒载体。
18.根据权利要求17所述的载体,其中所述病毒载体为AAV载体。
19.根据权利要求16所述载体,其中所述病毒载体为γ逆转录病毒载体、慢病毒载体或腺病毒载体。
20.根据权利要求16-19中的任意一项所述的载体,包含与所述启动子可操作连接的编码凝血因子的核酸分子。
21.根据权利要求20所述的载体,其中所述凝血因子为fVIII,或ET3或B结构域缺失型人(HSQ)fVIII变体。
22.根据权利要求21所述的载体,其中所述fVIII包含由SEQ ID NO:2、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:125或SEQ ID NO:126所示的核酸序列,或与SEQ ID NO:2、SEQID NO:11、SEQ ID NO:12、SEQ ID NO:125或SEQ ID NO:126有至少90%相同性的核酸序列。
23.根据权利要求20所述的载体,其中所述凝血因子为fIX。
24.根据权利要求23所述的载体,其中所述fIX包含由SEQ ID NO:8、SEQ ID NO:9、SEQID NO:10、SEQ ID NO:124或SEQ ID NO:127所示的核酸序列,或与SEQ ID NO:8、SEQ IDNO:9、SEQ ID NO:10、SEQ ID NO:124或SEQ ID NO:127有至少90%相同性的核酸序列。
25.一种组合物,包含药学上可接受的载剂中的权利要求16-24中的任意一项所述的载体。
26.一种分离的核酸分子,包含:
核酸序列,其编码fVIII并包含由SEQ ID NO:2、SEQ ID NO:11、SEQ ID NO:12、SEQ IDNO:125或SEQ ID NO:126之一所示的核苷酸序列,或与SEQ ID NO:2、SEQ ID NO:11、SEQ IDNO:12、SEQ ID NO:125或SEQ ID NO:126之一有至少90%相同性的核苷酸序列;或
核酸序列,其编码fIX并包含由SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:124或SEQ ID NO:127之一所示的核苷酸序列,或与SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:124或SEQ ID NO:127之一有至少90%相同性的核苷酸序列。
27.一种载体,包含与启动子可操作连接的权利要求26所述的重组核酸分子。
28.根据权利要求27所述的载体,其中所述载体为病毒载体。
29.根据权利要求28所述的载体,其中所述病毒载体为AAV载体。
30.根据权利要求28所述的载体,其中所述病毒载体为γ逆转录病毒载体、慢病毒载体或腺病毒载体。
31.一种组合物,包含药学上可接受的载剂中的权利要求27-30中的任意一项所述的载体。
32.一种在有需要的受试对象中诱导血液凝结的方法,包括给所述受试对象施用将治疗有效量的权利要求20-24或27-30中的任意一项所述的载体,或权利要求25或权利要求31所述的组合物。
33.一种治疗患有凝血障碍的受试对象的方法,包括选择患有凝血障碍的受试对象并给所述受试对象施用治疗有效量的权利要求20-24或27-30中的任意一项所述的载体,或权利要求25或权利要求31所述的组合物。
34.根据权利要求33所述的方法,其中所述凝血障碍为:
血友病A,并且给所述受试对象施用包含编码具有fVIII活性的蛋白质的核酸分子的载体;或
血友病B,并且给所述受试对象施用包含编码具有fIX活性的蛋白质的核酸分子的载体。
35.根据权利要求32-34中的任意一项所述的方法,其中静脉内施用所述载体。
36.根据权利要求32-34中的任意一项所述的方法,其中所述载体为AAV载体。
37.根据权利要求32-36中的任意一项所述的方法,其中所述载体与免疫抑制剂联合施用。
38.根据权利要求37所述的方法,其中所述免疫抑制剂为环孢素、他克莫司、雷帕霉素、环磷酰胺、氨甲蝶呤、硫唑嘌呤、巯嘌呤、氟二氧嘧啶、霉酚酸、更生霉素、芬戈莫德、T细胞受体抗体或结合蛋白、莫罗单抗-CD3、IL-2受体抗体或结合蛋白、巴利昔单抗、达克珠单抗、重组IFN-β、TNF-α抗体或结合蛋白、英夫利昔、依那西普或阿达木单抗。
39.根据权利要求20-24或27-30中的任意一项所述的载体或根据权利要求25或权利要求31所述的组合物在有需要的受试对象中诱导血液凝结或治疗患有凝血障碍的受试对象中的用途。
CN201680035258.2A 2015-04-16 2016-04-15 用于肝脏中蛋白质表达的重组启动子和载体及其用途 Active CN108093639B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210812376.7A CN115074366A (zh) 2015-04-16 2016-04-15 用于肝脏中蛋白质表达的重组启动子和载体及其用途
CN202210813636.2A CN115094062A (zh) 2015-04-16 2016-04-15 用于肝脏中蛋白质表达的重组启动子和载体及其用途

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201562148696P 2015-04-16 2015-04-16
US62/148,696 2015-04-16
US201562202133P 2015-08-06 2015-08-06
US62/202,133 2015-08-06
US201562212634P 2015-09-01 2015-09-01
US62/212,634 2015-09-01
PCT/US2016/027931 WO2016168728A2 (en) 2015-04-16 2016-04-15 Recombinant promoters and vectors for protein expression in liver and use thereof

Related Child Applications (2)

Application Number Title Priority Date Filing Date
CN202210812376.7A Division CN115074366A (zh) 2015-04-16 2016-04-15 用于肝脏中蛋白质表达的重组启动子和载体及其用途
CN202210813636.2A Division CN115094062A (zh) 2015-04-16 2016-04-15 用于肝脏中蛋白质表达的重组启动子和载体及其用途

Publications (2)

Publication Number Publication Date
CN108093639A true CN108093639A (zh) 2018-05-29
CN108093639B CN108093639B (zh) 2022-07-19

Family

ID=55910372

Family Applications (3)

Application Number Title Priority Date Filing Date
CN201680035258.2A Active CN108093639B (zh) 2015-04-16 2016-04-15 用于肝脏中蛋白质表达的重组启动子和载体及其用途
CN202210813636.2A Pending CN115094062A (zh) 2015-04-16 2016-04-15 用于肝脏中蛋白质表达的重组启动子和载体及其用途
CN202210812376.7A Pending CN115074366A (zh) 2015-04-16 2016-04-15 用于肝脏中蛋白质表达的重组启动子和载体及其用途

Family Applications After (2)

Application Number Title Priority Date Filing Date
CN202210813636.2A Pending CN115094062A (zh) 2015-04-16 2016-04-15 用于肝脏中蛋白质表达的重组启动子和载体及其用途
CN202210812376.7A Pending CN115074366A (zh) 2015-04-16 2016-04-15 用于肝脏中蛋白质表达的重组启动子和载体及其用途

Country Status (6)

Country Link
US (3) US10058624B2 (zh)
EP (2) EP3283126B1 (zh)
CN (3) CN108093639B (zh)
ES (1) ES2763551T3 (zh)
HK (1) HK1250021A1 (zh)
WO (1) WO2016168728A2 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108795986A (zh) * 2018-05-31 2018-11-13 深圳市免疫基因治疗研究院 一种a型血友病慢病毒载体、慢病毒及其制备方法和应用
CN112533645A (zh) * 2018-08-03 2021-03-19 桑格摩生物治疗股份有限公司 通过因子viii的表达改善临床参数
CN112608921A (zh) * 2020-12-23 2021-04-06 武汉枢密脑科学技术有限公司 用于肝脏中蛋白质表达的重组启动子、载体及其应用
WO2021129624A1 (zh) * 2019-12-23 2021-07-01 北京原基品德生物科技有限公司 一种分离的核酸分子及其应用
CN115244181A (zh) * 2020-03-11 2022-10-25 上海信致医药科技有限公司 阿司匹林化合物在增加核酸表达中的新型用途

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK3889173T3 (da) 2013-02-15 2023-10-09 Bioverativ Therapeutics Inc Optimeret faktor viii-gen
EP3151866B1 (en) 2014-06-09 2023-03-08 Voyager Therapeutics, Inc. Chimeric capsids
WO2016004113A1 (en) * 2014-06-30 2016-01-07 Biogen Ma Inc. Optimized factor ix gene
KR20170096998A (ko) 2014-11-05 2017-08-25 보이저 테라퓨틱스, 인크. 파킨슨병의 치료를 위한 aadc 폴리뉴클레오티드
GB201420139D0 (en) 2014-11-12 2014-12-24 Ucl Business Plc Factor IX gene therapy
CN107207556B (zh) 2014-11-14 2020-12-08 沃雅戈治疗公司 调节性多核苷酸
KR20230169197A (ko) 2014-11-14 2023-12-15 보이저 테라퓨틱스, 인크. 근위축성 측삭 경화증(als)을 치료하는 조성물 및 방법
WO2016094783A1 (en) 2014-12-12 2016-06-16 Voyager Therapeutics, Inc. Compositions and methods for the production of scaav
EP3283126B1 (en) * 2015-04-16 2019-11-06 Emory University Recombinant promoters and vectors for protein expression in liver and use thereof
JP7217630B2 (ja) 2016-02-01 2023-02-03 バイオベラティブ セラピューティクス インコーポレイテッド 最適化第viii因子遺伝子
US11326182B2 (en) 2016-04-29 2022-05-10 Voyager Therapeutics, Inc. Compositions for the treatment of disease
WO2017189964A2 (en) 2016-04-29 2017-11-02 Voyager Therapeutics, Inc. Compositions for the treatment of disease
CN110214187B (zh) 2016-05-18 2024-01-30 沃雅戈治疗公司 调节性多核苷酸
AU2017268382B2 (en) 2016-05-18 2023-09-28 Voyager Therapeutics, Inc. Compositions and methods of treating Huntington's disease
US10724050B1 (en) 2016-08-09 2020-07-28 Emory University CAS9 nucleic acid molecules and their use
CA3035522A1 (en) 2016-08-30 2018-03-08 The Regents Of The University Of California Methods for biomedical targeting and delivery and devices and systems for practicing the same
EP3568483A4 (en) * 2017-01-10 2020-08-19 Children's Medical Research Institute POLYNUCLEOTIDES AND VECTORS OF TRANSGEN EXPRESSION
AU2018261790A1 (en) 2017-05-05 2019-11-28 Voyager Therapeutics, Inc. Compositions and methods of treating amyotrophic lateral sclerosis (ALS)
SG11201909868YA (en) 2017-05-05 2019-11-28 Voyager Therapeutics Inc Compositions and methods of treating huntington's disease
JP2020519272A (ja) 2017-05-09 2020-07-02 エモリー ユニバーシティー 凝固因子変異体及びその使用
JOP20190269A1 (ar) 2017-06-15 2019-11-20 Voyager Therapeutics Inc بولي نوكليوتيدات aadc لعلاج مرض باركنسون
AU2018302016A1 (en) 2017-07-17 2020-02-06 The Regents Of The University Of California Trajectory array guide system
PE20200722A1 (es) * 2017-08-01 2020-07-21 Spark Therapeutics Inc Metodos de terapia genica del factor viii (fviii)
EP3662060A2 (en) 2017-08-03 2020-06-10 Voyager Therapeutics, Inc. Compositions and methods for delivery of aav
WO2019079242A1 (en) 2017-10-16 2019-04-25 Voyager Therapeutics, Inc. TREATMENT OF AMYOTROPHIC LATERAL SCLEROSIS (ALS)
CN111479924B (zh) 2017-10-16 2024-06-14 沃雅戈治疗公司 肌萎缩性侧索硬化症(als)的治疗
US10610606B2 (en) 2018-02-01 2020-04-07 Homology Medicines, Inc. Adeno-associated virus compositions for PAH gene transfer and methods of use thereof
CN112041437A (zh) 2018-02-19 2020-12-04 同源药物公司 用于恢复f8基因功能的腺相关病毒组合物和其使用方法
WO2019210187A1 (en) * 2018-04-26 2019-10-31 The University Of North Carolina At Chapel Hill Methods and compositions for treatment of hemophilia
US10842885B2 (en) 2018-08-20 2020-11-24 Ucl Business Ltd Factor IX encoding nucleotides
US20220054656A1 (en) * 2018-11-16 2022-02-24 Asklepios Biopharmaceutical, Inc. Therapeutic adeno-associated virus for treating pompe disease
CA3120014A1 (en) * 2018-11-19 2020-05-28 Uniqure Ip B.V. Liver-specific viral promoters and methods of using the same
EP3986481A2 (en) * 2019-06-20 2022-04-27 Takeda Pharmaceutical Company Limited Method of treatment with viral-based gene therapy
US20220325266A1 (en) * 2019-10-15 2022-10-13 The United States Of America,As Represented By The Secretary,Department Of Health And Human Services Synthetic genes for the treatment of propionic acidemia caused by mutations in propionyl-coa carboxylase beta
TW202140791A (zh) 2020-01-13 2021-11-01 美商霍蒙拉奇醫藥公司 治療苯酮尿症之方法
CA3171166A1 (en) 2020-02-13 2021-08-19 Tenaya Therapeutics, Inc. Gene therapy vectors for treating heart disease
WO2022140703A1 (en) * 2020-12-26 2022-06-30 Duke University Compositions and methods for treating and/or preventing glycogen storage diseases
US20240209392A1 (en) * 2021-04-26 2024-06-27 The Regents Of The University Of California High-throughput expression-linked promoter selection in eukaryotic cells
WO2023078220A1 (zh) * 2021-11-02 2023-05-11 苏州华毅乐健生物科技有限公司 分离的核酸分子及其应用
CN116555266A (zh) * 2023-06-09 2023-08-08 呈诺再生医学科技(北京)有限公司 肝脏特异性表达的重组启动子和载体及其在肝脏相关疾病治疗中的应用

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999029848A1 (en) * 1997-12-05 1999-06-17 The Immune Response Corporation Novel vectors and genes exhibiting increased expression
CN1329509A (zh) * 1998-10-20 2002-01-02 阿维根公司 用于由靶细胞表达因子viii的腺伴随病毒载体
CN1473943A (zh) * 2001-12-18 2004-02-11 三星电子株式会社 用于人HNF-1α基因扩增的多重PCR引物组
US20080220438A1 (en) * 1997-10-01 2008-09-11 Geron Corporation Telomerase Promoter Sequences for Screening Telomerase Modulators
CN102028943A (zh) * 2010-12-08 2011-04-27 中国人民解放军军事医学科学院微生物流行病研究所 一种呼吸道合胞病毒样颗粒疫苗及其制备方法
JP5576382B2 (ja) * 2008-10-01 2014-08-20 テット・システムズ・ゲーエムベーハー・ウント・カンパニー・カーゲー テトラサイクリン誘導可能な転写制御配列

Family Cites Families (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4886876A (en) 1983-03-31 1989-12-12 Scripps Clinic And Research Foundation Factor VIII coagulant polypeptides
US4757006A (en) 1983-10-28 1988-07-12 Genetics Institute, Inc. Human factor VIII:C gene and recombinant methods for production
EP0162067B1 (en) 1983-10-28 1992-07-15 Genetics Institute, Inc. Production of factor viii and related products
US5045455A (en) 1984-01-12 1991-09-03 Chiron Corporation Factor VIII:C cDNA cloning and expression
FI86885C (fi) 1984-04-20 1992-10-26 Genentech Inc Foerfarande foer framstaellning av human rekombinantfaktor viii och nukleinsyrasekvenser och vektorer anvaend daertill
US4965199A (en) 1984-04-20 1990-10-23 Genentech, Inc. Preparation of functional human factor VIII in mammalian cells using methotrexate based selection
EP0182448A3 (en) 1984-08-24 1987-10-28 Genetics Institute, Inc. Production of factor viii and related products
FI98829C (fi) 1986-01-27 1997-08-25 Chiron Corp Menetelmä rekombinoidun proteiinikompleksin valmistamiseksi, jolla on humaanitekijä VIII:C-aktiivisuutta
US5595886A (en) 1986-01-27 1997-01-21 Chiron Corporation Protein complexes having Factor VIII:C activity and production thereof
US5451521A (en) 1986-05-29 1995-09-19 Genetics Institute, Inc. Procoagulant proteins
US5422260A (en) 1986-05-29 1995-06-06 Genetics Institute, Inc. -Legal Affairs Human factor VIII:c muteins
US5149637A (en) 1987-04-06 1992-09-22 Scripps Clinic & Research Foundation Recombinant Factor VIIIC fragments
US5171844A (en) 1987-06-12 1992-12-15 Gist-Brocades N.W. Proteins with factor viii activity: process for their preparation using genetically-engineered cells and pharmaceutical compositions containing them
FR2619314B1 (fr) 1987-08-11 1990-06-15 Transgene Sa Analogue du facteur viii, procede de preparation et composition pharmaceutique le contenant
US5004803A (en) 1988-11-14 1991-04-02 Genetics Institute, Inc. Production of procoagulant proteins
KR960701899A (ko) 1989-11-17 1996-03-28 안네 제케르 인자 viii:c활성을 갖는 단백질 복합체 및 그의 제조
SE465222C5 (sv) 1989-12-15 1998-02-10 Pharmacia & Upjohn Ab Ett rekombinant, humant faktor VIII-derivat och förfarande för dess framställning
SE468050C (sv) 1991-03-15 1998-04-27 Pharmacia & Upjohn Ab Rekombinant derivat av human faktor VIII
US5661008A (en) 1991-03-15 1997-08-26 Kabi Pharmacia Ab Recombinant human factor VIII derivatives
CA2078721A1 (en) 1991-09-24 1993-03-25 Hiroshi Yonemura Process for preparing human coagulation factor viii protein complex
US5563045A (en) 1992-11-13 1996-10-08 Genetics Institute, Inc. Chimeric procoagulant proteins
WO1994011013A1 (en) 1992-11-13 1994-05-26 Duke University Chimeric blood coagulation proteins
ATE272122T1 (de) 1993-06-10 2004-08-15 Bayer Ag Vektoren und zelllinien von säugetieren mit erhöhter produktivität
US5681746A (en) 1994-12-30 1997-10-28 Chiron Viagene, Inc. Retroviral delivery of full length factor VIII
AU6486196A (en) 1995-07-11 1997-02-10 Chiron Corporation Novel factor viii:c polypeptide analogs with altered protease sites
US6200560B1 (en) 1998-10-20 2001-03-13 Avigen, Inc. Adeno-associated virus vectors for expression of factor VIII by target cells
AU2001266740A1 (en) * 2000-06-06 2001-12-17 Genelabs Technologies, Inc. Promoters for regulated gene expression
EP1395293B1 (en) * 2001-05-14 2009-07-22 Gbp Ip, Llc Lentiviral vectors encoding clotting factors for gene therapy
EP1572889B1 (en) * 2001-10-05 2008-12-17 Expression Therapeutics, LLC Nucleic acid and amino acid sequences encoding high-level expressor factor viii polypeptides and methods of use
ES2717377T3 (es) 2001-12-17 2019-06-20 Univ Pennsylvania Secuencias de serotipo 8 de virus adeno-asociado (AAV), vectores que las contienen y usos de las mismas
DE602004030327D1 (de) 2003-05-21 2011-01-13 Genzyme Corp Verfahren zur herstellung von präparationen rekombinanter aav-virionen, die weitgehend frei von leeren capsiden sind
EP2438931B1 (en) * 2004-09-22 2013-11-13 St. Jude Children's Research Hospital Improved expression of factor IX in gene therapy vectors
CN104087591A (zh) * 2006-06-19 2014-10-08 阿斯克肋匹奥生物制药公司 用于基因治疗的修饰的因子viii和因子ix基因和载体
CA2713338C (en) 2008-01-29 2021-10-26 Applied Genetic Technologies Corporation Recombinant virus production using mammalian cells in suspension
KR101190594B1 (ko) * 2008-02-14 2012-10-15 재단법인 목암생명공학연구소 유전자 치료용 코딩 서열의 발현에 적합한 발현 벡터
WO2010114948A2 (en) 2009-04-02 2010-10-07 University Of Florida Research Foundation, Inc. An inducible system for highly efficient production of recombinant adeno-associated virus (raav) vectors
WO2010141924A2 (en) 2009-06-05 2010-12-09 The General Hospital Corporation Enhanced engineered native promoters and uses thereof
GB0911870D0 (en) * 2009-07-08 2009-08-19 Ucl Business Plc Optimised coding sequence and promoter
MX340102B (es) 2010-01-28 2016-06-24 The Children's Hospital Of Philadelphia * Una plataforma de fabricacion ajustable en escala, para la purificacion de vector viral y vectores virales asi purificados para el uso en terapia de genes.
BR112013021494B1 (pt) 2011-02-22 2021-09-08 California Institute Of Technology Vetor viral, polinucleotídeo isolado, uso de um vírus adeno-associado (aav) recombinante e método para produzir o mesmo
GB201210357D0 (en) * 2012-06-12 2012-07-25 Ucl Business Plc Factor VIII sequences
JP6454643B2 (ja) * 2012-10-26 2019-01-16 フリーイェ・ユニヴェルシテイト・ブリュッセルVrije Universieit Brussel 血友病の肝臓指向性遺伝子治療のためのベクター並びにその方法及び使用
DK3889173T3 (da) * 2013-02-15 2023-10-09 Bioverativ Therapeutics Inc Optimeret faktor viii-gen
PT3044231T (pt) * 2013-09-12 2020-08-27 Biomarin Pharm Inc Vetores de avv compreendendo um gene que codifica o fator viii
WO2016004113A1 (en) * 2014-06-30 2016-01-07 Biogen Ma Inc. Optimized factor ix gene
CN107427557B (zh) * 2014-08-13 2022-01-04 费城儿童医院 用于包装和表达变体因子viii以治疗血友病的改良表达组件
EP3283126B1 (en) * 2015-04-16 2019-11-06 Emory University Recombinant promoters and vectors for protein expression in liver and use thereof

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080220438A1 (en) * 1997-10-01 2008-09-11 Geron Corporation Telomerase Promoter Sequences for Screening Telomerase Modulators
WO1999029848A1 (en) * 1997-12-05 1999-06-17 The Immune Response Corporation Novel vectors and genes exhibiting increased expression
CN1329509A (zh) * 1998-10-20 2002-01-02 阿维根公司 用于由靶细胞表达因子viii的腺伴随病毒载体
CN1473943A (zh) * 2001-12-18 2004-02-11 三星电子株式会社 用于人HNF-1α基因扩增的多重PCR引物组
JP5576382B2 (ja) * 2008-10-01 2014-08-20 テット・システムズ・ゲーエムベーハー・ウント・カンパニー・カーゲー テトラサイクリン誘導可能な転写制御配列
CN102028943A (zh) * 2010-12-08 2011-04-27 中国人民解放军军事医学科学院微生物流行病研究所 一种呼吸道合胞病毒样颗粒疫苗及其制备方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
COLLEEN NOTLEY等: "The canine factor VIII 3"-untranslated region and a concatemeric hepatocyte nuclear factor 1 regulatory element enhance factor VIII transgene expression in vivo", 《HUM GENE THER.》 *
G U RYFFEL等: "Liver cell specific gene transcription in vitro: the promoter elements HP1 and TATA box are necessary and sufficient to generate a liver-specific promoter", 《NUCLEIC ACIDS RES.》 *
NISHA NAIR等: "Computationally designed liver-specific transcriptional modules and hyperactive factor IX improve hepatic gene therapy", 《BLOOD》 *
P ROUET等: "A potent enhancer made of clustered liver-specific elements in the transcription control sequences of human alpha 1-microglobulin/bikunin gene", 《JOURNAL OF BIOLOGICAL CHEMISTRY》 *
R GODBOUT等: "Multiple regulatory elements in the intergenic region between the alpha-fetoprotein and albumin genes", 《MOL CELL BIOL.》 *
王松等: "肝富集转录因子在HBV基因转录与复制中的作用研究", 《第一次全国中西医结合传染病学术会议论文汇编》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108795986A (zh) * 2018-05-31 2018-11-13 深圳市免疫基因治疗研究院 一种a型血友病慢病毒载体、慢病毒及其制备方法和应用
CN112533645A (zh) * 2018-08-03 2021-03-19 桑格摩生物治疗股份有限公司 通过因子viii的表达改善临床参数
WO2021129624A1 (zh) * 2019-12-23 2021-07-01 北京原基品德生物科技有限公司 一种分离的核酸分子及其应用
CN113088519A (zh) * 2019-12-23 2021-07-09 北京原基品德生物科技有限公司 一种分离的核酸分子及其应用
CN114846141A (zh) * 2019-12-23 2022-08-02 苏州华毅乐健生物科技有限公司 一种分离的核酸分子及其应用
CN114846141B (zh) * 2019-12-23 2023-12-22 苏州华毅乐健生物科技有限公司 一种分离的核酸分子及其应用
CN113088519B (zh) * 2019-12-23 2024-02-02 苏州华毅乐健生物科技有限公司 一种分离的核酸分子及其应用
CN115244181A (zh) * 2020-03-11 2022-10-25 上海信致医药科技有限公司 阿司匹林化合物在增加核酸表达中的新型用途
CN112608921A (zh) * 2020-12-23 2021-04-06 武汉枢密脑科学技术有限公司 用于肝脏中蛋白质表达的重组启动子、载体及其应用
CN112608921B (zh) * 2020-12-23 2022-04-08 武汉枢密脑科学技术有限公司 用于肝脏中蛋白质表达的重组启动子、载体及其应用

Also Published As

Publication number Publication date
WO2016168728A2 (en) 2016-10-20
HK1250021A1 (zh) 2018-11-23
EP3283126A2 (en) 2018-02-21
US20180344877A1 (en) 2018-12-06
EP3626274A3 (en) 2020-06-17
ES2763551T3 (es) 2020-05-29
EP3626274A2 (en) 2020-03-25
CN115074366A (zh) 2022-09-20
EP3283126B1 (en) 2019-11-06
US20170326256A1 (en) 2017-11-16
US10058624B2 (en) 2018-08-28
CN108093639B (zh) 2022-07-19
CN115094062A (zh) 2022-09-23
US20210128751A1 (en) 2021-05-06
US10898588B2 (en) 2021-01-26
WO2016168728A3 (en) 2016-11-24

Similar Documents

Publication Publication Date Title
CN108093639A (zh) 用于肝脏中蛋白质表达的重组启动子和载体及其用途
AU2022200502B2 (en) Adeno-associated virus vector variants for high efficiency genome editing and methods thereof
US11279950B2 (en) Composition and methods for highly efficient gene transfer using AAV capsid variants
JP6831779B2 (ja) 修飾された第ix因子、並びに、細胞、器官及び組織への遺伝子導入のための組成物、方法及び使用
CN1856576B (zh) 腺伴随病毒(aav)进化支、序列、含有这些序列的载体及它们的应用
CN101511373B (zh) 用于基因治疗的修饰的因子ⅷ和因子ⅸ基因和载体
CN102994549B (zh) 增强腺相关病毒载体功能的方法
US7037713B2 (en) High-efficiency wild-type-free AAV helper functions
KR102665348B1 (ko) 지혈 장애의 치료를 위한 변이체 인자 viii의 패키징 및 발현을 위한 개선된 발현 카세트
CN108603174A (zh) 在适用于临床应用的无血清悬浮细胞培养体系中产生重组腺相关病毒(aav)载体的可扩展方法
CN113227385A (zh) 核酸分子及其用于非病毒基因疗法的用途
KR20200033840A (ko) 개선된 세포 트랜스펙션 및/또는 rAAV 벡터 생산을 위한 증진제
CN111247251A (zh) 核酸分子及其用途
KR20160135729A (ko) 뉴클레아제 없는 게놈 편집
JP2009535339A (ja) 低下されたキャプシド免疫原性を有する改変aavベクターおよびその使用
JP2001500497A (ja) 組換えアデノ随伴ウイルスに指図される遺伝子治療の方法
RU2819144C2 (ru) Молекулы нуклеиновой кислоты и пути их применения

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant