CN109072214B - 优化的因子viii基因 - Google Patents

优化的因子viii基因 Download PDF

Info

Publication number
CN109072214B
CN109072214B CN201780020889.1A CN201780020889A CN109072214B CN 109072214 B CN109072214 B CN 109072214B CN 201780020889 A CN201780020889 A CN 201780020889A CN 109072214 B CN109072214 B CN 109072214B
Authority
CN
China
Prior art keywords
seq
nucleotides
fviii
nucleic acid
polypeptide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201780020889.1A
Other languages
English (en)
Other versions
CN109072214A (zh
Inventor
谭思元
刘彤瑶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bioverativ Therapeutics Inc
Original Assignee
Bioverativ Therapeutics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bioverativ Therapeutics Inc filed Critical Bioverativ Therapeutics Inc
Priority to CN202310074417.1A priority Critical patent/CN116218863A/zh
Publication of CN109072214A publication Critical patent/CN109072214A/zh
Application granted granted Critical
Publication of CN109072214B publication Critical patent/CN109072214B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/745Blood coagulation or fibrinolysis factors
    • C07K14/755Factors VIII, e.g. factor VIII C (AHF), factor VIII Ag (VWF)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0008Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
    • A61K48/0016Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition wherein the nucleic acid is delivered as a 'naked' nucleic acid, i.e. not combined with an entity such as a cationic lipid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • A61P7/04Antihaemorrhagics; Procoagulants; Haemostatic agents; Antifibrinolytic agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/30Non-immunoglobulin-derived peptide or protein having an immunoglobulin constant or Fc region, or a fragment thereof, attached thereto
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/31Fusion polypeptide fusions, other than Fc, for prolonged plasma life, e.g. albumin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/15011Lentivirus, not HIV, e.g. FIV, SIV
    • C12N2740/15041Use of virus, viral particle or viral elements as a vector
    • C12N2740/15043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16041Use of virus, viral particle or viral elements as a vector
    • C12N2740/16043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/22Vectors comprising a coding region that has been codon optimised for expression in a respective host

Abstract

本公开提供密码子优化的因子VIII序列、包含密码子优化的因子VIII序列的载体和宿主细胞、由密码子优化的因子VIII序列编码的多肽和产生此类多肽的方法。本公开还提供治疗如血友病等出血病症的方法,所述方法包括向受试者施用密码子优化的因子VIII核酸序列或由其编码的多肽。

Description

优化的因子VIII基因
以电子方式提交的序列表的引用
呈ASCII文本文件形式的以电子方式提交的序列表(名称:2159_469PC02_SequenceListing_ST25.txt;大小:204,138字节;和创建日期:2017年1月31日)的内容以引用的方式整体并入本文中。
背景技术
凝血途径部分地涉及血小板的表面上因子VIIIa(FVIIIa)和因子IXa(FIXa)的酶复合物(Xase复合物)的形成。FIXa是一种丝氨酸蛋白酶,在其辅因子FVIIIa不存在下具有相对微弱催化活性。所述Xase复合物将因子X(FX)裂解成因子Xa(FXa),所述因子Xa(FXa)又与因子Va(FVa)相互作用以裂解凝血酶原并且产生凝血酶。血友病A是由FVIII(FVIII)基因中的突变和/或缺失,从而导致FVIII活性的缺陷而引起的出血病症(Peyvandi等人2006)。在一些情况下,患者由于如抗FVIII抗体等FVIII抑制剂的存在而具有降低的FVIII水平。
血友病A的特征在于自发出血和过多出血。通常在儿童早期开始的重复出血至肌肉和关节中随时间导致血友病性关节病和不可逆关节损害。这种损害是进行性的并且可导致严重受限的关节活动性、肌肉萎缩和慢性疼痛(Rodriguez-Merchan,E.C.,Semin.Thromb.Hemost.29:87-96(2003),其以引用的方式整体并入本文中)。
所述疾病可通过旨在使FVIII活性恢复至正常水平的1至5%以预防自发出血的替代疗法来治疗(参见例如Mannucci,P.M.等人,N.Engl.J.Med.344:1773-9(2001),以引用的方式整体并入本文中)。存在可用于按需要治疗出血事件或用于通过预防性治疗来预防出血事件发生的来源于血浆的重组FVIII产品。基于这些产品的半衰期(10-12小时)(WhiteG.C.等人,Thromb.Haemost.77:660-7(1997);Morfini,M.,Haemophilia 9(增刊1):94-99;discussion 100(2003)),治疗方案需要频繁静脉内施用,通常每周两次至三次用于预防并且每天一次至三次用于按需要治疗(Manco-Johnson,M.J.等人,N.Engl.J.Med.357:535-544(2007)),其中每一者均以引用的方式整体并入本文中。所述频繁施用是不便的并且昂贵的。
向患者提供低成本重组FVIII蛋白的主要障碍是商业制造的高成本。FVIII蛋白在异源表达***中表达不良,比相似大小的蛋白质低两个至三个数量级。(Lynch等人,Hum.Gene.Ther.;4:259–72(1993)。FVIII的不良表达部分地归因于FVIII编码序列中存在抑制FVIII表达的顺式作用元件,如转录沉默子元件(Hoeben等人,Blood85:2447-2454(1995))、基质附着样序列(MAR)(Fallux等人,Mol.Cell.Biol.16:4264-4272(1996))和转录延伸抑制元件(Koeberl等人,Hum.Gene.Ther.;6:469-479(1995))。
我们对FVIII表达的生物学的理解的进展已经引起了更有效FVIII变体的开发。例如,生物化学研究证明了FVIII B结构域对于FVIII辅因子活性并非必需的。B结构域的缺失导致了mRNA水平相对全长野生型FVIII的17倍增加和分泌蛋白的30%增加。(Toole等人,Proc Natl Acad Sci USA 83:5939–42(1986))。这引起了B结构域缺失(BDD)的FVIII蛋白浓缩物的开发,所述B结构域缺失(BDD)的FVIII蛋白浓缩物现在广泛用于临床中。然而,最近的研究指示了ER腔中的全长和BDD hFVIII错误折叠,导致未折叠蛋白反应(UPR)的活化和鼠科动物肝细胞的细胞凋亡。
因此,所属领域中需要在异源***中有效地表达的FVIII序列。
发明内容
公开了编码具有FVIII活性的多肽的密码子优化的核酸分子。一方面,本公开提供包含如下核苷酸序列的分离的核酸分子,所述核苷酸序列包含编码因子VIII(FVIII)多肽的N端部分的第一核酸序列和编码FVIII多肽的C端部分的第二核酸序列;其中所述第一核酸序列与(i)SEQ ID NO:3的核苷酸58-2277和2320-1791或(ii)SEQ ID NO:4的核苷酸58-2277和2320-1791具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;并且其中所述N端部分和所述C端部分合起来具有FVIII多肽活性。
本公开还提供包含如下核苷酸序列的分离的核酸分子,所述核苷酸序列包含编码FVIII多肽的N端部分的第一核酸序列和编码FVIII多肽的C端部分的第二核酸序列;其中所述第二核酸序列与(i)SEQ ID NO:5的核苷酸1792-2277和2320-4374或(ii)SEQ ID NO:6的1792-2277和2320-4374具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;并且其中所述N端部分和所述C端部分合起来具有FVIII多肽活性。
在一些实施方案中,本公开提供包含编码具有FVIII活性的多肽的核苷酸序列的分离的核酸分子,其中所述核苷酸序列包含与SEQ ID NO:1的核苷酸58-2277和2320-4374具有至少91%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施方案中,本公开提供包含编码具有FVIII活性的多肽的核苷酸序列的分离的核酸分子,其中所述核苷酸序列包含与SEQ ID NO:2的核苷酸58-2277和2320-4374具有至少约94%、至少约95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在一个实施方案中,本公开提供包含编码具有FVIII活性的多肽的核苷酸序列的分离的核酸分子,其中所述核苷酸序列包含与SEQ ID NO:70的核苷酸58-2277和2320-4374具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在另一实施方案中,本公开提供包含编码具有FVIII活性的多肽的核苷酸序列的分离的核酸分子,其中所述核苷酸序列包含与SEQ ID NO:71的核苷酸58-2277和2320-4374具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。
在一些实施方案中,本公开提供包含编码具有FVIII活性的多肽的核苷酸序列的分离的核酸分子,其中所述核苷酸序列包含与SEQ ID NO:3的核苷酸58-2277和2320-4374具有至少约92%、至少约93%、至少约94%、至少约95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。
在一些实施方案中,本公开提供包含编码具有FVIII活性的多肽的核苷酸序列的分离的核酸分子,其中所述核苷酸序列包含与SEQ ID NO:4的核苷酸58-2277和2320-4374具有至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。
在一些实施方案中,本公开提供包含编码具有FVIII活性的多肽的核苷酸序列的分离的核酸分子,其中所述核苷酸序列包含与SEQ ID NO:5的核苷酸58-2277和2320-4374具有至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。
在一些实施方案中,本公开提供包含编码具有FVIII活性的多肽的核苷酸序列的分离的核酸分子,其中所述核苷酸序列包含与SEQ ID NO:6的核苷酸58-2277和2320-4374具有至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。
在一些实施方案中,本公开提供一种增加具有FVIII活性的多肽在受试者中的表达的方法,所述方法包括向有需要的受试者施用本文所公开的分离的核酸分子或载体,其中所述多肽的表达相对于包含SEQ ID NO:16的参考核酸分子或包含所述参考核酸分子的载体增加。
在一些实施方案中,本公开提供一种治疗出血病症的方法,所述方法包括:向有需要的受试者施用本文所公开的核酸分子、载体或多肽。
实施方案
E1.一种包含如下核苷酸序列的分离的核酸分子,所述核苷酸序列包含编码因子VIII(FVIII)多肽的N端部分的第一核酸序列和编码FVIII多肽的C端部分的第二核酸序列;其中所述第一核酸序列与(i)SEQ ID NO:3的核苷酸58-2277和2320-1791或(ii)SEQ IDNO:4的核苷酸58-2277和2320-1791具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;并且其中所述N端部分和所述C端部分合起来具有FVIII多肽活性。
E2.E1的分离的核酸分子,其中所述第一核苷酸序列包含SEQ ID NO:3的核苷酸58-1791或SEQ ID NO:4的核苷酸58-1791。
E3.E1或E2的分离的核酸分子,其中所述第二核苷酸序列与SEQ ID NO:3的核苷酸1792-2277和2320-4374或SEQ ID NO:4的1792-2277和2320-4374具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。
E4.E1或E2的分离的核酸分子,其中所述第二核苷酸序列包含SEQ ID NO:3的核苷酸1792-2277和2320-4374或SEQ ID NO:4的核苷酸1792-2277和2320-4374。
E5.一种包含如下核苷酸序列的分离的核酸分子,所述核苷酸序列包含编码FVIII多肽的N端部分的第一核酸序列和编码FVIII多肽的C端部分的第二核酸序列;其中所述第二核酸序列与(i)SEQ ID NO:5的核苷酸1792-2277和2320-4374或(ii)SEQ ID NO:6的1792-2277和2320-4374具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;并且其中所述N端部分和所述C端部分合起来具有FVIII多肽活性。
E6.E5的分离的核酸分子,其中所述第二核酸序列包含SEQ ID NO:5的核苷酸1792-2277和2320-4374或SEQ ID NO:6的核苷酸1792-2277和2320-4374。
E7.E5或E6的分离的核酸分子,其中所述第一核酸序列与SEQ ID NO:5的核苷酸58-1791或SEQ ID NO:6的核苷酸58-1791具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。
E8.E5或E6的分离的核酸分子,其中所述第一核酸序列包含SEQ ID NO:5的核苷酸58-1791或SEQ ID NO:6的核苷酸58-1791。
E9.一种包含编码具有FVIII活性的多肽的核苷酸序列的分离的核酸分子,其中所述核苷酸序列包含与SEQ ID NO:1的核苷酸58-2277和2320-4374具有至少91%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。
E10.E9的分离的核酸分子,其中所述核苷酸序列包含SEQ ID NO:1的核苷酸58-2277和2320-4374。
E11.一种包含编码具有FVIII活性的多肽的核苷酸序列的分离的核酸分子,其中所述核苷酸序列包含与SEQ ID NO:2的核苷酸58-2277和2320-4374具有至少约94%、至少约95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。
E12.E10的分离的核酸分子,其中所述核苷酸序列包含SEQ ID NO:2的核苷酸58-2277和2320-4374。
E13.一种包含编码具有FVIII活性的多肽的核苷酸序列的分离的核酸分子,其中所述核苷酸序列包含与SEQ ID NO:70的核苷酸58-2277和2320-4374具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。
E14.E13的分离的核酸分子,其中所述核苷酸序列包含SEQ ID NO:70的核苷酸58-2277和2320-4374。
E15.一种包含编码具有FVIII活性的多肽的核苷酸序列的分离的核酸分子,其中所述核苷酸序列包含与SEQ ID NO:71的核苷酸58-2277和2320-4374具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。
E16.E15的分离的核酸分子,其中所述核苷酸序列包含SEQ ID NO:71的核苷酸58-2277和2320-4374。
E17.一种包含编码具有FVIII活性的多肽的核苷酸序列的分离的核酸分子,其中所述核苷酸序列包含与SEQ ID NO:3的核苷酸58-2277和2320-4374具有至少约92%、至少约93%、至少约94%、至少约95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。
E18.E17的分离的核酸分子,其中所述核苷酸序列包含SEQ ID NO:3的核苷酸58-2277和2320-4374。
E19.一种包含编码具有FVIII活性的多肽的核苷酸序列的分离的核酸分子,其中所述核苷酸序列包含与SEQ ID NO:4的核苷酸58-2277和2320-4374具有至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。
E20.E19的分离的核酸分子,其中所述核苷酸序列包含SEQ ID NO:4的核苷酸58-2277和2320-4374。
E21.一种包含编码具有FVIII活性的多肽的核苷酸序列的分离的核酸分子,其中所述核苷酸序列包含与SEQ ID NO:5的核苷酸58-2277和2320-4374具有至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。
E22.E21的分离的核酸分子,其中所述核苷酸序列包含SEQ ID NO:5的核苷酸58-2277和2320-4374。
E23.一种包含编码具有FVIII活性的多肽的核苷酸序列的分离的核酸分子,其中所述核苷酸序列包含与SEQ ID NO:6的核苷酸58-2277和2320-4374具有至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。
E24.E23的分离的核酸分子,其中所述核苷酸序列包含SEQ ID NO:6的核苷酸58-2277和2320-4374。
E25.E1至E24中任一者的分离的核酸分子,其中所述核苷酸序列进一步包含编码信号肽的核酸序列。
E26.E25的分离的核酸分子,其中所述信号肽是FVIII信号肽。
E27.E25或E26的分离的核酸分子,其中所述编码信号肽的核酸序列经过密码子优化。
E28.E25至E27中任一者的分离的核酸分子,其中所述编码信号肽的核酸序列与(i)SEQ ID NO:1的核苷酸1至57;(ii)SEQ ID NO:2的核苷酸1至57;(iii)SEQ ID NO:3的核苷酸1至57;(iv)SEQ ID NO:4的核苷酸1至57;(v)SEQ ID NO:5的核苷酸1至57;(vi)SEQ IDNO:6的核苷酸1至57;(vii)SEQ ID NO:70的核苷酸1至57;(viii)SEQ ID NO:71的核苷酸1至57;或(ix)SEQ ID NO:68的核苷酸1至57具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。
E29.E1至E28中任一者的分离的核酸分子,其中所述核酸分子包含选自由以下组成的组的一种或多种特性:
(a)所述核酸分子或其一部分的人密码子适应指数相对于SEQ ID NO:16增加;
(b)所述核苷酸序列或其一部分的最优密码子的频率相对于SEQ ID NO:16增加;
(c)所述核苷酸序列或其一部分含有与SEQ ID NO:16中的G/C核苷酸的百分比相比较高百分比的G/C核苷酸;
(d)所述核苷酸序列或其一部分的相对同义密码子使用相对于SEQ ID NO:16增加;
(e)所述核苷酸序列或其一部分的密码子的有效数目相对于SEQ ID NO:16降低;
(f)所述核苷酸序列含有相对于SEQ ID NO:16较少的MARS/ARS序列(SEQ ID NO:21和22);
(g)所述核苷酸序列含有相对于SEQ ID NO:16较少的去稳定元件(SEQ ID NO:23和24);和
(h)其任何组合。
E30.E1至E29中任一者的分离的核酸分子,其进一步包含异源核苷酸序列。
E31.E30的分离的核酸分子,其中所述异源核苷酸序列编码异源氨基酸序列,所述异源氨基酸序列是半衰期延长剂。
E32.E30或E31的分离的核酸分子,其中所述异源氨基酸序列是免疫球蛋白恒定区或其一部分、转铁蛋白、白蛋白或PAS序列。
E33.E30或E31的分离的核酸分子,其中所述异源氨基酸序列是Fc区。
E34.E30至E33中任一者的分离的核酸分子,其中所述异源氨基酸序列连接至由所述核苷酸序列编码的氨基酸序列的N端或C端或***由所述核苷酸序列编码的氨基酸序列中的两个氨基酸之间。
E35.E34的分离的核酸分子,其中所述异源氨基酸序列***选自表3的一个或多个***位点处的两个氨基酸之间。
E36.E30至E35中任一者的分离的核酸分子,其编码包含FVIII的单体-二聚体杂合分子。
E37.E1至E36中任一者的分离的核酸分子,其中所述FVIII多肽是全长FVIII或B结构域缺失的FVIII。
E38.E1至E37中任一者的分离的核酸分子,其可操作性连接至至少一个转录控制序列。
E39.一种载体,其包含E1至E38中任一者的核酸分子。
E40.E39的载体,其中所述载体是病毒载体。
E41.一种宿主细胞,其包含E1至E32中任一者的核酸分子或E39或E40的载体。
E42.E41的宿主细胞,其中所述宿主细胞是选自由以下组成的组:CHO细胞、HEK293细胞、BHK21细胞、PER.C6细胞、NS0细胞和CAP细胞。
E43.一种多肽,其由E1至E37中任一者的核酸分子或E39或40的载体编码或由E41或E42的宿主细胞产生。
E44.一种产生具有FVIII活性的多肽的方法,所述方法包括:在一定条件下培养E41或E42的宿主细胞,由此产生具有FVIII活性的多肽;和回收所述具有FVIII活性的多肽。
E45.E44的方法,其中所述具有FVIII活性的多肽的表达相对于在包括包含SEQ IDNO:16的参考核苷酸序列的相同条件下培养的宿主细胞增加。
E46.一种增加受试者中具有FVIII活性的多肽的表达的方法,所述方法包括向有需要的受试者施用E1至E38中任一者的分离的核酸分子或E39或E40的载体,其中所述多肽的表达相对于包含SEQ ID NO:16的参考核酸分子或包含所述参考核酸分子的载体增加。
E47.一种增加具有FVIII活性的多肽的表达的方法,所述方法包括在一定条件下培养E41或E42的宿主细胞,由此由所述核酸分子表达具有FVIII活性的多肽,其中所述具有FVIII活性的多肽的表达相对于在包括包含SEQ ID NO:16的参考核酸序列的相同条件下培养的宿主细胞增加。
E48.E44至E47中任一者的方法,其中所述FVIII多肽的表达增加至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍、至少约12倍、至少约13倍、至少约14倍、至少约15倍、至少约20倍、至少约25倍、至少约30倍、至少约35倍、至少约40倍、至少约50倍、至少约60倍、至少约70倍、至少约80倍、至少约90倍或至少约100倍。
E49.一种提高具有FVIII活性的多肽的产率的方法,所述方法包括在一定条件下培养E41或E42的宿主细胞,由此由所述核酸分子产生具有FVIII活性的多肽,其中具有FVIII活性的多肽的产率相对于在包括包含SEQ ID NO:16的参考核酸序列的相同条件下培养的宿主细胞增加。
E50.一种治疗出血病症的方法,所述方法包括:向有需要的受试者施用E1至E38中任一者的核酸分子、E39或E40的载体或E43的多肽。
E51.E50的方法,其中所述出血病症的特征在于FVIII缺陷。
E52.E50的方法,其中所述出血病症是血友病。
E53.E50的方法,其中所述出血病症是血友病A。
E54.E50至E53中任一者的方法,其中在施用后24小时的血浆FVIII活性相对于施用包含SEQ ID NO:16的参考核酸分子、包含所述参考核酸分子的载体或由所述参考核酸分子编码的多肽的受试者增加。
E55.E54的方法,其中所述血浆FVIII活性增加至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍、至少约12倍、至少约13倍、至少约14倍、至少约15倍、至少约20倍、至少约25倍、至少约30倍、至少约35倍、至少约40倍、至少约50倍、至少约60倍、至少约70倍、至少约80倍、至少约90倍或至少约100倍。
E56.E39或40的载体,其中所述载体是慢病毒载体。
E57.E39、E40和E56中任一者的载体,其进一步包含组织特异性启动子、组织特异性增强子或组织特异性启动子和组织特异性增强子两者。
E58.E57的载体,其中所述组织特异性启动子和/或所述组织特异性增强子选择性地增强肝细胞中所述转基因的表达。
E59.E57或E58的载体,其中所述组织特异性启动子包括选自由以下组成的组的启动子序列:由小鼠甲状腺素启动子(mTTR)、内源性人因子VIII启动子(F8)、人α-1-抗胰蛋白酶启动子(hAAT)、人白蛋白最小启动子和小鼠白蛋白启动子。
E60.E57至E59中任一者的载体,其中所述组织特异性启动子包括mTTR启动子。
E61.一种治疗出血病症的方法,所述方法包括:向有需要的受试者施用E56至E60中任一者的载体。
附图说明
图1A至图1J提供了编码B结构域缺失的因子VIII的密码子优化的核苷酸序列(SEQID NO:17)。图1A示出了coFVIII-3的核苷酸序列(SEQ ID NO:1)。图1B示出了coFVIII-4的核苷酸序列(SEQ ID NO:2)。图1C示出了coFVIII-5的核苷酸序列(SEQ ID NO:70)。图1D示出了coFVIII-6的核苷酸序列(SEQ ID NO:71)。图1E示出了coFVIII-52的核苷酸序列(SEQID NO:3)。图1F示出了coFVIII-62的核苷酸序列(SEQ ID NO:4)。图1G示出了coFVIII-25的核苷酸序列(SEQ ID NO:5)。图1H示出了coFVIII-26的核苷酸序列(SEQ ID NO:6)。图1I和图1J分别示出了B结构域缺失的(BDD-FVIII)的核苷酸序列和氨基酸序列(分别为SEQ IDNO:16和17)。
图2A至图2J示出了编码BDD-FVIII的密码子优化的核苷酸序列中的密码子使用偏好调节。图2A示出了编码BDD-FVIII(例如,非优化BDD-FVIII)的野生型核苷酸序列(在密码子优化之前)中的密码子的相对频率。所述非优化BDD-FVIII序列的人密码子适应指数(CAI)是74%。图2B示出了coFVIII-1变体序列中的密码子的相对频率,所述coFVIII-1变体序列具有88%的人CAI。图2C示出了coFVIII-3变体序列中的密码子的相对频率,所述coFVIII-3变体序列具有91%的人CAI。图2D示出了coFVIII-4变体序列中的密码子的相对频率,所述coFVIII-4变体序列具有97%的人CAI。图2E示出了coFVIII-5变体序列中的密码子的相对频率,所述coFVIII-5变体序列具有83%的人CAI。图2F示出了coFVIII-6变体序列中的密码子的相对频率,所述coFVIII-6变体序列具有83%的人CAI。图2G示出了coFVIII-52变体序列中的密码子的相对频率,所述coFVIII-52变体序列具有91%的人CAI。图2H示出了coFVIII-62变体序列中的密码子的相对频率,所述coFVIII-62变体序列具有91%的人CAI。图2I示出了coFVIII-25变体序列中的密码子的相对频率,所述coFVIII-25变体序列具有88%的人CAI。图2J示出了coFVIII-26变体序列中的密码子的相对频率,所述coFVIII-26变体序列具有88%的人CAI。
图3提供FVIII-303的质粒图,所述FVIII-303在pcDNA3骨架中包含在ET增强的转甲状腺素蛋白启动子的控制下的coFVIII-1,所述coFVIII-1定位于coFVIII-1翻译起始位点的上游并且包含合成增强子、mTIR增强子和mTIR启动子。
图4示出了在流体动力学注射5μg FVIII-303(coFVIII-1;圆形)或5μg FVIII-311(BDD-FVIII;正方形)之后HemA小鼠中的FVIII血浆活性的图形表示。FVIII血浆活性通过在注射后24、48和72小时进行FVIII特异性发色测定来测定。示出了针对FVIII-311的表达水平标准化的在72小时时的相对活性水平。
图5示出了pLV-coFVIII-52的质粒图,所述pLV-coFVIII-52在慢病毒质粒中包含在ET启动子的控制下的coFVIII-52,所述coFVIII-52定位于coFVIII-52翻译起始位点的上游并且包含合成增强子、mTTR增强子和mTTR启动子。
图6A至图6C示出了在流体动力学注射多种FVIII编码核苷酸之后HemA小鼠中的FVIII血浆活性的图形表示。FVIII血浆活性通过在注射后24、48和72小时进行FVIII特异性发色测定来测定。图6A示出了在流体动力学注射5μg LV-coFVIII-1(实心圆形)、5μg LV-coFVIII-3(三角形)、5μg LV-coFVIII-4(倒三角形)、5μg LV-coFVIII-5(菱形)或5μg LV-coFVIII-6(空心圆形)之后HemA小鼠中的FVIII血浆活性。图6B示出了在流体动力学注射5μg LV-coFVIII-1(圆形)、5μg LV-coFVIII-25(三角形)或5μg LV-coFVIII-26(倒三角形)之后HemA小鼠中的FVIII血浆活性。图6C示出了在流体动力学注射20μg LV-2116(非密码子优化的(WT)BDD-FVIII核苷酸序列;空心圆形)、20μg LV-coFVIII-1(三角形)、20μg LV-coFVIII-52(正方形)或20μg LV-coFVIII-62(实心圆形)之后HemA小鼠中的FVIII血浆活性。示出各质粒在72小时时的相对活性水平,如所指示的,针对LV-coFVIII-1(图6A、图6B和图6C)和/或LV-2116(图6C)的表达水平标准化。
图7示出了如与LV-2116(BDD-FVIII)对照相比,并且如通过FVIII特异性发色测定所测量,在注射每只小鼠1E8TU的包含coFVIII-1、coFVIII-5、coFVIII-52、coFVIII-6或coFVIII-62的慢病毒载体之后24小时HemA小鼠中的血浆FVIII活性。误差线指示标准偏差。
图8A至图8C提供编码融合至XTEN的BDD-FVIII的多种密码子优化的核苷酸序列。图8A示出了coFVIII-52-XTEN的核苷酸序列(SEQ ID NO:19),其中将编码具有144个氨基酸的XTEN的核苷酸序列(“XTEN144”;SEQ ID NO:18;加下划线)***coFVIII-52核苷酸序列内。图8B示出了coFVIII-1-XTEN的核苷酸序列(SEQ ID NO:20),其中将编码具有144个氨基酸的XTEN的核苷酸序列(“XTEN144”;SEQ ID NO:18;加下划线)***coFVIII-1核苷酸序列内。图8C示出了coFVIII-6-XTEN的核苷酸序列(SEQ ID NO:72),其中将编码具有144个氨基酸的XTEN的核苷酸序列(“XTEN144”;SEQ ID NO:18;加下划线)***coFVIII-6核苷酸序列(例如,对应于成熟FVIII序列的氨基酸残基745)内。
图9提供pLV-coFVIII-52-XTEN的质粒图,所述pLV-coFVIII-52-XTEN在慢病毒载体中包含在ET启动子的控制下的coFVIII-52-XTEN。以与pLV-coFVIII-52-XTEN相同的方式构建包含如本文所述的编码具有FVIII活性的多肽的剩余密码子优化的核酸分子中的每一者的慢病毒载体,其中***相同XTEN序列以替换FVIII的B结构域。
图10A和图10B示出了在注射包含编码BDD-FVIII的多种密码子优化的核苷酸序列的质粒DNA(图10A)或慢病毒载体(图10B)之后HemA小鼠中的FVIII活性。图10A示出了在流体动力学注射5μg FVIII-311(非密码子优化,BDD-FVIII编码核苷酸序列;正方形)、5μgFVIII-303(coFVIII-1;小圆形)或FVIII-306(coFVIII-1-XTEN144;大圆形)之后HemA小鼠中的FVIII血浆活性的图形表示。示出每种质粒在72小时时针对FVIII-311标准化的相对活性。图10B示出了如与LV-2116(BDD-FVIII)对照相比,并且如通过FVIII特异性发色测定所测量,在注射每只小鼠1E8TU的包含coFVIII-52或coFVIII-52-XTEN的慢病毒载体之后21天HemA小鼠中的血浆FVIII活性。误差线指示标准偏差。
图11A示出了全长成熟人因子VIII的氨基酸序列。图11B示出了全长人血管性血友病因子的氨基酸序列(SEQ ID NO:44)。图11C和图11D分别示出了具有42个氨基酸的XTEN多肽的氨基酸序列和核苷酸序列(XTEN AE42-4;分别为SEQ ID NO:46和47)。具有144个氨基酸的多种XTEN多肽的氨基酸序列在图11E、图11G、图11I、图11K、图11M、图11O、图11Q、图11S、图11U和图11W中示出(分别为SEQ ID NO:48、50、52、54、56、58、60、62、64和66),并且相应核苷酸序列在图11F、图11H、图11J、图11L、图11N、图11P、图11R、图11T、图11V和图11X中示出(分别为SEQ ID NO.49、51、53、55、57、59、61、63、65和67)。图11Y示出了ET启动子的核苷酸序列(SEQ ID NO:69)。图11Z示出了coFVIII-1的核苷酸序列(SEQ ID NO:68)(参见国际公布号WO 2014/127215,SEQ ID NO:1)。
图12A是在IV施用约1.5E10TU/kg的LV-wtBDD-FVIII(圆形)、LV-coFVIII-6(正方形)或LV-coFVIII-6XTEN(三角形)之后14天龄的HemA小鼠中的FVIII血浆活性(IU/mL)的图形表示。图12B是在通过IV施用约1.5E10TU/kg的表达wtBDD-FVIII、coFVIII-1、coFVIII-3、coFVIII-4、coFVIII-5、coFVIII-6、coFVIII-52、coFVIII-62、coFVIII-25或coFVIII-26的慢病毒载体治疗14天龄的HemA小鼠之后150天的载体拷贝数(VCN)的图形表示。图12C是在通过IV施用约1.5E10TU/kg的表达wtBDD-FVIII、coFVIII-1、coFVIII-3、coFVIII-4、coFVIII-5、coFVIII-6、coFVIII-52、coFVIII-62、coFVIII-25或coFVIII-26的慢病毒载体治疗14天龄的HemA小鼠之后21天的FVIII血浆活性(IU/mL)的图形表示。
图13A和图13B是说明用表达coFVIII-5变体的慢病毒治疗的五只HemA小鼠中的FVIII血浆活性水平(图13A)和抗FVIII抗体水平(图13B)的图形表示。通过静脉内注射向十四天龄的HemA同窝出生小鼠施用大约1.5E10TU/kg的表达coFVIII-5变体的慢病毒。各小鼠由数字指明(即,1、2、3、4和5;图13A和图13B)。
图14是在如通过慢病毒治疗后21天的FVIII血浆活性所证明的LV-FVIII表达水平与抗FVIII抗体的存在之间的关系的图形表示。各数据点对应于单一HemA小鼠。各小鼠通过静脉内注射接受1.5E10TU/kg的剂量的表达本文所公开的coFVIII变体之一的慢病毒。水平线指示平均FVIII血浆活性。
图15是在慢病毒治疗后150天时的每个细胞的载体拷贝数(VCN)与抗FVIII抗体的存在之间的关系的图形表示。各数据点对应于单一HemA小鼠。各小鼠通过静脉内注射接受1.5E10TU/kg的剂量的表达本文所公开的coFVIII变体之一的慢病毒。水平线指示平均VCN。
图16A和图16B是说明用表达coFVIII-52变体的慢病毒治疗的两只HemA小鼠(coFVIII-52-A和coFVIII-52-B)中的FVIII血浆活性水平(图16A)和抗FVIII抗体水平(图16B)的图形表示。通过静脉内注射向十四天龄的HemA同窝出生小鼠施用大约1.5E10TU/kg的表达coFVIII-52变体的慢病毒。图16C和图16D是示出从图16A和图16B的coFVIII-52-A(图16C)和coFVIII-52-B(图16D)小鼠收集的肝组织中的FVIII表达的RNA原位杂交染色(暗染色)的图像。
图17是示出用表达野生型B结构域缺的失FVIII(wtBDD-FVIII;三角形)、coFVIII-52XTEN(圆形)或coFVIII-6XTEN(倒三角形)变体的慢病毒治疗的HemA新生小鼠中的长期FVIII表达的图形表示。通过静脉内注射向新生HemA小鼠施用大约1.5A10TU/kg的表达wtBDD-FVIII、coFVIII-52XTEN或coFVIII-6XTEN的慢病毒。在大约16周内测量FVIII血浆活性。
图18是在施用1.3×109转导单位/kg的包含编码融合至XTEN的因子VIII的核苷酸的慢病毒载体(SEQ ID NO:72;LV-coFVIII-6-XTEN)之后HemA新生狗(S3或K4)中的循环FVIII水平的图形表示。由实线连接的正方形表示aPTT-S3样品,并且由虚线连接的三角形表示aPTT-K4样品。y轴示出了以正常值的百分比表示的血浆FVIII活性,其中正常人FVIII活性为100%。x轴示出了慢病毒治疗后的天数,其中慢病毒治疗在第0天施用。
图19A至图19C是全血止血的图形表示,如通过针对原生HemA狗(图19A)、在慢病毒治疗后2周的狗S3(图19B)和在慢病毒治疗后2周的狗K4(图19C)的旋转式血栓弹力描记(ROTEM)测定所监测。关于图19A至图19C中的每一者,凝固时间(CT)以秒(s)示出,凝块形成时间(CFT)以秒(s)示出,α角(α)以度(°)示出,CT后5分钟振幅(A5)以毫米(mm)示出,CT后20分钟振幅(A20)以毫米(mm)示出,并且最大凝块坚度(MCF)以毫米(mm)示出。图19D是表格,概述了针对图19A至图19C中展示的参数CT、CFT、α、A5、A2和MCF中的每一者的正常范围。
具体实施方式
本公开描述了编码具有因子VIII(FVIII)活性的多肽的密码子优化的基因。本公开针对编码具有因子VIII活性的多肽的密码子优化的核酸分子、包含优化的核酸分子的载体和宿主细胞、由优化的核酸分子编码的多肽和产生所述多肽的方法。本公开还针对治疗如血友病等出血病症的方法,所述方法包括向受试者施用优化的因子VIII核酸序列、包含所述优化的核酸序列的载体或由此编码的多肽。本公开通过提供优化的因子VIII序列满足了所属领域中的重要需要,所述优化的因子VIII序列在宿主细胞中展示了增加的表达,改进了产生重组因子VIII的方法中因子VIII蛋白的产率,并且当用于基因疗法方法中时潜在地引起较大的治疗功效。在某些实施方案中,本公开描述了一种包含如下核苷酸序列的分离的核酸分子,所述核苷酸序列与选自SEQ ID NO:1-14、70和71的核苷酸序列具有序列同源性。
本公开的示例性构建体说明于附图和序列表中。为了提供对本说明书和权利要求的清楚理解,下文提供以下定义。
I.定义
应注意,术语“一个(a)”或“一个(an)”实体是指一个或多个那一实体:例如,“一个核苷酸序列”应理解为表示一个或多个核苷酸序列。因而,术语“一个(a)”(或“一个(an)”)、“一个或多个”和“至少一个”在本文中可互换使用。
术语“约”在本文中用于意指大概、约略地、大约或在区域中。当术语“约”结合数值范围使用时,其通过在所陈述的数值上下延伸边界来修饰那一范围。通常,术语“约”在本文中用于修饰在所陈述的值上下的数值达10%的变化,向上或向下(更高或更低)。
出于本公开的目的,术语“分离的”指明生物材料(细胞、多肽、多核苷酸或其片段、变体或衍生物)已经从其原始环境(其中天然地存在所述生物材料的环境)中去除。例如,以天然状态存在于植物或动物中的多核苷酸并非分离的,然而,从其中天然地存在所述多核苷酸的相邻核酸分离的所述多核苷酸被视为“分离的”。不需要特定纯化程度。出于本公开的目的,在宿主细胞中表达的重组产生的多肽和蛋白质被视为分离的,已经通过任何合适技术分离、分馏或部分地或大体上纯化的原生或重组多肽也是如此。
“核酸”、“核酸分子”、“寡核苷酸”和“多核苷酸”可互换使用并且是指核糖核苷(腺苷、鸟苷、尿苷或胞嘧啶核苷;“RNA分子”)或脱氧核糖核苷(脱氧腺苷、脱氧鸟苷、脱氧胸苷或脱氧胞嘧啶核苷;“DNA分子”)的磷酸酯聚合物形式,或呈单链形式或双链螺旋的其任何磷脂类似物,如硫代磷酸酯和硫酯。双链DNA-DNA、DNA-RNA和RNA-RNA螺旋是可能的。术语核酸分子并且特别地DNA或RNA分子仅指所述分子的一级和二级结构,并且并未使其限于任何特定三级形式。因此,这一术语包括尤其发现于线性或环状DNA分子(例如,限制片段)、质粒、超螺旋DNA和染色体中的双链DNA。在论述特定双链DNA分子的结构时,序列可在本文中根据正常惯例描述,所述正常惯例仅沿DNA的非转录链(即,具有与mRNA同源的序列的链)依5'至3'方向给出所述序列。“重组DNA分子”是已经历分子生物操纵的DNA分子。DNA包括但不限于cDNA、基因组DNA、质粒DNA、合成DNA和半合成DNA。本公开的“核酸组合物”包含如本文所述的一种或多种核酸。
如本文所用,“编码区”或“编码序列”是多核苷酸的一部分,其由可翻译成氨基酸的密码子组成。尽管“终止密码子”(TAG、TGA或TAA)通常不翻译成氨基酸,其可被视为编码区的一部分,但任何侧接序列,例如启动子、核糖体结合位点、转录终止子、内含子等不是编码区的一部分。编码区的边界典型地由在5'端的编码所得多肽的氨基末端的起始密码子和在3'端的编码所得多肽的羧基末端的翻译终止密码子确定。两个或更多个编码区可存在于单一多核苷酸构建体中(例如,在单一载体上),或存在于单独多核苷酸构建体中(例如,在单独(不同)载体上)。接着,由此可见单一载体可含有仅单一编码区,或包含两个或更多个编码区。
由哺乳动物细胞分泌的某些蛋白质与分泌信号肽相关,一旦生长的蛋白质链跨糙面内质网的输出已经开始,所述分泌信号肽即从成熟蛋白质裂解。本领域技术人员知道,信号肽一般融合至所述多肽的N端,并且从完整或“全长”多肽裂解以产生所述多肽的分泌或“成熟”形式。在某些实施方案中,原生信号肽或保持指导与其可操作性缔合的多肽的分泌的能力的那一序列的功能衍生物。或者,可使用异源哺乳动物信号肽,例如人组织血纤维蛋白溶酶原活化剂(TPA)或小鼠β-葡糖苷酸酶信号肽,或其功能衍生物。
术语“下游”是指位于参考核苷酸序列的3'处的核苷酸序列。在某些实施方案中,下游核苷酸序列涉及转录起始点之后的序列。例如,基因的翻译起始密码子位于转录起始位点的下游。
术语“上游”是指位于参考核苷酸序列的5'处的核苷酸序列。在某些实施方案中,上游核苷酸序列涉及位于编码区或转录起始点的5'侧的序列。例如,大多数启动子位于转录起始位点的上游。
如本文所用,术语“基因调控区”或“调控区”是指位于编码区的上游(5'非编码序列)、内部或下游(3'非编码序列),并且影响缔合的编码区的转录、RNA加工、稳定性或翻译的核苷酸序列。调控区可包括启动子、翻译前导序列、内含子、多腺苷酸化识别序列、RNA加工位点、效应子结合位点和茎-环结构。如果编码区意图用于在真核细胞中表达,那么多腺苷酸化信号和转录终止序列将通常位于所述编码区的3'处。
编码例如多肽等基因产物的多核苷酸可包括与一个或多个编码区可操作性缔合的启动子和/或其他表达(例如,转录或翻译)控制元件。在可操作性缔合中,例如多肽等基因产物的编码区与一个或多个调控区缔合,其缔合方式使得将所述基因产物的表达置于所述调控区的影响或控制下。例如,如果启动子功能的诱导导致编码由所述编码区编码的基因产物的mRNA的转录,并且如果所述启动子与所述编码区之间的连接的性质不会干扰所述启动子指导所述基因产物的表达的能力或干扰DNA模板转录的能力,那么所述编码区与所述启动子“可操作性缔合”。除了启动子以外的其他表达控制元件也可与编码区可操作性缔合以指导基因产物表达,所述其他表达控制元件例如增强子、操纵子、阻遏子和转录终止信号。
“转录控制序列”是指提供宿主细胞中编码序列的表达的DNA调控序列,如启动子、增强子、终止子等。本领域技术人员已知多种转录控制区。这些转录控制区包括但不限于在脊椎动物细胞中发挥作用的转录控制区,如但不限于来自巨细胞病毒(即刻早期启动子,结合内含子-A)、猿猴病毒40(早期启动子)和逆转录病毒(如劳斯肉瘤病毒)的启动子和增强子区段。其他转录控制区包括源于脊椎动物基因的那些,如肌动蛋白、热休克蛋白、牛生长激素和兔β-球蛋白,以及能够控制真核细胞中的基因表达的其他序列。另外的合适转录控制区包括组织特异性启动子和增强子以及淋巴因子诱导性启动子(例如,可由干扰素或白细胞介素诱导的启动子)。
同样,本领域技术人员已知多种翻译控制元件。这些翻译控制元件包括但不限于核糖体结合位点、翻译起始和终止密码子和源于小核糖核酸病毒的元件(特别是内部核糖体进入位点或IRES,还称作CITE序列)。
如本文所用,术语“表达”是指使多核苷酸产生基因产物(例如,RNA或多肽)的过程。其包括但不限于将所述多核苷酸转录成信使RNA(mRNA)、转运RNA(tRNA)、小发夹RNA(shRNA)、小干扰RNA(siRNA)或任何其他RNA产物,和将mRNA翻译成多肽。表达产生“基因产物”。如本文所用,基因产物可以是核酸,例如通过基因的转录产生的信使RNA,或自转录物翻译的多肽。本文所述的基因产物进一步包括具有转录后修饰(例如,多腺苷酸化或剪接)的核酸,或具有翻译后修饰(例如,甲基化、糖基化、添加脂质、与其他蛋白质亚单位缔合或蛋白水解裂解)的多肽。如本文所用,术语“产率”是指通过基因的表达产生的多肽的量。
“载体”是指用于将核酸克隆和/或转移至宿主细胞中的任何媒剂。载体可以是可附接另一核酸区段以便引起所附接的区段的复制的复制子。“复制子”是指用作体内自主复制单位(即,能够在其本身的控制下复制)的任何遗传元件(例如,质粒、噬菌体、粘粒、染色体、病毒)。术语“载体”包括用于体外、离体或体内将核酸引入细胞中的病毒和非病毒媒剂。本领域中已知并使用大量载体,包括例如质粒、经过修饰的真核病毒或经过修饰的细菌病毒。将多核苷酸***至合适载体中可通过将适当的多核苷酸片段连接至具有互补粘性末端的所选载体中而实现。
载体可经过工程改造以编码提供已经并入所述载体的细胞的选择或鉴别的可选择标记或报告基因。可选择标记或报告基因的表达允许并入和表达含于所述载体上的其他编码区的宿主细胞的鉴别和/或选择。本领域中已知并且使用的可选择标记基因的实例包括:提供对氨苄青霉素、链霉素、庆大霉素、卡那霉素、潮霉素、双丙氨膦除草剂、磺酰胺等的抗性的基因;和用作表型标记的基因,即花青素调控基因、异戊烷基转移酶基因等。本领域中已知并且使用的报告基因的实例包括:荧光素酶(Luc)、绿色荧光蛋白(GFP)、氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶(LacZ)、β-葡糖苷酸酶(Gus)等。可选择标记也可以被视为报告基因。
术语“可选择标记”是指能够基于所述标记基因的效应被加以选择的鉴别因子,通常是抗生素或化学抗性基因,即对抗生素的抗性、对除草剂的抗性、比色标记、酶、荧光标记等,其中所述效应用于追踪所关注的核酸的遗传性和/或鉴别已经遗传所关注的核酸的细胞或生物体。本领域中已知并且使用的可选择标记基因的实例包括:提供对氨苄青霉素、链霉素、庆大霉素、卡那霉素、潮霉素、双丙氨膦除草剂、磺酰胺等的抗性的基因;和用作表型标记的基因,即花青素调控基因、异戊烷基转移酶基因等。
术语“报告基因”是指编码能够基于所述报告基因的效应加以鉴别的鉴别因子的核酸,其中所述效应用于追踪所关注的核酸的遗传性、鉴别已经遗传所关注的核酸的细胞或生物体和/或测量基因表达诱导或转录。本领域中已知并且使用的报告基因的实例包括:荧光素酶(Luc)、绿色荧光蛋白(GFP)、氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶(LacZ)、β-葡糖苷酸酶(Gus)等。可选择标记基因也可以被视为报告基因。
“启动子”和“启动子序列”可互换使用并且是指能够控制编码序列或功能RNA的表达的DNA序列。通常,编码序列位于启动子序列的3'处。启动子可整体源于原生基因,或由源于在自然界中发现的不同启动子的不同元件构成,或甚至包含合成DNA区段。本领域技术人员应理解,不同启动子可指导不同组织或细胞类型中或在不同发育阶段或响应于不同环境或生理条件的基因的表达。使基因在大多数时间在大多数细胞类型中表达的启动子通常被称作“组成性启动子”。使基因在特定细胞类型中表达的启动子通常被称作“细胞特异性启动子”或“组织特异性启动子”。使基因在特定发育或细胞分化阶段表达的启动子通常被称作“发育特异性启动子”或“细胞分化特异性启动子”。经过诱导并且在使细胞暴露于诱导所述启动子的试剂、生物分子、化学品、配体、光等或用所述试剂、生物分子、化学品、配体、光等处理之后使基因表达的启动子通常被称作“诱导性启动子”或“可调控启动子”。进一步认识到,由于在大多数情况下尚未完全地界定调控序列的精确边界,不同长度的DNA片段可以具有相同的启动子活性。
启动子序列通常在其3'端处以转录起始位点为界并且向上游延伸(5'方向)以包括开始在背景以上可检测的水平的转录所必需的最少数目的碱基或元件。在所述启动子序列内将发现转录起始位点(便利地例如通过用核酸酶S1定位来界定),以及负责RNA聚合酶的结合的蛋白质结合结构域(共有序列)。
术语“限制核酸内切酶”和“限制酶”可互换使用并且是指在双链DNA内的特定核苷酸序列内结合并且切割的酶。
术语“质粒”是指通常携带并非细胞的中心代谢的一部分的基因并且通常呈环状双链DNA分子的形式的染色体外元件。所述元件可以是自主复制的序列、基因组整合序列、噬菌体或核苷酸序列、源于任何来源的单链或双链DNA或RNA的线性、环状或超螺旋,其中多个核苷酸序列已经接合或重组成独特的构造,所述独特构造能够将所选择的基因产物的启动子片段和DNA序列连同适当的3'未翻译序列引入至细胞中。
可使用的真核病毒载体包括但不限于腺病毒载体、逆转录病毒载体、腺相关病毒载体、痘病毒(例如,牛痘病毒载体)、杆状病毒载体或疱疹病毒载体。非病毒载体包括质粒、脂质体、带电脂质(细胞转染剂(cytofectin))、DNA-蛋白质复合物和生物聚合物。
“克隆载体”是指“复制子”,所述复制子是单位长度的核酸,所述核酸顺序复制并且包含复制起点,如质粒、噬菌体或粘粒,另一核酸区段可附接至所述复制子以便引起所附接的区段的复制。某些克隆载体能够在一种细胞类型(例如,细菌)中复制并且在另一细胞类型(例如,真核细胞)中表达。克隆载体典型地包含一个或多个可用于包含所述载体的细胞的选择的序列和/或一个或多个用于所关注的核酸序列的***的克隆位点。
术语“表达载体”是指经过设计以使所***的核酸序列能够在***至宿主细胞中之后表达的媒剂。使所***的核酸序列放置成与如上文所述的调控区的可操作缔合。
载体通过本领域中众所周知的方法引入至宿主细胞中,例如转染、电穿孔、微注射、转导、细胞融合、DEAE葡聚糖、磷酸钙沉淀、脂质转染(溶酶体融合)、基因枪使用或DNA载体转运体(transporter)。
如本文所用,“培养(Culture)”、“培养(to culture)”和“培养(culturing)”意指在允许细胞生长或***的体外条件下孵育细胞或使细胞维持生存状态。如本文所用,“培养的细胞”意指体外繁殖的细胞。
如本文所用,术语“多肽”意图涵盖单数“多肽”以及复数“多肽”并且是指由通过酰胺键(还称作肽键)线性连接的单体(氨基酸)构成的分子。术语“多肽”是指两个或更多个氨基酸的任何一个或多个链,并且不指特定长度的产物。因此,肽、二肽、三肽、寡肽、“蛋白质”、“氨基酸链”或用于指两个或更多个氨基酸的一个或多个链的任何其他术语均包括于“多肽”的定义内,并且术语“多肽”可替代这些术语中的任一者或可互换使用。术语“多肽”还意图指多肽的表达后修饰的产物,所述表达后修饰包括但不限于糖基化、乙酰化、磷酸化、酰胺化、通过已知的保护/阻断基团衍生化、蛋白水解裂解或通过非天然存在的氨基酸修饰。多肽可源于天然生物来源或以重组技术产生,但不必自指定的核酸序列翻译。其可以任何方式,包括通过化学合成产生。
术语“氨基酸”包括丙氨酸(Ala或A);精氨酸(Arg或R);天冬酰胺(Asn或N);天冬氨酸(Asp或D);半胱氨酸(Cys或C);谷酰胺(Gln或Q);谷氨酸(Glu或E);甘氨酸(Gly或G);组氨酸(His或H);异亮氨酸(Ile或I);亮氨酸(Leu或L);赖氨酸(Lys或K);甲硫氨酸(Met或M);苯丙氨酸(Phe或F);脯氨酸(Pro或P);丝氨酸(Ser或S);苏氨酸(Thr或T);色氨酸(Trp或W);酪氨酸(Tyr或Y);和缬氨酸(Val或V)。非传统氨基酸也在本公开的范围内并且包括正亮氨酸、鸟氨酸、正缬氨酸、高丝氨酸和其他氨基酸残基类似物,如Ellman等人Meth.Enzym.202:301-336(1991)中所述的那些。为了产生所述非天然存在的氨基酸残基,可使用Noren等人Science 244:182(1989)和Ellman等人(同上)的程序。简单地说,这些程序涉及用非天然存在的氨基酸残基以化学方式活化抑制因子tRNA,随后为所述RNA的体外转录和翻译。所述非传统氨基酸的引入也可使用本领域中已知的肽化学来实现。如本文所用,术语“极性氨基酸”包括具有净零电荷,但在其侧链的不同部分中具有非零部分电荷的氨基酸(例如,M、F、W、S、Y、N、Q、C)。这些氨基酸可参与疏水性相互作用和静电相互作用。如本文所用,术语“带电氨基酸”包括可在其侧链上具有非零净电荷的氨基酸(例如,R、K、H、E、D)。这些氨基酸可参与疏水性相互作用和静电相互作用。
本公开还包括多肽的片段或变体,和其任何组合。术语“片段”或“变体”在提及本公开的多肽结合结构域或结合分子时包括保持参考多肽的至少一些特性(例如,对FcRn结合结构域或Fc变体的FcRn结合亲和力、针对FVIII变体的凝固活性或针对VWF片段的FVIII结合活性)的任何多肽。多肽的片段包括蛋白水解片段,以及缺失片段,加上本文中别处论述的特定抗体片段,但不包括天然存在的全长多肽(或成熟多肽)。本公开的多肽结合结构域或结合分子的变体包括如上文所述的片段,以及由于氨基酸取代、缺失或***而具有改变的氨基酸序列的多肽。变体可为天然或非天然存在的。非天然存在的变体可使用本领域已知的诱变技术产生。变体多肽可包含保守或非保守氨基酸取代、缺失或添加。
“保守氨基酸取代”是如下取代,其中氨基酸残基用具有相似侧链的氨基酸残基置换。具有相似侧链的氨基酸残基的家族已经在本领域中定义,包括碱性侧链(例如,赖氨酸、精氨酸、组氨酸)、酸性侧链(例如,天冬氨酸、谷氨酸)、不带电极性侧链(例如,甘氨酸、天冬酰胺、谷酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、非极性侧链(例如,丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、β-分支链侧链(例如,苏氨酸、缬氨酸、异亮氨酸)和芳香族侧链(例如,酪氨酸、苯丙氨酸、色氨酸、组氨酸)。因此,如果多肽中的氨基酸用来自相同侧链家族的另一氨基酸置换,那么所述取代被视为保守的。在另一实施方案中,氨基酸串可以用侧链家族成员的顺序和/或组成不同的结构上相似的串保守性置换。
如本领域中已知的术语“同一性百分比”是如通过比较所述序列所确定的两个或更多个多肽序列或两个或更多个多核苷酸序列之间的关系。在本领域中,“同一性”还意指如通过所述序列的串之间的匹配所确定的多肽或多核苷酸序列(视情况而定)之间的序列相关的程度。“同一性”可容易地通过已知方法计算,所述方法包括但不限于以下描述的那些:Computational Molecular Biology(Lesk,A.M.编)Oxford University Press,NewYork(1988);Biocomputing:Informatics and Genome Projects(Smith,D.W.编)AcademicPress,New York(1993);Computer Analysis of Sequence Data,第I部分(Griffin,A.M.和Griffin,H.G.编)Humana Press,New Jersey(1994);Sequence Analysis in MolecularBiology(von Heinje,G.编)Academic Press(1987);和Sequence Analysis Primer(Gribskov,M.和Devereux,J.编)Stockton Press,New York(1991)。测定同一性的优选方法经过设计以给出所测试的序列之间的最佳匹配。测定同一性的方法编纂于公开可得的计算机程序中。序列比对和同一性百分比计算可使用序列分析软件执行,所述序列分析软件如LASERGENE生物信息计算套件的Megalign程序(DNASTAR Inc.,Madison,WI)、GCG程序套件(Wisconsin Package 9.0版,Genetics Computer Group(GCG),Madison,WI)、BLASTP、BLASTN、BLASTX(Altschul等人,J.Mol.Biol.215:403(1990))和DNASTAR(DNASTAR,Inc.1228S.Park St.Madison,WI53715USA)。在本申请的上下文内,应理解在使用序列分析软件进行分析的情况下,除非另外规定,否则所述分析的结果将基于所参考的程序的“默认值”。如本文所用,“默认值”将意指当首次初始化时最初装载所述软件的值或参数的任何集合。出于测定本公开的优化的BDD FVIII序列与参考序列之间的同一性百分比的目的,仅使用所述参考序列中对应于本公开的优化的BDD FVIII序列中的核苷酸的核苷酸来计算同一性百分比。例如,当比较含有B结构域的全长FVIII核苷酸序列与本公开的优化的B结构域缺失(BDD)的FVIII核苷酸序列时,将使用所述比对中包括A1、A2、A3、C1和C2结构域的部分来计算同一性百分比。全长FVIII序列中编码B结构域(其将导致所述比对中的大“空位”)的部分的核苷酸将作为错误匹配未进行计算。另外,在测定本公开的优化的BDD FVIII序列或其指定部分(例如,SEQ ID NO:3的核苷酸58-2277和2320-4374)与参考序列之间的同一性百分比时,同一性百分比将通过将匹配的核苷酸的数目除以如本文所陈述的优化的BDD-FVIII序列或其指定部分的完整序列中的核苷酸的总数来计算。
如本文所用,“对应于本公开的优化的BDD FVIII序列中的核苷酸的核苷酸”是通过本公开的优化的BDD FVIII序列的比对来鉴别以最大化与参考FVIII序列的同一性。用于鉴别参考FVIII序列中的等同氨基酸的编号是基于用于鉴别本公开的优化的BDD FVIII序列中的相应氨基酸的编号。
“融合”或“嵌合”蛋白包含第一氨基酸序列连接至在自然界中未与其天然地连接的第二氨基酸序列。可使通常存在于单独蛋白质中的氨基酸序列集合于融合多肽中,或可将通常存在于同一蛋白质中的氨基酸序列以新的布置放置于融合多肽中,例如本公开的因子VIII结构域与Ig Fc结构域的融合。融合蛋白例如通过化学合成,或通过产生并且翻译其中肽区以所需关系进行编码的多核苷酸而产生。嵌合蛋白可进一步包含通过共价键、非肽键或非共价键与所述第一氨基酸序列缔合的第二氨基酸序列。
如本文所用,术语“***位点”是指FVIII多肽或其片段、变体或衍生物中的位置,所述位置紧邻可***异源部分的位置的上游。“***位点”以编号指定,所述编号是成熟原生FVIII(SEQ ID NO:15;图11A)中对应于所述***位点的氨基酸的编号,所述氨基酸紧邻***的位置的N端。例如,措辞“a3包含在对应于SEQ ID NO:15的氨基酸1656的***位点处的异源部分”指示所述异源部分位于对应于SEQ ID NO:15的氨基酸1656和氨基酸1657的两个氨基酸之间。
如本文所用,措辞“紧邻氨基酸的下游”是指紧挨着所述氨基酸的末端羧基的位置。同样,措辞“紧邻氨基酸的上游”是指紧挨着所述氨基酸的末端胺基的位置。
如本文所用,术语“***(inserted)”、“***(is inserted)”、“***至......中(inserted into)”或语法相关术语是指相对于原生成熟人FVIII中的类似位置,重组FVIII多肽中的异源部分的位置。如本文所用,所述术语是指所述重组FVIII多肽相对于原生成熟人FVIII的特征,并且不指示、暗示或推断制得所述重组FVIII多肽的任何方法或过程。
如本文所用,术语“半衰期”是指特定多肽的体内生物半衰期。半衰期可由施用于受试者的量的一半从动物中的循环和/或其他组织清除所需的时间表示。当给定多肽的清除曲线被绘制为随时间而变时,所述曲线通常是具有快速α-相和较长β-相的双相。所述α-相通常表示所施用的Fc多肽在血管内间隙与血管外间隙之间的平衡并且部分地由所述多肽的大小决定。所述β-相通常表示所述多肽在血管内间隙中的分解代谢。在一些实施方案中,FVIII和包含FVIII的嵌合蛋白是单相的,并且因此不具有α相,而仅具有单一β相。因此,在某些实施方案中,如本文所用的术语半衰期是指所述多肽在β-相中的半衰期。
如本文所用,术语“连接(linked)”分别是指第一氨基酸序列或核苷酸序列共价或非共价接合至第二氨基酸序列或核苷酸序列。所述第一氨基酸序列或核苷酸序列可直接地接合至所述第二氨基酸序列或核苷酸序列或与所述第二氨基酸序列或核苷酸序列并置,或替代地,间插序列可使所述第一序列共价地接合至所述第二序列。术语“连接”不仅意指第一氨基酸序列与第二氨基酸序列在C端或N端处的融合,而且包括整个第一氨基酸序列(或所述第二氨基酸序列)***至所述第二氨基酸序列(或分别地,所述第一氨基酸序列)中的任何两个氨基酸中。在一个实施方案中,所述第一氨基酸序列可通过肽键或接头连接至第二氨基酸序列。所述第一核苷酸序列可通过磷酸二酯键或接头连接至第二核苷酸序列。所述接头可以是肽或多肽(针对多肽链)或核苷酸或核苷酸链(针对核苷酸链)或任何化学部分(针对多肽链和多核苷酸链两者)。术语“连接”还由连字符(-)指示。
如本文所用,术语“与......缔合”是指在第一氨基酸链与第二氨基酸链之间形成的共价或非共价键。在一个实施方案中,术语“与......缔合”意指共价、非肽键或非共价键。这种缔合可由冒号,即(:)指示。在另一实施方案中,其意指除肽键以外的共价键。例如,氨基酸半胱氨酸包含硫醇基,其可与第二半胱氨酸残基上的硫醇基形成二硫键或桥。在大多数天然存在的IgG分子中,CH1和CL区由二硫键缔合并且两条重链由使用Kabat编号***时对应于239和242的位置处的两个二硫键(位置226或229,EU编号***)缔合。共价键的实例包括但不限于肽键、金属键、氢键、二硫键、σ键、π键、δ键、糖苷键、不确定键、弯键、偶极键、π骨架、双键、三键、四重键、五重键、六重键、共轭、超共轭、芳香性、哈普托数或反键。非共价键的非限制性实例包括离子键(例如,阳离子-π键或盐键)、金属键、氢键(例如,二氢键、二氢复合物、低屏障氢键或对称氢键)、范德华力、伦敦色散力(London dispersionforce)、机械键、卤素键、亲金作用、嵌入、堆叠、熵力或化学极性。
本文所用的术语“单体-二聚体杂合物”是指包含第一多肽链和第二多肽链的嵌合蛋白,所述多肽链通过二硫键彼此缔合,其中所述第一链包含凝固因子(例如,因子VIII)和第一Fc区并且所述第二链包含第二Fc区,基本上由第二Fc区组成,或由第二Fc区组成,而无所述凝固因子。因此,所述单体-二聚体杂合物构建体是包含仅具有一种凝固因子的单体方面和具有两个Fc区的二聚体方面的杂合物。
如本文所用,止血意指出血的停止或减慢;或通过血管或身体部分的血流的停止或减慢。
如本文所用,止血病症意指基因遗传或获得性病况,其特征在于自发地或由于创伤而出血的倾向,归因于形成纤维蛋白凝块的能力受损或不能形成纤维蛋白凝块。所述病症的实例包括血友病。三种主要形式是血友病A(因子VIII缺陷)、血友病B(因子IX缺陷或“克雷司马斯病”)和血友病C(因子XI缺陷,轻度出血倾向)。其他止血病症包括例如血管假性血友病、因子XI缺陷(PTA缺陷)、因子XII缺陷、纤维蛋白原、凝血酶原、因子V、因子VII、因子X或因子XIII的缺陷或结构异常、Bernard-Soulier综合征,所述Bernard-Soulier综合征是GPIb的缺乏或缺陷。vWF的受体GPIb可以是有缺陷的并且导致初期凝块形成(初期止血)的缺乏和增加的出血倾向),和Glanzman和Naegeli的血小板机能不全(血小板无力症(Glanzmann thrombasthenia))。在肝功能衰竭(急性和慢性形式)中,存在由肝脏引起的凝固因子的产生不足;这可增加出血风险。
本公开的分离的核酸分子、分离的多肽或包含所述分离的核酸分子的载体可以预防性地加以使用。如本文所用,术语“预防性治疗”是指在出血事件之前施用分子。在一个实施方案中,需要一般止血剂的受试者正在经历或将要经历手术。本公开的多核苷酸、多肽或载体可在作为预防剂在手术之前或之后施用。本公开的多核苷酸、多肽或载体可在手术期间或之后施用以控制急性出血事件。所述手术可包括但不限于肝移植、肝切除、牙科手术或干细胞移植。
本公开的分离的核酸分子、分离的多肽或载体也用于按需要治疗。术语“按需要治疗”是指响应于出血事件的症状或在可引起出血的行为之前施用分离的核酸分子、分离的多肽或载体。一方面,当出血开始时(如在损伤之后),或当预期出血时(如在手术之前),可对受试者给予按需要治疗。另一方面,在增加出血风险的活动(如接触运动)之前可给予按需要治疗。
如本文所用,术语“急性出血”是指出血事件,而与潜在原因无关。例如,受试者可具有创伤、***、遗传性出血病症(例如,因子VII缺陷)、血小板病症或由于凝固因子的抗体的发展而产生的抗性。
如本文所用,治疗(Treat)、治疗(treatment)、治疗(treating)是指例如疾病或病况的严重性的降低;疾病过程的持续时间的减少;与疾病或病况相关的一种或多种症状的改善;向患有疾病或病况的受试者提供有益作用,而未必治愈所述疾病或病况,或与疾病或病况相关的一种或多种症状的预防。在一个实施方案中,术语“治疗(treating)”或“治疗(treatment)”意指通过施用本公开的分离的核酸分子、分离的多肽或载体在受试者中维持至少约1IU/dL、2IU/dL、3IU/dL、4IU/dL、5IU/dL、6IU/dL、7IU/dL、8IU/dL、9IU/dL、10IU/dL、11IU/dL、12IU/dL、13IU/dL、14IU/dL、15IU/dL、16IU/dL、17IU/dL、18IU/dL、19IU/dL或20IU/dL的FVIII谷水平。在另一实施方案中,治疗意指维持介于约1与约20IU/dL之间、介于约2与约20IU/dL之间、介于约3与约20IU/dL之间、介于约4与约20IU/dL之间、介于约5与约20IU/dL之间、介于约6与约20IU/dL之间、介于约7与约20IU/dL之间、介于约8与约20IU/dL之间、介于约9与约20IU/dL之间或介于约10与约20IU/dL之间的FVIII谷水平。疾病或病况的治疗也可包括在受试者中维持可与非血友病受试者中的FVIII活性的至少约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%或20%相当的水平的FVIII活性。治疗所需的最低谷水平可通过一种或多种已知的方法来测量并且可针对每个人加以调节(增加或减少)。
如本文所用,“施用”意指经由药学上可接受的途径对受试者给予药学上可接受的因子VIII编码核酸分子、因子VIII多肽或包含本公开的因子VIII编码核酸分子的载体。施用途径可以是静脉内,例如静脉内注射和静脉内输注。另外的施用途径包括例如皮下、肌肉内、口服、鼻和肺施用。所述核酸分子、多肽和载体可作为包含至少一种赋形剂的药物组合物的一部分施用。
如本文所用,措辞“有需要的受试者”包括将受益于本公开的核酸分子、多肽或载体的施用的受试者,如哺乳动物受试者,例如以改善止血。在一个实施方案中,所述受试者包括但不限于患有血友病的个体。在另一实施方案中,所述受试者包括但不限于已经发展FVIII抑制因子并且因此需要旁路疗法的个体。所述受试者可以是成体或未成年体(例如,不足12岁)。
如本文所用,术语“凝固因子”是指天然存在或重组产生的分子或其类似物,其预防受试者中的出血事件或减少受试者中的出血事件的持续时间。换句话说,其意指具有促凝固活性的分子,即,负责将纤维蛋白原转化为不溶性纤维蛋白网,从而使血液凝结或凝固。“可活化凝固因子”是呈无活性形式(例如,呈其酶原形式)的凝固因子,其能够被转化为活性形式。
如本文所用,凝固活性意指参与生物化学反应的级联的能力,所述级联导致形成纤维蛋白凝块和/或降低出血或出血事件的严重性、持续时间或频率。
如本文所用,术语“异源”或“外源”是指在给定情况中,例如在细胞中或在多肽中通常未发现的所述分子。例如,外源或异源分子可被引入至细胞中并且仅在例如通过转染或遗传工程改造的其他形式操纵细胞之后存在,或异源氨基酸序列可存在于其中未天然地发现所述序列的蛋白质中。
如本文所用,术语“异源核苷酸序列”是指未天然地与给定多核苷酸序列一起存在的核苷酸序列。在一个实施方案中,所述异源核苷酸序列编码能够延长FVIII的半衰期的多肽。在另一实施方案中,所述异源核苷酸序列编码增加FVIII的流体动力学半径的多肽。在其他实施方案中,所述异源核苷酸序列编码改善FVIII的一种或多种药物动力学特性而不会显著地影响其生物活性或功能(例如,其促凝血活性)的多肽。在一些实施方案中,FVIII通过接头连接至(linked or connected to)由所述异源核苷酸序列编码的多肽。由异源核苷酸序列编码的多肽部分的非限制性实例包括免疫球蛋白恒定区或其一部分、白蛋白或其片段、白蛋白结合部分、转铁蛋白、美国专利申请号20100292130的PAS多肽、HAP序列、转铁蛋白或其片段、人绒毛膜***的β亚单位的C端肽(CTP)、白蛋白结合小分子、XTEN序列、FcRn结合部分(例如,完全Fc区或其结合FcRn的部分)、单链Fc区(ScFc区,例如,如US2008/0260738、WO 2008/012543或WO 2008/1439545中所述)、聚甘氨酸接头、聚丝氨酸接头、选自甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)的两种类型的氨基酸的6-40个氨基酸的肽和短多肽(其中具有小于50%至大于50%的变化程度的二级结构)或其两种或更多种组合。在一些实施方案中,由所述异源核苷酸序列编码的多肽连接至非多肽部分。所述非多肽部分的非限制性实例包括聚乙二醇(PEG)、白蛋白结合小分子、聚唾液酸、羟基乙基淀粉(HES)、其衍生物或其任何组合。
如本文所用,术语“Fc区”是定义为多肽中对应于原生Ig的Fc区的部分,即,如通过其两条重链的相应Fc域的二聚缔合所形成。原生Fc区与另一Fc区形成同二聚体。相比之下,如本文所用,术语“基因融合的Fc区”或“单链Fc区”(scFc区)是指包含基因连接于单一多肽链内(即,编码于单一邻接基因序列中)的Fc结构域的合成二聚Fc区。
在一个实施方案中,“Fc区”是指单一Ig重链的部分,在铰链区中紧邻木瓜蛋白酶裂解位点的上游(即,IgG中的残基216,考虑重链恒定区的第一残基是114)开始并且在所述抗体的C端处终止。相应地,完整Fc结构域至少包含铰链结构域、CH2结构域和CH3结构域。
视Ig同种型而定,Ig恒定区的Fc区可包括CH2、CH3和CH4结构域以及铰链区。包含Ig的Fc区的嵌合蛋白赋予嵌合蛋白数种可需要的特性,包括增加的稳定性、增加的血清半衰期(参见Capon等人,1989,Nature 337:525)以及结合于Fc受体,如新生儿Fc受体(FcRn)(美国专利号6,086,875、6,485,726、6,030,613;WO 03/077834;US2003-0235536A1),所述专利以引用的方式整体并入本文中。
“参考核苷酸序列”当作为与本公开的核苷酸序列的比较用于本文中时是与本公开的核苷酸序列基本上同一的多核苷酸序列,除了对应于FVIII序列的部分未优化。例如,针对由SEQ ID NO:1的密码子优化的BDD FVIII和编码在3'端连接至SEQ ID NO:1的单链Fc区的异源核苷酸序列组成的核酸分子的参考核苷酸序列是由SEQ ID NO:16的原始(或“亲本”)BDD FVIII(图1I)和编码在3'端连接至SEQ ID NO:16的单链Fc区的同一异源核苷酸序列组成的核酸分子。
如本文所用,“密码子适应指数”是指密码子使用偏好的量度。密码子适应指数(CAI)量度了给定的蛋白质编码基因序列相对于参考基因集合的偏差(Sharp PM和Li WH,Nucleic Acids Res.15(3):1281–95(1987))。CAI是通过测定在所述基因序列的长度内与各密码子相关的权重的几何平均值(在密码子中测量)来计算:
Figure BDA0001814810910000362
关于各氨基酸,在CAI中其密码子中的每一者的权重计算为针对所述氨基酸所观察到的密码子(fi)的频率与同义密码子(fj)的频率之间的比率:
式2:
Figure BDA0001814810910000361
如本文所用,关于核苷酸序列的术语“优化”是指编码多肽的多核苷酸序列,其中所述多核苷酸序列已经发生突变以增强所述多核苷酸序列的特性。在一些实施方案中,进行优化以增加转录水平,增加翻译水平,增加稳态mRNA水平,增加或减少调控蛋白(如通用转录因子)的结合,增加或减少剪接,或增加由所述多核苷酸序列产生的多肽的产率。可针对多核苷酸序列进行的以优化所述多核苷酸序列的改变的实例包括密码子优化、G/C含量优化、重复序列的去除、富AT元件的去除、隐蔽剪接位点的去除、抑制转录或翻译的顺式作用元件的去除、添加或去除poly-T或poly-A序列、在转录起始位点附近添加增强转录的序列(如Kozak共有序列)、可能形成茎环结构的序列的去除、去稳定序列的去除和其两种或更多种组合。
编码FVIII蛋白的多核苷酸序列
在一些实施方案中,本公开针对编码具有FVIII活性的多肽的密码子优化的核酸分子。在一些实施方案中,所述多核苷酸编码全长FVIII多肽。在其他实施方案中,所述核酸分子编码B结构域缺失(BDD)的FVIII多肽,其中FVIII的B结构域的全部或一部分缺失。在一个特定实施方案中,所述核酸分子编码包含如下氨基酸序列的多肽,所述氨基酸序列与SEQID NO:17(图1J)或其片段具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。在一个实施方案中,所述核酸分子编码具有氨基酸序列SEQ ID NO:17的多肽或其片段。
在一些实施方案中,本公开的核酸分子编码包含信号肽或其片段的FVIII多肽。在其他实施方案中,所述核酸分子编码缺乏信号肽的FVIII多肽。在一些实施方案中,所述信号肽包含SEQ ID NO:17的氨基酸1-19。
在一些实施方案中,本公开提供包含如下核苷酸序列的分离的核酸分子,所述核苷酸序列包含编码FVIII多肽的N端部分的第一核酸序列和编码FVIII多肽的C端部分的第二核酸序列;其中所述第一核酸序列与(i)SEQ ID NO:3的核苷酸58-1791或(ii)SEQ IDNO:4的核苷酸58-1791具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;并且其中所述N端部分和所述C端部分合起来具有FVIII多肽活性。在一个特定实施方案中,所述第一核酸序列与SEQ ID NO:3的核苷酸58-1791具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在另一实施方案中,所述第一核酸序列与SEQ ID NO:4的核苷酸58-1791具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施方案中,所述第一核苷酸序列包含SEQ ID NO:3的核苷酸58-1791或SEQ ID NO:4的核苷酸58-1791。
在其他实施方案中,本公开提供包含如下核苷酸序列的分离的核酸分子,所述核苷酸序列包含编码FVIII多肽的N端部分的第一核酸序列和编码FVIII多肽的C端部分的第二核酸序列;其中所述第一核酸序列与(i)SEQ ID NO:3的核苷酸1-1791或(ii)SEQ ID NO:4的核苷酸1-1791具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;并且其中所述N端部分和所述C端部分合起来具有FVIII多肽活性。在一个实施方案中,所述第一核苷酸序列包含SEQ ID NO:3的核苷酸1-1791或SEQ ID NO:4的核苷酸1-1791。在另一实施方案中,所述第二核苷酸序列与SEQ ID NO:3的核苷酸1792-4374或SEQ ID NO:4的1792-4374具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一个特定实施方案中,所述第二核苷酸序列包含SEQ ID NO:3的核苷酸1792-4374或SEQ ID NO:4的1792-4374。在另一实施方案中,所述第二核苷酸序列与SEQ ID NO:3的核苷酸1792-2277和2320-4374或SEQ ID NO:4的1792-2277和2320-4374(即,SEQ ID NO:3的核苷酸1792-4374或SEQ ID NO:4的1792-4374,而无编码B结构域或B结构域片段的核苷酸)具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一个特定实施方案中,所述第二核苷酸序列包含SEQ ID NO:3的核苷酸1792-2277和2320-4374或SEQ ID NO:4的1792-2277和2320-4374(即,SEQ ID NO:3的核苷酸1792-4374或SEQ ID NO:4的1792-4374,而无编码B结构域或B结构域片段的核苷酸)。
在一些实施方案中,本公开提供包含如下核苷酸序列的分离的核酸分子,所述核苷酸序列包含编码FVIII多肽的N端部分的第一核酸序列和编码FVIII多肽的C端部分的第二核酸序列;其中所述第二核酸序列与(i)SEQ ID NO:5的核苷酸1792-4374或(ii)SEQ IDNO:6的1792-4374具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;并且其中所述N端部分和所述C端部分合起来具有FVIII多肽活性。在某些实施方案中,所述第二核酸序列与SEQ ID NO:5的核苷酸1792-4374具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施方案中,所述第二核酸序列与SEQ ID NO:6的核苷酸1792-4374具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一个特定实施方案中,所述第二核酸序列包含SEQ ID NO:5的核苷酸1792-4374或SEQ ID NO:6的1792-4374。在一些实施方案中,连接至上文列出的第二核酸序列的第一核酸序列与SEQ ID NO:5的核苷酸58-1791或SEQ ID NO:6的核苷酸58-1791具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施方案中,连接至上文列出的第二核酸序列的第一核酸序列与SEQ ID NO:5的核苷酸1-1791或SEQ ID NO:6的核苷酸1-1791具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。
在其他实施方案中,本公开提供包含如下核苷酸序列的分离的核酸分子,所述核苷酸序列包含编码FVIII多肽的N端部分的第一核酸序列和编码FVIII多肽的C端部分的第二核酸序列;其中所述第二核酸序列与(i)SEQ ID NO:5的核苷酸1792-2277和2320-4374(即,SEQ ID NO:5的核苷酸1792-4374,而无编码B结构域或B结构域片段的核苷酸)或(ii)SEQ ID NO:6的1792-2277和2320-4374(即,SEQ ID NO:6的核苷酸1792-4374,而无编码B结构域或B结构域片段的核苷酸)具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;并且其中所述N端部分和所述C端部分合起来具有FVIII多肽活性。在某些实施方案中,所述第二核酸序列与SEQ ID NO:5的核苷酸1792-2277和2320-4374(即,SEQ ID NO:5的核苷酸1792-4374,而无编码B结构域或B结构域片段的核苷酸)具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施方案中,所述第二核酸序列与SEQ ID NO:6的核苷酸1792-2277和2320-4374(即,SEQ ID NO:6的核苷酸1792-4374,而无编码B结构域或B结构域片段的核苷酸)具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一个特定实施方案中,所述第二核酸序列包含SEQ ID NO:5的核苷酸1792-2277和2320-4374或SEQ ID NO:6的1792-2277和2320-4374(即,SEQ ID NO:5的核苷酸1792-4374或SEQ IDNO:6的1792-4374,而无编码B结构域或B结构域片段的核苷酸)。在一些实施方案中,连接至上文列出的第二核酸序列的第一核酸序列与SEQ ID NO:5的核苷酸58-1791或SEQ ID NO:6的核苷酸58-1791具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施方案中,连接至上文列出的第二核酸序列的第一核酸序列与SEQ ID NO:5的核苷酸1-1791或SEQ ID NO:6的核苷酸1-1791具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。
在一些实施方案中,本公开提供包含如下核苷酸序列的分离的核酸分子,所述核苷酸序列包含编码FVIII多肽的N端部分的第一核酸序列和编码FVIII多肽的C端部分的第二核酸序列;其中所述第一核酸序列与(i)SEQ ID NO:1的核苷酸58-1791、(ii)SEQ ID NO:2的核苷酸58-1791、(iii)SEQ ID NO:70的核苷酸58-1791或(iv)SEQ ID NO:71的核苷酸58-1791具有至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;并且其中所述N端部分和所述C端部分合起来具有FVIII多肽活性。在其他实施方案中,所述第一核苷酸序列包含SEQ ID NO:1的核苷酸58-1791、SEQ ID NO:2的核苷酸58-1791、(iii)SEQ ID NO:70的核苷酸58-1791或(iv)SEQ ID NO:71的核苷酸58-1791。
在其他实施方案中,本公开提供包含如下核苷酸序列的分离的核酸分子,所述核苷酸序列包含编码FVIII多肽的N端部分的第一核酸序列和编码FVIII多肽的C端部分的第二核酸序列;其中所述第一核酸序列与(i)SEQ ID NO:1的核苷酸1-1791、(ii)SEQ ID NO:2的核苷酸1-1791、(iii)SEQ ID NO:70的核苷酸1-1791或(iv)SEQ ID NO:71的核苷酸1-1791具有至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;并且其中所述N端部分和所述C端部分合起来具有FVIII多肽活性。在一个实施方案中,所述第一核苷酸序列包含SEQ ID NO:1的核苷酸1-1791、SEQ ID NO:2的核苷酸1-1791、(iii)SEQ IDNO:70的核苷酸1-1791或(iv)SEQ ID NO:71的核苷酸1-1791。在另一实施方案中,连接至所述第一核苷酸序列的第二核苷酸序列与SEQ ID NO:1的核苷酸1792-4374、SEQ ID NO:2的1792-4374、(iii)SEQ ID NO:70的核苷酸1792-4374或(iv)SEQ ID NO:71的核苷酸1792-4374具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一个特定实施方案中,连接至所述第一核苷酸序列的第二核苷酸序列包含(i)SEQ ID NO:1的核苷酸1792-4374、(ii)SEQ ID NO:2的核苷酸1792-4374、(iii)SEQ ID NO:70的核苷酸1792-4374或(iv)SEQ ID NO:71的核苷酸1792-4374。在其他实施方案中,连接至所述第一核苷酸序列的第二核苷酸序列与(i)SEQ ID NO:1的核苷酸1792-2277和2320-4374、(ii)SEQ ID NO:2的核苷酸1792-2277和2320-4374、(iii)SEQID NO:70的核苷酸1792-2277和2320-4374或(iv)SEQ ID NO:71的核苷酸1792-2277和2320-4374具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一个实施方案中,所述第二核苷酸序列包含(i)SEQ IDNO:1的核苷酸1792-2277和2320-4374、(ii)SEQ ID NO:2的核苷酸1792-2277和2320-4374、(iii)SEQ ID NO:70的核苷酸1792-2277和2320-4374或(iv)SEQ ID NO:71的核苷酸1792-2277和2320-4374。
在另一实施方案中,本公开提供包含如下核苷酸序列的分离的核酸分子,所述核苷酸序列包含编码FVIII多肽的N端部分的第一核酸序列和编码FVIII多肽的C端部分的第二核酸序列;其中所述第二核酸序列与(i)SEQ ID NO:1的核苷酸1792-4374、(ii)SEQ IDNO:2的核苷酸1792-4374、(iii)SEQ ID NO:70的核苷酸1792-4374或(iv)SEQ ID NO:71的核苷酸1792-4374具有至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;并且其中所述N端部分和所述C端部分合起来具有FVIII多肽活性。在一个特定实施方案中,所述第二核酸序列包含(i)SEQ ID NO:1的核苷酸1792-4374、(ii)SEQ ID NO:2的核苷酸1792-4374、(iii)SEQ ID NO:70的核苷酸1792-4374或(iv)SEQ ID NO:71的核苷酸1792-4374。在一些实施方案中,本公开提供包含如下核苷酸序列的分离的核酸分子,所述核苷酸序列包含编码FVIII多肽的N端部分的第一核酸序列和编码FVIII多肽的C端部分的第二核酸序列;其中所述第二核酸序列与(i)SEQ ID NO:1的核苷酸1792-2277和2320-4374、(ii)SEQ ID NO:2的核苷酸1792-2277和2320-4374、(iii)SEQ ID NO:70的核苷酸1792-2277和2320-4374或(iv)SEQ ID NO:71的核苷酸1792-2277和2320-4374(即,SEQ IDNO:1的核苷酸1792-4374、SEQ ID NO:2的核苷酸1792-4374、SEQ ID NO:70的核苷酸1792-4374或SEQ ID NO:71的核苷酸1792-4374,而无编码B结构域或B结构域片段的核苷酸)具有至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;并且其中所述N端部分和所述C端部分合起来具有FVIII多肽活性。在一个实施方案中,所述第二核酸序列包含(i)SEQ ID NO:1的核苷酸1792-2277和2320-4374、(ii)SEQ ID NO:2的核苷酸1792-2277和2320-4374、(iii)SEQ ID NO:70的核苷酸1792-2277和2320-4374或(iv)SEQ ID NO:71的核苷酸1792-2277和2320-4374(即,SEQ ID NO:1的核苷酸1792-4374、SEQ ID NO:2的核苷酸1792-4374、SEQ ID NO:70的核苷酸1792-4374或SEQ ID NO:71的核苷酸1792-4374,而无编码B结构域或B结构域片段的核苷酸)。
在一些实施方案中,本公开提供包含编码具有FVIII活性的多肽的核苷酸序列的分离的核酸分子,其中所述核苷酸序列包含与SEQ ID NO:1的核苷酸58-4374具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施方案中,所述核苷酸序列包含与SEQ IDNO:1的核苷酸58-2277和2320-4374(即,SEQ ID NO:1的核苷酸58-4374,而无编码B结构域或B结构域片段的核苷酸)具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施方案中,所述核酸序列与SEQ ID NO:1具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施方案中,所述核苷酸序列包含SEQ ID NO:1的核苷酸58-2277和2320-4374(即,SEQ ID NO:1的核苷酸58-4374,而无编码B结构域或B结构域片段的核苷酸)或SEQ ID NO:1的核苷酸58-4374。在其他实施方案中,所述核苷酸序列包含SEQ ID NO:1的核苷酸1-2277和2320-4374(即,SEQ IDNO:1的核苷酸1-4374,而无编码B结构域或B结构域片段的核苷酸)或SEQ ID NO:1的核苷酸1-4374。
在一些实施方案中,本公开提供包含编码具有FVIII活性的多肽的核苷酸序列的分离的核酸分子,其中所述核苷酸序列包含与SEQ ID NO:2的核苷酸58-4374具有至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施方案中,所述核苷酸序列包含与SEQ ID NO:2的核苷酸58-2277和2320-4374具有至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施方案中,所述核酸序列与SEQ ID NO:2具有至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施方案中,所述核苷酸序列包含SEQ ID NO:2的核苷酸58-2277和2320-4374(即,SEQ ID NO:2的核苷酸58-4374,而无编码B结构域或B结构域片段的核苷酸)或SEQ ID NO:2的核苷酸58-4374。在其他实施方案中,所述核苷酸序列包含SEQ ID NO:2的核苷酸1-2277和2320-4374(即,SEQ ID NO:2的核苷酸1-4374,而无编码B结构域或B结构域片段的核苷酸)或SEQ ID NO:2的核苷酸1-4374。
在一些实施方案中,本公开提供包含编码具有FVIII活性的多肽的核苷酸序列的分离的核酸分子,其中所述核苷酸序列包含与SEQ ID NO:70的核苷酸58-4374具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施方案中,所述核苷酸序列包含与SEQ ID NO:70的核苷酸58-2277和2320-4374(即,SEQ ID NO:70的核苷酸58-4374,而无编码B结构域或B结构域片段的核苷酸)具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施方案中,所述核酸序列与SEQ ID NO:70具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施方案中,所述核苷酸序列包含SEQ IDNO:70的核苷酸58-2277和2320-4374(即,SEQ ID NO:70的核苷酸58-4374,而无编码B结构域或B结构域片段的核苷酸)或SEQ ID NO:70的核苷酸58-4374。在其他实施方案中,所述核苷酸序列包含SEQ ID NO:70的核苷酸1-2277和2320-4374(即,SEQ ID NO:70的核苷酸1-4374,而无编码B结构域或B结构域片段的核苷酸)或SEQ ID NO:70的核苷酸1-4374。
在一些实施方案中,本公开提供包含编码具有FVIII活性的多肽的核苷酸序列的分离的核酸分子,其中所述核苷酸序列包含与SEQ ID NO:71的核苷酸58-4374具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施方案中,所述核苷酸序列包含与SEQ ID NO:71的核苷酸58-2277和2320-4374(即,SEQ ID NO:71的核苷酸58-4374,而无编码B结构域或B结构域片段的核苷酸)具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施方案中,所述核酸序列与SEQ ID NO:71具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施方案中,所述核苷酸序列包含SEQ IDNO:71的核苷酸58-2277和2320-4374(即,SEQ ID NO:71的核苷酸58-4374,而无编码B结构域或B结构域片段的核苷酸)或SEQ ID NO:71的核苷酸58-4374。在其他实施方案中,所述核苷酸序列包含SEQ ID NO:71的核苷酸1-2277和2320-4374(即,SEQ ID NO:71的核苷酸1-4374,而无编码B结构域或B结构域片段的核苷酸)或SEQ ID NO:71的核苷酸1-4374。
在一些实施方案中,本公开提供包含编码具有FVIII活性的多肽的核苷酸序列的分离的核酸分子,其中所述核苷酸序列包含与SEQ ID NO:3的核苷酸58-4374具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施方案中,所述核苷酸序列包含与SEQ ID NO:3的核苷酸58-2277和2320-4374(即,SEQ ID NO:3的核苷酸58-4374,而无编码B结构域或B结构域片段的核苷酸)具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在某些实施方案中,所述核酸序列与SEQ ID NO:3具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一些实施方案中,所述核苷酸序列包含SEQ ID NO:3的核苷酸58-2277和2320-4374(即,SEQ ID NO:3的核苷酸58-4374,而无编码B结构域或B结构域片段的核苷酸)或SEQ IDNO:3的核苷酸58-4374。在其他实施方案中,所述核苷酸序列包含SEQ ID NO:3的核苷酸58-2277和2320-4374(即,SEQ ID NO:3的核苷酸1-4374,而无编码B结构域或B结构域片段的核苷酸)或SEQ ID NO:3的核苷酸1-4374。
在一些实施方案中,本公开提供包含编码具有FVIII活性的多肽的核苷酸序列的分离的核酸分子,其中所述核苷酸序列包含与SEQ ID NO:4的核苷酸58-4374具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施方案中,所述核苷酸序列包含与SEQ ID NO:4的核苷酸58-2277和2320-4374(即,SEQ ID NO:4的核苷酸58-4374,而无编码B结构域或B结构域片段的核苷酸)具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施方案中,所述核酸序列与SEQ IDNO:4具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施方案中,所述核苷酸序列包含SEQ ID NO:4的核苷酸58-2277和2320-4374(即,SEQ ID NO:4的核苷酸58-4374,而无编码B结构域或B结构域片段的核苷酸)或SEQ ID NO:4的核苷酸58-4374。在其他实施方案中,所述核苷酸序列包含SEQ ID NO:4的核苷酸1-2277和2320-4374(即,SEQ ID NO:4的核苷酸1-4374,而无编码B结构域或B结构域片段的核苷酸)或SEQ ID NO:4的核苷酸1-4374。
在一些实施方案中,本公开提供包含编码具有FVIII活性的多肽的核苷酸序列的分离的核酸分子,其中所述核苷酸序列包含与SEQ ID NO:5的核苷酸58-4374具有至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施方案中,所述核苷酸序列包含与SEQ ID NO:5的核苷酸58-2277和2320-4374(即,SEQ ID NO:5的核苷酸58-4374,而无编码B结构域或B结构域片段的核苷酸)具有至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在某些实施方案中,所述核酸序列与SEQ ID NO:5具有至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一些实施方案中,所述核苷酸序列包含SEQ ID NO:5的核苷酸58-2277和2320-4374(即,SEQ ID NO:5的核苷酸58-4374,而无编码B结构域或B结构域片段的核苷酸)或SEQ IDNO:5的核苷酸58-4374。在其他实施方案中,所述核苷酸序列包含SEQ ID NO:5的核苷酸1-2277和2320-4374(即,SEQ ID NO:5的核苷酸1-4374,而无编码B结构域或B结构域片段的核苷酸)或SEQ ID NO:5的核苷酸1-4374。
在一些实施方案中,本公开提供包含编码具有FVIII活性的多肽的核苷酸序列的分离的核酸分子,其中所述核苷酸序列包含与SEQ ID NO:6的核苷酸58-4374具有至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施方案中,所述核苷酸序列包含与SEQ ID NO:6的核苷酸58-2277和2320-4374(即,SEQ ID NO:6的核苷酸58-4374,而无编码B结构域或B结构域片段的核苷酸)具有至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在某些实施方案中,所述核酸序列与SEQ ID NO:6具有至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一些实施方案中,所述核苷酸序列包含SEQ ID NO:6的核苷酸58-2277和2320-4374(即,SEQ ID NO:6的核苷酸58-4374,而无编码B结构域或B结构域片段的核苷酸)或SEQ IDNO:6的核苷酸58-4374。在其他实施方案中,所述核苷酸序列包含SEQ ID NO:6的核苷酸1-2277和2320-4374(即,SEQ ID NO:6的核苷酸1-4374,而无编码B结构域或B结构域片段的核苷酸)或SEQ ID NO:6的核苷酸1-4374。
在一些实施方案中,所述核苷酸序列包含编码信号肽的核酸序列。在某些实施方案中,所述信号肽是FVIII信号肽。在一些实施方案中,所述编码信号肽的核酸序列经过密码子优化。在一个特定实施方案中,所述编码信号肽的核酸序列与(i)SEQ ID NO:1的核苷酸1至57;(ii)SEQ ID NO:2的核苷酸1至57;(iii)SEQ ID NO:3的核苷酸1至57;(iv)SEQ IDNO:4的核苷酸1至57;(v)SEQ ID NO:5的核苷酸1至57;(vi)SEQ ID NO:6的核苷酸1至57;(vii)SEQ ID NO:70的核苷酸1至57;(viii)SEQ ID NO:71的核苷酸1至57;或(ix)SEQ IDNO:68的核苷酸1至57具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。
SEQ ID NO:1-6、70和71是开始或“亲本”或“野生型”FVIII核苷酸序列SEQ ID NO:16的优化形式。SEQ ID NO:16编码B结构域缺失的人FVIII。虽然SEQ ID NO:1-6、70和71是源于FVIII的特定B结构域缺失形式(SEQ ID NO:16),但应理解,本公开还针对编码FVIII的其他形式的核酸的优化形式。例如,FVIII的其他形式可包括全长FVIII、FVIII的其他B结构域缺失(下文所述)或保持FVIII活性的FVIII的其他片段。
除非另外规定,否则如本文所用,“具有FVIII活性的多肽”意指在凝固方面具有其正常作用的功能性FVIII多肽。术语具有FVIII活性的多肽包括保持全长野生型因子VIII在凝固途径中的功能的其功能性片段、变体、类似物或衍生物。“具有FVIII活性的多肽”可与FVIII蛋白、FVIII多肽或FVIII互换使用。FVIII功能的实例包括但不限于活化凝固的能力、用作因子IX的辅因子的能力或在Ca2+和磷脂存在下与因子IX形成因子X酶复合物(tenasecomplex)的能力,所述因子X酶复合物接着将因子X转化为活化形式Xa。在一个实施方案中,具有FVIII活性的多肽包含两条多肽链,具有FVIII重链的第一链和具有FVIII轻链的第二链。在另一实施方案中,具有FVIII活性的多肽是单链FVIII。单链FVIII可在对应于成熟FVIII序列的氨基酸残基1645和/或1648处含有一种或多种突变或取代。参见国际申请号PCT/US2012/045784,其以引用的方式整体并入本文中。所述FVIII蛋白可以是人、猪、犬、大鼠或鼠科动物FVIII蛋白。另外,来自人和其他物种的FVIII之间的比较已经鉴别出对功能可能所需的保守残基(Cameron等人,Thromb.Haemost.79:317-22(1998);US 6,251,632)。
如本文所用,FVIII的“B结构域”与本领域中已知的B结构域相同,本领域中已知的B结构域由内部氨基酸序列同一性和通过凝血酶进行蛋白水解裂解的位点限定(例如,全长人FVIII的残基Ser741-Arg1648)。其他人FVIII域由以下氨基酸残基限定:A1,残基Ala1-Arg372;A2,残基Ser373-Arg740;A3,残基Ser1690-Ile2032;C1,残基Arg2033-Asn2172;C2,残基Ser2173-Tyr2332。A3-C1-C2序列包括残基Ser1690-Tyr2332。剩余序列(残基Glu1649-Arg1689)通常称作FVIII轻链活化肽。猪、小鼠和犬FVIII的所有结构域(包括所述B结构域)的边界的位置也是本领域中已知的。BDD FVIII的一个实例是
Figure BDA0001814810910000491
重组BDDFVIII(Wyeth Pharmaceuticals,Inc.)。
“B结构域缺失的FVIII”可以具有美国专利号6,316,226、6,346,513、7,041,635、5,789,203、6,060,447、5,595,886、6,228,620、5,972,885、6,048,720、5,543,502、5,610,278、5,171,844、5,112,950、4,868,112和6,458,563中所公开的全部或部分缺失,所述专利中的每一者均以引用的方式整体并入本文中。在一些实施方案中,本公开的B结构域缺失的FVIII序列包含美国专利号6,316,226的第4栏第4行至第5栏第28行和实施例1-5中所公开的缺失中的任一者(也在US 6,346,513中)。在一些实施方案中,本公开的B结构域缺失的FVIII具有美国专利号5,789,203的第2栏第26-51行和实施例5-8中所公开的缺失(另外,US6,060,447、US 5,595,886和US 6,228,620)。在一些实施方案中,B结构域缺失的FVIII具有美国专利号5,972,885的第1栏第25行至第2栏第40行;美国专利号6,048,720的第6栏第1-22行和实施例1;美国专利号5,543,502的第2栏第17-46行;美国专利号5,171,844的第4栏第22行至第5栏第36行;美国专利号5,112,950的第2栏第55-68行、图2和实施例1;美国专利号4,868,112的第2栏第2行至第19栏第21行和表2;美国专利号7,041,635的第2栏第1行至第3栏第19行、第3栏第40行至第4栏第67行、第7栏第43行至第8栏第26行和第11栏第5行至第13栏第39行;或美国专利号6,458,563的第4栏第25-53行中所述的缺失。在一些实施方案中,B结构域缺失的FVIII具有B结构域中的大部分的缺失,但仍含有B结构域中将初级翻译产物体内蛋白水解加工为两条多肽链所必需的氨基端序列,如WO 91/09122中所公开,WO91/09122以引用的方式整体并入本文中。在一些实施方案中,B结构域缺失的FVIII用氨基酸747-1638的缺失,即实际上所述B结构域的完全缺失构建。Hoeben R.C.等人J.Biol.Chem.265(13):7318-7323(1990),其以引用的方式整体并入本文中。B结构域缺失的FVIII也可以含有FVIII的氨基酸771–1666或氨基酸868-1562的缺失。Meulien P.等人Protein Eng.2(4):301-6(1988),其以引用的方式整体并入本文中。作为本公开的一部分的另外的B结构域缺失包括例如:氨基酸982-1562或760-1639(Toole等人,Proc.Natl.Acad.Sci.U.S.A.(1986)83,5939-5942))、797-1562(Eaton等人Biochemistry(1986)25:8343-8347))、741-1646(Kaufman(PCT公布申请号WO 87/04187))、747-1560(Sarver等人,DNA(1987)6:553-564))、741-1648(Pasek(PCT申请号88/00831))、816-1598或741-1689(Lagner(Behring Inst.Mitt.(1988)No 82:16-25,EP 295597))的缺失,其中每一者均以引用的方式整体并入本文中。前述缺失中的每一者均可在任何FVIII序列中产生。
多种包括B结构域缺失的功能性FVIII分子公开于以下专利中:受让给Baxter的US6,316,226和US 6,346,513;受让给In2Gen的US 7,041,635;受让给Chiron的US 5,789,203、US 6,060,447、US 5,595,886和US 6,228,620;受让给Biovitrum的US 5,972,885和US6,048,720;受让给Novo Nordisk的US 5,543,502和US 5,610,278;受让给Immuno Ag的US5,171,844;受让给Transgene S.A.的US 5,112,950;受让给Genetics Institute的US 4,868,112,其中每一者均以引用的方式整体并入本文中。
密码子优化
在一个实施方案中,本公开提供包含编码具有FVIII活性的多肽的核苷酸序列的分离的核酸分子,其中所述核酸序列已经过密码子优化。在另一实施方案中,编码具有FVIII活性的多肽并且经受密码子优化的起始核酸序列是SEQ ID NO:16。在一些实施方案中,编码具有FVIII活性的多肽的序列针对人表达经过密码子优化。在其他实施方案中,编码具有FVIII活性的多肽的序列针对鼠科动物表达经过密码子优化。SEQ ID NO:1-6、70和71是SEQ ID NO:16的密码子优化形式,针对人表达经过优化。
当术语“密码子优化”是指用于多种宿主的转化的核酸分子的基因或编码区时,所述术语是指所述核酸分子的基因或编码区中的密码子的改变以反映宿主生物体的典型密码子使用而不改变由DNA编码的多肽。所述优化包括用更频繁用于所述生物体的基因中的一种或多种密码子置换至少一种或超过一种或大部分密码子。
包含编码任何多肽链的氨基酸的密码子的核苷酸序列中的偏差允许编码所述基因的序列的变异。由于各密码子由三个核苷酸组成,并且构成DNA的核苷酸限于四种特定碱基,存在核苷酸的64种可能组合,其中61种编码氨基酸(剩余三种密码子编码终止翻译的信号)。显示何种密码子编码何种氨基酸的“遗传密码”以表1复制于本文中。结果,多种氨基酸由超过一种密码子指定。例如,氨基酸丙氨酸和脯氨酸由四个三联体编码,丝氨酸和精氨酸由六个三联体编码,而色氨酸和甲硫氨酸仅由一个三联体编码。这种简并性允许DNA碱基组成在广泛范围内改变而不改变由所述DNA编码的蛋白质的氨基酸序列。
表1:标准遗传密码
Figure BDA0001814810910000521
多种生物体展示使用特定密码子来编码的偏好以将特定氨基酸***生长的肽链中。生物体之间密码子使用的密码子偏爱或密码子偏好差异由遗传密码的简并性提供,并且充分记录于多种生物体中。密码子偏好通常与信使RNA(mRNA)的翻译效率有关,相信信使RNA(mRNA)的翻译效率又尤其依赖于正在翻译的密码子的特性和特定转运RNA(tRNA)分子的可用性。细胞中所选择的tRNA的优势一般是最频繁用于肽合成的密码子的反映。因此,基因可基于密码子优化经过调适用于给定生物体中的最佳基因表达。
鉴于多种动物、植物和微生物物种的大量基因序列可用,已经计算出密码子使用的相对频率。密码子使用表可例如在www.kazusa.or.jp/codon/(2012年6月18日访问)中可获得的“密码子使用数据库”中获得。参见Nakamura,Y.等人Nucl.Acids Res.28:292(2000)。
以优化的频率随机地分配密码子以编码给定多肽序列可以通过计算各氨基酸的密码子频率,并且接着将所述密码子随机地分配至所述多肽序列而手动地进行。另外,多种算法和计算机软件程序可用于计算最佳序列。
在一些实施方案中,所述核酸分子包含一种或多种特性:(a)所述核酸分子或其一部分相对于SEQ ID NO:16具有增加的人密码子适应指数;(b)所述核苷酸序列或其一部分相对于SEQ ID NO:16具有增加的最优密码子频率;(c)与SEQ ID NO:16中的G/C核苷酸百分比相比,所述核苷酸序列或其一部分含有较高百分比的G/C核苷酸;(d)所述核苷酸序列或其一部分相对于SEQ ID NO:16具有增加的相对同义密码子使用;(e)所述核苷酸序列或其一部分相对于SEQ ID NO:16是降低的有效数目的密码子;(f)所述核苷酸序列相对于SEQID NO:16含有较少MARS/ARS序列(SEQ ID NO:21和22);(g)所述核苷酸序列相对于SEQ IDNO:16含有较少去稳定元件(SEQ ID NO:23和24);(i)所述核苷酸序列不含poly-T序列,(j)所述核苷酸序列不含poly-A序列;或(k)其任何组合。在一些实施方案中,所述核酸分子含有(a)-(j)中的至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或十种特征。
密码子适应指数
在一个实施方案中,本公开提供包含编码具有FVIII活性的多肽的本文所述的核苷酸序列的分离的核酸分子,其中所述人密码子适应指数相对于SEQ ID NO:16增加。例如,所述核苷酸序列可具有至少约0.75(75%)、至少约0.76(76%)、至少约0.77(77%)、至少约0.78(78%)、至少约0.79(79%)、至少约0.80(80%)、至少约0.81(81%)、至少约0.82(82%)、至少约0.83(83%)、至少约0.84(84%)、至少约0.85(85%)、至少约0.86(86%)、至少约0.87(87%)、至少约0.88(88%)、至少约0.89(89%)、至少约0.90(90%)、至少约0.91(91%)、至少约0.92(92%)、至少约0.93(93%)、至少约0.94(94%)、至少约0.95(95%)、至少约0.96(96%)、至少约0.97(97%)、至少约0.98(98%)或至少约0.99(99%)的人密码子适应指数。在一些实施方案中,所述核苷酸序列具有至少约.88(88%)的人密码子适应指数。在其他实施方案中,所述核苷酸序列具有至少约.91(91%)的人密码子适应指数。在其他实施方案中,所述核苷酸序列具有至少约.91(97%)的人密码子适应指数。
在一个特定实施方案中,本公开提供包含如下核苷酸序列的分离的核酸分子,所述核苷酸序列包含编码FVIII多肽的N端部分的第一核酸序列和编码FVIII多肽的C端部分的第二核酸序列;其中所述第一核酸序列与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ IDNO:3的核苷酸1-1791;(iii)SEQ ID NO:4的核苷酸58-1791;或(iv)SEQ ID NO:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中所述N端部分和所述C端部分合起来具有FVIII多肽活性;并且其中所述核苷酸序列的人密码子适应指数相对于SEQ ID NO:16增加。在一些实施方案中,所述核苷酸序列具有至少约0.75(75%)、至少约0.76(76%)、至少约0.77(77%)、至少约0.78(78%)、至少约0.79(79%)、至少约0.80(80%)、至少约0.81(81%)、至少约0.82(82%)、至少约0.83(83%)、至少约0.84(84%)、至少约0.85(85%)、至少约0.86(86%)、至少约0.87(87%)、至少约0.88(88%)、至少约0.89(89%)、至少约0.90(90%)或至少约.91(91%)的人密码子适应指数。在一个特定中,所述核苷酸序列具有至少约.88(88%)的人密码子适应指数。在另一实施方案中,所述核苷酸序列具有至少约.91(91%)的人密码子适应指数。
在另一实施方案中,本公开提供包含如下核苷酸序列的分离的核酸分子,所述核苷酸序列包含编码FVIII多肽的N端部分的第一核酸序列和编码FVIII多肽的C端部分的第二核酸序列;其中所述第二核酸序列与(i)SEQ ID NO:5的核苷酸1792-2277和2320-4374或(ii)SEQ ID NO:6的1792-2277和2320-4374具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中所述N端部分和所述C端部分合起来具有FVIII多肽活性;并且其中所述核苷酸序列的人密码子适应指数相对于SEQ ID NO:16增加。在一些实施方案中,所述核苷酸序列具有至少约0.75(75%)、至少约0.76(76%)、至少约0.77(77%)、至少约0.78(78%)、至少约0.79(79%)、至少约0.80(80%)、至少约0.81(81%)、至少约0.82(82%)、至少约0.83(83%)、至少约0.84(84%)、至少约0.85(85%)、至少约0.86(86%)、至少约0.87(87%)或至少约0.88(88%)的人密码子适应指数。在一个特定中,所述核苷酸序列具有至少约.83(83%)的人密码子适应指数。在另一实施方案中,所述核苷酸序列具有至少约.88(88%)的人密码子适应指数。
在其他实施方案中,本公开提供包含编码具有FVIII活性的多肽的核苷酸序列的分离的核酸分子,其中所述核苷酸序列包含与选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,SEQ ID NO:1、2、3、4、5、6、70和71的核苷酸58-4374,而无编码B结构域或B结构域片段的核苷酸)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中所述核苷酸序列的人密码子适应指数相对于SEQ ID NO:16增加。在一些实施方案中,所述核苷酸序列具有至少约0.75(75%)、至少约0.76(76%)、至少约0.77(77%)、至少约0.78(78%)、至少约0.79(79%)、至少约0.80(80%)、至少约0.81(81%)、至少约0.82(82%)、至少约0.83(83%)、至少约0.84(84%)、至少约0.85(85%)、至少约0.86(86%)、至少约0.87(87%)或至少约0.88(88%)的人密码子适应指数。在一个特定中,所述核苷酸序列具有至少约.75(75%)的人密码子适应指数。在另一实施方案中,所述核苷酸序列具有至少约.83(83%)的人密码子适应指数。在另一实施方案中,所述核苷酸序列具有至少约.88(88%)的人密码子适应指数。在另一实施方案中,所述核苷酸序列具有至少约.91(91%)的人密码子适应指数。在另一实施方案中,所述核苷酸序列具有至少约.97(97%)的人密码子适应指数。
在一些实施方案中,本公开的分离的核酸分子相对于SEQ ID NO:16具有增加的最优密码子频率(FOP)。在某些实施方案中,所述分离的核酸分子的FOP是至少约40、至少约45、至少约50、至少约55、至少约60、至少约64、至少约65、至少约70、至少约75、至少约79、至少约80、至少约85或至少约90。
在其他实施方案中,本公开的分离的核酸分子相对于SEQ ID NO:16具有增加的相对同义密码子使用(RCSU)。在一些实施方案中,所述分离的核酸分子的RCSU大于1.5。在其他实施方案中,所述分离的核酸分子的RCSU大于2.0。在某些实施方案中,所述分离的核酸分子的RCSU是至少约1.5、至少约1.6、至少约1.7、至少约1.8、至少约1.9、至少约2.0、至少约2.1、至少约2.2、至少约2.3、至少约2.4、至少约2.5、至少约2.6或至少约2.7。
在其他实施方案中,本公开的分离的核酸分子相对于SEQ ID NO:16具有减少的有效数目的密码子。在一些实施方案中,所述分离的核酸分子具有少于约50、少于约45、少于约40、少于约35、少于约30或少于约25的有效数目的密码子。在一个特定实施方案中,所述分离的核酸分子具有约40、约35、约30、约25或约20的有效数目的密码子。
G/C含量优化
在一些实施方案中,本公开提供包含编码具有FVIII活性的多肽的本文所述的核苷酸序列的分离的核酸分子,其中与SEQ ID NO:16中的G/C核苷酸百分比相比,所述核苷酸序列含有较高百分比的G/C核苷酸。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列具有至少约45%、至少约46%、至少约47%、至少约48%、至少约49%、至少约50%、至少约51%、至少约52%、至少约53%、至少约54%、至少约55%、至少约56%、至少约57%、至少约58%、至少约59%或至少约60%的G/C含量。
在一个特定实施方案中,本公开提供包含如下核苷酸序列的分离的核酸分子,所述核苷酸序列包含编码FVIII多肽的N端部分的第一核酸序列和编码FVIII多肽的C端部分的第二核酸序列;其中所述第一核酸序列与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ IDNO:3的核苷酸1-1791;(iii)SEQ ID NO:4的核苷酸58-1791;或(iv)SEQ ID NO:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中所述N端部分和所述C端部分合起来具有FVIII多肽活性;并且其中与SEQ ID NO:16中的G/C核苷酸百分比相比,所述核苷酸序列含有较高百分比的G/C核苷酸。在一些实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列具有至少约45%、至少约46%、至少约47%、至少约48%、至少约49%、至少约50%、至少约51%、至少约52%、至少约53%、至少约54%、至少约55%、至少约56%、至少约57%或至少约58%的G/C含量。在一个特定实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列具有至少约58%的G/C含量。
在另一实施方案中,本公开提供包含如下核苷酸序列的分离的核酸分子,所述核苷酸序列包含编码FVIII多肽的N端部分的第一核酸序列和编码FVIII多肽的C端部分的第二核酸序列;其中所述第二核酸序列与(i)SEQ ID NO:5的核苷酸1792-4374;(ii)SEQ IDNO:6的核苷酸1792-4374;(iii)SEQ ID NO:5的核苷酸1792-2277和2320-4374(即,SEQ IDNO:5的核苷酸1792-4374,而无编码B结构域或B结构域片段的核苷酸)或(iv)SEQ ID NO:6的核苷酸1792-2277和2320-4374(即,SEQ ID NO:6的核苷酸1792-4374,而无编码B结构域或B结构域片段的核苷酸)具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中所述N端部分和所述C端部分合起来具有FVIII多肽活性;并且其中与SEQ ID NO:16中的G/C核苷酸百分比相比,所述核苷酸序列含有较高百分比的G/C核苷酸。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列具有至少约45%、至少约46%、至少约47%、至少约48%、至少约49%、至少约50%、至少约51%、至少约52%、至少约53%、至少约54%、至少约55%、至少约56%或至少约57%的G/C含量。在一个特定实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列具有至少约52%的G/C含量。在另一实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列具有至少约55%的G/C含量。在另一实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列具有至少约57%的G/C含量。
在其他实施方案中,本公开提供包含编码具有FVIII活性的多肽的核苷酸序列的分离的核酸分子,其中所述核苷酸序列包含与选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的(i)核苷酸58-4374或(ii)核苷酸58-2277和2320-4374(即,SEQ ID NO:1、2、3、4、5、6、70和71的核苷酸58-4374,而无编码B结构域或B结构域片段的核苷酸)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中与SEQ ID NO:16中的G/C核苷酸百分比相比,所述核苷酸序列含有较高百分比的G/C核苷酸。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列具有至少约45%的G/C含量。在一个特定实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列具有至少约52%的G/C含量。在另一实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列具有至少约55%的G/C含量。在另一实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列具有至少约57%的G/C含量。在另一实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列具有至少约58%的G/C含量。在另一实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列具有至少约60%的G/C含量。
“G/C含量”(或鸟嘌呤-胞嘧啶含量)或“G/C核苷酸百分比”是指DNA分子中含氮碱基(为鸟嘌呤或胞嘧啶)的百分比。G/C含量可以使用下式计算:
Figure BDA0001814810910000591
人基因在其G/C含量方面是高度不同的,其中一些基因具有低达20%的G/C含量,并且其他基因具有高达95%的G/C含量。一般说来,富G/C基因更高地表达。事实上,已经证明了增加基因的G/C含量可以引起所述基因的增加的表达,这主要是归因于转录的增加和较高的稳态mRNA水平。参见Kudla等人,PLoS Biol.,4(6):e180(2006)。
基质附着区样序列
在一些实施方案中,本公开提供包含编码具有FVIII活性的多肽的本文所述的核苷酸序列的分离的核酸分子,其中所述核苷酸序列相对于SEQ ID NO:16含有较少MARS/ARS序列。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列含有至多6个、至多5个、至多4个、至多3个或至多2个MARS/ARS序列。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列含有至多1个MARS/ARS序列。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列不含MARS/ARS序列。
在一个特定实施方案中,本公开提供包含如下核苷酸序列的分离的核酸分子,所述核苷酸序列包含编码FVIII多肽的N端部分的第一核酸序列和编码FVIII多肽的C端部分的第二核酸序列;其中所述第一核酸序列与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ IDNO:3的核苷酸1-1791;(iii)SEQ ID NO:4的核苷酸58-1791;或(iv)SEQ ID NO:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中所述N端部分和所述C端部分合起来具有FVIII多肽活性;并且其中所述核苷酸序列相对于SEQ ID NO:16含有较少MARS/ARS序列。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列含有至多6个、至多5个、至多4个、至多3个或至多2个MARS/ARS序列。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列含有至多1个MARS/ARS序列。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列不含MARS/ARS序列。
在另一实施方案中,本公开提供包含如下核苷酸序列的分离的核酸分子,所述核苷酸序列包含编码FVIII多肽的N端部分的第一核酸序列和编码FVIII多肽的C端部分的第二核酸序列;其中所述第二核酸序列与(i)SEQ ID NO:5的核苷酸1792-4374;(ii)SEQ IDNO:6的核苷酸1792-4374;(iii)SEQ ID NO:5的核苷酸1792-2277和2320-4374(即,SEQ IDNO:5的核苷酸1792-4374,而无编码B结构域或B结构域片段的核苷酸)或(iv)SEQ ID NO:6的核苷酸1792-2277和2320-4374(即,SEQ ID NO:6的核苷酸1792-4374,而无编码B结构域或B结构域片段的核苷酸)具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中所述N端部分和所述C端部分合起来具有FVIII多肽活性;并且其中所述核苷酸序列相对于SEQ ID NO:16含有较少MARS/ARS序列。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列含有至多6个、至多5个、至多4个、至多3个或至多2个MARS/ARS序列。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列含有至多1个MARS/ARS序列。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列不含MARS/ARS序列。
在其他实施方案中,本公开提供包含编码具有FVIII活性的多肽的核苷酸序列的分离的核酸分子,其中所述核苷酸序列包含与(i)SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374或(ii)SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-2277和2320-4374(即,SEQID NO:1、2、3、4、5、6、70或71的核苷酸58-4374,而无编码B结构域或B结构域片段的核苷酸)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中所述核苷酸序列相对于SEQ ID NO:16含有较少MARS/ARS序列。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列含有至多6个、至多5个、至多4个、至多3个或至多2个MARS/ARS序列。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列含有至多1个MARS/ARS序列。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列不含MARS/ARS序列。
已经鉴别出人FVIII核苷酸序列中与酿酒酵母自主复制序列(ARS)和核基质附着区(MAR)共享序列相似性的的富AT元件。(Fallux等人,Mol.Cell.Biol.16:4264-4272(1996)。已经证明这些元件之一体外结合核因子并且抑制氯霉素乙酰转移酶(CAT)报告基因的表达。同上。已经假设这些序列可以促进人FVIII基因的转录抑制。因此,在一个实施方案中,所有MAR/ARS序列均在本公开的FVIII基因中消除。在亲本FVIII序列(SEQ ID NO:16)中存在四个MAR/ARS ATATTT序列(SEQ ID NO:21)和三个MAR/ARS AAATAT序列(SEQ ID NO:22)。使所有这些位点均发生突变以破坏优化的FVIII序列(SEQ ID NO:1-6)中的MAR/ARS序列。在所述优化序列中这些元件中的每一者的位置和相应核苷酸的序列显示于下表2中。
表2:抑制性元件的改变的概述
Figure BDA0001814810910000621
Figure BDA0001814810910000631
去稳定序列
在一些实施方案中,本公开提供包含编码具有FVIII活性的多肽的本文所述的核苷酸序列的分离的核酸分子,其中所述核苷酸序列相对于SEQ ID NO:16含有较少去稳定元件。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列含有至多9个、至多8个、至多7个、至多6个或至多5个去稳定元件。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列含有至多4个、至多3个、至多2个或至多1个去稳定元件。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列不含去稳定元件。
在一个特定实施方案中,本公开提供包含如下核苷酸序列的分离的核酸分子,所述核苷酸序列包含编码FVIII多肽的N端部分的第一核酸序列和编码FVIII多肽的C端部分的第二核酸序列;其中所述第一核酸序列与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ IDNO:3的核苷酸1-1791;(iii)SEQ ID NO:4的核苷酸58-1791;或(iv)SEQ ID NO:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中所述N端部分和所述C端部分合起来具有FVIII多肽活性;并且其中所述核苷酸序列相对于SEQ ID NO:16含有较少去稳定元件。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列含有至多9个、至多8个、至多7个、至多6个或至多5个去稳定元件。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列含有至多4个、至多3个、至多2个或至多1个去稳定元件。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列不含去稳定元件。
在另一实施方案中,本公开提供包含如下核苷酸序列的分离的核酸分子,所述核苷酸序列包含编码FVIII多肽的N端部分的第一核酸序列和编码FVIII多肽的C端部分的第二核酸序列;其中所述第二核酸序列与(i)SEQ ID NO:5的核苷酸1792-4374;(ii)SEQ IDNO:6的核苷酸1792-4374;(iii)SEQ ID NO:5的核苷酸1792-2277和2320-4374(即,SEQ IDNO:5的核苷酸1792-4374,而无编码B结构域或B结构域片段的核苷酸);或(iv)SEQ ID NO:6的核苷酸1792-2277和2320-4374(即,SEQ ID NO:6的核苷酸1792-4374,而无编码B结构域或B结构域片段的核苷酸)具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中所述N端部分和所述C端部分合起来具有FVIII多肽活性;并且其中所述核苷酸序列相对于SEQ ID NO:16含有较少去稳定元件。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列含有至多9个、至多8个、至多7个、至多6个或至多5个去稳定元件。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列含有至多4个、至多3个、至多2个或至多1个去稳定元件。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列不含去稳定元件。
在其他实施方案中,本公开提供包含编码具有FVIII活性的多肽的核苷酸序列的分离的核酸分子,其中所述核苷酸序列包含与(i)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374,而无编码B结构域或B结构域片段的核苷酸)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中所述核苷酸序列相对于SEQ ID NO:16含有较少去稳定元件。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列含有至多9个、至多8个、至多7个、至多6个或至多5个去稳定元件。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列含有至多4个、至多3个、至多2个或至多1个去稳定元件。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列不含去稳定元件。
在亲本FVIII序列(SEQ ID NO:16)中存在十个去稳定元件:六个ATTTA序列(SEQID NO:23)和四个TAAAT序列(SEQ ID NO:24)。在一个实施方案中,使这些位点的序列发生突变以破坏优化的FVIII SEQ ID NO:1-6、70和71中的去稳定元件。在所述优化序列中这些元件中的每一者的位置和相应核苷酸的序列显示于表2中。
潜在启动子结合位点
在一些实施方案中,本公开提供包含编码具有FVIII活性的多肽的本文所述的核苷酸序列的分离的核酸分子,其中所述核苷酸序列相对于SEQ ID NO:16含有较少潜在启动子结合位点。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列含有至多9个、至多8个、至多7个、至多6个或至多5个潜在启动子结合位点。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列含有至多4个、至多3个、至多2个或至多1个潜在启动子结合位点。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列不含潜在启动子结合位点。
在一个特定实施方案中,本公开提供包含如下核苷酸序列的分离的核酸分子,所述核苷酸序列包含编码FVIII多肽的N端部分的第一核酸序列和编码FVIII多肽的C端部分的第二核酸序列;其中所述第一核酸序列与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ IDNO:3的核苷酸1-1791;(iii)SEQ ID NO:4的核苷酸58-1791;或(iv)SEQ ID NO:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中所述N端部分和所述C端部分合起来具有FVIII多肽活性;并且其中所述核苷酸序列相对于SEQ ID NO:16含有较少潜在启动子结合位点。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列含有至多9个、至多8个、至多7个、至多6个或至多5个潜在启动子结合位点。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列含有至多4个、至多3个、至多2个或至多1个潜在启动子结合位点。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列不含潜在启动子结合位点。
在另一实施方案中,本公开提供包含如下核苷酸序列的分离的核酸分子,所述核苷酸序列包含编码FVIII多肽的N端部分的第一核酸序列和编码FVIII多肽的C端部分的第二核酸序列;其中所述第二核酸序列与(i)SEQ ID NO:5的核苷酸1792-4374;(ii)SEQ IDNO:6的核苷酸1792-4374;(iii)SEQ ID NO:5的核苷酸1792-2277和2320-4374(即,SEQ IDNO:5的核苷酸1792-4374,而无编码B结构域或B结构域片段的核苷酸);或(iv)SEQ ID NO:6的核苷酸1792-2277和2320-4374(即,SEQ ID NO:6的核苷酸1792-4374,而无编码B结构域或B结构域片段的核苷酸)具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中所述N端部分和所述C端部分合起来具有FVIII多肽活性;并且其中所述核苷酸序列相对于SEQ ID NO:16含有较少潜在启动子结合位点。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列含有至多9个、至多8个、至多7个、至多6个或至多5个潜在启动子结合位点。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列含有至多4个、至多3个、至多2个或至多1个潜在启动子结合位点。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列不含潜在启动子结合位点。
在其他实施方案中,本公开提供包含编码具有FVIII活性的多肽的核苷酸序列的分离的核酸分子,其中所述核苷酸序列包含与(i)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374,而无编码B结构域或B结构域片段的核苷酸)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中所述核苷酸序列相对于SEQ ID NO:16含有较少潜在启动子结合位点。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列含有至多9个、至多8个、至多7个、至多6个或至多5个潜在启动子结合位点。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列含有至多4个、至多3个、至多2个或至多1个潜在启动子结合位点。在其他实施方案中,所述编码具有FVIII活性的多肽的核苷酸序列不含潜在启动子结合位点。
TATA盒是通常在真核生物的启动子区中发现的调控序列。其充当通用转录因子TATA结合蛋白(TBP)的结合位点。TATA盒通常包含序列TATAA(SEQ ID NO:28)或闭合变体。然而,编码序列内的TATA盒可以抑制全长蛋白质的翻译。在野生型BDD FVIII序列(SEQ IDNO:16)中存在十个潜在启动子结合序列:五个TATAA序列(SEQ ID NO:28)和五个TTATA序列(SEQ ID NO:29)。在一些实施方案中,至少1个、至少2个、至少3个或至少4个启动子结合位点在本公开的FVIII基因中消除。在一些实施方案中,至少5个启动子结合位点在本公开的FVIII基因中消除。在其他实施方案中,至少6个、至少7个或至少8个启动子结合位点在本公开的FVIII基因中消除。在一个实施方案中,至少9个启动子结合位点在本公开的FVIII基因中消除。在一个特定实施方案中,所有启动子结合位点均在本公开的FVIII基因中消除。在所述优化序列中每一个潜在启动子结合位点的位置和相应核苷酸的序列显示于表2中。
其他顺式作用负调控元件
除了上文所述的MAR/ARS序列、去稳定元件和潜在启动子位点以外,还可在野生型BDD FVIII序列(SEQ ID NO:16)中鉴别出数个另外的潜在抑制序列。在所述非优化BDDFVIII序列中可鉴别出两个富AU序列元件(ARE)(ATTTTATT(SEQ ID NO:30);和ATTTTTAA(SEQ ID NO:31),连同poly-A位点(AAAAAAA;SEQ ID NO:26)、poly-T位点(TTTTTT;SEQ IDNO:25)和剪接位点(GGTGAT;SEQ ID NO:27)。这些元件中的一者或多者可从所述优化FVIII序列中去除。在所述优化序列中这些位点中的每一者的位置和相应核苷酸的序列显示于表2中。
在某些实施方案中,本公开提供包含如下核苷酸序列的分离的核酸分子,所述核苷酸序列包含编码FVIII多肽的N端部分的第一核酸序列和编码FVIII多肽的C端部分的第二核酸序列;其中所述第一核酸序列与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ ID NO:3的核苷酸1-1791;(iii)SEQ ID NO:4的核苷酸58-1791;或(iv)SEQ ID NO:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中所述N端部分和所述C端部分合起来具有FVIII多肽活性;并且其中所述核苷酸序列不含一种或多种顺式作用负调控元件,例如剪接位点、poly-T序列、poly-A序列、ARE序列或其任何组合。
在另一实施方案中,本公开提供包含如下核苷酸序列的分离的核酸分子,所述核苷酸序列包含编码FVIII多肽的N端部分的第一核酸序列和编码FVIII多肽的C端部分的第二核酸序列;其中所述第二核酸序列与(i)SEQ ID NO:5的核苷酸1792-4374;(ii)SEQ IDNO:6的核苷酸1792-4374;(iii)SEQ ID NO:5的核苷酸1792-2277和2320-4374(即,SEQ IDNO:5的核苷酸1792-4374,而无编码B结构域或B结构域片段的核苷酸);或(iv)SEQ ID NO:6的核苷酸1792-2277和2320-4374(即,SEQ ID NO:6的核苷酸1792-4374,而无编码B结构域或B结构域片段的核苷酸)具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中所述N端部分和所述C端部分合起来具有FVIII多肽活性;并且其中所述核苷酸序列不含一种或多种顺式作用负调控元件,例如剪接位点、poly-T序列、poly-A序列、ARE序列或其任何组合。
在其他实施方案中,本公开提供包含编码具有FVIII活性的多肽的核苷酸序列的分离的核酸分子,其中所述核苷酸序列包含与(i)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374,而无编码B结构域或B结构域片段的核苷酸)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中所述核苷酸序列不含一种或多种顺式作用负调控元件,例如剪接位点、poly-T序列、poly-A序列、ARE序列或其任何组合。
在一些实施方案中,本公开提供包含如下核苷酸序列的分离的核酸分子,所述核苷酸序列包含编码FVIII多肽的N端部分的第一核酸序列和编码FVIII多肽的C端部分的第二核酸序列;其中所述第一核酸序列与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ ID NO:3的核苷酸1-1791;(iii)SEQ ID NO:4的核苷酸58-1791;或(iv)SEQ ID NO:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中所述N端部分和所述C端部分合起来具有FVIII多肽活性;并且其中所述核苷酸序列不含剪接位点GGTGAT(SEQ ID NO:27)。在一些实施方案中,本公开提供包含如下核苷酸序列的分离的核酸分子,所述核苷酸序列包含编码FVIII多肽的N端部分的第一核酸序列和编码FVIII多肽的C端部分的第二核酸序列;其中所述第一核酸序列与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ ID NO:3的核苷酸1-1791;(iii)SEQ ID NO:4的核苷酸58-1791;或(iv)SEQ ID NO:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中所述N端部分和所述C端部分合起来具有FVIII多肽活性;并且其中所述核苷酸序列不含poly-T序列(SEQ ID NO:25)。在一些实施方案中,本公开提供包含如下核苷酸序列的分离的核酸分子,所述核苷酸序列包含编码FVIII多肽的N端部分的第一核酸序列和编码FVIII多肽的C端部分的第二核酸序列;其中所述第一核酸序列与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ ID NO:3的核苷酸1-1791;(iii)SEQ ID NO:4的核苷酸58-1791;或(iv)SEQ ID NO:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中所述N端部分和所述C端部分合起来具有FVIII多肽活性;并且其中所述核苷酸序列不含poly-A序列(SEQ ID NO:26)。在一些实施方案中,本公开提供包含如下核苷酸序列的分离的核酸分子,所述核苷酸序列包含编码FVIII多肽的N端部分的第一核酸序列和编码FVIII多肽的C端部分的第二核酸序列;其中所述第一核酸序列与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ ID NO:3的核苷酸1-1791;(iii)SEQ ID NO:4的核苷酸58-1791;或(iv)SEQ ID NO:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中所述N端部分和所述C端部分合起来具有FVIII多肽活性;并且其中所述核苷酸序列不含ARE元件(SEQ ID NO:30或SEQ ID NO:31)。
在一些实施方案中,本公开提供包含编码具有FVIII活性的多肽的核苷酸序列的分离的核酸分子,其中所述核苷酸序列包含与(i)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374,而无编码B结构域或B结构域片段的核苷酸)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中所述核苷酸序列不含剪接位点GGTGAT(SEQ ID NO:27)。在一些实施方案中,本公开提供包含编码具有FVIII活性的多肽的核苷酸序列的分离的核酸分子,其中所述核苷酸序列包含与(i)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374,而无编码B结构域或B结构域片段的核苷酸)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中所述核苷酸序列不含poly-T序列(SEQ ID NO:25)。在一些实施方案中,本公开提供包含编码具有FVIII活性的多肽的核苷酸序列的分离的核酸分子,其中所述核苷酸序列包含与(i)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374,而无编码B结构域或B结构域片段的核苷酸)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中所述核苷酸序列不含poly-A序列(SEQ ID NO:26)。在一些实施方案中,本公开提供包含编码具有FVIII活性的多肽的核苷酸序列的分离的核酸分子,其中所述核苷酸序列包含与(i)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374,而无编码B结构域或B结构域片段的核苷酸)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中所述核苷酸序列不含ARE元件(SEQ ID NO:30或SEQ ID NO:31)。
在其他实施方案中,本公开的优化的FVIII序列不包含抗病毒基序、茎-环结构和重复序列中的一者或多者。
在其他实施方案中,将围绕转录起始位点的核苷酸改变为kozak共有序列(GCCGCCACCATGC(SEQ ID NO:32),其中加下划线的核苷酸是起始密码子)。在其他实施方案中,可添加或去除限制位点以促进克隆过程。
异源核苷酸序列
在一些实施方案中,本公开的分离的核酸分子进一步包含异源核苷酸序列。在一些实施方案中,本公开的分离的核酸分子进一步包含至少一个异源核苷酸序列。所述异源核苷酸序列可与本公开的优化的BDD-FVIII核苷酸序列在5'端、3'端连接,或***至所述优化的BDD-FVIII核苷酸序列的中间。因此,在一些实施方案中,由所述异源核苷酸序列编码的异源氨基酸序列连接至由所述核苷酸序列编码的FVIII氨基酸序列的N端或C端或***所述FVIII氨基酸序列中的两个氨基酸之间。在一些实施方案中,所述异源氨基酸序列可***选自表3的一个或多个***位点处的两个氨基酸之间。在一些实施方案中,所述异源氨基酸序列可***由本公开的核酸分子编码的FVIII多肽内的在国际公布号WO 2013/123457 A1、WO 2015/106052 A1或美国公布号2015/0158929 A1中公开的任何位点处,所述公布以引用的方式整体并入本文中。
在一些实施方案中,由所述异源核苷酸序列编码的异源氨基酸序列***所述B结构域或其片段内。在一些实施方案中,所述异源氨基酸序列***FVIII内紧邻对应于成熟人FVIII(SEQ ID NO:15)的氨基酸745的氨基酸的下游。在一个特定实施方案中,所述FVIII包含对应于成熟人FVIII(SEQ ID NO:15)的氨基酸746-1646的缺失,并且由所述异源核苷酸序列编码的异源氨基酸序列紧邻对应于成熟人FVIII(SEQ ID NO:15)的氨基酸745的下游***。
表3:异源部分***位点
Figure BDA0001814810910000741
Figure BDA0001814810910000751
注:***位点指示对应于成熟人FVIII(SEQ ID NO:15)的氨基酸位置的氨基酸位置。
在其他实施方案中,本公开的分离的核酸分子进一步包含两个、三个、四个、五个、六个、七个或八个异源核苷酸序列。在一些实施方案中,所有所述异源核苷酸序列是相同的。在一些实施方案中,至少一个异源核苷酸序列不同于其它异源核苷酸序列。在一些实施方案中,本公开可包含串联的两个、三个、四个、五个、六个或超过七个异源核苷酸序列。
在一些实施方案中,所述异源核苷酸序列编码氨基酸序列。在一些实施方案中,由所述异源核苷酸序列编码的氨基酸序列是可增加FVIII分子的半衰期的异源部分(“半衰期延长剂”)。
在一些实施方案中,所述异源部分是具有未结构化或结构化特征的肽或多肽,所述未结构化或结构化特征与并入本公开的蛋白质中时体内半衰期的延长有关。非限制性实例包括白蛋白、白蛋白片段、免疫球蛋白的Fc片段、人绒毛膜***的β亚单位的C端肽(CTP)、HAP序列、XTEN序列、转铁蛋白或其片段、PAS多肽、聚甘氨酸接头、聚丝氨酸接头、白蛋白结合部分或这些多肽的任何片段、衍生物、变体或组合。在一个特定实施方案中,所述异源氨基酸序列是免疫球蛋白恒定区或其一部分、转铁蛋白、白蛋白或PAS序列。在一些方面,异源部分包括血管性血友病因子或其片段。在其他相关方面,异源部分可包括针对非多肽部分的附着位点(例如,半胱氨酸氨基酸),所述非多肽部分如聚乙二醇(PEG)、羟基乙基淀粉(HES)、聚唾液酸或这些元件的任何衍生物、变体或组合。在一些方面,异源部分包含充当针对非多肽部分的附着位点的半胱氨酸氨基酸,所述非多肽部分如聚乙二醇(PEG)、羟基乙基淀粉(HES)、聚唾液酸或这些元件的任何衍生物、变体或组合。
在一个具体实施方案中,第一异源核苷酸序列编码作为本领域中已知的半衰期延长分子的第一异源部分,并且第二异源核苷酸序列编码也可以是本领域中已知的半衰期延长分子的第二异源部分。在某些实施方案中,所述第一异源部分(例如,第一Fc部分)和所述第二异源部分(例如,第二Fc部分)彼此缔合以形成二聚体。在一个实施方案中,所述第二异源部分是第二Fc部分,其中所述第二Fc部分连接至所述第一异源部分(例如,第一Fc部分)或与所述第一异源部分(例如,第一Fc部分)缔合。例如,所述第二异源部分(例如,第二Fc部分)可通过接头连接至所述第一异源部分(例如,第一Fc部分)或通过共价或非共价键与所述第一异源部分缔合。
在一些实施方案中,所述异源部分是多肽,所述多肽包含至少约10个、至少约100个、至少约200个、至少约300个、至少约400个、至少约500个、至少约600个、至少约700个、至少约800个、至少约900个、至少约1000个、至少约1100个、至少约1200个、至少约1300个、至少约1400个、至少约1500个、至少约1600个、至少约1700个、至少约1800个、至少约1900个、至少约2000个、至少约2500个、至少约3000个或至少约4000个氨基酸,基本上由所述氨基酸组成,或由所述氨基酸组成。在其他实施方案中,所述异源部分是多肽,所述多肽包含约100个至约200个氨基酸、约200个至约300个氨基酸、约300个至约400个氨基酸、约400个至约500个氨基酸、约500个至约600个氨基酸、约600个至约700个氨基酸、约700个至约800个氨基酸、约800个至约900个氨基酸或约900个至约1000个氨基酸,基本上由所述氨基酸组成,或由所述氨基酸组成。
在某些实施方案中,异源部分会改善所述FVIII蛋白的一种或多种药物动力学特性,而不会显著影响其生物活性或功能。
在某些实施方案中,异源部分会增加本公开的FVIII蛋白的体内和/或体外半衰期。在其他实施方案中,异源部分会促进本公开的FVIII蛋白或其片段(例如,在所述FVIII蛋白的蛋白水解裂解之后包含异源部分的片段)的显现或定位。本公开的FVIII蛋白或其片段的显现和/或定位可以是体内、体外、离体或其组合。
在其他实施方案中,异源部分会增加本公开的FVIII蛋白或其片段(例如,在所述FVIII蛋白的蛋白水解裂解之后包含异源部分的片段)的稳定性。如本文所用,术语“稳定性”是指所述FVIII蛋白的一种或多种物理特性响应于环境条件(例如,升高或降低的温度)的维持的公认量度。在某些方面,所述物理特性可以是所述FVIII蛋白的共价结构的维持(例如,蛋白水解裂解、不想要的氧化或去酰胺化的不存在)。在其他方面,所述物理特性也可以是呈正确折叠状态的FVIII蛋白的存在(例如,可溶性或不溶性聚集体或沉淀物的不存在)。一方面,所述FVIII蛋白的稳定性是通过测定所述FVIII蛋白的生物物理特性,例如热稳定性、pH去折叠概况、糖基化的稳定去除、溶解度、生物化学功能(例如,结合于蛋白质、受体或配体的能力)等和/或其组合来测量。另一方面,通过所述相互作用的结合亲和力来证明生物化学功能。一方面,蛋白质稳定性的量度是热稳定性,即对热激发(thermalchallenge)的抗性。稳定性可以使用本领域中已知的方法来测量,如HPLC(高效液相色谱法)、SEC(尺寸排阻色谱法)、DLS(动态光散射)等。测量热稳定性的方法包括但不限于差示扫描量热法(DSC)、差示扫描荧光测定法(DSF)、圆二色性(CD)和热激发测定。
在某些方面,由本公开的核酸分子编码的FVIII蛋白包含至少一种半衰期延长剂,即异源部分,所述异源部分相对于缺乏所述异源部分的相应FVIII蛋白的体内半衰期增加所述FVIII蛋白的体内半衰期。FVIII蛋白的体内半衰期可以通过本领域技术人员已知的任何方法测量,例如活性测定(发色测定或一期凝固aPTT测定)、ELISA、ROTEMTM等。
在一些实施方案中,一种或多种半衰期延长剂的存在导致与缺乏所述一种或多种半衰期延长剂的相应蛋白质的半衰期相比所述FVIII蛋白的半衰期增加。包含半衰期延长剂的FVIII蛋白的半衰期比缺乏所述半衰期延长剂的相应FVIII蛋白的体内半衰期长至少约1.5倍、至少约2倍、至少约2.5倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍或至少约12倍。
在一个实施方案中,包含半衰期延长剂的FVIII蛋白的半衰期比缺乏所述半衰期延长剂的相应蛋白的体内半衰期长约1.5倍至约20倍、约1.5倍至约15倍或约1.5倍至约10倍。在另一实施方案中,如与缺乏所述半衰期延长剂的相应蛋白的体内半衰期相比,包含半衰期延长剂的FVIII蛋白的半衰期延长约2倍至约10倍、约2倍至约9倍、约2倍至约8倍、约2倍至约7倍、约2倍至约6倍、约2倍至约5倍、约2倍至约4倍、约2倍至约3倍、约2.5倍至约10倍、约2.5倍至约9倍、约2.5倍至约8倍、约2.5倍至约7倍、约2.5倍至约6倍、约2.5倍至约5倍、约2.5倍至约4倍、约2.5倍至约3倍、约3倍至约10倍、约3倍至约9倍、约3倍至约8倍、约3倍至约7倍、约3倍至约6倍、约3倍至约5倍、约3倍至约4倍、约4倍至约6倍、约5倍至约7倍或约6倍至约8倍。
在其他实施方案中,包含半衰期延长剂的FVIII蛋白的半衰期是至少约17小时、至少约18小时、至少约19小时、至少约20小时、至少约21小时、至少约22小时、至少约23小时、至少约24小时、至少约25小时、至少约26小时、至少约27小时、至少约28小时、至少约29小时、至少约30小时、至少约31小时、至少约32小时、至少约33小时、至少约34小时、至少约35小时、至少约36小时、至少约48小时、至少约60小时、至少约72小时、至少约84小时、至少约96小时或至少约108小时。
在其他实施方案中,包含半衰期延长剂的FVIII蛋白的半衰期是约15小时至约两周、约16小时至约一周、约17小时至约一周、约18小时至约一周、约19小时至约一周、约20小时至约一周、约21小时至约一周、约22小时至约一周、约23小时至约一周、约24小时至约一周、约36小时至约一周、约48小时至约一周、约60小时至约一周、约24小时至约六天、约24小时至约五天、约24小时至约四天、约24小时至约三天或约24小时至约两天。
在一些实施方案中,每名受试者中包含半衰期延长剂的FVIII蛋白的平均半衰期是约15小时、约16小时、约17小时、约18小时、约19小时、约20小时、约21小时、约22小时、约23小时、约24小时(1天)、约25小时、约26小时、约27小时、约28小时、约29小时、约30小时、约31小时、约32小时、约33小时、约34小时、约35小时、约36小时、约40小时、约44小时、约48小时(2天)、约54小时、约60小时、约72小时(3天)、约84小时、约96小时(4天)、约108小时、约120小时(5天)、约六天、约七天(一周)、约八天、约九天、约10天、约11天、约12天、约13天或约14天。
一种或多种半衰期延长剂可以融合至FVIII的C端或N端或***FVIII内。
1.免疫球蛋白恒定区或其部分
另一方面,异源部分包括一个或多个免疫球蛋白恒定区或其部分(例如,Fc区)。在一个实施方案中,本公开的分离的核酸分子进一步包含编码免疫球蛋白恒定区或其部分的异源核酸序列。在一些实施方案中,所述免疫球蛋白恒定区或其部分是Fc区。
免疫球蛋白恒定区包含指示CH(恒定重链)结构域(CH1、CH2等)的结构域。视同种型(即,IgG、IgM、IgA IgD或IgE)而定,所述恒定区可以包含三个或四个CH结构域。一些同种型(例如,IgG)恒定区还含有铰链区。参见Janeway等人2001,Immunobiology,GarlandPublishing,N.Y.,N.Y。
用于产生本公开的FVIII蛋白的免疫球蛋白恒定区或其部分可以从多种不同来源获得。在一个实施方案中,免疫球蛋白恒定区或其部分是源于人免疫球蛋白。然而,应理解免疫球蛋白恒定区或其部分可源于另一哺乳动物物种的免疫球蛋白,所述另一哺乳动物物种包括例如啮齿动物(例如,小鼠、大鼠、兔、豚鼠)或非人灵长类动物(例如,黑猩猩、猕猴)物种。此外,免疫球蛋白恒定区或其部分可源于任何免疫球蛋白类别(包括IgM、IgG、IgD、IgA和IgE)和任何免疫球蛋白同种型(包括IgG1、IgG2、IgG3和IgG4)。在一个实施方案中,使用人同种型IgG1。
多种免疫球蛋白恒定区基因序列(例如,人恒定区基因序列)可以可公开存取的寄存物形式获得。可选择具有特定效应功能(或缺乏特定效应功能)或具有降低免疫原性的特定修饰的恒定区结构域序列。已经公布抗体和抗体编码基因的多个序列并且合适的Ig恒定区序列(例如,铰链、CH2和/或CH3序列,或其部分)可使用公认技术源于这些序列。使用任何前述方法获得的遗传材料可接着发生改变或进行合成以获得本公开的多肽。应进一步理解,本公开的范围涵盖恒定区DNA序列的等位基因、变体和突变。
免疫球蛋白恒定区或其部分的序列可例如使用聚合酶链反应和选择用于扩增所关注的结构域的引物来克隆。为了克隆来自抗体的免疫球蛋白恒定区或其部分的序列,可从杂交瘤、脾或淋巴细胞分离mRNA,反转录至DNA中,并且通过PCR扩增抗体基因。PCR扩增方法详细地描述于美国专利号4,683,195;4,683,202;4,800,159;4,965,188;和例如“PCRProtocols:A Guide to Methods and Applications”Innis等人编,Academic Press,SanDiego,CA(1990);Ho等人1989.Gene 77:51;Horton等人1993.Methods Enzymol.217:270)中。PCR可基于公布的重链和轻链DNA和氨基酸序列通过共有恒定区引物或通过更特定引物来开始。PCR也可用于分离编码抗体轻链和重链的DNA克隆。在这种情况下,可通过共有引物或较大的同源探针,如小鼠恒定区探针来筛选文库。适用于抗体基因的扩增的多种引物集合是本领域中已知的(例如,基于纯化的抗体的N端序列(Benhar和Pastan.1994.ProteinEngineering 7:1509);cDNA末端的快速扩增(Ruberti,F.等人1994.J.Immunol.Methods173:33);抗体前导序列(Larrick等人1989Biochem.Biophys.Res.Commun.160:1250)的5'引物。抗体序列的克隆进一步描述于1995年1月25日提交的Newman等人的美国专利号5,658,570中,所述美国专利以引用的方式并入本文中。
本文所用的免疫球蛋白恒定区可以包括所有结构域和铰链区或其部分。在一个实施方案中,免疫球蛋白恒定区或其部分包含CH2结构域、CH3结构域和铰链区(即,Fc区或FcRn结合配偶体)。
如本文所用,术语“Fc区”是定义为多肽中对应于原生Ig的Fc区的部分,即,如通过其两条重链的相应Fc结构域的二聚缔合所形成。原生Fc区与另一Fc区形成同二聚体。相比之下,如本文所用,术语“遗传融合的Fc区”或“单链Fc区”(scFc区)是指包含遗传连接于单一多肽链内(即,编码于单一邻接遗传序列中)的Fc结构域的合成二聚Fc区。参见国际公布号WO 2012/006635,其以引用的方式整体并入本文中。
在一个实施方案中,“Fc区”是指单一Ig重链的部分,在铰链区中木瓜蛋白酶裂解位点的正好上游(即,IgG中的残基216,考虑重链恒定区的第一残基是114)开始并且在所述抗体的C端处终止。相应地,完全Fc区至少包含铰链域、CH2结构域和CH3结构域。
免疫球蛋白恒定区或其部分可以是FcRn结合配偶体。FcRn在成体上皮组织中具活性并且表达于肠腔、肺气道、鼻表面、***表面、结肠和直肠表面中(美国专利号6,485,726)。FcRn结合配偶体是免疫球蛋白中结合于FcRn的部分。
FcRn受体已经从包括人在内的数种哺乳动物物种中分离。人FcRn、猴FcRn、大鼠FcRn和小鼠FcRn的序列是已知的(Story等人1994,J.Exp.Med.180:2377)。FcRn受体以相对低pH结合IgG(而非其他免疫球蛋白类别,如IgA、IgM、IgD和IgE),沿腔至浆膜方向主动地跨细胞转运IgG,并且接着以细胞间隙液中发现的相对较高pH释放所述IgG。其表达于成体上皮组织中(美国专利号6,485,726、6,030,613、6,086,875;WO 03/077834;US2003-0235536A1),所述成体上皮组织包括肺和肠上皮(Israel等人1997,Immunology 92:69)肾近端肾小管上皮(Kobayashi等人2002,Am.J.Physiol.Renal Physiol.282:F358)以及鼻上皮、***表面和胆系表面。
适用于本公开的FcRn结合配偶体涵盖可由FcRn受体特异性结合的分子,包括完整IgG、IgG的Fc片段和包括所述FcRn受体的完全结合区的其他片段。IgG的Fc部分中结合于FcRn受体的区已经基于X射线结晶学加以描述(Burmeister等人1994,Nature 372:379)。Fc与FcRn的主要接触区域是在CH2和CH3结构域的接合部附近。Fc-FcRn接触均在单一Ig重链内。FcRn结合配偶体包括完整IgG、IgG的Fc片段和包括FcRn的完全结合区的IgG的其他片段。主要接触位点包括CH2结构域的氨基酸残基248、250-257、272、285、288、290-291、308-311和314和CH3结构域的氨基酸残基385-387、428和433-436。对免疫球蛋白或免疫球蛋白片段或区的氨基酸编号的提及均是基于Kabat等人1991,Sequences of Proteins ofImmunological Interest,U.S.Department of Public Health,Bethesda,Md。
结合于FcRn的Fc区或FcRn结合配偶体可由FcRn有效地跨上皮屏障穿梭,因此提供非侵入手段来全身性地施用所需的治疗分子。另外,包含Fc区或FcRn结合配偶体的融合蛋白由表达FcRn的细胞内吞。并未经过标记用于降解,这些融合蛋白再次再循环进入循环中,因此增加这些蛋白质的体内半衰期。在某些实施方案中,免疫球蛋白恒定区的部分是Fc区或FcRn结合配偶体,所述Fc区或FcRn结合配偶体典型地经由二硫键和其他非特异性相互作用与另一Fc区或另一FcRn结合配偶体缔合以形成二聚体和高级多聚体。
两种FcRn受体可以结合单一Fc分子。结晶学数据表明,每种FcRn分子结合Fc同二聚体的单一多肽。在一个实施方案中,使FcRn结合配偶体(例如,IgG的Fc片段)连接至生物活性分子会提供口服、经颊、舌下、经直肠、经***、以经鼻或经由肺途径或经由眼途径施用的气雾剂形式递送所述生物活性分子的手段。在另一实施方案中,FVIII蛋白可侵入性,例如皮下、静脉内施用。
FcRn结合配偶体区是可由FcRn受体特异性结合的分子或其部分,随后由所述Fc区的FcRn受体主动转运。特异性结合是指两种分子形成在生理学条件下相对稳定的复合物。特异性结合的特征在于高亲和力和低至中等能力,如与通常具有低亲和力和中等至高能力的非特异性结合相区分。典型地,当亲和力常数KA高于106M-1或高于108M-1时,结合被视为特异性的。必要时,非特异性结合可以降低,而不会通过改变结合条件显著影响特异性结合。熟练技术人员可以使用常规技术优化适当结合条件,如分子的浓度、溶液的离子强度、温度、允许用于结合的时间、阻断剂(例如,血清白蛋白、乳酪蛋白)的浓度等。
在某些实施方案中,由本公开的核酸分子编码的FVIII蛋白包含一个或多个截短的Fc区,所述截短的Fc区仍足以向所述Fc区赋予Fc受体(FcR)结合特性。例如,Fc区中结合于FcRn的部分(即,FcRn结合部分)包含IgG1EU编号的约氨基酸282-438(其中主要接触位点是CH2结构域的氨基酸248、250-257、272、285、288、290-291、308-311和314和CH3结构域的氨基酸残基385-387、428和433-436。因此,本公开的Fc区可包含FcRn结合部分或由FcRn结合部分组成。FcRn结合部分可源于任何同种型(包括IgG1、IgG2、IgG3和IgG4)的重链。在一个实施方案中,使用来自人同种型IgG1的抗体的FcRn结合部分。在另一实施方案中,使用来自人同种型IgG4的抗体的FcRn结合部分。
所述Fc区可获自多种不同来源。在一个实施方案中,所述多肽的Fc区是源于人免疫球蛋白。然而,应理解Fc部分可源于另一哺乳动物物种的免疫球蛋白,所述另一哺乳动物物种包括例如啮齿动物(例如,小鼠、大鼠、兔、豚鼠)或非人灵长类动物(例如,黑猩猩、猕猴)物种。此外,所述Fc结构域的多肽或其部分可源于任何免疫球蛋白类别(包括IgM、IgG、IgD、IgA和IgE)和任何免疫球蛋白同种型(包括IgG1、IgG2、IgG3和IgG4)。在另一实施方案中,使用人同种型IgG1。
在某些实施方案中,所述Fc变体赋予由包含所述野生型Fc结构域的Fc部分赋予的至少一种效应功能的改变(例如,所述Fc区结合于Fc受体(例如,FcγRI、FcγRII或FcγRIII)或补体蛋白(例如,C1q)或触发抗体依赖性细胞毒性(ADCC)、吞噬或补体依赖性细胞毒性(CDCC)的能力的改进或降低)。在其他实施方案中,所述Fc变体提供经过工程改造的半胱氨酸残基。
本公开的Fc区可使用公认Fc变体,已知所述公认Fc变体赋予效应功能和/或FcR或FcRn结合的改变(例如,增强或降低)。特别地,本公开的Fc区可包括例如在国际PCT公布WO88/07089A1、WO96/14339A1、WO98/05787A1、WO98/23289A1、WO99/51642A1、WO99/58572A1、WO00/09560A2、WO00/32767A1、WO00/42072A2、WO02/44215A2、WO02/060919A2、WO03/074569A2、WO04/016750A2、WO04/029207A2、WO04/035752A2、WO04/063351A2、WO04/074455A2、WO04/099249A2、WO05/040217A2、WO04/044859、WO05/070963A1、WO05/077981A2、WO05/092925A2、WO05/123780A2、WO06/019447A1、WO06/047350A2和WO06/085967A2;美国专利公布号US2007/0231329、US2007/0231329、US2007/0237765、US2007/0237766、US2007/0237767、US2007/0243188、US20070248603、US20070286859、US20080057056;或美国专利5,648,260;5,739,277;5,834,250;5,869,046;6,096,871;6,121,022;6,194,551;6,242,195;6,277,375;6,528,624;6,538,124;6,737,056;6,821,505;6,998,253;7,083,784;7,404,956和7,317,091中公开的氨基酸位置中的一处或多处的改变(例如,取代),其中每一者均以引用的方式并入本文中。在一个实施方案中,特定改变(例如,所属领域中公开的一种或多种氨基酸的特定取代)可在所公开的氨基酸位置中的一处或多处进行。在另一实施方案中,可在所公开的氨基酸位置中的一处或多处进行不同改变(例如,所属领域中公开的一个或多个氨基酸位置的不同取代)。
IgG的Fc区或FcRn结合配偶体可根据公认的程序(如定点诱变等)进行修饰以产生将由FcRn结合的经过修饰的IgG或Fc片段或其部分。所述修饰包括远离FcRn接触位点的修饰以及在所述接触位点内的修饰,所述修饰保持或甚至增强与FcRn的结合。例如,人IgG1Fc(Fcγ1)中的以下单一氨基酸残基可经过取代而无Fc对FcRn的结合亲和力的显著损失:P238A、S239A、K246A、K248A、D249A、M252A、T256A、E258A、T260A、D265A、S267A、H268A、E269A、D270A、E272A、L274A、N276A、Y278A、D280A、V282A、E283A、H285A、N286A、T289A、K290A、R292A、E293A、E294A、Q295A、Y296F、N297A、S298A、Y300F、R301A、V303A、V305A、T307A、L309A、Q311A、D312A、N315A、K317A、E318A、K320A、K322A、S324A、K326A、A327Q、P329A、A330Q、P331A、E333A、K334A、T335A、S337A、K338A、K340A、Q342A、R344A、E345A、Q347A、R355A、E356A、M358A、T359A、K360A、N361A、Q362A、Y373A、S375A、D376A、A378Q、E380A、E382A、S383A、N384A、Q386A、E388A、N389A、N390A、Y391F、K392A、L398A、S400A、D401A、D413A、K414A、R416A、Q418A、Q419A、N421A、V422A、S424A、E430A、N434A、T437A、Q438A、K439A、S440A、S444A和K447A,其中例如P238A表示在位置编号238处的野生型脯氨酸由丙氨酸取代。例如,一个特定实施方案并入N297A突变,从而去除了高度保守的N-糖基化位点。除了丙氨酸以外,其他氨基酸也可以在上文规定的位置处取代野生型氨基酸。突变可单独引入至Fc中,从而产生超过一百个不同于原生Fc的Fc区。另外,可合起来引入这些个别突变中的两者、三者或更多者的组合,从而产生数百个Fc区。
上述突变中的某些可对Fc区或FcRn结合配偶体赋予新的功能性。例如,一个实施方案并入N297A,从而去除了高度保守的N-糖基化位点。这种突变的作用是降低免疫原性,由此增强Fc区的循环半衰期,和使Fc区不能结合于FcγRI、FcγRIIA、FcγRIIB和FcγRIIIA,而不会损害对FcRn的亲和力(Routledge等人1995,Transplantation 60:847;Friend等人1999,Transplantation 68:1632;Shields等人1995,J.Biol.Chem.276:6591)。作为由上述突变产生的新的功能性的另一实例,对FcRn的亲和力可在一些情况下增加超出野生型的所述亲和力。这种增加的亲和力可反映增加的“缔合”速率、减少的“解离”速率或增加的“缔合”速率和减少的“解离”速率两者。相信赋予增加的对FcRn的亲和力的突变的实例包括但不限于T256A、T307A、E380A和N434A(Shields等人2001,J.Biol.Chem.276:6591)。
另外,至少三种人Fcγ受体看来识别IgG中在下部铰链区内的结合位点(一般是氨基酸234-237)。因此,新的功能性和潜在减少的免疫原性的另一实例可由这一区的突变引起,如例如通过将人IgG1“ELLG”(SEQ ID NO:45)的氨基酸233-236置换成来自IgG2“PVA”的相应序列(具有一个氨基酸缺失)。已经显示,当已经引入所述突变时,介导多种效应功能的FcγRI、FcγRII和FcγRIII将不会结合于IgG1。Ward和Ghetie 1995,TherapeuticImmunology 2:77和Armour等人1999,Eur.J.Immunol.29:2613。
在另一实施方案中,免疫球蛋白恒定区或其部分包含在铰链区中的氨基酸序列或其部分,所述氨基酸序列或其部分与第二免疫球蛋白恒定区或其部分形成一个或多个二硫键。所述第二免疫球蛋白恒定区或其部分可连接至第二多肽,从而使FVIII蛋白和所述第二多肽合在一起。在一些实施方案中,所述第二多肽是增强子部分。如本文所用,术语“增强子部分”是指能够增强FVIII的促凝血活性的分子、其片段或多肽的组分。所述增强子部分可以是辅因子,如可溶性组织因子(sTF)或促凝血肽。因此,在活化FVIII时,所述增强子部分可用于增强FVIII活性。
在某些实施方案中,由本公开的核酸分子编码的FVIII蛋白包含免疫球蛋白恒定区或其部分的氨基酸取代(例如,Fc变体),所述氨基酸取代会改变Ig恒定区的抗原独立效应功能,尤其是所述蛋白质的循环半衰期。
2.scFc区
另一方面,异源部分包括scFc(单链Fc)区。在一个实施方案中,本公开的分离的核酸分子进一步包含编码scFc区的异源核酸序列。所述scFc区包含在同一直链多肽链内的至少两个免疫球蛋白恒定区或其部分(例如,Fc部分或结构域(例如,2、3、4、5、6个或更多个Fc部分或结构域)),所述免疫球蛋白恒定区或其部分能够折叠(例如,分子内或分子间折叠)以形成由Fc肽接头连接的一个功能性scFc区。例如,在一个实施方案中,本公开的多肽能够经由其scFc区结合至至少一种Fc受体(例如,FcRn、FcγR受体(例如,FcγRIII)或补体蛋白(例如,C1q))以便改进半衰期或触发免疫效应功能(例如,抗体依赖性细胞毒性(ADCC)、吞噬或补体依赖性细胞毒性(CDCC)和/或改进可制造性)。
3.CTP
另一方面,异源部分包括人绒毛膜***的β亚单位的一种C端肽(CTP)或其片段、变体或衍生物。已知***至重组蛋白中的一种或多种CTP肽增加所述蛋白质的体内半衰期。参见例如美国专利号5,712,122,以引用的方式整体并入本文中。
示例性CTP肽包括DPRFQDSSSSKAPPPSLPSPSRLPGPSDTPIL(SEQ ID NO:33)或SSSSKAPPPSLPSPSRLPGPSDTPILPQ(SEQ ID NO:34)。参见例如美国专利申请公布号US 2009/0087411A1,以引用的方式并入。
4.XTEN序列
在一些实施方案中,异源部分包括一个或多个XTEN序列、其片段、变体或衍生物。如此处所用,“XTEN序列”是指具有非天然存在、大体上非重复性序列的延长长度的多肽,所述序列主要由小的亲水性氨基酸构成,其中所述序列在生理学条件下具有低度或不具有二级或三级结构。作为异源部分,XTEN可充当半衰期延长部分。另外,XTEN可提供所需特性,包括但不限于增强的药物动力学参数和溶解度特征。
将包含XTEN序列的异源部分并入至本公开的蛋白质中可以向所述蛋白质赋予以下有利特性中的一者或多者:构象柔性、增强的水溶性、高度蛋白酶抗性、低免疫原性、与哺乳动物受体的低结合或增加的流体动力学(或斯托克斯)半径。
在某些方面,XTEN序列可以增加药物动力学特性,如较长的体内半衰期或增加的曲线下面积(AUC),使得与不具有XTEN异源部分的相同蛋白质相比,本公开的蛋白质在一段增加的时期内停留于体内并且具有促凝血活性。
在一些实施方案中,适用于本公开的XTEN序列是具有超过约20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1200、1400、1600、1800或2000个氨基酸残基的肽或多肽。在某些实施方案中,XTEN是具有超过约20个至约3000个氨基酸残基、超过30个至约2500个残基、超过40个至约2000个残基、超过50个至约1500个残基、超过60个至约1000个残基、超过70个至约900个残基、超过80个至约800个残基、超过90个至约700个残基、超过100个至约600个残基、超过110个至约500个残基或超过120个至约400个残基的肽或多肽。在一个特定实施方案中,所述XTEN包含长于42个氨基酸并且短于144个氨基酸的长度的氨基酸序列。
本公开的XTEN序列可以包含5至14个(例如,9至14个)氨基酸残基的一个或多个序列基序或与所述序列基序具有至少80%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列,其中所述基序包含选自由甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)组成的组的4至6种类型的氨基酸(例如,5种氨基酸),基本上由所述氨基酸组成,或由所述氨基酸组成。参见US 2010-0239554 A1。
在一些实施方案中,所述XTEN包含非重叠序列基序,其中所述序列的约80%或至少约85%或至少约90%或约91%或约92%或约93%或约94%或约95%或约96%或约97%或约98%或约99%或约100%由选自从表4选择的单一基序家族的非重叠序列的多个单位组成,从而产生家族序列。如本文所用,“家族”意指所述XTEN具有仅选自来自表4的单一基序类别的基序;即,AD、AE、AF、AG、AM、AQ、BC或BD XTEN,并且选择所述XTEN中不是来自家族基序的任何其他氨基酸以实现所需的特性,如允许通过编码核苷酸并入限制位点、并入裂解序列或实现与FVIII的更佳连接。在XTEN家族的一些实施方案中,XTEN序列包含AD基序家族或AE基序家族或AF基序家族或AG基序家族或AM基序家族或AQ基序家族或BC家族或BD家族的非重叠序列基序的多个单位,其中所得XTEN展现上述同源性的范围。在其他实施方案中,所述XTEN包含来自表2A的两个或更多个基序家族的基序序列的多个单位。可选择这些序列以实现所需物理/化学特征,包括如下文更充分描述的净电荷、疏水性、缺乏二级结构或缺乏由所述基序的氨基酸组成赋予的重复性等特性。在上文中描述于这一段落中的实施方案中,并入至XTEN中的基序可使用本文所述的方法来选择并且组装以实现约36个至约3000个氨基酸残基的XTEN。
表4. 12个氨基酸的XTEN序列基序和基序家族
基序家族* 基序序列 SEQ ID NO:
AD GESPGGSSGSES 73
AD GSEGSSGPGESS 74
AD GSSESGSSEGGP 75
AD GSGGEPSESGSS 76
AE,AM GSPAGSPTSTEE 77
AE,AM,AQ GSEPATSGSETP 78
AE,AM,AQ GTSESATPESGP 79
AE,AM,AQ GTSTEPSEGSAP 80
AF,AM GSTSESPSGTAP 81
AF,AM GTSTPESGSASP 82
AF,AM GTSPSGESSTAP 83
AF,AM GSTSSTAESPGP 84
AG,AM GTPGSGTASSSP 85
AG,AM GSSTPSGATGSP 86
AG,AM GSSPSASTGTGP 87
AG,AM GASPGTSSTGSP 88
AQ GEPAGSPTSTSE 89
AQ GTGEPSSTPASE 90
AQ GSGPSTESAPTE 91
AQ GSETPSGPSETA 92
AQ GPSETSTSEPGA 93
AQ GSPSEPTEGTSA 94
BC GSGASEPTSTEP 95
BC GSEPATSGTEPS 96
BC GTSEPSTSEPGA 97
BC GTSTEPSEPGSA 98
BD GSTAGSETSTEA 99
BD GSETATSGSETA 100
BD GTSESATSESGA 101
BD GTSTEASEGSAS 102
*表示当合起来用于多种排列中时产生“家族序列”的个别基序序列
可用作本公开的嵌合蛋白中的异源部分的XTEN序列的实例公开于例如美国专利公布号2010/0239554 A1、2010/0323956 A1、2011/0046060 A1、2011/0046061 A1、2011/0077199 A1或2011/0172146 A1或国际专利公布号WO 2010091122 A1、WO 2010144502 A2、WO 2010144508 A1、WO 2011028228 A1、WO 2011028229 A1或WO 2011028344 A2中,其中每一者均以引用的方式整体并入本文中。
XTEN可具有变化的长度以用于***至或连接至FVIII。在一个实施方案中,XTEN序列的长度是基于所述融合蛋白中欲实现的特性或功能来选择。视预期的特性或功能而定,XTEN可以是短或中等长度序列或较长序列,所述序列可以用作载体。在某些实施方案中,所述XTEN包括约6个至约99个氨基酸残基的短区段、约100个至约399个氨基酸残基的中等长度和约400个至约1000个并且长达约3000个氨基酸残基的较长长度。因此,***至或连接至FVIII的XTEN可以具有约6个、约12个、约36个、约40个、约42个、约72个、约96个、约144个、约288个、约400个、约500个、约576个、约600个、约700个、约800个、约864个、约900个、约1000个、约1500个、约2000个、约2500个或长达约3000个氨基酸残基长度的长度。在其他实施方案中,所述XTEN序列是约6个至约50个、约50个至约100个、约100个至150个、约150个至250个、约250个至400个、约400个至约500个、约500个至约900个、约900个至1500个、约1500个至2000或约2000个至约3000个氨基酸残基长度。***至或连接至FVIII的XTEN的精确长度可以变化,而不会不利地影响所述FVIII的活性。在一个实施方案中,一种或多种本文所用的XTEN具有42个氨基酸、72个氨基酸、144个氨基酸、288个氨基酸、576个氨基酸或864个氨基酸长度并且可以选自一个或多个XTENT家族序列;即AD、AE、AF、AG、AM、AQ、BC或BD。
在一些实施方案中,本公开中所用的XTEN序列与选自由AE42、AG42、AE48、AM48、AE72、AG72、AE108、AG108、AE144、AF144、AG144、AE180、AG180、AE216、AG216、AE252、AG252、AE288、AG288、AE324、AG324、AE360、AG360、AE396、AG396、AE432、AG432、AE468、AG468、AE504、AG504、AF504、AE540、AG540、AF540、AD576、AE576、AF576、AG576、AE612、AG612、AE624、AE648、AG648、AG684、AE720、AG720、AE756、AG756、AE792、AG792、AE828、AG828、AD836、AE864、AF864、AG864、AM875、AE912、AM923、AM1318、BC864、BD864、AE948、AE1044、AE1140、AE1236、AE1332、AE1428、AE1524、AE1620、AE1716、AE1812、AE1908、AE2004A、AG948、AG1044、AG1140、AG1236、AG1332、AG1428、AG1524、AG1620、AG1716、AG1812、AG1908、AG2004和其任何组合组成的组的序列具有至少60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性。参见US 2010-0239554 A1。在一个特定实施方案中,所述XTEN包含AE42、AE72、AE144、AE288、AE576、AE864、AG 42、AG72、AG144、AG288、AG576、AG864或其任何组合。
可用作本公开的嵌合蛋白中的异源部分的示例性XTEN序列包括XTEN AE42-4(SEQID NO:46,由SEQ ID NO:47编码;分别是图11C和图11D)、XTEN 144-2A(SEQ ID NO:48,由SEQ ID NO:49编码;分别是图11E和图11F)、XTEN A144-3B(SEQ ID NO:50,由SEQ ID NO:51编码;分别是图11G和图11H)、XTEN AE144-4A(SEQ ID NO:52,由SEQ ID NO:53编码;分别是图11I和图11J)、XTEN AE144-5A(SEQ ID NO:54,由SEQ ID NO:55编码;分别是图11K和图11L)、XTEN AE144-6B(SEQ ID NO:56,由SEQ ID NO:57编码;分别是图11M和图11N)、XTENAG144-1(SEQ ID NO:58,由SEQ ID NO:59编码;分别是图11O和图11P)、XTEN AG144-A(SEQID NO:60,由SEQ ID NO:61编码;分别是图11Q和图11R)、XTEN AG144-B(SEQ ID NO:62,由SEQ ID NO:63编码;分别是图11S和图11T)、XTEN AG144-C(SEQ ID NO:64,由SEQ ID NO:65编码;分别是图11U和图11V)和XTEN AG144-F(SEQ ID NO:66,由SEQ ID NO:67编码;分别是图11W和图11X)。在一个特定实施方案中,所述XTEN是由SEQ ID NO:18编码。
在一些实施方案中,XTEN的氨基酸的少于100%选自甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P),或所述序列的少于100%由来自表2A的序列基序或本文所提供的XTEN序列组成。在所述实施方案中,所述XTEN的剩余氨基酸残基选自任何其他14种天然L-氨基酸,但可以优先地选自亲水性氨基酸,使得所述XTEN序列含有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或至少约99%亲水性氨基酸。用于缀合构建体中的XTEN的疏水性氨基酸的含量可以是少于5%或少于2%或少于1%疏水性氨基酸含量。在XTEN的构建中不受青睐的疏水性残基包括色氨酸、苯丙氨酸、酪氨酸、亮氨酸、异亮氨酸、缬氨酸和甲硫氨酸。另外,XTEN序列可以含有少于5%或少于4%或少于3%或少于2%或少于1%或不含以下氨基酸:甲硫氨酸(例如,以避免氧化)或天冬酰胺和谷酰胺(以避免去酰胺化)。
所述一个或多个XTEN序列可***由所述核苷酸序列编码的氨基酸序列的C端或N端或***由所述核苷酸序列编码的氨基酸序列中的两个氨基酸之间。例如,所述XTEN可***选自表3的一个或多个***位点处的两个氨基酸之间。FVIII内可允许XTEN***的位点的实例可发现于例如国际公布号WO 2013/123457 A1或美国公布号2015/0158929 A1中,所述公布以引用的方式整体并入本文中。
5.白蛋白或其片段、衍生物或变体
在一些实施方案中,异源部分包括白蛋白或其功能片段。人血清白蛋白(HSA或HA)是其全长形式具有609个氨基酸的蛋白质,负责血清的大部分的渗透压并且还充当内源和外源配体的载体。如本文所用,术语“白蛋白”包括全长白蛋白或其功能片段、变体、衍生物或类似物。白蛋白或其片段或变体的实例公开于美国专利公布号2008/0194481A1、2008/0004206 A1、2008/0161243 A1、2008/0261877 A1或2008/0153751 A1或PCT申请公布号2008/033413 A2、2009/058322 A1或2007/021494 A2中,所述公布以引用的方式整体并入本文中。
在一个实施方案中,由本公开的核酸分子编码的FVIII蛋白包含白蛋白、其片段或变体,所述白蛋白、其片段或变体进一步连接至选自由免疫球蛋白恒定区或其部分(例如,Fc区)、PAS序列、HES和PEG组成的组的第二异源部分。
6.白蛋白结合部分
在某些实施方案中,所述异源部分是白蛋白结合部分,其包含白蛋白结合肽、细菌白蛋白质结合结构域、白蛋白结合抗体片段或其任何组合。
例如,白蛋白结合蛋白可以是细菌白蛋白结合蛋白、抗体或包括结构域抗体的抗体片段(参见美国专利号6,696,245)。例如,白蛋白结合蛋白可以是细菌白蛋白质结合结构域,如链球菌蛋白G的细菌白蛋白质结合结构域(Konig,T.和Skerra,A.(1998)J.Immunol.Methods 218,73-83)。可用作缀合配偶体的白蛋白结合肽的其他实例是例如具有Cys-Xaa1–Xaa2–Xaa3–Xaa4-Cys共有序列的那些,其中Xaa1是Asp、Asn、Ser、Thr或Trp;Xaa2是Asn、Gln、His、Ile、Leu或Lys;Xaa3是Ala、Asp、Phe、Trp或Tyr;并且Xaa4是Asp、Gly、Leu、Phe、Ser或Thr,如美国专利申请2003/0069395或Dennis等人(Dennis等人(2002)J.Biol.Chem.277,35035-35043)所述。
如由Kraulis等人,FEBS Lett.378:190-194(1996)和Linhult等人,ProteinSci.11:206-213(2002)公开的来自链球菌蛋白G的结构域3是细菌白蛋白质结合结构域的一个实例。白蛋白结合肽的实例包括具有核心序列DICLPRWGCLW(SEQ ID NO:35)的肽的系列。参见例如Dennis等人,J.Biol.Chem.2002,277:35035-35043(2002)。白蛋白结合抗体片段的实例公开于Muller和Kontermann,Curr.Opin.Mol.Ther.9:319-326(2007);Roovers等人,Cancer Immunol.Immunother.56:303-317(2007),和Holt等人,Prot.Eng.DesignSci.,21:283-288(2008)中,所述文献以引用的方式整体并入本文中。所述白蛋白结合部分的一个实例是如由Trussel等人,Bioconjugate Chem.20:2286-2292(2009)公开的2-(3-顺丁烯二酰亚胺基丙酰胺基)-6-(4-(4-碘苯基)丁酰胺基)己酸酯(“Albu”标签)。
脂肪酸、尤其长链脂肪酸(LCFA)和长链脂肪酸样白蛋白结合化合物可用于延长本公开的FVIII蛋白的体内半衰期。LCFA样白蛋白结合化合物的一个实例是16-(l-(3-(9-(((2,5-二氧代吡咯烷-l-基氧基)羰基氧基)-甲基)-7-磺基-9H-芴-2-基氨基)-3-氧代丙基)-2,5-二氧代吡咯烷-3-基硫基)十六烷酸(参见例如WO 2010/140148)。
7.PAS序列
在其他实施方案中,所述异源部分是PAS序列。如本文所用,PAS序列意指主要包含丙氨酸和丝氨酸残基或主要包含丙氨酸、丝氨酸和脯氨酸残基的氨基酸序列,所述氨基酸序列在生理学条件下形成无规卷曲构象。因此,所述PAS序列是包含丙氨酸、丝氨酸和脯氨酸,基本上由丙氨酸、丝氨酸和脯氨酸组成,或由丙氨酸、丝氨酸和脯氨酸组成的结构单元、氨基酸聚合物或序列盒,其可用作所述嵌合蛋白中的异源部分的一部分。然而,熟练人员应知晓,当除了丙氨酸、丝氨酸和脯氨酸以外的残基作为所述PAS序列中的次要成分添加时,氨基酸聚合物也可以形成无规卷曲构象。如本文所用,术语“次要成分”意指除了丙氨酸、丝氨酸和脯氨酸以外的氨基酸可添加于所述PAS序列中至某一程度,例如多达约12%(即,所述PAS序列的100个氨基酸中的约12个)、多达约10%(即,所述PAS序列的100个氨基酸中的约10个)、多达约9%(即,100个氨基酸中的约9个)、多达约8%(即,100个氨基酸中的约8个)、约6%(即,100个氨基酸中的约6个)、约5%(即,100个氨基酸中的约5个)、约4%(即,100个氨基酸中的约4个)、约3%(即,100个氨基酸中的约3个)、约2%(即,100个氨基酸中的约2个)、约1%(即,100个氨基酸中的约1个)。不同于丙氨酸、丝氨酸和脯氨酸的氨基酸可选自由Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Thr、Trp、Tyr和Val组成的组。
在生理学条件下,所述PAS序列区段形成无规卷曲构象并且由此可以介导所述FVIII蛋白的增加的体内和/或体外稳定性。由于所述无规卷曲域本身不采取稳定结构或功能,由所述FVIII蛋白介导的生物活性基本上得以保持。在其他实施方案中,形成无规卷曲结构域的PAS序列是生物学惰性的,尤其相对于血浆中的蛋白水解、免疫原性、等电点/静电行为、结合于细胞表面受体或内化,但仍然是生物可降解的,其提供了优于如PEG等合成聚合物的明显优势。
形成无规卷曲构象的PAS序列的非限制性实例包括选自由以下组成的组的氨基酸序列:ASPAAPAPASPAAPAPSAPA(SEQ ID NO:36)、AAPASPAPAAPSAPAPAAPS(SEQ ID NO:37)、APSSPSPS APSSPSPASPSS(SEQ ID NO:38)、APSSPSPSAPSSPSPASPS(SE Q ID NO:39)、SSPSAPSPSSPASPSPSSPA(SEQ ID NO:40)、AA SPAAPSAPPAAASPAAPSAPPA(SEQ ID NO:41)和ASAAAPAAA SAAASAPSAAA(SEQ ID NO:42)或其任何组合。PAS序列的另外的实例由例如美国专利公布号2010/0292130A1和PCT申请公布号WO 2008/155134 A1已知。
8.HAP序列
在某些实施方案中,所述异源部分富甘氨酸的同型氨基酸聚合物(HAP)。所述HAP序列可包括甘氨酸的重复性序列,所述重复性序列具有至少50个氨基酸、至少100个氨基酸、120个氨基酸、140个氨基酸、160个氨基酸、180个氨基酸、200个氨基酸、250个氨基酸、300个氨基酸、350个氨基酸、400个氨基酸、450个氨基酸或500个氨基酸的长度。在一个实施方案中,所述HAP序列能够延长融合至或连接至所述HAP序列的部分的半衰期。所述HAP序列的非限制性实例包括但不限于(Gly)n、(Gly4Ser)n或S(Gly4Ser)n,其中n为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。在一个实施方案中,n为20、21、22、23、24、25、26、26、28、29、30、31、32、33、34、35、36、37、38、39或40。在另一实施方案中,n为50、60、70、80、90、100、110、120、130、140、150、160、170、180、190或200。
9.转铁蛋白或其片段
在某些实施方案中,所述异源部分是转铁蛋白或其片段。任何转铁蛋白均可用于制造本公开的FVIII蛋白。例如,野生型人TF(TF)是大约75KDa(未考虑糖基化)的679个氨基酸的蛋白质,具有两个主要的结构域N(约330个氨基酸)和C(约340个氨基酸),所述结构域看来源于基因复制。参见GenBank登录号NM001063、XM002793、M12530、XM039845、XM 039847和S95936(www.ncbi.nlm.nih.gov/),其均以引用的方式整体并入本文中。转铁蛋白包含两个结构域,N结构域和C结构域。N结构域包含两个子结构域N1结构域和N2结构域,并且C结构域包含两个子结构域C1结构域和C2结构域。
在一个实施方案中,转铁蛋白异源部分包括转铁蛋白剪接变体。在一个实施例中,转铁蛋白剪接变体可以是人转铁蛋白的剪接变体,例如Genbank登陆AAA61140。在另一实施方案中,所述嵌合蛋白的转铁蛋白部分包括转铁蛋白序列的一个或多个结构域,例如N结构域、C结构域、N1结构域、N2结构域、C1结构域、C2结构域或其任何组合。
10.清除受体
在某些实施方案中,所述异源部分是清除受体、其片段、变体或衍生物。LRP1是600kDa完整膜蛋白,其牵涉于多种蛋白质(如因子X)的受体介导清除中。参见例如Narita等人,Blood 91:555-560(1998)。
11.血管性血友病因子或其片段
在某些实施方案中,所述异源部分是血管性血友病因子(VWF)或其一个或多个片段。
VWF(还称作F8VWF)是存在于血浆中并且在内皮(在Weibel-Palade小体中)、巨核细胞(血小板的α-颗粒)和内皮下***中组成性产生的大的多聚体糖蛋白。基础VWF单体是2813个氨基酸的蛋白质。每一种单体均含有多个具有特定功能的特定结构域,即D'和D3结构域(其合起来结合于因子VIII)、A1结构域(其结合于血小板GPIb-受体、肝素和/或可能结合于胶原蛋白)、A3结构域(其结合于胶原蛋白)、C1结构域(其中当这个结构域被活化时,RGD结构域结合于血小板整合素αIIbβ3)和在所述蛋白质的C末端处的“半胱氨酸结”结构域(VWF与血小板源性生长因子(PDGF)、转化生长因子-β(TGFβ)和β-人绒毛膜***(βHCG)共享所述结构域)。
人VWF的2813单体氨基酸序列在Genbank中以登录号NP000543.2报告。编码人VWF的核苷酸序列在Genbank中以登录号NM000552.3报告。SEQ ID NO:44(图11B)是由SEQ IDNO:43编码的氨基酸序列。所述D'结构域包括SEQ ID NO:44的氨基酸764至866。所述D3结构域包括SEQ ID NO:44的氨基酸867至1240。
在血浆中,95-98%的FVIII以与全长VWF的紧密非共价复合物形式循环。这种复合物的形成对于体内FVIIII的适当血浆水平的维持至关重要。Lenting等人,Blood.92(11):3983-96(1998);Lenting等人,J.Thromb.Haemost.5(7):1353-60(2007)。当FVIII由于在重链中的位置372和740处和在轻链中的位置1689处的蛋白水解而活化时,结合于FVIII的VWF从活化的FVIII去除。
在某些实施方案中,所述异源部分是全长血管性血友病因子。在其他实施方案中,所述异源部分是血管性血友病因子片段。如本文所用,本文所用的术语“VWF片段”意指与FVIII相互作用并且保持通常由全长VWF提供给FVIII的至少一种或多种特性的任何VWF片段,所述至少一种或多种特性例如防止过早活化为FVIIIa、防止过早蛋白水解、防止可能导致过早清除的与磷脂膜的缔合、防止结合于可结合裸FVIII而非VWF结合的FVIII的FVIII清除受体和/或使FVIII重链和轻链相互作用稳定化。在一个特定实施方案中,所述异源部分是包含VWF的D'结构域和D3结构域的(VWF)片段。包含D'结构域和D3结构域的VWF片段可进一步包含选自由A1结构域、A2结构域、A3结构域、D1结构域、D2结构域、D4结构域、B1结构域、B2结构域、B3结构域、C1结构域、C2结构域、CK结构域、其一个或多个片段和其任何组合组成的组的VWF结构域。融合至VWF片段的具有FVIII活性的多肽的另外的实例公开于2012年7月3日提交的美国临时专利申请号61/667,901和美国公布号2015/0023959A1中,所述文献均以引用的方式整体并入本文中。
12.接头部分
在某些实施方案中,所述异源部分是肽接头。
如本文所用,术语“肽接头”或“接头部分”是指在多肽链的线性氨基酸序列中连接两个结构域的肽或多肽序列(例如,合成肽或多肽序列)。
在一些实施方案中,编码肽接头的异源核苷酸序列可***本公开的优化的FVIII多核苷酸序列与编码例如上述异源部分之一(如白蛋白)的异源核苷酸序列之间。肽接头可向嵌合多肽分子提供柔性。接头并非典型地裂解,然而所述裂解可以是所需的。在一个实施方案中,这些接头在加工期间未去除。
可存在于本公开的嵌合蛋白中的一种类型的接头是蛋白酶可裂解接头,其包含裂解位点(即蛋白酶裂解位点底物,例如因子XIa、Xa或凝血酶裂解位点)并且其可在所述裂解位点的N端或C端或两侧包括另外的接头。这些可裂解接头当并入至本公开的构建体中时产生具有异源裂解位点的嵌合分子。
在一个实施方案中,由本公开的核酸分子编码的FVIII多肽包含经由cscFc接头连接的两个或更多个Fc结构域或部分以形成包含于单一多肽链中的Fc区。所述cscFc接头侧接至少一个细胞内加工位点,即通过细胞内酶裂解的位点。所述多肽在所述至少一个细胞内加工位点处的裂解产生包含至少两个多肽链的多肽。
其他肽接头可任选地用于本公开的构建体中,例如以连接FVIII蛋白至Fc区。可结合本公开使用的一些示例性连接体包括例如下文更详细描述的包含GlySer氨基酸的多肽。
在一个实施方案中,所述肽接头是合成的,即非天然存在的。在一个实施方案中,肽接头包括包含如下氨基酸序列的肽(或多肽)(其可以是或可以不是天然存在的),所述氨基酸序列将氨基酸的第一线性序列连接或基因融合至在自然界中并未与其天然地连接或基因融合的氨基酸的第二线性序列。例如,在一个实施方案中,所述肽接头可包含非天然存在的多肽,所述非天然存在的多肽是天然存在的多肽的经过修饰的形式(例如,包含如添加、取代或缺失等突变)。在另一实施方案中,所述肽接头可包含非天然存在的氨基酸。在另一实施方案中,所述肽接头可包含存在于在自然界中不存在的线性序列中的天然存在的氨基酸。在另一实施方案中,所述肽接头可包含天然存在的多肽序列。
例如,在某些实施方案中,肽接头可用于融合相同的Fc部分,由此形成同二聚体scFc区。在其他实施方案中,肽接头可用于融合不同的Fc部分(例如,野生型Fc部分和Fc部分变体),由此形成异二聚体scFc区。
在另一实施方案中,肽接头包含gly-ser接头或由gly-ser接头组成。在一个实施方案中,scFc或cscFc接头包含免疫球蛋白铰链的至少一部分和gly-ser接头。如本文所用,术语“gly-ser接头”是指由甘氨酸和丝氨酸残基组成的肽。在某些实施方案中,所述gly-ser接头可***所述肽接头的两个其他序列之间。在其他实施方案中,gly-ser接头附接于所述肽接头的另一序列的一个或两个末端。在其他实施方案中,两个或更多个gly-ser接头连续并入肽接头中。在一个实施方案中,本公开的肽接头包含上部铰链区的至少一部分(例如,源于IgG1、IgG2、IgG3或IgG4分子)、中间铰链区的至少一部分(例如,源于IgG1、IgG2、IgG3或IgG4分子)和一系列gly/ser氨基酸残基。
本公开的肽接头是至少一个氨基酸长度并且可具有变化的长度。在一个实施方案中,本公开的肽接头是约1个至约50个氨基酸长度。如本文所用,术语“约”指示+/-两个氨基酸残基。由于接头长度必须是正整数,约1个至约50个氨基酸长度的长度意指1-3至48-52个氨基酸长度的长度。在另一实施方案中,本公开的肽接头是约10个至约20个氨基酸长度。在另一实施方案中,本公开的肽接头是约15个至约50个氨基酸长度。在另一实施方案中,本公开的肽接头是约20个至约45个氨基酸长度。在另一实施方案中,本公开的肽接头是约15个至约35个或约20个至约30个氨基酸长度。在另一实施方案中,本公开的肽接头是约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、40、50、60、70、80、90、100、500、1000或2000个氨基酸长度。在一个实施方案中,本公开的肽接头是20个或30个氨基酸长度。
在一些实施方案中,所述肽接头可包含至少两个、至少三个、至少四个、至少五个、至少10个、至少20个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个或至少100个氨基酸。在其他实施方案中,所述肽接头可包含至少200个、至少300个、至少400个、至少500个、至少600个、至少700个、至少800个、至少900个或至少1,000个氨基酸。在一些实施方案中,所述肽接头可包含至少约10、20、30、40、50、60、70、80、90、100、150、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900或2000个氨基酸。所述肽接头可包含1-5个氨基酸、1-10个氨基酸、1-20个氨基酸、10-50个氨基酸、50-100个氨基酸、100-200个氨基酸、200-300个氨基酸、300-400个氨基酸、400-500个氨基酸、500-600个氨基酸、600-700个氨基酸、700-800个氨基酸、800-900个氨基酸或900-1000个氨基酸。
肽接头可使用本领域中已知的技术引入至多肽序列中。修饰可通过DNA序列分析来确认。质粒DNA可用于转化宿主细胞以供所产生的多肽的稳定产生。
单体-二聚体杂合物
在一些实施方案中,进一步包含异源核苷酸序列的本公开的分离的核酸分子编码包含FVIII的单体-二聚体杂合分子。
本文所用的术语“单体-二聚体杂合物”是指包含第一多肽链和第二多肽链的嵌合蛋白,所述多肽链通过二硫键彼此缔合,其中所述第一链包含因子VIII和第一Fc区并且所述第二链包含第二Fc区,基本上由第二Fc区组成,或由第二Fc区组成,而无所述FVIII。因此,所述单体-二聚体杂合物构建体是包含仅具有一种凝固因子的单体方面和具有两个Fc区的二聚体方面的杂合物。
表达控制元件
在一些实施方案中,本公开的核酸分子或载体进一步包含至少一个表达控制序列。如本文所用的表达控制序列是任何调控核苷酸序列(如启动子序列或启动子-增强子组合),其促进与其可操作性连接的编码核酸的有效转录和翻译。例如,本公开的分离的核酸分子可操作性连接至至少一个转录控制序列。所述基因表达控制序列可例如是哺乳动物或病毒启动子,如组成性或诱导性启动子。组成性哺乳动物启动子包括但不限于用于以下基因的启动子:次黄嘌呤磷酸核糖基转移酶(HPRT)、腺苷脱氨酶、丙酮酸激酶、β-肌动蛋白启动子和其他组成性启动子。在真核细胞中组成性发挥作用的示例性病毒启动子包括例如来自巨细胞病毒(CMV)、猿猴病毒(例如,SV40)、***状瘤病毒、腺病毒、人免疫缺陷病毒(HIV)、劳斯肉瘤病毒、巨细胞病毒、莫洛尼白血病病毒的长末端重复序列(LTR)和其他逆转录病毒的启动子,和单纯疱疹病毒的胸苷激酶启动子。本领域技术人员已知其他组成性启动子。适用作本公开的基因表达序列的启动子还包括诱导性启动子。诱导性启动子在诱导剂存在下表达。例如,金属硫蛋白启动子在某些金属离子存在下经过诱导以促进转录和翻译。本领域普通技术人员已知其他诱导性启动子。
在一个实施方案中,本公开包括转基因在组织特异性启动子和/或增强子的控制下的表达。在另一实施方案中,所述启动子或其他表达控制序列选择性地增强肝细胞中所述转基因的表达。肝特异性启动子的实例包括但不限于小鼠甲状腺素启动子(mTTR)、内源人因子VIII启动子(F8)、人α-1-抗胰蛋白酶启动子(hAAT)、人白蛋白最小启动子和小鼠白蛋白启动子。在一个特定实施方案中,所述启动子包括mTTR启动子。所述mTTR启动子描述于R.H.Costa等人,1986,Mol.Cell.Biol.6:4697中。所述F8启动子描述于Figueiredo和Brownlee,1995,J.Biol.Chem.270:11828-11838中。
表达水平可使用一种或多种增强子进一步增强以实现治疗功效。一种或多种增强子可单独或与一种或多种启动子元件一起提供。典型地,所述表达控制序列包含多种增强子元件,和组织特异性启动子。在一个实施方案中,增强子包含α-1-微球蛋白/尿抑胰酶素(bikunin)增强子的一个或多个拷贝(Rouet等人,1992,J.Biol.Chem.267:20765-20773;Rouet等人,1995,Nucleic Acids Res.23:395-404;Rouet等人,1998,Biochem.J.334:577-584;Ill等人,1997,Blood Coagulation Fibrinolysis 8:S23-S30)。在另一实施方案中,增强子源于具有Enh1的肝特异性转录因子结合位点,如EBP、DBP、HNF1、HNF3、HNF4、HNF6,包括HNF1、(有义)-HNF3、(有义)-HNF4、(反义)-HNF1、(反义)-HNF6、(有义)-EBP、(反义)-HNF4(反义)。
在一个特定实施例中,适用于本公开的启动子包括SEQ ID NO:69(即,ET启动子;图11Y),其还称作GenBank号AY661265。还参见Vigna等人,Molecular Therapy 11(5):763(2005)。其他合适载体和基因调控元件的实例描述于WO 02/092134、EP1395293或美国专利号6,808,905、7,745,179或7,179,903中,所述文献以引用的方式整体并入本文中。
一般来说,所述表达控制序列应在必要时包括分别牵涉于转录和翻译的起始中的5'非转录和5'非翻译序列,如TATA盒、加帽序列、CAAT序列等。尤其,所述5'非转录序列应包括启动子区,所述启动子区包括用于可操作性接合的编码核酸的转录控制的启动子序列。所述基因表达序列在需要时任选地包括增强子序列或上游活化子序列。
载体***
本公开的一些实施方案针对包含本文所述的一种或多种编码具有FVIII活性的多肽的密码子优化的核酸分子的载体,包含所述载体的宿主细胞,和使用所述载体治疗出血病症的方法。本公开通过提供包含优化的FVIII序列的载体满足了本领域中的重要需要,所述优化的FVIII序列展示了受试者中增加的表达并且当用于基因疗法方法中时潜在地引起较大的治疗功效。
在一些实施方案中,本公开提供包含分离的核酸分子的载体,所述分离的核酸分子包含如下核苷酸序列,所述核苷酸序列包含编码FVII)多肽的N端部分的第一核酸序列和编码FVIII多肽的C端部分的第二核酸序列;其中所述第一核酸序列与(i)SEQ ID NO:3的核苷酸58-1791或(ii)SEQ ID NO:4的核苷酸58-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;并且其中所述N端部分和所述C端部分合起来具有FVIII多肽活性。在其他实施方案中,所述核酸分子包含如下核苷酸序列,所述核苷酸序列包含编码FVIII多肽的N端部分的第一核酸序列和编码FVIII多肽的C端部分的第二核酸序列;其中所述第二核酸序列与(i)SEQ ID NO:5的核苷酸1792-4374;(ii)SEQ ID NO:6的核苷酸1792-4374;(iii)SEQ ID NO:5的核苷酸1792-2277和2320-4374;或(iv)SEQ ID NO:6的核苷酸1792-2277和2320-4374具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;并且其中所述N端部分和所述C端部分合起来具有FVIII多肽活性。
在一些实施方案中,本公开提供包含分离的核酸分子的载体,所述分离的核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含与(i)SEQ IDNO:1的核苷酸58-4374或(ii)SEQ ID NO:1的核苷酸58-2277和2320-4374具有至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列并且可操作性连接至启动子、靶标序列或两者。在其他实施方案中,所述核酸序列包含(i)SEQ ID NO:1的核苷酸58-4374或(ii)SEQ ID NO:1的核苷酸58-2277和2320-4374。
在一些实施方案中,本公开提供包含分离的核酸分子的载体,所述分离的核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含与(i)SEQ IDNO:2的核苷酸58-4374或(ii)SEQ ID NO:2的核苷酸58-2277和2320-4374具有至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列并且可操作性连接至启动子、靶标序列或两者。在其他实施方案中,所述核酸序列包含(i)SEQID NO:2的核苷酸58-4374或(ii)SEQ ID NO:2的核苷酸58-2277和2320-4374。
在一些实施方案中,本公开提供包含分离的核酸分子的载体,所述分离的核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含与(i)SEQ IDNO:70的核苷酸58-4374或(ii)SEQ ID NO:70的核苷酸58-2277和2320-4374具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列并且可操作性连接至启动子、靶标序列或两者。在其他实施方案中,所述核酸序列包含(i)SEQ ID NO:70的核苷酸58-4374或(ii)SEQ ID NO:70的核苷酸58-2277和2320-4374。
在一些实施方案中,本公开提供包含分离的核酸分子的载体,所述分离的核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含与(i)SEQ IDNO:71的核苷酸58-4374或(ii)SEQ ID NO:71的核苷酸58-2277和2320-4374具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列并且可操作性连接至启动子、靶标序列或两者。在其他实施方案中,所述核酸序列包含(i)SEQ ID NO:71的核苷酸58-4374或(ii)SEQ ID NO:71的核苷酸58-2277和2320-4374。
在一些实施方案中,本公开提供包含分离的核酸分子的载体,所述分离的核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含与(i)SEQ IDNO:3的核苷酸58-4374或(ii)SEQ ID NO:3的核苷酸58-2277和2320-4374具有至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列并且可操作性连接至启动子、靶标序列或两者。在其他实施方案中,所述核酸序列包含(i)SEQ ID NO:3的核苷酸58-4374或(ii)SEQ ID NO:3的核苷酸58-2277和2320-4374。
在一些实施方案中,本公开提供包含分离的核酸分子的载体,所述分离的核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含与(i)SEQ IDNO:4的核苷酸58-4374或(ii)SEQ ID NO:4的核苷酸58-2277和2320-4374具有至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列并且可操作性连接至启动子、靶标序列或两者。在其他实施方案中,所述核酸序列包含(i)SEQ ID NO:4的核苷酸58-4374或(ii)SEQ ID NO:4的核苷酸58-2277和2320-4374。
在一些实施方案中,本公开提供包含分离的核酸分子的载体,所述分离的核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含与(i)SEQ IDNO:5的核苷酸58-4374或(ii)SEQ ID NO:5的核苷酸58-2277和2320-4374具有至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列并且可操作性连接至启动子、靶标序列或两者。在其他实施方案中,所述核酸序列包含(i)SEQ ID NO:5的核苷酸58-4374或(ii)SEQ ID NO:5的核苷酸58-2277和2320-4374。
在一些实施方案中,本公开提供包含分离的核酸分子的载体,所述分离的核酸分子包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含与(i)SEQ IDNO:6的核苷酸58-4374或(ii)SEQ ID NO:6的核苷酸58-2277和2320-4374具有至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列并且可操作性连接至启动子、靶标序列或两者。在其他实施方案中,所述核酸序列包含(i)SEQ ID NO:6的核苷酸58-4374或(ii)SEQ ID NO:6的核苷酸58-2277和2320-4374。
用于本公开的合适载体包括表达载体、病毒载体和质粒载体。在一个实施方案中,所述载体是病毒载体。
如本文所用,表达载体是指当引入至适当宿主细胞中时,含有用于所***的编码序列的转录和翻译的必需元件或在RNA病毒载体的情况下用于复制和翻译的必需元件的任何核酸构建体。表达载体可包括质粒、噬菌粒、病毒和其衍生物。
本公开的表达载体将包含编码本文所述的BDD FVIII蛋白的优化的多核苷酸。在一个实施方案中,针对BDD FVIII蛋白的优化的编码序列可操作性连接至表达控制序列。如本文所用,当两个核酸序列以允许各组分核酸序列保持其功能性的方式共价连接时,所述两个核酸序列是可操作性连接的。当编码序列和基因表达控制序列以将所述编码序列的表达或转录和/或翻译置于基因表达控制序列的影响或控制下的方式共价连接时,据说所述编码序列和所述基因表达控制序列是可操作性连接的。如果5'基因表达序列中的启动子的诱导导致编码序列的转录并且如果两个DNA序列之间的连接的性质不会(1)导致移码突变的引入,(2)干扰所述启动子区指导所述编码序列的转录的能力,或(3)干扰相应的RNA转录物翻译成蛋白质的能力,那么据说所述两个DNA序列是可操作性连接的。因此,如果基因表达序列能够实现编码核酸序列的转录,使得所得转录物被翻译成所需的蛋白质或多肽,那么所述基因表达序列将可操作性连接至所述编码核酸序列。
病毒载体包括但不限于来自以下病毒的核酸序列:逆转录病毒,如莫洛尼鼠科动物白血病病毒、哈维鼠科动物肉瘤病毒、鼠科动物乳腺肿瘤病毒和劳氏肉瘤病毒;慢病毒;腺病毒;腺相关病毒;SV40类型病毒;多瘤病毒;Epstein-Barr病毒;***状瘤病毒;疱疹病毒;牛痘病毒;脊髓灰质炎病毒;和RNA病毒,如逆转录病毒。可容易地使用本领域中众所周知的其他载体。某些病毒载体是基于非细胞病变真核病毒,其中非必需基因已经用所关注的基因置换。非细胞病变病毒包括逆转录病毒,其生命周期涉及将基因组病毒RNA反转录成DNA,所述DNA后续前病毒整合至宿主细胞DNA中。逆转录病毒已经被批准用于人基因疗法试验。最适用的是那些复制缺陷型逆转录病毒(即,能够指导所需的蛋白质的合成,但不能制造传染性粒子)。此类基因改变的逆转录病毒表达载体具有用于体内基因的高效转导的一般效用。用于产生复制缺陷型逆转录病毒的标准方案(包括以下步骤:将外源遗传材料并入至质粒中,用质粒转染包装细胞系,由所述包装细胞系产生重组逆转录病毒,从组织培养基收集病毒粒子,和用病毒粒子感染靶标细胞)提供于Kriegler,M.,Gene Transfer andExpression,A Laboratory Manual,W.H.Freeman Co.,New York(1990)和Murry,E.J.,Methods in Molecular Biology,第7卷,Humana Press,Inc.,Cliffton,N.J.(1991)中。
在一个实施方案中,所述病毒是腺相关病毒(双链DNA病毒)。所述腺相关病毒可工程改造成复制缺陷型并且能够感染广泛范围的细胞类型和物种。其进一步具有以下优势,如热和脂质溶剂稳定性;在不同谱系的细胞中的高转导频率,包括造血细胞;和缺乏重复传染抑制,因此允许多个系列的转导。据报告,所述腺相关病毒可以位点特异性方式整合至人细胞DNA中,由此最小化***诱变的可能性和逆转录病毒感染所特有的***基因表达的变异性。另外,野生型腺相关病毒感染已经在选择压力不存在下在组织培养物中持续超过100代,暗示腺相关病毒基因组整合是相对稳定的事件。所述腺相关病毒也可以染色体外形式起作用。
在另一实施方案中,所述病毒载体是已经操纵以携带编码如本文所公开的FVIII蛋白的多核苷酸的腺相关病毒(AAV)。已经公开了用于获得重组AAV(rAAV)的一般方法。参见例如USP 8,734,809、2013/0195801以及其中所引用的参考文献。在一些实施方案中,rAAV载体包含一个或多个AAV反向末端重复序列(ITR)和所关注的转基因(例如,优化的FVIII多核苷酸序列)。在某些实施方案中,制造rAAV的方法涉及培养所需的宿主细胞,所述宿主细胞含有编码AAV衣壳蛋白或其片段的核酸序列;功能性rep基因;由AAV反向末端重复序列(ITR)和所关注的转基因构成的rAAV载体;和充分的辅助功能以允许将重组AAV载体包装至所述AAV衣壳蛋白中。用于执行这些和相关程序的材料和方法已经公开于例如USP 8,734,809、2013/0195801、PCT/US1997/015692、PCT/US2002/033692、PCT/US2002/033630、WO2007/148971、WO00/20561、WO03/042361和WO2007/04670中。
源于几乎任何血清型的不同AAV载体序列中的一者或多者可根据本公开使用。特定AAV载体序列的选择将由如所关注的向性、所需的载体产率等已知参数指导。一般来说,AAV血清型具有在氨基酸和核酸层面上具有显著同源性的基因组序列,提供基因功能的相关集合,产生相关的病毒体,并且相似地复制和组装。关于多种AAV血清型的基因组序列和基因组相似性的概述,参见例如GenBank登录号U89790;GenBank登录号J01901;GenBank登录号AF043303;GenBank登录号AF085716;Chlorini等人(1997,J.Vir.71:6823-33);Srivastava等人(1983,J.Vir.45:555-64);Chlorini等人(1999,J.Vir.73:1309-1319);Rutledge等人(1998,J.Vir.72:309-319);和Wu等人(2000,J.Vir.74:8635-47)。AAV血清型1、2、3、4和5是用于本公开的上下文的AAV核苷酸序列的说明性来源。通过例如衣壳穿梭技术和AAV衣壳文库或由新近设计、开发或发展的ITR获得的AAV6、AAV7、AAV8或AAV9或新近开发的AAV样粒子也适用于某些公开应用。参见Dalkara,D等人(2013),Sci.Transl.Med.5(189):189ra76;Kotterman,MA Nat.Rev.Genet.(2014)15(7):455。
然而,在某些实施方案中,对肝和相关组织具有显著向性的AAV载体将在表达本文所公开的FVIII蛋白方面受到关注。非限制性实例包括AAV血清型1、2、6和8。参见例如Torres-Torranteras等人(2014)22:901和其中引用的参考文献。
在其他实施方案中,所述载体源于慢病毒。在某些实施方案中,所述载体是能够感染非***细胞的重组慢病毒的载体。
慢病毒基因组和前病毒DNA典型地具有在逆转录病毒中发现的三种基因:gag、pol和env,所述基因侧接两个长末端重复(LTR)序列。gag基因编码内部结构(基质、衣壳和核衣壳)蛋白;pol基因编码RNA指导的DNA聚合酶(反转录酶)、蛋白酶和整合酶;并且env基因编码病毒包膜糖蛋白。5'和3'LTR用于促进病毒体RNA的转录和多腺苷酸化。所述LTR含有病毒复制所必需的所有其他顺式作用序列。慢病毒具有另外的基因,包括vif、vpr、tat、rev、vpu、nef和vpx(在HIV-l、HIV-2和/或SIV中)。
与5'LTR相邻的是基因组的反转录(tRNA引物结合位点)和将病毒RNA有效衣壳化至粒子(Psi位点)中所必需的序列。如果衣壳化(或将逆转录病毒RNA包装至传染性病毒体中)所必需的序列从病毒基因组中缺失,那么所述顺式缺陷会防止基因组RNA的衣壳化。
然而,所得突变体仍能够指导所有病毒体蛋白的合成。本公开提供一种产生能够感染非***细胞的重组慢病毒的方法,所述方法包括用携带包装功能的两种或更多种载体(即,gag、pol和env,以及rev和tat)转染合适的宿主细胞。如下文中将公开,缺乏功能性tat基因的载体是某些应用所需要的。因此,例如,第一载体可提供编码病毒gag和病毒pol的核酸并且另一载体可提供编码病毒env的核酸以产生包装细胞。将提供异源基因的载体(本文中鉴别为转移载体)引入至所述包装细胞中会产生生产细胞,所述生产细胞释放携带所关注的外来基因的传染性病毒粒子。
根据上文所指示的载体和外来基因的配置,所述第二载体可提供编码病毒包膜(env)基因的核酸。所述env基因可源于几乎任何合适的病毒,包括逆转录病毒。在一些实施方案中,所述env蛋白是允许人和其他物种的细胞的转导的两性包膜蛋白。
逆转录病毒源性env基因的实例包括但不限于:莫洛尼鼠科动物白血病病毒(MoMuLV或MMLV)、哈维鼠科动物肉瘤病毒(HaMuSV或HSV)、鼠科动物乳腺肿瘤病毒(MuMTV或MMTV)、长臂猿ape白血病病毒(GaLV或GALV)、人免疫缺陷病毒(HIV)和劳氏肉瘤病毒(RSV)。也可使用其他env基因,如水泡性口炎病毒(VSV)蛋白G(VSV G)、肝炎病毒和流感的env基因。
提供病毒env核酸序列的载体与本文中别处所述的调控序列可操作性缔合。
在某些实施方案中,所述载体包括慢病毒载体,其中HIV毒力基因env、vif、vpr、vpu和nef缺失,而未损害所述载体转导非***细胞的能力。
在一些实施方案中,所述载体包括慢病毒载体,所述慢病毒载体包含3'LTR的U3区的缺失。U3区的缺失可以是完全缺失或部分缺失。
在一些实施方案中,包含本文所述的FVIII核苷酸序列的本公开的慢病毒载体可在细胞中用(a)包含gag、pol或gag和pol基因的第一核苷酸序列和(b)包含异源env基因的第二核苷酸序列转染;其中所述慢病毒载体缺乏功能性tat基因。在其他实施方案中,所述细胞进一步用包含rev基因的第四核苷酸序列转染。在某些实施方案中,所述慢病毒载体缺乏选自vif、vpr、vpu、vpx和nef或其组合的功能性基因。
在某些实施方案中,慢病毒载体包含编码gag蛋白、Rev应答元件、中央聚嘌呤序列(central polypurine track,cPPT)或其任何组合的一个或多个核苷酸序列。
所述慢病毒载体的实例公开于WO9931251、W09712622、W09817815、W09817816和WO9818934中,所述文献以引用的方式整体并入本文中。
其他载体包括质粒载体。质粒载体已经广泛地描述于本领域中并且是本领域技术人员众所周知的。参见例如Sambrook等人,Molecular Cloning:A Laboratory Manual,第2版,Cold Spring Harbor Laboratory Press,1989。最近数年来,已经发现质粒载体由于其无法在宿主基因组中复制和整合至宿主基因组中而特别有利于体内将基因递送至细胞。然而,这些具有与宿主细胞可相容的启动子的质粒可自在所述质粒内可操作性编码的基因表达肽。可获自商业供应商的一些常用的质粒包括pBR322、pUC18、pUC19、多种pcDNA质粒、pRC/CMV、多种pCMV质粒、pSV40和pBlueScript。特定质粒的另外实例包括pcDNA3.1,目录号V79020;pcDNA3.1/hygro,目录号V87020;pcDNA4/myc-His,目录号V86320;和pBudCE4.1,目录号V53220,均来自Invitrogen(Carlsbad,CA.)。其他质粒是本领域普通技术人员众所周知的。另外,质粒可使用标准分子生物学技术定制设计以去除和/或添加DNA的特定片段。
组织特异性表达
在某些实施方案中,在所述载体内包括一个或多个miRNA靶标序列将是适用的,所述miRNA靶标序列例如可操作性连接至优化的FVIII转基因。因此,本公开还提供可操作性连接至优化的FVIII核苷酸序列或以其他方式***载体内的至少一个miRNA序列靶标。包括于所述载体中的miRNA靶标序列的超过一个拷贝可增加***的有效性。还包括不同的miRNA靶标序列。例如,表达超过一种转基因的载体可具有在超过一个miRNA靶标序列的控制下的转基因,所述超过一个miRNA靶标序列可以是相同或不同的。所述miRNA靶标序列可以是串联的,但也包括其他布置。含有miRNA靶标序列的转基因表达盒也可以反义取向***所述载体内。反义取向可适用于病毒粒子的产生以避免可在其他方面对所述生产细胞有毒的基因产物的表达。在其他实施方案中,所述载体包含相同或不同的miRNA靶标序列的1、2、3、4、5、6、7或8个拷贝。然而,在某些其他实施方案中,所述载体将不包括任何miRNA靶标序列。是否包括miRNA靶标序列(和多少个)的选择将由如预期的组织靶标、所需的表达水平等已知参数指导。
在一个实施方案中,所述靶标序列是miR-223靶标,已经报告所述miR-223靶标最有效地阻断骨髓定向祖细胞中的表达并且至少部分地阻断更原始的HSPC中的表达。miR-223靶标可阻断分化的骨髓细胞(包括粒细胞、单核细胞、巨噬细胞、骨髓树突状细胞)中的表达。miR-223靶标也可适用于基因疗法应用,所述基因疗法应用依赖于淋巴或红细胞谱系中的稳固转基因表达。miR-223靶标也可极有效地阻断人HSC中的表达。
在另一实施方案中,所述靶标序列是miR142靶标(tccataaagt aggaaacact aca(SEQ ID NO:43))。在一个实施方案中,所述载体包含miR-142靶标序列的4个拷贝。在某些实施方案中,将造血特异性微RNA(如miR-142(142T))的互补序列并入至例如慢病毒载体(LV)等载体的3'非翻译区中,使得转基因编码转录物易受到miRNA介导的下调。通过这种方法,可防止造血谱系抗原递呈细胞(APC)中的转基因表达,同时在非造血细胞中维持转基因表达(Brown等人,Nat Med 2006)。这种策略可对转基因表达施加严苛的转录后控制并且因此使得转基因能够稳定递送并且长期表达。在一些实施方案中,miR-142调控会防止免疫介导的转导细胞清除和/或诱导抗原特异性调控T细胞(T reg)并且介导对转基因编码抗原的稳固免疫耐受性。
在一些实施方案中,所述靶标序列是miR181靶标。Chen C-Z和Lodish H,Seminarsin Immunology(2005)17(2):155-165公开了miR-181,所述miR-181是在小鼠骨髓内的B细胞中特异性表达的miRNA(Chen和Lodish,2005)。其还公开了一些人miRNA与白血病有关。
所述靶标序列可与所述miRNA完全或部分互补。术语“完全互补”意指所述靶标序列具有与识别所述靶标序列的miRNA的序列100%互补的核酸序列。术语“部分互补”意指所述靶标序列仅与识别所述靶标序列的miRNA的序列部分互补,由此所述部分互补序列仍由所述miRNA识别。换句话说,在本公开的上下文中的部分互补靶标序列有效识别相应的miRNA并且实现表达所述miRNA的细胞中的转基因表达的防止或降低。所述miRNA靶标序列的实例描述于WO2007/000668、WO2004/094642、WO2010/055413或WO2010/125471中,所述文献以引用的方式整体并入本文中。
宿主细胞
本公开还提供包含本公开的核酸分子或载体的宿主细胞。如本文所用,术语“转化”应以广泛含义使用以指将DNA引入至受体宿主细胞中,所述引入会改变基因型并且因而导致受体细胞中的改变。
“宿主细胞”是指已经用使用重组DNA技术构建并且编码至少一种异源基因的载体转化的细胞。本公开的宿主细胞优选地具有哺乳动物起源;最优选地具有人或小鼠起源。相信本领域技术人员具有优先确定最适用于其目的的特定宿主细胞系的能力。示例性宿主细胞系包括但不限于CHO、DG44和DUXB11(中国仓鼠卵巢细胞系,DHFR-)、HELA(人子***)、CVI(猴肾细胞系)、COS(具有SV40T抗原的CVI的衍生物)、R1610(中国仓鼠成纤维细胞)BALBC/3T3(小鼠成纤维细胞)、HAK(仓鼠肾细胞系)、SP2/O(小鼠骨髓瘤)、P3.times.63-Ag3.653(小鼠骨髓瘤)、BFA-1c1BPT(牛内皮细胞)、RAJI(人淋巴细胞)、PER.
Figure BDA0001814810910001151
NS0、CAP、BHK21和HEK 293(人肾)。在一个特定实施方案中,所述宿主细胞选自由以下组成的组:CHO细胞、HEK293细胞、BHK21细胞、PER.
Figure BDA0001814810910001152
细胞、NS0细胞和CAP细胞。宿主细胞系典型地可获自商业服务美国培养物保藏中心(American Tissue Culture Collection),或获自公布的文献。
将本公开的分离的核酸分子或载体引入至宿主细胞中可通过本领域技术人员众所周知的多种技术实现。这些技术包括但不限于转染(包括电泳和电穿孔)、原生质体融合、磷酸钙沉淀、与包膜DNA的细胞融合、微注射和用完整病毒感染。参见Ridgway,A.A.G.“Mammalian Expression Vectors”第24.2章,第470-472页Vectors,Rodriguez和Denhardt编(Butterworths,Boston,Mass.1988)。最优选地,质粒引入至宿主中是经由电穿孔。转化细胞在适合轻链和重链的产生的条件下生长,并且针对重链和/或轻链蛋白合成进行测定。示例性测定技术包括酶联免疫吸附测定(ELISA)、放射免疫测定(RIA)或荧光活化的细胞分选仪分析(FACS)、免疫组织化学等。
包含本公开的分离的核酸分子或载体的宿主细胞在适当的生长培养基中生长。如本文所用,术语“适当的生长培养基”意指含有细胞生长所需的营养物的培养基。细胞生长所需的营养物可包括碳源、氮源、必需氨基酸、维生素、矿物质和生长因子。任选地,所述培养基可含有一种或多种选择因子。任选地,所述培养基可含有牛犊血清或胎牛血清(FCS)。在一个实施方案中,所述培养基大体上不含IgG。所述生长培养基一般将通过例如药物选择或必需营养物的缺乏而选择含有所述DNA构建体的细胞,所述必需营养物通过所述DNA构建体上的可选择标记物来补充或用所述DNA构建体共转染。培养的哺乳动物细胞一般在市面上有售的含血清或无血清培养基(例如,MEM、DMEM、DMEM/F12)中生长。在一个实施方案中,所述培养基是CDoptiCHO(Invitrogen,Carlsbad,CA.)。在另一实施方案中,所述培养基是CD17(Invitrogen,Carlsbad,CA.)。适合用于所用的特定细胞系的培养基的选择在本领域普通技术人员的水平内。
多肽的制备
本公开还提供由本公开的核酸分子编码的多肽。在其他实施方案中,本公开的多肽由包含本公开的分离的核酸分子的载体编码。在其他实施方案中,本公开的多肽由包含本公开的分离的核酸分子的宿主细胞产生。
在其他实施方案中,本公开还提供一种产生具有FVIII活性的多肽的方法,所述方法包括在一定条件下培养本公开的宿主细胞,由此产生具有FVIII活性的多肽;和回收所述具有FVIII活性的多肽。在一些实施方案中,所述具有FVIII活性的多肽的表达相对于在包含包含SEQ ID NO:16(亲本FVIII基因序列)的参考核苷酸序列的相同条件下培养的宿主细胞增加。
在其他实施方案中,本公开提供一种增加具有FVIII活性的多肽的表达的方法,所述方法包括在一定条件下培养本公开的宿主细胞,由此由所述核酸分子表达具有FVIII活性的多肽,其中所述具有FVIII活性的多肽的表达相对于在包含包含SEQ ID NO:16的参考核酸分子的相同条件下培养的宿主细胞增加。
在其他实施方案中,本公开提供一种改进具有FVIII活性的多肽的产率的方法,所述方法包括在一定条件下培养宿主细胞,由此由所述核酸分子产生具有FVIII活性的多肽,其中具有FVIII活性的多肽的产率相对于在包含包含SEQ ID NO:16的参考核酸序列的相同条件下培养的宿主细胞增加。
在其他实施方案中,本公开提供一种改进具有FVIII活性的多肽的产率的方法,所述方法包括培养包含编码所述多肽的核苷酸序列的宿主细胞,其中所述核苷酸序列的3'部分的密码子适应指数相对于所述核苷酸序列的5'部分增加;其中具有FVIII活性的多肽的产率相对于在包含含有SEQ ID NO:16的参考核酸序列的相同条件下培养的宿主细胞增加。在一些实施方案中,所述核苷酸序列的5'部分的密码子适应指数相对于SEQ ID NO:16的密码子适应指数增加,减少,或未改变。
在其他实施方案中,本公开提供一种改进具有FVIII活性的多肽的产率的方法,所述方法包括培养包含编码所述多肽的核苷酸序列的宿主细胞,其中所述核苷酸序列的5'部分的密码子适应指数相对于所述核苷酸序列的3'部分增加;其中具有FVIII活性的多肽的产率相对于在包含含有SEQ ID NO:16的参考核酸序列的相同条件下培养的宿主细胞增加。在一些实施方案中,所述核苷酸序列的3'部分的密码子适应指数相对于SEQ ID NO:16的密码子适应指数增加,减少,或未改变。
在其他实施方案中,本公开提供一种改进具有FVIII活性的多肽的产率的方法,所述方法包括培养包含编码所述多肽的核苷酸序列的宿主细胞,其中所述核苷酸中编码所述多肽的C端部分的部分的密码子适应指数相对于所述核苷酸中编码所述多肽的N端部分的部分增加;其中具有FVIII活性的多肽的产率相对于在包含含有SEQ ID NO:16的参考核酸序列的相同条件下培养的宿主细胞增加。在一些实施方案中,所述核苷酸中编码所述多肽的N端部分的部分的密码子适应指数相对于SEQ ID NO:16的密码子适应指数增加,减少,或未改变。
在其他实施方案中,本公开提供一种改进具有FVIII活性的多肽的产率的方法,所述方法包括培养包含编码所述多肽的核苷酸序列的宿主细胞,其中所述核苷酸中编码所述多肽的N端部分的部分的密码子适应指数相对于所述核苷酸中编码所述多肽的C端部分的部分增加;其中具有FVIII活性的多肽的产率相对于在包含含有SEQ ID NO:16的参考核酸序列的相同条件下培养的宿主细胞增加。在一些实施方案中,所述核苷酸中编码所述多肽的C端部分的部分的密码子适应指数相对于SEQ ID NO:16的密码子适应指数增加,减少,或未改变。
在改进具有FVIII活性的多肽的产率的某些实施方案中,所述核苷酸序列的5'部分当适当地比对时与SEQ ID NO:1的约核苷酸1-1791、SEQ ID NO:1的核苷酸58-1791或其片段一致。在其他实施方案中,由所述核苷酸的5'部分编码的多肽当适当地比对时与SEQID NO:17的约氨基酸1-497、SEQ ID NO:17的氨基酸20-497或其片段一致。在某些实施方案中,所述核苷酸序列中编码所述多肽的N端部分的部分当适当地比对时与SEQ ID NO:1的约核苷酸1-1791、SEQ ID NO:1的核苷酸58-1791或其片段一致。在一些实施方案中,所述核苷酸序列的3'部分当适当地比对时与SEQ ID NO:1的约核苷酸1792-4374或其片段一致。在其他实施方案中,由所述核苷酸的3'部分编码的多肽当适当地比对时与SEQ ID NO:17的约氨基酸498-1458或其片段一致。在某些实施方案中,所述核苷酸序列中编码所述多肽的C端部分的部分当适当地比对时与SEQ ID NO:1的约核苷酸1792-4374或其片段一致。
在一些实施方案中,所述FVIII多肽的表达相对于在包含含有SEQ ID NO:16的参考核酸序列的相同条件下培养的宿主细胞增加至少约1.5倍、至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍、至少约12倍、至少约13倍、至少约14倍、至少约15倍、至少约20倍、至少约25倍、至少约30倍、至少约35倍、至少约40倍、至少约50倍、至少约60倍、至少约70倍、至少约80倍、至少约90倍、至少约100倍、至少约150倍或至少约200倍。
多种方法可用于由本公开的优化的核酸分子重组产生FVIII蛋白。所需序列的多核苷酸可通过从头固相DNA合成或通过早先制备的多核苷酸的PCR诱变产生。寡核苷酸介导的诱变是一种用于制备核苷酸序列中的取代、***、缺失或改变(例如,改变的密码子)的方法。例如,起始DNA通过使编码所需突变的寡核苷酸与单链DNA模板杂交而改变。在杂交之后,使用DNA聚合酶来合成所述模板的完整第二互补链,所述完整第二互补链并入寡核苷酸引物。在一个实施方案中,基因工程改造(例如,基于引物的PCR诱变)足以并入如本文所定义的改变,以产生本公开的多核苷酸。
关于重组蛋白产生,将编码FVIII蛋白的本公开的优化的多核苷酸序列***至适当的表达媒介物中,所述表达媒介物即含有用于所***的编码序列的转录和翻译的必需元件或在RNA病毒载体的情况下含有用于复制和翻译的必需元件的载体。
本公开的多核苷酸序列在适当阅读框中***至所述载体中。所述表达载体接着转染至将表达所述多肽的合适靶细胞中。本领域中已知的转染技术包括但不限于磷酸钙沉淀(Wigler等人1978,Cell 14:725)和电穿孔(Neumann等人1982,EMBO,J.1:841)。多种宿主-表达载体***可用于在真核细胞中表达本文所述的FVIII蛋白。在一个实施方案中,所述真核细胞是动物细胞,包括哺乳动物细胞(例如,HEK293细胞、PER.
Figure BDA0001814810910001201
CHO、BHK、Cos、HeLa细胞)。本公开的多核苷酸序列也可编码将允许分泌所述FVIII蛋白的信号序列。本领域技术人员应理解,虽然所述FVIII蛋白经过翻译,但所述信号序列由所述细胞裂解以形成成熟蛋白。多种信号序列是本领域中已知的,例如原生因子Vll信号序列、原生因子IX信号序列和小鼠IgK轻链信号序列。或者,在未包括信号序列的情况下,所述FVIII蛋白可通过溶解所述细胞来回收。
本公开的FVIII蛋白可在转基因动物,如啮齿动物、山羊、绵羊、猪或牛中合成。术语“转基因动物”是指已经将外来基因并入至其基因组中的非人动物。因为这种基因存在于生殖系组织中,所以其从母体传代至后代。外源基因被引入至单细胞胚胎中(Brinster等人1985,Proc.Natl.Acad.Sci.USA 82:4438)。产生转基因动物的方法是本领域中已知的,包括产生免疫球蛋白分子的转基因技术(Wagner等人1981,Proc.Natl.Acad.Sci.USA 78:6376;McKnight等人1983,Cell 34:335;Brinster等人1983,Nature 306:332;Ritchie等人1984,Nature 312:517;Baldassarre等人2003,Theriogenology 59:831;Robl等人2003,Theriogenology 59:107;Malassagne等人2003,Xenotransplantation 10(3):267)。
所述表达载体可编码允许重组产生的蛋白质的容易纯化或鉴别的标签。实例包括但不限于载体pUR278(Ruther等人1983,EMBO J.2:1791),其中本文所述的FVIII蛋白的编码序列可与lac Z编码区同框连接至所述载体中,使得产生杂合蛋白;pGEX载体可用于表达具有谷胱甘肽S-转移酶(GST)标签的蛋白质。这些蛋白质通常是可溶的并且可容易地通过吸附至基质谷胱甘肽-琼脂糖珠粒、随后在游离谷胱甘肽存在下洗脱而从细胞纯化。所述载体包括用于纯化之后所述标签的容易去除的裂解位点(例如,PreCission Protease(Pharmacia,Peapack,N.J.))。
出于本公开的目的,可使用多种表达载体***。这些表达载体通常在宿主生物体中可复制,呈游离体形式或作为宿主染色体DNA的组成部分。表达载体可包括表达控制序列,包括但不限于启动子(例如,天然缔合或异源启动子)、增强子、信号序列、剪接信号、增强子元件和转录终止序列。优选地,所述表达控制序列是能够转化或转染真核宿主细胞的载体中的真核启动子***。表达载体还可使用源于动物病毒的DNA元件,所述动物病毒如牛***状瘤病毒、多瘤病毒、腺病毒、牛痘病毒、杆状病毒、逆转录病毒(RSV、MMTV或MOMLV)、巨细胞病毒(CMV)或SV40病毒。其他涉及使用具有内部核糖体结合位点的多顺反子***。
通常,表达载体含有选择标记(例如,氨苄青霉素抗性、潮霉素抗性、四环素抗性或新霉素抗性)以允许检测用所需的DNA序列转化的那些细胞(参见例如Itakura等人,美国专利4,704,362)。已经将所述DNA整合至其染色体中的细胞可通过引入一种或多种允许转化的宿主细胞的选择的标记来选择。所述标记可提供针对营养缺陷型宿主的原养型、生物杀灭剂抗性(例如,抗生素)或对如铜等重金属的抗性。所述可选择标记基因可直接地连接至欲表达的DNA序列,或通过共转化引入至同一细胞中。
适用于表达优化的FVIII序列的载体的实例是NEOSPLA(美国专利号6,159,730)。这种载体含有巨细胞病毒启动子/增强子、小鼠β球蛋白主要启动子、SV40复制起点、牛生长激素多腺苷酸化序列、新霉素磷酸转移酶外显子1和外显子2、二氢叶酸还原酶基因和前导序列。已经发现这种载体在可变区和恒定区基因的并入、细胞中的转染、随后含G418培养基中的选择和甲氨蝶呤扩增后引起极高水平的抗体表达。载体***也教导于美国专利号5,736,137和5,658,570中,所述美国专利中的每一者均以引用的方式整体并入本文中。这种***提供高表达水平,例如>30pg/细胞/天。其他示例性载体***公开于美国专利号6,413,777中。
在其他实施方案中,本公开的公开的多肽可使用多顺反子构建体表达。在这些表达***中,可从单一多顺反子构建体产生多种所关注的基因产物,如多聚体结合蛋白的多种多肽。这些***有利地使用内部核糖体进入位点(IRES)以在真核宿主细胞中提供相对高水平的多肽。可相容的IRES序列公开于美国专利号6,193,980中,所述美国专利也并入本文中。
更一般地,一旦已经制备编码多肽的载体或DNA序列,即可将所述表达载体引入至适当宿主细胞中。即,所述宿主细胞可被转化。将质粒引入至宿主细胞中可通过本领域技术人员众所周知的多种技术实现,如上文所论述。转化细胞在适合FVIII多肽的产生的条件下生长,并且针对FVIII多肽合成进行测定。示例性测定技术包括酶联免疫吸附测定(ELISA)、放射免疫测定(RIA)或荧光活化的细胞分选仪分析(FACS)、免疫组织化学等。
在用于从重组宿主分离多肽的方法的描述中,除非另外清楚地规定,否则术语“细胞”和“细胞培养物”可互换使用以表示多肽的来源。换句话说,从“细胞”回收多肽可意指从短暂离心的全细胞,或从含有培养基和悬浮的细胞两者的细胞培养物回收。
用于蛋白质表达的宿主细胞系优选地具有哺乳动物起源;最优选地具有人或小鼠起源,因为本公开的分离的核酸已经针对人细胞中的表达经过优化。上文已经描述了示例性宿主细胞系。在产生具有FVIII活性的多肽的方法的一个实施方案中,所述宿主细胞是HEK293细胞。在产生具有FVIII活性的多肽的方法的另一实施方案中,所述宿主细胞是CHO细胞。
编码本公开的多肽的基因也可在如细菌或酵母或植物细胞等非哺乳动物细胞中表达。在这方面,应理解如细菌等多种单细胞非哺乳动物微生物也可被转化;即,能够在培养物中或在发酵中生长的那些。易经受转化的细菌包括以下的成员:肠杆菌科,如大肠杆菌或沙门氏菌属菌株;杆菌科,如枯草芽胞杆菌;肺炎球菌;链球菌,和流感嗜血杆菌。应进一步理解,当在细菌中表达时,所述多肽典型地成为包涵体的一部分。所述多肽必须经过分离,经过纯化并且接着组装至功能分子中。
或者,本公开的优化的核苷酸序列可并入转基因中以引入至转基因动物的基因组中并且后续在所述转基因动物的乳汁中表达(参见例如Deboer等人,US 5,741,957,Rosen,US 5,304,489,和Meade等人,US5,849,992)。合适的转基因包括用于与来自乳腺特异性基因(如酪蛋白或β微球蛋白)的启动子和增强子可操作性连接的多肽的编码序列。
体外产生允许按比例增加以生成大量的所需多肽。用于组织培养条件下的哺乳动物细胞培养的技术是本领域中已知的并且包括均质悬浮培养(例如,在气升式反应器中或在连续搅拌反应器中)或固定或截留细胞培养(例如,在中空纤维、微胶囊中,在琼脂糖微珠或陶瓷筒上)。必需和/或必要时,多肽的溶液可通过惯用色谱方法,例如凝胶过滤、离子交换色谱法、DEAE-纤维素色谱法或(免疫)亲和力色谱法来纯化,例如在合成铰链区多肽的优先生物合成之后或在本文所述的HIC色谱法步骤之前或之后。亲和标签序列(例如,His(6)标签)可任选地附接或包括于所述多肽序列内以促进下游纯化。
一旦经过表达,所述FVIII蛋白可根据本领域的标准程序来纯化,包括硫酸铵沉淀、亲和柱色谱法、HPLC纯化、凝胶电泳等(一般参见Scopes,Protein Purification(Springer-Verlag,N.Y.,(1982))。关于药物用途,至少约90-95%均质性的大体上纯蛋白质是优选的,并且98-99%或更高均质性是最优选的。
药物组合物
含有本公开的分离的核酸分子、由所述核酸分子编码的具有FVIII活性的多肽、载体或宿主细胞的组合物可含有合适的药学上可接受的载体。例如,其可含有促进将活性化合物加工成设计用于递送至作用位点的制剂的赋形剂和/或助剂。
所述药物组合物可经过配制以通过团注进行肠胃外施用(即,静脉内、皮下或肌肉内)。用于注射的制剂可以单位剂型,例如在安瓿中或在具有添加的防腐剂的多剂量容器中呈递。所述组合物可采用如油性或水性媒剂中的悬浮液、溶液或乳液等形式,并且含有如悬浮剂、稳定剂和/或分散剂等配制剂。或者,所述活性成分可呈用于由合适媒剂(例如,无热原水)复原的粉末形式。
用于肠胃外施用的合适制剂还包括呈水溶性形式的活性化合物(例如,水溶性盐)的水溶液。另外,可施用呈适当油性注射悬浮液形式的所述活性化合物的悬浮液。合适的亲脂性溶剂或媒剂包括脂肪油(例如,芝麻油)或合成脂肪酸酯(例如,油酸乙酯或三酸甘油酯)。水性注射悬浮液可含有增加所述悬浮液的粘度的物质,包括例如羧基甲基纤维素钠、山梨醇和葡聚糖。任选地,所述悬浮液还可含有稳定剂。脂质体也可用于封装本公开的分子以递送至细胞或胞间隙中。示例性药学上可接受的载剂是生理学上可相容的溶剂、分散介质、涂层、抗细菌和抗真菌剂、等渗和吸收延迟剂、水、生理盐水、磷酸盐缓冲生理盐水、右旋糖、甘油、乙醇等。在一些实施方案中,所述组合物包含等渗剂,例如糖、多元醇(如甘露醇、山梨醇)或氯化钠。在其他实施方案中,所述组合物包含药学上可接受的物质,如湿润剂或微量的辅助物质(如湿润或乳化剂、防腐剂或缓冲剂),所述药学上可接受的物质增强活性成分的保质期或有效性。
本公开的组合物可呈多种形式,包括例如液体(例如,可注射和可输注溶液)、分散液、悬浮液、半固体和固体剂型。优选的形式取决于施用模式和治疗应用。
所述组合物可配制成溶液、微乳液、分散液、脂质体或适合高药物浓度的其他有序结构。无菌可注射溶液可通过在有需要时具有一种上文所列举的成分或成分的组合的适当溶剂中并入所需量的活性成分、随后过滤灭菌来制备。一般地,分散液通过将活性成分并入无菌媒剂中来制备,所述无菌媒剂含有基础分散介质和来自上文所列举的那些的所需其他成分。在用于制备无菌可注射溶液的无菌粉末的情况下,优选制备方法是真空干燥和冷冻干燥,其会生成活性成分加上来自先前无菌过滤的溶液的任何另外所需成分的粉末。溶液的适当流动性可例如通过使用涂层(如卵磷脂),在分散液的情况下通过维持所需粒径,和通过使用表面活性剂来维持。可注射组合物的延长吸收可通过在所述组合物中包括延迟吸收的剂(例如单硬脂酸盐和明胶)来引起。
活性成分可用控制释放制剂或器件来配制。所述制剂和器件的实例包括植入物、透皮贴剂和微封装的递送***。可使用生物可降解、生物可相容聚合物,例如乙烯乙酸乙烯酯、聚酐、聚乙醇酸、胶原蛋白、聚原酸酯和聚乳酸。本领域技术人员已知用于制备所述制剂和器件的方法。参见例如Sustained and Controlled Release Drug Delivery Systems,J.R.Robinson编,Marcel Dekker,Inc.,New York,1978。
可注射储库制剂可通过在如聚丙交酯-聚乙交酯等生物可降解聚合物中形成所述药物的微封装基质而制得。视药物与聚合物的比率和所用聚合物的性质而定,可控制药物释放速率。其他示例性生物可降解聚合物是聚原酸酯和聚酐。储库可注射制剂还可通过将药物截留于脂质体或微乳液中来制备。
补充活性化合物可并入至所述组合物中。在一个实施方案中,本公开的嵌合蛋白与另一凝固因子或其变体、片段、类似物或衍生物配制。例如,所述凝固因子包括但不限于因子V、因子VII、因子VIII、因子IX、因子X、因子XI、因子XII、因子XIII、凝血酶原、纤维蛋白原、血管性血友病因子或重组可溶性组织因子(rsTF)或前述任一者的活化形式。止血剂的凝固因子也可包括抗纤维蛋白溶解药物,例如ε-氨基-己酸、氨甲环酸。
给药方案可经过调节以提供最佳所需响应。例如,可施用单一大丸药,可随时间施用数个分次剂量,或剂量可如治疗情形的紧急性所指示按比例降低或增加。为了便于剂量的施用和均一性,以剂量单位形式配制肠胃外组合物是有利的。参见例如Remington'sPharmaceutical Sciences(Mack Pub.Co.,Easton,Pa.1980)。
除了活性化合物以外,液体剂型还可含有惰性成分,如水、乙醇、碳酸乙酯、乙酸乙酯、苯甲醇、苯甲酸苯甲酯、丙二醇、1,3-丁二醇、二甲基甲酰胺、油、甘油、四氢糠醇、聚乙二醇和山梨聚糖的脂肪酸酯。
合适的药物载剂的非限制性实例也由E.W.Martin描述于Remington'sPharmaceutical Sciences中。赋形剂的一些实例包括淀粉、葡萄糖、乳糖、蔗糖、明胶、麦芽、稻、面粉、白垩、硅胶、硬质酸钠、甘油单硬脂酸酯、滑石、氯化钠、脱脂奶粉、甘油、丙烯、二醇、水、乙醇等。所述组合物还可含有pH缓冲剂和湿润或乳化剂。
对于口服施用,所述药物组合物可采用通过常规手段制备的片剂或胶囊的形式。所述组合物还可制备为液体,例如糖浆或悬浮液。所述液体可包括悬浮剂(例如,山梨醇糖浆、纤维素衍生物或氢化食用脂肪)、乳化剂(卵磷脂或***树胶)、非水性媒剂(例如,杏仁油、油性酯、乙醇或分馏植物油)和防腐剂(例如,对羟基苯甲酸甲酯或对羟基苯甲酸丙酯或山梨酸)。所述制剂还可包括调味剂、着色剂和甜味剂。或者,所述组合物可呈用于以水或另一合适的媒剂复原的干燥产品形式提供。
对于经颊施用,所述组合物可根据常规方案采用片剂或***锭的形式。
对于通过吸入施用,根据本公开使用的化合物便利地以具有或不具有赋形剂的雾化气雾剂的形式或以来自加压包装或喷雾器的气雾剂喷雾的形式递送,任选地具有推进剂,例如二氯二氟甲烷、三氯氟甲烷、二氯四氟甲烷、二氧化钛或其他合适气体。在加压气雾剂的情况下,剂量单位可通过提供阀以递送计量的量来测定。例如用于吸入器或吹入器中的明胶的胶囊和筒可配制成含有所述化合物和合适的粉末基质(如乳糖或淀粉)的粉末混合物。
所述药物组合物还可配制用于以栓剂或保留灌肠形式直肠施用,例如含有常规栓剂基质,如可可脂或其他甘油酯。
在一个实施方案中,药物组合物包含具有因子VIII活性的多肽、编码所述具有因子VIII活性的多肽的优化的核酸分子、包含所述核酸分子的载体或包含所述载体的宿主细胞,和医药学上可接受的载剂。在一些实施方案中,所述组合物通过选自由以下组成的组的途径施用:表面施用、眼内施用、肠胃外施用、鞘内施用、硬膜下施用和口服施用。所述肠胃外施用可以是静脉内或皮下施用。
在其他实施方案中,所述组合物用于治疗有需要的受试者中的出血疾病或病况。所述出血疾病或病况选自由以下组成的组:出血性凝固病症、关节积血、肌肉出血、口腔出血(oral bleed)、出血、出血至肌肉中、口腔出血(oral hemorrhage)、创伤、创伤性头皮炎、胃肠出血、颅内出血、腹腔内出血、胸腔内出血、骨折、中枢神经***出血、咽后间隙出血、腹膜后间隙出血、髂腰肌鞘出血和其任何组合。在其他实施方案中,预定所述受试者经历手术。在其他实施方案中,所述治疗是预防性的或按需要的。
治疗方法
本公开提供一种治疗出血病症的方法,所述方法包括向有需要的受试者施用本公开的核酸分子、载体或多肽。在一些实施方案中,所述出血病症的特征在于FVIII缺陷。在一些实施方案中,所述出血病症是血友病。在一些实施方案中,所述出血病症是血友病A。在治疗出血病症的方法的一些实施方案中,在施用后24小时的血浆FVIII活性相对于施用包含SEQ ID NO:16的参考核酸分子、包含所述参考核酸分子的载体或由所述参考核酸分子编码的多肽的受试者增加。
在一些实施方案中,血浆FVIII活性在施用后约6小时、约12小时、约18小时、约24小时、约36小时、约48小时、约3天、约4天、约5天、约6天、约7天、约8天、约9天、约10天、约11天、约12天、约13天、约14天、约15天、约16天、约17天、约18天、约19天、约20天、约21天、约22天、约23天、约24天、约25天、约26天、约27天或约28天相对于施用包含SEQ ID NO:16的参考核酸分子、包含所述参考核酸分子的载体或由所述参考核酸分子编码的多肽的受试者增加。在某些实施方案中,血浆FVIII活性在施用后约24小时相对于施用包含SEQ ID NO:16的参考核酸分子、包含所述参考核酸分子的病毒载体或由所述参考核酸分子编码的多肽的受试者增加。在另一实施方案中,血浆FVIII活性在施用后约21天相对于施用包含SEQ ID NO:16的参考核酸分子、包含所述参考核酸分子的病毒载体或由所述参考核酸分子编码的多肽的受试者增加。
在一些实施方案中,施用后的血浆FVIII活性相对于施用包含SEQ ID NO:16的参考核酸分子、包含所述参考核酸分子的病毒载体或由所述参考核酸分子编码的多肽的受试者增加至少约1.5倍、至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍、至少约12倍、至少约13倍、至少约14倍、至少约15倍、至少约20倍、至少约25倍、至少约30倍、至少约35倍、至少约40倍、至少约50倍、至少约60倍、至少约70倍、至少约80倍、至少约90倍、至少约100倍、至少约150倍、至少约200倍、至少约250倍、至少约300倍、至少约350倍、至少约400倍、至少约450倍或至少约500倍。在一些实施方案中,施用后的血浆FVIII活性相对于生理学正常循环FVIII水平增加至少约150%、至少约200%、至少约250%、至少约300%、至少约350%、至少约400%、至少约450%、至少约500%、至少约550%、至少约600%、至少约650%、至少约700%、至少约750%、至少约800%、至少约850%、至少约900%、至少约950%、至少约1000%、至少约1500%、至少约2000%、至少约2500%、至少约3000%、至少约3500%、至少约4000%、至少约4500%、至少约5000%、至少约5500%、至少约6000%、至少约7000%、至少约8000%、至少约9000%、至少约10,000%。在一个实施方案中,施用后的血浆FVIII活性相对于生理学正常循环FVIII水平增加至少约3000至约5000%。在一些实施方案中,在施用包含编码本文所述的具有因子VIII(FVIII)活性的多肽的密码子优化的基因的质粒后24小时,或在施用包含编码本文所述的具有因子VIII(FVIII)活性的多肽的密码子优化的基因的慢病毒或AAV载体后21天,血浆FVIII活性相对于施用包含SEQ ID NO:16的参考核酸分子、包含所述参考核酸分子的载体或由所述参考核酸分子编码的多肽的受试者增加至少约6倍。在一些实施方案中,在施用包含编码本文所述的具有因子VIII(FVIII)活性的多肽的密码子优化的基因的质粒后24小时,或在施用包含编码本文所述的具有因子VIII(FVIII)活性的多肽的密码子优化的基因的慢病毒或AAV载体后21天,血浆FVIII活性相对于施用包含SEQ IDNO:16的参考核酸分子、包含所述参考核酸分子的载体或由所述参考核酸分子编码的多肽的受试者增加至少约10倍。在一些实施方案中,在施用包含编码本文所述的具有因子VIII(FVIII)活性的多肽的密码子优化的基因的质粒后24小时,或在施用包含编码本文所述的具有因子VIII(FVIII)活性的多肽的密码子优化的基因的慢病毒或AAV载体后21天,血浆FVIII活性相对于施用包含SEQ ID NO:16的参考核酸分子、包含所述参考核酸分子的载体或由所述参考核酸分子编码的多肽的受试者增加至少约23倍。在一些实施方案中,在施用包含编码本文所述的具有因子VIII(FVIII)活性的多肽的密码子优化的基因的质粒后24小时,或在施用包含编码本文所述的具有因子VIII(FVIII)活性的多肽的密码子优化的基因的慢病毒或AAV载体后21天,血浆FVIII活性相对于施用包含SEQ ID NO:16的参考核酸分子、包含所述参考核酸分子的载体或由所述参考核酸分子编码的多肽的受试者增加至少约18倍。在一些实施方案中,在施用包含编码本文所述的具有因子VIII(FVIII)活性的多肽的密码子优化的基因的质粒后24小时,或在施用包含编码本文所述的具有因子VIII(FVIII)活性的多肽的密码子优化的基因的慢病毒或AAV载体后21天,血浆FVIII活性相对于施用包含SEQ ID NO:16的参考核酸分子、包含所述参考核酸分子的载体或由所述参考核酸分子编码的多肽的受试者增加至少约30倍。在一些实施方案中,在施用包含编码本文所述的具有因子VIII(FVIII)活性的多肽的密码子优化的基因的质粒后24小时,或在施用包含编码本文所述的具有因子VIII(FVIII)活性的多肽的密码子优化的基因的慢病毒或AAV载体后21天,血浆FVIII活性相对于施用包含SEQ ID NO:16的参考核酸分子、包含所述参考核酸分子的载体或由所述参考核酸分子编码的多肽的受试者增加至少约50倍。在一些实施方案中,在施用包含编码本文所述的具有因子VIII(FVIII)活性的多肽的密码子优化的基因的质粒后24小时,或在施用包含编码本文所述的具有因子VIII(FVIII)活性的多肽的密码子优化的基因的慢病毒或AAV载体后21天,血浆FVIII活性相对于施用包含SEQ ID NO:16的参考核酸分子、包含所述参考核酸分子的载体或由所述参考核酸分子编码的多肽的受试者增加至少约100倍。
本公开还涉及一种治疗、改善或预防受试者的止血病症的方法,所述方法包括施用治疗有效量的本公开的分离的核酸分子或由本公开的核酸分子编码的具有FVIII活性的多肽。由所述分离的核酸分子或所述编码的多肽实现的治疗、改善和预防可以是旁路疗法。接受旁路疗法的受试者可已经发展凝固因子(例如,FVIII)的抑制剂,或是正在发展凝固因子抑制剂的受试者。
本公开的核酸分子、载体或多肽通过促进纤维蛋白凝块的形成来治疗或预防止血病症。由本公开的核酸分子编码的具有FVIII活性的多肽可活化凝固级联的成员。所述凝固因子可以是外在途径、内在途径或两者的参与者。
本公开的核酸分子、载体或多肽可用于治疗已知可用FVIII治疗的止血病症。可使用本公开的方法治疗的止血病症包括但不限于血友病A、血友病B、血管假性血友病、因子XI缺陷(PTA缺陷)、因子XII缺陷以及纤维蛋白原、凝血酶原、因子V、因子VII、因子X或因子XIII的缺陷或结构异常、关节积血、肌肉出血、口腔出血(oral bleed)、出血、出血至肌肉中、口腔出血(oral hemorrhage)、创伤、创伤性头皮炎、胃肠出血、颅内出血、腹腔内出血、胸腔内出血、骨折、中枢神经***出血、咽后间隙出血、腹膜后间隙出血和髂腰肌鞘出血。用于施用于受试者的组合物包括包含编码FVIII凝固因子(用于基因疗法应用)以及FVIII多肽分子的本公开的优化的核苷酸序列的核酸分子。
在一些实施方案中,所述止血病症是遗传病症。在一个实施方案中,所述受试者具有血友病A。在其他实施方案中,所述止血病症是FVIII缺陷的结果。在其他实施方案中,所述止血病症可以是缺陷型FVIII凝固因子的结果。
在另一实施方案中,所述止血病症可以是获得性病症。所述获得性病症可由于潜在的继发疾病或病况而引起。所述无关病况可以是例如但不限于癌症、自身免疫疾病或怀孕。所述获得性病症可由于老年或由于治疗潜在的继发病症的药物治疗(例如,癌症化学疗法)而引起。
本公开还涉及一种治疗未患有止血病症或导致获得止血病症的继发疾病或病况的受试者的方法。本公开因此涉及一种治疗需要一般止血剂的受试者的方法,所述方法包括施用治疗有效量的本公开的分离的核酸分子、载体或FVIII多肽。例如,在一个实施方案中,需要一般止血剂的受试者正在经历或将要经历手术。本公开的分离的核酸分子、载体或FVIII多肽可在手术之前或之后作为预防药施用。本公开的分离的核酸分子、载体或FVIII多肽可在手术期间或之后施用以控制急性出血事件。所述手术可包括但不限于肝移植、肝切除或干细胞移植。
在另一实施方案中,本公开的分离的核酸分子、载体或FVIII多肽可用于治疗患有有止血病症但具有急性出血事件的受试者。所述急性出血事件可由于严重创伤,例如手术、车祸、伤口、撕裂性枪击或导致不受控出血的任何其他创伤性事件而引起。
所述分离的核酸分子、载体或FVIII蛋白可用于预防性治疗具有止血病症的受试者。所述分离的核酸分子、载体或FVIII蛋白可用于治疗具有止血病症的受试者中的急性出血事件。
在另一实施方案中,通过施用本公开的分离的核酸分子或载体实现的FVIII蛋白的表达不会在受试者中诱导免疫反应。在一些实施方案中,所述免疫反应包含针对FVIII的抗体的发展。在一些实施方案中,所述免疫反应包含细胞因子分泌。在一些实施方案中,所述免疫反应包含B细胞、T细胞或B细胞和T细胞两者的活化。在一些实施方案中,所述免疫反应是抑制免疫反应,其中相对于尚未发展免疫反应的受试者中的FVIII活性,所述受试者中的免疫反应会降低FVIII蛋白的活性。在某些实施方案中,通过施用本公开的分离的核酸分子或载体实现的FVIII蛋白的表达会防止针对由所述分离的核酸分子或所述载体表达的FVIII蛋白或FVIII蛋白的抑制免疫反应。
在一些实施方案中,本公开的分离的核酸分子、载体或FVIII蛋白组合物与至少一种促进止血的其他药剂组合施用。所述促进止血的其他药剂是具有经过证明的凝固活性的治疗剂。所述止血剂可包括例如但不限于因子V、因子VII、因子IX、因子X、因子XI、因子XII、因子XIII、凝血酶原或纤维蛋白原或前述任一者的活化形式。所述凝固因子或止血剂也可包括抗纤维蛋白溶解药物,例如ε-氨基-己酸、氨甲环酸。
在本公开的一个实施方案中,所述组合物(例如,所述分离的核酸分子、载体或FVIII多肽)是如下组合物,其中当施用于受试者时,FVIII以可活化形式存在。所述可活化分子可在施用于受试者之后在凝固位点处体内活化。
所述分离的核酸分子、载体或FVIII多肽可静脉内、皮下、肌肉内或经由任何粘膜表面,例如口服、舌下、经颊、舌下、经鼻、经直肠、经***或经由肺途径施用。所述FVIII蛋白可植入生物聚合物固体支撑物内或连接至生物聚合物固体支撑物,所述生物聚合物固体支撑物允许所述嵌合蛋白缓慢释放至所需位点。
关于口服施用,所述药物组合物可采用通过常规手段制备的片剂或胶囊的形式。所述组合物还可制备为液体,例如糖浆或悬浮液。所述液体可包括悬浮剂(例如,山梨醇糖浆、纤维素衍生物或氢化食用脂肪)、乳化剂(卵磷脂或***树胶)、非水性媒剂(例如,杏仁油、油性酯、乙醇或分馏植物油)和防腐剂(例如,对羟基苯甲酸甲酯或对羟基苯甲酸丙酯或山梨酸)。所述制剂还可包括调味剂、着色剂和甜味剂。或者,所述组合物可呈用于以水或另一合适媒剂复原的干燥产品形式提供。
关于经颊和舌下施用,所述组合物可根据常规方案采用片剂、***锭或快速溶解膜的形式。
关于通过吸入施用,根据本公开使用的具有FVIII活性的多肽便利地以来自加压包装或喷雾器的气雾剂喷雾(例如,在PBS中)的形式递送,利用合适的推进剂,例如二氯二氟甲烷、三氯氟甲烷、二氯四氟甲烷、二氧化碳或其他合适气体。在加压气雾剂的情况下,剂量单位可通过提供阀以递送计量的量来测定。例如用于吸入器或吹入器中的明胶的胶囊和筒可配制成含有所述化合物和合适的粉末基质(如乳糖或淀粉)的粉末混合物。
在一个实施方案中,所述分离的核酸分子、载体或FVIII多肽的施用途径是肠胃外。如本文所用,术语肠胃外包括静脉内、动脉内、腹膜内、肌肉内、皮下、直肠或***施用。肠胃外施用的静脉内形式是优选的。虽然清楚地预期所有这些施用形式均在本公开的范围内,但一种施用形式将是用于注射、特别是用于静脉内或动脉内注射或滴注的溶液。通常,用于注射的合适药物组合物可包含缓冲剂(例如,乙酸盐、磷酸盐或柠檬酸盐缓冲液)、表面活性剂(例如,聚山梨醇酯)、任选地稳定剂(例如,人白蛋白)等。然而,在与本文教导可相容的其他方法中,所述分离的核酸分子、载体或FVIII多肽可直接地递送至不良细胞群体的位点,由此增加患病组织的治疗剂暴露。
用于肠胃外施用的制剂包括无菌水溶液或非水溶液、悬浮液和乳液。非水性溶剂的实例是丙二醇、聚乙二醇、植物油(如橄榄油)和可注射有机酯(如油酸乙酯)。水性载体包括水、醇/水溶液、乳液或悬浮液,包括生理盐水和缓冲介质。在本公开中,药学上可接受的载剂包括但不限于0.01-0.1M和优选地0.05M磷酸盐缓冲液或0.8%生理盐水。其他常见肠胃外媒剂包括磷酸钠溶液、林格氏右旋糖、右旋糖和氯化钠、乳酸林格氏或固定油。静脉内媒剂包括流体和营养补充剂、电解质补充剂(如基于林格氏右旋糖的那些)等。防腐剂和其他添加剂也可存在,例如抗微生物剂、抗氧化剂、螯合剂和惰性气体等。
更特定地,适用于可注射用途的药物组合物包括无菌水溶液(其中可溶于水)或分散液和用于无菌可注射溶液或分散液的临时制备的无菌粉末。在所述情况下,所述组合物必须是无菌的并且应具流动性至存在可容易注射性的程度。其应在制造和存储条件下稳定且将优选地针对如细菌和真菌等微生物的污染作用进行防腐处理。载体可以是含有例如水、乙醇、多元醇(例如,甘油、丙二醇和液体聚乙二醇等)和其合适混合物的溶剂或分散介质。适当流动性可例如通过使用涂层(如卵磷脂),在分散液的情况下通过维持所需粒径和通过使用表面活性剂来维持。
微生物作用的预防可通过多种抗细菌剂和抗真菌剂,例如对羟基苯甲酸酯、氯丁醇、苯酚、抗坏血酸、硫柳汞等实现。在多种情况下,在所述组合物中包括例如糖、多元醇(如甘露醇、山梨糖醇)或氯化钠的等渗剂将是优选的。可注射组合物的延长吸收可通过在所述组合物中包括延迟吸收的剂(例如单硬脂酸铝和明胶)来引起。
在任何情况下,无菌可注射溶液可通过在有需要时在适当溶剂中并入所需量的活性化合物(例如,单独或与其他活性剂组合的多肽)与一种本文所列举的成分或成分的组合、随后过滤灭菌来制备。一般地,分散液通过将活性化合物并入无菌媒剂中来制备,所述无菌媒剂含有基础分散介质和来自上文所列举的那些的所需其他成分。在用于制备无菌可注射溶液的无菌粉末的情况下,优选制备方法是真空干燥和冷冻干燥,其会生成活性成分加上来自其先前无菌过滤的溶液的任何另外所需成分的粉末。根据本领域中已知的方法,用于注射的制剂经过加工,填充至如安瓿、袋、瓶、注射器或小瓶等容器中,并且在无菌条件下密封。此外,所述制剂可以试剂盒的形式包装并且出售。所述制品将优选地具有标签或包装插页,指示出相关组合物适用于治疗患有或倾向于患有凝固病症的受试者。
所述药物组合物还可配制用于以栓剂或保留灌肠形式直肠施用,例如含有常规栓剂基质,如可可脂或其他甘油酯。
用于病况的治疗的本公开组合物的有效剂量视多种不同因素而变化,所述因素包括施用方式、靶标位点、患者的生理学状态、患者是人或动物、所施用的其他药物和治疗是预防性的或治疗性的。通常,患者是人,但包括转基因动物在内的非人哺乳动物也可进行治疗。治疗剂量可使用本领域技术人员已知的常规方法来滴定以优化安全性和功效。
关于施用包含编码如本文所述的具有因子VIII(FVIII)活性的多肽的密码子优化的基因的质粒或由所述密码子优化的基因编码的多肽的剂量可介于1000ug/kg至0.1ng/kg体重范围内。在一个实施方案中,给药范围是1ug/kg至100ug/kg。关于施用包含编码如本文所述的具有因子VIII(FVIII)活性的多肽的密码子优化的基因的慢病毒载体的剂量可介于103至1015TU/kg范围内。关于施用包含编码如本文所述的具有因子VIII(FVIII)活性的多肽的密码子优化的基因的AAV载体的剂量可介于105至1018VG/kg范围内。
所述分离的核酸分子、质粒、载体或FVIII多肽可作为单一剂量或作为多个剂量施用,其中所述多个剂量可连续地或以特定定时的时间间隔施用。体外测定可用于测定关于施用的最佳剂量范围和/或方案。本领域中已知测量凝固因子活性的体外测定。另外,有效剂量可从获自动物模型,例如血友病狗(Mount等人2002,Blood 99(8):2670)的剂量-反应曲线推断。
在上述范围中间的剂量也预期在本公开的范围内。受试者可每天、隔天、每周或根据通过经验分析确定的任何其他方案施用所述剂量。示例性治疗需要在例如至少六个月的一段延长时期内以多个剂量施用。在一些方法中,可同时施用两种或更多种多肽,在所述情况下所施用的各多肽的剂量属于所指示的范围内。
本公开的分离的核酸分子、载体或FVIII多肽可在多个场合施用。单一剂量之间的时间间隔可为每天、每周、每个月或每年。时间间隔也可以是不规则的,如通过测量患者中经过修饰的多肽或抗原的血液水平所指示。或者,多肽可以持续释放制剂形式施用,在所述情况下需要不太频繁施用。剂量和频率视所述多肽或多核苷酸在患者中的半衰期而变化。
施用的剂量和频率可视治疗是预防性的或治疗性的而变化。在预防性应用中,含有所述分离的核酸分子、载体或FVIII多肽或其混合物的组合物施用于尚未呈疾病状态的患者以增强所述患者的抗性或最小化疾病的效应。所述量被定义为“预防有效剂量”。在很长一段时期内,相对低剂量以相对不频繁时间间隔施用。一些患者在其余生中继续接受治疗。
本公开的分离的核酸分子、载体或FVIII多肽可任选地与有效治疗需要治疗(例如,预防性或治疗性)的病症或病况的其他剂组合施用。
如本文所用,本公开的分离的核酸分子、载体或FVIII多肽与辅助疗法结合或组合施用意指所述疗法和所公开的多肽的连续、同时、同延、并发、伴随或同时期施用或应用。本领域技术人员应理解,所述组合治疗方案的多种组分的施用或应用可定时以增强所述治疗的总体有效性。熟练技术人员(例如,医师)将基于所选择的辅助疗法和本说明书的教导容易地能够辨别有效的组合治疗方案而无不当实验。
应进一步理解,本公开的分离的核酸分子、载体或FVIII多肽可与一种或多种剂结合或组合使用(例如,以提供组合治疗方案)。可与本公开的多肽或多核苷酸组合的示例性剂包括代表针对所治疗的特定病症的现行护理标准的剂。所述剂本质上可以是化学的或生物的。术语“生物”或“生物剂”是指由活的生物体和/或其产品制得的任何药物活性剂,所述药物活性剂预期用作治疗剂。
欲与本公开的多核苷酸或多肽组合使用的剂的量可随受试者而变化或可根据本领域中已知来施用。参见例如Bruce A Chabner等人,Antineoplastic Agents,GOODMAN&GILMAN’S THE PHARMACOLOGICAL BASIS OF THERAPEUTICS 1233-1287((Joel G.Hardman等人编,第9版1996)。在另一实施方案中,施用与所述护理标准一致的量的所述剂。
如先前所论述,本公开的多核苷酸和多肽可以针对凝固病症的体内治疗的药物有效量施用。在这方面,应理解本公开的多肽或多核苷酸可经过配制以促进活性剂的施用并且促进活性剂的稳定性。优选地,根据本公开的药物组合物包含药学上可接受、无毒、无菌载体,如生理盐水、无毒缓冲液、防腐剂等。当然,本公开的药物组合物可以单一或多个剂量施用以提供药物有效量的所述多肽。
多种测试可用于评估凝固***的功能:活化部分凝血酶原时间(aPTT)测试、发色测定、
Figure BDA0001814810910001381
测定、凝血酶原时间(PT)测试(还用于测定INR)、纤维蛋白原测试(通常通过Clauss方法)、血小板计数、血小板功能测试(通常通过PFA-100)、TCT、出血时间、混合测试(异常性纠正患者的血浆是否与正常血浆混合)、凝固因子测定、抗磷脂抗体、D-二聚体、基因测试(例如,因子V Leiden、凝血酶原突变G20210A)、稀释印度蝰蛇毒液时间(dRVVT)、杂项血小板功能测试、血栓弹力描记术(TEG或Sonoclot)、血栓弹力图试验(
Figure BDA0001814810910001382
例如
Figure BDA0001814810910001383
)或优球蛋白溶解时间(ELT)。
所述aPTT测试是量度“内在”(还称作接触活化途径)和共同凝固途径两者的功效的性能指示剂。这种测试通常用于测量市面上有售的重组凝固因子(例如,FVIII或FIX)的凝固活性。其与凝血酶原时间(PT)结合使用,所述凝血酶原时间(PT)测量外在途径。
Figure BDA0001814810910001384
分析提供关于止血法的整体动力学的信息:凝固时间、凝块形成、凝块稳定性和溶解。血栓弹力图试验中的不同参数取决于血浆凝固***的活性、血小板功能、纤维蛋白溶解或影响这些相互作用的多种因素。这种测定可提供二期止血的完整视图。
基因疗法
本公开提供一种增加具有FVIII活性的多肽在受试者中的表达的方法,所述方法包括向有需要的受试者施用本公开的分离的核酸分子,其中所述多肽的表达相对于包含SEQ ID NO:16的参考核酸分子增加。本公开还提供一种增加具有FVIII活性的多肽在受试者中的表达的方法,所述方法包括向有需要的受试者施用本公开的载体,其中所述多肽的表达相对于包含参考核酸分子的载体增加。
已经探索体细胞基因疗法作为血友病A的可能治疗。基因疗法是血友病的特别引人注意的治疗,因为其可能通过在载体的单一施用之后连续内源产生FVIII来治愈所述疾病。血友病A充分适用于基因置换方法,因为其临床显现完全可归因于以微量(200ng/ml)在血浆中循环的单一基因产物(FVIII)的缺乏。
本公开的FVIII蛋白可在哺乳动物(例如,人患者)中体内产生,使用基因疗法方法来治疗选自由以下组成的组的出血疾病或病症将是治疗上有益的:出血性凝固病症、关节积血、肌肉出血、口腔出血(oral bleed)、出血、出血至肌肉中、口腔出血(oralhemorrhage)、创伤、创伤性头皮炎、胃肠出血、颅内出血、腹腔内出血、胸腔内出血、骨折、中枢神经***出血、咽后间隙出血、腹膜后间隙出血和髂腰肌鞘出血。在一个实施方案中,所述出血疾病或病症是血友病。在另一实施方案中,所述出血疾病或病症是血友病A。这涉及施用可操作性连接至合适的表达控制序列的优化的FVIII编码核酸。在某些实施方案中,这些序列并入至病毒载体中。用于所述基因疗法的合适病毒载体包括腺病毒载体、慢病毒载体、杆状病毒载体、Epstein Barr病毒载体、乳多空病毒载体、牛痘病毒载体、单纯疱疹病毒载体和腺相关病毒(AAV)载体。所述病毒载体可以是复制缺陷型病毒载体。在其他实施方案中,腺病毒载体在其E1基因或E3基因中具有缺失。在其他实施方案中,所述序列并入至本领域技术人员已知的非病毒载体中。
本文所述的多个方面、实施方案和选项均可以任何和所有变化组合。
本说明书中提及的所有公布、专利和专利申请均以引用的方式并入,其并入程度就如同各个别公布、专利或专利申请特定地并且个别地经指示以引用的方式并入一般。
已经一般地描述了本公开,可通过参考本文所提供的实施例获得进一步理解。这些实施例仅出于说明目的并且不意图具限制性。
实施例
实施例1.密码子优化策略
通过控制密码子使用偏好产生了八种密码子优化的BDD FVIII变体,包括coFVIII-3(SEQ ID NO:1;图1A)、coFVIII-4(SEQ ID NO:2;图1B)、coFVIII-5(SEQ ID NO:70;图1C)、coFVIII-6(SEQ ID NO:71;图1D)、coFVIII-52(SEQ ID NO:3;图1E)、coFVIII-62(SEQ ID NO:4;图1F)、coFVIII-25(SEQ ID NO:5;图1G)和coFVIII-26(SEQ ID NO:6;图1H)。使用在线工具Eugene来促进密码子优化,如先前所述(参见Gaspar等人,“EuGene:maximizing synthetic gene design for heterologous expression,”Bioinformatics28:2683-84(2012)),并且监测数种密码子使用参数,如密码子适应指数(CAI)和相对同义密码子使用(RSCU)(表5)。所有变体均调整至CAI≥83%并且RSCU≥1.63,而亲本B结构域缺失的FVIII序列在优化之前的CAI为74%并且RSCU为1.12(表5)。
表5:密码子优化参数
Figure BDA0001814810910001401
Figure BDA0001814810910001411
相对于非优化的BDD FVIII序列(图2A),除了所述CAI的总体增加以外,所述八种变体还基于如图2中所说明的CAI在编码区中的分布被设计成三个类别。第一个类别包含在整个编码区中具有高CAI的平均分布的BDD FVIII变体(参见图2C至图2F)。第一个类别包括coFVIII-3(图2C)、coFVIII-4(图2D)、coFVIII-5(图2E)、coFVIII-6(图2F),以及先前描述的coFVIII-1(参见国际公布号WO 2014/127215(SEQ ID NO:1))(图2B)。第二个类别包含在所述编码序列的N端半段处具有较低CAI并且在所述编码序列的C端半段处具有较高CAI的BDD-FVIII变体(参见图2G和图2H)。第二个类别包括coFVIII-52(图2G)和coFVIII-62(图2H)。第三个类别包含在所述编码序列的N端半段处具有较高CAI并且在所述编码序列的C端半段处具有较低CAI的BDD FVIII变体(参见图2I和图2J)。第三个类别包括coFVIII-25(图2I)和coFVIII-26(图2J)。
不受任何理论束缚,推测较高CAI可能与较快蛋白质翻译有关,并且这三种类别可能代表从开始至结束的不同蛋白质合成速率。例如,具有较低CAI的区的翻译可能相对于具有较高CAI的区的翻译缓慢地进行。假如这样的话,例如具有较低CAI的coFVIII-52或coFVIII-62的N端半段的翻译可能最初缓慢地进行,随后具有较高CAI的C端半段更快翻译。这可能优选用于翻译期间的蛋白质折叠和翻译后修饰,而不会减慢总体蛋白质合成。关于coFVIII-25和coFVIII-26变体可见相反效应,所述变体在N端半段处具有较高CAI并且在C端半段处具有较低CAI。
为了确保mRNA的稳定性,所有FVIII密码子优化的变体均经过调整以避免包括隐蔽剪接位点、过早polyA位点、RNA不稳定基序(ARE)和重复序列在内的多个位点,和调整GC含量(参见表2)。
实施例2.从pcDNA3质粒克隆和表达coFVIII变体
针对体内表达设计含有多种FVIII变体的表达质粒。将非优化BDD FVIII(图1I;SEQ ID NO:16)和coFVIII-1(图11Z;SEQ ID NO:68)多核苷酸克隆至pcDNA3骨架(Invitrogen)中,其中CMV启动子由ET启动子置换(参见图3)。所得质粒FVIII-311(BDDFVIII)和FVIII-303(coFVIII-1)分别地驱动非优化BDD FVIII和coFVIII-1的表达。
在Hem A小鼠中通过FVIII-303或FVIII-311的流体动力学注射(5μg DNA/小鼠)来评估FVIII-311和FVIII-303的体内表达。在注射后24、48和72小时收集血浆样品,并且通过FVIII特异性发色测定来测定FVIII活性。
如图4所示,用FVIII-311(BDD FVIII;正方形)治疗的小鼠的血浆FVIII活性在注射后72小时为74±43mU/mL,而用FVIII-303(coFVIII-1;圆形)治疗的小鼠的血浆FVIII活性在注射后72小时为452±170mU/mL(图4)。这代表coFVIII-1的表达相对于非优化BDDFVIII增加大概六倍。
实施例3.使用慢病毒载体***克隆和表达coFVIII变体
为了进一步评估密码子优化的BDD FVIII变体的表达水平,在ET启动子的控制下将编码序列克隆至慢病毒质粒中(参见Amendola等人,“Coordinate dual-genetransgenesis by lentiviral vectors carrying synthetic bidirectionalpromoters,”Nature Biol.23:108-16(2005);国际公布号WO 2000/066759 A1)。pLV-coFVIII-52的质粒图显示于图5中;并且含有非优化BDD FVIII(LV-2116)、coFVIII-1(LV-coFVIII-1)、coFVIII-3(LV-coFVIII-3)、coFVIII-4(LV-coFVIII-4)、coFVIII-5(LV-coFVIII-5)和coFVIII-6(LV-coFVIII-6)、coFVIII-62(LV-coFVIII-62)、coFVIII-25(LV-coFVIII-25)和coFVIII-26(LV-coFVIII-26)的质粒以相同方式构建,除了coFVIII-52片段由每一个所指示的编码序列使用NheI和SalI位点置换(表6)。
表6:编码FVIII变体的表达质粒
Figure BDA0001814810910001431
在HemA小鼠中通过以5μg DNA/小鼠(图6A、图6B)或20μg DNA/小鼠(图6C)的剂量进行流体动力学注射来评估慢病毒密码子优化的FVIII变体。如图6所示,coFVIII-3(图6A;三角形)、coFVIII-4(图6A;倒三角形)、coFVIII-5(图6A;菱形)、coFVIII-6(图6A;空心圆形)、coFVIII-25(图6B;三角形)、coFVIII-26(图6B;倒三角形)、coFVIII-52(图6C;正方形)和coFVIII-62(图6C;实心圆形)中的每一者均展现高于coFVIII-1(图6A,圆形;图6B,圆形;和图6C,三角形)的FVIII活性。特别地,coFVIII-25和coFVIII-26在注射后72小时展现相似的表达水平,达到比coFVIII-1的活性高约3倍的活性(图6B),与非优化、亲本BDD FVIII相比,所述活性翻译成高24倍的FVIII活性(参见图4)。coFVIII-52(正方形)和coFVIII-62(实心圆形)均在注射后72小时实现甚至更高的表达,分别展现比coFVIII-1(三角形)高6倍和4倍的表达,并非分别展现比非优化、亲本BDD FVIII(空心圆形)高50倍和30倍的表达(图6C)。这些数据指示,在编码序列的N端半段处的较低CAI和在编码序列的C端半段处的较高CAI的组合如与CAI的反向分布相比可能更有益于FVIII表达。
实施例4:HemA小鼠中密码子优化的FVIII变体的长期慢病毒表达
针对通过慢病毒载体介导的基因转移实现的长期FVIII表达,评估经过鉴别驱动在流体动力学注射后72小时HemA小鼠中FVIII的高表达的变体。慢病毒载体通过短暂转染在293T细胞中产生并且通过超离心浓缩至约5E9TU/ml。所述慢病毒载体接着通过眶后注射以1E8TU/小鼠的剂量施用于12-14日龄的HemA小鼠。在慢病毒注射后21天,注射LV-2116(BDD FVIII;图7)的小鼠的平均血浆FVIII活性是约0.04IU/ml。在注射后21天,相对于LV-2116(非优化B结构域缺失的FVIII)对照,coFVIII-1、coFVIII-5、coFVIII-52、coFVIII-6和coFVIII-62中的每一者均导致较高循环FVIII水平。特别地,在注射后21天,coFVIII-1和coFVIII-5注射会产生约1.8IU/mL的FVIII血浆活性水平,coFVIII-52会产生约4.9IU/mL的FVIII血浆活性水平,coFVIII-6会产生约4.6IU/mL的FVIII血浆活性水平,并且coFVIII-62会产生约2.5IU/mL的FVIII血浆活性水平(图7)。在注射LV-coFVIII-6和LV-coFVIII-52(分别为4.6IU/ml和4.9IU/ml)的小鼠中观察到的FVIII血浆水平比注射LV-2116(非优化BDD-FVIII)对照的小鼠中观察到的血浆水平高超过100倍。
实施例5.coFVIII-XTEN融合构建体
测试XTEN改进稳态FVIII表达的能力。首先,将144个氨基酸的XTEN的编码序列(“XTEN144”;SEQ ID NO:18)分别***coFVIII-52和coFVIII-1的核苷酸1193处(或在编码多肽的最初764个氨基酸之后)以产生coFVIII-52-XTEN(图8A;SEQ ID NO:19)和coFVIII-1-XTEN(图8B;SEQ ID NO:20)。所述coFVIII-1-XTEN序列接着在如上文所述的ET启动子的控制下克隆至pcDNA3骨架(Invitrogen)中,以产生FVIII-306表达质粒;并且所述coFVIII-52-XTEN序列在如上文所公开的ET启动子的控制下克隆至慢病毒质粒中,以产生pLV-coFVIII-52-XTEN(图9)。FVIII-306(coFVIII-1-XTEN)通过流体动力学注射以5μg DNA/小鼠施用于HemA小鼠。如与FVIII-303(coFVIII-1;图10A,小圆形)和FVIII-311(BDD FVIII;图10A,正方形)相比,XTEN144融合至coFVIII-1(FVIII-306;图10A,大圆形)会在注射后72小时时在HemA小鼠中分别引起约5倍和33倍高的FVIII表达。XTEN***对FVIII表达的影响也在HemA小鼠中使用慢病毒载体来评估(图10B)。LV-coFVIII-52-XTEN通过眶后注射以1E8TU/小鼠施用于12-14日龄的HemA小鼠。如与LV-coFVIII52和LV-2116(BDD-FVIII)相比,XTEN144融合至coFVIII-52(图10B)会在注射后21天时在HemA小鼠中分别引起约4倍和450倍高的FVIII表达。
包含融合至XTEN144并且融合至ET启动子的coFVIII-3、co-FVIII-4、coFVIII-5、coFVIII-6、coFVIII-62、coFVIII-25和coFVIII-26中的每一者的慢病毒载体将如上文所述进行制备。所述载体将针对其FVIII蛋白表达进行测试。
实施例6.coFVIII构建体的表达
通过标准分子克隆技术将密码子优化的FVIII变体克隆至如图9所说明的慢病毒质粒中。慢病毒载体接着通过短暂转染在HEK293细胞中产生并且通过超离心分离。
将FVIII慢病毒载体通过静脉内注射以1.5E10TU/kg LV-FVIII变体的剂量施用于14日龄的HemA小鼠幼崽。在LV-FVIII治疗后第21天测量FVIII血浆活性,并且在LV-FVIII治疗后第150天在从LV-FVIII治疗的动物收集的肝尸检样品中测量每个细胞的载体拷贝数(VCN)。虽然VCN值在所有动物中均相似而与所施用的LV-FVIII变体无关(图12B),但用coFVIII变体治疗的动物中的FVIII活性水平比用wtBDD-FVIII治疗的动物中高30至100倍(图12A和图12C;表7)。这些数据指示,FVIII密码子优化会改进慢病毒载体设置中的FVIII表达。
表7:密码子优化的FVIII构建体的相对表达
Figure BDA0001814810910001461
实施例7.在慢病毒治疗后HemA小鼠中的FVIII转基因表达介导的免疫反应
针对长期FVIII表达和抗FVIII抗体形成,评估实施例6的LV-FVIII治疗的小鼠。如通过FVIII血浆活性证明的FVIII表达在同一治疗组内的动物之间变化(图13A)。例如,用表达coFVIII-5变体的慢病毒载体治疗的三只小鼠(指定1、2和3)在大约16周内显示一致的FVIII表达,而用相同慢病毒载体治疗的三只同窝出生小鼠(指定4、5和6)在治疗后约10周显示FVIII血浆活性水平的急剧下降(图13A)。在小鼠1、2和3中观察到的一致的FVIII血浆活性与不可检测或极低水平的抗FVIII抗体相关(图13B;小鼠1、2和3)。相反,展现FVIII血浆活性的急剧下降的小鼠还展现抗FVIII抗体的增加的水平(图13B;小鼠4、5和6)。这些数据表明,FVIII转基因表达会在一小组动物中诱导抗FVIII抗体形成,并且所得的抗FVIII抗体从循环中消除转基因FVIII蛋白。
评估FVIII表达与抗FVIII抗体形成之间的关系。将实施例6的LV-FVIII治疗的小鼠分成两组:呈抗FVIII抗体阴性的小鼠和呈抗FVIII抗体阳性的小鼠。如图14所示,转基因FVIII在生理学水平下的表达不会诱导对转基因FVIII的免疫反应(图14,圆形)然而,超生理水平的FVIII表达看来诱导抗FVIII抗体形成,以致FVIII表达水平越高,抗FVIII抗体形成的机会越高。这些数据表明,在经受FVIII基因疗法治疗的患者中维持FVIII表达的生理水平看来是有益的。
为了确定FVIII表达诱导的免疫反应是否导致转基因表达肝细胞的损失,在来自抗FVIII抗体阳性和阴性小鼠的肝尸检样品中评估载体拷贝数(图15)和FVIII RNA转录水平(图16)。如图15所示,抗FVIII抗体阳性和阴性小鼠中的载体拷贝数的分布是相同的,指示尽管发展抗FVIII抗体,仍维持具有LV-FVIII整合的细胞。这表明LV-FVIII介导的FVIII转基因表达不会诱导针对FVIII表达肝细胞的细胞毒性T淋巴细胞(CTL)反应。为了进一步确认这些结果,通过RNA原位杂交评估FVIII RNA转录(图16C和图16D)。在肝收集时,小鼠coFVIII-52-B不具有可检测的循环FVIII和高水平的抗FVIII抗体(图16A和图16B)。然而,来自coFVIII-52-B小鼠的肝组织中的RNA转录信号和FVIII-RNA阳性细胞的数目可与FVIII-52-A小鼠相当,所述FVIII-52-A小鼠在尸检时具有约4IU/ml的循环FVIII。因此,FVIII表达不会在实验HemA小鼠中诱导CTL反应。
实施例8.LV-FVIII治疗的HemA新生小鼠中的FVIII长期表达
为了评估使用慢病毒***通过靶向肝来治疗儿科HemA患者的功效,通过太阳穴静脉注射向2日龄的HemA小鼠施用约1.5E10TU/kg的LV-coFVIII-52XTEN、LV-coFVIII6-XTEN或表达wtBDD-FVIII的慢病毒载体。对于变体和对照两者观察到一致的长期FVIII表达,证明了在经过治疗的小鼠的***的肝细胞中维持了整合的FVIII表达级联(图17)。这些数据表明,LV-FVIII可能潜在地用于治疗儿科和成年HemA患者。
实施例9.HemA新生狗中的LV-FVIII的评估
为了进一步评估LV-FVIII在较大动物模型中的功效,通过静脉内注射向两只一周龄的HemA新生狗(指定S3和K4)施用1.3×109 TU/kg LV-coFVIII-6-XTEN。这一剂量比先前用于HemA小鼠模型中的剂量低超过10倍。在施用所述慢病毒载体之后,通过一期凝固测定(aPTT)监测血浆FVIII活性(图18)并且通过旋转式血栓弹力描记(ROTEM)测定监测全血止血(图19A至图19D)。在LV-FVIII治疗之前,针对S3的FVIII水平是正常值的0.7%(图18)。在慢病毒载体治疗后,S3的FVIII水平在第7天和第14天分别增加至79%和103%(图18)。关于K4,施用前FVIII水平是正常值的1.4%(图18)。在慢病毒载体治疗后,FVIII水平在第6天和第14天分别增加至22%和25%(图18)。
与FVIII水平相关,在治疗后2周对于两只动物均观察到标准化ROTEM(图19A至图19C),证明由LV-FVIII介导的治疗益处。HemA狗中由LV-FVIII实现的治疗有益的FVIII表达水平确认了LV-FVIII用于血友病A的治疗的潜在用途。
实施例10.HemA新生小鼠中的LV-FVIII的评估
用于基因置换的使用慢病毒载体(LV)的离体基因疗法已经证明了针对多种适应症的临床功效并且在经过治疗的患者中的多年随访未显示肿瘤发生的迹象。LV-FIX的全身性递送会介导持续的FIX表达并且在血友病动物模型中经充分耐受。大的包装能力、经由基因整合维持长期转基因表达的能力、人群体中已存在的抗LV抗体(ab)的缺乏和在临床前和临床情形中证明的鼓舞人心的体内概况使LV成为用于体内基因递送、尤其用于具有大cDNA尺寸的基因候选物(如FVIII)的有希望的媒剂。
为了评估LV-FVIII用于治疗血友病A(HemA)的潜在用途,使置于肝细胞特异性启动子下的密码子优化的人FVIII(hFVIII)变体成为LV***的一部分,所述LV***含有微RNA-142靶标序列的多个拷贝以最小化抗原递呈细胞中的FVIII表达并且降低诱导性抗FVIII抗体的概率。通过293T细胞的短暂转染产生LV-hFVIII载体,随后通过超离心进行1000倍浓缩并且在HemA小鼠模型中进行评估。在LV-hFVIII的静脉内施用后,通过FVIII活性和抗原测定监测循环hFVIII水平,通过经由定量PCR测量LV DNA拷贝并且经由原位杂交测量转基因RNA来评估肝中的LV转导效率,通过总抗hFVIII抗体ELISA测量抗hFVIII抗体。
针对在新生阶段经过治疗的HemA小鼠中的所有LV-hFVIII变体,观察到持续的FVIII表达。在1.5E10转导单位/kg的剂量下,LV编码密码子优化的hFVIII(LV-cohFVIII)引起比LV编码野生型hFVIII高30倍至100倍的循环FVIII(图12C),而肝细胞中的载体拷贝数和FVIII RNA阳性细胞的百分比在所有测试的组中可相当(图12B)。密码子优化与XTEN的组合(LV-cohFVIII-XTEN)是一种非结构化亲水性多肽,据推测其通过增加有效负荷的流体动力学尺寸来改进循环半衰期,所述组合在血浆中产生30-50IU/mL FVIII活性,代表正常循环FVIII水平的3,000-5,000%(图12A、图17)。此外,仅在具有超生理水平的hFVIII的小鼠中检测到抗hFVIII ab(图14),而在抗hFVIII抗体阳性小鼠中未观察到针对LV诱导细胞的细胞毒性T淋巴细胞反应(图15和图16A至图16D)。我们的结果支持用于血友病A的体内基因疗法的LV-FVIII的进一步发展。
特定实施方案的前述描述将充分地揭露本公开的一般性质,使得其他人可通过应用在本领域的技术内的知识容易地针对多种应用来修改和/或改编所述特定实施方案,而无不当实验,不偏离本公开的一般概念。因此,基于本文所提供的教导和指导,所述改变和修改意图在所公开的实施方案的相等物的含义和范围内。应理解,本文中的措辞或术语是出于描述而非限制的目的,以致本说明书的术语或措辞欲由熟练技术人员根据所述教导和指导来解释。
本公开的其他实施方案将由本领域技术人员通过考虑本文所公开的公开的说明书和实践显而易知。预期所述说明书和实施例仅被视为示例性的,本公开的真实范围和精神由以下权利要求指示。
本文所引用的所有专利和公布均以引用的方式整体并入本文中。
本申请要求2016年2月1日提交的美国临时申请号62/289,696和2016年10月18日提交的美国临时申请号62/409,739的优先权权益,所述美国临时申请以引用的方式整体并入本文中。
序列表
<110> 比奥贝拉蒂治疗公司(BIOVERATIV THERAPEUTICS INC.)
<120> 优化的因子VIII基因
<130> 2159.469PC02
<150> 62/409,739
<151> 2016-10-18
<150> 62/289,696
<151> 2016-02-01
<160> 103
<170> PatentIn 3.5版
<210> 1
<211> 4374
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-3
<400> 1
atgcagattg agctgtccac ttgtttcttc ctgtgcctcc tgcgcttctg tttctccgcc 60
actcgccggt actaccttgg agccgtggag ctttcatggg actacatgca gagcgacctg 120
ggcgaactcc ccgtggatgc cagattcccc ccccgcgtgc caaagtcctt cccctttaac 180
acctccgtgg tgtacaagaa aaccctcttt gtcgagttca ctgaccacct gttcaacatc 240
gccaagccgc gcccaccttg gatgggcctc ctgggaccga ccattcaagc tgaagtgtac 300
gacaccgtgg tgatcaccct gaagaacatg gcgtcccacc ccgtgtccct gcatgcggtc 360
ggagtgtcct actggaaggc ctccgaagga gctgagtacg acgaccagac tagccagcgg 420
gaaaaggagg acgataaagt gttcccgggc ggctcgcata cttacgtgtg gcaagtcctg 480
aaggaaaacg gacctatggc atccgatcct ctgtgcctga cttactccta cctttcccat 540
gtggacctcg tgaaggacct gaacagcggg ctgattggtg cacttctcgt gtgccgcgaa 600
ggttcgctcg ctaaggaaaa gacccagacc ctccataagt tcatcctttt gttcgctgtg 660
ttcgatgaag gaaagtcatg gcattccgaa actaagaact cgctgatgca ggaccgggat 720
gccgcctcag cccgcgcctg gcctaaaatg catacagtca acggatacgt gaatcggtca 780
ctgcccgggc tcatcggttg tcacagaaag tccgtgtact ggcacgtcat cggcatgggc 840
actacgcctg aagtgcactc catcttcctg gaagggcaca ccttcctcgt gcgcaaccac 900
cgccaggcct ctctggaaat ctccccgatt acctttctga ccgcccagac tctgctcatg 960
gacctggggc agttccttct cttctgccac atctccagcc atcagcacga cggaatggag 1020
gcctacgtga aggtggactc atgcccggaa gaacctcagt tgcggatgaa gaacaacgag 1080
gaggccgagg actatgacga cgatttgact gactccgaga tggacgtcgt gcggttcgat 1140
gacgacaaca gccccagctt catccagatt cgcagcgtgg ccaagaagca ccccaaaacc 1200
tgggtgcact acatcgcggc cgaggaagaa gattgggact acgccccgtt ggtgctggca 1260
cccgatgacc ggtcgtacaa gtcccagtat ctgaacaatg gtccgcagcg gattggcaga 1320
aagtacaaga aagtgcggtt catggcgtac actgacgaaa cgtttaagac ccgggaggcc 1380
attcaacatg agagcggcat tctgggacca ctgctgtacg gagaggtcgg cgataccctg 1440
ctcatcatct tcaaaaacca ggcctcccgg ccttacaaca tctaccctca cggaatcacc 1500
gacgtgcggc cactctactc gcggcgcctg ccgaagggcg tcaagcacct gaaagacttc 1560
cctatcctgc cgggcgaaat cttcaagtat aagtggaccg tcaccgtgga ggacgggccc 1620
accaagagcg atcctaggtg tctgactcgg tactactcca gcttcgtgaa catggaacgg 1680
gacctggcat cgggactcat tggaccgctg ctgatctgct acaaagagtc ggtggatcaa 1740
cgcggcaacc agatcatgtc cgacaagcgc aacgtgatcc tgttctccgt gtttgatgaa 1800
aacagatcct ggtacctcac tgaaaacatc cagaggttcc tcccaaaccc cgcaggagtg 1860
caactggagg accctgagtt tcaggcctcg aatatcatgc actcgattaa cggttacgtg 1920
ttcgactcgc tgcagctgag cgtgtgcctc catgaagtcg cttactggta cattctgtcc 1980
atcggcgccc agactgactt cctgagcgtg ttcttttccg gttacacctt taagcacaag 2040
atggtgtacg aagataccct gaccctgttc cctttctccg gcgaaacggt gttcatgtcg 2100
atggagaacc cgggtctgtg gattctggga tgccacaaca gcgactttcg gaaccgcgga 2160
atgactgccc tgctgaaggt gtcctcatgc gacaagaaca ccggagacta ctacgaggac 2220
tcctacgagg atatctcagc ctacctcctg tccaagaaca acgcgatcga gccgcgcagc 2280
ttcagccaga acccgcctgt gctgaagagg caccagcgag aaattacccg gaccaccctc 2340
caatcggatc aggaggaaat cgactacgac gacaccatct cggtggaaat gaagaaggaa 2400
gatttcgata tctacgacga ggacgaaaat cagtcccctc gctcattcca aaagaaaact 2460
agacactact ttatcgccgc ggtggaaaga ctgtgggact atggaatgtc atccagccct 2520
cacgtccttc ggaaccgggc ccagagcgga tcggtgcctc agttcaagaa agtggtgttc 2580
caggagttca ccgacggcag cttcacccag ccgctgtacc ggggagaact gaacgaacac 2640
ctgggcctgc tcggtcccta catccgcgcg gaagtggagg ataacatcat ggtgaccttc 2700
cgtaaccaag catccagacc ttactccttc tattcctccc tgatctcata cgaggaggac 2760
cagcgccaag gcgccgagcc ccgcaagaac ttcgtcaagc ccaacgagac taagacctac 2820
ttctggaagg tccaacacca tatggccccg accaaggatg agtttgactg caaggcctgg 2880
gcctacttct ccgacgtgga ccttgagaag gatgtccatt ccggcctgat cgggccgctg 2940
ctcgtgtgtc acaccaacac cctgaaccca gcgcatggac gccaggtcac cgtccaggag 3000
tttgctctgt tcttcaccat ttttgacgaa actaagtcct ggtacttcac cgagaatatg 3060
gagcgaaact gtagagcgcc ctgcaatatc cagatggaag atccgacttt caaggagaac 3120
tatagattcc acgccatcaa cgggtacatc atggatactc tgccggggct ggtcatggcc 3180
caggatcaga ggattcggtg gtacttgctg tcaatgggat cgaacgaaaa cattcactcc 3240
attcacttct ccggtcacgt gttcactgtg cgcaagaagg aggagtacaa gatggcgctg 3300
tacaatctgt accccggggt gttcgaaact gtggagatgc tgccgtccaa ggccggcatc 3360
tggagagtgg agtgcctgat cggagagcac ctccacgcgg ggatgtccac cctcttcctg 3420
gtgtactcga ataagtgcca gaccccgctg ggcatggcct cgggccacat cagagacttc 3480
cagatcacag caagcggaca atacggccaa tgggcgccga agctggcccg cttgcactac 3540
tccggatcga tcaacgcatg gtccaccaag gaaccgttct cgtggattaa ggtggacctc 3600
ctggccccta tgattatcca cggaattaag acccagggcg ccaggcagaa gttctcctcc 3660
ctgtacatct cgcaattcat catcatgtac agcctggacg ggaagaagtg gcagacttac 3720
aggggaaact ccaccggcac cctgatggtc tttttcggca acgtggattc ctccggcatt 3780
aagcacaaca tcttcaaccc accgatcata gccagatata ttaggctcca ccccactcac 3840
tactcaatcc gctcaactct tcggatggaa ctcatggggt gcgacctgaa ctcctgctcc 3900
atgccgttgg ggatggaatc aaaggctatt agcgacgccc agatcaccgc gagctcctac 3960
ttcactaaca tgttcgccac ctggagcccc tccaaggcca ggctgcactt gcagggacgg 4020
tcaaatgcct ggcggccgca agtgaacaat ccgaaggaat ggcttcaagt ggatttccaa 4080
aagaccatga aagtgaccgg agtcaccacc cagggagtga agtcccttct gacctcgatg 4140
tatgtgaagg agttcctgat tagcagcagc caggacgggc accagtggac cctgttcttc 4200
caaaacggaa aggtcaaggt gttccagggg aaccaggact cgttcacacc cgtggtgaac 4260
tccctggacc ccccactgct gacgcggtac ttgaggattc atcctcagtc ctgggtccat 4320
cagattgcat tgcgaatgga agtcctgggc tgcgaggccc aggacctgta ctga 4374
<210> 2
<211> 4374
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-4
<400> 2
atgcagatcg agctgagcac gtgcttcttc ctgtgcctgc tgaggttctg cttcagcgcc 60
accaggaggt actacctggg cgccgtggag ctgagctggg actacatgca gagcgacctg 120
ggcgagctgc ccgtggacgc caggttcccc cccagggtgc ccaagagctt ccccttcaac 180
acgagcgtgg tgtacaagaa gaccctgttc gtggagttca ccgaccatct gttcaatatc 240
gccaagccca ggcccccctg gatggggctg ctggggccca cgatccaggc cgaggtgtac 300
gacaccgtgg tcatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg 360
ggcgtgagct actggaaggc cagcgagggc gccgagtacg acgaccagac cagccagagg 420
gagaaggagg acgacaaggt gttccccggc ggcagccaca cctacgtgtg gcaggtgctg 480
aaggagaatg ggcccatggc cagcgacccc ctgtgcctga cctactctta cctgagccac 540
gtggatctgg tgaaggacct gaacagcggc ctgatcggcg ccctgctggt gtgcagggag 600
ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg 660
ttcgacgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggatagggac 720
gccgccagcg ccagggcctg gcccaagatg cacaccgtga acggctacgt gaacaggtct 780
ctgcccggcc tgatcggctg ccacaggaag agcgtgtact ggcacgtgat cggcatgggg 840
accacccccg aggtgcacag catcttcctg gagggccaca cgttcctggt gaggaatcac 900
aggcaggcca gcctggagat cagcccgatc accttcctga ccgcccagac cctgctgatg 960
gacctggggc agttcctgct gttctgccat atcagctctc accagcacga cggcatggag 1020
gcctacgtga aggtggatag ctgccccgag gagccccagc tgaggatgaa gaacaacgag 1080
gaggccgagg actacgacga cgacctgacc gacagcgaga tggacgtggt gaggttcgac 1140
gacgacaata gcccgagctt catccagatc aggagcgtgg ccaagaagca ccccaagacc 1200
tgggtgcatt acatcgccgc cgaggaggag gattgggact acgcccccct ggtgctggcc 1260
cccgacgaca ggtcttacaa gagccagtac ctgaacaacg ggccccagag gatcggcagg 1320
aagtacaaga aggtgaggtt catggcctac accgacgaga ccttcaagac cagggaggcg 1380
atccagcacg agagcgggat cctggggccc ctgctgtacg gcgaggtggg cgacacgctg 1440
ctgatcatct tcaagaacca ggccagcagg ccgtacaata tctaccccca cgggatcacc 1500
gacgtgaggc ccctgtactc taggaggctg cccaagggcg tgaagcacct gaaggacttc 1560
cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggacgggccc 1620
acgaagagcg accccaggtg cctgaccagg tactacagct ctttcgtgaa catggagagg 1680
gacctggcca gcggcctgat cgggcccctg ctgatctgct acaaggagag cgtggatcag 1740
aggggcaacc agatcatgag cgacaagagg aacgtgatcc tgttcagcgt gttcgacgag 1800
aataggtctt ggtacctgac cgagaatatc cagaggttcc tgcccaaccc cgccggcgtg 1860
cagctggagg atcccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg 1920
ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc 1980
atcggcgccc agaccgactt cctgagcgtg ttcttcagcg gctacacctt caagcacaag 2040
atggtgtacg aggataccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc 2100
atggagaacc ccggcctgtg gatcctgggc tgccataact ccgacttcag gaataggggc 2160
atgaccgccc tgctgaaggt gagctcttgc gacaagaaca ccggcgacta ctacgaggat 2220
agctacgagg atatcagcgc ctacctgctg agcaagaaca acgccatcga gcccaggtct 2280
ttcagccaga acccccccgt gctgaagagg caccagaggg agatcaccag gacgaccctg 2340
cagagcgacc aggaggagat cgactacgac gacacgatca gcgtggagat gaagaaggag 2400
gatttcgaca tctacgacga ggacgagaat cagagcccca ggtctttcca gaagaagacc 2460
aggcattact tcatcgccgc cgtggagagg ctgtgggact acggcatgag cagctctccc 2520
cacgtgctga ggaatagggc ccagagcggc agcgtgcccc agttcaagaa ggtggtgttc 2580
caggagttca ccgacggcag cttcacccag cccctgtaca ggggcgagct gaacgagcac 2640
ctgggcctgc tggggcccta catcagggcc gaggtggagg ataacatcat ggtgaccttc 2700
aggaatcagg ccagcaggcc ctatagcttc tatagctctc tgatcagcta cgaggaggat 2760
cagaggcagg gcgccgagcc caggaagaac ttcgtgaagc ccaacgagac caagacctac 2820
ttctggaagg tgcagcacca catggccccc acgaaggacg agttcgactg caaggcctgg 2880
gcctacttca gcgacgtgga tctggagaag gacgtgcaca gcggcctgat cgggcccctg 2940
ctggtgtgcc acaccaacac cctgaacccc gcccacggca ggcaggtgac cgtgcaggag 3000
ttcgccctgt tcttcaccat cttcgacgag accaagagct ggtacttcac cgagaatatg 3060
gagaggaatt gcagggcccc ctgcaatatc cagatggagg acccgacctt caaggagaat 3120
tacaggttcc acgccatcaa cggctacatc atggacacgc tgcccggcct ggtcatggcc 3180
caggatcaga ggatcaggtg gtatctgctg agcatgggga gcaacgagaa tatccacagc 3240
atccacttca gcggccacgt gttcaccgtg aggaagaagg aggagtacaa gatggccctg 3300
tacaatctgt accccggcgt gttcgagacc gtggagatgc tgcccagcaa ggccgggatc 3360
tggagggtgg agtgcctgat cggcgagcac ctgcacgccg gcatgagcac gctgttcctg 3420
gtgtactcta acaagtgcca gacccccctg gggatggcca gcggccacat cagggacttc 3480
cagatcaccg ccagcggcca gtacggccag tgggccccca agctggccag gctgcactat 3540
tccggaagca tcaacgcctg gagcacgaag gagcccttca gctggatcaa ggtggatctg 3600
ctggccccca tgatcatcca cgggatcaag acccagggcg ccaggcagaa gttcagctct 3660
ctgtatatca gccagttcat catcatgtac tctctggacg gcaagaagtg gcagacctac 3720
aggggcaaca gcaccggcac gctgatggtg ttcttcggca acgtggactc tagcgggatc 3780
aagcacaata tcttcaaccc ccccatcatc gccaggtaca tcaggctgca ccccacccat 3840
tactctatca ggtctaccct gaggatggag ctgatgggct gcgacctgaa cagctgcagc 3900
atgcccctgg ggatggagag caaggccatc agcgacgccc agatcaccgc cagctcttac 3960
ttcaccaaca tgttcgccac ctggagcccg agcaaggcca ggctgcacct gcagggcagg 4020
tctaacgcct ggaggcccca ggtgaacaac cccaaggagt ggctgcaggt ggatttccag 4080
aagaccatga aggtgaccgg cgtgaccacg cagggcgtga agagcctgct gaccagcatg 4140
tacgtgaagg agttcctgat cagctctagc caggacggcc accagtggac cctgttcttc 4200
cagaacggca aggtgaaggt gttccagggc aaccaggata gcttcacccc cgtggtgaac 4260
agcctggacc cccccctgct gaccaggtat ctgaggatcc acccccagag ctgggtgcac 4320
cagatcgccc tgaggatgga ggtgctgggc tgcgaggccc aggatctgta ttga 4374
<210> 3
<211> 4374
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-52
<400> 3
atgcaaatcg aactgagcac ctgtttcttc ctctgcctgc tgagattctg tttctccgcg 60
acccgccgat actacctggg agcagtggag ctctcctggg attacatgca gagcgacctt 120
ggggagctgc ccgtggatgc caggttccct ccccgggtgc caaagtcgtt tccgttcaac 180
acctccgtgg tgtacaagaa aactctgttc gtggagttca ccgaccacct gttcaatatc 240
gccaagccca gacctccctg gatggggctg ttgggaccta ccatccaagc ggaggtgtac 300
gacactgtgg tcatcactct gaagaacatg gcctcgcatc ccgtgtccct gcacgccgtg 360
ggagtgtctt actggaaagc gtccgagggg gccgaatacg acgaccagac ctcgcagaga 420
gaaaaggaag atgacaaggt gttcccagga ggatcgcaca cctacgtgtg gcaagtgttg 480
aaggagaacg gcccaatggc ctccgacccg ctgtgcctga cctactcgta cctgtcccac 540
gtggacctcg tgaaggacct caactcggga ctgattggag ccctgctggt ctgcagggaa 600
ggctcactgg cgaaagaaaa gactcagacc ttgcacaagt tcattctgct gttcgctgtg 660
ttcgacgagg ggaagtcgtg gcacagcgag actaagaact ccctgatgca agatagagat 720
gccgcctccg cccgggcctg gcctaagatg cacaccgtga acggttacgt gaaccgctcc 780
ctccctggcc tgattggatg ccaccggaag tccgtgtact ggcacgtgat cgggatgggg 840
accacccccg aggtgcacag catcttcctg gaaggtcaca catttctcgt gcgcaaccac 900
cggcaggcct ccctggaaat cagccccatt accttcctca ctgcccagac tctgctgatg 960
gacctgggac agttcctgct gttctgccat atctcctccc accaacatga cggaatggag 1020
gcatacgtga aggtcgattc ctgccctgag gaaccccagc tccgcatgaa gaacaatgag 1080
gaagccgagg actacgacga cgacctgacg gatagcgaga tggatgtggt ccggttcgat 1140
gacgataaca gcccttcctt catccaaatt cgctcggtgg caaagaagca ccccaagacc 1200
tgggtgcatt acattgcggc ggaagaagag gactgggatt atgccccgct tgtcctcgct 1260
cctgacgacc ggagctacaa gagccagtac ctgaacaacg gtccacagag gatcggtaga 1320
aagtacaaga aggtccgctt catggcctat accgacgaaa ccttcaaaac tagagaggcc 1380
atccaacacg aatccggcat cctgggcccg ctcttgtacg gagaagtcgg cgacaccctt 1440
ctcattatct tcaagaacca ggcttcccgg ccgtacaaca tctatccgca tgggatcact 1500
gacgtgcgcc cactgtactc gcggcgcctg cccaagggtg tcaaacacct gaaggatttt 1560
ccgatccttc cgggagaaat cttcaagtac aagtggaccg tgaccgtgga agatggccca 1620
actaagtctg accctagatg cctcacccgc tactactcat ccttcgtcaa catggagcgc 1680
gacctggcca gcggactgat cggcccgctg ctgatttgct acaaggaatc agtggaccaa 1740
cggggaaacc agatcatgtc ggataagagg aacgtcatcc tcttctccgt gtttgacgaa 1800
aaccggtcgt ggtacctgac cgagaacatc cagaggttcc tgcccaaccc tgctggggtg 1860
cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa tggctacgtg 1920
ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc 1980
atcggcgccc agaccgactt cctgagcgtg ttcttctctg gctacacctt caagcacaag 2040
atggtgtatg aggacaccct gaccctgttc cccttcagcg gggagactgt cttcatgagc 2100
atggagaacc ctggcctgtg gatcctgggc tgccacaaca gcgacttcag gaacaggggc 2160
atgactgccc tgctgaaagt ctccagctgt gacaagaaca ccggggacta ctacgaggac 2220
agctacgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcccaggagc 2280
ttctctcaga accccccagt gctgaagagg caccagaggg agatcaccag gaccaccctg 2340
cagtctgacc aggaggagat cgactatgat gacaccatca gcgtggagat gaagaaggag 2400
gacttcgaca tctacgacga ggacgagaac cagagcccca ggagcttcca gaagaagacc 2460
aggcactact tcattgctgc tgtggagagg ctgtgggact atggcatgtc cagcagcccc 2520
catgtgctga ggaacagggc ccagtctggc agcgtgcccc agttcaagaa agtcgtgttc 2580
caggagttca ccgacggcag cttcacccag cccctgtaca gaggggagct gaacgagcac 2640
ctgggcctgc tgggccccta catcagggcc gaggtggagg acaacatcat ggtgaccttc 2700
aggaaccagg ccagcaggcc ctacagcttc tacagcagcc tgatcagcta cgaggaggac 2760
cagaggcagg gggctgagcc caggaagaac tttgtgaagc ccaatgaaac caagacctac 2820
ttctggaagg tgcagcacca catggccccc accaaggacg agttcgactg caaggcctgg 2880
gcctacttct ctgacgtgga cctggagaag gacgtgcact ctggcctgat tggccccctg 2940
ctggtgtgcc acaccaacac cctgaaccct gcccatggca ggcaggtgac tgtgcaggag 3000
ttcgccctgt tcttcaccat cttcgatgaa accaagagct ggtacttcac tgagaacatg 3060
gagaggaact gcagggcccc ctgcaacatc cagatggagg accccacctt caaggagaac 3120
tacaggttcc atgccatcaa tggctacatc atggacaccc tgcctggcct ggtcatggcc 3180
caggaccaga ggatcaggtg gtatctgctg agcatgggca gcaacgagaa catccacagc 3240
atccacttct ctggccacgt gttcactgtg aggaagaagg aggagtacaa gatggccctg 3300
tacaacctgt accctggggt gttcgaaacc gtggagatgc tgcccagcaa ggccggcatc 3360
tggagggtgg agtgcctgat tggggagcac ctgcacgccg gcatgagcac cctgttcctg 3420
gtgtacagca acaagtgcca gacccccctg ggcatggcct ctggccacat cagggacttc 3480
cagatcactg cctctggcca gtacggccag tgggccccca agctggccag gctgcactac 3540
tccggaagca tcaatgcctg gagcaccaag gagcccttca gctggatcaa agtggacctg 3600
ctggccccca tgatcatcca cggcatcaag acccaggggg ccaggcagaa gttctccagc 3660
ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac 3720
aggggcaaca gcaccggcac cctgatggtg ttcttcggca acgtggacag cagcggcatc 3780
aagcacaaca tcttcaaccc ccccatcatc gccagataca tcaggctgca ccccacccac 3840
tacagcatca ggagcaccct gaggatggag ctgatgggct gtgacctgaa cagctgcagc 3900
atgcccctgg gcatggagag caaggccatc tctgacgccc agatcactgc ctccagctac 3960
ttcaccaaca tgtttgccac ctggagcccc agcaaggcca ggctgcacct gcagggcagg 4020
agcaatgcct ggaggcccca ggtcaacaac cccaaggagt ggctgcaggt ggacttccag 4080
aagaccatga aggtgactgg ggtgaccacc cagggggtga agagcctgct gaccagcatg 4140
tacgtgaagg agttcctgat ctccagcagc caggacggcc accagtggac cctgttcttc 4200
cagaatggca aggtgaaggt gttccagggc aaccaggaca gcttcacccc tgtggtcaac 4260
agcctggacc cccccctgct gaccagatac ctgaggatcc acccccagag ctgggtgcac 4320
cagatcgccc tgaggatgga ggtgctgggc tgtgaggccc aggacctgta ctga 4374
<210> 4
<211> 4374
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-62
<400> 4
atgcagattg agctgtccac ttgtttcttc ctgtgcctcc tgcgcttctg tttctccgcc 60
actcgccggt actaccttgg agccgtggag ctttcatggg actacatgca gagcgacctg 120
ggcgaactcc ccgtggatgc cagattcccc ccccgcgtgc caaagtcctt cccctttaac 180
acctccgtgg tgtacaagaa aaccctcttt gtcgagttca ctgaccacct gttcaacatc 240
gccaagccgc gcccaccttg gatgggcctc ctgggaccga ccattcaagc tgaagtgtac 300
gacaccgtgg tgatcaccct gaagaacatg gcgtcccacc ccgtgtccct gcatgcggtc 360
ggagtgtcct actggaaggc ctccgaagga gctgagtacg acgaccagac tagccagcgg 420
gaaaaggagg acgataaagt gttcccgggc ggctcgcata cttacgtgtg gcaagtcctg 480
aaggaaaacg gacctatggc atccgatcct ctgtgcctga cttactccta cctttcccat 540
gtggacctcg tgaaggacct gaacagcggg ctgattggtg cacttctcgt gtgccgcgaa 600
ggttcgctcg ctaaggaaaa gacccagacc ctccataagt tcatcctttt gttcgctgtg 660
ttcgatgaag gaaagtcatg gcattccgaa actaagaact cgctgatgca ggaccgggat 720
gccgcctcag cccgcgcctg gcctaaaatg catacagtca acggatacgt gaatcggtca 780
ctgcccgggc tcatcggttg tcacagaaag tccgtgtact ggcacgtcat cggcatgggc 840
actacgcctg aagtgcactc catcttcctg gaagggcaca ccttcctcgt gcgcaaccac 900
cgccaggcct ctctggaaat ctccccgatt acctttctga ccgcccagac tctgctcatg 960
gacctggggc agttccttct cttctgccac atctccagcc atcagcacga cggaatggag 1020
gcctacgtga aggtggactc atgcccggaa gaacctcagt tgcggatgaa gaacaacgag 1080
gaggccgagg actatgacga cgatttgact gactccgaga tggacgtcgt gcggttcgat 1140
gacgacaaca gccccagctt catccagatt cgcagcgtgg ccaagaagca ccccaaaacc 1200
tgggtgcact acatcgcggc cgaggaagaa gattgggact acgccccgtt ggtgctggca 1260
cccgatgacc ggtcgtacaa gtcccagtat ctgaacaatg gtccgcagcg gattggcaga 1320
aagtacaaga aagtgcggtt catggcgtac actgacgaaa cgtttaagac ccgggaggcc 1380
attcaacatg agagcggcat tctgggacca ctgctgtacg gagaggtcgg cgataccctg 1440
ctcatcatct tcaaaaacca ggcctcccgg ccttacaaca tctaccctca cggaatcacc 1500
gacgtgcggc cactctactc gcggcgcctg ccgaagggcg tcaagcacct gaaagacttc 1560
cctatcctgc cgggcgaaat cttcaagtat aagtggaccg tcaccgtgga ggacgggccc 1620
accaagagcg atcctaggtg tctgactcgg tactactcca gcttcgtgaa catggaacgg 1680
gacctggcat cgggactcat tggaccgctg ctgatctgct acaaagagtc ggtggatcaa 1740
cgcggcaacc agatcatgtc cgacaagcgc aacgtgatcc tgttctccgt gtttgatgaa 1800
aacagatcct ggtacctgac cgagaacatc cagaggttcc tgcccaaccc tgctggggtg 1860
cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa tggctacgtg 1920
ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc 1980
atcggcgccc agaccgactt cctgagcgtg ttcttctctg gctacacctt caagcacaag 2040
atggtgtatg aggacaccct gaccctgttc cccttcagcg gggagactgt cttcatgagc 2100
atggagaacc ctggcctgtg gatcctgggc tgccacaaca gcgacttcag gaacaggggc 2160
atgactgccc tgctgaaagt ctccagctgt gacaagaaca ccggggacta ctacgaggac 2220
agctacgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcccaggagc 2280
ttctctcaga accccccagt gctgaagagg caccagaggg agatcaccag gaccaccctg 2340
cagtctgacc aggaggagat cgactatgat gacaccatca gcgtggagat gaagaaggag 2400
gacttcgaca tctacgacga ggacgagaac cagagcccca ggagcttcca gaagaagacc 2460
aggcactact tcattgctgc tgtggagagg ctgtgggact atggcatgtc cagcagcccc 2520
catgtgctga ggaacagggc ccagtctggc agcgtgcccc agttcaagaa agtcgtgttc 2580
caggagttca ccgacggcag cttcacccag cccctgtaca gaggggagct gaacgagcac 2640
ctgggcctgc tgggccccta catcagggcc gaggtggagg acaacatcat ggtgaccttc 2700
aggaaccagg ccagcaggcc ctacagcttc tacagcagcc tgatcagcta cgaggaggac 2760
cagaggcagg gggctgagcc caggaagaac tttgtgaagc ccaatgaaac caagacctac 2820
ttctggaagg tgcagcacca catggccccc accaaggacg agttcgactg caaggcctgg 2880
gcctacttct ctgacgtgga cctggagaag gacgtgcact ctggcctgat tggccccctg 2940
ctggtgtgcc acaccaacac cctgaaccct gcccatggca ggcaggtgac tgtgcaggag 3000
ttcgccctgt tcttcaccat cttcgatgaa accaagagct ggtacttcac tgagaacatg 3060
gagaggaact gcagggcccc ctgcaacatc cagatggagg accccacctt caaggagaac 3120
tacaggttcc atgccatcaa tggctacatc atggacaccc tgcctggcct ggtcatggcc 3180
caggaccaga ggatcaggtg gtatctgctg agcatgggca gcaacgagaa catccacagc 3240
atccacttct ctggccacgt gttcactgtg aggaagaagg aggagtacaa gatggccctg 3300
tacaacctgt accctggggt gttcgaaacc gtggagatgc tgcccagcaa ggccggcatc 3360
tggagggtgg agtgcctgat tggggagcac ctgcacgccg gcatgagcac cctgttcctg 3420
gtgtacagca acaagtgcca gacccccctg ggcatggcct ctggccacat cagggacttc 3480
cagatcactg cctctggcca gtacggccag tgggccccca agctggccag gctgcactac 3540
tccggaagca tcaatgcctg gagcaccaag gagcccttca gctggatcaa agtggacctg 3600
ctggccccca tgatcatcca cggcatcaag acccaggggg ccaggcagaa gttctccagc 3660
ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac 3720
aggggcaaca gcaccggcac cctgatggtg ttcttcggca acgtggacag cagcggcatc 3780
aagcacaaca tcttcaaccc ccccatcatc gccagataca tcaggctgca ccccacccac 3840
tacagcatca ggagcaccct gaggatggag ctgatgggct gtgacctgaa cagctgcagc 3900
atgcccctgg gcatggagag caaggccatc tctgacgccc agatcactgc ctccagctac 3960
ttcaccaaca tgtttgccac ctggagcccc agcaaggcca ggctgcacct gcagggcagg 4020
agcaatgcct ggaggcccca ggtcaacaac cccaaggagt ggctgcaggt ggacttccag 4080
aagaccatga aggtgactgg ggtgaccacc cagggggtga agagcctgct gaccagcatg 4140
tacgtgaagg agttcctgat ctccagcagc caggacggcc accagtggac cctgttcttc 4200
cagaatggca aggtgaaggt gttccagggc aaccaggaca gcttcacccc tgtggtcaac 4260
agcctggacc cccccctgct gaccagatac ctgaggatcc acccccagag ctgggtgcac 4320
cagatcgccc tgaggatgga ggtgctgggc tgtgaggccc aggacctgta ctga 4374
<210> 5
<211> 4374
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-25
<400> 5
atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc 60
accaggagat actacctggg cgccgtggag ctgagctggg actacatgca gtctgacctg 120
ggcgagctgc cagtggacgc caggttcccc cccagagtgc ccaagagctt ccccttcaac 180
accagcgtgg tgtacaagaa gaccctgttc gtggagttca ctgaccacct gttcaacatc 240
gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac 300
gacaccgtgg tcatcaccct gaagaacatg gccagccacc ccgtctccct gcacgccgtg 360
ggggtgagct actggaaggc ctctgagggc gccgagtacg acgaccagac cagccagagg 420
gagaaggagg acgacaaggt gttccctggg ggcagccaca cctacgtgtg gcaggtcctg 480
aaggagaacg gccccatggc ctctgacccc ctgtgcctga cctacagcta cctgagccac 540
gtggacctgg tgaaggacct gaactctggc ctgattgggg ccctgctggt gtgcagggag 600
ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg 660
ttcgacgagg gcaagagctg gcactctgaa accaagaaca gcctgatgca ggacagggac 720
gccgcctctg ccagggcctg gcccaagatg cacaccgtca acggctacgt caacaggagc 780
ctgcctggcc tgattggctg ccacaggaag agcgtgtact ggcatgtgat cggcatgggc 840
accacccctg aggtgcacag catcttcctg gagggccaca ccttcctggt caggaaccac 900
aggcaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg 960
gacctgggcc agttcctgct gttctgccac atctccagcc accagcacga cggcatggag 1020
gcctacgtga aagtggacag ctgccctgag gagccccagc tgaggatgaa gaacaacgag 1080
gaggccgagg actatgatga cgacctgacc gacagcgaga tggacgtggt caggttcgac 1140
gacgacaaca gccccagctt catccagatc aggagcgtgg ccaagaagca ccccaagacc 1200
tgggtgcact acatcgctgc tgaggaggag gactgggact atgcccccct ggtgctggcc 1260
cctgatgaca ggagctacaa gagccagtac ctgaacaatg gcccccagag gattggcagg 1320
aagtacaaga aagtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc 1380
atccagcatg agtctggcat cctgggcccc ctgctgtacg gggaggtggg ggacaccctg 1440
ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca tggcatcacc 1500
gacgtgaggc ccctgtacag caggaggctg cctaaggggg tgaagcacct gaaagacttc 1560
cccatcctgc ctggggagat cttcaagtac aagtggactg tgactgtgga ggacggcccc 1620
accaagagcg accccaggtg cctgaccaga tactacagca gcttcgtcaa catggagagg 1680
gacctggcct ctggcctgat tggccccctg ctgatctgct acaaggagtc tgtggaccag 1740
aggggcaacc agatcatgag cgacaagagg aacgtgatcc tgttctctgt cttcgacgag 1800
aacaggagct ggtacctgac tgaaaacatc cagcggttcc tccccaaccc cgcgggcgtg 1860
cagctggaag atcctgagtt tcaggcatca aacatcatgc actccattaa cggctacgtg 1920
ttcgattcgc tgcagctgag cgtgtgtctg cacgaagtgg cctactggta catcctgtcc 1980
attggtgccc agactgactt cctgtccgtg tttttctccg gctacacgtt caagcacaag 2040
atggtgtacg aggacaccct gaccctcttc cctttttccg gcgaaactgt gtttatgagc 2100
atggagaatc ccggcctgtg gatcttgggc tgccacaaca gcgacttccg taacagagga 2160
atgactgcgc tgctcaaggt gtccagctgc gacaagaaca ccggagacta ttatgaggac 2220
tcatacgagg acatctccgc ctacctcctg tccaagaata acgccattga acctcggagc 2280
ttcagccaga acccacccgt gcttaagaga catcaacggg agatcactag gaccaccctg 2340
cagtcagacc aggaggaaat cgactacgat gacaccatct cggtcgagat gaagaaggag 2400
gactttgaca tctacgacga agatgaaaac cagagcccga ggtcgttcca aaagaaaacc 2460
cgccactact ttattgctgc tgtcgagcgg ctgtgggact acggaatgtc gtcctcgccg 2520
cacgtgctcc gcaaccgagc ccagagcggc tcggtgccgc aattcaagaa ggtcgtgttc 2580
caggagttca ctgacgggag cttcactcag cctttgtacc ggggagaact caatgaacat 2640
ctcggcctcc tcggacctta catcagagca gaagtggaag ataacatcat ggtcactttc 2700
cgtaaccaag ccagccgccc gtactcgttc tactcctccc tcatttctta cgaagaggac 2760
cagcggcagg gcgcagaacc gcgcaagaac ttcgtgaagc ccaacgaaac caagacctac 2820
ttctggaaag tgcagcatca tatggccccg actaaggacg agtttgactg caaagcctgg 2880
gcctacttct ccgatgtgga cttggagaag gacgtccact ccggcctcat cggtcccctg 2940
ctcgtgtgcc ataccaatac cctgaacccc gcacacggtc gccaggtcac cgtgcaggag 3000
ttcgctctgt tcttcactat cttcgacgaa actaagtcct ggtacttcac cgagaacatg 3060
gagaggaact gcagagcccc ctgtaacatc cagatggagg acccgacgtt caaggaaaac 3120
taccggttcc acgccattaa cggatacatc atggatacgc tgccgggtct tgtgatggcc 3180
caggatcaac ggatcagatg gtacttattg tcgatgggca gcaacgagaa catccactct 3240
attcacttct ccggtcatgt gttcactgtg cggaagaagg aagagtacaa gatggccctg 3300
tacaaccttt atcccggagt gttcgaaact gtggaaatgc tgccgtcgaa ggccggcatt 3360
tggcgcgtgg agtgtttgat tggagaacat ctccatgcgg ggatgtcaac cctgttcctg 3420
gtgtatagca acaagtgcca gactccgctt gggatggcgt caggacacat tagggatttc 3480
cagatcactg cgtccggcca gtacggccaa tgggccccta agctggcccg cctgcattac 3540
tccggatcca ttaacgcctg gtcaaccaag gagccattct cctggatcaa ggtggacctt 3600
ctggccccca tgattatcca cggaattaag acccaggggg cccggcagaa gttctcctca 3660
ctgtacatca gccagttcat aatcatgtac tccctggacg gaaagaagtg gcaaacctac 3720
agggggaaca gcaccggcac actgatggtc tttttcggaa atgtggactc ctccgggatt 3780
aagcataaca tcttcaaccc tccgattatc gctcggtaca ttagacttca ccctacccac 3840
tacagcattc gctccaccct gcggatggaa ctgatgggct gcgatctgaa ctcgtgcagc 3900
atgccgttgg gaatggagtc caaagcaatt tccgacgcgc agatcaccgc ctcgtcctac 3960
tttaccaaca tgttcgccac gtggtcaccg tccaaggccc ggctgcacct ccagggaaga 4020
tccaacgcat ggcggccaca ggtcaacaac cctaaggagt ggctccaggt ggacttccag 4080
aaaaccatga aggtcaccgg agtcacaacc cagggagtga agtcgctgct gacttctatg 4140
tacgtcaagg agttcctgat ctccagcagc caggacgggc accagtggac cctgttcttc 4200
caaaatggaa aggtcaaggt gtttcagggc aatcaggatt cattcacccc ggtggtgaac 4260
tcccttgatc cacccctcct gacccgctac cttcgcatcc acccacagtc ctgggtgcac 4320
cagatcgcgc tgaggatgga ggtcctggga tgcgaagccc aggacctgta ctga 4374
<210> 6
<211> 4374
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-26
<400> 6
atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc 60
accaggagat actacctggg cgccgtggag ctgagctggg actacatgca gtctgacctg 120
ggcgagctgc cagtggacgc caggttcccc cccagagtgc ccaagagctt ccccttcaac 180
accagcgtgg tgtacaagaa gaccctgttc gtggagttca ctgaccacct gttcaacatc 240
gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac 300
gacaccgtgg tcatcaccct gaagaacatg gccagccacc ccgtctccct gcacgccgtg 360
ggggtgagct actggaaggc ctctgagggc gccgagtacg acgaccagac cagccagagg 420
gagaaggagg acgacaaggt gttccctggg ggcagccaca cctacgtgtg gcaggtcctg 480
aaggagaacg gccccatggc ctctgacccc ctgtgcctga cctacagcta cctgagccac 540
gtggacctgg tgaaggacct gaactctggc ctgattgggg ccctgctggt gtgcagggag 600
ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg 660
ttcgacgagg gcaagagctg gcactctgaa accaagaaca gcctgatgca ggacagggac 720
gccgcctctg ccagggcctg gcccaagatg cacaccgtca acggctacgt caacaggagc 780
ctgcctggcc tgattggctg ccacaggaag agcgtgtact ggcatgtgat cggcatgggc 840
accacccctg aggtgcacag catcttcctg gagggccaca ccttcctggt caggaaccac 900
aggcaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg 960
gacctgggcc agttcctgct gttctgccac atctccagcc accagcacga cggcatggag 1020
gcctacgtga aagtggacag ctgccctgag gagccccagc tgaggatgaa gaacaacgag 1080
gaggccgagg actatgatga cgacctgacc gacagcgaga tggacgtggt caggttcgac 1140
gacgacaaca gccccagctt catccagatc aggagcgtgg ccaagaagca ccccaagacc 1200
tgggtgcact acatcgctgc tgaggaggag gactgggact atgcccccct ggtgctggcc 1260
cctgatgaca ggagctacaa gagccagtac ctgaacaatg gcccccagag gattggcagg 1320
aagtacaaga aagtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc 1380
atccagcatg agtctggcat cctgggcccc ctgctgtacg gggaggtggg ggacaccctg 1440
ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca tggcatcacc 1500
gacgtgaggc ccctgtacag caggaggctg cctaaggggg tgaagcacct gaaagacttc 1560
cccatcctgc ctggggagat cttcaagtac aagtggactg tgactgtgga ggacggcccc 1620
accaagagcg accccaggtg cctgaccaga tactacagca gcttcgtcaa catggagagg 1680
gacctggcct ctggcctgat tggccccctg ctgatctgct acaaggagtc tgtggaccag 1740
aggggcaacc agatcatgag cgacaagagg aacgtgatcc tgttctctgt cttcgacgag 1800
aacaggagct ggtacctcac tgaaaacatc cagaggttcc tcccaaaccc cgcaggagtg 1860
caactggagg accctgagtt tcaggcctcg aatatcatgc actcgattaa cggttacgtg 1920
ttcgactcgc tgcagctgag cgtgtgcctc catgaagtcg cttactggta cattctgtcc 1980
atcggcgccc agactgactt cctgagcgtg ttcttttccg gttacacctt taagcacaag 2040
atggtgtacg aagataccct gaccctgttc cctttctccg gcgaaacggt gttcatgtcg 2100
atggagaacc cgggtctgtg gattctggga tgccacaaca gcgactttcg gaaccgcgga 2160
atgactgccc tgctgaaggt gtcctcatgc gacaagaaca ccggagacta ctacgaggac 2220
tcctacgagg atatctcagc ctacctcctg tccaagaaca acgcgatcga gccgcgcagc 2280
ttcagccaga acccgcctgt gctgaagagg caccagcgag aaattacccg gaccaccctc 2340
caatcggatc aggaggaaat cgactacgac gacaccatct cggtggaaat gaagaaggaa 2400
gatttcgata tctacgacga ggacgaaaat cagtcccctc gctcattcca aaagaaaact 2460
agacactact ttatcgccgc ggtggaaaga ctgtgggact atggaatgtc atccagccct 2520
cacgtccttc ggaaccgggc ccagagcgga tcggtgcctc agttcaagaa agtggtgttc 2580
caggagttca ccgacggcag cttcacccag ccgctgtacc ggggagaact gaacgaacac 2640
ctgggcctgc tcggtcccta catccgcgcg gaagtggagg ataacatcat ggtgaccttc 2700
cgtaaccaag catccagacc ttactccttc tattcctccc tgatctcata cgaggaggac 2760
cagcgccaag gcgccgagcc ccgcaagaac ttcgtcaagc ccaacgagac taagacctac 2820
ttctggaagg tccaacacca tatggccccg accaaggatg agtttgactg caaggcctgg 2880
gcctacttct ccgacgtgga ccttgagaag gatgtccatt ccggcctgat cgggccgctg 2940
ctcgtgtgtc acaccaacac cctgaaccca gcgcatggac gccaggtcac cgtccaggag 3000
tttgctctgt tcttcaccat ttttgacgaa actaagtcct ggtacttcac cgagaatatg 3060
gagcgaaact gtagagcgcc ctgcaatatc cagatggaag atccgacttt caaggagaac 3120
tatagattcc acgccatcaa cgggtacatc atggatactc tgccggggct ggtcatggcc 3180
caggatcaga ggattcggtg gtacttgctg tcaatgggat cgaacgaaaa cattcactcc 3240
attcacttct ccggtcacgt gttcactgtg cgcaagaagg aggagtacaa gatggcgctg 3300
tacaatctgt accccggggt gttcgaaact gtggagatgc tgccgtccaa ggccggcatc 3360
tggagagtgg agtgcctgat cggagagcac ctccacgcgg ggatgtccac cctcttcctg 3420
gtgtactcga ataagtgcca gaccccgctg ggcatggcct cgggccacat cagagacttc 3480
cagatcacag caagcggaca atacggccaa tgggcgccga agctggcccg cttgcactac 3540
tccggatcga tcaacgcatg gtccaccaag gaaccgttct cgtggattaa ggtggacctc 3600
ctggccccta tgattatcca cggaattaag acccagggcg ccaggcagaa gttctcctcc 3660
ctgtacatct cgcaattcat catcatgtac agcctggacg ggaagaagtg gcagacttac 3720
aggggaaact ccaccggcac cctgatggtc tttttcggca acgtggattc ctccggcatt 3780
aagcacaaca tcttcaaccc accgatcata gccagatata ttaggctcca ccccactcac 3840
tactcaatcc gctcaactct tcggatggaa ctcatggggt gcgacctgaa ctcctgctcc 3900
atgccgttgg ggatggaatc aaaggctatt agcgacgccc agatcaccgc gagctcctac 3960
ttcactaaca tgttcgccac ctggagcccc tccaaggcca ggctgcactt gcagggacgg 4020
tcaaatgcct ggcggccgca agtgaacaat ccgaaggaat ggcttcaagt ggatttccaa 4080
aagaccatga aagtgaccgg agtcaccacc cagggagtga agtcccttct gacctcgatg 4140
tatgtgaagg agttcctgat tagcagcagc caggacgggc accagtggac cctgttcttc 4200
caaaacggaa aggtcaaggt gttccagggg aaccaggact cgttcacacc cgtggtgaac 4260
tccctggacc ccccactgct gacgcggtac ttgaggattc atcctcagtc ctgggtccat 4320
cagattgcat tgcgaatgga agtcctgggc tgcgaggccc aggacctgta ctga 4374
<210> 7
<211> 1734
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-52-NT58
<400> 7
gcgacccgcc gatactacct gggagcagtg gagctctcct gggattacat gcagagcgac 60
cttggggagc tgcccgtgga tgccaggttc cctccccggg tgccaaagtc gtttccgttc 120
aacacctccg tggtgtacaa gaaaactctg ttcgtggagt tcaccgacca cctgttcaat 180
atcgccaagc ccagacctcc ctggatgggg ctgttgggac ctaccatcca agcggaggtg 240
tacgacactg tggtcatcac tctgaagaac atggcctcgc atcccgtgtc cctgcacgcc 300
gtgggagtgt cttactggaa agcgtccgag ggggccgaat acgacgacca gacctcgcag 360
agagaaaagg aagatgacaa ggtgttccca ggaggatcgc acacctacgt gtggcaagtg 420
ttgaaggaga acggcccaat ggcctccgac ccgctgtgcc tgacctactc gtacctgtcc 480
cacgtggacc tcgtgaagga cctcaactcg ggactgattg gagccctgct ggtctgcagg 540
gaaggctcac tggcgaaaga aaagactcag accttgcaca agttcattct gctgttcgct 600
gtgttcgacg aggggaagtc gtggcacagc gagactaaga actccctgat gcaagataga 660
gatgccgcct ccgcccgggc ctggcctaag atgcacaccg tgaacggtta cgtgaaccgc 720
tccctccctg gcctgattgg atgccaccgg aagtccgtgt actggcacgt gatcgggatg 780
gggaccaccc ccgaggtgca cagcatcttc ctggaaggtc acacatttct cgtgcgcaac 840
caccggcagg cctccctgga aatcagcccc attaccttcc tcactgccca gactctgctg 900
atggacctgg gacagttcct gctgttctgc catatctcct cccaccaaca tgacggaatg 960
gaggcatacg tgaaggtcga ttcctgccct gaggaacccc agctccgcat gaagaacaat 1020
gaggaagccg aggactacga cgacgacctg acggatagcg agatggatgt ggtccggttc 1080
gatgacgata acagcccttc cttcatccaa attcgctcgg tggcaaagaa gcaccccaag 1140
acctgggtgc attacattgc ggcggaagaa gaggactggg attatgcccc gcttgtcctc 1200
gctcctgacg accggagcta caagagccag tacctgaaca acggtccaca gaggatcggt 1260
agaaagtaca agaaggtccg cttcatggcc tataccgacg aaaccttcaa aactagagag 1320
gccatccaac acgaatccgg catcctgggc ccgctcttgt acggagaagt cggcgacacc 1380
cttctcatta tcttcaagaa ccaggcttcc cggccgtaca acatctatcc gcatgggatc 1440
actgacgtgc gcccactgta ctcgcggcgc ctgcccaagg gtgtcaaaca cctgaaggat 1500
tttccgatcc ttccgggaga aatcttcaag tacaagtgga ccgtgaccgt ggaagatggc 1560
ccaactaagt ctgaccctag atgcctcacc cgctactact catccttcgt caacatggag 1620
cgcgacctgg ccagcggact gatcggcccg ctgctgattt gctacaagga atcagtggac 1680
caacggggaa accagatcat gtcggataag aggaacgtca tcctcttctc cgtg 1734
<210> 8
<211> 2583
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-52-CT
<400> 8
tttgacgaaa accggtcgtg gtacctgacc gagaacatcc agaggttcct gcccaaccct 60
gctggggtgc agctggagga ccccgagttc caggccagca acatcatgca cagcatcaat 120
ggctacgtgt tcgacagcct gcagctgagc gtgtgcctgc acgaggtggc ctactggtac 180
atcctgagca tcggcgccca gaccgacttc ctgagcgtgt tcttctctgg ctacaccttc 240
aagcacaaga tggtgtatga ggacaccctg accctgttcc ccttcagcgg ggagactgtc 300
ttcatgagca tggagaaccc tggcctgtgg atcctgggct gccacaacag cgacttcagg 360
aacaggggca tgactgccct gctgaaagtc tccagctgtg acaagaacac cggggactac 420
tacgaggaca gctacgagga catcagcgcc tacctgctga gcaagaacaa tgccatcgag 480
cccaggagct tctctcagaa ccccccagtg ctgaagaggc accagaggga gatcaccagg 540
accaccctgc agtctgacca ggaggagatc gactatgatg acaccatcag cgtggagatg 600
aagaaggagg acttcgacat ctacgacgag gacgagaacc agagccccag gagcttccag 660
aagaagacca ggcactactt cattgctgct gtggagaggc tgtgggacta tggcatgtcc 720
agcagccccc atgtgctgag gaacagggcc cagtctggca gcgtgcccca gttcaagaaa 780
gtcgtgttcc aggagttcac cgacggcagc ttcacccagc ccctgtacag aggggagctg 840
aacgagcacc tgggcctgct gggcccctac atcagggccg aggtggagga caacatcatg 900
gtgaccttca ggaaccaggc cagcaggccc tacagcttct acagcagcct gatcagctac 960
gaggaggacc agaggcaggg ggctgagccc aggaagaact ttgtgaagcc caatgaaacc 1020
aagacctact tctggaaggt gcagcaccac atggccccca ccaaggacga gttcgactgc 1080
aaggcctggg cctacttctc tgacgtggac ctggagaagg acgtgcactc tggcctgatt 1140
ggccccctgc tggtgtgcca caccaacacc ctgaaccctg cccatggcag gcaggtgact 1200
gtgcaggagt tcgccctgtt cttcaccatc ttcgatgaaa ccaagagctg gtacttcact 1260
gagaacatgg agaggaactg cagggccccc tgcaacatcc agatggagga ccccaccttc 1320
aaggagaact acaggttcca tgccatcaat ggctacatca tggacaccct gcctggcctg 1380
gtcatggccc aggaccagag gatcaggtgg tatctgctga gcatgggcag caacgagaac 1440
atccacagca tccacttctc tggccacgtg ttcactgtga ggaagaagga ggagtacaag 1500
atggccctgt acaacctgta ccctggggtg ttcgaaaccg tggagatgct gcccagcaag 1560
gccggcatct ggagggtgga gtgcctgatt ggggagcacc tgcacgccgg catgagcacc 1620
ctgttcctgg tgtacagcaa caagtgccag acccccctgg gcatggcctc tggccacatc 1680
agggacttcc agatcactgc ctctggccag tacggccagt gggcccccaa gctggccagg 1740
ctgcactact ccggaagcat caatgcctgg agcaccaagg agcccttcag ctggatcaaa 1800
gtggacctgc tggcccccat gatcatccac ggcatcaaga cccagggggc caggcagaag 1860
ttctccagcc tgtacatcag ccagttcatc atcatgtaca gcctggacgg caagaagtgg 1920
cagacctaca ggggcaacag caccggcacc ctgatggtgt tcttcggcaa cgtggacagc 1980
agcggcatca agcacaacat cttcaacccc cccatcatcg ccagatacat caggctgcac 2040
cccacccact acagcatcag gagcaccctg aggatggagc tgatgggctg tgacctgaac 2100
agctgcagca tgcccctggg catggagagc aaggccatct ctgacgccca gatcactgcc 2160
tccagctact tcaccaacat gtttgccacc tggagcccca gcaaggccag gctgcacctg 2220
cagggcagga gcaatgcctg gaggccccag gtcaacaacc ccaaggagtg gctgcaggtg 2280
gacttccaga agaccatgaa ggtgactggg gtgaccaccc agggggtgaa gagcctgctg 2340
accagcatgt acgtgaagga gttcctgatc tccagcagcc aggacggcca ccagtggacc 2400
ctgttcttcc agaatggcaa ggtgaaggtg ttccagggca accaggacag cttcacccct 2460
gtggtcaaca gcctggaccc ccccctgctg accagatacc tgaggatcca cccccagagc 2520
tgggtgcacc agatcgccct gaggatggag gtgctgggct gtgaggccca ggacctgtac 2580
tga 2583
<210> 9
<211> 1734
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-62-NT58
<400> 9
gccactcgcc ggtactacct tggagccgtg gagctttcat gggactacat gcagagcgac 60
ctgggcgaac tccccgtgga tgccagattc cccccccgcg tgccaaagtc cttccccttt 120
aacacctccg tggtgtacaa gaaaaccctc tttgtcgagt tcactgacca cctgttcaac 180
atcgccaagc cgcgcccacc ttggatgggc ctcctgggac cgaccattca agctgaagtg 240
tacgacaccg tggtgatcac cctgaagaac atggcgtccc accccgtgtc cctgcatgcg 300
gtcggagtgt cctactggaa ggcctccgaa ggagctgagt acgacgacca gactagccag 360
cgggaaaagg aggacgataa agtgttcccg ggcggctcgc atacttacgt gtggcaagtc 420
ctgaaggaaa acggacctat ggcatccgat cctctgtgcc tgacttactc ctacctttcc 480
catgtggacc tcgtgaagga cctgaacagc gggctgattg gtgcacttct cgtgtgccgc 540
gaaggttcgc tcgctaagga aaagacccag accctccata agttcatcct tttgttcgct 600
gtgttcgatg aaggaaagtc atggcattcc gaaactaaga actcgctgat gcaggaccgg 660
gatgccgcct cagcccgcgc ctggcctaaa atgcatacag tcaacggata cgtgaatcgg 720
tcactgcccg ggctcatcgg ttgtcacaga aagtccgtgt actggcacgt catcggcatg 780
ggcactacgc ctgaagtgca ctccatcttc ctggaagggc acaccttcct cgtgcgcaac 840
caccgccagg cctctctgga aatctccccg attacctttc tgaccgccca gactctgctc 900
atggacctgg ggcagttcct tctcttctgc cacatctcca gccatcagca cgacggaatg 960
gaggcctacg tgaaggtgga ctcatgcccg gaagaacctc agttgcggat gaagaacaac 1020
gaggaggccg aggactatga cgacgatttg actgactccg agatggacgt cgtgcggttc 1080
gatgacgaca acagccccag cttcatccag attcgcagcg tggccaagaa gcaccccaaa 1140
acctgggtgc actacatcgc ggccgaggaa gaagattggg actacgcccc gttggtgctg 1200
gcacccgatg accggtcgta caagtcccag tatctgaaca atggtccgca gcggattggc 1260
agaaagtaca agaaagtgcg gttcatggcg tacactgacg aaacgtttaa gacccgggag 1320
gccattcaac atgagagcgg cattctggga ccactgctgt acggagaggt cggcgatacc 1380
ctgctcatca tcttcaaaaa ccaggcctcc cggccttaca acatctaccc tcacggaatc 1440
accgacgtgc ggccactcta ctcgcggcgc ctgccgaagg gcgtcaagca cctgaaagac 1500
ttccctatcc tgccgggcga aatcttcaag tataagtgga ccgtcaccgt ggaggacggg 1560
cccaccaaga gcgatcctag gtgtctgact cggtactact ccagcttcgt gaacatggaa 1620
cgggacctgg catcgggact cattggaccg ctgctgatct gctacaaaga gtcggtggat 1680
caacgcggca accagatcat gtccgacaag cgcaacgtga tcctgttctc cgtg 1734
<210> 10
<211> 2583
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-62-CT
<400> 10
tttgatgaaa acagatcctg gtacctgacc gagaacatcc agaggttcct gcccaaccct 60
gctggggtgc agctggagga ccccgagttc caggccagca acatcatgca cagcatcaat 120
ggctacgtgt tcgacagcct gcagctgagc gtgtgcctgc acgaggtggc ctactggtac 180
atcctgagca tcggcgccca gaccgacttc ctgagcgtgt tcttctctgg ctacaccttc 240
aagcacaaga tggtgtatga ggacaccctg accctgttcc ccttcagcgg ggagactgtc 300
ttcatgagca tggagaaccc tggcctgtgg atcctgggct gccacaacag cgacttcagg 360
aacaggggca tgactgccct gctgaaagtc tccagctgtg acaagaacac cggggactac 420
tacgaggaca gctacgagga catcagcgcc tacctgctga gcaagaacaa tgccatcgag 480
cccaggagct tctctcagaa ccccccagtg ctgaagaggc accagaggga gatcaccagg 540
accaccctgc agtctgacca ggaggagatc gactatgatg acaccatcag cgtggagatg 600
aagaaggagg acttcgacat ctacgacgag gacgagaacc agagccccag gagcttccag 660
aagaagacca ggcactactt cattgctgct gtggagaggc tgtgggacta tggcatgtcc 720
agcagccccc atgtgctgag gaacagggcc cagtctggca gcgtgcccca gttcaagaaa 780
gtcgtgttcc aggagttcac cgacggcagc ttcacccagc ccctgtacag aggggagctg 840
aacgagcacc tgggcctgct gggcccctac atcagggccg aggtggagga caacatcatg 900
gtgaccttca ggaaccaggc cagcaggccc tacagcttct acagcagcct gatcagctac 960
gaggaggacc agaggcaggg ggctgagccc aggaagaact ttgtgaagcc caatgaaacc 1020
aagacctact tctggaaggt gcagcaccac atggccccca ccaaggacga gttcgactgc 1080
aaggcctggg cctacttctc tgacgtggac ctggagaagg acgtgcactc tggcctgatt 1140
ggccccctgc tggtgtgcca caccaacacc ctgaaccctg cccatggcag gcaggtgact 1200
gtgcaggagt tcgccctgtt cttcaccatc ttcgatgaaa ccaagagctg gtacttcact 1260
gagaacatgg agaggaactg cagggccccc tgcaacatcc agatggagga ccccaccttc 1320
aaggagaact acaggttcca tgccatcaat ggctacatca tggacaccct gcctggcctg 1380
gtcatggccc aggaccagag gatcaggtgg tatctgctga gcatgggcag caacgagaac 1440
atccacagca tccacttctc tggccacgtg ttcactgtga ggaagaagga ggagtacaag 1500
atggccctgt acaacctgta ccctggggtg ttcgaaaccg tggagatgct gcccagcaag 1560
gccggcatct ggagggtgga gtgcctgatt ggggagcacc tgcacgccgg catgagcacc 1620
ctgttcctgg tgtacagcaa caagtgccag acccccctgg gcatggcctc tggccacatc 1680
agggacttcc agatcactgc ctctggccag tacggccagt gggcccccaa gctggccagg 1740
ctgcactact ccggaagcat caatgcctgg agcaccaagg agcccttcag ctggatcaaa 1800
gtggacctgc tggcccccat gatcatccac ggcatcaaga cccagggggc caggcagaag 1860
ttctccagcc tgtacatcag ccagttcatc atcatgtaca gcctggacgg caagaagtgg 1920
cagacctaca ggggcaacag caccggcacc ctgatggtgt tcttcggcaa cgtggacagc 1980
agcggcatca agcacaacat cttcaacccc cccatcatcg ccagatacat caggctgcac 2040
cccacccact acagcatcag gagcaccctg aggatggagc tgatgggctg tgacctgaac 2100
agctgcagca tgcccctggg catggagagc aaggccatct ctgacgccca gatcactgcc 2160
tccagctact tcaccaacat gtttgccacc tggagcccca gcaaggccag gctgcacctg 2220
cagggcagga gcaatgcctg gaggccccag gtcaacaacc ccaaggagtg gctgcaggtg 2280
gacttccaga agaccatgaa ggtgactggg gtgaccaccc agggggtgaa gagcctgctg 2340
accagcatgt acgtgaagga gttcctgatc tccagcagcc aggacggcca ccagtggacc 2400
ctgttcttcc agaatggcaa ggtgaaggtg ttccagggca accaggacag cttcacccct 2460
gtggtcaaca gcctggaccc ccccctgctg accagatacc tgaggatcca cccccagagc 2520
tgggtgcacc agatcgccct gaggatggag gtgctgggct gtgaggccca ggacctgtac 2580
tga 2583
<210> 11
<211> 1734
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-25-NT58
<400> 11
gccaccagga gatactacct gggcgccgtg gagctgagct gggactacat gcagtctgac 60
ctgggcgagc tgccagtgga cgccaggttc ccccccagag tgcccaagag cttccccttc 120
aacaccagcg tggtgtacaa gaagaccctg ttcgtggagt tcactgacca cctgttcaac 180
atcgccaagc ccaggccccc ctggatgggc ctgctgggcc ccaccatcca ggccgaggtg 240
tacgacaccg tggtcatcac cctgaagaac atggccagcc accccgtctc cctgcacgcc 300
gtgggggtga gctactggaa ggcctctgag ggcgccgagt acgacgacca gaccagccag 360
agggagaagg aggacgacaa ggtgttccct gggggcagcc acacctacgt gtggcaggtc 420
ctgaaggaga acggccccat ggcctctgac cccctgtgcc tgacctacag ctacctgagc 480
cacgtggacc tggtgaagga cctgaactct ggcctgattg gggccctgct ggtgtgcagg 540
gagggcagcc tggccaagga gaagacccag accctgcaca agttcatcct gctgttcgcc 600
gtgttcgacg agggcaagag ctggcactct gaaaccaaga acagcctgat gcaggacagg 660
gacgccgcct ctgccagggc ctggcccaag atgcacaccg tcaacggcta cgtcaacagg 720
agcctgcctg gcctgattgg ctgccacagg aagagcgtgt actggcatgt gatcggcatg 780
ggcaccaccc ctgaggtgca cagcatcttc ctggagggcc acaccttcct ggtcaggaac 840
cacaggcagg ccagcctgga gatcagcccc atcaccttcc tgaccgccca gaccctgctg 900
atggacctgg gccagttcct gctgttctgc cacatctcca gccaccagca cgacggcatg 960
gaggcctacg tgaaagtgga cagctgccct gaggagcccc agctgaggat gaagaacaac 1020
gaggaggccg aggactatga tgacgacctg accgacagcg agatggacgt ggtcaggttc 1080
gacgacgaca acagccccag cttcatccag atcaggagcg tggccaagaa gcaccccaag 1140
acctgggtgc actacatcgc tgctgaggag gaggactggg actatgcccc cctggtgctg 1200
gcccctgatg acaggagcta caagagccag tacctgaaca atggccccca gaggattggc 1260
aggaagtaca agaaagtcag gttcatggcc tacactgatg aaaccttcaa gaccagggag 1320
gccatccagc atgagtctgg catcctgggc cccctgctgt acggggaggt gggggacacc 1380
ctgctgatca tcttcaagaa ccaggccagc aggccctaca acatctaccc ccatggcatc 1440
accgacgtga ggcccctgta cagcaggagg ctgcctaagg gggtgaagca cctgaaagac 1500
ttccccatcc tgcctgggga gatcttcaag tacaagtgga ctgtgactgt ggaggacggc 1560
cccaccaaga gcgaccccag gtgcctgacc agatactaca gcagcttcgt caacatggag 1620
agggacctgg cctctggcct gattggcccc ctgctgatct gctacaagga gtctgtggac 1680
cagaggggca accagatcat gagcgacaag aggaacgtga tcctgttctc tgtc 1734
<210> 12
<211> 2583
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-25-CT
<400> 12
ttcgacgaga acaggagctg gtacctgact gaaaacatcc agcggttcct ccccaacccc 60
gcgggcgtgc agctggaaga tcctgagttt caggcatcaa acatcatgca ctccattaac 120
ggctacgtgt tcgattcgct gcagctgagc gtgtgtctgc acgaagtggc ctactggtac 180
atcctgtcca ttggtgccca gactgacttc ctgtccgtgt ttttctccgg ctacacgttc 240
aagcacaaga tggtgtacga ggacaccctg accctcttcc ctttttccgg cgaaactgtg 300
tttatgagca tggagaatcc cggcctgtgg atcttgggct gccacaacag cgacttccgt 360
aacagaggaa tgactgcgct gctcaaggtg tccagctgcg acaagaacac cggagactat 420
tatgaggact catacgagga catctccgcc tacctcctgt ccaagaataa cgccattgaa 480
cctcggagct tcagccagaa cccacccgtg cttaagagac atcaacggga gatcactagg 540
accaccctgc agtcagacca ggaggaaatc gactacgatg acaccatctc ggtcgagatg 600
aagaaggagg actttgacat ctacgacgaa gatgaaaacc agagcccgag gtcgttccaa 660
aagaaaaccc gccactactt tattgctgct gtcgagcggc tgtgggacta cggaatgtcg 720
tcctcgccgc acgtgctccg caaccgagcc cagagcggct cggtgccgca attcaagaag 780
gtcgtgttcc aggagttcac tgacgggagc ttcactcagc ctttgtaccg gggagaactc 840
aatgaacatc tcggcctcct cggaccttac atcagagcag aagtggaaga taacatcatg 900
gtcactttcc gtaaccaagc cagccgcccg tactcgttct actcctccct catttcttac 960
gaagaggacc agcggcaggg cgcagaaccg cgcaagaact tcgtgaagcc caacgaaacc 1020
aagacctact tctggaaagt gcagcatcat atggccccga ctaaggacga gtttgactgc 1080
aaagcctggg cctacttctc cgatgtggac ttggagaagg acgtccactc cggcctcatc 1140
ggtcccctgc tcgtgtgcca taccaatacc ctgaaccccg cacacggtcg ccaggtcacc 1200
gtgcaggagt tcgctctgtt cttcactatc ttcgacgaaa ctaagtcctg gtacttcacc 1260
gagaacatgg agaggaactg cagagccccc tgtaacatcc agatggagga cccgacgttc 1320
aaggaaaact accggttcca cgccattaac ggatacatca tggatacgct gccgggtctt 1380
gtgatggccc aggatcaacg gatcagatgg tacttattgt cgatgggcag caacgagaac 1440
atccactcta ttcacttctc cggtcatgtg ttcactgtgc ggaagaagga agagtacaag 1500
atggccctgt acaaccttta tcccggagtg ttcgaaactg tggaaatgct gccgtcgaag 1560
gccggcattt ggcgcgtgga gtgtttgatt ggagaacatc tccatgcggg gatgtcaacc 1620
ctgttcctgg tgtatagcaa caagtgccag actccgcttg ggatggcgtc aggacacatt 1680
agggatttcc agatcactgc gtccggccag tacggccaat gggcccctaa gctggcccgc 1740
ctgcattact ccggatccat taacgcctgg tcaaccaagg agccattctc ctggatcaag 1800
gtggaccttc tggcccccat gattatccac ggaattaaga cccagggggc ccggcagaag 1860
ttctcctcac tgtacatcag ccagttcata atcatgtact ccctggacgg aaagaagtgg 1920
caaacctaca gggggaacag caccggcaca ctgatggtct ttttcggaaa tgtggactcc 1980
tccgggatta agcataacat cttcaaccct ccgattatcg ctcggtacat tagacttcac 2040
cctacccact acagcattcg ctccaccctg cggatggaac tgatgggctg cgatctgaac 2100
tcgtgcagca tgccgttggg aatggagtcc aaagcaattt ccgacgcgca gatcaccgcc 2160
tcgtcctact ttaccaacat gttcgccacg tggtcaccgt ccaaggcccg gctgcacctc 2220
cagggaagat ccaacgcatg gcggccacag gtcaacaacc ctaaggagtg gctccaggtg 2280
gacttccaga aaaccatgaa ggtcaccgga gtcacaaccc agggagtgaa gtcgctgctg 2340
acttctatgt acgtcaagga gttcctgatc tccagcagcc aggacgggca ccagtggacc 2400
ctgttcttcc aaaatggaaa ggtcaaggtg tttcagggca atcaggattc attcaccccg 2460
gtggtgaact cccttgatcc acccctcctg acccgctacc ttcgcatcca cccacagtcc 2520
tgggtgcacc agatcgcgct gaggatggag gtcctgggat gcgaagccca ggacctgtac 2580
tga 2583
<210> 13
<211> 1734
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-26-NT58
<400> 13
gccaccagga gatactacct gggcgccgtg gagctgagct gggactacat gcagtctgac 60
ctgggcgagc tgccagtgga cgccaggttc ccccccagag tgcccaagag cttccccttc 120
aacaccagcg tggtgtacaa gaagaccctg ttcgtggagt tcactgacca cctgttcaac 180
atcgccaagc ccaggccccc ctggatgggc ctgctgggcc ccaccatcca ggccgaggtg 240
tacgacaccg tggtcatcac cctgaagaac atggccagcc accccgtctc cctgcacgcc 300
gtgggggtga gctactggaa ggcctctgag ggcgccgagt acgacgacca gaccagccag 360
agggagaagg aggacgacaa ggtgttccct gggggcagcc acacctacgt gtggcaggtc 420
ctgaaggaga acggccccat ggcctctgac cccctgtgcc tgacctacag ctacctgagc 480
cacgtggacc tggtgaagga cctgaactct ggcctgattg gggccctgct ggtgtgcagg 540
gagggcagcc tggccaagga gaagacccag accctgcaca agttcatcct gctgttcgcc 600
gtgttcgacg agggcaagag ctggcactct gaaaccaaga acagcctgat gcaggacagg 660
gacgccgcct ctgccagggc ctggcccaag atgcacaccg tcaacggcta cgtcaacagg 720
agcctgcctg gcctgattgg ctgccacagg aagagcgtgt actggcatgt gatcggcatg 780
ggcaccaccc ctgaggtgca cagcatcttc ctggagggcc acaccttcct ggtcaggaac 840
cacaggcagg ccagcctgga gatcagcccc atcaccttcc tgaccgccca gaccctgctg 900
atggacctgg gccagttcct gctgttctgc cacatctcca gccaccagca cgacggcatg 960
gaggcctacg tgaaagtgga cagctgccct gaggagcccc agctgaggat gaagaacaac 1020
gaggaggccg aggactatga tgacgacctg accgacagcg agatggacgt ggtcaggttc 1080
gacgacgaca acagccccag cttcatccag atcaggagcg tggccaagaa gcaccccaag 1140
acctgggtgc actacatcgc tgctgaggag gaggactggg actatgcccc cctggtgctg 1200
gcccctgatg acaggagcta caagagccag tacctgaaca atggccccca gaggattggc 1260
aggaagtaca agaaagtcag gttcatggcc tacactgatg aaaccttcaa gaccagggag 1320
gccatccagc atgagtctgg catcctgggc cccctgctgt acggggaggt gggggacacc 1380
ctgctgatca tcttcaagaa ccaggccagc aggccctaca acatctaccc ccatggcatc 1440
accgacgtga ggcccctgta cagcaggagg ctgcctaagg gggtgaagca cctgaaagac 1500
ttccccatcc tgcctgggga gatcttcaag tacaagtgga ctgtgactgt ggaggacggc 1560
cccaccaaga gcgaccccag gtgcctgacc agatactaca gcagcttcgt caacatggag 1620
agggacctgg cctctggcct gattggcccc ctgctgatct gctacaagga gtctgtggac 1680
cagaggggca accagatcat gagcgacaag aggaacgtga tcctgttctc tgtc 1734
<210> 14
<211> 2583
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-26-CT
<400> 14
ttcgacgaga acaggagctg gtacctcact gaaaacatcc agaggttcct cccaaacccc 60
gcaggagtgc aactggagga ccctgagttt caggcctcga atatcatgca ctcgattaac 120
ggttacgtgt tcgactcgct gcagctgagc gtgtgcctcc atgaagtcgc ttactggtac 180
attctgtcca tcggcgccca gactgacttc ctgagcgtgt tcttttccgg ttacaccttt 240
aagcacaaga tggtgtacga agataccctg accctgttcc ctttctccgg cgaaacggtg 300
ttcatgtcga tggagaaccc gggtctgtgg attctgggat gccacaacag cgactttcgg 360
aaccgcggaa tgactgccct gctgaaggtg tcctcatgcg acaagaacac cggagactac 420
tacgaggact cctacgagga tatctcagcc tacctcctgt ccaagaacaa cgcgatcgag 480
ccgcgcagct tcagccagaa cccgcctgtg ctgaagaggc accagcgaga aattacccgg 540
accaccctcc aatcggatca ggaggaaatc gactacgacg acaccatctc ggtggaaatg 600
aagaaggaag atttcgatat ctacgacgag gacgaaaatc agtcccctcg ctcattccaa 660
aagaaaacta gacactactt tatcgccgcg gtggaaagac tgtgggacta tggaatgtca 720
tccagccctc acgtccttcg gaaccgggcc cagagcggat cggtgcctca gttcaagaaa 780
gtggtgttcc aggagttcac cgacggcagc ttcacccagc cgctgtaccg gggagaactg 840
aacgaacacc tgggcctgct cggtccctac atccgcgcgg aagtggagga taacatcatg 900
gtgaccttcc gtaaccaagc atccagacct tactccttct attcctccct gatctcatac 960
gaggaggacc agcgccaagg cgccgagccc cgcaagaact tcgtcaagcc caacgagact 1020
aagacctact tctggaaggt ccaacaccat atggccccga ccaaggatga gtttgactgc 1080
aaggcctggg cctacttctc cgacgtggac cttgagaagg atgtccattc cggcctgatc 1140
gggccgctgc tcgtgtgtca caccaacacc ctgaacccag cgcatggacg ccaggtcacc 1200
gtccaggagt ttgctctgtt cttcaccatt tttgacgaaa ctaagtcctg gtacttcacc 1260
gagaatatgg agcgaaactg tagagcgccc tgcaatatcc agatggaaga tccgactttc 1320
aaggagaact atagattcca cgccatcaac gggtacatca tggatactct gccggggctg 1380
gtcatggccc aggatcagag gattcggtgg tacttgctgt caatgggatc gaacgaaaac 1440
attcactcca ttcacttctc cggtcacgtg ttcactgtgc gcaagaagga ggagtacaag 1500
atggcgctgt acaatctgta ccccggggtg ttcgaaactg tggagatgct gccgtccaag 1560
gccggcatct ggagagtgga gtgcctgatc ggagagcacc tccacgcggg gatgtccacc 1620
ctcttcctgg tgtactcgaa taagtgccag accccgctgg gcatggcctc gggccacatc 1680
agagacttcc agatcacagc aagcggacaa tacggccaat gggcgccgaa gctggcccgc 1740
ttgcactact ccggatcgat caacgcatgg tccaccaagg aaccgttctc gtggattaag 1800
gtggacctcc tggcccctat gattatccac ggaattaaga cccagggcgc caggcagaag 1860
ttctcctccc tgtacatctc gcaattcatc atcatgtaca gcctggacgg gaagaagtgg 1920
cagacttaca ggggaaactc caccggcacc ctgatggtct ttttcggcaa cgtggattcc 1980
tccggcatta agcacaacat cttcaaccca ccgatcatag ccagatatat taggctccac 2040
cccactcact actcaatccg ctcaactctt cggatggaac tcatggggtg cgacctgaac 2100
tcctgctcca tgccgttggg gatggaatca aaggctatta gcgacgccca gatcaccgcg 2160
agctcctact tcactaacat gttcgccacc tggagcccct ccaaggccag gctgcacttg 2220
cagggacggt caaatgcctg gcggccgcaa gtgaacaatc cgaaggaatg gcttcaagtg 2280
gatttccaaa agaccatgaa agtgaccgga gtcaccaccc agggagtgaa gtcccttctg 2340
acctcgatgt atgtgaagga gttcctgatt agcagcagcc aggacgggca ccagtggacc 2400
ctgttcttcc aaaacggaaa ggtcaaggtg ttccagggga accaggactc gttcacaccc 2460
gtggtgaact ccctggaccc cccactgctg acgcggtact tgaggattca tcctcagtcc 2520
tgggtccatc agattgcatt gcgaatggaa gtcctgggct gcgaggccca ggacctgtac 2580
tga 2583
<210> 15
<211> 2332
<212> PRT
<213> 智人
<400> 15
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala
725 730 735
Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro Ser Thr Arg
740 745 750
Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp Ile Glu Lys
755 760 765
Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys Ile Gln Asn
770 775 780
Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser Pro Thr Pro
785 790 795 800
His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr Glu Thr Phe
805 810 815
Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn Ser Leu Ser
820 825 830
Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly Asp Met Val
835 840 845
Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu Lys Leu Gly
850 855 860
Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys Val Ser Ser
865 870 875 880
Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn Leu Ala Ala
885 890 895
Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met Pro Val His
900 905 910
Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys Ser Ser Pro
915 920 925
Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu Asn Asn Asp
930 935 940
Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu Ser Ser Trp
945 950 955 960
Gly Lys Asn Val Ser Ser Thr Glu Ser Gly Arg Leu Phe Lys Gly Lys
965 970 975
Arg Ala His Gly Pro Ala Leu Leu Thr Lys Asp Asn Ala Leu Phe Lys
980 985 990
Val Ser Ile Ser Leu Leu Lys Thr Asn Lys Thr Ser Asn Asn Ser Ala
995 1000 1005
Thr Asn Arg Lys Thr His Ile Asp Gly Pro Ser Leu Leu Ile Glu
1010 1015 1020
Asn Ser Pro Ser Val Trp Gln Asn Ile Leu Glu Ser Asp Thr Glu
1025 1030 1035
Phe Lys Lys Val Thr Pro Leu Ile His Asp Arg Met Leu Met Asp
1040 1045 1050
Lys Asn Ala Thr Ala Leu Arg Leu Asn His Met Ser Asn Lys Thr
1055 1060 1065
Thr Ser Ser Lys Asn Met Glu Met Val Gln Gln Lys Lys Glu Gly
1070 1075 1080
Pro Ile Pro Pro Asp Ala Gln Asn Pro Asp Met Ser Phe Phe Lys
1085 1090 1095
Met Leu Phe Leu Pro Glu Ser Ala Arg Trp Ile Gln Arg Thr His
1100 1105 1110
Gly Lys Asn Ser Leu Asn Ser Gly Gln Gly Pro Ser Pro Lys Gln
1115 1120 1125
Leu Val Ser Leu Gly Pro Glu Lys Ser Val Glu Gly Gln Asn Phe
1130 1135 1140
Leu Ser Glu Lys Asn Lys Val Val Val Gly Lys Gly Glu Phe Thr
1145 1150 1155
Lys Asp Val Gly Leu Lys Glu Met Val Phe Pro Ser Ser Arg Asn
1160 1165 1170
Leu Phe Leu Thr Asn Leu Asp Asn Leu His Glu Asn Asn Thr His
1175 1180 1185
Asn Gln Glu Lys Lys Ile Gln Glu Glu Ile Glu Lys Lys Glu Thr
1190 1195 1200
Leu Ile Gln Glu Asn Val Val Leu Pro Gln Ile His Thr Val Thr
1205 1210 1215
Gly Thr Lys Asn Phe Met Lys Asn Leu Phe Leu Leu Ser Thr Arg
1220 1225 1230
Gln Asn Val Glu Gly Ser Tyr Asp Gly Ala Tyr Ala Pro Val Leu
1235 1240 1245
Gln Asp Phe Arg Ser Leu Asn Asp Ser Thr Asn Arg Thr Lys Lys
1250 1255 1260
His Thr Ala His Phe Ser Lys Lys Gly Glu Glu Glu Asn Leu Glu
1265 1270 1275
Gly Leu Gly Asn Gln Thr Lys Gln Ile Val Glu Lys Tyr Ala Cys
1280 1285 1290
Thr Thr Arg Ile Ser Pro Asn Thr Ser Gln Gln Asn Phe Val Thr
1295 1300 1305
Gln Arg Ser Lys Arg Ala Leu Lys Gln Phe Arg Leu Pro Leu Glu
1310 1315 1320
Glu Thr Glu Leu Glu Lys Arg Ile Ile Val Asp Asp Thr Ser Thr
1325 1330 1335
Gln Trp Ser Lys Asn Met Lys His Leu Thr Pro Ser Thr Leu Thr
1340 1345 1350
Gln Ile Asp Tyr Asn Glu Lys Glu Lys Gly Ala Ile Thr Gln Ser
1355 1360 1365
Pro Leu Ser Asp Cys Leu Thr Arg Ser His Ser Ile Pro Gln Ala
1370 1375 1380
Asn Arg Ser Pro Leu Pro Ile Ala Lys Val Ser Ser Phe Pro Ser
1385 1390 1395
Ile Arg Pro Ile Tyr Leu Thr Arg Val Leu Phe Gln Asp Asn Ser
1400 1405 1410
Ser His Leu Pro Ala Ala Ser Tyr Arg Lys Lys Asp Ser Gly Val
1415 1420 1425
Gln Glu Ser Ser His Phe Leu Gln Gly Ala Lys Lys Asn Asn Leu
1430 1435 1440
Ser Leu Ala Ile Leu Thr Leu Glu Met Thr Gly Asp Gln Arg Glu
1445 1450 1455
Val Gly Ser Leu Gly Thr Ser Ala Thr Asn Ser Val Thr Tyr Lys
1460 1465 1470
Lys Val Glu Asn Thr Val Leu Pro Lys Pro Asp Leu Pro Lys Thr
1475 1480 1485
Ser Gly Lys Val Glu Leu Leu Pro Lys Val His Ile Tyr Gln Lys
1490 1495 1500
Asp Leu Phe Pro Thr Glu Thr Ser Asn Gly Ser Pro Gly His Leu
1505 1510 1515
Asp Leu Val Glu Gly Ser Leu Leu Gln Gly Thr Glu Gly Ala Ile
1520 1525 1530
Lys Trp Asn Glu Ala Asn Arg Pro Gly Lys Val Pro Phe Leu Arg
1535 1540 1545
Val Ala Thr Glu Ser Ser Ala Lys Thr Pro Ser Lys Leu Leu Asp
1550 1555 1560
Pro Leu Ala Trp Asp Asn His Tyr Gly Thr Gln Ile Pro Lys Glu
1565 1570 1575
Glu Trp Lys Ser Gln Glu Lys Ser Pro Glu Lys Thr Ala Phe Lys
1580 1585 1590
Lys Lys Asp Thr Ile Leu Ser Leu Asn Ala Cys Glu Ser Asn His
1595 1600 1605
Ala Ile Ala Ala Ile Asn Glu Gly Gln Asn Lys Pro Glu Ile Glu
1610 1615 1620
Val Thr Trp Ala Lys Gln Gly Arg Thr Glu Arg Leu Cys Ser Gln
1625 1630 1635
Asn Pro Pro Val Leu Lys Arg His Gln Arg Glu Ile Thr Arg Thr
1640 1645 1650
Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile
1655 1660 1665
Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp
1670 1675 1680
Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr
1685 1690 1695
Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser
1700 1705 1710
Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro
1715 1720 1725
Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe
1730 1735 1740
Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu
1745 1750 1755
Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val
1760 1765 1770
Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser
1775 1780 1785
Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg
1790 1795 1800
Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys
1805 1810 1815
Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys
1820 1825 1830
Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His
1835 1840 1845
Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu
1850 1855 1860
Asn Pro Ala His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu
1865 1870 1875
Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu
1880 1885 1890
Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu
1895 1900 1905
Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly
1910 1915 1920
Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln
1925 1930 1935
Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile
1940 1945 1950
His Ser Ile His Phe Ser Gly His Val Phe Thr Val Arg Lys Lys
1955 1960 1965
Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe
1970 1975 1980
Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val
1985 1990 1995
Glu Cys Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu
2000 2005 2010
Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala
2015 2020 2025
Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr
2030 2035 2040
Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser
2045 2050 2055
Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val
2060 2065 2070
Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly
2075 2080 2085
Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile
2090 2095 2100
Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn
2105 2110 2115
Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser
2120 2125 2130
Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr
2135 2140 2145
Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg
2150 2155 2160
Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu
2165 2170 2175
Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser
2180 2185 2190
Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala
2195 2200 2205
Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val
2210 2215 2220
Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met
2225 2230 2235
Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr
2240 2245 2250
Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly
2255 2260 2265
His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe
2270 2275 2280
Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp
2285 2290 2295
Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp
2300 2305 2310
Val His Gln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala
2315 2320 2325
Gln Asp Leu Tyr
2330
<210> 16
<211> 4371
<212> DNA
<213> 人工序列
<220>
<223> BDD-FVIII (非优化;“亲本”),核苷酸序列
<400> 16
atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc 60
accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc 120
ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac 180
acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc 240
gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat 300
gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt 360
ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg 420
gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg 480
aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat 540
gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa 600
gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta 660
tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat 720
gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct 780
ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc 840
accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat 900
cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg 960
gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa 1020
gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa 1080
gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat 1140
gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact 1200
tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc 1260
cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg 1320
aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct 1380
attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg 1440
ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact 1500
gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt 1560
ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca 1620
actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga 1680
gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa 1740
agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag 1800
aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg 1860
cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt 1920
tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc 1980
attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa 2040
atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg 2100
atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc 2160
atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac 2220
agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc 2280
ttctctcaaa acccaccagt cttgaaacgc catcaacggg aaataactcg tactactctt 2340
cagtcagatc aagaggaaat tgactatgat gataccatat cagttgaaat gaagaaggaa 2400
gattttgaca tttatgatga ggatgaaaat cagagccccc gcagctttca aaagaaaaca 2460
cgacactatt ttattgctgc agtggagagg ctctgggatt atgggatgag tagctcccca 2520
catgttctaa gaaacagggc tcagagtggc agtgtccctc agttcaagaa agttgttttc 2580
caggaattta ctgatggctc ctttactcag cccttatacc gtggagaact aaatgaacat 2640
ttgggactcc tggggccata tataagagca gaagttgaag ataatatcat ggtaactttc 2700
agaaatcagg cctctcgtcc ctattccttc tattctagcc ttatttctta tgaggaagat 2760
cagaggcaag gagcagaacc tagaaaaaac tttgtcaagc ctaatgaaac caaaacttac 2820
ttttggaaag tgcaacatca tatggcaccc actaaagatg agtttgactg caaagcctgg 2880
gcttatttct ctgatgttga cctggaaaaa gatgtgcact caggcctgat tggacccctt 2940
ctggtctgcc acactaacac actgaaccct gctcatggga gacaagtgac agtacaggaa 3000
tttgctctgt ttttcaccat ctttgatgag accaaaagct ggtacttcac tgaaaatatg 3060
gaaagaaact gcagggctcc ctgcaatatc cagatggaag atcccacttt taaagagaat 3120
tatcgcttcc atgcaatcaa tggctacata atggatacac tacctggctt agtaatggct 3180
caggatcaaa ggattcgatg gtatctgctc agcatgggca gcaatgaaaa catccattct 3240
attcatttca gtggacatgt gttcactgta cgaaaaaaag aggagtataa aatggcactg 3300
tacaatctct atccaggtgt ttttgagaca gtggaaatgt taccatccaa agctggaatt 3360
tggcgggtgg aatgccttat tggcgagcat ctacatgctg ggatgagcac actttttctg 3420
gtgtacagca ataagtgtca gactcccctg ggaatggctt ctggacacat tagagatttt 3480
cagattacag cttcaggaca atatggacag tgggccccaa agctggccag acttcattat 3540
tccggatcaa tcaatgcctg gagcaccaag gagccctttt cttggatcaa ggtggatctg 3600
ttggcaccaa tgattattca cggcatcaag acccagggtg cccgtcagaa gttctccagc 3660
ctctacatct ctcagtttat catcatgtat agtcttgatg ggaagaagtg gcagacttat 3720
cgaggaaatt ccactggaac cttaatggtc ttctttggca atgtggattc atctgggata 3780
aaacacaata tttttaaccc tccaattatt gctcgataca tccgtttgca cccaactcat 3840
tatagcattc gcagcactct tcgcatggag ttgatgggct gtgatttaaa tagttgcagc 3900
atgccattgg gaatggagag taaagcaata tcagatgcac agattactgc ttcatcctac 3960
tttaccaata tgtttgccac ctggtctcct tcaaaagctc gacttcacct ccaagggagg 4020
agtaatgcct ggagacctca ggtgaataat ccaaaagagt ggctgcaagt ggacttccag 4080
aagacaatga aagtcacagg agtaactact cagggagtaa aatctctgct taccagcatg 4140
tatgtgaagg agttcctcat ctccagcagt caagatggcc atcagtggac tctctttttt 4200
cagaatggca aagtaaaggt ttttcaggga aatcaagact ccttcacacc tgtggtgaac 4260
tctctagacc caccgttact gactcgctac cttcgaattc acccccagag ttgggtgcac 4320
cagattgccc tgaggatgga ggttctgggc tgcgaggcac aggacctcta c 4371
<210> 17
<211> 1438
<212> PRT
<213> 人工序列
<220>
<223> BDD-FVIII (非优化;“亲本”),氨基酸序列
<400> 17
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala
725 730 735
Ile Glu Pro Arg Ser Phe Ser Gln Asn Pro Pro Val Leu Lys Arg His
740 745 750
Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile
755 760 765
Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp
770 775 780
Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys
785 790 795 800
Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly
805 810 815
Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser
820 825 830
Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser
835 840 845
Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu
850 855 860
Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr
865 870 875 880
Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile
885 890 895
Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe
900 905 910
Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His
915 920 925
Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe
930 935 940
Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro
945 950 955 960
Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln
965 970 975
Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr
980 985 990
Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro
995 1000 1005
Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg
1010 1015 1020
Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu
1025 1030 1035
Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met
1040 1045 1050
Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val
1055 1060 1065
Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn
1070 1075 1080
Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys
1085 1090 1095
Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His
1100 1105 1110
Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln
1115 1120 1125
Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile
1130 1135 1140
Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg
1145 1150 1155
Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro
1160 1165 1170
Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His
1175 1180 1185
Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr
1190 1195 1200
Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp
1205 1210 1215
Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe
1220 1225 1230
Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro
1235 1240 1245
Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser
1250 1255 1260
Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn
1265 1270 1275
Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp
1280 1285 1290
Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr
1295 1300 1305
Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn
1310 1315 1320
Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val
1325 1330 1335
Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly
1340 1345 1350
Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile
1355 1360 1365
Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn
1370 1375 1380
Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro
1385 1390 1395
Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg
1400 1405 1410
Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu
1415 1420 1425
Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1430 1435
<210> 18
<211> 450
<212> DNA
<213> 人工序列
<220>
<223> XTEN核苷酸序列
<400> 18
ggcgcgccaa catcagagag cgccacccct gaaagtggtc ccgggagcga gccagccaca 60
tctgggtcgg aaacgccagg cacaagtgag tctgcaactc ccgagtccgg acctggctcc 120
gagcctgcca ctagcggctc cgagactccg ggaacttccg agagcgctac accagaaagc 180
ggacccggaa ccagtaccga acctagcgag ggctctgctc cgggcagccc agccggctct 240
cctacatcca cggaggaggg cacttccgaa tccgccaccc cggagtcagg gccaggatct 300
gaacccgcta cctcaggcag tgagacgcca ggaacgagcg agtccgctac accggagagt 360
gggccaggga gccctgctgg atctcctacg tccactgagg aagggtcacc agcgggctcg 420
cccaccagca ctgaagaagg tgcctcgagc 450
<210> 19
<211> 4824
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-52-XTEN
<400> 19
atgcaaatcg aactgagcac ctgtttcttc ctctgcctgc tgagattctg tttctccgcg 60
acccgccgat actacctggg agcagtggag ctctcctggg attacatgca gagcgacctt 120
ggggagctgc ccgtggatgc caggttccct ccccgggtgc caaagtcgtt tccgttcaac 180
acctccgtgg tgtacaagaa aactctgttc gtggagttca ccgaccacct gttcaatatc 240
gccaagccca gacctccctg gatggggctg ttgggaccta ccatccaagc ggaggtgtac 300
gacactgtgg tcatcactct gaagaacatg gcctcgcatc ccgtgtccct gcacgccgtg 360
ggagtgtctt actggaaagc gtccgagggg gccgaatacg acgaccagac ctcgcagaga 420
gaaaaggaag atgacaaggt gttcccagga ggatcgcaca cctacgtgtg gcaagtgttg 480
aaggagaacg gcccaatggc ctccgacccg ctgtgcctga cctactcgta cctgtcccac 540
gtggacctcg tgaaggacct caactcggga ctgattggag ccctgctggt ctgcagggaa 600
ggctcactgg cgaaagaaaa gactcagacc ttgcacaagt tcattctgct gttcgctgtg 660
ttcgacgagg ggaagtcgtg gcacagcgag actaagaact ccctgatgca agatagagat 720
gccgcctccg cccgggcctg gcctaagatg cacaccgtga acggttacgt gaaccgctcc 780
ctccctggcc tgattggatg ccaccggaag tccgtgtact ggcacgtgat cgggatgggg 840
accacccccg aggtgcacag catcttcctg gaaggtcaca catttctcgt gcgcaaccac 900
cggcaggcct ccctggaaat cagccccatt accttcctca ctgcccagac tctgctgatg 960
gacctgggac agttcctgct gttctgccat atctcctccc accaacatga cggaatggag 1020
gcatacgtga aggtcgattc ctgccctgag gaaccccagc tccgcatgaa gaacaatgag 1080
gaagccgagg actacgacga cgacctgacg gatagcgaga tggatgtggt ccggttcgat 1140
gacgataaca gcccttcctt catccaaatt cgctcggtgg caaagaagca ccccaagacc 1200
tgggtgcatt acattgcggc ggaagaagag gactgggatt atgccccgct tgtcctcgct 1260
cctgacgacc ggagctacaa gagccagtac ctgaacaacg gtccacagag gatcggtaga 1320
aagtacaaga aggtccgctt catggcctat accgacgaaa ccttcaaaac tagagaggcc 1380
atccaacacg aatccggcat cctgggcccg ctcttgtacg gagaagtcgg cgacaccctt 1440
ctcattatct tcaagaacca ggcttcccgg ccgtacaaca tctatccgca tgggatcact 1500
gacgtgcgcc cactgtactc gcggcgcctg cccaagggtg tcaaacacct gaaggatttt 1560
ccgatccttc cgggagaaat cttcaagtac aagtggaccg tgaccgtgga agatggccca 1620
actaagtctg accctagatg cctcacccgc tactactcat ccttcgtcaa catggagcgc 1680
gacctggcca gcggactgat cggcccgctg ctgatttgct acaaggaatc agtggaccaa 1740
cggggaaacc agatcatgtc ggataagagg aacgtcatcc tcttctccgt gtttgacgaa 1800
aaccggtcgt ggtacctgac cgagaacatc cagaggttcc tgcccaaccc tgctggggtg 1860
cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa tggctacgtg 1920
ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc 1980
atcggcgccc agaccgactt cctgagcgtg ttcttctctg gctacacctt caagcacaag 2040
atggtgtatg aggacaccct gaccctgttc cccttcagcg gggagactgt cttcatgagc 2100
atggagaacc ctggcctgtg gatcctgggc tgccacaaca gcgacttcag gaacaggggc 2160
atgactgccc tgctgaaagt ctccagctgt gacaagaaca ccggggacta ctacgaggac 2220
agctacgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcccaggagc 2280
ttctctcaga acggcgcgcc aacatcagag agcgccaccc ctgaaagtgg tcccgggagc 2340
gagccagcca catctgggtc ggaaacgcca ggcacaagtg agtctgcaac tcccgagtcc 2400
ggacctggct ccgagcctgc cactagcggc tccgagactc cgggaacttc cgagagcgct 2460
acaccagaaa gcggacccgg aaccagtacc gaacctagcg agggctctgc tccgggcagc 2520
ccagccggct ctcctacatc cacggaggag ggcacttccg aatccgccac cccggagtca 2580
gggccaggat ctgaacccgc tacctcaggc agtgagacgc caggaacgag cgagtccgct 2640
acaccggaga gtgggccagg gagccctgct ggatctccta cgtccactga ggaagggtca 2700
ccagcgggct cgcccaccag cactgaagaa ggtgcctcga gccccccagt gctgaagagg 2760
caccagaggg agatcaccag gaccaccctg cagtctgacc aggaggagat cgactatgat 2820
gacaccatca gcgtggagat gaagaaggag gacttcgaca tctacgacga ggacgagaac 2880
cagagcccca ggagcttcca gaagaagacc aggcactact tcattgctgc tgtggagagg 2940
ctgtgggact atggcatgtc cagcagcccc catgtgctga ggaacagggc ccagtctggc 3000
agcgtgcccc agttcaagaa agtcgtgttc caggagttca ccgacggcag cttcacccag 3060
cccctgtaca gaggggagct gaacgagcac ctgggcctgc tgggccccta catcagggcc 3120
gaggtggagg acaacatcat ggtgaccttc aggaaccagg ccagcaggcc ctacagcttc 3180
tacagcagcc tgatcagcta cgaggaggac cagaggcagg gggctgagcc caggaagaac 3240
tttgtgaagc ccaatgaaac caagacctac ttctggaagg tgcagcacca catggccccc 3300
accaaggacg agttcgactg caaggcctgg gcctacttct ctgacgtgga cctggagaag 3360
gacgtgcact ctggcctgat tggccccctg ctggtgtgcc acaccaacac cctgaaccct 3420
gcccatggca ggcaggtgac tgtgcaggag ttcgccctgt tcttcaccat cttcgatgaa 3480
accaagagct ggtacttcac tgagaacatg gagaggaact gcagggcccc ctgcaacatc 3540
cagatggagg accccacctt caaggagaac tacaggttcc atgccatcaa tggctacatc 3600
atggacaccc tgcctggcct ggtcatggcc caggaccaga ggatcaggtg gtatctgctg 3660
agcatgggca gcaacgagaa catccacagc atccacttct ctggccacgt gttcactgtg 3720
aggaagaagg aggagtacaa gatggccctg tacaacctgt accctggggt gttcgaaacc 3780
gtggagatgc tgcccagcaa ggccggcatc tggagggtgg agtgcctgat tggggagcac 3840
ctgcacgccg gcatgagcac cctgttcctg gtgtacagca acaagtgcca gacccccctg 3900
ggcatggcct ctggccacat cagggacttc cagatcactg cctctggcca gtacggccag 3960
tgggccccca agctggccag gctgcactac tccggaagca tcaatgcctg gagcaccaag 4020
gagcccttca gctggatcaa agtggacctg ctggccccca tgatcatcca cggcatcaag 4080
acccaggggg ccaggcagaa gttctccagc ctgtacatca gccagttcat catcatgtac 4140
agcctggacg gcaagaagtg gcagacctac aggggcaaca gcaccggcac cctgatggtg 4200
ttcttcggca acgtggacag cagcggcatc aagcacaaca tcttcaaccc ccccatcatc 4260
gccagataca tcaggctgca ccccacccac tacagcatca ggagcaccct gaggatggag 4320
ctgatgggct gtgacctgaa cagctgcagc atgcccctgg gcatggagag caaggccatc 4380
tctgacgccc agatcactgc ctccagctac ttcaccaaca tgtttgccac ctggagcccc 4440
agcaaggcca ggctgcacct gcagggcagg agcaatgcct ggaggcccca ggtcaacaac 4500
cccaaggagt ggctgcaggt ggacttccag aagaccatga aggtgactgg ggtgaccacc 4560
cagggggtga agagcctgct gaccagcatg tacgtgaagg agttcctgat ctccagcagc 4620
caggacggcc accagtggac cctgttcttc cagaatggca aggtgaaggt gttccagggc 4680
aaccaggaca gcttcacccc tgtggtcaac agcctggacc cccccctgct gaccagatac 4740
ctgaggatcc acccccagag ctgggtgcac cagatcgccc tgaggatgga ggtgctgggc 4800
tgtgaggccc aggacctgta ctga 4824
<210> 20
<211> 4824
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-1-XTEN
<400> 20
atgcagattg agctgtctac ttgctttttc ctgtgcctgc tgaggttttg cttttccgct 60
acacgaaggt attatctggg ggctgtggaa ctgtcttggg attacatgca gagtgacctg 120
ggagagctgc cagtggacgc aaggtttccc cctagagtcc ctaagtcatt ccccttcaac 180
actagcgtgg tctacaagaa aacactgttc gtggagttta ctgatcacct gttcaacatc 240
gcaaagccta ggccaccctg gatgggactg ctggggccaa caatccaggc cgaggtgtac 300
gacaccgtgg tcattacact taagaacatg gcctcacacc ccgtgagcct gcatgctgtg 360
ggcgtcagct actggaaggc ttccgaagga gcagagtatg acgatcagac ttcccagaga 420
gaaaaagagg acgataaggt gtttcctggc ggatctcata cctacgtgtg gcaggtcctg 480
aaagagaatg gccctatggc ctccgaccct ctgtgcctga cctactctta tctgagtcac 540
gtggacctgg tcaaggatct gaacagcggc ctgatcggag ccctgctggt gtgcagggaa 600
ggaagcctgg ctaaggagaa aacccagaca ctgcataagt tcattctgct gttcgccgtg 660
tttgacgaag ggaaatcatg gcacagcgag acaaagaata gtctgatgca ggacagggat 720
gccgcttcag ccagagcttg gcccaaaatg cacactgtga acggctacgt caatcgctca 780
ctgcctgggc tgatcggctg ccaccgaaag agcgtgtatt ggcatgtcat cgggatgggc 840
accacacctg aagtgcactc cattttcctg gagggacata cctttctggt ccgcaaccac 900
cgacaggctt ccctggagat ctctccaatt accttcctga cagcacagac tctgctgatg 960
gacctggggc agttcctgct gttttgccac atcagctccc accagcatga tggcatggag 1020
gcttacgtga aagtggactc ttgtcccgag gaacctcagc tgcggatgaa gaacaatgag 1080
gaagcagaag actatgacga tgacctgacc gactccgaga tggatgtggt ccgattcgat 1140
gacgataaca gcccctcctt tatccagatt agatctgtgg ccaagaaaca ccctaagaca 1200
tgggtccatt acatcgcagc cgaggaagag gactgggatt atgcaccact ggtgctggca 1260
ccagacgatc gctcctacaa atctcagtat ctgaacaatg ggccacagag gattggcaga 1320
aagtacaaga aagtgcggtt catggcatat accgatgaga ccttcaagac tcgcgaagcc 1380
atccagcacg agagcggcat cctgggacca ctgctgtacg gagaagtggg agacaccctg 1440
ctgatcattt tcaagaacca ggccagccgg ccttacaata tctatccaca tgggattaca 1500
gatgtgcgcc ctctgtacag caggagactg ccaaagggcg tcaaacacct gaaggacttc 1560
ccaatcctgc ccggagaaat cttcaagtac aagtggactg tcaccgtcga ggatggcccc 1620
actaagagcg accctcggtg cctgacccgc tactattcta gtttcgtgaa tatggaaaga 1680
gatctggcaa gcggactgat cggaccactg ctgatttgtt acaaagagag cgtggatcag 1740
agaggcaacc agatcatgtc cgacaagcgg aatgtgattc tgttcagtgt ctttgacgaa 1800
aacaggtcat ggtacctgac cgagaacatc cagagattcc tgcctaatcc agctggggtg 1860
cagctggaag atcctgagtt tcaggcatct aacatcatgc atagtattaa tggctacgtg 1920
ttcgacagtt tgcagctgag cgtgtgcctg cacgaggtcg cttactggta tatcctgagc 1980
attggggcac agacagattt cctgagcgtg ttcttttccg gctacacttt taagcataaa 2040
atggtctatg aggacacact gactctgttc cccttcagcg gcgaaaccgt gtttatgagc 2100
atggagaatc ccggactgtg gattctgggg tgccacaaca gcgatttcag aaatcgcgga 2160
atgactgccc tgctgaaagt gtcaagctgt gacaagaaca ccggggacta ctatgaagat 2220
tcatacgagg acatcagcgc atatctgctg tccaaaaaca atgccattga accccggtct 2280
tttagtcaga atggcgcgcc aacatcagag agcgccaccc ctgaaagtgg tcccgggagc 2340
gagccagcca catctgggtc ggaaacgcca ggcacaagtg agtctgcaac tcccgagtcc 2400
ggacctggct ccgagcctgc cactagcggc tccgagactc cgggaacttc cgagagcgct 2460
acaccagaaa gcggacccgg aaccagtacc gaacctagcg agggctctgc tccgggcagc 2520
ccagccggct ctcctacatc cacggaggag ggcacttccg aatccgccac cccggagtca 2580
gggccaggat ctgaacccgc tacctcaggc agtgagacgc caggaacgag cgagtccgct 2640
acaccggaga gtgggccagg gagccctgct ggatctccta cgtccactga ggaagggtca 2700
ccagcgggct cgcccaccag cactgaagaa ggtgcctcga gccctccagt gctgaagcgg 2760
caccagcgcg agatcacccg cactaccctg cagagtgatc aggaagagat cgactacgac 2820
gatacaattt ctgtggaaat gaagaaagag gacttcgata tctatgacga agatgagaac 2880
cagagtcctc gatcattcca gaagaaaacc aggcattact ttattgccgc agtggagcgg 2940
ctgtgggatt atggcatgtc ctctagtcct cacgtgctgc gaaatagggc ccagtcagga 3000
agcgtcccac agttcaagaa agtggtcttc caggagttta cagacgggtc ctttactcag 3060
ccactgtaca ggggcgaact gaacgagcac ctgggactgc tggggcccta tatcagagca 3120
gaagtggagg ataacattat ggtcaccttc agaaatcagg cctctcggcc ttacagtttt 3180
tattcaagcc tgatctctta cgaagaggac cagcgacagg gagctgaacc acgaaaaaac 3240
ttcgtgaagc ctaatgagac caaaacatac ttttggaagg tgcagcacca tatggcccca 3300
acaaaagacg agttcgattg caaggcatgg gcctattttt ctgacgtgga tctggagaag 3360
gacgtgcaca gtggcctgat tggcccactg ctggtgtgcc atactaacac cctgaatcca 3420
gcccacggcc ggcaggtcac tgtccaggag ttcgctctgt tctttaccat ctttgatgag 3480
acaaagagct ggtacttcac cgaaaacatg gagcgaaatt gcagggctcc atgtaacatt 3540
cagatggaag accccacatt caaggagaac taccgctttc atgctatcaa tggatacatc 3600
atggatactc tgcccgggct ggtcatggca caggaccaga gaatccggtg gtatctgctg 3660
agcatgggca gcaacgagaa tatccactca attcatttca gcgggcacgt gtttactgtc 3720
aggaagaaag aagagtacaa gatggccctg tacaacctgt atcccggcgt gttcgaaacc 3780
gtcgagatgc tgcctagcaa ggccggaatc tggagagtgg aatgcctgat tggagagcac 3840
ctgcatgctg ggatgtctac cctgtttctg gtgtacagta ataagtgtca gacacccctg 3900
ggaatggcat ccgggcatat cagggatttc cagattaccg catctggaca gtacggacag 3960
tgggcaccta agctggctag actgcactat tccggatcta tcaacgcttg gtccacaaaa 4020
gagcctttct cttggattaa ggtggacctg ctggccccaa tgatcattca tggcatcaaa 4080
actcagggag ctcggcagaa gttctcctct ctgtacatct cacagtttat catcatgtac 4140
agcctggatg ggaagaaatg gcagacatac cgcggcaata gcacaggaac tctgatggtg 4200
ttctttggca acgtggacag cagcggaatc aagcacaaca ttttcaatcc ccctatcatt 4260
gctagataca tccggctgca cccaacccat tattctattc gaagtacact gaggatggaa 4320
ctgatgggat gcgatctgaa cagttgttca atgcccctgg ggatggagtc caaggcaatc 4380
tctgacgccc agattaccgc cagctcctac ttcactaata tgtttgctac ctggagccct 4440
tccaaagcaa gactgcacct gcaaggccgc agcaacgcat ggcgaccaca ggtgaacaat 4500
cccaaggagt ggttgcaggt cgattttcag aaaactatga aggtgaccgg ggtcacaact 4560
cagggcgtga aaagtctgct gacctcaatg tacgtcaagg agttcctgat ctctagttca 4620
caggacggac atcagtggac actgttcttt cagaacggga aggtgaaagt cttccagggc 4680
aatcaggatt cctttacacc tgtggtcaac agtctagacc ctccactgct gaccagatac 4740
ctgagaatcc accctcagtc ctgggtgcac cagattgccc tgagaatgga agtgctggga 4800
tgcgaggccc aggatctgta ctga 4824
<210> 21
<211> 6
<212> DNA
<213> 人工序列
<220>
<223> MAR/ARS
<400> 21
atattt 6
<210> 22
<211> 6
<212> DNA
<213> 人工序列
<220>
<223> MAR/ARS
<400> 22
aaatat 6
<210> 23
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 去稳定元件
<400> 23
attta 5
<210> 24
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 去稳定元件
<400> 24
taaat 5
<210> 25
<211> 6
<212> DNA
<213> 人工序列
<220>
<223> poly-T位点
<400> 25
tttttt 6
<210> 26
<211> 7
<212> DNA
<213> 人工序列
<220>
<223> poly-A位点
<400> 26
aaaaaaa 7
<210> 27
<211> 6
<212> DNA
<213> 人工序列
<220>
<223> 剪接位点
<400> 27
ggtgat 6
<210> 28
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> TATA盒
<400> 28
tataa 5
<210> 29
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> TATA盒
<400> 29
ttata 5
<210> 30
<211> 8
<212> DNA
<213> 人工序列
<220>
<223> 富AU序列元件
<400> 30
attttatt 8
<210> 31
<211> 8
<212> DNA
<213> 人工序列
<220>
<223> 富AU序列元件
<400> 31
atttttaa 8
<210> 32
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> kozak共有序列
<400> 32
gccgccacca tgc 13
<210> 33
<211> 32
<212> PRT
<213> 人工序列
<220>
<223> CTP肽
<400> 33
Asp Pro Arg Phe Gln Asp Ser Ser Ser Ser Lys Ala Pro Pro Pro Ser
1 5 10 15
Leu Pro Ser Pro Ser Arg Leu Pro Gly Pro Ser Asp Thr Pro Ile Leu
20 25 30
<210> 34
<211> 28
<212> PRT
<213> 人工序列
<220>
<223> CTP肽
<400> 34
Ser Ser Ser Ser Lys Ala Pro Pro Pro Ser Leu Pro Ser Pro Ser Arg
1 5 10 15
Leu Pro Gly Pro Ser Asp Thr Pro Ile Leu Pro Gln
20 25
<210> 35
<211> 11
<212> PRT
<213> 人工序列
<220>
<223> 白蛋白结合肽核心序列
<400> 35
Asp Ile Cys Leu Pro Arg Trp Gly Cys Leu Trp
1 5 10
<210> 36
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> PAS序列
<400> 36
Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro
1 5 10 15
Ser Ala Pro Ala
20
<210> 37
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> PAS序列
<400> 37
Ala Ala Pro Ala Ser Pro Ala Pro Ala Ala Pro Ser Ala Pro Ala Pro
1 5 10 15
Ala Ala Pro Ser
20
<210> 38
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> PAS序列
<400> 38
Ala Pro Ser Ser Pro Ser Pro Ser Ala Pro Ser Ser Pro Ser Pro Ala
1 5 10 15
Ser Pro Ser Ser
20
<210> 39
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> PAS序列
<400> 39
Ala Pro Ser Ser Pro Ser Pro Ser Ala Pro Ser Ser Pro Ser Pro Ala
1 5 10 15
Ser Pro Ser
<210> 40
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> PAS序列
<400> 40
Ser Ser Pro Ser Ala Pro Ser Pro Ser Ser Pro Ala Ser Pro Ser Pro
1 5 10 15
Ser Ser Pro Ala
20
<210> 41
<211> 24
<212> PRT
<213> 人工序列
<220>
<223> PAS序列
<400> 41
Ala Ala Ser Pro Ala Ala Pro Ser Ala Pro Pro Ala Ala Ala Ser Pro
1 5 10 15
Ala Ala Pro Ser Ala Pro Pro Ala
20
<210> 42
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> PAS序列
<400> 42
Ala Ser Ala Ala Ala Pro Ala Ala Ala Ser Ala Ala Ala Ser Ala Pro
1 5 10 15
Ser Ala Ala Ala
20
<210> 43
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> miR142标靶
<400> 43
tccataaagt aggaaacact aca 23
<210> 44
<211> 2332
<212> PRT
<213> 智人
<400> 44
Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr
1 5 10 15
Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro
20 25 30
Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys
35 40 45
Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro
50 55 60
Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val
65 70 75 80
Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val
85 90 95
Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala
100 105 110
Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val
115 120 125
Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn
130 135 140
Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser
145 150 155 160
His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu
165 170 175
Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu
180 185 190
His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp
195 200 205
His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser
210 215 220
Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg
225 230 235 240
Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His
245 250 255
Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu
260 265 270
Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile
275 280 285
Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly
290 295 300
Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met
305 310 315 320
Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg
325 330 335
Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp
340 345 350
Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe
355 360 365
Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His
370 375 380
Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu
385 390 395 400
Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro
405 410 415
Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr
420 425 430
Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile
435 440 445
Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile
450 455 460
Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile
465 470 475 480
Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys
485 490 495
His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys
500 505 510
Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys
515 520 525
Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala
530 535 540
Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp
545 550 555 560
Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe
565 570 575
Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln
580 585 590
Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe
595 600 605
Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser
610 615 620
Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu
625 630 635 640
Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr
645 650 655
Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro
660 665 670
Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp
675 680 685
Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala
690 695 700
Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu
705 710 715 720
Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala
725 730 735
Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro Ser Thr Arg
740 745 750
Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp Ile Glu Lys
755 760 765
Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys Ile Gln Asn
770 775 780
Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser Pro Thr Pro
785 790 795 800
His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr Glu Thr Phe
805 810 815
Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn Ser Leu Ser
820 825 830
Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly Asp Met Val
835 840 845
Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu Lys Leu Gly
850 855 860
Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys Val Ser Ser
865 870 875 880
Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn Leu Ala Ala
885 890 895
Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met Pro Val His
900 905 910
Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys Ser Ser Pro
915 920 925
Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu Asn Asn Asp
930 935 940
Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu Ser Ser Trp
945 950 955 960
Gly Lys Asn Val Ser Ser Thr Glu Ser Gly Arg Leu Phe Lys Gly Lys
965 970 975
Arg Ala His Gly Pro Ala Leu Leu Thr Lys Asp Asn Ala Leu Phe Lys
980 985 990
Val Ser Ile Ser Leu Leu Lys Thr Asn Lys Thr Ser Asn Asn Ser Ala
995 1000 1005
Thr Asn Arg Lys Thr His Ile Asp Gly Pro Ser Leu Leu Ile Glu
1010 1015 1020
Asn Ser Pro Ser Val Trp Gln Asn Ile Leu Glu Ser Asp Thr Glu
1025 1030 1035
Phe Lys Lys Val Thr Pro Leu Ile His Asp Arg Met Leu Met Asp
1040 1045 1050
Lys Asn Ala Thr Ala Leu Arg Leu Asn His Met Ser Asn Lys Thr
1055 1060 1065
Thr Ser Ser Lys Asn Met Glu Met Val Gln Gln Lys Lys Glu Gly
1070 1075 1080
Pro Ile Pro Pro Asp Ala Gln Asn Pro Asp Met Ser Phe Phe Lys
1085 1090 1095
Met Leu Phe Leu Pro Glu Ser Ala Arg Trp Ile Gln Arg Thr His
1100 1105 1110
Gly Lys Asn Ser Leu Asn Ser Gly Gln Gly Pro Ser Pro Lys Gln
1115 1120 1125
Leu Val Ser Leu Gly Pro Glu Lys Ser Val Glu Gly Gln Asn Phe
1130 1135 1140
Leu Ser Glu Lys Asn Lys Val Val Val Gly Lys Gly Glu Phe Thr
1145 1150 1155
Lys Asp Val Gly Leu Lys Glu Met Val Phe Pro Ser Ser Arg Asn
1160 1165 1170
Leu Phe Leu Thr Asn Leu Asp Asn Leu His Glu Asn Asn Thr His
1175 1180 1185
Asn Gln Glu Lys Lys Ile Gln Glu Glu Ile Glu Lys Lys Glu Thr
1190 1195 1200
Leu Ile Gln Glu Asn Val Val Leu Pro Gln Ile His Thr Val Thr
1205 1210 1215
Gly Thr Lys Asn Phe Met Lys Asn Leu Phe Leu Leu Ser Thr Arg
1220 1225 1230
Gln Asn Val Glu Gly Ser Tyr Asp Gly Ala Tyr Ala Pro Val Leu
1235 1240 1245
Gln Asp Phe Arg Ser Leu Asn Asp Ser Thr Asn Arg Thr Lys Lys
1250 1255 1260
His Thr Ala His Phe Ser Lys Lys Gly Glu Glu Glu Asn Leu Glu
1265 1270 1275
Gly Leu Gly Asn Gln Thr Lys Gln Ile Val Glu Lys Tyr Ala Cys
1280 1285 1290
Thr Thr Arg Ile Ser Pro Asn Thr Ser Gln Gln Asn Phe Val Thr
1295 1300 1305
Gln Arg Ser Lys Arg Ala Leu Lys Gln Phe Arg Leu Pro Leu Glu
1310 1315 1320
Glu Thr Glu Leu Glu Lys Arg Ile Ile Val Asp Asp Thr Ser Thr
1325 1330 1335
Gln Trp Ser Lys Asn Met Lys His Leu Thr Pro Ser Thr Leu Thr
1340 1345 1350
Gln Ile Asp Tyr Asn Glu Lys Glu Lys Gly Ala Ile Thr Gln Ser
1355 1360 1365
Pro Leu Ser Asp Cys Leu Thr Arg Ser His Ser Ile Pro Gln Ala
1370 1375 1380
Asn Arg Ser Pro Leu Pro Ile Ala Lys Val Ser Ser Phe Pro Ser
1385 1390 1395
Ile Arg Pro Ile Tyr Leu Thr Arg Val Leu Phe Gln Asp Asn Ser
1400 1405 1410
Ser His Leu Pro Ala Ala Ser Tyr Arg Lys Lys Asp Ser Gly Val
1415 1420 1425
Gln Glu Ser Ser His Phe Leu Gln Gly Ala Lys Lys Asn Asn Leu
1430 1435 1440
Ser Leu Ala Ile Leu Thr Leu Glu Met Thr Gly Asp Gln Arg Glu
1445 1450 1455
Val Gly Ser Leu Gly Thr Ser Ala Thr Asn Ser Val Thr Tyr Lys
1460 1465 1470
Lys Val Glu Asn Thr Val Leu Pro Lys Pro Asp Leu Pro Lys Thr
1475 1480 1485
Ser Gly Lys Val Glu Leu Leu Pro Lys Val His Ile Tyr Gln Lys
1490 1495 1500
Asp Leu Phe Pro Thr Glu Thr Ser Asn Gly Ser Pro Gly His Leu
1505 1510 1515
Asp Leu Val Glu Gly Ser Leu Leu Gln Gly Thr Glu Gly Ala Ile
1520 1525 1530
Lys Trp Asn Glu Ala Asn Arg Pro Gly Lys Val Pro Phe Leu Arg
1535 1540 1545
Val Ala Thr Glu Ser Ser Ala Lys Thr Pro Ser Lys Leu Leu Asp
1550 1555 1560
Pro Leu Ala Trp Asp Asn His Tyr Gly Thr Gln Ile Pro Lys Glu
1565 1570 1575
Glu Trp Lys Ser Gln Glu Lys Ser Pro Glu Lys Thr Ala Phe Lys
1580 1585 1590
Lys Lys Asp Thr Ile Leu Ser Leu Asn Ala Cys Glu Ser Asn His
1595 1600 1605
Ala Ile Ala Ala Ile Asn Glu Gly Gln Asn Lys Pro Glu Ile Glu
1610 1615 1620
Val Thr Trp Ala Lys Gln Gly Arg Thr Glu Arg Leu Cys Ser Gln
1625 1630 1635
Asn Pro Pro Val Leu Lys Arg His Gln Arg Glu Ile Thr Arg Thr
1640 1645 1650
Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile
1655 1660 1665
Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp
1670 1675 1680
Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr
1685 1690 1695
Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser
1700 1705 1710
Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro
1715 1720 1725
Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe
1730 1735 1740
Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu
1745 1750 1755
Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val
1760 1765 1770
Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser
1775 1780 1785
Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg
1790 1795 1800
Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys
1805 1810 1815
Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys
1820 1825 1830
Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His
1835 1840 1845
Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu
1850 1855 1860
Asn Pro Ala His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu
1865 1870 1875
Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu
1880 1885 1890
Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu
1895 1900 1905
Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly
1910 1915 1920
Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln
1925 1930 1935
Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile
1940 1945 1950
His Ser Ile His Phe Ser Gly His Val Phe Thr Val Arg Lys Lys
1955 1960 1965
Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe
1970 1975 1980
Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val
1985 1990 1995
Glu Cys Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu
2000 2005 2010
Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala
2015 2020 2025
Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr
2030 2035 2040
Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser
2045 2050 2055
Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val
2060 2065 2070
Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly
2075 2080 2085
Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile
2090 2095 2100
Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn
2105 2110 2115
Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser
2120 2125 2130
Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr
2135 2140 2145
Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg
2150 2155 2160
Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu
2165 2170 2175
Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser
2180 2185 2190
Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala
2195 2200 2205
Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val
2210 2215 2220
Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met
2225 2230 2235
Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr
2240 2245 2250
Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly
2255 2260 2265
His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe
2270 2275 2280
Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp
2285 2290 2295
Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp
2300 2305 2310
Val His Gln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala
2315 2320 2325
Gln Asp Leu Tyr
2330
<210> 45
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 人IgG1的氨基酸233-236
<400> 45
Glu Leu Leu Gly
1
<210> 46
<211> 42
<212> PRT
<213> 人工序列
<220>
<223> XTEN AE42-4,蛋白质序列
<400> 46
Gly Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly
1 5 10 15
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala
20 25 30
Thr Ser Gly Ser Glu Thr Pro Ala Ser Ser
35 40
<210> 47
<211> 126
<212> DNA
<213> 人工序列
<220>
<223> XTEN AE42-4,DNA序列
<400> 47
ggcgcgccag gttctcctgc tggctccccc acctcaacag aagaggggac aagcgaaagc 60
gctacgcctg agagtggccc tggctctgag ccagccacct ccggctctga aacccctgcc 120
tcgagc 126
<210> 48
<211> 144
<212> PRT
<213> 人工序列
<220>
<223> XTEN AE144-2A,蛋白质序列
<400> 48
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly
1 5 10 15
Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly
20 25 30
Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
35 40 45
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu
50 55 60
Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
65 70 75 80
Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly
85 90 95
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu
100 105 110
Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
115 120 125
Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly
130 135 140
<210> 49
<211> 450
<212> DNA
<213> 人工序列
<220>
<223> XTEN AE144-2A,DNA序列
<400> 49
ggcgcgccaa ccagtacgga gccgtccgag gggagcgcac caggaagccc ggctgggagc 60
ccgacttcta ccgaagaggg tacatctacc gaaccaagtg aaggttcagc accaggcacc 120
tcaacagaac cctctgaggg ctcggcgcct ggtacaagtg agtccgccac cccagaatcc 180
gggcctggga caagcacaga accttcggaa gggagtgccc ctggaacatc cgaatcggca 240
accccagaat cagggccagg atctgagccc gcgacttcgg gctccgagac gcctgggaca 300
tccaccgagc cctccgaagg atcagcccca ggcaccagca cggagccctc tgagggaagc 360
gcacctggta ccagcgaaag cgcaactccc gaatcaggtc ccggtacgag cgagtcggcg 420
accccggaga gcgggccagg tgcctcgagc 450
<210> 50
<211> 144
<212> PRT
<213> 人工序列
<220>
<223> XTEN AE144-3B,蛋白质序列
<400> 50
Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser
1 5 10 15
Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser
20 25 30
Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly
35 40 45
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu
50 55 60
Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly
65 70 75 80
Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
85 90 95
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu
100 105 110
Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser
115 120 125
Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
130 135 140
<210> 51
<211> 450
<212> DNA
<213> 人工序列
<220>
<223> XTEN AE144-3B,DNA序列
<400> 51
ggcgcgccaa gtcccgctgg aagcccaact agcaccgaag aggggacctc agagtccgcc 60
acccccgagt ccggccctgg ctctgagcct gccactagcg gctccgagac tcctggcaca 120
tccgaaagcg ctacacccga gagtggaccc ggcacctcta ccgagcccag tgagggctcc 180
gcccctggaa caagcaccga gcccagcgaa ggcagcgccc cagggacctc cacagagccc 240
agtgaaggca gtgctcctgg caccagcacc gaaccaagcg agggctctgc acccgggacc 300
tccaccgagc caagcgaagg ctctgcccct ggcacttcca ccgagcccag cgaaggcagc 360
gcccctggga gccccgctgg ctctcccacc agcactgagg agggcacatc taccgaacca 420
agtgaaggct ctgcaccagg tgcctcgagc 450
<210> 52
<211> 144
<212> PRT
<213> 人工序列
<220>
<223> XTEN AE144-4A,蛋白质序列
<400> 52
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala
1 5 10 15
Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
20 25 30
Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly
35 40 45
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu
50 55 60
Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
65 70 75 80
Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly
85 90 95
Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala Gly
100 105 110
Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu
115 120 125
Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
130 135 140
<210> 53
<211> 450
<212> DNA
<213> 人工序列
<220>
<223> XTEN AE144-4A,DNA序列
<400> 53
ggcgcgccaa cgtccgaaag tgctacccct gagtcaggcc ctggtagtga gcctgccaca 60
agcggaagcg aaactccggg gacctcagag tctgccactc ccgaatcggg gccaggctct 120
gaaccggcca cttcagggag cgaaacacca ggaacatcgg agagcgctac cccggagagc 180
gggccaggaa ctagtactga gcctagcgag ggaagtgcac ctggtacaag cgagtccgcc 240
acacccgagt ctggccctgg ctctccagcg ggctcaccca cgagcactga agagggctct 300
cccgctggca gcccaacgtc gacagaagaa ggatcaccag caggctcccc cacatcaaca 360
gaggagggta catcagaatc tgctactccc gagagtggac ccggtacctc cactgagccc 420
agcgagggga gtgcaccagg tgcctcgagc 450
<210> 54
<211> 144
<212> PRT
<213> 人工序列
<220>
<223> XTEN AE144-5A,蛋白质序列
<400> 54
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala
1 5 10 15
Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
20 25 30
Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly
35 40 45
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu
50 55 60
Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser
65 70 75 80
Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly
85 90 95
Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
100 105 110
Ala Thr Pro Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser
115 120 125
Thr Glu Glu Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly
130 135 140
<210> 55
<211> 450
<212> DNA
<213> 人工序列
<220>
<223> XTEN AE144-5A,DNA序列
<400> 55
ggcgcgccaa catcagagag cgccacccct gaaagtggtc ccgggagcga gccagccaca 60
tctgggtcgg aaacgccagg cacaagtgag tctgcaactc ccgagtccgg acctggctcc 120
gagcctgcca ctagcggctc cgagactccg ggaacttccg agagcgctac accagaaagc 180
ggacccggaa ccagtaccga acctagcgag ggctctgctc cgggcagccc agccggctct 240
cctacatcca cggaggaggg cacttccgaa tccgccaccc cggagtcagg gccaggatct 300
gaacccgcta cctcaggcag tgagacgcca ggaacgagcg agtccgctac accggagagt 360
gggccaggga gccctgctgg atctcctacg tccactgagg aagggtcacc agcgggctcg 420
cccaccagca ctgaagaagg tgcctcgagc 450
<210> 56
<211> 144
<212> PRT
<213> 人工序列
<220>
<223> XTEN AE144-6B,蛋白质序列
<400> 56
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser
1 5 10 15
Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
20 25 30
Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly
35 40 45
Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro Ala
50 55 60
Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser
65 70 75 80
Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
85 90 95
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Glu Pro Ala
100 105 110
Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu
115 120 125
Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
130 135 140
<210> 57
<211> 450
<212> DNA
<213> 人工序列
<220>
<223> XTEN AE144-6B,DNA序列
<400> 57
ggcgcgccaa catctaccga gccttccgaa ggctctgccc ctgggacctc agaatctgca 60
acccctgaaa gcggccctgg aacctccgaa agtgccactc ccgagagcgg cccagggaca 120
agcgagtcag caacccctga gtctggaccc ggcagcgagc ctgcaacctc tggctcagag 180
actcccggct cagaacccgc tacctcaggc tccgagacac ccggctctcc tgctgggagt 240
cccacttcca ccgaggaagg aacatccact gagcctagtg agggctctgc ccctggaacc 300
agcacagagc caagtgaggg cagtgcacca ggatccgagc cagcaaccag cgggtccgag 360
actcccggga cctctgagtc tgccacccca gagagcggac ccggcacttc aaccgagccc 420
tccgaaggat cagcaccagg tgcctcgagc 450
<210> 58
<211> 144
<212> PRT
<213> 人工序列
<220>
<223> XTEN AG144-1,蛋白质序列
<400> 58
Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser
1 5 10 15
Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly Ser Gly Thr
20 25 30
Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser
35 40 45
Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser
50 55 60
Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr
65 70 75 80
Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser
85 90 95
Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser
100 105 110
Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser
115 120 125
Ser Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser
130 135 140
<210> 59
<211> 450
<212> DNA
<213> 人工序列
<220>
<223> XTEN AG144-1,DNA序列
<400> 59
ggcgcgccac ccgggtcgtc cccgtcggcg tccaccggaa cagggccagg gtcatccccg 60
tcagcgtcga ctgggacggg acccgggaca cccggttcgg ggactgcatc ctcctcgcct 120
ggttcgtcca ccccgtcagg agccacgggt tcgccgggaa gcagcccaag cgcatccact 180
ggtacagggc ctggggcttc accgggtact tcatccacgg ggtcaccggg aacgcccgga 240
tcggggacgg cttcctcatc accaggatcg tcaacaccct cgggcgcaac gggcagcccc 300
ggaacccctg gttcgggtac ggcgtcgtcg agccccggtg cgagcccggg aacaagctcg 360
acaggatcgc ctggggcgtc acccggcacg tcgagcacag gcagccccgg aacccctgga 420
tcgggaaccg cgtcgtcaag cgcctcgagc 450
<210> 60
<211> 144
<212> PRT
<213> 人工序列
<220>
<223> XTEN AG144-A,蛋白质序列
<400> 60
Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Pro
1 5 10 15
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr
20 25 30
Gly Thr Gly Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro
35 40 45
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro
50 55 60
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser
65 70 75 80
Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro
85 90 95
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Thr Pro Gly
100 105 110
Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
115 120 125
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
130 135 140
<210> 61
<211> 450
<212> DNA
<213> 人工序列
<220>
<223> XTEN AG144-A,DNA序列
<400> 61
ggcgcgccag gtgcctcgcc gggaacatca tcaactggtt cacccgggtc atccccctcg 60
gcctcaaccg ggacgggtcc cggctcatcc cccagcgcca gcactggaac aggtcctggc 120
actcctggtt ccggtacggc atcgtcatcc ccgggaagct caacaccgtc cggagcgaca 180
ggatcacctg gctcgtcacc ttcggcgtca actggaacgg ggccaggggc ctcacccgga 240
acgtcctcga ctgggtcgcc tggtacgccg ggatcaggaa cggcctcatc ctcgcctggg 300
tcctcaacgc cctcgggtgc gactggttcg ccgggaactc ctggctcggg gacggcctcg 360
tcgtcgcctg gggcatcacc ggggacgagc tccacggggt cccctggagc gtcaccgggg 420
acctcctcga caggtagccc ggcctcgagc 450
<210> 62
<211> 144
<212> PRT
<213> 人工序列
<220>
<223> XTEN AG144-B,蛋白质序列
<400> 62
Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr
1 5 10 15
Pro Ser Gly Ala Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
20 25 30
Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro
35 40 45
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro
50 55 60
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr
65 70 75 80
Gly Thr Gly Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro
85 90 95
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ala Ser Pro
100 105 110
Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
115 120 125
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
130 135 140
<210> 63
<211> 450
<212> DNA
<213> 人工序列
<220>
<223> XTEN AG144-B,DNA序列
<400> 63
ggcgcgccag gtacaccggg cagcggcacg gcttcgtcgt cacccggctc gtccacaccg 60
tcgggagcta cgggaagccc aggagcgtca ccgggaacgt cgtcaacggg gtcaccgggt 120
acgccaggta gcggcacggc cagcagctcg ccaggttcat cgaccccgtc gggagcgact 180
gggtcgcccg gatcaagccc gtcagcttcc actggaacag gacccgggtc gtcgccgtca 240
gcctcaacgg ggacaggacc tggttcatcg acgccgtcag gggcgacagg ctcgcccgga 300
tcgtcaacac cctcgggggc aacggggagc cctggtgcgt cgcctggaac ctcatccacc 360
ggaagcccgg gggcctcgcc gggtacgagc tccacgggat cgcccggagc gtcccccgga 420
acttcaagca cagggagccc tgcctcgagc 450
<210> 64
<211> 144
<212> PRT
<213> 人工序列
<220>
<223> XTEN AG144-C,蛋白质序列
<400> 64
Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro
1 5 10 15
Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
20 25 30
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
35 40 45
Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly
50 55 60
Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser
65 70 75 80
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
85 90 95
Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Thr
100 105 110
Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala
115 120 125
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
130 135 140
<210> 65
<211> 450
<212> DNA
<213> 人工序列
<220>
<223> XTEN AG144-C,DNA序列
<400> 65
ggcgcgccag gtacacccgg atcgggtaca gcgtcatcga gccccggtgc gtcacctggt 60
acgtcgagca cggggtcgcc aggggcgtcc cctgggacgt cctcaacagg ctcgcccggt 120
gcgtcacccg gcacgtcgtc cacgggttca cctggtagct ccccttccgc gtccactggc 180
accgggcctg gaactccggg gagcggcaca gcgagctcgt cgccgggagc atcgcctggg 240
acatcgagca ccgggtcgcc aggagcatcg cccggaacat ccagcacagg aagccccggc 300
gcgtcgcccg ggacatcaag cacaggttcc ccgggatcga gcacgccgtc cggagccact 360
ggatcaccag ggagctcgac accttccggc gcaacgggat cgcccggagc cagcccgggt 420
acgtcaagca ctggctcccc tgcctcgagc 450
<210> 66
<211> 144
<212> PRT
<213> 人工序列
<220>
<223> XTEN AG144-F,蛋白质序列
<400> 66
Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro
1 5 10 15
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser
20 25 30
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
35 40 45
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro
50 55 60
Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser
65 70 75 80
Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro
85 90 95
Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr
100 105 110
Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala
115 120 125
Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
130 135 140
<210> 67
<211> 450
<212> DNA
<213> 人工序列
<220>
<223> XTEN AG144-F,DNA序列
<400> 67
ggcgcgccag gctccagccc ctccgcgagc acgggaaccg gaccaggttc gtcaccctca 60
gcatcaacgg ggacgggacc gggggcgtca ccaggaacgt cctccaccgg ctcgccgggt 120
gcatcacccg gaacgtcatc gaccggatcg ccagggagct cgacgccatc aggcgcaaca 180
ggatcacctg gctcaagccc tagcgcgtca accggcacgg gtccgggtgc ctcccctggc 240
acgtccagca ccggatcacc cggatcgagc ccatccgcct caaccggaac cggacccggt 300
acaccagggt cgggaacagc ctcctcgtca ccaggctcct caaccccctc gggagccacg 360
ggttcgcccg gttcgtcaac gccttccgga gcaactggta gccccggagc atcgccagga 420
acttcgagca cggggtcgcc cgcctcgagc 450
<210> 68
<211> 4374
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-1 DNA序列
<400> 68
atgcagattg agctgtctac ttgctttttc ctgtgcctgc tgaggttttg cttttccgct 60
acacgaaggt attatctggg ggctgtggaa ctgtcttggg attacatgca gagtgacctg 120
ggagagctgc cagtggacgc aaggtttccc cctagagtcc ctaagtcatt ccccttcaac 180
actagcgtgg tctacaagaa aacactgttc gtggagttta ctgatcacct gttcaacatc 240
gcaaagccta ggccaccctg gatgggactg ctggggccaa caatccaggc cgaggtgtac 300
gacaccgtgg tcattacact taagaacatg gcctcacacc ccgtgagcct gcatgctgtg 360
ggcgtcagct actggaaggc ttccgaagga gcagagtatg acgatcagac ttcccagaga 420
gaaaaagagg acgataaggt gtttcctggc ggatctcata cctacgtgtg gcaggtcctg 480
aaagagaatg gccctatggc ctccgaccct ctgtgcctga cctactctta tctgagtcac 540
gtggacctgg tcaaggatct gaacagcggc ctgatcggag ccctgctggt gtgcagggaa 600
ggaagcctgg ctaaggagaa aacccagaca ctgcataagt tcattctgct gttcgccgtg 660
tttgacgaag ggaaatcatg gcacagcgag acaaagaata gtctgatgca ggacagggat 720
gccgcttcag ccagagcttg gcccaaaatg cacactgtga acggctacgt caatcgctca 780
ctgcctgggc tgatcggctg ccaccgaaag agcgtgtatt ggcatgtcat cgggatgggc 840
accacacctg aagtgcactc cattttcctg gagggacata cctttctggt ccgcaaccac 900
cgacaggctt ccctggagat ctctccaatt accttcctga cagcacagac tctgctgatg 960
gacctggggc agttcctgct gttttgccac atcagctccc accagcatga tggcatggag 1020
gcttacgtga aagtggactc ttgtcccgag gaacctcagc tgcggatgaa gaacaatgag 1080
gaagcagaag actatgacga tgacctgacc gactccgaga tggatgtggt ccgattcgat 1140
gacgataaca gcccctcctt tatccagatt agatctgtgg ccaagaaaca ccctaagaca 1200
tgggtccatt acatcgcagc cgaggaagag gactgggatt atgcaccact ggtgctggca 1260
ccagacgatc gctcctacaa atctcagtat ctgaacaatg ggccacagag gattggcaga 1320
aagtacaaga aagtgcggtt catggcatat accgatgaga ccttcaagac tcgcgaagcc 1380
atccagcacg agagcggcat cctgggacca ctgctgtacg gagaagtggg agacaccctg 1440
ctgatcattt tcaagaacca ggccagccgg ccttacaata tctatccaca tgggattaca 1500
gatgtgcgcc ctctgtacag caggagactg ccaaagggcg tcaaacacct gaaggacttc 1560
ccaatcctgc ccggagaaat cttcaagtac aagtggactg tcaccgtcga ggatggcccc 1620
actaagagcg accctcggtg cctgacccgc tactattcta gtttcgtgaa tatggaaaga 1680
gatctggcaa gcggactgat cggaccactg ctgatttgtt acaaagagag cgtggatcag 1740
agaggcaacc agatcatgtc cgacaagcgg aatgtgattc tgttcagtgt ctttgacgaa 1800
aacaggtcat ggtacctgac cgagaacatc cagagattcc tgcctaatcc agctggggtg 1860
cagctggaag atcctgagtt tcaggcatct aacatcatgc atagtattaa tggctacgtg 1920
ttcgacagtt tgcagctgag cgtgtgcctg cacgaggtcg cttactggta tatcctgagc 1980
attggggcac agacagattt cctgagcgtg ttcttttccg gctacacttt taagcataaa 2040
atggtctatg aggacacact gactctgttc cccttcagcg gcgaaaccgt gtttatgagc 2100
atggagaatc ccggactgtg gattctgggg tgccacaaca gcgatttcag aaatcgcgga 2160
atgactgccc tgctgaaagt gtcaagctgt gacaagaaca ccggggacta ctatgaagat 2220
tcatacgagg acatcagcgc atatctgctg tccaaaaaca atgccattga accccggtct 2280
tttagtcaga atcctccagt gctgaagagg caccagaggg agatcacccg cactaccctg 2340
cagagtgatc aggaagagat cgactacgac gatacaattt ctgtggaaat gaagaaagag 2400
gacttcgata tctatgacga agatgagaac cagagtcctc gatcattcca gaagaaaacc 2460
aggcattact ttattgccgc agtggagcgg ctgtgggatt atggcatgtc ctctagtcct 2520
cacgtgctgc gaaatagggc ccagtcagga agcgtcccac agttcaagaa agtggtcttc 2580
caggagttta cagacgggtc ctttactcag ccactgtaca ggggcgaact gaacgagcac 2640
ctgggactgc tggggcccta tatcagagca gaagtggagg ataacattat ggtcaccttc 2700
agaaatcagg cctctcggcc ttacagtttt tattcaagcc tgatctctta cgaagaggac 2760
cagcgacagg gagctgaacc acgaaaaaac ttcgtgaagc ctaatgagac caaaacatac 2820
ttttggaagg tgcagcacca tatggcccca acaaaagacg agttcgattg caaggcatgg 2880
gcctattttt ctgacgtgga tctggagaag gacgtgcaca gtggcctgat tggcccactg 2940
ctggtgtgcc atactaacac cctgaatcca gcccacggcc ggcaggtcac tgtccaggag 3000
ttcgctctgt tctttaccat ctttgatgag acaaagagct ggtacttcac cgaaaacatg 3060
gagcgaaatt gcagggctcc atgtaacatt cagatggaag accccacatt caaggagaac 3120
taccgctttc atgctatcaa tggatacatc atggatactc tgcccgggct ggtcatggca 3180
caggaccaga gaatccggtg gtatctgctg agcatgggca gcaacgagaa tatccactca 3240
attcatttca gcgggcacgt gtttactgtc aggaagaaag aagagtacaa gatggccctg 3300
tacaacctgt atcccggcgt gttcgaaacc gtcgagatgc tgcctagcaa ggccggaatc 3360
tggagagtgg aatgcctgat tggagagcac ctgcatgctg ggatgtctac cctgtttctg 3420
gtgtacagta ataagtgtca gacacccctg ggaatggcat ccgggcatat cagggatttc 3480
cagattaccg catctggaca gtacggacag tgggcaccta agctggctag actgcactat 3540
tccggatcta tcaacgcttg gtccacaaaa gagcctttct cttggattaa ggtggacctg 3600
ctggccccaa tgatcattca tggcatcaaa actcagggag ctcggcagaa gttctcctct 3660
ctgtacatct cacagtttat catcatgtac agcctggatg ggaagaaatg gcagacatac 3720
cgcggcaata gcacaggaac tctgatggtg ttctttggca acgtggacag cagcggaatc 3780
aagcacaaca ttttcaatcc ccctatcatt gctagataca tccggctgca cccaacccat 3840
tattctattc gaagtacact gaggatggaa ctgatgggat gcgatctgaa cagttgttca 3900
atgcccctgg ggatggagtc caaggcaatc tctgacgccc agattaccgc cagctcctac 3960
ttcactaata tgtttgctac ctggagccct tccaaagcaa gactgcacct gcaaggccgc 4020
agcaacgcat ggcgaccaca ggtgaacaat cccaaggagt ggttgcaggt cgattttcag 4080
aaaactatga aggtgaccgg ggtcacaact cagggcgtga aaagtctgct gacctcaatg 4140
tacgtcaagg agttcctgat ctctagttca caggacggac atcagtggac actgttcttt 4200
cagaacggga aggtgaaagt cttccagggc aatcaggatt cctttacacc tgtggtcaac 4260
agtctagacc ctccactgct gaccagatac ctgagaatcc accctcagtc ctgggtgcac 4320
cagattgccc tgagaatgga agtgctggga tgcgaggccc aggatctgta ctga 4374
<210> 69
<211> 577
<212> DNA
<213> 人工序列
<220>
<223> ET启动子,DNA序列
<400> 69
ctcgaggtca attcacgcga gttaataatt accagcgcgg gccaaataaa taatccgcga 60
ggggcaggtg acgtttgccc agcgcgcgct ggtaattatt aacctcgcga atattgattc 120
gaggccgcga ttgccgcaat cgcgaggggc aggtgacctt tgcccagcgc gcgttcgccc 180
cgccccggac ggtatcgata agcttaggag cttgggctgc aggtcgaggg cactgggagg 240
atgttgagta agatggaaaa ctactgatga cccttgcaga gacagagtat taggacatgt 300
ttgaacaggg gccgggcgat cagcaggtag ctctagagga tccccgtctg tctgcacatt 360
tcgtagagcg agtgttccga tactctaatc tccctaggca aggttcatat ttgtgtaggt 420
tacttattct ccttttgttg actaagtcaa taatcagaat cagcaggttt ggagtcagct 480
tggcagggat cagcagcctg ggttggaagg agggggtata aaagcccctt caccaggaga 540
agccgtcaca cagatccaca agctcctgcc accatgg 577
<210> 70
<211> 4374
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-5
<400> 70
atgcaaatcg aactgagcac ctgtttcttc ctctgcctgc tgagattctg tttctccgcg 60
acccgccgat actacctggg agcagtggag ctctcctggg attacatgca gagcgacctt 120
ggggagctgc ccgtggatgc caggttccct ccccgggtgc caaagtcgtt tccgttcaac 180
acctccgtgg tgtacaagaa aactctgttc gtggagttca ccgaccacct gttcaatatc 240
gccaagccca gacctccctg gatggggctg ttgggaccta ccatccaagc ggaggtgtac 300
gacactgtgg tcatcactct gaagaacatg gcctcgcatc ccgtgtccct gcacgccgtg 360
ggagtgtctt actggaaagc gtccgagggg gccgaatacg acgaccagac ctcgcagaga 420
gaaaaggaag atgacaaggt gttcccagga ggatcgcaca cctacgtgtg gcaagtgttg 480
aaggagaacg gcccaatggc ctccgacccg ctgtgcctga cctactcgta cctgtcccac 540
gtggacctcg tgaaggacct caactcggga ctgattggag ccctgctggt ctgcagggaa 600
ggctcactgg cgaaagaaaa gactcagacc ttgcacaagt tcattctgct gttcgctgtg 660
ttcgacgagg ggaagtcgtg gcacagcgag actaagaact ccctgatgca agatagagat 720
gccgcctccg cccgggcctg gcctaagatg cacaccgtga acggttacgt gaaccgctcc 780
ctccctggcc tgattggatg ccaccggaag tccgtgtact ggcacgtgat cgggatgggg 840
accacccccg aggtgcacag catcttcctg gaaggtcaca catttctcgt gcgcaaccac 900
cggcaggcct ccctggaaat cagccccatt accttcctca ctgcccagac tctgctgatg 960
gacctgggac agttcctgct gttctgccat atctcctccc accaacatga cggaatggag 1020
gcatacgtga aggtcgattc ctgccctgag gaaccccagc tccgcatgaa gaacaatgag 1080
gaagccgagg actacgacga cgacctgacg gatagcgaga tggatgtggt ccggttcgat 1140
gacgataaca gcccttcctt catccaaatt cgctcggtgg caaagaagca ccccaagacc 1200
tgggtgcatt acattgcggc ggaagaagag gactgggatt atgccccgct tgtcctcgct 1260
cctgacgacc ggagctacaa gagccagtac ctgaacaacg gtccacagag gatcggtaga 1320
aagtacaaga aggtccgctt catggcctat accgacgaaa ccttcaaaac tagagaggcc 1380
atccaacacg aatccggcat cctgggcccg ctcttgtacg gagaagtcgg cgacaccctt 1440
ctcattatct tcaagaacca ggcttcccgg ccgtacaaca tctatccgca tgggatcact 1500
gacgtgcgcc cactgtactc gcggcgcctg cccaagggtg tcaaacacct gaaggatttt 1560
ccgatccttc cgggagaaat cttcaagtac aagtggaccg tgaccgtgga agatggccca 1620
actaagtctg accctagatg cctcacccgc tactactcat ccttcgtcaa catggagcgc 1680
gacctggcca gcggactgat cggcccgctg ctgatttgct acaaggaatc agtggaccaa 1740
cggggaaacc agatcatgtc ggataagagg aacgtcatcc tcttctccgt gtttgacgaa 1800
aaccggtcgt ggtacctgac tgaaaacatc cagcggttcc tccccaaccc cgcgggcgtg 1860
cagctggaag atcctgagtt tcaggcatca aacatcatgc actccattaa cggctacgtg 1920
ttcgattcgc tgcagctgag cgtgtgtctg cacgaagtgg cctactggta catcctgtcc 1980
attggtgccc agactgactt cctgtccgtg tttttctccg gctacacgtt caagcacaag 2040
atggtgtacg aggacaccct gaccctcttc cctttttccg gcgaaactgt gtttatgagc 2100
atggagaatc ccggcctgtg gatcttgggc tgccacaaca gcgacttccg taacagagga 2160
atgactgcgc tgctcaaggt gtccagctgc gacaagaaca ccggagacta ttatgaggac 2220
tcatacgagg acatctccgc ctacctcctg tccaagaata acgccattga acctcggagc 2280
ttcagccaga acccacccgt gcttaagaga catcaacggg agatcactag gaccaccctg 2340
cagtcagacc aggaggaaat cgactacgat gacaccatct cggtcgagat gaagaaggag 2400
gactttgaca tctacgacga agatgaaaac cagagcccga ggtcgttcca aaagaaaacc 2460
cgccactact ttattgctgc tgtcgagcgg ctgtgggact acggaatgtc gtcctcgccg 2520
cacgtgctcc gcaaccgagc ccagagcggc tcggtgccgc aattcaagaa ggtcgtgttc 2580
caggagttca ctgacgggag cttcactcag cctttgtacc ggggagaact caatgaacat 2640
ctcggcctcc tcggacctta catcagagca gaagtggaag ataacatcat ggtcactttc 2700
cgtaaccaag ccagccgccc gtactcgttc tactcctccc tcatttctta cgaagaggac 2760
cagcggcagg gcgcagaacc gcgcaagaac ttcgtgaagc ccaacgaaac caagacctac 2820
ttctggaaag tgcagcatca tatggccccg actaaggacg agtttgactg caaagcctgg 2880
gcctacttct ccgatgtgga cttggagaag gacgtccact ccggcctcat cggtcccctg 2940
ctcgtgtgcc ataccaatac cctgaacccc gcacacggtc gccaggtcac cgtgcaggag 3000
ttcgctctgt tcttcactat cttcgacgaa actaagtcct ggtacttcac cgagaacatg 3060
gagaggaact gcagagcccc ctgtaacatc cagatggagg acccgacgtt caaggaaaac 3120
taccggttcc acgccattaa cggatacatc atggatacgc tgccgggtct tgtgatggcc 3180
caggatcaac ggatcagatg gtacttattg tcgatgggca gcaacgagaa catccactct 3240
attcacttct ccggtcatgt gttcactgtg cggaagaagg aagagtacaa gatggccctg 3300
tacaaccttt atcccggagt gttcgaaact gtggaaatgc tgccgtcgaa ggccggcatt 3360
tggcgcgtgg agtgtttgat tggagaacat ctccatgcgg ggatgtcaac cctgttcctg 3420
gtgtatagca acaagtgcca gactccgctt gggatggcgt caggacacat tagggatttc 3480
cagatcactg cgtccggcca gtacggccaa tgggccccta agctggcccg cctgcattac 3540
tccggatcca ttaacgcctg gtcaaccaag gagccattct cctggatcaa ggtggacctt 3600
ctggccccca tgattatcca cggaattaag acccaggggg cccggcagaa gttctcctca 3660
ctgtacatca gccagttcat aatcatgtac tccctggacg gaaagaagtg gcaaacctac 3720
agggggaaca gcaccggcac actgatggtc tttttcggaa atgtggactc ctccgggatt 3780
aagcataaca tcttcaaccc tccgattatc gctcggtaca ttagacttca ccctacccac 3840
tacagcattc gctccaccct gcggatggaa ctgatgggct gcgatctgaa ctcgtgcagc 3900
atgccgttgg gaatggagtc caaagcaatt tccgacgcgc agatcaccgc ctcgtcctac 3960
tttaccaaca tgttcgccac gtggtcaccg tccaaggccc ggctgcacct ccagggaaga 4020
tccaacgcat ggcggccaca ggtcaacaac cctaaggagt ggctccaggt ggacttccag 4080
aaaaccatga aggtcaccgg agtcacaacc cagggagtga agtcgctgct gacttctatg 4140
tacgtcaagg agttcctgat ctccagcagc caggacgggc accagtggac cctgttcttc 4200
caaaatggaa aggtcaaggt gtttcagggc aatcaggatt cattcacccc ggtggtgaac 4260
tcccttgatc cacccctcct gacccgctac cttcgcatcc acccacagtc ctgggtgcac 4320
cagatcgcgc tgaggatgga ggtcctggga tgcgaagccc aggacctgta ctga 4374
<210> 71
<211> 4374
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-6
<400> 71
atgcagattg agctgtccac ttgtttcttc ctgtgcctcc tgcgcttctg tttctccgcc 60
actcgccggt actaccttgg agccgtggag ctttcatggg actacatgca gagcgacctg 120
ggcgaactcc ccgtggatgc cagattcccc ccccgcgtgc caaagtcctt cccctttaac 180
acctccgtgg tgtacaagaa aaccctcttt gtcgagttca ctgaccacct gttcaacatc 240
gccaagccgc gcccaccttg gatgggcctc ctgggaccga ccattcaagc tgaagtgtac 300
gacaccgtgg tgatcaccct gaagaacatg gcgtcccacc ccgtgtccct gcatgcggtc 360
ggagtgtcct actggaaggc ctccgaagga gctgagtacg acgaccagac tagccagcgg 420
gaaaaggagg acgataaagt gttcccgggc ggctcgcata cttacgtgtg gcaagtcctg 480
aaggaaaacg gacctatggc atccgatcct ctgtgcctga cttactccta cctttcccat 540
gtggacctcg tgaaggacct gaacagcggg ctgattggtg cacttctcgt gtgccgcgaa 600
ggttcgctcg ctaaggaaaa gacccagacc ctccataagt tcatcctttt gttcgctgtg 660
ttcgatgaag gaaagtcatg gcattccgaa actaagaact cgctgatgca ggaccgggat 720
gccgcctcag cccgcgcctg gcctaaaatg catacagtca acggatacgt gaatcggtca 780
ctgcccgggc tcatcggttg tcacagaaag tccgtgtact ggcacgtcat cggcatgggc 840
actacgcctg aagtgcactc catcttcctg gaagggcaca ccttcctcgt gcgcaaccac 900
cgccaggcct ctctggaaat ctccccgatt acctttctga ccgcccagac tctgctcatg 960
gacctggggc agttccttct cttctgccac atctccagcc atcagcacga cggaatggag 1020
gcctacgtga aggtggactc atgcccggaa gaacctcagt tgcggatgaa gaacaacgag 1080
gaggccgagg actatgacga cgatttgact gactccgaga tggacgtcgt gcggttcgat 1140
gacgacaaca gccccagctt catccagatt cgcagcgtgg ccaagaagca ccccaaaacc 1200
tgggtgcact acatcgcggc cgaggaagaa gattgggact acgccccgtt ggtgctggca 1260
cccgatgacc ggtcgtacaa gtcccagtat ctgaacaatg gtccgcagcg gattggcaga 1320
aagtacaaga aagtgcggtt catggcgtac actgacgaaa cgtttaagac ccgggaggcc 1380
attcaacatg agagcggcat tctgggacca ctgctgtacg gagaggtcgg cgataccctg 1440
ctcatcatct tcaaaaacca ggcctcccgg ccttacaaca tctaccctca cggaatcacc 1500
gacgtgcggc cactctactc gcggcgcctg ccgaagggcg tcaagcacct gaaagacttc 1560
cctatcctgc cgggcgaaat cttcaagtat aagtggaccg tcaccgtgga ggacgggccc 1620
accaagagcg atcctaggtg tctgactcgg tactactcca gcttcgtgaa catggaacgg 1680
gacctggcat cgggactcat tggaccgctg ctgatctgct acaaagagtc ggtggatcaa 1740
cgcggcaacc agatcatgtc cgacaagcgc aacgtgatcc tgttctccgt gtttgatgaa 1800
aacagatcct ggtacctcac tgaaaacatc cagaggttcc tcccaaaccc cgcaggagtg 1860
caactggagg accctgagtt tcaggcctcg aatatcatgc actcgattaa cggttacgtg 1920
ttcgactcgc tgcagctgag cgtgtgcctc catgaagtcg cttactggta cattctgtcc 1980
atcggcgccc agactgactt cctgagcgtg ttcttttccg gttacacctt taagcacaag 2040
atggtgtacg aagataccct gaccctgttc cctttctccg gcgaaacggt gttcatgtcg 2100
atggagaacc cgggtctgtg gattctggga tgccacaaca gcgactttcg gaaccgcgga 2160
atgactgccc tgctgaaggt gtcctcatgc gacaagaaca ccggagacta ctacgaggac 2220
tcctacgagg atatctcagc ctacctcctg tccaagaaca acgcgatcga gccgcgcagc 2280
ttcagccaga acccgcctgt gctgaagagg caccagcgag aaattacccg gaccaccctc 2340
caatcggatc aggaggaaat cgactacgac gacaccatct cggtggaaat gaagaaggaa 2400
gatttcgata tctacgacga ggacgaaaat cagtcccctc gctcattcca aaagaaaact 2460
agacactact ttatcgccgc ggtggaaaga ctgtgggact atggaatgtc atccagccct 2520
cacgtccttc ggaaccgggc ccagagcgga tcggtgcctc agttcaagaa agtggtgttc 2580
caggagttca ccgacggcag cttcacccag ccgctgtacc ggggagaact gaacgaacac 2640
ctgggcctgc tcggtcccta catccgcgcg gaagtggagg ataacatcat ggtgaccttc 2700
cgtaaccaag catccagacc ttactccttc tattcctccc tgatctcata cgaggaggac 2760
cagcgccaag gcgccgagcc ccgcaagaac ttcgtcaagc ccaacgagac taagacctac 2820
ttctggaagg tccaacacca tatggccccg accaaggatg agtttgactg caaggcctgg 2880
gcctacttct ccgacgtgga ccttgagaag gatgtccatt ccggcctgat cgggccgctg 2940
ctcgtgtgtc acaccaacac cctgaaccca gcgcatggac gccaggtcac cgtccaggag 3000
tttgctctgt tcttcaccat ttttgacgaa actaagtcct ggtacttcac cgagaatatg 3060
gagcgaaact gtagagcgcc ctgcaatatc cagatggaag atccgacttt caaggagaac 3120
tatagattcc acgccatcaa cgggtacatc atggatactc tgccggggct ggtcatggcc 3180
caggatcaga ggattcggtg gtacttgctg tcaatgggat cgaacgaaaa cattcactcc 3240
attcacttct ccggtcacgt gttcactgtg cgcaagaagg aggagtacaa gatggcgctg 3300
tacaatctgt accccggggt gttcgaaact gtggagatgc tgccgtccaa ggccggcatc 3360
tggagagtgg agtgcctgat cggagagcac ctccacgcgg ggatgtccac cctcttcctg 3420
gtgtactcga ataagtgcca gaccccgctg ggcatggcct cgggccacat cagagacttc 3480
cagatcacag caagcggaca atacggccaa tgggcgccga agctggcccg cttgcactac 3540
tccggatcga tcaacgcatg gtccaccaag gaaccgttct cgtggattaa ggtggacctc 3600
ctggccccta tgattatcca cggaattaag acccagggcg ccaggcagaa gttctcctcc 3660
ctgtacatct cgcaattcat catcatgtac agcctggacg ggaagaagtg gcagacttac 3720
aggggaaact ccaccggcac cctgatggtc tttttcggca acgtggattc ctccggcatt 3780
aagcacaaca tcttcaaccc accgatcata gccagatata ttaggctcca ccccactcac 3840
tactcaatcc gctcaactct tcggatggaa ctcatggggt gcgacctgaa ctcctgctcc 3900
atgccgttgg ggatggaatc aaaggctatt agcgacgccc agatcaccgc gagctcctac 3960
ttcactaaca tgttcgccac ctggagcccc tccaaggcca ggctgcactt gcagggacgg 4020
tcaaatgcct ggcggccgca agtgaacaat ccgaaggaat ggcttcaagt ggatttccaa 4080
aagaccatga aagtgaccgg agtcaccacc cagggagtga agtcccttct gacctcgatg 4140
tatgtgaagg agttcctgat tagcagcagc caggacgggc accagtggac cctgttcttc 4200
caaaacggaa aggtcaaggt gttccagggg aaccaggact cgttcacacc cgtggtgaac 4260
tccctggacc ccccactgct gacgcggtac ttgaggattc atcctcagtc ctgggtccat 4320
cagattgcat tgcgaatgga agtcctgggc tgcgaggccc aggacctgta ctga 4374
<210> 72
<211> 4824
<212> DNA
<213> 人工序列
<220>
<223> coFVIII-6-XTEN
<400> 72
atgcagattg agctgtccac ttgtttcttc ctgtgcctcc tgcgcttctg tttctccgcc 60
actcgccggt actaccttgg agccgtggag ctttcatggg actacatgca gagcgacctg 120
ggcgaactcc ccgtggatgc cagattcccc ccccgcgtgc caaagtcctt cccctttaac 180
acctccgtgg tgtacaagaa aaccctcttt gtcgagttca ctgaccacct gttcaacatc 240
gccaagccgc gcccaccttg gatgggcctc ctgggaccga ccattcaagc tgaagtgtac 300
gacaccgtgg tgatcaccct gaagaacatg gcgtcccacc ccgtgtccct gcatgcggtc 360
ggagtgtcct actggaaggc ctccgaagga gctgagtacg acgaccagac tagccagcgg 420
gaaaaggagg acgataaagt gttcccgggc ggctcgcata cttacgtgtg gcaagtcctg 480
aaggaaaacg gacctatggc atccgatcct ctgtgcctga cttactccta cctttcccat 540
gtggacctcg tgaaggacct gaacagcggg ctgattggtg cacttctcgt gtgccgcgaa 600
ggttcgctcg ctaaggaaaa gacccagacc ctccataagt tcatcctttt gttcgctgtg 660
ttcgatgaag gaaagtcatg gcattccgaa actaagaact cgctgatgca ggaccgggat 720
gccgcctcag cccgcgcctg gcctaaaatg catacagtca acggatacgt gaatcggtca 780
ctgcccgggc tcatcggttg tcacagaaag tccgtgtact ggcacgtcat cggcatgggc 840
actacgcctg aagtgcactc catcttcctg gaagggcaca ccttcctcgt gcgcaaccac 900
cgccaggcct ctctggaaat ctccccgatt acctttctga ccgcccagac tctgctcatg 960
gacctggggc agttccttct cttctgccac atctccagcc atcagcacga cggaatggag 1020
gcctacgtga aggtggactc atgcccggaa gaacctcagt tgcggatgaa gaacaacgag 1080
gaggccgagg actatgacga cgatttgact gactccgaga tggacgtcgt gcggttcgat 1140
gacgacaaca gccccagctt catccagatt cgcagcgtgg ccaagaagca ccccaaaacc 1200
tgggtgcact acatcgcggc cgaggaagaa gattgggact acgccccgtt ggtgctggca 1260
cccgatgacc ggtcgtacaa gtcccagtat ctgaacaatg gtccgcagcg gattggcaga 1320
aagtacaaga aagtgcggtt catggcgtac actgacgaaa cgtttaagac ccgggaggcc 1380
attcaacatg agagcggcat tctgggacca ctgctgtacg gagaggtcgg cgataccctg 1440
ctcatcatct tcaaaaacca ggcctcccgg ccttacaaca tctaccctca cggaatcacc 1500
gacgtgcggc cactctactc gcggcgcctg ccgaagggcg tcaagcacct gaaagacttc 1560
cctatcctgc cgggcgaaat cttcaagtat aagtggaccg tcaccgtgga ggacgggccc 1620
accaagagcg atcctaggtg tctgactcgg tactactcca gcttcgtgaa catggaacgg 1680
gacctggcat cgggactcat tggaccgctg ctgatctgct acaaagagtc ggtggatcaa 1740
cgcggcaacc agatcatgtc cgacaagcgc aacgtgatcc tgttctccgt gtttgatgaa 1800
aacagatcct ggtacctcac tgaaaacatc cagaggttcc tcccaaaccc cgcaggagtg 1860
caactggagg accctgagtt tcaggcctcg aatatcatgc actcgattaa cggttacgtg 1920
ttcgactcgc tgcagctgag cgtgtgcctc catgaagtcg cttactggta cattctgtcc 1980
atcggcgccc agactgactt cctgagcgtg ttcttttccg gttacacctt taagcacaag 2040
atggtgtacg aagataccct gaccctgttc cctttctccg gcgaaacggt gttcatgtcg 2100
atggagaacc cgggtctgtg gattctggga tgccacaaca gcgactttcg gaaccgcgga 2160
atgactgccc tgctgaaggt gtcctcatgc gacaagaaca ccggagacta ctacgaggac 2220
tcctacgagg atatctcagc ctacctcctg tccaagaaca acgcgatcga gccgcgcagc 2280
ttcagccaga acggcgcgcc aacatcagag agcgccaccc ctgaaagtgg tcccgggagc 2340
gagccagcca catctgggtc ggaaacgcca ggcacaagtg agtctgcaac tcccgagtcc 2400
ggacctggct ccgagcctgc cactagcggc tccgagactc cgggaacttc cgagagcgct 2460
acaccagaaa gcggacccgg aaccagtacc gaacctagcg agggctctgc tccgggcagc 2520
ccagccggct ctcctacatc cacggaggag ggcacttccg aatccgccac cccggagtca 2580
gggccaggat ctgaacccgc tacctcaggc agtgagacgc caggaacgag cgagtccgct 2640
acaccggaga gtgggccagg gagccctgct ggatctccta cgtccactga ggaagggtca 2700
ccagcgggct cgcccaccag cactgaagaa ggtgcctcga gcccgcctgt gctgaagagg 2760
caccagcgag aaattacccg gaccaccctc caatcggatc aggaggaaat cgactacgac 2820
gacaccatct cggtggaaat gaagaaggaa gatttcgata tctacgacga ggacgaaaat 2880
cagtcccctc gctcattcca aaagaaaact agacactact ttatcgccgc ggtggaaaga 2940
ctgtgggact atggaatgtc atccagccct cacgtccttc ggaaccgggc ccagagcgga 3000
tcggtgcctc agttcaagaa agtggtgttc caggagttca ccgacggcag cttcacccag 3060
ccgctgtacc ggggagaact gaacgaacac ctgggcctgc tcggtcccta catccgcgcg 3120
gaagtggagg ataacatcat ggtgaccttc cgtaaccaag catccagacc ttactccttc 3180
tattcctccc tgatctcata cgaggaggac cagcgccaag gcgccgagcc ccgcaagaac 3240
ttcgtcaagc ccaacgagac taagacctac ttctggaagg tccaacacca tatggccccg 3300
accaaggatg agtttgactg caaggcctgg gcctacttct ccgacgtgga ccttgagaag 3360
gatgtccatt ccggcctgat cgggccgctg ctcgtgtgtc acaccaacac cctgaaccca 3420
gcgcatggac gccaggtcac cgtccaggag tttgctctgt tcttcaccat ttttgacgaa 3480
actaagtcct ggtacttcac cgagaatatg gagcgaaact gtagagcgcc ctgcaatatc 3540
cagatggaag atccgacttt caaggagaac tatagattcc acgccatcaa cgggtacatc 3600
atggatactc tgccggggct ggtcatggcc caggatcaga ggattcggtg gtacttgctg 3660
tcaatgggat cgaacgaaaa cattcactcc attcacttct ccggtcacgt gttcactgtg 3720
cgcaagaagg aggagtacaa gatggcgctg tacaatctgt accccggggt gttcgaaact 3780
gtggagatgc tgccgtccaa ggccggcatc tggagagtgg agtgcctgat cggagagcac 3840
ctccacgcgg ggatgtccac cctcttcctg gtgtactcga ataagtgcca gaccccgctg 3900
ggcatggcct cgggccacat cagagacttc cagatcacag caagcggaca atacggccaa 3960
tgggcgccga agctggcccg cttgcactac tccggatcga tcaacgcatg gtccaccaag 4020
gaaccgttct cgtggattaa ggtggacctc ctggccccta tgattatcca cggaattaag 4080
acccagggcg ccaggcagaa gttctcctcc ctgtacatct cgcaattcat catcatgtac 4140
agcctggacg ggaagaagtg gcagacttac aggggaaact ccaccggcac cctgatggtc 4200
tttttcggca acgtggattc ctccggcatt aagcacaaca tcttcaaccc accgatcata 4260
gccagatata ttaggctcca ccccactcac tactcaatcc gctcaactct tcggatggaa 4320
ctcatggggt gcgacctgaa ctcctgctcc atgccgttgg ggatggaatc aaaggctatt 4380
agcgacgccc agatcaccgc gagctcctac ttcactaaca tgttcgccac ctggagcccc 4440
tccaaggcca ggctgcactt gcagggacgg tcaaatgcct ggcggccgca agtgaacaat 4500
ccgaaggaat ggcttcaagt ggatttccaa aagaccatga aagtgaccgg agtcaccacc 4560
cagggagtga agtcccttct gacctcgatg tatgtgaagg agttcctgat tagcagcagc 4620
caggacgggc accagtggac cctgttcttc caaaacggaa aggtcaaggt gttccagggg 4680
aaccaggact cgttcacacc cgtggtgaac tccctggacc ccccactgct gacgcggtac 4740
ttgaggattc atcctcagtc ctgggtccat cagattgcat tgcgaatgga agtcctgggc 4800
tgcgaggccc aggacctgta ctga 4824
<210> 73
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AD基序
<400> 73
Gly Glu Ser Pro Gly Gly Ser Ser Gly Ser Glu Ser
1 5 10
<210> 74
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AD基序
<400> 74
Gly Ser Glu Gly Ser Ser Gly Pro Gly Glu Ser Ser
1 5 10
<210> 75
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AD基序
<400> 75
Gly Ser Ser Glu Ser Gly Ser Ser Glu Gly Gly Pro
1 5 10
<210> 76
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AD基序
<400> 76
Gly Ser Gly Gly Glu Pro Ser Glu Ser Gly Ser Ser
1 5 10
<210> 77
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AE、AM基序
<400> 77
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu
1 5 10
<210> 78
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AE、AM、AQ基序
<400> 78
Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro
1 5 10
<210> 79
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AE、AM、AQ基序
<400> 79
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro
1 5 10
<210> 80
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AE、AM、AQ基序
<400> 80
Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
1 5 10
<210> 81
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AF、AM基序
<400> 81
Gly Ser Thr Ser Glu Ser Pro Ser Gly Thr Ala Pro
1 5 10
<210> 82
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AF、AM基序
<400> 82
Gly Thr Ser Thr Pro Glu Ser Gly Ser Ala Ser Pro
1 5 10
<210> 83
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AF、AM基序
<400> 83
Gly Thr Ser Pro Ser Gly Glu Ser Ser Thr Ala Pro
1 5 10
<210> 84
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AF、AM基序
<400> 84
Gly Ser Thr Ser Ser Thr Ala Glu Ser Pro Gly Pro
1 5 10
<210> 85
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AG、AM基序
<400> 85
Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro
1 5 10
<210> 86
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AG、AM基序
<400> 86
Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro
1 5 10
<210> 87
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AG、AM基序
<400> 87
Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro
1 5 10
<210> 88
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AG、AM基序
<400> 88
Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro
1 5 10
<210> 89
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AQ基序
<400> 89
Gly Glu Pro Ala Gly Ser Pro Thr Ser Thr Ser Glu
1 5 10
<210> 90
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AQ基序
<400> 90
Gly Thr Gly Glu Pro Ser Ser Thr Pro Ala Ser Glu
1 5 10
<210> 91
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AQ基序
<400> 91
Gly Ser Gly Pro Ser Thr Glu Ser Ala Pro Thr Glu
1 5 10
<210> 92
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AQ基序
<400> 92
Gly Ser Glu Thr Pro Ser Gly Pro Ser Glu Thr Ala
1 5 10
<210> 93
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AQ基序
<400> 93
Gly Pro Ser Glu Thr Ser Thr Ser Glu Pro Gly Ala
1 5 10
<210> 94
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> AQ基序
<400> 94
Gly Ser Pro Ser Glu Pro Thr Glu Gly Thr Ser Ala
1 5 10
<210> 95
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> BC基序
<400> 95
Gly Ser Gly Ala Ser Glu Pro Thr Ser Thr Glu Pro
1 5 10
<210> 96
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> BC基序
<400> 96
Gly Ser Glu Pro Ala Thr Ser Gly Thr Glu Pro Ser
1 5 10
<210> 97
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> BC基序
<400> 97
Gly Thr Ser Glu Pro Ser Thr Ser Glu Pro Gly Ala
1 5 10
<210> 98
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> BC基序
<400> 98
Gly Thr Ser Thr Glu Pro Ser Glu Pro Gly Ser Ala
1 5 10
<210> 99
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> BD基序
<400> 99
Gly Ser Thr Ala Gly Ser Glu Thr Ser Thr Glu Ala
1 5 10
<210> 100
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> BD基序
<400> 100
Gly Ser Glu Thr Ala Thr Ser Gly Ser Glu Thr Ala
1 5 10
<210> 101
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> BD基序
<400> 101
Gly Thr Ser Glu Ser Ala Thr Ser Glu Ser Gly Ala
1 5 10
<210> 102
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> BD基序
<400> 102
Gly Thr Ser Thr Glu Ala Ser Glu Gly Ser Ala Ser
1 5 10
<210> 103
<211> 1607
<212> PRT
<213> 人工序列
<220>
<223> coFVIII-6-XTEN蛋白质序列
<400> 103
Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe
1 5 10 15
Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser
20 25 30
Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg
35 40 45
Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val
50 55 60
Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile
65 70 75 80
Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln
85 90 95
Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser
100 105 110
His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser
115 120 125
Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp
130 135 140
Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu
145 150 155 160
Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser
165 170 175
Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile
180 185 190
Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr
195 200 205
Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly
210 215 220
Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp
225 230 235 240
Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr
245 250 255
Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val
260 265 270
Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile
275 280 285
Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser
290 295 300
Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met
305 310 315 320
Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His
325 330 335
Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro
340 345 350
Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp
355 360 365
Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser
370 375 380
Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr
385 390 395 400
Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro
405 410 415
Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn
420 425 430
Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met
435 440 445
Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu
450 455 460
Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu
465 470 475 480
Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro
485 490 495
His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys
500 505 510
Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe
515 520 525
Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp
530 535 540
Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg
545 550 555 560
Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu
565 570 575
Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val
580 585 590
Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu
595 600 605
Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp
610 615 620
Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val
625 630 635 640
Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp
645 650 655
Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe
660 665 670
Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr
675 680 685
Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro
690 695 700
Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly
705 710 715 720
Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp
725 730 735
Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys
740 745 750
Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Gly Ala Pro Thr
755 760 765
Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr
770 775 780
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
785 790 795 800
Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr
805 810 815
Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro
820 825 830
Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr
835 840 845
Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser
850 855 860
Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala
865 870 875 880
Thr Pro Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr
885 890 895
Glu Glu Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ala
900 905 910
Ser Ser Pro Pro Val Leu Lys Arg His Gln Arg Glu Ile Thr Arg Thr
915 920 925
Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser
930 935 940
Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn
945 950 955 960
Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr Phe Ile Ala
965 970 975
Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser Ser Pro His Val
980 985 990
Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro Gln Phe Lys Lys Val
995 1000 1005
Val Phe Gln Glu Phe Thr Asp Gly Ser Phe Thr Gln Pro Leu Tyr
1010 1015 1020
Arg Gly Glu Leu Asn Glu His Leu Gly Leu Leu Gly Pro Tyr Ile
1025 1030 1035
Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr Phe Arg Asn Gln
1040 1045 1050
Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile Ser Tyr Glu
1055 1060 1065
Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe Val Lys
1070 1075 1080
Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His Met
1085 1090 1095
Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe
1100 1105 1110
Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly
1115 1120 1125
Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly
1130 1135 1140
Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe
1145 1150 1155
Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn
1160 1165 1170
Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys
1175 1180 1185
Glu Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr
1190 1195 1200
Leu Pro Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr
1205 1210 1215
Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His Ser Ile His Phe
1220 1225 1230
Ser Gly His Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met
1235 1240 1245
Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met
1250 1255 1260
Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly
1265 1270 1275
Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser
1280 1285 1290
Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg
1295 1300 1305
Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro
1310 1315 1320
Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser
1325 1330 1335
Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro
1340 1345 1350
Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe
1355 1360 1365
Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp
1370 1375 1380
Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu
1385 1390 1395
Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn
1400 1405 1410
Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro
1415 1420 1425
Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly
1430 1435 1440
Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys
1445 1450 1455
Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn
1460 1465 1470
Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln
1475 1480 1485
Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu
1490 1495 1500
Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val
1505 1510 1515
Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys
1520 1525 1530
Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu
1535 1540 1545
Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp
1550 1555 1560
Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr
1565 1570 1575
Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala
1580 1585 1590
Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr
1595 1600 1605

Claims (10)

1.一种分离的核酸分子,其核苷酸序列编码具有FVIII活性的多肽且如SEQ ID NO:71的核苷酸58-2277和2320-4374或SEQ ID NO:71的核苷酸58-4374所示。
2.如权利要求1所述的分离的核酸分子,其中所述核苷酸序列连接至编码信号肽的核酸序列,其中所述编码信号肽的核酸序列包含:
(i)SEQ ID NO:1的核苷酸1至57;
(ii)SEQ ID NO:2的核苷酸1至57;
(iii)SEQ ID NO:3的核苷酸1至57;
(iv)SEQ ID NO:4的核苷酸1至57;
(v)SEQ ID NO:5的核苷酸1至57;
(vi)SEQ ID NO:6的核苷酸1至57;
(vii)SEQ ID NO:70的核苷酸1至57;
(viii)SEQ ID NO:71的核苷酸1至57;或
(ix)SEQ ID NO:68的核苷酸1至57。
3.如权利要求1或2所述的分离的核酸分子,其中所述核苷酸序列连接至编码异源氨基酸序列的异源核苷酸序列,其中所述异源氨基酸序列是免疫球蛋白恒定区或其一部分、XTEN、转铁蛋白、白蛋白或PAS序列。
4.如权利要求3所述的分离的核酸分子,其中所述异源氨基酸序列连接至由所述核苷酸序列编码的氨基酸序列的N端或C端或***由所述核苷酸序列编码的氨基酸序列中的在选自如SEQ ID NO:15所示的成熟人FVIII的位置3,18,22,26,40,60,65,81,116,119,130,188,211,216,220,224,230,333,336,339,375,378,399,403,409,416,442,487,490,494,500,518,588,603,713,745,1656,1711,1720,1725,1749,1796,1802,1827,1861,1896,1900,1904,1905,1910,1937,2019,2068,2111,2120,2171,2188,2227和2332的一个或多个***位点处的两个氨基酸之间。
5.一种分离的核酸分子,其核苷酸序列编码具有FVIII活性的FVIII多肽且如SEQ IDNO:72所示。
6.一种载体,其包含如权利要求1至5中任一项所述的核酸分子。
7.如权利要求6所述的载体,其中所述载体是慢病毒载体。
8.一种宿主细胞,其包含如权利要求1至5中任一项所述的核酸分子或如权利要求6或7所述的载体。
9.一种产生具有FVIII活性的多肽的方法,所述方法包括:在一定条件下培养如权利要求8所述的宿主细胞,由此产生具有FVIII活性的多肽;和回收所述具有FVIII活性的多肽。
10.如权利要求1至5中任一项所述的核酸分子或如权利要求6或7所述的载体用于制备治疗出血病症的药物的用途。
CN201780020889.1A 2016-02-01 2017-01-31 优化的因子viii基因 Active CN109072214B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310074417.1A CN116218863A (zh) 2016-02-01 2017-01-31 优化的因子viii基因

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662289696P 2016-02-01 2016-02-01
US62/289,696 2016-02-01
US201662409739P 2016-10-18 2016-10-18
US62/409,739 2016-10-18
PCT/US2017/015879 WO2017136358A1 (en) 2016-02-01 2017-01-31 Optimized factor viii genes

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202310074417.1A Division CN116218863A (zh) 2016-02-01 2017-01-31 优化的因子viii基因

Publications (2)

Publication Number Publication Date
CN109072214A CN109072214A (zh) 2018-12-21
CN109072214B true CN109072214B (zh) 2023-02-17

Family

ID=58044178

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202310074417.1A Pending CN116218863A (zh) 2016-02-01 2017-01-31 优化的因子viii基因
CN201780020889.1A Active CN109072214B (zh) 2016-02-01 2017-01-31 优化的因子viii基因

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202310074417.1A Pending CN116218863A (zh) 2016-02-01 2017-01-31 优化的因子viii基因

Country Status (25)

Country Link
US (2) US11753461B2 (zh)
EP (2) EP3411478B1 (zh)
JP (2) JP7217630B2 (zh)
KR (1) KR20180118659A (zh)
CN (2) CN116218863A (zh)
AU (2) AU2017214378B2 (zh)
BR (1) BR112018015659A2 (zh)
CA (1) CA3012695A1 (zh)
CL (1) CL2018002054A1 (zh)
CO (1) CO2018009120A2 (zh)
DK (1) DK3411478T3 (zh)
ES (1) ES2926585T3 (zh)
HK (1) HK1257078A1 (zh)
HR (1) HRP20221089T1 (zh)
HU (1) HUE059941T2 (zh)
IL (1) IL260796A (zh)
LT (1) LT3411478T (zh)
MX (2) MX2018009375A (zh)
PH (1) PH12018501628A1 (zh)
PL (1) PL3411478T3 (zh)
PT (1) PT3411478T (zh)
RS (1) RS63548B1 (zh)
SG (2) SG10201913278PA (zh)
SI (1) SI3411478T1 (zh)
WO (1) WO2017136358A1 (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SI3889173T1 (sl) 2013-02-15 2023-11-30 Bioverativ Therapeutics Inc. Optimiran gen dejavnika VIII
JP7217630B2 (ja) 2016-02-01 2023-02-03 バイオベラティブ セラピューティクス インコーポレイテッド 最適化第viii因子遺伝子
KR20200035130A (ko) * 2017-08-09 2020-04-01 바이오버라티브 테라퓨틱스 인크. 핵산 분자 및 이의 용도
CA3090136A1 (en) * 2018-02-01 2019-08-08 Bioverativ Therapeutics, Inc. Use of lentiviral vectors expressing factor viii
KR102245539B1 (ko) 2018-02-12 2021-04-29 주식회사 지앤피바이오사이언스 코어-쉘 구조의 마이크로 입자를 유효성분으로 포함하는 성장인자 유전자 발현 증가용 조성물
BR112021002017A2 (pt) * 2018-08-09 2021-05-11 Bioverativ Therapeutics Inc. moléculas de ácido nucleico e usos das mesmas para terapia genética não viral
BR112021020668A2 (pt) 2019-04-17 2022-01-11 Codiak Biosciences Inc Composições de exossomos e aav
US20210113634A1 (en) * 2019-09-30 2021-04-22 Bioverativ Therapeutics Inc. Lentiviral vector formulations
CN111647625A (zh) * 2019-12-25 2020-09-11 深圳三智医学科技有限公司 一种提高人凝血因子ix表达水平的方法
CN111808863B (zh) * 2020-06-23 2021-05-28 康霖生物科技(杭州)有限公司 一种密码子优化的凝血因子viii基因及其构建体
TW202323274A (zh) * 2021-08-23 2023-06-16 美商百歐維拉提夫治療公司 優化因子viii基因
WO2023028441A1 (en) 2021-08-23 2023-03-02 Bioverativ Therapeutics Inc. Engineered itr sequences and methods of use
IL310879A (en) 2021-08-23 2024-04-01 Bioverativ Therapeutics Inc Expression system in colovirus
WO2023056331A1 (en) * 2021-09-30 2023-04-06 Bioverativ Therapeutics Inc. Nucleic acids encoding factor viii polypeptides with reduced immunogenicity
WO2023205300A2 (en) * 2022-04-20 2023-10-26 Asklepios Biopharmaceutical, Inc. Therapeutic adeno-associated virus using codon optimized nucleic acid encoding factor viii
WO2023211315A1 (en) * 2022-04-28 2023-11-02 Joint Stock Company "Biocad" Isolated nucleic acid that encodes fusion protein based on fviii-bdd and on heterologous signal peptide

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014127215A1 (en) * 2013-02-15 2014-08-21 Biogen Idec Ma Inc. Optimized factor viii gene
CN104427995A (zh) * 2012-06-08 2015-03-18 比奥根艾迪克Ma公司 嵌合凝血因子
WO2016004113A1 (en) * 2014-06-30 2016-01-07 Biogen Ma Inc. Optimized factor ix gene

Family Cites Families (188)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4704362A (en) 1977-11-08 1987-11-03 Genentech, Inc. Recombinant cloning vehicle microbial polypeptide expression
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4965188A (en) 1986-08-22 1990-10-23 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme
US4868112A (en) 1985-04-12 1989-09-19 Genetics Institute, Inc. Novel procoagulant proteins
KR910006424B1 (ko) 1985-08-21 1991-08-24 인코텍스 비.브이 편성브리프(brief) 제조방법
ATE87663T1 (de) 1986-01-03 1993-04-15 Genetics Inst Verfahren zur herstellung von faktor-viii:c-typ- proteinen.
US5595886A (en) 1986-01-27 1997-01-21 Chiron Corporation Protein complexes having Factor VIII:C activity and production thereof
US4800159A (en) 1986-02-07 1989-01-24 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences
US5543502A (en) 1986-06-24 1996-08-06 Novo Nordisk A/S Process for producing a coagulation active complex of factor VIII fragments
EP0832981A1 (en) 1987-02-17 1998-04-01 Pharming B.V. DNA sequences to target proteins to the mammary gland for efficient secretion
WO1988007089A1 (en) 1987-03-18 1988-09-22 Medical Research Council Altered antibodies
US6060447A (en) 1987-05-19 2000-05-09 Chiron Corporation Protein complexes having Factor VIII:C activity and production thereof
US5171844A (en) 1987-06-12 1992-12-15 Gist-Brocades N.W. Proteins with factor viii activity: process for their preparation using genetically-engineered cells and pharmaceutical compositions containing them
US6346513B1 (en) 1987-06-12 2002-02-12 Baxter Trading Gmbh Proteins with factor VIII activity: process for their preparation using genetically-engineered cells and pharmaceutical compositions containing them
DE3720246A1 (de) 1987-06-19 1988-12-29 Behringwerke Ag Faktor viii:c-aehnliches molekuel mit koagulationsaktivitaet
FR2619314B1 (fr) 1987-08-11 1990-06-15 Transgene Sa Analogue du facteur viii, procede de preparation et composition pharmaceutique le contenant
US6780613B1 (en) 1988-10-28 2004-08-24 Genentech, Inc. Growth hormone variants
AU648020B2 (en) 1989-02-21 1994-04-14 Washington University Modified forms of reproductive hormones
US5633076A (en) 1989-12-01 1997-05-27 Pharming Bv Method of producing a transgenic bovine or transgenic bovine embryo
SE465222C5 (sv) 1989-12-15 1998-02-10 Pharmacia & Upjohn Ab Ett rekombinant, humant faktor VIII-derivat och förfarande för dess framställning
MX9204374A (es) 1991-07-25 1993-03-01 Idec Pharma Corp Anticuerpo recombinante y metodo para su produccion.
ATE236987T1 (de) 1992-11-13 2003-04-15 Idec Pharma Corp Konsensus-kozak-sequenzen zur säugetier- exprimierung
US5736137A (en) 1992-11-13 1998-04-07 Idec Pharmaceuticals Corporation Therapeutic application of chimeric and radiolabeled antibodies to human B lymphocyte restricted differentiation antigen for treatment of B cell lymphoma
SE504074C2 (sv) 1993-07-05 1996-11-04 Pharmacia Ab Proteinberedning för subkutan, intramuskulär eller intradermal administrering
US5827690A (en) 1993-12-20 1998-10-27 Genzyme Transgenics Corporatiion Transgenic production of antibodies in milk
GB9422383D0 (en) 1994-11-05 1995-01-04 Wellcome Found Antibodies
US6818439B1 (en) * 1994-12-30 2004-11-16 Chiron Corporation Methods for administration of recombinant gene delivery vehicles for treatment of hemophilia and other disorders
US6030613A (en) 1995-01-17 2000-02-29 The Brigham And Women's Hospital, Inc. Receptor specific transepithelial transport of therapeutics
US6086875A (en) 1995-01-17 2000-07-11 The Brigham And Women's Hospital, Inc. Receptor specific transepithelial transport of immunogens
US6485726B1 (en) 1995-01-17 2002-11-26 The Brigham And Women's Hospital, Inc. Receptor specific transepithelial transport of therapeutics
US5739277A (en) 1995-04-14 1998-04-14 Genentech Inc. Altered polypeptides with increased half-life
US6096871A (en) 1995-04-14 2000-08-01 Genentech, Inc. Polypeptides altered to contain an epitope from the Fc region of an IgG molecule for increased half-life
US5869046A (en) 1995-04-14 1999-02-09 Genentech, Inc. Altered polypeptides with increased half-life
US6121022A (en) 1995-04-14 2000-09-19 Genentech, Inc. Altered polypeptides with increased half-life
SE9503380D0 (sv) 1995-09-29 1995-09-29 Pharmacia Ab Protein derivatives
US6013516A (en) 1995-10-06 2000-01-11 The Salk Institute For Biological Studies Vector and method of use for nucleic acid delivery to non-dividing cells
GB9524973D0 (en) 1995-12-06 1996-02-07 Lynxvale Ltd Viral vectors
US6458563B1 (en) 1996-06-26 2002-10-01 Emory University Modified factor VIII
AU3968897A (en) 1996-08-02 1998-02-25 Bristol-Myers Squibb Company A method for inhibiting immunoglobulin-induced toxicity resulting from the use of immunoglobulins in therapy and in vivo diagnosis
EP1696036B1 (en) 1996-09-06 2010-04-21 The Trustees of The University of Pennsylvania Use of recombinant adeno-associated virus in the manufacture of a medicament for gene therapy via muscle cells
GB9621680D0 (en) 1996-10-17 1996-12-11 Oxford Biomedica Ltd Lentiviral vectors
IL129017A0 (en) 1996-10-17 2000-02-17 Oxford Biomedica Ltd Retroviral vectors
GB9622500D0 (en) 1996-10-29 1997-01-08 Oxford Biomedica Ltd Therapeutic gene
WO1998023289A1 (en) 1996-11-27 1998-06-04 The General Hospital Corporation MODULATION OF IgG BINDING TO FcRn
US6277375B1 (en) 1997-03-03 2001-08-21 Board Of Regents, The University Of Texas System Immunoglobulin-like domains with increased half-lives
CA2225189C (en) 1997-03-06 2010-05-25 Queen's University At Kingston Canine factor viii gene, protein and methods of use
EP0981637B1 (en) 1997-03-14 2005-05-25 Biogen Idec Inc. Method for integrating genes at specific sites in mammalian cells via homologous recombination and vectors for accomplishing the same
US6207455B1 (en) 1997-05-01 2001-03-27 Lung-Ji Chang Lentiviral vectors
US6531298B2 (en) 1997-07-21 2003-03-11 The University Of North Carolina At Chapel Hill Factor IX antihemophilic factor with increased clotting activity
GB9722131D0 (en) 1997-10-20 1997-12-17 Medical Res Council Method
US5994136A (en) 1997-12-12 1999-11-30 Cell Genesys, Inc. Method and means for producing high titer, safe, recombinant lentivirus vectors
DK1068241T3 (da) 1998-04-02 2008-02-04 Genentech Inc Antistofvarianter og fragmenter deraf
US6194551B1 (en) 1998-04-02 2001-02-27 Genentech, Inc. Polypeptide variants
US6528624B1 (en) 1998-04-02 2003-03-04 Genentech, Inc. Polypeptide variants
US6242195B1 (en) 1998-04-02 2001-06-05 Genentech, Inc. Methods for determining binding of an analyte to a receptor
GB9809951D0 (en) 1998-05-08 1998-07-08 Univ Cambridge Tech Binding molecules
CA2341029A1 (en) 1998-08-17 2000-02-24 Abgenix, Inc. Generation of modified molecules with increased serum half-lives
US6924365B1 (en) 1998-09-29 2005-08-02 Transkaryotic Therapies, Inc. Optimized messenger RNA
US20090017533A1 (en) 1998-09-29 2009-01-15 Shire Human Genetic Therapies, Inc., A Delaware Corporation Optimized messenger rna
US6103526A (en) 1998-10-08 2000-08-15 Protein Sciences Corporation Spodoptera frugiperda single cell suspension cell line in serum-free media, methods of producing and using
EP1006183A1 (en) 1998-12-03 2000-06-07 Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. Recombinant soluble Fc receptors
US6737056B1 (en) 1999-01-15 2004-05-18 Genentech, Inc. Polypeptide variants with altered effector function
ES2694002T3 (es) 1999-01-15 2018-12-17 Genentech, Inc. Polipéptido que comprende una región Fc de IgG1 humana variante
EP1849873B1 (en) 1999-04-29 2011-10-12 Gbp Ip, Llc Method and means for producing high titer, safe, recombinant lentivirus vectors
ATE511400T1 (de) 2000-03-03 2011-06-15 Genetronics Inc Nukleinsäure-fomulierungen zur genverabreichung
CA2405709A1 (en) 2000-04-12 2001-10-25 Human Genome Sciences, Inc. Albumin fusion proteins
AU2002226028A1 (en) 2000-11-14 2002-05-27 Board Of Regents, Unversity Of Texas Systems Mutant human factor ix with an increased resistance to inhibition by heparin
GB0029407D0 (en) 2000-12-01 2001-01-17 Affitech As Product
ES2649037T3 (es) 2000-12-12 2018-01-09 Medimmune, Llc Moléculas con semividas prolongadas, composiciones y usos de las mismas
US20020159978A1 (en) 2001-02-06 2002-10-31 James Allen Muscle-directed gene transfer by use of recombinant AAV-1 and AAV-6 virions
US6888319B2 (en) 2001-03-01 2005-05-03 Palomar Medical Technologies, Inc. Flashlamp drive circuit
EP1377306A1 (en) 2001-03-09 2004-01-07 Dyax Corp. Serum albumin binding moieties
US20040106794A1 (en) 2001-04-16 2004-06-03 Schering Corporation 3,4-Di-substituted cyclobutene-1,2-diones as CXC-chemokine receptor ligands
DE60233047D1 (de) 2001-05-14 2009-09-03 Gbp Ip Llc Lentivirale vektoren kodierend für gerinnungsfaktoren für die gentherapie
MXPA04001982A (es) 2001-09-04 2004-06-07 Merck Patent Gmbh Factor ix modificado.
US7271002B2 (en) 2001-11-09 2007-09-18 United States Of America, Represented By The Secretary, Department Of Health And Human Services Production of adeno-associated virus in insect cells
NZ532635A (en) 2001-11-13 2007-05-31 Univ Pennsylvania A method of identifying unknown adeno-associated virus (AAV) sequences and a kit for the method
PT1453547T (pt) 2001-12-17 2016-12-28 Univ Pennsylvania Sequências do vírus adeno-associado (aav) do serotipo 8, vetores contendo as mesmas, e utilizações destas
CA2471363C (en) 2001-12-21 2014-02-11 Human Genome Sciences, Inc. Albumin fusion proteins
KR101271635B1 (ko) 2001-12-21 2013-06-12 휴먼 게놈 사이언시즈, 인코포레이티드 알부민 융합 단백질
US20080194481A1 (en) 2001-12-21 2008-08-14 Human Genome Sciences, Inc. Albumin Fusion Proteins
US6899917B2 (en) 2001-12-27 2005-05-31 3M Innovative Properties Company Powdered epoxy composition
US20040002587A1 (en) 2002-02-20 2004-01-01 Watkins Jeffry D. Fc region variants
US20040132101A1 (en) 2002-09-27 2004-07-08 Xencor Optimized Fc variants and methods for their generation
US7317091B2 (en) 2002-03-01 2008-01-08 Xencor, Inc. Optimized Fc variants
US20040018557A1 (en) 2002-03-01 2004-01-29 Immunomedics, Inc. Bispecific antibody point mutations for enhancing rate of clearance
CN100343393C (zh) 2002-03-15 2007-10-17 布赖汉姆妇女医院 适合治疗剂全身性递送的中央气道给药
US6615782B1 (en) 2002-04-12 2003-09-09 Delphi Technologies, Inc. Two-step finger follower rocker arm
AU2003241599A1 (en) 2002-05-22 2003-12-12 The Children's Hospital Of Philadelphia Compositions and methods for the treatment of hemophilia a
CA2495251C (en) 2002-08-14 2018-03-06 Macrogenics, Inc. Fc.gamma.riib-specific antibodies and methods of use thereof
DK2345671T3 (en) 2002-09-27 2016-02-15 Xencor Inc Optimized Fc variants and methods for their formation
AU2003286467B2 (en) 2002-10-15 2009-10-01 Abbvie Biotherapeutics Inc. Alteration of FcRn binding affinities or serum half-lives of antibodies by mutagenesis
GB2395337B (en) 2002-11-14 2005-12-28 Gary Michael Wilson Warning Unit
JP2006524039A (ja) 2003-01-09 2006-10-26 マクロジェニクス,インコーポレーテッド 変異型Fc領域を含む抗体の同定および作製ならびにその利用法
US7041635B2 (en) 2003-01-28 2006-05-09 In2Gen Co., Ltd. Factor VIII polypeptide
US8388955B2 (en) 2003-03-03 2013-03-05 Xencor, Inc. Fc variants
US20090010920A1 (en) 2003-03-03 2009-01-08 Xencor, Inc. Fc Variants Having Decreased Affinity for FcyRIIb
US9715692B1 (en) 2003-04-11 2017-07-25 Facebook, Inc. System for managing bids for pay-per-click search engines
JP2006524051A (ja) 2003-04-24 2006-10-26 フォンダッチォーネ・セントロ・サン・ラファエル・デル・モンテ・タボール 両方向性合成プロモーターを備えたレンチウイルスベクターおよびその使用
TWI353991B (en) 2003-05-06 2011-12-11 Syntonix Pharmaceuticals Inc Immunoglobulin chimeric monomer-dimer hybrids
CA2533701A1 (en) 2003-07-31 2005-02-17 Isis Pharmaceuticals, Inc. Oligomeric compounds and compositions for use in modulation of small non-coding rnas
GB0324368D0 (en) 2003-10-17 2003-11-19 Univ Cambridge Tech Polypeptides including modified constant regions
GB0325379D0 (en) 2003-10-30 2003-12-03 Oxford Biomedica Ltd Vectors
EP1697520A2 (en) 2003-12-22 2006-09-06 Xencor, Inc. Fc polypeptides with novel fc ligand binding sites
US20080089892A1 (en) 2004-01-12 2008-04-17 Eli Lilly And Co. Fc Region Variants
EP1737890A2 (en) 2004-03-24 2007-01-03 Xencor, Inc. Immunoglobulin variants outside the fc region
WO2005123780A2 (en) 2004-04-09 2005-12-29 Protein Design Labs, Inc. Alteration of fcrn binding affinities or serum half-lives of antibodies by mutagenesis
CA2572467A1 (en) 2004-07-01 2006-01-19 Virxsys Corporation Vector packaging cell line
WO2006085967A2 (en) 2004-07-09 2006-08-17 Xencor, Inc. OPTIMIZED ANTI-CD20 MONOCONAL ANTIBODIES HAVING Fc VARIANTS
EP2471813B1 (en) 2004-07-15 2014-12-31 Xencor, Inc. Optimized Fc variants
WO2006036502A2 (en) 2004-09-22 2006-04-06 St. Jude Children's Research Hospital Improved expression of factor ix in gene therapy vectors
WO2006047350A2 (en) 2004-10-21 2006-05-04 Xencor, Inc. IgG IMMUNOGLOBULIN VARIANTS WITH OPTIMIZED EFFECTOR FUNCTION
KR20130114758A (ko) 2005-05-27 2013-10-17 오스페달레 산 라파엘 에스.알.엘. Mi-rna를 포함하는 유전자 벡터
WO2007004670A1 (ja) 2005-07-05 2007-01-11 Kaneka Corporation メタクリル系樹脂組成物
JP2009504157A (ja) 2005-08-12 2009-02-05 ヒューマン ジノーム サイエンシーズ, インコーポレイテッド アルブミン融合タンパク質
AU2006304997B2 (en) 2005-10-20 2012-03-01 Uniqure Ip B.V. Improved AAV vectors produced in insect cells
US8048848B2 (en) 2006-02-03 2011-11-01 Prolor Biotech Ltd. Long-acting interferons and derivatives thereof and methods thereof
US8476234B2 (en) 2006-02-03 2013-07-02 Prolor Biotech Inc. Long-acting coagulation factors and methods of producing same
EP1997351A4 (en) 2006-03-13 2014-04-16 Koninkl Philips Nv ADAPTIVE CONTROL AND CONTROL PROCEDURE FOR A SOLID BODY LIGHTING SYSTEM
WO2007149406A2 (en) 2006-06-19 2007-12-27 Nautilus Technology Llc Modified coagulation factor ix polypeptides and use thereof for treatment
WO2007149852A2 (en) 2006-06-19 2007-12-27 Asklepios Biopharmaceutical, Inc. Modified factor viii and factor ix genes and vectors for gene therapy
ES2785223T3 (es) 2006-06-21 2020-10-06 Uniqure Ip Bv Células de insecto para la producción de vectores de AAV
GB0614780D0 (en) 2006-07-25 2006-09-06 Ucb Sa Biological products
BRPI0716744A2 (pt) 2006-09-14 2016-10-04 Human Genome Sciences Inc proteínas de fusão de albumina
US8167585B2 (en) 2006-09-28 2012-05-01 Siemens Industry, Inc. Devices and/or systems for mounting an auxiliary blower
US7700734B2 (en) 2007-01-09 2010-04-20 Shu-Wha Lin Recombinant human factor IX and use thereof
EP2144930A1 (en) 2007-04-18 2010-01-20 ZymoGenetics, Inc. Single chain fc, methods of making and methods of treatment
NZ581395A (en) 2007-05-14 2012-08-31 Biogen Idec Inc Single-chain fc (scfc) regions, binding polypeptides comprising same, and methods related thereto
CN101970678B (zh) 2007-06-21 2014-08-20 慕尼黑科技大学 具有增加的体内和/或体外稳定性的生物学活性蛋白
CA2702363A1 (en) 2007-10-15 2009-04-23 The University Of North Carolina At Chapel Hill Human factor ix variants with an extended half life
US20090271163A1 (en) 2007-12-06 2009-10-29 Wyeth Crystal structure of human factor VIII and uses thereof
KR20110015551A (ko) 2008-04-16 2011-02-16 바이엘 헬스케어 엘엘씨 제ix인자의 부위-지정 변형
AU2009244633A1 (en) 2008-04-16 2009-11-12 Bayer Healthcare Llc Modified Factor IX polypeptides and uses thereof
EP2268807A2 (en) 2008-04-21 2011-01-05 Novo Nordisk A/S Hyperglycosylated human coagulation factor ix
US10273502B2 (en) 2008-06-18 2019-04-30 Oxford Biomedica (Uk) Limited Virus purification
PL2307551T3 (pl) 2008-06-18 2017-07-31 Oxford Biomedica (Uk) Limited Oczyszczanie wektorów retrowirusowych
EP2149603A1 (en) 2008-07-28 2010-02-03 DRK-Blutspendedienst Baden-Württemberg-Hessen gGmbH Factor IX variants with clotting activity in absence of their cofactor and their use for treating bleeding disorders
EP4219547A3 (en) 2008-09-15 2023-10-18 uniQure biopharma B.V. Factor ix polypeptide mutant, its uses and a method for its production
DK2364362T3 (en) 2008-11-12 2016-01-25 Ospedale San Raffaele Srl Gene vector FOR INDUCTION OF IMMUNE TOLERANCE transgene
US8716448B2 (en) 2009-02-03 2014-05-06 Amunix Operating Inc. Coagulation factor VII compositions and methods of making and using same
US8680050B2 (en) 2009-02-03 2014-03-25 Amunix Operating Inc. Growth hormone polypeptides fused to extended recombinant polypeptides and methods of making and using same
US8703717B2 (en) 2009-02-03 2014-04-22 Amunix Operating Inc. Growth hormone polypeptides and methods of making and using same
CN102348715B (zh) 2009-02-03 2017-12-08 阿穆尼克斯运营公司 延伸重组多肽和包含该延伸重组多肽的组合物
US9050269B2 (en) 2009-03-10 2015-06-09 The Trustees Of The University Of Pennsylvania Protection of virus particles from phagocytosis by expression of CD47
ES2427627T3 (es) 2009-04-06 2013-10-31 Novo Nordisk A/S Entrega dirigida de proteínas de Factor VIII a plaquetas
ES2786039T3 (es) 2009-04-30 2020-10-08 Ospedale San Raffaele Srl Vector génico
US8734809B2 (en) 2009-05-28 2014-05-27 University Of Massachusetts AAV's and uses thereof
WO2010140148A1 (en) 2009-06-01 2010-12-09 Yeda Research And Development Co . Ltd Prodrugs containing albumin binding probe
PT2440228T (pt) 2009-06-08 2018-12-24 Amunix Operating Inc Polipéptidos de regulação da glicose e métodos de preparação e utilização dos mesmos
EP2440241B1 (en) 2009-06-08 2017-08-09 Amunix Operating Inc. Growth hormone polypeptides and methods of making and using same
GB0911870D0 (en) 2009-07-08 2009-08-19 Ucl Business Plc Optimised coding sequence and promoter
WO2011028344A2 (en) 2009-08-25 2011-03-10 Amunix Operating Inc. Interleukin-1 receptor antagonist compositions and methods of making and using same
RU2012115480A (ru) 2009-09-18 2013-10-27 Микромет Аг РЕЖИМ ДОЗИРОВАНИЯ ПРИ ВВЕДЕНИИ БИСПЕЦИФИЧЕСКОГО АНТИТЕЛА EpCAMxCD3
US8326547B2 (en) 2009-10-07 2012-12-04 Nanjingjinsirui Science & Technology Biology Corp. Method of sequence optimization for improved recombinant protein expression using a particle swarm optimization algorithm
WO2011069164A2 (en) 2009-12-06 2011-06-09 Biogen Idec Ma Inc. Factor viii-fc chimeric and hybrid polypeptides, and methods of use thereof
CA3027824A1 (en) 2010-02-23 2011-09-01 Sanofi Anti-alpha2 integrin antibodies and their uses
DK2826860T3 (en) 2010-04-23 2018-12-03 Univ Massachusetts CNS targeting AAV vectors and methods for their use
EP3508573A1 (en) 2010-07-09 2019-07-10 Bioverativ Therapeutics Inc. Systems for factor viii processing and methods thereof
KR20230156435A (ko) 2010-07-09 2023-11-14 바이오버라티브 테라퓨틱스 인크. 인자 ix 폴리펩티드 및 이들의 사용 방법
EP2591006B1 (en) 2010-07-09 2019-04-24 Bioverativ Therapeutics Inc. Processable single chain molecules and polypeptides made using same
US20130017997A1 (en) 2010-08-19 2013-01-17 Amunix Operating Inc. Factor VIII Compositions and Methods of Making and Using Same
CA2837995A1 (en) 2011-06-03 2012-12-13 The Regents Of The University Of Michigan Method of producing factor viii proteins by recombinant methods
MY180714A (en) 2011-07-08 2020-12-07 Bioverativ Therapeutics Inc Factor viii chimeric and hybrid polypeptides, and methods of use thereof
AU2012340501A1 (en) 2011-12-19 2013-07-11 Grifols, S.A. Compositions, methods, and kits for preparing sialylated recombinant proteins
NZ626945A (en) 2012-01-12 2016-10-28 Biogen Ma Inc Chimeric factor viii polypeptides and uses thereof
CN111548418A (zh) 2012-02-15 2020-08-18 比奥贝拉蒂治疗公司 因子viii组合物及其制备和使用方法
KR20190094480A (ko) * 2012-02-15 2019-08-13 바이오버라티브 테라퓨틱스 인크. 재조합 인자 viii 단백질
CN103316356B (zh) 2012-03-22 2016-08-17 北京三诺佳邑生物技术有限责任公司 一种重组慢病毒载体制剂
AU2013243948A1 (en) 2012-04-02 2014-10-30 Moderna Therapeutics, Inc. Modified polynucleotides for the production of proteins associated with human disease
PT2882450T (pt) 2012-07-11 2020-02-19 Bioverativ Therapeutics Inc Complexo de fator viii com xten e a proteína fator de von willebrand, e utilizações do mesmo
RU2500816C1 (ru) 2012-07-19 2013-12-10 Общество с ограниченной ответственностью "Международный биотехнологический центр "Генериум" ("МБЦ "Генериум") РЕКОМБИНАНТНАЯ ПЛАЗМИДНАЯ ДНК рАК380, КОДИРУЮЩАЯ ПОЛИПЕПТИД РЕКОМБИНАНТНОГО ФАКТОРА IХ СВЕРТЫВАЕМОСТИ КРОВИ ЧЕЛОВЕКА, ЛИНИЯ КЛЕТОК Cricetulus griseus CHO 1E6 - ПРОДУЦЕНТ РЕКОМБИНАНТНОГО ФАКТОРА IХ СВЕРТЫВАЕМОСТИ КРОВИ ЧЕЛОВЕКА И СПОСОБ ПОЛУЧЕНИЯ ПОЛИПЕПТИДА, ОБЛАДАЮЩЕГО АКТИВНОСТЬЮ РЕКОМБИНАНТНОГО ФАКТОРА IХ
TW202003554A (zh) 2013-08-14 2020-01-16 美商百歐維拉提夫治療公司 因子viii-xten融合物及其用途
EP2881463A1 (en) 2013-12-09 2015-06-10 DRK-Blutspendedienst Baden-Württemberg-Hessen gGmbH Factor IX variants with clotting activity in absence of their cofactor and/or with increased F.IX clotting activity and their use for treating bleeding disorders
SI3091997T1 (sl) 2014-01-10 2022-10-28 Bioverativ Therapeutics Inc. Himerni proteini faktorja VIII in njihova uporaba
GB201412494D0 (en) 2014-07-14 2014-08-27 Ospedale San Raffaele And Fond Telethon Vector production
TWI707951B (zh) 2015-04-08 2020-10-21 美商健臻公司 過大腺相關載體之製造
CN115074366A (zh) 2015-04-16 2022-09-20 埃默里大学 用于肝脏中蛋白质表达的重组启动子和载体及其用途
JP6909203B2 (ja) 2015-08-03 2021-07-28 バイオベラティブ セラピューティクス インコーポレイテッド 第ix因子融合タンパク質及びそれらの製造方法及び使用方法
HUE052016T2 (hu) 2015-11-19 2021-04-28 Novartis Ag Pufferek lentivírus prepartátumok stabilizálására
JP7217630B2 (ja) 2016-02-01 2023-02-03 バイオベラティブ セラピューティクス インコーポレイテッド 最適化第viii因子遺伝子
CA3089117A1 (en) 2018-01-30 2019-08-08 Modernatx, Inc. Compositions and methods for delivery of agents to immune cells
CA3090136A1 (en) 2018-02-01 2019-08-08 Bioverativ Therapeutics, Inc. Use of lentiviral vectors expressing factor viii
WO2020113197A1 (en) 2018-11-30 2020-06-04 Vaccine Stabilization Institute Viral formulations containing amino acids
TW202039855A (zh) 2018-12-06 2020-11-01 美商百歐維拉提夫治療公司 表現因子ix之慢病毒載體的用途
US20210113634A1 (en) 2019-09-30 2021-04-22 Bioverativ Therapeutics Inc. Lentiviral vector formulations
KR20230074703A (ko) 2020-06-24 2023-05-31 바이오버라티브 테라퓨틱스 인크. 유리 인자 viii을 상기 단백질이 발현되도록 변형된 렌티바이러스 벡터의 제제로부터 제거하는 방법
BR112023002395A2 (pt) 2020-08-23 2023-03-21 Bioverativ Therapeutics Inc Sistema de baculovírus modificado para produção aprimorada de dna com extremidades fechadas (cedna)

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104427995A (zh) * 2012-06-08 2015-03-18 比奥根艾迪克Ma公司 嵌合凝血因子
WO2014127215A1 (en) * 2013-02-15 2014-08-21 Biogen Idec Ma Inc. Optimized factor viii gene
WO2016004113A1 (en) * 2014-06-30 2016-01-07 Biogen Ma Inc. Optimized factor ix gene

Also Published As

Publication number Publication date
DK3411478T3 (da) 2022-09-12
JP2022089920A (ja) 2022-06-16
HK1257078A1 (zh) 2019-10-11
BR112018015659A2 (pt) 2018-12-26
SG11201806398YA (en) 2018-08-30
JP7217630B2 (ja) 2023-02-03
IL260796A (en) 2018-10-31
CO2018009120A2 (es) 2018-10-22
HUE059941T2 (hu) 2023-01-28
ES2926585T3 (es) 2022-10-27
US11753461B2 (en) 2023-09-12
SI3411478T1 (sl) 2022-10-28
KR20180118659A (ko) 2018-10-31
CN109072214A (zh) 2018-12-21
PT3411478T (pt) 2022-09-13
CL2018002054A1 (es) 2019-01-25
WO2017136358A1 (en) 2017-08-10
AU2017214378A1 (en) 2018-09-20
PH12018501628A1 (en) 2019-06-03
US20190185543A1 (en) 2019-06-20
PL3411478T3 (pl) 2022-10-03
EP3411478A1 (en) 2018-12-12
EP4137570A1 (en) 2023-02-22
JP2019506166A (ja) 2019-03-07
CA3012695A1 (en) 2017-08-10
AU2017214378B2 (en) 2023-05-04
EP3411478B1 (en) 2022-06-08
MX2023001394A (es) 2023-03-03
US20240124555A1 (en) 2024-04-18
SG10201913278PA (en) 2020-02-27
HRP20221089T1 (hr) 2022-11-25
RS63548B1 (sr) 2022-09-30
AU2023202218A1 (en) 2023-05-04
CN116218863A (zh) 2023-06-06
MX2018009375A (es) 2018-09-05
LT3411478T (lt) 2022-09-26

Similar Documents

Publication Publication Date Title
CN109072214B (zh) 优化的因子viii基因
US20210115425A1 (en) Optimized factor ix gene
KR102409250B1 (ko) 인자 viii 키메라 단백질 및 이들의 용도
CN111918674A (zh) 表达因子viii的慢病毒载体的用途
CN111247251A (zh) 核酸分子及其用途
US20200199626A1 (en) Use of lentiviral vectors expressing factor ix
CN115279896A (zh) 慢病毒载体配制品
RU2803163C2 (ru) Применение лентивирусных векторов, экспрессирующих фактор viii
CN118019758A (zh) 编码免疫原性降低的因子viii多肽的核酸

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant